説明

Fターム[5B091AA15]の内容

機械翻訳 (6,566) | 言語 (1,300) | 自然言語・解析結果間(例;日本語文解析) (617)

Fターム[5B091AA15]に分類される特許

61 - 80 / 617


【課題】複数ユーザが協調して意思決定を行うことが可能な対話型サービス用データを抽出する。
【解決手段】ユーザとの対話用データを抽出する対話装置100は、ユーザとの対話から抽出されたユーザ毎の個人データを管理する個人データ管理部51と、対象ユーザとの対話において他ユーザに関する個人データの参照の許可/不許可を制御する参照管理部60と、ユーザとの対話対象候補としてのオントロジーを管理するドメイン知識管理部30と、ドメイン知識管理部30により管理されるオントロジーと、個人データ管理部51により管理される対象ユーザの個人データと、参照管理部60により許可された他ユーザの個人データとに基づき、対象ユーザとの対話用データを生成する対話制御部11と、を有する。 (もっと読む)


【課題】文脈ベクトルの値が不確実であるという事実を考慮した適切な意味的類似度を算出する類似度算出装置を提供する。
【解決手段】意味的類似度の算出の対象となる第1の言語表現w及び第2の言語表現wを受け付ける受付部11、コーパスにおける第1の言語表現wの出現に関する情報である第1の文脈ベクトルと、コーパスにおける第2の言語表現wの出現に関する情報である第2の文脈ベクトルとを取得する取得部13、2個の文脈ベクトルφ、φの類似度を計算する類似関数g(φ、φ)と、第1及び第2の文脈ベクトルからベイズ推定を用いて得られた確率分布とを用いて、第1の言語表現に対応する文脈ベクトルと、第2の言語表現に対応する文脈ベクトルとの類似度の期待値である意味的類似度を算出する算出部14、算出された意味的類似度を出力する出力部15を備える。 (もっと読む)


【課題】タスク独立のコーパスから言語モデルを生成するための方法(20)が提供される。
【解決手段】一実施例では、タスク依存の統一化された言語モデル(140)が生成される。統一化された言語モデル(140)には、ノンターミナルを持つ複数の文脈自由文法(144)およびそこに組み込まれた同一のノンターミナルの少なくともいくつかを持つハイブリッドNグラムモデル(142)が含まれる。 (もっと読む)


【課題】修飾先の候補を2以上有する形態素を含む文について、当該形態素の修飾先の候補を1つに特定するように当該文を校正する文校正プログラム及び文校正装置を提供する。
【解決手段】文校正装置1は、対象とする文に含まれる形態素を解析する形態素解析手段101と、形態素のうち修飾先の候補を2以上有する形態素を検出する曖昧性検出手段102と、文に対する、連体修飾を受けない少なくとも1つの連用修飾文節の挿入により、曖昧性検出手段102により検出された形態素である修飾先不特定形態素の修飾先の候補が1つとなるように文を校正する文校正手段103とを有する。 (もっと読む)


【課題】一方の文の語句と他方の文の語句とを換言できない場合において、文と文とが互いに関連するか否かを判定する文章解析プログラム及び文章解析装置を提供する。
【解決手段】文章解析プログラム110は、制御部10を、第1の文章から少なくとも、同格であって対となる語句と、当該対となる語句を修飾する語句とを抽出し、それらの対応付けを示す文脈規則情報111を作成する文脈規則情報作成手段102と、第1の文と第2の文とを含む第2の文章において、第1の文の第1の語句及び第2の語句が文脈規則情報111に含まれるときであって、第1の語句及び第2の語句以外の第1の文に含まれる語句、文脈規則情報111の対となる語句の他方及び第2の語句が第2の文に含まれるとき、第1の文と第2の文とが関係すると判定する文章関係判定手段105として機能させる。 (もっと読む)


【課題】センサデータ及びユーザとの対話から得た知識を用いて、起承転結型のストーリーを生成する。
【解決手段】センサノードを用いて観測されたイベントから、非日常イベントを、予め把握されたイベントの発生トレンドとの対比により抽出して、これをストーリーの「転」とし、当該非日常イベントが発生した日時や環境にふさわしい導入文を「起」として生成し、その日時や環境における日常のイベントを予め把握されたイベントの発生トレンドから特定して、これを「承」として生成し、当該非日常イベントの原因イベントをユーザとの対話から発見し、これを「結」として生成して、これらを結合することにより起承転結型のストーリーを生成する。 (もっと読む)


【課題】文又は節に含まれる主語と述語の組合せと同義の、接頭辞付きの単語を生成する。
【解決手段】接頭辞・述語表現対照表20は、接頭辞ごとに、接頭辞の意味を表す述語表現のリストを有する。構文意味解析部12は、対象文入力部10に入力された対象文に対して構文意味解析を実行し、主語と述語の組を抽出する。単語候補生成部14は、抽出された述語に対応する接頭辞を接頭辞・述語表現対照表20から求め、求めた各接頭辞をその主語に連結することで、主語と述語の組と同義である単語の候補を生成する。同義語判定部16は、生成された候補の中から、標準辞書22の語彙に含まれるものを選別し、これをその主語と述語の組に対応する接頭辞付き同義語として出力する。 (もっと読む)


【課題】文書を構成する単語の区切りに空白文字が存在する外国語文書において、各単語の区切りを確実に検出し、空白文字を区切りに確実に再挿入することができる技術を提供する
【解決手段】英語表記ルールによる判断、元文書データに含まれる空白文字の有無の情報による判断、隣接する文字同士が含まれる文字列オブジェクトの同一性による判断、隣接する文字同士が含まれる文字列オブジェクトの間隔による判断を用いて隣接する文字が同じ単語に含まれるかどうか(空白の有無)について判断する。なお、これらの処理をこの記述の順番で判断するのが好ましい。 (もっと読む)


【課題】第一言語の原文には必ずしも表現されておらず、解釈に言外の知識を要する曖昧性がある場合であっても精度よく翻訳可能とすることである。
【解決手段】実施形態の機械翻訳装置によれば、曖昧箇所検出手段は、翻訳対象となる第一言語文書では明示されていないが文書解析翻訳手段で得た第二言語の訳文には必要となる情報が欠落している曖昧箇所を検出する。質問文作成手段は、曖昧箇所ごとに第二言語の訳文に必要となる情報を得るためのユーザへの質問文を作成する。質問文付与手段は第一言語の原文の該当箇所にその質問文を付与し、表示装置に第一言語の原文及び質問文を表示する。回答解析手段は、質問文に対するユーザからの回答から第二言語の訳文に必要となる情報を獲得して第二言語の訳文に反映させる。 (もっと読む)


【課題】評価を表す表現について関連性の高い表現の候補を正確に特定する。
【解決手段】情報処理装置10が備える評価表現辞書114は、評価対象を評価するための評価項目を表す語と当該評価項目に対する評価値を表す語とを含む評価表現と、当該評価表現が肯定的な表現であるか否かを表す極性と、を関連付けて記憶する。評価表現抽出部130は、評価表現辞書114を参照し、処理対象の文字列に含まれる評価表現を処理対象の文字列から抽出し、抽出した評価表現それぞれの極性を特定する。評価表現分類部140は、抽出された評価表現の間で評価対象および極性が共通するか否かに基づいて、前記抽出された評価表現を1以上のグループに分類する。出力処理部170は、同一のグループに分類された評価表現が複数ある場合に、これら複数の評価表現を互いに関連付けて関連表現記憶部180に対して出力する。 (もっと読む)


【課題】様々な形式で記述された日時表現に対して文書の内容に関連する重要な日時表現か否かを判定可能とする。
【解決手段】入力された電子文書を文に分割し(S201)、分割された各文を単語に分割する(S202)。日時表現に該当する単語列のパターンが記述された日時表現辞書を参照して、入力された電子文書を構成する各文の単語列パターンから日時表現を特定する(S203)。日時表現の表記パターン、該日時表現の前後に出現する単語、該日時表現の文書中での出現位置に基づき該日時表現の文脈中の用いられ方を表す日時表現文脈ベクトルを求める(S204)。日時表現文脈ベクトルを、事前の学習で作成した日時表現の重要・不要を判定するための重要日時表現判定モデルに応じて分類し、日時表現が重要か否かを判定する(S205)。 (もっと読む)


【課題】文から評価対象に対する発言者の二者択一的な価値評価の他に、発言意図を抽出する技術の実現。
【解決手段】各文が否定評価か肯定評価かを判定し、ネガ/ポジ判定タグを付与するネガ/ポジ判定部22と、各文の主題を認定する主題認定部24と、各文の意図表現に意図類型タグを関連付ける意図抽出部28と、複数の評価軸と類似表現との対応関係を格納した評価軸類似表現記憶部32と、各文の主題が評価軸類似表現記憶部32に格納された類似表現に該当する場合には対応の評価軸を関連付け、評価軸単位でネガ判定タグとポジ判定タグが付与された文の数をそれぞれ集計し、その比率を表すネガ/ポジ分析結果チャートを生成し、評価軸及び意図類型単位で文の数を集計し、意図類型単位での文の総数と、意図類型及び評価軸単位での文の数を表示した意図分類チャートを生成し、各チャートを外部に出力する分析結果評価部36を備えた感性分析システム10。 (もっと読む)


【課題】深い階層を有する特許請求項の構造解析を行う請求項構造情報生成装置を提供する。
【解決手段】記憶部11で記憶される請求項を形態素解析する形態素解析部12、請求項の文節を特定する文節特定部13、記述断片の区切であり記述断片間の関係を示す表層の手がかり情報とトークンとを有する表層区切情報が記憶される表層区切情報記憶部14、請求項の表層の手かがり情報に該当する位置にトークンを付与するトークン付与部15、記述断片の区切となる文節の品詞の手がかり情報と区切文節タイプとを有する文節タイプ対応情報が記憶される文節タイプ対応情報記憶部16、請求項の品詞の手がかり情報に該当する文節に区切文節タイプを付与する区切文節タイプ付与部17、付与されたトークン・区切文節タイプを用いて記述断片の構造を示す請求項構造情報を生成する生成部19、請求項構造情報を出力する出力部20を備える。 (もっと読む)


【課題】談話データの構造を解析した結果に基づいてトークスクリプトの利用状況の情報を含む発話者による談話の内訳情報を効率よく算出する談話内訳算出システムを提供する。
【解決手段】談話データ101および談話セマンティクス200を入力とし、トークスクリプトの利用状況を含む談話の内訳情報を出力する談話内訳算出システム1であって、談話セマンティクス200は簡約情報61を含み、簡約された談話データ101におけるブロックと各トークスクリプトとの間の類似度を算出し、最も類似するトークスクリプトを類似度情報71として出力する類似度算出部70と、簡約された談話データ101における各ブロックの類似度が閾値より高い場合に当該ブロックが対応するトークスクリプトに従って発話されたものであると判断し、発話者毎にトークスクリプトに従って発話されたブロックの割合を含む談話内訳情報300を出力する談話内訳算出部80とを有する。 (もっと読む)


【課題】自然文からユーザの価値判断が示されている表現を抽出する際に参照する感性辞書を効率的に編集できるように支援する技術の実現。
【解決手段】事物に対する肯定/否定の価値判断を表す感性用語と、肯定/否定の何れであるかを示す極性との組合せを格納しておく感性辞書記憶部18と、複数の用語について、各用語の類義語を定義したデータが格納された類義語辞書記憶部34と、起点語が入力された場合に、この起点語をキーに類義語辞書記憶部34を検索して起点語の類義語を抽出し、各類義語をキーに類義語辞書記憶部34を検索して各類義語の類義語を抽出し、抽出された用語のリストを含む感性用語登録画面80を生成してクライアント端末58に送信し、この画面80を介してリスト中の1または複数の用語を選択する情報と、各用語の極性を指定する情報が入力された場合に、選択された用語を指定された極性に関連付けて感性辞書記憶部18に格納する辞書編集支援部38を備えた。 (もっと読む)


【課題】複数の文から評価対象に対する発言者の二者択一的な価値評価の他に、発言意図を抽出する技術の実現。
【解決手段】感性用語と、肯定/否定の極性との組合せを格納した感性辞書記憶部18と、否定表現を格納した否定表現記憶部20と、意図表現と意図類型との組合せを格納した意図表現記憶部26と、各文の感性用語に付与した極性タグの種類と否定表現に付与した否定表現タグの有無との組合せに基づいて否定評価文か肯定評価文かを判定し、ネガ/ポジ判定タグを付与するネガ/ポジ判定部22と、各文の主題を認定する主題認定部24と、各文の意図表現に対応の意図類型タグを関連付ける意図抽出部28と、複数の評価軸と類似表現との対応関係を格納した評価軸類似表現記憶部32と、各文の主題が評価軸類似表現記憶部32に格納された類似表現に該当する場合には対応の評価軸を関連付ける分析結果評価部36を備えた感性分析システム10。 (もっと読む)


【課題】談話データの特性に強く、文章構造の枠組みを規定せずに談話セマンティックに基づいて談話データからFAQの候補となる質問文を抽出するFAQ候補抽出システムを提供する。
【解決手段】談話データ101および談話セマンティクス200を入力とし、談話データ101からFAQ候補となる質問文を抽出して出力するFAQ候補抽出システム1であって、談話セマンティクス200は各ステートメントのフロー情報21を含み、談話データ101から、顧客によって発話され、質問文もしくは要求文であることを示すフローが設定された質問・要求ステートメントを抽出する質問抽出部60と、質問・要求ステートメントから指定されたキーワードを含むものを抽出する候補抽出部80と、質問・要求ステートメントについてクラスタリングし、各クラスタの代表となる質問・要求ステートメントをFAQ候補300として出力するクラスタリング部90とを有する。 (もっと読む)


【課題】話し言葉やノイズといった談話データの特性に強く、談話データの構造を解析した結果から、所望の項目や内容が含まれ、かつ不要な項目が含まれない形で要約を生成する談話要約生成システムを提供する。
【解決手段】談話データ101および談話構造の解析結果である談話セマンティクス200を入力とし、談話についての要約を生成して出力する談話要約生成システム1であって、談話データ101において要約300に含めるべき部分を特定するための単語の連接のパターンと、要約300に含める要約文章のひな型との対応のリストを指定した要約テンプレート72と、要約テンプレート72に指定された各パターンと談話データ101とのマッチングを行い、マッチした場合に要約テンプレート72におけるマッチしたパターンに対応する要約文章のひな型から要約文章を生成して要約300に追加する談話要約部70とを有する。 (もっと読む)


【課題】あらゆるテキストにおいて、複数の固有表現間の関係情報を抽出可能な装置、その方法及びプログラムを提供する。
【解決手段】入力された複数の固有表現の関係情報を抽出する装置であって、各固有表現を含むテキストが入力されると、入力テキストを形態素解析するとともに入力テキストを構成する文節の係り受けを解析する解析処理部10と、入力テキストを構成する複数の文のうち各固有表現を含む文とは異なる他の文から自立語を含む文節を関係情報候補として抽出した後に、各固有表現及び関係情報候補の全てが抽出されるまで入力テキストの文頭から順に抽出された名詞文節を、該名詞文節に伴う助詞に対応付けられた記憶領域に記憶させ、各固有表現及び関係情報候補の全てが抽出されると記憶領域における名詞文節の格納状態を表す格納情報を取得して、解析結果及び格納情報に基づいて関係情報を抽出する関係情報抽出処理部20とを備えた。 (もっと読む)


【課題】 テキスト文書を表現するためのグラフィカル・モデルを用いてテキスト解析を行う方法及びコンピュータ・プログラムを提供する。
【解決手段】 グラフィカル・モデルを用いてテキスト文書を表現するための方法において、複数の順序付けられた単語を含む文書を受け取り、その文書に対するグラフ・データ構造体を生成する。グラフ・データ構造体は、複数のノード及びエッジを含み、各ノードは、文書内の別個の単語を表現し、各エッジは、2つのノードが互いからの所定の距離内に現れる回数を識別する。グラフ・データ構造体は情報レポジトリ内に格納される。 (もっと読む)


61 - 80 / 617