説明

Fターム[5B091AA11]の内容

機械翻訳 (6,566) | 言語 (1,300) | 1言語間 (116)

Fターム[5B091AA11]の下位に属するFターム

Fターム[5B091AA11]に分類される特許

61 - 80 / 109


【課題】分かち書きにされた文章であっても正確な形態素解析を実行することができる。
【解決手段】自然言語の文章が文節毎に分かち書きにされているか否かを判別し(S102)、判別結果に応じて、単語の表記とその品詞とを対応付けて格納する一般単語辞書及び/又は単語の表記に含まれる漢字の全部又は一部を仮名で表す交書きの表記とその品詞とを対応付けて格納する特別単語辞書を選択し(S103又はS104)、選択した単語辞書に基づいて文章の形態素解析を行うようにしてある(S106)。 (もっと読む)


【課題】より一般化され網羅性がある形態素複合ルールを生成すること。
【解決手段】形態素複合ルール生成エンジン22は、サンプル文章から形態素解析された形態素と、その形態素の品詞との基本組み合わせ及びその部分集合の組み合わせを算出し、全組み合わせのうち、出現比率が所定の閾値以上である組み合わせを複合ルール候補として抽出する。形態素複合ルール生成エンジン22は、形態素解析後の他のサンプル文章に複合ルール候補を適用して形態素を複合し、その複合語の、インターネット上の検索エンジンによる完全一致検索数が所定数以上である場合に、その複合ルール候補を正式複合ルールとして確定する。 (もっと読む)


【課題】 単語から該単語の、様々なレベルの上位概念や下位概念、兄弟概念の単語を導出する。
【解決手段】 本発明は、コーパスが入力されると、該コーパス内の任意の単語Aに対し、各成分の値が、単語Aと、該成分に対応する単語または単語意味属性との共起頻度の相対値である単語ベクトルを生成し、単語ベクトル記憶手段に格納し、任意の単語Bに対し、該単語Bの前記単語ベクトル記憶手段に格納されている単語ベクトルと、任意の単語Cの該単語ベクトル記憶手段に格納されている単語ベクトルとの間の、あるパラメータαのもとでのダイバージェンス距離を算出し、該単語Bと該単語Cとの間の単語間関連度を算出し、単語間関連度記憶手段に格納する。 (もっと読む)


【課題】第1の文(リード文)とそれに関連する第2の文(本記文の集合)が与えられたとき、本記文の表現を用いてリード文の表現を正しい文法構造で具体化する。
【解決手段】係り受け解析部は、第1の文データと、第1の文データに関連する第2の文データを入力し、第1の文データと第2の文データをそれぞれ解析して、第1の文データおよび第2の文データについての係り受け構造データを出力する。自動編集部は、第1の文データと第2の文データの係り受け構造データを比較した結果に基づき、第1の文データに含まれる表現を第2の文データに含まれる表現で置換しても係り受け構造に矛盾が生じない表現置換候補と、第2の文データに含まれる表現を第1の文データ内の所定箇所に挿入しても係り受け構造に矛盾が生じない表現挿入候補との、少なくともいずれかを抽出し、これらの少なくともいずれかに基づいて第1の文データを編集する処理を行なう。 (もっと読む)


【課題】 文書を構成する要素間の距離を用いて、要素間の係り受けを確定し、品詞や読み方などの多義性の解消を容易にする為の技術を提供すること。
【解決手段】 辞書DB16は、文書中に登場し得るそれぞれの要素の読み方、要素間の接続の確率、が登録されている辞書データを管理する。電子透かし抽出部12は、読み取った文書を構成する要素の間の距離を取得する。係り受け作成部13は、それぞれの要素の間の距離に基づいて、それぞれの要素を複数のグループに分割する。そして係り受け作成部13は、一方のグループと他方のグループとの間の接続確率が最も高くなる、一方のグループの品詞、他方のグループの品詞を特定する処理を、辞書データを用いて行うことで、特定した品詞に対応する読み方を確定させる。音声合成出力部17は、読み方が確定したそれぞれのグループについて、音声出力を行う。 (もっと読む)


【課題】動詞の必須格の有無のみに依らず、多義的な動詞が含まれている文についても、より正しく、その曖昧性を評価することのできる曖昧性評価装置を提供する。
【解決手段】曖昧性評価装置が、複数のテキストを記憶する記憶手段に含まれるテキストの中から、評価対象の表現を含む前記テキストを抽出する表現抽出部と、前記表現抽出部によって抽出された前記テキスト内において前記表現を修飾する文節を抽出する修飾文節抽出部と、前記表現抽出部によって抽出された前記テキストに関する統計量と、前記修飾文節抽出部によって抽出された前記文節に関する統計量とを基に、前記表現の曖昧性を表わす評価値を算出する曖昧性評価処理部とを備える。 (もっと読む)


【課題】評判情報の抽出処理において、新規の表現を辞書に自動的に登録する。
【解決手段】評価辞書と属性辞書を参照することにより、テキストから評価表現と属性表現の組である評判情報を抽出する機能を有する評判情報抽出装置において、文から抽出した文節ペアを構成する2つの文節のうちの一方の文節が前記評価辞書内の評価表現を含み、他方の文節はいずれの辞書内の表現も含まないと判定された場合に、前記他方の文節を属性辞書追加候補文節であると判定し、前記一方の文節が前記属性辞書内の属性表現を含み、前記他方の文節はいずれの辞書内の表現も含まないと判定された場合に、前記他方の文節を、評価辞書追加候補文節であると判定する手段と、前記評価辞書追加候補文節又は前記属性辞書追加候補文節から、評価表現又は属性表現を抽出し、新規の表現として前記評価辞書又は前記属性辞書に追加する手段とを備える。 (もっと読む)


【課題】情報抽出を行なう場合のルール適用単位などに利用可能なテキスト分割を行なう装置、方法を提供する。
【解決手段】入力テキストを構成する文から連続する2つの文を取得し、後続文中の文先頭部に近い最左述語動詞と、先行文の文末尾に近い最右述語動詞を述語動詞ペアとして抽出し、述語動詞ペアを含む文が重文として成立する確率値である重文確率値を求め、求めた重文確率値を閾値と比較し、閾値より大きい重文確率値を持つ述語動詞ペアを含む複数の文を文集合として設定し、設定した文集合を単位として入力テキストを分割する。この分割単位である文集合を単位として情報抽出ルールを適用した情報抽出処理を実行することで、意味のつながりのある文のまとまりを単位とした情報抽出が可能となり的確な情報抽出が実現される。 (もっと読む)


【課題】テキストデータから新規の固有表現を、その愛称や略称で記述された語彙を含めて精度良くかつ効率良く抽出すること。
【解決手段】タグ信頼度付与処理部12により、形態素解析済の大規模形態素解析済テキストから固有表現モデルを用いて各形態素がとり得る固有表現タグ毎の信頼度を算出し、各形態素に該固有表現タグとその信頼度を付与してタグ信頼度付テキストを生成し、固有表現展開処理部22により、タグ信頼度付テキストに対し、形態素毎に信頼度が上位N個のタグを取り出して展開し、固有表現を取り出し、固有表現語彙リストにないもののみを新規固有表現語彙候補として出力し、スコア計算処理部24により、各候補のタグ信頼度をその形態素数に対して正規化し、同一の表記及び固有表現状態を含む候補のタグ信頼度を加算してスコア化し、スコアが高い順に上位M個の候補を新規固有表現語彙リストとして出力する。 (もっと読む)


【課題】固有表現抽出の精度を向上させるために有用な大規模タグ付きコーパスを、人手による作業量を少なく、コストをかけずに作成すること。
【解決手段】小規模固有表現モデル記憶部12に記憶された、人手で正しい固有表現タグが付与された小規模タグ付きコーパスから作成した小規模固有表現モデルを用いて、大規模タグ付きコーパス記憶部11内の単語情報付き単語列に対し、デコーダ16により確率を最大化する固有表現タグ列を推定し、各単語に各固有表現タグをそれぞれ自動付与するとともに、タグ信頼度付与手段14により単語単位に推定された固有表現タグ毎の信頼度を算出し、リジェクタ18にてタグ信頼度が予め設定した値以下であり、不許可と判定された固有表現タグのみ、修正・登録手段19により手作業で修正する。 (もっと読む)


【課題】無意味な空白や記号、想定外の事例による処理誤りのない固有表現抽出処理を実現する。
【解決手段】入力文を形態素解析して生成した形態素列から、不要形態素認定処理部22及び形態素候補作成処理部51で不要形態素を除去して固有表現抽出を行う対象となる形態素のみからなる形態素候補データを生成し、ユーザ辞書参照処理部54でユーザ辞書を参照してユーザ辞書侯補データを生成し、前向き制御処理部65で形態素候補データ中の各形態素について確率モデル及びユーザ辞書侯補データを参照してユーザ辞書由来のスコアを反映した固有表現識別子に対する最大途中確率値を求め、候補探索処理部71で最終的に文頭から文末までの確率値が最大となるような一連の形態素と固有表現識別子の組である固有表現付形態素候補を生成し、不要形態素復元処理部41で前記除去された不要形態素を復元する。 (もっと読む)


【課題】ポーズを含む発話を処理単位に分割する処理単位分割装置を提供する。
【解決手段】発話に応じたテキストの形態素列情報を受け付ける形態素列情報受付部14、教師テキストの教師形態素列情報及び教師テキストの分割位置を示す教師分割情報を含む教師データを保持する教師データ記憶部17、ポーズを検出するポーズ検出部15、分割位置の判断を行う判断形態素、判断形態素の直前の1以上の先行形態素、及び判断形態素の直後の0以上の後続形態素を、判断形態素とポーズとの間の形態素数と、予め決められた後続形態素数との多くない方の数が後続形態素数となるように決定する決定部16、判断形態素、先行形態素、及び後続形態素を用いて教師データの機械学習により判断形態素の位置が分割位置か判断して分割情報を構成する分割部18、分割情報を出力する出力部19を備える。 (もっと読む)


【課題】未知語形態素候補の長さに制限を設けないこと、極端に不適切な未知語形態素候補を排除すること、未知語形態素候補の生成確率が小さくならないことを実現する。
【解決手段】入力文中の文字間が形態素の分割点である形態素分割点確率を計算する形態素分割点確率計算手段と、前記形態素分割点確率を用いて、前記入力文中の文字列が形態素である形態素確率を計算する形態素確率計算手段と、前記形態素確率に基づいて、前記入力文において全ての形態素候補となる文字列を判定する形態素候補判定手段と、を備える。 (もっと読む)


【課題】接続標識や構文構造だけに頼らず、複文の関係を抽出することのできる節間関係推定装置およびコンピュータプログラムを提供する。
【解決手段】装置が、節ペアに関する意味カテゴリーの組合せと節ペアの関係とを関連付けて保持する関係パラメータ記憶部と、テキストデータから得られた節ペアのデータに当該節ペアの関係を表わすデータを付与する節ペア関係付与部と、節の意味カテゴリーを推定するためのルールを用いて、節ペアに含まれる各節の意味カテゴリーを推定する処理を行ない、推定結果の意味カテゴリーを表わすデータを各節に付与する意味カテゴリー推定部と、節ペアに対応する意味カテゴリーの組合せと節ペア関係付与部によって付与された節ペアの関係との共起頻度を計算し、所定範囲の有意確率を有する意味カテゴリーの組合せと節ペアの関係とを関連付けて関係パラメータ記憶部に書き込む検定処理部を備える。 (もっと読む)


【課題】構文パースを使用して正字法バリエーションを有するテキストをセグメント化する方法の提供。
【解決手段】正字法および屈折言語のバリエーション308を構文パーサ316に送ることによりテキストをセグメント化する。可能なセグメントは文字列内で最初に識別される。識別されたセグメントのうち少なくとも2つは互いに重なる。セグメントのうち少なくとも1つについて、他の文字列が識別される。この他の文字列は、セグメントにより識別された単語の異なる語彙形式を識別する、屈折形態論306により形成される。他の文字列はセグメントで識別された単語の正字法バリエーション308を表す場合もある。その後、識別されたセグメントおよび他のセグメントが構文パーサ316に渡され、1つまたは複数の構文解析結果を出力する。解析結果にあるセグメントは、入力文字列のセグメント化を表す。 (もっと読む)


【課題】従来、対話コーパスを自動生成できない、という課題があった。
【解決手段】二人のユーザから入力される連続した対話文であり、第一のユーザから入力された第一対話文と、当該第一対話文の入力後に、第二のユーザから入力された第二対話文と、当該第二対話文の入力後に、第一のユーザから入力された第三対話文を受け付ける対話文受付部と、前記受け付けた対話文のうち、少なくとも一のユーザから入力された対話文を自然言語処理し、少なくとも一の用語を有する処理結果を取得する自然言語処理部と、前記処理結果と前記対話文受付部が受け付けた対話文、または前記処理結果から、対話文の繋がりに関する情報である対話連係情報を生成する対話連係情報生成部と、前記対話連係情報を蓄積する対話連係情報蓄積部を具備する対話コーパス生成装置により、対話コーパスを自動生成できる。 (もっと読む)


【課題】大量の学習データや複雑なルールを用いずに、比較的容易に構築可能でかつ頑健さも兼ね備えた言語理解装置を提供する。
【解決手段】言語理解モデル記憶部(10)は、単語遷移のデータとコンセプト重みデータとを記憶する。有限状態変換器処理部(20)は、入力される単語系列に含まれる単語に基づき、単語遷移のデータに従って、定義された出力を理解結果候補として出力し、単語重み値を累積する。コンセプト重み付け処理部(30)は、コンセプト重みデータに従って、理解結果候補に含まれるコンセプトに対応するコンセプト重み値を累積する。理解結果決定部(40)は、出力された複数の系列の理解結果候補の中から、累積された単語重み値と累積されたコンセプト重み値とに基づき理解結果を決定する。 (もっと読む)


【課題】入力文の記号論理式レベルの文への単純化、記号論理式レベルの単純な文を用いた推論、及び記号論理式レベルの文に基づく出力文の生成の統一的、単純な方法による実現、並びに同様な方法による論理又は言い換え表現の自動的学習の実現。
【解決手段】従来記号論理によって行われている推論処理を、記号論理式と同レベルの単純さの自然言語文を用いて行い、それにより入力文から出力文への変換処理を統一する。また、入力文から記号論理式レベルの単純さの文への言い換えを逆用して、記号論理式レベルの単純さの文に基づく出力文生成を実現する。さらに、同様の言い換えを利用して、単純化された論理又は言い換え表現を抽出して利用する。 (もっと読む)


【課題】入力文の記号論理式レベルの文への単純化、記号論理式レベルの単純な文を用いた推論、及び記号論理式レベルの文に基づく出力文の生成の統一的、単純な方法による実現、並びに同様な方法による論理又は言語表現の自動的学習の実現。
【解決手段】従来記号論理式によって行われている推論処理を、記号論理式と同レベルの単純さの自然言語文を用いて行い、それにより入力文から出力文への変換処理を統一する。また、入力文から記号論理式レベルの単純さの文への言い換えを逆用して、出力文生成を実現する。さらに、同様の言い換えを利用して、単純化された論理又は言語表現を抽出して利用する。 (もっと読む)


【課題】ユーザと多様な対話を可能にする対話処理装置、応答文生成方法、及び応答文生成処理プログラムを提供する。
【解決手段】入力装置14により、ユーザと対話を行う際に当該ユーザからの入力となる入力文を示す入力文データを取得し、コンピュータ本体16により、入力装置14により取得された入力文データにより示される入力文に対して肯定的な応答文を生成し、ディスプレイ12により、コンピュータ本体16により生成された応答文が表示される。 (もっと読む)


61 - 80 / 109