説明

Fターム[5B091CA05]の内容

機械翻訳 (6,566) | 言語処理技術 (1,358) | 文解析 (1,092) | 構文解析 (271)

Fターム[5B091CA05]の下位に属するFターム

Fターム[5B091CA05]に分類される特許

141 - 160 / 258


【課題】複数の文を対象として文章区間を抽出するために、学習データに基づく学習処理の結果を用いることが出来るようにする。またその学習処理の時間を短縮する。
【解決手段】テキスト分析装置が、最終仮説情報を記憶する最終仮説情報記憶部と、学習データを構文解析した結果に基づき木構造を生成する第1木構造生成部と、生成された木構造から複数の部分木を抽出して弱学習器を生成する弱学習器生成部と、生成された複数の弱学習器を基にギブスブースト学習アルゴリズムによる学習処理を行なって最終仮説情報を作成する学習処理部と、判定対象のテキストデータからテキストデータに含まれる文章区間に対応する木構造を生成する第2木構造生成部と、この木構造と前記最終仮説情報とに基づき、文章区間が検索対象に該当するか否かを判定する判定処理部を備える。 (もっと読む)


【課題】個々の事例に応じた複数の固有表現間の関係情報を抽出可能な装置及びその方法を提供する。
【解決手段】入力テキストを形態素解析するとともに入力テキストを構成する文節の係り受けを解析する解析処理部10と、各固有表現が同一文に含まれている場合には、部分木のルート文節に含まれる自立語を関係情報として抽出し、各固有表現のそれぞれが互いに異なる文に含まれている場合には、各固有表現のうち後方固有表現を含む文節から後方固有表現とは異なる自立語を関係情報として抽出する関係情報抽出処理部20とを備えたので、各固有表現の関係情報を入力テキストから抽出することができ、個々の事例に応じた固有表現間の関係情報を抽出することができる。 (もっと読む)


本発明は、自動翻訳方法に関する。
本方法は、ソース言語のフレーズをターゲット言語のフレーズに翻訳するときに、
−翻訳対象のソースフレーズの全体的または部分的な翻訳に対応するターゲット言語のフレーズ部分の組をテキストデータベースから抽出するステップ(1)と、
−ソースフレーズと重なるこれらのターゲットフレーズ部分のすべての組み合わせを決定するステップ(2)と、
−前ステップにおいて組み合わされたターゲットフレーズ部分間の重なりが最大であることを基準として、および組み合わされる要素の数が最小化されることを基準として、最良の組み合わせを選定するステップ(3)と、
−一貫性を基準として最良の組み合わせを選定することによりターゲットフレーズを決定するステップ(4)と
を含む。
本発明は、特に、希少言語のテキストの翻訳に適用可能である。
より一般には、過去に確定されたバイリンガルテキストがない場合の翻訳に適用される。 (もっと読む)


【課題】個々の事例に応じて相互に関係する固有表現の組を抽出可能な装置及びその方法を提供する。
【解決手段】入力テキストを形態素解析して該入力テキストに含まれる複数の固有表現を抽出し、抽出された各固有表現を組み合せてなる複数の固有表現の組毎に、前後の文の話題が変化したと想定される話題区切り候補が入力テキストの各固有表現間に存在するか否かを表す情報を少なくとも含む素性を抽出し、抽出された素性と、所定の固有表現の組に対応する各固有表現間の関係の有無について事前に判別された結果と、該所定の固有表現の組に対応する各固有表現を含むテキストを用いて事前に第2のステップを行うことにより抽出された事前素性とに基づいて、固有表現の組に対応する各固有表現間に関係があるか否かを固有表現の組毎に判別する。 (もっと読む)


【課題】個々の事例に応じて相互に関係する固有表現の組を抽出可能な装置及びその方法を提供する。
【解決手段】テキストが入力されると、入力テキストを形態素解析して該入力テキストに含まれる複数の固有表現を抽出し、各固有表現を組み合せてなる複数の固有表現の組毎に、固有表現の組に対応する各固有表現のそれぞれを含む文節間の係り受け関係を表す部分木を取得し、部分木を少なくとも含む素性を抽出し、抽出された素性と、所定の固有表現の組に対応する各固有表現間の関係の有無について事前に判別された結果と、該所定の固有表現の組に対応する各固有表現を含むテキストを用いて素性抽出処理部から事前に抽出された素性とに基づいて、固有表現の組に対応する各固有表現間に関係があるか否かを固有表現の組毎に判別する。 (もっと読む)


【課題】対象単語に対する意味タグの付与精度を高める。
【解決手段】特徴量抽出部12により、対象単語のうちから選択した処理対象単語について、当該処理対象単語と対象文に含まれる他の単語との間の単語共起関係を示す一次特徴量を生成し、当該処理対象単語と単語共起関係を持つ他の対象単語について記憶部の単語辞書を検索して得られた意味タグおよび意味クラスと当該処理対象単語との間の意味共起関係を示す意味共起特徴量を生成し、当該処理対象単語の一次特徴量と意味共起特徴量から当該処理対象単語の拡張特徴量を生成し、意味タグ決定部13により、処理対象単語の拡張特徴量に基づいて、単語辞書に記述されている当該処理対象単語の意味タグのうち、対象文で使用されている当該処理対象単語の最も適切な意味を示す意味タグを決定する。 (もっと読む)


少なくとも1つの自然言語の電子文書またはデジタル文書において、自動的に全体−部分関係を認識する意味プロセッサ及び方法は、テキストにおいて1つ以上の展開された主語−動作−目的語(eSAO)セットを認識し、各eSAOセットは、1つ以上のeSAO構成要素を有し、意味プロセッサ及び方法は、1つ以上のeSAOセットを全体−部分関係パターンに適合させ、適合に基づいて1つ以上のeSAO全体−部分関係を生成し、前記eSAO全体−部分関係は、全体eSAOと部分eSAOとを含む。
(もっと読む)


【課題】幅広いデータを対象とすることができ、且つ所望の特定の関係を有する複数の語の組みを網羅的に抽出することのできるテキスト分析装置およびテキスト分析プログラムを提供する。
【解決手段】テキスト分析装置が、入力されるテキストデータに含まれる2語のペアそれぞれについての語義特徴および構文特徴を抽出する特徴抽出部と、複数の前記ペアについての特定の関係における共起情報を記憶する共起情報記憶部と、前記特徴抽出部が抽出した前記ペアの前記語義特徴および前記構文特徴と、前記共起情報記憶部から読み出した当該ペアの前記共起情報とに基づき、当該ペアが前記特定の関係を有するか否かを判断する処理を行なう判断処理部を備える。 (もっと読む)


【課題】 自然言語の文章から適切に質問内容を抽出することが可能な技術を提供する。
【解決手段】 本発明は、自然言語の文章から質問内容を抽出する装置として具現化される。その質問内容抽出装置は、その文章を表現する文字列を入力する手段と、その文字列に対応する文節の順列を生成する手段と、その文節の順列に含まれる文節の中から、質問述語を決定する手段と、その文節の順列においてその質問述語よりも前方にある文節を対象として、その質問述語を基準とする係り受け関係を決定する手段と、その質問述語を基準とする係り受け関係をその質問内容として出力する手段とを備えている。 (もっと読む)


【課題】従来の通常型フィルタリング解析方式における特定の入力原言語文に対して発生した、部分パターンに対する不適切なスコアの付与法、部分パターンが存在しない状態が発生しないようにして正しい解析結果を与える機械翻訳結果選択方式を提供することを目的とする。
【解決手段】入力原言語文の特定単語の出現順序と同一の特定単語出現順序を持つ文例を文例群の中から選び、その文例が持つその文例に対応する解析結果の全体またはその一部分を上記通常型フィルタリング解析方式の部分パターンとして用い、これに高いスコアを与えることにより結果として入力原言語文に特化した部分パターンを持つ解析結果を選ぶ。これにより正しい解析結果を得ることができる。 (もっと読む)


【課題】文単位の任意の素性を利用し、予め解候補を用意せずに依存構造の解析を行うことが可能な言語処理装置、言語処理方法、およびコンピュータプログラムを提供する。
【解決手段】言語処理装置は、文節単位の素性を用いて依存構造を解析するための確率モデルのパラメータである文節単位モデルパラメータを推定する文節単位モデルパラメータ推定部(132)と;文単位の素性を用いて依存構造を解析するための確率モデルのパラメータである文単位モデルパラメータを推定する文単位モデルパラメータ推定部(134)と;上記文単位モデルパラメータと上記文節単位モデルパラメータとによって特徴付けられる確率モデルから入力文に対する依存構造のサンプルを生成する動的サンプル生成部(112)と;上記動的サンプル生成部により生成された上記入力文に対する依存構造のサンプルから最適な依存構造を決定する依存構造決定部(113)とを備える。 (もっと読む)


【解決課題】ユーザからの入力文の意図を高精度に判定することができるようにする。
【解決手段】当該ユーザ発話を示す文が疑問文の形式であるか否かに基づいて、ユーザ発話の意図が「質問」であるか否かを判定する(106)。ユーザ発話の意図が「質問」ではないと判定されると、ユーザ発話を示す文が節を含んでいるか否かに基づいて、ユーザ発話の意図が「言明系」であるか否かを判定し(108)、ユーザ発話の意図が「言明系」であると判定されると、前ユーザ発話を示す文が疑問形であるか否かに基づいて、ユーザ発話の意図が「言明」及び「言明型回答」の何れか一方であるかを判定する(110)。一方、ユーザ発話の意図が「言明系」ではないと判定されると、前ユーザ発話を示す文が疑問形であるか否かに基づいて、ユーザ発話の意図が「Y/N回答」及び「了解」の何れか一方であるかを判定する(116)。 (もっと読む)


【課題】複雑な自然言語表現を頑健に理解する能力を有し、かつ、システム開発者の手間を軽減する。
【解決手段】言語理解装置は、ドメイン内の概念のツリー構造と、概念を特定する概念名及び概念表現とを示すデータと、概念名に対応した意味フレーム及びそのスロットを示すデータと、スロットに対応した概念名を示すデータとを記憶する記憶部を備えており、記憶部を参照して、発話内容に含まれる概念表現を検出し、対応する概念名を読み出す。さらに、記憶部を参照して、読み出された概念名に対応する意味フレームのスロット及び当該スロットに対応した概念名とを読み出し、それぞれの意味フレーム毎に、発話内容に含まれる概念表現の中から、当該意味フレームの各スロットに対応する概念名と同じ概念名に対応し、かつ、未入札の概念表現を特定し、特定した概念表現に当該スロットを入札し、その入札した結果を示すスロット割当表データを生成する。 (もっと読む)


【課題】入力されたテキストデータから対象表現、属性表現および評価表現よりなる評価情報を抽出して出力する際、様々なドメインに対しコストをかけずに評価情報の各要素の関係を抽出でき、関連付けて出力可能とすること。
【解決手段】形態素解析部6、固有表現抽出部7および係り受け解析部8により、テキストデータから単語、固有表現、文節および係り受け情報を抽出し、評価表現抽出部9により、評価表現辞書3および評価表現ルール4を参照して単語情報から評価表現情報を抽出し、属性表現抽出部10により、カテゴリフィルタを参照して単語、固有表現、文節、係り受けおよび評価表現情報から属性表現情報を抽出し、対象表現抽出部11により、単語、固有表現、文節、係り受け、評価表現情報および属性表現情報から対象表現情報を抽出し、評価情報作成部12により評価情報を出力する。 (もっと読む)


【課題】係り元・係り先の2文節のみならず他の文節の情報も利用して、係り先がない文節または自身に係る文節を含めて解析すること。
【解決手段】単語情報付き文節列の各文節の特徴を表す素性列を生成し(s1)、その各文節に対する、着目文節が後方N文節のどの文節にどのタイプで係るか又は後方N文節には係らないことを表すラベルを、着目文節のラベルの尤もらしさを着目文節及び後方N文節の素性と着目文節の直前の文節のラベルとから算出する条件付き確率場に基づく系列ラベリングにより決定し(s2)、各ラベルから後方N文節内に係り先がある文節を判定し、素性列から削除するとともに該削除文節に関するラベルを係り受け情報に変換し(s3)、素性列の文節数が1以下になるまで前記系列ラベリング及び文節削除を繰り返し(s4)、残された文節に関するラベルを係り受け情報に変換することにより係り受け情報付きの文節列を復元する(s5)。 (もっと読む)


【課題】機械翻訳の精度を向上させる。
【解決手段】メッセージを翻訳するシステムであって、互いに同一の内容を互いに異なる第1言語および第2言語のそれぞれで記述した第1メッセージおよび第2メッセージのそれぞれを構文解析することにより、第1メッセージの構造を示す第1構文木、および、第2メッセージの構造を示す第2構文木を生成する構文解析部と、第1構文木に含まれるある部分木によって表される語句の表記が、第2構文木においてその部分木に対応する部分木によって表される語句の表記と一致する場合に、その語句を翻訳不要の語句と判断する判断部と、第3言語で記述した第3メッセージを翻訳して第4言語で記述した第4メッセージを生成する処理において、第3メッセージに含まれる翻訳不要の語句を第3メッセージ中の表記のまま、翻訳後の第4メッセージに含めて出力する翻訳部とを備えるシステムを提供する。 (もっと読む)


【課題】辞書を動的に更新可能とする。
【解決手段】コーパスの中のテキストを構文解析するための方法を提供する。テキストの第1のセグメントに基づいて辞書の可能な新しいエントリの仮説を立てる(ステップ302)。次に、その可能な新しいエントリを使用して、テキストの第1のセグメントに関する正常な構文解析が形成される(ステップ307)。その正常な構文解析に基づき、新しいエントリを含むように辞書が変更される(ステップ312)。次に、辞書の中のその新しいエントリを使用してテキストの第2のセグメントを構文解析する(ステップ300)。 (もっと読む)


【課題】言語情報を考慮して良質な対訳フレーズを抽出すること。
【解決手段】フレーズアラインメントの指標を総合評価値算出部30が算出する場合に、コーパスベース統計評価値算出部41が算出する単語間翻訳確率、辞書情報対応部42が算出する辞書対応情報、および構文構造評価値算出部31が算出する構文構造情報を定量的に結合して総合的評価基準を求める。これにより、単語間翻訳確率が有効に活かせるだけではなく、構文解析情報や辞書情報などの言語学的に裏付けられた情報が定量的に組み込まれるため、フレーズアラインメントを優位度情報付きで進めることが可能となる。 (もっと読む)


【課題】内包する構文木を個々に評価することなく一括して係り受け解析を施すことが可能な構造を有した統語森を生成する自然言語解析装置及び同装置による係り受け解析方法を提供すること。
【解決手段】入力形態素列を構文解析することにより、複数の構文木を内包する統語森を生成する自然言語解析装置であって、文法規則を記憶する第1のメモリを具備し、前記文法規則に基づいて、前記入力形態素列から主辞及び前記主辞が支配する部分構造に相当する主辞支配域を検出する検出手段を具備する。また、検出手段により検出された主辞支配域を有する主辞構造付統語森を生成する構文解析手段を具備する。 (もっと読む)


【課題】対話を円滑に行うコミュニケーション支援装置を提供する。
【解決手段】第1言語文の入力を受付ける第1言語受付部101と、第1言語文を構文解析して1または複数の単語を構成要素とする第1言語構造情報を生成する第1言語解析部102と、受付けた第1言語文を翻訳した第2言語文を生成する第2言語文生成部104と、第2言語文を受付ける第2言語受付部111と、第2言語文を構文解析して1または複数の単語を構成要素とする第2言語構造情報を生成する第2言語解析部112と、第1言語構造情報を構成する第1単語と、第2言語構造情報を構成する第2単語とを比較し、同一または類似の意味内容を含む第1単語が存在しない第2単語を抽出する抽出部131と、第2言語文を翻訳し、抽出した第2単語に対応する第3単語を、抽出した第2単語以外に対応する第4単語より優先して出力する第1言語文を生成する第1言語文生成部114と、を備えた。 (もっと読む)


141 - 160 / 258