説明

Fターム[5B091CA05]の内容

機械翻訳 (6,566) | 言語処理技術 (1,358) | 文解析 (1,092) | 構文解析 (271)

Fターム[5B091CA05]の下位に属するFターム

Fターム[5B091CA05]に分類される特許

201 - 220 / 258


【課題】述語に対応するより具体的な主語または目的語を抽出することができる単語抽出方法、データベース構築方法、データベース構築装置、データベース構築プログラム、および、記録媒体を提供する。
【解決手段】取得部11は、語義辞書12から述語の見出し語と、この見出し語の語義文とを取得する。解析部13は、取得部11が取得した語義文を構造解析する。抽出部15は、解析部13により構造解析が行われた語義文から名詞を抽出する。登録部16は、取得部11が取得した述語と、抽出部15が抽出した名詞とを対応付けて典型文DB18に登録する。これにより、典型文DB18には、述語に対応するより具体的な主語または目的語が登録される。 (もっと読む)


【課題】 単語列に対して高精度な解析結果を取得する。
【解決手段】 評価対象単語列に対する構文及び意味の解析を行う構文・意味解析装置において、文節内の品詞及び文節境界の生起確率である文節モデルを用いて、前記評価対象単語列の品詞・文節境界候補の探索を行い、構文スコアを算出する品詞・文節境界候補探索手段と、自立語の意味素性の文節間での依存確率である意味依存モデルを用いて、前記品詞・文節境界候補探索手段により得られる品詞・文節境界候補に対して各自立語の意味素性の文節間での依存構造の同定を行い、意味スコアを算出する意味依存構造同定手段と、前記構文スコア及び前記意味スコアに基づいて妥当性スコアを算出し、前記品詞・文節境界候補のうち、特定の妥当性スコア及び/又は特定の妥当性スコアの構文・意味解析結果を出力する解析スコア算出手段とを有することにより、上記課題を解決する。 (もっと読む)


【課題】原文から翻訳対象の入力原文を取得した際に欠如した文字または誤入力された文字のある単語を、入力原文の取得元の特性を基に訂正することで、他言語への翻訳の際に未知語や非文の発生を低減し、翻訳精度を向上すると共に作業効率を向上する。
【解決手段】翻訳原文推定装置は、Webページより取得した文字列を単語の単位に分割した複数の単語のうち先頭単語の先頭文字が小文字が大文字かを判定し、先頭文字が小文字の場合、先頭単語の先頭に大文字のアルファベットを付加した複数の先頭単語置き換え単語を生成する形態素解析部14と、生成された複数の先頭単語置き換え単語について辞書部10の辞書データを基に選出された辞書部10に存在する先頭単語置き換え候補を原文の先頭単語と置き換えた1つ以上の文について辞書部10の辞書データを基に構文解析を行う構文解析部15と、その中から文法的に正しい原文候補を選出し翻訳部18へ出力する構文解析制御部16とを備える。 (もっと読む)


ドキュメント(600)内で定義を識別する方法は、入力としてテキスト単位を受け取ること(605)を含む。その後、どのテキスト単位がキューフレーズを含むかが識別される(610)。キューフレーズを含むと識別されたテキスト単位について、キューフレーズを含むテキスト単位が定義を包含するかどうかを判定するために、キューフレーズの周辺で局所化された解析が実行される(615)。
(もっと読む)


【課題】 翻訳文の言語の知識を要せずに、原文に沿う高精度な翻訳結果を得ることを可能とする。
【解決手段】 係り受け関係抽出手段102は、翻訳手段101によって翻訳された翻訳文を単語毎に切り分けてそれぞれの係り受けの関係を抽出する。係り受け関係図式化手段103は、係り受け関係抽出手段102によって抽出された係り受け関係を図式化する。対応単語抽出手段104は、係り受け関係抽出手段102で抽出した単語に対応する原文の単語を対応単語として抽出する。図形検索手段105は辞書110から翻訳文の各単語に対応する図形を検索する。表示手段106には、図式化した係り受け関係、対応単語および単語に対応する図形を組み合わせた翻訳結果が表示される。 (もっと読む)


【課題】同義語や類義語についてどのような意味の語と一緒に使われることが多いかという用法の違いに関する汎用性の高い情報を、高精度で自動的に得られるようにする。
【解決手段】複数の同義語,類義語の入力を受け付ける手段1、入力単語を含む文データをコーパスから抽出する手段2、この文データを構文解析してそれらに含まれる入力単語と文法的関係にある名詞を抽出する手段3、シソーラスからこの名詞とその上位概念のノードを抽出して有向グラフを入力単語ごとに生成する手段4、複数の有向グラフを比較して異なるノードを抽出する手段5、抽出した有向グラフの差異のノードを入力単語の用法の違いに関する情報として出力する手段6、を備えた装置Aを構成し、またコンピュータを同装置Aとして機能させるプログラムを用いる。
(もっと読む)


【課題】言語の解析を正確に行うことのできるシステムを提供する。
【解決手段】与えられた文をトークンに分割し、品詞を決定する。品詞を一義的に決定できないトークンについては、前後のトークンの品詞に基づいて決定する。次に、述語について、接尾語等を用いて属性の解析を行う。次に、役割と品詞のマッチングによる局所的な構造の解析と役割の決定を行う。その後、従属文の抽出および文型分析等により全体的な構造の解析を行う。全体的な構造の解析によって、局所的な構造の修正が必要であれば修正を行う。 (もっと読む)


【課題】従来の機械翻訳装置においては、高品質かつ高速な翻訳ができない、という課題があった。
【解決手段】複数の単語からなり非終端記号を含まない長単位句を一ノードとする原言語木構造情報を有する原言語木構造モデルと、複数の単語からなり非終端記号を含まない長単位句を一ノードとする目的言語木構造情報を有する目的言語木構造モデルと、原言語木構造情報と目的言語木構造情報との対応を示す情報であるマッピング情報とマッピング確率を有する木構造マッピングモデルと、第二言語における単語の出現に関する確率の情報である単語出現確率を1以上有する言語モデルとに基づいて、受け付けた文章を構文解析し、翻訳モデル確率と、言語モデル確率を取得し、当該2つの確率に基づいて、出力の構文木を評価し、出力する翻訳文を決定する機械翻訳装置により、高品質かつ高速な翻訳が可能となる。 (もっと読む)


【課題】人間にとって理解しやすい解析結果を出力することができる文章解析装置、文章解析方法、プログラムおよび記憶媒体を提供する。
【解決手段】分割部13aは、入力された文章を単語単位で分割する。言語解析部13dは、単語単位に分割された分割候補に対して構文解析、意味解析、構文意味解析等の言語解析を行い、複数の異なる解析構造を有する解析候補を生成する。親密度算出部13cは、言語解析部13dにより生成された各解析候補に含まれる各単語の親密度を単語記憶部11から抽出し、文中に含まれる単語の親密度の平均を解析候補毎に算出する。選択部13dは、言語解析部13bにより生成された複数の解析候補の中から、文中に含まれる単語の親密度の平均が最も高い解析構造を抽出する。これにより、人間にとって理解しやすい解析結果が出力される。 (もっと読む)


【課題】 複数種類の分析に備えて複数種類のデータ解析結果を保持することができるようにすること。
【解決手段】 分析部112は、言語解析結果格納部108に格納された複数のデータファイルのデータ解析結果から分析パラメータ設定部111による分析パラメータに指定されたデータ解析結果を選択して、設定された分析パラメータに基づいて分析を実行する。 (もっと読む)


【課題】 質問応答システムにおいて、質問に対して最適な回答を提供可能とした構成を実現する。
【解決手段】 入力質問の検索結果に対する照応解析結果に基づいて、検索結果に含まれる名詞句、代名詞およびゼロ代名詞のいずれかの表現を整理し、参照関係にある表現を共有する文を参照関係文として抽出し、回答候補抽出パッセージの選択処理において、選択パッセージに対応する参照関係文を含めて回答候補抽出パッセージとして設定し、これらのパッセージから回答候補を抽出する。本構成により、検索キーワードとのマッチ度に基づくパッセージ選択を行なった場合に、キーワードから離間した位置にある有力な回答候補を見落とすことなく、確実に回答候補として取得し、クライアントに提示することが可能となる。 (もっと読む)


【課題】 構文構造に係る解説も提供可能な検索効率が良い自然言語学習支援装置、方法及びプログラムを提供する。
【解決手段】 本発明では、辞書は、自然言語文を構文解析する際に利用される辞書情報本体と、その辞書情報本体に対応付けられた原解説情報とを少なくとも含むレコード情報を複数格納している。そして、辞書の辞書情報本体を利用して入力文を構文解析している際に、構文解析に用いられた辞書情報本体に係る原解説情報を少なくとも記憶し、入力文、及び、記憶された原解説情報から、出力解説情報を作成して出力する。
解説情報を取り出すためだけの辞書検索が不要となっている。また、構文解析時に把握された構文構造も解説対象とし得る。 (もっと読む)


【課題】 複数の入力文章に含まれるすべての動作表現に対して入力者の意図を設定することができ,様々な表現を含む入力文章の分類精度を向上させる。
【解決手段】 入力文章から,少なくとも,係り元単語と係り先単語と接続単語とを抽出する単語抽出部104と;係り先単語に付与された直接付属単語より表される入力者の意図を表す係り先単語意図情報を設定する係り先単語意図情報設定部106と;予め,接続単語と,係り先単語と,係り先単語の意図情報を表す係り先単語意図情報と,係り元単語の意図情報を表す係り元単語意図情報とを組み合わせた意図情報パターンを記憶する意図情報パターン記憶部110と;意図情報パターン記憶部に記憶された意図情報パターンに基づいて,入力文章の係り元単語に入力者の意図を表す係り元単語意図情報を設定する係り元単語意図情報設定部108と;を備える。 (もっと読む)


【課題】利用者が再入力する負担を軽減し、適切な対訳文を出力することができるコミュニケーション支援装置を提供する。
【解決手段】複数の言語間の翻訳を行うことによりコミュニケーションを支援するコミュニケーション支援装置において、翻訳の元となる原言語による音声を認識して認識の結果である原言語文を出力する音声認識部101と、連続して認識した複数の音声の間の類似性に基づいて類似する音声が連続して入力されたか否かを判定する連続入力判定部102と、原言語文を翻訳して対象言語で記述された対訳文に変換して出力する言語変換部103とを備え、言語変換部103は、連続入力判定部102が類似する音声が連続して入力されたと判定した場合に、先に認識した音声に対応する原言語文に対して出力した対訳文と異なる対訳文を、後に認識した音声に対応する原言語文に対して出力する。 (もっと読む)


【課題】係り受けの関係を考慮することにより、語句のみを検索した場合や、語句の変化に着目した場合には見落としやすい着眼点に基づいて文を抽出すること。
【解決手段】まず、解析部202は、文書中に含まれる所定の文における句の並びを解析する。次に、特定部204は、解析部202によって解析された句の並びについて、係り受けの関係を特定する。そして、表示部205は、特定部204によって特定された係り受けの関係を、文書から抽出した所定の文とともに表示する。 (もっと読む)


本発明は、モビール形状概念を基礎にした構文分析方法及び自然語検索方法に関し、入力された文章の形態素を分析する形態素辞書プログラムと、文法規則が格納される文法規則データベースと、助詞と語尾を共に統語の単位として取り扱う標識理論に基づいて用言語尾の統語的地位を認定し、語彙間の統合関係が完全に文法的に規定され得るように、文章の各構成成分の語幹及び語尾など中心語(head)が有する下位範疇の内訳が格納される下位範疇化データベースとを構築し、分析すべき文章が入力されれば、前記形態素辞書プログラムにより各語節形態素内訳を分析し、各語節形態素分析資料のうち該当入力資料に適した形態素を選択し、前処理を実施する形態素分析段階と、分析された形態素を文法規則データベースに格納された文法的規則によって文章の部分的な構造をまず確立し、前記下位範疇化データベースを用いて全体的な構造を確立し、各構造の加重値を計算して、最も適した最適例を確定して出力する構文分析段階と、を備えてなる。本発明によれば、いかなる語順倒置型構文も分析が容易なので、別途の難しい分析装置を使用することなく、早く処理することができ、文章を構成する表現間の文法的関係を正確に捕捉することができ、その結果、人間が判断することと同様の方式で、ユーザが要求する情報を検索して、正確な情報を提供することができるという効果を有する。
(もっと読む)


【課題】 質問応答システムにおいて、質問に対して最適な回答を提供可能とした構成を実現する。
【解決手段】 入力質問に基づく検索処理結果に基づいて初期回答候補を抽出し、抽出した回答候補についての検査処理を実行し、質問に対する最適な回答を選択可能とした。回答候補を適用したクエリによって検索を行い、検索結果として得られた文の構成語が、入力質問の構成語の語彙意味と同様の語彙意味を有するか否かを判定し、同様の語彙意味を有すると判定されたクエリに含まれる回答候補を、最終的な回答候補として選択する。本構成により、質問に対する最適な回答を回答候補として選択してクライアントに提供することが可能となる。 (もっと読む)


【課題】コンピュータを用いてタプルデータを検出することができ、テキストデータを十分に解析可能なテキストデータ解析方法,テキストデータ解析サーバ,テキストデータ解析プログラム及びテキストデータ解析プログラムを記録した記録媒体を提供することを目的とする。
【解決手段】テキストデータ解析方法であって、辞書を利用する形態素解析機能によりテキストデータを形態素に分離するステップと、タプル構成機能が構成ルールに従い、形態素をノードとした構文木データを作成するステップと、タプル抽出機能が抽出ルールに従い、ノード間を合体して構文木データから部分木データを作成するステップと、カテゴライズ機能がシソーラスに従い、部分木データに含まれる意味的に類似する語句を同一の語句に統一し、ノードに関係子を割り付けて部分木データからタプルデータを作成するステップとを行うことにより上記課題を解決する。 (もっと読む)


【課題】 翻訳メモリシステムに処理対象として新たな翻訳元言語が追加された場合であっても、それぞれの異種言語間の対訳ペアを作成するのに要する手間や時間を軽減する。
【解決手段】 ペア格納部11は、翻訳先言語で表現された自然言語文と、その自然言語文を中間言語で表現した中間言語表現とのペアを複数格納している。構文意味解析部12は、翻訳元言語(言語a)で表現された自然言語文が入力されると、その自然言語文に対して構文意味解析を施すことによって、その自然言語文を中間言語表現に変換する。検索部13は、ペア格納部11に格納されている内容を検索し、構文意味解析部12によって得られる中間言語表現と一致する中間言語表現を特定する。さらに、検索部13は、特定した中間言語表現とペアをなす翻訳先言語(言語b)で表現された自然言語文をペア格納部11から抽出する。出力部14は、抽出された自然言語文を翻訳結果として出力する。 (もっと読む)


【課題】 簡便かつ高精度な同義語データベースを生成する情報処理装置、同義語対生成方法、同義語対生成プログラム、同義語対生成プログラムを記録した記録媒体を提供する。
【解決手段】 文を構成する文節の品詞と、文節の係り受けを解析する係り受け解析手段と、文から、第一記号と第二記号とからなる所定の記号対を含む文である対象文を検出する対象文検出手段と、係り受け解析手段による係り受け解析結果を用いて、対象文における第一記号の直前の所定の連続する文節からなる第一の文字列と記号対内の所定の連続する文節からなる第二の文字列とを抽出する文字列対抽出手段と、第一の文字列と第二の文字列がともに係り関係を有する所定の文節が存在するか否かを判定する共係り関係存在判定手段とを有し、共係り関係存在判定手段で係り関係が存在する場合、第一の文字列と第二の文字列を同義語対とする。 (もっと読む)


201 - 220 / 258