説明

Fターム[5B091CA05]の内容

機械翻訳 (6,566) | 言語処理技術 (1,358) | 文解析 (1,092) | 構文解析 (271)

Fターム[5B091CA05]の下位に属するFターム

Fターム[5B091CA05]に分類される特許

81 - 100 / 258


【課題】所定のインスタンスとの関係がオントロジ上での特定の関係に該当するフレーズを、入力された解析対象記事から抽出するに際して、該抽出に係る再現率および適合率の向上が図られるようにする。
【解決手段】関係解析部10によって、所定のインスタンスとの関係がオントロジ上での特定の関係に該当するフレーズを解析対象記事から抽出すると共に、間接的関係解析部20によって、所定のインスタンスとの関係がオントロジ上での特定の間接的関係に該当する間接的関係フレーズを解析対象記事から抽出する。 (もっと読む)


【課題】 分析対象の文から所望の記述内容を効果的に抽出できるようにする。
【解決手段】 所望する記述内容を抽出するための複数の間接表現語を間接表現展開辞書2から取得し、アンケート結果記憶部3に記憶されているアンケートの回答文を構成する語の係り関係を解析部4により解析した結果に基づいて、当該回答文を構成する語のうち前記取得した複数の間接表現語のいずれかに対して係り元の関係を有する語又は係り先の関係を有する語の一方又は両方を特定部5により特定し、当該特定した語を基準とした意味チャンク(或いはフレーズ)を出力部6により出力する。 (もっと読む)


【課題】数を表す語と組み合わせて文中で用いられる単語が助数詞及び名詞のいずれか一方として機能するか又は両方として機能するかの判定の基礎となる基礎情報を文章群データに基づいて取得する言語処理装置を提供する。
【解決手段】単語取得手段(21)は、数を表す語と組み合わせて文中で用いられる単語を取得する。統計情報取得手段(22)は、文章群データに基づいて、単語の用いられ方に関する統計情報を取得する。基礎情報生成手段(23)は、単語が助数詞及び名詞のいずれか一方として機能するか又は両方として機能するかの判定の基礎となる基礎情報を、統計情報に基づいて生成する。 (もっと読む)


【課題】格フレーム情報を取得したいドメインのコーパスが少量しか存在しなくても、その目的のドメインに適した格フレーム情報を取得可能とし、そのドメインに対する解析精度を向上させる。
【解決手段】目的のドメインの少量のコーパスと目的のドメインとは異なるドメインの大量のコーパスの係り受け情報を作成し、この複数のドメインのコーパスから取得した係り受け情報を使って補語をクラスタリングし、このクラスタリングした係り受け情報の目的ドメインの情報のみを使って格フレームの選択制約を作成し、この選択制約に基づいて解析する。 (もっと読む)


【課題】個々の事例に応じた複数の固有表現間の関係情報を高精度で抽出可能な装置、その方法、プログラム及び記録媒体を提供する。
【解決手段】入力された複数の固有表現に関係する情報を抽出する装置であって、前記各固有表現を含むテキストが入力されると、入力テキストを形態素解析するとともに入力テキストを構成する文節の係り受けを解析する解析処理部10と、解析処理部10による解析結果を取得すると、入力テキストに含まれる少なくとも一つの自立語を関係情報候補として抽出するとともに、該関係情報候補が関係情報であると推定される度合を表す関係推定情報を、抽出された関係情報候補毎に取得し、解析結果及び関係推定情報に基づき関係情報候補から関係情報を抽出する関係情報抽出処理部20とを備えた。 (もっと読む)


【課題】テキストデータにおいて、対応する実データが存在しないものが含まれる場合においても、言語モデルを高精度に識別学習できるようにすること。
【解決手段】言語モデル更新装置は、テキストデータから合成したデータである擬似データを用いて言語モデルを更新する言語モデル更新部を備える。 (もっと読む)


【課題】入力文内の翻訳領域を簡単かつ適切に設定すること。
【解決手段】(A)において、ユーザ操作により入力文内の領域「弟が水」を指定する。(B)において、形態素解析を実行する。(C)において、対象領域を特定する。(D)において、対象領域内の文節間で係り受けチェック(1回目)をおこなう。(E)において、2回目の係り受けチェックをおこなう。これにより、拡大された対象領域「弟が水曜日に買った」が翻訳領域に決定される。したがって、翻訳領域において翻訳が可能となる。 (もっと読む)


【課題】項判定規則を高精度で自動学習し、ゼロ代名詞や複合名詞を含めた述語項構造解析を統一的に扱うことができる辞書作成装置を提供する。
【解決手段】正解項構造付き訓練用テキストを構文解析し、構文・意味解析結果テーブル120を作成する構文・意味解析部101と、前記構文・意味解析結果テーブル120を参照して、学習を行うための属性を抽出し訓練属性インデクステーブル121を作成し、同時に訓練ベクトルを作成して訓練ベクトルテーブル122を作成する訓練データ作成部102と、前記テーブル122を用いて属性の重要度を表す重みを学習し、該学習により得られた重みを前記訓練属性インデクステーブル121に追加して重みテーブル123を作成する重み学習部103と、前記重みテーブル123を参照し、重要度の高い属性順に属性を並べ替えたリストを項判定規則として出力する項判定規則作成部104とを備える。 (もっと読む)


【課題】文をその区切りによって分割して得られる文要素に対して構文解析を行う場合に、構文解析に失敗しにくい構文解析装置を提供する。
【解決手段】解析対象文を複数の文要素に分割し、分割された複数の文要素の少なくとも一つについて、標準文法規則に基づいて当該文要素に適合する修正文法規則を生成し、当該生成された修正文法規則を用いて文要素の構文解析を行う構文解析装置である。 (もっと読む)


【課題】確率文脈自由文法探索において、探索結果の精度を維持しつつ、計算コストを低減する技術に関する。
【解決手段】確率文脈自由文法探索において、終端記号と非終端記号(ノード)と確率付き生成規則の集合によって定義される文法Gが与えられたとする。まず、文法Gをランダムに並び換える(ステップS101)。次に、ノードをすべて集約して近似確率P2を算出し(ステップS105)、文法Gに対してノードの枝刈り(枝刈りされた部分は探索の対象外とされる)を行いつつ、ノードを高さごとに集約して近似確率P1を算出して(ステップS107)、解候補の確率θと比較し(ステップS106、S108)、ノードの枝刈りを行いつつ、厳密な確率Pの算出に用いられる文法の数やノードの数を低減した上で、厳密な確率計算を行う(ステップS109)。 (もっと読む)


【課題】テキスト文書が正しくない照応解析の結果が得られやすいテキスト文書であるか否かの判別を図る分類器を生成する情報処理装置を提供すること。
【解決手段】標本解析部4は、複数の正解コーパスに対して照応解析を行う。教師データ取得部6は、正解コーパスごとに、該正解コーパスに対して行われた照応解析の精度が所定精度以上であるか否かの判定結果を教師データとして取得する。学習データ取得部8は、正解コーパスごとに、該正解コーパスの内容に基づいて、基準学習項目に対応する特徴量を学習データとして取得する。する。分類器生成部10は、教師データと学習データとに基づいて、第2分類器を生成する。 (もっと読む)


【課題】文章に含まれる未知語の意味情報を推定して文章解析をすること。
【解決手段】本発明に係る文章解析システムは、解析対象である文章の構文解析結果を利用して、前記文章に含まれる未知語の意味情報を、前記文章に含まれる既知語の意味情報に基づいて推定する。 (もっと読む)


【課題】従来、ブログ等の文章群の文脈を可視化できなかった。
【解決手段】一人以上の個人が入力した1以上の文章群を格納し得る文章群格納部と、前記文章群格納部に格納されている文章群に含まれる文から、動作や状態の主体である主体語または動作や状態の客体である客体語である対象物を取得する対象物取得部と、前記文章群格納部に格納されている文章群に含まれる文から、前記対象物に対応する用語であり、動作や状態を示す用語である動作状態を取得する動作状態取得部と、前記対象物と、当該対象物に対応する動作状態とを対応付けた図である対応図を出力する対応図出力部とを具備する情報出力装置により、ブログ等の文章群の文脈を可視化できる。 (もっと読む)


【課題】コンテンツに含まれる第1言語の第1音声信号および第2言語の第2音声信号の一方から第3言語に翻訳する際に、より翻訳精度が高いと判断される音声信号を選択することにより、翻訳精度を向上させたコンテンツ出力装置を提供する。
【解決手段】本発明のコンテンツ出力装置100は、第1言語の第1音声信号および第2言語の第2音声信号のを含み、少なくとも一方の音声信号を出力することが可能なコンテンツを受信する受信部(アンテナ110、チューナ部120、制御部210)と、第1言語の第1音声信号から第3言語に翻訳した場合の正確さの尤度と、第2言語の第2音声信号から第3言語に翻訳した場合の正確さの尤度とを比較し、該尤度の高い方の音声信号から第3言語に翻訳する翻訳部(言語翻訳部190、辞書部200、制御部210)と、該翻訳部により翻訳した第3言語の音声信号を出力する音声出力部180とを備える。 (もっと読む)


【課題】機械翻訳システムを改善する必要性に対処するシステムまたは方法を提供する。
【解決手段】2カ国語コーパス取得される依存構造のノードを整列させるメソッド300は、第1の段階302が、該依存構造のノードを関連付けて仮の対応を形成する2段階アプローチを含む。次いで、段階304において、該依存構造のノードを仮の対応および/または構造的考察に応じて整列させる。整列した依存構造からマッピングを取得する。翻訳実行時により流暢な翻訳が取得できるように、ローカルコンテキストの種類および量の変化に応じてマッピングを拡大することが可能である。 (もっと読む)


【課題】ユーザにより辞書登録または訳語学習された語句の関連語の辞書登録/訳語学習を何度も行う手間を省き、翻訳処理の効率を上げることである。
【解決手段】ユーザによって指定された第一言語の原文中の辞書登録または訳語学習の対象となる原文語句、その原文語句に対応する訳文語句及び訳文語句の訳語情報を辞書登録/訳語学習指定部26aで受け付け、登録見出し語・訳語対応付け部26bで原文語句の構成語と訳文語句の構成語との対応付けを行い、関連表現パターン展開部27aは、関連表現パターン定義格納部27cに格納された関連表現パターンに基づいて辞書登録または訳語学習の対象となる原文語句の関連表現を展開し原文語句から派生する関連語句を作成し、訳出パターン作成部27bは関連表現パターン展開部27aで作成された関連語句に対して関連語句の訳語を作成する。 (もっと読む)


【課題】より一般化され網羅性がある形態素複合ルールを生成すること。
【解決手段】形態素複合ルール生成エンジン22は、サンプル文章から形態素解析された形態素と、その形態素の品詞との基本組み合わせ及びその部分集合の組み合わせを算出し、全組み合わせのうち、出現比率が所定の閾値以上である組み合わせを複合ルール候補として抽出する。形態素複合ルール生成エンジン22は、形態素解析後の他のサンプル文章に複合ルール候補を適用して形態素を複合し、その複合語の、インターネット上の検索エンジンによる完全一致検索数が所定数以上である場合に、その複合ルール候補を正式複合ルールとして確定する。 (もっと読む)


【課題】適用変換規則の組合せに制限がある場合にも高速に最適な適用規則の組合せを求めることができる言語処理装置を提供する。
【解決手段】 入力された構文解析結果に対し、あらかじめ与えられた構文情報に対する格構造への重みつき変換規則を適用し、最適な格解析結果を得る言語処理装置10であって、前記構文情報に対する格構造への重みつき格変換規則を記憶した重みつき格変換規則テーブル20と、入力された構文情報および前記重みつき格変換規則テーブル20に記憶された格変換規則を用いて最適な格解析結果を得る格変換部30とを備える。 (もっと読む)


【課題】 単語から該単語の、様々なレベルの上位概念や下位概念、兄弟概念の単語を導出する。
【解決手段】 本発明は、コーパスが入力されると、該コーパス内の任意の単語Aに対し、各成分の値が、単語Aと、該成分に対応する単語または単語意味属性との共起頻度の相対値である単語ベクトルを生成し、単語ベクトル記憶手段に格納し、任意の単語Bに対し、該単語Bの前記単語ベクトル記憶手段に格納されている単語ベクトルと、任意の単語Cの該単語ベクトル記憶手段に格納されている単語ベクトルとの間の、あるパラメータαのもとでのダイバージェンス距離を算出し、該単語Bと該単語Cとの間の単語間関連度を算出し、単語間関連度記憶手段に格納する。 (もっと読む)


【課題】第1の文(リード文)とそれに関連する第2の文(本記文の集合)が与えられたとき、本記文の表現を用いてリード文の表現を正しい文法構造で具体化する。
【解決手段】係り受け解析部は、第1の文データと、第1の文データに関連する第2の文データを入力し、第1の文データと第2の文データをそれぞれ解析して、第1の文データおよび第2の文データについての係り受け構造データを出力する。自動編集部は、第1の文データと第2の文データの係り受け構造データを比較した結果に基づき、第1の文データに含まれる表現を第2の文データに含まれる表現で置換しても係り受け構造に矛盾が生じない表現置換候補と、第2の文データに含まれる表現を第1の文データ内の所定箇所に挿入しても係り受け構造に矛盾が生じない表現挿入候補との、少なくともいずれかを抽出し、これらの少なくともいずれかに基づいて第1の文データを編集する処理を行なう。 (もっと読む)


81 - 100 / 258