説明

Fターム[5B091CA21]の内容

機械翻訳 (6,566) | 言語処理技術 (1,358) | 変換・文生成 (261)

Fターム[5B091CA21]の下位に属するFターム

Fターム[5B091CA21]に分類される特許

121 - 140 / 152


【課題】誤りを含まない対象言語文を得ることができるコミュニケーション支援装置を提供する。
【解決手段】原言語文の意味内容を解析し、その解釈の候補である少なくとも1つの原言語解釈候補を出力する原言語解析部102と、複数の原言語解釈候補の各候補間の相違する部分である曖昧部分を検出する曖昧部分検出部106と、曖昧部分検出部106が検出した曖昧部分を削除する曖昧部分削除部107と、原言語解析部102が出力し、曖昧部分削除部107が曖昧部分を削除した原言語解釈候補を、対象言語における意味内容に翻訳し、対象言語における意味内容の解釈の候補である少なくとも1つの対象言語解釈候補を出力する翻訳部103と、翻訳部103が出力した対象言語解釈候補に基づき、対象言語で記述した文である対象言語文を生成し、対象言語文の候補である少なくとも1つの対象言語文候補を出力する対象言語生成部104と、を備えた。 (もっと読む)


【課題】省略語の本来の意味を表す翻訳結果を得ることのできる技術の提供を目的とする。
【解決手段】原文の記載された原稿の画像を入力し、原文のレイアウトを解析して、語句の省略語とその定義内容とを関連付けた省略語定義領域を抽出する。抽出された省略語定義領域に含まれる定義内容に対応する翻訳語を辞書から抽出し、翻訳語の先頭文字を用いて翻訳省略語を生成する。翻訳省略語と原文の省略語とを対応付けて省略語辞書に記憶させる。そして、原文の文字列に対応する翻訳語および翻訳省略語を辞書および省略語辞書から抽出して翻訳文を生成して出力する。 (もっと読む)


【課題】 翻訳メモリシステムに処理対象として新たな翻訳元言語が追加された場合であっても、それぞれの異種言語間の対訳ペアを作成するのに要する手間や時間を軽減する。
【解決手段】 ペア格納部11は、翻訳先言語で表現された自然言語文と、その自然言語文を中間言語で表現した中間言語表現とのペアを複数格納している。構文意味解析部12は、翻訳元言語(言語a)で表現された自然言語文が入力されると、その自然言語文に対して構文意味解析を施すことによって、その自然言語文を中間言語表現に変換する。検索部13は、ペア格納部11に格納されている内容を検索し、構文意味解析部12によって得られる中間言語表現と一致する中間言語表現を特定する。さらに、検索部13は、特定した中間言語表現とペアをなす翻訳先言語(言語b)で表現された自然言語文をペア格納部11から抽出する。出力部14は、抽出された自然言語文を翻訳結果として出力する。 (もっと読む)


【課題】 原文中の補足情報を参照して、適切な翻訳文を作成する。
【解決手段】 翻訳対象となる原文中の、人物を特定する補足対象語句の翻訳に用いる補足情報を、当該原文中において人物に関する情報が記載されている蓋然性の高い領域から抽出し、抽出した補足情報を補足対象語句に関連付けて特徴データベースD1に記憶しておく。特徴データベースD1に記憶されている補足情報によって示される補足対象語句の属性を参照して補足対象語句を翻訳する。 (もっと読む)


【目的】翻訳確率を用い、安定した翻訳が可能な用例を選択できる用例ベースの機械翻訳装置を提供する。
【解決手段】機械翻訳装置は、原言語のテキストの構文木から複数の部分木群を作成する部分木群作成部110と、複数の部分木群に含まれる部分木の各々に対し、用例データベース44から当該部分木と一致する原言語の構文木を持つ用例群を検索する用例群検索部112と、検索された用例群に含まれる用例の各々に対する翻訳確率を、各用例のコンテキスト類似度以上のコンテキスト類似度を持つ部分用例群内における、当該用例の出現頻度により算出する確率算出部116と、この翻訳確率に基づき最尤の部分木群を選択する最尤候補選択部118と、最尤候補選択部118が選択した部分木群と、当該部分木群に含まれる部分木に対し検索された用例とに基づいて、目的言語のテキストを生成する目的言語テキスト生成部とを含む。 (もっと読む)


【課題】 原言語の文を目的言語の文により正確に、高速に翻訳することができる翻訳メモリを提供する。
【解決手段】 翻訳メモリは、第1の言語についてサブ文字列を記憶する第1の辞書トライ構造、および第1の辞書トライ構造に記憶されたサブ文字列を特定するインデックス情報を記憶するインデックストライ構造を含む第1の検索辞書と、第2の言語についてサブ文字列を記憶する第2の辞書トライ構造、および第2の辞書トライ構造に記憶されたサブ文字列を特定するインデックス情報を記憶するインデックストライ構造を含む第2の検索辞書とを有し、第1の検索辞書のインデックス情報は、少なくとも第2の検索辞書における対訳のサブ文字列を特定するためのインデックス情報を識別する識別情報を含むものである。 (もっと読む)


【課題】 ある言語に従って構築されている文書の文書データを、より簡易な処理によって別の言語の文書データに変換するような仕組みを提供すること。
【解決手段】 画像パターンとインデックスの各対を内包する画像パターン辞書データ部51、及び領域識別情報とインデックスの各対を内包する文書レイアウトデータ部52を個別に有する圧縮文書データが入力されると、それら両データ部のうち、画像パターン辞書データ部51にて各インデックスと対を成している画像パターンを、翻訳された新たな文字を表す画像パターンと差し替える。 (もっと読む)


【課題】原文とその訳文とを対比させて別々の画面に表示させる出力制御装置において、その表示の際の利用者の利便性を向上させる。
【解決手段】指定された表示画面の表示種別(複数の表示画面のそれぞれにどの言語のハイパー文書が表示されるのかを示す種別)に基づいてハイパー文書データの処理種別(言語変換処理の種別)を判定し、ハイパー文書データの参照先の文書データの変換制御を行う。原文のハイパーリンクが訳文にそのまま埋め込まれ、原文に埋め込まれたハイパーリンクの参照先の文書が原文の言語で記述されている状態で、ハイパーリンクが訳文から参照された場合においても、そのハイパーリンクの参照先の文書が訳文の言語に変換されて表示される。 (もっと読む)


【課題】従来は、変形文字で書かれたテキストを正しく解析することはできず、また、文字認識技術を応用するにも、膨大な情報量と演算量のため、少ないメモリと、能力の高くないCPUでは動作させることができない。
【解決手段】変形文字を含むテキストは、通常のテキストで殆ど現れない記号、ギリシャ文字、ロシア文字などの文字コードが大量、かつばらばらに現れる現象を利用して、変形文字で書かれたテキストかどうかを変形文字テキスト判定手段で判断し、変形文字を含むテキストであると判断された場合には、変形文字テキスト修正手段でテキスト中に含まれる変形文字を変形文字テーブルを用いて変形される前の文字列に変換し、さらに、最低限の曖昧候補に限定して、事前に辞書引き処理をして、テキストを一意に決定し、テキスト解析手段で言語解析用辞書を用いて形態素解析を行う。 (もっと読む)


【課題】翻訳作業を効率的に進めることができ、迅速で、信頼性の高い翻訳を行う。
【解決手段】入力文を受付ける入力文受付部と、例文の部分列を作成する部分列作成部と、例文の部分列を用いて第1言語と第2言語の対訳例文を検索する対訳例文検索部と、対訳例文から所定の対訳例文をフレーズ候補として抽出するフレーズ候補抽出部と、フレーズ候補から所定のフレーズを選択するフレーズ候補整理部と、入力文の構文を解析する構文解析部と、構文の意味を解析し対応訳語を含む概念構造を生成する意味解析部と、フレーズ候補における第1言語の単語で前記対応訳語を検索する対応訳語検索部と、対応訳語がヒットした場合に、意味解析部で生成された概念構造の対応訳語における第2言語の単語を、フレーズ候補における第1言語の単語に対応する第2言語の単語に置き換える訳語置き換え部と、置き換えられた訳語を用いて訳文を生成する訳文生成部とを備える。 (もっと読む)


【課題】辞書の登録に制限を設けず、辞書に新たな語を登録してもその影響を少なくすることができる訳語生成装置及びそれを用いた機械翻訳装置を提供する。
【解決手段】訳語生成装置は、日本語の文から英語の文への翻訳において、日本文中の語句と、日本語の語句に対応して予め特定された英語の語句との対から、日本語の語句の訳語を生成するための訳語生成装置であり、英語の語句に対する複数の関連語を特定する関連語拡張処理部48と、翻訳の途中結果において、日本語の語句に対応すべき部分から所定の範囲内に存在する複数の近傍語句を特定する言語変換処理部42と、予め準備した英語の用例文36のうち、関連語と近傍語句とからなる語句群と意味的に最も類似する類似文を特定し、当該類似文内に存在する英語の文字列であって所定の基準を充足するものを、日本語の語句に対する訳語として特定する局所生成部46とを含む。 (もっと読む)


【課題】簡易な構成でしかも開発者の知識能力に左右されることなく、入力された原文に対して最適な換言文を自動的に生成可能な自動換言装置を提供する。
【解決手段】自動換言装置80は、用例コーパスC1中の表現素片を出現度数とともに記憶する表現素片データベース(DB)D1と、対訳コーパスC2中の用例文に対する換言文を、換言の態様を示す換言情報とともに記憶する換言文DBD2と、対訳コーパスC2中の用例文から換言文への換言情報を適用頻度とともに記憶する換言情報DBD3と、表現素片の少なくとも一つを原文と共有する換言文を換言文DBD2から検索する類似文検索部84と、検索された換言文に対し、元の用例文との間の換言と、原文との間の換言に関する妥当性スコアを評価する表現検証部85と、妥当性スコアが最も高い換言文に対応する換言情報を原文に対し逆方向に適用し換言文を生成する原文換言部83とを含む。 (もっと読む)


本発明者たちは、マルチリンガルサーチを容易にするための1つ以上の新規な方法、システムおよびインタフェースを創作した。1つの例示的な方法は、ドキュメントのコレクションに対する複数の特定言語インデックスを作成することを伴い、各インデックスは、ドキュメントからの用語のステムされたおよびステムされていないバージョンを含む。ユーザは、1つ以上のターゲット言語のセットと関連する問い合わせを提出する。問い合わせ処理は、それぞれが潜在的に等価な問い合わせ用語のセットをもたらす1つ以上の技術を使用して、問い合わせにおける各用語の元のおよびステムされたバージョンを各ターゲット言語に翻訳することを伴う。潜在的に等価な問い合わせ用語の各セットは、従来のモノリンガルサーチ技術、ブール演算または自然言語問い合わせなどを使用して、対応する特定言語インデックスに対して処理され、コレクションからドキュメントを識別する。
(もっと読む)


【課題】 ユーザーにより連続的に入力された複数の情報から応答として要求されている複合的な側面を持つ行為や状態等の状況を多角的な視点から適切に判断して自然で人間的な応答をする。
【解決手段】 状況認識要素となる複数の状況特定データを、共通する概念を有する状況特定データの集合毎に状況特定データを統括する概念として定義され応答出力となるべき状況多角認識用の状況データに関連付けてデータベース化する。ユーザーによって入力された情報を状況特定データと照合して入力された情報に対応する状況特定データを判断し、入力された情報に対応する状況特定データに得点を加算して状況特定データが属する状況データの評価点数を集計し、評価点数の集計状況に応じて入力された情報に対して応答すべき状況データを判断して、応答出力生成手段により応答すべき状況データに関連付けられた出力形式に従って応答データを生成して出力処理する。 (もっと読む)


【課題】比較的少量の資源で中国語の表現の換言表現を生成することのできる換言装置を提供する。
【解決手段】中国語表現の換言装置は、中国語文40を中国語発話にセグメント化し、その中国語発話にPOS(品詞)タグを付す処理を行なうためのセグメント化及びPOSタグ付け部100と、中国語発話内に存在する所定の条件を充足する構造を特定するためのモジュール104と、中国語発話内で特定された所定の条件を充足する構造に対し、当該条件に対応して定められた規則を適用して新たな表現を生成するモジュール106とを含む。 (もっと読む)


【課題】入力文に含まれる語や句の意味的な対応関係を自動的に解釈することを課題とする。
【解決手段】自然言語の意味を特定するために所定形式で構成された複数の意味表現に関し、これら複数の意味表現の意味的対応関係を解析する自然言語解析装置1であって、所定手段にて生成された複数の意味表現のうち、相互に意味的対応関係を持ち得る複数の意味表現を特定する対応意味表現特定手段と、前記対応意味表現特定手段にて特定された前記複数の意味表現の各々に含まれる属性表現の中から、相互に意味的な対応関係を持ち得る複数の属性表現を特定する対応属性表現特定手段と、前記対応属性表現特定手段にて特定された前記複数の属性表現の各々に含まれる情報を相互に対比し、この対比の結果に基づく所定の処理を行う属性表現処理手段とを備える。 (もっと読む)


【課題】 1を超える数の自然言語からの単語を有する混合言語表現用の言語モデルを構築する。
【解決手段】 言語間のペアの単語について単語等価確率が生成され、ストアされる。単語等価確率は、モノリンガルの単語履歴を生成するために必要に応じて使用される。モノリンガルの履歴は、次の単語の仮説を生成するためにモノリンガルの言語モデルによって使用される。また単語等価確率は、外来言語における次の単語の確率を計算するためにも使用される。 (もっと読む)


マークアップ言語テキストテンプレートを生成する方法は、ソース言語テキストストリング内の可変テキスト要素を識別し、第1の事前定義の記号を可変テキスト要素に割り当てることと、可変テキスト要素の文法的規則を識別し、識別された文法的規則に基づいて、第2の事前定義の記号を可変テキスト要素に割り当てることと、補足情報を可変テキスト要素に割り当てるかどうかを判定することであって、第1の事前定義の記号、第2の事前定義の記号、および補足情報は、割り当てられる場合にトークンを表す、判定することと、1つまたは複数のトークンを含むマークアップ言語テキストテンプレートを完成するために、ソース言語テキストストリング内の残りの可変テキスト要素について、文法的規則の識別、第1および第2の事前定義の記号の割当、および補足情報を割り当てるかどうかの判定を繰り返すこととを含む。 (もっと読む)


【課題】入力文が長文であっても、構文解析処理を用いずに入力文を短縮する。
【解決手段】機械翻訳システム20は、文の要素に関する削除知識34を作成する削除知識作成処理部32と、削除知識34を用いて入力文36を短縮する長文短縮部60と、長文短縮部60の出力する短縮文62を入力とする機械翻訳部64とを含む。削除知識作成処理部32は、同義の長短の文対からなる学習用文対30から、文短縮のための知識を学習する文短縮用知識の学習装置であって、長い文を構成する各要素のうち、短い文を構成する要素に含まれるものとそうでないものとに対しそれぞれ所定のタグを付与した学習データ52を作成する学習データ作成部50と、学習データ52を用いた機械学習により、任意の要素に対し削除可能かを示すタグを推定するための削除知識34を獲得する削除知識学習部54とを含む。長文短縮部60は、削除知識34を用いて入力文36を短縮する。 (もっと読む)


【課題】 人間の言語機能をシミュレートして語彙を選択する。
【解決手段】 言語処理装置100は、語彙と該語彙にあらかじめ付与されたホルモン名とを対応付けて登録した語彙テーブルを語彙テーブル格納部162から取得するシミュレーション用データ取得部161と、予測対象者が他者と行うコミュニケーションから、予測対象者が提示した語彙と他者が提示した語彙とをそれぞれ切り出す語彙切出部150と、予測対象者が提示した語彙に付与されたホルモン名の出現回数と他者が提示した語彙に付与されたホルモン名の出現回数とを語彙テーブルを参照してホルモン名ごとに算出し、ホルモン名ごとの出現回数の差に基づいて、出現回数をさらに増加させるべきホルモン名を決定し、該決定したホルモン名が付与された語彙を語彙テーブルより抽出するホルモン法実行部163とを備える。 (もっと読む)


121 - 140 / 152