説明

Fターム[5B091CC01]の内容

機械翻訳 (6,566) | 辞書、知識ベース (865) | 辞書の種類 (414)

Fターム[5B091CC01]の下位に属するFターム

Fターム[5B091CC01]に分類される特許

81 - 100 / 125


【課題】 世間の話題動向を分析する。
【解決手段】 入力部112は、検索対象用語の入力を受け付ける。記事データ受信部122は、検索対象用語を含む文書データを外部装置から受信する。下位用語検出部160は、検索対象用語を含む文書データの集合において所定個数以上含まれ、かつ、検索対象用語とは異なる用語を解用語として検出する。記事データ受信部122は、下位用語を含む文書データを外部装置から受信する。等位用語検出部162は、下位用語を含む文書データの集合において所定個数以上含まれ、かつ、検索対象用語および下位用語とは異なる用語を検索対象用途の等位用語として検出する。 (もっと読む)


【課題】 人出による労力を軽減しつつ、異なる文字から構成されるメタデータに含まれる語句が同一の意味を持つかどうかを判断できるようにする。
【解決手段】 翻訳文字列比較部35は、通信ネットワーク1を介して言語辞書提供サーバ装置5aまたは専門分野辞書提供サーバ装置5bにアクセスし、言語辞書提供サーバ装置5aまたは専門分野辞書提供サーバ装置5bにて提供される辞書を参照することにより、メタデータ分解部33にて抽出された個々のメタデータを特定の言語に翻訳し、翻訳された単語同士が同一かどうかを判定し、メタデータに含まれる語句の意味が同一であるかどうかを判断する。
(もっと読む)


【課題】 統計機械翻訳装置の学習をより有効に行なうことができるような対訳コーパスを作成できるコーパス変換装置を提供する。
【解決手段】 コーパス変換装置20は、日本語と英語との対訳コーパス50を、統計機械翻訳の学習に適した学習用対訳コーパスに変換するためのコーパス変換装置であって、対訳コーパス50に含まれる対訳を、所定の基準にしたがい互いに同義と判定される対訳からなる同義文クラスに分類するクラス分け処理部52と、分類された同義文クラスの各々に対し、当該同義文クラスに含まれる対訳の日本語の文を代表する代表文を決定するための日本語代表文決定部56と、クラス分け処理部52により分類された同義文クラスの各々に対し、対訳の各々の日本語の文を、当該同義文クラスに対し日本語代表文決定部56により決定された代表文で実質的に置換することにより、日英コーパス22を作成するための日本語置換処理部60とを含む。 (もっと読む)


コロケーション翻訳を抽出するシステムおよび方法を提示する。本方法には、ソース言語およびターゲット言語のモノリンガルコーポラおよびバイリンガルコーパス(使用可能な場合)を使用してコロケーション翻訳モデルを構築するステップが含まれる。コロケーション翻訳モデルは、コロケーションの前後のコンテキストワード(contextual words)に関する期待値最大化(EM:expectation maximization)アルゴリズムを使用する。コロケーション翻訳モデルは、後でコロケーション翻訳辞書を抽出するために使用できる。コンテキストの冗長性(context redundancy)および/または双方向翻訳の制約(bi−directional translation)に基づくオプションのフィルタを使用して、信頼性の高いコロケーション翻訳のみが辞書に組み込まれることを保証できる。構築されたコロケーション翻訳モデルと抽出されたコロケーション翻訳辞書は、後でセンテンス翻訳(sentence translation)などのさらなる自然言語処理(natural language processing)を行う場合に利用できる。
(もっと読む)


【課題】二つの文の意味的等価性を信頼性高く評価できる装置を提供する。
【解決手段】意味的等価性評価装置は、二つの文の単語の各々に適切なPOSタグを付し、第1及び第2の単語の集合98、100を出力するPOSタグ付け及びステム処理部96と、第2の単語の集合100に対する第1の単語の集合98の拡張PERスコアを計算するためのPER計算モジュール102とを含む。拡張PERスコアは第1及び第2の単語の集合98、100の一致しない単語から計算された第1の要素グループと、第1及び第2の単語の集合98、100の一致した単語から計算された第2の要素グループとを含む。 (もっと読む)


【課題】 ユーザ固有の関連語辞書の生成、更新処理を効率的に実行可能とした構成を実現する。
【解決手段】 質問応答システムにおいてユーザの質問から重要語として抽出されたキーワードと、キーワードに基づく検索処理の結果から抽出された回答候補と回答候補の適正情報を、関連語辞書修正手段に入力し、これらの入力情報に基づいて関連語辞書の修正処理を実行する。例えば、回答候補の適正情報に基づいて、キーワードと適正な回答各々に対応する語相互の関連度を上昇させ、キーワードと不適正な回答各々に対応する語相互の関連度を低下させる処理などを実行する。このような関連語辞書修正処理により、質問応答システムを利用したユーザの興味、関心分野に特化したユーザ固有の関連語辞書が生成または更新される。 (もっと読む)


【課題】訳例データベースの類似検索結果から翻訳対象文中の様々な表現について最適な訳例の絞込みが適切できるようにする。
【解決手段】訳例データベースから翻訳対象文に類似する訳例を検索し、類似検索の検索結果に基づき、翻訳対象文を構成する単語及び部分文字列の一致部分を含む訳例検索数を濃淡、色などで段階的に強調することで定量的に表示し、訳例を利用する単語や部分文字列を絞り込む。訳例検索数の定量表示が行われた翻訳対象文の単語を選択すると、選択単語の訳例が表示される。また単語選択に対応して、選択した単語を含み且つ訳例をもつ複数の部分文字列のリストが表示され、リスト中の部分文字列を選択することで、それを含む訳例が表示される。
(もっと読む)


【課題】文書の所定の言語に対する信頼度を演算することができるようにする。
【解決手段】 入力部33は、インターネット11を介して文書を入力する。データベース作成部34は、入力された文書の著者の所属が英語圏かを判断し、英語圏である場合には高信頼タグを付与して、高信頼文書71として英文データベース格納部37に格納する。著者の所属が英語圏でない場合には、非高信頼タグを付与して、非高信頼文書72として英文データベース格納部37に格納する。推論部41は、英文データベース格納部37に格納されている文書からフレーズを抽出し、そのフレーズが高信頼文書71とヒットした数、並びに非高信頼文書72とヒットした数に基づいて、英文品質値を演算し、それに基づいて高信頼文書71と非高信頼文書72としての文書の構成を再構成する。 (もっと読む)


【課題】複数の翻訳辞書を用いて機械翻訳する際に各辞書由来の尤度の偏りを補正して精度の高い翻訳処理を可能とすること。
【解決手段】固有表現抽出手段11で入力文に含まれる固有表現を抽出して固有表現抽出済み文を作成し、句対訳候補列挙手段25で固有表現抽出済み文を構成する各々の句に対応する句対訳候補を翻訳モデル群記憶部21から検索し、その確率値とともに対訳侯補テーブル24に記録し、辞書別重み付け手段26で重み付けテーブル23を参照して句対訳候補に対応する各翻訳辞書由来の確率値に重みを付け、最適経路探索手段27で対訳侯補テーブル24に記録された句対訳候補による組み合わせのうち、重みを付けられたそれぞれの確率値と、言語モデル記憶部22から取得した当該組み合わせにおける連続する2つの単語の確率値との積が最大となる組み合わせを求めて翻訳結果として出力する。 (もっと読む)


【課題】 単語などの言語表現の感情極性の自動抽出を高精度に行う。
【解決手段】 辞書の語釈文データDTW、シソーラスデータDSR及びコーパスデータDCPから、形態素解析モジュールM1により感情極性が同じになり易い言語表現対を抽出し、その対を連結することにより語彙ネットワークを構築するネットワーク構築モジュールM2と、上記ネットワーク構築モジュールM2により構築された語彙ネットワークに基づいて各言語表現について感情極性値の生起確率をスピン系モデルの計算方法を用いて計算する感情極性計算モジュールM3とを備え、上記感情極性計算モジュールM3により、平均場近似を用いて近似確率分布関数を計算し、各単語の感情極性を判定する。 (もっと読む)


【課題】 構文構造に係る解説も提供可能な検索効率が良い自然言語学習支援装置、方法及びプログラムを提供する。
【解決手段】 本発明では、辞書は、自然言語文を構文解析する際に利用される辞書情報本体と、その辞書情報本体に対応付けられた原解説情報とを少なくとも含むレコード情報を複数格納している。そして、辞書の辞書情報本体を利用して入力文を構文解析している際に、構文解析に用いられた辞書情報本体に係る原解説情報を少なくとも記憶し、入力文、及び、記憶された原解説情報から、出力解説情報を作成して出力する。
解説情報を取り出すためだけの辞書検索が不要となっている。また、構文解析時に把握された構文構造も解説対象とし得る。 (もっと読む)


【課題】ユーザーが所有する携帯端末において、ユーザーが必要とする原語を翻訳する機能を安価に実現可能な翻訳システムを提供する。
【解決手段】ユーザーが所有する携帯端末において、第1の自然言語(日本語)における一単語又は一文である原語情報を見出しとし、該原語情報を第2の自然言語(中国語)に翻訳した一単語又は一文に関する翻訳情報(綴り,発音,関連する動画)及び広告情報(広告主のロゴマーク,クライアント名,URL)が収納されている単体のファイル20が指定されたことに基づいて、該指定されたファイルに収納されている翻訳情報及び広告情報が前記携帯端末において出力されるように構成する。 (もっと読む)


【課題】 対応付けを評価した高品質の翻訳パターンを作成できる翻訳パターン作成装置、方法及びプログラムを提供する。
【解決手段】 対訳文書の各言語の文に対して形態素解析を行い、各言語の形態素解析結果を用いて各言語の単語、単語列の対応関係を推定し、対応度合が基準度合を超えている対応関係から翻訳パターンを作成する。そして、同一文に対し、作成された翻訳パターンを使用して機械翻訳すると共に、作成された翻訳パターンを使用しないで機械翻訳し、得られた2種類の翻訳結果に基づいて、作成された翻訳パターンを評価したり、その後の翻訳パターンの作成動作を制御したりする。2種類の翻訳結果は、翻訳の元になった上記同一文に対する正解の対訳文との関係で、いずれが正しいかを判断できる。 (もっと読む)


【課題】従来の情報処理装置においては、通訳の精度が低い、という課題があった。
【解決手段】1以上の通訳単語情報と1以上の翻訳単語情報の対応を決定する通訳単語翻訳単語対応決定部と、1以上の翻訳単語情報と1以上の原文単語情報の対応を決定する翻訳単語原文単語対応決定部と、前記通訳単語翻訳単語対応決定部における対応の決定処理と、前記翻訳単語原文単語対応決定部における対応の決定処理に基づいて、前記1以上の通訳単語情報を有する各節情報に対応する1以上の原文単語情報である翻訳単位情報を決定する翻訳単位情報決定部と、前記翻訳単位情報決定部が決定した翻訳単位情報と、当該翻訳単位情報に対応する節情報に関する情報である翻訳チャンク情報を蓄積する翻訳チャンク情報蓄積部を具備する情報処理装置により、精度の高い翻訳ができる。 (もっと読む)


【課題】ユーザが選択する負担をなくし、ユーザに応じた適切な翻訳結果を出力する日中機械翻訳装置を提供すること。
【解決手段】日本語単語と少なくとも1つの中国語単語とを対応付けて登録した日中対訳辞書111と、日本語単語と、該日本語単語と異なる表記で同じ意味内容を表す言い換え単語とを対応付けて登録した日本語言い換え辞書112と、中国語単語が日中対訳辞書111に複数登録されているときに、入力された日本語単語に対応付けられた言い換え単語を日本語言い換え辞書112から検索する言い換え辞書検索部103と、検索した言い換え単語と、入力された日本語単語に対応付けられた複数の中国語単語との関連する度合いを示す類似度を、複数の中国語単語ごとに算出する類似度算出部104と、算出した類似度が最大の中国語単語を、入力された日本語の訳語として選択する訳語選択部106とを備えた。 (もっと読む)


【課題】翻訳装置の多言語翻訳において、翻訳対象となる言語の言語種を的確に識別し翻訳を行う。
【解決手段】
撮像手段から取得した映像データから文字列を抽出し、この文字列の文字種と、この文字種を使用する言語種に対応する言語辞書を参照して翻訳結果を表示装置に表示する翻訳装置において、抽出した文字列についてその文字種データ、単語データ、正書規則データ及び/又はGPSによって翻訳装置の位置情報を取得し当該位置で使用されている言語種のデータを参照し優先順位を付けて言語種の特定を行う。その後、特定した言語種に対応する辞書を参照し所定の言語に翻訳を行う。 (もっと読む)


【課題】 前処理やデータの編集を必要とせず、コンピュータに様々な文を正確かつ迅速に分割させるコンピュータプログラムを提供する。
【解決手段】
文分割プログラム86は、文とその文を分割した分割文字列とからなる対を3個以上含むデータベース88とともに用いられる。文分割プログラム86は、処理対象の文が与えられると、データベース88から任意の二つの文を選択し二つの文と処理対象の文とから類推文を生成し、類推文がデータベース88に存在すれば、データベース88中で類推文及び二つの文と対になっている分割文字列をそれぞれ読出し、読出された3つの分割文字列を用いて類推分割文字列を生成するための分割プログラム部分90と、入力文82を分割プログラム部分90に与え、入力文82に対して分割プログラム部分90が生成する類推分割文字列を出力文84として出力するための入出力プログラム部分92とを含む。 (もっと読む)


【課題】省略語の本来の意味を表す翻訳結果を得ることのできる技術の提供を目的とする。
【解決手段】原文の記載された原稿の画像を入力し、原文のレイアウトを解析して、語句の省略語とその定義内容とを関連付けた省略語定義領域を抽出する。抽出された省略語定義領域に含まれる定義内容に対応する翻訳語を辞書から抽出し、翻訳語の先頭文字を用いて翻訳省略語を生成する。翻訳省略語と原文の省略語とを対応付けて省略語辞書に記憶させる。そして、原文の文字列に対応する翻訳語および翻訳省略語を辞書および省略語辞書から抽出して翻訳文を生成して出力する。 (もっと読む)


【課題】従来の情報処理装置においては、バリエーションが豊富な文例が生成できないという課題があった。
【解決手段】第一の文章または1以上の単語を示す情報である第一情報と、第二の文章または1以上の単語を示す情報である第二情報の対である生成元情報を1以上格納している生成元情報格納部と、前記第二情報の言い換えである文章または1以上の単語を示す情報である言換情報を1以上格納している言換情報格納部と、第一情報と同一のタイプの文章または1以上の単語を示す情報である入力情報を受け付ける入力情報受付部と、前記入力情報と、前記1以上の言換情報に基づいて、文章または1以上の単語を示す情報である新情報を生成する新情報生成部と、前記新情報を出力する新情報出力部を具備する情報処理装置により、バリエーションが豊富な文例が生成できる。 (もっと読む)


【課題】 あらかじめ存在する翻訳文を有効に活用することができる翻訳システムを提供すること
【解決手段】 本発明は、原稿から画像データを生成する画像読み取り手段と、翻訳先言語を入力する入力手段と、前記画像データに対し文字認識処理を行い原文を生成する文字認識手段と、前記原文および前記翻訳先言語を特定する言語識別子を記憶する原文記憶手段と、翻訳文と、その翻訳文が記述された言語を特定する言語識別子と、その翻訳文の内容を特定する文書識別子とを対応付けて記憶した翻訳文データベースと、前記原文から、文書識別子を抽出する抽出手段と、前記翻訳文データベースから、前記抽出手段により前記原文から抽出された文書識別子と同一の文書識別子および前記原文記憶手段に記憶された言語識別子と同一の文書識別子および言語識別子と対応付けられた翻訳文を検索する検索手段と、前記翻訳文を出力する出力手段とを有する翻訳システムを提供する (もっと読む)


81 - 100 / 125