説明

機械翻訳装置、機械翻訳方法および機械翻訳プログラム

【課題】
利用者の現在の利用シーンに対応する適応モデルをオンラインで動的に生成する機械翻訳装置を実現することである。
【解決手段】
実施形態の機械翻訳装置は、第1言語を入力する言語入力手段と、前記言語入力手段に入力された第1言語の利用者もしくは利用場所に関する付加情報を取得する付加情報取得手段と、第2言語と当該第2言語を取得した際の利用者もしくは利用場所に関する付加情報を対応付けた第2言語の参照データを格納する参照データ格納手段と、前記付加情報取得手段で取得された第1言語の付加情報の全部あるいは一部と同一な内容の付加情報を有する第2言語のテキスト情報を取得するテキスト情報取得手段と、前記テキスト情報取得手段によって取得された第2言語のテキスト情報を利用して、前記言語入力手段に入力された第1言語を第2言語に翻訳する翻訳手段とを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施形態は、機械翻訳装置、機械翻訳方法および機械翻訳プログラムに関する。
【背景技術】
【0002】
近年、コンピュータの高性能化、ブロードバンドインフラの急速な普及に従い、入力された原言語のテキストを目的言語のテキストに翻訳する機械翻訳装置およびサービスが普及してきている。これらの機械翻訳では、翻訳の精度を向上させるために、利用者が予め選択した「買い物」、「乗り物」などの利用シーン毎に翻訳辞書を切り替える方法が提案されている。
【0003】
しかしながら、上述した方法では、オフラインで予め分類された利用シーンにしか対応することができなかった。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開平7−141383号公報
【特許文献2】特開2002−366545号公報
【非特許文献】
【0005】
【非特許文献1】Philipp Koehn, "Statistical Machine Translation," 第1版, Cambridge University Press, 2009年12月17日, Chapter 7.
【非特許文献2】Philipp Koehn, Josh Schroeder, "Experiments in domain adaptation for statistical machine translation," Proceedings of the Second Workshop on Statistical Machine Translation, Prague, Czech Republic, June 23-23, 2007, p.224-227.
【発明の概要】
【発明が解決しようとする課題】
【0006】
発明が解決しようとする課題は、利用者の現在の利用シーンに対応する機械翻訳装置を提供することである。
【課題を解決するための手段】
【0007】
実施形態の機械翻訳装置は、第1言語を入力する言語入力手段と、前記言語入力手段に入力された第1言語の利用者もしくは利用場所に関する付加情報を取得する付加情報取得手段と、第2言語と当該第2言語を取得した際の利用者もしくは利用場所に関する付加情報を対応付けた第2言語の参照データを格納する参照データ格納手段と、前記付加情報取得手段で取得された第1言語の付加情報の全部あるいは一部と同一な内容の付加情報を有する第2言語のテキスト情報を取得するテキスト情報取得手段と、前記テキスト情報取得手段によって取得された第2言語のテキスト情報を利用して、前記言語入力手段に入力された第1言語を第2言語に翻訳する翻訳手段とを備える。
【図面の簡単な説明】
【0008】
【図1】第1の実施形態の機械翻訳装置を示すブロック図。
【図2】実施形態の付加情報を示す図。
【図3】実施形態の翻訳文候補と翻訳スコアを示す図。
【図4】実施形態の日本語の参照データを示す図。
【図5】実施形態の適応モデルの学習に利用する日本語のテキスト情報を示す図。
【図6】実施形態の適応モデルを示す図。
【図7】実施形態の翻訳スコアを示す図。
【図8】実施形態の機械翻訳装置のフローチャート。
【図9】実施形態の機械翻訳装置のフローチャート。
【図10】実施形態の参照データを示す図。
【発明を実施するための形態】
【0009】
以下、本発明の実施形態について図面を参照しながら説明する。
【0010】
(第1の実施形態)
第1の実施形態の機械翻訳装置は、英語のテキストを目的言語である日本語のテキストに翻訳する装置である。この機械翻訳装置は、例えば、付加情報として利用者のプロファイルデータおよび利用場所に関する情報を取得し、この付加情報に適した翻訳の適応モデルを参照データを用いて学習する。参照データとは、目的言語である日本語と当該日本語を取得した際の利用者および利用場所に関する付加情報を対応付けたデータである。機械翻訳装置は、利用者が入力した英語とその付加情報を取得すると、同様な内容の付加情報を有する日本語の参照データを参照データ格納部から取得する。そして、取得した日本語の参照データのテキスト情報から訳出傾向を表す適応モデルを生成する。このように、翻訳の適応モデルをオンラインで動的に生成することにより、利用者の利用シーンに柔軟に対応した適応モデルを学習できる。本実施形態では、利用者の英語を通常の方法で機械翻訳し、複数の翻訳文候補とその翻訳スコアを算出する。そして、オンラインで動的に生成した適応モデルを利用して翻訳スコアを更新し、最終的な翻訳結果を出力する。
【0011】
(全体のブロック構成)
図1は、第1の実施形態にかかる機械翻訳装置を示すブロック図である。本実施形態の機械翻訳装置は、原言語である英語を入力する言語入力部101と、言語入力部101に入力された英語の利用者および利用場所に関する付加情報を取得する付加情報取得部102と、目的言語である日本語と当該日本語を取得した際の利用者および利用場所に関する付加情報を対応付けた日本語の参照データを格納する参照データ格納部103と、前記付加情報取得部102で取得された英語に関する付加情報の全部あるいは一部と同一な内容の付加情報を有する日本語の参照データからテキスト情報を取得するテキスト情報取得部104と、テキスト情報取得部104で取得された日本語のテキスト情報を利用して、言語入力部101に入力された英語を日本語に翻訳する翻訳部105と、翻訳部105の翻訳結果を出力する出力部106とを備える。
【0012】
本実施形態の翻訳部105は、翻訳辞書107を用いて言語入力部101に入力された英語を日本語に翻訳し、複数の翻訳文候補と当該翻訳文候補の翻訳スコアを取得する翻訳文候補取得部108と、テキスト情報取得部104によって取得された日本語のテキスト情報から訳出傾向を表す適応モデルを学習する適応モデル学習部109と、適応モデル学習部109によって学習された適応モデルを用いて翻訳文候補取得部108で取得された複数の翻訳文候補の翻訳スコアを更新する適応翻訳部110とを備える。
【0013】
(言語取得部)
言語入力部101は、翻訳対象となる英語のテキストを入力する。ここで、入力には、キーボード、ポインティングデバイス、手書き文字認識、OCR、音声認識など、一般的に用いられる様々な方法を用いることができる。
【0014】
(付加情報取得部)
付加情報取得部102は、言語入力部101に入力された英語の利用者のプロファイルデータおよび利用場所に関する付加情報を取得する。利用者のプロファイルデータは、利用者の性別、年齢、職業、趣味、使用言語等を表すデータである。このデータは、機械翻訳装置の利用登録時に利用者が一度入力すればよい。利用場所に関する情報は、機械翻訳装置に搭載されたGPSセンサで取得できる。例えば、図2(a)は、"It looks good."というテキストが言語入力部101に入力されたときに取得された付加情報を表している。この例では、利用者のプロファイルデータとして性別、生年、使用言語が、利用場所に関する情報として緯度、経度が取得される。
【0015】
付加情報取得部102は、上述した利用者のプロファイルデータやGPSセンサで取得された利用場所に関する情報を解析して他の付加情報を取得することもできる。例えば、GPSセンサで取得した緯度、経度と実在の地図データを照らし合わせて、利用者が現在いる施設のカテゴリや都市名などの利用場所に関する付加情報を取得できる。また、利用者のプロファイルデータの生年1993年と現在の日にち(2011年)から、利用者に関する付加情報として利用者の年代「20代」を計算することができる(図2(b))。
【0016】
(翻訳文候補取得部)
翻訳文候補取得部108は、言語入力部101に入力された英語のテキストを目的言語である日本語のテキストに翻訳する。具体的には、基本となる翻訳辞書107を用いて翻訳し、その結果として複数の候補文候補(翻訳文候補群)と各候補の確からしさを表す翻訳スコアを出力する。翻訳処理には、一般的なトランスファ方式、用例ベース方式、統計ベース方式、中間言語方式の機械翻訳システムにおいて利用されている様々な方法を用いることができる。
【0017】
図3は、言語入力部101に入力された"It looks good."の翻訳文候補群と各翻訳文候補の翻訳スコアを示している。
【0018】
(参照データ格納部)
参照データ格納部103は、目的言語である日本語と当該日本語を取得した際の利用者および利用場所に関する付加情報とを対応付けた参照データを格納している。この参照データは、後述する適応モデル学習部109で適応モデルを計算する際の学習データとして利用する。図4に、日本語の参照データの例を示す。参照データには、他の利用者の機械翻訳装置で取得された情報を利用する。例えば、日本語を母国語とする他の利用者が別の機械翻訳装置を使用した際に入力した日本語と当該日本語の利用者および利用場所に関する付加情報とを対応付けたデータを参照データとして利用することができる。各言語の参照データは、ネットワークを介した共有サーバ上に蓄積してもよい。これにより、多数の利用者の参照データを容易に蓄積することができる。
【0019】
(テキスト情報取得部)
テキスト情報取得部104は、翻訳文候補取得部108で取得された翻訳文候補と当該翻訳文候補に対応する英語の利用者および利用場所に関する付加情報を利用して、参照データ格納部103に格納された日本語の参照データから適応モデルの学習に用いる日本語のテキスト情報を取得する。まず、翻訳対象となる英語に関する付加情報と同一内容の付加情報を有する日本語の参照データを参照データ格納部103から取得する。ここで、本実施形態では、取得された全ての付加情報ではなく「性別」、「年代」、「施設カテゴリ」について内容の同一性を判断する。次に、取得された参照データの日本語テキストから、翻訳文候補取得部108で取得された翻訳文候補群との類似度が所定値以上になるテキストを取得し、後述する適応モデル学習部109に出力する。
【0020】
図2(a)および(b)の場合、付加情報の内容のうち性別が「女性」、年代が「10代」、施設カテゴリが「Restaurant」となっている日本語の参照データを参照データ格納部103から取得する。図5(a)は、参照データ格納部103から取得された参照データの日本語テキストを表している。次に、テキスト情報取得部104は、図5(a)の各日本語テキストについて、図3の翻訳文候補群との類似度を後述する方法で計算する。図5(b)は、計算された類似度を表している。最後に、テキスト情報取得部104は、図5(b)の類似度が所定値以上となる日本語テキストを取得し、適応モデル学習部109に出力する。図5(c)は、所定値を0.4に設定した場合にテキスト情報取得部104が出力する日本語テキストを表している。
【0021】
日本語テキストと翻訳文候補群の類似度の計算方法について説明する。類似度計算には、編集距離、ワードエラーレート、トランスレーションエラーレート、BLEUなどのn-gram情報を用いた指標などを用いることができる。本実施形態では、日本語テキストと翻訳文候補との文字トライグラムの一致度を2つの文の全文字トライグラム数で割った値を類似度として用いる。例えば、「これおいしそうだね−。」と「おいしそうだね!」の2文をトライグラムに分解すると、それぞれ「これお、れおい、おいし、いしそ、しそう、そうだ、うだね、だねー、ねー。」と「おいし、いしそ、しそう、そうだ、うだね、だね!」となる。この2文は5つのトライグラムが一致していることから、類似度として5/10=0.5という値が得られる。以上の方法で、各日本語テキストについて全ての翻訳文候補との類似度を計算する。そして、得られた類似度のうち最大の値を当該日本語テキストの最終的な類似度とする。
【0022】
なお、本実施形態では、「性別」、「年代」、「施設カテゴリ」の付加情報について同一性を判断しているが、全ての付加情報が一致する日本語の参照データを参照データ格納部103から取得するようにしてもよい。
【0023】
(適応モデル学習部)
適応モデル学習部109は、テキスト情報取得部104によって取得された日本語テキストから訳出傾向を表す適応モデルを学習する。本実施形態では、適応モデルとして適応文群から学習した単語バイグラム言語モデル(非特許文献1)を用いる。図6は、対数確率で表した単語バイグラムの適応モデルを示している。
【0024】
この他にも、適応モデルとして他のグラム数を有するnーgram言語モデルや隠れマルコフモデル、最大エントロピーモデル、WFST、CRF、対数線形モデル等の確率モデルや、TF−IDFなどの特徴語抽出方法などの方法を用いることができる。
【0025】
(適応翻訳部)
適応翻訳部110は、適応モデル学習部109で学習された適応モデルを用いて、翻訳文候補取得部108で取得された複数の翻訳文候補の翻訳スコアを更新する。具体的には、翻訳文候補取得部108で取得された翻訳スコアと適応モデルによって計算された適応スコアとの平均を更新後の翻訳スコアとして取得する。
【0026】
図7(a)は、適応モデルを用いて図3の翻訳文候補の適応スコアを計算した例である。同図に示すID8の「おいしそうー!」なる文の適応スコアは、図6に示す適応モデルの(おいしそう,ー)と(ー,!)から0.310+0.147=0.457と計算される。適応翻訳部110は、図7(a)に示された更新前の翻訳スコアと適応スコアを用いて更新後の翻訳スコアを算出する。図7(b)は、更新後の翻訳スコアが大きい順に翻訳文候補をリスト表示している。同図において、ID1の「それはよさそうですね。」なる文の更新後の翻訳スコアは(0.358+0.093)/2=0.226となり、ID8の「おいしそうー!」なる文の更新後の翻訳スコアは(0.268+0.457)/2=0363となる。以上のように、適応スコアを用いて翻訳スコアを更新した結果、性別が「女性」、年代が「10代」、施設カテゴリが「Restaurant」の付加情報に適した翻訳文候補の翻訳スコアが大きくなる。
【0027】
このように、オンラインで動的に学習した適応モデルを用いた翻訳スコアの更新により、例えば、”It looks good.”を「男性」が入力した場合には、図7(a)に示すID7の「うまそうー!」の翻訳スコアが最も大きくなり、”It looks good.”を「clothing store」で入力した場合には、ID17の「かわいいー!」の翻訳スコアが最も大きくなるなど、現在の付加情報が示す利用者および利用場所に適した翻訳結果を得ることができる。
【0028】
(出力部)
出力部106は、適応翻訳部110によって翻訳スコアが更新された翻訳文候補のうち最大の翻訳スコアをもつ翻訳文候補を最終的な翻訳結果として出力する。出力形式としては、ディスプレイ装置による画像出力、プリンタ装置による印字出力、音声合成装置による合成音声出力など、従来から用いられている方式を用いることができる。
【0029】
(フローチャート)
図8は、本実施形態にかかる機械翻訳装置のフローチャートである。まず、言語入力部101は、翻訳対象となる英語を入力する(ステップS81)。次に、付加情報取得部102は、入力された英語に関する付加情報として、利用者のプロファイルデータと当該英語の利用場所に関する情報を取得する(ステップS82)。翻訳文候補取得部108は、言語入力部101に入力された英語を日本語に翻訳して、複数の翻訳文候補と各翻訳文候補の翻訳スコアを取得する(ステップS83)。テキスト情報取得部104は、翻訳文候補取得部108で取得された翻訳文候補と当該翻訳文候補に対応する英語に関する付加情報を利用して、参照データ格納部103に格納された日本語の参照データから適応モデル学習に用いる日本語のテキストを取得する(ステップS84)。ステップS84の詳細は後述する。適応モデル学習部109は、ステップS84で取得された日本語のテキストを学習データとして適応モデルを学習する(ステップS85)。適応翻訳部110は、適応モデル学習部109によって学習された適応モデルを用いて、翻訳文候補取得部108で取得された複数の翻訳文候補の翻訳スコアを更新する(ステップS86)。最後に、出力部106は、更新後の翻訳スコアが最大となる翻訳文候補を最終的な翻訳結果として出力する(ステップS87)。
【0030】
次に、図9のフローチャートを用いてステップS84の詳細を説明する。まず、言語入力部101に入力された英語に関する付加情報と同一な内容の付加情報(性別、年代、施設カテゴリ)を有する日本語の参照データを参照データ格納部103から取得する(ステップS91)。ステップS91で参照データを取得した場合(ステップS92のYesの分岐)、当該参照データから類似度を計算する1つの日本語テキストPを選択する(ステップS93)。次に、この日本語テキストPと翻訳文候補群Cの類似度を計算する(ステップS94)。そして、計算された類似度が所定値以上となる場合(ステップS95のYesの分岐)は、当該日本語テキストPを適応モデルの学習データに追加する(ステップS96)。一方、計算された類似度が所定値を下回る場合(ステップS95のNoの分岐)は、ステップS97に移行して他の日本語テキストに対する類似度計算の必要性を確認する。以上の処理を繰り返して、全ての日本語テキストの類似度計算が終了したら(ステップS97のYesの分岐)、取得した日本語の学習データを適応モデル学習部109に出力する(ステップS98)。
【0031】
(効果)
このように、本実施形態にかかる機械翻訳装置は、付加情報の内容が一致する日本語のテキスト情報から訳出傾向を表す適応モデルをオンラインで動的に生成し、当該適応モデルを用いて翻訳スコアを更新している。これにより、利用者の現在の利用シーンに適した翻訳を行うことができる。また、機械翻訳装置で取得した付加情報から適応モデルを自動的に生成することにより、利用者が予め利用シーンを選択する手間を除くことができる。
【0032】
本実施形態にかかる機械翻訳装置は、ネットワークを介した共有サーバ上に蓄積された他の利用者の日本語と当該日本語の利用者および利用場所に関する付加情報を参照データとして利用する。これにより、様々な状況に対応した参照データを利用できる。
【0033】
(変形例1)
本実施形態で取得した英語と当該英語の利用者および利用場所に関する付加情報を、英語の参照データとして参照データ格納部103に格納することもできる。この参照データは、日本語のテキストを英語のテキストに翻訳する際に利用できる。また、上記英語の参照データを、ネットワークを介した共有サーバ上に蓄積することもできる。これにより、他の利用者が適応モデルを学習する際の英語の参照データを、別途コストをかけることなく収集できる。ここで、参照データ格納部103は、図10に示すように、複数の言語の参照データを一括して格納するものであってもよい。
【0034】
(変形例2)
付加情報を取得するために、加速度センサ、ジャイロセンサ、環境光センサ、血圧センサ等の各種センサによるセンシングデータや、カメラデバイスによる周辺画像を用いることもできる。また、特開2010−74278記載の方法を用いて、加速度センサの情報から、車に乗っている、電車に乗っている、走っている、歩いている、立ち止まっている、などの利用者の行動に関する情報を抽出して付加情報として利用することもできる。さらに、機械翻訳装置が外部と通信する手段を有する場合は、基地局IDを利用場所に関する付加情報として取得することもできる。
【0035】
(変形例3)
本実施形態では、複数の翻訳文候補とその翻訳スコアを翻訳文候補取得部108で取得し、その後適応翻訳部110で翻訳スコアを更新するようにしたが、例えば非特許文献2のように、適応モデル学習部109で学習されたる適応モデルをインドメイン言語モデルとして使用し、最終的な翻訳スコアを直接計算するようにしてもよい。
【0036】
(変形例4)
参照データ格納部103に格納されている参照データの日本語を、テキスト形式でなく音声データの形式で格納することもできる。適応モデルを学習する際は、音声認識を使って当該音声データから日本語のテキスト情報を抽出することができる。
【0037】
(変形例5)
本実施形態では、1つの適応モデルを学習したが、参照データから複数の適応モデルを学習するようにしてもよい。例えば、年代が同一な参照データと場所が同一な参照データからそれぞれ適応モデルを学習し、学習された適応モデルを所定の重みで足し合わせるなどして翻訳スコアを計算することもできる。
【0038】
本実施の形態にかかる機械翻訳装置をコンピュータで実行可能なプログラムで実現し、そのプログラムをコンピュータで読み取り可能な記憶媒体として提供することも可能である。
【0039】
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
【符号の説明】
【0040】
101 言語入力部
102 付加情報取得部
103 参照データ格納部
104 テキスト情報取得部
105 翻訳部
106 出力部
107 翻訳辞書
108 翻訳文候補取得部
109 適応モデル学習部
110 適応翻訳部

【特許請求の範囲】
【請求項1】
第1言語を第2言語に翻訳する機械翻訳装置であって、
第1言語を入力する言語入力手段と、
前記言語入力手段に入力された第1言語の利用者もしくは利用場所に関する付加情報を取得する付加情報取得手段と、
第2言語と当該第2言語を取得した際の利用者もしくは利用場所に関する付加情報を対応付けた第2言語の参照データを格納する参照データ格納手段と、
前記参照データ格納手段から、前記付加情報取得手段で取得された第1言語の付加情報の全部あるいは一部と同一な内容の付加情報を有する第2言語のテキスト情報を取得するテキスト情報取得手段と、
前記テキスト情報取得手段によって取得された第2言語のテキスト情報を利用して、前記言語入力手段に入力された第1言語を第2言語に翻訳する翻訳手段と、
を備える機械翻訳装置。
【請求項2】
前記翻訳手段が、前記言語入力手段に入力された第1言語を第2言語に翻訳して複数の翻訳文候補と当該翻訳文候補の翻訳スコアを取得する翻訳文候補取得手段と、
前記テキスト情報取得手段によって取得された第2言語のテキスト情報から訳出傾向を表す適応モデルを学習する適応モデル学習手段と、
前記適応モデル学習手段によって学習された適応モデルを用いて前記翻訳文候補取得手段で取得された複数の翻訳文候補の翻訳スコアを更新する適応翻訳手段とを備え、
前記テキスト情報取得手段が、前記翻訳文候補取得手段で取得された翻訳文候補を利用して、前記第2言語の参照データから第2言語のテキスト情報を取得する請求項1記載の機械翻訳装置。
【請求項3】
前記テキスト情報取得手段が、前記翻訳文候補取得手段で取得された翻訳文候補と前記参照データ格納手段に格納された第2言語のテキストの類似度を利用して、前記第2言語の参照データから第2言語のテキスト情報を取得する請求項2記載の機械翻訳装置。
【請求項4】
前記参照データ格納手段に格納された参照データが、前記機械翻訳装置以外の装置で取得された第2言語と当該第2言語を取得した際の利用者もしくは利用場所に関する付加情報を対応付けた第2言語の参照データを含む請求項1から請求項3の何れか1項に記載の機械翻訳装置。
【請求項5】
前記参照データ格納手段が、前記言語入力手段に入力された第1言語と前記付加情報取得手段で取得された当該第1言語の付加情報とを対応付けたデータを第1言語の参照データとして格納する請求項1から請求項4の何れか1項に記載の機械翻訳装置。
【請求項6】
第1言語を第2言語に翻訳する機械翻訳方法であって、
第1言語を入力する言語入力工程と、
前記言語入力工程で入力された第1言語の利用者もしくは利用場所に関する付加情報を取得する付加情報取得工程と、
第2言語と当該第2言語を取得した際の利用者もしくは利用場所に関する付加情報を対応付けた第2言語の参照データを格納した参照データ格納手段から、前記付加情報取得工程で取得された第1言語の付加情報の全部あるいは一部と同一な内容の付加情報を有する第2言語のテキスト情報を取得するテキスト情報取得工程と、
前記テキスト情報取得工程によって取得された第2言語のテキスト情報を利用して、前記言語入力工程で入力された第1言語を第2言語に翻訳する翻訳工程と、
を備える機械翻訳方法。
【請求項7】
前記翻訳工程が、前記言語入力工程で入力された第1言語を第2言語に翻訳して複数の翻訳文候補と当該翻訳文候補の翻訳スコアを取得する翻訳文候補取得工程と、
前記テキスト情報取得工程によって取得された第2言語のテキスト情報から訳出傾向を表す適応モデルを学習する適応モデル学習工程と、
前記適応モデル学習工程によって学習された適応モデルを用いて前記翻訳文候補取得工程で取得された複数の翻訳文候補の翻訳スコアを更新する適応翻訳工程とを備え、
前記テキスト情報取得工程が、前記翻訳文候補取得工程で取得された翻訳文候補を利用して、前記第2言語の参照データから第2言語のテキスト情報を取得する請求項6記載の機械翻訳方法。
【請求項8】
第1言語を第2言語に翻訳する機械翻訳装置に、
第1言語を入力する言語入力工程と、
前記言語入力工程で入力された第1言語の利用者もしくは利用場所に関する付加情報を取得する付加情報取得工程と、
第2言語と当該第2言語を取得した際の利用者もしくは利用場所に関する付加情報を対応付けた第2言語の参照データを格納した参照データ格納手段から、前記付加情報取得工程で取得された第1言語の付加情報の全部あるいは一部と同一な内容の付加情報を有する第2言語のテキスト情報を取得するテキスト情報取得工程と、
前記テキスト情報取得工程によって取得された第2言語のテキスト情報を利用して、前記言語入力工程で入力された第1言語を第2言語に翻訳する翻訳工程と、
を実現させるための機械翻訳プログラム。
【請求項9】
前記翻訳工程が、前記言語入力工程で入力された第1言語を第2言語に翻訳して複数の翻訳文候補と当該翻訳文候補の翻訳スコアを取得する翻訳文候補取得工程と、
前記テキスト情報取得工程によって取得された第2言語のテキスト情報から訳出傾向を表す適応モデルを学習する適応モデル学習工程と、
前記適応モデル学習工程によって学習された適応モデルを用いて前記翻訳文候補取得工程で取得された複数の翻訳文候補の翻訳スコアを更新する適応翻訳工程とを備え、
前記テキスト情報取得工程が、前記翻訳文候補取得工程で取得された翻訳文候補を利用して、前記第2言語の参照データから第2言語のテキスト情報を取得する請求項8記載の機械翻訳プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate