説明

機械翻訳装置、方法およびプログラム

【課題】翻訳結果を得るまでの時間を短縮できるとともに、信頼度の高い機械翻訳結果を得ることができる機械翻訳装置を提供する。
【解決手段】言い換え文生成手段81は、入力されたテキスト文と同一の言語でそのテキスト文の内容を示す別の表現へ言い換えた1つまたは複数の言い換え文を生成する。機械翻訳手段82は、言い換え文を翻訳後の言語である目的言語へと機械翻訳する。翻訳信頼度決定手段83は、目的言語へ翻訳された言い換え文の信頼度を示す翻訳信頼度を決定する。言い換え文特定手段84は、言い換え文生成手段81が生成した言い換え文の中から、翻訳信頼度に基づいて言い換え文の候補を抽出し、候補の中から翻訳の対象とする言い換え文である翻訳対象言い換え文を特定する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、機械翻訳された翻訳結果の信頼度をより高くする機械翻訳装置、機械翻訳方法および機械翻訳プログラムに関する。
【背景技術】
【0002】
機械翻訳は、翻訳後の言語(以下、目的言語と記す。)が堪能ではないユーザによって使用されることが多い。このようなユーザに対し、機械翻訳によって出力された翻訳結果の信頼度を表示する、または、その翻訳結果の信頼度を導出できる情報を表示することで、出力された翻訳結果が信頼できるか否かをユーザが判断できる機械翻訳装置が一般に普及している。
【0003】
そのような装置の一例として、逆翻訳結果を表示する機械翻訳装置が知られている。逆翻訳結果が表示されることにより、ユーザは、逆翻訳結果と入力文との一致度を求めることができるため、機械翻訳の信頼度を判断することが可能になる。
【0004】
また、特許文献1には、翻訳結果で得られた訳語に対して変更要求があった場合に翻訳元の言語での言い換え語を表示する機械翻訳方法が記載されている。特許文献1に記載された機械翻訳方法では、訳語に対する変更要求があると、言い換え語の候補を表示し、ユーザに選択させた言い換え語に対する訳語候補リストの中から優先度の高い訳語を提示する。
【0005】
なお、特許文献2には、用例ベースによる翻訳方式の翻訳精度を向上させる機械翻訳方法が記載されている。特許文献2に記載された機械翻訳方法では、規則ベースの翻訳方式で用いられる規則を適用して各訳語候補を抽出し、その規則の信頼度に基づいて各訳語候補に罰則値を付与する。そして、用例ベースの翻訳を行う際、付与された罰則値を参照して翻訳候補を絞り込む。
【0006】
また、特許文献3には、訳語候補の確実度を評価する機械翻訳方法が記載されている。特許文献3に記載された機械翻訳方法では、原言語の文に含まれる単語の訳語候補を抽出し、その抽出された複数の訳語候補それぞれの確実度を評価する。そして、評価された訳語候補から一つの訳語を選択すると、選択された訳語の確実度が表示される。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特開平9−330318号公報
【特許文献2】特開2008−305167号公報
【特許文献3】特開平5−158973号公報
【発明の概要】
【発明が解決しようとする課題】
【0008】
一般に、目的言語が堪能ではないユーザが機械翻訳の結果を見ても、正しい翻訳か否かを判断することは困難である。また、機械翻訳による翻訳精度は必ずしも100%になるとは限らず(すなわち、翻訳精度は100%に満たないため)、ユーザは、自分の伝えたい内容が正しく相手に伝わっているか不安に思いながら、機械翻訳装置を利用している現状がある。
【0009】
そこで、図12に示すような逆翻訳結果を表示する機械翻訳装置を利用することで、ユーザは、信頼度の高い(すなわち、内容のより正しい)翻訳結果を得ることは可能である。図12は、逆翻訳結果を表示する一般的な機械翻訳装置の例を示すブロック図である。図12に例示する一般的な機械翻訳装置は、テキスト入力部101と、機械翻訳部102と、逆翻訳部103と、結果出力部104とを備えている。
【0010】
テキスト入力部101は、キーボード入力により作成されたテキストや、音声認識システムの出力結果として作成されたテキストなど、ユーザが翻訳したいと考えているテキストの入力を受け付ける。機械翻訳部102は、入力されたテキストの機械翻訳を行う。逆翻訳部103は、機械翻訳による翻訳結果の逆翻訳を行う。結果出力部104は、逆翻訳による結果を機械翻訳による結果と合わせて表示する。そして、図12に例示する機械翻訳装置を用いて翻訳した翻訳結果の信頼度が低かった場合、入力テキスト文の内容を示す別表現のテキスト文の再入力を試みることになる。
【0011】
しかし、音声入力を使用する場合の再発声や、再度のテキスト入力には時間がかかるため、翻訳結果を得るまでに時間を要してしまうという問題がある。この場合、スムーズな会話に支障をきたしてしまうことが考えられる。
【0012】
また、機械翻訳に不慣れなユーザが再入力する言い換え文を考える作業は容易ではなく、負担が大きい。さらに、再入力した文の翻訳結果の信頼度が必ずしも高くなるとは限らないため、何度も再入力が必要となる可能性がある。その場合、ユーザへの負担がさらに大きくなってしまうという問題がある。
【0013】
また、特許文献1に記載された機械翻訳方法では、言い換えの対象とする訳語を翻訳結果から個別に選択しなければならず、最終的な翻訳結果を得るまでに時間を要してしまうという問題がある。また、特許文献2および特許文献3に記載された方法でも、個々の訳語に対して評価を行う必要があるため、やはり、最終的な翻訳結果を得るまでに時間を要してしまうという問題がある。
【0014】
そこで、本発明は、翻訳結果を得るまでの時間を短縮できるとともに、信頼度の高い機械翻訳結果を得ることができる機械翻訳装置、機械翻訳方法および機械翻訳プログラムを提供することを目的とする。
【課題を解決するための手段】
【0015】
本発明による機械翻訳装置は、入力されたテキスト文と同一の言語でそのテキスト文の内容を示す別の表現へ言い換えた1つまたは複数の言い換え文を生成する言い換え文生成手段と、言い換え文を翻訳後の言語である目的言語へと機械翻訳する機械翻訳手段と、目的言語へ翻訳された言い換え文の信頼度を示す翻訳信頼度を決定する翻訳信頼度決定手段と、言い換え文生成手段が生成した言い換え文の中から、翻訳信頼度に基づいて言い換え文の候補を抽出し、候補の中から翻訳の対象とする言い換え文である翻訳対象言い換え文を特定する言い換え文特定手段とを備えたことを特徴とする。
【0016】
本発明による機械翻訳方法は、入力されたテキスト文と同一の言語でそのテキスト文の内容を示す別の表現へ言い換えた1つまたは複数の言い換え文を生成し、言い換え文を翻訳後の言語である目的言語へと機械翻訳し、目的言語へ翻訳された言い換え文の信頼度を示す翻訳信頼度を決定し、生成された言い換え文の中から、翻訳信頼度に基づいて言い換え文の候補を抽出し、言い換え文の候補の中から翻訳の対象とする言い換え文である翻訳対象言い換え文を特定することを特徴とする。
【0017】
本発明による機械翻訳プログラムは、コンピュータに、入力されたテキスト文と同一の言語でそのテキスト文の内容を示す別の表現へ言い換えた1つまたは複数の言い換え文を生成する言い換え文生成処理、言い換え文を翻訳後の言語である目的言語へと機械翻訳する機械翻訳処理、目的言語へ翻訳された言い換え文の信頼度を示す翻訳信頼度を決定する翻訳信頼度決定処理、および、言い換え文生成処理で生成された言い換え文の中から、翻訳信頼度に基づいて言い換え文の候補を抽出し、候補の中から翻訳の対象とする言い換え文である翻訳対象言い換え文を特定する言い換え文特定処理を実行させることを特徴とする。
【発明の効果】
【0018】
本発明によれば、翻訳結果を得るまでの時間を短縮できるとともに、信頼度の高い機械翻訳結果を得ることができる。
【図面の簡単な説明】
【0019】
【図1】本発明の第1の実施形態における機械翻訳装置の例を示すブロック図である。
【図2】第1の実施形態における機械翻訳装置の動作の例を示すフローチャートである。
【図3】第1の実施例における機械翻訳装置の例を示すブロック図である。
【図4】機械翻訳結果を表示する画面の例を示す説明図である。
【図5】入力文の逆翻訳結果を表示する画面の例を示す説明図である。
【図6】翻訳信頼度の算出結果の例を示す説明図である。
【図7】表示命令を受け付ける画面の例を示す説明図である。
【図8】言い換え文候補を表示する画面の例を示す説明図である。
【図9】選択した言い換え文と言い換え文の翻訳結果を表示する画面の例を示す説明図である。
【図10】言い換え文候補と翻訳信頼度とを表示した画面の例を示す説明図である。
【図11】本発明による機械翻訳装置の最小構成の例を示すブロック図である。
【図12】逆翻訳結果を表示する一般的な機械翻訳装置の例を示すブロック図である。
【発明を実施するための形態】
【0020】
以下、本発明の実施形態を図面を参照して説明する。
【0021】
実施形態1.
図1は、本発明の第1の実施形態における機械翻訳装置の例を示すブロック図である。本実施形態における機械翻訳装置は、テキスト入力部201と、言い換え文生成部202と、機械翻訳部203と、翻訳信頼度決定部204と、言い換え候補特定部205と、結果出力部206とを備えている。
【0022】
テキスト入力部201は、キーボードや他の音声認識システム(図示せず)などから原言語のテキストの入力を受け付ける。ここで、原言語とは、翻訳前の言語のことを意味する。以下、テキスト入力部201に入力された翻訳対象のテキストを入力テキストと記す。
【0023】
言い換え文生成部202は、入力テキストの言語種類と内容を保ったまま、1つまたは複数の別の表現へと言い換えた言い換え文を生成する。すなわち、言い換え文生成部202は、入力されたテキスト文と同一の言語でそのテキスト文の内容を示す別の表現へ言い換えた言い換え文を生成する。ここで、言い換え文は、入力されたテキスト文の内容と同等の内容を示すものであれば、厳密に同一の内容を示すものでなくてもよい。
【0024】
言い換え文生成部202は、例えば、入力されたテキスト文中の単語を、類語辞書に登録された類似の単語に置換することで言い換え文を生成してもよい。ただし、言い換え文の生成方法は、類語辞典を使用する方法に限定されない。入力されたテキスト文と同等の内容を示す文を生成できる方法であれば、他の方法であってもよい。
【0025】
機械翻訳部203は、入力されたテキストおよび言い換え文を、翻訳後の言語(すなわち、目的言語)へと機械翻訳する。機械翻訳の方法は特に限定されず、統計ベースによる機械翻訳や、ルールベースによる機械翻訳など、現在知られている方法のいずれを用いてもよい。
【0026】
翻訳信頼度決定部204は、入力されたテキストおよび言い換え文に対する機械翻訳結果(すなわち、目的言語へ翻訳された文)の翻訳信頼度を決定する。翻訳信頼度決定部204は、例えば、目的言語へ機械翻訳された言い換え文を原言語に逆翻訳し、逆翻訳された言い換え文と入力されたテキスト文との類似度を翻訳信頼度として算出してもよい。なお、逆翻訳された言い換え文と入力されたテキスト文との類似度の算出方法については後述する。ただし、翻訳信頼度決定部204が翻訳信頼度を決定する方法は、上記方法に限定されない。各言い換え文の翻訳信頼度を算出できる方法であれば、他の方法であってもよい。
【0027】
言い換え候補特定部205は、言い換え文生成部202が生成した言い換え文の中から、翻訳信頼度に基づいて言い換え文の候補を抽出し、抽出された言い換え文の候補の中から翻訳の対象とする言い換え文(以下、翻訳対象言い換え文と記すこともある。)を特定する。
【0028】
具体的には、言い換え候補特定部205は、翻訳信頼度に応じて上位から順に一定数以下の言い換え文候補を抽出してユーザに表示し、表示した候補のうちユーザによって選択された候補を言い換え文と特定してもよい。また、言い換え候補特定部205は、翻訳信頼度が閾値以上の言い換え文候補を抽出してユーザに表示し、表示した候補のうちユーザによって選択された候補を言い換え文と特定してもよい。本実施形態では、言い換え候補特定部205が翻訳信頼度に基づいて表示した言い換え文の候補のうち、ユーザによって選択された候補を言い換え文と特定する場合について説明する。また、本実施形態では、ユーザによって候補の中から言い換え文を選択する操作が行われたときに、言い換え候補特定部205が言い換え文を特定するものとする。
【0029】
結果出力部206は、選択された言い換え文およびその言い換え文の機械翻訳結果を出力する。また、結果出力部206は、言い換え文だけでなく、入力テキストおよび入力テキストを機械翻訳した結果を出力してもよい。結果出力部206は、例えば、ディスプレイなどの表示装置によって実現される。
【0030】
テキスト入力部201と、言い換え文生成部202と、機械翻訳部203と、翻訳信頼度決定部204と、言い換え候補特定部205とは、プログラム(機械翻訳プログラム)に従って動作するコンピュータのCPUによって実現される。例えば、プログラムは、機械翻訳装置の記憶部(図示せず)に記憶され、CPUは、そのプログラムを読み込み、プログラムに従って、テキスト入力部201、言い換え文生成部202、機械翻訳部203、翻訳信頼度決定部204、言い換え候補特定部205として動作してもよい。
【0031】
また、テキスト入力部201と、言い換え文生成部202と、機械翻訳部203と、翻訳信頼度決定部204と、言い換え候補特定部205とは、それぞれが専用のハードウェアで実現されていてもよい。
【0032】
次に、動作について説明する。図2は、本実施形態における機械翻訳装置の動作の例を示すフローチャートである。テキスト入力部201は、ユーザが翻訳を要求する原言語のテキスト文入力を受け付ける(ステップS1)。次に、機械翻訳部203は、入力テキストを目的言語へと機械翻訳する(ステップS2)。そして、結果出力部206は、機械翻訳結果を表示する(ステップS3)。また、翻訳信頼度決定部204は、機械翻訳結果の翻訳信頼度を算出する(ステップS4)。
【0033】
一方、言い換え文生成部202は、入力テキストの1つまたは複数の言い換え文を作成する(ステップS5)。このとき、言い換え文生成部202は、各言い換え文に対して、入力テキストとの意味的な近さを表すスコア(以下、言い換えスコアと記す)を算出してもよい。
【0034】
例えば、言い換え文生成部202が入力テキスト内の単語を類語に置き換えることで言い換え文を生成する場合、言い換え文生成部202は、類語に置換した単語数が多いほど言い換えスコアを低く算出するように(例えば、置換した単語数の逆数を言い換えスコアと)してもよい。これは、類語に置換した単語数が多いほど、もとの入力文からの意味から離れていくと考えられるからである。
【0035】
次に、機械翻訳部203は、言い換え文を目的言語へと機械翻訳する(ステップS6)。そして、翻訳信頼度決定部204は、機械翻訳結果の翻訳信頼度を算出する(ステップS7)。
【0036】
言い換え候補特定部205は、言い換え文の中から翻訳信頼度の高い順に一定数を、または、翻訳信頼度が閾値以上の言い換え文を言い換え候補と特定し、この言い換え候補を表示対象として決定する(ステップS8)。
【0037】
なお、ステップS5において、各言い換え文の言い換えスコアを算出している場合、言い換え候補特定部205は、翻訳信頼度だけでなく、言い換えスコアも考慮して言い換え候補を特定してもよい。言い換え候補特定部205は、例えば、言い換え文の中から翻訳信頼度と言い換えスコアとを線形補間した値の高い順に一定数を(または、閾値以上の言い換え文を)言い換え候補と特定してもよい。また、例えば、翻訳信頼度をT、言い換えスコアをSとした場合、言い換え候補特定部205は、言い換え候補を特定する際の値VをV=αT+(1−α)Sで算出してもよい。なお、αは、翻訳信頼度Tと言い換えスコアSとの精度の差に応じて予め定められる重み値である。
【0038】
なお、ここでは、言い換え候補特定部205が、言い換え候補の特定が完了した旨をユーザに通知するとともに、ユーザからの表示命令を受け付けるまで、言い換え候補の表示を待機するものとする。
【0039】
その後、言い換え候補特定部205は、ユーザから言い換え候補を表示する旨の表示命令を受け付ける(ステップS9)。そして、言い換え候補特定部205は、言い換え候補を結果出力部206に表示させる(ステップS10)。この時、言い換え候補特定部205は、翻訳信頼度の高い順に言い換え文候補の表示を並び替えてもよい。
【0040】
言い換え候補特定部205は、ユーザによる言い換え文候補の選択を受け付ける(ステップS11)。すなわち、ユーザによって言い換え文候補の中から言い換え文を選択する操作が行われると、言い換え候補特定部205は、言い換え文を特定する。そして、結果出力部206は、選択された言い換え文の機械翻訳結果を表示する(ステップS12)。
【0041】
なお、上記説明では、ステップS9において、言い換え候補特定部205が表示命令を受け付けてから言い換え文候補を表示する場合を例示したが、言い換え候補特定部205は、表示命令を受け付けずに言い換え文候補を表示してもよい。例えば、ステップS4において、入力文の翻訳した際に算出された翻訳信頼度が閾値以下の場合、言い換え候補特定部205は、ユーザからの言い換え候補表示命令を受け付けるステップS9の処理を省略し、ステップS10の処理を行ってもよい。
【0042】
また、上記説明では、機械翻訳部203が入力テキストおよび言い換え文を目的言語へと機械翻訳し、翻訳信頼度決定部204が入力テキストおよび言い換え文に対する機械翻訳結果の翻訳信頼度を決定する場合について説明した。ただし、入力テキストの翻訳信頼度を利用しない場合、機械翻訳部203は入力テキストを目的言語へと機械翻訳しなくてもよく、翻訳信頼度決定部204は入力テキストの翻訳信頼度を決定しなくてもよい。この場合、図2に例示するステップS1〜ステップS4の処理は省略可能である。
【0043】
以上のように、本実施形態によれば、言い換え文生成部202が、入力テキストの言い換え文を生成し、機械翻訳部203が言い換え文を目的言語へと機械翻訳する。また、翻訳信頼度決定部204が、目的言語へ翻訳された言い換え文の翻訳信頼度を決定する。そして、言い換え候補特定部205が、生成された言い換え文の中から、翻訳信頼度に基づいて言い換え文の候補を抽出し、その候補の中から翻訳対象言い換え文を特定する。具体的には、言い換え候補特定部205は、候補の中からユーザによって指定された言い換え文を翻訳対象言い換え文と特定する。よって、翻訳結果を得るまでの時間を短縮できるとともに、信頼度の高い機械翻訳結果を得ることができる。
【0044】
すなわち、本実施形態では、翻訳信頼度の高い表現へ入力文の言い替えを行うため、ユーザがテキストを再入力することなく、言い換え候補の選択を行うのみで一定以上の翻訳信頼度を持つ翻訳結果を出力することができる。よって、ユーザは、スムーズな会話を行うことが可能になる。
【0045】
具体的には、ユーザが入力文の言い換えで行う再発声やテキスト再入力などの操作を、言い換え候補を選択する操作で置き換えるため、一般的な機械翻訳装置よりも、短時間で高信頼度の翻訳結果を得ることができる。また、ユーザが言い換え文を考える作業を省略できるため、ユーザの負担を減らすことができる。
【0046】
さらに、本実施形態では、ユーザが言い換え候補の中から一回選択するだけで、高信頼度の翻訳結果を得ることができる。すなわち、ユーザは高信頼度の翻訳結果を得るまで何度も再入力を行う作業が不要になるため、ユーザの負担を減らすことができ、さらに、短時間で高信頼度の翻訳結果を得ることができる。
【0047】
実施形態2.
次に、本発明の第2の実施形態における機械翻訳装置について説明する。本実施形態における機械翻訳装置の構成は、第1の実施形態における機械翻訳装置の構成と同様である。ただし、言い換え候補特定部205が、翻訳信頼度、または、翻訳信頼度と言い換えスコアとを組み合わせたスコアが最良の言い換え候補を選択する点において、第1の実施形態と異なる。それ以外については、第1の実施形態と同様である。
【0048】
具体的には、言い換え候補特定部205は、言い換え文候補のうち翻訳信頼度が最も高い言い換え文を特定する。また、言い換え文生成部202が言い換えスコアを算出している場合、言い換え候補特定部205は、言い換え文候補のうち、例えば、翻訳信頼度と言い換えスコアとを線形補間した値が最も大きい言い換え文を特定してもよい。
【0049】
本実施形態では、言い換え候補特定部205が言い換え文を特定するため、図2に例示するフローチャートのうち、ステップS10における言い換え候補の表示およびステップS11においてユーザが言い換え文候補を選択する処理を省略することができる。なお、本実施形態では、図2に例示するフローチャートのステップS8において、言い換え候補特定部205が翻訳信頼度または翻訳信頼度と言い換えスコアとを組み合わせたスコアが最良の言い換え候補を選択する。
【0050】
すなわち、本実施形態では、言い換え候補特定部205が、言い換え文の候補の中から、翻訳信頼度が最も高い言い換え文を翻訳対象言い換え文と特定する。よって、ユーザが言い換え候補の選択をしなくても、高信頼度の翻訳結果を出力できるため、よりスムーズな会話を行うことが可能になる。
【0051】
実施形態3.
次に、本発明の第3の実施形態における機械翻訳装置について説明する。本実施形態における機械翻訳装置の構成も、第1の実施形態における機械翻訳装置の構成と同様である。ただし、言い換え候補特定部205が、翻訳信頼度と言い換え文候補とを合わせてユーザに提示し、かつ、ユーザによる適切な言い換え文の選択を受け付ける点において、第1の実施形態と異なる。それ以外については、第1の実施形態と同様である。
【0052】
具体的には、図2に例示するフローチャートのうち、ステップS8で言い換え候補文候補の特定を省略し、ステップS10において、各言い換え文候補とともに翻訳信頼度または翻訳信頼度と言い換えスコアとを組み合わせたスコアをユーザに提示する。
【0053】
そのため、本実施形態では、ユーザがテキストを再入力することなく言い換え候補の選択を行うだけで翻訳信頼度が一定以上の翻訳結果を出力できるため、スムーズな会話を行うことが可能になる。また、機械翻訳装置の処理を減らすことで、装置自身の負荷も軽減できる。
【実施例1】
【0054】
以下、具体的な実施例により本発明を説明するが、本発明の範囲は以下に説明する内容に限定されない。図3は、第1の実施例における機械翻訳装置の例を示すブロック図である。本実施例における機械翻訳装置は、テキスト入力部301と、言い換え文生成部302と、機械翻訳部303と、言い換え候補特定部305と、結果出力部306と、言い換え文特定部309とを備えている。また、言い換え文特定部309は、逆翻訳部307と、翻訳信頼度付与部304とを含む。
【0055】
テキスト入力部301、言い換え文生成部302、機械翻訳部303、言い換え候補特定部305および結果出力部306は、それぞれ、第1の実施形態におけるテキスト入力部201、言い換え文生成部202、機械翻訳部203、言い換え候補特定部205および結果出力部206に相当する。また、言い換え文特定部309(より詳しくは、翻訳信頼度付与部304および逆翻訳部307)は、第1の実施形態における翻訳信頼度決定部204に相当する。
【0056】
逆翻訳部307は、機械翻訳結果を原言語へと逆翻訳する。ここで、逆翻訳とは、目的言語に翻訳された入力テキストを原言語に戻す機械翻訳を行うことである。なお、逆翻訳の方法は特に限定されず、統計ベースによる機械翻訳や、ルールベースによる機械翻訳など、現在知られている方法のいずれを用いてもよい。
【0057】
翻訳信頼度付与部304は、入力テキスト文と逆翻訳した結果作成された文との類似度を算出する。この類似度が高いほど、翻訳結果の信頼度が高いと考えられることから、以下、この類似度を翻訳信頼度として利用する。
【0058】
次に、図2を参照し、本実施例における機械翻訳装置の動作について説明する。
【0059】
ユーザの入力操作に応じ、テキスト入力部301がテキスト「私は彼の携帯電話に電話をしました。」を受け付けたとする(ステップS1)。この場合、機械翻訳部303は、目的言語への翻訳を行う(ステップS2)。ここでは、機械翻訳部303は、入力テキストを「I called his cellular phone.」と翻訳する。機械翻訳部303が用いる機械翻訳の手法は、統計ベースの翻訳であってもよく、ルールベースの翻訳であってもよい。機械翻訳部303は、広く知られた翻訳手法を用いることができる。
【0060】
次に、結果出力部306は、機械翻訳結果を表示する(ステップS3)。図4は、機械翻訳結果を表示する画面の例を示す説明図である。図4に示す例では、結果出力部306が入力文と翻訳結果とを矢印で対応付けて表示していることを示す。
【0061】
次に、逆翻訳部307は、機械翻訳結果を原言語へ逆翻訳する。ここでは、逆翻訳部307は、機械翻訳結果を「私は彼の携帯電話を呼びました。」と逆翻訳する。上述の通り、逆翻訳部307が機械翻訳する手法には、統計ベースの翻訳や、ルールベースの翻訳など、既知の手法を用いることができる。
【0062】
さらに、翻訳信頼度付与部304は、入力文と逆翻訳結果の類似度を計算する。翻訳信頼度付与部304は、入力文と逆翻訳結果の両方の文を形態素解析し、逆翻訳結果に同じ単語および同意語が含まれている入力文の単語または自立語の割合を類似度として計算してもよい。すなわち、翻訳信頼度付与部304は、逆翻訳結果に含まれる単語または自立語が、入力文の単語または自立語と同一(または同意)である割合を類似度としてもよい。以後、この類似度を翻訳信頼度として利用する。
【0063】
なお、ここでは、入力文に対する機械翻訳結果の翻訳信頼度が0.75であったとする。また、結果出力部306は、逆翻訳結果を表示してもよい(ステップS4)。図5は、入力文の逆翻訳結果を表示する画面の例を示す説明図である。図5に示す例では、結果出力部306が、入力文、翻訳結果および逆翻訳結果を画面50に表示していることを示す。
【0064】
一方、言い換え文生成部302は、入力文の言い換え文を生成する(ステップS5)。ここでは、言い換え文生成部302が、「私は彼の携帯電話に電話をかけました。」および「私は彼の携帯電話に連絡をしました。」および「私は彼の携帯電話宛てに彼に電話をしました。」の3通りの言い換え文を生成したとする。なお、言い換え文生成部302が言い換え文を生成する手法には、既知の手法を用いることができる。例えば、言い換え文生成部302は、入力文内の単語を類語に置き換えることで言い換え文を生成してもよい。
【0065】
なお、本実施例では、言い換え文生成部302が3通りの言い換え文を生成する場合について説明するが、生成される言い換え文の数は何通りあってもよい。また、言い換え文生成部302は、入力文と言い換え文との文の近さを表すスコア(すなわち、言い換えスコア)を各言い換え文ごとに算出してもよい。
【0066】
例えば、「電話をしました」と「電話をかけました」とは、同意表現であるので、言い換え文生成部302は、より高い言い換えスコアを言い換え文に付与する。また、「電話をしました」と「連絡をしました」とは正確に同じ意味を表してはいないので、言い換え文生成部302は、より低い言い換えスコアを言い換え文に付与する。
【0067】
次に、機械翻訳部303は、言い換え文の機械翻訳を行う(ステップS6)。ここでは、機械翻訳部303は、ステップS5で生成された3通りの言い換え文の機械翻訳を行い、それぞれの機械翻訳結果として、「I called his cellular phone.」、「I contacted his cellular phone. 」および「I called him to his cellular phone. 」を導出したものとする。
【0068】
次に、逆翻訳部307は、機械翻訳結果を逆翻訳する。ここでは、逆翻訳部307は、それぞれ、「私は彼の携帯電話を呼びました。」、「私は彼の携帯電話に連絡をしました。」および「私は、彼を彼の携帯電話に電話をしました。」と逆翻訳したものとする。
【0069】
そして、翻訳信頼度付与部304は、これらの言い換え文の翻訳信頼度を求める。すなわち、翻訳信頼度付与部304は、言い換え文と逆翻訳結果の類似度を計算する。図6は、翻訳信頼度の算出結果の例を示す説明図である。図6に示す例では、言い換え文から翻訳文を導出し、その翻訳文を逆翻訳した結果と言い換え文の翻訳信頼度とを示している。入力文と逆翻訳結果が完全一致している場合は、信頼度が最大になる。ここでは、翻訳信頼度が、それぞれ、0.75,1.0,0.85と算出されたものとする。なお、本実施例において、信頼度の最大は1.0である。
【0070】
次に、言い換え候補特定部305は、翻訳信頼度の高い言い換え文を言い換え文候補として決定する(ステップS8)。言い換え候補特定部305は、例えば、翻訳信頼度の上位2個を言い換え文候補と決定してもよい。この場合、本実施例では、言い換え候補特定部305は、翻訳信頼度が1.0の言い換え文である「私は彼の携帯電話に連絡をしました。」と、翻訳信頼度が0.85の言い換え文である「私は、彼を彼の携帯電話に電話をしました。」とを言い換え文候補として決定する。
【0071】
また、言い換え文を決定する翻訳信頼度の閾値を予め設定しておいてもよい。例えば、翻訳信頼度の閾値を0.9とし、翻訳信頼度が0.9以上の言い換え文を候補とする場合、言い換え候補特定部305は、翻訳信頼度が1.0の言い換え文である「私は彼の携帯電話に連絡をしました。」のみを言い換え文候補として決定する。
【0072】
以下の説明では、言い換え候補特定部305が翻訳信頼度の上位2個を言い換え文候補と決定する場合について説明する。また、本実施例では、言い換え候補特定部305が翻訳信頼度に基づいて言い換え文候補を決定しているが、言い換え候補特定部305は、翻訳信頼度と言い換えスコアとを線形補間した値に基づいて言い換え文候補を決定してもよい。
【0073】
次に、言い換え候補特定部305は、ユーザから言い換え候補を表示する旨の表示命令を受け付ける(ステップS9)。図7は、表示命令を受け付ける画面の例を示す説明図である。例えば、翻訳信頼度の閾値が0.8と設定されている場合、本実施例では入力文に対する翻訳信頼度は0.75のため、閾値を下回っている。そこで、言い換え候補特定部305は、図7に例示するように、「翻訳が誤っている可能性があります。言い換え候補を選択しますか。」とする説明用のダイアログを結果出力部306に表示するとともに、ユーザに候補を表示する旨の表示命令を受け付けるための「はい」というボタンを結果出力部306に表示させてもよい。ここでは、ユーザが「はい」をクリックすると、言い換え候補特定部305が表示命令を受け付ける。その後、ステップS10の処理に進む。
【0074】
次に、言い換え候補特定部305は、ステップS8において決定された言い換え文候補を結果表示部306に表示させる(ステップS10)。図8は、言い換え文候補を表示する画面の例を示す説明図である。図8に示す例では、図5に例示する画面50上に言い換え文の候補を示すウィンドウ51が表示され、画面50が上書きされた状態を示す。言い換え候補特定部305は、翻訳信頼度が高いものほど上に表示させるなど、表示順を並べ替えて言い換え文候補を表示させてもよい。
【0075】
そして、ユーザによって言い換え文候補の中から言い換え文を選択する操作が行われると、言い換え候補特定部305は、その選択操作を受け付ける(ステップS11)。ここでは、ユーザが言い換え文の中から「私は彼の携帯電話に連絡をしました。」を選択したとする。
【0076】
言い換え文が選択されると、結果出力部306は、選択された言い換え文の機械翻訳結果を表示する(ステップS12)。図9は、選択した言い換え文と言い換え文の翻訳結果を表示する画面の例を示す説明図である。図9に示す例では、結果出力部306がステップS11で選択された言い換え文の翻訳結果として「I contacted his cellular phone. 」を表示したことを示す。
【0077】
なお、ステップS9において、入力文に対する翻訳信頼度が閾値を下回っている場合、ユーザから言い換え候補を表示する旨の表示命令を受け付けずに(すなわち、ステップS9を省略して)ステップS10の処理へ進んでもよい。
【実施例2】
【0078】
次に、第2の実施例について説明する。第2の実施例における機械翻訳装置は、第1の実施例における機械翻訳装置と同様である。また、テキスト入力部301が入力文を受け付けて、言い換え文候補の翻訳信頼度を算出するステップS1〜ステップS8の処理は、第1の実施例と同様である。ここで、実施例2では、実施例1で説明したステップS8における処理の代わりに、言い換え候補特定部305が翻訳信頼度の最も高い言い換え文に言い換え候補を決定する。具体的には、言い換え候補特定部305は、言い換え文候補のうち翻訳信頼度が1.0の「私は彼の携帯電話に連絡をしました。」を言い換え文に決定する。
【0079】
その後、言い換え候補特定部305がダイアログを表示し、ユーザから言い換え候補を表示する旨の表示命令(ここでは、「はい」をクリックする操作)を受け付けると(ステップS9)、ステップS10〜ステップS11に例示する言い換え候補の表示処理および言い換え文候補の選択処理が省略され、ステップS12の処理が行われる。具体的には、結果出力部306が、選択された言い換え文の機械翻訳結果を表示する(ステップS12)。
【0080】
本実施例では、結果出力部306は、機械翻訳結果として、「I contacted his cellular phone. 」を表示する。つまり、図7に例示する画面において「はい」が選択されると、結果出力部306は、図8に例示する画面表示を省略し、図9に例示する画面を表示する。
【実施例3】
【0081】
次に、第3の実施例について説明する。第3の実施例における機械翻訳装置も、第1の実施例における機械翻訳装置と同様である。また、テキスト入力部301が入力文を受け付けて、言い換え文候補の翻訳信頼度を算出するステップS1〜ステップS8の処理は、第1の実施例と同様である。ここで、実施例3では、実施例1で説明したステップS8の処理が省略され、ユーザから言い換え候補を表示する旨の表示命令を受け付けるステップS9以降の処理が行われる。
【0082】
言い換え候補特定部305がダイアログを表示し、ユーザから言い換え候補を表示する旨の表示命令(ここでは、「はい」をクリックする操作)を受け付けると(ステップS9)、言い換え候補特定部305は、言い換え文候補を翻訳信頼度とともに結果表示部306に表示させる(ステップS10)。図10は、言い換え文候補と翻訳信頼度とを表示した画面の例を示す説明図である。図10に示す例では、図5に例示する画面50上に言い換え文候補とともに数値で翻訳信頼度を示すウィンドウ52が表示され、画面50が上書きされた状態を示す。ただし、翻訳信頼度の表示は数値に限定されない。翻訳信頼度が分かる表示であれば、例えば、グラフ形式であってもよい。
【0083】
そして、ユーザによって言い換え文候補の中から言い換え文を選択する操作が行われると、言い換え候補特定部305は、その選択操作を受け付ける(ステップS11)。ここでは、ユーザが言い換え文の中から「私は彼の携帯電話に連絡をしました。」を選択したとする。
【0084】
言い換え文が選択されると、結果出力部306は、選択された言い換え文の機械翻訳結果を表示する(ステップS12)。ここでは、結果出力部306は、図9に例示するように、翻訳結果として「I contacted his cellular phone. 」と表示する。
【0085】
次に、本発明の最小構成について説明する。図11は、本発明による機械翻訳装置の最小構成の例を示すブロック図である。本発明による機械翻訳装置は、入力されたテキスト文(例えば、入力テキスト)と同一の言語でそのテキスト文の内容を示す別の表現へ言い換えた1つまたは複数の言い換え文を生成する言い換え文生成手段81(例えば、言い換え文生成部202)と、言い換え文を翻訳後の言語である目的言語へと機械翻訳する機械翻訳手段82(例えば、機械翻訳部303)と、目的言語へ翻訳された言い換え文の信頼度を示す翻訳信頼度を決定する翻訳信頼度決定手段83(例えば、翻訳信頼度決定部204)と、言い換え文生成手段81が生成した言い換え文の中から、翻訳信頼度に基づいて言い換え文の候補を抽出し、候補の中から翻訳の対象とする言い換え文である翻訳対象言い換え文を特定する言い換え文特定手段84(例えば、言い換え候補特定部205)とを備えている。
【0086】
そのような構成により、翻訳結果を得るまでの時間を短縮できるとともに、信頼度の高い機械翻訳結果を得ることができる。
【0087】
上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
【0088】
(付記1)入力されたテキスト文と同一の言語で当該テキスト文の内容を示す別の表現へ言い換えた1つまたは複数の言い換え文を生成する言い換え文生成手段と、前記言い換え文を翻訳後の言語である目的言語へと機械翻訳する機械翻訳手段と、目的言語へ翻訳された言い換え文の信頼度を示す翻訳信頼度を決定する翻訳信頼度決定手段と、言い換え文生成手段が生成した言い換え文の中から、前記翻訳信頼度に基づいて言い換え文の候補を抽出し、前記候補の中から翻訳の対象とする言い換え文である翻訳対象言い換え文を特定する言い換え文特定手段とを備えたことを特徴とする機械翻訳装置。
【0089】
(付記2)言い換え文特定手段は、言い換え文の候補の中からユーザによって指定された言い換え文を翻訳対象言い換え文と特定する付記1記載の機械翻訳装置。
【0090】
(付記3)言い換え文特定手段は、言い換え文の候補の中から、翻訳信頼度が最も高い言い換え文を翻訳対象言い換え文と特定する付記1記載の機械翻訳装置。
【0091】
(付記4)言い換え文特定手段は、言い換え文の候補と当該言い換え文の翻訳信頼度とを合わせて表示手段に表示させ、前記候補の中からユーザによって指定された言い換え文を翻訳対象言い換え文と特定する付記1記載の機械翻訳装置。
【0092】
(付記5)翻訳信頼度決定手段は、目的言語へ機械翻訳された言い換え文を元の言語である原言語に逆翻訳する逆翻訳手段と、逆翻訳された言い換え文と入力されたテキスト文との類似度を翻訳信頼度として各言い換え文に付与する類似度付与手段とを含む付記1から付記4のうちのいずれか1項に記載の機械翻訳装置。
【0093】
(付記6)言い換え文生成手段は、入力されたテキスト文と言い換え文との意味的近さを表す値である言い換えスコアを算出し、言い換え文特定手段は、言い換え文生成手段が生成した言い換え文の中から、前記翻訳信頼度および前記言い換えスコアに基づいて言い換え文の候補を抽出する付記1から付記5のうちのいずれか1項に記載の機械翻訳装置。
【0094】
(付記7)入力されたテキスト文と同一の言語で当該テキスト文の内容を示す別の表現へ言い換えた1つまたは複数の言い換え文を生成し、前記言い換え文を翻訳後の言語である目的言語へと機械翻訳し、目的言語へ翻訳された言い換え文の信頼度を示す翻訳信頼度を決定し、生成された言い換え文の中から、前記翻訳信頼度に基づいて言い換え文の候補を抽出し、前記言い換え文の候補の中から翻訳の対象とする言い換え文である翻訳対象言い換え文を特定することを特徴とする機械翻訳方法。
【0095】
(付記8)言い換え文の候補の中からユーザによって指定された言い換え文を翻訳対象言い換え文と特定する付記7記載の機械翻訳方法。
【0096】
(付記9)言い換え文の候補の中から、翻訳信頼度が最も高い言い換え文を翻訳対象言い換え文と特定する付記7記載の機械翻訳方法。
【0097】
(付記10)言い換え文の候補と当該言い換え文の翻訳信頼度とを合わせて表示手段に表示させ、前記候補の中からユーザによって指定された言い換え文を翻訳対象言い換え文と特定する付記7記載の機械翻訳方法。
【0098】
(付記11)翻訳信頼度を決定する際、目的言語へ機械翻訳された言い換え文を元の言語である原言語に逆翻訳し、逆翻訳された言い換え文と入力されたテキスト文との類似度を翻訳信頼度として算出する付記7から付記10のうちのいずれか1つに記載の機械翻訳方法。
【0099】
(付記12)コンピュータに、入力されたテキスト文と同一の言語で当該テキスト文の内容を示す別の表現へ言い換えた1つまたは複数の言い換え文を生成する言い換え文生成処理、前記言い換え文を翻訳後の言語である目的言語へと機械翻訳する機械翻訳処理、目的言語へ翻訳された言い換え文の信頼度を示す翻訳信頼度を決定する翻訳信頼度決定処理、および、言い換え文生成処理で生成された言い換え文の中から、前記翻訳信頼度に基づいて言い換え文の候補を抽出し、前記候補の中から翻訳の対象とする言い換え文である翻訳対象言い換え文を特定する言い換え文特定処理を実行させるための機械翻訳プログラム。
【0100】
(付記13)コンピュータに、言い換え文特定処理で、言い換え文の候補の中からユーザによって指定された言い換え文を翻訳対象言い換え文と特定させる付記12記載の機械翻訳プログラム。
【0101】
(付記14)コンピュータに、言い換え文特定処理で、言い換え文の候補の中から、翻訳信頼度が最も高い言い換え文を翻訳対象言い換え文と特定させる付記12記載の機械翻訳プログラム。
【0102】
(付記15)コンピュータに、言い換え文特定処理で、言い換え文の候補と当該言い換え文の翻訳信頼度とを合わせて表示手段に表示させ、前記候補の中からユーザによって指定された言い換え文を翻訳対象言い換え文と特定させる付記12記載の機械翻訳プログラム。
【0103】
(付記16)翻訳信頼度決定処理で、目的言語へ機械翻訳された言い換え文を元の言語である原言語に逆翻訳する逆翻訳処理、および、逆翻訳された言い換え文と入力されたテキスト文との類似度を翻訳信頼度として算出する類似度算出処理を実行させる付記12から付記15のうちのいずれか1つに記載の機械翻訳プログラム。
【産業上の利用可能性】
【0104】
本発明は、機械翻訳された翻訳結果の信頼度をより高くする機械翻訳装置に好適に適用される。例えば、ユーザが短い単位で発声した音声の入力やユーザによるテキストの入力に対して翻訳を行った結果を相手に表示する通訳システムや、翻訳結果を音声として合成した結果を相手に提示する通訳システムなどに本発明を適用できる。他にも、通訳チャットシステムや、通訳会議システムなどに本発明を適用できる。
【符号の説明】
【0105】
201,301 テキスト入力部
202,302 言い換え文生成部
203,303 機械翻訳部
204 翻訳信頼度決定部
205,305 言い換え候補特定部
206,306 結果出力部
304 翻訳信頼度付与部
307 逆翻訳部

【特許請求の範囲】
【請求項1】
入力されたテキスト文と同一の言語で当該テキスト文の内容を示す別の表現へ言い換えた1つまたは複数の言い換え文を生成する言い換え文生成手段と、
前記言い換え文を翻訳後の言語である目的言語へと機械翻訳する機械翻訳手段と、
目的言語へ翻訳された言い換え文の信頼度を示す翻訳信頼度を決定する翻訳信頼度決定手段と、
言い換え文生成手段が生成した言い換え文の中から、前記翻訳信頼度に基づいて言い換え文の候補を抽出し、前記候補の中から翻訳の対象とする言い換え文である翻訳対象言い換え文を特定する言い換え文特定手段とを備えた
ことを特徴とする機械翻訳装置。
【請求項2】
言い換え文特定手段は、言い換え文の候補の中からユーザによって指定された言い換え文を翻訳対象言い換え文と特定する
請求項1記載の機械翻訳装置。
【請求項3】
言い換え文特定手段は、言い換え文の候補の中から、翻訳信頼度が最も高い言い換え文を翻訳対象言い換え文と特定する
請求項1記載の機械翻訳装置。
【請求項4】
言い換え文特定手段は、言い換え文の候補と当該言い換え文の翻訳信頼度とを合わせて表示手段に表示させ、前記候補の中からユーザによって指定された言い換え文を翻訳対象言い換え文と特定する
請求項1記載の機械翻訳装置。
【請求項5】
翻訳信頼度決定手段は、
目的言語へ機械翻訳された言い換え文を元の言語である原言語に逆翻訳する逆翻訳手段と、
逆翻訳された言い換え文と入力されたテキスト文との類似度を翻訳信頼度として各言い換え文に付与する類似度付与手段とを含む
請求項1から請求項4のうちのいずれか1項に記載の機械翻訳装置。
【請求項6】
言い換え文生成手段は、入力されたテキスト文と言い換え文との意味的近さを表す値である言い換えスコアを算出し、
言い換え文特定手段は、言い換え文生成手段が生成した言い換え文の中から、前記翻訳信頼度および前記言い換えスコアに基づいて言い換え文の候補を抽出する
請求項1から請求項5のうちのいずれか1項に記載の機械翻訳装置。
【請求項7】
入力されたテキスト文と同一の言語で当該テキスト文の内容を示す別の表現へ言い換えた1つまたは複数の言い換え文を生成し、
前記言い換え文を翻訳後の言語である目的言語へと機械翻訳し、
目的言語へ翻訳された言い換え文の信頼度を示す翻訳信頼度を決定し、
生成された言い換え文の中から、前記翻訳信頼度に基づいて言い換え文の候補を抽出し、
前記言い換え文の候補の中から翻訳の対象とする言い換え文である翻訳対象言い換え文を特定する
ことを特徴とする機械翻訳方法。
【請求項8】
言い換え文の候補の中からユーザによって指定された言い換え文を翻訳対象言い換え文と特定する
請求項7記載の機械翻訳方法。
【請求項9】
コンピュータに、
入力されたテキスト文と同一の言語で当該テキスト文の内容を示す別の表現へ言い換えた1つまたは複数の言い換え文を生成する言い換え文生成処理、
前記言い換え文を翻訳後の言語である目的言語へと機械翻訳する機械翻訳処理、
目的言語へ翻訳された言い換え文の信頼度を示す翻訳信頼度を決定する翻訳信頼度決定処理、および、
言い換え文生成処理で生成された言い換え文の中から、前記翻訳信頼度に基づいて言い換え文の候補を抽出し、前記候補の中から翻訳の対象とする言い換え文である翻訳対象言い換え文を特定する言い換え文特定処理
を実行させるための機械翻訳プログラム。
【請求項10】
コンピュータに、
言い換え文特定処理で、言い換え文の候補の中からユーザによって指定された言い換え文を翻訳対象言い換え文と特定させる
請求項9記載の機械翻訳プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate


【公開番号】特開2012−159969(P2012−159969A)
【公開日】平成24年8月23日(2012.8.23)
【国際特許分類】
【出願番号】特願2011−18552(P2011−18552)
【出願日】平成23年1月31日(2011.1.31)
【出願人】(000004237)日本電気株式会社 (19,353)
【Fターム(参考)】