説明

機械翻訳装置

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、換言機構を両言語に備えた機械翻訳装置に関する。
【0002】
【従来の技術及び発明が解決しようとする課題】翻訳困難な表現や構文の機械翻訳の翻訳品質を向上させるための従来の自動編集、自動書き換えなど(以下、換言という)は、機構的には従来技術の機械翻訳機構と同等又はその一部であり、換言の結果が複数個可能であれば、それらの結果の中から人間の操作者が一つを選択することが必要であった。こうした換言機構を備えただけの翻訳装置では、操作者は原言語及び目的言語(例えば日英翻訳においては原言語は日本語、目的言語は英語)の知識を持ち、換言の結果を選択する能力を備える必要があったため、当該翻訳装置の利用者が限定されるという問題点があった。
【0003】あるいは、換言の結果が複数個可能にならないように、換言操作の根拠となる知識(以下、換言知識という)の条件を予め詳細に設定しておかなければならなかった。こうした換言機構を備えただけの翻訳装置では、換言機構以外の狭義の翻訳(以下、言語変換という)機構における言語変換の根拠となる知識の開発及び準備の負荷の一部を、換言知識の開発及び準備の負荷に転嫁したものであり、当該翻訳装置の性能は開発者の知識と能力に大きく左右される点に変わりなかった。このため、機械翻訳装置の開発には大きな資源が必要であるという問題点があった。
【0004】本発明の目的は以上の問題点を解決し、換言機構を両言語に備えた機械翻訳装置において、原言語と目的言語の知識を持たない操作者が使用可能であり、開発に必要な資源(例えば、時間、手間、及び人的資源など)を低減可能な機械翻訳装置を提供することにある。
【0005】
【課題を解決するための手段】第1の発明に係る機械翻訳装置は、原言語文を目的言語文に翻訳する機械翻訳装置において、上記原言語文を解析して上記原言語文の単語又は句である原言語文の構成要素を抽出し、原言語の換言操作の換言前後の構成要素の対にてなる原言語の換言操作を参照して、上記原言語文の構成要素に対する、上記原言語の換言操作の換言前の構成要素の近似の程度を示す第1のスコアを計算し、最大の第1のスコアを有する上記原言語の換言操作の換言前の構成要素を含む上記原言語の換言操作を選択し、選択された上記原言語の換言操作を用いて上記原言語文を換言後の原言語文に換言するとともに、選択された上記原言語の換言操作の処理の前後の差違を表す差違情報を生成する原言語換言処理部と、原言語の構成要素と対応する目的言語の構成要素との対にてなる言語変換知識を参照して、上記換言後の原言語文を目的言語文に言語変換する言語変換処理部と、上記目的言語文を解析して上記目的言語文の単語又は句である目的言語文の構成要素を抽出し、上記差違情報に基づいて、目的言語の換言操作の換言前後の構成要素の対にてなる目的言語の換言操作を参照して、上記目的言語文の構成要素に対する、上記差違情報と反対の換言操作を行う上記目的言語の換言操作の換言前の構成要素の近似の程度を示す第2のスコアを計算し、最大の第2のスコアを有する上記目的言語の換言操作の換言前の構成要素を含む上記目的言語の換言操作を選択し、選択された上記目的言語の換言操作を用いて上記目的言語文を換言後の目的言語文に換言する目的言語換言処理部とを備えたことを特徴とする。
【0006】また、第2の発明に係る機械翻訳装置は、原言語文を目的言語文に翻訳する機械翻訳装置において、上記原言語文を解析して上記原言語文の単語又は句である原言語文の構成要素を抽出し、原言語の換言操作の換言前後の構成要素の対にてなる原言語の換言操作を参照して、上記原言語文の構成要素に対する、上記原言語の換言操作の換言前の構成要素の近似の程度を示す第1のスコアを計算し、最大の第1のスコアを有する上記原言語の換言操作の換言前の構成要素を含む上記原言語の換言操作を選択し、選択された上記原言語の換言操作を用いて上記原言語文を換言後の原言語文に換言する原言語換言処理部と、原言語の構成要素と対応する目的言語の構成要素との対にてなる言語変換知識を参照して、上記換言後の原言語文を目的言語文に言語変換する言語変換処理部と、上記目的言語文を解析して上記目的言語文の単語又は句である目的言語文の構成要素を抽出し、上記差違情報に基づいて、目的言語の換言操作の換言前後の構成要素の対にてなる所定の目的言語の換言操作を参照して、上記目的言語文の構成要素に対する、上記目的言語の換言操作の換言前の構成要素の近似の程度を示す第2のスコアを計算し、最大の第2のスコアを有する上記目的言語の換言操作の換言前の構成要素を含む上記目的言語の換言操作を選択し、選択された上記目的言語の換言操作を用いて上記目的言語文を換言後の目的言語文に換言する目的言語換言処理部とを備え、上記言語変換処理部は、上記言語変換知識の原言語の構成要素を参照して、上記換言後の原言語文に対する、上記言語変換知識の原言語の構成要素の近似の程度を示す第3のスコアを計算し、計算した第3のスコアの値が所定のしきい値より高いときは、最大の第3のスコアを有する上記言語変換知識の原言語の構成要素を含む上記言語変換知識を選択し、選択された上記言語変換知識を用いて上記換言後の原言語文を上記目的言語文に言語変換する一方、計算した第3のスコアの値が上記しきい値以下のときは、最大の第3のスコアを有する上記言語変換知識の原言語の構成要素を翻訳可能文情報として選択して上記原言語換言処理部に出力し、上記原言語換言処理部は、上記原言語文の構成要素に対する上記原言語の換言操作の換言前の構成要素の近似の程度と、上記翻訳可能文情報に対する上記原言語の換言操作の換言後の構成要素の近似の程度とを示す第1のスコアを計算し、最大の第1のスコアを有する原言語の換言操作の換言前後の構成要素を含む上記原言語の換言操作を選択し、選択された上記原言語の換言操作を用いて上記原言語文を換言後の原言語文に換言することを特徴とする。
【0007】
【発明の実施の形態】以下、図面を参照して本発明の実施形態について説明する。
【0008】図1は、本発明の実施形態に係る機械翻訳装置3を備えた音声翻訳合成システムの構成を示すブロック図である。この音声翻訳合成システムは、音声認識装置2、機械翻訳装置3及び音声合成装置4を備えて構成され、機械翻訳装置3は、従来技術の問題点を解決するために、ある原言語文又は目的言語に翻訳された原言語文に対して複数個存在する可能な換言の中から自動的に1つを選択する両言語の換言機構を、図2に示すように、言語変換処理部12の両側の原言語換言処理部11及び目的言語換言処理部13とに設け、(A)原言語換言処理部11は、選択された原言語の換言操作の処理の前後の差違を表す差違情報を生成し、目的言語換言処理部13は、上記差違情報に基づいて、目的言語の換言操作の換言前後の構成要素の対にてなる目的言語の換言操作を参照して、上記目的言語文の構成要素に対する、上記差違情報と反対の換言操作を行う上記目的言語の換言操作の換言前の構成要素の近似の程度を示す第2のスコアを計算し、最大の第2のスコアを有する上記目的言語の換言操作の換言前の構成要素を含む上記目的言語の換言操作を選択すること、並びに、(B)言語変換処理部12は、上記言語変換知識の原言語の構成要素を参照して、上記換言後の原言語文に対する、上記言語変換知識の原言語の構成要素の近似の程度を示す第3のスコアを計算し、計算した第3のスコアの値が上記しきい値以下のときは、最大の第3のスコアを有する上記言語変換知識の原言語の構成要素を翻訳可能文情報として選択して原言語換言処理部11に帰還して出力し、原言語換言処理部11は、上記原言語文の構成要素に対する上記原言語の換言操作の換言前の構成要素の近似の程度と、上記翻訳可能文情報に対する上記原言語の換言操作の換言後の構成要素の近似の程度とを示す第1のスコアを計算し、最大の第1のスコアを有する上記原言語の換言操作の換言前後の構成要素を含む原言語の換言操作を選択し、選択された上記原言語の換言操作を用いて上記原言語文を上記換言後の原言語文に換言することを特徴としている。
【0009】図1において、音声翻訳合成システムは、マイクロホン1と、音声認識装置2と、機械翻訳装置3と、音声合成装置4と、スピーカ5とを備えて構成される。ここで、音声認識装置2と機械翻訳装置3とにより音声翻訳システムを構成し、機械翻訳装置3と音声合成装置4とにより翻訳音声合成システムを構成する。
【0010】マイクロホン1に入力された原言語文の発声音声は電気信号に変換された後、音声認識装置2に入力され、音声認識装置2は公知の音声認識方法を用いて、入力される原言語文の音声信号を音声認識することにより原言語文の文字列に変換して機械翻訳装置3に出力する。次いで、機械翻訳装置3は入力される原言語文の文字列を詳細後述する方法を用いて、目的言語文の文字列に機械翻訳した後、音声合成装置4に出力する。さらに、音声合成装置4は公知の音声合成方法を用いて、入力される目的言語文の文字列を音声信号に音声合成してスピーカ5から合成音声を出力する。
【0011】図2は、図1の機械翻訳装置3の詳細構成を示すブロック図である。本実施形態の機械翻訳装置3は、処理制御部10と、上記処理制御部10にそれぞれ接続された原言語換言処理部11、言語変換処理部12及び目的言語換言処理部13を備えている。処理制御部10は、音声認識装置2から入力された原言語文を原言語換言処理部11に出力し、原言語換言処理部11は上記原言語文を機械翻訳に適当な表現及び構文に換言して原言語換言文を生成し、上記原言語換言文と当該換言に関連する換言知識の差違情報とを処理制御部10に出力する。この換言の結果、原言語文中の語義及び並列構文の構造などが特定され、それによって原言語文の持つあいまい性が解消される。次いで、処理制御部10は言語変換処理部12に上記原言語換言文を翻訳原文として入力し、言語変換処理部12は、上記翻訳原文を目的言語に言語変換した目的言語翻訳文を生成して処理制御部10に出力し、もしくは、当該言語変換が可能でないとき、翻訳可能文情報を生成して処理制御部10に出力する。処理制御部10は、上記生成された翻訳可能文情報と、それに対応する原言語文とを原言語換言処理部11に入力し、原言語換言処理部11は、翻訳可能文情報を参照して、目的言語翻訳文を生成するためにより適切な換言を実行する。次に、処理制御部10は、目的言語翻訳文と、上記生成された差異情報とは反対の差異情報を発生して目的言語換言処理部13に出力し、目的言語換言処理部13は、原言語での換言処理によって発生した原言語文との差違を解消するために、上記反対の差違情報を用いて、目的言語翻訳文を換言後の目的言語文、すなわち目的言語換言文に換言して処理制御部10に出力する。最後に、処理制御部10は目的言語文を音声合成装置4に出力する。
【0012】図3は、図2の原言語換言処理部11の詳細構成を示すブロック図である。図3において、原言語換言処理部11は、近似照合処理部112と、上記近似照合処理部112にそれぞれ接続された原言語解析処理部111、原言語換言文生成部113及び換言知識メモリ114と、上記近似照合処理部112及び上記原言語解析処理部111に接続された履歴情報メモリ115とを備えて構成される。
【0013】原言語解析処理部111は、公知の機械翻訳装置に利用されている公知の形態素解析方法により原言語文を形態素解析して、原言語文の各構成要素(例えば、ある単語又は句)を抽出し、原言語文を換言知識メモリ114に記憶された換言知識と照合可能な形式に変形して原言語文解析結果とする。ここで、上記換言知識は、原言語の換言前の構成要素(又は文字列)と換言後の構成要素(又は文字列)とを対にした情報である換言操作と、上記換言前の構成要素と上記換言後の構成要素との差違を表す差違情報とのデータを含む。次いで、近似照合処理部112は、言語変換処理部12において生成される翻訳可能文情報が入力されない場合、原言語文解析結果と換言知識の換言操作とを照合し、所定のスコア計算方法を用いて原言語文解析結果の各構成要素とそこに適用される換言操作に係る換言前の構成要素との間の近似の程度を示す第1のスコアを計算し、最大の第1のスコアを有し、原言語文解析結果に適用可能な換言操作を記述した換言知識を選択し、選択した換言知識と、原言語文解析結果とを原言語換言文生成部113に出力する。第1のスコアの計算は、例えば、別途用意した単言語コーパスにおける出現確率などにより、複数の換言候補の間のさまざまな尤度を比較することによって実行することができる。原言語換言文生成部113は、公知の方法により、原言語文解析結果を換言知識の換言操作を用いて原言語換言文に換言して出力する。ここで、公知の方法とは、例えば公知の機械翻訳装置に利用されている、形態素解析手段、変換手段、生成手段等の手段であり、原言語と目的言語が同一言語である点を除けば、原言語換言文生成部113は公知の機械翻訳装置の機構と同等又はその一部として構成される。さらに、原言語換言文生成部113は、選択された換言操作の処理前後の差違を表す換言知識の差違情報を出力する。原言語換言処理部11は、後に参照するために、入力される各原言語文と、それに対する次の表に示された各項目の情報とを履歴情報メモリ115に記憶する。
【0014】
【表1】
――――――――――――――――――――――――――――――――――――原言語文 原言語文の形態素解析結果 対応する換言知識 原言語換言文――――――――――――――――――――――――――――――――――――
【0015】一方、言語変換処理部12によって生成された翻訳可能文情報が入力された場合、近似照合処理部112は、翻訳可能文情報と原言語文解析結果と換言知識の換言操作とを照合し、所定のスコア計算方法を用いて原言語文解析結果の各構成要素とそこに適用される換言操作に係る換言前の構成要素との間の近似の程度と、上記翻訳可能文情報と換言操作の換言後の構成要素との間の近似の程度とを示す第1のスコアを計算し、最大の第1のスコアを有し、原言語文解析結果に適用可能な換言操作を記述した換言知識を選択し、選択した換言語知識と、原言語文解析結果とを原言語換言文生成部113に出力する。ただし、原言語換言処理部11の他の動作は、翻訳可能文情報が入力されない場合と同様である。
【0016】図4は、図2の言語変換処理部12の詳細構成を示すブロック図である。言語変換処理部12は、原言語照合処理部121と、上記原言語照合処理部121に接続された近似照合判定部122及び言語変換知識メモリ124と、近似照合判定部122に接続された目的言語文生成部123とを備えて構成される。原言語照合処理部121は、処理制御部10から翻訳原文として入力された原言語換言文と、言語変換知識メモリ124に記憶された言語変換知識の原言語情報とを照合して、所定のスコア計算方法を用いて翻訳原文とそこに適用される言語変換知識の原言語情報との間の近似の程度を示す第3のスコアを計算し、計算した第3のスコアの値で示される、言語変換処理における言語変換の根拠となる可能性が、あるしきい値より高い言語変換知識と、翻訳原文とを、近似照合判定部122に出力する。上記第3のスコアの計算は、公知の方法を用いて、例えば、翻訳原文と、言語変換知識の原言語情報との構文上の類似点を数値化し、それによって各原言語情報に対してスコアを計算する。言語変換知識は、言語変換知識メモリ124に記憶された、原言語の構成要素(すなわち原言語情報)と目的言語の構成要素(すなわち目的言語情報)とを対とした情報であり、それによって言語変換知識メモリ124は対訳辞書として動作する。ここで、上記しきい値よりも高い値の第3のスコアを有する言語変換知識が発見されないときは、機械翻訳装置3による翻訳は実行されない。近似照合判定部122は、翻訳原文と言語変換知識の原言語情報とを順次照合して言語変換するか否かを判定し、言語変換する場合には最大の第3のスコアを有する当該言語変換知識を選択して翻訳原文とともに目的言語文生成部123に出力し、また、第3のスコアの値がすべて所定のしきい値以下であり、言語変換しない場合には、翻訳原文と最も近似した、すなわち最大のスコアを有する言語変換知識の原言語情報を翻訳可能文情報として出力する。近似照合判定部122は、例えば同一翻訳原文に対する近似照合判定回数や、翻訳処理の経過時間などにより近似照合を徐々に緩和して言語変換するか否かを判定する。目的言語文生成部123は、例えば公知の機械翻訳装置に利用されている公知の方法により、翻訳原文を目的言語翻訳文に言語変換して出力する。目的言語文生成部123は公知の機械翻訳装置の機構と同等又はその一部として構成される。
【0017】図5は、図2の目的言語換言処理部13の詳細構成を示すブロック図である。目的言語換言処理部13は、近似照合処理部132と、上記近似照合処理部132にそれぞれ接続された翻訳文解析処理部131、目的言語換言文生成部133及び換言知識メモリ134とを備えて構成される。翻訳文解析処理部131は、例えば公知の機械翻訳装置に利用されている公知の形態素解析方法を用いて、目的言語翻訳文を形態素解析し、目的言語翻訳文の各構成要素(例えば、ある単語又は句)を抽出し、換言知識メモリ134に記憶された換言知識と照合可能な形式に変形して翻訳文解析結果とする。ここで、上記換言知識は、目的言語の換言前の構成要素(又は文字列)と換言後の構成要素(又は文字列)とを対にした情報である換言操作と、上記換言操作による換言前の構成要素と換言後の構成要素との差違を表す差違情報とにてなるデータの組である。近似照合処理部132は、処理制御部10から入力された差違情報と、翻訳文解析結果と、換言知識メモリ134に記憶された換言知識の換言操作及び差違情報とを照合し、所定のスコア計算方法を用いて、翻訳文解析結果の各構成要素に対する、上記処理制御部10で生成された反対の差違情報が反映された換言操作に含まれる換言前の構成要素の近似の程度を示す第2のスコアを計算し、最大の第2のスコアを有し、翻訳文解析結果に適用可能な換言操作を記述した換言知識を選択し、選択した換言知識と、翻訳文解析結果とを、目的言語換言文生成部133に出力する。第2のスコアの計算は、第1のスコアの計算方法と同様に、例えば、別途用意した単言語コーパスにおける出現確率などにより、複数の換言候補の間のさまざまな尤度を比較することによって実行することができる。目的言語換言文生成部133は公知の方法を用いて、翻訳文解析結果を換言知識の換言操作を用いて目的言語換言文に換言して出力する。ここで、公知の方法とは、例えば公知の機械翻訳装置に利用されている、形態素解析手段、変換手段、生成手段等の手段であり、原言語と目的言語が同一言語である点を除けば、目的言語換言文生成部133は公知の機械翻訳装置の機構と同等又はその一部として構成される。
【0018】本実施形態の機械翻訳装置3では、原言語換言処理部11及び言語変換処理部12の構成を介して、原言語の換言において、複数個適用可能になった換言操作の中から自動的に一つを選択する機構を設けたことにより、結果的に、複数個可能になった換言の結果の中から自動的に一つを選択している。また、原言語換言処理部11、言語変換処理部12及び目的言語換言処理部13の構成を介して、目的言語の換言において、複数個適用可能になった換言操作の中から自動的に一つを選択する機構を設けたことにより、結果的に、複数個可能になった換言の結果の中から自動的に一つを選択している。
【0019】
【実施例】以下、例文を用いて、本発明の実施形態に係る機械翻訳装置の動作について説明する。説明のために、以下、原言語が英語、目的言語が日本語であるとするが、他の実施形態において、本発明を日本語から英語への翻訳、又は別の言語間での翻訳のために用いることを制限しない。ここで、原言語文は "Could I have your name, sir?" であるとする。
【0020】処理制御部10は、原言語文 "Could I have your name, sir?" が入力されると、原言語換言処理部11に上記原言語文を入力し、原言語換言処理部11からの出力を待機する。
【0021】原言語換言処理部11は、原言語文 "Could I have your name, sir?" が入力されると、原言語解析処理部111で原言語文を形態素解析して、換言知識と照合可能な形式に変形して原言語文解析結果とする。本実施例では原言語文解析結果は表記上、以下のようなものになる。
【0022】
【表2】
――――――――――――――――――――――――――――――――――――<文頭> could I have your name <読点> sir <文末>――――――――――――――――――――――――――――――――――――
【0023】換言知識は、換言知識メモリ114に記憶された、原言語における換言操作と差違情報とを対とした情報である。以下の表にその例を示す。
【0024】
【表3】
―――――――――――――――――――――――――――――――――――― 換言操作 差違情報――――――――――――――――――――――――――――――――――――<文頭> could I → <文頭> can I 丁重さ−sir <文末> → (空) <文末> 丁重さ−――――――――――――――――――――――――――――――――――――
【0025】原言語の換言操作は、例えば、原言語における、ある単語又は句の換言前の構成要素と、換言後の構成要素とを対にした情報である。勿論、換言操作を「sir<文末>:第1要素を削除」のように操作として記述してもよい。また、差違情報の別の例として、強調及び婉曲、女性的な表現の強弱、男性的な表現の強弱などを含むことができるが、しかしこれらに制限されない。本実施例では、「丁重さ」に関する、+と−で表された増減についてのみ考察する。
【0026】近似照合処理部112は、初めの段階では翻訳可能文情報が入力されないので、上記原言語文解析結果と上記換言知識とを照合して、所定のスコア計算方法を用いて原言語文解析結果に対する原言語の換言操作の換言前の構成要素の近似の程度を示す第1のスコアを計算して、原言語文解析結果に適用可能な換言操作を記述した換言知識の内から最大の第1のスコアを有する換言知識を選択し、当該換言知識と原言語文解析結果とを原言語換言文生成部113に出力する。本実施例では上記の原言語文解析結果と換言知識2件とが出力されたものとする。
【0027】原言語換言文生成部113は、従来技術の手段により、原言語文解析結果を原言語の換言知識の換言操作を用いて原言語換言文に換言して出力する。本実施例では原言語換言文は、"Can I have your name?" となる。また、原言語換言文生成部113は、選択された換言操作の処理前後の差違を表す換言知識の差違情報を出力する。本実施例では差違情報は、「丁重さ−」が2件となる。
【0028】原言語換言処理部11は、処理の経過を履歴情報メモリ115に保存し、同じ処理が繰り返されることを避ける。
【0029】処理制御部10は、上記の原言語換言文と差違情報とが、原言語換言処理部11から出力されると、上記差異情報を、当該差違情報とは反対の換言操作の差異情報に変換して一時的に保存する。この変換は、例えば予め組み込んだ対応表を参照して行ない、本実施例では2件の「丁重さ−」をそれぞれ「丁重さ+」とする。差違情報についての説明は、後に目的言語換言処理部13の説明と関連して述べる。
【0030】処理制御部10は、言語変換処理部12に上記原言語換言文を翻訳原文として入力し、言語変換処理部12からの出力を待機する。
【0031】言語変換処理部12の動作において、まず、原言語照合処理部121は、翻訳原文 "Can I have your name?" が入力されると、翻訳原文と、言語変換知識メモリ124に記憶された言語変換知識の原言語情報とを照合して、所定のスコア計算方法を用いて翻訳原文に対する言語変換知識の原言語情報の近似の程度を示す第3のスコアを計算し、計算した第3のスコアの値で示される、言語変換処理における言語変換の根拠となる可能性が、あるしきい値より高い言語変換知識と翻訳原文とを選択し、近似照合判定部122に出力する。
【0032】言語変換知識は、言語変換知識メモリ124に記憶された、以下に示されたような、原言語情報と目的言語情報とを対とした情報である。
【0033】
【表4】
―――――――――――――――――――――――――――――――――――― 原言語情報 目的言語情報――――――――――――――――――――――――――――――――――――May I have your name ? 貴方の名前を教えて下さい。
Can I help you ? はい、どうぞ。
Can I <VP> ? <VP>てもいいですか。
――――――――――――――――――――――――――――――――――――
【0034】ここで、<VP>は動詞句を表す。本実施例では、上記3件の言語変換知識が、上記のしきい値より高い可能性があるものとして出力されたものとする。
【0035】近似照合判定部122は、翻訳原文と言語変換知識の原言語情報とを順次照合して、言語変換するか否かを判定し、言語変換する場合には当該言語変換知識と翻訳原文とを目的言語文生成部123に出力し、言語変換しない場合には翻訳原文と最も近似した、すなわち最大の第3のスコアを有する言語変換知識の原言語情報を翻訳可能文情報として処理制御部10に出力する。このとき、近似照合判定部122は、例えば同一翻訳原文に対する近似照合判定回数や、翻訳処理の経過時間などにより近似照合を徐々に緩和して言語変換するか否かを判定する。
【0036】つまり、翻訳原文 "Can I have your name?" に対して、原言語情報 May I have your name ? は、1語置換されただけの比較的近似した情報であるが、説明上の現時点では初回の近似照合判定であるため、言語変換しないと判定する。しかし、近似照合の緩和の設定によるが、例えば2回目の近似照合判定であったり翻訳処理の経過時間が1秒を超えていたりしていた場合には、当該言語変換知識で言語変換すると判定することになる。
【0037】本実施例では、上記3件の言語変換知識のうち、原言語情報 May I have yourname ? が翻訳原文と最も近似した原言語情報であるとして、翻訳可能文情報として出力する。翻訳可能文情報は例えば "May", "I", "have", "your", "name","?" という語句のリストである。
【0038】処理制御部10は、上記の翻訳可能文情報が言語変換処理部12から出力されると、原言語文 "Could I have your name, sir?" と翻訳可能文情報 "May", "I", "have", "your", "name", "?" を原言語換言処理部11に出力し、原言語換言処理部11の出力に待機する。
【0039】本実施例の以上のステップにおいて、原言語換言文に適用可能な言語変換知識が発見されなかったため、次に、原言語換言処理部11は、翻訳可能文情報を参照し、原言語文の換言を再び実行する。原言語換言処理部11は、処理の経過を保存した上記の履歴情報メモリ115に記憶された履歴情報から当該原言語文の原言語文解析結果を得て、上記の翻訳可能文情報と共に、近似照合処理部112で上記原言語の換言知識との照合を行ない、所定のスコア計算方法により、原言語文に対する換言操作の換言前の構成要素の近似の程度と、翻訳可能文情報に対する換言操作の換言後の構成要素の近似の程度とを示す第1のスコアを計算する。当該原言語文の原言語文解析結果が保存されていなければ、原言語解析処理部111で形態素解析する。
【0040】近似照合処理部112は、計算した第1のスコアの値を参照し、換言知識メモリ114に記憶された換言知識の中で、翻訳可能文情報によって言語変換処理における言語変換の根拠となる可能性が上がり、上記のしきい値を超えるものがあれば、出力する換言知識に加える。
【0041】それは、例えば以下のような換言知識であるが、本実施例では換言知識メモリ114に予め存在しなかったものとする。
【0042】
【表5】
―――――――――――――――――――――――――――――――――――― 換言操作 差違情報――――――――――――――――――――――――――――――――――――<文頭> could I → <文頭> may I 丁重さ−――――――――――――――――――――――――――――――――――――
【0043】また、原言語換言処理部11は、当該原言語文に対する原言語換言文 "Can Ihave your name?" を原言語解析処理部111で形態素解析し、原言語文解析結果を得て、上記の翻訳可能文情報と共に、近似照合処理部112で上記換言知識との照合を行なう。当該原言語換言文の原言語文解析結果に相当するものが、例えば原言語換言文生成部113の処理経過として履歴情報メモリ115に保存されていれば、それを利用して形態素解析処理を省略する。以下こうした補足説明は省略する。
【0044】
【表6】
―――――――――――――――――――――――――――――――――――― 換言操作 差違情報――――――――――――――――――――――――――――――――――――<文頭> can I → <文頭> may I (空)
――――――――――――――――――――――――――――――――――――
【0045】近似照合処理部112は、上記と同様に、上記原言語文解析結果と上記換言知識とを照合して、所定のスコア計算方法を用いて原言語文解析結果に対する原言語の換言操作の換言前の構成要素の近似の程度を示す第1のスコアを計算して、原言語文解析結果に適用可能な換言操作を記述した換言知識の内から最大の第1のスコアを有する換言知識を選択し、当該換言知識と原言語文解析結果とを原言語換言文生成部113に出力する。本実施例では上記原言語文解析結果と上記の換言知識1件とが出力されたものとする。
【0046】原言語換言文生成部113は、上記と同様に、原言語解析結果を原言語換言文に換言して出力する。本実施例では原言語換言文は、"May I have your name?"となる。また、原言語換言文生成部113は、選択された換言操作の処理前後の差違を表す換言知識の差違情報を、当該原言語文の以前の換言の換言知識の差違情報に加えて、出力する。表5の換言知識に差違情報は存在しないので、本実施例において差違情報は、「丁重さ−」が2件のままである。
【0047】処理制御部10は、言語変換処理部12に上記原言語換言文を翻訳原文として出力し、言語変換処理部12からの出力を待機する。
【0048】言語変換処理部12は、翻訳原文 "May I have your name?" を入力すると、上記と同様に、原言語照合処理部121で翻訳原文と上記言語変換知識の原言語情報とを照合して、所定のスコア計算方法を用いて翻訳原文に対する言語変換知識の原言語情報の近似の程度を示す第3のスコアを計算し、計算した第3のスコアの値で示される言語変換処理における言語変換の根拠となる可能性が、あるしきい値より高い言語変換知識と翻訳原文とを、近似照合判定部122に出力する。
【0049】言語変換知識は、原言語情報と目的言語情報とを対とした情報である。
【0050】
【表7】
―――――――――――――――――――――――――――――――――――― 原言語情報 目的言語情報――――――――――――――――――――――――――――――――――――May I have your name ? 貴方の名前を教えて下さい。
May I help you ? はい、どうぞ。
May I <VP> ? <VP>てもいいですか。
――――――――――――――――――――――――――――――――――――
【0051】本実施例では、上記3件の言語変換知識が、上記のしきい値より高い可能性があるものとして出力されたものとする。
【0052】近似照合判定部122は、上記と同様に、翻訳原文と言語変換知識の原言語情報とを順次照合して、言語変換するか否かを判定し、言語変換する場合には当該言語変換知識と翻訳原文とを目的言語文生成部123に出力し、言語変換しない場合には翻訳原文と最も近似した、すなわち最大の第3のスコアを有する言語変換知識の原言語情報を翻訳可能文情報として出力する。
【0053】本実施例では、以下の言語変換知識により言語変換すると判定する。
【0054】
【表8】
―――――――――――――――――――――――――――――――――――― 原言語情報 目的言語情報――――――――――――――――――――――――――――――――――――May I have your name ? 貴方の名前を教えて下さい。
――――――――――――――――――――――――――――――――――――
【0055】近似照合判定部122は、翻訳原文 "May I have your name?" と上記の言語変換知識1件とを目的言語文生成部123に出力する。
【0056】目的言語文生成部123は、従来技術の手段により、翻訳原文を言語変換知識を用いて目的言語翻訳文に言語変換して出力する。本実施例では目的言語翻訳文は、"貴方の名前を教えて下さい。" となる。
【0057】次に、目的言語換言処理部13で実行される、目的言語における換言処理について説明する。本実施例では、原言語における換言処理、すなわち、原言語換言処理部11及び言語変換処理部12で実行される処理について説明されたときと同一の原言語文で説明し、原言語における換言処理と重なる部分は説明を省略して、続きとして説明する。
【0058】処理制御部10は、上記の原言語換言文と差違情報とが、原言語換言処理部11から出力されると、入力される差違情報を、当該差異情報と反対の換言操作の差違情報に変換して、一時的に保存する。この変換は、例えば予め組み込まれた対応表を参照して行ない、本実施例では「丁重さ−」を「丁重さ+」とする。本実施例では、2回目の換言では差違情報が加わらなかった。
【0059】処理制御部10は、2件の上記差違情報「丁重さ+」と目的言語翻訳文 "貴方の名前を教えて下さい。" とを目的言語換言処理部13に出力し、目的言語換言処理部13からの出力を待機する。
【0060】目的言語換言処理部13は、目的言語翻訳文 "貴方の名前を教えて下さい。"を入力すると、翻訳文解析処理部131で目的言語翻訳文を形態素解析して、換言知識と照合可能な形式に変形して翻訳文解析結果とする。本実施例では翻訳文解析結果は表記上、以下のようなものになる。
【0061】
【表9】
――――――――――――――――――――――――――――――――――――<文頭> 貴方 の 名前 を 教える て下さい <文末>――――――――――――――――――――――――――――――――――――
【0062】換言知識は、換言知識メモリ134に記憶された、目的言語における換言操作と差違情報とを対とした情報である。換言操作は、例えば目的言語の換言前の構成要素と換言後の構成要素とを対にした情報である。
【0063】
【表10】
―――――――――――――――――――――――――――――――――――― 換言操作 差違情報――――――――――――――――――――――――――――――――――――貴方 の → お客様 の 丁重さ+貴方 の → そちら の 丁重さ−教える て下さい <文末> → 頂戴できますか <文末> 丁重さ+て下さい <文末> → て頂けますか <文末> 丁重さ+教える て下さい <文末> → 告知すること <文末> 高圧的+――――――――――――――――――――――――――――――――――――
【0064】近似照合処理部132は、上記翻訳文解析結果と上記換言知識と処理制御部10から入力した差違情報とを照合し、所定のスコア計算方法を用いて、上記翻訳文解析結果及び上記差違情報に対する目的言語の換言知識の第2のスコアを計算する。近似照合処理部132は、計算した第2のスコアに基づいて、翻訳文解析結果に適用可能な換言操作と、処理制御部10から入力した差違情報と反対の差違情報とを記述した換言知識を選択し、当該換言知識と翻訳文解析結果とを目的言語換言文生成部133に出力する。本実施例では、上記の翻訳文解析結果と、表に図示された換言知識5件のうち差違情報に「丁重さ+」を含む3件とが出力されたものとする。
【0065】目的言語換言文生成部133は、予め記憶された目的言語の文法知識を参照して、実際に適用する差違情報を決定し、従来技術の手段により、翻訳文解析結果を目的言語の換言知識の換言操作を用いて目的言語換言文に換言して出力する。本実施例では目的言語換言文は、"お客様の名前を頂戴できますか" となる。
【0066】処理制御部10は、上記の目的言語換言文が目的言語換言処理部13から出力されると、それを目的言語文として音声合成装置4に出力し、次の原言語文の入力に待機する。ここで、履歴情報メモリ115に記憶された1つの原言語文に関連する情報は、各原言語文の入力ごとに更新されても、又は更新されずに蓄積されてもよい。
【0067】以上の実施形態において、原言語換言処理部11が目的言語換言処理部13に原言語文と換言された原言語文との差違情報を引き渡し、目的言語換言処理部13が上記差違情報に基づいて自動的に最も妥当な換言された目的言語文を選択して出力する構成のみを備えるように構成してもよい。
【0068】以上の実施形態において、言語変換処理部12が原言語換言処理部11に翻訳可能文情報をフィードバックし、原言語換言処理部11はそれに基づいて自動的に元も妥当な換言された原言語文を出力する構成のみを備えるように構成してもよい。
【0069】以上の実施形態においては、形態素解析して文をその構成要素に変換しているが、形態素解析に代えて構文解析を用いてもよい。
【0070】
【発明の効果】以上詳述したように本発明に係る機械翻訳装置によれば、ある原言語文又は目的言語に翻訳された原言語文に対して複数個存在する可能な換言の中から自動的に1つを選択する両言語の換言機構を、言語変換処理部の両側の原言語換言処理部及び目的言語換言処理部とに設け、原言語換言処理部11は目的言語換言処理部13に原言語文と換言された原言語文との差違情報を引き渡し、目的言語換言処理部13が上記差違情報に基づいて自動的に最も妥当な換言された目的言語文を選択して出力し、又は/及び、言語変換処理部12は原言語換言処理部11に翻訳可能文情報をフィードバックし、原言語換言処理部11はそれに基づて自動的に元も妥当な換言された原言語文を出力する。
【0071】従って、原言語での換言における差違情報を目的言語での換言に使用しているので、目的言語において換言する語彙を自動選択するときの精度を上げることができる。そのため、機械翻訳装置の操作者に原言語、目的言語の知識を要求せずに済むため、機械翻訳装置の用途が広がる。例えば、図1のように音声認識装置や音声合成装置と組み合わせて音声翻訳(通訳)装置とし、一般の人が海外旅行に持って出るということが可能になる。また、翻訳の実行時に適当な訳語を自動選択し、換言精度を上げることができるため、機械翻訳装置の開発に必要な事前知識を削減することができ、それによって、機械翻訳装置の開発に必要な資源を低減できる。これにより、例えば日英間以外の言語間での機械翻訳装置の開発が容易になる。さらに、日英間の翻訳装置でも、現在は専門用語辞書の入れ替えといったごく一部の変更で幾つかの分野や用途に対応しているのに対し、分野や用途に特化した機械翻訳装置の開発が容易になる。
【図面の簡単な説明】
【図1】 本発明の実施形態に係る機械翻訳装置3を備えた音声翻訳合成システムの構成を示すブロック図である。
【図2】 図1の機械翻訳装置3の詳細構成を示すブロック図である。
【図3】 図2の原言語換言処理部11の詳細構成を示すブロック図である。
【図4】 図2の言語変換処理部12の詳細構成を示すブロック図である。
【図5】 図2の目的言語換言処理部13の詳細構成を示すブロック図である。
【符号の説明】
1…マイクロホン、
2…音声認識装置、
3…機械翻訳装置、
4…音声合成装置、
5…スピーカ、
10…処理制御部、
11…原言語換言処理部、
12…言語変換処理部、
13…目的言語換言処理部、
111…原言語解析処理部、
112,132…近似照合処理部、
113…原言語換言文生成部、
114,134…換言知識メモリ、
115…履歴情報メモリ、
121…原言語照合処理部、
122…近似照合判定部、
123…目的言語文生成部、
124…言語変換知識メモリ、
131…翻訳文解析処理部、
133…目的言語換言文生成部。

【特許請求の範囲】
【請求項1】 原言語文を目的言語文に翻訳する機械翻訳装置において、上記原言語文を解析して上記原言語文の単語又は句である原言語文の構成要素を抽出し、原言語の換言操作の換言前後の構成要素の対にてなる原言語の換言操作を参照して、上記原言語文の構成要素に対する、上記原言語の換言操作の換言前の構成要素の近似の程度を示す第1のスコアを計算し、最大の第1のスコアを有する上記原言語の換言操作の換言前の構成要素を含む上記原言語の換言操作を選択し、選択された上記原言語の換言操作を用いて上記原言語文を換言後の原言語文に換言するとともに、選択された上記原言語の換言操作の処理の前後の差違を表す差違情報を生成する原言語換言処理部と、原言語の構成要素と対応する目的言語の構成要素との対にてなる言語変換知識を参照して、上記換言後の原言語文を目的言語文に言語変換する言語変換処理部と、上記目的言語文を解析して上記目的言語文の単語又は句である目的言語文の構成要素を抽出し、上記差違情報に基づいて、目的言語の換言操作の換言前後の構成要素の対にてなる目的言語の換言操作を参照して、上記目的言語文の構成要素に対する、上記差違情報と反対の換言操作を行う上記目的言語の換言操作の換言前の構成要素の近似の程度を示す第2のスコアを計算し、最大の第2のスコアを有する上記目的言語の換言操作の換言前の構成要素を含む上記目的言語の換言操作を選択し、選択された上記目的言語の換言操作を用いて上記目的言語文を換言後の目的言語文に換言する目的言語換言処理部とを備えたことを特徴とする機械翻訳装置。
【請求項2】 原言語文を目的言語文に翻訳する機械翻訳装置において、上記原言語文を解析して上記原言語文の単語又は句である原言語文の構成要素を抽出し、原言語の換言操作の換言前後の構成要素の対にてなる原言語の換言操作を参照して、上記原言語文の構成要素に対する、上記原言語の換言操作の換言前の構成要素の近似の程度を示す第1のスコアを計算し、最大の第1のスコアを有する上記原言語の換言操作の換言前の構成要素を含む上記原言語の換言操作を選択し、選択された上記原言語の換言操作を用いて上記原言語文を換言後の原言語文に換言する原言語換言処理部と、原言語の構成要素と対応する目的言語の構成要素との対にてなる言語変換知識を参照して、上記換言後の原言語文を目的言語文に言語変換する言語変換処理部と、上記目的言語文を解析して上記目的言語文の単語又は句である目的言語文の構成要素を抽出し、上記差違情報に基づいて、目的言語の換言操作の換言前後の構成要素の対にてなる所定の目的言語の換言操作を参照して、上記目的言語文の構成要素に対する、上記目的言語の換言操作の換言前の構成要素の近似の程度を示す第2のスコアを計算し、最大の第2のスコアを有する上記目的言語の換言操作の換言前の構成要素を含む上記目的言語の換言操作を選択し、選択された上記目的言語の換言操作を用いて上記目的言語文を換言後の目的言語文に換言する目的言語換言処理部とを備え、上記言語変換処理部は、上記言語変換知識の原言語の構成要素を参照して、上記換言後の原言語文に対する、上記言語変換知識の原言語の構成要素の近似の程度を示す第3のスコアを計算し、計算した第3のスコアの値が所定のしきい値より高いときは、最大の第3のスコアを有する上記言語変換知識の原言語の構成要素を含む上記言語変換知識を選択し、選択された上記言語変換知識を用いて上記換言後の原言語文を上記目的言語文に言語変換する一方、計算した第3のスコアの値が上記しきい値以下のときは、最大の第3のスコアを有する上記言語変換知識の原言語の構成要素を翻訳可能文情報として選択して上記原言語換言処理部に出力し、上記原言語換言処理部は、上記原言語文の構成要素に対する上記原言語の換言操作の換言前の構成要素の近似の程度と、上記翻訳可能文情報に対する上記原言語の換言操作の換言後の構成要素の近似の程度とを示す第1のスコアを計算し、最大の第1のスコアを有する原言語の換言操作の換言前後の構成要素を含む上記原言語の換言操作を選択し、選択された上記原言語の換言操作を用いて上記原言語文を換言後の原言語文に換言することを特徴とする機械翻訳装置。
【請求項3】 上記言語変換処理部は、上記言語変換知識の原言語の構成要素を参照して、上記換言後の原言語文に対する、上記言語変換知識の原言語の構成要素の近似の程度を示す第3のスコアを計算し、計算した第3のスコアの値が所定のしきい値より高いときは、最大の第3のスコアを有する上記言語変換知識の原言語の構成要素を含む上記言語変換知識を選択し、選択された上記言語変換知識を用いて上記換言後の原言語文を上記目的言語文に言語変換する一方、計算した第3のスコアの値が上記しきい値以下のときは、最大の第3のスコアを有する上記言語変換知識の原言語の構成要素を翻訳可能文情報として選択して上記原言語換言処理部に出力し、上記原言語換言処理部は、上記原言語文の構成要素に対する上記原言語の換言操作の換言前の構成要素の近似の程度と、上記翻訳可能文情報に対する上記原言語の換言操作の換言後の構成要素の近似の程度とを示す第1のスコアを計算し、最大の第1のスコアを有する上記原言語の換言操作の換言前後の構成要素を含む原言語の換言操作を選択し、選択された上記原言語の換言操作を用いて上記原言語文を上記換言後の原言語文に換言するとともに、選択された上記原言語の換言操作の処理の前後の差違を表す差違情報を生成することを特徴とする請求項1記載の機械翻訳装置。

【図1】
image rotate


【図2】
image rotate


【図3】
image rotate


【図4】
image rotate


【図5】
image rotate


【特許番号】特許第3403715号(P3403715)
【登録日】平成15年2月28日(2003.2.28)
【発行日】平成15年5月6日(2003.5.6)
【国際特許分類】
【出願番号】特願2001−84925(P2001−84925)
【出願日】平成13年3月23日(2001.3.23)
【公開番号】特開2002−288168(P2002−288168A)
【公開日】平成14年10月4日(2002.10.4)
【審査請求日】平成14年12月3日(2002.12.3)
【出願人】(393031586)株式会社国際電気通信基礎技術研究所 (905)
【参考文献】
【文献】佐藤理史,論文表題を言い換える,情報処理学会論文誌,日本,1999年 7月15日,Vol.40,No.7,p.2937−p.2945
【文献】山本和英・白井諭・坂本仁・張玉潔,SANDGLASS:両言語換言機構を基軸とする音声翻訳,言語処理学会第7回年次大会発表論文集,日本,2001年 3月27日,p.221−p.224,「1 動機と提案の概略」及び「参考文献」の欄