説明

機械翻訳装置及び機械翻訳プログラム

【課題】用例ベース方式による中国語の入力語の翻訳精度を向上させる。
【解決手段】差分文字列検索部5が、翻訳対象の差分文字列を前後方向にN文字拡張した拡張パターン及び類似用例の差分文字列を前後方向にN文字拡張した拡張パターンを作成し、文字数を順次短くしながら翻訳対象の拡張パターン及び類似用例の拡張パターンの日本語訳を辞書データベース6bから検索する。翻訳対象の拡張パターンの日本語訳と類似用例の拡張パターンの日本語訳の双方の検索に成功した場合、組立部8が、類似用例の日本語訳を構成する文字列中の拡張パターンに対応する部分を翻訳対象の拡張パターンの日本語訳に置換した文字列を出力する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、用例ベース方式により原言語の入力語を目的言語に翻訳する機械翻訳装置及び機械翻訳プログラムに関する。
【背景技術】
【0002】
従来より、用例ベース方式により原言語の入力語を目的言語に翻訳する機械翻訳装置が知られている。この機械翻訳装置は、始めに、入力された原言語の入力語に類似する原言語の用例を類似用例として検索し、原言語の入力語と類似用例の差分文字列を抽出する。そして機械翻訳装置は、入力語の差分文字列の目的言語訳を辞書検索し、類似用例の目的言語訳中の差分文字列に対応する部分を入力語の差分文字列の目的言語訳に置換することにより、原言語の入力語を目的言語に翻訳する。
【先行技術文献】
【非特許文献】
【0003】
【非特許文献1】Nagao M. (1984). "A Framework of a Mechanical Translation between Japanese and English by Analogy Principle", Artifical and Human Intelligence (A. Elithorn and R.Banerji, editors), Elsevir Science Publishers. B. V., p.173-180.
【発明の概要】
【発明が解決しようとする課題】
【0004】
英語や日本語は、スペースの位置や文字種(例えば名詞と助詞等)の違いによって単語の切れ目を判断することが容易である。これに対して中国語は、漢字が連続的に並んでいる構造となっているために英語や日本語と比較して単語の切れ目を判断することが難しい。このため従来の機械翻訳装置により中国語の入力語を翻訳した場合、差分文字列が単語の一部分になる、換言すれば、分断された単語が差分文字列として抽出されることにより、入力語の差分文字列の目的言語訳検索に失敗したり、その後の置換処理に失敗したりする等の理由で、翻訳精度が低下することがある。具体的には、中国語の入力語が「水煮海(A)」(本明細書中において(A)は以下の外1に示す文字を表す)(日本語訳:アナゴの四川風ラー油煮込),その類似用例が「水煮活(A)」(日本語訳:ウナギの四川風ラー油煮込)である場合、入力語の差分文字列が「海(A)」,類似用例の差分文字列が「活(A)」となれば、その日本語訳「アナゴ」,「ウナギ」が検索され、その後の置換処理は正確に行われる。しかしながら実際には入力語と類似用例との間では文字列「水煮」,「(A)」が共通しているので、入力語の差分文字列は「海」,類似用例の差分文字列は「活」となり、適切な日本語訳が検索されず、その後の置換処理が正確に行われなくなる。
【外1】
【0005】

【0006】
本発明は、上記課題を解決するためになされたものであり、その目的は、用例ベース方式による中国語の入力語の翻訳精度を向上させることが可能な機械翻訳装置及び機械翻訳プログラムを提供することにある。
【課題を解決するための手段】
【0007】
開示の機械翻訳装置及び機械翻訳プログラムは、入力語及び類似用例の差分文字列を前後方向に所定文字数拡張した拡張パターンを生成し、拡張パターンの文字数を順次短くしながら入力語及び類似用例の拡張パターンの目的言語訳を検索し、目的言語訳の検索に成功した入力語及び類似用例の拡張パターンを差分文字列として抽出する。
【発明の効果】
【0008】
開示の機械翻訳装置及び機械翻訳プログラムによれば、用例ベース方式による中国語の入力語の翻訳精度を向上させることができる。
【図面の簡単な説明】
【0009】
【図1】本発明の実施形態となる機械翻訳装置の構成を示すブロック図である。
【図2】図1に示す差分文字列検索部の内部構成を示すブロック図である。
【図3】本発明の実施形態となる機械翻訳処理の流れを示すフローチャート図である。
【図4】図3に示す機械翻訳処理の続きを示すフローチャート図である。
【図5】図4に示す機械翻訳処理の続きを示すフローチャート図である。
【図6】翻訳対象と類似用例の一例を示す図である。
【図7】拡張パターンの一例を示す図である。
【図8】拡張パターンテーブルの一例を示す図である。
【図9】拡張パターンの日本語訳検索の一例を示す図である。
【図10】類似用例の日本語訳の一例を示す図である。
【図11】図3に示すステップS6の処理の一例を示す図である。
【図12】図4に示すステップS15の処理の一例を示す図である。
【図13】図4に示すステップS14の処理の一例を示す図である。
【図14】図5に示すステップS22の処理の一例を示す図である。
【図15】図5に示すステップS21の処理の一例を示す図である。
【発明を実施するための形態】
【0010】
以下、図面を参照して、本発明の実施形態となる機械翻訳装置の構成及びその翻訳動作について説明する。なお本実施形態では、機械翻訳装置1は中国語の入力語を日本語に翻訳するものであるが、目的言語は日本語に限定されることはなく、英語等の日本語以外の言語であってもよい。また同様に本実施形態では、入力語が中国語に限定されることはなく、中国語以外の言語であってもよい。また本発明の実施形態となる機械翻訳装置は、単体の装置として利用することも可能であるし、その動作を規定したコンピュータプログラムをインストールすることによりパーソナルコンピュータ,携帯電話機,情報端末装置等の情報処理装置上で動作させることも可能である。
〔機械翻訳装置の構成〕
始めに、図1,図2を参照して、本発明の実施形態となる機械翻訳装置の構成について説明する。
【0011】
本発明の実施形態となる機械翻訳装置1は、用例ベース方式により中国語の入力語を日本語に翻訳する装置であり、図1に示すように、入力部2,類似用例検索部3,差分文字列生成部4,差分文字列検索部5,対訳データベース6,検索処理部7,組立部8,及び出力部9を有する。差分文字列検索部5は、図2に示すように、拡張パターン作成部11,拡張パターンテーブル記憶部12,拡張パターン検索部13,及び最良結果判定部14を有する。
【0012】
入力部2は、キーボード,タッチパネル,マイクロフォン等の入力装置である。入力部2は、ユーザが操作入力又は発話入力した入力語のデータを類似用例検索部3に出力する。類似用例検索部3,差分文字列生成部4,差分文字列検索部5(拡張パターン作成部11,拡張パターン検索部13,最良結果判定部14),検索処理部7,及び組立部8それぞれの機能は、機械翻訳装置1内の演算処理装置(図示せず)が予め内部に格納されている又は電気通信回線を介して取得したコンピュータプログラムを実行することにより実現される。各部の機能の詳細については後述の翻訳動作において説明する。
【0013】
対訳データベース6は、用例データベース6aと辞書データベース6bを含む。用例データベース6aは、中国語の用例(フレーズや文等)とその日本語訳のデータを記憶する。辞書データベース6bは、中国語の語句とその日本語訳のデータを関連付けして記憶する。出力部9は、表示出力装置,音声出力装置等の出力装置である。出力部9は、組立部8により生成された出力語を出力する。拡張パターンテーブル記憶部12は、RAM(Random Access Memory)等の揮発性の記憶装置である。拡張パターンテーブル記憶部12は、拡張パターン作成部11により作成された拡張パターン(詳しくは後述)が記録された拡張パターンテーブル(詳しくは後述)を記憶する。
〔機械翻訳処理〕
このような構成を有する機械翻訳装置1は、以下に示す機械翻訳処理を実行することにより用例ベース方式により中国語の入力語を日本語に翻訳する。以下、図3乃至図5に示すフローチャートを参照して機械翻訳処理を実行する際の機械翻訳装置1の動作の流れについて説明する。図3に示すフローチャートは、中国語の入力語が入力部2に入力されたタイミングで開始となり、翻訳処理はステップS1の処理に進む。
【0014】
ステップS1の処理では、類似用例検索部3が、中国語の入力語(翻訳対象)に最も類似する中国語の用例(類似用例)とその日本語訳を用例データベース6aから検索する。具体的には、翻訳対象が「水煮海(A)」である場合、類似用例検索部3は用例データベース6aから図6に示すようにその類似用例「水煮活(A)」(日本語訳「ウナギの四川風ラー油煮込)を検索する。これによりステップS1の処理は完了し、翻訳処理はステップS2の処理に進む。
【0015】
ステップS2の処理では、差分文字列生成部4が、翻訳対象とステップS1の処理により検索された類似用例の互いに異なる文字列部分を差分文字列として生成する。具体的には、図6に示す例の場合、翻訳対象と類似用例との間で文字列「水煮」,「(A)」は共通であるので、差分文字列生成部4は翻訳対象及び類似用例の差分文字列をそれぞれ「海」,「活」として生成する。これにより、ステップS2の処理は完了し、翻訳処理はステップS3の処理に進む。
【0016】
ステップS3の処理では、拡張パターン作成部11が、翻訳対象の差分文字列と類似用例の差分文字列を前後方向にN(=0〜nの整数)文字拡張した文字列(拡張パターン)のペアを作成する。具体的には、翻訳対象の差分文字列と類似用例の差分文字列がそれぞれ図6に示す「海」,「活」であり、且つ、拡張文字数n=2である場合、拡張パターン作成部11は、図7に示すように、0(N=0)文字拡張した拡張パターンのペアとして(海,活)、1(N=1)文字拡張したパターンのペアとして(煮海,煮活),(海(B),活(B))(本明細書中において(B)は以下の外2に示す文字を表す)、2(N=2)文字拡張したパターンのペアとして(水煮海,水煮活),(煮海(B),煮活(B)),(海(A),活(A))を作成する。なお拡張する文字数Nは予め設定された固定値であるとするが、ユーザが任意に設定できるようにしてもよい。そして拡張パターン作成部11は、図8に示すような作成された拡張パターンのペアを記述した拡張パターンテーブルを作成し、作成した拡張パターンテーブルを拡張パターンテーブル記憶部12内に格納する。なお詳しくは後述するが、図8に示す拡張パターンテーブルには、拡張パターンに一致する辞書検索結果を記述するための空欄が拡張パターン毎に設けられている。これにより、ステップS3の処理は完了し、翻訳処理はステップS4の処理に進む。
【外2】
【0017】

【0018】
ステップS4の処理では、拡張パターン検索部13が、拡張パターンテーブル記憶部12内に格納されている拡張パターンテーブルを参照して、拡張パターンのペアのデータを読み出し、翻訳対象及び類似用例の拡張パターンの日本語訳を辞書データベース6bから検索し、図8に示す拡張パターンテーブルに検索結果を記録する。なお拡張パターン検索部13は、文字数が多い順に拡張パターンの辞書検索を実行し、各拡張パターンに対して以後の処理を実行する。これは差分文字列が辞書に登録されている場合であっても、差分文字列を含む文字数がより多い文字列が辞書に登録されている場合には、文字数がより多い文字列の方が意味が限定され、より正確な翻訳結果になることが期待できるためである。また詳しくは後述するが、拡張パターン検索部13は、このステップS4の処理において、拡張パターンが複数の単語により構成されているか否かを判別するためのあいまい検索処理と完全一致検索処理を実行する。これにより、ステップS4の処理は完了し、翻訳処理はステップS5の処理に進む。
【0019】
ステップS5の処理では、最良結果判定部14が、ステップS4の処理により翻訳対象の拡張パターンと類似用例の拡張パターンの両方について日本語訳が辞書検索されたか否かを判別することにより、単語の切れ目が正しいか否か(拡張パターンが分断された単語を含むか否か)を判定する。判別の結果、少なくとも一方の拡張パターンの辞書検索に失敗した場合、最良結果判定部14は、単語の切れ目が正しくないと判断し、翻訳処理をステップS11の処理に進める。一方、両方の拡張パターンの辞書検索に成功した場合には、最良結果判定部14は、単語の切れ目が正しいと判断し、翻訳処理をステップS6の処理に進める。
【0020】
ステップS6の処理では、組立部8が、翻訳対象の拡張パターンと類似用例の拡張パターンの両方について日本語訳が辞書検索されたペアについて、ステップS1の処理により検索された類似用例の日本語訳中の拡張パターンに対応する部分を翻訳対象の拡張パターンの日本語訳に置換した文字列を出力語として生成し、出力部9が、組立部8により生成された出力語を出力する。具体的には、図8,図9に示すように拡張パターンのペア(海(A),活(A))について日本語訳(アナゴ,ウナギ)が辞書検索された場合、組立部8は図10に示す類似用例の日本語訳「ウナギの四川風ラー油煮込」中の拡張パターンの日本語訳に対応する部分「ウナギ」を図11に示すように翻訳対象の拡張パターンの日本語訳「アナゴ」に置換した文字列「アナゴの四川風ラー油煮込」を出力語として生成する。これにより、ステップS6の処理は完了し、一連の翻訳処理は終了する。
【0021】
ステップS11の処理では、最良結果判定部14が、ステップS4の処理において翻訳対象の拡張パターンの日本語訳検索に成功したか否かを判別する。判別の結果、翻訳対象の拡張パターンの日本語訳検索に成功している場合、最良結果判定部14は翻訳処理をステップS14の処理に進める。一方、翻訳対象の拡張パターンの日本語訳検索に成功していない場合には、最良結果判定部14は翻訳処理をステップS12の処理に進める。
【0022】
ステップS12の処理では、最良結果判定部14が、ステップS4の処理において類似用例の拡張パターンの日本語訳検索に成功したか否かを判別する。判別の結果、類似用例の拡張パターンの日本語訳検索に成功している場合、最良結果判定部14は翻訳処理をステップS21の処理に進める。一方、類似用例の拡張パターンの日本語訳検索に成功していない場合には、最良結果判定部14は翻訳処理をステップS13の処理に進める。
【0023】
ステップS13の処理では、最良結果判定部14が、類似用例の日本語訳を出力するように出力部9を制御する。具体的には、図6に示す例では、類似用例「水煮活(A)」の日本語訳は「ウナギの四川風ラー油煮込」であるので、最良結果判定部14は翻訳対象「水煮海(A)」の日本語訳を「ウナギの四川風ラー油煮込」として出力するように出力部9を制御する。これにより、ステップS13の処理は完了し、一連の翻訳処理は終了する。
【0024】
ステップS14の処理では、最良結果判定部14が、類似用例の拡張パターンの日本語訳を所定の一致率(ステップS14の処理における単語数が2個の場合は一致率50%,単語数が3個の場合は33%)であいまい検索した後、日本語訳が検索された文字列部分を除く文字列の日本語訳を完全一致検索するすることにより、類似用例の拡張パターンが複数の単語により構成されているか否かを判別する。具体的には、図13(a)に示すように翻訳対象及び類似用例が「台式(C)茄子」(本明細書中において(C)は以下の外3に示す文字を表す)及び「台式(C)河(B)」であり、図13(b)に示すように翻訳対象の拡張パターン「(C)茄子」の日本語訳「焼きなす」の検索に成功し、類似用例の拡張パターン「(C)河(B)」の日本語訳検索に失敗した場合であって、ステップS15の処理において図13(c)に示すように文字列「河(B)」の日本語訳が「ウナギ」と検索された場合、拡張パターン検索部13は図13(d)に示すように残りの文字列「(C)」の日本語訳「焼き」を完全一致検索する。判別の結果、類似用例の拡張パターンが複数単語により構成されている場合、最良結果判定部14は翻訳処理をステップS16の処理に進める。一方、類似用例の拡張パターンが一単語により構成されている場合には、最良結果判定部14は翻訳処理をステップS15の処理に進める。
【外3】
【0025】

【0026】
ステップS15の処理では、組立部8が、翻訳対象の文字列中の拡張パターンに対応する部分を翻訳対象の拡張パターンの日本語訳に置換した文字列を出力語として生成し、出力部9が、組立部8により生成された出力語を出力する。具体的には、図12(a)に示すように翻訳対象及び類似用例が「台式(C)茄子」及び「台式(C)河(B)」であり、図12(b)に示すように翻訳対象の拡張パターン「茄子」の日本語訳「なす」の検索に成功し、類似用例の拡張パターン「河(B)」の日本語訳検索に失敗した場合、組立部8は、図12(c)に示すように、翻訳対象「台式(C)茄子」中の拡張パターン「茄子」に対応する部分をその日本語訳に置き換えた文字列「台式(C)なす」を出力語として生成する。これにより、ステップS15の処理は完了し、一連の翻訳処理は終了する。
【0027】
ステップS16の処理では、組立部8が、類似用例の日本語訳のステップS14の処理によりあいまい検索された文字列と完全一致検索された文字列に対応する部分をそれぞれ空白,翻訳対象の拡張パターンの日本語訳に置換した文字列を出力語として生成し、出力部9が、組立部8により生成された出力語を出力する。具体的には、図13(e)に示すように類似用例「台式(C)河(B)」の日本語訳が「台湾式焼きウナギ」である場合、組立部8は日本語訳中のあいまい検索された文字列に対応する部分「ウナギ」をスペース、完全一致検索された文字列に対応する部分「焼き」を翻訳対象の拡張パターン「(C)茄子」の日本語訳「焼きなす」に置換した文字列「台湾式焼きなす_」を出力語として生成する。これにより、ステップS16の処理は完了し、一連の翻訳処理は終了する。
【0028】
ステップS21の処理では、最良結果判定部14が、翻訳対象の拡張パターンの日本語訳を所定の一致率(ステップS21の処理における単語数が2個の場合は一致率50%,単語数が3個の場合は33%)であいまい検索した後、ステップS23の処理により日本語訳が検索された文字列部分を除く翻訳対象の拡張パターンの文字列の日本語訳を完全一致検索することにより、翻訳対象の拡張パターンが複数の単語により構成されているか否かを判別する。具体的には、図15(a)に示すように翻訳対象及び類似用例が「台式(C)茄子」及び「台式(C)河(B)」であり、図15(b)に示すように翻訳対象の拡張パターン「(C)茄子」の日本語訳の検索に失敗し、類似用例の拡張パターン「(C)河(B)」の日本語訳「焼きウナギ」の検索に成功した場合であって、ステップS23の処理において図14(c)に示すように文字列「茄子」の日本語訳が「なす」と検索された場合、拡張パターン検索部13は図15(d)に示すように残りの文字列「(C)」の日本語訳「焼き」を完全一致検索する。判別の結果、翻訳対象の拡張パターンが複数単語により構成されている場合、最良結果判定部14は翻訳処理をステップS23の処理に進める。一方、翻訳対象の拡張パターンが一単語により構成されている場合には、最良結果判定部14は翻訳処理をステップS22の処理に進める。
【0029】
ステップS22の処理では、組立部8が、類似用例の日本語訳中の拡張パターンの日本語訳に対応する部分を翻訳対象の拡張パターンに置換した文字列を出力語として生成し、出力部9が、組立部8により生成された出力語を出力する。具体的には、図14(a)に示すように翻訳対象及び類似用例が「台式(C)茄子」及び「台式(C)河(B)」であり、図14(b)に示すように翻訳対象の拡張パターン「茄子」の日本語訳の検索に失敗し、類似用例の拡張パターン「河(B)」の日本語訳「ウナギ」の検索に成功した場合、組立部8は、類似用例の日本語訳「台湾式焼きウナギ」の拡張パターンの日本語訳に対応する部分「ウナギ」を翻訳対象の拡張パターン「茄子」に置き換えた文字列「台湾式焼き茄子」を出力語として生成する。これにより、ステップS22の処理は完了し、一連の翻訳処理は終了する。
【0030】
ステップS23の処理では、組立部8が、類似用例の日本語訳の拡張パターンに対応する部分をあいまい検索された日本語訳と完全一致検索された日本語訳に置換した文字列を出力語として生成し、出力部9が、組立部8により生成された出力語を出力する。具体的には、図15(e)に示すように類似用例「台式(C)河(B)」の日本語訳が「台湾式焼きウナギ」である場合、組立部8は類似用例の日本語訳中の拡張パターンに対応する部分「焼きウナギ」をあいまい検索された日本語訳「なす」と完全一致検索された日本語訳「焼き」に置換した文字列「台湾式焼きなす」を出力語として生成する。これにより、ステップS23の処理は完了し、一連の翻訳処理は終了する。
【0031】
以上の説明から明らかなように本発明の実施形態となる翻訳処理によれば、差分文字列検索部5が、翻訳対象の差分文字列を前後方向にN文字拡張した拡張パターン及び類似用例の差分文字列を前後方向にN文字拡張した拡張パターンを作成し、文字数を順次短くしながら翻訳対象の拡張パターン及び類似用例の拡張パターンの日本語訳を辞書データベース6bから検索する。そして翻訳対象の拡張パターンの日本語訳と類似用例の拡張パターンの日本語訳の検索に成功した場合、組立部8が、類似用例の日本語訳を構成する文字列中の拡張パターンに対応する部分を入力語の拡張パターンの日本語訳に置換した文字列を出力語として生成して出力する。すなわち本発明の実施形態となる翻訳処理では、辞書検索に成功した翻訳対象及び類似用例の拡張パターンを差分文字列として抽出する。そしてこのような翻訳処理によれば、分断された単語が差分文字列として抽出されることがなくなるので、用例ベース方式による中国語の入力語の翻訳精度を向上させることができる。
【0032】
また本発明の実施形態となる翻訳処理によれば、翻訳対象の拡張パターンの日本語訳検索に成功し、類似用例の拡張パターンの日本語訳検索に失敗した場合、組立部8は、翻訳対象を構成する文字列中の拡張パターンに対応する部分をその日本語訳に置換した文字列を出力語として生成する。一方、翻訳対象の拡張パターンの日本語訳検索に失敗し、類似用例の拡張パターンの日本語訳検索に成功した場合には、組立部8は、類似用例の日本語訳を構成する文字列中の拡張パターンに対応する部分を翻訳対象の拡張パターンに置換した文字列を出力語として生成する。これにより、検索結果を最大限活用した翻訳結果を得ることができる。
【0033】
以上、本発明者によってなされた発明を適用した実施の形態について説明したが、この実施の形態による本発明の開示の一部をなす記述及び図面により本発明は限定されることはない。例えば上記実施形態では、翻訳対象及び類似用例のどちらか一方の検索に失敗した場合に翻訳対象又は類似用例が複数単語により構成されているか否かの判別処理を行ったが、翻訳対象及び類似用例の両方の検索に失敗した場合にも翻訳対象又は類似用例が複数単語により構成されているか否かを判別して同様の処理を行うようにしてもよい。また本実施形態では、類似用例検索部3は翻訳対象に最も類似する用例を類似用例として検索したが、2番目に類似する用例を検索する等して類似用例を複数検索し、各類似用例に対して上述の翻訳処理を行うようにしてもよい。このような処理によれば、翻訳精度をより向上させることができる。このように上記実施の形態に基づいて当業者等によりなされる他の実施の形態、実施例及び運用技術等は全て本発明の範疇に含まれることは勿論である。
【符号の説明】
【0034】
1:機械翻訳装置
2:入力部
3:類似用例検索部
4:差分文字列生成部
5:差分文字列検索部
6:対訳データベース
6a:用例データベース
6b:辞書データベース
7:検索処理部
8:組立部
9:出力部
11:拡張パターン作成部
12:拡張パターンテーブル記憶部
13:拡張パターン検索部
14:最良結果判定部

【特許請求の範囲】
【請求項1】
原言語の入力語が入力される入力部と、
原言語の語句と当該語句の目的言語訳とを関連づけして記憶する辞書データベースと、
原言語の用例と当該用例の目的言語訳とを関連づけして記憶する用例データベースと、
前記入力部に入力された原言語の入力語に類似する原言語の用例と当該用例の目的言語訳をそれぞれ類似用例及び用例訳として前記用例データベースから検索する類似用例検索部と、
前記入力部に入力された原言語の入力語と前記類似用例検索部により検索された類似用例の差分文字列を抽出する差分文字列抽出部と、
前記入力語の差分文字列を前後方向に所定文字数拡張した文字列及び前記類似用例の差分文字列を前後方向に所定文字数拡張した文字列をそれぞれ入力語の拡張パターン及び類似用例の拡張パターンとして生成し、入力語及び類似用例の拡張パターンの目的言語訳を前記辞書データベースから検索する差分文字列検索部と、
前記差分文字列検索部が入力語の拡張パターンの目的言語訳と類似用例の拡張パターンの目的言語訳の双方の検索に成功した場合、前記差分文字列検索部の検索結果を利用して、前記用例訳を構成する文字列中の類似用例の拡張パターンに対応する部分を入力語の拡張パターンの目的言語訳に置換した文字列を出力語として生成する組立部と、
前記組立部により生成された出力語を出力する出力部とを備え、
前記差分文字列検索部は、入力語の拡張パターンの目的言語訳と類似用例の拡張パターンの目的言語訳の少なくとも一方の検索に失敗した場合、入力語の拡張パターンと類似用例の拡張パターンの文字数を減らし、文字数を減らした拡張パターンの目的言語訳を検索する処理を、入力語の拡張パターンの目的言語訳と類似用例の拡張パターンの目的言語訳の双方の検索に成功するまで繰り返し実行することを特徴とする機械翻訳装置。
【請求項2】
請求項1に記載の機械翻訳装置において、
前記組立部は、前記入力語の拡張パターンの目的言語訳検索に成功し、類似用例の拡張パターンの目的言語訳検索に失敗した場合、入力語を構成する文字列中の拡張パターンに対応する部分を当該拡張パターンの目的言語訳に置換した文字列を出力語として生成することを特徴とする機械翻訳装置。
【請求項3】
請求項1又は請求項2に記載の機械翻訳装置において、
前記組立部は、前記入力語の拡張パターンの目的言語訳検索に失敗し、類似用例の拡張パターンの目的言語訳検索に成功した場合、前記用例訳を構成する文字列中の拡張パターンに対応する部分を前記入力語の拡張パターンに置換した文字列を出力語として生成することを特徴とする機械翻訳装置。
【請求項4】
請求項1乃至請求項3のうち、いずれか1項に記載の機械翻訳装置において、
前記組立部は、前記入力語の拡張パターンの目的言語訳と前記類似用例の拡張パターンの目的言語訳の少なくとも一方の検索に失敗した場合、検索に失敗した拡張パターンが複数の単語により構成されていると仮定して当該拡張パターンの目的言語訳を再度検索することを特徴とする機械翻訳装置。
【請求項5】
請求項1乃至請求項4のうち、いずれか1項に記載の機械翻訳装置において、
前記類似用例検索部は前記類似用例を複数検索し、前記入力語の拡張パターンの目的言語訳と類似用例の拡張パターンの目的言語訳の双方の検索に失敗した場合、前記差分文字列抽出部及び前記差分文字列検索部は前記類似用例検索部から検索された他の類似用例を用いて再度処理を実行することを特徴とする機械翻訳装置。
【請求項6】
原言語の用例と当該用例の目的言語訳とを関連づけして記憶する用例データベースから、原言語の入力語に類似する原言語の用例と当該用例の目的言語訳をそれぞれ類似用例及び用例訳として検索する類似用例検索処理と、
前記原言語の入力語と前記類似用例検索処理により検索された類似用例の差分文字列を抽出する差分文字列抽出処理と、
前記入力語の差分文字列を前後方向に所定文字数拡張した文字列及び前記類似用例の差分文字列を前後方向に所定文字数拡張した文字列をそれぞれ入力語の拡張パターン及び類似用例の拡張パターンとして生成し、原言語の語句と当該語句の目的言語訳とを関連づけして記憶する辞書データベースから入力語及び類似用例の拡張パターンの目的言語訳を検索する差分文字列検索処理と、
前記差分文字列検索処理において入力語の拡張パターンの目的言語訳と類似用例の拡張パターンの目的言語訳の双方の検索に成功した場合、差分文字列検索処理の結果を利用して、前記用例訳を構成する文字列中の類似用例の拡張パターンに対応する部分を入力語の拡張パターンの目的言語訳に置換した文字列を出力語として生成する組立処理と、
前記組立処理により生成された出力語を出力する出力処理と
をコンピュータに実行させ、
前記差分文字列検索処理は、入力語の拡張パターンの目的言語訳と類似用例の拡張パターンの目的言語訳の少なくとも一方の検索に失敗した場合、入力語の拡張パターンと類似用例の拡張パターンの文字数を減らし、文字数を減らした拡張パターンの目的言語訳を検索する処理を、入力語の拡張パターンの目的言語訳と類似用例の拡張パターンの目的言語訳の双方の検索に成功するまで繰り返し実行する処理を含むこと
を特徴とする機械翻訳プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate