説明

入力された原言語文を目的言語に機械翻訳する装置、方法およびプログラム

【課題】音声翻訳の翻訳精度を向上させる機械翻訳装置を提供する。
【解決手段】第1言語の用例と第2言語の用例とを対応づけて記憶する用例記憶部123と、入力された第1言語文に対応する第2言語の用例を用例記憶部123から取得する用例翻訳部104と、予め定められた規則に基づいて、第1言語文を第2言語に翻訳する規則翻訳部103と、用例翻訳部104の翻訳結果と規則翻訳部103の翻訳結果とから最も確からしい翻訳結果を選択する選択部102aと、第1言語文に含まれる第1単語と、選択された翻訳結果に含まれる第2単語との間の対応関係を記憶するキャッシュメモリ122と、選択された翻訳結果を出力する出力部105と、を備え、規則翻訳部103は、さらに、第1単語に対応する第2単語をキャッシュメモリ122から取得し、取得した第2単語で第1単語を変換した第2単語を置換する。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は、複数の翻訳方式によって、入力された原言語文を翻訳の目的言語に機械翻訳する装置、方法およびプログラムに関するものである。
【背景技術】
【0002】
従来、機械翻訳は、文型の限られた技術文書等に適用領域が限られていた。しかし、近年の機械翻訳技術の進展により、Web文書等の幅広い分野の文書を扱えるようになり、さらに音声認識技術との融合により、人間の発話を実世界・実時間で翻訳する音声翻訳器(通訳器)の実用化が期待される状況になってきた。ところが、音声翻訳器の実用化に関しては、話し言葉を扱う性格上、言葉の省略や助詞等の脱落、句や文の倒置、言い直し、不要語句の挿入など、これまで書き言葉にはあまり現れなかった言語現象に対応していく必要があり、克服すべき課題も多い。
【0003】
これらの課題に対し有用な解として、入力文を事前に準備された対訳用例データベースと照合し、照合した全体もしくは部分に対応する訳文を出力することで、翻訳品質を向上させる用例主導型翻訳方式(EBMT:Example Based Machine Translation)が提案されている。しかし、どのような入力文に対しても照合できるような巨大な対訳用例データベースを開発するコストは膨大であり、EBMTだけであらゆる入力に対する翻訳を行うことはできない。
【0004】
このため、従来から用いられてきた、翻訳規則に従って翻訳する規則主導型翻訳方式(RBMT:Ruled Based Machine Translation)を併用することでカバレージを高め、さらに両方式の長所を活かして、最終的な訳出性能を向上させるハイブリッド翻訳方式(Hybrid MT)が提案されている。
【0005】
Hybrid MTでは、EBMTとRBMTの訳出方法の違いに伴い、同一発話者の同一単語の訳語が異なる場合や、待遇表現等で丁寧度に差が現れる場合など、一連の会話の中で一貫した口調で訳出することができない場合がある。
【0006】
一例として、(1)スキーの板とスキー靴を借りたいことを表す日本語の文(板と靴を借りたいのですが。)が入力されて、EBMTにより「I'd like to rent skis and boots.」が出力され、さらに(2)別のスキー靴を見たいことを表す日本語の文(別の靴を見せてください。)が入力されて、RBMTにより「Please show me different shoes.」が出力された場合について説明する。
【0007】
この例は、入力(1)に対しては、対訳用例データベースに当該例文が登録されていたため、EBMTにより翻訳が行われたことを示している。この結果、「靴」の訳語としては、発話文脈に最適な「boots」が選択されている。一方、引き続き発話された入力(2)では、類似例文が対訳用例データベースに存在せず、この結果、RBMTにより翻訳が行われたことを示している。
【0008】
RBMTでは、通常、多くの文脈で最適と思われる訳語が選択される。この結果、「靴」の訳語としては「shoes」が選択されている。このように、一連の会話であるにも拘わらず、内部で用いられた翻訳方式の違いにより、同一の単語に対する訳語が異なる場合が生じうる。出力を聞いた聞き手は、第1文では、スキー靴を思い浮かべていたのに、第2文では、「shoes(短靴)」と言い換えられるため、発話者の意図を汲むのに戸惑いを覚えることになる。
【0009】
上記課題に関連する技術として、特許文献1では、プロの翻訳者等が、マニュアル文等を翻訳する際に、機械翻訳装置(RBMT)と翻訳メモリ装置(EBMT)とを併用し、対話的に翻訳文を作成する過程を支援するシステムが提案されている。
【0010】
特許文献1では、データ互換処理部なる機構によって、RBMTの結果を人手により修正の上、EBMTの例文に追加する、あるいは、EBMTの例文を解析して得られる対訳パターンもしくは対訳辞書をRBMTの辞書に追加する、という処理を行っている。これにより、RBMTとEBMTの翻訳結果を同一のデータ構造で扱えるようになる。
【0011】
この結果、翻訳メモリに「靴」の訳語が「boots」として数多く現れていれば、機械翻訳用辞書に訳語「boots」が追加される。その結果、RBMTでも、「靴」の訳語として「boots」を得ることができる。
【0012】
【特許文献1】特開2002−278964号公報
【発明の開示】
【発明が解決しようとする課題】
【0013】
しかしながら、特許文献1の方法では、EBMTが潜在的に持つ対訳情報を直接RBMT側に登録するため、対訳情報が不揮発性になるという問題がある。すなわち、入力文脈に依らず、ある入力語の訳語が特定のものに固定化するという傾向がある。これは、特許文献1が想定している翻訳支援環境で、プロの翻訳者等が、自己の過去の翻訳結果を有効利用して翻訳効率を高めるという目的には好適である。
【0014】
しかし、会話支援環境で使用される音声翻訳装置はさまざまな場面で使用されることが想定され、場面毎に最適な訳語は異なるため、訳語が固定化することにより翻訳精度が低下するという不都合が生じる。
【0015】
例えば、レンタルスキーの店での会話文では、「靴」を「boots」と訳出すべきだが、シューズショップでの使用場面を想定すれば、通常「shoes」と訳出すべきである。ところが、特許文献1の方法により「靴」の訳語として「boots」が登録された場合、シューズショップでの会話文に対しても「boots」と訳出されるため、翻訳精度が低下する。
【0016】
本発明は、上記に鑑みてなされたものであって、多数の文脈が想定される音声翻訳での翻訳精度を向上させることができる装置、方法およびプログラムを提供することを目的とする。
【課題を解決するための手段】
【0017】
上述した課題を解決し、目的を達成するために、本発明は、第1言語の用例と、前記第1言語の用例を翻訳した第2言語の用例とを対応づけて記憶する用例記憶部と、第1言語による第1単語と、第2言語による第2単語とを対応づけた単語辞書を記憶する辞書記憶部と、第1言語による第1言語文の入力を受付ける入力受付部と、前記第1言語文に対応する前記第2言語の用例を前記用例記憶部から取得することにより、前記第1言語文を第2言語に用例翻訳する用例翻訳部と、前記第1言語文に含まれる前記第1単語に対応する前記第2単語を前記辞書記憶部から取得し、予め定められた規則に基づいて、前記第1言語文に含まれる前記第1単語を、取得した前記第2単語に変換することにより、前記第1言語文を第2言語に規則翻訳する規則翻訳部と、前記用例翻訳部の翻訳結果と前記規則翻訳部の翻訳結果とのうち、最も確からしい翻訳結果を選択する選択部と、前記第1言語文に含まれる前記第1単語と、選択された翻訳結果に含まれる前記第2単語との間の対応関係を記憶する対応記憶部と、選択された翻訳結果を出力する出力部と、を備え、前記規則翻訳部は、さらに、他の第1言語文を第2言語に規則翻訳し、かつ、前記他の第1言語文に含まれる前記第1単語のそれぞれについて、前記第1単語に対応する前記第2単語を前記対応記憶部から取得し、取得した前記第2単語で前記第1単語を規則翻訳した前記第2単語を置換すること、を特徴とする。
【0018】
また、本発明は、上記装置を実行することができる方法およびプログラムである。
【発明の効果】
【0019】
本発明によれば、内部的に異なる翻訳方式が用いられていても、翻訳結果の整合性がとれるので、翻訳精度を向上させることができ、聞き手に不自然な印象を与えることがないという効果を奏する。
【発明を実施するための最良の形態】
【0020】
以下に添付図面を参照して、この発明にかかる装置、方法およびプログラムの最良な実施の形態を詳細に説明する。
【0021】
本実施の形態にかかる機械翻訳装置は、ハイブリッド翻訳方式を構成する規則翻訳および用例翻訳のそれぞれの翻訳結果から得られる付加情報をキャッシュメモリに保存し、以降の翻訳処理で付加情報を参照して翻訳の精度を向上させるものである。
【0022】
なお、以下では、日本語と英語との間の機械翻訳を前提として説明するが、翻訳の原言語および目的言語の組み合わせはこれに限るものではなく、あらゆる言語の組み合わせについて適用することができる。
【0023】
図1は、本実施の形態にかかる機械翻訳装置100の構成を示すブロック図である。同図に示すように、機械翻訳装置100は、辞書記憶部121と、キャッシュメモリ122と、用例記憶部123と、入力受付部101と、翻訳制御部102と、規則翻訳部103と、用例翻訳部104と、出力部105と、を備えている。
【0024】
辞書記憶部121は、原言語の単語と目的言語の単語とを対応づけた翻訳辞書を格納するものである。辞書記憶部121は、後述する規則翻訳部103が翻訳する際に参照する。図2は、辞書記憶部121に格納された翻訳辞書のデータ構造の一例を示す説明図である。同図の例では、翻訳辞書には、日本語の単語と、日本語の単語の丁寧度と、英語の単語と、英語の単語の丁寧度と、画面とが対応づけられて格納されている。
【0025】
なお、丁寧度とは、各単語の意味内容の丁寧さの程度を表すものである。例えば、同図に示すように、英単語「visit」に対する日本語の訳語としては、2つの日本語(「行く」、「伺う」)が存在するが、それぞれ丁寧さの程度が異なるため、丁寧度の値(「3」、「4」)が異なっている。丁寧度は、後述するキャッシュメモリ122内の丁寧度と一致する訳語を選択するために参照される。
【0026】
また、場面とは、訳語が使用される場面を表す情報であり、対応する訳語が複数存在するときに、場面を参照することにより適切な訳語を選択するために用いられる。
【0027】
キャッシュメモリ122は、入力された原言語による文である原文と、原文の目的言語による翻訳結果(訳文)との間の単語の対応関係や、場面に関する場面情報、丁寧度などの翻訳に関する付加情報などを一時的に記憶する記憶部であり、RAM(Random Access Memory)によって構成される。なお、キャッシュメモリ122を、HDD(Hard Disk Drive)、光ディスク、メモリカードなどの、その他一般的に利用されている記憶媒体により構成してもよい。また、キャッシュメモリ122には付加情報等が時系列順に追記され、記憶された情報は、一連の対話に関する翻訳処理が終了すると初期化される。
【0028】
図3は、キャッシュメモリ122に記憶される情報の一例を示す説明図である。なお、同図は、上述の例のように、スキーの板とスキー靴を借りたいことを表す日本語の文(板と靴を借りたいのですが。)が入力されたときの処理結果を登録した状態を示している。
【0029】
同図に示すように、キャッシュメモリ122内には、識別情報と、付加情報とが格納されている。識別情報は、入力文を一意に識別するIDと、翻訳の方向と、翻訳の方式とを含んでいる。
【0030】
IDは、ユーザIDやユーザ名などの「発話者の識別情報」、記号「#」、および発話者ごとの発話順序を表す「順番号」を付加した形式で表される。同図では、例えば、日本語の発話者「S」の1番目および2番目の発話に対応したIDである「S#1」、「S#2」が登録されている。
【0031】
方向には、本実施の形態では、日英翻訳の場合「JE」が、英日翻訳の場合「EJ」が設定される。方式には、後述する選択部102aにより選択された翻訳結果を生成した翻訳の方式を設定し、用例主導型翻訳方式の場合は「EB」が、規則主導型翻訳方式の場合は「RB」が設定される。
【0032】
同図の最初のレコードに示すように、EBMTにより「I'd like to rent skis and boots.」が出力される上述の例に対しては、ID=「S#1」、翻訳方向は日英(JE)、使用された翻訳方式は用例主導型(EB)が設定される。
【0033】
付加情報は、規則翻訳部103および用例翻訳部104が共通して翻訳結果と共に出力する情報であり、場面情報、アラインメント情報、丁寧度、および確信度を含む。
【0034】
場面情報は、用例主導型翻訳方式で翻訳したときに出力される情報であり、用例翻訳時に検索された用例が使用される場面を示す情報である。上述の例に対しては、場面情報として「ski」が設定される。後述するように、場面情報は用例記憶部123に各用例と共に格納されている。
【0035】
なお、用例記憶部123に場面情報が記憶されていない場合は空の値(null)が設定される。また、規則主導型翻訳方式でも、文に含まれる単語の場面などから入力された発話の使用場面を特定し、場面情報を出力するように構成してもよい。
【0036】
アラインメント情報は、原文と訳文の各構成要素間の対応付けを示す情報である。構成要素とは、単語などの形態素や、複数の形態素を含む形態素列を表す。同図では、矢印の左に日本語の構成要素を、矢印の右に英語の構成要素を指定することにより、矢印の両側の構成要素が対応づけられていることが示されている。
【0037】
例えば、上述の例に対しては、原文中のスキー板を意味する形態素(板)が訳文中の形態素「ski」に対応することが示されている。また、原文中の形態素列(たい+の+です+が)が訳文中の形態素列「would+like+to」に対応することが示されている。
【0038】
また、アラインメント情報には、さらに訳語の属性情報が付加されるように構成してもよい。例えば同図では、「ski(pl)」のように、訳語(ski)が複数形(pl)であることを示す属性情報を括弧内に指定する例が示されている。
【0039】
丁寧度は、訳文の意味内容の丁寧さの程度を表すものである。キャッシュメモリ122内の丁寧度は、用例翻訳の翻訳結果が選択されたときに、用例に対応する丁寧度が用例記憶部123から取得されて設定される。
【0040】
確信度は、翻訳結果の確からしさを表す0〜1の数値である。値が大きいほど翻訳結果が信頼できることを表す。確信度の算出方法の詳細については後述する。
【0041】
用例記憶部123は、原言語の文の用例と、目的言語の文の用例とを対応づけて格納するものである。図4は、用例記憶部123に記憶された用例のデータ構造の一例を示す説明図である。
【0042】
同図に示すように、用例記憶部123には、日本語用例と、英語用例と、場面情報と、日本語用例と英語用例内の各構成要素間の対応付けを示す情報であるアラインメント情報と、丁寧度とを対応づけて格納している。
【0043】
アラインメント情報は、用例記憶部123に用例を登録するときに、構成要素の対応付けを事前に解析して得られた情報を設定する。なお、アラインメント情報を用例記憶部123に保存せず、用例翻訳部104が翻訳したときにアラインメント情報を生成するように構成してもよい。しかし、アラインメント情報生成処理の精度の観点から、人手による検証を経たものが事前に付与されていることが望ましい。
【0044】
丁寧度は、上述のように、訳文の意味内容の丁寧さの程度を表すものである。同図では、「それをやってください」を意味する日本語に対し、丁寧度が異なる7つの訳文が設定されている例が示されている。丁寧度は、各訳出でほぼ同等の値となるように用例または訳語を選択するために参照される。これにより、口調の一貫性を保つことが可能となる。
【0045】
なお、辞書記憶部121および用例記憶部123は、HDD(Hard Disk Drive)、光ディスク、メモリカード、RAMなどの一般的に利用されているあらゆる記憶媒体により構成することができる。
【0046】
入力受付部101は、音声認識、手書き文字認識、キー入力等により原文の入力を受付けるものである。
【0047】
翻訳制御部102は、規則翻訳部103および用例翻訳部104を駆動し、両者がそれぞれ出力した翻訳結果から、最終的な翻訳結果を選択する処理を制御するものであり、選択部102aを備えている。
【0048】
選択部102aは、規則翻訳部103および用例翻訳部104がそれぞれ出力した翻訳結果のうち、翻訳結果とともにそれぞれ出力された確信度が大きい翻訳結果を、最終的な翻訳結果として選択するものである。
【0049】
また、翻訳制御部102は、選択した翻訳結果について付加情報および対応する識別情報を生成し、生成した付加情報および識別情報をキャッシュメモリ122に登録する。付加情報および識別情報の生成方法については後述する。
【0050】
規則翻訳部103は、辞書記憶部121に格納された辞書情報や、予め定められた翻訳規則を参照して、原文を目的言語に翻訳する規則主導型翻訳方式の翻訳部である。具体的には、規則翻訳部103は、まず入力された原文に対して、形態素解析、統語解析、依存構造解析などの通常の文解析処理を行い、原文の意味構造を反映した依存構造木を生成する。そして、規則翻訳部103は、辞書記憶部121および所定の翻訳規則を参照しながら、依存構造木を目的言語の依存構造木に変換するトランスファー処理を行う。最後に、規則翻訳部103は、目的言語の依存構造木から目的言語による訳文を生成する。
【0051】
また、規則翻訳部103は、変換前後の各依存構造木の要素の対応から、原文と訳文の各構成要素間のアラインメント情報を生成する。
【0052】
用例翻訳部104は、原文を用例記憶部123内の用例と照合し、一致または類似する用例に対応する目的言語の用例を選択することにより翻訳を行う用例主導方式の翻訳部である。
【0053】
なお、規則翻訳部103および用例翻訳部104は、翻訳結果を出力すると共に、翻訳結果の確信度、原文と訳文の各構成要素間の対応付け(アラインメント情報)などを含む上述の付加情報を出力する。
【0054】
出力部105は、翻訳制御部102が選択した翻訳結果を音声合成してユーザに出力するものである。なお、出力部105は、翻訳結果をディスプレイ等によりユーザに提示するように構成してもよい。
【0055】
次に、このように構成された本実施の形態にかかる機械翻訳装置100による機械翻訳処理について説明する。図5は、本実施の形態における機械翻訳処理の全体の流れを示すフローチャートである。
【0056】
まず、入力受付部101が、原文の入力を受付ける(ステップS501)。次に、規則翻訳部103による規則翻訳処理(ステップS502)、および用例翻訳部104による用例翻訳処理(ステップS503)が行われる。なお、規則翻訳処理と用例翻訳処理の処理順序はこれに限られず、先に用例翻訳処理を実行してもよいし、並行して処理するように構成してもよい。規則翻訳処理と用例翻訳処理の詳細については後述する。
【0057】
次に、選択部102aが、規則翻訳処理による翻訳結果と、用例翻訳処理による翻訳結果のそれぞれの確信度を比較し、確信度が高い翻訳結果を選択する(ステップS504)。
【0058】
次に、翻訳制御部102が、選択した翻訳結果の付加情報および識別情報を生成し、生成した付加情報に識別情報を付与してキャッシュメモリ122に登録する(ステップS505)。具体的には、翻訳制御部102は、以下のようにして付加情報および識別情報を生成する。
【0059】
まず、翻訳制御部102は、識別情報のうちIDを、ユーザにより指定または入力されたユーザIDと、RAMなどの記憶部(図示せず)で管理するユーザごとの発話順序とから生成する。また、翻訳制御部102は、ユーザにより指定された翻訳方向を識別情報の方向として設定する。あるいは、音声翻訳システムであれば、発声者を識別する話者認識技術を用いて自動生成されるユーザIDや、発声言語の言語種を判別する言語識別技術により得られる翻訳方向から設定してもよい。また、翻訳制御部102は、翻訳制御部102自身が選択した翻訳方式を識別情報の方式として設定する。
【0060】
付加情報のうち場面情報は、方式として用例主導型が選択された場合に、用例記憶部123から取得された場面情報が設定される。アラインメント情報は、用例主導型を選択した場合は用例記憶部123から取得したアラインメント情報が設定され、規則主導型を選択した場合は、規則翻訳部103が生成したアラインメント情報が設定される。
【0061】
丁寧度は、原則として用例主導型が選択された場合に、用例記憶部123から取得された丁寧度が設定される。なお、キャッシュメモリ122の丁寧度を参照し、規則翻訳時に丁寧度が一致する訳語を選択したときは、参照した丁寧度が引き継がれて設定される場合がある。確信度は、規則翻訳部103および用例翻訳部104がそれぞれ出力した確信度が設定される。
【0062】
最後に、出力部105が、翻訳制御部102により選択された翻訳結果を音声合成してスピーカ等(図示せず)に出力し(ステップS506)、機械翻訳処理を終了する。
【0063】
次に、ステップS502の規則翻訳処理の詳細について説明する。図6は、本実施の形態における規則翻訳処理の全体の流れを示すフローチャートである。
【0064】
まず、規則翻訳部103は、入力された原文を解析して依存構造木を生成する(ステップS601)。上述のように、規則翻訳部103は、従来から用いられている形態素解析、統語解析、および依存構造解析等の文解析処理を実行することにより依存構造木を生成する。
【0065】
次に、規則翻訳部103は、生成した依存構造木を目的言語の依存構造木にトランスファーする(ステップS602)。この処理は、従来から用いられている機械翻訳のトランスファー方式における処理と同様である。
【0066】
この後、規則翻訳部103は、キャッシュメモリ122の内容を適用して依存構造木内の単語を変更するキャッシュ適用処理を実行する(ステップS603〜ステップS607)。規則翻訳のキャッシュ適用処理では、基本的に時系列順に並んだキャッシュメモリ122内のレコードを遡及検索し、適用可能な付加情報が検索された場合に、検索された付加情報を用いて目的言語の依存構造木を修正する。遡及検索の範囲および適用方法は、付加情報の種類によって異なる。以下、ステップS603〜ステップS607のキャッシュ適用処理について説明する。
【0067】
まず、規則翻訳部103は、キャッシュメモリ122からアラインメント情報を取得し(ステップS603)、取得したアラインメント情報に、依存構造木内の単語が含まれているか否かを判断する(ステップS604)。
【0068】
含まれている場合は(ステップS604:YES)、規則翻訳部103は、アラインメント情報内の単語で依存構造木内の単語を変更する(ステップS605)。具体的には、以下のようにしてアラインメント情報の適用を行う。
【0069】
まず、規則翻訳部103は、取得したアラインメント情報のうち、発話者が同一、または、翻訳方向が逆方向かつ翻訳方式が用例主導型(EB)である範囲を探索する。探索キーは、発話者が同一の場合は原言語の形態素もしくは形態素列とする。また、翻訳方向が逆方向の場合は、訳語側の形態素もしくは形態素列を探索キーとする。
【0070】
例えば、キャッシュメモリ122に図3のID=「S#1」および「H#1」に示すような情報が格納されており、上述の例と同様に、発話者(S)が、別のスキー靴を見たいことを表す日本語の文(別の靴を見せてください。)が入力したとする(ID=「S#2」)。この場合、翻訳方向が逆方向かつ翻訳方式がEBであるレコードは存在しないため、探索範囲は発話者が同一であるID=「S#1」のレコードのみとなる。
【0071】
ID=「S#2」に対応する原文に対しては、当該原文内の単語の1つであり、スキー靴を意味する日本語(靴)を含むアラインメント情報(靴→boot(pl))がキャッシュメモリ122内に存在する。したがって、例えば、規則翻訳で当該単語(靴)の訳語として「shoe(pl)」が選択されていた場合、アラインメント情報に従って訳語を「boot(pl)」に変更する。
【0072】
なお、このとき、訳語の属性情報(pl等)も継承される。例えば、用例主導型で「靴を片方なくしました。」を意味する日本語が入力され、用例翻訳により訳語「I've lost a boot.」が出力された後、規則主導型で「靴」を意味する日本語を翻訳する場合は、通常の訳語である「boot(pl)」の代わりに単数形の「boot(sg)」が選択される。
【0073】
ステップS604で、アラインメント情報に依存構造木内の単語が含まれていないと判断された場合(ステップS604:NO)、または、アラインメント情報の適用後(ステップS605)、規則翻訳部103は、場面情報および丁寧度の適用を行う。すなわち、規則翻訳部103は、キャッシュメモリ122から場面情報および丁寧度を取得し(ステップS606)、依存構造木内の単語を、場面情報および丁寧度が一致する単語に変更する(ステップS607)。場面情報の適用、および丁寧度の適用は以下のように行う。
【0074】
まず、場面情報の適用について説明する。場面情報は、翻訳方式が用例主導型(EB)である範囲で検索し、最初に検索された場面情報、すなわち最新の場面情報を現在の発話の場面であると仮定する。そして、訳語候補の中に、当該の場面情報に適合する訳語が存在すれば、それを第1優先の訳語(第1訳語)に変更する。
【0075】
例えば、「服」を意味する日本語に対する通常の第1訳語は「dress」であるが、使用場面「スキー」では、「ski wear」が第1訳語に変更される。従って、キャッシュメモリ122に図3に示すような情報が格納されていた場合であって、その後に入力された日本語の原文中に「服」を意味する単語が現れた場合、その単語の訳語は「ski wear」に変更される。
【0076】
次に、丁寧度の適用について図7を用いて説明する。図7は、キャッシュメモリ122に記憶される情報の別の例を示す説明図である。
【0077】
丁寧度の探索では、発話者が同一である範囲で探索する。丁寧度を対話相手に合わせることは無意味だからである。ここで、例えば、先行発話として「My name is Brown.」が入力され、用例翻訳により対応する日本語(私はブラウンと申します。)が出力され、キャッシュメモリ122に図7に示すような情報が格納されたことを仮定する。
【0078】
この状態で、同一発話者が、「I'll visit tomorrow.」と発話した場合、探索範囲は、ID=「S#1」となり、丁寧度4が取得される。なお、丁寧度4は、英日翻訳では謙譲語の使用を表すものとする。
【0079】
ここで、例えば、図2に示すような辞書記憶部121を参照し、「visit」の訳語として丁寧度3の日本語(行く)が選択されていたとすると、当該日本語は、取得した丁寧度と一致する丁寧度(4)に対応する別の日本語(伺う)に変更される。
【0080】
図6に戻り、上述のようなキャッシュ適用処理(ステップS603〜ステップS607)が終了すると、規則翻訳部103は、目的言語の依存構造木から訳文を生成する(ステップS608)。すなわち、規則翻訳部103は、従来から用いられている機械翻訳のトランスファー方式における処理と同様に、構文生成・形態素生成処理を実行して目的言語の訳文を生成する。
【0081】
次に、規則翻訳部103は、生成した訳文と原文との対応からアラインメント情報を生成する(ステップS609)。具体的には、規則翻訳部103は、トランスファー時に変換された原言語の依存構造木および目的言語の依存構造木の間の対応関係に、キャッシュ適用処理により得られた新たな対応関係を反映した最終結果をアラインメント情報として生成する。
【0082】
次に、規則翻訳部103は、規則翻訳で得られた翻訳結果の確信度を算出する(ステップS610)。確信度は、1より小さい特定値を最大値とし(用例主導翻訳では最大値1)、係り受けの曖昧性の多さや訳語の曖昧性の多さに応じた点数を減じることにより算出する。なお、キャッシュ適用により訳語の曖昧性等が減じられれば、その分ペナルティは小さくなる。
【0083】
具体的には、規則翻訳部103は、以下の(1)式により規則主導翻訳における確信度Crを算出する。ここで、α、βは、0<α、β<1を満たす定数、Nは全構成語数、Nsは構文的曖昧性の数、Ntwは訳語に曖昧性を持つ語の数を意味する。
【数1】

【0084】
なお、αは、規則主導翻訳における上限値を定める定数であり、βは、訳語の曖昧性に関するペナルティの上限値を定める定数である。
【0085】
次に、規則翻訳部103は、訳文および付加情報を出力する(ステップS611)。なお、付加情報のうちアラインメント情報は、ステップS609で生成したアラインメント情報を出力する。付加情報のうち場面情報および丁寧度は、原則として規則翻訳では出力しないが、キャッシュメモリ122を参照して場面情報または丁寧度が一致する訳語に変更した場合は、参照元のレコードと同一の場面情報または丁寧度を設定してもよい。また、原文に含まれる単語に対応する場面や丁寧度を辞書記憶部121から取得し、取得した場面や丁寧度を設定するように構成してもよい。
【0086】
次に、ステップS503の用例翻訳処理の詳細について説明する。図8は、本実施の形態における用例翻訳処理の全体の流れを示すフローチャートである。
【0087】
まず、用例翻訳部104は、原文と類似する文に対応する目的言語の用例を用例記憶部123から検索する(ステップS801)。このように、用例の検索は類似文検索の手法により行い、完全一致しなくとも、一定の確信度とともに類似する用例が順序づけられて取得されるものとする。なお、完全一致の場合に確信度として1が設定される。
【0088】
また、同図には図示しないが、検索に失敗した場合、または所定の閾値以下の確信度しか得られなかった場合は、空の翻訳結果、および空の付加情報を出力して終了する。
【0089】
検索が成功した場合、キャッシュメモリ122を参照して用例の変更を行うキャッシュ適用処理を実行する(ステップS802〜ステップS803)。用例翻訳のキャッシュ適用処理では、基本的に丁寧度以外の変更処理は行わない。対訳用例は、使用場面を想定した上での最適解釈が既に行われた結果だからである。一方、丁寧度は、話者と聞き手の関係に基づいて動的に決定されるものであり、文脈から獲得する必要があるからである。なお、常に最大限の丁寧度で出力する戦略もあるが、慇懃無礼となる場合があるという問題が生じうる。
【0090】
丁寧度は、多くの場合、現在翻訳対象となっている原文からも獲得することができるが、対象とする言語対によっては、必ずしも一意に対応するとは限らない。例えば、「質問してよろしいですか?」を意味する日本語の原文に対し、先行文脈が存在しない場合は、異なる丁寧度を有する「May I ask a question?」、および「I wonder if I might ask a question.」の2つの英語の訳文が対応づけられる。
【0091】
実際、特に慣用的表現のように、同一の原文に対し丁寧度のみ異なる複数の訳文が用例記憶部123に登録されていることも多い。このような場合、キャッシュ適用処理により、先行文脈を参照すること、すなわちキャッシュメモリ122を参照することで、複数の訳文のうち、丁寧度が一致するいずれか1つを選択して翻訳結果とする。
【0092】
次に、用例翻訳部104は、選択した用例と、原文との相違部分を検出して単語の置換を行う(ステップS803)。例えば、原文が「コップを1つください。」であり、検索された用例が「お皿を2枚ください。」であった場合、アラインメント情報の「お皿→dish(pl)」、および「2枚→two」を、それぞれ「コップ→glass(sg)」、「1つ→a」に変更するとともに、訳文の対応部分の単語をそれぞれ変更する。
【0093】
次に、用例翻訳部104は、翻訳結果の最終的な確信度を算出する(ステップS805)。確信度は、用例検索時に得られた値を最大値とし、単語置換の多さや置換単語間の意味的距離に応じた点数を減じることにより確定する。
【0094】
具体的には、用例翻訳部104は、以下の(2)式により用例主導翻訳における確信度Ceを算出する。ここで、Siは、入力文内の単語(入力単語)と用例内の単語(用例単語)の対応付けにおける、入力単語と用例単語との類似度を表し、0<=Si<=1を満たすものとする。
【数2】

【0095】
なお、入力単語と用例単語との類似度は、単語間の階層関係を格納したシソーラス(図示せず)を参照し、両者間の階層数が小さいほど類似度を高く算出する方法などの、従来から用いられているあらゆる類似度算出方法を適用できる。
【0096】
次に、用例翻訳部104は、訳文および付加情報を出力する(ステップS806)。なお、付加情報に含まれる場面情報、アラインメント情報、および丁寧度は、選択した用例に対応する情報をそれぞれ用例記憶部123から取得して出力する。
【0097】
次に、本実施の形態による機械翻訳処理の具体例について説明する。以下では、キャッシュメモリ122に図3に示すような情報が格納されており、「別の靴を見せてください。」を意味する日本語が入力された場合を例に説明する。
【0098】
この原文に対し、規則翻訳部103および用例翻訳部104は、それぞれ規則翻訳処理(ステップS502)、および用例翻訳処理(ステップS503)を実行する。図9は、このときの規則翻訳処理により生成された依存構造木の一例を示す説明図である。また、図10は、このときの用例翻訳処理により選択された用例と入力文との対応の一例を示す説明図である。
【0099】
規則翻訳部103が依存構造木を生成した時点では、全構成語(構成語数N=3)のうち、すべての構成語に複数の訳語候補が存在する(Ntw=3)。一方、構文的曖昧性は存在しない(Ns=1)。したがって、α=0.9、β=0.3として、この時点の確信度Crを上述の(1)式で算出すると、Cr=0.9*(1−0.3*3/3)=0.63となる。
【0100】
この後、ステップS605でアラインメント情報の適用を行うと、ノード901の訳語の曖昧性が解消され、Ntw=2となるため、確信度はCr=0.9*(1−0.3*2/3)=0.72に上昇する。ステップS610ではこの値が規則翻訳の翻訳結果の確信度として算出される。このように本実施の形態によれば、キャッシュメモリ122を参照することにより、規則翻訳の精度を向上させることができる。
【0101】
一方、用例翻訳処理では、図10に示すように、入力文1010に対して完全一致する用例が検索されず、類似する原言語用例1011と、原言語用例1011に対応する目的言語用例1012とが検索されたものとする。
【0102】
なお、この場合、用例翻訳部104は、入力文1010と原言語用例1011とで一致する要素1001および要素1002は置換しないが、相違部分である要素1004に対応する要素1007を要素1003に相当する英語の訳語に置換する(ステップS804)。同様に、用例翻訳部104は、相違部分である要素1006に対応する要素1008を要素1005に相当する英語の訳語に置換する(ステップS804)。
【0103】
用例翻訳部104は、上述の(2)式により用例翻訳の翻訳結果の確信度Ceを算出する(ステップS805)。図10の例では、要素1001(別の)と要素1002(別の)とは完全一致するため類似度は1である。また、要素1003(靴を)と要素1004(人を)との類似度が0.2、要素1005(見せてください)と要素1006(呼んでください)の類似度が0.1であったとすると、(2)式より、確信度として、Ce=(1+0.2+0.1)/3=0.43が得られる。
【0104】
なお、用例翻訳ではキャッシュ適用処理で適合する情報が存在しなかったものとすると、最終的な確信度は0.43のままとなる。このようにして得られた規則翻訳の確信度0.72と用例翻訳の確信度0.43とを比較することにより、選択部102aが、最終的に確信度の大きい規則翻訳の翻訳結果を選択する(ステップS504)。また、翻訳制御部102が、選択された規則翻訳の翻訳結果の付加情報をキャッシュメモリ122に登録する(ステップS505)。
【0105】
このように、本実施の形態にかかる機械翻訳装置では、規則翻訳および用例翻訳のそれぞれの翻訳結果から得られる単語の対応関係や場面情報、丁寧度などの付加情報をキャッシュメモリに保存し、以降の翻訳処理で付加情報を参照して翻訳の精度を向上させることができる。
【0106】
図11は、本実施の形態にかかる機械翻訳装置のハードウェア構成を示す説明図である。
【0107】
本実施の形態にかかる機械翻訳装置は、CPU(Central Processing Unit)51などの制御装置と、ROM(Read Only Memory)52やRAM53などの記憶装置と、ネットワークに接続して通信を行う通信I/F54と、各部を接続するバス61を備えている。
【0108】
本実施の形態にかかる機械翻訳装置で実行される機械翻訳プログラムは、ROM52等に予め組み込まれて提供される。
【0109】
本実施の形態にかかる機械翻訳装置で実行される機械翻訳プログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM(Compact Disk Read Only Memory)、フレキシブルディスク(FD)、CD−R(Compact Disk Recordable)、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録して提供するように構成してもよい。
【0110】
さらに、本実施の形態にかかる機械翻訳装置で実行される機械翻訳プログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよい。また、本実施の形態にかかる機械翻訳装置で実行される機械翻訳プログラムをインターネット等のネットワーク経由で提供または配布するように構成してもよい。
【0111】
本実施の形態にかかる機械翻訳装置で実行される機械翻訳プログラムは、上述した各部(入力受付部、翻訳制御部、規則翻訳部、用例翻訳部、出力部)を含むモジュール構成となっており、実際のハードウェアとしてはCPU51が上記ROM52から機械翻訳プログラムを読み出して実行することにより上記各部が主記憶装置上にロードされ、各部が主記憶装置上に生成されるようになっている。
【産業上の利用可能性】
【0112】
以上のように、本発明にかかる機械翻訳する装置、方法およびプログラムは、複数の翻訳方式を組み合わせて原言語文を目的言語に翻訳する機械翻訳装置、方法およびプログラムに適している。
【図面の簡単な説明】
【0113】
【図1】本実施の形態にかかる機械翻訳装置の構成を示すブロック図である。
【図2】辞書記憶部に格納された翻訳辞書のデータ構造の一例を示す説明図である。
【図3】キャッシュメモリに記憶される情報の一例を示す説明図である。
【図4】用例記憶部に記憶された用例のデータ構造の一例を示す説明図である。
【図5】本実施の形態における機械翻訳処理の全体の流れを示すフローチャートである。
【図6】本実施の形態における規則翻訳処理の全体の流れを示すフローチャートである。
【図7】キャッシュメモリに記憶される情報の別の例を示す説明図である。
【図8】本実施の形態における用例翻訳処理の全体の流れを示すフローチャートである。
【図9】規則翻訳処理により生成された依存構造木の一例を示す説明図である。
【図10】用例翻訳処理により選択された用例と入力文との対応の一例を示す説明図である。
【図11】本実施の形態にかかる機械翻訳装置のハードウェア構成を示す説明図である。
【符号の説明】
【0114】
51 CPU
52 ROM
53 RAM
54 通信I/F
61 バス
100 機械翻訳装置
101 入力受付部
102 翻訳制御部
102a 選択部
103 規則翻訳部
104 用例翻訳部
105 出力部
121 辞書記憶部
122 キャッシュメモリ
123 用例記憶部
901 ノード
1001、1002、1003、1004、1005、1006、1007、1008 要素
1010 入力文
1011 原言語用例
1012 目的言語用例

【特許請求の範囲】
【請求項1】
第1言語の用例と、前記第1言語の用例を翻訳した第2言語の用例とを対応づけて記憶する用例記憶部と、
第1言語による第1単語と、第2言語による第2単語とを対応づけた単語辞書を記憶する辞書記憶部と、
第1言語による第1言語文の入力を受付ける入力受付部と、
前記第1言語文に対応する前記第2言語の用例を前記用例記憶部から取得することにより、前記第1言語文を第2言語に用例翻訳する用例翻訳部と、
前記第1言語文に含まれる前記第1単語に対応する前記第2単語を前記辞書記憶部から取得し、予め定められた規則に基づいて、前記第1言語文に含まれる前記第1単語を、取得した前記第2単語に変換することにより、前記第1言語文を第2言語に規則翻訳する規則翻訳部と、
前記用例翻訳部の翻訳結果と前記規則翻訳部の翻訳結果とのうち、最も確からしい翻訳結果を選択する選択部と、
前記第1言語文に含まれる前記第1単語と、選択された翻訳結果に含まれる前記第2単語との間の対応関係を記憶する対応記憶部と、
選択された翻訳結果を出力する出力部と、を備え、
前記規則翻訳部は、さらに、他の第1言語文を第2言語に規則翻訳し、かつ、前記他の第1言語文に含まれる前記第1単語のそれぞれについて、前記第1単語に対応する前記第2単語を前記対応記憶部から取得し、取得した前記第2単語で前記第1単語を規則翻訳した前記第2単語を置換すること、
を特徴とする機械翻訳装置。
【請求項2】
前記辞書記憶部は、前記第1単語と、前記第2単語と、前記第2単語を使用する場面を表す第1場面情報とを対応づけた単語辞書を記憶し、
前記対応記憶部は、前記第1言語文を使用する場面を表す第2場面情報をさらに記憶し、
前記規則翻訳部は、前記第2場面情報を前記対応記憶部から取得し、前記第1言語文に含まれる前記第1単語と、取得した前記第2場面情報と一致する前記第1場面情報とに対応づけられた前記第2単語を前記辞書記憶部から取得し、前記規則に基づいて、前記第1言語文に含まれる前記第1単語を、取得した前記第2単語に変換することにより、前記第1言語文を第2言語に規則翻訳すること、
を特徴とする請求項1に記載の機械翻訳装置。
【請求項3】
前記対応記憶部は、前記第2場面情報を前記対応関係と対応づけて記憶し、
前記規則翻訳部は、最後に記憶された前記対応関係に対応づけられた前記第2場面情報を前記対応記憶部から取得し、前記第1言語文に含まれる前記第1単語と、取得した前記第2場面情報と一致する前記第1場面情報とに対応づけられた前記第2単語を前記辞書記憶部から取得し、前記規則に基づいて、前記第1言語文に含まれる前記第1単語を、取得した前記第2単語に変換することにより、前記第1言語文を第2言語に規則翻訳すること、
を特徴とする請求項2に記載の機械翻訳装置。
【請求項4】
前記辞書記憶部は、前記第1単語と、前記第2単語と、前記第2単語の意味内容の丁寧さの程度を表す第1丁寧度とを対応づけた単語辞書を記憶し、
前記対応記憶部は、前記第1言語文の意味内容の丁寧さの程度を表す第2丁寧度をさらに記憶し、
前記規則翻訳部は、前記第2丁寧度を前記対応記憶部から取得し、前記第1言語文に含まれる前記第1単語と、取得した前記第2丁寧度と一致する前記第1丁寧度とに対応づけられた前記第2単語を前記辞書記憶部から取得し、前記規則に基づいて、前記第1言語文に含まれる前記第1単語を、取得した前記第2単語に変換することにより、前記第1言語文を第2言語に規則翻訳すること、
を特徴とする請求項1に記載の機械翻訳装置。
【請求項5】
前記対応記憶部は、前記第2丁寧度と、前記第1言語文の発話者を識別する識別情報とを対応づけて記憶し、
前記入力部は、前記第1言語文とともに、前記第1言語文の発話者の前記識別情報の入力を受付け、
前記規則翻訳部は、受付けた前記識別情報に対応づけられた前記第2丁寧度を前記対応記憶部から取得し、前記第1言語文に含まれる前記第1単語と、取得した前記第2丁寧度と一致する前記第1丁寧度とに対応づけられた前記第2単語を前記辞書記憶部から取得し、前記規則に基づいて、前記第1言語文に含まれる前記第1単語を、取得した前記第2単語に変換することにより、前記第1言語文を第2言語に規則翻訳すること、
を特徴とする請求項4に記載の機械翻訳装置。
【請求項6】
前記入力受付部は、さらに、第2言語による第2言語文の入力を受付け、
前記規則翻訳部は、さらに、前記第2言語文に含まれる前記第2単語に対応する前記第1単語を前記辞書記憶部から取得し、前記規則に基づいて、前記第2言語文に含まれる前記第2単語を、取得した前記第1単語に変換することにより、前記第2言語文を第1言語に規則翻訳し、前記第2言語文に含まれる前記第2単語のそれぞれについて、前記第2単語に対応する前記第1単語を前記対応記憶部から取得し、取得した前記第1単語で前記第2単語を規則翻訳した前記第1単語を置換すること、
を特徴とする請求項1に記載の機械翻訳装置。
【請求項7】
前記用例翻訳部は、前記第2言語文に対応する前記第1言語の用例を前記用例記憶部から取得することにより、前記第2言語文を第1言語に用例翻訳し、
前記選択部は、さらに、前記第2言語文に対する前記用例翻訳部の翻訳結果と、前記第2言語文に対する前記規則翻訳部の翻訳結果とのうち、最も確からしい翻訳結果を選択し、
前記対応記憶部は、さらに、前記第2言語文に含まれる前記第2単語と、選択された翻訳結果に含まれる前記第1単語との間の対応関係を記憶すること、
を特徴とする請求項6に記載の機械翻訳装置。
【請求項8】
前記用例記憶部は、前記第1言語の用例と、前記第2言語の用例と、前記第2言語の用例の意味内容の丁寧さの程度を表す第1丁寧度とを対応づけて記憶し、
前記対応記憶部は、前記第1言語文の意味内容の丁寧さの程度を表す第2丁寧度をさらに記憶し、
前記用例翻訳部は、前記第2丁寧度を前記対応記憶部から取得し、取得した前記第2丁寧度と一致する前記第1丁寧度と、前記第1言語文と、に対応づけられた前記第2言語の用例を前記用例記憶部から取得すること、
を特徴とする請求項1に記載の機械翻訳装置。
【請求項9】
前記対応記憶部は、前記第2丁寧度と、前記第1言語文の発話者を識別する識別情報とを対応づけて記憶し、
前記入力部は、前記第1言語文とともに、前記第1言語文の発話者の前記識別情報の入力を受付け、
前記用例翻訳部は、受付けた前記識別情報に対応づけられた前記第2丁寧度を前記対応記憶部から取得し、取得した前記第2丁寧度と一致する前記第1丁寧度と、前記第1言語文と、に対応づけられた前記第2言語の用例を前記用例記憶部から取得すること、
を特徴とする請求項8に記載の機械翻訳装置。
【請求項10】
前記用例翻訳部は、さらに、翻訳結果の確からしさを表す第1確信度を算出し、
前記規則翻訳部は、さらに、翻訳結果の確からしさを表す第2確信度を算出し、
前記選択部は、前記第1確信度が前記第2確信度より大きいときは前記用例翻訳部の翻訳結果を選択し、前記第1確信度が前記第2確信度より小さいときは前記規則翻訳部の翻訳結果を選択すること、
を特徴とする請求項1に記載の機械翻訳装置。
【請求項11】
入力受付部によって、第1言語による第1言語文の入力を受付ける第1入力受付ステップと、
用例翻訳部によって、第1言語の用例と、前記第1言語の用例を翻訳した第2言語の用例とを対応づけて記憶する用例記憶部から、前記第1言語文に対応する前記第2言語の用例を取得することにより、前記第1言語文を第2言語に用例翻訳する用例翻訳ステップと、
規則翻訳部によって、第1言語による第1単語と、第2言語による第2単語とを対応づけた単語辞書を記憶する辞書記憶部から、前記第1言語文に含まれる前記第1単語に対応する前記第2単語を取得し、予め定められた規則に基づいて、前記第1言語文に含まれる前記第1単語を、取得した前記第2単語に変換することにより、前記第1言語文を第2言語に規則翻訳する第1規則翻訳ステップと、
選択部によって、前記用例翻訳ステップの翻訳結果と前記規則翻訳ステップの翻訳結果とのうち、最も確からしい翻訳結果を選択し、前記第1言語文に含まれる前記第1単語と、選択した翻訳結果に含まれる前記第2単語との間の対応関係を対応記憶部に記憶する選択ステップと、
出力部によって、選択された翻訳結果を出力する出力ステップと、
入力受付部によって、前記第1言語文の入力をさらに受付ける第2入力受付ステップと、
用例翻訳部によって、前記用例記憶部から、前記第2入力受付ステップにより受付けられた前記第1言語文に対応する前記第2言語の用例を取得することにより、前記第1言語文を第2言語に用例翻訳する第2用例翻訳ステップと、
規則翻訳部によって、前記辞書記憶部から、前記第2入力受付ステップにより受付けられた前記第1言語文に含まれる前記第1単語に対応する前記第2単語を取得し、前記規則に基づいて、前記第1言語文に含まれる前記第1単語を、取得した前記第2単語に変換することにより、前記第1言語文を第2言語に規則翻訳する第2規則翻訳ステップと、
規則翻訳部によって、前記第2入力受付ステップにより受付けられた前記第1言語文に含まれる前記第1単語のそれぞれについて、前記第1単語に対応する前記第2単語を前記対応記憶部から取得し、取得した前記第2単語で前記第1単語を規則翻訳した前記第2単語を置換する置換ステップと、
を備えたことを特徴とする機械翻訳方法。
【請求項12】
第1言語による第1言語文の入力を受付ける第1入力受付手順と、
第1言語の用例と、前記第1言語の用例を翻訳した第2言語の用例とを対応づけて記憶する用例記憶部から、前記第1言語文に対応する前記第2言語の用例を取得することにより、前記第1言語文を第2言語に用例翻訳する用例翻訳手順と、
第1言語による第1単語と、第2言語による第2単語とを対応づけた単語辞書を記憶する辞書記憶部から、前記第1言語文に含まれる前記第1単語に対応する前記第2単語を取得し、予め定められた規則に基づいて、前記第1言語文に含まれる前記第1単語を、取得した前記第2単語に変換することにより、前記第1言語文を第2言語に規則翻訳する第1規則翻訳手順と、
前記用例翻訳手順の翻訳結果と前記規則翻訳手順の翻訳結果とのうち、最も確からしい翻訳結果を選択し、前記第1言語文に含まれる前記第1単語と、選択した翻訳結果に含まれる前記第2単語との間の対応関係を対応記憶部に記憶する選択手順と、
選択された翻訳結果を出力する出力手順と、
前記第1言語文の入力をさらに受付ける第2入力受付手順と、
前記用例記憶部から、前記第2入力受付手順により受付けられた前記第1言語文に対応する前記第2言語の用例を取得することにより、前記第1言語文を第2言語に用例翻訳する第2用例翻訳手順と、
前記辞書記憶部から、前記第2入力受付手順により受付けられた前記第1言語文に含まれる前記第1単語に対応する前記第2単語を取得し、前記規則に基づいて、前記第1言語文に含まれる前記第1単語を、取得した前記第2単語に変換することにより、前記第1言語文を第2言語に規則翻訳する第2規則翻訳手順と、
前記第2入力受付手順により受付けられた前記第1言語文に含まれる前記第1単語のそれぞれについて、前記第1単語に対応する前記第2単語を前記対応記憶部から取得し、取得した前記第2単語で前記第1単語を規則翻訳した前記第2単語を置換する置換手順と、
をコンピュータに実行させる機械翻訳プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate


【公開番号】特開2008−176536(P2008−176536A)
【公開日】平成20年7月31日(2008.7.31)
【国際特許分類】
【出願番号】特願2007−8899(P2007−8899)
【出願日】平成19年1月18日(2007.1.18)
【出願人】(000003078)株式会社東芝 (54,554)
【Fターム(参考)】