翻訳装置及び翻訳プログラム

【課題】追加説明を含む入力文について、正しく翻訳できるようにすること。
【解決手段】翻訳装置は、入力文から追加説明部分を抽出する抽出手段と、入力文から前記抽出手段で追加説明部分が抽出され前記追加説明部分が除かれた文に、当該追加説明部分の位置を示す管理情報を付加する付加手段と、前記追加説明部分が除かれた文を翻訳する第1の翻訳手段と、前記抽出手段で抽出された追加説明部分を翻訳する第２の翻訳手段と、前記管理情報に基づいて、前記第１及び第２の翻訳手段の翻訳結果を合成する合成手段と、を具備することを特徴とする。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、翻訳装置及び翻訳プログラムに関する。
【背景技術】
【０００２】
特許文献１には、原文中に一つの固まりであった単語列に、下線のような属性情報としての付加情報が付与された文に対して翻訳処理を行った結果、言語の構造の違いにより語順が変わり、複数に分離してしまう問題に対し、入力文からタグ情報を取り除いたテキスト文を翻訳した後、訳文にタグ情報を挿入し、このタグ情報の訳文への復元の際に、本来1つのものが分離されても、文字列と付加情報との関係情報からまとまりを認識することで対処することが開示されている。
【先行技術文献】
【特許文献】
【０００３】
【特許文献１】特開平９ー２９３０７３号公報
【発明の概要】
【発明が解決しようとする課題】
【０００４】
本発明の目的とするところは、追加説明文などが文書に含まれていても、正しく翻訳することが可能な翻訳装置及び翻訳プログラムを提供することにある。
【課題を解決するための手段】
【０００５】
本発明の請求項１に係る翻訳装置は、入力文から追加説明部分を抽出する抽出手段と、入力文から前記抽出手段で追加説明部分が抽出され前記追加説明部分が除かれた文に、当該追加説明部分の位置を示す管理情報を付加する付加手段と、前記追加説明部分が除かれた文を翻訳する第1の翻訳手段と、前記抽出手段で抽出された追加説明部分を翻訳する第２の翻訳手段と、前記管理情報に基づいて、前記第１及び第２の翻訳手段の翻訳結果を合成する合成手段と、を具備することを特徴とするものである。
【０００６】
上記構成において、前記第1の翻訳手段が適切に翻訳できないときに、当該入力文を分割する分割手段と、前記分割手段で分割された各文を翻訳する第３の翻訳手段を具備することを特徴とするものである。
【０００７】
上記構成において、前記第１の翻訳手段は、第１言語の例文パターンとその対訳である第２言語の対訳例文パターンを例文パターン対訳組として記憶する例文パターン辞書を有し、前記例文パターン辞書を参照し、翻訳対象の文と前記例文パターンとをマッチングさせて翻訳する例文パターン翻訳装置であり、前記第２の翻訳手段は、第１の言語の単語とその対訳である第２の言語の単語を単語組として記憶する単語対訳辞書、第１言語の例文とその対訳である第２言語の対訳例文を例文対訳組として記憶する例文辞書、第１言語の句パターンとその対訳である第２言語の対訳句パターンを句パターン対訳組として記憶する句パターン対訳辞書及び前記例文パターン辞書の少なくとも１つを参照して翻訳を行う句翻訳装置であることを特徴とするものである。
【０００８】
本発明の請求項４に係る翻訳プログラムは、コンピュータを、入力文から前処理として追加説明部分を抽出する抽出手段と、入力文から前記抽出手段で追加説明部分が抽出され追加説明部分が除かれた文を翻訳する第１の翻訳手段と、前記抽出手段で抽出された追加説明部分を翻訳する第２の翻訳手段と、前記第1及び第2の翻訳手段の翻訳結果を合成する合成手段として機能させることを特徴とするものである。
【発明の効果】
【０００９】
請求項1の構成によれば、追加説明などを含んだ入力文書についても、本構成を有しない場合に比較して、正しく翻訳できる。
【００１０】
請求項２の構成によれば、１つの文に複数の文を含んだ入力文書についても、本構成を有しない場合に比較して、正しく翻訳できる。
【００１１】
請求項３の構成によれば、比較的簡単な辞書で、追加説明などを含んだ入力文書についても、本構成を有しない場合に比較して、正しく翻訳できる。
【００１２】
請求項４の構成によれば、追加説明などを含んだ入力文書についても、本構成を有しない場合に比較して、正しく翻訳できる。
【図面の簡単な説明】
【００１３】
【図１】本実施例の翻訳装置の機能的な構成例を示すブロック図である。
【図２】翻訳装置の処理手順を示すフローチャートである。
【図３】前処理部の処理手順前段を示すフローチャートである。
【図４】前処理部の処理手順後段を示すフローチャートである。
【図５】分割部の処理手順を示すフローチャートである。
【図６】(ａ)訳文合成部、(ｂ)訳文生成部の処理手順を示すフローチャートである。
【図７】例文対訳辞書のデータ構造を示す説明図である。
【図８】例文パターンのデータ構造を示す説明図である。
【図９】例文パターン対訳辞書のデータ構造を示す説明図である。
【図１０】例文パターン翻訳部に利用可能な翻訳装置の全体構成を示すブロック図である。
【図１１】翻訳装置１００１の主要部の詳細構成を示すブロック図である。
【図１２】翻訳装置の主要部処理手順前段を示すフローチャートである。
【図１３】翻訳装置の主要部処理手順後段を示すフローチャートである。
【図１４】句翻訳部の詳細構成を示すブロック図である。
【図１５】句翻訳部の処理手順を示すフローチャートである。
【図１６】翻訳装置の一ハードウエア構成を示すブロック図である。
【図１７】課題を入力文例で示す説明図である。
【図１８】例１、例２の入力文例の場合における処理例を示す説明図である。
【図１９】例３、例４の入力文例の場合における処理例を示す説明図である。
【発明を実施するための形態】
【００１４】
まず、本発明を実施するための最良の形態を、具体な入力文例を挙げて説明する。
【００１５】
まず、文の最後に追加説明(例１)や途中に追加説明(例２)のパターンがある場合である。
例１：“ ３が４の右側にあることを確認する(全部品対象) ”
例２：“ ３と５のハーネス(図Aに示す)はロックしないこと ”
ここで、例文パターンベース翻訳エンジンを用いて、文(センテンス)を翻訳するとする。例１の場合最適な例文パターンが、
“NP1 が NP2 にあることを確認する”
であるが、例文１の入力文と完全にマッチングできない。つまり、“(全部品対象)”がマッチングできない。もし、マッチングの距離値がパターンベース翻訳エンジンのマッチング閾値を越えると、上記例文パターンは、翻訳用候補として抽出されない。
例２の場合に例文パターンとして、たとえば、
(１)“NP1 に示す NP2 はロックしないこと”
(２)“NP1 と NP2 はロックしないこと”
の二つを挙げられる。しかし、例文パターン(１)は、例文２の入力文と完全にマッチングできない。もちろん、最適な例文パターン（２）にも完全にマッチング可能である。しかし、最適な例文パターン(２)のマッチング項目数(6個)が、例文パターン(１)のマッチング項目数(7個)より１個少ないので、最適な例文パターン(２)は選ばれない。
文の最後に追加説明がある別の場合として、次の例３の入力文がある。
例３：
この場合について図１７を参照して説明する。
中国文；図１７に示す、
日本語訳文；１に異物がある《2008-1-29 19:54:59》
ここで、《2008-1-29 19:54:59》はトラブル発見したときの時刻を示す。
この例３の場合に、例文パターンとして、
中国語パターン；NP1 内有 NP2，
日本語パターン； NP1 に NP2 がある
が挙げられ、翻訳結果は、
１に異物《2008-1-29 19:54:59》がある
となってしまい、正確に翻訳できない。
【００１６】
次に、議事録などで、1つの文にコンマや読点などで区切られて複数の文(センテンス)を含む入力文例を説明する。
【００１７】
この場合の入力文の具体例として、例４を挙げる。
例４：“材料メーカに追加確認すること，出荷の時に保護部材を強化して衝突損害を防止する”
このように、実際の文書には、センテンス単位が正しく表記されていない場合があり、翻訳が難しくなる。
【００１８】
なお、本書において「句」の語は、二つ以上の単語からなる句、句を内在する句を含むものとする。言語学上、文が節、句を含み、節が句を含む、句が句を含まない。本明細書には、句の定義が言語学上の定義ではない、二つ以上の単語からなる単語列、かつ、句が句を含んでもよいと定義する。
【００１９】
以下、本発明を実施するための最良の形態を、図に示す実施例を参照して説明する。
【実施例】
【００２０】
図１は本発明の実施例に係る翻訳装置の機能的な構成を示すブロック図である。本実施例の翻訳装置１００は、異なる方式による複数の翻訳エンジンとしての翻訳部を直列に複数段設けたものである。翻訳装置１００は、入力部１、翻訳メモリ翻訳部２、前処理部３、例文パターン翻訳部４、分割部５、句翻訳部６、訳文合成部7、訳文生成部８、出力部９及び記憶部１０を含んで構成される。
【００２１】
入力部１は、翻訳対象の文を入力する。翻訳メモリ翻訳部２は、入力された文Ｓと記憶部１０に記憶された例文対訳辞書とを照合して一致または類似する例文の訳文を出力する。翻訳が成功した場合には、出力部９へ送り、失敗した場合には、入力文を次段に送る。なお、翻訳メモリ翻訳装置の詳細としては、例えば、特開２００８−６５３９５に開示されたものがある。
【００２２】
前処理部３は、翻訳メモリ翻訳部２で翻訳が失敗した場合に入力された文Ｓの前処理を行い、追加説明部分(Ｔ(ｎ)、接尾辞Ｐｆｉｘ)と、追加説明部分の位置などを示す管理情報としてダミー変数Ｔｉを付加した文Ｓ１とに振り分け、前者を句翻訳部６へ、後者を例文パターン翻訳部４へ送る。詳細は後述する。
【００２３】
例文パターン翻訳部４は、前処理部３から入力された文Ｓと、記憶部１０に記憶された例文パターン対訳辞書とを照合して翻訳結果の入力文Ｓ１の訳文を出力する。詳細構成は後述する。
【００２４】
分割部５は、例文パターン翻訳部４で翻訳が失敗したとき、入力文を分割し、分割文をバッファメモリ(図示せず)に一時的に記憶する。
【００２５】
句翻訳部６は、入力句や文を記憶部１０内の辞書を参照して翻訳する翻訳エンジンであり、前処理部３からの追加説明部分(Ｔ(ｎ)、接尾辞Ｐｆｉｘ)を翻訳する翻訳部Ａ６aと、分割部５で分割された分割文Ｓ１ｍを翻訳する翻訳部Ａ６ｂとを備え、翻訳結果をバッファメモリ(図示せず)に一時的に記憶する。
【００２６】
訳文合成部７は、翻訳部Ａ６ａからの追加説明部分(Ｔ(ｎ)、Ｐｆｉｘ)の訳と、例文パターン翻訳部４からの文Ｓ１の訳文とを合成して入力文Ｓの訳文を作成する。訳文生成部８は、追加説明部分(Ｔ(ｎ)、接尾辞Ｐｆｉｘ)の訳を用いて分割文Ｓ１ｍを切り替え、入力文Ｓの訳文を作成する。
【００２７】
出力部９は、翻訳メモリ翻訳部２、訳文合成部７および訳文生成部８からの文Ｓの訳文を出力する。例えば、表示部への入力文Ｓの訳文の可視表示または可聴表示や、画像形成装置や外部装置などへの出力を行う。
【００２８】
記憶部１０は、翻訳辞書として、単語対訳辞書、例文対訳辞書、句対訳辞書、例文パターン対訳辞書、句パターン対訳辞書などを備える。単語対訳辞書は、第１の言語の単語とその対訳である第２の言語の単語を単語組として記憶する。句対訳辞書は、第１言語の句とその対訳である第２言語の対訳句を句対訳組として記憶する。例文辞書は、第１言語の例文とその対訳である第２言語の対訳例文を例文対訳組として記憶する。句パターン対訳辞書は、第１言語の句パターンとその対訳である第２言語の対訳句パターンを句パターン対訳組として記憶する。例文パターン辞書は、第１言語の例文パターンとその対訳である第２言語の対訳例文パターンを例文パターン対訳組として記憶する。
【００２９】
図２のフローチャートを参照して本実施例の翻訳装置１００の動作を説明する。
【００３０】
まず、入力部1から入力された文Ｓが翻訳メモリ翻訳部２で記憶部１０の例文対訳辞書と照合して翻訳される(Ｓ１、Ｓ２)。ここで、翻訳が成功すれば、その翻訳結果は、出力部９に送られて出力される(Ｓ１０)。この場合、翻訳の信頼性は例えば1.0である。翻訳に失敗すれば、入力文Ｓは、前処理部３に送られる。前処理部３では、入力文S対して所定のパターンを抽出するなどの前処理を行う。詳細は後述する。前処理後の文Ｓ１、追加説明などの切り替え項目T(1),T(2),…T(n)、接尾辞Pfix及び句読点Kを生成する(Ｓ３)。生成された文Ｓ１は、例文パターン翻訳部４に送られ、追加説明部分の切り替え項目T(1),T(2),…T(n),Pfix及び句読点Kは、句翻訳部６の句翻訳エンジンとしての翻訳部Ａ６ａへ送られる。翻訳部Ａ６ａでは、記憶部１０の例文パターン対訳辞書や句例文パターン対訳辞書などを参照して切り替え項目T(1),T(2),…T(n)、接尾辞Pfixをそれぞれ翻訳する(Ｓ４)。
【００３１】
例文パターン翻訳部４では、例文パターンベース翻訳エンジンを用いて例文パターン対訳辞書を照合し文Ｓ１を翻訳する(Ｓ５)。ここで、翻訳に成功すれば、訳文合成部７で、T(1),T(2),…T(n)の訳文を用いて、文S1の訳文の中にあるT1,T2,…Tn変数をそれぞれ切り替え、接尾辞Pfixの訳文と句読点Kを文Sの最後に追加し，文Sの訳文を生成する(Ｓ６)。
【００３２】
例文パターン翻訳部４で翻訳に失敗すれば、分割部５で、文Ｓ1を分割して、分割文S11,S12,…S1mを生成する(Ｓ７)。その後、句翻訳部６の句翻訳エンジンとしての翻訳部Ｂ６ｂを用いて分割文S11,S12,…S1mをそれぞれ翻訳する(Ｓ８)。その後、訳文生成部８で、追加説明T(1),T(2),…T(n)の訳文を用いて、 S11,S12,…S1mの訳文の中にあるT1,T2,…Tn変数をそれぞれ切り替え、接尾辞Pfixの訳文と句読点KをS1mの最後に追加し、文Ｓの訳文を生成する(Ｓ９)。
【００３３】
ステップＳ２、Ｓ６、Ｓ９で、文Ｓの訳文が生成されると、訳文は出力部９に送られて出力される(Ｓ１０)。
【００３４】
次に図３、図４のフローチャートを参照して前処理部３の詳細処理を説明する。
【００３５】
前処理部３で、文Sに、もし、特定パターンの範囲を示す括弧などの、ある引用記号ペアの内に他の引用記号を含んだ場合は、一番外側の引用記号ペアを抽出する。通常は、左から右へ入力文Sを走査して判定を行うものとし、入力文に半角記号と全角記号が混在する場合、半角記号と全角記号を事前に統一して行うものとする。
【００３６】
まず、入力文Ｓが前段の翻訳メモリ翻訳部２から前処理部３に入力されると、前処理部３は、i=1とする(Ｓ１１)。入力された文Sの中に、もし、追加説明などを示す特定のパターン”xxx”(引用パターンとも呼ぶ)があれば、T(i)=xxx,T1(i)=左側の引用記号, T2(i)=右側の引用記号、”Ti”とし、これらでSの引用パターン”xxx”を切り替える(Ｓ１２a)。次に、文Sの中に、同様の特定のパターン[xxx]があれば、iを更新し(i++；iに１を増やす、以下同じ意味を表す)、T(i)=xxx,T1(i)=左側の引用記号, T2(i)=右側の引用記号,”Ti”で、Sの特定のパターン[xxx]を切り替える(Ｓ１２ｂ)。
【００３７】
以下同様に、文Sの中に、特定のパターン(xxx)があれば，i++;T(i)=xxx, T1(i)=左側の引用記号, T2(i)=右側の引用記号,”Ti”で、文Ｓ中の特定のパターン(xxx)を切り替える(Ｓ１２ｃ)。文Sの中に、特定のパターン(xxx)があれば、i++;T(i)=xxx, T1(i)=左側の引用記号, T2(i)=右側の引用記号,”Ti”で、文Ｓ中の特定のパターン(xxx)を切り替える(Ｓ１２ｃ)。文Ｓの中に、特定のパターン《xxx》があれば、i++;T(i)=xxx,T1(i)=左側の引用記号, T2(i)=右側の引用記号,”Ti”で、文Ｓ中の特定のパターン《xxx》を切り替える(Ｓ１２ｄ)。文Ｓの中に、特定のパターン〈xxx〉があれば、i++;T(i)=xxx,T1(i)=左側の引用記号, T2(i)=右側の引用記号,”Ti”で、文Ｓ中の特定のパターン〈xxx〉を切り替える(Ｓ１２e)。文Ｓの中に、特定のパターン＜xxx＞があれば、i++;T(i)=xxx,T1(i)=左側の引用記号, T2(i)=右側の引用記号,”Ti”で、文Ｓ中の特定のパターン＜xxx＞を切り替える(Ｓ１２ｆ)。文Ｓの中に、特定のパターン『xxx』があれば、 i++; T(i)=xxx,T1(i)=左側の引用記号, T2(i)=右側の引用記号,”Ti”で、文Ｓ中の特定のパターン『xxx』を切り替える(Ｓ１２ｇ)。文Ｓの中に、特定のパターン「xxx」があれば、 i++; T(i)=xxx,T1(i)=左側の引用記号, T2(i)=右側の引用記号,”Ti”で、文Ｓ中の特定のパターン「xxx」を切り替える(Ｓ１２ｈ)。
【００３８】
もし、文の右から連続な特定のパターン(xxx), 《ｙｙｙ》…があれば、
Pfix= (xxx), 《ｙｙｙ》…
とし、文Ｓから接尾辞Pfixを削除する。また、文の最後に句読点があれば、その句読点も変数Kに保存し、文Ｓから句読点を削除する(Ｓ１３)。
【００３９】
次に、連続記号列S(スペース記号を含む)を抽出し、
Ei=yyy xxx 12%+2=6
とする(Ｓ１４)。
【００４０】
特定のパターンがT1,T2,…,TnやE1,E2,…Emで切り替えられ、接尾辞Postfixや句読点が削除された文S1をこれらの切り替えられたダミー変数などの管理情報と共に次段の例文パターン翻訳部４に出力すると共に、特定のパターンや接尾辞を次段の句翻訳部６に出力する(Ｓ１５)。
【００４１】
次に図５のフローチャートを参照して分割部５の詳細手順について説明する。
【００４２】
まず、文Ｓ１が入力され、入力された文Ｓ１を半角の記号, ; : 、スペース記号及び全角の記号, ; : 、スペース記号を用いて分割する(Ｓ２１、Ｓ２２)。分割された文をS11,S12,…S1mとしてバッファメモリ(図示せず)にそれぞれ格納し、対応する翻訳エンジンとしての句翻訳部６の翻訳部Ｂ６ｂに分割文S11,S12,…S1mの格納終了を通知する(Ｓ２３)。
【００４３】
次に図６(ａ)のフローチャートを参照して訳文合成部７の詳細手順について説明する。
【００４４】
まず、前段の句翻訳部６の翻訳Ａ６ａが翻訳した追加説明などのT(1),T(2),…T(n)の訳文や接尾辞Pfixの訳文をバッファメモリ(図示せず)から取得すると共に、同様に、前段の例文パターン翻訳部４から文Ｓ１の訳文を取得する(Ｓ３１)。次に、取得した追加説明などのT(1),T(2),…T(n)の訳文を用いて、文S1の訳文の中にあるT1,T2,…Tn変数をそれぞれ切り替え、接尾辞Pfixの訳文と句読点Kを文Sの最後に追加し、文Sの訳文を合成し、合成結果を出力部９に転送する(Ｓ３２、Ｓ３３)。
【００４５】
次に図６(ｂ)のフローチャートを参照して訳文生成部８の詳細手順について説明する。
【００４６】
まず、句翻訳部６の翻訳Ａ６ａが翻訳した追加説明などのT(1),T(2),…T(n)の訳文や接尾辞Pfixの訳文をバッファメモリ(図示せず)から取得すると共に、翻訳Ｂ６ｂが翻訳したS11,S12,…S1mの訳文を取得する(Ｓ３５)。次にT(1),T(2),…T(n)の訳文を用いて、 S11,S12,…S1mの訳文の中にあるT1,T2,…Tn変数をそれぞれ切り替え、接尾辞Pfixの訳文と句読点Kを分割文S1mの最後に追加し、文Ｓの訳文を生成し、生成結果の訳文Ｓを出力部９に転送する(Ｓ３６、Ｓ３７)。
【００４７】
次に例文パターン翻訳部４および句翻訳部６の詳細について述べる。
【００４８】
まず、各翻訳部の詳細を説明する前に、記憶部１０の例文対訳辞書及び例文パターン対訳辞書のデータ構造の一例について述べる。
【００４９】
図７に例文対訳辞書のデータ構造例を示す。複数のレコードから成り、各レコードは、第１言語の例文Ｔ１と、この例文Ｔ１の訳文となる第２言語の例文Ｔ２とを含む。
【００５０】
次に例文パターン対訳辞書のデータ構造について説明する。図８に例文パターンのデータ構造例を示す。同図において、例文パターンＰＥは、例文ＳＥ１からＳＥ４を類別するパターンである。
【００５１】
例文パターンＰＥは、類別される例文に共通な単語、又は節で構成される固定部分ＰＦと、固定部分ＰＦではない単語又は節であるが、類別される例文間で品詞が共通する単語又は節で構成される可変部分ＰＶとで構成される。可変部分ＰＶは、それらの品詞が共通する単語又は節を、例えば、Ｖ１及びＶ２といった記号を用いて表す。
【００５２】
よって、例文パターンＰＥは類別される例文に共通な文字列で構成され、可変部分ＰＶは類別される例文に共通しない文字列を表す記号（以下単に、非共通文字列という）で構成される。つまり、非共通文字列は、例文パターンを構成する共通文字列以外の文字列をいう。
【００５３】
ここで、節とは、文法上、従位接続詞や関係詞が導く文であって、主語と述語とが一組になり完結した文をいう。しかし本実施例では、動詞、形容詞、及び形容動詞である単語とそれらに付随して使用される助詞、助動詞、及び補助動詞である単語とを合わせて節といい、それぞれ動詞節、形容詞節、及び形容動詞節という。また、節の品詞とは、動詞節、形容詞節、及び形容動詞節のいずれかへ節を分類した区分けをいう。
【００５４】
具体的には、図８に示すように、「渡してください」という節ＳＣ１から４及びＰＣは、「渡す」という動詞である単語、「て」という接助詞である単語、及び「くださる」という補助動詞である単語で構成される。
【００５５】
また、動詞である単語「渡す」とそれに付随して使用される単語「て」及び「くださる」とで構成される節ＳＣ１から４及びＰＣの品詞を動詞節という。
【００５６】
固定部分ＰＦは、例文に共通な単語又は節のみならず、その同義語を表すＦＩＸ内容情報、可変部分であるか固定部分であるかを表すＴＹＰＥ情報、並びに固定部分を構成する単語の品詞を表す品詞情報、固定部分を構成する単語が属している語彙体系を表す情報である言語体系属性名等で構成される。
【００５７】
可変部分ＰＶは、共通する品詞を表す情報である変数名情報、及び可変部分であるか固定部分であるかを表すＴＹＰＥ情報、可変部分の語彙体系属性名等で構成される。語彙体系の言語としては、日本語語彙体系(Ｊ)、中国語語彙体系(Ｃ)などのように、挙げられる。
【００５８】
本記実施例において、変数名情報は、共通する品詞が名詞であることを表す名詞フレーズ(例えば、名詞句の変数名；ＮＰ、変数名ＩＤ；１)、形容詞であることを表す形容詞フレーズ(例えば、形容詞句の変数名；ＡＰ、変数名ＩＤ；２)、及び副詞であることを表す副詞フレーズ(例えば、副詞句の変数名；ＤＰ、変数名ＩＤ；３)を含む。
【００５９】
また、本実施例において、可変部分ＰＶは、類別される例文間で品詞が共通する単語又は節で構成されるとして説明したが、これに限定される訳ではなく、共通する性質の内容を表す単語又は節で構成される実施例を採用できる。共通する性質の内容を表す単語又は節の具体例としては、例えば、時間、数量、地名、又は人名を表す単語又は節を挙げることができる。
【００６０】
次に例文パターン対訳辞書のデータ構造例について図９を参照して説明する。同図に示すように、例文パターン対訳辞書６３は、レコード１からｎで構成される。レコード１からｎは、第１言語で表された例文パターンＴ１と、例文パターンＴ１を第２言語に翻訳した訳文パターンとしての例文パターンＴ２と、例文パターンＴ１及び例文パターンＴ２のペア(組)を識別するＩＤと、例文パターンＴ１及びＴ２を構成する単語等である文字列の対応関係を表す対応関係情報Ｆ２とを関連付けて保存する。
【００６１】
レコード１からｎが保存する対応関係情報Ｆ２について説明する。ここでは、例文パターンＴ１が単語等である５つの文字列 a1 から a5 で構成され、かつ例文パターンＴ２が単語等である６つの文字列 b1 から b6 で構成されている場合を例に挙げて説明を行う。
【００６２】
対応関係情報Ｆ２は、文字列が例文パターンＴ１及び対訳としての例文パターンＴ２において使用される順番を用いて文字列の対応関係を表す。
【００６３】
具体的には、例文パターンＴ１で n 番目に使用される文字列 an が表す意味と、例文パターンＴ２で m 番目に使用される文字列 bm が表す意味とが同じである場合には、対応関係を「(n:m)」として表す。
【００６４】
また、例文パターンＴ１で n 番目に使用される文字列 an が表す意味と、例文パターンＴ２で m 番目及び m+1 番目に使用される２つの文字列が表す意味とが同じ意味を表す場合には、「(n:m,m+1)」として表す。
【００６５】
逆に、例文パターンＴ１で n 番目及び n+1 番目に使用される２つの文字列 an 及び an+1が表す意味と、対訳例文パターンＴ２で m 番目に使用される文字列 bm が表す意味とが同じ意味を表す場合には、「(n,n+1:m)」として表す。
【００６６】
同様に、例文パターンＴ１で n 番目及び n+1 番目に使用される２つの文字列 an 及び an+1が表す意味と、例文パターンＴ２で m 番目及び m+1 番目に使用される２つの文字列が表す意味とが同じ意味を表す場合には、「(n,n+1:m,m+1)」として表す。
【００６７】
本実施例では、例文パターンＴ１で使用される１つの文字列と例文パターンＴ２で使用される１つの文字列とが同じ意味を表す場合、１つの文字列と２つの文字列とが同じ意味を表す場合、２つの文字列と１つの文字列とが同じ意味を表す場合、２つの文字列と２つの文字列とが同じ意味を表す場合の対応関係を表す表記方法について説明したが、これに限定される訳ではない。
【００６８】
例えば、j個（j>=1)の文字列とk個（k>=1)の文字列とが同じ意味を表す場合には、一般的に、「(n,n+1,…,n+j:m,m+1,…,m+k)」として表す構成を採用できる。
【００６９】
更に、例文パターンＴ１で n 番目に使用される文字列 an が表す意味と同じ意味を表す文字列が例文パターンＴ２で使用されない場合には、「(n:0)」として表す。また逆に、例文パターンＴ２で m 番目に使用される文字列 bm が表す意味と同じ意味を表す文字列が例文パターンＴ１で使用されない場合には、「(0:m)」として表す。
【００７０】
図１０に示す具体な対応関係情報
F2(T１,T2) = { (1:1),(2:3),(3:4,5),(5:6),(4:0),(0:2) }
について説明する。対応関係情報 F2(T1,T2) は、例文パターンT1で１番目に使用される文字列 a1 の表す意味が例文パターンT2で１番目に使用される文字列 b1 の意味と同じであり、これらは対応する。同様に、例文パターンT1で２番目に使用される文字列 a2 の表す意味が例文パターンT2で３番目に使用される文字列 b3 の意味と同じであり、例文パターンT1で３番目に使用される文字列 a3 の表す意味が例文パターンT2で４番目及び５番目に使用される文字列 b4 及び b5 の意味と同じであり、例文パターンT1で５番目に使用される文字列 a5 の表す意味が例文パターンT2で６番目に使用される文字列 b6 の意味と同じであり、それぞれ対応する。さらに例文パターンT1で４番目に使用されるa4 と同じ意味を表す文字列が例文パターンT2で使用されず、かつ例文パターンT2で２番目に使用される文字列 b2 と同じ意味を表す文字列が例文パターンT1で使用されないという対応関係を表す。対応関係さえ表現できれば、どのような表現でもよく、本発明に係る翻訳装置等は、以上述べた表現に限定されない。
【００７１】
図１０の翻訳システム１０aの構成に含む翻訳装置１００１は、例文と例文パターンのマッチグ処理を行っている例文パターン翻訳装置(部)に適用できる。図１０乃至図１３を参照して翻訳装置１００１を説明する。図１１は翻訳装置１００１の主要部の構成を示す詳細ブロック図である。
【００７２】
まず、解析部１２００は、入力装置３０００から入力された第1言語の文書情報を形態素解析し、入力文を構成する単語を切り分け，単語の品詞を付与するなどの処理をする。
【００７３】
検索部１３００は、解析部１２００の解析結果および記憶部１１００の記憶内容を参照して、入力文と類似な第1言語の例文パターン候補（1または複数ある）を抽出する。
【００７４】
変換部１４０１は、第1言語の入力文と抽出された第1言語の例文パターンの候補を用いて，入力文の節を求める。第1言語入力文を第1言語例文パターンとの間の相違を求めるために，第1言語例文パターンに基づいて第1言語入力文を変換する。第1の実施例の変換部１４００との相違点は、後述する。
【００７５】
算出部１５００は変換部１４０１で変換された第1言語入力文の単語/節の列と第1言語例文パターンの候補間の相違として距離を求める。最小な相違を決める第1言語入力文の単語/節の列と、抽出された第1言語の例文パターン候補間の変換写像を求める。ここで，最小な相違値としての距離値を与える例文パターン候補が複数ある場合があるし、最小な相違値を決める例文パターン候補と入力文の単語/節の列間の変換写像が複数ある場合もある。
【００７６】
抽出部１６００は、第1言語入力文の単語/節の列と第1言語例文パターン間の対応関係を求める。第1言語入力文の単語/節の列と抽出された第1言語の例文パターン候補間の対応関係(写像)を求める。抽出部１６００は、内部構成として、実抽出部１６１０(図示せず)、関係特定部１６２０(図示せず)および関係選択部１６３０を含む。実抽出部１６１０は、検索部１３００が検索した例文パターンから１つのパターンを抽出し、算出部１５００が計算した第２の指標である入力文と例文パターンとの距離が、最も近い例文パターンを抽出する。関係特定部１６２０は、入力文Ｓ’を構成する変換後の文字列と入力文Ｓを類別する例文パターンＡを構成する文字列との対応関係を特定する。最終段の関係選択部１６３０は第1言語入力文の単語/節の列と抽出された第1言語の例文パターン候補間の対応関係が複数ある場合は，適切な対応関係を選択する。即ち、関係特定部１６２０から、対応関係集合を取得すると共に、変換された入力文、例文パターン、対訳例文パターン、及び対応関係情報を取得する。取得した対応関係情報から、割り当てたスコアが最大の値をとる対応関係情報を選択する。
【００７７】
判定修正部１８００は、判定部１８１０、修正部１８２０および最適関係選択部１８３０を含んで構成される。判定修正部１８００は、関係選択部１６３０の選択結果および記憶部１１００の記憶内容を参照して、選択結果を判定し、修正が必要な場合は、修正して算出部１５００に戻すことにより、再度対応関係を得るものである。
【００７８】
判定部１８１０は、関係選択部１６３０の選択結果について、第１言語入力文の単語/節の列と第１言語例文パターン間の対応関係を再計算するかどうかを判定する。
【００７９】
修正部１８２０は、第1言語入力文の単語/節の列を修正して，修正後の第1言語入力文の単語/節の列と第1言語例文パターン間の相違をもう一度計算し，新しい距離値を定めるために第1言語入力文の単語/節の列と第1言語例文パターン間の対応関係を求める。
【００８０】
最適関係選択部１８３０は、すべての例文パターンの候補と第1言語入力文の単語/節の列間の対応関係集合から，最適な対訳関係選択する。この選択により求められた例文パターン対訳ベアの番号と第1言語入力文の単語/節の列と抽出された第1言語の例文パターン間の対応関係を出力する。
【００８１】
記憶部１１００は、第１の実施例と同様なデータ構成を有し、記憶内容としては、例文対訳辞書および例文パターン対訳辞書を含む。例文パターン対訳辞書は、例えば、例文パターン、訳文パターン、および例文パターンと訳文パターン間の対応関係を一組として記憶している．これを例文パターン対訳ペアと呼ぶ。
【００８２】
翻訳部１７００は、最適関係選択部１８３０で選択された第1言語入力文の単語/節の列と第1言語例文パターン間の対応関係、第1言語例文パターンとそのパターンに対応している訳語言語の例文パターン間の対応関係を用いて、第1言語入力文の単語/節の列と訳語言語の例文パターン間の対応関係を求め、可変部分を翻訳して、訳文を生成する。
【００８３】
次に図１２および図１３のフローチャートを参照して、翻訳装置１００１の要部の動作を説明する。
【００８４】
形態素解析済みの入力文Sが検索部１３００に入力されと、検索部１３００は、入力文ｓに対応する例文パターン候補Aset、即ち、Dmin, F1set(S)，F1set(S’), F1set(S’,A)などを初期化する（Ｓ３０１、Ｓ３０２）。更に例文パターン候補Asetから例文パターン候補Aが取り出され、変換部１４０１により、パターンAに対応する入力文SをS’とする（Ｓ３０３、Ｓ３０４）。この入力文S’とAの間の距離D１を算出部１５００により求める。求めた距離D1がDmin最小値より小さいかどうか判断する（Ｓ３０６）。小さい場合には、F1set(S’,A)およびF1set(S’)をヌル値（NULL）即ち空値とし、D1をDminとした後、抽出部１６００で文S’と例文パターンAの間の対応関係(写像)を求める（Ｓ３０７、Ｓ３０９）。
【００８５】
更に、求めた距離値Dimを定める写像をF1set(S’,A)に格納する。選択部１６３０で、F1set(S’,A)にある不適切な写像を削除する（Ｓ３１０）。得られたF1set(S’,A)をF1set(S’)に入れる。
即ち、F1set(S’)＝ F1set(S’)＋F1set(S’,A)
【００８６】
その後、または、ステップＳ３０６で大きいと判断した場合には、Asetの候補をすべて処理したかどうかを判断し、未処理があれば、候補Ａを取り出し上記処理を行い、すべて処理済みであれば、次のステップに進む。
【００８７】
次に、判定部１８１０で、F1set(S’)の中から一つの写像F1i(S’,A)を取り出し、F1i(S’,A)に対して，再計算する必要があるかどうかを判定する（Ｓ３１１、Ｓ３１２）。再計算する必要がある場合には、修正部１８２０で、F1i(S’,A)と候補Ａを参考して、文S’を修正し、これを修正後の文S’’とする（Ｓ３１３）。
即ち、F1set(S’,A)＝F1set(S’,A)-F1i(S’,A)
【００８８】
修正後の文S’’と候補Aの間の相違を算出部１５００で求める（Ｓ３１４）。求めた相違としての距離値をD2とする。距離値D2が最小値Dminより小さいかどうかを判断する（Ｓ３１５）。小さい場合には、文S’’と候補Aの間の対応関係(写像)F1set(S’’,A)を求める（Ｓ３１６）。その後、Dmin=D2であれば、F1set(S)=F1set(S)+F1set(S’’,A)とし、Dmin>D2であれば、F1set(S)=F1set(S’,A)およびDmin=D2とする（Ｓ３１７）。
【００８９】
ステップＳ３１７の処理の終了後、ステップＳ３１５で、大きいと判断した場合、およびステップＳ３１２で再計算の必要がないと判断した場合には、F1set(S’)の写像をすべて処理したかどうかを判断する（Ｓ３１８）。未処理があれば、ステップＳ３１２に戻り処理を行う。処理済であれば、F1set(S)がNULLであれば、F1set(S)= F1set(S’,A)とした後、最適関係選択部１８３０で、F1set(S)から最適な写像（対応関係）を求め、求めた写像をF1res(S,A)に入れる（Ｓ３１９、Ｓ３２０）。
【００９０】
次に句翻訳部６を、異なる方式による翻訳エンジンとしての複数段の翻訳部１０３〜１０８を直列に接続した場合の詳細について説明する。図１４は、そのような句翻訳部６の構成例を示すブロック図である。このような異なる翻訳方式に基づく複数段の翻訳部１０３〜１０８、およびそれらで用いられる複数の対訳辞書を記憶部１１０に備えており、これは入力部１０１に入力される第１言語の句、または文が、より簡単な翻訳からより複雑な翻訳へ移行するように構成されており、これによって翻訳の高速化および高精度化を図っている。
【００９１】
句翻訳部６は、図１４に示すように、入力部１０１、翻訳判定部１０２、例文マッチング翻訳部１０３、単語アライメント例文ベース翻訳部１０４、辞書ベース翻訳部１０５、例文パターン翻訳部１０６、例文集合ベース翻訳部１０７、単語直訳／ルールベース翻訳部１０８、出力部１０９および記憶部１１０を含んで構成される。
【００９２】
翻訳判定部１０２は、入力部１０１より入力された句または文(以下単に句という)について、翻訳が必要かどうか判定する。ここで、第1言語が、日本語、中国語、韓国語などの場合には、非漢字、非カタカナ、非平かな、非韓国語文字の文字列なら、翻訳する必要がない。第1言語が欧米言語の場合には、数字および各種の記号からなる文字列なら、翻訳する必要がない。
【００９３】
例文マッチング翻訳部１０３は、翻訳判定部１０２で入力句の翻訳が必要と判定された場合に入力句の翻訳を行う。すなわち、第１言語と言語２間の例文を対応させた記憶部１１０内の例文対訳辞書を用いて、入力された句Pと完全マッチングした例文があれば、その例文の訳文をPの第２言語の訳文として出力する．完全にマッチングした例文が存在しない場合は，入力された句Pを含む例文があれば、その対訳例文ペアと対応している対訳パターンペアを記憶部１１０内の例文パターン対訳辞書から取り出し、取り出した対訳パターンペアを用いて、句Pを翻訳する。
【００９４】
例文マッチング翻訳部１０３において、入力された句に対する訳語が得られなかった場合、その入力された句は単語アライメントベース翻訳部１０４の処理の対象になる。
【００９５】
単語アライメント例文ベース翻訳部１０４は、入力句に対する訳文候補を記憶部１１０内の単語アライメント対訳辞書を参照して得る。なお、ここでは、説明を簡単にするため入力句は予め形態素解析されたものとする。単語アライメント対訳辞書は、第１言語による例文とその第２言語による対訳文の組を格納したものであり、これらには単語アライメント情報、すなわち第１言語の例文における各単語と第２言語の対訳文における各単語の対応付け情報が付加されている。
【００９６】
単語アライメント例文ベース翻訳部１０４において、入力された句に対する訳語が得られなかった場合、その入力された句は辞書ベース翻訳部１０５の処理の対象になる。
【００９７】
辞書ベース翻訳部１０５は、入力された句に対して、記憶部１１０内の単語／句対訳辞書を検索し、一致する句が辞書内にある場合にその対訳句を出力するものである。単語／句対訳辞書内には、第１言語による単語あるいは句をキーとし、第２言語によるその対訳語あるいは句を値とする辞書セットと、第２言語による単語あるいは句をキーとし、第１言語によるその対訳語あるいは句を値とする辞書セットが収められている。辞書ベース翻訳部１０３は、基本的には２段階の処理を行い、最初に第１言語による単語／句をキーとして検索を行ってその対訳句の抽出を行い、それが成功しなかった場合に、今度は第２言語による単語／句をキーとして検索を行ってその対訳句の抽出を行う。
【００９８】
辞書ベース翻訳部１０５において、入力された句に対する訳語が得られなかった場合、その入力された句は例文パターン翻訳部１０６の処理の対象になる。
【００９９】
例文パターン翻訳部１０６は、記憶部１０１内の例文パターン対訳辞書を参照して翻訳候補を得る例文パターンベース翻訳エンジンを使用した翻訳部で、先の例文マッチング翻訳部１０３でも行っているが、例文マッチング翻訳部１０３とは、例文パターンや写像の選択基準、単語や節区切りを変えて行っても良いし、例文マッチング翻訳部１０３では、例文対訳辞書のみを使用した翻訳を行い、例文パターン対訳辞書によるマッチングは例文パターン翻訳部１０６だけで行っても良い。この際、例文パターン対訳辞書によるマッチングは既に述べた翻訳装置１００１が適用できる。
【０１００】
例文パターン翻訳部１０６において、入力された句に対する訳語が得られなかった場合、その入力された句は例文集合ベース翻訳部１０７の処理の対象になる。
【０１０１】
例文集合ベース翻訳部１０７は、入力された句に対する訳文候補を記憶部１１０内の例文対訳辞書を参照して得る。例文対訳辞書には、第１言語による例文とその第２言語による対訳文の組が多数格納される。本翻訳部における翻訳精度を向上させるためには、できるだけ多くの例文対訳組を例文対訳辞書に登録しておくことが好ましい。例文集合ベース翻訳部１０７は、詳細構成として、例文対訳辞書から入力された句を含む複数の例文対訳組を選択するための例文対訳ペア選択部(図示せず)と、各例文対訳組相互間の共通部分の組を抽出する句ペア抽出部(図示せず)と、抽出された複数の共通部分の組での、入力された句に対する支持度合を算出する支持度算出部(図示せず)と、算出された支持度合に基づいて訳文候補のなかから最終的な訳文を選択する訳文選択部(図示せず)を備えていてもよい。
【０１０２】
例文集合ベース翻訳部１０７で適切に翻訳されなかった句は、次段の単語直訳／ルールベース翻訳部１０８へ渡され、ここでの翻訳処理を受ける。
【０１０３】
単語直訳／ルールベース翻訳部１０８は、入力句に対して、記憶部１１０内の単語対訳辞書を参照した単語直訳の機能およびルールベースの翻訳機能のうち、少なくとも一方の翻訳機能を備える。ルールベースの翻訳機能は、第１言語の解析（形態素解析、構文・意味解析など）を行い、人手によって作成された大量のルールをベースとして、解析の結果を第２言語に変換し、さらに第２言語の訳文を生成するものである。
【０１０４】
次に図１５のフローチャートを参照して句翻訳部の動作を説明する。
【０１０５】
まず、翻訳判定部１０２で入力部１０１からの入力句Ｐについて翻訳が必要かどうか判定され、翻訳が不要であれば、入力句Ｐを翻訳せず、そのまま訳文として、出力部１０９に転送し出力させる(Ｓ４１、Ｓ４９)。この場合、翻訳信憑性は１.０である。翻訳が必要であれば、入力句Ｐを例文マッチング翻訳部１０３に送り、例文マッチング翻訳部１０３で例文対訳辞書または例文パターン辞書を用いた翻訳が行われる(Ｓ４３)。入力句の翻訳に成功すれば、翻訳結果の訳文を出力部１０９に転送し出力させる。この場合の翻訳信憑性は１.０である。
【０１０６】
入力句の翻訳に失敗した場合には、入力句は次段の単語アライメント例文ベース翻訳部１０４に送られ、単語アライメント対訳辞書を用いた翻訳が行われる(Ｓ４４)。入力句の翻訳に成功すれば、翻訳結果の訳文を出力部１０９に転送し出力させる。この場合の翻訳信憑性は０.７である。
【０１０７】
入力句の翻訳に失敗した場合には、入力句は次段の辞書ベース翻訳部１０５に送られ、単語／句対訳辞書を用いた翻訳が行われる(Ｓ４５)。入力句の翻訳に成功すれば、翻訳結果の訳文を出力部１０９に転送し出力させる。この場合の翻訳信憑性は０.７である。
【０１０８】
入力句の翻訳に失敗した場合には、入力句は次段の例文パターン翻訳部１０６に送られ、例文パターン対訳辞書を用いた翻訳が行われる(Ｓ４５)。入力句の翻訳に成功すれば、翻訳結果の訳文を出力部１０９に転送し出力させる。この場合の翻訳信憑性は例文パターン翻訳部の信憑性である。
【０１０９】
入力句の翻訳に失敗した場合には、入力句は次段の例文集合ベース翻訳部１０７に送られ、例文対訳辞書を用いた翻訳が行われる(Ｓ４５)。入力句の翻訳に成功すれば、翻訳結果の訳文を出力部１０９に転送し出力させる。この場合の翻訳信憑性は0.7である。
【０１１０】
入力句の翻訳に失敗した場合には、入力句は次段の単語直訳／ルールベース翻訳部１０８に送られ、単語直訳またはルールベースの翻訳が行われる(Ｓ４５)。入力句の翻訳に成功すれば、翻訳結果の訳文を出力部１０９に転送し出力させる。この場合の翻訳信憑性は単語直訳またはルールベースの翻訳の信憑性である。
【０１１１】
図１６は、翻訳装置の一ハードウエア構成を示すブロック図である。翻訳装置は、好ましくは、入力装置１７０１、表示装置１７０２、主記憶装置１７０４、記憶装置１７０６、中央処理装置（ＣＰＵ）１７０８、これらを接続するバス１７１０を含んで構成される。
【０１１２】
入力装置１７００は、キー操作により情報を入力するキーボード、原稿に記載された文書等を光学的に読み取るスキャナ、外部装置や外部メモリ等からのデータを入力する入力インターフェース等を含む。表示装置１７０２は、ユーザの入力および翻訳結果等を表示するディスプレイ等を含む。主記憶装置１７０４は、ＲＯＭまたはＲＡＭを含み、図４に示す各部の動作を制御するプログラムや演算処理されたデータ等を記憶する。記憶装置１７０６は、例えばハードディスク等の大容量記憶装置を含み、例文対訳辞書などの各種辞書等のデータを格納する。中央処理装置１７０８は、主記憶装置１７０４に記憶されたプログラムに従い各部を制御する。
【０１１３】
次に、課題の欄で述べた入力文の例に対して本実施例の翻訳装置１００が対応できることを図１８および図１９を参照して説明する。
【０１１４】
追加説明の記述に条件としての接尾辞がある１番目の入力文(例１)について説明する。
【０１１５】
この場合の入力文Ｓが、図１８に示すように、
文S = ３が４の右側にあることを確認する(全部品対象)
であり、前処理部３により得られた、接尾辞Pfixおよび接尾辞Pfixを削除した文Ｓ１が、
Pfix= (全部品対象) ，S1 = ３が４の右側にあることを確認する
である。句翻訳部６の翻訳部Ａ６aによる接尾辞Pfixの訳文は、
図１８に示すようになる。
【０１１６】
例文パターン翻訳部４により例文パターンベース翻訳エンジンを用いて文S1を翻訳するとき、文S1が、例文パターン、
“NP1 が NP2 にあることを確認する”
と、完全にマッチングし、文S1の訳文は、
図１８に示すようになる。
【０１１７】
訳文合成部７で、翻訳部Ａ６aからの接尾辞Pfixの訳文と、例文パターン翻訳部４からの文S1の訳文を用いて、文Sの訳文を合成する。その翻訳結果は図１８に示す通りであり、正しく翻訳できた。
【０１１８】
次に部品の追加説明としてのパターンがある２番目の入力文(例２)について説明する。
【０１１９】
この場合の入力文Ｓが、図１８に示すように、
文S = ３と５のハーネス(図Aに示す)はロックしないこと
であり、前処理部３で得られる、追加説明などのパターン(切替項目)が、
T(1) =図Aに示す, T1(1) = (, T2(1)=).
S1= ３と５のハーネスT1はロックしないこと
である。
【０１２０】
句翻訳部６の翻訳部Ａ６aによるT(1)の訳文は、
図１８に示すようになる。
【０１２１】
例文パターン翻訳文部４で例文ベース翻訳エンジンを用いて文S1を翻訳するとき、文S1が、例文パターン、
“NP1 と NP2 はロックしないこと”
と、完全にマッチングする。名詞句ＮＰ１、ＮＰ２は、
NP1= ３, NP2= ５のハーネスT1,
であり、文Ｓ１の訳文は、
図１８に示すようになる。
【０１２２】
訳文合成部７で、T(1)の訳文, T1(1),T2(1)とS1の訳文を用いて、文Sの訳文を合成する。合成結果の訳文Ｓは、
図１８に示すようになる。
【０１２３】
次に、年月日及び時間の接尾辞がある３番目の入力文(例３)について説明する。
【０１２４】
まず、入力文Ｓは、図１９に示す通りであり、
前処理部３で得られた、入力文中の接尾辞Pfixは、それを削除した文Ｓ１が、
Pfix = 《2008-1-29 19:54:59》
であり、接尾辞Pfixを削除した文Ｓ１は、
図１９に示すようになる。
【０１２５】
句翻訳部６の翻訳部Ａ６aによる接尾辞Pfixの訳文が、
Pfixの訳文= 《2008-1-29 19:54:59》
である。
【０１２６】
例文パターン翻訳文部４で例文パターンベース翻訳エンジンを用いた文Ｓ１の翻訳結果は、
S1の翻訳結果＝１に異物がある
であり、使用した対訳パターン：
中国語パターン：NP1 内有 NP2，
日本語パターン： NP1 に NP2 がある
である。
【０１２７】
訳文合成部７で、翻訳部Ａ６aからの接尾辞Pfixの訳文と例文パターン翻訳文部４からのS1の訳文を用いて、文Sの訳文を合成する。その合成結果、すなわち、入力文Ｓの訳文は、図１９に示す通りであり、正しい翻訳が得られた。
【０１２８】
次に、１文中に２文含む第４番目の入力文Ｓ(例４)について説明する。
【０１２９】
まず、入力文Ｓが、図１９に示すように、
S=材料メーカに追加確認すること，出荷の時に保護部材を強化して衝突損害を防止する．
である。この入力文ＳをＳ１として、例文パターン翻訳部４で翻訳が失敗する。
【０１３０】
次に分割部５で文Ｓ１の分割が行われ、２つの分割文Ｓ１１およびＳ１２となる。すなわち、
S11=材料メーカに追加確認すること，
S12=出荷の時に保護部材を強化して衝突損害を防止する
となる。
【０１３１】
次に、句翻訳部６の翻訳Ｂ６ｂで、分割文S11とS12を翻訳する。句翻訳部６は、例文パターン翻訳部４は句の翻訳だけではなく、文(センテンス)も翻訳できるので、上記の分割文S11とS12が例文パターン翻訳部４の例文パターンベース翻訳エンジンで翻訳可能である。もし、例文パターン対訳辞書に、次の対訳パターンがあれば、例文パターンベース翻訳エンジンが分割文S11とS12を翻訳可能である。すなわち、
“中国語パターン：図19に示す
---日本語パターン：NP1 に追加確認すること”
“中国語パターン：図19に示す
---日本語パターン：NP1 の時に NP2 を強化して NP3 を防止する”
例文パターン翻訳部４の例文パターンベース句翻訳エンジンのS11とS12の翻訳は、次の通りである。すなわち、
S11とS12の翻訳：
S11の翻訳は、図１９の（１）に示す通りであり、
S11の翻訳は、図１９の（２）に示す通りである。
【０１３２】
訳文生成部８で、翻訳Ｂ６ｂからの分割文S11の訳文とS12の訳文を用いて、文Sの訳文を生成する。その結果は、
図１９の示す通りとなり、正しく翻訳できることが分かる。
【０１３３】
以上本発明の好ましい実施例について詳述したが、本発明は係る特定の実施例に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形、変更が可能である。
【符号の説明】
【０１３４】
１,１０１：入力部２：翻訳メモリ翻訳部
３：前処理部(抽出手段、付加手段)
４, １０６：例文パターン翻訳部(第１の翻訳手段)
５：分割部(分割手段)
６：句翻訳部(第２の翻訳手段、第３の翻訳手段)
７：訳文合成部(合成手段) ８：訳文生成部
９,１０９：出力部１０,１１０：記憶部
１０２：翻訳判定部１０３：例文マッチング翻訳部
１０４：単語アライメント例文ベース翻訳部１０５：辞書ベース翻訳部
１０７：例文集合ベース翻訳部１０８：単語直訳／ルールベース翻訳部
１００,１００１：翻訳装置１２００：解析部
１３００：検索部１４０１：変換部
１５００：算出部１６００：抽出部
１６３０：関係選択部
１７００：翻訳部１８００：判定修正部
１８１０：判定部１８２０：修正部
１８３０：最適関係選択部
２０００：出力装置３０００：入力装置
１７０1：入力装置
１７０２：表示装置１７０４：主記憶装置
１７０６：記憶装置１７０８：中央処理装置（ＣＰＵ）
１７１０：バス

【特許請求の範囲】
【請求項１】
入力文から追加説明部分を抽出する抽出手段と、
入力文から前記抽出手段で追加説明部分が抽出され前記追加説明部分が除かれた文に、当該追加説明部分の位置を示す管理情報を付加する付加手段と、
前記追加説明部分が除かれた文を翻訳する第1の翻訳手段と、
前記抽出手段で抽出された追加説明部分を翻訳する第２の翻訳手段と、
前記管理情報に基づいて、前記第１及び第２の翻訳手段の翻訳結果を合成する合成手段と、
を具備することを特徴とする翻訳装置。
【請求項２】
前記第1の翻訳手段が適切に翻訳できないときに、当該入力文を分割する分割手段と、
前記分割手段で分割された各文を翻訳する第３の翻訳手段を具備することを特徴とする請求項1記載の翻訳装置。
【請求項３】
前記第１の翻訳手段は、第１言語の例文パターンとその対訳である第２言語の対訳例文パターンを例文パターン対訳組として記憶する例文パターン辞書を有し、前記例文パターン辞書を参照し、翻訳対象の文と前記例文パターンとをマッチングさせて翻訳する例文パターン翻訳装置であり、前記第２の翻訳手段は、第１の言語の単語とその対訳である第２の言語の単語を単語組として記憶する単語対訳辞書、第１言語の例文とその対訳である第２言語の対訳例文を例文対訳組として記憶する例文辞書、第１言語の句パターンとその対訳である第２言語の対訳句パターンを句パターン対訳組として記憶する句パターン対訳辞書及び前記例文パターン辞書の少なくとも１つを参照して翻訳を行う句翻訳装置であることを特徴とする請求項１記記載の翻訳装置。
【請求項４】
コンピュータを、
入力文から追加説明部分を抽出する抽出手段と、
入力文から前記抽出手段で追加説明部分が抽出され前記追加説明部分が除かれた文に、当該追加説明部分の位置を示す管理情報を付加する付加手段と、
前記追加説明部分が除かれた文を翻訳する第1の翻訳手段と、
前記抽出手段で抽出された追加説明部分を翻訳する第２の翻訳手段と、
前記管理情報に基づいて、前記第１及び第２の翻訳手段の翻訳結果を合成する合成手段として機能させることを特徴とする翻訳プログラム。

【図１】