翻訳支援プログラム、翻訳支援装置、翻訳支援方法

【課題】翻訳支援装置において、原文を修正しても編集前の状態に戻せるような編集を行い、機械翻訳の機能および翻訳メモリ中の翻訳資産を有効に活用できるようにする。
【解決手段】この翻訳支援装置は、原文と原文を翻訳した訳文とを対で記憶する翻訳メモリ９と、この翻訳メモリ９に記憶する原文・訳文を編集する原文・訳文編集部３とを備える。原文・訳文編集部３は、原文に対して行われた文字列の編集操作（文分割、文結合、１文編集等）に応じた位置に特殊記号（＠数字＠）を付加した第３の文書を生成し、この第３の文書を原文を編集した編集履歴として編集履歴記憶部１５に記憶する。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、例えばある言語の文章を他の言語の文章に翻訳する翻訳支援プログラム、翻訳支援装置、翻訳支援方法に関する。
【背景技術】
【０００２】
ある言語（原言語）の文書を他の言語（目的言語）の文書に自動的に翻訳する機械翻訳装置がある。
【０００３】
従来の機械翻訳装置としては、ある言語で書かれている文（原文）と、その文を他の言語で表した文（訳文）とを対で格納したデータベースである翻訳メモリを参照して、翻訳作業を支援する翻訳支援装置が知られている（例えば特許文献１参照）。
【０００４】
従来の翻訳支援装置における翻訳処理の流れは以下のようになっている。
１．過去に翻訳済みの対訳文を翻訳メモリに予め登録しておき、翻訳対象文と類似の文が翻訳メモリ中にあれば、それを参照して翻訳に利用する。
２．翻訳対象文と類似の文が翻訳メモリ中にない場合は、機械翻訳を実行させて翻訳文（下訳）を作成し、下訳に人手で適宜修正を加えて訳文を完成する。
３．翻訳対象文と完成した訳文を翻訳メモリに登録して、新たな翻訳対象文書を翻訳する際に再利用する。
【特許文献１】特開平６−６８１４２号公報
【発明の開示】
【発明が解決しようとする課題】
【０００５】
従来の翻訳支援装置では、機械翻訳の翻訳結果を人手で修正して翻訳メモリに登録する場合、訳文の修正（後編集）は、簡単に行えても原文の修正（前編集）は簡単には行えないという問題があった。
【０００６】
これは、翻訳メモリに登録する原文がオリジナルの原文から変更されていると、別の文書の翻訳時に再利用され難くなるためである。
【０００７】
例えば、ある日本語テキスト文書から、同じ内容のｈｔｍｌ文書、リッチテキスト文書を作ってあったものとする。そして、日本語テキスト文書を基にして英語の翻訳文書を作成し、これらを翻訳メモリに登録したものとする。その際に、翻訳メモリに登録した原文はオリジナルの原文から変更されているものとする。
【０００８】
この翻訳メモリの内容を使って、ｈｔｍｌ文書、リッチテキスト文書を翻訳し、英語版のｈｔｍｌ文書、リッチテキスト文書を作成するものとする。
【０００９】
しかし、翻訳メモリには、オリジナルの原文とは異なる原文が登録されているため、翻訳メモリのデータとの類似率は低くなる。また、機械翻訳装置が翻訳し易いように原文を修正すると、実際には存在しない人工的な文になる場合もあり、このような場合は実際の文とマッチしない可能性がさらに高くなる。
【００１０】
そこで、原文の修正をあえて行う場合には、修正前の原文を別途保存しておき、翻訳メモリ登録時に修正後の原文と置き換える必要がある。
【００１１】
しかし、この場合にも、特に原文の分割・結合を行うと、原文との置き換え作業は非常に繁雑になるという問題がある。その上、原文の分割・結合が必要になるケースはまれではない。例えば原文である日本語の１文が「が、」でつながる複数の文からなり、文を分割した方が翻訳結果が良くなる場合や、ｈｔｍｌファイルなどの書式情報付き文書においてレイアウトの都合で１文が分割されており、正しく翻訳するには文を結合する必要がある場合など、枚挙にいとまがない。
【００１２】
このように、翻訳メモリに登録することを考えると、原文の修正は簡単にはできないため、現実的には機械翻訳結果の修正は、訳文の修正に頼る場合が大半であった。
【００１３】
最初から自分で英文を書き起こせるユーザは、機械翻訳の機能を十分に活用せずに、訳文の上書き編集をして多大な労力を費やし、最初から英文を書き起こすことの難しいユーザは、訳文に問題があることは分かっていても、それをどう直せばよいかを推敲できずに機械翻訳された訳文を容認せざるを得ない場合が多くあった。
【００１４】
本発明はこのような課題を解決するためになされたもので、原文を修正しても編集前の状態に戻せるような編集処理が行え、機械翻訳の機能および翻訳メモリ中の翻訳資産を有効に活用できる翻訳支援プログラム、翻訳支援装置、翻訳支援方法を提供することを目的としている。
【課題を解決するための手段】
【００１５】
上記した課題を解決するために、本発明の翻訳支援プログラムは、ある言語の原文を機械翻訳することで他の言語の翻訳文を生成するコンピュータに処理を行わせる翻訳支援プログラムにおいて、前記コンピュータを、前記原文を予め記憶されている翻訳辞書に基づいて機械翻訳することで翻訳文を生成する翻訳手段と、前記翻訳手段による翻訳結果の再利用を目的として原文と翻訳文を対応付けて保存する翻訳メモリと、前記翻訳手段により翻訳された翻訳文および原文の少なくとも一方を編集して生成した特殊記号付きの翻訳文、特殊記号付きの原文の編集履歴が記憶される編集履歴記憶部と、前記原文および翻訳文の少なくとも一つに対して編集対象の文字列の選択操作を行う操作手段と、前記操作手段により原文の中から選択された文字列に対して、前記編集履歴記憶部に記憶された特殊記号付きの翻訳文を基に、分割、結合、および一文編集のうちの少なくとも一つを行う位置を推定し、その位置に特殊記号を付加して特殊記号付きの原文を生成する手段と、生成された特殊記号付きの原文を原文の編集履歴として前記編集履歴記憶部に記憶する手段として機能させることを特徴とする。
上記翻訳支援プログラムにおいて、前記コンピュータを、前記特殊記号付きの原文を、特殊記号に従って再度翻訳して新たな翻訳文を生成する再翻訳手段と、前記再翻訳手段により生成された新たな翻訳文を翻訳結果の文書として前記特殊記号付きの原文に対応付けて前記翻訳メモリに記憶する手段として機能させるようにしても良い。
【００１６】
本発明の翻訳支援装置は、ある言語の原文を予め記憶されている翻訳辞書に基づいて機械翻訳することで他の言語の翻訳文を生成する翻訳手段と、前記翻訳手段による翻訳結果の再利用を目的として原文と翻訳文とを対応付けて保存する翻訳メモリと、前記翻訳手段により翻訳された翻訳文および原文の少なくとも一方を編集して生成した特殊記号付きの翻訳文、特殊記号付きの原文の編集履歴が記憶される編集履歴記憶部と、前記翻訳文および原文の少なくとも一つに対して編集対象の文字列の選択操作を行う操作手段と、前記操作手段により前記原文の中から選択された文字列に対して、前記編集履歴記憶部に記憶された特殊記号付きの翻訳文を基に、分割、結合、および一文編集のうちの少なくとも一つを行う位置を推定し、その位置に特殊記号を付加して特殊記号付きの原文を生成する手段と、生成された特殊記号付きの原文を原文の編集履歴として前記編集履歴記憶部に記憶する手段とを具備したことを特徴とする。
上記翻訳支援装置において、前記特殊記号付きの原文を、特殊記号に従って再度翻訳して新たな翻訳文を生成する再翻訳手段と、前記再翻訳手段により生成された新たな翻訳文を翻訳結果の文書として前記特殊記号付きの原文に対応付けて前記翻訳メモリに記憶する手段とを備えても良い。
【００１７】
本発明の翻訳支援方法は、ある言語の原文を予め記憶されている翻訳辞書に基づいて機械翻訳することで他の言語の翻訳文を生成する上で、前記原文の中から選択された文字列に対して、編集履歴記憶部に記憶された特殊記号付きの翻訳文を基に、分割、結合、および一文編集のうちの少なくとも一つを行う位置を推定し、その位置に特殊記号を付加して特殊記号付きの原文を生成するステップと、生成された特殊記号付きの原文を原文の編集履歴として前記編集履歴記憶部に記憶するステップとを有することを特徴とする。
なお、上記翻訳支援方法において、前記特殊記号付きの原文を、特殊記号に従って再度翻訳して新たな翻訳文を生成するステップと、再度翻訳して生成した新たな翻訳文を翻訳結果の文書として前記特殊記号付きの原文に対応付けて翻訳メモリに保存するステップとを有してもよい。
【００１８】
本発明では、選択された文字例の分割位置、結合位置、および一文編集のうちの少なくとも一つを行う編集位置に特殊記号を付加した特殊記号付きの原文を生成し、それを原文の編集履歴として編集履歴記憶部に記憶するので、編集履歴記憶部を参照して特殊記号付きの原文から特殊記号を検出することで、特殊記号付きの原文を編集前の原文の形態に戻すことができる。
【００１９】
また、特殊記号付きの原文を再度翻訳した新たな翻訳文を翻訳結果の文書として特殊記号付きの原文に対応付けて翻訳メモリに保存するので、高い精度の翻訳結果を再利用できるようになる。
【発明の効果】
【００２０】
以上説明したように本発明によれば、原文を修正しても編集前の状態に戻せるような編集処理が行え、機械翻訳の機能および翻訳メモリ中の翻訳資産を有効に活用できる。
【発明を実施するための最良の形態】
【００２１】
以下、本発明の実施の形態を図面を参照して詳細に説明する。図１は本発明に係る一実施形態の翻訳支援装置全体の構成を示すブロック図である。
この実施形態の翻訳支援装置は、大別して、文分割処理部１、翻訳手段としての翻訳処理部２、編集手段としての原文・訳文編集部３、文書出力部４等の４つの部分からなる。
【００２２】
文分割処理部１は、翻訳対象の原言語で書かれた原文文書入力部５と、原文文書を所定の文分割規則に従って１文単位に自動的に分割する原文文書自動文分割部６と、自動文分割の際に参照される所定の文分割規則が記憶された文分割規則テーブル７とを有している。原文文書入力部５は、例えばキーボード、マウス、グラフィックユーザインタフェース画面等で構成され、原文および訳文のうち少なくとも一つに対して文字列の編集操作を行う操作手段として機能する。文分割規則テーブル７に記憶されている所定の文分割規則は、例えばメモリにファイルの形態で記憶されていても良く、また、文分割処理部１の処理プログラムの中に予め記述、つまり設定されていても良い。
【００２３】
翻訳処理部２は、翻訳処理を制御する翻訳処理制御部８と、翻訳対象のある原言語（例えば日本語等）で書かれた文（翻訳対象文:第１の文書）と、翻訳後の他の言語、つまり目的言語（英語等）で書かれた文（翻訳結果の文書：第２の文書（以下訳文と称す））とが一対（一組）に対応付けられて保存されている翻訳メモリ９と、この翻訳メモリ９の中に、１文単位に分割された原言語からなる原文と類似する文（類似文）があるか否かを検索する翻訳メモリ検索部１０と、原文を自動的に目的言語の文に翻訳する機械翻訳処理部１１と、この機械翻訳処理部１１により参照される翻訳辞書としての翻訳用辞書１２を有している。
【００２４】
翻訳処理部２は、ある原文を予め記憶されている翻訳用辞書１２に基づいて機械翻訳することで目的言語文書である訳語を生成する翻訳手段として機能する。
翻訳用辞書１２には、言語翻訳用の辞書情報（日→英辞書、英→日辞書等の辞書データ）と、この他、形態素解析、構文解析、意味解析、言語変換用の解析ルール、変換規則等が記憶されている。
【００２５】
翻訳メモリ９は、翻訳処理部２による翻訳結果の再利用を目的として翻訳前の文書とこの翻訳前の文書を翻訳した翻訳結果の文書とを対応付けて保存するものである。この翻訳メモリ９は、過去の翻訳実績を再利用するためにデータベースの形態で蓄積し翻訳作業の効率アップを図る機能の一部として用いられる。
【００２６】
機械翻訳処理部１１は、形態素解析、構文解析、意味解析、言語変換処理部１３、訳文生成部１４を有している。
原文・訳文編集部３は、操作手段により原文に対して行われた文字列の編集操作に応じた位置に特殊記号を付加して第３の文書（図６参照）を生成する手段として機能する。
【００２７】
原文・訳文編集部３は、原文、訳文を編集した編集履歴が記憶される編集履歴記憶部１５を有している。編集履歴記憶部１５は、メモリ、ハードディスク装置に設けられた記憶領域等で実現される。原文・訳文編集部３は、生成した第３の文書を第１の文書の編集履歴として編集履歴記憶部１５に記憶する手段として機能する。つまり、編集履歴記憶部１５には、原文および訳文のうち、少なくとも一つを編集した編集履歴が記憶される。
原文・訳文編集部３は、操作手段である対訳編集画面によって、原文の中から選択された文字列に対して、編集履歴記憶部１５に記憶された特殊記号付きの訳文を基に、分割、結合、および一文編集のうちの少なくとも一つを行う位置を推定し、その位置に特殊記号を付加して特殊記号付きの原文を生成する手段として機能する。原文・訳文編集部３は、生成された特殊記号付きの原文を原文の編集履歴として編集履歴記憶部１５に記憶する手段として機能する。
【００２８】
訳文生成部１４は、形態素解析、構文解析、意味解析、言語変換処理部１３により形態素解析、構文解析、意味解析、言語変換されて意味をなす語句（文字列）となったものを文の形態に並べる処理を行う。
【００２９】
文書出力部４は、文の形態の原文・訳文などを文書の形態で出力するものであり、原文、訳文、それぞれの修正文のうち少なくとも一つを出力するプリントドライバ、表示ドライバ等を含むプログラムと、プリンタ、表示装置等のハードウェア等である。
【００３０】
この翻訳支援装置のハードウェアは、ＣＰＵ、メモリ、ハードディスク装置等を備えたコンピュータと、このコンピュータに接続された表示装置および印刷装置等である。ハードディスク装置にはコンピュータシステム全体を動作させるオペレーティングシステム（以下ＯＳと称す）と、機械翻訳を実行する制御プログラム（以下翻訳支援プログラムと称す）がインストールされており、これら翻訳支援プログラム、ＯＳ、ＣＰＵ、メモリ等が協働して、文分割処理部１、翻訳処理部２、原文・訳文編集部３、文書出力部４等の処理動作を実現する。
【００３１】
以下、図２を参照してこの実施形態の翻訳支援装置の動作を説明する。図２はこの実施形態の翻訳支援装置の処理全体を示すフローチャートである。
【００３２】
この翻訳支援装置では、原文文書入力部５に原文文書が入力されると（図２のステップＳ２０１）、原文文書自動文分割部６は、原文文書を１文単位に分割する（ステップＳ２０２）。この原文文書自動文分割部６では、日本語の文章の場合、１つの文は、読点を区切りとして分割される。また、英語の文章の場合、１つの文は、ピリオド、コロン、セミコロンなどを区切りとして分割される。この他、例えば括弧、改行記号、ｈｔｍｌのような書式情報付き文書では、１つの文は、改行記号、カッコなどを区切りとして分割される。また、英文の場合、“Dr.”などのようにピリオドが付く語があるため、個別に考慮すべき単語を辞書にまとめ、適宜参照する。上記区切り情報は予めメモリあるいはプログラム上に記憶（設定）されている。
【００３３】
原文文書自動文分割部６により１文単位に分割された原文は、１文ずつ、最後の文になるまで（ステップＳ２０３）、翻訳処理部２へ送られて、翻訳処理部２によって翻訳処理が行われる（ステップＳ２０４）。なお、ステップＳ２０４の翻訳処理の詳細な内容は後述する。
【００３４】
翻訳処理が行われた訳文は、原文とともに原文・訳文編集部３へ送られる。原文・訳文編集部３では、訳文および／または原文の編集処理が行われる（ステップＳ２０５）。このステップＳ２０５の編集処理の詳細な内容については後述する。
【００３５】
ステップＳ２０５の編集処理が行われた後、編集済みの原文に対する翻訳処理が再度必要な場合、原文・訳文編集部３より翻訳処理部２へ翻訳対象の文が戻される。そして、翻訳処理部２により文書の有無が判定されて（ステップＳ２０３）、翻訳処理が行われる（ステップＳ２０４）。
なお、翻訳対象の文が複数存在したとしても、ステップＳ２０３の判定処理を経ることで、すべての翻訳対象文に対して１文ずつ翻訳処理が実効される。
【００３６】
翻訳処理が再度必要でない場合（ステップＳ２０６のＮｏ）、原文・訳文編集部３は、原文と翻訳結果を文書出力部４へ送り（ステップＳ２０７）、原文・訳文編集部３としての処理動作を終了する。
【００３７】
＜翻訳処理部２の動作＞
ここで、図３を参照して図２のステップ２０４で示した翻訳処理について説明する。図３は図２のステップ２０４で示した翻訳処理を示すフローチャートである。
【００３８】
文分割処理部１によって１文単位に分割された翻訳対象文が翻訳処理部２に入力されると（ステップＳ３０１）、翻訳処理部２では、翻訳メモリ検索部１０が、翻訳処理制御部８からの命令により、翻訳対象文をキーにして翻訳メモリ９を検索することで（ステップＳ３０２）、翻訳対象文と類似した文が翻訳メモリ９内に存在するか否かを判定する（ステップＳ３０３）。なおステップ３０２の翻訳メモリ検索部１０による翻訳メモリ検索処理の詳細な内容について後述する。
【００３９】
検索の結果、翻訳メモリ９内に、翻訳対象文と類似した文が存在した場合（ステップＳ３０３のＹｅｓ）、翻訳メモリ検索部１０は、その類似文を翻訳処理による訳文と判定して、翻訳結果を表示装置の表示画面へ出力し（ステップＳ３０４）、この翻訳対象文に対する翻訳処理を終了する。
また、翻訳対象文と類似した文が存在しない場合（ステップＳ３０３のＮｏ）、翻訳メモリ検索部１０は、翻訳対象文を機械翻訳処理部１１へ送り、機械翻訳処理を実行させる。
機械翻訳処理部１１は、翻訳メモリ検索部１０より受けた取った翻訳対象文に対して形態素解析、構文解析、意味解析、言語変換の各種処理からなる原文解析処理（ステップＳ３０５）と、訳文生成処理（ステップＳ３０６）とを行うことで機械翻訳処理を行う。
機械翻訳処理部１１は、機械翻訳処理が終了すると、翻訳結果を原文・訳文編集部３へ出力する（ステップＳ３０４）。
【００４０】
＜原文・訳文編集部３の動作＞
続いて、図４のフローチャートを参照して、上記図２のステップ２０５で示した原文・訳文編集部３の処理の詳細について説明する。
【００４１】
原文・訳文編集部３に、翻訳処理部２から原文および翻訳処理の結果が送られると、原文・訳文編集部３は、原文・訳文の同じ内容を初期値として編集履歴記憶部１５に記憶するとともに、その原文・訳文を表示装置の表示画面に表示する。原文・訳文の編集処理は、表示画面に表示された原文・訳文のうち、ユーザが選択した文に対して実行される。この表示画面は、原文および訳文の対訳編集画面であり、原文および訳文の少なくとも一つに対して編集対象の文字列の選択操作を行う操作手段として機能する。
【００４２】
図４には、ユーザが編集したい文を選択してから１回の編集作業が終了するまでの流れを示すものであり、すべての編集作業が終了するまで、必要に応じて図４の処理が繰り返される。
【００４３】
ユーザにより選択された編集対象の文字列、つまり編集対象文が原文・訳文編集部３に入力されると（図４のステップＳ４０１）、原文・訳文編集部３は、編集対象文が訳文か原文かを判定する（ステップＳ４０２）。この判定の仕方としては、入力元（訳文は機械翻訳処理部１１から入力、原文は翻訳処理制御部８から入力）がどこであるか、つまりどこから送られてきたかで判定する方法と、ユーザが操作した画面あるいは文自体（原文と訳文を２分割画面に別個に表示しているため）で判定する方法がある。
【００４４】
判定の結果、編集対象文が訳文の場合（ステップＳ４０２のＹｅｓ）、原文・訳文編集部３は、訳文編集を行い（ステップＳ４０３）、編集結果を文書出力部４へ出力して（ステップＳ４１２）、編集処理を終了する。
また、編集対象文が原文の場合（ステップＳ４０２のＮｏ）、原文・訳文編集部３は、編集内容に応じて１文の分割を行うか否か（ステップＳ４０４）、複数文の結合を行うか否か（ステップＳ４０７）を判定し、この判定結果に応じて処理を行う。
【００４５】
例えば１文の分割を行う場合（ステップＳ４０４のＹｅｓ）、原文・訳文編集部３は、文分割処理を実行し（ステップＳ４０５）、複数文の結合を行う場合には、文結合処理を実行し（ステップＳ４０８）、これら２つ以外の場合、つまり、編集内容が１文内での変更のみに留まる場合（ステップＳ４０４のＹｅｓ）、原文・訳文編集部３は、１文編集処理を実行する（ステップＳ４０９）。これら文分割、文結合、一文編集等の各処理によって、編集文に特殊記号が付される。各処理の内容については、後で図５の例を用いて詳細に説明する。なお、選択入力された文が長い場合、分割と結合を同時に行うことも有り得る。この場合、ステップＳ４０５、Ｓ４０８の処理が同時に実行されることになる。また、他の一文編集処理との組み合わせも考えられる。
【００４６】
これらの処理の後、原文・訳文編集部３は、編集履歴記憶部１５に対して原文編集履歴内容の更新処理を行い（ステップＳ４０６）、編集履歴記憶部１５に、処理内容が時系列で記憶される。
【００４７】
原文の編集作業を終了した後、ユーザは再翻訳が必要か否かを判断する。再翻訳が必要と判断したユーザは、表示画面上の翻訳ボタンを操作し、再翻訳が不要と判断したユーザは、表示画面上の翻訳ボタン以外のボタン、あるいはキー操作を行うので、原文・訳文編集部３は、原文編集後のユーザの操作に応じて処理内容を変える（ステップＳ４１０）。
【００４８】
例えばユーザにより表示画面上の翻訳ボタンが操作された場合、原文・訳文編集部３は、再翻訳が必要と判定し（ステップＳ４１０のＹｅｓ）、この場合は、編集された原文を翻訳処理部２に渡し、再度の翻訳処理を実行させる（ステップＳ４１１）。
【００４９】
また、ユーザにより他の操作が行われた場合、原文・訳文編集部３は、再翻訳を不要と判定し（ステップＳ４１０のＮｏ）、翻訳処理（ステップＳ４１１）をスキップし、訳文編集が必要か否かの判定処理を行う（ステップＳ４１２）。
【００５０】
このステップＳ４１２の判定処理では、ユーザにより次の文（原文あるいは訳文）が編集対象として指定された場合に、原文・訳文編集部３は、訳文編集を必要と判定し（ステップＳ４１２のＹｅｓ）、指定された編集対象文に対して訳文編集を実行し（ステップＳ４０３）、その後、翻訳結果の文を翻訳メモリ９と文書出力部４へ出力し（ステップＳ４１３）、編集処理を終了する。原文・訳文編集部３より出力された翻訳結果の文は、特殊記号が付加された編集後の原文に対応付けられて翻訳メモリ９に保存（登録）される。
【００５１】
また、ユーザにより次の文（原文あるいは訳文）が編集対象として指定されず、訳文編集が不要な場合（ステップＳ４１２のＮｏ）、原文・訳文編集部３は、訳文編集処理（ステップＳ４０３）をスキップして、編集文を出力し（ステップＳ４１３）、編集処理を終了する。
【００５２】
＜原文・訳文編集部３の動作の実例と翻訳メモリ９への登録例＞
図５は翻訳処理部２から原文・訳文編集部３に送られてきた、編集処理前の原文・訳文および編集履歴記憶部１５の内容を示したものである。これらの例を用いて、具体的な原文・訳文編集部３の動作と翻訳メモリ９への登録内容について説明する。原文・訳文未編集の状態では、編集履歴記憶部１５の内容（原文・訳文）は、それぞれの原文・訳文と全く同じ内容になっている。
【００５３】
これらの例では、翻訳処理から出力された翻訳結果は原文の内容を十分に反映したものとは言えず、修正が必要である。
例えば文５１は、ひらがな表記になっているため、「たなか」が人名と認識されていない例である。文５２では、「田中ですが、」の「が、」が、日本語では軽い接続の意味で使われているが、翻訳結果では逆接の意味と解釈され、逆接の接続詞”although”が出力されている。文５３および文５４は、レイアウトの都合で１文が２つに分割されたため、正しく翻訳されていない例である。
【００５４】
上記の点を考慮して、ユーザが文の選択操作を行い、この選択操作に応じて原文・訳文編集部３が文分割処理、文結合処理、１文編集処理を行い、原文を修正した結果を図６に示す。
【００５５】
文６１は、ひらがな表記を漢字表記に修正したものである。漢字表記にすることで「田中」が人名と解釈され、正しい翻訳結果が出力されている。このように意味が一意に決まるように表記や表現を変更することで、正しい翻訳結果が得られる場合が多い。
文６２および文６３は、「が、」で接続された原文を２文に分割し、それぞれ文として完結するようにしたものである。これらの文を再度翻訳すると、当然だが、逆接の接続詞althoughは訳文に現れなくなる。このような文の分割処理を行うと、編集履歴記憶部１５には、分割した前半文字列の末尾と、後半文字列の先頭に特殊記号”＠数字＠”が挿入された編集履歴が記憶される。”＠”と”＠”の間の数字は、この位置に特殊記号を挿入したことを識別するための特殊記号のＩＤ番号であり、同じＩＤ番号が付いている原文同士は、編集前は繋がっていたことを示す。数字は、通常、文の文節や文の結合部が検出された際に原文・訳文編集部３により連続番号で付与される。
【００５６】
文６４は、文５３および文５４の２文を結合したものである。結合した文の再翻訳結果は、意味の通るものとなっている。このような文の結合処理を行うと、編集履歴記憶部１５には文同士の結合部に”＠数字＠”が挿入された編集履歴が記憶される。
【００５７】
結合処理の場合は同じＩＤ番号を持つ複数の原文は存在しないが、同じＩＤを持つ原文と訳文は存在する。機械翻訳処理部１１は、結合した原文を再翻訳するので、訳文中の結合部は、本来は存在しないはずであるが、編集履歴記憶部１５（訳文）に保存されている結合前の翻訳結果と再翻訳結果とを比較することで、原文の結合部に対応する訳文の結合部を推定（特定）し翻訳を行う。例えば文６４は、”This processing”の後で切れると推定（特定）される。これは、編集履歴記憶部１５に記憶された＠前の文字列”This processing”と再翻訳結果の”This processing”が完全一致しているので、訳文の切れ目はprocessingの後ろであると推定すると、２つの翻訳結果の一致度がもっとも高くなるためである。
すなわち、翻訳処理制御部８は、編集履歴記憶部１５に記憶された訳文（最翻訳結果）に対して、編集履歴記憶部１５に記憶された編集記号付き訳文を基にして、文の切れ目を推定する。
【００５８】
図７は原文を修正して機械翻訳処理部１１が再翻訳した訳文に、更に修正を加えた例である。
この例は、文７４の「処理」に対する訳語「processing」を「process」に変更する修正を加えた例である。このように、原文の修正を行うことで構文的に正しい翻訳結果が得られると、後は翻訳結果の一部を修正するだけで一定水準の訳文を得ることができる。
【００５９】
したがって、最初から自分で英文を書き起こせるユーザは、訳文を最初から自分で作成する必要が無くなり、翻訳の労力が大幅に軽減できる。
また、最初から英文を自分で作成することが難しいユーザにとっては、わずかな修正で正しい英文が得られるため、機械翻訳の翻訳結果が間違っていても、比較的容易に修正が可能となる。
【００６０】
図８は上記の翻訳結果から、翻訳メモリ９に登録された内容を示した図である。
翻訳メモリ９に登録された原文は、修正を加えた原文ではなく、編集履歴記憶部１５の内容であり、オリジナルの原文の文字列に対して文分割部分や文結合部を示す特殊記号を加えたもの（第３の文書の形態）になっている。
【００６１】
この実施形態の翻訳支援装置では、このような翻訳メモリ９への登録方法を採っているが、原文を分割した場合に限り、分割前の原文に復元したものを翻訳メモリ９に登録する、という方法も可能である。この方法によれば、翻訳メモリ検索部１０に特別な機能が無くても、翻訳対象の文が編集前のオリジナルの原文と一致する場合、翻訳メモリ９に登録されたオリジナルの原文と対になっている訳文を出力することができる。
【００６２】
以下、より汎用的な図８に示した内容で翻訳メモリ９に登録する場合について説明する。
＜新たな文書翻訳時の翻訳メモリ検索動作＞
図８に示した翻訳メモリ９を使って、図９に示す新たな文書を翻訳する場合の、翻訳メモリ検索の動作について説明する。翻訳メモリ検索は、図３のステップＳ３０２に示した処理である。
【００６３】
この場合、翻訳メモリ検索部１０は、翻訳対象の１つの文（翻訳文０１と呼ぶとする）に対して、翻訳メモリ９内の１つのデータ（メモリデータ０１と呼ぶ）と比較処理を行い、比較処理終了後、翻訳メモリ９の次のデータとの比較処理を行う。これを繰り返し翻訳文０１と翻訳メモリ９のすべてのデータとの比較処理が終了すると、次の翻訳文０２の検索処理を開始する。
【００６４】
このような比較方法をとったのは、本実施例の動作を分かりやすく説明するためであり、検査高速化のために、インデックス作成などの他の検索方法をとったとしても、本特許の範囲を逸脱するものではない。なお、比較処理の内容によっては、複数の翻訳文、複数のメモリデータをまとめて比較する場合もある。
【００６５】
図１０および図１１は、翻訳文０１と、翻訳メモリデータ１件（メモリデータ０１と呼ぶことにする）との比較処理を示すフローチャートであり、図１０は完全一致検索処理を示し、図１１は類似文検索処理を示す。
【００６６】
翻訳メモリ検索部１０は、まず、図１０の完全一致検索処理を実行した後、完全一致するメモリデータ０１が検出されなかった翻訳文０１に対して、引き続き、図１１の類似文検索処理を実行する。
【００６７】
以下では、まず、図１０のフローチャートを用いて検索処理の動作を説明し、図９の例文が当てはまるケースに対して具体例を使った説明を加える。
＜翻訳メモリ検索動作−完全一致検索＞
翻訳メモリ検索部１０に翻訳対象文（翻訳文０１）が入力されると（ステップＳ５０１）、翻訳メモリ検索部１０は、まず、翻訳文０１とメモリデータ０１とを比較して互いが完全一致するか否かを判定する（ステップＳ５０２）。ここで、完全一致とは、翻訳文０１とメモリデータ０１、つまり翻訳メモリ９に記憶されている翻訳文とが一語一句違わないことを指す。
【００６８】
比較の結果、翻訳文０１とメモリデータ０１とが完全一致した場合、翻訳メモリ検索部１０は、翻訳メモリ９に一致する文が存在するものと判定し（ステップＳ５０２のＹｅｓ）、一致した文をメモリデータ０１とする（ステップＳ５０３）。
【００６９】
このステップＳ５０３のような結果になるケースは、翻訳文０１が図９の文９０の場合に相当する。つまり最初に行った翻訳時に、漢字表記になるよう原文を編集していても、翻訳メモリ９にはオリジナルのひらがな表記の原文である図８の対原文８１「わたしはたなかです。」が登録されていたため、オリジナルと同じひらがな表記の翻訳文０１にメモリデータ０１がマッチして、正しい英文”I am Tanaka.”が翻訳結果とされる。以上は、１文編集処理を行って翻訳メモリ９のデータがマッチするケースの場合である。
【００７０】
ステップＳ５０２の判定処理において、翻訳文０１とメモリデータ０１が完全一致しない場合（ステップＳ５０２のＮｏ）、翻訳メモリ検索部１０は、翻訳文０１とメモリデータ０１の原文中の“＠”の前にある文字列とを比較して完全一致するか否かを判定する（ステップＳ５０４）。
【００７１】
この比較判定の結果、翻訳文０１とメモリデータ０１の原文中の“＠”の前にある文字列とが完全一致しない場合（ステップＳ５０４のＮｏ）、翻訳メモリ検索部１０は、翻訳文０１と一致する文は無しと判定し、検索処理を終了する。
【００７２】
一方、翻訳文０１とメモリデータ０１の原文中の“＠”の前にある文字列とが完全に一致した場合（ステップＳ５０４のＹｅｓ）、翻訳メモリ検索部１０は、“＠”がメモリデータ０１の文末に存在するか否かを判定する（ステップＳ５０５）。
【００７３】
この判定の結果、“＠”がメモリデータ０１の文末に存在した場合（ステップＳ５０５のＹｅｓ）、翻訳メモリ検索部１０は、さらに一致しなかった翻訳文中の文字列（この部分を未一致部と呼び、一致している部分を一致部と呼ぶ）が、先頭部分に同じＩＤ番号が付いた＠記号を持った翻訳メモリ９のデータ（これをメモリデータ０２と呼ぶ）と一致するか否かを判定する（ステップＳ５０６）。
【００７４】
この判定の結果、未一致部とメモリデータ０２とが完全一致した場合、翻訳メモリ検索部１０は、翻訳メモリ９に一致する文が有るものと判定し（ステップＳ５０６のＹｅｓ）、一致した文については、特殊記号“＠”を削除すると共にメモリデータ０１の後にメモリデータ０２を結合し、結合文（メモリデータ０１＋０２）を生成する（Ｓ５０７）。
このＳ５０７の結果になるケースは、翻訳文０１が図９の文９１の場合に相当する。
【００７５】
翻訳メモリ検索部１０は、翻訳メモリ９を検索した場合、まず「私は田中ですが、」の部分がメモリデータの対原文８２「私は田中ですが、＠１＠」の”＠１＠”の前の部分と一致する（ステップＳ５０４）。なお＠１＠の数字の「１」は新たな文節や結合位置が検出されたときに、機械的に順に付加されている連続番号である。
次のステップＳ５０６の調査処理において、「彼は中田です。」の部分がメモリデータの対原文８３「＠１＠彼は中田です。」の＠１＠より後ろの文字列と一致する。
この調査結果に基づいて、Ｓ５０７の処理では、”I am Tanaka. He is Nakada.”という、逆接の接続詞の入らない英文の翻訳結果が生成される。
【００７６】
このように、翻訳メモリ９の内容を作成するときに、原文を分割して翻訳メモリ９に登録したときに、分割されたデータに、互いに連結していることを示す特殊記号（＠１＠等）が付加されているので、オリジナルと同じく分割されていない翻訳文にメモリデータがマッチする。以上は、文分割処理を行って登録した翻訳メモリデータがマッチするケースである。
【００７７】
ステップＳ５０６の判定処理で「未一致部」がメモリデータ０２と完全一致しない場合（ステップＳ５０６のＹｅｓ）、翻訳メモリ検索部１０は、予め設定された数式（関数式）を用いてあいまい一致の一致率を計算し、その計算結果の数値と予め設定されていた基準値とを比較して、計算結果の数値が基準値を超えているか否かを判定する（ステップＳ５０８）。
すなわち、類似度がある一定の値以上の場合（ステップＳ５０８のＹｅｓ）、翻訳メモリ検索部１０は、翻訳文０１の「一致部」とメモリデータ０１とがマッチ（一致）したものと見なし、翻訳結果にはメモリデータ０１の訳文を出力すると共に、「未一致部」についてはメモリデータとマッチしなかったものと判定する（ステップＳ５０９）。
類似度がある一定の値に満たない場合（ステップＳ５０８のＮｏ）、翻訳メモリ検索部１０は、「一致部」、「未一致部」共にメモリデータとマッチしなかったものと判定し、完全一致の検索処理を終了する。
これは、文の一部はマッチしていても、残りの部分の一致度が非常に低い場合は、文全体としての意味を考え直した方が良い場合があるからである。ただしユーザの意志によって、ステップＳ５０８の判定処理をスキップする設定に変更し、「一致部」はメモリデータとマッチしたものと判定して、メモリデータの訳文を表示するようなモードを導入するようにしてもよい。
【００７８】
ステップＳ５０９のような結果になるケースは、翻訳文が図９の文９２の場合に相当する。文９２の前半「私は田中ですが、」は、メモリデータの対原文８２”＠”前の部分「私は田中ですが、」と一致するが、後半部の「生まれは千葉です」がメモリデータの対原文８３と一致しているのは助詞「は」と助動詞「です」のみで、一致度は非常に低い（８語中３語）。このため、「一致部」は、「未一致部」とともにメモリデータと不一致と判定される。
ステップＳ５０５の判定処理において、“＠”がメモリデータの文末にない場合（ステップＳ５０５のＮｏ）、翻訳メモリ検索部１０は、ステップＳ５０４の処理での翻訳メモリ９の未一致部が、次の翻訳対象文（翻訳文０２と呼ぶ）と完全一致するか否かを判定する（ステップＳ５１０）。
未一致部と翻訳文０２が一致した場合（ステップＳ５１０のＹｅｓ）、翻訳メモリ検索部１０は、一致文ありと判定し、一致文を、翻訳文０１に対してはメモリデータ０１の”＠”前の部分、翻訳文０２に対してはメモリデータ０１の”＠”の後の部分とする結合処理を行い（ステップＳ５１１）、訳文を生成する。
【００７９】
このステップＳ５１１のような結果になるケースは、翻訳文が図９の文９３および文９４の場合に相当する。
【００８０】
すなわち、翻訳メモリ検索部１０が翻訳メモリ９を検索したところ、まず図９の文９３「この処理は」の部分がメモリデータの対原文８４の「この処理は＠２＠」の”＠２＠”の前の部分と一致する（ステップＳ５０４）。
【００８１】
次に、図９の文９４「以下のように行います。」の部分が”＠２＠”の後の部分と一致する（ステップＳ５１０）。ステップＳ５１１では、この検索結果に基づいて、”This process＠２＠ is performed as follows．”という訳文（翻訳結果）が生成される。
【００８２】
このように、翻訳メモリ９のデータを作成したときに、原文を結合して翻訳メモリ９に登録しても、結合部に結合の履歴を示す特殊記号（＠２＠）が挿入されるので、オリジナルと同じく結合されていない翻訳文にメモリデータがマッチする。
【００８３】
また、原文の結合部と対応する結合部が訳文においても特殊記号（＠２＠）が挿入されているので、結合されていない原文の各部分に対して、対応する訳文を出力することができる。以上は、文結合処理を行って登録した翻訳メモリデータがマッチするケースである。
【００８４】
ステップＳ５１０の処理において、翻訳メモリ９の「未一致部」が翻訳文０２と完全一致しない場合（ステップＳ５１０のＮｏ）、翻訳メモリ検索部１０は、あいまい一致の一致率を計算し、ステップＳ５０８の判定処理と同様に、類似度がある一定の値を超えているか否かを判定する（ステップＳ５１２）。
【００８５】
判定の結果、類似度がある一定の値以上の場合（ステップＳ５１２のＹｅｓ）、翻訳メモリ検索部１０は、翻訳メモリ９の「一致部」を翻訳文０１とマッチしたものと判定し、翻訳結果としてメモリデータの訳文の“＠”前の部分を出力し、「未一致部」についてはメモリデータとマッチしなかったものと判定する（ステップＳ５１３）。
【００８６】
また、類似度がある一定の値に満たない場合（ステップＳ５１２のＮｏ）、翻訳メモリ検索部１０は、翻訳文０１、０２ともにメモリデータとマッチしなかったものと判定し、完全一致の検索処理を終了となる。なお、この他、ステップＳ５０８の基準値との比較判定処理の場合と同様に、ステップＳ５１２の比較判定を行わずに、「一致部」のメモリデータの訳文を表示するモードを設定してもよい。
ステップＳ５１３のような結果になるケースは、翻訳文が図９の文９５、文９６の場合に相当する。
すなわち、文９５は、翻訳メモリデータの対原文８４“＠”前の文字列と一致するが、文９６が“＠”後の文字列と一致しているのは動詞「行う」のみである上、活用形が異なり、一致度は非常に低い。このため、翻訳文０１は、翻訳文０２と共にメモリデータと不一致と判定される。
【００８７】
＜翻訳メモリ検索動作−類似文一致検索＞
図１０の完全一致検索で一致文なしと判定された翻訳対象文に対して、図１１の類似文検索を行う。以下では、図１１のフローチャートを参照して類似文検索処理について説明する。文分割処理、文結合処理が行われたメモリデータが類似文としてヒットする場合については、図９の具体例を用いて説明する。
翻訳メモリ検索部１０は、図１０に示した完全一致検索処理で翻訳対象文と一致する文が存在しないものと判定すると、類似文検索処理を行う。
【００８８】
この場合、図１１に示すように、一致文なしの翻訳対象文が翻訳メモリ検索部１０に入力されると（ステップＳ６０１）、翻訳メモリ検索部１０は、まず、翻訳メモリ９を検索し、翻訳メモリ９に類似文はあるか否かを判定する（ステップＳ６０２）。
【００８９】
ここでは、翻訳対象文とメモリデータ０１との類似度が一定以上の値か否かで類似文の有無を判定する。
類似文検索での一致度は、日本語の場合、文字列の中で一致した文字数がどのくらいあるかといった文字数割合を計算で求める。また、英語の場合は文字列の中で一致した単語数がどのくらいあるかの単語数割合を計算で求める。
【００９０】
活用形が異なる単語は、一定の係数をかけた上で「一致」と判定する。計算の結果として得られた類似度が、ユーザが予め設定しておいた値以上の場合（ステップＳ６０２のＹｅｓ）、翻訳メモリ検索部１０は、翻訳メモリ９に類似文が存在したものと判定し、類似文をメモリデータ０１とする（ステップＳ６０３）。
【００９１】
また、類似度が、ユーザが予め設定しておいた値未満の場合（ステップＳ６０２のＮｏ）、翻訳メモリ検索部１０は、翻訳メモリ９に類似文が存在しないものと判定し、次に翻訳対象文とメモリデータ０１の原文中の“＠”の前にある文字列との類似度を判定する（ステップＳ６０４）。
翻訳対象文と“＠”の前にある文字列との類似度を判定した結果でも、類似度が一定の値に満たない場合（ステップＳ６０４のＮｏ）、翻訳メモリ検索部１０は、類似文なしと判定し、類似文検索処理を終了する。
【００９２】
一方、類似文ありと判定した場合（ステップＳ６０４のＹｅｓ）、翻訳メモリ検索部１０は、“＠”がメモリデータ０１の文末にあるか否かを判定する（ステップＳＳ６０５）。
【００９３】
この判定の結果、“＠”がメモリデータ０１の文末にある場合（ステップＳ６０５のＹｅｓ）、翻訳メモリ検索部１０は、さらにステップＳ６０４の比較判定処理で一致しなかった翻訳文中の未一致部と、メモリデータ０２との類似度を判定する（ステップＳ６０６）。
【００９４】
この判定の結果、類似度がある一定以上の値に満たない場合（ステップＳ６０６のＮｏ）、翻訳メモリ検索部１０は、類似文なしと判定し、処理を終了する。
また、類似度がある一定の値以上の場合（ステップＳ６０６のＹｅｓ）、翻訳メモリ検索部１０は、類似文ありと判定し、検索された類似文の特殊記号＠数字＠を削除し、メモリデータ０１の後にメモリデータ０２を結合した文を生成する（ステップＳ６０７）。
【００９５】
ステップＳ６０７の結果となるケースは、翻訳文が図９の文９７の場合に相当する。
つまり、図９の文９７の「わたしは田中ですが、」および翻訳メモリ９の対原文８２「私は田中ですが、」と、文９８の「かれは中田です。」および翻訳メモリ９の対原文８２「彼は中田です。」とは、「私」および「彼」の表記が異なる以外は一致している。
【００９６】
ステップＳ６０５の比較判定処理において、“＠”がメモリデータ０１の文末にない場合（ステップＳ６０５のＮｏ）、翻訳メモリ検索部１０は、さらにステップＳ６０４の比較判定処理での翻訳メモリ９の未一致部と、翻訳文０２との類似度を判定する（ステップＳ６０８）。
【００９７】
類似度がある一定以上の値に満たない場合（ステップＳ６０８のＮｏ）、翻訳メモリ検索部１０は、類似文なしと判定して処理を終了する。
一方、類似度がある一定の値以上の場合（ステップＳ６０８のＹｅｓ）、翻訳メモリ検索部１０は、類似文ありと判定し、類似文は、翻訳文０１に対してはメモリデータ０１の“＠”前の部分、翻訳文０２に対してはメモリデータ０１の“＠”の後の部分とした文を生成する（ステップＳ６０９）。
ステップＳ６０９の結果になるケースは、翻訳文が図９の文９８および文９９の場合に相当する。
【００９８】
つまり図９の文９８の「あの処理は」は、メモリデータ対原文８４の“＠”前部分と指示語が異なるだけであり（「この」と「あの」）、文９９はメモリデータの対原文８４の“＠”後部分と完全一致している。
【００９９】
このようにこの実施形態の翻訳支援装置によれば、翻訳メモリ９に原文とその翻訳結果を登録する際、原文に対して編集が行われていた場合、編集前の原文の状態を再現できるよう、原文を編集した文字例の位置に特殊記号（＠数字＠）を付加した文書（第３の文書）を生成し、それを第１の文書の編集履歴として編集履歴記憶部１５に記憶する。
また、生成した第３の文書を再翻訳した翻訳結果の文書（第４の文書）を第３の文書と対応付けて翻訳メモリ９に保存（登録）するので、機械翻訳の精度を向上できると共に、編集履歴記憶部１５を参照することで機械翻訳が翻訳し易くなる。
さらに、第３の文書に付加されている特殊記号を付加時の規則で削除することで原文の状態に戻せるので、原文自体に対して編集を気軽に行うことができる。さらに原文に対して文分割、文結合、用語の置換、情報の追加などの編集を気軽に行うことができる。
【０１００】
この結果、機械翻訳の能力を十分活用し、翻訳作業の効率を高めることができる。
【図面の簡単な説明】
【０１０１】
【図１】本発明に係る一実施形態の翻訳支援装置の全体構成を示すブロック図。
【図２】図１の翻訳支援装置の処理全体の流れを表すフローチャート。
【図３】図１の翻訳支援装置の翻訳処理の流れを表すフローチャート。
【図４】図１の翻訳支援装置の編集処理の流れを表すフローチャート。
【図５】編集処理前の原文・訳文および編集履歴記憶部の内容を示す図。
【図６】原文編集後の原文、再翻訳結果および編集履歴記憶部の内容を示す図。
【図７】訳文編集後の原文、再翻訳結果および編集履歴記憶部の内容を示す図。
【図８】翻訳メモリの登録内容を示す図。
【図９】新たな文書での翻訳対象文。
【図１０】図１の翻訳支援装置において、完全一致検索の際の翻訳メモリ検索処理を示すフローチャート。
【図１１】図１の翻訳支援装置において、類似文検索の際の翻訳メモリ検索処理を示すフローチャート。
【符号の説明】
【０１０２】
１…文分割処理部、２…翻訳処理部、３…原文・訳文編集部、４…文書出力部、５…原文文書入力部、６…原文文書自動分割部、７…文分割規則テーブル、８…翻訳処理制御部、９…翻訳メモリ、１０…翻訳メモリ検索部、１１…機械翻訳処理部、１２…翻訳用辞書、１３…形態素解析、構文解析、意味解析、言語変換処理部、１４…訳文生成部、１５…編集履歴記憶部。

【特許請求の範囲】
【請求項１】
ある言語の原文を機械翻訳することで他の言語の翻訳文を生成するコンピュータに処理を行わせる翻訳支援プログラムにおいて、
前記コンピュータを、
前記原文を予め記憶されている翻訳辞書に基づいて機械翻訳することで翻訳文を生成する翻訳手段と、
前記翻訳手段による翻訳結果の再利用を目的として原文と翻訳文を対応付けて保存する翻訳メモリと、
前記翻訳手段により翻訳された翻訳文および原文の少なくとも一方を編集して生成した特殊記号付きの翻訳文、特殊記号付きの原文の編集履歴が記憶される編集履歴記憶部と、
前記原文および翻訳文の少なくとも一つに対して編集対象の文字列の選択操作を行う操作手段と、
前記操作手段により原文の中から選択された文字列に対して、前記編集履歴記憶部に記憶された特殊記号付きの翻訳文を基に、分割、結合、および一文編集のうちの少なくとも一つを行う位置を推定し、その位置に特殊記号を付加して特殊記号付きの原文を生成する手段と、
生成された特殊記号付きの原文を原文の編集履歴として前記編集履歴記憶部に記憶する手段
として機能させることを特徴とする翻訳支援プログラム。
【請求項２】
請求項１記載の翻訳支援プログラムにおいて、
前記コンピュータを、
前記特殊記号付きの原文を、特殊記号に従って再度翻訳して新たな翻訳文を生成する再翻訳手段と、
前記再翻訳手段により生成された新たな翻訳文を翻訳結果の文書として前記特殊記号付きの原文に対応付けて前記翻訳メモリに記憶する手段
として機能させることを特徴とする翻訳支援プログラム。
【請求項３】
ある言語の原文を予め記憶されている翻訳辞書に基づいて機械翻訳することで他の言語の翻訳文を生成する翻訳手段と、
前記翻訳手段による翻訳結果の再利用を目的として原文と翻訳文とを対応付けて保存する翻訳メモリと、
前記翻訳手段により翻訳された翻訳文および原文の少なくとも一方を編集して生成した特殊記号付きの翻訳文、特殊記号付きの原文の編集履歴が記憶される編集履歴記憶部と、
前記翻訳文および原文の少なくとも一つに対して編集対象の文字列の選択操作を行う操作手段と、
前記操作手段により前記原文の中から選択された文字列に対して、前記編集履歴記憶部に記憶された特殊記号付きの翻訳文を基に、分割、結合、および一文編集のうちの少なくとも一つを行う位置を推定し、その位置に特殊記号を付加して特殊記号付きの原文を生成する手段と、
生成された特殊記号付きの原文を原文の編集履歴として前記編集履歴記憶部に記憶する手段と
を具備したことを特徴とする翻訳支援装置。
【請求項４】
請求項３記載の翻訳支援装置において、
前記特殊記号付きの原文を、特殊記号に従って再度翻訳して新たな翻訳文を生成する再翻訳手段と、
前記再翻訳手段により生成された新たな翻訳文を翻訳結果の文書として前記特殊記号付きの原文に対応付けて前記翻訳メモリに記憶する手段と
を具備したことを特徴とする翻訳支援装置。
【請求項５】
ある言語の原文を予め記憶されている翻訳辞書に基づいて機械翻訳することで他の言語の翻訳文を生成する上で、前記原文の中から選択された文字列に対して、編集履歴記憶部に記憶された特殊記号付きの翻訳文を基に、分割、結合、および一文編集のうちの少なくとも一つを行う位置を推定し、その位置に特殊記号を付加して特殊記号付きの原文を生成するステップと、
生成された特殊記号付きの原文を原文の編集履歴として前記編集履歴記憶部に記憶するステップと
を有することを特徴とする翻訳支援方法。
【請求項６】
請求項５記載の翻訳支援方法において、
前記特殊記号付きの原文を、特殊記号に従って再度翻訳して新たな翻訳文を生成するステップと、
再度翻訳して生成した新たな翻訳文を翻訳結果の文書として前記特殊記号付きの原文に対応付けて翻訳メモリに保存するステップと
を有することを特徴とする翻訳支援方法。

【図１】