翻訳支援方法、翻訳支援装置及びコンピュータプログラム
【課題】翻訳メモリを共有メモリとして用いて翻訳効率を改善すると共に、翻訳メモリの機密性を効果的に維持することができる翻訳支援方法、翻訳支援装置及びコンピュータプログラムを提供する。
【解決手段】原文情報、翻訳文情報及び翻訳に係る局面に関する局面情報を含む付随情報の入力を受け付け、入力を受け付けた局面情報と既に翻訳メモリに記憶されている局面情報との類似度である局面類似度を算出する。算出された局面類似度が所定の閾値より小さい局面情報が存在する場合、局面情報に対応する翻訳文情報についてのみ、入力を受け付けた翻訳文情報との類似度である訳文類似度を算出する。算出された訳文類似度が所定の閾値より大きい翻訳文情報が存在する場合、入力を受け付けた原文情報、翻訳文情報及び付随情報を共有メモリへ複写する。
【解決手段】原文情報、翻訳文情報及び翻訳に係る局面に関する局面情報を含む付随情報の入力を受け付け、入力を受け付けた局面情報と既に翻訳メモリに記憶されている局面情報との類似度である局面類似度を算出する。算出された局面類似度が所定の閾値より小さい局面情報が存在する場合、局面情報に対応する翻訳文情報についてのみ、入力を受け付けた翻訳文情報との類似度である訳文類似度を算出する。算出された訳文類似度が所定の閾値より大きい翻訳文情報が存在する場合、入力を受け付けた原文情報、翻訳文情報及び付随情報を共有メモリへ複写する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、翻訳メモリを共有メモリとして用いて翻訳効率を改善すると共に、翻訳メモリの機密性を維持することができる翻訳支援方法、翻訳支援装置及びコンピュータプログラムに関する。
【背景技術】
【0002】
オフィス文書を所定の言語から他の言語に翻訳する場合、定型文を翻訳するときのように同一の訳文を繰り返し採用することが多い。翻訳効率を高めるべく、原文と訳文との組み合わせ情報が記憶してある翻訳メモリを共有し、翻訳メモリから同一の訳文を抽出する。
【0003】
定型文の翻訳効率を高めるには、なるべく広い範囲、例えば組織内の全員で翻訳メモリを共有することが好ましい。一方で、訳文を共有する範囲が広がった場合、訳文に含まれている機密情報が広範囲に拡散するおそれがある。情報は、内容を閲覧することができる主体が少ないほど漏洩の危険は少ない。したがって、機密性の観点からはなるべく狭い範囲で翻訳メモリを共有すべきである。
【0004】
このように相反する問題を解決する手段はほとんど存在しない。例えば非特許文献1では、自動翻訳を支援するツールが開示されているが、翻訳効率の改善を主眼に置いている。また、翻訳メモリの機密性を保持する技術としては、いわゆる文書サニタイズ技術が挙げられる。固有表現抽出技術を用いてリスト(辞書)から固有表現を同定し、翻訳メモリにて共有するのが適切ではない語の削除又は置換を実行する。
【非特許文献1】マーク プライアー(marc prior)、オメガT(Omega T)ホームページ、オメガTプロジェクト、[online]、[平成20年8月1日検索]、インターネット<URL:http://www.omegat.org>
【発明の開示】
【発明が解決しようとする課題】
【0005】
上述したように非特許文献1では、翻訳効率の改善を望むことはできるが、翻訳メモリを共有化することによる機密情報の漏洩については考慮がなされていない。
【0006】
また、翻訳メモリに文書サニタイズ技術を適用する場合、一般名詞を組み合わせることにより構成された固有名詞、例えば「新BRICs外貨債」、「新世代オープンプラットホームプロジェクト」等については共有対象から外れることから訳文として抽出することができない。また、固有名詞であるか否かだけで共有化するか否かを判別するため、文章単位では共有化するか否かを判別することができない。
【0007】
本発明は斯かる事情に鑑みてなされたものであり、翻訳メモリを共有メモリとして用いて翻訳効率を改善すると共に、翻訳メモリの機密性を効果的に維持することができる翻訳支援方法、翻訳支援装置及びコンピュータプログラムを提供することを目的とする。
【課題を解決するための手段】
【0008】
上記目的を達成するために第1発明に係る翻訳支援方法は、原文情報と翻訳文情報との組み合わせ情報、及び所定の付随情報を記憶する翻訳メモリと、ネットワークを介して複数のユーザがアクセスすることが可能な共有メモリとを用い、翻訳対象となる原文情報を前記翻訳メモリ及び前記共有メモリを照会しつつ翻訳する処理を支援するコンピュータで実行することが可能な翻訳支援方法において、原文情報、翻訳文情報及び翻訳に係る局面に関する局面情報を含む付随情報の入力を受け付け、入力を受け付けた付随情報に含まれる局面情報に基づいて、既に前記翻訳メモリに記憶されている付随情報に含まれる局面情報との類似度である局面類似度を算出し、算出された局面類似度が所定の閾値より小さい局面情報が存在するか否かを判断し、前記局面類似度が所定の閾値より小さい局面情報が存在すると判断することに応答して、該局面情報に対応する翻訳文情報について、入力を受け付けた翻訳文情報との類似度である訳文類似度を算出し、算出された訳文類似度が所定の閾値より大きい翻訳文情報が存在するか否かを判断し、前記訳文類似度が所定の閾値より大きい翻訳文情報が存在すると判断することに応答して、入力を受け付けた原文情報、翻訳文情報及び付随情報を前記共有メモリへ複写することを特徴とする。
【0009】
また、第2発明に係る翻訳支援方法は、第1発明において、前記局面情報間のベクトル距離である局面間距離を算出し、算出された局面間距離が所定の閾値より大きい局面情報が存在するか否かを判断し、前記局面間距離が所定の閾値より大きい局面情報が存在すると判断することに応答して、該局面情報に対応する前記翻訳文情報間のベクトル距離である訳文間距離を算出し、算出された訳文間距離が所定の閾値より小さい翻訳文情報が存在するか否かを判断し、前記訳文間距離が所定の閾値より小さい翻訳文情報が存在すると判断することに応答して、該翻訳文情報に対応する原文情報及び付随情報を前記共有メモリへ複写することを特徴とする。
【0010】
また、第3発明に係る翻訳支援方法は、第2発明において、前記原文情報間のベクトル距離である原文間距離を算出し、算出された原文間距離が所定の閾値より小さい原文情報が存在するか否かを判断し、前記原文間距離が所定の閾値より小さい原文情報が存在すると判断することに応答して、該原文情報に対応する翻訳文情報についてのみ前記訳文間距離を算出することを特徴とする。
【0011】
次に、上記目的を達成するために第4発明に係る翻訳支援装置は、原文情報と翻訳文情報との組み合わせ情報、及び所定の付随情報を記憶する翻訳メモリと、ネットワークを介して複数のユーザがアクセスすることが可能な共有メモリとを備え、翻訳対象となる原文情報を前記翻訳メモリ及び前記共有メモリを照会しつつ翻訳する処理を支援する翻訳支援装置において、原文情報、翻訳文情報及び翻訳に係る局面に関する局面情報を含む付随情報の入力を受け付ける受付手段と、入力を受け付けた付随情報に含まれる局面情報に基づいて、既に前記翻訳メモリに記憶されている付随情報に含まれる局面情報との類似度である局面類似度を算出する局面類似度算出手段と、算出された局面類似度が所定の閾値より小さい局面情報が存在するか否かを判断する局面類似度判断手段と、該局面類似度判断手段で所定の閾値より小さい局面情報が存在すると判断することに応答して、該局面情報に対応する翻訳文情報について、入力を受け付けた翻訳文情報との類似度である訳文類似度を算出する訳文類似度算出手段と、算出された訳文類似度が所定の閾値より大きい翻訳文情報が存在するか否かを判断する訳文類似度判断手段と、該訳文類似度判断手段で所定の閾値より大きい翻訳文情報が存在すると判断することに応答して、入力を受け付けた原文情報、翻訳文情報及び付随情報を前記共有メモリへ複写する複写手段とを備えることを特徴とする。
【0012】
また、第5発明に係る翻訳支援装置は、第4発明において、前記局面類似度算出手段は、前記局面情報間のベクトル距離である局面間距離を算出するようにしてあり、前記局面類似度判断手段は、算出された局面間距離が所定の閾値より大きい局面情報が存在するか否かを判断するようにしてあり、前記訳文類似度算出手段は、該局面類似度判断手段で前記局面間距離が所定の閾値より大きい局面情報が存在すると判断することに応答して、該局面情報に対応する前記翻訳文情報間のベクトル距離である訳文間距離を算出するようにしてあり、前記訳文類似度判断手段は、算出された訳文間距離が所定の閾値より小さい翻訳文情報が存在するか否かを判断するようにしてあり、前記複写手段は、該訳文類似度判断手段で前記訳文間距離が所定の閾値より小さい翻訳文情報が存在すると判断することに応答して、該翻訳文情報に対応する原文情報及び付随情報を前記共有メモリへ複写するようにしてあることを特徴とする。
【0013】
また、第6発明に係る翻訳支援装置は、第5発明において、前記原文情報間のベクトル距離である原文間距離を算出する原文間距離算出手段と、算出された原文間距離が所定の閾値より小さい原文情報が存在するか否かを判断する原文類似度判断手段と、該原文類似度判断手段で、前記原文間距離が所定の閾値より小さい原文情報が存在すると判断することに応答して、前記訳文類似度算出手段は、該原文情報に対応する翻訳文情報についてのみ前記訳文間距離を算出するようにしてあることを特徴とする。
【0014】
次に、上記目的を達成するために第7発明に係るコンピュータプログラムは、原文情報と翻訳文情報との組み合わせ情報、及び所定の付随情報を記憶する翻訳メモリと、ネットワークを介して複数のユーザがアクセスすることが可能な共有メモリとを備え、翻訳対象となる原文情報を前記翻訳メモリ及び前記共有メモリを照会しつつ翻訳する処理を支援するコンピュータで実行することが可能なコンピュータプログラムにおいて、前記コンピュータを、原文情報、翻訳文情報及び翻訳に係る局面に関する局面情報を含む付随情報の入力を受け付ける受付手段、入力を受け付けた付随情報に含まれる局面情報に基づいて、既に前記翻訳メモリに記憶されている付随情報に含まれる局面情報との類似度である局面類似度を算出する局面類似度算出手段、算出された局面類似度が所定の閾値より小さい局面情報が存在するか否かを判断する局面類似度判断手段、該局面類似度判断手段で所定の閾値より小さい局面情報が存在すると判断することに応答して、該局面情報に対応する翻訳文情報について、入力を受け付けた翻訳文情報との類似度である訳文類似度を算出する訳文類似度算出手段、算出された訳文類似度が所定の閾値より大きい翻訳文情報が存在するか否かを判断する訳文類似度判断手段、及び該訳文類似度判断手段で所定の閾値より大きい翻訳文情報が存在すると判断することに応答して、入力を受け付けた原文情報、翻訳文情報及び付随情報を前記共有メモリへ複写する複写手段として機能させることを特徴とする。
【0015】
また、第8発明に係るコンピュータプログラムは、第7発明において、前記局面類似度算出手段を、前記局面情報間のベクトル距離である局面間距離を算出する手段として機能させ、前記局面類似度判断手段を、算出された局面間距離が所定の閾値より大きい局面情報が存在するか否かを判断する手段として機能させ、前記訳文類似度算出手段を、該局面類似度判断手段で前記局面間距離が所定の閾値より大きい局面情報が存在すると判断することに応答して、該局面情報に対応する前記翻訳文情報間のベクトル距離である訳文間距離を算出する手段として機能させ、前記訳文類似度判断手段を、算出された訳文間距離が所定の閾値より小さい翻訳文情報が存在するか否かを判断する手段として機能させ、前記複写手段を、該訳文類似度判断手段で前記訳文間距離が所定の閾値より小さい翻訳文情報が存在すると判断することに応答して、該翻訳文情報に対応する原文情報及び付随情報を前記共有メモリへ複写する手段として機能させることを特徴とする。
【0016】
また、第9発明に係るコンピュータプログラムは、第8発明において、前記コンピュータを、前記原文情報間のベクトル距離である原文間距離を算出する原文間距離算出手段、及び算出された原文間距離が所定の閾値より小さい原文情報が存在するか否かを判断する原文類似度判断手段として機能させ、該原文類似度判断手段で、前記原文間距離が所定の閾値より小さい原文情報が存在すると判断することに応答して、前記訳文類似度算出手段を、該原文情報に対応する翻訳文情報についてのみ前記訳文間距離を算出する手段として機能させることを特徴とする。
【発明の効果】
【0017】
本発明によれば、翻訳メモリに記憶された訳文を用いる局面が異なる場合であるにもかかわらず、言語的に類似している訳文については汎用的に用いることが可能な訳文であるとの前提に基づいて、局面が異なり、かつ訳文が類似している訳文に関する情報のみを共有メモリに記憶することにより、汎用的であると考えられる訳文のみを複数のユーザで共有することができる。したがって、局面に依存するような固有情報の共有化を未然に回避することができ、翻訳効率の改善を図ることができると同時に、一定の情報の拡散を防止することも可能となる。
【発明を実施するための最良の形態】
【0018】
以下、本発明の実施の形態に係る翻訳支援装置について、図面に基づいて具体的に説明する。以下の実施の形態は、特許請求の範囲に記載された発明を限定するものではなく、実施の形態の中で説明されている特徴的事項の組み合わせの全てが解決手段の必須事項であるとは限らないことは言うまでもない。
【0019】
また、本発明は多くの異なる態様にて実施することが可能であり、実施の形態の記載内容に限定して解釈されるべきものではない。実施の形態を通じて同じ要素には同一の符号を付している。
【0020】
以下の実施の形態では、コンピュータシステムにコンピュータプログラムを導入した翻訳支援装置について説明するが、当業者であれば明らかな通り、本発明はその一部をコンピュータで実行することが可能なコンピュータプログラムとして実施することができる。したがって、本発明は、翻訳支援装置というハードウェアとしての実施の形態、ソフトウェアとしての実施の形態、又はソフトウェアとハードウェアとの組み合わせの実施の形態をとることができる。コンピュータプログラムは、ハードディスク、DVD、CD、光記憶装置、磁気記憶装置等の任意のコンピュータで読み取ることが可能な記録媒体に記録することができる。
【0021】
本発明の実施の形態では、翻訳メモリに記憶された訳文を用いる局面が異なる場合であるにもかかわらず、言語的に類似している訳文については汎用的に用いることが可能な訳文であるとの前提に基づいて、局面が異なり、かつ訳文が類似している訳文に関する原文情報、翻訳文情報、付随情報を共有メモリに記憶する。これにより、汎用的であると考えられる訳文に関する情報のみを複数のユーザで共有し、局面に依存するような固有的な訳文に関する情報の共有化を避けることができるので、翻訳効率の改善を図ることができると同時に、機密情報が含まれる可能性が高い固有的な情報については共有化されないことから、情報の機密性を一定の水準で維持することが可能となる。ここで「局面」とは、原文から翻訳文を生成する状況を意味しており、原文を含む文書の属する分野、セクタ(保険、公共、運輸等)等を含む広い概念である。また、「ベクトル距離」とは、予め定義されたn(nは自然数)次元空間上のベクトル間の内積の大きさを意味しており、比較対象となる2つの空間ベクトル間のなす角度の大きさに相当する。なお、以下の実施の形態では、「翻訳メモリ」という文言を原文情報、翻訳文情報、付随情報で構成される情報の意味で用い、ハードウエアとしての翻訳メモリは翻訳メモリ記憶部と、共有メモリは共有翻訳メモリ記憶部と換言する。
【0022】
図1は、本発明の実施の形態に係る翻訳支援装置の構成例を示すブロック図である。本発明の実施の形態に係る翻訳支援装置1は、少なくともCPU(中央演算装置)11、メモリ12、記憶装置13、I/Oインタフェース14、ビデオインタフェース15、可搬型ディスクドライブ16、通信インタフェース17及び上述したハードウェアを接続する内部バス18で構成されている。
【0023】
CPU11は、内部バス18を介して翻訳支援装置1の上述したようなハードウェア各部と接続されており、上述したハードウェア各部の動作を制御するとともに、記憶装置13に記憶されているコンピュータプログラム100に従って、種々のソフトウェア的機能を実行する。メモリ12は、SRAM、SDRAM等の揮発性メモリで構成され、コンピュータプログラム100の実行時にロードモジュールが展開され、コンピュータプログラム100の実行時に発生する一時的なデータ等を記憶する。
【0024】
記憶装置13は、内蔵される固定型記憶装置(ハードディスク)、SRAM等の揮発性メモリ、ROM等の不揮発性メモリ等で構成されている。記憶装置13に記憶されているコンピュータプログラム100は、プログラム及びデータ等の情報を記録したDVD、CD−ROM等の可搬型記録媒体90から、可搬型ディスクドライブ16によりダウンロードされ、実行時には記憶装置13からメモリ12へ展開して実行される。もちろん、通信インタフェース17を介してネットワーク2に接続されている外部のコンピュータからダウンロードされたコンピュータプログラムであっても良い。
【0025】
また記憶装置13は、翻訳メモリ記憶部(翻訳メモリ)131及び共有翻訳メモリ記憶部(共有メモリ)132を備えている。翻訳メモリ記憶部131には、原文情報と翻訳文情報との組み合わせ情報、及び所定の付随情報で構成される、いわゆる翻訳メモリを複数記憶してある。所定の付随情報は、例えばメタデータとして付加されており、少なくとも翻訳処理がなされた状況に関する情報である局面情報を含んでいる。共有翻訳メモリ記憶部132には、翻訳メモリ記憶部131に記憶されている翻訳メモリのうち、複数の不特定ユーザにより共有することが可能な翻訳メモリのみを記憶する。
【0026】
通信インタフェース17は内部バス18に接続されており、インターネット、LAN、WAN等の外部のネットワーク2に接続されることにより、外部のコンピュータ等とデータ送受信を行うことが可能となっている。ネットワーク2に接続されている外部の翻訳装置3、3、・・・は、新たに生成された翻訳メモリを翻訳支援装置1の翻訳メモリ記憶部131に登録することはできるが、共有翻訳メモリ記憶部132に登録することはできない。一方、ネットワーク2に接続されている外部の翻訳装置3、3、・・・は、翻訳支援装置1の共有翻訳メモリ記憶部132を照会して翻訳メモリを読み出すことはできるが、翻訳メモリ記憶部131に記憶されている翻訳メモリを読み出すことはできない。
【0027】
I/Oインタフェース14は、キーボード21、マウス22等のデータ入力媒体と接続され、データの入力を受け付ける。また、ビデオインタフェース15は、CRTモニタ、LCD等の表示装置23と接続され、所定の画像を表示する。
【0028】
図2は、本発明の実施の形態に係る翻訳支援装置1の機能ブロック図である。受付部201は、原文情報、翻訳文情報及び翻訳に係る局面に関する局面情報を含む付随情報で構成される翻訳メモリの入力を受け付ける。翻訳メモリの入力は、キーボード21、マウス22等により受け付ける。
【0029】
局面類似度算出部202は、入力を受け付けた翻訳メモリの付随情報に含まれる局面に関する局面情報に基づいて、既に翻訳メモリ記憶部131に記憶されている翻訳メモリの付随情報に含まれる局面情報との類似度である局面類似度を算出する。局面類似度の算出方法は、特に限定されるものではなく、局面類似度が高いほど類似度が高いと評価される指標であっても良いし、低いほど類似度が高いと評価される指標であっても良い。前者の例としては局面情報間の相関を算出する方法が、後者の例としては局面情報間の空間ベクトル距離を算出する方法が、それぞれ該当する。図2及び後述する図3の説明では、局面類似度が高いほど類似度が高いと評価される指標を用いる場合について説明している。
【0030】
局面類似度判断部203は、算出された局面類似度が所定の閾値より小さい局面情報が記憶されているか否かを判断する。すなわち、一定の度合よりも局面情報が類似していない翻訳メモリが翻訳メモリ記憶部131に記憶されているか否かを判断する。
【0031】
訳文類似度算出部204は、局面類似度判断部203で所定の閾値より小さい局面情報が存在すると判断した場合、局面類似度が所定の閾値より小さいと判断された局面情報に対応する翻訳文メモリに含まれる翻訳文情報と、入力を受け付けた翻訳メモリに含まれる翻訳文情報との類似度である訳文類似度を算出する。すなわち、一定の度合よりも局面情報が類似していない翻訳メモリが翻訳メモリ記憶部131に記憶されている場合に、翻訳文情報の類似度を算出する。訳文類似度の算出方法も、局面類似度の算出方法と同様、特に限定されるものではなく、訳文類似度が高いほど類似度が高いと評価される指標であっても良いし、低いほど類似度が高いと評価される指標であっても良い。前者の例としては翻訳文情報間の相関を算出する方法が、後者の例としては翻訳文情報間の空間ベクトル距離を算出する方法が、それぞれ該当する。図2及び後述する図4の説明では、訳文類似度が高いほど類似度が高いと評価される指標を用いる場合について説明している。
【0032】
訳文類似度判断部205は、算出された訳文類似度が所定の閾値より大きい翻訳文情報が存在するか否かを判断する。すなわち、一定の度合よりも局面情報が類似していない翻訳メモリに含まれる翻訳文情報の中で、一定の度合よりも類似している翻訳文情報が存在するか否かを判断する。
【0033】
複写部206は、訳文類似度判断部205で所定の閾値より大きい翻訳文情報が存在すると判断した場合、入力を受け付けた翻訳メモリを共有翻訳メモリ記憶部132へ複写する。これにより、一定の度合よりも局面情報が類似していない翻訳メモリのうち、一定の度合よりも類似している翻訳メモリが存在する場合には、翻訳メモリ記憶部131に記憶するべき翻訳メモリを共有翻訳メモリ記憶部132へ複写することができ、複数のユーザによる共有化による翻訳効率の改善を図ることができる。また、訳文を用いる局面が異なる場合であるにもかかわらず、言語的に類似している訳文については汎用的に用いることが可能な訳文であるとの前提に基づいて、斯かる組み合わせを含む翻訳メモリを共有翻訳メモリ記憶部132へ記憶することにより、不用意に情報が拡散することを防止することも可能となる。
【0034】
図3及び図4は、本発明の実施の形態に係る翻訳支援装置1のCPU11の共有翻訳メモリ記憶部132へ共有するべき翻訳メモリを記憶する処理手順を示すフローチャートである。図3に示すように、翻訳支援装置1のCPU11は、原文情報、翻訳文情報及び付随情報に含まれる局面情報で構成された翻訳メモリの入力を受け付ける(ステップS301)。翻訳メモリの入力は、キーボード21、マウス22等により受け付ける。
【0035】
CPU11は、翻訳メモリ記憶部131内に記憶されている翻訳メモリから一の翻訳メモリを選択し(ステップS302)、選択した翻訳メモリに含まれる局面情報と入力を受け付けた局面情報との間の局面類似度を算出する(ステップS303)。CPU11は、算出した局面類似度が所定の閾値より小さいか否かを判断する(ステップS304)。
【0036】
局面情報の入力は、セクタ、プロジェクト名等、翻訳メモリ記憶部131の利用局面を特定することができるメタデータである局面メタデータとして受け付ける。したがって、局面類似度pは、類似度算出対象となる2つの局面情報t1、t2の関数p(t1、t2)で表すことができる。所定の閾値をθp とした場合、p(t1、t2)<θp である場合に局面が異なると判断する。
【0037】
CPU11が、算出した局面類似度が所定の閾値より小さいと判断した場合(ステップS304:YES)、CPU11は、選択された局面情報に対応して記憶されている翻訳メモリをメモリ12へ一時記憶する(ステップS305)。CPU11が、算出した局面類似度が所定の閾値以上であると判断した場合(ステップS304:NO)、CPU11は、ステップS305をスキップし、翻訳メモリ記憶部131内に記憶されているすべての翻訳メモリを選択したか否かを判断する(ステップS306)。
【0038】
CPU11が、選択されていない翻訳メモリが存在すると判断した場合(ステップS306:NO)、CPU11は、次の翻訳メモリを選択して(ステップS307)、処理をステップS303へ戻して、上述した処理を繰り返す。CPU11が、すべての翻訳メモリを選択したと判断した場合(ステップS306:YES)、CPU11は、入力を受け付けた翻訳メモリを翻訳メモリ記憶部131へ記憶し(ステップS308)、図4に示すように、メモリ12内に一時記憶されている翻訳メモリから一の翻訳メモリを選択する(ステップS401)。
【0039】
CPU11は、選択された翻訳メモリに含まれる翻訳文情報と、入力を受け付けた翻訳メモリに含まれる翻訳文情報との間の訳文類似度を算出する(ステップS402)。CPU11は、算出した訳文類似度が所定の閾値より大きいか否かを判断する(ステップS403)。
【0040】
訳文類似度cは、類似度算出対象となる2つの翻訳文情報u1、u2の関数c(u1、u2)で表すことができる。所定の閾値をθc とした場合、c(u1、u2)>θc である場合に訳文が類似すると判断する。
【0041】
CPU11が、算出した訳文類似度が所定の閾値より大きいと判断した場合(ステップS403:YES)、CPU11は、選択された翻訳文情報に対応して記憶されている翻訳メモリをメモリ12へ一時記憶する(ステップS404)。CPU11が、算出した訳文類似度が所定の閾値以下であると判断した場合(ステップS403:NO)、CPU11は、ステップS404をスキップし、メモリ12内に一時記憶されているすべての翻訳メモリを選択したか否かを判断する(ステップS405)。
【0042】
CPU11が、選択されていない翻訳メモリが存在すると判断した場合(ステップS405:NO)、CPU11は、次の翻訳メモリを選択して(ステップS406)、処理をステップS402へ戻して、上述した処理を繰り返す。CPU11が、すべての翻訳メモリを選択したと判断した場合(ステップS405:YES)、CPU11は、一時記憶されている翻訳メモリを共有翻訳メモリ記憶部132へ複写する(ステップS407)。
【0043】
上述の例では、翻訳メモリ記憶部131の内容を維持した状態で、複数のユーザで共有することが可能な翻訳メモリを共有翻訳メモリ記憶部132へ複写している。このようにすることで、利用者は自己の使用している翻訳装置3内に記憶されている翻訳メモリのみならず、共有翻訳メモリ記憶部132に記憶されている翻訳メモリを照会することにより、翻訳効率の改善を図ることができる。
【0044】
一方、翻訳メモリ記憶部131から複数のユーザで共有することが可能な翻訳メモリを共有翻訳メモリ記憶部132へ移動させても良い。この場合、翻訳メモリ記憶部131と共有翻訳メモリ記憶部132とで重複して翻訳メモリを記憶することがなく、記憶装置13の記憶容量を節約することができる。具体的には、複数のユーザで共有することが可能な翻訳メモリを共有翻訳メモリ記憶部132へ複写してから、元の翻訳メモリを翻訳メモリ記憶部131から削除する。
【0045】
以下、局面類似度及び訳文類似度として、局面間距離又は訳文間距離を用いる場合の具体例を示す。上述した例とは異なり、局面情報を局面ベクトルとして取得して局面間距離sを算出し、翻訳文情報を訳文ベクトルとして取得して訳文間距離dを算出することにより、局面が異なるか否か及び訳文が類似するか否かを判断する。すなわち、2つの局面ベクトルt1、t2間の局面間距離s(t1、t2)は、所定の閾値をθs とした場合、s(t1、t2)>θs である場合に局面が異なると判断する。また、2つの訳文ベクトルu1、u2間の訳文間距離d(u1、u2)は、所定の閾値をθd とした場合、d(u1、u2)<θd である場合に訳文が類似すると判断する。
【0046】
まず局面情報として、「金融」、「通信」、「運輸」という3つのセクタを定義する。そして、局面間距離とは、局面ベクトル間の距離を意味しており、所定の局面に含まれる訳文ベクトルの平均値を局面ベクトルと定義する。
【0047】
次に、訳文間距離は、一の訳文について空間ベクトルとして事前に定義した場合の訳文ベクトル間のなす角度で表す。訳文ベクトルは、任意のn次元(nは自然数)の空間として表現され、例えば「電気」、「減益」という2つの単語からなる二次元空間ベクトルとして訳文を表現する場合、「電気」という語が2回出現し、「減益」という語が1回出現している訳文の訳文ベクトルは、(2、1)とベクトル表現することができる。
【0048】
図5は、訳文ベクトルの例示図である。例えば訳文ベクトルt0に対応する翻訳文情報には、「電気」という語が2回出現し、「減益」という語が出現していないことを、項目「電気」、「減益」の数値が示している。したがって訳文ベクトルt0は(2、0)となる。以下、同様にして、訳文ベクトルt1は(2、1)t2は(3、1)である旨を示している。
【0049】
図6は、訳文ベクトルを項目「電気」を横軸に、項目「減益」を縦軸にしてベクトル表現したグラフである。斯かるベクトル空間上の2つのベクトル間の距離は、ベクトル間のなす角度(内積)の大きさで表現することができる。図7は、図6に示す訳文ベクトルt0と、訳文ベクトルt1、t2、・・・との訳文間距離の算出結果の例示図である。
【0050】
図7に示すように、訳文ベクトルt0と、訳文ベクトルt1、t2、・・・とのそれぞれの組み合わせについて、訳文ベクトル間のなす角をベクトル間の距離、すなわち訳文間距離として算出している。訳文ベクトルt0の訳文間距離が‘0.0’となっているのは、内積をもとめる基準となる訳文ベクトルだからである。
【0051】
なお、翻訳メモリ記憶部131に翻訳メモリを記憶する場合、付随情報として局面情報だけでなく、翻訳文情報中に出現する所定の単語の回数も記憶すれば良い。図8は、翻訳メモリ記憶部131に記憶するデータ構成の例示図である。図8の例では、原文情報は省略し、翻訳文情報に所定の単語が出現する回数及び局面情報を付随情報として記憶している。このようにすることで、局面情報ごとに、訳文ベクトルの平均値を算出することができ、局面間距離の算出の基礎とすることができる。
【0052】
図8では、局面「運輸」の訳文ベクトルの平均値が(2.5、1.0)、局面「通信」の訳文ベクトルの平均値が(3.5、0.5)、局面「金融」の訳文ベクトルの平均値が(2.0、3.5)と求まっており、上述した訳文間距離の算出方法と同様の手順にて局面間距離を算出することができる。すなわち、それぞれの局面の訳文ベクトルの平均値を基礎として、他の局面の訳文ベクトルの平均値とのベクトル間距離を内積として算出する。
【0053】
図9は、局面間距離の算出結果の例示図である。例えば局面が類似しているか否かを判断する閾値θs を、局面間距離‘40’と設定した場合、局面「金融」−「通信」間、「金融」−「運輸」間での局面間距離は閾値θs を超えているので、異なる局面に属すると判断することができる。
【0054】
なお、翻訳メモリ記憶部131から共有翻訳メモリ記憶部132へ複写するか否かを判断するための閾値は、距離を算出して比較する対象の個数nを‘2’とした場合、判断するための関数f(s、d)は二次元空間上の領域境界線となる。図10は、閾値を直線で表した判断方法の一例を示す模式図である。
【0055】
図10では、局面間距離sを縦軸に、訳文間距離dを横軸に取り、局面間距離sの閾値θs 、訳文間距離θd をそれぞれ設定している。つまり、局面間距離sが閾値θs より大きい場合には両者の局面情報は異なり、小さい場合には両者の局面情報が類似していると判断する。また、訳文間距離dが閾値θd より大きい場合には両者の翻訳文情報は異なり、小さい場合には両者の翻訳文情報が類似していると判断する。
【0056】
すなわち、新たに入力を受け付けた翻訳メモリを原点1001とし、翻訳メモリ記憶部131に記憶されている翻訳メモリについて、それぞれ局面間距離s及び訳文間距離dを算出してベクトル情報としてプロットする。ベクトル1002、1003は、局面間距離sが閾値θs より大きいので、局面情報が異なると判断される。一方、ベクトル1004、1005は、局面間距離sが閾値θs より小さいので、局面情報が類似していると判断される。したがって、ベクトル1002、1003が、訳文間距離の算出対象となる。
【0057】
次にベクトル1002、1003は、訳文間距離dが閾値θd よりも小さいことから、翻訳文情報が類似していると判断される。したがって、ベクトル1002、1003に対応する翻訳メモリを翻訳メモリ記憶部131から共有翻訳メモリ記憶部132へ複写することが可能な情報であると判断することができる。
【0058】
上述の例では、いずれも閾値に基づく一次直線より上方か下方かに基づいて判断しているが、判定関数f(s、d)を二次曲線1006のように設定して、複写対象となるベクトルを特定しても良い。図10の例では、ベクトル1002、1003、1004に対応する翻訳メモリが複写対象となり、ベクトル1005に対応する翻訳メモリは複写対象とはならない。
【0059】
新たに入力を受け付けた翻訳メモリから、新たなベクトルt0を、局面を「金融」と、翻訳文情報の中には「電気」が2回、「減益」が0回出現すると定義した場合、図9と同様にしてベクトルt0とベクトルt1〜t6の各々との間の局面間距離を算出する。この場合、ベクトルt0との局面間距離sの閾値θs が‘40’以上離れている局面は「運輸」となるので、訳文間距離は、ベクトルt1、t2について比較すれば良い。
【0060】
図11は、図8に示す翻訳メモリ記憶部131に記憶されているベクトルt1〜t6と入力を受け付けたベクトルt0との間の訳文間距離の例示図である。訳文間距離dの閾値θd を‘40’とした場合、ベクトルt1、t2の訳文間距離dはともに‘40’以下となっている。したがって、ベクトルt0とは局面が異なる「運輸」であり、しかも訳文間距離dが閾値θd よりも小さいベクトルはベクトルt1、t2であることから、入力を受け付けたベクトルt0とともにベクトルt1、t2に対応する翻訳メモリが共有翻訳メモリ記憶部132への複写対象となり、翻訳メモリ記憶部131から共有翻訳メモリ記憶部132へ複写される。
【0061】
もちろん、局面間距離sが閾値θs 以下であると判断された場合であっても、訳文間距離dが閾値θd よりも小さいベクトル、図11の場合ではベクトルt3、t4についても複写の対象としても良い。例えば閾値θdをより小さく設定することにより抽出されたベクトルは、特定の場面で固有の翻訳文である可能性が高くなるからである。この場合、ベクトルt3、t4に対応する翻訳メモリも共有翻訳メモリ記憶部132への複写対象となり、翻訳メモリ記憶部131から共有翻訳メモリ記憶部132へ複写される。
【0062】
図12及び図13は、局面間距離又は訳文間距離を用いる場合の翻訳支援装置1のCPU11の共有翻訳メモリ記憶部132へ共有するべき翻訳メモリを記憶する処理手順を示すフローチャートである。図12に示すように、翻訳支援装置1のCPU11は、原文情報、翻訳文情報及び付随情報に含まれる局面情報で構成された翻訳メモリの入力を受け付ける(ステップS1201)。翻訳メモリの入力は、キーボード21、マウス22等により受け付ける。
【0063】
CPU11は、翻訳メモリ記憶部131内に記憶されている局面情報を含む翻訳メモリから一の翻訳メモリを選択し(ステップS1202)、選択した翻訳メモリに含まれる局面情報と入力を受け付けた翻訳メモリに含まれる局面情報との間の局面間距離を算出する(ステップS1203)。CPU11は、算出した局面間距離が所定の閾値より大きいか否かを判断する(ステップS1204)。
【0064】
CPU11が、算出した局面間距離が所定の閾値より大きいと判断した場合(ステップS1204:YES)、CPU11は、選択された局面情報に対応して記憶されている翻訳メモリをメモリ12へ一時記憶する(ステップS1205)。CPU11が、算出した局面間距離が所定の閾値以下であると判断した場合(ステップS1204:NO)、CPU11は、ステップS1205をスキップし、翻訳メモリ記憶部131内に記憶されているすべての翻訳メモリを選択したか否かを判断する(ステップS1206)。
【0065】
CPU11が、選択されていない翻訳メモリが存在すると判断した場合(ステップS1206:NO)、CPU11は、次の翻訳メモリを選択して(ステップS1207)、処理をステップS1203へ戻して、上述した処理を繰り返す。CPU11が、すべての翻訳メモリを選択したと判断した場合(ステップS1206:YES)、CPU11は、入力を受け付けた翻訳メモリを翻訳メモリ記憶部131へ記憶し(ステップS1208)、図13に示すように、メモリ12内に一時記憶されている翻訳メモリから一の翻訳メモリを選択する(ステップS1301)。
【0066】
CPU11は、選択された翻訳メモリに含まれる翻訳文情報と、入力を受け付けた翻訳メモリに含まれる翻訳文情報との間の訳文間距離を算出する(ステップS1302)。CPU11は、算出した訳文間距離が所定の閾値より小さいか否かを判断する(ステップS1303)。
【0067】
CPU11が、算出した訳文間距離が所定の閾値より小さいと判断した場合(ステップS1303:YES)、CPU11は、選択された翻訳文情報に対応して記憶されている翻訳メモリをメモリ12へ一時記憶する(ステップS1304)。CPU11が、算出した訳文間距離が所定の閾値以上であると判断した場合(ステップS1303:NO)、CPU11は、ステップS1304をスキップし、メモリ12内に一時記憶されているすべての翻訳メモリを選択したか否かを判断する(ステップS1305)。
【0068】
CPU11が、選択されていない翻訳メモリが存在すると判断した場合(ステップS1305:NO)、CPU11は、次の翻訳メモリを選択して(ステップS1306)、処理をステップS1302へ戻して、上述した処理を繰り返す。CPU11が、すべての翻訳メモリを選択したと判断した場合(ステップS1305:YES)、CPU11は、一時記憶されている翻訳メモリを共有翻訳メモリ記憶部132へ複写する(ステップS1307)。
【0069】
なお、上述した実施の形態では翻訳メモリに含まれる翻訳文情報に基づいて訳文類似度又は訳文間距離を算出しているが、まず原文情報間のベクトル距離である原文間距離を算出して、原文間距離が所定の閾値より小さい、すなわち原文が類似している場合にのみ翻訳文情報に基づいて訳文類似度又は訳文間距離を算出しても良い。
【0070】
この場合、原文情報間の類似度である原文類似度を算出する原文類似度算出部207、及び算出した原文類似度が所定の閾値より小さい原文情報が存在するか否かを判断する原文類似度判断部208を設け、訳文類似度判断部205は、原文情報の類似度が所定の閾値より大きい原文情報が存在すると判断した場合、原文情報の類似度が所定の閾値より大きい原文情報に対応する翻訳文情報についてのみ訳文間距離を算出する。これにより、原文情報と翻訳文情報との組み合わせ情報が類似している情報を共有翻訳メモリ記憶部132へ複写することができ、翻訳効率を高めることができる。
【0071】
具体的には、原文類似度算出部207では、原文情報間のベクトル距離である原文間距離を算出し、原文類似度判断部208では、算出した原文間距離が所定の閾値より小さい原文情報が存在するか否かを判断する。訳文類似度判断部205は、原文間距離が所定の閾値より小さい原文情報が存在すると判断した場合、原文情報に対応する翻訳文情報についてのみ訳文間距離を算出する。
【0072】
また、局面類似度算出処理と訳文類似度算出処理とを並行して実行し、同時に閾値より大きいか否かの判断処理を実行しても良い。CPUに十分な処理能力があり、メモリに余裕がある場合には、演算処理全体のスループットが高くなる可能性がある。
【0073】
以上のように本実施の形態によれば、翻訳メモリ記憶部131に記憶された訳文を用いる局面が異なる場合であるにもかかわらず、言語的に類似している訳文については汎用的に用いることが可能な訳文であるとの前提に基づいて、局面が異なり、かつ訳文が類似している訳文に関する情報のみを共有翻訳メモリ記憶部132に複写することにより、汎用的であると考えられる訳文のみを複数のユーザで共有することができる。したがって、局面に依存するような固有情報の共有化を未然に回避することができ、翻訳効率の改善を図ることができると同時に、一定の情報の拡散を防止することも可能となる。
【0074】
なお、本発明は上記実施例に限定されるものではなく、本発明の趣旨の範囲内であれば多種の変更、改良等が可能である。
【図面の簡単な説明】
【0075】
【図1】本発明の実施の形態に係る翻訳支援装置の構成例を示すブロック図である。
【図2】本発明の実施の形態に係る翻訳支援装置の機能ブロック図である。
【図3】本発明の実施の形態に係る翻訳支援装置のCPUの共有翻訳メモリ記憶部へ共有するべき翻訳メモリを記憶する処理手順を示すフローチャートである。
【図4】本発明の実施の形態に係る翻訳支援装置のCPUの共有翻訳メモリ記憶部へ共有するべき翻訳メモリを記憶する処理手順を示すフローチャートである。
【図5】訳文ベクトルの例示図である。
【図6】訳文ベクトルを項目「電気」を横軸に、項目「減益」を縦軸にしてベクトル表現したグラフである。
【図7】訳文間距離の算出結果の例示図である。
【図8】翻訳メモリ記憶部に記憶するデータ構成の例示図である。
【図9】局面間距離の算出結果の例示図である。
【図10】閾値を直線で表した判断方法の一例を示す模式図である。
【図11】翻訳メモリ記憶部に記憶されているベクトルと入力を受け付けたベクトルとの間の訳文間距離の例示図である。
【図12】局面間距離又は訳文間距離を用いる場合の翻訳支援装置のCPUの共有翻訳メモリ記憶部へ共有するべき翻訳メモリを記憶する処理手順を示すフローチャートである。
【図13】局面間距離又は訳文間距離を用いる場合の翻訳支援装置のCPUの共有翻訳メモリ記憶部へ共有するべき翻訳メモリを記憶する処理手順を示すフローチャートである。
【符号の説明】
【0076】
1 翻訳支援装置
2 ネットワーク
3 翻訳装置
11 CPU
12 メモリ
13 記憶装置
14 I/Oインタフェース
15 ビデオインタフェース
16 可搬型ディスクドライブ
17 通信インタフェース
18 内部バス
23 表示装置
90 可搬型記録媒体
100 コンピュータプログラム
131 翻訳メモリ記憶部(翻訳メモリ)
132 共有翻訳メモリ記憶部(共有メモリ)
【技術分野】
【0001】
本発明は、翻訳メモリを共有メモリとして用いて翻訳効率を改善すると共に、翻訳メモリの機密性を維持することができる翻訳支援方法、翻訳支援装置及びコンピュータプログラムに関する。
【背景技術】
【0002】
オフィス文書を所定の言語から他の言語に翻訳する場合、定型文を翻訳するときのように同一の訳文を繰り返し採用することが多い。翻訳効率を高めるべく、原文と訳文との組み合わせ情報が記憶してある翻訳メモリを共有し、翻訳メモリから同一の訳文を抽出する。
【0003】
定型文の翻訳効率を高めるには、なるべく広い範囲、例えば組織内の全員で翻訳メモリを共有することが好ましい。一方で、訳文を共有する範囲が広がった場合、訳文に含まれている機密情報が広範囲に拡散するおそれがある。情報は、内容を閲覧することができる主体が少ないほど漏洩の危険は少ない。したがって、機密性の観点からはなるべく狭い範囲で翻訳メモリを共有すべきである。
【0004】
このように相反する問題を解決する手段はほとんど存在しない。例えば非特許文献1では、自動翻訳を支援するツールが開示されているが、翻訳効率の改善を主眼に置いている。また、翻訳メモリの機密性を保持する技術としては、いわゆる文書サニタイズ技術が挙げられる。固有表現抽出技術を用いてリスト(辞書)から固有表現を同定し、翻訳メモリにて共有するのが適切ではない語の削除又は置換を実行する。
【非特許文献1】マーク プライアー(marc prior)、オメガT(Omega T)ホームページ、オメガTプロジェクト、[online]、[平成20年8月1日検索]、インターネット<URL:http://www.omegat.org>
【発明の開示】
【発明が解決しようとする課題】
【0005】
上述したように非特許文献1では、翻訳効率の改善を望むことはできるが、翻訳メモリを共有化することによる機密情報の漏洩については考慮がなされていない。
【0006】
また、翻訳メモリに文書サニタイズ技術を適用する場合、一般名詞を組み合わせることにより構成された固有名詞、例えば「新BRICs外貨債」、「新世代オープンプラットホームプロジェクト」等については共有対象から外れることから訳文として抽出することができない。また、固有名詞であるか否かだけで共有化するか否かを判別するため、文章単位では共有化するか否かを判別することができない。
【0007】
本発明は斯かる事情に鑑みてなされたものであり、翻訳メモリを共有メモリとして用いて翻訳効率を改善すると共に、翻訳メモリの機密性を効果的に維持することができる翻訳支援方法、翻訳支援装置及びコンピュータプログラムを提供することを目的とする。
【課題を解決するための手段】
【0008】
上記目的を達成するために第1発明に係る翻訳支援方法は、原文情報と翻訳文情報との組み合わせ情報、及び所定の付随情報を記憶する翻訳メモリと、ネットワークを介して複数のユーザがアクセスすることが可能な共有メモリとを用い、翻訳対象となる原文情報を前記翻訳メモリ及び前記共有メモリを照会しつつ翻訳する処理を支援するコンピュータで実行することが可能な翻訳支援方法において、原文情報、翻訳文情報及び翻訳に係る局面に関する局面情報を含む付随情報の入力を受け付け、入力を受け付けた付随情報に含まれる局面情報に基づいて、既に前記翻訳メモリに記憶されている付随情報に含まれる局面情報との類似度である局面類似度を算出し、算出された局面類似度が所定の閾値より小さい局面情報が存在するか否かを判断し、前記局面類似度が所定の閾値より小さい局面情報が存在すると判断することに応答して、該局面情報に対応する翻訳文情報について、入力を受け付けた翻訳文情報との類似度である訳文類似度を算出し、算出された訳文類似度が所定の閾値より大きい翻訳文情報が存在するか否かを判断し、前記訳文類似度が所定の閾値より大きい翻訳文情報が存在すると判断することに応答して、入力を受け付けた原文情報、翻訳文情報及び付随情報を前記共有メモリへ複写することを特徴とする。
【0009】
また、第2発明に係る翻訳支援方法は、第1発明において、前記局面情報間のベクトル距離である局面間距離を算出し、算出された局面間距離が所定の閾値より大きい局面情報が存在するか否かを判断し、前記局面間距離が所定の閾値より大きい局面情報が存在すると判断することに応答して、該局面情報に対応する前記翻訳文情報間のベクトル距離である訳文間距離を算出し、算出された訳文間距離が所定の閾値より小さい翻訳文情報が存在するか否かを判断し、前記訳文間距離が所定の閾値より小さい翻訳文情報が存在すると判断することに応答して、該翻訳文情報に対応する原文情報及び付随情報を前記共有メモリへ複写することを特徴とする。
【0010】
また、第3発明に係る翻訳支援方法は、第2発明において、前記原文情報間のベクトル距離である原文間距離を算出し、算出された原文間距離が所定の閾値より小さい原文情報が存在するか否かを判断し、前記原文間距離が所定の閾値より小さい原文情報が存在すると判断することに応答して、該原文情報に対応する翻訳文情報についてのみ前記訳文間距離を算出することを特徴とする。
【0011】
次に、上記目的を達成するために第4発明に係る翻訳支援装置は、原文情報と翻訳文情報との組み合わせ情報、及び所定の付随情報を記憶する翻訳メモリと、ネットワークを介して複数のユーザがアクセスすることが可能な共有メモリとを備え、翻訳対象となる原文情報を前記翻訳メモリ及び前記共有メモリを照会しつつ翻訳する処理を支援する翻訳支援装置において、原文情報、翻訳文情報及び翻訳に係る局面に関する局面情報を含む付随情報の入力を受け付ける受付手段と、入力を受け付けた付随情報に含まれる局面情報に基づいて、既に前記翻訳メモリに記憶されている付随情報に含まれる局面情報との類似度である局面類似度を算出する局面類似度算出手段と、算出された局面類似度が所定の閾値より小さい局面情報が存在するか否かを判断する局面類似度判断手段と、該局面類似度判断手段で所定の閾値より小さい局面情報が存在すると判断することに応答して、該局面情報に対応する翻訳文情報について、入力を受け付けた翻訳文情報との類似度である訳文類似度を算出する訳文類似度算出手段と、算出された訳文類似度が所定の閾値より大きい翻訳文情報が存在するか否かを判断する訳文類似度判断手段と、該訳文類似度判断手段で所定の閾値より大きい翻訳文情報が存在すると判断することに応答して、入力を受け付けた原文情報、翻訳文情報及び付随情報を前記共有メモリへ複写する複写手段とを備えることを特徴とする。
【0012】
また、第5発明に係る翻訳支援装置は、第4発明において、前記局面類似度算出手段は、前記局面情報間のベクトル距離である局面間距離を算出するようにしてあり、前記局面類似度判断手段は、算出された局面間距離が所定の閾値より大きい局面情報が存在するか否かを判断するようにしてあり、前記訳文類似度算出手段は、該局面類似度判断手段で前記局面間距離が所定の閾値より大きい局面情報が存在すると判断することに応答して、該局面情報に対応する前記翻訳文情報間のベクトル距離である訳文間距離を算出するようにしてあり、前記訳文類似度判断手段は、算出された訳文間距離が所定の閾値より小さい翻訳文情報が存在するか否かを判断するようにしてあり、前記複写手段は、該訳文類似度判断手段で前記訳文間距離が所定の閾値より小さい翻訳文情報が存在すると判断することに応答して、該翻訳文情報に対応する原文情報及び付随情報を前記共有メモリへ複写するようにしてあることを特徴とする。
【0013】
また、第6発明に係る翻訳支援装置は、第5発明において、前記原文情報間のベクトル距離である原文間距離を算出する原文間距離算出手段と、算出された原文間距離が所定の閾値より小さい原文情報が存在するか否かを判断する原文類似度判断手段と、該原文類似度判断手段で、前記原文間距離が所定の閾値より小さい原文情報が存在すると判断することに応答して、前記訳文類似度算出手段は、該原文情報に対応する翻訳文情報についてのみ前記訳文間距離を算出するようにしてあることを特徴とする。
【0014】
次に、上記目的を達成するために第7発明に係るコンピュータプログラムは、原文情報と翻訳文情報との組み合わせ情報、及び所定の付随情報を記憶する翻訳メモリと、ネットワークを介して複数のユーザがアクセスすることが可能な共有メモリとを備え、翻訳対象となる原文情報を前記翻訳メモリ及び前記共有メモリを照会しつつ翻訳する処理を支援するコンピュータで実行することが可能なコンピュータプログラムにおいて、前記コンピュータを、原文情報、翻訳文情報及び翻訳に係る局面に関する局面情報を含む付随情報の入力を受け付ける受付手段、入力を受け付けた付随情報に含まれる局面情報に基づいて、既に前記翻訳メモリに記憶されている付随情報に含まれる局面情報との類似度である局面類似度を算出する局面類似度算出手段、算出された局面類似度が所定の閾値より小さい局面情報が存在するか否かを判断する局面類似度判断手段、該局面類似度判断手段で所定の閾値より小さい局面情報が存在すると判断することに応答して、該局面情報に対応する翻訳文情報について、入力を受け付けた翻訳文情報との類似度である訳文類似度を算出する訳文類似度算出手段、算出された訳文類似度が所定の閾値より大きい翻訳文情報が存在するか否かを判断する訳文類似度判断手段、及び該訳文類似度判断手段で所定の閾値より大きい翻訳文情報が存在すると判断することに応答して、入力を受け付けた原文情報、翻訳文情報及び付随情報を前記共有メモリへ複写する複写手段として機能させることを特徴とする。
【0015】
また、第8発明に係るコンピュータプログラムは、第7発明において、前記局面類似度算出手段を、前記局面情報間のベクトル距離である局面間距離を算出する手段として機能させ、前記局面類似度判断手段を、算出された局面間距離が所定の閾値より大きい局面情報が存在するか否かを判断する手段として機能させ、前記訳文類似度算出手段を、該局面類似度判断手段で前記局面間距離が所定の閾値より大きい局面情報が存在すると判断することに応答して、該局面情報に対応する前記翻訳文情報間のベクトル距離である訳文間距離を算出する手段として機能させ、前記訳文類似度判断手段を、算出された訳文間距離が所定の閾値より小さい翻訳文情報が存在するか否かを判断する手段として機能させ、前記複写手段を、該訳文類似度判断手段で前記訳文間距離が所定の閾値より小さい翻訳文情報が存在すると判断することに応答して、該翻訳文情報に対応する原文情報及び付随情報を前記共有メモリへ複写する手段として機能させることを特徴とする。
【0016】
また、第9発明に係るコンピュータプログラムは、第8発明において、前記コンピュータを、前記原文情報間のベクトル距離である原文間距離を算出する原文間距離算出手段、及び算出された原文間距離が所定の閾値より小さい原文情報が存在するか否かを判断する原文類似度判断手段として機能させ、該原文類似度判断手段で、前記原文間距離が所定の閾値より小さい原文情報が存在すると判断することに応答して、前記訳文類似度算出手段を、該原文情報に対応する翻訳文情報についてのみ前記訳文間距離を算出する手段として機能させることを特徴とする。
【発明の効果】
【0017】
本発明によれば、翻訳メモリに記憶された訳文を用いる局面が異なる場合であるにもかかわらず、言語的に類似している訳文については汎用的に用いることが可能な訳文であるとの前提に基づいて、局面が異なり、かつ訳文が類似している訳文に関する情報のみを共有メモリに記憶することにより、汎用的であると考えられる訳文のみを複数のユーザで共有することができる。したがって、局面に依存するような固有情報の共有化を未然に回避することができ、翻訳効率の改善を図ることができると同時に、一定の情報の拡散を防止することも可能となる。
【発明を実施するための最良の形態】
【0018】
以下、本発明の実施の形態に係る翻訳支援装置について、図面に基づいて具体的に説明する。以下の実施の形態は、特許請求の範囲に記載された発明を限定するものではなく、実施の形態の中で説明されている特徴的事項の組み合わせの全てが解決手段の必須事項であるとは限らないことは言うまでもない。
【0019】
また、本発明は多くの異なる態様にて実施することが可能であり、実施の形態の記載内容に限定して解釈されるべきものではない。実施の形態を通じて同じ要素には同一の符号を付している。
【0020】
以下の実施の形態では、コンピュータシステムにコンピュータプログラムを導入した翻訳支援装置について説明するが、当業者であれば明らかな通り、本発明はその一部をコンピュータで実行することが可能なコンピュータプログラムとして実施することができる。したがって、本発明は、翻訳支援装置というハードウェアとしての実施の形態、ソフトウェアとしての実施の形態、又はソフトウェアとハードウェアとの組み合わせの実施の形態をとることができる。コンピュータプログラムは、ハードディスク、DVD、CD、光記憶装置、磁気記憶装置等の任意のコンピュータで読み取ることが可能な記録媒体に記録することができる。
【0021】
本発明の実施の形態では、翻訳メモリに記憶された訳文を用いる局面が異なる場合であるにもかかわらず、言語的に類似している訳文については汎用的に用いることが可能な訳文であるとの前提に基づいて、局面が異なり、かつ訳文が類似している訳文に関する原文情報、翻訳文情報、付随情報を共有メモリに記憶する。これにより、汎用的であると考えられる訳文に関する情報のみを複数のユーザで共有し、局面に依存するような固有的な訳文に関する情報の共有化を避けることができるので、翻訳効率の改善を図ることができると同時に、機密情報が含まれる可能性が高い固有的な情報については共有化されないことから、情報の機密性を一定の水準で維持することが可能となる。ここで「局面」とは、原文から翻訳文を生成する状況を意味しており、原文を含む文書の属する分野、セクタ(保険、公共、運輸等)等を含む広い概念である。また、「ベクトル距離」とは、予め定義されたn(nは自然数)次元空間上のベクトル間の内積の大きさを意味しており、比較対象となる2つの空間ベクトル間のなす角度の大きさに相当する。なお、以下の実施の形態では、「翻訳メモリ」という文言を原文情報、翻訳文情報、付随情報で構成される情報の意味で用い、ハードウエアとしての翻訳メモリは翻訳メモリ記憶部と、共有メモリは共有翻訳メモリ記憶部と換言する。
【0022】
図1は、本発明の実施の形態に係る翻訳支援装置の構成例を示すブロック図である。本発明の実施の形態に係る翻訳支援装置1は、少なくともCPU(中央演算装置)11、メモリ12、記憶装置13、I/Oインタフェース14、ビデオインタフェース15、可搬型ディスクドライブ16、通信インタフェース17及び上述したハードウェアを接続する内部バス18で構成されている。
【0023】
CPU11は、内部バス18を介して翻訳支援装置1の上述したようなハードウェア各部と接続されており、上述したハードウェア各部の動作を制御するとともに、記憶装置13に記憶されているコンピュータプログラム100に従って、種々のソフトウェア的機能を実行する。メモリ12は、SRAM、SDRAM等の揮発性メモリで構成され、コンピュータプログラム100の実行時にロードモジュールが展開され、コンピュータプログラム100の実行時に発生する一時的なデータ等を記憶する。
【0024】
記憶装置13は、内蔵される固定型記憶装置(ハードディスク)、SRAM等の揮発性メモリ、ROM等の不揮発性メモリ等で構成されている。記憶装置13に記憶されているコンピュータプログラム100は、プログラム及びデータ等の情報を記録したDVD、CD−ROM等の可搬型記録媒体90から、可搬型ディスクドライブ16によりダウンロードされ、実行時には記憶装置13からメモリ12へ展開して実行される。もちろん、通信インタフェース17を介してネットワーク2に接続されている外部のコンピュータからダウンロードされたコンピュータプログラムであっても良い。
【0025】
また記憶装置13は、翻訳メモリ記憶部(翻訳メモリ)131及び共有翻訳メモリ記憶部(共有メモリ)132を備えている。翻訳メモリ記憶部131には、原文情報と翻訳文情報との組み合わせ情報、及び所定の付随情報で構成される、いわゆる翻訳メモリを複数記憶してある。所定の付随情報は、例えばメタデータとして付加されており、少なくとも翻訳処理がなされた状況に関する情報である局面情報を含んでいる。共有翻訳メモリ記憶部132には、翻訳メモリ記憶部131に記憶されている翻訳メモリのうち、複数の不特定ユーザにより共有することが可能な翻訳メモリのみを記憶する。
【0026】
通信インタフェース17は内部バス18に接続されており、インターネット、LAN、WAN等の外部のネットワーク2に接続されることにより、外部のコンピュータ等とデータ送受信を行うことが可能となっている。ネットワーク2に接続されている外部の翻訳装置3、3、・・・は、新たに生成された翻訳メモリを翻訳支援装置1の翻訳メモリ記憶部131に登録することはできるが、共有翻訳メモリ記憶部132に登録することはできない。一方、ネットワーク2に接続されている外部の翻訳装置3、3、・・・は、翻訳支援装置1の共有翻訳メモリ記憶部132を照会して翻訳メモリを読み出すことはできるが、翻訳メモリ記憶部131に記憶されている翻訳メモリを読み出すことはできない。
【0027】
I/Oインタフェース14は、キーボード21、マウス22等のデータ入力媒体と接続され、データの入力を受け付ける。また、ビデオインタフェース15は、CRTモニタ、LCD等の表示装置23と接続され、所定の画像を表示する。
【0028】
図2は、本発明の実施の形態に係る翻訳支援装置1の機能ブロック図である。受付部201は、原文情報、翻訳文情報及び翻訳に係る局面に関する局面情報を含む付随情報で構成される翻訳メモリの入力を受け付ける。翻訳メモリの入力は、キーボード21、マウス22等により受け付ける。
【0029】
局面類似度算出部202は、入力を受け付けた翻訳メモリの付随情報に含まれる局面に関する局面情報に基づいて、既に翻訳メモリ記憶部131に記憶されている翻訳メモリの付随情報に含まれる局面情報との類似度である局面類似度を算出する。局面類似度の算出方法は、特に限定されるものではなく、局面類似度が高いほど類似度が高いと評価される指標であっても良いし、低いほど類似度が高いと評価される指標であっても良い。前者の例としては局面情報間の相関を算出する方法が、後者の例としては局面情報間の空間ベクトル距離を算出する方法が、それぞれ該当する。図2及び後述する図3の説明では、局面類似度が高いほど類似度が高いと評価される指標を用いる場合について説明している。
【0030】
局面類似度判断部203は、算出された局面類似度が所定の閾値より小さい局面情報が記憶されているか否かを判断する。すなわち、一定の度合よりも局面情報が類似していない翻訳メモリが翻訳メモリ記憶部131に記憶されているか否かを判断する。
【0031】
訳文類似度算出部204は、局面類似度判断部203で所定の閾値より小さい局面情報が存在すると判断した場合、局面類似度が所定の閾値より小さいと判断された局面情報に対応する翻訳文メモリに含まれる翻訳文情報と、入力を受け付けた翻訳メモリに含まれる翻訳文情報との類似度である訳文類似度を算出する。すなわち、一定の度合よりも局面情報が類似していない翻訳メモリが翻訳メモリ記憶部131に記憶されている場合に、翻訳文情報の類似度を算出する。訳文類似度の算出方法も、局面類似度の算出方法と同様、特に限定されるものではなく、訳文類似度が高いほど類似度が高いと評価される指標であっても良いし、低いほど類似度が高いと評価される指標であっても良い。前者の例としては翻訳文情報間の相関を算出する方法が、後者の例としては翻訳文情報間の空間ベクトル距離を算出する方法が、それぞれ該当する。図2及び後述する図4の説明では、訳文類似度が高いほど類似度が高いと評価される指標を用いる場合について説明している。
【0032】
訳文類似度判断部205は、算出された訳文類似度が所定の閾値より大きい翻訳文情報が存在するか否かを判断する。すなわち、一定の度合よりも局面情報が類似していない翻訳メモリに含まれる翻訳文情報の中で、一定の度合よりも類似している翻訳文情報が存在するか否かを判断する。
【0033】
複写部206は、訳文類似度判断部205で所定の閾値より大きい翻訳文情報が存在すると判断した場合、入力を受け付けた翻訳メモリを共有翻訳メモリ記憶部132へ複写する。これにより、一定の度合よりも局面情報が類似していない翻訳メモリのうち、一定の度合よりも類似している翻訳メモリが存在する場合には、翻訳メモリ記憶部131に記憶するべき翻訳メモリを共有翻訳メモリ記憶部132へ複写することができ、複数のユーザによる共有化による翻訳効率の改善を図ることができる。また、訳文を用いる局面が異なる場合であるにもかかわらず、言語的に類似している訳文については汎用的に用いることが可能な訳文であるとの前提に基づいて、斯かる組み合わせを含む翻訳メモリを共有翻訳メモリ記憶部132へ記憶することにより、不用意に情報が拡散することを防止することも可能となる。
【0034】
図3及び図4は、本発明の実施の形態に係る翻訳支援装置1のCPU11の共有翻訳メモリ記憶部132へ共有するべき翻訳メモリを記憶する処理手順を示すフローチャートである。図3に示すように、翻訳支援装置1のCPU11は、原文情報、翻訳文情報及び付随情報に含まれる局面情報で構成された翻訳メモリの入力を受け付ける(ステップS301)。翻訳メモリの入力は、キーボード21、マウス22等により受け付ける。
【0035】
CPU11は、翻訳メモリ記憶部131内に記憶されている翻訳メモリから一の翻訳メモリを選択し(ステップS302)、選択した翻訳メモリに含まれる局面情報と入力を受け付けた局面情報との間の局面類似度を算出する(ステップS303)。CPU11は、算出した局面類似度が所定の閾値より小さいか否かを判断する(ステップS304)。
【0036】
局面情報の入力は、セクタ、プロジェクト名等、翻訳メモリ記憶部131の利用局面を特定することができるメタデータである局面メタデータとして受け付ける。したがって、局面類似度pは、類似度算出対象となる2つの局面情報t1、t2の関数p(t1、t2)で表すことができる。所定の閾値をθp とした場合、p(t1、t2)<θp である場合に局面が異なると判断する。
【0037】
CPU11が、算出した局面類似度が所定の閾値より小さいと判断した場合(ステップS304:YES)、CPU11は、選択された局面情報に対応して記憶されている翻訳メモリをメモリ12へ一時記憶する(ステップS305)。CPU11が、算出した局面類似度が所定の閾値以上であると判断した場合(ステップS304:NO)、CPU11は、ステップS305をスキップし、翻訳メモリ記憶部131内に記憶されているすべての翻訳メモリを選択したか否かを判断する(ステップS306)。
【0038】
CPU11が、選択されていない翻訳メモリが存在すると判断した場合(ステップS306:NO)、CPU11は、次の翻訳メモリを選択して(ステップS307)、処理をステップS303へ戻して、上述した処理を繰り返す。CPU11が、すべての翻訳メモリを選択したと判断した場合(ステップS306:YES)、CPU11は、入力を受け付けた翻訳メモリを翻訳メモリ記憶部131へ記憶し(ステップS308)、図4に示すように、メモリ12内に一時記憶されている翻訳メモリから一の翻訳メモリを選択する(ステップS401)。
【0039】
CPU11は、選択された翻訳メモリに含まれる翻訳文情報と、入力を受け付けた翻訳メモリに含まれる翻訳文情報との間の訳文類似度を算出する(ステップS402)。CPU11は、算出した訳文類似度が所定の閾値より大きいか否かを判断する(ステップS403)。
【0040】
訳文類似度cは、類似度算出対象となる2つの翻訳文情報u1、u2の関数c(u1、u2)で表すことができる。所定の閾値をθc とした場合、c(u1、u2)>θc である場合に訳文が類似すると判断する。
【0041】
CPU11が、算出した訳文類似度が所定の閾値より大きいと判断した場合(ステップS403:YES)、CPU11は、選択された翻訳文情報に対応して記憶されている翻訳メモリをメモリ12へ一時記憶する(ステップS404)。CPU11が、算出した訳文類似度が所定の閾値以下であると判断した場合(ステップS403:NO)、CPU11は、ステップS404をスキップし、メモリ12内に一時記憶されているすべての翻訳メモリを選択したか否かを判断する(ステップS405)。
【0042】
CPU11が、選択されていない翻訳メモリが存在すると判断した場合(ステップS405:NO)、CPU11は、次の翻訳メモリを選択して(ステップS406)、処理をステップS402へ戻して、上述した処理を繰り返す。CPU11が、すべての翻訳メモリを選択したと判断した場合(ステップS405:YES)、CPU11は、一時記憶されている翻訳メモリを共有翻訳メモリ記憶部132へ複写する(ステップS407)。
【0043】
上述の例では、翻訳メモリ記憶部131の内容を維持した状態で、複数のユーザで共有することが可能な翻訳メモリを共有翻訳メモリ記憶部132へ複写している。このようにすることで、利用者は自己の使用している翻訳装置3内に記憶されている翻訳メモリのみならず、共有翻訳メモリ記憶部132に記憶されている翻訳メモリを照会することにより、翻訳効率の改善を図ることができる。
【0044】
一方、翻訳メモリ記憶部131から複数のユーザで共有することが可能な翻訳メモリを共有翻訳メモリ記憶部132へ移動させても良い。この場合、翻訳メモリ記憶部131と共有翻訳メモリ記憶部132とで重複して翻訳メモリを記憶することがなく、記憶装置13の記憶容量を節約することができる。具体的には、複数のユーザで共有することが可能な翻訳メモリを共有翻訳メモリ記憶部132へ複写してから、元の翻訳メモリを翻訳メモリ記憶部131から削除する。
【0045】
以下、局面類似度及び訳文類似度として、局面間距離又は訳文間距離を用いる場合の具体例を示す。上述した例とは異なり、局面情報を局面ベクトルとして取得して局面間距離sを算出し、翻訳文情報を訳文ベクトルとして取得して訳文間距離dを算出することにより、局面が異なるか否か及び訳文が類似するか否かを判断する。すなわち、2つの局面ベクトルt1、t2間の局面間距離s(t1、t2)は、所定の閾値をθs とした場合、s(t1、t2)>θs である場合に局面が異なると判断する。また、2つの訳文ベクトルu1、u2間の訳文間距離d(u1、u2)は、所定の閾値をθd とした場合、d(u1、u2)<θd である場合に訳文が類似すると判断する。
【0046】
まず局面情報として、「金融」、「通信」、「運輸」という3つのセクタを定義する。そして、局面間距離とは、局面ベクトル間の距離を意味しており、所定の局面に含まれる訳文ベクトルの平均値を局面ベクトルと定義する。
【0047】
次に、訳文間距離は、一の訳文について空間ベクトルとして事前に定義した場合の訳文ベクトル間のなす角度で表す。訳文ベクトルは、任意のn次元(nは自然数)の空間として表現され、例えば「電気」、「減益」という2つの単語からなる二次元空間ベクトルとして訳文を表現する場合、「電気」という語が2回出現し、「減益」という語が1回出現している訳文の訳文ベクトルは、(2、1)とベクトル表現することができる。
【0048】
図5は、訳文ベクトルの例示図である。例えば訳文ベクトルt0に対応する翻訳文情報には、「電気」という語が2回出現し、「減益」という語が出現していないことを、項目「電気」、「減益」の数値が示している。したがって訳文ベクトルt0は(2、0)となる。以下、同様にして、訳文ベクトルt1は(2、1)t2は(3、1)である旨を示している。
【0049】
図6は、訳文ベクトルを項目「電気」を横軸に、項目「減益」を縦軸にしてベクトル表現したグラフである。斯かるベクトル空間上の2つのベクトル間の距離は、ベクトル間のなす角度(内積)の大きさで表現することができる。図7は、図6に示す訳文ベクトルt0と、訳文ベクトルt1、t2、・・・との訳文間距離の算出結果の例示図である。
【0050】
図7に示すように、訳文ベクトルt0と、訳文ベクトルt1、t2、・・・とのそれぞれの組み合わせについて、訳文ベクトル間のなす角をベクトル間の距離、すなわち訳文間距離として算出している。訳文ベクトルt0の訳文間距離が‘0.0’となっているのは、内積をもとめる基準となる訳文ベクトルだからである。
【0051】
なお、翻訳メモリ記憶部131に翻訳メモリを記憶する場合、付随情報として局面情報だけでなく、翻訳文情報中に出現する所定の単語の回数も記憶すれば良い。図8は、翻訳メモリ記憶部131に記憶するデータ構成の例示図である。図8の例では、原文情報は省略し、翻訳文情報に所定の単語が出現する回数及び局面情報を付随情報として記憶している。このようにすることで、局面情報ごとに、訳文ベクトルの平均値を算出することができ、局面間距離の算出の基礎とすることができる。
【0052】
図8では、局面「運輸」の訳文ベクトルの平均値が(2.5、1.0)、局面「通信」の訳文ベクトルの平均値が(3.5、0.5)、局面「金融」の訳文ベクトルの平均値が(2.0、3.5)と求まっており、上述した訳文間距離の算出方法と同様の手順にて局面間距離を算出することができる。すなわち、それぞれの局面の訳文ベクトルの平均値を基礎として、他の局面の訳文ベクトルの平均値とのベクトル間距離を内積として算出する。
【0053】
図9は、局面間距離の算出結果の例示図である。例えば局面が類似しているか否かを判断する閾値θs を、局面間距離‘40’と設定した場合、局面「金融」−「通信」間、「金融」−「運輸」間での局面間距離は閾値θs を超えているので、異なる局面に属すると判断することができる。
【0054】
なお、翻訳メモリ記憶部131から共有翻訳メモリ記憶部132へ複写するか否かを判断するための閾値は、距離を算出して比較する対象の個数nを‘2’とした場合、判断するための関数f(s、d)は二次元空間上の領域境界線となる。図10は、閾値を直線で表した判断方法の一例を示す模式図である。
【0055】
図10では、局面間距離sを縦軸に、訳文間距離dを横軸に取り、局面間距離sの閾値θs 、訳文間距離θd をそれぞれ設定している。つまり、局面間距離sが閾値θs より大きい場合には両者の局面情報は異なり、小さい場合には両者の局面情報が類似していると判断する。また、訳文間距離dが閾値θd より大きい場合には両者の翻訳文情報は異なり、小さい場合には両者の翻訳文情報が類似していると判断する。
【0056】
すなわち、新たに入力を受け付けた翻訳メモリを原点1001とし、翻訳メモリ記憶部131に記憶されている翻訳メモリについて、それぞれ局面間距離s及び訳文間距離dを算出してベクトル情報としてプロットする。ベクトル1002、1003は、局面間距離sが閾値θs より大きいので、局面情報が異なると判断される。一方、ベクトル1004、1005は、局面間距離sが閾値θs より小さいので、局面情報が類似していると判断される。したがって、ベクトル1002、1003が、訳文間距離の算出対象となる。
【0057】
次にベクトル1002、1003は、訳文間距離dが閾値θd よりも小さいことから、翻訳文情報が類似していると判断される。したがって、ベクトル1002、1003に対応する翻訳メモリを翻訳メモリ記憶部131から共有翻訳メモリ記憶部132へ複写することが可能な情報であると判断することができる。
【0058】
上述の例では、いずれも閾値に基づく一次直線より上方か下方かに基づいて判断しているが、判定関数f(s、d)を二次曲線1006のように設定して、複写対象となるベクトルを特定しても良い。図10の例では、ベクトル1002、1003、1004に対応する翻訳メモリが複写対象となり、ベクトル1005に対応する翻訳メモリは複写対象とはならない。
【0059】
新たに入力を受け付けた翻訳メモリから、新たなベクトルt0を、局面を「金融」と、翻訳文情報の中には「電気」が2回、「減益」が0回出現すると定義した場合、図9と同様にしてベクトルt0とベクトルt1〜t6の各々との間の局面間距離を算出する。この場合、ベクトルt0との局面間距離sの閾値θs が‘40’以上離れている局面は「運輸」となるので、訳文間距離は、ベクトルt1、t2について比較すれば良い。
【0060】
図11は、図8に示す翻訳メモリ記憶部131に記憶されているベクトルt1〜t6と入力を受け付けたベクトルt0との間の訳文間距離の例示図である。訳文間距離dの閾値θd を‘40’とした場合、ベクトルt1、t2の訳文間距離dはともに‘40’以下となっている。したがって、ベクトルt0とは局面が異なる「運輸」であり、しかも訳文間距離dが閾値θd よりも小さいベクトルはベクトルt1、t2であることから、入力を受け付けたベクトルt0とともにベクトルt1、t2に対応する翻訳メモリが共有翻訳メモリ記憶部132への複写対象となり、翻訳メモリ記憶部131から共有翻訳メモリ記憶部132へ複写される。
【0061】
もちろん、局面間距離sが閾値θs 以下であると判断された場合であっても、訳文間距離dが閾値θd よりも小さいベクトル、図11の場合ではベクトルt3、t4についても複写の対象としても良い。例えば閾値θdをより小さく設定することにより抽出されたベクトルは、特定の場面で固有の翻訳文である可能性が高くなるからである。この場合、ベクトルt3、t4に対応する翻訳メモリも共有翻訳メモリ記憶部132への複写対象となり、翻訳メモリ記憶部131から共有翻訳メモリ記憶部132へ複写される。
【0062】
図12及び図13は、局面間距離又は訳文間距離を用いる場合の翻訳支援装置1のCPU11の共有翻訳メモリ記憶部132へ共有するべき翻訳メモリを記憶する処理手順を示すフローチャートである。図12に示すように、翻訳支援装置1のCPU11は、原文情報、翻訳文情報及び付随情報に含まれる局面情報で構成された翻訳メモリの入力を受け付ける(ステップS1201)。翻訳メモリの入力は、キーボード21、マウス22等により受け付ける。
【0063】
CPU11は、翻訳メモリ記憶部131内に記憶されている局面情報を含む翻訳メモリから一の翻訳メモリを選択し(ステップS1202)、選択した翻訳メモリに含まれる局面情報と入力を受け付けた翻訳メモリに含まれる局面情報との間の局面間距離を算出する(ステップS1203)。CPU11は、算出した局面間距離が所定の閾値より大きいか否かを判断する(ステップS1204)。
【0064】
CPU11が、算出した局面間距離が所定の閾値より大きいと判断した場合(ステップS1204:YES)、CPU11は、選択された局面情報に対応して記憶されている翻訳メモリをメモリ12へ一時記憶する(ステップS1205)。CPU11が、算出した局面間距離が所定の閾値以下であると判断した場合(ステップS1204:NO)、CPU11は、ステップS1205をスキップし、翻訳メモリ記憶部131内に記憶されているすべての翻訳メモリを選択したか否かを判断する(ステップS1206)。
【0065】
CPU11が、選択されていない翻訳メモリが存在すると判断した場合(ステップS1206:NO)、CPU11は、次の翻訳メモリを選択して(ステップS1207)、処理をステップS1203へ戻して、上述した処理を繰り返す。CPU11が、すべての翻訳メモリを選択したと判断した場合(ステップS1206:YES)、CPU11は、入力を受け付けた翻訳メモリを翻訳メモリ記憶部131へ記憶し(ステップS1208)、図13に示すように、メモリ12内に一時記憶されている翻訳メモリから一の翻訳メモリを選択する(ステップS1301)。
【0066】
CPU11は、選択された翻訳メモリに含まれる翻訳文情報と、入力を受け付けた翻訳メモリに含まれる翻訳文情報との間の訳文間距離を算出する(ステップS1302)。CPU11は、算出した訳文間距離が所定の閾値より小さいか否かを判断する(ステップS1303)。
【0067】
CPU11が、算出した訳文間距離が所定の閾値より小さいと判断した場合(ステップS1303:YES)、CPU11は、選択された翻訳文情報に対応して記憶されている翻訳メモリをメモリ12へ一時記憶する(ステップS1304)。CPU11が、算出した訳文間距離が所定の閾値以上であると判断した場合(ステップS1303:NO)、CPU11は、ステップS1304をスキップし、メモリ12内に一時記憶されているすべての翻訳メモリを選択したか否かを判断する(ステップS1305)。
【0068】
CPU11が、選択されていない翻訳メモリが存在すると判断した場合(ステップS1305:NO)、CPU11は、次の翻訳メモリを選択して(ステップS1306)、処理をステップS1302へ戻して、上述した処理を繰り返す。CPU11が、すべての翻訳メモリを選択したと判断した場合(ステップS1305:YES)、CPU11は、一時記憶されている翻訳メモリを共有翻訳メモリ記憶部132へ複写する(ステップS1307)。
【0069】
なお、上述した実施の形態では翻訳メモリに含まれる翻訳文情報に基づいて訳文類似度又は訳文間距離を算出しているが、まず原文情報間のベクトル距離である原文間距離を算出して、原文間距離が所定の閾値より小さい、すなわち原文が類似している場合にのみ翻訳文情報に基づいて訳文類似度又は訳文間距離を算出しても良い。
【0070】
この場合、原文情報間の類似度である原文類似度を算出する原文類似度算出部207、及び算出した原文類似度が所定の閾値より小さい原文情報が存在するか否かを判断する原文類似度判断部208を設け、訳文類似度判断部205は、原文情報の類似度が所定の閾値より大きい原文情報が存在すると判断した場合、原文情報の類似度が所定の閾値より大きい原文情報に対応する翻訳文情報についてのみ訳文間距離を算出する。これにより、原文情報と翻訳文情報との組み合わせ情報が類似している情報を共有翻訳メモリ記憶部132へ複写することができ、翻訳効率を高めることができる。
【0071】
具体的には、原文類似度算出部207では、原文情報間のベクトル距離である原文間距離を算出し、原文類似度判断部208では、算出した原文間距離が所定の閾値より小さい原文情報が存在するか否かを判断する。訳文類似度判断部205は、原文間距離が所定の閾値より小さい原文情報が存在すると判断した場合、原文情報に対応する翻訳文情報についてのみ訳文間距離を算出する。
【0072】
また、局面類似度算出処理と訳文類似度算出処理とを並行して実行し、同時に閾値より大きいか否かの判断処理を実行しても良い。CPUに十分な処理能力があり、メモリに余裕がある場合には、演算処理全体のスループットが高くなる可能性がある。
【0073】
以上のように本実施の形態によれば、翻訳メモリ記憶部131に記憶された訳文を用いる局面が異なる場合であるにもかかわらず、言語的に類似している訳文については汎用的に用いることが可能な訳文であるとの前提に基づいて、局面が異なり、かつ訳文が類似している訳文に関する情報のみを共有翻訳メモリ記憶部132に複写することにより、汎用的であると考えられる訳文のみを複数のユーザで共有することができる。したがって、局面に依存するような固有情報の共有化を未然に回避することができ、翻訳効率の改善を図ることができると同時に、一定の情報の拡散を防止することも可能となる。
【0074】
なお、本発明は上記実施例に限定されるものではなく、本発明の趣旨の範囲内であれば多種の変更、改良等が可能である。
【図面の簡単な説明】
【0075】
【図1】本発明の実施の形態に係る翻訳支援装置の構成例を示すブロック図である。
【図2】本発明の実施の形態に係る翻訳支援装置の機能ブロック図である。
【図3】本発明の実施の形態に係る翻訳支援装置のCPUの共有翻訳メモリ記憶部へ共有するべき翻訳メモリを記憶する処理手順を示すフローチャートである。
【図4】本発明の実施の形態に係る翻訳支援装置のCPUの共有翻訳メモリ記憶部へ共有するべき翻訳メモリを記憶する処理手順を示すフローチャートである。
【図5】訳文ベクトルの例示図である。
【図6】訳文ベクトルを項目「電気」を横軸に、項目「減益」を縦軸にしてベクトル表現したグラフである。
【図7】訳文間距離の算出結果の例示図である。
【図8】翻訳メモリ記憶部に記憶するデータ構成の例示図である。
【図9】局面間距離の算出結果の例示図である。
【図10】閾値を直線で表した判断方法の一例を示す模式図である。
【図11】翻訳メモリ記憶部に記憶されているベクトルと入力を受け付けたベクトルとの間の訳文間距離の例示図である。
【図12】局面間距離又は訳文間距離を用いる場合の翻訳支援装置のCPUの共有翻訳メモリ記憶部へ共有するべき翻訳メモリを記憶する処理手順を示すフローチャートである。
【図13】局面間距離又は訳文間距離を用いる場合の翻訳支援装置のCPUの共有翻訳メモリ記憶部へ共有するべき翻訳メモリを記憶する処理手順を示すフローチャートである。
【符号の説明】
【0076】
1 翻訳支援装置
2 ネットワーク
3 翻訳装置
11 CPU
12 メモリ
13 記憶装置
14 I/Oインタフェース
15 ビデオインタフェース
16 可搬型ディスクドライブ
17 通信インタフェース
18 内部バス
23 表示装置
90 可搬型記録媒体
100 コンピュータプログラム
131 翻訳メモリ記憶部(翻訳メモリ)
132 共有翻訳メモリ記憶部(共有メモリ)
【特許請求の範囲】
【請求項1】
原文情報と翻訳文情報との組み合わせ情報、及び所定の付随情報を記憶する翻訳メモリと、ネットワークを介して複数のユーザがアクセスすることが可能な共有メモリとを用い、翻訳対象となる原文情報を前記翻訳メモリ及び前記共有メモリを照会しつつ翻訳する処理を支援するコンピュータで実行することが可能な翻訳支援方法において、
原文情報、翻訳文情報及び翻訳に係る局面に関する局面情報を含む付随情報の入力を受け付け、
入力を受け付けた付随情報に含まれる局面情報に基づいて、既に前記翻訳メモリに記憶されている付随情報に含まれる局面情報との類似度である局面類似度を算出し、
算出された局面類似度が所定の閾値より小さい局面情報が存在するか否かを判断し、
前記局面類似度が所定の閾値より小さい局面情報が存在すると判断することに応答して、該局面情報に対応する翻訳文情報について、入力を受け付けた翻訳文情報との類似度である訳文類似度を算出し、
算出された訳文類似度が所定の閾値より大きい翻訳文情報が存在するか否かを判断し、
前記訳文類似度が所定の閾値より大きい翻訳文情報が存在すると判断することに応答して、入力を受け付けた原文情報、翻訳文情報及び付随情報を前記共有メモリへ複写することを特徴とする翻訳支援方法。
【請求項2】
前記局面情報間のベクトル距離である局面間距離を算出し、
算出された局面間距離が所定の閾値より大きい局面情報が存在するか否かを判断し、
前記局面間距離が所定の閾値より大きい局面情報が存在すると判断することに応答して、該局面情報に対応する前記翻訳文情報間のベクトル距離である訳文間距離を算出し、
算出された訳文間距離が所定の閾値より小さい翻訳文情報が存在するか否かを判断し、
前記訳文間距離が所定の閾値より小さい翻訳文情報が存在すると判断することに応答して、該翻訳文情報に対応する原文情報及び付随情報を前記共有メモリへ複写することを特徴とする請求項1記載の翻訳支援方法。
【請求項3】
前記原文情報間のベクトル距離である原文間距離を算出し、
算出された原文間距離が所定の閾値より小さい原文情報が存在するか否かを判断し、
前記原文間距離が所定の閾値より小さい原文情報が存在すると判断することに応答して、該原文情報に対応する翻訳文情報についてのみ前記訳文間距離を算出することを特徴とする請求項2記載の翻訳支援方法。
【請求項4】
原文情報と翻訳文情報との組み合わせ情報、及び所定の付随情報を記憶する翻訳メモリと、ネットワークを介して複数のユーザがアクセスすることが可能な共有メモリとを備え、翻訳対象となる原文情報を前記翻訳メモリ及び前記共有メモリを照会しつつ翻訳する処理を支援する翻訳支援装置において、
原文情報、翻訳文情報及び翻訳に係る局面に関する局面情報を含む付随情報の入力を受け付ける受付手段と、
入力を受け付けた付随情報に含まれる局面情報に基づいて、既に前記翻訳メモリに記憶されている付随情報に含まれる局面情報との類似度である局面類似度を算出する局面類似度算出手段と、
算出された局面類似度が所定の閾値より小さい局面情報が存在するか否かを判断する局面類似度判断手段と、
該局面類似度判断手段で所定の閾値より小さい局面情報が存在すると判断することに応答して、該局面情報に対応する翻訳文情報について、入力を受け付けた翻訳文情報との類似度である訳文類似度を算出する訳文類似度算出手段と、
算出された訳文類似度が所定の閾値より大きい翻訳文情報が存在するか否かを判断する訳文類似度判断手段と、
該訳文類似度判断手段で所定の閾値より大きい翻訳文情報が存在すると判断することに応答して、入力を受け付けた原文情報、翻訳文情報及び付随情報を前記共有メモリへ複写する複写手段と
を備えることを特徴とする翻訳支援装置。
【請求項5】
前記局面類似度算出手段は、前記局面情報間のベクトル距離である局面間距離を算出するようにしてあり、
前記局面類似度判断手段は、算出された局面間距離が所定の閾値より大きい局面情報が存在するか否かを判断するようにしてあり、
前記訳文類似度算出手段は、該局面類似度判断手段で前記局面間距離が所定の閾値より大きい局面情報が存在すると判断することに応答して、該局面情報に対応する前記翻訳文情報間のベクトル距離である訳文間距離を算出するようにしてあり、
前記訳文類似度判断手段は、算出された訳文間距離が所定の閾値より小さい翻訳文情報が存在するか否かを判断するようにしてあり、
前記複写手段は、該訳文類似度判断手段で前記訳文間距離が所定の閾値より小さい翻訳文情報が存在すると判断することに応答して、該翻訳文情報に対応する原文情報及び付随情報を前記共有メモリへ複写するようにしてあることを特徴とする請求項4記載の翻訳支援装置。
【請求項6】
前記原文情報間のベクトル距離である原文間距離を算出する原文間距離算出手段と、
算出された原文間距離が所定の閾値より小さい原文情報が存在するか否かを判断する原文類似度判断手段と、
該原文類似度判断手段で、前記原文間距離が所定の閾値より小さい原文情報が存在すると判断することに応答して、前記訳文類似度算出手段は、該原文情報に対応する翻訳文情報についてのみ前記訳文間距離を算出するようにしてあることを特徴とする請求項5記載の翻訳支援装置。
【請求項7】
原文情報と翻訳文情報との組み合わせ情報、及び所定の付随情報を記憶する翻訳メモリと、ネットワークを介して複数のユーザがアクセスすることが可能な共有メモリとを備え、翻訳対象となる原文情報を前記翻訳メモリ及び前記共有メモリを照会しつつ翻訳する処理を支援するコンピュータで実行することが可能なコンピュータプログラムにおいて、
前記コンピュータを、
原文情報、翻訳文情報及び翻訳に係る局面に関する局面情報を含む付随情報の入力を受け付ける受付手段、
入力を受け付けた付随情報に含まれる局面情報に基づいて、既に前記翻訳メモリに記憶されている付随情報に含まれる局面情報との類似度である局面類似度を算出する局面類似度算出手段、
算出された局面類似度が所定の閾値より小さい局面情報が存在するか否かを判断する局面類似度判断手段、
該局面類似度判断手段で所定の閾値より小さい局面情報が存在すると判断することに応答して、該局面情報に対応する翻訳文情報について、入力を受け付けた翻訳文情報との類似度である訳文類似度を算出する訳文類似度算出手段、
算出された訳文類似度が所定の閾値より大きい翻訳文情報が存在するか否かを判断する訳文類似度判断手段、及び
該訳文類似度判断手段で所定の閾値より大きい翻訳文情報が存在すると判断することに応答して、入力を受け付けた原文情報、翻訳文情報及び付随情報を前記共有メモリへ複写する複写手段
として機能させることを特徴とするコンピュータプログラム。
【請求項8】
前記局面類似度算出手段を、前記局面情報間のベクトル距離である局面間距離を算出する手段として機能させ、
前記局面類似度判断手段を、算出された局面間距離が所定の閾値より大きい局面情報が存在するか否かを判断する手段として機能させ、
前記訳文類似度算出手段を、該局面類似度判断手段で前記局面間距離が所定の閾値より大きい局面情報が存在すると判断することに応答して、該局面情報に対応する前記翻訳文情報間のベクトル距離である訳文間距離を算出する手段として機能させ、
前記訳文類似度判断手段を、算出された訳文間距離が所定の閾値より小さい翻訳文情報が存在するか否かを判断する手段として機能させ、
前記複写手段を、該訳文類似度判断手段で前記訳文間距離が所定の閾値より小さい翻訳文情報が存在すると判断することに応答して、該翻訳文情報に対応する原文情報及び付随情報を前記共有メモリへ複写する手段として機能させることを特徴とする請求項7記載のコンピュータプログラム。
【請求項9】
前記コンピュータを、
前記原文情報間のベクトル距離である原文間距離を算出する原文間距離算出手段、及び
算出された原文間距離が所定の閾値より小さい原文情報が存在するか否かを判断する原文類似度判断手段
として機能させ、
該原文類似度判断手段で、前記原文間距離が所定の閾値より小さい原文情報が存在すると判断することに応答して、前記訳文類似度算出手段を、該原文情報に対応する翻訳文情報についてのみ前記訳文間距離を算出する手段として機能させることを特徴とする請求項8記載のコンピュータプログラム。
【請求項1】
原文情報と翻訳文情報との組み合わせ情報、及び所定の付随情報を記憶する翻訳メモリと、ネットワークを介して複数のユーザがアクセスすることが可能な共有メモリとを用い、翻訳対象となる原文情報を前記翻訳メモリ及び前記共有メモリを照会しつつ翻訳する処理を支援するコンピュータで実行することが可能な翻訳支援方法において、
原文情報、翻訳文情報及び翻訳に係る局面に関する局面情報を含む付随情報の入力を受け付け、
入力を受け付けた付随情報に含まれる局面情報に基づいて、既に前記翻訳メモリに記憶されている付随情報に含まれる局面情報との類似度である局面類似度を算出し、
算出された局面類似度が所定の閾値より小さい局面情報が存在するか否かを判断し、
前記局面類似度が所定の閾値より小さい局面情報が存在すると判断することに応答して、該局面情報に対応する翻訳文情報について、入力を受け付けた翻訳文情報との類似度である訳文類似度を算出し、
算出された訳文類似度が所定の閾値より大きい翻訳文情報が存在するか否かを判断し、
前記訳文類似度が所定の閾値より大きい翻訳文情報が存在すると判断することに応答して、入力を受け付けた原文情報、翻訳文情報及び付随情報を前記共有メモリへ複写することを特徴とする翻訳支援方法。
【請求項2】
前記局面情報間のベクトル距離である局面間距離を算出し、
算出された局面間距離が所定の閾値より大きい局面情報が存在するか否かを判断し、
前記局面間距離が所定の閾値より大きい局面情報が存在すると判断することに応答して、該局面情報に対応する前記翻訳文情報間のベクトル距離である訳文間距離を算出し、
算出された訳文間距離が所定の閾値より小さい翻訳文情報が存在するか否かを判断し、
前記訳文間距離が所定の閾値より小さい翻訳文情報が存在すると判断することに応答して、該翻訳文情報に対応する原文情報及び付随情報を前記共有メモリへ複写することを特徴とする請求項1記載の翻訳支援方法。
【請求項3】
前記原文情報間のベクトル距離である原文間距離を算出し、
算出された原文間距離が所定の閾値より小さい原文情報が存在するか否かを判断し、
前記原文間距離が所定の閾値より小さい原文情報が存在すると判断することに応答して、該原文情報に対応する翻訳文情報についてのみ前記訳文間距離を算出することを特徴とする請求項2記載の翻訳支援方法。
【請求項4】
原文情報と翻訳文情報との組み合わせ情報、及び所定の付随情報を記憶する翻訳メモリと、ネットワークを介して複数のユーザがアクセスすることが可能な共有メモリとを備え、翻訳対象となる原文情報を前記翻訳メモリ及び前記共有メモリを照会しつつ翻訳する処理を支援する翻訳支援装置において、
原文情報、翻訳文情報及び翻訳に係る局面に関する局面情報を含む付随情報の入力を受け付ける受付手段と、
入力を受け付けた付随情報に含まれる局面情報に基づいて、既に前記翻訳メモリに記憶されている付随情報に含まれる局面情報との類似度である局面類似度を算出する局面類似度算出手段と、
算出された局面類似度が所定の閾値より小さい局面情報が存在するか否かを判断する局面類似度判断手段と、
該局面類似度判断手段で所定の閾値より小さい局面情報が存在すると判断することに応答して、該局面情報に対応する翻訳文情報について、入力を受け付けた翻訳文情報との類似度である訳文類似度を算出する訳文類似度算出手段と、
算出された訳文類似度が所定の閾値より大きい翻訳文情報が存在するか否かを判断する訳文類似度判断手段と、
該訳文類似度判断手段で所定の閾値より大きい翻訳文情報が存在すると判断することに応答して、入力を受け付けた原文情報、翻訳文情報及び付随情報を前記共有メモリへ複写する複写手段と
を備えることを特徴とする翻訳支援装置。
【請求項5】
前記局面類似度算出手段は、前記局面情報間のベクトル距離である局面間距離を算出するようにしてあり、
前記局面類似度判断手段は、算出された局面間距離が所定の閾値より大きい局面情報が存在するか否かを判断するようにしてあり、
前記訳文類似度算出手段は、該局面類似度判断手段で前記局面間距離が所定の閾値より大きい局面情報が存在すると判断することに応答して、該局面情報に対応する前記翻訳文情報間のベクトル距離である訳文間距離を算出するようにしてあり、
前記訳文類似度判断手段は、算出された訳文間距離が所定の閾値より小さい翻訳文情報が存在するか否かを判断するようにしてあり、
前記複写手段は、該訳文類似度判断手段で前記訳文間距離が所定の閾値より小さい翻訳文情報が存在すると判断することに応答して、該翻訳文情報に対応する原文情報及び付随情報を前記共有メモリへ複写するようにしてあることを特徴とする請求項4記載の翻訳支援装置。
【請求項6】
前記原文情報間のベクトル距離である原文間距離を算出する原文間距離算出手段と、
算出された原文間距離が所定の閾値より小さい原文情報が存在するか否かを判断する原文類似度判断手段と、
該原文類似度判断手段で、前記原文間距離が所定の閾値より小さい原文情報が存在すると判断することに応答して、前記訳文類似度算出手段は、該原文情報に対応する翻訳文情報についてのみ前記訳文間距離を算出するようにしてあることを特徴とする請求項5記載の翻訳支援装置。
【請求項7】
原文情報と翻訳文情報との組み合わせ情報、及び所定の付随情報を記憶する翻訳メモリと、ネットワークを介して複数のユーザがアクセスすることが可能な共有メモリとを備え、翻訳対象となる原文情報を前記翻訳メモリ及び前記共有メモリを照会しつつ翻訳する処理を支援するコンピュータで実行することが可能なコンピュータプログラムにおいて、
前記コンピュータを、
原文情報、翻訳文情報及び翻訳に係る局面に関する局面情報を含む付随情報の入力を受け付ける受付手段、
入力を受け付けた付随情報に含まれる局面情報に基づいて、既に前記翻訳メモリに記憶されている付随情報に含まれる局面情報との類似度である局面類似度を算出する局面類似度算出手段、
算出された局面類似度が所定の閾値より小さい局面情報が存在するか否かを判断する局面類似度判断手段、
該局面類似度判断手段で所定の閾値より小さい局面情報が存在すると判断することに応答して、該局面情報に対応する翻訳文情報について、入力を受け付けた翻訳文情報との類似度である訳文類似度を算出する訳文類似度算出手段、
算出された訳文類似度が所定の閾値より大きい翻訳文情報が存在するか否かを判断する訳文類似度判断手段、及び
該訳文類似度判断手段で所定の閾値より大きい翻訳文情報が存在すると判断することに応答して、入力を受け付けた原文情報、翻訳文情報及び付随情報を前記共有メモリへ複写する複写手段
として機能させることを特徴とするコンピュータプログラム。
【請求項8】
前記局面類似度算出手段を、前記局面情報間のベクトル距離である局面間距離を算出する手段として機能させ、
前記局面類似度判断手段を、算出された局面間距離が所定の閾値より大きい局面情報が存在するか否かを判断する手段として機能させ、
前記訳文類似度算出手段を、該局面類似度判断手段で前記局面間距離が所定の閾値より大きい局面情報が存在すると判断することに応答して、該局面情報に対応する前記翻訳文情報間のベクトル距離である訳文間距離を算出する手段として機能させ、
前記訳文類似度判断手段を、算出された訳文間距離が所定の閾値より小さい翻訳文情報が存在するか否かを判断する手段として機能させ、
前記複写手段を、該訳文類似度判断手段で前記訳文間距離が所定の閾値より小さい翻訳文情報が存在すると判断することに応答して、該翻訳文情報に対応する原文情報及び付随情報を前記共有メモリへ複写する手段として機能させることを特徴とする請求項7記載のコンピュータプログラム。
【請求項9】
前記コンピュータを、
前記原文情報間のベクトル距離である原文間距離を算出する原文間距離算出手段、及び
算出された原文間距離が所定の閾値より小さい原文情報が存在するか否かを判断する原文類似度判断手段
として機能させ、
該原文類似度判断手段で、前記原文間距離が所定の閾値より小さい原文情報が存在すると判断することに応答して、前記訳文類似度算出手段を、該原文情報に対応する翻訳文情報についてのみ前記訳文間距離を算出する手段として機能させることを特徴とする請求項8記載のコンピュータプログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【公開番号】特開2010−117759(P2010−117759A)
【公開日】平成22年5月27日(2010.5.27)
【国際特許分類】
【出願番号】特願2008−288591(P2008−288591)
【出願日】平成20年11月11日(2008.11.11)
【出願人】(390009531)インターナショナル・ビジネス・マシーンズ・コーポレーション (4,084)
【氏名又は名称原語表記】INTERNATIONAL BUSINESS MASCHINES CORPORATION
【復代理人】
【識別番号】100117260
【弁理士】
【氏名又は名称】福永 正也
【Fターム(参考)】
【公開日】平成22年5月27日(2010.5.27)
【国際特許分類】
【出願日】平成20年11月11日(2008.11.11)
【出願人】(390009531)インターナショナル・ビジネス・マシーンズ・コーポレーション (4,084)
【氏名又は名称原語表記】INTERNATIONAL BUSINESS MASCHINES CORPORATION
【復代理人】
【識別番号】100117260
【弁理士】
【氏名又は名称】福永 正也
【Fターム(参考)】
[ Back to top ]