説明

翻訳装置及びプログラム

【課題】 原文のレイアウトに対して翻訳文を無理なく整合させることが可能な翻訳装置を提供する。
【解決手段】 読取部によって読み取った原文の原稿の画像データから文字データを抽出する。文字データを指定された言語に翻訳する。翻訳文を原文のレイアウトに仮配置させ、配置エラーの有無を調べる。配置エラーが有る場合に、翻訳文の文字属性を変更する文字属性変更処理を行い、原文のレイアウトに仮配置させ、配置エラーの有無を調べる。依然として配置エラーが有る場合に、翻訳結果に基づいて、翻訳の方法を変更する翻訳方法変更処理あるいは翻訳後の文書を変更する翻訳文書変更処理のいずれか一方もしくは両方の処理からなる再翻訳処理を行い、翻訳内容を変更して翻訳文を原文のレイアウトに整合させる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ある言語によって表現されている原文を別の言語の文章に翻訳する技術に関する。
【背景技術】
【0002】
ある言語によって表現されている原文を別の言語の文章に翻訳する翻訳装置が知られている。原文を翻訳すると、原文と翻訳文との文字数や文字種が異なることから、翻訳前後で文字列や単語の長さに食い違いが生じる。このため、翻訳文が原文と同じレイアウトに収まるように、翻訳文の文字種、文字サイズ、文字ピッチあるいは行ピッチなどの文字の属性を変更する翻訳装置が提案されている(例えば特許文献1〜6)。
【特許文献1】特開平5−6396号公報
【特許文献2】特開平5−303589号公報
【特許文献3】特開平7−85215号公報
【特許文献4】特開平8−6948号公報
【特許文献5】特開平9−114835号公報
【特許文献6】特開2003−122751号公報
【発明の開示】
【発明が解決しようとする課題】
【0003】
しかしながら、このような翻訳文の文字の属性自体を変更して元のレイアウトに収めようとすると、文字が細かくなりすぎて、翻訳文の読み取りが困難となることがある。従って、例えば文字のサイズを小さくするにも限界があり、ある程度の大きさ文字を使用せざるを得ない。その結果、原文のレイアウトに対して翻訳文を無理なく収めることができず、原文が収められている枠線などから翻訳文がはみ出してしまうなどの不具合が生じてしまう。特に表や図を含むプレゼンテーション資料などのように、文字領域の制限されている原稿を翻訳した際には、翻訳文が表や図からはみ出してしまい、読みづらくしかも体裁の良くない翻訳原稿となってしまう。
【0004】
そこで、本発明の目的は、上記事情に鑑みてなされたもので、原文と同じようなレイアウトに対して、閲覧者にとって読みやすい翻訳文を収めることが可能な技術を提供することにある。
【課題を解決するための手段】
【0005】
上記目的を達成するために、本発明は、異なる言語で同じ意味の語句同士を対応付けた翻訳辞書と、それぞれの言語において変更可能な表現内容に関する情報を含んだ言語データベースとを記憶した記憶手段と、第1の言語で表現された原文のレイアウトを解析するレイアウト解析手段と、前記翻訳辞書を用いて前記第1の言語で表現された原文を翻訳し、第2の言語で表現された翻訳文を得る翻訳手段と、前記翻訳手段によって得られた翻訳文を、前記レイアウト解析手段によって得られたレイアウトに当て嵌める仮配置手段と、前記仮配置手段によって前記レイアウトに当て嵌められた翻訳文が当該レイアウトに収まっているか否かを判断する判断手段と、前記判断手段により前記翻訳文が前記レイアウトに収まっていないと判断された場合には、前記言語データベースに含まれている表現内容に関する情報を参照して、前記レイアウトに収まるように前記翻訳文の表現を変更する再翻訳手段とを備える翻訳装置を提供する。
【0006】
この翻訳装置によれば、原文のレイアウトに当て嵌められた翻訳文が当該レイアウトに収まっていなければ、翻訳内容を変更する再翻訳処理を行って翻訳文を原文のレイアウトに整合させる。よって、例えば表や図を含むプレゼンテーション資料など、文字領域が一定領域内に制限されているようなレイアウトの原文を翻訳した際にも、翻訳文をそのレイアウトに収め、良好な体裁の翻訳原稿を得ることができる。
【0007】
本発明においては、前記再翻訳手段は、翻訳文の表現方法を変更することにより、前記翻訳文の表現を変更するようにしてもよい。例えば、前記再翻訳手段は、翻訳文の表現をより短い語句の表現に変更する処理、翻訳文における修飾語を省略する処理、翻訳文における主語を削除する処理、及び、翻訳文における文章の語尾を簡潔にする処理のうち、少なくとも何れかの処理を実行することで、前記翻訳文の表現を変更することが望ましい。
【0008】
また、本発明において、前記再翻訳手段は、前記翻訳手段によって得られた翻訳文の語句を別の語句に置換することにより前記翻訳文の表現を変更するようにしてもよい。例えば、前記再翻訳手段は、翻訳文に含まれる語句を略語に変更する処理、又は、翻訳文に含まれる語句を記号に変更し、この記号の注釈を翻訳文中に別記する処理を実行することで、前記翻訳文の表現を変更することが望ましい。
【0009】
また、本発明は、コンピュータに、第1の言語で表現された原文のレイアウトを解析するレイアウト解析機能と、異なる言語で同じ意味の語句同士を対応付けた翻訳辞書を用いて、前記第1の言語で表現された原文を翻訳して第2の言語で表現された翻訳文を得る翻訳機能と、前記翻訳機能によって得られた翻訳文を、前記レイアウト解析手段によって得られたレイアウトに当て嵌める仮配置機能と、前記仮配置機能によって前記レイアウトに当て嵌められた翻訳文が当該レイアウトに収まっているか否かを判断する判断機能と、前記判断機能により前記翻訳文が前記レイアウトに収まっていないと判断された場合には、それぞれの言語において変更可能な表現内容に関する情報を含む言語データベースを参照して、前記レイアウトに収まるように前記翻訳文の表現を変更する再翻訳機能とを実現させるためのプログラムを提供する。
【発明を実施するための最良の形態】
【0010】
以下、本発明に係る翻訳装置の実施形態について図面を参照して説明する。
図1は、本実施形態に係る翻訳装置11の構成を示すブロック図である。翻訳装置11は例えば複合機であり、図1に示すように制御部1と、操作部2と、読取部3と、表示部4と、印刷部5と、記憶部6とを備えている。操作部2は各種のキーによって構成されたものであり、操作者による操作が可能とされている。読取部3は、図示せぬ読取面に配置された原稿の画像をスキャンし、画像データとして出力する。表示部4は、例えば、液晶ディスプレイ等からなるもので、読取部3から出力される画像データや、記録媒体や記憶部6などから制御部1によって読み出された画像データや、操作部2を構成するキーによって入力されたデータなどに従って画像を表示する。印刷部5は、図示せぬ感光体、露光部、現像部、転写部及び定着部等を備えており、制御部1から供給される画像データに基づいたトナー像を形成し、記録材である用紙上にそのトナー像を定着させる。
【0011】
記憶部6には、異なる言語で同じ意味の語句同士を対応付けた翻訳辞書と、それぞれの言語において変更可能な表現内容に関する情報を含む言語データベースと、制御部1によって実行される翻訳プログラムとが格納されている。なお、言語データベースの内容については後で詳述する。制御部1は、操作部2を用いた操作者からの指示に基づいて、読取部3にて読み取った画像データや、記憶部6から読み出した画像データに基づいて表示部4に画像を表示させる。また、制御部1は、記憶部6に記憶されている翻訳プログラムを実行することで、ある言語(第1の言語)で表現された文書を、操作者によって指定された言語(第2の言語)の文書へと翻訳する。
【0012】
次に、上記制御部1による翻訳処理について、図2に示すフローチャートに沿って説明する。なお、ここでは、図3に示す日本語の原文を英語に翻訳する場合と、図4に示す英語の原文を日本語に翻訳する場合とを例に挙げて説明する。
まず、操作者が読取部3の読取面に原文を配置し、操作部2を操作して読み取り動作を開始させる。この操作に応じて、制御部1は、読取部3によって読取面に配置された原文を読み取らせ、その内容を画像として表した画像データを取得する(ステップS01)。これにより、制御部1は、例えば図3に示す日本語の原文や、図4に示す英語の原文を表す画像データを得ることになる。
【0013】
次いで、制御部1は、画像データが表す画像に対してレイアウト解析を行う(ステップS02)。さらに、制御部1は、画像データが表す画像において、文字情報と絵柄情報とを分離する処理を行う(ステップS03)。これにより、画像データから、図表などの絵柄領域(図3、図4中の符号L)と、文字領域(図3、図4中の符号W)とが分離されることになる。次に、制御部1は、画像データから分離した文字領域Wに対して、OCR(Optical Character Reader)処理を行って、画像データを文字データに変換する文字情報認識処理を行う(ステップS04)。そして、制御部1は、この文字情報認識処理によって得られた文字データに対して、翻訳辞書を用いた翻訳処理を行うことで、原文の文字データを指定された言語の翻訳文の文字データに変換する(ステップS05)。これにより、例えば図3に示した日本語の原文の文字データが翻訳言語である英語に翻訳され、図4に示した英語の原文の文字データが翻訳言語である日本語に翻訳されることになる。
【0014】
次に、制御部1は、翻訳文の文字データが表す文字を、原文の画像データから割り出したレイアウトに当て嵌める仮配置処理を行い(ステップS06)、レイアウトに当て嵌められた翻訳文が、そのレイアウトに収まっているか否かを判断する(ステップS07)。つまり、制御部1は、原文のレイアウトに翻訳文を仮配置した結果を参照し、レイアウトに当て嵌めた各文字が枠線などからはみ出すなどの配置エラーが有るか否かを判断すればよい。その結果、当て嵌めた文字が枠などからはみ出すことなく、翻訳文がレイアウトに収まっていると判断した場合は(ステップS07;Yes)、制御部1は、仮配置を確定させる配置処理を行い(ステップS08)、印刷部5にて翻訳文を印刷させる(ステップS09)。
【0015】
ここで、図5は、日本語から英語に翻訳した文字データを原文のレイアウトに仮配置した場合に配置エラーが生じた状態を示すものである。図5に示す例では、翻訳文の語句が翻訳前より長くなったために行数が増加し、絵柄領域Lである枠線から翻訳文がはみ出している。また、図6は、英語から日本語に翻訳した文字データを原文のレイアウトに仮配置した結果を示すものである。この場合も、翻訳文の語句が翻訳前よりも長くなったために行数が増加し、絵柄領域Lである枠線から翻訳文がはみ出している。
【0016】
制御部1は、図5,6に例示したように、翻訳文が原文のレイアウトに収まっていないと判断した場合は(ステップS07;No)、文字属性変更処理を行う(ステップS10)。この文字属性変更処理は、翻訳文を原文のレイアウトにできる限り収めるべく、翻訳文の文字データが表す文字サイズ、文字間隔、行間隔あるいはフォントなどの文字属性を変更するものである。なお、この文字属性の変更は、文字が小さすぎたり、文字間隔及び行間隔が狭すぎて解読が困難とならないように、一定の範囲内にて行われる。
【0017】
次に、制御部1は、文字属性を変更した翻訳文の文字データを、再び原文のレイアウトに当て嵌める仮配置処理を行う(ステップS11)。制御部1は、この仮配置処理の結果でよいかどうかを判断する(ステップS12)。つまり、制御部1は、原文のレイアウトに翻訳文を仮配置した結果を参照し、レイアウトに当て嵌めた語句が枠などからはみ出すなどの配置エラーが有るか否かを判断する。その結果、翻訳文が原文のレイアウトに収まっていると判断した場合は(ステップS12;Yes)、制御部1は、仮配置を確定させる配置処理を行い(ステップS08)、印刷部5にて翻訳文を印刷させる(ステップS09)。
【0018】
これに対して、制御部11は、依然として配置エラーが有り、翻訳文が原文のレイアウトに収まっていないと判断した場合は(ステップS12;No)、翻訳文に対して再翻訳処理を行う(ステップS13)。この再翻訳処理は、翻訳文中の語句を以下の方法を用いることでより短くする処理であり、大別して、翻訳文の表現方法の変更と、翻訳後の語句の置換とがある。
【0019】
(1)翻訳方法の変更
まず、翻訳文の表現方法の変更について具体的に説明する。
(1−1)簡潔或いは平易な表現への変更処理
制御部1は、翻訳文の一部の表現について、記憶部6に記憶されている言語データベースを参照し、簡潔な表現あるいは平易な表現(より短い表現)に変更する。例えば、翻訳文が「書き記してください」という表現である場合、これをより簡易な表現である「書いてください」に変更するといった具合である。どのような表現を如何なる表現に変更可能かということに関しては、例えば変更前後の表現を予め対応付けて言語データベースに含めておけばよい。
【0020】
(1−2)同義語への変更処理
制御部1は、翻訳文の一部の表現について、記憶部6に記憶されている言語データベースを参照し、同義語でより短い表現に変更する。例えば、翻訳文が“make a decision”という表現である場合に、この表現を“decide”に変更するといった具合である。どのような表現を如何なる表現に変更可能かということに関しては、例えば変更前後の表現を予め対応付けて言語データベースに含めておけばよい。
【0021】
(1−3)修飾語の省略処理
制御部1は、翻訳文において形容詞などの修飾語が繰り返し現れるような場合に、この重複する修飾語を省略する。例えば、翻訳文中に「テクニカルサポート担当者」という表現が繰り返し現れる場合、この表現のうち「テクニカルサポート」を省略して「担当者」に変更するといった具合である。どのような場合にどのような表現を省略するかといったアルゴリズムは予め言語データベースの内容に含まれている。
【0022】
(1−4)主語の削除処理
制御部1は、翻訳文において不要な主語を削除する。例えば、翻訳文が日本語の場合には、文章の冒頭に主語を明示しておけば、その後の文章では必ずしも主語を示す必要はないことが多い。どのような場合に主語を省略し得るかといったアルゴリズムは予め言語データベースの内容に含まれている。
【0023】
(1−5)語尾の変更処理
制御部1は、翻訳文の語尾を簡潔なものに変更する。例えば、翻訳文の語尾が「検討する。」である場合に、この語尾を体言止めなどの「検討。」に変更する。どのような語尾を如何なる表現に変更するかといった情報は予め言語データベースの内容に含まれている。
【0024】
(2)翻訳後の語句の置換
次に翻訳後の語句の置換について説明する。
(2−1)一般略語への変更処理
制御部1は、翻訳文の語句の一部を、一般略語に変更する。例えば、翻訳文の語句が、“Department”である場合に、この語句を“Dept.”に変更する。また、翻訳文の語句が、“First fiscal half” や“Second fiscal half”である場合に、これらの語句を“1H”や“2H”に変更する。また、“AND”を“&”に変更する場合もそうである。どのような語句に如何なる一般略語があるかといった情報は予め言語データベースに含まれている。
【0025】
(2−2)特殊略語への変更処理
この方法によれば、上記のような一般略語が存在しないような語句を、ある組織内でのみ使用されるような特殊略語に置換することができる。制御部1は、翻訳文の語句の一部を、予め言語データベースで定義されている特殊略語に変更する。例えば、翻訳文の語句が、“Information Management”や“Data Storage”である場合に、これらの語句を“IM”や“DS”に変更する。どのような語句に対してどのような特殊略語があるかといった情報は予め言語データベースに含めておけばよい。
【0026】
(2−3)注釈による別記処理
制御部1は、翻訳文の語句の一部を記号に変更し、この記号の注釈を文書のレイアウト上、不具合が生じない場所などに別記する。例えば、“Information Management”や“Data Storage”である場合に、これらの語句を“IM”や“DS”という記号に変更し、例えば文書の余白部分に、“IM:Information Management”や“DS:Data Storage”という注釈を記述する。なお、どのような語句を記号に変更するかについては、翻訳文中の語句の出現頻度やその語句の長さなどに基づいたアルゴリズムを予め用意しておき、これを言語データベースに含めておけばよい。
【0027】
ここで、図7は、英語の翻訳文に対する再翻訳処理の内容を示すものである。この英語の翻訳文に対しては、上述した翻訳文書変更処理のうちの一般略語への変更処理と、特殊略語への変更処理とがなされている。具体的には、図7に示すように、“And”が“&”に変更され、“Data Storage”が“DS”に変更され、“Information Management”が“IM”に変更され、“First fiscal half”が“1H”に変更され、“Second fiscal half”が“2H”に変更されている。
【0028】
また、図8は、日本語の翻訳文に対する再翻訳処理の内容を示すものである。この日本語の翻訳文に対しては、翻訳方法変更処理のうちの主語の削除処理と、同義語への変更処理とがなされている。具体的には、図8に示すように、主語である「あなたが」が削除され、「明確にする」がさらに短い同義語である「確定する」に変更されている。
【0029】
再び図2に戻り、制御部1は、再翻訳処理を行った翻訳文の文字データを、原文のレイアウトに当て嵌める仮配置処理を行う(ステップS14)。そして、制御部1は、仮配置処理の結果でよいかどうかを判断する(ステップS15)。制御部1は、レイアウトが良好でないと判断した場合は(ステップS15;No)、再びステップS13の再翻訳処理に戻り、配置エラーがなくなるまで上述した処理を繰り返す(ステップS13〜S15)。
【0030】
ここで、図9は、図3の日本語の原文を英語に翻訳し、さらにステップS10の文字属性変更処理を経た結果に対してステップS13の再翻訳処理を行うことで、原文のレイアウトに翻訳文を収めることができた状態を示す図である。図示のように、図3に示した原文と同様に、絵柄領域Lである枠線内に翻訳文(文字領域W)が収まっている。また、図10は、図4の英語の原文を日本語に翻訳し、さらにステップS10の文字属性変更処理を経た結果に対してステップS13の再翻訳処理を行うことで、原文のレイアウトに翻訳文を収めることができた状態を示す図である。図示のように、図4に示した原文と同様に、絵柄領域Lである枠線内に翻訳文(文字領域W)が収まっている。これら図9,10のように、原文のレイアウトに当て嵌めた翻訳文がそのレイアウトに収まっていると判断した場合は(ステップS15;Yes)、制御部1は、仮配置を確定させる配置処理を行い(ステップS08)、印刷部5にて翻訳文を印刷させる(ステップS09)。
【0031】
以上、説明したように、本実施形態に係る翻訳装置によれば、翻訳結果に対してさらに再翻訳処理を行うことにより翻訳文を原文のレイアウトに整合させる。よって、例えば、表や図を含むプレゼンテーション資料など、文字領域が一定領域内に制限されているようなレイアウトの原文を翻訳した際にも、翻訳文をそのレイアウトに収め、良好な体裁の翻訳原稿を得ることができる。
【0032】
なお、翻訳装置11は、読取部や印刷部を備えた複合機に限らず、そのような複合機にホスト装置として接続されたコンピュータによって実現されるものであってもよい。この場合、翻訳装置11は、図1に示した読取部3及び印刷部5を備えないことになる。また、翻訳対象の原文は、読取部3によって読み取られた文書に限らず、例えばテキストデータであってもよい。この場合、図2のステップS01,S04の処理は不要となる。
【図面の簡単な説明】
【0033】
【図1】本実施形態に係る翻訳装置の構成を示すブロック図である。
【図2】翻訳装置による翻訳処理を説明するフローチャートである。
【図3】日本語からなる原文の原稿を示す図である。
【図4】英語からなる原文の原稿を示す図である。
【図5】日本語から英語に翻訳した文字データの仮配置時における配置エラーを生じた状態のレイアウトを示す図である。
【図6】英語から日本語に翻訳した文字データの仮配置時における配置エラーを生じた状態のレイアウトを示す図である。
【図7】英語の翻訳文に対する再翻訳処理を示す図である。
【図8】日本語の翻訳文に対する再翻訳処理を示す図である。
【図9】日本語から英語に翻訳した文字データの仮配置時における配置エラーの解消後のレイアウトを示す図である。
【図10】英語から日本語に翻訳した文字データの仮配置時における配置エラーの解消後のレイアウトを示す図である。
【符号の説明】
【0034】
1…制御部、2…操作部、3…読取部、4…表示部、5…印刷部、6…記憶部、11…翻訳装置、L…絵柄領域、W…文字領域。

【特許請求の範囲】
【請求項1】
異なる言語で同じ意味の語句同士を対応付けた翻訳辞書と、それぞれの言語において変更可能な表現内容に関する情報を含んだ言語データベースとを記憶した記憶手段と、
第1の言語で表現された原文のレイアウトを解析するレイアウト解析手段と、
前記翻訳辞書を用いて前記第1の言語で表現された原文を翻訳し、第2の言語で表現された翻訳文を得る翻訳手段と、
前記翻訳手段によって得られた翻訳文を、前記レイアウト解析手段によって得られたレイアウトに当て嵌める仮配置手段と、
前記仮配置手段によって前記レイアウトに当て嵌められた翻訳文が当該レイアウトに収まっているか否かを判断する判断手段と、
前記判断手段により前記翻訳文が前記レイアウトに収まっていないと判断された場合には、前記言語データベースに含まれている表現内容に関する情報を参照して、前記レイアウトに収まるように前記翻訳文の表現を変更する再翻訳手段と
を備える翻訳装置。
【請求項2】
前記再翻訳手段は、翻訳文の表現方法を変更することにより、前記翻訳文の表現を変更する請求項1記載の翻訳装置。
【請求項3】
前記再翻訳手段は、翻訳文の表現をより短い語句の表現に変更する処理、翻訳文における修飾語を省略する処理、翻訳文における主語を削除する処理、及び、翻訳文における文章の語尾を簡潔にする処理のうち、少なくとも何れかの処理を実行することで、前記翻訳文の表現を変更することを特徴とする請求項2に記載の翻訳装置。
【請求項4】
前記再翻訳手段は、前記翻訳手段によって得られた翻訳文の語句を別の語句に置換することにより、前記翻訳文の表現を変更する請求項1記載の翻訳装置。
【請求項5】
前記再翻訳手段は、翻訳文に含まれる語句を略語に変更する処理、又は、翻訳文に含まれる語句を記号に変更し、この記号の注釈を翻訳文中に別記する処理を実行することで、前記翻訳文の表現を変更することを特徴とする請求項4に記載の翻訳装置。
【請求項6】
コンピュータに、
第1の言語で表現された原文のレイアウトを解析するレイアウト解析機能と、
異なる言語で同じ意味の語句同士を対応付けた翻訳辞書を用いて、前記第1の言語で表現された原文を翻訳して第2の言語で表現された翻訳文を得る翻訳機能と、
前記翻訳機能によって得られた翻訳文を、前記レイアウト解析手段によって得られたレイアウトに当て嵌める仮配置機能と、
前記仮配置機能によって前記レイアウトに当て嵌められた翻訳文が当該レイアウトに収まっているか否かを判断する判断機能と、
前記判断機能により前記翻訳文が前記レイアウトに収まっていないと判断された場合には、それぞれの言語におおいて変更可能な表現内容に関する情報を含む言語データベースを参照して、前記レイアウトに収まるように前記翻訳文の表現を変更する再翻訳機能と
を実現させるためのプログラム。





【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate


【公開番号】特開2007−87056(P2007−87056A)
【公開日】平成19年4月5日(2007.4.5)
【国際特許分類】
【出願番号】特願2005−274313(P2005−274313)
【出願日】平成17年9月21日(2005.9.21)
【出願人】(000005496)富士ゼロックス株式会社 (21,908)
【Fターム(参考)】