説明

翻訳結果表示方法、翻訳結果表示システム、翻訳結果生成装置および翻訳結果表示プログラム

【課題】翻訳結果を原文の領域に対応づけて出力する場合に、原文の領域のサイズに応じて見やすい翻訳結果を表示できる翻訳結果表示方法を提供する。
【解決手段】フォント記憶手段81は、予め定められた単語ごとに複数種類のフォントを記憶する。文字領域抽出手段82は、画像から文字列が含まれる領域である文字領域を抽出する。翻訳文字列生成手段83は、文字領域内の文字列を翻訳した翻訳文字列を生成する。翻訳結果生成制御手段84は、翻訳文字列に含まれる単語に対応するフォントをフォント記憶手段81に記憶された複数種類のフォントの中から選択して翻訳結果画像を生成する。また、翻訳結果生成制御手段84は、文字領域に収まるサイズのフォントの中からより大きいサイズのフォントを選択して翻訳結果画像を生成し、文字領域が抽出された画像における当該文字領域に、生成した翻訳結果画像を表示する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、翻訳結果を生成し、その翻訳結果を表示する翻訳結果表示方法、翻訳結果表示システム、翻訳結果生成装置および翻訳結果表示プログラムに関する。
【背景技術】
【0002】
現実世界の対象物(例えば、広告看板やレストランのメニュー、雑誌など)に表示された語句をコンピュータにより翻訳し、翻訳結果を利用者に提示するシステムが各種知られている。図11は、原文から翻訳結果を出力した例を示す説明図である。例えば、カメラに映る図11(a)に示すような画像をOCR(Optical Character Reader)等によって認識し、認識した画像をもとに図11(b)に例示する翻訳結果を出力するアプリケーションが知られている(例えば、非特許文献1、非特許文献2参照)。
【0003】
また、特許文献1には、翻訳後のテキストを翻訳対象とする文字エリアの位置に重ねて表示する情報変換方法が記載されている。特許文献1に記載された情報変換方法では、翻訳前のテキストに代えて、そのテキストの位置に翻訳後のテキストを重ね合わせて表示する。また、特許文献1には、重ね合わせる翻訳後テキストの色や大きさを、翻訳前のテキストの色や大きさとすることが好ましい旨記載されている。
【0004】
特許文献2には、原文文字列と翻訳文文字列の両方を配置した画像を作成する文書画像処理装置が記載されている。特許文献2に記載された文書画像処理装置は、原文(文字列画像)のサイズと翻訳文文字列のサイズを、文字列画像の全体の長さ、翻訳文文字列の総文字数、文章領域のサイズ、文章領域に設定する行間割合等に基づいて決定する。そして、特許文献2に記載された文書画像処理装置は、原文文字列画像と翻訳文文字列画像の長さの比に応じて作成する各画像を補正する。
【0005】
特許文献3には、翻訳文のレイアウトを原文と同一にする翻訳方法が記載されている。特許文献3に記載された翻訳方法では、翻訳文を原文と同一のレイアウトで配置できない場合に翻訳文の中から省略対象とする語句を抽出する。そして、抽出した語句の省略語を使用して、単位領域に配置可能な翻訳文を生成する。また、特許文献3に記載された翻訳方法では、翻訳後の単語が枠内に収まらない場合、その単語を短く変換して枠内に出力する。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2006−146454号公報
【特許文献2】特開2009−53932号公報
【特許文献3】特開2007−34430号公報
【非特許文献】
【0007】
【非特許文献1】吉田一星、”翻訳ルーペって何?”、[online]、[平成23年2月3日検索]、インターネット〈URL:http://techblog.yahoo.co.jp/honyaku/〉
【非特許文献2】the Google Mobile Team、"Translate the real world with Google Goggles"、[online]、[平成23年2月3日検索]、インターネット〈URL:http://googlemobile.blogspot.com/2010/05/translate-real-world-with-google.html〉
【発明の概要】
【発明が解決しようとする課題】
【0008】
図11に示すように、原文と翻訳結果とが別々の画面で表示されると、翻訳結果が原文のどの部分を翻訳したものか利用者にわかりづらい。特に、レストランのメニューのようにレイアウトが複雑なものは、翻訳結果と原文の対応づけが困難である。
【0009】
一方、特許文献1〜特許文献3に記載された方法では、原文と翻訳結果とを同一の画面上に対応づけて表示する。図12は、翻訳結果を原文のレイアウトに合わせて表示した例を示す説明図である。図12に示すように、原文と翻訳結果とを同一の画面上に対応づけて表示することで、上記問題を解決することは可能である。
【0010】
しかし、特許文献1に記載された情報変換方法では、翻訳対象とする文字エリアに翻訳後テキストを単に重ねて表示するだけである。そのため、文字エリアの領域の大きさによっては、表示されるテキストの文字が変形してしまうなど、重ねて表示する翻訳結果がかえって見づらくなる恐れがある。
【0011】
また、特許文献2に記載された文書画像処理装置では、原文文字列画像から翻訳文文字列画像が作成された後、原文文字列画像との長さの比に応じて翻訳文文字列画像の大きさが縮小される。そのため、特許文献1に記載された情報変換方法と同様、原文文字列画像の長さによっては、縮小された画像の文字が変形してしまうなど、出力された翻訳結果が見づらくなる恐れがある。
【0012】
また、特許文献3に記載された翻訳方法のように、枠内に収まらない翻訳結果の単語を短く変換して表示する方法では、枠の大きさによって使用できる文字の数に限界があり、場合によっては、翻訳結果の意味が伝わらない恐れがある。
【0013】
そこで、本発明は、翻訳結果を原文の領域に対応づけて出力する場合に、原文の領域のサイズに応じて見やすい翻訳結果を表示できる翻訳結果表示方法、翻訳結果表示システム、翻訳結果生成装置および翻訳結果表示プログラムを提供することを目的とする。
【課題を解決するための手段】
【0014】
本発明による翻訳結果表示方法は、画像から文字列が含まれる領域である文字領域を抽出し、文字領域内の文字列を翻訳した翻訳文字列を生成し、予め定められた単語ごとに複数種類のフォントを記憶するフォント記憶手段に記憶されたその複数種類のフォントの中から、翻訳文字列に含まれる単語に対応するフォントを選択して翻訳結果画像を生成し、翻訳結果画像を生成する際に、文字領域に収まるサイズのフォントの中からより大きいサイズのフォントを選択して翻訳結果画像を生成し、文字領域が抽出された画像におけるその文字領域に、生成した翻訳結果画像を表示することを特徴とする。
【0015】
本発明による翻訳結果表示システムは、予め定められた単語ごとに複数種類のフォントを記憶するフォント記憶手段と、画像から文字列が含まれる領域である文字領域を抽出する文字領域抽出手段と、文字領域内の文字列を翻訳した翻訳文字列を生成する翻訳文字列生成手段と、翻訳文字列に含まれる単語に対応するフォントをフォント記憶手段に記憶された複数種類のフォントの中から選択して翻訳結果画像を生成する翻訳結果生成制御手段とを備え、翻訳結果生成制御手段が、文字領域に収まるサイズのフォントの中からより大きいサイズのフォントを選択して翻訳結果画像を生成し、文字領域が抽出された画像におけるその文字領域に、生成した翻訳結果画像を表示することを特徴とする。
【0016】
本発明による翻訳結果生成装置は、予め定められた単語ごとに複数種類のフォントを記憶するフォント記憶手段と、画像から文字列が含まれる領域である文字領域を抽出する文字領域抽出手段と、文字領域内の文字列を翻訳した翻訳文字列を生成する翻訳文字列生成手段と、翻訳文字列に含まれる単語に対応するフォントをフォント記憶手段に記憶された複数種類のフォントの中から選択して翻訳結果画像を生成する翻訳結果生成制御手段とを備え、翻訳結果生成制御手段が、文字領域に収まるサイズのフォントの中からより大きいサイズのフォントを選択して翻訳結果画像を生成することを特徴とする
【0017】
本発明による翻訳結果表示プログラムは、コンピュータに、画像から文字列が含まれる領域である文字領域を抽出する文字領域抽出処理、文字領域内の文字列を翻訳した翻訳文字列を生成する翻訳文字列生成処理、および、予め定められた単語ごとに複数種類のフォントを記憶するフォント記憶手段に記憶されたその複数種類のフォントの中から、翻訳文字列に含まれる単語に対応するフォントを選択して翻訳結果画像を生成する翻訳結果生成制御処理を実行させ、翻訳結果生成制御処理で、文字領域に収まるサイズのフォントの中からより大きいサイズのフォントを選択して翻訳結果画像を生成させ、文字領域が抽出された画像におけるその文字領域に、生成した翻訳結果画像を表示させることを特徴とする。
【発明の効果】
【0018】
本発明によれば、翻訳結果を原文の領域に対応づけて出力する場合に、原文の領域のサイズに応じて見やすい翻訳結果を表示できる。
【図面の簡単な説明】
【0019】
【図1】本発明による翻訳結果表示システムの一実施形態を示すブロック図である。
【図2】翻訳用データベース記憶部が記憶する情報の例を示す説明図である。
【図3】フォント選択用データベース記憶部が記憶する情報の例を示す説明図である。
【図4】翻訳結果表示システムの動作例を示すフローチャートである。
【図5】翻訳結果表示システムの動作例を示すフローチャートである。
【図6】翻訳対象範囲の例を示す説明図である。
【図7】複数の入力領域を抽出する場合の例を示す説明図である。
【図8】本発明による翻訳結果表示システムの変形例を示すブロック図である。
【図9】本発明による翻訳結果表示システムの最小構成の例を示すブロック図である。
【図10】本発明による翻訳結果生成装置の最小構成の例を示すブロック図である。
【図11】原文から翻訳結果を出力した例を示す説明図である。
【図12】翻訳結果を原文のレイアウトに合わせて表示した例を示す説明図である。
【発明を実施するための形態】
【0020】
以下、本発明の実施形態を図面を参照して説明する。
【0021】
図1は、本発明による翻訳結果表示システムの一実施形態を示すブロック図である。本実施形態における翻訳結果表示システム1は、入力部10と、表示部20と、対象領域計測部30と、翻訳部40と、翻訳結果生成部50とを備えている。
【0022】
入力部10は、翻訳対象とする現実世界の対象物(例えば、広告看板やレストランのメニュー、雑誌など)を画像として保存する。入力部10は、例えば、カメラなどにより実現される。
【0023】
具体的には、入力部10は、対象物画像記憶媒体11と、入力制御部12とを含む。対象物画像記憶媒体11は、現実世界の対象物を画像として記憶する。以下、翻訳の対象として入力された画像のことを、入力画像と記す。入力制御部12は、入力部10に対象物の画像が入力されると、その画像を対象物画像記憶媒体11に記憶させる。また、入力制御部12が画像を撮影し、その画像を対象物画像記憶媒体11に記憶させてもよい。
【0024】
表示部20は、対象物画像記憶媒体11に保存された画像や、後述する翻訳結果生成部50が生成した翻訳結果画像を利用者に表示する。表示部20は、例えば、ディスプレイ装置により実現される。また、表示部20は、表示している画像の中から指定された任意の領域を対象領域計測部30に通知する機能を備えていてもよい。この場合、表示部20は、例えば、タッチパネルにより実現される。
【0025】
対象領域計測部30は、対象領域記憶媒体31と、対象領域計測制御部32とを含む。
【0026】
対象領域計測制御部32は、入力画像の中から翻訳の対象とする範囲(以下、翻訳対象範囲と記す。)を決定する。対象領域計測制御部32は、入力画像全体を翻訳対象範囲と決定してもよく、利用者により指定された範囲を翻訳対象範囲と決定してもよい。対象領域計測制御部32は、例えば、表示部20を介して利用者が指定した範囲を翻訳対象範囲と決定してもよい。
【0027】
さらに、対象領域計測制御部32は、翻訳対象範囲の中から「文字」が表記された領域(以下、文字領域と記す。)、および、その文字領域中の文字列を抽出する。なお、抽出する文字列は、1文字であってもよく、2文字以上であってもよい。対象領域計測制御部32は、例えば、OCR技術を用いて文字領域および文字列を抽出する。このとき、対象領域計測制御部32は、抽出した文字領域のサイズおよび入力画像中の位置を示す情報(以下、位置情報と記す。)を計測する。また、対象領域計測制御部32は、一つの文字領域だけでなく、複数の文字領域を抽出してもよい。なお、ここでの「文字」とは、翻訳対象とする語の他、各語を区切る記号なども含まれる。
【0028】
また、対象領域計測制御部32は、抽出した文字領域における文字列部分の色(以下、文字色と記す。)および文字列以外の部分の色(以下、背景色と記す。)の情報をそれぞれ抽出する。
【0029】
対象領域記憶媒体31は、対象領域計測制御部32が抽出した文字領域およびその文字領域の文字列を記憶する。また、対象領域記憶媒体31は、その文字領域における文字色および背景色を合わせて記憶する。
【0030】
翻訳部40は、対象とする文字列を翻訳する翻訳システムである。翻訳用データベース記憶部41と、翻訳制御部42とを含む。
【0031】
翻訳用データベース記憶部41は、原文と翻訳文とをそれぞれ対応づけた情報を記憶する。ここで、原文および翻訳文は、1つの語のみであってもよく、複数の語を組み合わせた句であってもよい。また、各語は1文字であってもよく、2文字以上であってもよい。なお、原文と翻訳文とをそれぞれ対応づけた情報は、例えば、ユーザ等により、予め翻訳用データベース記憶部41に設定される。
【0032】
また、翻訳用データベース記憶部41は、上述する翻訳文の内容を示す語句であり、その翻訳文よりも文字数が少ない語句(以下、略語と記す。)を原文と対応付けて記憶していてもよい。図2は、翻訳用データベース記憶部41が記憶する情報の例を示す説明図である。図2に示す例では、原文「Sandwiches」に、翻訳文である「サンドイッチ」と、その略語である「サンド」とを対応付けていることを示す。
【0033】
翻訳制御部42は、対象領域記憶媒体31に記録された文字列の内容を翻訳した翻訳文字列を生成する。なお、翻訳の方法は特に限定されず、統計ベースによる翻訳や、ルールベースによる翻訳など、現在知られている方法のいずれを用いてもよい。また、翻訳制御部42は、翻訳用データベース記憶部41に記憶された情報を利用して翻訳を行ってもよい。
【0034】
翻訳結果生成部50は、フォント選択用データベース記憶部51と、翻訳結果生成制御部52とを含む。フォント選択用データベース記憶部51は、予め定められた単語ごとに複数種類のフォントを記憶する。また、フォント選択用データベース記憶部51は、単語ごとの複数種類のフォントだけでなく、その単語の略語ごとに複数種類のフォントを記憶していてもよい。
【0035】
具体的には、フォント選択用データベース記憶部51は、翻訳文に使われる可能性のある単語および略語ごとに、その単語および略語を表示する領域の縦サイズおよび横サイズの情報を記憶する。ここで、フォントの種類やサイズによって、そのフォントを表示する領域の縦サイズおよび横サイズは異なるため、フォント選択用データベース記憶部51は、1つの単語および略語について、複数のサイズおよび複数の種類のフォント情報を記憶する。
【0036】
図3は、フォント選択用データベース記憶部51が記憶する情報の例を示す説明図である。図3に示す例では、翻訳文字列中の文字列である「サンドイッチ」およびその略語を示す文字列である「サンド」について、それぞれ2種類のフォント情報を記憶していることを示す。具体的には、文字列「サンドイッチ」に対して、2種類のフォント(MSゴシック16pt、12pt)と、そのフォントのサイズ(縦6,横12、縦4.5,横8.4)とをそれぞれ対応づけていることを示す。
【0037】
翻訳結果生成制御部52は、翻訳文字列に含まれる単語に対応するフォントをフォント選択用データベース記憶部51に記憶されたフォントの中から選択して翻訳結果画像を生成する。その際、翻訳結果生成制御部52は、文字領域に収まるサイズのフォントの中からより大きいサイズのフォントを選択して翻訳結果画像を生成する。さらに、翻訳結果生成制御部52は、その翻訳結果画像を対象とする文字領域に出力する。
【0038】
対象領域計測制御部32と、翻訳制御部42と、翻訳結果生成制御部52とは、プログラム(翻訳結果表示プログラム)に従って動作するコンピュータのCPUによって実現される。例えば、プログラムは、翻訳結果表示システムを構成する装置の記憶部(図示せず)に記憶され、CPUは、そのプログラムを読み込み、プログラムに従って、対象領域計測制御部32、翻訳制御部42および翻訳結果生成制御部52として動作してもよい。また、対象領域計測制御部32と、翻訳制御部42と、翻訳結果生成制御部52は、それぞれが専用のハードウェアで実現されていてもよい。
【0039】
また、対象物画像記憶媒体11、対象領域記憶媒体31、翻訳用データベース記憶部41およびフォント選択用データベース記憶部51は、例えば、磁気ディスク等により実現される。
【0040】
次に、動作について説明する。図4および図5は、本実施形態における翻訳結果表示システムの動作例を示すフローチャートである。なお、入力部10は、例えば、カメラにより実現され、表示部20は、例えば、ディスプレイ装置により実現される。また、対象領域計測制御部32は、文字領域として、縦サイズおよび横サイズで特定される矩形領域を抽出するものとする。
【0041】
本システムの利用者により翻訳対象とする現実世界の対象物が決定されると、入力部10の入力制御部12は、その対象物を入力画像として対象物画像記憶媒体11に記憶させる(図4におけるステップS1)。そして、表示部20は、対象物画像記憶媒体11に記憶された入力画像を利用者に対して表示する(ステップS2)。
【0042】
次に、対象領域計測部30の対象領域計測制御部32は、この入力画像の中から翻訳対象範囲を決定する(ステップS3)。対象領域計測制御部32は、入力画像全体を翻訳対象範囲に決定してもよく、利用者によって指定された入力画像中の任意の領域を翻訳対象範囲に決定してもよい。図6は、翻訳対象範囲の例を示す説明図である。図6に示す例では、入力画像のうち、破線で示す部分の領域が利用者によって指定されたことを示す。
【0043】
また、対象領域計測部30の対象領域計測制御部32は、例えば、OCR技術などを使い、決定した翻訳対象範囲から文字領域を抽出する(ステップS4)。その際、対象領域計測制御部32は、抽出した文字領域の縦サイズ、横サイズおよび入力画像中の位置情報を計測する(ステップS5)。さらに、対象領域計測制御部32は、抽出した文字領域における文字列内容、文字列部分の色(文字色)および文字列以外の部分の色(背景色)の情報をそれぞれ抽出する(ステップS6)。
【0044】
そして、対象領域計測制御部32は、ステップS5で計測したサイズおよび位置情報と、ステップS6で抽出した文字列内容、文字色および背景色を対象領域記憶媒体31に記憶させる(ステップS7)。なお、翻訳対象範囲内に文字領域が複数存在する場合、対象領域計測制御部32は、文字領域ごとに、縦サイズ、横サイズ、入力画像における位置情報、文字列内容、文字色および背景色を示す情報を対象領域記憶媒体31に記憶させる。
【0045】
図7は、複数の入力領域を抽出する場合の例を示す説明図である。図7に示す例では、翻訳対象範囲に6つの文字領域が含まれている。また、図7では、領域1で表わされる文字領域の情報の例を示している。図7に例示する領域1の文字領域は、X座標が2〜12の範囲(すなわち、横サイズ=10)、Y座標が2〜8の範囲(すなわち、縦サイズ=6)で表わされる領域であり、領域1の文字色が黒、背景色が白、文字列内容が「Sandwiches」であることを示す。
【0046】
翻訳部40の翻訳制御部42は、対象領域記憶媒体31に記録された文字列内容を翻訳し、翻訳文字列を生成する(ステップS8)。翻訳処理を行う際、翻訳制御部42は、現在知られている方法のいずれを用いてもよい。また、翻訳制御部42は、翻訳用データベース記憶部41に記憶された情報をもとに翻訳処理を行ってもよい。
【0047】
翻訳結果生成部50の翻訳結果生成制御部52は、翻訳文字列のフォント(フォント種類およびフォントサイズ)を決定する。その際、翻訳結果生成制御部52は、翻訳文が利用者に見やすくなるよう、なるべく大きなフォントを選択するようにする。この処理は、以下のステップS9〜S16の手順で行われる。
【0048】
翻訳結果生成制御部52は、フォント選択用データベース記憶部51に記憶された情報を参照し、対象領域記憶媒体31に記憶された文字領域の縦サイズを基準に、なるべくフォントサイズの大きな翻訳文字列のフォントを選択する(図5におけるステップS9)。具体的には、翻訳結果生成制御部52は、矩形領域における一の辺(ここでは、縦サイズ)に収まる最も大きいサイズのフォントを一つまたは複数選択する。
【0049】
次に、翻訳結果生成制御部52は、ステップS9で選択したフォントを使った場合に、翻訳文字列の長さが対象領域記憶媒体31に記憶された文字領域の横サイズに収まる長さか否かを判定する(ステップS10)。具体的には、翻訳結果生成制御部52は、翻訳文字列の横サイズが文字領域の横サイズよりも小さいか否かを判定する。翻訳文字列の横サイズが文字領域の横サイズよりも小さい場合、翻訳結果生成制御部52は、翻訳文字列の長さが文字領域に収まる長さと判定できる。
【0050】
翻訳文字列の長さが文字領域の横サイズに収まる長さであった場合(ステップS10における「収まる」)、翻訳結果生成制御部52は、ステップS9で選択したフォント(フォント種類およびフォントサイズ)を翻訳結果用のフォントと決定し、翻訳結果画像を生成する(ステップS11)。
【0051】
具体的には、翻訳結果生成制御部52は、対象領域記憶媒体31に記録されている文字領域の位置情報をもとに、入力画像の領域に対してステップS11において決定したフォントの翻訳語で翻訳文字列を描画する。このとき、翻訳結果生成制御部52は、対象領域記憶媒体31に記録されている文字色を使って翻訳文字列を描画し、文字領域内の背景を対象領域記憶媒体31に記録されている背景色で描画する。
【0052】
一方、ステップS10において、翻訳文字列の長さが文字領域の横サイズに収まる長さでない場合(ステップS10における「収まらない」)、翻訳結果生成制御部52は、翻訳文字列の横サイズを短くするため、翻訳文字列中の語句に略語に変換できる語句があるか否かを、翻訳用データベース記憶部41を参照して確認する(ステップS12)。
【0053】
略語に変換できる語句が翻訳文字列中にあって、翻訳文字列の横サイズを短くできる場合(ステップS12における「ある」)、翻訳結果生成制御部52は、その略語を選択するとともに、その略語を使った場合の翻訳文字列の横サイズが対象領域記憶媒体31に記録されている文字領域の横サイズに収まる長さか否かを判定する(ステップS13)。
【0054】
略語を使った場合の翻訳文字列の長さが文字領域の横サイズに収まる長さであった場合(ステップS13における「収まる」)、翻訳結果生成制御部52は、ステップS13で選択したフォント(フォント種類およびフォントサイズ)を翻訳結果用のフォントと決定し、その略語のフォントを用いて翻訳結果画像を生成する(ステップS11)。
【0055】
このように、通常の文字列では翻訳結果画像の文字が小さくなってしまう場合であっても、通常の翻訳後よりも文字数の少ない略語を選択することで、より大きなフォントを選択することが可能になる。よって、原文の領域のサイズに応じて、より見やすい翻訳結果を表示できる。
【0056】
一方、略語を使った場合の翻訳文字列の長さが文字領域の横サイズに収まる長さでない場合(ステップS13における「収まらない」)、また、略語に変換できる語句が翻訳文字列中にない場合(ステップS12における「ない」)、ステップS9およびステップS13で選択したフォントでは文字領域に収まらないことが分かる。この場合、翻訳結果生成制御部52は、別のフォント(フォント種類およびフォントサイズ)に変更する(ステップS14)。
【0057】
具体的には、翻訳結果生成制御部52は、縦サイズを維持したまま、横サイズが小さいフォントを順次選択する。横サイズに収まるフォントが存在しない場合、翻訳結果生成制御部52は、縦サイズを小さくした後、横サイズが小さいフォントを再度選択する処理を繰り返す。
【0058】
以下、この処理の一例を説明する。ここでは、縦サイズが6、横サイズが10の文字領域に翻訳結果を収めるものとする。今、フォント選択用データベース記憶部51に、(1)縦サイズ6,横サイズ14、(2)縦サイズ6,横サイズ12、(3)縦サイズ5,横サイズ13、(4)縦サイズ5,横サイズ11、(5)縦サイズ4,横サイズ12、(6)縦サイズ4,横サイズ10のフォントが記憶されているとする。
【0059】
まず、翻訳結果生成制御部52は、縦方向に収まる最も大きいサイズのフォントとして、縦サイズが6のフォントを選択する。そして、翻訳結果生成制御部52は、選択したフォントの中から、横方向に収まる最も大きいサイズのフォントとして、横サイズが14である(1)のフォントを選択する。ただし、(1)は、横サイズに収まらないフォントである。そこで、翻訳結果生成制御部52は、次に(2)のフォントを選択する。しかし、(2)のフォントでも、横サイズに収まらないため、翻訳結果生成制御部52は、次に、(3)、(4)、(5)、(6)とフォントを順次選択する。そして、翻訳結果生成制御部52は、文字領域に収まるフォントとして、(6)のフォントを選択する。
【0060】
なお、上記説明では、横書きの文字列から横書きの翻訳文字列を生成する場合において、縦サイズを基準に横サイズを順次変更する方法について例示した。ただし、翻訳結果生成制御部52がフォントを選択する方法は、上記方法に限定されない。例えば、縦書きの文字列から縦書きの翻訳文字列を生成する場合、横サイズを基準に縦サイズを順次変更するようにしてもよい。また、略語のフォントを選択する方法も、単語のフォントを選択する方法と同様である。
【0061】
このように、翻訳結果生成制御部52は、ステップS9における処理と同様、フォント選択用データベース記憶部51に記憶された情報を参照し、対象領域記憶媒体31に記憶された文字領域の縦サイズを基準に、なるべくフォントサイズの大きな翻訳文字列のフォントを選択する。
【0062】
次に、翻訳結果生成制御部52は、ステップS14で選択したフォントを使った場合に、翻訳文字列の長さが対象領域記憶媒体31に記憶された文字領域の横サイズに収まる長さか否かを判定する(ステップS15)。翻訳文字列の長さが文字領域の横サイズに収まらない長さであった場合(ステップS15における「収まらない」)、翻訳結果生成制御部52は、ステップS14以降の処理を繰り返す。すなわち、翻訳結果生成制御部52は、翻訳文字列の長さが文字領域の横サイズに収まる長さになるまで、ステップS14とステップS15の処理を繰り返す。
【0063】
一方、翻訳文字列の長さが文字領域の横サイズに収まる長さであった場合(ステップS15における「収まる」)、翻訳結果生成制御部52は、選択したフォント(フォント種類およびフォントサイズ)を翻訳結果用のフォントと決定し、翻訳結果画像を生成する(ステップS16)。なお、翻訳対象範囲内に文字領域が複数存在する場合、ステップS8〜ステップS16の処理が領域分繰り返される。
【0064】
翻訳結果画像が生成されると、表示部20は、翻訳結果画像を利用者に対して表示する(ステップS17)。
【0065】
以上のように、本実施形態によれば、対象領域計測制御部32が入力画像の翻訳対象範囲から文字領域を抽出し、翻訳制御部42が文字領域内の文字列を翻訳した翻訳文字列を生成する。そして、翻訳結果生成制御部52が、フォント選択用データベース記憶部51に記憶された複数種類のフォントの中から、翻訳文字列に含まれる単語に対応するフォントを選択して翻訳結果画像を生成する。その際、翻訳結果生成制御部52は、文字領域に収まるサイズのフォントの中からより大きいサイズのフォントを選択して翻訳結果画像を生成する。そして、翻訳結果生成制御部52は、入力画像の対応する文字領域の位置に、生成した翻訳結果画像を表示する。以上の処理を行うことで、翻訳結果を原文の領域に対応づけて出力する場合に、原文の領域のサイズに応じて見やすい翻訳結果を表示できる。
【0066】
すなわち、本発明では、翻訳対象とした原文と同じ位置に翻訳結果を上書きして表示するため、利用者にとって翻訳結果の内容が分かりやすい。具体的には、原文の領域内に翻訳結果を表示するため、翻訳結果が原文の領域からはみ出ることがない。そのため、原文の文字列以外の部分が見えなくなることを抑制でき、さらに、文字列以外の部分も含め、対象物の全体のレイアウトを損なうことなく、翻訳結果を利用者に提示できる。
【0067】
次に、本実施形態の変形例について説明する。図8は、本変形例における翻訳結果表示システムの例を示すブロック図である。本変形例における翻訳結果表示システムは、翻訳結果生成装置100と、翻訳結果表示装置200とを備えている。翻訳結果生成装置100と、翻訳結果表示装置200とは、通信ネットワーク99を介して相互に接続される。
【0068】
翻訳結果表示装置200は、入力部10と、表示部20とを備えている。また、入力部10は、対象物画像記憶媒体11と、入力制御部12とを含む。対象物画像記憶媒体11および入力制御部12の内容は、上記実施形態と同様である。ただし、入力制御部12が、入力部10に対象物の画像が入力されたときに、その画像を翻訳結果生成装置100に送信する点において上記実施形態と異なる。
【0069】
表示部20は、翻訳結果生成装置100から受け取った翻訳結果画像を利用者に表示する。なお、表示の方法は、上記実施形態と同様である。
【0070】
翻訳結果生成装置100は、対象領域計測部30と、翻訳部40と、翻訳結果生成部50とを備えている。対象領域計測部30は、対象領域記憶媒体31と、対象領域計測制御部32とを含む。対象領域計測制御部32は、翻訳結果表示装置200から受け取った画像に対して、翻訳対象範囲の決定および文字領域の抽出を行う。それ以外の対象領域計測部30の内容については、上記実施形態と同様である。
【0071】
翻訳部40は、翻訳用データベース記憶部41と、翻訳制御部42とを含む。なお、翻訳部40の内容については、上記実施形態と同様である。
【0072】
翻訳結果生成部50は、フォント選択用データベース記憶部51と、翻訳結果生成制御部52とを含む。翻訳結果生成制御部52は、生成した翻訳結果画像を翻訳結果表示装置200に送信する。なお、翻訳結果生成制御部52は、翻訳結果表示装置200から受け取った画像の文字領域に翻訳結果画像を重ねた画像を翻訳結果表示装置200に送信してもよい。
【0073】
このような構成であっても、翻訳結果を原文の領域に対応づけて出力する場合に、原文の領域のサイズに応じて見やすい翻訳結果を表示できる。
【0074】
次に、本発明の最小構成について説明する。図9は、本発明による翻訳結果表示システムの最小構成の例を示すブロック図である。本発明による翻訳結果表示システムは、予め定められた単語ごとに複数種類のフォント(例えば、図3に例示するフォント)を記憶するフォント記憶手段81(例えば、フォント選択用データベース記憶部51)と、画像(例えば、入力画像の翻訳対象範囲)から文字列が含まれる領域である文字領域を抽出する文字領域抽出手段82(例えば、対象領域計測制御部32)と、文字領域内の文字列を翻訳した翻訳文字列を生成する翻訳文字列生成手段83(例えば、翻訳制御部42)と、翻訳文字列に含まれる単語に対応するフォントをフォント記憶手段81に記憶された複数種類のフォントの中から選択して翻訳結果画像を生成する翻訳結果生成制御手段84(例えば、翻訳結果生成制御部52)とを備えている。
【0075】
翻訳結果生成制御手段84は、文字領域に収まるサイズのフォントの中からより大きいサイズのフォントを選択して翻訳結果画像を生成し、文字領域が抽出された画像におけるその文字領域に、生成した翻訳結果画像を表示する。
【0076】
そのような構成により、翻訳結果を原文の領域に対応づけて出力する場合に、原文の領域のサイズに応じて見やすい翻訳結果を表示できる。
【0077】
また、フォント記憶手段81は、予め定められた単語の内容を示しその単語よりも文字数が少ない略語ごとに複数種類のフォントを記憶してもよい。そして、翻訳結果生成制御手段84は、翻訳文字列に含まれる単語に対応するフォントが文字領域に収まらない場合に、その単語の略語を表示する複数種類のフォントのうち文字領域に収まるサイズのフォントをフォント記憶手段から選択して翻訳結果画像を生成してもよい。このようにすることで、単語のフォントが長くなってしまう場合であっても、略語に置き換えることで文字数が短くなるため、より大きいサイズのフォントを使用できるようになる。そのため、より見やすい翻訳結果を表示できるようになる。
【0078】
また、文字領域抽出手段82が、文字領域における文字列の色である文字色およびその文字列以外の部分の色である背景色を抽出し、翻訳結果生成制御手段84が、文字色で翻訳文字列を描画し、背景を背景色で描画した翻訳結果画像を生成してもよい。このようにすることで、翻訳結果をより違和感なく表示することが可能になる。
【0079】
また、文字領域抽出手段82が、文字領域を矩形領域として抽出し、翻訳結果生成制御手段84が、矩形領域における一の辺(例えば、縦方向)に収まる最も大きいサイズのフォントを一つまたは複数選択し、選択したフォントの中から、矩形領域における他の辺(例えば、横方向)に収まる最も大きいサイズのフォントを選択してもよい。
【0080】
図10は、本発明による翻訳結果生成装置の最小構成の例を示すブロック図である。本発明による翻訳結果生成装置(例えば、翻訳結果生成装置100)は、フォント記憶手段81(例えば、フォント選択用データベース記憶部51)と、文字領域抽出手段82(例えば、対象領域計測制御部32)と、翻訳文字列生成手段83(例えば、翻訳制御部42)と、翻訳結果生成制御手段85(例えば、翻訳結果生成制御部52)とを備えている。
【0081】
フォント記憶手段81、文字領域抽出手段82および翻訳文字列生成手段83のどう際については、図9に例示する内容と同様である。
【0082】
翻訳結果生成制御手段85は、翻訳文字列に含まれる単語に対応するフォントをフォント記憶手段81に記憶された複数種類のフォントの中から選択して翻訳結果画像を生成する。その際、翻訳結果生成制御手段85は、文字領域に収まるサイズのフォントの中からより大きいサイズのフォントを選択して翻訳結果画像を生成する。
【0083】
このような構成であっても、例えば、翻訳結果表示装置200が翻訳結果を原文の領域に対応づけて出力する場合に、原文の領域のサイズに応じて見やすい翻訳結果を表示できる。
【産業上の利用可能性】
【0084】
本発明は、翻訳結果を表示する翻訳結果表示システムに好適に適用される。
【符号の説明】
【0085】
1 翻訳結果表示システム
10 入力部
11 対象物画像記憶媒体
12 入力制御部
20 表示部
30 対象領域計測部
31 対象領域記憶媒体
32 対象領域計測制御部
40 翻訳部
41 翻訳用データベース記憶部
42 翻訳制御部
50 翻訳結果生成部
51 フォント選択用データベース記憶部
52 翻訳結果生成制御部
99 通信ネットワーク
100 翻訳結果生成装置
200 翻訳結果表示装置

【特許請求の範囲】
【請求項1】
画像から文字列が含まれる領域である文字領域を抽出し、
前記文字領域内の文字列を翻訳した翻訳文字列を生成し、
予め定められた単語ごとに複数種類のフォントを記憶するフォント記憶手段に記憶された当該複数種類のフォントの中から、前記翻訳文字列に含まれる単語に対応するフォントを選択して翻訳結果画像を生成し、
翻訳結果画像を生成する際に、前記文字領域に収まるサイズのフォントの中からより大きいサイズのフォントを選択して翻訳結果画像を生成し、
前記文字領域が抽出された画像における当該文字領域に、生成した翻訳結果画像を表示する
ことを特徴とする翻訳結果表示方法。
【請求項2】
翻訳結果画像を生成する際、翻訳文字列に含まれる単語に対応するフォントが文字領域に収まらない場合に、予め定められた単語の内容を示し当該単語よりも文字数が少ない略語ごとに複数種類のフォントを記憶するフォント記憶手段から、前記翻訳文字列に含まれる単語の略語を表示する複数種類のフォントのうち前記文字領域に収まるサイズのフォントを選択して翻訳結果画像を生成する
請求項1記載の翻訳結果表示方法。
【請求項3】
文字領域における文字列の色である文字色および当該文字列以外の文字領域部分の色である背景色を抽出し、
前記文字色で翻訳文字列を描画し、背景を前記背景色で描画した翻訳結果画像を生成する
請求項1または請求項2記載の翻訳結果表示方法。
【請求項4】
文字領域を矩形領域として抽出し、
翻訳結果画像を生成する際、前記矩形領域における一の辺に収まる最も大きいサイズのフォントを一つまたは複数選択し、選択したフォントの中から、矩形領域における他の辺に収まる最も大きいサイズのフォントを選択する
請求項1から請求項3のうちのいずれか1項に記載の翻訳結果表示方法。
【請求項5】
予め定められた単語ごとに複数種類のフォントを記憶するフォント記憶手段と、
画像から文字列が含まれる領域である文字領域を抽出する文字領域抽出手段と、
前記文字領域内の文字列を翻訳した翻訳文字列を生成する翻訳文字列生成手段と、
前記翻訳文字列に含まれる単語に対応するフォントを前記フォント記憶手段に記憶された複数種類のフォントの中から選択して翻訳結果画像を生成する翻訳結果生成制御手段とを備え、
前記翻訳結果生成制御手段は、前記文字領域に収まるサイズのフォントの中からより大きいサイズのフォントを選択して翻訳結果画像を生成し、前記文字領域が抽出された画像における当該文字領域に、生成した翻訳結果画像を表示する
ことを特徴とする翻訳結果表示システム。
【請求項6】
フォント記憶手段は、予め定められた単語の内容を示し当該単語よりも文字数が少ない略語ごとに複数種類のフォントを記憶し、
翻訳結果生成制御手段は、翻訳文字列に含まれる単語に対応するフォントが文字領域に収まらない場合に、当該単語の略語を表示する複数種類のフォントのうち前記文字領域に収まるサイズのフォントを前記フォント記憶手段から選択して翻訳結果画像を生成する
請求項5記載の翻訳結果表示システム。
【請求項7】
予め定められた単語ごとに複数種類のフォントを記憶するフォント記憶手段と、
画像から文字列が含まれる領域である文字領域を抽出する文字領域抽出手段と、
前記文字領域内の文字列を翻訳した翻訳文字列を生成する翻訳文字列生成手段と、
前記翻訳文字列に含まれる単語に対応するフォントを前記フォント記憶手段に記憶された複数種類のフォントの中から選択して翻訳結果画像を生成する翻訳結果生成制御手段とを備え、
前記翻訳結果生成制御手段は、前記文字領域に収まるサイズのフォントの中からより大きいサイズのフォントを選択して翻訳結果画像を生成する
ことを特徴とする翻訳結果生成装置。
【請求項8】
フォント記憶手段は、予め定められた単語の内容を示し当該単語よりも文字数が少ない略語ごとに複数種類のフォントを記憶し、
翻訳結果生成制御手段は、翻訳文字列に含まれる単語に対応するフォントが文字領域に収まらない場合に、当該単語の略語を表示する複数種類のフォントのうち前記文字領域に収まるサイズのフォントを前記フォント記憶手段から選択して翻訳結果画像を生成する
請求項7記載の翻訳結果生成装置。
【請求項9】
コンピュータに、
画像から文字列が含まれる領域である文字領域を抽出する文字領域抽出処理、
前記文字領域内の文字列を翻訳した翻訳文字列を生成する翻訳文字列生成処理、および、
予め定められた単語ごとに複数種類のフォントを記憶するフォント記憶手段に記憶された当該複数種類のフォントの中から、前記翻訳文字列に含まれる単語に対応するフォントを選択して翻訳結果画像を生成する翻訳結果生成制御処理を実行させ、
前記翻訳結果生成制御処理で、前記文字領域に収まるサイズのフォントの中からより大きいサイズのフォントを選択して翻訳結果画像を生成させ、前記文字領域が抽出された画像における当該文字領域に、生成した翻訳結果画像を表示させる
ための翻訳結果表示プログラム。
【請求項10】
コンピュータに、
翻訳結果生成制御処理で、翻訳文字列に含まれる単語に対応するフォントが文字領域に収まらない場合に、予め定められた単語の内容を示し当該単語よりも文字数が少ない略語ごとに複数種類のフォントを記憶するフォント記憶手段から、前記翻訳文字列に含まれる単語の略語を表示する複数種類のフォントのうち前記文字領域に収まるサイズのフォントを選択して翻訳結果画像を生成させる
請求項9記載の翻訳結果表示プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate


【公開番号】特開2012−173785(P2012−173785A)
【公開日】平成24年9月10日(2012.9.10)
【国際特許分類】
【出願番号】特願2011−32212(P2011−32212)
【出願日】平成23年2月17日(2011.2.17)
【出願人】(000004237)日本電気株式会社 (19,353)
【Fターム(参考)】