説明

表示画像キャプチャ翻訳装置、表示画像キャプチャ翻訳方法、及びプログラム

【課題】翻訳対象の文書画像が他の画像で隠された場合でも、翻訳表示内容が変化せず、より正確な情報を表示することが可能になるようにする。
【解決手段】表示内容取得部21が、表示内容記憶部11から現在ディスプレイ31の画面に表示されるウィンドウ内の画像データをすべてキャプチャする。キャプチャした画像は記憶部25に一旦記憶するとともに、比較部26に送る。比較部26は、記憶部25から前回キャプチャした画像を読み出し、今回キャプチャした画像のそれぞれと比較し、前回キャプチャした画像と一致する画像であるかを確認する。前回のキャプチャ画像と一致する場合は、記憶部25から前回の訳ふり内容を読み出して訳ふり文字配置部24に送る。表示内容記憶部11に訳ふり文字のデータを送り、ディスプレイ31に表示する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、翻訳対象である文書画像の表示されている文字を翻訳する表示画像キャプチャ翻訳装置、表示画像キャプチャ翻訳方法、及びプログラムに関する。
【背景技術】
【0002】
国際学会や国際会議などにおけるプレゼンテーションでは、液晶などの大型ディスプレイやプロジェクタなどの投影機で資料を表示させて説明するのが一般的である。特にプレゼンテーション資料は、そのデータをメモリやHDDなどの記憶装置に複数のファイルとして記憶させ、説明するときは、パソコンなどでそのファイルを記憶装置から順次呼び出して表示させる。説明者が外国人であり、母国語で説明する場合は、通訳を介して翻訳される。しかし、表示されている資料は、外国語のままの場合が多く、聴講者の理解が十分とは言い難かった。
【0003】
そこで、特許文献1、2には、表示されているプレゼンテーションの資料の文字部分を抽出し、翻訳して翻訳文字を表示することが記載されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開平3−163591号公報
【特許文献2】特開2006−127518号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
プレゼンテーションにおいては、資料データの複数のファイルを同時に開いて説明することが多い。この場合は、複数のウィンドウが開いてプレゼンテーション資料が同時に表示されるが、説明中に使用者がウィンドウを移動させたりして、ウィンドウ同士が重なりあって、翻訳する対象の文書画像が隠される場合がある。しかしながら、従来技術の特許文献1や特許文献2では、このような場合の画面翻訳について言及されていない。一般的に、ウィンドウで表示するシステムにおいて、そのウィンドウの画面表示イメージを得る操作を行った場合、隠された部分のイメージが取得できるかどうかは不定であり、一般的には取得できないものである。その際、隠された文字部分が取得できないことにより、特に境界付近において、文字認識結果が変化したり、正確な翻訳ができないなどの影響が発生することが考えられる。
【0006】
本発明は、斯かる実情に鑑み、翻訳対象の文書画像が他の画像で隠された場合でも、翻訳表示内容が変化せず、より正確な情報を表示することが可能になる表示画像キャプチャ翻訳装置、表示画像キャプチャ翻訳方法、及びプログラムを提供しようとするものである。
【課題を解決するための手段】
【0007】
本発明は、表示装置に表示された画像から、該画像に含まれる第1言語の文字を文字認識し、その結果を第2言語に翻訳し前記表示装置に表示する表示画像キャプチャ翻訳装置であって、
表示された前記画像から画像データを取得する表示内容取得部と、前記画像データから第1言語の文字を認識して第1言語の文字データを取得する文字認識部と、前記文字認識部が取得した前記第1言語の文字データを第2言語の文字データに翻訳する翻訳部と、前記表示内容取得部が取得した画像データと、該画像データに含まれる第1言語の文字データを前記翻訳部が翻訳した第2言語の文字データとを記憶する記憶部と、前記記憶部に記憶された前回取得した画像データと、現在表示中の画像データの比較を行う比較部と、翻訳した文字データを表示画像として配置する文字配置部と、を備え、
前記文字配置部は、前記記憶部に記憶された前回画像データと現在表示中の画像データとが一致すれば、その一致画像に対応する第2言語の文字データを前記記憶部から読み出して表示中の対応画像に配置して表示させることを特徴とする。
【0008】
また、本発明は、前記記憶部に画像データが記憶されていない場合、あるいは前記記憶部に現在表示中の画像に一致する画像データが記憶されていない場合、
前記文字認識部は、現在表示中の画像データの第1言語の文字データを取得し、前記翻訳部は、前記文字認識部が取得した第1言語の文字データを第2言語の文字データに翻訳し、前記文字配置部は、前記翻訳部が翻訳した前記第2言語の文字データを前記画像に配置して表示させることを特徴とする。
【0009】
また、本発明は、前記比較部は、現在表示中の画像で、かつ別の画像で一部隠されて表示されている画像において、その露出表示されている部分の画像データが、前記記憶部に記憶されている以前取得した画像データの対応する部分と一致する場合は、画像データが一致しているものとすることを特徴とする。
【0010】
ここで、前記文字配置部は、露出表示されている第1言語の文字データのみ翻訳した第2言語の文字データを文字として配置表示することを特徴とする。
【0011】
また、本発明は、表示装置に表示された画像から、該画像に含まれる第1言語の文字を文字認識し、その結果を第2言語に翻訳し前記表示装置に表示する表示画像キャプチャ翻訳方法であって、
表示された前記画像から画像データを取得する表示内容取得ステップと、前記画像データから第1言語の文字を認識して第1言語の文字データを取得する文字認識ステップと、前記文字認識部が取得した前記第1言語の文字データを第2言語の文字データに翻訳する翻訳ステップと、前記表示内容取得部が取得した画像データと、該画像データに含まれる第1言語の文字データを前記翻訳部が翻訳した第2言語の文字データとを記憶する記憶ステップと、前記記憶ステップで記憶されていた前回取得した画像データと、現在表示中の画像データの比較を行う比較ステップと、翻訳した文字データを表示画像として配置する文字配置ステップと、を備え、
前記文字配置ステップは、前記記憶ステップで記憶された前回画像データと現在表示中の画像データとが一致すれば、その一致画像に対応する前記記憶ステップで記憶した第2言語の文字データを表示中の対応画像に配置して表示させることを特徴とする。
【0012】
また、本発明は、コンピュータに、前記表示画像キャプチャ翻訳方法の各ステップを実行させるためのプログラムである。
【発明の効果】
【0013】
本発明によれば、記憶部に記憶された前回取得した画像と、今回表示された画像を比較し、一致すれば前回取得した画像の翻訳文字データを用いて表示するので、翻訳表示内容が変化せず、また素早く正確な情報を表示して、聴講者の理解が得やすくなる。
【0014】
また、前回取得した画像がなくても、表示された画像の文字を翻訳するので、常に翻訳文を表示することが可能である。
【0015】
また、今回取得した画像が別の画像で隠されていても、表示されている部分で、記憶部に記憶されている前回の画像との一致を判定し、一致すれば同じ画像とするので、前回画像の文字翻訳が変らず、聴講者に同じ画像であることがすぐに分かる。
【0016】
また、隠れた部分の文字については、表示しないようにするので、より正確な情報を表示することが可能になる。
【図面の簡単な説明】
【0017】
【図1】本発明に係る表示画像キャプチャ翻訳装置を備えたプレゼンテーション装置の一実施形態を示すブロック図である。
【図2】このプレゼンテーション装置の処理を示すフローチャートである。
【図3】最初に表示された画像を示す画面説明図である。
【図4】次に表示された画像を示す画面説明図である。
【図5】図3の訳ふりを行った画面説明図である。
【図6】図4の訳ふりを行った画面説明図である。
【発明を実施するための形態】
【0018】
以下、本発明の実施の形態を添付図面を参照して説明する。
図1は本発明に係る表示画像キャプチャ翻訳装置を備えたプレゼンテーション装置の一実施形態を示すブロック図である。
【0019】
このプレゼンテーション装置10には、プレゼンテーションの内容や訳ふりの表示を使用者に表示するディスプレイ31と、キーボードやマウスなどからなり、使用者がプレゼンテーション画像(資料画像など)の表示操作などの指示を行う操作部32とが接続されている。
【0020】
プレゼンテーション装置10は、ディスプレイ31に表示する画像内容を記憶する表示内容記憶部11、操作部32の指示により、ディスプレイ31に表示させるプレゼンテーション機能の全般の実行を行うプレゼンテーション実行部12、表示画像キャプチャ翻訳装置である画面訳ふり実行モジュール20を備えている。
【0021】
表示内容記憶部11は、ディスプレイ31に表示させる画像データを記憶する。また、その画像に含まれる文字のテキストデータがあればそれも記憶している。
プレゼンテーション実行部12は、操作部32の指示に基づいて、ディスプレイ11に表示させるプレゼンテーション画面の画像を生成し、表示内容記憶部11に記憶させる。この記憶された画像をディスプレイ31に表示する。
【0022】
画面訳ふり実行モジュール20は、表示内容記憶部11より現在表示されている画面内容(表示画像)の画像データを取得する表示内容取得部21、表示内容取得部21より画面内容を取得し、その画面中に表示されている第1言語の文字の認識を行い第1言語の文字データ(テキストデータ)を取得する文字認識部22、文字認識部22より取得した第1言語の文字データを受け取り、第1言語(認識した文字の言語)から第2言語(翻訳する言語)への翻訳変換を行い訳ふり文字データ(第2言語のテキストデータ)を取得する訳ふり部23、訳ふり部23より訳ふり文字データを取得して文字認識結果の文字位置や大きさ情報から、訳ふり文字を適切な位置に配置する訳ふり文字配置部24、以前に取得した表示画面の画像データやそれに含まれる第1言語テキストデータ、及びそれに対する訳ふり結果(第2言語テキストデータ)を記憶する記憶部25、今回の表示画面の画像と、以前の表示画面の画像の内容を比較する比較部26を備える。
【0023】
ここで、文字認識部22は、画像データから文字部分を認識し、文字画像から第1言語テキストデータに変換する。ここで、表示内容記憶部11から取得したデータに、画像データに対応する第1言語テキストデータがあれば、それを用いる。
【0024】
このプレゼンテーション装置10の処理動作を図2を用いて説明する。
使用者は、プレゼンテーション資料のデータをメモリやHDDなどの記憶装置にあらかじめ複数のファイルに記憶させておく。それをプレゼンテーション装置10で読み出し、プレゼンテーション用のアプリケーションプログラムによって表示させる。プレゼンテーションでは、複数のファイルを同時に表示をさせる場合もあり、そのファイルごとに表示ウィンドウを開いて、プレゼンテーション資料を同時に表示させる。使用者は、説明の過程で、各ウィンドウを並列に並べたり、重ねたりして、プレゼンテーション資料を表示させることがある。本実施形態は、どのような表示になっても、安定した訳文を提供できるように処理するものである。
【0025】
図2は、次の例に基づいて説明する。
まずは表示部40に、図3の文書画像41を表示し、その次に図4の文書画像51,52を表示部40に表示する場合の翻訳処理を例として説明する。
【0026】
ディスプレイ31に最初に表示された画面は、図3に示すように、ディスプレイ31の表示部40に、第1のウィンドウが開いて文書画像41が表示され、そこには第1言語の文字列42が表示されている。次にディスプレイ31に表示された画面は、図4に示すように、ディスプレイ31の表示部40に、第1のウィンドウが開いて文書画像51が表示され、第2のウィンドウが開いて文書画像54が表示されている。文書画像54には、第1言語の文字列55が表示されている。
【0027】
まず、画面訳ふり実行モジュール20を起動させたとき、記憶部25の初期化を行い、記憶データがない状態にする(ステップS1)。使用者が操作部32によりプレゼンテーションの指示を行い、プレゼンテーション実行部12がその指示に従って、表示すべき画像のデータを生成し、それを表示内容記憶部11に記憶させ、ディスプレイ31に表示する。
【0028】
表示内容取得部21が、表示内容記憶部11から現在ディスプレイ31の画面に表示されるウィンドウ内の画像データをすべてキャプチャする(ステップS2)。そして、キャプチャした画像は記憶部25に一旦記憶するとともに、比較部26に送る。なお、記憶部25において、このステップで一旦記憶する領域と後述するステップS8で記憶する領域とは別である。ここで、一旦記憶した画像データは、後述するステップS11の画面更新時に消去される。
【0029】
最初の段階では、ステップS1において、記憶部25のデータが初期化されているので、前回キャプチャした画像データはない状態であるが、このフローチャートの処理を繰り返した場合は、前回キャプチャした画像データが記憶部25に記憶されていることになる。
【0030】
例えば、図4の画像51,54が表示された場合、記憶部25には、前回表示した画像41のデータが記憶されている。さらに、詳しくは後述するが、図5に示す画像41における文字列(第1言語)42を第2言語に翻訳した文字列43のテキストデータも記憶部25に記憶している。
【0031】
比較部26は、記憶部25から前回キャプチャした画像データを読み出し、今回キャプチャした画像のそれぞれと比較し、前回キャプチャした画像データと一致する画像であるかを確認する(ステップS3)。前回のキャプチャ画像データと一致する場合は(ステップS3;Yes)、記憶部25から前回の訳ふり内容を読み出して訳ふり文字配置部24に送り、ステップ10に進む(ステップS4)。
【0032】
ここで、図3の画面が最初に表示されたものである場合は、記憶部25には前回のキャプチャ画像は存在しないので、ステップS3では前回のキャプチャ画像と一致しないものとし、ステップS5に進む。
【0033】
図3の画像の処理が済んだあとで、図4に示す画面の画像51,54を表示内容取得部21が取得した場合、比較部26は、画像51,54に対して、前回取得した画像41(図3参照)と比較する。画像51の一部が別画像54により隠されている場合、比較部26は、その画像51の表示されている部分のデータと、記憶部25に記憶されている前回キャプチャ画像41のデータとを比較し、画像51が露出表示されている部分のデータが画像41のデータと一致すれば、同一画像であると判断する。
従って、ステップS4に進んで、記憶部25から画像41における第2言語の文字列43(図5参照)の翻訳テキストデータを読み出し、訳ふり文字配置部24に送る。
【0034】
また、比較部26は、画像54のデータが前回のキャプチャ画像41のデータとは一致しないので、別画像と判断し、ステップS5に進む。
【0035】
記憶部25に今回のキャプチャ画像データと一致する画像データが存在しない場合は(ステップS3;No)、ステップ5に進み、文字認識部22は、今回キャプチャした画像データを文字認識し文字データを取得し、ステップS6において、翻訳対象となる第1言語の文字が存在するかを判定する。翻訳対象となる文字が存在すれば(ステップS6;Yes)、ステップS7に進む。翻訳対象となる文字が存在しなければ(ステップS6;No)、ステップS11に進み、次の画面更新のタイミングまで待つ。
【0036】
ステップS7では、訳ふり部23は、抽出した第1言語の文字データを第2言語の文字データに翻訳して訳ふりを行う。ステップS8において、訳ふり結果のデータと、その画像データを記憶部25に記憶する。
【0037】
ステップS9では、訳ふり文字配置部24が、ステップS7で訳ふりされた第2言語の文字データ、あるいはステップS4で、記憶部25から読み出された前回訳ふりされた第2言語の文字データを、現在表示されている第1言語文字の下に配置する。ただし、隠れている部分に対して訳ふりした結果がある場合は、それを表示してはおかしいので、その部分に対応する訳ふりの表示を抑制する。
【0038】
ステップS10では、ディスプレイ31に現在表示されている画像に対して、訳ふり文字配置部24が配置した位置に表示するように、表示内容記憶部11に訳ふり文字のデータを送り、ディスプレイ31に表示する。
【0039】
ステップS11で、訳ふり文字更新のタイミングかどうかを判定する。まだ訳ふり更新のタイミングでなければ、ループして待つ。表示画面が更新された場合は(ステップS11;Yes)、ステップS12に進み、次の訳ふりを行うために、表示されている訳ふり文字データを消去し、ステップS2に戻る。なお、ステップS2で一旦記憶した画像データも消去する(ステップS8で記憶したデータは、記憶部25にそのまま保存される)。
【0040】
最初に図3の画面がディスプレイ31に表示された場合は、図5のように第2言語の翻訳文字列43が、第1言語の文字列42の下側に表示される。
その後、図4の画面がディスプレイ31に表示された場合は、図6のように、画像51に対しては、第1言語の文字列52の下側に、図3の第2言語の文字列43の一部が表示される。これは上述のように画像51は、前回キャプチャした画像41と同じ画像と判断したからである。
また、画像54に対しては、図6のように、第1言語の文字列55の下側に、翻訳処理された第2言語の文字列56が表示される。
【0041】
また、ウィンドウ全体表示との画像を覚えて比較・再利用しているが、一部が隠されているさらに直近の画像も覚えておいて、全体表示との比較が一致しなかった場合、さらに直近の一部隠ぺいされたウィンドウ画像も比較して一致した場合はそちらを利用することにより、より以前の精度の高い訳ふり結果が利用できる場面を多くすることも考えられる。
【0042】
こうして、翻訳対象ウィンドウが他のウィンドウで隠された場合、直前のウィンドウ全体表示時の表示内容をキャプチャして覚えておき、それぞれのウィンドウに表示される画像の現時点での表示内容のキャプチャ情報と比較し、ウィンドウ表示部分において内容が一致するならば、ウィンドウが隠れている部分も変化していないものとみなし、以前のウィンドウ全体のキャプチャ内容で文字認識を行い、それを元に翻訳結果を表示することで、あるいは、以前の文字認識結果ならびに翻訳結果を記憶しておき、それを利用することで、ウィンドウが隠れた場合においても翻訳表示内容が変化せず、より正確な情報を表示することが可能になる。
【0043】
上記各実施の形態に係る画面訳ふり実行モジュール20の機能の一部は、コンピュータによって実現することができる。その場合、このような機能の処理内容を記述したプログラムが提供される。そして、そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリなどがある。
【符号の説明】
【0044】
10 プレゼンテーション装置
11 表示内容記憶部
12 プレゼンテーション実行部
20 画面訳ふり実行モジュール
21 表示内容取得部
22 文字認識部
23 訳ふり部
24 文字配置部
25 記憶部
26 比較部
31 ディスプレイ
32 操作部

【特許請求の範囲】
【請求項1】
表示装置に表示された画像から、該画像に含まれる第1言語の文字を文字認識し、その結果を第2言語に翻訳し前記表示装置に表示する表示画像キャプチャ翻訳装置であって、
表示された前記画像から画像データを取得する表示内容取得部と、
前記画像データから第1言語の文字を認識して第1言語の文字データを取得する文字認識部と、
前記文字認識部が取得した前記第1言語の文字データを第2言語の文字データに翻訳する翻訳部と、
前記表示内容取得部が取得した画像データと、該画像データに含まれる第1言語の文字データを前記翻訳部が翻訳した第2言語の文字データとを記憶する記憶部と、
前記記憶部に記憶された前回取得した画像データと、現在表示中の画像データの比較を行う比較部と、
翻訳した文字データを表示画像として配置する文字配置部と、
を備え、
前記文字配置部は、前記記憶部に記憶された前回画像データと現在表示中の画像データとが一致すれば、その一致画像に対応する第2言語の文字データを前記記憶部から読み出して表示中の対応画像に配置して表示させることを特徴とする表示画像キャプチャ翻訳装置。
【請求項2】
前記記憶部に画像データが記憶されていない場合、あるいは前記記憶部に現在表示中の画像に一致する画像データが記憶されていない場合、
前記文字認識部は、現在表示中の画像データの第1言語の文字データを取得し、
前記翻訳部は、前記文字認識部が取得した第1言語の文字データを第2言語の文字データに翻訳し、
前記文字配置部は、前記翻訳部が翻訳した前記第2言語の文字データを前記画像に配置して表示させることを特徴とする請求項1に記載の表示画像キャプチャ翻訳装置。
【請求項3】
前記比較部は、現在表示中の画像で、かつ別の画像で一部隠されて表示されている画像において、その露出表示されている部分の画像データが、前記記憶部に記憶されている以前取得した画像データの対応する部分と一致する場合は、画像データが一致しているものとすることを特徴とする請求項1又は2に記載の表示画像キャプチャ翻訳装置。
【請求項4】
前記文字配置部は、露出表示されている第1言語の文字データのみ翻訳した第2言語の文字データを文字として配置表示することを特徴とする請求項3に記載の表示画像キャプチャ翻訳装置。
【請求項5】
表示装置に表示された画像から、該画像に含まれる第1言語の文字を文字認識し、その結果を第2言語に翻訳し前記表示装置に表示する表示画像キャプチャ翻訳方法であって、
表示された前記画像から画像データを取得する表示内容取得ステップと、
前記画像データから第1言語の文字を認識して第1言語の文字データを取得する文字認識ステップと、
前記文字認識部が取得した前記第1言語の文字データを第2言語の文字データに翻訳する翻訳ステップと、
前記表示内容取得部が取得した画像データと、該画像データに含まれる第1言語の文字データを前記翻訳部が翻訳した第2言語の文字データとを記憶する記憶ステップと、
前記記憶ステップで記憶されていた前回取得した画像データと、現在表示中の画像データの比較を行う比較ステップと、
翻訳した文字データを表示画像として配置する文字配置ステップと、
を備え、
前記文字配置ステップは、前記記憶ステップで記憶された前回画像データと現在表示中の画像データとが一致すれば、その一致画像に対応する前記記憶ステップで記憶した第2言語の文字データを表示中の対応画像に配置して表示させることを特徴とする表示画像キャプチャ翻訳方法。
【請求項6】
コンピュータに、請求項5の表示画像キャプチャ翻訳方法の各ステップを実行させるためのプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2012−256097(P2012−256097A)
【公開日】平成24年12月27日(2012.12.27)
【国際特許分類】
【出願番号】特願2011−127329(P2011−127329)
【出願日】平成23年6月7日(2011.6.7)
【出願人】(000005049)シャープ株式会社 (33,933)
【Fターム(参考)】