情報処理装置および方法、プログラム、並びに撮像装置
【課題】文字認識処理の結果をより容易に確認する。
【解決手段】文字認識処理部は、画像における文字列領域に対して文字認識処理を行い、文字列情報抽出部は、文字認識処理部によって文字認識された文字列から、文字列に関する情報である文字列情報を抽出し、表示用文字列生成部は、文字列情報抽出部によって抽出された文字列情報に応じた文字フォントの表示用文字列を生成し、表示制御部は、表示用文字列を、画像における文字列領域の近傍に表示するよう制御する。本技術は、デジタルスチルカメラに適用することができる。
【解決手段】文字認識処理部は、画像における文字列領域に対して文字認識処理を行い、文字列情報抽出部は、文字認識処理部によって文字認識された文字列から、文字列に関する情報である文字列情報を抽出し、表示用文字列生成部は、文字列情報抽出部によって抽出された文字列情報に応じた文字フォントの表示用文字列を生成し、表示制御部は、表示用文字列を、画像における文字列領域の近傍に表示するよう制御する。本技術は、デジタルスチルカメラに適用することができる。
【発明の詳細な説明】
【技術分野】
【0001】
本技術は、情報処理装置および方法、プログラム、並びに撮像装置に関し、特に、文字認識処理の結果を確認することができるようにする情報処理装置および方法、プログラム、並びに撮像装置に関する。
【背景技術】
【0002】
従来、画像に含まれる文字列の文字を認識する文字認識処理を行い、その文字認識処理の結果を、その文字列を含む画像上の所定の位置に表示する技術がある(例えば、特許文献1,2参照)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2000−207487号公報
【特許文献2】特開2004−206548号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、上述した技術においては、画像に含まれる文字列の位置と、文字認識処理の結果としての文字列の位置とが離れていたり、画像に含まれる文字列の書体とは異なる書体で、文字認識処理の結果としての文字列が表示されていた。
【0005】
したがって、画像に含まれる文字列と、文字認識処理の結果としての文字列とを比較しにくく、文字認識処理の結果に、誤認識された文字が含まれていたとしても、ユーザは、その誤認識された文字に気づかない恐れがあった。
【0006】
本技術は、このような状況に鑑みてなされたものであり、文字認識処理の結果をより容易に確認することができるようにするものである。
【課題を解決するための手段】
【0007】
本技術の一側面の情報処理装置は、画像における文字列領域に対して文字認識処理を行う文字認識処理部と、前記文字認識処理部によって文字認識された文字列から、前記文字列に関する情報である文字列情報を抽出する文字列情報抽出部と、前記文字列情報抽出部によって抽出された文字列情報に応じた文字フォントの表示用文字列を生成する表示用文字列生成部と、前記表示用文字列を、前記画像における前記文字列領域の近傍に表示するよう制御する表示制御部とを備える。
【0008】
前記文字列情報抽出部には、前記文字列情報として、前記文字列における文字それぞれの文字サイズおよび文字コードを抽出させ、前記表示用文字列生成部には、前記文字サイズに基づいて前記文字フォントを決定し、前記文字コードに基づいて、前記文字フォントの前記表示用文字列を生成させることができる。
【0009】
前記文字列情報抽出部には、前記文字列情報として、前記画像における前記文字列領域の位置を抽出させ、前記表示制御部には、前記文字列領域の位置に基づいて、前記表示用文字列を、前記画像における前記文字列領域の近傍に表示するよう制御させることができる。
【0010】
前記文字列情報抽出部には、前記文字列情報として、前記画像の所定方向に対する前記文字列領域の傾きを抽出させ、前記表示制御部には、前記文字列領域が前記画像の所定方向に対して傾いている場合、傾きを補正した前記文字列領域の画像を表示するよう制御させるとともに、前記表示用文字列を、傾きが補正された前記文字列領域の画像の近傍に表示するよう制御させることができる。
【0011】
前記情報処理装置には、前記画像における前記文字列領域の色を識別する色識別部をさらに設け、前記表示用文字列生成部には、前記色識別部によって識別された前記文字列領域の色に基づいて、前記文字フォントの表示用文字列を生成させることができる。
【0012】
前記色識別部には、前記文字列領域における文字部分の色、および前記文字部分以外の背景部分の色を識別させ、前記表示用文字列生成部には、前記文字部分の色および前記背景部分の色に基づいて、前記文字フォントの表示用文字列を生成させることができる。
【0013】
本技術の一側面の情報処理方法は、画像における文字列領域に対して文字認識処理を行う文字認識処理ステップと、前記文字認識処理ステップの処理によって文字認識された文字列から、前記文字列に関する情報である文字列情報を抽出する文字列情報抽出ステップと、前記文字列情報抽出ステップの処理によって抽出された文字列情報に応じた文字フォントの表示用文字列を生成する表示用文字列生成ステップと、前記表示用文字列を、前記画像における前記文字列領域の近傍に表示する表示ステップとを含む。
【0014】
本技術の一側面のプログラムは、画像における文字列領域に対して文字認識処理を行う文字認識処理ステップと、前記文字認識処理ステップの処理によって文字認識された文字列から、前記文字列に関する情報である文字列情報を抽出する文字列情報抽出ステップと、前記文字列情報抽出ステップの処理によって抽出された文字列情報に応じた文字フォントの表示用文字列を生成する表示用文字列生成ステップと、前記表示用文字列を、前記画像における前記文字列領域の近傍に表示するよう制御する表示制御ステップとを含む処理をコンピュータに実行させる。
【0015】
本技術の一側面の撮像装置は、被写体を撮像する撮像部と、前記撮像部による撮像によって得られた撮像画像における文字列領域に対して文字認識処理を行う文字認識処理部と、前記文字認識処理部によって文字認識された文字列から、前記文字列に関する情報である文字列情報を抽出する文字列情報抽出部と、前記文字列情報抽出部によって抽出された文字列情報に応じた文字フォントの表示用文字列を生成する表示用文字列生成部と、前記表示用文字列を、前記撮像画像における前記文字列領域の近傍に表示するよう制御する表示制御部とを備える。
【0016】
本技術の一側面においては、画像における文字列領域に対して文字認識処理が行われ、文字認識された文字列から、文字列に関する情報である文字列情報が抽出され、抽出された文字列情報に応じた文字フォントの表示用文字列が生成され、表示用文字列が、画像における文字列領域の近傍に表示されるよう制御される。
【発明の効果】
【0017】
本技術の一側面によれば、文字認識処理の結果をより容易に確認することが可能となる。
【図面の簡単な説明】
【0018】
【図1】本技術を適用した情報処理装置としての撮像装置の一実施の形態の機能構成例を示すブロック図である。
【図2】文字列情報抽出部の機能構成例を示すブロック図である。
【図3】文字列領域色識別部の機能構成例を示すブロック図である。
【図4】表示用文字列生成部の機能構成例を示すブロック図である。
【図5】認識文字列表示処理について説明するフローチャートである。
【図6】文字列情報抽出処理について説明するフローチャートである。
【図7】文字列情報について説明する図である。
【図8】文字列情報の構成を示す図である。
【図9】文字列領域色識別処理について説明するフローチャートである。
【図10】表示用文字列生成処理について説明するフローチャートである。
【図11】表示用文字列の表示の例について説明する図である。
【図12】表示用文字列の表示の例について説明する図である。
【図13】コンピュータのハードウェアの構成例を示すブロック図である。
【発明を実施するための形態】
【0019】
以下、本技術の実施の形態について図を参照して説明する。なお、説明は以下の順序で行う。
1.撮像装置の機能構成
2.認識文字列表示処理
【0020】
<1.撮像装置の機能構成>
図1は、本技術を適用した情報処理装置としての撮像装置の一実施の形態の構成を示している。
【0021】
図1の撮像装置11は、例えば、デジタルスチルカメラとして構成され、ユーザの操作にしたがって、被写体を撮像し、その被写体の撮像画像(静止画像)を蓄積したり、ユーザに提示する。また、撮像装置11は、ユーザの操作にしたがって、撮像画像に含まれる文字列に対して文字認識処理を行い、文字認識処理の結果をユーザに提示する。なお、撮像装置11は、被写体の撮像画像として、動画像を蓄積したり、ユーザに提示するデジタルビデオカメラとして構成されるようにしてもよい。
【0022】
図1の撮像装置11は、レンズ31、撮像部32、文字列領域抽出部33、文字パターンデータベース34、文字認識処理部35、文字列情報抽出部36、文字列領域色識別部37、表示用文字列生成部38、表示制御部39、および表示部40から構成される。
【0023】
撮像部32は、撮像素子やA/D(Analog/Digital)変換部を含むように構成され、レンズ31からの光を受光して光電変換することにより被写体を撮像し、得られたアナログの画像信号をA/D変換する。撮像部32は、A/D変換の結果得られたデジタルの画像データ(以下、撮像画像という)を文字列領域抽出部33および表示制御部39に供給する。
【0024】
文字列領域抽出部33は、被写体の撮像時に、図示せぬ操作部に対するユーザの操作によって設定される、認識対象となる文字列を含む領域(文字列領域)の画像(文字列領域画像)を、撮像部32からの撮像画像から抽出し、文字認識処理部35および表示制御部39に供給する。
【0025】
文字パターンデータベース34は、文字認識処理部35によって行われる文字認識処理の結果となる文字の候補である文字パターンを記憶している。
【0026】
文字認識処理部35は、文字パターンデータベース34に記憶されている文字パターンを用いて、文字列領域抽出部33からの文字列領域画像に対して文字認識処理を行い、その文字認識処理の結果を文字列領域画像とともに、文字列情報抽出部36および文字列領域色識別部37に供給する。
【0027】
文字列情報抽出部36は、文字認識処理部35からの文字認識処理の結果に基づいて、文字認識処理部35からの文字列領域画像から、文字認識された文字列に関する情報である文字列情報を抽出し、表示用文字列生成部38および表示制御部39に供給する。
【0028】
文字列領域色識別部37は、文字認識処理部35からの文字認識処理の結果と文字列領域画像とに基づいて、文字列領域の色を識別し、識別された色を示す情報である文字列領域色情報を、表示用文字列生成部38に供給する。
【0029】
表示用文字列生成部38は、文字列領域色識別部37からの文字列領域色情報に基づいて、文字列情報抽出部36からの文字列情報に応じた文字フォントの文字列である表示用文字列を生成し、表示制御部39に供給する。ここで、文字フォントは、文字の書体を表すデータ(書体データ)を示すものとする。
【0030】
表示制御部39は、表示用文字列生成部38からの表示用文字列を、撮像部32からの撮像画像における文字列領域の近傍に表示するように、表示部40の表示を制御する。
【0031】
表示部40は、表示制御部39の制御の下、表示用文字列が重畳された撮影画像を表示する。
【0032】
[文字列情報抽出部の構成]
ここで、図2を参照して、文字列情報抽出部36の構成について説明する。
【0033】
図2の文字列情報抽出部36は、文字列サイズ測定部51、文字列位置測定部52、文字サイズ測定部53、文字コード化処理部54、および文字列情報生成部55から構成される。
【0034】
文字列サイズ測定部51は、文字認識処理部35からの文字列領域画像に基づいて、撮像画像における文字列領域のサイズ(文字列サイズ)を測定し、文字列情報生成部55に供給する。
【0035】
文字列位置測定部52は、文字認識処理部35からの文字列領域画像に基づいて、撮像画像における文字列領域の位置(文字列位置)を測定し、文字列情報生成部55に供給する。
【0036】
文字サイズ測定部53は、文字認識処理部35からの文字認識処理の結果および文字列領域画像に基づいて、文字列領域画像における文字列の文字それぞれのサイズ(文字サイズ)を測定し、文字列情報生成部55に供給する。
【0037】
文字コード化処理部54は、文字認識処理部35からの文字認識処理の結果および文字列領域画像に基づいて、文字列領域画像における文字列の文字それぞれを、所定の文字コードに変換し、文字列情報生成部55に供給する。
【0038】
文字列情報生成部55は、文字列サイズ測定部51からの文字列サイズ、文字列位置測定部52からの文字列位置、文字サイズ測定部53からの文字サイズ、および文字コード化処理部54からの文字コードを構成要素とする文字列情報を生成する。
【0039】
[文字列領域色識別部の構成]
次に、図3を参照して、文字列領域色識別部37の構成について説明する。
【0040】
図3の文字列領域色識別部37は、文字色判定部71、背景色判定部72、および文字列領域色情報生成部73から構成される。
【0041】
文字色判定部71は、文字認識処理部35からの文字認識処理の結果および文字列領域画像に基づいて、文字列領域における文字列の文字部分の色を判定し、判定された文字部分の色を表す文字色情報を文字列領域色情報生成部73に供給する。
【0042】
背景色判定部72は、文字認識処理部35からの文字認識処理の結果および文字列領域画像に基づいて、文字列領域における文字列の文字部分以外の背景部分の色を判定し、判定された背景部分の色を表す背景色情報を文字列領域色情報生成部73に供給する。
【0043】
文字列領域色情報生成部73は、文字色判定部71からの文字色情報および背景色判定部72からの背景色情報を構成要素とする文字列領域色情報を生成する。
【0044】
[表示用文字列生成部の構成]
次に、図4を参照して、表示用文字列生成部38の構成について説明する。
【0045】
図4の表示用文字列生成部38は、文字フォント決定部91および文字列生成部92から構成される。
【0046】
文字フォント決定部91は、文字列情報抽出部36からの文字列情報に基づいて、表示用文字列の文字フォントを決定し、文字列生成部92に供給する。
【0047】
文字列生成部92は、文字フォント決定部91からの文字フォント、文字列情報抽出部36からの文字列情報、および文字列領域色識別部37からの文字列領域色情報に基づいて、表示用文字列を生成する。
【0048】
<2.認識文字列表示処理>
次に、図5を参照して、撮像装置11による認識文字列表示処理について説明する。
【0049】
撮像装置11の動作モードが被写体を撮像する撮像モードで、表示部40において、撮像対象となる被写体をユーザに確認させるためのスルー画像上に、文字列領域として設定された領域を示す枠が表示され、その枠内に所定の文字列が含まれた状態で、ユーザにより、例えば、図示せぬシャッタボタンが半押しされることで、認識文字列表示処理が開始される。
【0050】
ステップS11において、撮像部32は、ユーザによりシャッタボタンが半押しされたときの被写体を撮像し、得られた撮像画像を、文字列領域抽出部33および表示制御部39に供給する。
【0051】
ステップS12において、文字列領域抽出部33は、撮像部32からの撮像画像において、文字列領域の文字列領域画像を抽出し、文字認識処理部35および表示制御部39に供給する。
【0052】
ステップS13において、文字認識処理部35は、文字パターンデータベース34に記憶されている文字パターンを用いて、文字列領域抽出部33からの文字列領域画像に対して文字認識処理を行い、その文字認識処理の結果を文字列領域画像とともに、文字列情報抽出部36および文字列領域色識別部37に供給する。
【0053】
ステップS14において、文字列情報抽出部36は、文字認識処理部35からの文字認識処理の結果に基づいて、文字認識処理部35からの文字列領域画像から文字列情報を抽出する文字列情報抽出処理を実行する。
【0054】
[文字列情報抽出処理の例]
ここで、図6のフローチャートを参照して、文字列情報抽出部36による文字列情報抽出処理について説明する。
【0055】
ステップS31において、文字列サイズ測定部51は、文字認識処理部35からの文字列領域画像に基づいて、撮像画像における文字列領域のサイズ(文字列サイズ)として、文字列領域の高さ、幅、および傾きを測定し、文字列情報生成部55に供給する。
【0056】
図7は、撮像装置11の表示部40において、撮像画像(スルー画像)に設定された文字列領域の例を示している。図7においては、文字列領域を示す枠150内には、「DSG−TX7」の文字列が含まれている。
【0057】
すなわち、ステップS31においては、例えば、文字列領域の高さおよび幅として、図7Aに示される、文字列領域を示す枠150の高さおよび幅が測定される。また、例えば、文字列領域の傾きとしては、図7Bに示されるように、撮像画像の水平方向に対する、文字列領域を示す枠150の傾きが測定される。
【0058】
次に、ステップS32において、文字列位置測定部52は、文字認識処理部35からの文字列領域画像に基づいて、撮像画像における文字列領域の位置(文字列位置)として、図7Aに示されるように、表示部40(撮像画像)の左上の頂点を原点としたときの、文字列領域を示す枠150の左上の頂点の位置(縦位置および横位置)を測定し、文字列情報生成部55に供給する。なお、文字列位置は、撮像画像における文字列領域の位置を特定するものであればよく、文字列領域を示す枠150の左上の頂点以外の位置であってもよい。
【0059】
ステップS33において、文字サイズ測定部53は、文字認識処理部35からの文字認識処理の結果および文字列領域画像に基づいて、文字列領域画像における文字列の文字それぞれのサイズ(文字サイズ)として、文字列の文字それぞれの高さおよび幅を測定し、文字列情報生成部55に供給する。
【0060】
すなわち、ステップS33においては、例えば、図7Aの右側に示されるように、文字認識処理された文字列「DSG−TX7」の文字「D」、「S」、「G」、「−」、「T」、「X」、「7」それぞれ高さおよび幅が測定される。
【0061】
ステップS34において、文字コード化処理部54は、文字認識処理部35からの文字認識処理の結果および文字列領域画像に基づいて、例えば、図7に示される、文字認識処理された文字列「DSG−TX7」の文字「D」、「S」、「G」、「−」、「T」、「X」、「7」それぞれを、例えばUnicode等の文字コードに変換し、文字列情報生成部55に供給する。
【0062】
ステップS35において、文字列情報生成部55は、文字列サイズ測定部51からの文字列サイズ、文字列位置測定部52からの文字列位置、文字サイズ測定部53からの文字サイズ、および文字コード化処理部54からの文字コードを構成要素とする文字列情報を生成する。
【0063】
図8は、文字列情報生成部55によって生成される文字列情報の構成例を示している。
【0064】
図8に示されるように、文字列情報は、文字列の高さ、幅、および傾きからなる文字列サイズ、文字列位置、文字の高さおよび幅からなる文字サイズ、並びに文字コードから構成される。図8の文字列情報においては、文字サイズおよび文字コードは、文字列に含まれるn個の文字それぞれについて存在する。
【0065】
このようにして生成された文字列情報は、表示用文字列生成部38および表示制御部39に供給され、処理は、図5のフローチャートのステップS14に戻る。
【0066】
ステップS14の後、処理はステップS15に進み、文字列領域色識別部37は、文字認識処理部35からの文字認識処理の結果と文字認識処理部35からの文字列領域画像とに基づいて、文字列領域色識別処理を実行し、文字列領域色情報を生成する。
【0067】
[文字列情報抽出処理の例]
ここで、図9のフローチャートを参照して、文字列領域色識別部37による文字列領域色識別処理について説明する。
【0068】
ステップS51において、文字色判定部71は、文字認識処理部35からの文字認識処理の結果および文字列領域画像に基づいて、文字列領域における文字列の文字部分の色を判定し、判定された文字部分の色を表す文字色情報を文字列領域色情報生成部73に供給する。
【0069】
ステップS52において、背景色判定部72は、文字認識処理部35からの文字認識処理の結果および文字列領域画像に基づいて、文字列領域における文字列の文字部分以外の背景部分の色を判定し、判定された背景部分の色を表す背景色情報を文字列領域色情報生成部73に供給する。
【0070】
ステップS53において、文字列領域色情報生成部73は、文字色判定部71からの文字色情報および背景色判定部72からの背景色情報を構成要素とする文字列領域色情報を生成する。
【0071】
このようにして生成された文字列領域色情報は、表示用文字列生成部38に供給され、処理は、図5のフローチャートのステップS15に戻る。
【0072】
ステップS15の後、処理はステップS16に進み、表示用文字列生成部38は、文字列領域色識別部37からの文字列領域色情報に基づいて、文字列情報抽出部36からの文字列情報に応じた文字フォントの文字列である表示用文字列を生成する表示用文字列生成処理を実行する。
【0073】
[表示用文字列生成処理の例]
ここで、図10のフローチャートを参照して、表示用文字列生成部38による表示用文字列生成処理について説明する。
【0074】
ステップS71において、文字フォント決定部91は、文字列情報抽出部36からの文字列情報に基づいて、表示用文字列の文字フォントを決定し、文字列生成部92に供給する。
【0075】
具体的には、文字フォント決定部91は、文字列情報における文字列の文字それぞれの文字サイズ(高さおよび幅)および文字コードに基づいて、文字列領域の文字の縦横比に近似し、文字列領域の文字の高さが略一致する文字フォントを決定する。
【0076】
ステップS72において、文字列生成部92は、文字フォント決定部91からの文字フォント、文字列情報抽出部36からの文字列情報、および文字列領域色認識部37からの文字列領域色情報に基づいて、表示用文字列を生成する。
【0077】
具体的には、文字列生成部92は、文字列情報抽出部36からの文字列情報における文字列の文字それぞれの文字コードに基づいて、文字フォント決定部91からの文字フォントの文字列である表示用文字列を生成する。また、文字列生成部92は、文字列情報の文字列サイズ(高さおよび幅)に基づいて、表示用文字列を表示するための表示領域を設定する。そして、文字列生成部92は、表示領域における表示用文字列の文字の色を、文字列領域色識別部37からの文字列領域色情報の文字色情報で表わされる色とし、表示領域における表示用文字列の背景の色を、文字列領域色情報の背景色情報で表わされる色とした表示用文字列画像を生成する。
【0078】
このようにして生成された表示用文字列(表示用文字列画像)は、表示制御部39に供給され、処理は、図5のフローチャートのステップS16に戻る。
【0079】
ステップS16の後、処理はステップS17に進み、表示制御部39は、表示用文字列生成部38からの表示用文字列(表示用文字列画像)を、撮像画像における文字列領域の近傍に表示するように、表示部40の表示を制御する。
【0080】
具体的には、表示制御部39は、文字列情報の文字列位置に基づいて、表示用文字列生成部38からの表示用文字列画像を、撮像画像における文字列領域に並べて表示するように、表示部40の表示を制御する。
【0081】
例えば、図11に示されるように、表示部40において、撮像画像における文字列領域を示す枠150内の文字列の最初の文字「D」と、表示用文字列画像200における最初の文字「D」の水平方向の位置が揃うように、表示用文字列画像200が、文字列領域を示す枠150内の下側に配置され表示される。
【0082】
また、文字列情報抽出部36からの文字列情報の文字列サイズにおいて、文字列の傾きがある場合、すなわち、図7Bで説明したように、撮像画像の水平方向に対して文字列領域を示す枠150が傾いている場合、表示制御部39は、表示用文字列生成部38からの表示用文字列(表示用文字列画像)を、文字列領域抽出部33からの文字列領域画像の傾きを補正した傾き補正文字列領域画像の近傍に表示するように、表示部40の表示を制御する。
【0083】
例えば、図12に示されるように、表示部40において、撮像画像における文字列領域を示す枠150で示される文字列領域画像の傾きを補正した傾き補正文字列領域画像250が、撮像画像の所定の位置に表示され、傾き補正文字列領域画像250における文字列の最初の文字「D」と、表示用文字列画像200における最初の文字「D」の水平方向の位置が揃うように、表示用文字列画像200が、傾き補正文字列領域画像250の下側に配置され表示される。
【0084】
なお、表示用文字列画像200は、文字列領域を示す枠150内や傾き補正文字列領域画像250の下側に配置されるようにしたが、例えば、それぞれの上側等、文字列領域の文字列と表示用文字列画像200の文字列とを比較しやすくなる位置に配置されればよい。
【0085】
以上の処理によれば、撮像画像において、文字認識処理が行われた文字列領域の近傍に、文字認識された文字列の文字のサイズに応じた文字フォントの文字列が表示されるようになる。これにより、画像に含まれる文字列と、文字認識処理の結果としての文字列とを比較しやすくなり、ユーザは、文字認識処理の結果を容易に確認することができるようになる。したがって、例えば、文字認識処理の結果に、誤認識された文字が含まれていたとしても、ユーザは、その誤認識された文字を簡単に見つけること可能となる。
【0086】
また、表示用文字列画像における文字部分の色および背景部分の色を、それぞれ、撮像画像における文字列領域画像の文字部分の色および背景部分の色とすることで、画像に含まれる文字列と、文字認識処理の結果としての文字列をより比較しやすくなるので、ユーザに、文字認識処理の結果をより容易に確認させることができるようになる。
【0087】
なお、文字列領域画像や撮像画像全体が、白黒画像かまたはそれに近い場合には、撮像装置11において、文字列領域色識別部37を設けないようにし、文字列領域色識別処理を行わないようにしてもよい。
【0088】
また、以上においては、文字列領域は、撮像時にユーザにより設定されるものとしたが、スルー画像に含まれる複数の文字列を認識し、その中で所定の条件を満たす文字列が含まれる領域を文字列領域として設定するようにしてもよい。
【0089】
さらに、以上においては、本技術を、撮像部を備える撮像装置に適用した構成について説明したが、撮像装置に限らず、本技術を、入力された画像に対して所定の処理を施して表示する情報処理装置に適用することができる。
【0090】
上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータ等に、プログラム記録媒体からインストールされる。
【0091】
図13は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示すブロック図である。
【0092】
コンピュータにおいて、CPU(Central Processing Unit)901,ROM(Read Only Memory)902,RAM(Random Access Memory)903は、バス904により相互に接続されている。
【0093】
バス904には、さらに、入出力インタフェース905が接続されている。入出力インタフェース905には、キーボード、マウス、マイクロホン等よりなる入力部906、ディスプレイ、スピーカ等よりなる出力部907、ハードディスクや不揮発性のメモリ等よりなる記憶部908、ネットワークインタフェース等よりなる通信部909、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリ等のリムーバブルメディア911を駆動するドライブ910が接続されている。
【0094】
以上のように構成されるコンピュータでは、CPU901が、例えば、記憶部908に記憶されているプログラムを、入出力インタフェース905およびバス904を介して、RAM903にロードして実行することにより、上述した一連の処理が行われる。
【0095】
コンピュータ(CPU901)が実行するプログラムは、例えば、磁気ディスク(フレキシブルディスクを含む)、光ディスク(CD-ROM(Compact Disc-Read Only Memory),DVD(Digital Versatile Disc)等)、光磁気ディスク、もしくは半導体メモリ等よりなるパッケージメディアであるリムーバブルメディア911に記録して、あるいは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供される。
【0096】
そして、プログラムは、リムーバブルメディア911をドライブ910に装着することにより、入出力インタフェース905を介して、記憶部908にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部909で受信し、記憶部908にインストールすることができる。その他、プログラムは、ROM902や記憶部908に、あらかじめインストールしておくことができる。
【0097】
なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
【0098】
また、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。
【0099】
さらに、本技術は以下のような構成をとることができる。
(1) 画像における文字列領域に対して文字認識処理を行う文字認識処理部と、
前記文字認識処理部によって文字認識された文字列から、前記文字列に関する情報である文字列情報を抽出する文字列情報抽出部と、
前記文字列情報抽出部によって抽出された文字列情報に応じた文字フォントの表示用文字列を生成する表示用文字列生成部と、
前記表示用文字列を、前記画像における前記文字列領域の近傍に表示するよう制御する表示制御部と
を備える情報処理装置。
(2) 前記文字列情報抽出部は、前記文字列情報として、前記文字列における文字それぞれの文字サイズおよび文字コードを抽出し、
前記表示用文字列生成部は、前記文字サイズに基づいて前記文字フォントを決定し、前記文字コードに基づいて、前記文字フォントの前記表示用文字列を生成する
(1)に記載の情報処理装置。
(3) 前記文字列情報抽出部は、前記文字列情報として、前記画像における前記文字列領域の位置を抽出し、
前記表示制御部は、前記文字列領域の位置に基づいて、前記表示用文字列を、前記画像における前記文字列領域の近傍に表示させる
(1)または(2)に記載の情報処理装置。
(4) 前記文字列情報抽出部は、前記文字列情報として、前記画像の所定方向に対する前記文字列領域の傾きを抽出し、
前記表示制御部は、前記文字列領域が前記画像の所定方向に対して傾いている場合、傾きを補正した前記文字列領域の画像を表示させるとともに、前記表示用文字列を、傾きが補正された前記文字列領域の画像の近傍に表示させる
(1)または(2)に記載の情報処理装置。
(5) 前記画像における前記文字列領域の色を識別する色識別部をさらに備え、
前記表示用文字列生成部は、前記色識別部によって識別された前記文字列領域の色に基づいて、前記文字フォントの表示用文字列を生成する
(1)乃至(4)のいずれかに記載の情報処理装置。
(6) 前記色識別部は、前記文字列領域における文字部分の色、および前記文字部分以外の背景部分の色を識別し、
前記表示用文字列生成部は、前記文字部分の色および前記背景部分の色に基づいて、前記文字フォントの表示用文字列を生成する
(5)に記載の情報処理装置。
(7) 画像における文字列領域に対して文字認識処理を行う文字認識処理ステップと、
前記文字認識処理ステップの処理によって文字認識された文字列から、前記文字列に関する情報である文字列情報を抽出する文字列情報抽出ステップと、
前記文字列情報抽出ステップの処理によって抽出された文字列情報に応じた文字フォントの表示用文字列を生成する表示用文字列生成ステップと、
前記表示用文字列を、前記画像における前記文字列領域の近傍に表示する表示ステップと
を含む情報処理方法。
(8) 画像における文字列領域に対して文字認識処理を行う文字認識処理ステップと、
前記文字認識処理ステップの処理によって文字認識された文字列から、前記文字列に関する情報である文字列情報を抽出する文字列情報抽出ステップと、
前記文字列情報抽出ステップの処理によって抽出された文字列情報に応じた文字フォントの表示用文字列を生成する表示用文字列生成ステップと、
前記表示用文字列を、前記画像における前記文字列領域の近傍に表示するよう制御する表示制御ステップと
を含む処理をコンピュータに実行させるプログラム。
(10) 被写体を撮像する撮像部と、
前記撮像部による撮像によって得られた撮像画像における文字列領域に対して文字認識処理を行う文字認識処理部と、
前記文字認識処理部によって文字認識された文字列から、前記文字列に関する情報である文字列情報を抽出する文字列情報抽出部と、
前記文字列情報抽出部によって抽出された文字列情報に応じた文字フォントの表示用文字列を生成する表示用文字列生成部と、
前記表示用文字列を、前記撮像画像における前記文字列領域の近傍に表示するよう制御する表示制御部と
を備える撮像装置。
【符号の説明】
【0100】
11 撮像装置, 31 レンズ, 32 撮像部, 33 文字列領域抽出部, 35 文字認識処理部, 36 文字列情報抽出部, 37 文字列領域色識別部, 38 表示用文字列生成部, 39 表示制御部, 40 表示部
【技術分野】
【0001】
本技術は、情報処理装置および方法、プログラム、並びに撮像装置に関し、特に、文字認識処理の結果を確認することができるようにする情報処理装置および方法、プログラム、並びに撮像装置に関する。
【背景技術】
【0002】
従来、画像に含まれる文字列の文字を認識する文字認識処理を行い、その文字認識処理の結果を、その文字列を含む画像上の所定の位置に表示する技術がある(例えば、特許文献1,2参照)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2000−207487号公報
【特許文献2】特開2004−206548号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、上述した技術においては、画像に含まれる文字列の位置と、文字認識処理の結果としての文字列の位置とが離れていたり、画像に含まれる文字列の書体とは異なる書体で、文字認識処理の結果としての文字列が表示されていた。
【0005】
したがって、画像に含まれる文字列と、文字認識処理の結果としての文字列とを比較しにくく、文字認識処理の結果に、誤認識された文字が含まれていたとしても、ユーザは、その誤認識された文字に気づかない恐れがあった。
【0006】
本技術は、このような状況に鑑みてなされたものであり、文字認識処理の結果をより容易に確認することができるようにするものである。
【課題を解決するための手段】
【0007】
本技術の一側面の情報処理装置は、画像における文字列領域に対して文字認識処理を行う文字認識処理部と、前記文字認識処理部によって文字認識された文字列から、前記文字列に関する情報である文字列情報を抽出する文字列情報抽出部と、前記文字列情報抽出部によって抽出された文字列情報に応じた文字フォントの表示用文字列を生成する表示用文字列生成部と、前記表示用文字列を、前記画像における前記文字列領域の近傍に表示するよう制御する表示制御部とを備える。
【0008】
前記文字列情報抽出部には、前記文字列情報として、前記文字列における文字それぞれの文字サイズおよび文字コードを抽出させ、前記表示用文字列生成部には、前記文字サイズに基づいて前記文字フォントを決定し、前記文字コードに基づいて、前記文字フォントの前記表示用文字列を生成させることができる。
【0009】
前記文字列情報抽出部には、前記文字列情報として、前記画像における前記文字列領域の位置を抽出させ、前記表示制御部には、前記文字列領域の位置に基づいて、前記表示用文字列を、前記画像における前記文字列領域の近傍に表示するよう制御させることができる。
【0010】
前記文字列情報抽出部には、前記文字列情報として、前記画像の所定方向に対する前記文字列領域の傾きを抽出させ、前記表示制御部には、前記文字列領域が前記画像の所定方向に対して傾いている場合、傾きを補正した前記文字列領域の画像を表示するよう制御させるとともに、前記表示用文字列を、傾きが補正された前記文字列領域の画像の近傍に表示するよう制御させることができる。
【0011】
前記情報処理装置には、前記画像における前記文字列領域の色を識別する色識別部をさらに設け、前記表示用文字列生成部には、前記色識別部によって識別された前記文字列領域の色に基づいて、前記文字フォントの表示用文字列を生成させることができる。
【0012】
前記色識別部には、前記文字列領域における文字部分の色、および前記文字部分以外の背景部分の色を識別させ、前記表示用文字列生成部には、前記文字部分の色および前記背景部分の色に基づいて、前記文字フォントの表示用文字列を生成させることができる。
【0013】
本技術の一側面の情報処理方法は、画像における文字列領域に対して文字認識処理を行う文字認識処理ステップと、前記文字認識処理ステップの処理によって文字認識された文字列から、前記文字列に関する情報である文字列情報を抽出する文字列情報抽出ステップと、前記文字列情報抽出ステップの処理によって抽出された文字列情報に応じた文字フォントの表示用文字列を生成する表示用文字列生成ステップと、前記表示用文字列を、前記画像における前記文字列領域の近傍に表示する表示ステップとを含む。
【0014】
本技術の一側面のプログラムは、画像における文字列領域に対して文字認識処理を行う文字認識処理ステップと、前記文字認識処理ステップの処理によって文字認識された文字列から、前記文字列に関する情報である文字列情報を抽出する文字列情報抽出ステップと、前記文字列情報抽出ステップの処理によって抽出された文字列情報に応じた文字フォントの表示用文字列を生成する表示用文字列生成ステップと、前記表示用文字列を、前記画像における前記文字列領域の近傍に表示するよう制御する表示制御ステップとを含む処理をコンピュータに実行させる。
【0015】
本技術の一側面の撮像装置は、被写体を撮像する撮像部と、前記撮像部による撮像によって得られた撮像画像における文字列領域に対して文字認識処理を行う文字認識処理部と、前記文字認識処理部によって文字認識された文字列から、前記文字列に関する情報である文字列情報を抽出する文字列情報抽出部と、前記文字列情報抽出部によって抽出された文字列情報に応じた文字フォントの表示用文字列を生成する表示用文字列生成部と、前記表示用文字列を、前記撮像画像における前記文字列領域の近傍に表示するよう制御する表示制御部とを備える。
【0016】
本技術の一側面においては、画像における文字列領域に対して文字認識処理が行われ、文字認識された文字列から、文字列に関する情報である文字列情報が抽出され、抽出された文字列情報に応じた文字フォントの表示用文字列が生成され、表示用文字列が、画像における文字列領域の近傍に表示されるよう制御される。
【発明の効果】
【0017】
本技術の一側面によれば、文字認識処理の結果をより容易に確認することが可能となる。
【図面の簡単な説明】
【0018】
【図1】本技術を適用した情報処理装置としての撮像装置の一実施の形態の機能構成例を示すブロック図である。
【図2】文字列情報抽出部の機能構成例を示すブロック図である。
【図3】文字列領域色識別部の機能構成例を示すブロック図である。
【図4】表示用文字列生成部の機能構成例を示すブロック図である。
【図5】認識文字列表示処理について説明するフローチャートである。
【図6】文字列情報抽出処理について説明するフローチャートである。
【図7】文字列情報について説明する図である。
【図8】文字列情報の構成を示す図である。
【図9】文字列領域色識別処理について説明するフローチャートである。
【図10】表示用文字列生成処理について説明するフローチャートである。
【図11】表示用文字列の表示の例について説明する図である。
【図12】表示用文字列の表示の例について説明する図である。
【図13】コンピュータのハードウェアの構成例を示すブロック図である。
【発明を実施するための形態】
【0019】
以下、本技術の実施の形態について図を参照して説明する。なお、説明は以下の順序で行う。
1.撮像装置の機能構成
2.認識文字列表示処理
【0020】
<1.撮像装置の機能構成>
図1は、本技術を適用した情報処理装置としての撮像装置の一実施の形態の構成を示している。
【0021】
図1の撮像装置11は、例えば、デジタルスチルカメラとして構成され、ユーザの操作にしたがって、被写体を撮像し、その被写体の撮像画像(静止画像)を蓄積したり、ユーザに提示する。また、撮像装置11は、ユーザの操作にしたがって、撮像画像に含まれる文字列に対して文字認識処理を行い、文字認識処理の結果をユーザに提示する。なお、撮像装置11は、被写体の撮像画像として、動画像を蓄積したり、ユーザに提示するデジタルビデオカメラとして構成されるようにしてもよい。
【0022】
図1の撮像装置11は、レンズ31、撮像部32、文字列領域抽出部33、文字パターンデータベース34、文字認識処理部35、文字列情報抽出部36、文字列領域色識別部37、表示用文字列生成部38、表示制御部39、および表示部40から構成される。
【0023】
撮像部32は、撮像素子やA/D(Analog/Digital)変換部を含むように構成され、レンズ31からの光を受光して光電変換することにより被写体を撮像し、得られたアナログの画像信号をA/D変換する。撮像部32は、A/D変換の結果得られたデジタルの画像データ(以下、撮像画像という)を文字列領域抽出部33および表示制御部39に供給する。
【0024】
文字列領域抽出部33は、被写体の撮像時に、図示せぬ操作部に対するユーザの操作によって設定される、認識対象となる文字列を含む領域(文字列領域)の画像(文字列領域画像)を、撮像部32からの撮像画像から抽出し、文字認識処理部35および表示制御部39に供給する。
【0025】
文字パターンデータベース34は、文字認識処理部35によって行われる文字認識処理の結果となる文字の候補である文字パターンを記憶している。
【0026】
文字認識処理部35は、文字パターンデータベース34に記憶されている文字パターンを用いて、文字列領域抽出部33からの文字列領域画像に対して文字認識処理を行い、その文字認識処理の結果を文字列領域画像とともに、文字列情報抽出部36および文字列領域色識別部37に供給する。
【0027】
文字列情報抽出部36は、文字認識処理部35からの文字認識処理の結果に基づいて、文字認識処理部35からの文字列領域画像から、文字認識された文字列に関する情報である文字列情報を抽出し、表示用文字列生成部38および表示制御部39に供給する。
【0028】
文字列領域色識別部37は、文字認識処理部35からの文字認識処理の結果と文字列領域画像とに基づいて、文字列領域の色を識別し、識別された色を示す情報である文字列領域色情報を、表示用文字列生成部38に供給する。
【0029】
表示用文字列生成部38は、文字列領域色識別部37からの文字列領域色情報に基づいて、文字列情報抽出部36からの文字列情報に応じた文字フォントの文字列である表示用文字列を生成し、表示制御部39に供給する。ここで、文字フォントは、文字の書体を表すデータ(書体データ)を示すものとする。
【0030】
表示制御部39は、表示用文字列生成部38からの表示用文字列を、撮像部32からの撮像画像における文字列領域の近傍に表示するように、表示部40の表示を制御する。
【0031】
表示部40は、表示制御部39の制御の下、表示用文字列が重畳された撮影画像を表示する。
【0032】
[文字列情報抽出部の構成]
ここで、図2を参照して、文字列情報抽出部36の構成について説明する。
【0033】
図2の文字列情報抽出部36は、文字列サイズ測定部51、文字列位置測定部52、文字サイズ測定部53、文字コード化処理部54、および文字列情報生成部55から構成される。
【0034】
文字列サイズ測定部51は、文字認識処理部35からの文字列領域画像に基づいて、撮像画像における文字列領域のサイズ(文字列サイズ)を測定し、文字列情報生成部55に供給する。
【0035】
文字列位置測定部52は、文字認識処理部35からの文字列領域画像に基づいて、撮像画像における文字列領域の位置(文字列位置)を測定し、文字列情報生成部55に供給する。
【0036】
文字サイズ測定部53は、文字認識処理部35からの文字認識処理の結果および文字列領域画像に基づいて、文字列領域画像における文字列の文字それぞれのサイズ(文字サイズ)を測定し、文字列情報生成部55に供給する。
【0037】
文字コード化処理部54は、文字認識処理部35からの文字認識処理の結果および文字列領域画像に基づいて、文字列領域画像における文字列の文字それぞれを、所定の文字コードに変換し、文字列情報生成部55に供給する。
【0038】
文字列情報生成部55は、文字列サイズ測定部51からの文字列サイズ、文字列位置測定部52からの文字列位置、文字サイズ測定部53からの文字サイズ、および文字コード化処理部54からの文字コードを構成要素とする文字列情報を生成する。
【0039】
[文字列領域色識別部の構成]
次に、図3を参照して、文字列領域色識別部37の構成について説明する。
【0040】
図3の文字列領域色識別部37は、文字色判定部71、背景色判定部72、および文字列領域色情報生成部73から構成される。
【0041】
文字色判定部71は、文字認識処理部35からの文字認識処理の結果および文字列領域画像に基づいて、文字列領域における文字列の文字部分の色を判定し、判定された文字部分の色を表す文字色情報を文字列領域色情報生成部73に供給する。
【0042】
背景色判定部72は、文字認識処理部35からの文字認識処理の結果および文字列領域画像に基づいて、文字列領域における文字列の文字部分以外の背景部分の色を判定し、判定された背景部分の色を表す背景色情報を文字列領域色情報生成部73に供給する。
【0043】
文字列領域色情報生成部73は、文字色判定部71からの文字色情報および背景色判定部72からの背景色情報を構成要素とする文字列領域色情報を生成する。
【0044】
[表示用文字列生成部の構成]
次に、図4を参照して、表示用文字列生成部38の構成について説明する。
【0045】
図4の表示用文字列生成部38は、文字フォント決定部91および文字列生成部92から構成される。
【0046】
文字フォント決定部91は、文字列情報抽出部36からの文字列情報に基づいて、表示用文字列の文字フォントを決定し、文字列生成部92に供給する。
【0047】
文字列生成部92は、文字フォント決定部91からの文字フォント、文字列情報抽出部36からの文字列情報、および文字列領域色識別部37からの文字列領域色情報に基づいて、表示用文字列を生成する。
【0048】
<2.認識文字列表示処理>
次に、図5を参照して、撮像装置11による認識文字列表示処理について説明する。
【0049】
撮像装置11の動作モードが被写体を撮像する撮像モードで、表示部40において、撮像対象となる被写体をユーザに確認させるためのスルー画像上に、文字列領域として設定された領域を示す枠が表示され、その枠内に所定の文字列が含まれた状態で、ユーザにより、例えば、図示せぬシャッタボタンが半押しされることで、認識文字列表示処理が開始される。
【0050】
ステップS11において、撮像部32は、ユーザによりシャッタボタンが半押しされたときの被写体を撮像し、得られた撮像画像を、文字列領域抽出部33および表示制御部39に供給する。
【0051】
ステップS12において、文字列領域抽出部33は、撮像部32からの撮像画像において、文字列領域の文字列領域画像を抽出し、文字認識処理部35および表示制御部39に供給する。
【0052】
ステップS13において、文字認識処理部35は、文字パターンデータベース34に記憶されている文字パターンを用いて、文字列領域抽出部33からの文字列領域画像に対して文字認識処理を行い、その文字認識処理の結果を文字列領域画像とともに、文字列情報抽出部36および文字列領域色識別部37に供給する。
【0053】
ステップS14において、文字列情報抽出部36は、文字認識処理部35からの文字認識処理の結果に基づいて、文字認識処理部35からの文字列領域画像から文字列情報を抽出する文字列情報抽出処理を実行する。
【0054】
[文字列情報抽出処理の例]
ここで、図6のフローチャートを参照して、文字列情報抽出部36による文字列情報抽出処理について説明する。
【0055】
ステップS31において、文字列サイズ測定部51は、文字認識処理部35からの文字列領域画像に基づいて、撮像画像における文字列領域のサイズ(文字列サイズ)として、文字列領域の高さ、幅、および傾きを測定し、文字列情報生成部55に供給する。
【0056】
図7は、撮像装置11の表示部40において、撮像画像(スルー画像)に設定された文字列領域の例を示している。図7においては、文字列領域を示す枠150内には、「DSG−TX7」の文字列が含まれている。
【0057】
すなわち、ステップS31においては、例えば、文字列領域の高さおよび幅として、図7Aに示される、文字列領域を示す枠150の高さおよび幅が測定される。また、例えば、文字列領域の傾きとしては、図7Bに示されるように、撮像画像の水平方向に対する、文字列領域を示す枠150の傾きが測定される。
【0058】
次に、ステップS32において、文字列位置測定部52は、文字認識処理部35からの文字列領域画像に基づいて、撮像画像における文字列領域の位置(文字列位置)として、図7Aに示されるように、表示部40(撮像画像)の左上の頂点を原点としたときの、文字列領域を示す枠150の左上の頂点の位置(縦位置および横位置)を測定し、文字列情報生成部55に供給する。なお、文字列位置は、撮像画像における文字列領域の位置を特定するものであればよく、文字列領域を示す枠150の左上の頂点以外の位置であってもよい。
【0059】
ステップS33において、文字サイズ測定部53は、文字認識処理部35からの文字認識処理の結果および文字列領域画像に基づいて、文字列領域画像における文字列の文字それぞれのサイズ(文字サイズ)として、文字列の文字それぞれの高さおよび幅を測定し、文字列情報生成部55に供給する。
【0060】
すなわち、ステップS33においては、例えば、図7Aの右側に示されるように、文字認識処理された文字列「DSG−TX7」の文字「D」、「S」、「G」、「−」、「T」、「X」、「7」それぞれ高さおよび幅が測定される。
【0061】
ステップS34において、文字コード化処理部54は、文字認識処理部35からの文字認識処理の結果および文字列領域画像に基づいて、例えば、図7に示される、文字認識処理された文字列「DSG−TX7」の文字「D」、「S」、「G」、「−」、「T」、「X」、「7」それぞれを、例えばUnicode等の文字コードに変換し、文字列情報生成部55に供給する。
【0062】
ステップS35において、文字列情報生成部55は、文字列サイズ測定部51からの文字列サイズ、文字列位置測定部52からの文字列位置、文字サイズ測定部53からの文字サイズ、および文字コード化処理部54からの文字コードを構成要素とする文字列情報を生成する。
【0063】
図8は、文字列情報生成部55によって生成される文字列情報の構成例を示している。
【0064】
図8に示されるように、文字列情報は、文字列の高さ、幅、および傾きからなる文字列サイズ、文字列位置、文字の高さおよび幅からなる文字サイズ、並びに文字コードから構成される。図8の文字列情報においては、文字サイズおよび文字コードは、文字列に含まれるn個の文字それぞれについて存在する。
【0065】
このようにして生成された文字列情報は、表示用文字列生成部38および表示制御部39に供給され、処理は、図5のフローチャートのステップS14に戻る。
【0066】
ステップS14の後、処理はステップS15に進み、文字列領域色識別部37は、文字認識処理部35からの文字認識処理の結果と文字認識処理部35からの文字列領域画像とに基づいて、文字列領域色識別処理を実行し、文字列領域色情報を生成する。
【0067】
[文字列情報抽出処理の例]
ここで、図9のフローチャートを参照して、文字列領域色識別部37による文字列領域色識別処理について説明する。
【0068】
ステップS51において、文字色判定部71は、文字認識処理部35からの文字認識処理の結果および文字列領域画像に基づいて、文字列領域における文字列の文字部分の色を判定し、判定された文字部分の色を表す文字色情報を文字列領域色情報生成部73に供給する。
【0069】
ステップS52において、背景色判定部72は、文字認識処理部35からの文字認識処理の結果および文字列領域画像に基づいて、文字列領域における文字列の文字部分以外の背景部分の色を判定し、判定された背景部分の色を表す背景色情報を文字列領域色情報生成部73に供給する。
【0070】
ステップS53において、文字列領域色情報生成部73は、文字色判定部71からの文字色情報および背景色判定部72からの背景色情報を構成要素とする文字列領域色情報を生成する。
【0071】
このようにして生成された文字列領域色情報は、表示用文字列生成部38に供給され、処理は、図5のフローチャートのステップS15に戻る。
【0072】
ステップS15の後、処理はステップS16に進み、表示用文字列生成部38は、文字列領域色識別部37からの文字列領域色情報に基づいて、文字列情報抽出部36からの文字列情報に応じた文字フォントの文字列である表示用文字列を生成する表示用文字列生成処理を実行する。
【0073】
[表示用文字列生成処理の例]
ここで、図10のフローチャートを参照して、表示用文字列生成部38による表示用文字列生成処理について説明する。
【0074】
ステップS71において、文字フォント決定部91は、文字列情報抽出部36からの文字列情報に基づいて、表示用文字列の文字フォントを決定し、文字列生成部92に供給する。
【0075】
具体的には、文字フォント決定部91は、文字列情報における文字列の文字それぞれの文字サイズ(高さおよび幅)および文字コードに基づいて、文字列領域の文字の縦横比に近似し、文字列領域の文字の高さが略一致する文字フォントを決定する。
【0076】
ステップS72において、文字列生成部92は、文字フォント決定部91からの文字フォント、文字列情報抽出部36からの文字列情報、および文字列領域色認識部37からの文字列領域色情報に基づいて、表示用文字列を生成する。
【0077】
具体的には、文字列生成部92は、文字列情報抽出部36からの文字列情報における文字列の文字それぞれの文字コードに基づいて、文字フォント決定部91からの文字フォントの文字列である表示用文字列を生成する。また、文字列生成部92は、文字列情報の文字列サイズ(高さおよび幅)に基づいて、表示用文字列を表示するための表示領域を設定する。そして、文字列生成部92は、表示領域における表示用文字列の文字の色を、文字列領域色識別部37からの文字列領域色情報の文字色情報で表わされる色とし、表示領域における表示用文字列の背景の色を、文字列領域色情報の背景色情報で表わされる色とした表示用文字列画像を生成する。
【0078】
このようにして生成された表示用文字列(表示用文字列画像)は、表示制御部39に供給され、処理は、図5のフローチャートのステップS16に戻る。
【0079】
ステップS16の後、処理はステップS17に進み、表示制御部39は、表示用文字列生成部38からの表示用文字列(表示用文字列画像)を、撮像画像における文字列領域の近傍に表示するように、表示部40の表示を制御する。
【0080】
具体的には、表示制御部39は、文字列情報の文字列位置に基づいて、表示用文字列生成部38からの表示用文字列画像を、撮像画像における文字列領域に並べて表示するように、表示部40の表示を制御する。
【0081】
例えば、図11に示されるように、表示部40において、撮像画像における文字列領域を示す枠150内の文字列の最初の文字「D」と、表示用文字列画像200における最初の文字「D」の水平方向の位置が揃うように、表示用文字列画像200が、文字列領域を示す枠150内の下側に配置され表示される。
【0082】
また、文字列情報抽出部36からの文字列情報の文字列サイズにおいて、文字列の傾きがある場合、すなわち、図7Bで説明したように、撮像画像の水平方向に対して文字列領域を示す枠150が傾いている場合、表示制御部39は、表示用文字列生成部38からの表示用文字列(表示用文字列画像)を、文字列領域抽出部33からの文字列領域画像の傾きを補正した傾き補正文字列領域画像の近傍に表示するように、表示部40の表示を制御する。
【0083】
例えば、図12に示されるように、表示部40において、撮像画像における文字列領域を示す枠150で示される文字列領域画像の傾きを補正した傾き補正文字列領域画像250が、撮像画像の所定の位置に表示され、傾き補正文字列領域画像250における文字列の最初の文字「D」と、表示用文字列画像200における最初の文字「D」の水平方向の位置が揃うように、表示用文字列画像200が、傾き補正文字列領域画像250の下側に配置され表示される。
【0084】
なお、表示用文字列画像200は、文字列領域を示す枠150内や傾き補正文字列領域画像250の下側に配置されるようにしたが、例えば、それぞれの上側等、文字列領域の文字列と表示用文字列画像200の文字列とを比較しやすくなる位置に配置されればよい。
【0085】
以上の処理によれば、撮像画像において、文字認識処理が行われた文字列領域の近傍に、文字認識された文字列の文字のサイズに応じた文字フォントの文字列が表示されるようになる。これにより、画像に含まれる文字列と、文字認識処理の結果としての文字列とを比較しやすくなり、ユーザは、文字認識処理の結果を容易に確認することができるようになる。したがって、例えば、文字認識処理の結果に、誤認識された文字が含まれていたとしても、ユーザは、その誤認識された文字を簡単に見つけること可能となる。
【0086】
また、表示用文字列画像における文字部分の色および背景部分の色を、それぞれ、撮像画像における文字列領域画像の文字部分の色および背景部分の色とすることで、画像に含まれる文字列と、文字認識処理の結果としての文字列をより比較しやすくなるので、ユーザに、文字認識処理の結果をより容易に確認させることができるようになる。
【0087】
なお、文字列領域画像や撮像画像全体が、白黒画像かまたはそれに近い場合には、撮像装置11において、文字列領域色識別部37を設けないようにし、文字列領域色識別処理を行わないようにしてもよい。
【0088】
また、以上においては、文字列領域は、撮像時にユーザにより設定されるものとしたが、スルー画像に含まれる複数の文字列を認識し、その中で所定の条件を満たす文字列が含まれる領域を文字列領域として設定するようにしてもよい。
【0089】
さらに、以上においては、本技術を、撮像部を備える撮像装置に適用した構成について説明したが、撮像装置に限らず、本技術を、入力された画像に対して所定の処理を施して表示する情報処理装置に適用することができる。
【0090】
上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータ等に、プログラム記録媒体からインストールされる。
【0091】
図13は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示すブロック図である。
【0092】
コンピュータにおいて、CPU(Central Processing Unit)901,ROM(Read Only Memory)902,RAM(Random Access Memory)903は、バス904により相互に接続されている。
【0093】
バス904には、さらに、入出力インタフェース905が接続されている。入出力インタフェース905には、キーボード、マウス、マイクロホン等よりなる入力部906、ディスプレイ、スピーカ等よりなる出力部907、ハードディスクや不揮発性のメモリ等よりなる記憶部908、ネットワークインタフェース等よりなる通信部909、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリ等のリムーバブルメディア911を駆動するドライブ910が接続されている。
【0094】
以上のように構成されるコンピュータでは、CPU901が、例えば、記憶部908に記憶されているプログラムを、入出力インタフェース905およびバス904を介して、RAM903にロードして実行することにより、上述した一連の処理が行われる。
【0095】
コンピュータ(CPU901)が実行するプログラムは、例えば、磁気ディスク(フレキシブルディスクを含む)、光ディスク(CD-ROM(Compact Disc-Read Only Memory),DVD(Digital Versatile Disc)等)、光磁気ディスク、もしくは半導体メモリ等よりなるパッケージメディアであるリムーバブルメディア911に記録して、あるいは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供される。
【0096】
そして、プログラムは、リムーバブルメディア911をドライブ910に装着することにより、入出力インタフェース905を介して、記憶部908にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部909で受信し、記憶部908にインストールすることができる。その他、プログラムは、ROM902や記憶部908に、あらかじめインストールしておくことができる。
【0097】
なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
【0098】
また、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。
【0099】
さらに、本技術は以下のような構成をとることができる。
(1) 画像における文字列領域に対して文字認識処理を行う文字認識処理部と、
前記文字認識処理部によって文字認識された文字列から、前記文字列に関する情報である文字列情報を抽出する文字列情報抽出部と、
前記文字列情報抽出部によって抽出された文字列情報に応じた文字フォントの表示用文字列を生成する表示用文字列生成部と、
前記表示用文字列を、前記画像における前記文字列領域の近傍に表示するよう制御する表示制御部と
を備える情報処理装置。
(2) 前記文字列情報抽出部は、前記文字列情報として、前記文字列における文字それぞれの文字サイズおよび文字コードを抽出し、
前記表示用文字列生成部は、前記文字サイズに基づいて前記文字フォントを決定し、前記文字コードに基づいて、前記文字フォントの前記表示用文字列を生成する
(1)に記載の情報処理装置。
(3) 前記文字列情報抽出部は、前記文字列情報として、前記画像における前記文字列領域の位置を抽出し、
前記表示制御部は、前記文字列領域の位置に基づいて、前記表示用文字列を、前記画像における前記文字列領域の近傍に表示させる
(1)または(2)に記載の情報処理装置。
(4) 前記文字列情報抽出部は、前記文字列情報として、前記画像の所定方向に対する前記文字列領域の傾きを抽出し、
前記表示制御部は、前記文字列領域が前記画像の所定方向に対して傾いている場合、傾きを補正した前記文字列領域の画像を表示させるとともに、前記表示用文字列を、傾きが補正された前記文字列領域の画像の近傍に表示させる
(1)または(2)に記載の情報処理装置。
(5) 前記画像における前記文字列領域の色を識別する色識別部をさらに備え、
前記表示用文字列生成部は、前記色識別部によって識別された前記文字列領域の色に基づいて、前記文字フォントの表示用文字列を生成する
(1)乃至(4)のいずれかに記載の情報処理装置。
(6) 前記色識別部は、前記文字列領域における文字部分の色、および前記文字部分以外の背景部分の色を識別し、
前記表示用文字列生成部は、前記文字部分の色および前記背景部分の色に基づいて、前記文字フォントの表示用文字列を生成する
(5)に記載の情報処理装置。
(7) 画像における文字列領域に対して文字認識処理を行う文字認識処理ステップと、
前記文字認識処理ステップの処理によって文字認識された文字列から、前記文字列に関する情報である文字列情報を抽出する文字列情報抽出ステップと、
前記文字列情報抽出ステップの処理によって抽出された文字列情報に応じた文字フォントの表示用文字列を生成する表示用文字列生成ステップと、
前記表示用文字列を、前記画像における前記文字列領域の近傍に表示する表示ステップと
を含む情報処理方法。
(8) 画像における文字列領域に対して文字認識処理を行う文字認識処理ステップと、
前記文字認識処理ステップの処理によって文字認識された文字列から、前記文字列に関する情報である文字列情報を抽出する文字列情報抽出ステップと、
前記文字列情報抽出ステップの処理によって抽出された文字列情報に応じた文字フォントの表示用文字列を生成する表示用文字列生成ステップと、
前記表示用文字列を、前記画像における前記文字列領域の近傍に表示するよう制御する表示制御ステップと
を含む処理をコンピュータに実行させるプログラム。
(10) 被写体を撮像する撮像部と、
前記撮像部による撮像によって得られた撮像画像における文字列領域に対して文字認識処理を行う文字認識処理部と、
前記文字認識処理部によって文字認識された文字列から、前記文字列に関する情報である文字列情報を抽出する文字列情報抽出部と、
前記文字列情報抽出部によって抽出された文字列情報に応じた文字フォントの表示用文字列を生成する表示用文字列生成部と、
前記表示用文字列を、前記撮像画像における前記文字列領域の近傍に表示するよう制御する表示制御部と
を備える撮像装置。
【符号の説明】
【0100】
11 撮像装置, 31 レンズ, 32 撮像部, 33 文字列領域抽出部, 35 文字認識処理部, 36 文字列情報抽出部, 37 文字列領域色識別部, 38 表示用文字列生成部, 39 表示制御部, 40 表示部
【特許請求の範囲】
【請求項1】
画像における文字列領域に対して文字認識処理を行う文字認識処理部と、
前記文字認識処理部によって文字認識された文字列から、前記文字列に関する情報である文字列情報を抽出する文字列情報抽出部と、
前記文字列情報抽出部によって抽出された文字列情報に応じた文字フォントの表示用文字列を生成する表示用文字列生成部と、
前記表示用文字列を、前記画像における前記文字列領域の近傍に表示するよう制御する表示制御部と
を備える情報処理装置。
【請求項2】
前記文字列情報抽出部は、前記文字列情報として、前記文字列における文字それぞれの文字サイズおよび文字コードを抽出し、
前記表示用文字列生成部は、前記文字サイズに基づいて前記文字フォントを決定し、前記文字コードに基づいて、前記文字フォントの前記表示用文字列を生成する
請求項1に記載の情報処理装置。
【請求項3】
前記文字列情報抽出部は、前記文字列情報として、前記画像における前記文字列領域の位置を抽出し、
前記表示制御部は、前記文字列領域の位置に基づいて、前記表示用文字列を、前記画像における前記文字列領域の近傍に表示するよう制御する
請求項1に記載の情報処理装置。
【請求項4】
前記文字列情報抽出部は、前記文字列情報として、前記画像の所定方向に対する前記文字列領域の傾きを抽出し、
前記表示制御部は、前記文字列領域が前記画像の所定方向に対して傾いている場合、傾きを補正した前記文字列領域の画像を表示するよう制御するとともに、前記表示用文字列を、傾きが補正された前記文字列領域の画像の近傍に表示するよう制御する
請求項1に記載の情報処理装置。
【請求項5】
前記画像における前記文字列領域の色を識別する色識別部をさらに備え、
前記表示用文字列生成部は、前記色識別部によって識別された前記文字列領域の色に基づいて、前記文字フォントの表示用文字列を生成する
請求項1に記載の情報処理装置。
【請求項6】
前記色識別部は、前記文字列領域における文字部分の色、および前記文字部分以外の背景部分の色を識別し、
前記表示用文字列生成部は、前記文字部分の色および前記背景部分の色に基づいて、前記文字フォントの表示用文字列を生成する
請求項5に記載の情報処理装置。
【請求項7】
画像における文字列領域に対して文字認識処理を行う文字認識処理ステップと、
前記文字認識処理ステップの処理によって文字認識された文字列から、前記文字列に関する情報である文字列情報を抽出する文字列情報抽出ステップと、
前記文字列情報抽出ステップの処理によって抽出された文字列情報に応じた文字フォントの表示用文字列を生成する表示用文字列生成ステップと、
前記表示用文字列を、前記画像における前記文字列領域の近傍に表示する表示ステップと
を含む情報処理方法。
【請求項8】
画像における文字列領域に対して文字認識処理を行う文字認識処理ステップと、
前記文字認識処理ステップの処理によって文字認識された文字列から、前記文字列に関する情報である文字列情報を抽出する文字列情報抽出ステップと、
前記文字列情報抽出ステップの処理によって抽出された文字列情報に応じた文字フォントの表示用文字列を生成する表示用文字列生成ステップと、
前記表示用文字列を、前記画像における前記文字列領域の近傍に表示するよう制御する表示制御ステップと
を含む処理をコンピュータに実行させるプログラム。
【請求項9】
被写体を撮像する撮像部と、
前記撮像部による撮像によって得られた撮像画像における文字列領域に対して文字認識処理を行う文字認識処理部と、
前記文字認識処理部によって文字認識された文字列から、前記文字列に関する情報である文字列情報を抽出する文字列情報抽出部と、
前記文字列情報抽出部によって抽出された文字列情報に応じた文字フォントの表示用文字列を生成する表示用文字列生成部と、
前記表示用文字列を、前記撮像画像における前記文字列領域の近傍に表示するよう制御する表示制御部と
を備える撮像装置。
【請求項1】
画像における文字列領域に対して文字認識処理を行う文字認識処理部と、
前記文字認識処理部によって文字認識された文字列から、前記文字列に関する情報である文字列情報を抽出する文字列情報抽出部と、
前記文字列情報抽出部によって抽出された文字列情報に応じた文字フォントの表示用文字列を生成する表示用文字列生成部と、
前記表示用文字列を、前記画像における前記文字列領域の近傍に表示するよう制御する表示制御部と
を備える情報処理装置。
【請求項2】
前記文字列情報抽出部は、前記文字列情報として、前記文字列における文字それぞれの文字サイズおよび文字コードを抽出し、
前記表示用文字列生成部は、前記文字サイズに基づいて前記文字フォントを決定し、前記文字コードに基づいて、前記文字フォントの前記表示用文字列を生成する
請求項1に記載の情報処理装置。
【請求項3】
前記文字列情報抽出部は、前記文字列情報として、前記画像における前記文字列領域の位置を抽出し、
前記表示制御部は、前記文字列領域の位置に基づいて、前記表示用文字列を、前記画像における前記文字列領域の近傍に表示するよう制御する
請求項1に記載の情報処理装置。
【請求項4】
前記文字列情報抽出部は、前記文字列情報として、前記画像の所定方向に対する前記文字列領域の傾きを抽出し、
前記表示制御部は、前記文字列領域が前記画像の所定方向に対して傾いている場合、傾きを補正した前記文字列領域の画像を表示するよう制御するとともに、前記表示用文字列を、傾きが補正された前記文字列領域の画像の近傍に表示するよう制御する
請求項1に記載の情報処理装置。
【請求項5】
前記画像における前記文字列領域の色を識別する色識別部をさらに備え、
前記表示用文字列生成部は、前記色識別部によって識別された前記文字列領域の色に基づいて、前記文字フォントの表示用文字列を生成する
請求項1に記載の情報処理装置。
【請求項6】
前記色識別部は、前記文字列領域における文字部分の色、および前記文字部分以外の背景部分の色を識別し、
前記表示用文字列生成部は、前記文字部分の色および前記背景部分の色に基づいて、前記文字フォントの表示用文字列を生成する
請求項5に記載の情報処理装置。
【請求項7】
画像における文字列領域に対して文字認識処理を行う文字認識処理ステップと、
前記文字認識処理ステップの処理によって文字認識された文字列から、前記文字列に関する情報である文字列情報を抽出する文字列情報抽出ステップと、
前記文字列情報抽出ステップの処理によって抽出された文字列情報に応じた文字フォントの表示用文字列を生成する表示用文字列生成ステップと、
前記表示用文字列を、前記画像における前記文字列領域の近傍に表示する表示ステップと
を含む情報処理方法。
【請求項8】
画像における文字列領域に対して文字認識処理を行う文字認識処理ステップと、
前記文字認識処理ステップの処理によって文字認識された文字列から、前記文字列に関する情報である文字列情報を抽出する文字列情報抽出ステップと、
前記文字列情報抽出ステップの処理によって抽出された文字列情報に応じた文字フォントの表示用文字列を生成する表示用文字列生成ステップと、
前記表示用文字列を、前記画像における前記文字列領域の近傍に表示するよう制御する表示制御ステップと
を含む処理をコンピュータに実行させるプログラム。
【請求項9】
被写体を撮像する撮像部と、
前記撮像部による撮像によって得られた撮像画像における文字列領域に対して文字認識処理を行う文字認識処理部と、
前記文字認識処理部によって文字認識された文字列から、前記文字列に関する情報である文字列情報を抽出する文字列情報抽出部と、
前記文字列情報抽出部によって抽出された文字列情報に応じた文字フォントの表示用文字列を生成する表示用文字列生成部と、
前記表示用文字列を、前記撮像画像における前記文字列領域の近傍に表示するよう制御する表示制御部と
を備える撮像装置。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【公開番号】特開2012−221095(P2012−221095A)
【公開日】平成24年11月12日(2012.11.12)
【国際特許分類】
【出願番号】特願2011−84501(P2011−84501)
【出願日】平成23年4月6日(2011.4.6)
【出願人】(000002185)ソニー株式会社 (34,172)
【Fターム(参考)】
【公開日】平成24年11月12日(2012.11.12)
【国際特許分類】
【出願日】平成23年4月6日(2011.4.6)
【出願人】(000002185)ソニー株式会社 (34,172)
【Fターム(参考)】
[ Back to top ]