説明

撮影操作誘導システム、撮影操作誘導方法および撮影操作誘導プログラム

【課題】撮影者の手間を煩わせることなく、認識アプリケーションで認識しやすい画像の撮影を可能にする。
【解決手段】画像を解析することにより認識の可否を判断するための指標を得る。認識可否判別手段122は、解析した指標を元に認識可否判別パラメータ記憶部132を参照し、認識可否の判断を行う。認識可能である場合、カメラパラメータを設定する。認識不可の場合、認識可能となるための変更カメラパラメータを算出する。画面表示手段124は変更カメラパラメータに基づき、誘導表示を画像データに重畳して出力する。撮影者は誘導表示に従って操作を行い、対象物体を撮影するだけで、認識しやすい画像を得ることができる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、撮影操作誘導システム、撮影操作誘導方法および撮影操作誘導プログラムに関し、特に認識しやすい画像を撮影するための、撮影操作誘導システム、撮影操作誘導方法および撮影操作誘導プログラムに関する。
【背景技術】
【0002】
これまで、カメラ付き携帯電話のようなカメラ付き携帯端末は、風景や人物の撮影といった用途で使われてきた。近年、カメラ付き携帯端末における情報処理能力の高性能化、高機能化等は目覚しく、こうした端末が、OCR(Optical Character Recognition)やバーコード読み取りなど(以下、認識アプリケーションと呼ぶ)の画像認識処理用途にも使われつつある。
【0003】
これらの認識アプリケーションが画像認識処理をするために必要とする入力画像の要件は、撮影者に意識されることが無いのが一般的であり、撮影者は、勘や経験等に基づいて、端末の位置等の撮影条件(カメラパラメータ)を調整し、利用する認識アプリケーションが必要とする要件を満たす入力画像を撮影していた。
【0004】
所望の画像を得るためには、端末の備えるカメラの機械的構造を改良し、撮影時のカメラパラメータを所望のものへと制御するアプローチもあるが、端末の小型化という制約条件の元では、機械的構造の複雑化というアプローチは敬遠されやすい。
【0005】
こうした状況の下、文字認識に対する入力画像として要件を満たす画像を撮影者に撮影させるため、撮影された画像中の所定の領域の大きさに基づいて撮影操作を誘導する手法が提案されている。
【0006】
例えば、特許文献1には、文字認識の対象となる画像の入力にあたり、入力されるべき文字のサイズを撮影者に表示する手法が記載されている。また、特許文献2では、OCRをするための対象領域を文字の連結成分の大きさから判定し、ガイド情報を表示することにより、撮影操作をサポートするガイド表示機能を実現している。
【0007】
一方、入力画像の要件として、合焦状態が着目されており、例えば、特許文献3には、「撮影者の操作によりピント調整された」撮影画像から微分画像データを作成し、その高域成分を示す画素値に応じて、所定の色を割り当てて表示する手段を備え、色の違いにより合焦状態を知らせる装置が記載されている。また、特許文献4には、「撮影者の操作によるピント調整」の合焦状態の表示を視覚的又は聴覚的に行う表示手段を備え、例えば、合焦状態を棒グラフやレベルメータ、数値、図形の個数、LEDの点滅ピッチ、音で示す方法が記載されている。

【特許文献1】特開平11−110536号公報 (0014段落〜0015段落、図2等)
【特許文献2】特開2004−213215号公報
【特許文献3】特開2002−196225号公報
【特許文献4】特開2006−166451号公報
【発明の開示】
【発明が解決しようとする課題】
【0008】
第1の問題点は、撮影された画像が領域の大きさや合焦状態を満たすものであっても、必ずしも撮影された画像は認識できる要件を満たすわけではないことである。
【0009】
例えば、特許文献3、4に記載の画像の高域成分量で判断する合焦状態の場合、高域成分が増加し続けていても合焦状態と判断されるが、高域成分が増加するにつれ、画像には高周波ノイズが付加される場合がある。その結果、高周波ノイズの影響で画質が乱れ、認識不可の原因になり得る。また、入力画像の画像解像度の不足や、コントラストの不十分、位置合わせ、その他の要因によって認識できないことがある。
【0010】
第2の問題点は、認識アプリケーションが認識できる要件を満たす画像を撮影するための具体的な撮影操作を、撮影者が分からないことである。
【0011】
特許文献3、4に記載の、色の違いによる合焦状態の表示や、棒グラフや音による合焦状態を確認するだけでは、撮影者が撮影端末をどの位置までどのくらい動かせばよいか分からないので、経験則的に上下左右に端末を動かさなければならない。また、特許文献2は、認識できない場合の判定結果をガイド情報として提示しているのみであり、撮影者に具体的な撮影操作を誘導するための誘導表示を提示しているわけではない。
[発明の目的]
本発明は、このような課題に鑑みてなされたものであって、認識アプリケーションの認識処理の要件を満たす画像を撮影するための操作を、撮影者が、容易に把握することのできる撮影操作誘導システムを提供することにある。
【0012】
本発明の他の目的は、要件を満たす画像を撮影するための操作を簡易化する撮影操作誘導システムを提供することにある。
【課題を解決するための手段】
【0013】
上記課題を解決するべく本願に開示される発明は、撮影操作誘導システムであって、画像データに対し画像処理を行い所定の指標を出力する解析手段と、前記指標とカメラパラメータと画像データを認識できるか否かを示す認識の可否とを対応付けて記憶する認識可否パラメータ記憶手段と、前記認識可否パラメータ記憶手段から前記指標に対応するカメラパラメータと認識の可否を読み出し、認識できない場合に、認識できるためのカメラパラメータを出力する認識可否判別手段と、前記出力されたカメラパラメータに基づいて操作を誘導するための誘導表示を行う表示手段と、を備えることを特徴とする。
【0014】
また、上記課題を解決するべく本願に開示される発明は、プログラムであって、情報処理装置に、画像データに対し画像処理を行い所定の指標を出力する解析処理と、前記指標とカメラパラメータと画像データを認識できるか否かを示す認識の可否とを対応付けて記憶する認識可否パラメータ記憶処理と、前記認識可否パラメータ記憶手段から前記指標に対応するカメラパラメータと認識の可否を読み出し、認識できない場合に、認識できるためのカメラパラメータを出力する認識可否判別処理と、前記出力されたカメラパラメータに基づいて操作を誘導するための誘導表示を行う表示処理と、を実行させることを特徴とする。
【発明の効果】
【0015】
第1の効果は、撮影者が、認識アプリケーションにおける入力画像の要件を意識することなく、該要件を満たす画像を撮影するための撮影操作を把握しやすいことである。
【0016】
その理由は、撮影した画像データを解析することに得られる指標とカメラパラメータとに基づいて画像データが認識可能かを判別し、認識できない場合は、認識しやすい画像データを得るためのカメラパラメータを算出し、前記カメラパラメータを実現するための撮影操作を端末画面に表示するからである。
【0017】
第2の効果は、要件を満たす画像を撮影するための撮影者による操作が容易となる点にある。その理由は、内部機構を制御することによってカメラパラメータの再設定が可能な場合には、撮影者による操作を要することなく認識可能な画像を撮影できる状態となるからである。
【発明を実施するための最良の形態】
【0018】
[第1の実施の形態]
次に、図1を参照して本発明を実施するための第1の実施の形態の構成について詳細に説明する。
【0019】
本発明を実施するための第1の実施の形態は、画像を認識できるか否かを判定するための指標として、画像データの合焦状態を解析することにより得られるぼけ量を用いる。
【0020】
図1を参照すると、本発明を実施するための第1の実施の形態は、撮像装置110とデータ処理装置120とデータ記憶装置130と表示装置140とから構成される。
【0021】
撮像装置110は、対象を撮影することにより画像データを出力する。
【0022】
データ記憶装置130は、カメラパラメータ記憶部131と認識可否判別パラメータ記憶部132とから構成される。データ記憶装置130は、たとえば半導体メモリや磁気記憶装置等により実現される。半導体メモリは、予め上述のように構成されていても良いし、読み込まれたプログラム等が動作する際に半導体メモリ内にカメラパラメータ記憶部131と認識可否判別パラメータ記憶部132とを構成しても良い。
【0023】
カメラパラメータ記憶部131は、撮像装置110による画像データの撮影時のカメラパラメータを記憶する。カメラパラメータとしては、被写体との距離、撮像装置の姿勢、F値、画像データの解像度、ズーム値等がある。
【0024】
認識可否判別パラメータ記憶部132は、画像データを解析することにより得られる指標と、カメラパラメータと、認識できるか否かを示す認識の可否とを対応付けて記憶する。本実施の形態では、指標として、合焦状態を解析した結果として得られるぼけ量を用いる。図4は、認識可否判別パラメータ記憶部132に記憶される、ぼけ量と、カメラパラメータと、認識の可否との対応付けの一例を示す図である。この図では、理解を容易にするために、ぼけ量と、カメラパラメータの一部である被写体との距離とが対応付けられる様子を示している。具体的には、ぼけ量を縦軸に、カメラパラメータの一部である被写体との距離を横軸にとり、対応付けられた両者の関係が所定のグラフ形状で示されている。また、ぼけ量と被写体との距離の関係において、認識できる範囲を、所定の形状(図4の例では矩形形状)として記憶している。上記記憶の態様は一例であり、このような手法に限られない。
【0025】
データ処理装置120は、入力された画像データを処理し、表示装置に出力するための表示データを生成する装置である。具体的には、半導体集積回路等により実現される。
【0026】
データ処理装置120は、合焦状態解析手段121と認識可否判別手段122と画面表示手段123とを備える。予めこのように構成されていた半導体集積回路として実現しても良いし、半導体集積回路が読み込まれたプログラム等を解釈実行することにより上記各手段をそなえるものとして動作するよう構成しても良い。
【0027】
合焦状態解析手段121は、画像データを入力とし、画像を認識できるか否かを判定するための指標を得るために画像データを解析し、解析結果を出力する。本実施の形態では、画像を認識できるか否かを判定するための指標としてぼけ量を用いる。よって、本実施の形態における合焦状態解析手段121は、具体的には、画像データの合焦状態を解析し、ぼけ量を出力する。合焦状態の解析は、例えば、エッジの滑らかさや、中間色の占める割合等を求めることにより行う。合焦状態の解析処理の方法の例は後述される。
【0028】
認識可否判別手段122は、画像を認識できるか否かを判定するための指標を入力とし、カメラパラメータ記憶部131からカメラパラメータを読み出し、前記指標と前記カメラパラメータに対応付けられた認識の可否を読み出す。そして、認識可否判別手段122は、、認識不可を読み出した場合には、認識可能とするために変更するカメラパラメータ(以下、変更カメラパラメータと記す)を出力する。本実施の形態では、指標としてぼけ量を用いるので、認識可否判別手段122は、ぼけ量を入力とし、読み出したカメラパラメータとともに認識可否判別パラメータ記憶部132を読み出し、対応付けられた認識の可否を読み出す。認識可否判別手段122は、認識不可を読み出した場合には、認識可能とするためのカメラパラメータ、例えば、F値や、被写体との距離等を算出し、変更カメラパラメータとして出力する。
【0029】
認識可否判別手段122は、変更カメラパラメータとして、例えば、認識可能であるカメラパラメータに対応付けられた指標と入力された指標との差が最小であり、また、変更の前後におけるカメラパラメータの差分が最小となるカメラパラメータを出力することができる。上記のようなカメラパラメータの出力方法は一例であり、上記手法に限られない。
【0030】
また、認識可否判別手段122は、カメラパラメータのうち、内部機構に関するもの(絞り値、F値等)については、変更してカメラパラメータ記憶部131に記憶させ、内部機構に関しない他のカメラパラメータ(被写体との距離、撮像装置の姿勢など)を変更カメラパラメータとして出力するようにしても良い。このようにすれば、内部機構に関するカメラパラメータの変更が自動化されるので、撮影者による操作を軽減することが出来る。
【0031】
本実施の形態のように、前記指標から認識の可否を直接的に求めることが出来る場合には、カメラパラメータ記憶部131からのカメラパラメータの読み出しを省略しても良い。このようにすれば、読み出し処理を省略できるから、処理を高速かつ軽量にすることが出来る。
【0032】
画面表示手段123は、画像データと変更カメラパラメータを入力とし、カメラパラメータの変更を実現するための操作を誘導する所定のメッセージや図形等を、画像データに重畳することにより表示データを出力する手段である。画面表示手段123は、例えば、変更カメラパラメータによるカメラパラメータの変更が、被写体との距離を延長するものである場合には、“もう少しはなれて下さい”等の文字列を表示データに埋め込むことにより、表示データを生成する。あるいは、画面表示手段123は、画像データ内の所定の領域と比較して小さい領域を示す枠状の図形を当該領域の中心点近辺に重畳して表示データを生成してもよい。変更カメラパラメータによるカメラパラメータの変更が、撮像装置の姿勢を変更するものである場合には、画面表示手段123は、“下に向けてください”等の文字列を表示データに埋め込んでも良いし、下方向を示す矢印状の図形を表示データに埋め込んでも良い。画面表示手段123によって埋め込まれる文字列は、図示しないが、変更カメラパラメータの要素と対応付けられて予めデータ記憶装置に記憶されていてもよい。
【0033】
表示装置140は、表示データを入力とし、入力された表示データを表示する。表示装置140は、具体的には液晶ディスプレイ等によって実現される。
【0034】
次に、図面を参照して、本発明を実施するための第1の実施の形態の動作を説明する。
【0035】
撮像装置110は、カメラパラメータ記憶部131で保持しているカメラパラメータを元に撮影を行う。そして、撮像装置110は、撮影した画像データを合焦状態解析手段121に送信する(ステップA1)。
【0036】
合焦状態解析手段121は、画像データの合焦状態の解析を行う(ステップA2)。
【0037】
合焦状態解析手段121は、例えば、エッジの滑らかさを解析し、ぼけ量として出力することが出来る。非合焦状態では、エッジは滑らかになるのでこの滑らかの長さをぼけ量とする(図5)。他の例として、合焦状態解析手段121は、中間色の占める割合をぼけ量として出力することが出来る(図6)。撮影対象が2値画像(白黒画像)の場合、合焦状態であれば、白画素と黒画素の2種類に分かれるが、非合焦状態の場合、滑らかになっている画素値は白と黒の中間色になる(図6(b)の斜線部分)。したがって、対象領域に対する中間色の割合をぼけ量とすることができる。
【0038】
なお、合焦状態解析手段121による解析の対象領域は、あらかじめ画像中心付近の矩形領域と定めてもよいし、画像データから認識対象となる領域を抽出した領域でもよい。
【0039】
合焦状態解析手段121は、合焦状態の解析を終了すると、解析の結果得られるぼけ量の値を認識可否判別手段122に入力する。
【0040】
次に、認識可否判別手段122は、合焦状態の解析結果を受け取り、認識可否判別パラメータ記憶部132を参照し、解析結果が認識可能かを確認する(ステップA3)。
【0041】
認識可否判別手段122は、入力されたぼけ量とカメラパラメータ記憶部131に記憶されたカメラパラメータとに対応付けられた認識の可否を、認識可否判別パラメータ記憶部132から読み出す。認識不可である場合、認識可否判別手段122は、内部機構を制御することにより変更できるカメラパラメータを変更することにより認識可能とすることが出来るか否かを判断する(ステップA4)。例えば、F値は、内部機構である絞りを制御することにより変更するカメラパラメータであり、ぼけ量は、F値を変更することによって制御することが可能である。認識可否判別手段122は、F値を変更することにより変更されるぼけ量とカメラパラメータとに対応付けられた認識の可否を確認しながら、認識可能であるF値を昇順あるいは降順に検索する。認識可能であるF値が検索された場合には、認識可否判別手段122は、カメラパラメータの再設定が可能であると判断し(ステップA4のYes)、カメラパラメータ記憶部131に記憶させるとともに、カメラパラメータの設定を行い(ステップA5)、再設定された条件で撮影を行う。
【0042】
認識可否判別手段122は、パラメータ設定が可能でないと判断する場合(ステップA4のNo)、認識可能な画像データを撮影するための変更カメラパラメータを出力する。認識可否判別手段122は、例えば、認識可能な目標ぼけ量を定め、定められた目標ぼけ量を満たすための変更カメラパラメータのうち、現在のカメラパラメータと変更カメラパラメータの差分とが最小となるものを変更カメラパラメータとして出力することが出来る。
【0043】
認識可否判別手段122は、認識可能な目標ぼけ量を、認識可否判別パラメータ記憶部132に記憶されたレコードから選択することにより定めてもよい。この場合において、認識可否判別手段は、解析されたぼけ量と、目標ぼけ量との差分が最小となるものを選択しても良い。このようにすれば、変更の前後におけるカメラパラメータの差分が小さくなるため、撮影者による操作を微細に抑えることが出来る。
【0044】
上記のような認識可否判別手段122による処理方法は、一例であり、上記手法に限られない。
【0045】
次に、画面表示手段123は、認識可否判別手段122から変更カメラパラメータを受け取ると、変更カメラパラメータを満たすために、操作を誘導するための表示データの生成を行う(ステップA6)。
【0046】
変更カメラパラメータとして、撮影距離が入力された場合には、画面表示手段123は、例えば、操作を誘導するための表示データを、画像データ内の所定の領域を、該領域の輪郭を拡大/縮小した図形と重畳することにより作成することができる。この場合、画像表示手段123は、入力された撮影距離を元に、画像データ内の所定の領域を変更後の撮影距離で撮影した場合における変更後の領域の大きさを計算する。例えば、距離が2倍になると画角も2倍になるカメラの場合(図8)、撮影距離が2倍になると、画像データにおける所定領域の大きさは1/2になる(図9)から、変更後の領域の大きさを、現画像データにおける所定領域の1/2の大きさとして算出する。画像表示手段123は、このように計算した領域の大きさを表示する枠状の図形を、画像データに重畳することにより表示データを作成し、表示装置140に送信する。また、他の例として、画像表示手段123は、予め変更パラメータと対応付けられた所定のメッセージを画像データに重畳することにより、表示データを生成しても良い。
【0047】
表示装置140は、入力された表示データを液晶ディスプレイ等の画面に表示する(ステップA7)。
【0048】
次に、本発明を実施するための第1の実施の形態の効果について説明する。
【0049】
本発明の第1の実施の形態では、認識アプリケーションにおける入力画像の要件を意識することなく、撮影者は、該要件を満たす画像を撮影することが出来る。本発明の第1の実施の形態は、撮影画像の合焦状態を解析した結果を元に認識可否判別処理を行い、認識不可の場合には、認識可能な合焦状態の画像を撮影するためのカメラパラメータを再設定または再設定を行うための誘導表示を行うからである。
【0050】
また、本発明の第1の実施の形態では、要件を満たす画像を撮影するための撮影者による操作が容易となる。その理由は、内部機構を制御することによってはカメラパラメータの再設定が不可能な場合であっても、認識可能な画像を撮影するためのカメラパラメータへと誘導する誘導表示を行うからである。誘導表示は、画面等の表示装置により表示されるため、利用者は、当該表示を見ながら具体的なカメラの操作方法(カメラをどの方向にどのくらい動かせばよいか等)を知ることができ、認識アプリケーションにおける入力画像の要件を満たす画像を撮影するための撮影条件を撮影者が実現しやすい。
【0051】
また、本発明の第1の実施の形態によれば、要件を満たす画像を撮影するための撮影者による操作が容易となる。その理由は、内部機構の制御によるカメラパラメータの再設定が可能な場合には、撮影者による操作を要することなく認識可能な画像を撮影できる状態となるからである。
[実施例]
次に、本発明の第1の実施例を、図面を参照して説明する。かかる実施例は本発明を実施するための第1の実施の形態に対応するものである。
【0052】
本実施例は、撮像装置としてカメラ付き携帯電話を、データ処理装置として前記カメラ付き携帯電話に内蔵された小型コンピュータを、データ記憶装置として前記カメラ付き携帯電話に内蔵されたRAMを、出力装置として前記カメラ付き携帯電話のディスプレイを備えている。
【0053】
小型コンピュータは、合焦状態解析手段121、認識可否判別手段122、画面表示手段123として機能する中央演算処理装置を有しており、またRAMには、カメラパラメータと、認識可否判別パラメータが記憶されている。
【0054】
カメラパラメータ記憶部には、図3に示すように、例えば解像度は”1280x1024”、F値は”4.0”、ズーム段階は”2”が予め定められている。また、認識可否判別パラメータ記憶部には、図4に示すように、合焦状態を示す量(以下ぼけ量と呼ぶ)と撮影距離との認識可否の関係に対して、認識できる範囲を示したパラメータが予め定められている。
【0055】
今、カメラパラメータ記憶部で定められたパラメータで画像を撮影し、合焦状態解析手段121に入力されたとする。
【0056】
合焦状態解析手段121では中央演算処理装置により、画像の合焦状態の解析を行う。合焦状態の解析は、エッジの滑らかさをぼけ量とする方法や、中間色の占める割合をぼけ量とする方法がある。合焦状態の解析が終了した後、合焦状態解析手段121は、ぼけ量の値を認識可否判別手段122に供給する。
【0057】
認識可否判別手段122は、入力されたぼけ量を認識可否判別パラメータと比較する。認識不可と判別された場合、パラメータ設定が可能かを判断した後、可能であればパラメータ設定を行う。ぼけ量を改善するパラメータはF値であるので、F値のパラメータを例えば、F4.0からF5.6に変更することになる。パラメータ設定が可能でない場合、認識可批判別手段122は、認識可能な目標ぼけ量の計算を行い、理想的な撮影距離を変更カメラパラメータとして画面表示手段123へ出力する。
【0058】
例えば、合焦状態解析手段121によって出力されたぼけ量が100であったとする。この場合において、認識可否判別手段122が認識可否判別パラメータ記憶部132からぼけ量100と対応付けられた撮影距離と認識の可否を読み出すと、ぼけ量100は図7のAに配置されるから、撮影距離は5cmで認識不可と判断される。認識可能範囲にマッピング位置を移動させるには、目標ぼけ量の50まで、ぼけ量を低減させる必要がある(図7のB)。目標ぼけ量から、理想撮影距離は10cmなので、現在の位置から5cm離れて撮影すればよい。認識可否判別手段122は、変更後カメラパラメータとして理想撮影距離10cmなる情報を出力する。
【0059】
画面表示手段123は、前記出力された理想撮影距離を元に、現在表示している対象領域をどのくらいの大きさで表示すればよいかを計算する。例えば距離が2倍になると画角も2倍になるカメラの場合(図8)、撮影距離が2倍になると、撮影対象は1/2になる(図9)。これにより、対象領域は現在の対象領域の1/2の大きさに設定する。このように計算した対象領域の大きさを作成し、表示装置140に送信する。
【0060】
表示装置140は、画面表示手段123で生成した対象領域を表示する。
【0061】
以下に、図10及び図11を参照しながら、画面表示手段123で生成する対象例について具体的に説明する。画面表示手段123は、予めこれらの表示を行うことができるように設定されているものとする。
【0062】
図10において表示画面1には、誘導表示として矩形が表示されており、理想撮影距離に応じて、矩形領域が拡大することを示している(図10(a))。矩形領域が小さくなる場合は、「カメラを引いてください」や、矩形領域が大きくなる場合は、「カメラを近づけて撮影してください」という文言を表示してもよい(図10(b))。
【0063】
図11において表示画面2には、誘導表示として撮影対象物体の輪郭が表示されており、理想撮影距離に応じて、輪郭が拡大・縮小することを示している(図11(a))。輪郭が小さくなる場合は、「カメラを引いて撮影してください」や、輪郭が大きくなる場合は、「カメラを近づけて撮影してください」という文言を表示してもよい(図11(b))。ここで、撮影対象物体の輪郭は、従来手法である2次微分による輪郭抽出処理や、「新編 画像解析ハンドブック」(高木幹雄・下田陽久監修、日本、2004年、253〜254頁)に記載のsnakeを用いた輪郭抽出処理を用いることにより抽出することが出来る。
【0064】
このような誘導表示により、撮影者は、画面を見ながらカメラをどの方向にどのくらい動かせばよいかがわかる。
[第2の実施の形態]
次に、本発明の第2の実施の形態について図面を参照して説明する。
【0065】
第1の実施の形態は、画像を認識できるか否かを判定するための指標として、画像データの合焦状態を解析することにより得られるぼけ量を用いたが、本発明を実施するための第2の実施の形態は、画像を認識できるか否かを判定するための指標として、画像データの解像度状態を解析することにより得られる解像度状態値を用いる点で、第1の実施の形態と異なる。すなわち、第2の実施の形態は、解像度低下による認識付加原因を把握し、解像度低下を防ぐためのカメラパラメータ設定を行うことを特徴とする。
【0066】
図12は、第2の実施の形態の構成を示す図である。図12を参照すると、本発明の第2の実施の形態では、合焦状態解析手段121に代えて解像度解析手段124を備える点認識可否判別パラメータ記憶部132に代えて認識可否判別パラメータ記憶部133を備える点、及び認識可否判別手段122に変えて認識可否判別手段125を備える点で第1の実施の形態と異なる。第1の実施の形態と同様の構成要素については同一の番号を付し説明を省略する。
【0067】
解像度解析手段124は、画像データを入力とし、画像を認識できるか否かを判定するための指標を得るために、画像データから解像度状態を解析し、解像度状態値を出力する。解像度状態の解析は、例えば、画像データ中の対象物体の大きさを解像度状態値として計測したり、2次元バーコードの型番情報を読み取ったりすること等により行うことが出来る。解像度状態の解析処理の方法の例は後述される。
【0068】
認識可否判別パラメータ記憶部133は、画像データを解析することにより得られる指標として解像度状態値を用いる点で認識可否判別パラメータ記憶部132と異なる。すなわち、認識可否判別パラメータ記憶部133は、解像度状態値と、カメラパラメータと、認識できるか否かを示す認識の可否とを対応付けて記憶する。図15は、認識可否判別パラメータ記憶部133に記憶される、解像度状態値と、カメラパラメータと、認識の可否との対応付けの一例を示す図である。この図では、理解を容易にするために、解像度状態値と、カメラパラメータの一部であるカメラ解像度との対応付けをグラフの形状で示している。具体的には、カメラ解像度を縦軸に、解像度状態値を横軸にとり、対応付けられた両者の関係が所定のグラフ形状で示されている。また、カメラ解像度と解像度状態値とのの関係において、認識できる範囲を、所定の領域(図15の例では所定の直線の下部である三角形状の領域)として記憶している。上記記憶の態様は一例であり、このような手法に限られない。
【0069】
認識可否判別手段125は、画像を認識できるか否かを判定するための指標として解像度状態値を用いる点で、認識可否判別手段122と異なる。認識可否判別手段125は、カメラパラメータ記憶部131からカメラパラメータを読み出し、入力された解像度状態値と前記カメラパラメータに対応付けられた認識の可否を読み出し、認識不可の場合には、認識可能となるための変更カメラパラメータ算出し、カメラパラメータ記憶部131に設定する手段である。
【0070】
次に、図12と図13のフローチャートを参照して、本実施の形態の動作について詳細に説明する。なお、第1の実施の形態と同様の動作には、同一の符号が付され、説明は省略される。
【0071】
解像度状態解析手段124は、画像データの解像度状態の解析を行う(ステップB2)。
【0072】
解像度状態の解析を終えると、解像度状態解析手段124は、解像度状態値を解析結果として認識可否判別手段125に送信する。
【0073】
解像度状態解析手段124は、例えば、画像データ中の対象物体の大きさを計測し、その大きさを解像度状態値とする方法により、解像度状態を解析することができる。画像データ中の対象物体の大きさを計測する方法としては、「新編 画像解析ハンドブック」(高木幹雄・下田陽久監修、日本、2004年、1823〜1824頁)に記載のレイアウト解析で基本の処理となる投影法を用いることができる。投影方向については、縦方向、横方向の2種類について行い、投影量の間隔を解像度状態値とする。
【0074】
画像データに2次元バーコードが撮影されている場合には、解像度状態解析手段124は、例えば、2次元バーコードの型番情報を読み取ることにより、2次元バーコードにおける解像度状態の解析を行っても良い。この型番情報は、2次元バーコードの1辺がいくつのモジュール数から構成されているかが記載されている(JIS X 0510 2次元コードシンボル−QRコード−基本仕様、2004年、5頁、7.3章)。解像度状態解析手段124は、モジュール数と2次元バーコードの画像上の1辺の長さ(画素数)から、1モジュールが何画素から構成されているかを計算し、その値を解像度状態値として用いることができる。例えば、撮影した2次元バーコードの1辺の長さが300画素だとすると、解像度状態解析手段124は、型番情報から1辺が54個のモジュールから構成されていると読み取った場合、1モジュールあたりの画素数は300÷54=5.56となることから、解像度状態値を5.56とする(図14)。
【0075】
上記のような画像データの解像度状態の解析手法はその一例を示すものであり、上記手法に限られない。
【0076】
次に、認識可否判別手段125では、解像度状態値を受け取り、認識可否判別パラメータ記憶部に格納されている、認識可否判別パラメータと照合し、解析結果が認識可能であるかを確認する(ステップB3)。認識可否判別手段125は、例えば、カメラパラメータ記憶部131から読み出したカメラパラメータと、受け取った解像度状態値とに対応付けられた認識の可否を読み出し、認識可能か否かを判断する。
【0077】
認識可能である場合、後の処理は行われない(ステップB3のYes)。認識不可能である場合(ステップB3のNo)、認識可否判別手段125は、認識可否判別パラメータ記憶部134から認識できるためのカメラパラメータを求め、カメラパラメータの再設定が可能かを判断した後(ステップB4)、カメラパラメータ記憶部131に再設定し(ステップB5)、再撮影するとともに、画面表示手段123に変更カメラパラメータを出力する。。
【0078】
認識可否判別手段125は、例えば、カメラの撮像解像度(図15に示すカメラ解像度)を変更することにより、認識できるカメラパラメータを設定することが出来る。つまり、撮影時の解像度よりも更に高い解像度での撮影が可能な場合に、カメラパラメータ記憶部131に対して撮影時の解像度を高くするカメラパラメータを設定する。例えば、カメラ解像度が1280x1024、解像度状態値が5.56、ズーム段階が2の場合、かかる点は、図15の点Aに配置される。ここでカメラ解像度を1616x1212にすると、点Aは点Bに移動し、認識可能領域に配置される。カメラ解像度を1616x1212に変更することで認識可能になることから、認識可否判別手段125は、カメラ解像度を1616x1212とする変更カメラパラメータをカメラパラメータ記憶部131に設定し、撮像装置110は設定されたカメラパラメータで再撮影する。
【0079】
他の例として、認識可否判別手段125は、例えば、カメラのズーム機能を使用することにより、認識できるカメラパラメータを設定することが出来る。すなわち、撮影時のズーム段階を上げることで、撮影対象を大きく写し解像度を上げる。例えば、カメラ解像度が1280x1024、解像度状態値が5.56、ズーム段階が2の場合、かかる点は、図15の点Aに配置される。ここで、ズーム段階を2倍の4にすると、解像度状態値は2倍となり、5.56x2=11.12となる(点C)。ズーム段階を2倍にすることで、点Aは点Cに移動し、認識可能領域に配置される。ズーム段階を2倍の4に変更することで認識可能になることから、認識可否判別手段125は、ズーム段階を4とする変更カメラパラメータをカメラパラメータ記憶部131に設定し、撮像装置110は設定されたカメラパラメータで再撮影する。
【0080】
また、認識可否判別手段125は、カメラの撮像解像度の変更と、カメラのズーム機能の使用とを併用しても良い。
【0081】
画面表示手段123は、カメラパラメータ記憶部131の内容が設定された場合に、その旨を表示装置140に送信するようにしても良い。この場合、画面表示手段123は再設定されたカメラパラメータを埋め込んだ画像データを生成して表示装置140に送信し、表示装置140は、該内容を表示装置に表示しても良い。このようにすれば、撮影者はカメラパラメータが再設定されたことを理解できる。また、この再設定した旨の通知・非通知は切り替えられるようにしてもよい。
【0082】
次に、本発明を実施するための第2の実施の形態の効果について説明する。
【0083】
本発明を実施するための第2の実施の形態では、解像度状態を解析する手段が加えられているため、解像度不足による認識可否を判別することができる。認識不可の場合、理想的な解像度状態を撮影するためのカメラパラメータを再設定するので、認識しやすい画像を撮影することができる。
【0084】
第2の実施の形態として、第1の実施の形態の合焦状態解析手段121に解像度解析手段124を有する構成を説明したが、他の実施の形態として、合成状態解析手段121と解像度解析手段124との双方を有するように構成しても良い。そのような構成によれば、詳細な入力画像の要件を満たすための操作を誘導することができる。
[第3の実施の形態]
次に、本発明の第3の実施の形態について図面を参照して説明する。
【0085】
図16は、第3の実施の形態の構成を示すブロック図である。図16を参照すると、本発明の第3の実施の形態は、画質状態解析手段126と画質調整手段127と認識可否判別手段128をさらに備える点、及び認識可否判別パラメータ記憶部132に代えて認識可否判別パラメータ記憶部134を備える点で第1の実施の形態と異なる。第3の実施の形態はこれらを有することにより、画質低下による認識不可要因を把握し、画質低下を防ぐための画像処理、パラメータ設定を行うことを特徴とする。
【0086】
画質状態解析手段126は、画像データを入力とし、画像を認識できるか否かを判定するための指標を得るために、画像データから画質状態を解析し、解析結果として画質状態値を出力する。画質状態の解析は、例えば、画像のコントラストを解析し、コントラスト値を画質状態値として用いることが出来る。画質状態の解析方法は、後述される。
【0087】
認識可否判別パラメータ記憶部134は、認識可否判別パラメータ記憶部132の記憶する内容に加えて、画質状態値と認識の可否とが対応付けられて記憶する。
【0088】
認識可否判別手段128は、画質状態値を入力とし、認識可否判別パラメータ記憶部134から、画質状態値に対応付けられた認識の可否を読み出し、認識可能か否かを判断するとともに、認識不可の場合には、認識可能とするために目標となる画質状態値を読み出して出力する。
【0089】
画質状態調整手段127は、目標とする画質状態値を入力とし、目標とする画質状態値への調整が可能か否かを判断し、調整可能な場合には所定の画像処理を行う手段である。調整不可能である場合には、予め定められた文字列を画面表示手段に出力する。
【0090】
次に、図16と図17のフローチャートを参照して、本実施の形態の動作について詳細に説明する。
【0091】
撮像装置110は、カメラパラメータ記憶部131で保持しているカメラパラメータに基づいて撮影した画像データを画質状態解析手段126に送信する(ステップC1)。画質状態解析手段126は、画像データの画質状態の解析を行う(ステップC2)。画質状態の解析結果は認識可否判別手段128に送信される。
【0092】
画質状態解析手段126による撮影画像の画質状態の解析内容としては、例えば、画像のコントラストがある。コントラストを画像中の最大輝度値と最小輝度値の大きさと定義すると、画像中の輝度値のヒストグラム図18では、最大輝度値245、最小輝度値5で、コントラスト値は240になる。コントラスト値が大きいほど画像ははっきりと写り、認識しやすい画像といえる。このような例によれば、画質状態解析手段126は、コントラスト値を解析結果とする。
【0093】
次に、認識可否判別手段122では、画質状態の解析結果を受け取り、認識可否判別パラメータ記憶部に格納されている、認識可否判別パラメータと照合し、解析結果が認識可能かを確認する(ステップC3)。認識可能である場合、後の処理は行われない。認識不可能である場合、認識可否判別手段128は、認識可否判別パラメータ記憶部から認識可能な画質状態値と認識の可否とを読み出し、画質調整手段127に出力する。その後、画質調整手段127は、受け取った画質状態値と認識の可否とから、画質調整可能かを判断する(ステップC4)。画質調整可能である場合、画質調整手段127は、受け取った画質状態値に基づいて画像処理を行う(ステップC6)。画質調整不可能である場合、画質調整手段127は、予め定められた文言を表示装置140に表示する(ステップC5)。
【0094】
画質状態値としてコントラスト値を用いる例で説明すると、例えば、認識可否判別パラメータ記憶部は、認識可能コンラトスト値として200を、認識不可コントラスト値として100を記憶するようにして、コントラスト値と認識の可否とが対応付けて記憶される。すなわち、この場合、認識可能なコントラスト値は200以上、認識不可コントラストは100以下となる。
【0095】
認識可否判別パラメータ記憶部が上述の情報を記憶している場合の例で、例えば、画質状態解析手段126による画質状態の解析により、コントラスト値が150と解析され、認識可否判別手段128が受け取った例を説明する。この場合、認識可否判別手段は、コントラスト値150と対応付けられた認識の可否を読み出す。コントラスト値150は、認識可能なコントラスト値と認識不可能なコントラストの間にあるコントラスト値であり、対応付けられる認識の可否は、認識可能コントラストでも認識不可コントラストでもない。認識可否判別手段128はかかる結果を画質調整手段127へ出力する。また、認識可否判別手段128は、認識の可否が認識可能コントラストで無い場合には、認識の可否と併せて、認識可能なコントラスト値を目標画質状態値として出力してもよい。
【0096】
画質調整手段127はかかる結果を受け取り、認識不可コントラストではないことから、調整可能と判断する。前記判断の後、画質調整手段127は、コントラストに関する画像処理を行い、画質の調整された画像データを出力する。コントラストを調整する方法は、例えば、「新編 画像解析ハンドブック」(高木幹雄・下田陽久監修、日本、2004年)の1171〜1176頁に記載されている方法を用いることができる。画質調整手段127は、コントラストを調整する値を決定する際に、認識可否判別パラメータ部に記憶されている認識可能コントラスト値を参考にしてもよい。また、認識可否判別手段128から受け取った目標画質状態値を参考にしてもよい。
【0097】
また、画質状態解析手段によりコントラスト値が50と解析された場合は、認識可否判別手段128は、かかるコントラスト値を認識不可コントラストであるとして画質調整手段126に出力する。この場合、画質調整手段127は、受け取ったコントラスト値が認識不可コントラストであることから、調整できないと判断する。画質調整手段127は前記判断と共に、「ライトを付けてください」「明るい場所で撮影してください」などの予め定められた文字列を画面表示手段123に出力しても良い(図19に表示された態様の一例)。なお、画質状態解析手段126により解析されたコントラスト値が200以上の場合は、認識可能コントラストとして画質調整手段127に通知されるので、画質調整手段126は画質調整を行わない。
【0098】
次に、合焦状態解析手段121は、画質調整後の画像データを入力とし、合焦状態の解析を行う(ステップA2)。その後、合焦状態解析手段121は、解析結果を認識可否判別手段122に送信する。
【0099】
以降の動作は、第1の実施の形態と同様である。
【0100】
次に、本発明を実施するための第3の実施の形態の効果について説明する。
【0101】
本発明を実施するための第3の実施の形態では、画質状態を解析する手段と、画質を調整する手段が加えられており、合焦状態を解析する前に画質状態を解析し、画質を調整する。このため、撮影された画像データが認識アプリケーションにおける画質の要件を満たすかどうかを判別することが出来る。具体的には、画質低下による認識可否を判別することができる。
【0102】
また、本発明を実施するための第3の実施の形態は、撮影された画像データが認識できない場合であって、認識可能な画質へと調整できる場合には画質の調整を行う。このため、所定の場合には、撮影条件等を変更することなく、認識アプリケーション処理にとって認識しやすい画像データを生成することができる。
【0103】
また、本発明を実施するための第3の実施の形態では、要件を満たす画像を撮影するための撮影者による操作が容易となる。その理由は、内部機構を制御することによってはカメラパラメータを再設定できない場合であっても、認識可能な合焦状態になるカメラパラメータへと誘導する誘導表示を行うからである。誘導表示は、画面等の表示装置により表示されるため、撮影者は、当該表示を見ながら具体的なカメラの操作方法(カメラをどの方向にどのくらい動かせばよいか等)を知ることができ、認識アプリケーションにおける入力画像の要件を満たす画像を撮影するための撮影条件を撮影者が実現しやすい。
【0104】
また、本発明の各実施の形態における各構成要素は、その機能をハードウェア的に実現することはもちろん、コンピュータとプログラムとで実現することができる。プログラムは、磁気ディスクや半導体メモリ等のコンピュータ可読記録媒体に記録されて提供され、コンピュータの立ち上げ時などにコンピュータに読み取られ、そのコンピュータの動作を制御することにより、そのコンピュータを前述した各実施の形態における構成要素として機能させる。
[産業上の利用可能性]
本発明によれば、最適な画質で撮影するための撮影操作誘導装置や、撮影操作誘導装置をコンピュータに実現するためのプログラムといった用途に適用できる。また、顔認識や指紋認証を備えているデジタルカメラやデジタルビデオカメラに搭載されている、画質調整機能といった用途にも適用できる。
【図面の簡単な説明】
【0105】
【図1】本発明の第1の実施の形態の構成を示すブロック図。
【図2】本発明の第1の実施の形態の動作を示すフローチャート
【図3】カメラパラメータの例を示す説明図
【図4】ぼけ量と撮影距離の関係から認識可能範囲を示す説明図
【図5】合焦状態と非合焦状態におけるぼけ量の関係を1次元で説明した図
【図6】合焦状態と非合焦状態におけるぼけ量の関係を2次元平面で説明した図
【図7】計測したぼけ量と目標ぼけ量と各々の撮影距離を説明した図
【図8】撮影距離と画角の例を示す説明図
【図9】撮影距離と撮影対象の大きさを示す説明図
【図10】誘導表示を矩形として表示画面上に表示した例を示す説明図
【図11】誘導表示を撮影対象の輪郭として表示画面上に表示した例を示す説明図
【図12】本発明の第2の実施の形態の構成を示すブロック図
【図13】本発明の第2の実施の形態の動作を示すフローチャート
【図14】2次元バーコードの解像度状態値の計算例を示す説明図
【図15】解像度状態とズーム段階変更による効果を示す説明図
【図16】本発明の第3の実施の形態の構成を示すブロック図
【図17】本発明の第4の実施の形態の動作を示すフローチャート
【図18】コントラストの例を示す説明図
【図19】誘導表示を文言として表示画面上に表示した例を示す説明図
【符号の説明】
【0106】
110 撮像装置
120 データ処理装置
121 合焦状態解析手段
122 認識可否判別手段
123 画面表示手段
124 解像度解析手段
125 認識可否判別手段
126 画質状態解析手段
127 画質調整手段
128 認識可否判別手段
130 データ記憶装置
131 カメラパラメータ記憶部
132 認識可否判別パラメータ記憶部
133 認識可否判別パラメータ記憶部
134 認識可否判別パラメータ記憶部
140 表示装置

【特許請求の範囲】
【請求項1】
画像データに対し画像処理を行い所定の指標を出力する解析手段と、
前記指標とカメラパラメータと画像データを認識できるか否かを示す認識の可否とを対応付けて記憶する認識可否パラメータ記憶手段と、
前記認識可否パラメータ記憶手段から前記指標に対応するカメラパラメータと認識の可否を読み出し、認識できない場合に、認識できるためのカメラパラメータを出力する認識可否判別手段と、
前記出力されたカメラパラメータに基づいて操作を誘導するための誘導表示を行う表示手段と、
を備えることを特徴とする撮影操作誘導システム。
【請求項2】
前記解析手段は、画像データの合焦状態を解析しぼけ量を出力する合焦状態解析手段であり、
前記認識可否パラメータ記憶手段は、ぼけ量と、被写体との距離と、画像データを認識できるか否かを示す認識の可否とを対応付けて記憶する、
ことを特徴とする請求項1に記載の撮影操作誘導システム。
【請求項3】
前記解析手段は、画像データの解像度状態を解析し解像度状態値を出力する解像度状態解析手段であり、
前記認識可否パラメータ記憶手段は、解像度状態値と、カメラ解像度と、画像データを認識できるか否かを示す認識の可否とを対応付けて記憶する、
ことを特徴とする請求項1に記載の撮影操作誘導システム。
【請求項4】
前記認識可否パラメータ記憶手段は、画像データの画質の状態を示す画質状態値と画像データを認識できるか否かを示す認識の可否をさらに記憶し、
画質状態値を入力とし、前記認識可否パラメータ記憶手段から入力された画質状態値に対応する認識の可否を読み出し、画質状態値と認識の可否とを出力する第2の認識可否判別手段と、
画像データから画質状態値を算出する画質解析手段と、
画像データと認識の可否と画質状態値とを受け取り、画質を調整可能か否か判断し、調整可能な場合に、受け取った画像データの画質を調整した画像データを出力する画質調整手段と、
をさらに備え、
前記解析手段は、前記画質調整手段から出力される画像データを入力とする
ることを特徴とする請求項2または3に記載の撮影操作誘導システム。
【請求項5】
情報処理装置に、
画像データに対し画像処理を行い所定の指標を出力する解析処理と、
前記指標とカメラパラメータと画像データを認識できるか否かを示す認識の可否とを対応付けて記憶する認識可否パラメータ記憶処理と、
前記認識可否パラメータ記憶手段から前記指標に対応するカメラパラメータと認識の可否を読み出し、認識できない場合に、認識できるためのカメラパラメータを出力する認識可否判別処理と、
前記出力されたカメラパラメータに基づいて操作を誘導するための誘導表示を行う表示処理と、
を実行させることを特徴とするプログラム。
【請求項6】
前記解析処理は、画像データの合焦状態を解析しぼけ量を出力する合焦状態解析処理であり、
前記認識可否パラメータ記憶処理は、ぼけ量と、被写体との距離と、画像データを認識できるか否かを示す認識の可否とを対応付けて記憶する、
ことを特徴とする請求項5に記載のプログラム。
【請求項7】
前記解析処理は、画像データの解像度状態を解析し解像度状態値を出力する解像度状態解析処理であり、
前記認識可否パラメータ記憶処理は、解像度状態値と、カメラ解像度と、画像データを認識できるか否かを示す認識の可否とを対応付けて記憶する、
ことを特徴とする請求項5に記載のプログラム。
【請求項8】
前記認識可否パラメータ記憶処理は、画像データの画質の状態を示す画質状態値と画像データを認識できるか否かを示す認識の可否をさらに記憶する処理であり、
画質状態値を入力とし、前記認識可否パラメータ記憶手段から入力された画質状態値に対応する認識の可否を読み出し、画質状態値と認識の可否とを出力する第2の認識可否判別処理と、
画像データから画質状態値を算出する画質解析処理と、
画像データと認識の可否と画質状態値とを受け取り、画質を調整可能か否か判断し、調整可能な場合に、受け取った画像データの画質を調整した画像データを出力する画質調整処理と、
をさらに実行させる、
前記解析処理は、前記画質調整処理から出力される画像データを入力とする
ることを特徴とする請求項6または7に記載のプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate


【公開番号】特開2008−205774(P2008−205774A)
【公開日】平成20年9月4日(2008.9.4)
【国際特許分類】
【出願番号】特願2007−38977(P2007−38977)
【出願日】平成19年2月20日(2007.2.20)
【出願人】(000004237)日本電気株式会社 (19,353)
【Fターム(参考)】