撮像装置、撮像方法及び撮像プログラム
【課題】被写体含まれる、文字等の特徴物に応じて最適な画素数を自動的に設定し、メモリ容量の最適化を図ることができる撮像装置を提供する。
【解決手段】被写体を撮影したライブビュー画像が表示されている段階において、シャッターの半押しを検知すると(ステップSA1)、画像解析エリアA内の画像解析を行う(ステップSA2)。画像解析の結果、特徴物が文字であると認識した場合は(ステップSA3)、画素をVGAに変更する。また、風景であると認識した場合は(ステップSA5)、画素を8Mに変更する。また、顔であると認識した場合は(ステップSA7)、画素を10Mに変更する(ステップSA8)。これにより、高い画素数を必要としない文字などを被写体として、メモ代わりに撮影する場合などは画素数を低く設定しておき、画像解析エリア内が文字であるときは、低い画素数で撮影して経済的かつ計画的にメモリの消費を管理することを目的とする。
【解決手段】被写体を撮影したライブビュー画像が表示されている段階において、シャッターの半押しを検知すると(ステップSA1)、画像解析エリアA内の画像解析を行う(ステップSA2)。画像解析の結果、特徴物が文字であると認識した場合は(ステップSA3)、画素をVGAに変更する。また、風景であると認識した場合は(ステップSA5)、画素を8Mに変更する。また、顔であると認識した場合は(ステップSA7)、画素を10Mに変更する(ステップSA8)。これにより、高い画素数を必要としない文字などを被写体として、メモ代わりに撮影する場合などは画素数を低く設定しておき、画像解析エリア内が文字であるときは、低い画素数で撮影して経済的かつ計画的にメモリの消費を管理することを目的とする。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、例えばデジタルカメラ等の撮像装置に関し、特に被写体を撮影する際の画素数を被写体含まれる、文字等の特徴物に応じて自動的に変更することができる撮像装置、撮像方法及び撮像プログラムに関するものである。
【背景技術】
【0002】
従来より、撮像装置を用いて風景や建物・記念物、文字、人物等の被写体を撮影することがあった。この際の画素数(解像度)は、ユーザがマニュアル操作でMENU階層の中へ入り画素数を選択して切り替えを行うといった、ユーザ自らが決定する手法が一般的である。例えば、特許文献1には、文字認識モードと通常撮影モードとを切り換えるモード切換手段によって、文字撮影の場合と通常撮影の場合とで設定を換える撮像装置が開示されている。
【0003】
【特許文献1】特開平7−288722号公報(明細書[0015])
【発明の開示】
【発明が解決しようとする課題】
【0004】
しかしながら、従来のようにユーザがマニュアル操作で画素数を選択して切り替える方法では、画素数の切り替えることなく前回撮影時に選択した画素数のままで撮影を行ってしまうことが多い。このため、カメラの有する最高画素数、例えば10Mにて撮影をしているユーザでは、マニュアルによる切替え作業が面倒なことから、いかなる被写体であろうとも10Mで撮影してしまいがちになり、撮影が最適な設定で行われないことが多い。
【0005】
特に、常に10Mで撮影していると、必要以上にメモリの容量を消費したり、撮影画像をPCで確認する場合に画像サイズが大きすぎて取り扱いづらくなるという問題がある。
【0006】
最近では、被写体として文字を撮影してメモ代わりに使うという方法もあり、こういう場合には、文字が認識できれば足りるため、高画質画像でなくてもよいという要望もある。
【0007】
本発明は、かかる従来の課題に鑑みてなされたものであり、例えば、被写体含まれる、文字等の特徴物に応じて最適な画素数を設定することを目的とする。
【課題を解決するための手段】
【0008】
前記課題を解決するため請求項1記載の発明に係る撮像装置にあっては、被写体画像を撮像する撮像手段と、前記撮像手段が撮像する被写体画像から特徴物を検出する検出手段と、前記検出手段によって検出された特徴物に応じて、前記撮像手段が撮像すべき範囲を画素数として設定する画素数設定手段とを備えることを特徴とする。
【0009】
また、請求項2記載の発明に係る撮像装置にあっては、光学的にズームを行う光学ズーム手段と、前記検出手段によって検出された特徴物が、前記撮像手段の撮像画角内に設定された当該特徴物を解析するための画像解析エリアに収まる最大倍率まで前記光学ズーム手段によるズーム処理を行うズーム制御手段と、を更に備えることを特徴とする。
【0010】
また、請求項3記載の発明に係る撮像装置にあっては、前記ズーム制御手段は、前記検出手段によって被写体画像から複数の特徴物を検出した場合、検出した全ての特徴物が前記画像解析エリアに収まる最大倍率まで前記光学ズーム手段によるズーム処理を行うことを特徴とする。
【0011】
また、請求項4記載の発明に係る撮像装置にあっては、前記検出手段によって被写体画像から特徴物を検出できない場合又は前記光学ズーム手段によって処理可能なズーム処理範囲を超えている場合には、その旨を報知する報知手段を更に備えることを特徴とする。
【0012】
また、請求項5記載の発明に係る撮像装置にあっては、前記検出手段によって特徴物を検出できない場合、前記画素数設定手段は画素数をさらに上げ、再び前記検出手段による特徴物の検出を行うよう制御する検出制御手段を更に備えることを特徴とする。
【0013】
また、請求項6記載の発明に係る撮像装置にあっては、前記検出手段によって検出される特徴物は文字であり、前記検出手段は、文字を検出する文字検出手段を含むことを特徴とする。
【0014】
また、請求項7記載の発明に係る撮像装置にあっては、前記検出手段は、前記被写体画像における画像解析エリア内の特徴物を検出することを特徴とする。
【0015】
また、請求項8記載の発明に係る撮像方法にあっては、撮像部が撮像する被写体画像から特徴物を検出する検出ステップと、前記検出ステップにて検出された特徴物に応じて、前記撮像手段が撮像すべき範囲を画素数として設定する画素数設定ステップと、を含むことを特徴とする。
【0016】
また、請求項9記載の発明に係る撮像プログラムにあっては、撮像装置が有するコンピュータを、撮像する被写体画像から特徴物を検出する検出手段、前記検出手段によって検出された特徴物に応じて、当該撮像装置が撮像すべき範囲を画素数として設定する画素数設定手段、として機能させることを特徴とする。
【発明の効果】
【0017】
本発明によれば、被写体に含まれる特徴物に応じて最適な画素数を設定するので、メモリ容量の最適化を図ることができる。
【発明を実施するための最良の形態】
【0018】
図1は、本発明の実施形態の撮像装置であるデジタルカメラ1の電気的構成を示すブロック図である。
【0019】
このデジタルカメラ1は、基本モードである撮像モードにおいて、ズームレンズ31を移動させて光学ズーム動作を行わせるズーム駆動部32、フォーカスレンズ33を移動させて合焦動作を行わせるAF駆動部34、とから構成される撮像光学系と、撮像素子であるCCD,タイミング発生器(TG),垂直ドライバ,サンプルホールド回路(S/H),A/D変換器,カラープロセス回路等を含む撮像部35と、制御部36a,画像圧縮部36b,撮像処理部36cを含む情報処理部36と、メイン表示制御部37と、メイン表示部38と、メインタッチパネル39と、キー入力部40と、記憶領域41と、音声処理部42と、スピーカ43と、を備える。
【0020】
撮像モードでのモニタリング状態においては、ズーム駆動部32は、光学ズーム指示があると制御部36aからの制御信号に基づいて図示しないズームレンズ駆動モータを駆動してズームレンズ31を光軸に沿って前後に移動させることによりCCDに結像させる画像の倍率そのものを変化させる。また、AF駆動部34は図示しないフォーカスレンズ駆動モータを駆動してフォーカスレンズ33を移動させる。そして、撮像光学系の撮像光軸後方に配置された撮像部35に設けられた撮像素子であるCCDが、タイミング発生器(TG),垂直ドライバによって走査駆動され、一定周期毎に結像した光像に対応する光電変換出力を1フレーム分出力する。なお、撮像光学系は本発明の光学ズーム手段に相当する。
【0021】
撮像部35のCCDは被写体の二次元画像を撮像する固体撮像デバイスであり、典型的には毎秒数十フレームの画像を撮像する。なお、撮像素子はCCDに限定されずCMOS(Complementary Metal Oxide Semiconductor)などの固体撮像デバイスでもよい。この光電変換出力は、アナログ値の信号の状態でRGBの各原色成分毎に適宜ゲイン調整された後に、サンプルホールド回路(S/H)でサンプルホールドされ、A/D変換器でデジタルデータ(画素)に変換され、カラープロセス回路で画像補間処理及びY補正処理を含むカラープロセス処理が行われて、デジタル値の輝度信号Y及び色差信号Cb、Crが生成される。その後、カラープロセス回路の出力する輝度信号Y及び色差信号Cb、Crを、同じくカラープロセス回路からの複合(composite)同期信号、メモリ書き込みイネーブル信号、及びクロック信号を用いてバッファメモリとして使用される揮発性の一時記録装置41dにDMA転送する。
【0022】
情報処理部36は、このデジタルカメラ1全体の制御動作を司るものであり、CPU若しくはMPU等の制御部36aと、1フレーム分の輝度及び色差信号をY、Cb、Crの各コンポーネント毎に縦8画素×横8画素の基本ブロックと呼称される単位で読み出してJPEG(Joint Photograph cording Experts Group)回路に書込み、このJPEG回路でADCT(Adaptive Discrete Cosine Transform:適応離散コサイン変換)、エントロピー符号化方式であるハフマン符号化等の処理によりデータ圧縮する画像圧縮部36bと、撮像部35によって撮像された画像データを処理する撮像処理部36cと、を有する。なお、情報処理部36は、本発明の撮像手段、画素数設定手段、検出手段(文字検出手段)、ズーム制御手段に相当する。
【0023】
また、制御部36aは、キー入力部40からの状態信号に対応してフラッシュメモリ等のプログラム格納用メモリに格納されている各モードに対応の処理プログラムやメニューデータを取り出して、デジタルカメラ1の各機能の実行制御や、光学ズーム時のズームレンズの動作制御や、電子ズームや、ライブビュー表示、自動合焦、撮像、記憶、及び記憶した画像の再生・表示等の実行制御等を行う。
【0024】
また、制御部36aは合焦指示に応じてその時点でCCDから取込んでいる1フレーム分の輝度及び色差信号のDMA転送の終了後、直ちにCCDからの経路を停止して記憶保存の状態に遷移する。そして、得た符号データを1画像のデータファイルとしてJPEG回路から読出し、保存記録装置41cや外部記憶装置41bに記憶保存する。また、1フレーム分の輝度及び色差信号の圧縮処理及び保存記録装置41cへの全圧縮データの書込み終了に伴って、制御部36aはCCDから一時記録装置41dへの経路を再び起動する。
【0025】
メイン表示制御部37は、撮影画像の表示制御や機能選択時の操作用画像の表示制御、設定画面の表示制御等を行うものであり、メイン表示部38に対する表示制御を行う。メイン表示制御部37は、上記輝度及び色差信号を一時記録装置41dから定期的に読み出し、これらのデータを基にビデオ信号を生成してメイン表示部38に出力する。メイン表示部38は、上述したように撮像モード時にはモニタ表示部(電子ファインダ)として機能するもので、ビデオ信号に基づいた表示を行うことで、その時点で取込んでいる画像情報に基づく画像をリアルタイムに表示することになる。
【0026】
メインタッチパネル39は、メイン表示部38に設けられたタッチパネル機能を制御する入力制御部である。
【0027】
記憶領域41は、外部記憶装着部41aに装着可能な外部記憶装置41bや、不揮発性の保存記録装置41cや、揮発性の一時記録装置41dを含むものである。保存記録装置41cは制御部36aで実行される動作プログラム等を記憶したプログラム格納メモリとして、一時記録装置41dは上記輝度及び色差信号をDMA転送されるメモリとして機能する。
この記憶領域41に属する記録装置又は記憶装置は、本実施例においては41a〜41dの形態をとっているが、これに限らず、別の組み合わせであっても良い。たとえば、一時記録装置41dと保存記録装置41cは、一つの不揮発性の記録装置で代替されても構わない。
【0028】
また、基本モードである再生モード時には、制御部36aが保存記録装置41c又は外部記憶装置41bに記憶されている画像データを選択的に読出し、JPEG回路で画像撮像モード時にデータ圧縮した手順とまったく逆の手順で圧縮されている画像データを伸張し、伸張した画像データをメイン表示制御部37を介して展開して記憶させた上で、このメイン表示制御部37から定期的に読出し、これらの画像データを元にビデオ信号を生成して表示部11,21で再生出力させる。
【0029】
上記JPEG回路は複数の圧縮率に対応しており、圧縮率に対応させて記憶するモードには圧縮率の低い高解像度(一般に、高精細、ファイン、ノーマルなどと呼ばれる)に対応するモードと圧縮率の高い低解像度(一般にエコノミーなどと呼ばれる)モードがある。また、高画素数から低画素数にも対応している。例えば、SXGA(1600×1200)、XGA(1024×786)、SVGA(800×600)、VGA(640×480)、QVGA(320×240)等と呼ばれる記憶画素サイズがある。
【0030】
保存記録装置41cは、内蔵メモリ(フラッシュメモリ)やハードディスク等、外部記憶装置41bは、着脱可能なメモリカード等の記憶媒体からなり画像データや撮像情報等を保存記憶する。
【0031】
キー入力部40は、シャッター釦3、電源釦4、モード釦5を有し、それらのキーが操作されると操作されたキーの操作信号を生成して情報処理部36に送出するキー処理部(図示せず)等から構成されている。モード釦5は撮像モードや再生モードの選択を行うものである。ユーザはモード釦5を操作して、(静止画)通常撮像モード、マクロ撮像モード、連写モード、速写モード、・・、動画撮像モード、・・・等の撮像モードを選択することができる。ズームレバー2は、ズーム操作に用いられ、光学ズームの場合はズームボタン(Wボタン又はTボタン)の操作に対応してズームレンズ(可変焦点距離レンズ)がワイド側またテレ側に移動されズームボタンの操作に対応してズーム値が決定され、ズーム値の変化に追従して画角が実際に変化し、液晶モニタ画面にはワイド(広角)画像又はテレ(望遠)画像が表示される。シャッター釦3は、撮像時にレリーズ操作を行うもので、2段階のストロークを有しており、1段目の操作(半押し状態)でオートフォーカス(AF)と自動露出(AE)を行わせるための合焦指示信号を発生し、2段目の操作(全押し状態)で撮像処理を行うための撮像指示信号を発生する。
【0032】
音声処理部42は、制御部36aからの指示によってスピーカ43で発生させる音声信号を処理するものであり、一例として、制御部36aによって処理可能なズーム処理範囲を超えている場合に、予め設定された音声信号を保存記録装置41cから読み出してスピーカ43で再生する。なお、音声処理部42及びスピーカ43は、本発明の報知手段に相当するが、報知は音声のみならず、ランプ等の光やメイン表示部38による表示内容によっても行うことができる。
【0033】
以上の構成からなるデジタルカメラ1において、撮影モードが設定されているときの動作について説明する。図2は、撮影モードが設定された場合にメイン表示部38に表示される内容を示す図であり、図3は、撮影モードが設定された場合に情報処理部36の制御の下で実行される画素決定の処理手順を示すフローチャートである。
【0034】
図2に示すように、メイン表示部38には、被写体を撮影したライブビュー画像が表示される。画像解析エリアAはメイン表示部38の中央等予め設定されており、表示/非表示の切り替えが可能である。本例では、図2(a)において被写体は風景、画素数は10Mであり、図2(b)において、被写体は新聞紙面、画素数はVGAである。メイン表示部38には、画像解析エリアAが四角枠で示され、画素数Bが表示されている。
【0035】
図3を参照して、撮影モードが設定された場合に情報処理部36の制御の下で実行される画素数決定の処理手順について説明する。
【0036】
情報処理部36では、被写体を撮影したライブビュー画像が表示されている段階で、シャッターの半押しを検知すると(ステップSA1)、画像解析エリアA内の画像解析を行う(ステップSA2)。すなわち、図2(a)において風景内の文字(建物の名称)をメモ代わりに残したいとか、図2(b)において新聞紙面上の一部分の記載内容をメモ代わりに残したい場合に、メモ代わりに残したい範囲が画像解析エリアAにくるようにユーザがデジタルカメラ1を上下左右に動かして位置合わせを行い、適当なところでユーザがシャッター釦3を半押しすると、画像解析エリアA内の画像から特徴物を検出して、特徴物が、文字か、風景か、顔かを判断する。
【0037】
画像解析の結果、特徴物が文字であると認識した場合は(ステップSA3)、画素をVGAに変更する。また、風景であると認識した場合は(ステップSA5)、画素を8Mに変更する。また、顔であると認識した場合は(ステップSA7)、画素を10M(最高画素数)に変更する(ステップSA8)。
【0038】
その後、フォーカス露出を決定し(ステップSA9)、本サブルーチンを終了する。
【0039】
ステップSA2における画像解析の手法について詳述する。文字,風景,顔の判断は、以下のように行うことができる。
【0040】
制御部36aは、一時記録装置41dから被写体画像データを読み出して、適当な方法によって閾値(2値化基準閾値)を求める2値化閾値計算を行う。次に、被写体画像データが多諸調の濃淡画像である場合は、白黒2値の画像(2値画像データ)に変換を行う。その後、変換後の2値画像データを任意のサブ領域に分割し、各サブ領域において、サブ領域内の全画素数に占める黒画素数(又は白画素数)を求めて、それらを要素とする特徴ベクトルを生成して、特徴比較を行う。これは、求めた特徴ベクトルを予め保存記録装置に記録されている基準特徴ベクトルと比較して、類似度(例えば正規化相関係数)が最も高いものを文字,風景,顔と判断する。
【0041】
例えば、サブ領域を縦(又は横)方向に設定する場合は、白画素数のみのサブ領域が一定間隔で生成されている場合は、そのサブ領域間には文字が存在すると判断することができるし、顔の輪郭,目,鼻,口といった人間の顔の特徴を2値画像で検出して、顔が存在すると判断することができるし、こういった特徴を検出できない場合は、風景が存在すると判断することができる。
【0042】
なお、上述した説明では、被写体画像データに対して2値画像データを生成したが、特徴が文字,風景,顔か否かを判断するにあたっては、画像解析エリアA内の2値画像データのみを生成することによっても行ってもよい。この場合には、シャッター釦3の押下検知によって画像解析エリアA内の画像データを被写体画像データとは別に一時記録装置41dに記録し、制御部36aが画像解析エリアA内の画像データを読み出して2値画像データへの変換を行う。
【0043】
本実施形態では、ステップSA2における画像解析として2値画像データの生成する手法について説明するが、本発明はこれに限定されず、文字,風景,顔を効率的に判別できるのであれば、如何なる手法を用いてもよく、この他にも、例えば、パターンマッチング、特別な文字検出用プログラム,風景検出用プログラム,顔検出用プログラムなどによって行ってもよい。
【0044】
次に、デジタルカメラ1による撮影処理について、図4〜図8を参照して説明する。図4は、撮影モードが設定された場合に情報処理部36の制御の下で実行される撮影準備処理手順を示すフローチャート、図5は、撮影準備処理の実行時に、画像解析エリアAで認識されうる文字範囲の例を示す図である。図6は、図4におけるライブビュー画像撮影処理の処理手順を示すフローチャート、図7は、撮影モードが設定された場合に情報処理部36の制御の下で実行される撮影記録処理手順を示すフローチャート、図8は、図7の基本撮影条件設定処理の処理手順を示すフローチャートである。
【0045】
まず、図4及び図6を参照して、撮影モードが設定されている場合に情報処理部36の制御の下で実行される撮影準備処理手順について説明する。
【0046】
ライブビュー画像撮影処理を行う(ステップSB1)。この処理は、図6に示すように、ズームレンズ31の位置に基づきフォーカスレンズ33を移動させて(ステップSB1−1)、撮像部35によるライブビュー画像の撮影を行うものである(ステップSB1−2)。
【0047】
次に、画像解析エリアA内の認識を行う(ステップSB2)。これは、図3のステップSA2に示すように画像解析エリアA内の2値画像を解析することで、画像解析エリアA内に文字,風景,顔のいずれかが存在するか否かを認識するものであり、特にモードメニュー等によって文字を認識するようにユーザが選択・設定している場合には、文字の存在の有無を認識する。このようにして、被写体画像から文字,風景,顔等の特徴物を検出する。なお、画像解析エリアA内の2値画像データを取得するタイミングとしては、ライブビュー画像の取得に合わせて行うこともできるが、処理負担軽減のために、例えばシャッター釦3の半押し検出に合わせて行ったり、ユーザがピントを合わせたり、ズーム操作を行っていることを自動検知して、自動的に2値画像データを取得するなど、様々な方法が可能である。
【0048】
次に、画像解析エリアA内に文字が存在するか否かを判断し(ステップSB3)、文字が存在しない場合には、通常画像の撮影設定を行う(ステップSB4)。例えば、図3のステップSA6,SA8に示すように、画素数を8M,10Mに設定変更する。
【0049】
一方、文字が存在すると判断した場合には、文字画素数の検出を行う(ステップSB5)。文字が存在するか否かの判断は、上述した特徴比較によって行うことができる。また、文字画素数の検出は、1文字を構成する画素数を算出して、多数文字の場合はその平均画素数を検出するものであり、例えば、2値画像データの白画素領域間に存在する黒画素数を個々に算出することによって、1文字あたりの画素数を検出してもよい。
【0050】
次に、ステップSB5において検出された文字画素数が適当であるか否かを判断する(ステップSB6)。すなわち、ユーザが視認して判読するのに適した画素数であるか否かを、予め設定した閾値(例えば、25×25)以上か否かによって判断し、例えば、文字画素数が10×10である場合には、解像度の調整を行い(ステップSB7)、解像度を上げる。一方で、予め設定した閾値以上の場合には、解像度を下げる。このようにして、予め設定した閾値に近い最適な解像度に設定する。
【0051】
ステップSB6において文字画素数が適当であると判断した場合には、文字範囲検出を行う(ステップSB8)。すなわち、被写体画像データを2値化した2値画像データにおける文字範囲を検出する。
【0052】
次に、文字範囲は所定領域か否かを判断する(ステップSB9)。所定領域とは、画像解析エリアA内か否かであって、ステップSB8において検出した文字範囲(図5(b))と、ステップSB2において検出した画像解析エリアA内に存在する文字範囲(図5(a))が同じか否かを判断するものである。一例として、図5(a)に、ステップSB2において検出した画像解析エリアA内で認識されうる文字範囲、図5(b)に、ステップSB8において検出した文字範囲を示す。例えば、ステップSB2において検出した画像解析エリアA(図5(a))と、文字範囲検出にて文字を認識したすエリアA(図5(b))と、を比較して、その両方のエリアが等しい、すなわち、一致、又は近似している場合、所定領域であると判断する。具体的には、画像解析エリアA内の黒画素数(又は白画素数)と、上記検出した文字範囲における黒画素数(又は白画素数)を検出して、それらを比較し、検出した文字範囲の画素数が画像解析エリアA内の画素数と一致又は近似すれば所定領域と判断する。
【0053】
ステップSB9において、文字範囲が所定領域でないと判断すると、ズーム調整可能か否かを判断する(ステップSB10)。これは、検出された文字範囲が画像解析エリアに収まる最大倍率又は最小倍率までズーム処理を行うものであり、文字範囲の方が画像解析エリアよりも小さければズーム拡大処理を行うためのズーム調整が可能か否か、文字範囲の方が画像解析エリアよりも大きければズーム縮小処理を行うためのズーム調整が可能か否かを判断する。
【0054】
ステップSB10においてズーム調整可能と判断した場合は、ズームレンズを1段階上下する調整を行い(ステップSB11)、処理をステップSB5に戻す。
【0055】
一方、ステップSB10においてズーム調整不可能と判断した場合、又は、ステップSB9において文字範囲は所定領域と判断した場合は、詳細文字認識を行う(ステップSB12)。詳細文字認識は、画像解析エリアA内の文字を認識するものである。
【0056】
次に、情報処理部36は、図4に示す一連の撮影準備処理の後に、図7に示す撮影記録処理を行う。図7及び図8を参照して、撮影モードが設定されている場合に情報処理部36の制御の下で実行される撮影記録処理手順について説明する。
【0057】
まず、基本撮影条件設定処理を行う(ステップSC1)。具体的には、図8に示すように、AF(オートフォーカス)を行いFr(フォーカスレンズのレンズ位置)を決定する(ステップSC1−1)。AFに成功したか否かを判断し(ステップSC1−2)、AFに成功したと判断された場合はステップSC1−3に進む一方、AFに失敗したと判断された場合は処理をステップSC1−1に戻し、オートフォーカスを行う処理を繰り返す。ここで、ステップSC1−2では、AFが成功したか失敗したかをAF評価値が所定値以上になったか否かに基づいて判断する。AFが成功したと判断された場合は、AE(自動露出)を行いEV(EV値:Exposure Value)を決定する(ステップSC1−3)。その後、プログラム線図、EV、EVH(EV補正値)に基づいて、E(絞り)、ISO(ISO感度)、SS(シャッタースピード)、フラッシュON/OFFを決定して(ステップSC1−4)、本サブルーチンを終了する。なお、ステップSC1−4では、フラッシュON/OFFは、SS>1/60でON、SS<1/60でOFFと決定し、ON/OFFに関わらず、使用するプログラム線図は1つである。
【0058】
次に、設定された撮影条件下で、記録用画像の撮影処理を行う(ステップSC2)。その後、図4のステップSB12で実行した詳細文字認識の結果と撮影された記録用画像とを関連付けして(ステップSC3)、外部記憶装置41bに記録用画像を保存する(ステップSC4)。
【0059】
次に、メイン表示部38に記録用画像を確認表示して(ステップSC5)、本サブルーチンを終了する。
【0060】
なお、上述した実施形態では、図4のステップSB3で文字が存在しないと判断した場合に、直ちにステップSB4に進む構成について説明したが、本発明はこれに限定されない。例えば、画像解析エリア内の文字認識をより正確に実行するように、図4のステップSB1からステップSB3の間の処理に図9に示すステップSB3−1,SB3−2の解像度を調整する処理を追加してもよい。
【0061】
すなわち、すなわちステップSB2において画像解析エリア内の認識を行った後、ステップSB3において文字が存在するか否かを判断し、文字が存在しないと判断した場合は、現在設定されている解像度よりも高い解像度に拡大可能か否かを判断する(ステップSB3−1)。これ以上高い解像度に設定できないと判断した場合は、処理をステップSB4に進める。
【0062】
一方、現在設定されている解像度よりも高い解像度に拡大可能であると判断した場合は、解像度を上げて(ステップSB3−2)、再び画像解析エリア内の認識を行う(ステップSB2)。なお、解像度を上げる処理は、解像度を1段階ごとに高く設定するようにしてもよく、或いは、一度に最大の解像度を設定するようにしてもよい。このようにして、解像度を高く設定した後に文字が存在するかどうかを改めて判断し(ステップSB3)、画像解析エリア内に文字が存在すると判断した場合にはステップSB5に進む。
【0063】
例えば、遠くの文字をメモ代わりに読み取りたいという場合、現在設定されている低い解像度では文字としての判別が不可能であるが、解像度を高く設定することにより文字としての判別が可能になることもある。このように高い解像度に自動的に設定することでステップSB3における文字が存在するか否かの判断を迅速かつ正確に行うことができる。
【0064】
次に、情報処理部36で行われるエラー処理の内容について、図10及び図11を参照して説明する。図10は、情報処理部36の制御の下で実行されるエラー処理の処理手順を示すフローチャートであり、図11は、一時記録装置41dに書き込まれているエラーフラグの状態を示す図である。
【0065】
本発明の実施形態において、エラー処理がされるのは、第1に図4又は図9のステップSB3において文字が存在しないと判断された場合、第2に図4のステップSB10においてズーム調整不可能と判断された場合、第3に図8のステップSC1−2においてAF失敗と判断された場合である。第1の場合には「文字無し」フラグが立てられ、第2の場合には「ズーム限界」フラグが立てられ、第3の場合には「AF失敗」フラグが立てられる(図11参照)。エラーフラグは2値情報によって示され、フラグが立てられると「1」に遷移し、それ以外の場合は「0」に遷移する。
【0066】
情報処理部36においては、エラーフラグの内容を一時記録装置41dから読み出して(ステップSD1)、エラーフラグの内容に応じたエラー報知をメイン表示部38やスピーカ43によって行う(ステップSD2,SD3)。
【0067】
このように、本発明の実施形態によれば、被写体画像のうち画像解析エリア内の画像から特徴物である文字を検出して、ユーザが判読可能な画素数となるような画像数を決定することで、最適な記憶容量にて記憶することができ、経済的かつ計画的にメモリの消費を管理することができる。この際に、単に低い画素数で記憶するのではなく、画像解析エリアに収まる最大倍率までズーム処理を行って記憶することから、文字判別の容易さと記憶容量の適切さとを考慮したメモリの消費を管理することができる。
【0068】
特に、被写体画像は風景や建物等であるが、そこに内在する文字部分のみをメモ代わりに残しておきたい場合に、風景に照準を合わせるのではなく、画像解析エリア内の文字部分に照準を合わせて解像度設定やズーム処理を行うことで、文字認識に必要な解像度で最適な撮影を行うことができ、メモリの消費を管理することができる。
【図面の簡単な説明】
【0069】
【図1】本発明の実施形態の撮像装置であるデジタルカメラの電気的構成を示すブロック図である。
【図2】撮影モードが設定された場合にメイン表示部に表示される内容を示す図である。
【図3】撮影モードが設定された場合に情報処理部の制御の下で実行される画素決定の処理手順を示すフローチャートである。
【図4】撮影モードが設定された場合に情報処理部の制御の下で実行される撮影準備処理手順を示すフローチャートである。
【図5】図4における撮影準備処理の実行時に、画像解析エリアAで認識されうる文字範囲の例を示す図である。
【図6】図4におけるライブビュー画像撮影処理の処理手順を示すフローチャートである。
【図7】撮影モードが設定された場合に情報処理部の制御の下で実行される撮影記録処理手順を示すフローチャートである。
【図8】情報処理部36の制御の下で実行される基本撮影条件設定処理の処理手順を示すフローチャートである。
【図9】図4に示すフローの一部変形例である。
【図10】情報処理部の制御の下で実行されるエラー処理の処理手順を示すフローチャートである。
【図11】一時記録装置に書き込まれているエラーフラグの状態を示す図である。
【符号の説明】
【0070】
1 デジタルカメラ
38 メイン表示部
A 画像解析エリア
B 画素数表示
【技術分野】
【0001】
本発明は、例えばデジタルカメラ等の撮像装置に関し、特に被写体を撮影する際の画素数を被写体含まれる、文字等の特徴物に応じて自動的に変更することができる撮像装置、撮像方法及び撮像プログラムに関するものである。
【背景技術】
【0002】
従来より、撮像装置を用いて風景や建物・記念物、文字、人物等の被写体を撮影することがあった。この際の画素数(解像度)は、ユーザがマニュアル操作でMENU階層の中へ入り画素数を選択して切り替えを行うといった、ユーザ自らが決定する手法が一般的である。例えば、特許文献1には、文字認識モードと通常撮影モードとを切り換えるモード切換手段によって、文字撮影の場合と通常撮影の場合とで設定を換える撮像装置が開示されている。
【0003】
【特許文献1】特開平7−288722号公報(明細書[0015])
【発明の開示】
【発明が解決しようとする課題】
【0004】
しかしながら、従来のようにユーザがマニュアル操作で画素数を選択して切り替える方法では、画素数の切り替えることなく前回撮影時に選択した画素数のままで撮影を行ってしまうことが多い。このため、カメラの有する最高画素数、例えば10Mにて撮影をしているユーザでは、マニュアルによる切替え作業が面倒なことから、いかなる被写体であろうとも10Mで撮影してしまいがちになり、撮影が最適な設定で行われないことが多い。
【0005】
特に、常に10Mで撮影していると、必要以上にメモリの容量を消費したり、撮影画像をPCで確認する場合に画像サイズが大きすぎて取り扱いづらくなるという問題がある。
【0006】
最近では、被写体として文字を撮影してメモ代わりに使うという方法もあり、こういう場合には、文字が認識できれば足りるため、高画質画像でなくてもよいという要望もある。
【0007】
本発明は、かかる従来の課題に鑑みてなされたものであり、例えば、被写体含まれる、文字等の特徴物に応じて最適な画素数を設定することを目的とする。
【課題を解決するための手段】
【0008】
前記課題を解決するため請求項1記載の発明に係る撮像装置にあっては、被写体画像を撮像する撮像手段と、前記撮像手段が撮像する被写体画像から特徴物を検出する検出手段と、前記検出手段によって検出された特徴物に応じて、前記撮像手段が撮像すべき範囲を画素数として設定する画素数設定手段とを備えることを特徴とする。
【0009】
また、請求項2記載の発明に係る撮像装置にあっては、光学的にズームを行う光学ズーム手段と、前記検出手段によって検出された特徴物が、前記撮像手段の撮像画角内に設定された当該特徴物を解析するための画像解析エリアに収まる最大倍率まで前記光学ズーム手段によるズーム処理を行うズーム制御手段と、を更に備えることを特徴とする。
【0010】
また、請求項3記載の発明に係る撮像装置にあっては、前記ズーム制御手段は、前記検出手段によって被写体画像から複数の特徴物を検出した場合、検出した全ての特徴物が前記画像解析エリアに収まる最大倍率まで前記光学ズーム手段によるズーム処理を行うことを特徴とする。
【0011】
また、請求項4記載の発明に係る撮像装置にあっては、前記検出手段によって被写体画像から特徴物を検出できない場合又は前記光学ズーム手段によって処理可能なズーム処理範囲を超えている場合には、その旨を報知する報知手段を更に備えることを特徴とする。
【0012】
また、請求項5記載の発明に係る撮像装置にあっては、前記検出手段によって特徴物を検出できない場合、前記画素数設定手段は画素数をさらに上げ、再び前記検出手段による特徴物の検出を行うよう制御する検出制御手段を更に備えることを特徴とする。
【0013】
また、請求項6記載の発明に係る撮像装置にあっては、前記検出手段によって検出される特徴物は文字であり、前記検出手段は、文字を検出する文字検出手段を含むことを特徴とする。
【0014】
また、請求項7記載の発明に係る撮像装置にあっては、前記検出手段は、前記被写体画像における画像解析エリア内の特徴物を検出することを特徴とする。
【0015】
また、請求項8記載の発明に係る撮像方法にあっては、撮像部が撮像する被写体画像から特徴物を検出する検出ステップと、前記検出ステップにて検出された特徴物に応じて、前記撮像手段が撮像すべき範囲を画素数として設定する画素数設定ステップと、を含むことを特徴とする。
【0016】
また、請求項9記載の発明に係る撮像プログラムにあっては、撮像装置が有するコンピュータを、撮像する被写体画像から特徴物を検出する検出手段、前記検出手段によって検出された特徴物に応じて、当該撮像装置が撮像すべき範囲を画素数として設定する画素数設定手段、として機能させることを特徴とする。
【発明の効果】
【0017】
本発明によれば、被写体に含まれる特徴物に応じて最適な画素数を設定するので、メモリ容量の最適化を図ることができる。
【発明を実施するための最良の形態】
【0018】
図1は、本発明の実施形態の撮像装置であるデジタルカメラ1の電気的構成を示すブロック図である。
【0019】
このデジタルカメラ1は、基本モードである撮像モードにおいて、ズームレンズ31を移動させて光学ズーム動作を行わせるズーム駆動部32、フォーカスレンズ33を移動させて合焦動作を行わせるAF駆動部34、とから構成される撮像光学系と、撮像素子であるCCD,タイミング発生器(TG),垂直ドライバ,サンプルホールド回路(S/H),A/D変換器,カラープロセス回路等を含む撮像部35と、制御部36a,画像圧縮部36b,撮像処理部36cを含む情報処理部36と、メイン表示制御部37と、メイン表示部38と、メインタッチパネル39と、キー入力部40と、記憶領域41と、音声処理部42と、スピーカ43と、を備える。
【0020】
撮像モードでのモニタリング状態においては、ズーム駆動部32は、光学ズーム指示があると制御部36aからの制御信号に基づいて図示しないズームレンズ駆動モータを駆動してズームレンズ31を光軸に沿って前後に移動させることによりCCDに結像させる画像の倍率そのものを変化させる。また、AF駆動部34は図示しないフォーカスレンズ駆動モータを駆動してフォーカスレンズ33を移動させる。そして、撮像光学系の撮像光軸後方に配置された撮像部35に設けられた撮像素子であるCCDが、タイミング発生器(TG),垂直ドライバによって走査駆動され、一定周期毎に結像した光像に対応する光電変換出力を1フレーム分出力する。なお、撮像光学系は本発明の光学ズーム手段に相当する。
【0021】
撮像部35のCCDは被写体の二次元画像を撮像する固体撮像デバイスであり、典型的には毎秒数十フレームの画像を撮像する。なお、撮像素子はCCDに限定されずCMOS(Complementary Metal Oxide Semiconductor)などの固体撮像デバイスでもよい。この光電変換出力は、アナログ値の信号の状態でRGBの各原色成分毎に適宜ゲイン調整された後に、サンプルホールド回路(S/H)でサンプルホールドされ、A/D変換器でデジタルデータ(画素)に変換され、カラープロセス回路で画像補間処理及びY補正処理を含むカラープロセス処理が行われて、デジタル値の輝度信号Y及び色差信号Cb、Crが生成される。その後、カラープロセス回路の出力する輝度信号Y及び色差信号Cb、Crを、同じくカラープロセス回路からの複合(composite)同期信号、メモリ書き込みイネーブル信号、及びクロック信号を用いてバッファメモリとして使用される揮発性の一時記録装置41dにDMA転送する。
【0022】
情報処理部36は、このデジタルカメラ1全体の制御動作を司るものであり、CPU若しくはMPU等の制御部36aと、1フレーム分の輝度及び色差信号をY、Cb、Crの各コンポーネント毎に縦8画素×横8画素の基本ブロックと呼称される単位で読み出してJPEG(Joint Photograph cording Experts Group)回路に書込み、このJPEG回路でADCT(Adaptive Discrete Cosine Transform:適応離散コサイン変換)、エントロピー符号化方式であるハフマン符号化等の処理によりデータ圧縮する画像圧縮部36bと、撮像部35によって撮像された画像データを処理する撮像処理部36cと、を有する。なお、情報処理部36は、本発明の撮像手段、画素数設定手段、検出手段(文字検出手段)、ズーム制御手段に相当する。
【0023】
また、制御部36aは、キー入力部40からの状態信号に対応してフラッシュメモリ等のプログラム格納用メモリに格納されている各モードに対応の処理プログラムやメニューデータを取り出して、デジタルカメラ1の各機能の実行制御や、光学ズーム時のズームレンズの動作制御や、電子ズームや、ライブビュー表示、自動合焦、撮像、記憶、及び記憶した画像の再生・表示等の実行制御等を行う。
【0024】
また、制御部36aは合焦指示に応じてその時点でCCDから取込んでいる1フレーム分の輝度及び色差信号のDMA転送の終了後、直ちにCCDからの経路を停止して記憶保存の状態に遷移する。そして、得た符号データを1画像のデータファイルとしてJPEG回路から読出し、保存記録装置41cや外部記憶装置41bに記憶保存する。また、1フレーム分の輝度及び色差信号の圧縮処理及び保存記録装置41cへの全圧縮データの書込み終了に伴って、制御部36aはCCDから一時記録装置41dへの経路を再び起動する。
【0025】
メイン表示制御部37は、撮影画像の表示制御や機能選択時の操作用画像の表示制御、設定画面の表示制御等を行うものであり、メイン表示部38に対する表示制御を行う。メイン表示制御部37は、上記輝度及び色差信号を一時記録装置41dから定期的に読み出し、これらのデータを基にビデオ信号を生成してメイン表示部38に出力する。メイン表示部38は、上述したように撮像モード時にはモニタ表示部(電子ファインダ)として機能するもので、ビデオ信号に基づいた表示を行うことで、その時点で取込んでいる画像情報に基づく画像をリアルタイムに表示することになる。
【0026】
メインタッチパネル39は、メイン表示部38に設けられたタッチパネル機能を制御する入力制御部である。
【0027】
記憶領域41は、外部記憶装着部41aに装着可能な外部記憶装置41bや、不揮発性の保存記録装置41cや、揮発性の一時記録装置41dを含むものである。保存記録装置41cは制御部36aで実行される動作プログラム等を記憶したプログラム格納メモリとして、一時記録装置41dは上記輝度及び色差信号をDMA転送されるメモリとして機能する。
この記憶領域41に属する記録装置又は記憶装置は、本実施例においては41a〜41dの形態をとっているが、これに限らず、別の組み合わせであっても良い。たとえば、一時記録装置41dと保存記録装置41cは、一つの不揮発性の記録装置で代替されても構わない。
【0028】
また、基本モードである再生モード時には、制御部36aが保存記録装置41c又は外部記憶装置41bに記憶されている画像データを選択的に読出し、JPEG回路で画像撮像モード時にデータ圧縮した手順とまったく逆の手順で圧縮されている画像データを伸張し、伸張した画像データをメイン表示制御部37を介して展開して記憶させた上で、このメイン表示制御部37から定期的に読出し、これらの画像データを元にビデオ信号を生成して表示部11,21で再生出力させる。
【0029】
上記JPEG回路は複数の圧縮率に対応しており、圧縮率に対応させて記憶するモードには圧縮率の低い高解像度(一般に、高精細、ファイン、ノーマルなどと呼ばれる)に対応するモードと圧縮率の高い低解像度(一般にエコノミーなどと呼ばれる)モードがある。また、高画素数から低画素数にも対応している。例えば、SXGA(1600×1200)、XGA(1024×786)、SVGA(800×600)、VGA(640×480)、QVGA(320×240)等と呼ばれる記憶画素サイズがある。
【0030】
保存記録装置41cは、内蔵メモリ(フラッシュメモリ)やハードディスク等、外部記憶装置41bは、着脱可能なメモリカード等の記憶媒体からなり画像データや撮像情報等を保存記憶する。
【0031】
キー入力部40は、シャッター釦3、電源釦4、モード釦5を有し、それらのキーが操作されると操作されたキーの操作信号を生成して情報処理部36に送出するキー処理部(図示せず)等から構成されている。モード釦5は撮像モードや再生モードの選択を行うものである。ユーザはモード釦5を操作して、(静止画)通常撮像モード、マクロ撮像モード、連写モード、速写モード、・・、動画撮像モード、・・・等の撮像モードを選択することができる。ズームレバー2は、ズーム操作に用いられ、光学ズームの場合はズームボタン(Wボタン又はTボタン)の操作に対応してズームレンズ(可変焦点距離レンズ)がワイド側またテレ側に移動されズームボタンの操作に対応してズーム値が決定され、ズーム値の変化に追従して画角が実際に変化し、液晶モニタ画面にはワイド(広角)画像又はテレ(望遠)画像が表示される。シャッター釦3は、撮像時にレリーズ操作を行うもので、2段階のストロークを有しており、1段目の操作(半押し状態)でオートフォーカス(AF)と自動露出(AE)を行わせるための合焦指示信号を発生し、2段目の操作(全押し状態)で撮像処理を行うための撮像指示信号を発生する。
【0032】
音声処理部42は、制御部36aからの指示によってスピーカ43で発生させる音声信号を処理するものであり、一例として、制御部36aによって処理可能なズーム処理範囲を超えている場合に、予め設定された音声信号を保存記録装置41cから読み出してスピーカ43で再生する。なお、音声処理部42及びスピーカ43は、本発明の報知手段に相当するが、報知は音声のみならず、ランプ等の光やメイン表示部38による表示内容によっても行うことができる。
【0033】
以上の構成からなるデジタルカメラ1において、撮影モードが設定されているときの動作について説明する。図2は、撮影モードが設定された場合にメイン表示部38に表示される内容を示す図であり、図3は、撮影モードが設定された場合に情報処理部36の制御の下で実行される画素決定の処理手順を示すフローチャートである。
【0034】
図2に示すように、メイン表示部38には、被写体を撮影したライブビュー画像が表示される。画像解析エリアAはメイン表示部38の中央等予め設定されており、表示/非表示の切り替えが可能である。本例では、図2(a)において被写体は風景、画素数は10Mであり、図2(b)において、被写体は新聞紙面、画素数はVGAである。メイン表示部38には、画像解析エリアAが四角枠で示され、画素数Bが表示されている。
【0035】
図3を参照して、撮影モードが設定された場合に情報処理部36の制御の下で実行される画素数決定の処理手順について説明する。
【0036】
情報処理部36では、被写体を撮影したライブビュー画像が表示されている段階で、シャッターの半押しを検知すると(ステップSA1)、画像解析エリアA内の画像解析を行う(ステップSA2)。すなわち、図2(a)において風景内の文字(建物の名称)をメモ代わりに残したいとか、図2(b)において新聞紙面上の一部分の記載内容をメモ代わりに残したい場合に、メモ代わりに残したい範囲が画像解析エリアAにくるようにユーザがデジタルカメラ1を上下左右に動かして位置合わせを行い、適当なところでユーザがシャッター釦3を半押しすると、画像解析エリアA内の画像から特徴物を検出して、特徴物が、文字か、風景か、顔かを判断する。
【0037】
画像解析の結果、特徴物が文字であると認識した場合は(ステップSA3)、画素をVGAに変更する。また、風景であると認識した場合は(ステップSA5)、画素を8Mに変更する。また、顔であると認識した場合は(ステップSA7)、画素を10M(最高画素数)に変更する(ステップSA8)。
【0038】
その後、フォーカス露出を決定し(ステップSA9)、本サブルーチンを終了する。
【0039】
ステップSA2における画像解析の手法について詳述する。文字,風景,顔の判断は、以下のように行うことができる。
【0040】
制御部36aは、一時記録装置41dから被写体画像データを読み出して、適当な方法によって閾値(2値化基準閾値)を求める2値化閾値計算を行う。次に、被写体画像データが多諸調の濃淡画像である場合は、白黒2値の画像(2値画像データ)に変換を行う。その後、変換後の2値画像データを任意のサブ領域に分割し、各サブ領域において、サブ領域内の全画素数に占める黒画素数(又は白画素数)を求めて、それらを要素とする特徴ベクトルを生成して、特徴比較を行う。これは、求めた特徴ベクトルを予め保存記録装置に記録されている基準特徴ベクトルと比較して、類似度(例えば正規化相関係数)が最も高いものを文字,風景,顔と判断する。
【0041】
例えば、サブ領域を縦(又は横)方向に設定する場合は、白画素数のみのサブ領域が一定間隔で生成されている場合は、そのサブ領域間には文字が存在すると判断することができるし、顔の輪郭,目,鼻,口といった人間の顔の特徴を2値画像で検出して、顔が存在すると判断することができるし、こういった特徴を検出できない場合は、風景が存在すると判断することができる。
【0042】
なお、上述した説明では、被写体画像データに対して2値画像データを生成したが、特徴が文字,風景,顔か否かを判断するにあたっては、画像解析エリアA内の2値画像データのみを生成することによっても行ってもよい。この場合には、シャッター釦3の押下検知によって画像解析エリアA内の画像データを被写体画像データとは別に一時記録装置41dに記録し、制御部36aが画像解析エリアA内の画像データを読み出して2値画像データへの変換を行う。
【0043】
本実施形態では、ステップSA2における画像解析として2値画像データの生成する手法について説明するが、本発明はこれに限定されず、文字,風景,顔を効率的に判別できるのであれば、如何なる手法を用いてもよく、この他にも、例えば、パターンマッチング、特別な文字検出用プログラム,風景検出用プログラム,顔検出用プログラムなどによって行ってもよい。
【0044】
次に、デジタルカメラ1による撮影処理について、図4〜図8を参照して説明する。図4は、撮影モードが設定された場合に情報処理部36の制御の下で実行される撮影準備処理手順を示すフローチャート、図5は、撮影準備処理の実行時に、画像解析エリアAで認識されうる文字範囲の例を示す図である。図6は、図4におけるライブビュー画像撮影処理の処理手順を示すフローチャート、図7は、撮影モードが設定された場合に情報処理部36の制御の下で実行される撮影記録処理手順を示すフローチャート、図8は、図7の基本撮影条件設定処理の処理手順を示すフローチャートである。
【0045】
まず、図4及び図6を参照して、撮影モードが設定されている場合に情報処理部36の制御の下で実行される撮影準備処理手順について説明する。
【0046】
ライブビュー画像撮影処理を行う(ステップSB1)。この処理は、図6に示すように、ズームレンズ31の位置に基づきフォーカスレンズ33を移動させて(ステップSB1−1)、撮像部35によるライブビュー画像の撮影を行うものである(ステップSB1−2)。
【0047】
次に、画像解析エリアA内の認識を行う(ステップSB2)。これは、図3のステップSA2に示すように画像解析エリアA内の2値画像を解析することで、画像解析エリアA内に文字,風景,顔のいずれかが存在するか否かを認識するものであり、特にモードメニュー等によって文字を認識するようにユーザが選択・設定している場合には、文字の存在の有無を認識する。このようにして、被写体画像から文字,風景,顔等の特徴物を検出する。なお、画像解析エリアA内の2値画像データを取得するタイミングとしては、ライブビュー画像の取得に合わせて行うこともできるが、処理負担軽減のために、例えばシャッター釦3の半押し検出に合わせて行ったり、ユーザがピントを合わせたり、ズーム操作を行っていることを自動検知して、自動的に2値画像データを取得するなど、様々な方法が可能である。
【0048】
次に、画像解析エリアA内に文字が存在するか否かを判断し(ステップSB3)、文字が存在しない場合には、通常画像の撮影設定を行う(ステップSB4)。例えば、図3のステップSA6,SA8に示すように、画素数を8M,10Mに設定変更する。
【0049】
一方、文字が存在すると判断した場合には、文字画素数の検出を行う(ステップSB5)。文字が存在するか否かの判断は、上述した特徴比較によって行うことができる。また、文字画素数の検出は、1文字を構成する画素数を算出して、多数文字の場合はその平均画素数を検出するものであり、例えば、2値画像データの白画素領域間に存在する黒画素数を個々に算出することによって、1文字あたりの画素数を検出してもよい。
【0050】
次に、ステップSB5において検出された文字画素数が適当であるか否かを判断する(ステップSB6)。すなわち、ユーザが視認して判読するのに適した画素数であるか否かを、予め設定した閾値(例えば、25×25)以上か否かによって判断し、例えば、文字画素数が10×10である場合には、解像度の調整を行い(ステップSB7)、解像度を上げる。一方で、予め設定した閾値以上の場合には、解像度を下げる。このようにして、予め設定した閾値に近い最適な解像度に設定する。
【0051】
ステップSB6において文字画素数が適当であると判断した場合には、文字範囲検出を行う(ステップSB8)。すなわち、被写体画像データを2値化した2値画像データにおける文字範囲を検出する。
【0052】
次に、文字範囲は所定領域か否かを判断する(ステップSB9)。所定領域とは、画像解析エリアA内か否かであって、ステップSB8において検出した文字範囲(図5(b))と、ステップSB2において検出した画像解析エリアA内に存在する文字範囲(図5(a))が同じか否かを判断するものである。一例として、図5(a)に、ステップSB2において検出した画像解析エリアA内で認識されうる文字範囲、図5(b)に、ステップSB8において検出した文字範囲を示す。例えば、ステップSB2において検出した画像解析エリアA(図5(a))と、文字範囲検出にて文字を認識したすエリアA(図5(b))と、を比較して、その両方のエリアが等しい、すなわち、一致、又は近似している場合、所定領域であると判断する。具体的には、画像解析エリアA内の黒画素数(又は白画素数)と、上記検出した文字範囲における黒画素数(又は白画素数)を検出して、それらを比較し、検出した文字範囲の画素数が画像解析エリアA内の画素数と一致又は近似すれば所定領域と判断する。
【0053】
ステップSB9において、文字範囲が所定領域でないと判断すると、ズーム調整可能か否かを判断する(ステップSB10)。これは、検出された文字範囲が画像解析エリアに収まる最大倍率又は最小倍率までズーム処理を行うものであり、文字範囲の方が画像解析エリアよりも小さければズーム拡大処理を行うためのズーム調整が可能か否か、文字範囲の方が画像解析エリアよりも大きければズーム縮小処理を行うためのズーム調整が可能か否かを判断する。
【0054】
ステップSB10においてズーム調整可能と判断した場合は、ズームレンズを1段階上下する調整を行い(ステップSB11)、処理をステップSB5に戻す。
【0055】
一方、ステップSB10においてズーム調整不可能と判断した場合、又は、ステップSB9において文字範囲は所定領域と判断した場合は、詳細文字認識を行う(ステップSB12)。詳細文字認識は、画像解析エリアA内の文字を認識するものである。
【0056】
次に、情報処理部36は、図4に示す一連の撮影準備処理の後に、図7に示す撮影記録処理を行う。図7及び図8を参照して、撮影モードが設定されている場合に情報処理部36の制御の下で実行される撮影記録処理手順について説明する。
【0057】
まず、基本撮影条件設定処理を行う(ステップSC1)。具体的には、図8に示すように、AF(オートフォーカス)を行いFr(フォーカスレンズのレンズ位置)を決定する(ステップSC1−1)。AFに成功したか否かを判断し(ステップSC1−2)、AFに成功したと判断された場合はステップSC1−3に進む一方、AFに失敗したと判断された場合は処理をステップSC1−1に戻し、オートフォーカスを行う処理を繰り返す。ここで、ステップSC1−2では、AFが成功したか失敗したかをAF評価値が所定値以上になったか否かに基づいて判断する。AFが成功したと判断された場合は、AE(自動露出)を行いEV(EV値:Exposure Value)を決定する(ステップSC1−3)。その後、プログラム線図、EV、EVH(EV補正値)に基づいて、E(絞り)、ISO(ISO感度)、SS(シャッタースピード)、フラッシュON/OFFを決定して(ステップSC1−4)、本サブルーチンを終了する。なお、ステップSC1−4では、フラッシュON/OFFは、SS>1/60でON、SS<1/60でOFFと決定し、ON/OFFに関わらず、使用するプログラム線図は1つである。
【0058】
次に、設定された撮影条件下で、記録用画像の撮影処理を行う(ステップSC2)。その後、図4のステップSB12で実行した詳細文字認識の結果と撮影された記録用画像とを関連付けして(ステップSC3)、外部記憶装置41bに記録用画像を保存する(ステップSC4)。
【0059】
次に、メイン表示部38に記録用画像を確認表示して(ステップSC5)、本サブルーチンを終了する。
【0060】
なお、上述した実施形態では、図4のステップSB3で文字が存在しないと判断した場合に、直ちにステップSB4に進む構成について説明したが、本発明はこれに限定されない。例えば、画像解析エリア内の文字認識をより正確に実行するように、図4のステップSB1からステップSB3の間の処理に図9に示すステップSB3−1,SB3−2の解像度を調整する処理を追加してもよい。
【0061】
すなわち、すなわちステップSB2において画像解析エリア内の認識を行った後、ステップSB3において文字が存在するか否かを判断し、文字が存在しないと判断した場合は、現在設定されている解像度よりも高い解像度に拡大可能か否かを判断する(ステップSB3−1)。これ以上高い解像度に設定できないと判断した場合は、処理をステップSB4に進める。
【0062】
一方、現在設定されている解像度よりも高い解像度に拡大可能であると判断した場合は、解像度を上げて(ステップSB3−2)、再び画像解析エリア内の認識を行う(ステップSB2)。なお、解像度を上げる処理は、解像度を1段階ごとに高く設定するようにしてもよく、或いは、一度に最大の解像度を設定するようにしてもよい。このようにして、解像度を高く設定した後に文字が存在するかどうかを改めて判断し(ステップSB3)、画像解析エリア内に文字が存在すると判断した場合にはステップSB5に進む。
【0063】
例えば、遠くの文字をメモ代わりに読み取りたいという場合、現在設定されている低い解像度では文字としての判別が不可能であるが、解像度を高く設定することにより文字としての判別が可能になることもある。このように高い解像度に自動的に設定することでステップSB3における文字が存在するか否かの判断を迅速かつ正確に行うことができる。
【0064】
次に、情報処理部36で行われるエラー処理の内容について、図10及び図11を参照して説明する。図10は、情報処理部36の制御の下で実行されるエラー処理の処理手順を示すフローチャートであり、図11は、一時記録装置41dに書き込まれているエラーフラグの状態を示す図である。
【0065】
本発明の実施形態において、エラー処理がされるのは、第1に図4又は図9のステップSB3において文字が存在しないと判断された場合、第2に図4のステップSB10においてズーム調整不可能と判断された場合、第3に図8のステップSC1−2においてAF失敗と判断された場合である。第1の場合には「文字無し」フラグが立てられ、第2の場合には「ズーム限界」フラグが立てられ、第3の場合には「AF失敗」フラグが立てられる(図11参照)。エラーフラグは2値情報によって示され、フラグが立てられると「1」に遷移し、それ以外の場合は「0」に遷移する。
【0066】
情報処理部36においては、エラーフラグの内容を一時記録装置41dから読み出して(ステップSD1)、エラーフラグの内容に応じたエラー報知をメイン表示部38やスピーカ43によって行う(ステップSD2,SD3)。
【0067】
このように、本発明の実施形態によれば、被写体画像のうち画像解析エリア内の画像から特徴物である文字を検出して、ユーザが判読可能な画素数となるような画像数を決定することで、最適な記憶容量にて記憶することができ、経済的かつ計画的にメモリの消費を管理することができる。この際に、単に低い画素数で記憶するのではなく、画像解析エリアに収まる最大倍率までズーム処理を行って記憶することから、文字判別の容易さと記憶容量の適切さとを考慮したメモリの消費を管理することができる。
【0068】
特に、被写体画像は風景や建物等であるが、そこに内在する文字部分のみをメモ代わりに残しておきたい場合に、風景に照準を合わせるのではなく、画像解析エリア内の文字部分に照準を合わせて解像度設定やズーム処理を行うことで、文字認識に必要な解像度で最適な撮影を行うことができ、メモリの消費を管理することができる。
【図面の簡単な説明】
【0069】
【図1】本発明の実施形態の撮像装置であるデジタルカメラの電気的構成を示すブロック図である。
【図2】撮影モードが設定された場合にメイン表示部に表示される内容を示す図である。
【図3】撮影モードが設定された場合に情報処理部の制御の下で実行される画素決定の処理手順を示すフローチャートである。
【図4】撮影モードが設定された場合に情報処理部の制御の下で実行される撮影準備処理手順を示すフローチャートである。
【図5】図4における撮影準備処理の実行時に、画像解析エリアAで認識されうる文字範囲の例を示す図である。
【図6】図4におけるライブビュー画像撮影処理の処理手順を示すフローチャートである。
【図7】撮影モードが設定された場合に情報処理部の制御の下で実行される撮影記録処理手順を示すフローチャートである。
【図8】情報処理部36の制御の下で実行される基本撮影条件設定処理の処理手順を示すフローチャートである。
【図9】図4に示すフローの一部変形例である。
【図10】情報処理部の制御の下で実行されるエラー処理の処理手順を示すフローチャートである。
【図11】一時記録装置に書き込まれているエラーフラグの状態を示す図である。
【符号の説明】
【0070】
1 デジタルカメラ
38 メイン表示部
A 画像解析エリア
B 画素数表示
【特許請求の範囲】
【請求項1】
被写体画像を撮像する撮像手段と、
前記撮像手段が撮像する被写体画像から特徴物を検出する検出手段と、
前記検出手段によって検出された特徴物に応じて、前記撮像手段が撮像すべき範囲を画素数として設定する画素数設定手段と、
を備えることを特徴とする撮像装置。
【請求項2】
光学的にズームを行う光学ズーム手段と、
前記検出手段によって検出された特徴物が、前記撮像手段の撮像画角内に設定された当該特徴物を解析するための画像解析エリアに収まる最大倍率まで前記光学ズーム手段によるズーム処理を行うズーム制御手段と、
を更に備えることを特徴とする請求項1記載の撮像装置。
【請求項3】
前記ズーム制御手段は、前記検出手段によって被写体画像から複数の特徴物を検出した場合、検出した全ての特徴物が前記画像解析エリアに収まる最大倍率まで前記光学ズーム手段によるズーム処理を行うことを特徴とする請求項2記載の撮像装置。
【請求項4】
前記検出手段によって被写体画像から特徴物を検出できない場合又は前記光学ズーム手段によって処理可能なズーム処理範囲を超えている場合には、その旨を報知する報知手段を更に備えることを特徴とする請求項2又は請求項3のいずれか記載の撮像装置。
【請求項5】
前記検出手段によって特徴物を検出できない場合、前記画素数設定手段は画素数をさらに上げ、再び前記検出手段による特徴物の検出を行うよう制御する検出制御手段を更に備えることを特徴とする請求項1から4のいずれか記載の撮像装置。
【請求項6】
前記検出手段によって検出される特徴物は文字であり、
前記検出手段は、文字を検出する文字検出手段を含むことを特徴とする請求項1から5のいずれか記載の撮像装置。
【請求項7】
前記検出手段は、前記被写体画像における画像解析エリア内の特徴物を検出することを特徴とする請求項1から6のいずれか記載の撮像装置。
【請求項8】
撮像部が撮像する被写体画像から特徴物を検出する検出ステップと、
前記検出ステップにて検出された特徴物に応じて、撮像手段が撮像すべき範囲を画素数として設定する画素数設定ステップと、
を含むことを特徴とする撮像方法。
【請求項9】
撮像装置が有するコンピュータを、
撮像する被写体画像から特徴物を検出する検出手段、
前記検出手段によって検出された特徴物に応じて、当該撮像装置が撮像すべき範囲を画素数として設定する画素数設定手段、
として機能させることを特徴とする撮像プログラム。
【請求項1】
被写体画像を撮像する撮像手段と、
前記撮像手段が撮像する被写体画像から特徴物を検出する検出手段と、
前記検出手段によって検出された特徴物に応じて、前記撮像手段が撮像すべき範囲を画素数として設定する画素数設定手段と、
を備えることを特徴とする撮像装置。
【請求項2】
光学的にズームを行う光学ズーム手段と、
前記検出手段によって検出された特徴物が、前記撮像手段の撮像画角内に設定された当該特徴物を解析するための画像解析エリアに収まる最大倍率まで前記光学ズーム手段によるズーム処理を行うズーム制御手段と、
を更に備えることを特徴とする請求項1記載の撮像装置。
【請求項3】
前記ズーム制御手段は、前記検出手段によって被写体画像から複数の特徴物を検出した場合、検出した全ての特徴物が前記画像解析エリアに収まる最大倍率まで前記光学ズーム手段によるズーム処理を行うことを特徴とする請求項2記載の撮像装置。
【請求項4】
前記検出手段によって被写体画像から特徴物を検出できない場合又は前記光学ズーム手段によって処理可能なズーム処理範囲を超えている場合には、その旨を報知する報知手段を更に備えることを特徴とする請求項2又は請求項3のいずれか記載の撮像装置。
【請求項5】
前記検出手段によって特徴物を検出できない場合、前記画素数設定手段は画素数をさらに上げ、再び前記検出手段による特徴物の検出を行うよう制御する検出制御手段を更に備えることを特徴とする請求項1から4のいずれか記載の撮像装置。
【請求項6】
前記検出手段によって検出される特徴物は文字であり、
前記検出手段は、文字を検出する文字検出手段を含むことを特徴とする請求項1から5のいずれか記載の撮像装置。
【請求項7】
前記検出手段は、前記被写体画像における画像解析エリア内の特徴物を検出することを特徴とする請求項1から6のいずれか記載の撮像装置。
【請求項8】
撮像部が撮像する被写体画像から特徴物を検出する検出ステップと、
前記検出ステップにて検出された特徴物に応じて、撮像手段が撮像すべき範囲を画素数として設定する画素数設定ステップと、
を含むことを特徴とする撮像方法。
【請求項9】
撮像装置が有するコンピュータを、
撮像する被写体画像から特徴物を検出する検出手段、
前記検出手段によって検出された特徴物に応じて、当該撮像装置が撮像すべき範囲を画素数として設定する画素数設定手段、
として機能させることを特徴とする撮像プログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【公開番号】特開2010−81100(P2010−81100A)
【公開日】平成22年4月8日(2010.4.8)
【国際特許分類】
【出願番号】特願2008−244833(P2008−244833)
【出願日】平成20年9月24日(2008.9.24)
【出願人】(000001443)カシオ計算機株式会社 (8,748)
【Fターム(参考)】
【公開日】平成22年4月8日(2010.4.8)
【国際特許分類】
【出願日】平成20年9月24日(2008.9.24)
【出願人】(000001443)カシオ計算機株式会社 (8,748)
【Fターム(参考)】
[ Back to top ]