説明

撮像装置

【課題】集合写真等にて、フレーミングをより高度に自動化してユーザの負荷を軽減し、利便性を高めた撮像装置を提供する。
【解決手段】N個の顔認識領域を取得し(S11)、認識したN個の顔認識領域の構造体Frect(i):(i=0〜N−1)のソートを行う(S12)。ソートの基準は各構造体の領域縦横サイズ(Xdim,Ydim)の面積で判定、面積に応じてFrect(0)>Frect(1)>…>Frect(N−1)に並び変える。面積最大の顔認識領域Frect(0)と所定の閾値ThS(0<ThS<1)を用いた領域の面積比で評価する。ソートした顔認識領域の各々の面積と判定面積(面積最大の画像認識領域×ThS)とを比較、後者より前者が大きなk個(1≦k≦N、少なくとも1個(Frect(0)))の顔認識領域を重要被写体とし(S14)、この顔認識領域を包含した矩形領域が収まる正規化フレームを判定してズームする。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、撮像装置における顔認識機能に係り、特に、顔認識する手段を有する撮像装置において、複数の顔を認識した場合にフレーミングを自動化する機能を有する撮像装置に関するものである。
【背景技術】
【0002】
近年の電子スチルカメラなど撮像装置の主用途の1つに、ポートレート撮影、すなわち人物の顔を主被写体として撮影することが挙げられる。また、複数人が並んだ状態で撮影する集合写真の撮影も頻繁に行われている。これらの撮影用途は、背景にあたる部分の重要性は比較的低く、一方で被写体となる人物の顔の重要性は比較的高い。
【0003】
そして、被写体に対して適切な画角を得られるようにする発明としては、特許文献1のように顔を認識して警告を与えてフレーミングを再度行うよう促す発明や、特許文献2のように認識した領域について、大きさを計測し適正、かつ自動的にズームさせ、さらに顔が中心になるよう手振れ補正レンズを駆動させる、あるいは電子ズームを用いて画角を調節する発明もなされている。
【特許文献1】特開平11−008788号公報
【特許文献2】特開2004−320286号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
しかしながら、特許文献1に記載された構成は、手作業で再度フレーミングするために、ズーム操作を含む手作業による調節が必要であり、操作性が悪く面倒である。また特許文献2に記載された構成は、特に被写体となる人物が複数ある場合に、一人一人に対して画角を調節する機能が提供されているが、集合写真を意図した撮影を含め、顔認識する領域が広く分散する場合、それらのうち撮影に適した複数の人数に対して1枚の画像に収めるための適切な対応が示されていないとう課題があった。
【0005】
本発明は、前記従来技術の問題を解決することに指向するものであり、顔を含む人物被写体の撮影、特に集合写真において、フレーミングをより高度に自動化することでユーザの負荷を軽減し、利便性を高めた撮像装置を提供することを目的とする。
【課題を解決するための手段】
【0006】
前記の目的を達成するために、本発明に係る請求項1に記載した撮像装置は、撮像面を所定の範囲内で移動する移動手段と、光学的に焦点距離を変更するズーム手段と、モニタリング中の画像データから複数の顔を認識し、顔認識領域を抽出する抽出手段とを有する撮像装置において、画像データから複数の顔認識領域を抽出した場合、各々認識した顔認識領域の面積または周長に基づいて、画角に含むべき顔の領域とするか判定する判定手段と、画角に含むべき顔の領域の一部またはすべてを含む画角になるように自動的にズームするまたは撮像面を移動する駆動手段と、を備えたことにより、集合写真のように複数の顔がある場合に最適なズーミングを自動的に行うことができる。
【0007】
また、請求項2に記載した撮像装置は、請求項1の撮像装置であって、判定手段は、抽出した複数の顔認識領域の中で最大の面積となる顔認識領域に対する所定の比率を閾値とした顔認識領域面積の比較により判定することにより、集合写真の特徴である、顔認識領域の比較的近似する被写体環境で、ズーム動作の適合率を向上することができる
また、請求項3に記載した撮像装置は、請求項1,2の撮像装置であって、ズーム手段により望遠側にズーム動作するまたは移動手段により撮像面の移動位置を決定するための顔認識処理の実行前に、最も広角側にズーム動作を行うことにより、最も広い画角から顔認識領域を抽出することで、ズーム動作の適合率を向上させることができる。
【0008】
また、請求項4,5に記載した撮像装置は、請求項1〜3の撮像装置であって、画像データから複数の顔認識領域を抽出した場合、順次画角に含まれる顔の数が減少するように望遠側にズーム動作すること、さらに、順次画角に含まれる顔の数が増加するように広角側にズーム動作することにより、注目したい顔の数に応じて、ユーザの意図する構図の候補を段階的に、かつ容易な操作で自動的に設定できる。
【発明の効果】
【0009】
本発明によれば、集合写真等の複数の顔がある被写体に対して最適なズーミングを自動的に行うことができるという効果を奏する。
【発明を実施するための最良の形態】
【0010】
以下、図面を参照して本発明における実施の形態を詳細に説明する。
【0011】
図1は本発明の実施の形態における撮像装置の概略構成を示すブロック図である。図1において、100A,100Bはズーム/フォーカス機能を有する撮影レンズとそれを駆動するモータである。101A,101BはCCD103へ露光する光量を制御する絞り兼シャッタとそれを駆動するモータである。モータ100B,101BはCPU200の制御信号に基づき、モータドライバ102によって駆動を制御される。
【0012】
ズームポジションは(表1)に示すようにZp0(広角側)ないしZp8(望遠側)の全9段階ある。ここで、Zp0(広角側)におけるモニタリング中の画像データ(幅320×高さ240ピクセル)の座標空間を基準として、各ズームポジションZpにおける画角に相当する領域を正規化フレームF(0)〜F(8)として定義する。概念例として、図2に正規化フレームF(0),F(4),F(8)の領域例を示した。
【0013】
【表1】

撮像部はCCD103によって生成される画像信号に対し、増幅器104Aで信号を増幅された後にA/D変換器104Bでデジタル画像信号に変換される。以上の各回路の同期はシグナルジェネレータ105により制御する。また、デジタル画像信号はVRAMコントローラ106を経由してVRAM107にピクセルごとの輝度色差画像データとして格納される。
【0014】
CCD103は、CCD駆動機構103Aによって光軸と垂直な平面上を一定の範囲内で連続的に移動することができる。また、CCD駆動機構103Aは、例えばセンサにホール素子、アクチュエータにボイスコイルと永久磁石を用いて、モータドライバ102により撮像面の駆動をサーボ制御する公知の手振れ補正機構を流用することで充当する。
【0015】
撮像系を含む全体の制御はCPU200が行う。CPU200にはバスがあり、そこにVRAM107、画像データを拡大縮小するリサイズモジュール200A、画像データをJPEGコードに圧縮変換するJPEGコーダ200B、汎用メモリのSDRAM200C、DMA制御を行うDMAコントローラ200D、着脱が可能なメモリカード201との書き込み/読み出しを制御するカードコントローラ200E、LCDモニタ202へ出力するビデオ信号を生成するビデオコントローラ200F、および制御プログラムやシーン別に画像データが格納されたフラッシュメモリ200Gが接続されている。
【0016】
また、CPU200への割り込み信号として、撮影記録を指向するレリーズキー120、および撮影シーンを設定するシーンボタン121等が操作ユニット109に設けられ、またタイマ割り込みを実施するためのクロックジェネレータ108がある。
【0017】
本実施の形態における撮像装置の顔認識の判断には、モニタリング中に1フレームごとに更新されるVRAM107にある画像データをもとに所定時間ごとに行う。顔に相当すると思われる領域は、所定の局所窓をテンプレートとして、画素値に基づいた評価値算出によって検出する。以下にその方法について説明する。
【0018】
判定評価する画像データ内の一部分に相当する位置および大きさに関して任意の矩形領域xに対し、領域の顔認識評価値f(x)を求める。f(x)の導出には、図3で示す4つのパターンA,B,C,Dからなる矩形領域xの局所窓iを用いる。
【0019】
なお、局所窓iの大きさ、領域内の相対位置は同一のパターンも含めて複数あり、それぞれ検出する顔の部位が異なるため、独立して特徴量を評価する。それぞれの局所窓iは2つの領域で構成され、正領域Apと逆領域Anがある(正逆の標記は識別のための便宜的なもので、正逆を反対に割り当てても同義である)。各局所窓iの特徴量h(i)は、局所窓iの正領域Apにおける画素値の総和s(i,Ap)と、逆領域Anにおける画素値の総和s(i,An)の差分、すなわち(数1)
【0020】
【数1】

で求める。
【0021】
すべての局所窓iにおいて、特徴量h(i)が求まれば、局所窓iごとに所定の重み係数a(i)を用いて、領域の顔認識評価値fを局所窓iに関する加重総和を(数2)
【0022】
【数2】

にて求める。各局所窓iの大きさ、相対位置、重み係数a(i)は予め顔画像のデータベースから学習によって得たデータを与える。例えば、本実施の形態では、(表2)のようなデータ群を与え、プログラム上では、それぞれ(表2)のS50に示すような等価な構造体の形式で扱う。
【0023】
【表2】

そして、本実施の形態では、図2に示した画像データを320×240ピクセル、評価する顔認識領域の最小サイズを40×40ピクセル、同最大サイズ240×240ピクセルとして、4ピクセル単位で評価する(図4参照)。また、(表2)に示す局所窓フレームの適用概念を図5に示す。
【0024】
また、図6,図7は顔認識領域を判定して登録する処理の流れを示したフローチャートである。図6のフローチャートは顔認識領域のサイズが小さい領域から順次大きい領域へ、また画像の左上から順次右下へ、評価対象とする矩形領域xを決定する処理であり、図7のフローチャートは評価対象となる矩形領域xについて、(数2)により顔認識評価値f(x)を算出し、所定の閾値Thより大きい場合に顔認識領域としてデータ構造Frectの配列として追加登録する手続きを示している。
【0025】
本処理では画像空間の位置、サイズについて多様な部分領域について独立して評価するため、顔認識領域は複数抽出されることもある。すなわち、本実施の形態では、認識手法が想定する効果の範囲内で、複数の顔を認識することが可能である。
【0026】
そして、以上の処理により顔認識領域として抽出したN個の顔認識領域は、構造体の配列Frect(i)(i=0,1,2,…,N)として格納される。また、各顔認識判定領域Frect(i)のデータ形式は図8で示すように、起点となる画像空間の左上の座標(Xb,Yb)、矩形の幅および高さ(Xdim,Ydim)、前記処理で得られた顔認識評価値Vにより構成される。
【0027】
さらに、ズーム位置Zpを決定するためには、認識した顔認識領域から、その一部を重要被写体として決定する処理を行う。重要被写体の決定方法として、本実施の形態では、第1に顔認識領域の面積に基づく方法、第2に顔認識評価値に基づく方法を提示する。これらの方法はいずれの方法を用いても構わない。
【0028】
以後は、便宜的にFrect(i)のパラメータ(起点(Xb,Yb)、サイズ(Xdim,Ydim)、評価値VをそれぞれFrect(i).Xbという形で表現する。)
第1の方法として、図9のフローチャートに示すように、所定の閾値ThS(0<ThS<1であり、代表的にはThS=0.5とする)を用いた領域の面積比で評価する。まず、前述した図7に示したフローチャートに基づきN個の顔認識領域を取得し(S11)、認識したN個の顔認識領域の構造体Frect(i):(i=0〜N−1)のソートを行う(S12)。ソートの基準は各構造体の領域縦横サイズ(Xdim,Ydim)から求まる領域の面積(Xdim×Ydim)で判定する。その結果、構造体が面積に応じてFrect(0)>Frect(1)>…>Frect(N−1)に並び変えられる。
【0029】
この時点で、面積が最大となる顔認識領域は、Frect(0)となるので、Frect(1)〜Frect(N−1)の各々の面積(Frect(i).Xdim×Frect(i).Ydim)と判定面積(Frect(0).Xdim×Frect(0).Ydim×ThS)を比較する(S13)。後者より前者が大きなk個(1≦k≦N、少なくとも1個(Frect(0))は条件を満たす)の顔認識領域Frect(0),Frect(1),…,Frect(k−1)を重要被写体と判定する(S14)。
【0030】
なお、前述した第2の顔認識評価値に基づく処理においても、図10に示すフローチャートのように、顔認識評価値Vを用いて図9のフローチャートと同様な処理行う。
【0031】
そして、図11は重要被写体として認識した領域を含むようにズームポジションを決定する処理を示すフローチャート、図12(a)〜(d),図13(a)〜(d),図14が状態遷移図である。
【0032】
図11のフローチャートに示すように、集合写真のズーム処理として、まず、広角側(Zp0)へズームさせる(図12(a)に示す初期状態)(S21)。これは、顔認識評価するためのモニタリング画像を取得することを目的とする。この後、モニタリング画像から、評価する(320×240ピクセル)の画像データを取得する(S22)。次に重要被写体領域を取得するための重要被写体を判定するフローチャート(図9または図10)に入り、重要被写体となる顔認識領域の構造体Frect(0),Frect(1),…,Frect(k)を取得する(S23)。
【0033】
この後、Frect(0)ないしFrect(k−1)を含むすべての領域を包含する最も広角側のズーム位置Zpを判定するため矩形領域Rを計算する(図12(b)参照)。さらに、(表1)に示す各ズーム位置Zp(0ないし8の9段階)に対応する前述の正規化フレームF(Zp)を用いて、矩形領域Rが収まる正規化フレームを判定する(図12(c)参照)(S24)。最後に、判定したズーム位置Zpへズームして、完了となる(図12(d)に示すZp1までズームした状態1)(S25)。
【0034】
また、本実施の形態では、Frect(0)のみを重要被写体として、前記と同様の方法により例えばFrect(0)の領域を包含する最も広角側のズーム位置Zpへ駆動する方法(図13(a)〜(d)参照)も提供する。この場合にモニタリング画像データで認識した顔認識領域において、複数の中の1つを選択し、これを矩形領域Rとし前述した処理を行うことで、ユーザの意図する重要被写体のズーム処理を行うことができる。
【0035】
この動作を、「WIDEキー」と「TELEキー」を用いて、図14に示すように双方向の状態遷移をすることで、特徴とする顔の数に応じた多段階のズームを提供することができる。
【0036】
また、前述した処理において、矩形領域Rの収まる正規化フレームを判定してズーム処理を行ったが、矩形領域Rの中心位置を求めて、移動手段による撮像面の移動可能な範囲で画角の中央に移動させ、移動した矩形領域Rの収まる正規化フレームを判定してズーム処理を行ってもよく、ユーザの意図する重要被写体を中央に配置したズームを行うことができる。
【産業上の利用可能性】
【0037】
本発明に係る撮像装置は、集合写真等の複数の顔がある被写体に対して最適なズーミングを自動的に行うことができ、顔認識手段を有する撮像装置において、複数の顔を認識した場合にフレーミングを自動化する機能として有用である。
【図面の簡単な説明】
【0038】
【図1】本発明の実施の形態における撮像装置の概略構成を示すブロック図
【図2】正規化フレームの概念を示す図
【図3】顔認識判定フレームのパターンを示す図
【図4】内部処理データの構造例を示す図
【図5】顔認識判定フレームの適用概念を示す図
【図6】顔認識領域を判定して登録する処理における評価対象領域の取得処理を示すフローチャート
【図7】顔認識領域を判定して登録する処理における顔認識領域の取得処理を示すフローチャート
【図8】顔認識矩形領域のデータ構造例を示す図
【図9】重要被写体判定処理を示すフローチャート
【図10】別の重要被写体判定処理を示すフローチャート
【図11】自動ズーム処理を示すフローチャート
【図12】自動ズーム処理した状態遷移(a)〜(d)を示す図
【図13】図12からさらに自動ズーム処理した状態遷移(a)〜(d)を示す図
【図14】「WIDEキー」、「TELEキー」を用いた双方向の状態遷移を説明する図
【符号の説明】
【0039】
100A ズーム/フォーカスレンズ
100B,101B モータ
101A シャッタ/絞り
102 モータドライバ
103 CCD
103A CCD駆動機構
104A 増幅器
104b A/D変換器
105 シグナルジェネレータ
106 VRAMコントローラ
107 VRAM
108 クロックジェネレータ
109 操作ユニット
200 CPU
200A リサイズモジュール
200B JPEGコーダ
200C SDRAM
200D DMAコントローラ
200E カードコントローラ
200F ビデオコントローラ
201 メモリカード
202 LCDモニタ

【特許請求の範囲】
【請求項1】
撮像面を所定の範囲内で移動する移動手段と、光学的に焦点距離を変更するズーム手段と、モニタリング中の画像データから複数の顔を認識し、顔認識領域を抽出する抽出手段とを有する撮像装置において、
前記画像データから複数の顔認識領域を抽出した場合、各々認識した顔認識領域の面積または周長に基づいて、画角に含むべき顔の領域とするか判定する判定手段と、
前記画角に含むべき顔の領域の一部またはすべてを含む画角になるように自動的にズームするまたは撮像面を移動する駆動手段と、
を備えたことを特徴とする撮像装置。
【請求項2】
前記判定手段は、抽出した複数の顔認識領域の中で最大の面積となる顔認識領域に対する所定の比率を閾値とした顔認識領域面積の比較により判定することを特徴とする請求項1の撮像装置。
【請求項3】
前記ズーム手段により望遠側にズーム動作するまたは前記移動手段により撮像面の移動位置を決定するための顔認識処理の実行前に、最も広角側にズーム動作を行うことを特徴とする請求項1または2記載の撮像装置。
【請求項4】
前記画像データから複数の顔認識領域を抽出した場合、順次画角に含まれる顔の数が減少するように望遠側にズーム動作することを特徴とする請求項1〜3のいずれか1項に記載の撮像装置。
【請求項5】
前記画像データから複数の顔認識領域を抽出した場合、順次画角に含まれる顔の数が増加するように広角側にズーム動作することを特徴とする請求項4記載の撮像装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate


【公開番号】特開2008−227918(P2008−227918A)
【公開日】平成20年9月25日(2008.9.25)
【国際特許分類】
【出願番号】特願2007−63282(P2007−63282)
【出願日】平成19年3月13日(2007.3.13)
【出願人】(000006747)株式会社リコー (37,907)
【Fターム(参考)】