説明

画像データの識別方法及び撮像装置、プログラム、及び記憶媒体

【課題】 個人認証に要する時間を短縮することが可能な撮像装置を提供する。
【解決手段】 複数のフレームの画像データに含まれる顔画像データに対して、個人の識別と表情の識別のいずれかの識別処理を行う画像データの識別方法において、顔検出手段が、前記画像データに含まれる顔画像データを検出する顔検出工程(S202)と、識別手段が、前記顔検出工程で検出された1つまたは複数の顔画像データに対して前記識別処理を行う識別工程(S207)とを有し、前記識別工程では、前記識別処理を行うフレームの画像データに含まれる顔画像データと同じ人物を示す、前のフレームの画像データに含まれる顔画像データについて、前記識別処理に成功した場合に、失敗した場合よりも、高い数値を与えるものであって、該数値の高いものから予め設けた上限に達する数までの顔画像データに対して前記識別処理を行う。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、個人認証機能を備えた画像データの識別方法及び撮像装置、プログラム、及び記憶媒体に関する。
【背景技術】
【0002】
最近、撮像装置であるデジタルカメラに被写体の顔を認識させる技術が組み込まれているものがある。さらに、単に被写体の顔を認識させるのみならず、その被写体の顔をさらに識別して個人認証することで、その被写体が誰であるかの人物の個人認証が可能なデジタルカメラも提案されている。
【0003】
たとえば、特許文献1に開示された発明では、被写体を個人認証する際に使用する特徴点候補の抽出方法を工夫することで、より高精度で高速に認証が可能な個人認証方法を提案している。また、特許文献2に開示された発明では、撮像時の被写体の照明条件が変化する場合の個人認証方法の工夫が提案されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開平9−251534号公報
【特許文献2】特開2000−222576号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、特許文献1で提案されている方法では、画像データに含まれる被写体である人物が1人のみの画像データを入力する必要がある。したがって、画像データの被写体として複数の人物が含まれる場合や、目標となる人物以外の被写体が同時に撮像される場合については考慮されていない。
【0006】
また、特許文献2に提案されている方法では、画像データに含まれる被写体として複数の人物が含まれ、含まれている複数の人物を検出する方法が紹介されている。しかしながら、特許文献2に提案されている方法では、被写体である人物の動き量を検出して人物の人数を判定する方法であるため、撮像装置が固定されている必要がある。さらに、特許文献2に提案されている方法では、固定された同じ画角の、過去の撮像した画像データが必要とされている。
【0007】
上記で説明したように、従来より提案されている方法では、複数の被写体である人物が含まれている場合や、複数の人物が画像フレーム毎に異なる画角で撮像されるデジタルカメラの様な撮像装置においては、個人認証が出来ない欠点がある。
【0008】
また、従来の個人認証の方法では、撮像された複数の顔の全ての顔に対して個人認証処理を行うために多くの時間が必要となり、EVFを使用する表示動作に対して個人認証処理が間に合わなくなることが有った。逆にEVFでの表示動作に間に合う時間内で個人認証処理を行うためには、EVFでの表示のフレームレートを落とす必要があった。このように、表示のフレームレートの低い状態でEVFでの画面を見ながらでの撮像では、人物の位置や表情などが実時間で表示されないことになる。そのため、デジタルカメラとして最も重要なシャッタチャンスを逃す恐れが生じる。この問題は、個人を識別する個人認証のみならず、笑顔や目瞑りなどを識別する表情認識にも当てはめることができる。
【0009】
したがって本発明の目的は、個人や表情の識別処理に要する時間を短縮することが可能な撮像装置を提供することにある。
【課題を解決するための手段】
【0010】
上記の目的を達成するため、複数のフレームの画像データに含まれる顔画像データに対して、個人の識別と表情の識別のいずれかの識別処理を行う、本願発明にかかる画像データの識別方法は、
【0011】
顔検出手段が、前記画像データに含まれる顔画像データを検出する顔検出工程と、
【0012】
識別手段が、前記顔検出工程で検出された1つまたは複数の顔画像データに対して前記識別処理を行う識別工程とを有し、
【0013】
前記識別工程では、前記識別処理を行うフレームの画像データに含まれる顔画像データと同じ人物を示す、前のフレームの画像データに含まれる顔画像データについて、前記識別処理に成功した場合に、失敗した場合よりも、高い数値を与えるものであって、該数値の高いものから予め設けた上限に達する数までの顔画像データに対して前記識別処理を行うことを特徴とする。
【発明の効果】
【0014】
本発明によれば、個人や表情の識別に要する時間を短縮することができ、適切な撮影が可能な識別機能を備える撮像装置を提供することが可能となる。
【図面の簡単な説明】
【0015】
【図1】本発明の実施形態に係る個人認証機能を備える撮像装置のブロック構成図である。
【図2】本発明の実施形態に係る個人認証機能を備える撮像装置の動作を説明するフローチャートである。
【発明を実施するための形態】
【0016】
<実施形態1>
図1は、本発明の実施形態に係る個人認証機能を備える撮像装置100の構成を示すブロック図である。図1において、1は撮像レンズ、2はフォーカスレンズである。フォーカスレンズ2を制御することで、撮像される被写体の合焦状態を制御することが可能に構成されている。
【0017】
また、3は撮像レンズを通過した被写体の光束を光電変換し電気信号に変換するCCDやCMOS等の撮像素子である。4は撮像素子3から出力されたアナログの画像信号にクランプ処理、ゲイン処理等を行い、デジタル信号である画像データに変換するA/D変換部である。
【0018】
5は信号処理部であり、A/D変換部4からの画像データに対して、予め定めた画素補間処理や色変換処理を実行する。また、信号処理部5は、撮像して得られた画像データを用いて予め定めた演算処理を実行し、得られた演算結果に基づいて自動白バランス処理等の信号処理を実行する。
【0019】
信号処理部5で信号処理された画像データは、画像メモリ6に一時的に記憶される。また、画像メモリ6に一時的に記憶された画像データは、記録再生部7に供給され、ユーザの要求で取り外し可能な記録媒体8に記録される。また画像データは表示制御部9に送られ表示装置10で画像データの表示を実行する。記録媒体8は、光デイスク記録媒体、半導体記録媒体等、各種の取り外し可能な記録媒体が使用できる。
【0020】
システム制御部11は、基本的に、撮像装置100の全体の動作を制御するものであって、通常内部にCPUを備える。たとえば、撮像して得られる画像データを用いて予め定めた演算処理を信号処理部5で実行し、その演算結果に基づいて、焦点制御部12、及び露出制御部13を制御する。すなわち、フォーカスレンズ2に対して、焦点制御部12が制御を行ない自動焦点制御(AF)を実行する。また、撮像レンズ1内の絞り及びシャッタ、さらには撮像素子3の電子シャッタに対して、露出制御部13が制御を行い自動露出制御(AE)を実行する。
【0021】
システム制御部11に接続されたRAM14は、表示装置10に表示する画像データを記憶してもよく、表示制御部9を介し表示装置10に画像データを供給して表示する。また、このRAM14は、システム制御部11の作業領域としても使用することが可能である。
【0022】
画像メモリ6は、撮像した静止画像データや動画像データを一時的に格納し、予め定めた枚数の静止画像データや、予め定めた時間分の動画像データを格納するのに十分に高速かつ大量の記憶容量を備える。これにより、複数枚の静止画像データを連続して撮像する連写撮像や複数枚の撮像画像データを合成するパノラマ撮像の場合にも、画像メモリ6を使用して実行することが可能となる。
【0023】
表示装置10は、撮像した画像データを逐次表示する事により電子ビューファインダ(以下EVF)として使用する。また、表示装置10は、システム制御部11でのプログラムの実行にしたがって任意に表示をオン/オフすることが可能に構成される。更に、顔検出状態表示、個人認証状態表示、合焦枠表示、合焦表示、非合焦の警告の表示なども行う。
【0024】
7はメモリカードやハードディスク等の取り外し可能な記録媒体8とのインタフェースである記録再生部である。この記録再生部7を用いて、画像データや画像データに付属した管理情報を、記録媒体8との間で転送し合うことができる。システム制御部11は、撮像装置100全体の動作を制御している。システム制御部11に接続されたRAM14及び/又はROM15に、このシステム制御部11の動作用の定数、変数、プログラムと、個人認証又は識別処理用の登録された人物の顔画像データの特徴情報、顔検出に必要なデータ等を記憶している。
【0025】
16は顔検出部である。顔検出部16においては、撮像する画像データに含まれる被写体から、目、口等のエッジを検出して人物の顔の特徴部分を検出する。この場合、RAM14及び/又はROM15に、記憶された、顔検出に必要なデータに基づいて検出が実行される。
【0026】
すなわち、顔が占める画像データの領域(顔位置と顔の大きさ)、顔の確からしさ(顔信頼度)から、その画像領域のデータを顔画像データとして検出する顔検出処理や識別処理を実行する。さらに顔検出部16は、検出された顔画像データの数も同時に検出する。顔検出処理は、個人認証のように個人別に参照用データを蓄積しておく必要がないため、個人認証に比較して十分に早く処理を完了させることが可能である。
【0027】
17は特徴情報抽出部であり、顔検出部16で検出された顔画像データから、個人認証の際に用いる特徴情報を抽出する。
【0028】
18は主顔率算出部、19は主顔選択部である。これらについては、その詳細は後述する。20は認証部であり、RAM14及びまたはROM15に記憶された個人認証用の登録された人物の顔画像データの特徴情報と、特徴情報抽出部17で抽出された検出された顔画像データとに基づく、たとえばテンプレートマッチングによる個人認証を実行する。
【0029】
なお、図1に示して説明した撮像装置の構成は1例であり、以下に説明する動作を実行できるのであれば、本発明に係る撮像装置の構成は、図1に示した構成に限定されるものではない。
【0030】
次に、図2のフローチャートを参照して、本発明の実施形態に係る撮像装置100の動作について詳細に説明する。先ず、処理の開始後、ステップS201で、撮像素子3から出力される画像信号を、A/D変換部4及び信号処理部5により画像データを取得する。取得した画像データは、たとえば画像メモリ6に一時的に記憶される。
【0031】
次にステップS202に進み、ステップS201で取得して画像メモリ6に記録された画像データに対して、顔検出部16で顔検出処理を実行する。この顔検出部16での顔検出処理の結果、撮像する画像データに含まれる被写体から、目、口等のエッジを検出して顔の特徴部分を検出する。そして被写体である人物の顔が占める画像データの領域(顔の位置「S」と顔の大きさ「S」)、顔の確からしさ(顔信頼度「R」)から顔画像データを検出するとともに、顔画像データの数が検出される。
【0032】
次にステップS203に進み、顔検出部16で検出された顔画像データの数が2または2より大きいかを判断する。この判断はたとえば、システム制御部11で実行する。ステップS203の判断で、検出された顔画像データの数が2以上の場合には、ステップS205に進み、主顔率算出処理が主顔率算出部18で実行される。なお、主顔率とは、画像データにおける各顔画像データの主要である割合い、即ち主要度合いを表す。
【0033】
ステップS205の主顔率算出処理では、ステップS202の顔検出で得られた全ての顔画像データに関し、主要度合いを表す主顔率「M」を算出する。この場合、少なくとも画像データにおける顔画像データの中心からの距離「D」及び顔画像データの大きさ「S」、さらには顔信頼度「R」を使用して下記の計算式より主顔率「M」を算出する。この場合、画像データにおける顔画像データの中心からの距離「D」は、顔画像データの画像データ内での位置を意味する。距離「D」、大きさ「S」、顔信頼度「R」は、それぞれ顔画像データが画像データの中心に近いほど、顔画像データが大きいほど、顔画像データの顔信頼度が高いほど、主顔率「M」が大きくなるように設定される。
【0034】
主顔率「M」の算出は、主顔率算出部18で実行され、以下の計算式で主要度合いを表す主顔率「M」が算出される。
【0035】
M=(Dis=W×D)+(Siz=W×S)+(Rel=W×R)
【0036】
上記の計算式での計算の結果、主顔率「M」が最大となる顔画像データの顔を主顔とする主顔選択処理をステップS206で実行する。主顔選択部19は、この主顔選択処理を実行する。尚、距離重み係数「Dis=W」、顔大きさ重み係数「Siz=W」、および顔信頼度重み係数「Rel=W」は予めROM15に設定する。
【0037】
上記した計算式は1例であり、ここで重要なことは、顔画像データの画像データ内での主要度合いの主顔率「M」を得ることである。したがって、ここで説明した以外の方法であっても、顔画像データの画像データ内での主要度合いの主顔率「M」が得られるのであれば、この実施形態におけるパラメータや計算式以外でも使用可能である。当然のことながら、主要度合いの定義の仕方によっても、パラメータや計算式は異なる場合がありうる。
【0038】
ステップS206では、検出された複数の顔画像データから現在調べている画像データに含まれる顔画像データのなかで主要である、すなわち算出された主顔率「M」を調べて、たとえば主顔率「M」が最大である顔画像データを選ぶ主顔選択処理を実行する。ステップS206の主顔選択処理は、主顔選択部19で実行される。
【0039】
そして、ステップS207に進み、選択された1人の主顔とされた顔画像データについて認証部20での個人認証を実行することにより、短時間での個人認証を行うことが可能となる。
【0040】
ステップS203およびS204の判断で検出された顔の数が1であれば、主顔選択処理は不要であるので直接ステップS207に進み、1人の主顔とされた人物の顔画像データについて個人認証を行う事により、短時間での個人認証を行うことが可能となる。勿論、ステップS204でNOの場合は、ステップS202において、顔画像データが検出されなかった、すなわち、画像データに顔画像データがなく人物がいないことを意味し、個人認証処理を行うことなくステップS208に進むこととなる。
【0041】
この時点で、ステップS208でシャッタSW1が押されたと判断された場合には、ステップS209に進み、焦点制御部12及び露出制御部13を制御して自動焦点制御および自動露出制御を実行する。その後ステップS210でシャッタSW2が押されているのを確認して、ステップS211で撮像動作、すなわち、顔画像データを含む画像データの記録媒体8への記録を実行し、処理を終了する。
【0042】
また、顔画像データ位置、顔画像データの大きさ「S」及び主顔率「M」を画像フレーム毎に記憶する事により、画像フレーム間で画角の変化が少ないと判断できる場合には、以下のように補正して処理することもできる。
【0043】
すなわち、前に撮像した画像データから得られた顔画像データの個人認証処理の結果に応じて、主顔率「M」に対して主顔率重み「Main=W」を乗算して補正し、その後に主顔率「M」が最大となる顔画像データを主顔としても良い。この場合のステップS206における主顔率「M」を補正する計算式を下記に示す。
【0044】
M=Main=WxM
【0045】
さらに、主顔率重み「Main=W」は、個人認証が出来た場合はその数値を大きくするように補正し、個人認証が出来なかった場合には数値を小さくするするように補正することにより、主顔選択処理の精度を高める事も可能である。
【0046】
主顔率「M」が予め定めた閾値より大きい顔画像データが複数ある場合などは、複数の顔画像データに対して個人認証処理を実行することも考えられる。しかし、個人認証する顔画像データの数があまり多くならないように閾値を決めることが必要である。あるいは、個人認証処理する対象の数の上限を設け、主顔率「M」が高いものから上限に達する数までの顔画像データに対して個人認証処理をするようにしてもよい。
【0047】
本発明によれば、1つの画角で撮像される画像データ内に、被写体として複数の人物の顔画像データが含まれる場合においても、ユーザの意図した人物の個人認証が可能である。また、効率的に個人認証を行なうため、高いフレームレートでのEVFでの表示処理が可能となり、シャッタチャンスを逃す事無く撮像が可能な撮像装置を提供することができる。
【0048】
また、笑顔や目瞑りなどを識別する表情認識処理も、目の動きや口角の形状等、顔検出処理よりも詳細な情報を必要とするため、蓄積すべき参照用データが顔検出処理よりも多いという点では共通している。したがって、表情認識処理についても、主顔率の高い顔に関してのみ識別処理を行うという構成にすることにより、識別に要する時間を短縮することができるという効果を得ることが可能となる。
【0049】
また、本発明は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給することによっても実施可能である。すなわち本発明の目的は、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読出し実行することによっても達成される。
【0050】
この場合、記憶媒体から読出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。プログラムコードを供給するための記憶媒体としては、例えばフレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、磁気テープ、不揮発性のメモリカード、ROMなどを用いることができる。
【0051】
また、コンピュータが読出したプログラムコードを実行することで、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOSなどが実際の処理の一部または全部を行いこともありうる。それにより、本発明は、その処理によって前述した実施形態の機能が実現される場合も含まれる。
【0052】
さらに本発明においては、記憶媒体から読出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれて実施することも可能である。したがって、書込まれプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれる。

【特許請求の範囲】
【請求項1】
複数のフレームの画像データに含まれる顔画像データに対して、個人の識別と表情の識別のいずれかの識別処理を行う画像データの識別方法において、
顔検出手段が、前記画像データに含まれる顔画像データを検出する顔検出工程と、
識別手段が、前記顔検出工程で検出された1つまたは複数の顔画像データに対して前記識別処理を行う識別工程とを有し、
前記識別工程では、前記識別処理を行うフレームの画像データに含まれる顔画像データと同じ人物を示す、前のフレームの画像データに含まれる顔画像データについて、前記識別処理に成功した場合に、失敗した場合よりも、高い数値を与えるものであって、該数値の高いものから予め設けた上限に達する数までの顔画像データに対して前記識別処理を行うことを特徴とする画像データの識別方法。
【請求項2】
複数のフレームの画像データに含まれる顔画像データに対して、個人の識別と表情の識別のいずれかの識別処理を行う撮像装置において、
前記画像データに含まれる顔画像データを検出する顔検出手段と、
前記顔検出手段で検出された1つまたは複数の顔画像データに対して前記識別処理を行う識別手段とを有し、
前記識別手段は、前記識別処理を行うフレームの画像データに含まれる顔画像データと同じ人物を示す、前のフレームの画像データに含まれる顔画像データについて、前記識別処理に成功した場合に、失敗した場合よりも、高い数値を与えるものであって、該数値の高いものから予め設けた上限に達する数までの顔画像データに対して前記識別処理を行うことを特徴とする撮像装置。
【請求項3】
請求項1に記載の画像データの識別方法の各工程をコンピュータに実行させるためのプログラム。
【請求項4】
請求項1に記載の画像データの識別方法の各工程をコンピュータに実行させるためのプログラムが記憶されたコンピュータで読み取り可能な記憶媒体。

【図1】
image rotate

【図2】
image rotate


【公開番号】特開2012−160212(P2012−160212A)
【公開日】平成24年8月23日(2012.8.23)
【国際特許分類】
【出願番号】特願2012−114510(P2012−114510)
【出願日】平成24年5月18日(2012.5.18)
【分割の表示】特願2007−103301(P2007−103301)の分割
【原出願日】平成19年4月10日(2007.4.10)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】