説明

個人認証装置、個人認証方法及びプログラム

【課題】精度よく個人認証を行うとともに、個人認証に要する時間を抑えることができるようにする。
【解決手段】検出された顔領域から顔の解像度、顔の向き、顔の表情などの顔の状態を検出する。そして、1つの特徴データのみでも個人認証が可能な状態において、その前の顔の状態が1つの特徴データのみでも十分に個人認証が可能な状態であった場合には、用いる特徴データを1つし、その前の顔の状態が1つの特徴データでは個人認証が不十分である状態であった場合には、用いる特徴データを2つにするように適応的に切り替える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、特に、入力された画像から個人を認証する個人認証装置、個人認証方法及びプログラムに関する。
【背景技術】
【0002】
従来、顔検出機能を利用して個人認証を行う技術が知られている。この技術は、検出した顔画像データから個人ごとに異なる顔領域の特徴データを抽出し、予め登録した特徴データと比較することにより、検出した顔が登録されている人物か否かを識別するものである。しかしながら、上記特徴データは顔の解像度や向きなどの影響を受けるため、登録時と顔の解像度や向きなどが異なる場合には、個人認証の精度が下がってしまう。
【0003】
そこで、このような問題点を解消するために、以下のような技術が開示されている。例えば、複数の顔画像データから3次元顔モデルを生成し、顔の向きを検知したときに検知した顔の向きによって、個人認証をするのに有効な向きの顔画像データを3次元顔モデルより生成する。そして、生成した顔画像データで個人認証を行う方法が知られている(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2009−43065号公報
【特許文献2】特開2005−266981号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、特許文献1に記載の方法では、顔の向きを検知してから顔画像データを生成し、個人認証に使用しているため、個人認証を行うまで多くの処理時間がかかってしまい、結果として認証率が下がってしまう。さらに、向きの異なる複数の顔画像データから、新たな向きの顔画像データを生成するという非常に複雑な処理を必要とする。
【0006】
一方、顔の向きを検知してから顔画像データを生成すると多くの処理時間がかかってしまうため、顔画像データを予め用意しておくことが考えられる。この場合、いかなる顔の向きにも対応する顔画像データを登録すると、メモリの容量も膨大なものとなってしまうことから、正面向き、左向き、右向きなどの離散的な向きの顔画像データをいくつか登録しておく。そして、これら向きの異なる顔画像データを複数組み合わせて個人認証を行うことが考えられる。例えば、正面向きと右向きとの間の向きの顔であっても、正面向きで登録された顔画像データによる個人認証の評価値と、右向きで登録された顔画像データによる個人認証の評価値との総和を用いることにより、その人物が誰であるかを認証することが可能となる。
【0007】
ここで、動画を撮影する時や、撮影準備のために被写体の様子をリアルタイムで動画としてモニターに表示するライブビュー時では、個人認証の対象となる人物の顔の向きも固定されているわけではなく、顔の向きが随時変化することが多い。どの顔の向きに対しても漏れなく個人認証をするためには、常に、複数の向きの異なる顔画像データによる評価値の総和を求めればよいが、個人認証に用いる顔画像データが増えるほど、個人認証に要する処理時間が増えてしまうことになる。
【0008】
本発明は前述の問題点に鑑み、精度よく個人認証を行うとともに、個人認証に要する時間を抑えることができるようにすることを目的としている。
【課題を解決するための手段】
【0009】
本発明の個人認証装置は、入力された画像データに含まれる人物の顔領域を検出する顔検出手段と、前記顔検出手段により検出された顔領域から顔の状態を検出する顔状態検出手段と、個人認証用の複数の特徴データを記憶する記憶手段と、前記顔状態検出手段により検出された顔の状態に基づいて、前記記憶手段から特徴データを選択する選択手段と、前記顔検出手段により検出された顔領域と前記選択手段により選択された特徴データとを比較することにより、個人を認識する認証手段とを備え、前記選択手段が、前記記憶手段から選択する特徴データの数を前記顔状態検出手段により前回検出された顔の状態に基づいて選択した特徴データの数よりも増やす場合と、減らす場合とで、前記顔状態検出手段により検出される顔の状態の閾値が異なることを特徴とする。
【発明の効果】
【0010】
本発明によれば、精度よく個人認証を行うとともに、個人認証に要する時間を抑えることができる。
【図面の簡単な説明】
【0011】
【図1】実施形態に係る撮像装置の概略構成例を示すブロック図である。
【図2】第1の実施形態における個人認証処理手順の一例を示すフローチャートである。
【図3】第1の実施形態において、顔の状態変化と、選択される特徴データの変化との関係を示す図である。
【図4】第2の実施形態における個人認証処理手順の一例を示すフローチャートである。
【図5】第2の実施形態において、顔の状態変化と、選択される特徴データの変化との関係を示す図である。
【図6】正面顔及び横顔の特徴データの一例を示す図である。
【発明を実施するための形態】
【0012】
以下に、添付図面を参照しながら本発明の実施形態について詳細に説明する。以下に説明する実施形態は、本発明の実現するための一例であり、本発明が適用される装置の構成や各種条件によって適宜修正又は変更されるべきものであり、本発明は以下の実施形態に限定されるものではない。
【0013】
(第1の実施形態)
図1は、本実施形態に係る撮像装置100の概略構成例を示すブロック図である。
図1に示すように、レンズ系101によって被写体像を表す光線が集光され、CCD等の撮像素子102に入射される。撮像素子102から出力された映像信号は、アナログ信号処理部103において相関二重サンプリング等のアナログ信号処理が行われる。アナログ信号処理部103から出力された映像信号は、A/D変換部104においてデジタル信号である画像データに変換され、撮像系制御部111及びデジタル信号処理部105に入力される。デジタル信号処理部105においては、A/D変換部104から出力された画像データに対してガンマ補正処理、ホワイトバランス処理等のデジタル画像信号処理が実行される。
【0014】
また、撮像系制御部111は、A/D変換部104から出力された画像データ、或いは不図示の操作部を介してユーザからの指示に基づいて、露出制御、焦点制御、シャッタ制御等をレンズ系101や撮像素子102に対して実行する。
【0015】
デジタル信号処理部105から出力された画像データは、一時記憶部106に一時的に記憶され、表示制御部109により表示装置110の表示画面上にその画像が表示される。また、デジタル信号処理部105から出力された画像データは、一時記憶部106を介して、顔検出部114にも入力される。また、着脱可能な記録媒体108に記録されている画像データを記録制御部107によって読み出すことができる。
【0016】
顔検出部114は、画像データから人物の顔領域の位置やサイズを検出する。顔検出については既知の方法を用いる。例えば、顔検出部114は、入力された画像データから、鼻、口や目などの顔領域の構成要素に相当する形状を抽出し、両目の中間を通過する延長線上に鼻と口が存在する領域を検出する。そして、両目の大きさとそれらの距離とから顔の大きさを推定し、鼻の中心に相当する位置を基準として、推定した大きさの領域で囲まれた領域を顔領域とする。
【0017】
また、顔検出部114は、検出された顔領域から特徴データを抽出する。特徴データは、例えば、特許文献2に開示されているように、口、目、眉毛、鼻など顔の構成要素の具体的な形状や、これらの構成要素の位置に関する情報を含む。ここで、特徴データは、入力された顔領域の画像データから、例えばニューラルネットワークや空間フィルタを用いたエッジ検出などの手法を用いて算出することにより抽出することができる。なお、形状や位置に関する情報だけでなく、彩度や色相に関する情報も特徴データに含めるようにしてもよい。1つの顔における特徴データが多いほど、その顔の様子を詳細に解析することが可能となり、この特徴データを用いた個人認証の精度が向上する。
【0018】
顔状態検出部115は、顔検出部114で抽出された特徴データに基づいて、その顔がどのような状態をしているかを検出する。ここで顔の状態とは、例えば顔の解像度、顔の向き、顔の表情などが挙げられる。
【0019】
特徴データ選択部116は、顔状態検出部115で検出された顔の状態と予め選択されている特徴データとを基に、記憶部113に予め登録されている個人認証用の特徴データの中から条件に合った特徴データを選択し、一時記憶部106に記憶する。このとき、詳細については後述するが、一時記憶部106に記憶される特徴データを増やす処理と減らす処理とでは条件が異なる。また、記憶部113に記憶されている特徴データは顔領域の特徴量のみを保持してもよいし、画像データもしくは画像データを作成できるモデルを保持しておき、必要なときに顔領域の特徴量を抽出してもよい。
【0020】
個人認証部117は、一時記憶部106に記憶された特徴データと、顔検出部114により抽出された顔領域の特徴データとを比較・照合することにより個人認証を行う。これらの個人認証処理は、システム制御部112の制御に従って実行される。
【0021】
通常の撮影においては、撮像装置100の不図示のシャッタが押下されると、被写体が撮像され、撮像素子102により被写体像を表す画像データが得られる。そして、デジタル信号処理部105を介して一時記憶部106に一時的に画像データが記憶される。さらに、一時記憶部106から画像データが読み出され、記録制御部107によって記録媒体108に記録されて、一連の撮影動作を完了する。
【0022】
なお、本実施形態に係る撮像装置100は、単体の装置で構成されてもよく、複数の装置からなるシステムで構成されてもよい。例えば、デジタルカメラやデジタルビデオカメラ単体の内部に、図1に示したレンズ系101から個人認証部117までの全ての構成を備えてもよい。あるいは、レンズ系101からデジタル信号処理部105までの構成のみをデジタルカメラやデジタルビデオカメラの内部に持たせ、それ以外の構成をデジタルカメラやデジタルビデオカメラと通信可能な外部のコンピュータに持たせもよい。さらには、レンズ系101から個人認証部117までの全ての構成をネットワーク上の複数のコンピュータに分担して持たせてもよい。
【0023】
図2は、本実施形態に係る撮像装置100による個人認証処理手順の一例を示すフローチャートである。
まず、図2のステップS201において、デジタル信号処理部105は、撮像素子102等を介して画像データを取得し、一時記憶部106に記憶する。本実施形態では、主に動画データやライブビューのような時間的に連続した画像データを取得する。動画データやライブビューの場合、個人認証に要する時間に応じたフレーム間隔で連続的に個人認証が行われる。以下の説明では、ステップS201において、動画中の1フレームが画像データとして入力されたものとする。なお、撮像装置100にて撮影した静止画データに適用してもよく、記録媒体108に記録されている画像データを読み出して、同様の処理を行ってもよい。
【0024】
次に、ステップS202において、顔検出部114は、ステップS201で取得した画像データから人物の顔領域を検出し、さらに検出した顔領域から特徴データを抽出する。そして、ステップS203において、顔検出部114は、1つ以上の顔を検出したか否かを判定する。この判定の結果、1つ以上の顔を検出した場合はステップS204に進み、1つも顔を検出できなかった場合はステップS225に進む。
【0025】
ステップS204においては、顔状態検出部115は、ステップS202において検出された顔の状態を検出する。顔の状態とは例えば顔の解像度、顔の向き、顔の表情などが挙げられ、顔状態検出部115は、これらの状態を評価値として算出する。また、ステップS202において顔を複数検出した場合は、全ての顔に対して顔の状態を検出してもよく、一部の顔について顔の状態を検出してもよい。また、代表となる顔を選んで顔の状態を検出してもよい。以下、説明を分かりやすくするために、顔の状態として顔の向きについて検出し、図6に示すような正面顔601及び横顔602の特徴データが記憶部113に予め記憶されているものとする。さらに検出される顔は一つだけであることを想定して説明する。
【0026】
以下、ステップS205〜S223の処理は、特徴データ選択部116により行われる処理であり、図3を参照しながら説明する。
図3は、本実施形態において、顔の状態変化と、選択される特徴データの変化との関係を示す図である。図3における縦軸は、入力された画像データに係る顔の状態の評価値を示し、横軸は時間を示している。なお、前述したように、顔の状態とは顔の向きを表すものとし、記憶部113には、図6に示す正面顔601及び横顔602の特徴データが記憶されているものとする。
【0027】
図3に示すように、顔状態検出部115において検出された顔の状態により、選択される特徴データが変化する。ここで、正面顔601を示す特徴データ301には、広い範囲303と狭い範囲304とを持たせる。同様に、横顔602を示す特徴データ302にも広い範囲305と狭い範囲306とを持たせる。なお、これらの範囲の大きさはユーザが任意に設定できるようにしてもよいし、記憶部113に予め記憶されている特徴データの種類や枚数などに応じて設定してもよい。その際、特徴データ301、302のそれぞれの広い範囲303、305が互いに重ならないようにする。
【0028】
本実施形態では、特徴データの選択方法が5つの領域で異なっている。ここで、範囲304をレベル1とし、範囲303のうち範囲304に含まれない領域をレベル2とする。また、範囲306をレベル5とし、範囲305のうち範囲306に含まれない領域をレベル4とする。さらに、レベル2とレベル4との間の領域をレベル3とする。
【0029】
ここで、選択される特徴データを増やすタイミングは、顔の状態がレベル2からレベル3へ変化するとき、またはレベル4からレベル3へ変化するときである。一方、選択される特徴データを減らすタイミングは、顔の状態がレベル4からレベル5へ変化するとき、またはレベル2からレベル1へ変化するときである。したがって、入力された画像データに係る顔の状態がレベル2またはレベル4のときに、選択される特徴データが異なる場合がある。すなわち、顔の状態がレベル1からレベル2に変化したときは、選択される特徴データは正面顔601のままであり、顔の状態がレベル3からレベル2に変化したときは、選択される特徴データが正面顔601及び横顔602のままである。また、顔の状態がレベル5からレベル4に変化したときは、選択される特徴データは横顔602のままであり、顔の状態がレベル3からレベル4に変化したときは、選択される特徴データは正面顔601及び横顔602のままである。
【0030】
図2の説明に戻り、次のステップS205において、個人認証処理が1回目であるか否かを判定する。この判定の結果、1回目である場合はステップS206に進み、そうでない場合はステップS211に進む。ステップS206においては、顔の状態が図3に示したレベル1であるか否かを判定する。この判定の結果、レベル1である場合はステップS210に進み、正面顔601の特徴データを選択してステップS224に進む。
【0031】
一方、ステップS206の判定の結果、顔の状態がレベル1でない場合は、ステップS207において、顔の状態がレベル5であるか否かを判定する。この判定の結果、レベル5である場合はステップS209に進み、横顔602の特徴データを選択してステップS224に進む。一方、ステップS207の判定の結果、顔の状態がレベル5でない場合、つまりレベル2、レベル3、またはレベル4である場合は、ステップS208に進み、正面顔601及び横顔602の両方の特徴データを選択してステップS224に進む。
【0032】
一方、ステップS211においては、顔の状態がレベル1であるか否かを判定する。この判定の結果、顔の状態がレベル1である場合は、ステップS212において、正面顔601の特徴データを選択し、ステップS224に進む。一方、ステップS211の判定の結果、顔の状態がレベル1でない場合はステップS213に進む。
【0033】
次に、ステップS213において、顔の状態がレベル5であるか否かを判定する。この判定の結果、顔の状態がレベル5である場合は、ステップS214において、横顔602の特徴データを選択し、ステップS224に進む。一方、ステップS213の判定の結果、顔の状態がレベル5でない場合はステップS215に進む。
【0034】
次に、ステップS215において、顔の状態がレベル3であるか否かを判定する。この判定の結果、顔の状態がレベル3である場合は、ステップS216において、正面顔601及び横顔602の両方の特徴データを選択し、ステップS224に進む。一方、ステップS215の判定の結果、顔の状態がレベル3でない場合はステップS217に進む。
【0035】
次に、ステップS217において、顔の状態がレベル2であるか否かを判定する。この判定の結果、顔の状態がレベル3である場合は、ステップS218に進み、顔の状態がレベル2でない場合、つまり顔の状態がレベル4である場合はステップS221に進む。
【0036】
ステップS218においては、正面顔601の特徴データのみが今まで選択されていたか否かを判定する。この判定の結果、正面顔601の特徴データのみが選択されていた場合は、ステップS219において、選択する特徴データを正面顔601のままとし、ステップS224に進む。一方、ステップS218の判定の結果、そうでない場合、つまり、正面顔601及び横顔602の両方の特徴データが今まで選択されていた場合は、ステップS220に進む。そして、ステップS220において、選択する特徴データを正面顔601及び横顔602の両方のままとし、ステップS224に進む。
【0037】
一方、ステップS221においては、横顔602の特徴データのみが今まで選択されていたか否かを判定する。この判定の結果、横顔602の特徴データのみが選択されていた場合は、ステップS222において、選択する特徴データは横顔602のままとし、ステップS224に進む。一方、ステップS212の判定の結果、そうでない場合、つまり、正面顔601及び横顔602の両方の特徴データが今まで選択されていた場合は、ステップS223に進む。そして、ステップS223において、選択する特徴データを正面顔601及び横顔602の両方のままとし、ステップS224に進む。
【0038】
以上のようにステップS205〜S223の処理により特徴データ選択部116によって特徴データが選択される。そして、ステップS224において、個人認証部117は、ステップS202で顔検出部114により抽出された画像データの特徴データと選択されている特徴データとを比較し、その顔が誰であるのかを識別し、ステップS225に進む。
【0039】
次に、ステップS225において、まだ次の画像データ(フレーム)があるか否かを判定する。この判定の結果、次の画像データがある場合はステップS201に戻り、そうでない場合は、処理を終了する。
【0040】
以上のように本実施形態では、選択する特徴データを増やすときと減らすときとで閾値を異なるようにしている。すなわち、選択する特徴データが正面顔601から、正面顔601及び横顔602の2つに増やす場合には、顔の向きの評価値が閾値307を上回る必要がある。これに対して、選択する特徴データを正面顔601及び横顔602の2つから、正面顔601のみに減らす場合には、顔の向きの評価値が閾値308を下回る必要がある。このように、選択する特徴データが増える場合と減る場合とでその閾値を異なるようにする理由について、以下に説明する。
【0041】
動画を撮影する時や、撮影準備のために被写体の様子をリアルタイムで動画としてモニターに表示するライブビュー時では、個人認証の対象となる人物の顔の向きが随時変化する。そして、その都度、個人認証の対象となる人物の顔の向きに応じた特徴データを選択する必要がある。また、顔の向きを判別する処理自体にも、ある程度の処理時間が必要となるため、顔の向きを検出したところで、タイムラグによって実際の顔の向きとの間にはいくらかの差異が生じていることも考えられる。
【0042】
このような状況を鑑みると、常に2つ以上の特徴データを参照し、それらの照合結果の総和に基づいて個人を判定することも考えられるが、常に2つ以上の特徴データ分の照合時間を要することになってしまう。そこで、本実施形態では、正面顔601または横顔602の特徴データのみを用いれば足りる可能性が高い場合と、正面顔601及び横顔602の2つの特徴データを用いる必要がある場合とを適応的に切り替えている。
【0043】
例えば、個人認証の対象となる人物がレベル1に相当するほぼ正面を向いていることが前回検出されており、それからレベル2に相当するやや斜めに向いたことが検出された場合には、この顔の動きとして次の2つの場合が考えられる。1つは、そのまま顔の向きがレベル3に相当する斜めに近づく動きであり、もう1つは、正面を向いていた被写体がたまたまレベル2に相当する向きの余所見をした動きである。後者の場合は、顔の向きがすぐにレベル1に戻ることになる。
【0044】
このように、顔の向きがレベル1から閾値308を通過してレベル2となった場合には、顔の向きがそのままレベル3に向かっていく可能性と、再びレベル1に戻る可能性とが存在する。レベル2であっても正面顔601の特徴データがあれば個人認証を行うことができるため、再びレベル1に戻る可能性を考慮して、正面顔601の特徴データのみを用いるようにする。このようにすることによって、正面顔601及び横顔602の2つの特徴データを用いる場合よりも、個人認証に要する処理時間を短縮することができる。
【0045】
同様に、個人認証の対象となる人物がレベル3に相当するほぼ斜めを向いていることが検出されており、それからレベル2に相当するやや斜めに向いたことが検出された場合には、この顔の動きとして次の2つの場合が考えられる。1つは、そのまま顔の向きがレベル1に相当する正面に近づく動きであり、もう1つは、レベル3に相当する斜めを向いていた被写体がたまたまレベル2に相当する向きの余所見をした動きである。後者の場合は、顔の向きがすぐにレベル3に戻ることになる。
【0046】
このように、顔の向きがレベル3から閾値307を通過してレベル2となった場合には、顔の向きがそのままレベル1に向かっていく可能性と、再びレベル3に戻る可能性とが存在する。レベル3では、正面顔601または横顔602のみでは十分な照合結果が得られないため、レベル3に戻る可能性があることから、レベル2であっても、正面顔601及び横顔602の2つの特徴データを用いることが望まれる。顔の向きが少なくとも閾値308を通過してレベル1となり、横顔602の特徴データがない場合であっても十分な照合結果が得られるようになった段階で、特徴データを正面顔601のみとする。
【0047】
以上説明したように、顔の向きがレベル2であると検出された場合であっても、それがレベル1の向きであった顔が余所見をした結果か、レベル3の向きであった顔が余所見をした結果かによって、その後に顔の向きがどちらを向くかという確率が異なる。このように1つの特徴データのみでも個人認証が可能な状態において、その前の顔の状態に応じて、用いる特徴データを1つにするか、あるいは、2つにするかを適応的に切り替える。これにより、個人認証が成功する確率を担保するとともに、照合に用いる特徴データの数を状況に応じて減らして処理時間の短縮を図ることが可能となる。
【0048】
(第2の実施形態)
第1の実施形態では、1つの特徴データに対し2つの範囲を設け、その範囲を超えたかどうかにより選択する特徴データを変更した。これに対して本実施形態では、1つの特徴データに対し範囲を1つだけ設け、選択されている特徴データを減らすタイミングは、範囲を超え、かつ一定期間安定したと判断したときとする。なお、本実施形態に係る撮像装置の概略構成は、第1の実施形態で説明した図1と同様であるため、説明は省略する。
【0049】
図4は、本実施形態に係る撮像装置100による個人認証処理手順の一例を示すフローチャートである。なお、図4のステップS201〜S204、S224及びS225の処理については、第1の実施形態で説明した図2と同様の処理であるため、説明は省略する。また、ステップS405〜S423の処理は、特徴データ選択部116により行われる処理であり、図5を参照しながら説明する。
【0050】
図5は、本実施形態において、顔の状態変化と、選択される特徴データの変化との関係を示す図である。図5における縦軸は、入力された画像データに係る顔の状態の評価値を示し、横軸は時間を示している。また、第1の実施形態と同様に、顔の状態とは顔の向きを表すものとし、記憶部113には、図6に示す正面顔601及び横顔602の特徴データが記憶されているものとする。
【0051】
図5に示すように、顔状態検出部115において検出された顔の状態により、選択される特徴データが変化する。本実施形態では、正面顔601を示す特徴データ501には1つの範囲503を持たせ、横顔602を示す特徴データ502には1つの範囲504を持たせる。なお、これらの範囲の大きさはユーザが任意に設定できるようにしてもよいし、記憶部113に予め記憶されている特徴データの種類や枚数などに応じて設定してもよい。その際、範囲503、504が互いに重ならないようにする。
【0052】
本実施形態では、特徴データの選択方法が3つの領域で異なっている。ここで、範囲503をレベルAとし、範囲504をレベルCとする。また、レベルAとレベルCとの間の領域をレベルBとする。
【0053】
本実施形態では、さらに安定したと判断するために必要な期間が設けられている。この期間はユーザが任意に設定できるようにしてもよいし、状況に応じて設定するようにしてもよい。例えば、入力された画像データに係る顔の状態が1つの領域に留まる時間が短く、変化が不規則なシーンの場合はこの期間を長くし、1つの領域に留まる時間が長く、変化が規則的なシーンの場合はこの期間を短くする。
【0054】
ここで、選択される特徴データを増やすタイミングは、特徴データとして正面顔601か横顔602のいずれか一方が選択されているときに、顔の状態がレベルBに変化するときである。一方、選択される特徴データを減らすタイミングは、顔の状態がレベルBからレベルA、またはレベルBからレベルCに変化し、変化してから所定の期間以上その領域(レベル)に留まったときである。つまり、レベルAやレベルCになっても、すぐに選択する特徴データを減らすことができない。
【0055】
このように本実施形態では、選択する特徴データを増やす処理と減らす処理とでは条件が異なる。正面顔601または横顔602の特徴データが選択されているときに、検出した顔の状態が斜め方向になった場合は、早い段階で選択する特徴データを増やすことによりタイムラグを減少させ、認証率を向上させる。一方、正面顔601及び横顔602の両方の特徴データが選択されているときに、正面顔601及び横顔602のいずれかが、検出した顔の状態から遠ざかったときに、その特徴データを比較対象から除外する条件を厳しくする。
【0056】
図4の説明に戻り、ステップS405においては、個人認証処理が1回目であるか否かを判定する。この判定の結果、1回目である場合はステップS406に進み、そうでない場合はステップS411に進む。ステップS406においては、顔の状態がレベルAであるか否かを判定する。この判定の結果、顔の状態がレベルAである場合は、ステップS410において、正面顔601の特徴データを選択し、ステップS224に進む。一方、ステップS406の判定の結果、顔の状態がレベルAでない場合は、ステップS407に進む。
【0057】
次に、ステップS407において、顔の状態がレベルCであるか否かを判定する。この判定の結果、顔の状態がレベルCである場合は、ステップS409において、横顔602の特徴データを選択し、ステップS224に進む。一方、ステップS407の判定の結果、顔の状態がレベルCでない場合、つまりレベルBである場合は、ステップS408に進み、正面顔601及び横顔602の両方の特徴データを選択し、ステップS224に進む。
【0058】
一方、ステップS411においては、顔の状態がレベルBであるか否かを判定する。この判定の結果、顔の状態がレベルBである場合は、ステップS412において、正面顔601及び横顔602の両方の特徴データを選択し、ステップS224に進む。一方、ステップS411の判定の結果、顔の状態がレベルBでない場合はステップS413に進む。
【0059】
次に、ステップS413において、顔の状態がレベルAであるか否かを判定する。この判定の結果、顔の状態がレベルAである場合は、ステップS414に進み、顔の状態がレベルAでない場合、つまり顔の状態がレベルCである場合はステップS419に進む。
【0060】
ステップS414においては、選択されている特徴データが正面顔601のみであるか否かを判定する。この判定の結果、選択されている特徴データが正面顔601のみである場合は、ステップS415において、選択する特徴データを正面顔601のままとし、ステップS224に進む。一方、ステップS414の判定の結果、選択されている特徴データが正面顔601のみでない場合、つまり選択されている特徴データが正面顔601及び横顔602の両方である場合は、ステップS416に進む。
【0061】
ステップS416においては、レベルAで顔の状態が所定の時間維持されたか否かを判定する。この判定の結果、レベルAで顔の状態が所定の時間維持された場合、つまり顔の状態が所定数のフレームの間レベルAが維持された場合は、ステップS417において、正面顔601の特徴データを選択し、ステップS224に進む。一方、ステップS416の判定の結果、レベルAで顔の状態が所定の時間維持されていない場合は、ステップS418において、選択する特徴データを正面顔601及び横顔602の両方のままとし、ステップS224に進む。
【0062】
一方、ステップS419においては、選択されている特徴データが横顔602のみであるか否かを判定する。この判定の結果、選択されている特徴データが横顔602のみである場合は、ステップS420において、選択する特徴データを横顔602のままとし、ステップS224に進む。一方、ステップS419の判定の結果、選択されている特徴データが横顔602のみでない場合、つまり選択されている特徴データが正面顔601及び横顔602の両方である場合は、ステップS421に進む。
【0063】
次に、ステップS421において、レベルCで顔の状態が所定の時間維持されたか否かを判定する。この判定の結果、レベルAで顔の状態が所定の時間維持された場合、つまり顔の状態が所定数のフレームの間レベルCが維持された場合は、ステップS422において、横顔602の特徴データを選択し、ステップS224に進む。一方、ステップS421の判定の結果、レベルCで顔の状態が所定の時間維持されていない場合は、ステップS423において、選択する特徴データを正面顔601及び横顔602の両方のままとし、ステップS224に進む。
【0064】
以上のように本実施形態では、選択する特徴データを増やすときと、減らすときとで、時間的な条件が異なるようにしている。顔の向きがレベルAから閾値505を通過してレベルBになった場合には、選択する特徴データを正面顔601のみから、即座に正面顔601及び横顔602の2つに増やす。一方、選択する特徴データを正面顔601及び横顔602の2つから、正面顔601のみに減らす場合には、顔の向きがレベルBから閾値505を通過してレベルAになってから所定の時間、レベルAを維持する必要がある。この理由について、以下に説明する。
【0065】
例えば、個人認証の対象となる人物がもともとレベルAに相当するほぼ正面を向いていることが検出されており、それからレベルBに相当する斜めを向いたことが検出された場合には、正面顔601のみ、あるいは、横顔602のみでは十分な照合結果が得られない。このため、すぐに特徴データを正面顔601及び横顔602の2つに増やす必要がある。
【0066】
これに対して、個人認証の対象となる人物がもともとレベルBに相当する斜めを向いていることが検出されており、それからレベルAに相当するほぼ正面を向いたことが検出された場合には、この顔の動きとして次の2つの場合が考えられる。1つは、そのまま顔の向きがレベルAに相当するほぼ正面の向きに滞在する動きであり、もう1つは、レベルBに相当する斜めを向いていた被写体がたまたまレベルAに相当するほぼ正面の向きに余所見をした動きである。後者の場合は、顔の向きはすぐにレベルBに戻ることになる。
【0067】
このように、顔の向きがレベルBから閾値505を通過してレベルAとなった場合には、顔の向きがそのままレベルAに滞在する可能性と、再びレベルBに戻る可能性とが存在する。レベルBでは、正面顔601のみ、あるいは、横顔602のみでは十分な照合結果が得られないため、レベルBに戻る可能性がある場合は、レベルAであっても、正面顔601及び横顔602の2つの特徴データを用いることが望まれる。したがって、顔の向きが所定の時間以上継続してレベルAとなり、顔の向きがレベルAで落ち着いたと判断できるようになった段階で、特徴データを正面顔601のみとする。
【0068】
以上説明したように本実施形態によれば、1つの特徴データが必要な状況から2つの特徴データが必要な状況に変化した場合には、特徴データを無条件で増やす。これに対して、2つの特徴データが必要な状況から1つの特徴データだけで足りる状況に変化した場合には、1つの特徴データで足りる状況が所定の時間以上経過したことを確認してから、特徴データを減らすようにする。これにより、個人認証が成功する確率を担保するとともに、照合に用いる特徴データの数を状況に応じて減らして処理時間の短縮を図ることが可能となる。
【0069】
(その他の実施形態)
前述した第1及び第2の実施形態では、顔の状態として顔の向きのみに注目したが、顔の解像度や表情などに注目してもよく、複数の状態を組み合わせてもよい。また、例外的な処理として、撮像装置100が大きく動いてしまったり、顔の動きが速すぎたりして、特徴データの選択処理が追いつかないような場合は、特徴データの選択処理を1回目の処理として扱ってもよい。
【0070】
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
【符号の説明】
【0071】
112 システム制御部
113 記憶部
114 顔検出部
115 顔状態検出部
116 特徴データ選択部
117 個人認証部

【特許請求の範囲】
【請求項1】
入力された画像データに含まれる人物の顔領域を検出する顔検出手段と、
前記顔検出手段により検出された顔領域から顔の状態を検出する顔状態検出手段と、
個人認証用の複数の特徴データを記憶する記憶手段と、
前記顔状態検出手段により検出された顔の状態に基づいて、前記記憶手段から特徴データを選択する選択手段と、
前記顔検出手段により検出された顔領域と前記選択手段により選択された特徴データとを比較することにより、個人を認証する認証手段とを備え、
前記選択手段が、前記記憶手段から選択する特徴データの数を前記顔状態検出手段により前回検出された顔の状態に基づいて選択した特徴データの数よりも増やす場合と、減らす場合とで、前記顔状態検出手段により検出される顔の状態の閾値が異なることを特徴とする個人認証装置。
【請求項2】
入力された画像データに含まれる人物の顔領域を検出する顔検出手段と、
前記顔検出手段により検出された顔領域から顔の状態を検出する顔状態検出手段と、
個人認証用の複数の特徴データを記憶する記憶手段と、
前記顔状態検出手段により検出された顔の状態に基づいて、前記記憶手段から特徴データを選択する選択手段と、
前記顔検出手段により検出された顔領域と前記選択手段により選択された特徴データとを比較することにより、個人を認証する認証手段とを備え、
前記選択手段が、前記記憶手段から選択する特徴データの数を前記顔状態検出手段により前回検出された顔の状態に基づいて選択した特徴データの数よりも減らす場合は、前記顔状態検出手段により検出された顔の状態が所定の閾値を超えてから所定の時間が経過していることを条件とすることを特徴とする個人認証装置。
【請求項3】
前記所定の時間は、ユーザの操作に応じて設定された時間、またはシーンに応じた時間であることを特徴とする請求項2に記載の個人認証装置。
【請求項4】
前記記憶手段に記憶されている特徴データは、正面顔及び横顔の特徴データであることを特徴とする請求項1〜3の何れか1項に記載の個人認証装置。
【請求項5】
前記顔状態検出手段により検出される顔の状態とは、顔の解像度、顔の向き、または顔の表情であることを特徴とする請求項1〜4の何れか1項に記載の個人認証装置。
【請求項6】
前記記憶手段は、画像データまたはモデルに含まれる顔領域の特徴量を特徴データとして記憶していることを特徴とする請求項1〜5の何れか1項に記載の個人認証装置。
【請求項7】
前記閾値は、ユーザの操作に応じて設定された値、または前記記憶手段に記憶されている特徴データに応じた値であることを特徴とする請求項1〜6の何れか1項に記載の個人認証装置。
【請求項8】
入力された画像データに含まれる人物の顔領域を検出する顔検出工程と、
前記顔検出工程において検出された顔領域から顔の状態を検出する顔状態検出工程と、
前記顔状態検出工程において検出された顔の状態に基づいて、記憶手段から個人認証用の特徴データを選択する選択工程と、
前記顔検出工程において検出された顔領域と前記選択工程において選択された特徴データとを比較することにより、個人を認証する認証工程とを備え、
前記選択工程において、前記記憶手段から選択する特徴データの数を前記顔状態検出工程において前回検出された顔の状態に基づいて選択した特徴データの数よりも増やす場合と、減らす場合とで、前記顔状態検出工程において検出される顔の状態の閾値が異なることを特徴とする個人認証方法。
【請求項9】
入力された画像データに含まれる人物の顔領域を検出する顔検出工程と、
前記顔検出工程において検出された顔領域から顔の状態を検出する顔状態検出工程と、
前記顔状態検出工程において検出された顔の状態に基づいて、記憶手段から個人認証用の特徴データを選択する選択工程と、
前記顔検出工程において検出された顔領域と前記選択工程において選択された特徴データとを比較することにより、個人を認証する認証工程とを備え、
前記選択工程において、前記記憶手段から選択する特徴データの数を前記顔状態検出工程において前回検出された顔の状態に基づいて選択した特徴データの数よりも減らす場合は、前記顔状態検出工程において検出された顔の状態が所定の閾値を超えてから所定の時間が経過していることを条件とすることを特徴とする個人認証方法。
【請求項10】
入力された画像データに含まれる人物の顔領域を検出する顔検出工程と、
前記顔検出工程において検出された顔領域から顔の状態を検出する顔状態検出工程と、
前記顔状態検出工程において検出された顔の状態に基づいて、記憶手段から個人認証用の特徴データを選択する選択工程と、
前記顔検出工程において検出された顔領域と前記選択工程において選択された特徴データとを比較することにより、個人を認証する認証工程とをコンピュータに実行させ、
前記選択工程において、前記記憶手段から選択する特徴データの数を前記顔状態検出工程において前回検出された顔の状態に基づいて選択した特徴データの数よりも増やす場合と、減らす場合とで、前記顔状態検出工程において検出される顔の状態の閾値が異なることを特徴とするプログラム。
【請求項11】
入力された画像データに含まれる人物の顔領域を検出する顔検出工程と、
前記顔検出工程において検出された顔領域から顔の状態を検出する顔状態検出工程と、
前記顔状態検出工程において検出された顔の状態に基づいて、記憶手段から個人認証用の特徴データを選択する選択工程と、
前記顔検出工程において検出された顔領域と前記選択工程において選択された特徴データとを比較することにより、個人を認証する認証工程とをコンピュータに実行させ、
前記選択工程において、前記記憶手段から選択する特徴データの数を前記顔状態検出工程において前回検出された顔の状態に基づいて選択した特徴データの数よりも減らす場合は、前記顔状態検出工程において検出された顔の状態が所定の閾値を超えてから所定の時間が経過していることを条件とすることを特徴とするプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2012−226598(P2012−226598A)
【公開日】平成24年11月15日(2012.11.15)
【国際特許分類】
【出願番号】特願2011−94291(P2011−94291)
【出願日】平成23年4月20日(2011.4.20)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】