未知の顔の入力画像を既知の顔の基準画像と比較する方法

【課題】方法は、既知の顔の基準画像を使用して入力画像内の未知の顔を識別する。
【解決手段】各画像からＨａａｒ−ｌｉｋｅ特徴ベクトルを抽出する。このベクトルを圧縮する。入力画像の圧縮特徴ベクトルと、基準画像のセットからの各圧縮特徴ベクトルとの間のＬ１ノルムを求めて、最も類似している基準画像を求める。最も類似している基準画像に関連付けられる顔のアイデンティティが、入力画像内の未知の顔のアイデンティティとして指定される。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、包括的にはパターン及び物体の認識に関し、より詳細には、圧縮特徴ベクトルを使用して静止画像及び動画像内で人の顔を識別することに関する。
【背景技術】
【０００２】
人を識別する際に、顔の画像が使用されることが多い。本発明において使用される場合、混乱を招かないように、検出とは、画像内にあるのが何であるか、すなわち、画像内に顔があるか否かを意味している。また、識別とは、画像内にいるのが誰であるか、すなわち、画像内の顔のアイデンティティ（identity：識別性）を判断することを意味している。
【０００３】
顔識別では、未知の顔を特徴のベクトルによって表すことができる。２つの顔画像を比較するために、特徴ベクトルを使用して類似度スコアが計算される。類似度スコアが高いほど、それらの顔は、類似している。一例の顔識別用途では、特徴値は、３２ビットで記憶される浮動小数点数である。単一の顔の特徴ベクトルは、１０００個程度の特徴、すなわち、３２０００ビットを有する。明らかに、このような大きな特徴ベクトルは、メモリを消費し、処理のために相当量の資源を必要とする。これは、既知の基準画像の基礎的データベースが数百万の画像を含む可能性がある場合に、特に当てはまる。
【０００４】
自明の解決策は、特徴ベクトルを圧縮することである。しかしながら、データを圧縮することは、データを廃棄することになり、圧縮されたデータに対する操作によって、結果の精度が低下することがよく知られている。
【０００５】
顔識別
人の最も視覚的に区別可能な特徴の１つが、顔である。したがって、静止画像及び動画像（ビデオ）内の顔の検出及び識別は、画像から人を識別することが望ましい多くの用途にとって重要な技術である。顔識別は、コンピュータビジョン技術に対して極度に困難な課題を提示する。
【０００６】
たとえば、監視カメラが必要とする顔画像では、シーンの照明が粗末であり、制御されていないことが多く、該カメラは、一般的に品質が低く、通常、シーンの重要である可能性がある部分から離れている。シーン内の顔のロケーション及び向きは、通常、制御することができない。髪の生え際、まつ毛、及び顎のようないくつかの顔特徴は、変化しやすい。口のような他の特徴は、特にビデオ内では非常に変化しやすい。
【０００７】
顔識別システムの中核は、２つの画像を入力として取り込んで類似度スコアを出力する類似度関数である。顔類似度関数を使用して未知の顔の画像（入力画像）を、既知の顔の画像（基準画像）のセットと比較することができる。基準画像のセットは、同じ顔の複数の画像を含むことができる。各画像は、関連付けられる識別情報を有する。未知の入力顔は、最大類似度スコアが閾値を上回っている限り、入力顔と比較したときに最大の類似度スコアを有する基準画像のアイデンティティとして識別される。そうでなければ入力顔は、未知のままである。
【０００８】
２つの顔の間の類似度スコアを計算する多くの方法が存在する。ほとんどすべての方法が、最初に２つの顔のそれぞれの特徴ベクトルを計算すること、そして、次に特徴ベクトルを比較することを含む。既知の方法は、主成分分析（固有顔）、線形判別分析（フィッシャー顔）、及び弾性バンチグラフを使用する。
【発明の概要】
【発明が解決しようとする課題】
【０００９】
問題点として、特徴のサイズが非常に大きくなり、記憶するのに大量のコンピュータメモリを必要とする可能性がある。
【課題を解決するための手段】
【００１０】
方法は、２つの顔画像を比較して類似度スコアをもたらす。各画像から特徴ベクトルを抽出する。特徴ベクトルを圧縮して、該圧縮特徴ベクトルを比較して類似度スコアをもたらす。
【図面の簡単な説明】
【００１１】
【図１】本発明の実施の形態による顔認識方法のブロック図である。
【図２】本発明の実施の形態によるテンプレートフィルタである（（Ａ）〜（Ｄ））。
【図３】本発明の実施の形態による矩形領域内の画素強度の総和である。
【発明を実施するための形態】
【００１２】
図１は、本発明の実施の形態による２つの顔画像を比較する方法を示す。未知の顔から取得された画像１０１から特徴ベクトル１１１を抽出する（１１０）。別の顔の画像１０２から異なる特徴ベクトル１１２も抽出する。特徴ベクトル１１１を圧縮特徴ベクトル１２１に量子化し、特徴ベクトル１１２を圧縮特徴ベクトル１２２に量子化する。圧縮特徴ベクトルを比較して（１３０）、類似度スコア１４０を求める。類似度スコアは、２つの画像１０１及び１０２内の顔が同じであるか否かを指示する。
【００１３】
前処理：顔検出
本発明では、顔の画像がどのように取得されるかは重要ではない。従来の顔検出を使用することができる。本明細書において使用される場合、混乱を招かないように、検出とは、画像内にあるのが何であるか、すなわち、画像内に顔があるか否かを意味している。また、識別とは、画像内にいるのが誰であるか、すなわち、画像内の顔のアイデンティティが何であるかを意味している。
【００１４】
後処理：正規化
選択肢として、計算される画像対内の顔を、サイズ、向き、及び照明に関して正規化することができる。たとえば、顔は、ほぼ画像全体を占めることができ、垂直方向及び水平方向に位置調整することができる。
【００１５】
特徴抽出
特徴抽出中、複数のフィルタを、入力画像及び基準画像内の画素の矩形パッチに適用する。フィルタは、パッチと同じサイズ及びロケーションのテンプレートフィルタとすることができる。たとえば、図２（Ａ）〜（Ｄ）に示すように、Ｈａａｒ−ｌｉｋｅ特徴を抽出することができる。単純な矩形Ｈａａｒ−ｌｉｋｅ特徴は、画像内の２つ以上の矩形パッチ２０１及び２０２内の画素値の加重和、又は総和の差と定義することができる。矩形パッチは、連続的であり、画像内で任意の位置及びスケールにあることができる。Ｈａａｒ−ｌｉｋｅ特徴は、エッジ若しくはテクスチャ変化のような、画像内の特定の特性の存否を指示する、又はパッチが暗い領域と明るい領域との間の境界上にわたって位置しているか否かを指示することができる。特徴ベクトルの形成に使用される数百又は数千の特徴は、通常、トレーニング段階において、数百又は数千の可能な特徴からなるはるかに大きいセットから学習される。
【００１６】
Ｈａａｒ−ｌｉｋｅ特徴は、積分画像を使用して迅速に計算することができる。積分画像は、画像と同じサイズを有する行列の形態の２次元ルックアップテーブルとして定義される。積分画像の各要素は、該要素の位置に関して、原画像の左上領域に位置するすべての画素の総和を含む。これによって、非常に少数、たとえば、４つのルックアップを使用して、任意の位置又はスケールにおいて画像内の矩形パッチの総和、すなわち総和＝ｐｔ_４−ｐｔ_３−ｐｔ_２＋ｐｔ_１を計算することができる。ここで、要素点ｐｔ_ｎは、Ｈａａｒ−ｌｉｋｅ特徴における矩形の角を形成する積分画像の要素である。
【００１７】
図３に示すように、矩形ＡＢＣＤ３１０の角Ａ３１１、角Ｂ３１２、角Ｃ３１３及び角Ｄ３１４において積分画像値を有する積分画像２００の矩形領域３１０内の画素強度の総和を、
エリア（ＡＢＣＤ）＝Ａ＋Ｄ−Ｂ−Ｃ
として求めることができる。
【００１８】
特徴圧縮
特徴のすべての可能な値を０〜２^ｂ−１の整数にマッピングすることによって、実数値特徴ベクトル内の特徴をｂビットに圧縮する。これは、最初に（たとえば、トレーニング段階において）顔の大きなセットにわたって各特徴の平均（μ）及び標準偏差（σ）を計算することによって行われる。次いで、（たとえば）平均の１標準偏差内に入る特徴の値を、単純な線形マッピングを使用して０〜２^ｂ−１の実数にマッピングする。平均−１標準偏差よりも小さい任意の特徴値を０にマッピングする。平均＋１標準偏差よりも大きい任意の特徴値を２^ｂ−１にマッピングする。次いで、マッピングした特徴値を切り捨てて（量子化して）整数値をもたらす。標準偏差をｓσに一般化することができることに留意されたい。ここで、変数ｓは、実数、たとえば、１．０、１．１、２．０、３．０、３．５等である。スカラーｓは、平均μの周囲の切り捨て領域の幅を制御する。
【００１９】
この特徴圧縮方法は、下式として等式で表すことができる。
【００２０】
【数１】

【００２１】
ここで、ｆ_ｉは、入力特徴の値であり、μ_ｉは、特徴の平均であり、ｓσ_ｉは、特徴のスケーリングされた標準偏差（複数可）であり、ｂは、圧縮特徴における所望のビット数であり、Ｆ_ｉは、０〜２^ｂ−１の整数値を有することができる最終的な圧縮特徴値である。
【００２２】
驚くべきことに、また、予測とは対照的に、本発明の方法は、非常に少数の特徴ビットで良好に機能する。通常、特徴値を表すのに使用するビット数を低減すると、精度も減少すると予測するであろう。しかしながら、本発明における圧縮方法に関しては、これは当てはまらない。本発明では、０〜２５５、すなわちｂ＝８の範囲内の値を有する正確な結果を得ることができる。したがって、本発明の圧縮係数は、４倍である。さらに、より驚くべきことに、また、すべての予測及び常識に反して、本発明者らは、本発明の方法が、たった１ビット（ｂ＝１）でも機能すること、及び８ビットから１ビットにしても、本発明の結果の精度がほとんど減少しないことを発見した。
【００２３】
平均及び標準偏差
各特徴の平均（μ）及び標準偏差（複数可）（σ）を画像のトレーニングセットから計算することができる。トレーニング画像の総数がｒであり、ｎが各特徴ベクトル内の特徴の総数である。ｘ番目のトレーニング画像から抽出される特徴ベクトルは、ｖ_ｘ＝［ｆ_１、ｆ_２、・・・、ｆ_ｎ］であり、ここで１≦ｘ≦ｒである。ｖ_ｘのｉ番目の特徴値がｆ_ｉであり、ここで１≦ｉ≦ｎである。平均のベクトルμ＝［μ_１、μ_２、・・・、μ_ｎ］は、下式によって求められる。
【００２４】
【数２】

【００２５】
標準偏差のベクトルσ＝［σ_１、σ_２、・・・、σ_ｎ］は、下式によって求められる。
【００２６】
【数３】

【００２７】
特徴比較
２つの圧縮特徴ベクトル、ＦとＧとの間の距離（類似度）を計算するさまざまな方法が存在する。単純な方法は、２つの特徴ベクトルの間のＬ１ノルムを求める。これは、数学的に、下式として表すことができる。
【００２８】
【数４】

【００２９】
ここで、Ｆ_ｉは、Ｆの特徴ベクトルのｉ番目の特徴であり、Ｇ_ｉは、特徴ベクトルＧのｉ番目の特徴であり、ｄは、特徴ベクトルＦと特徴ベクトルＧとの間の結果として求められるＬ１距離である。
【００３０】
次いで、類似度スコアＳを、
Ｓ＝Ｍ−ｄ
として計算することができる。ここで、Ｍは、２つの特徴ベクトル間のＬ１ノルムの可能な最大スコアである。ｂビットでの２つの圧縮ベクトルの場合、Ｌ１ノルムの最大スコアは（２^ｂ−１）^＊ｎである。

【特許請求の範囲】
【請求項１】
未知の顔の入力画像を既知の顔の基準画像と比較する方法であって、
各前記画像から特徴ベクトルを抽出するステップと、
前記特徴ベクトルを圧縮特徴ベクトルに圧縮するステップと、
２つの前記顔の類似度スコアを求めるために、前記圧縮特徴ベクトルを比較するステップステップと
を含む方法。
【請求項２】
前記特徴は、前記画像内の画素の２つ以上の矩形パッチ内の画素値の加重和、又は総和の差として定義される矩形Ｈａａｒ−ｌｉｋｅ特徴であり、前記矩形パッチは、前記画像内で任意の位置及びスケールにおいて連続している請求項１に記載の方法。
【請求項３】
前記Ｈａａｒ−ｌｉｋｅ特徴は、積分画像から求められる請求項２に記載の方法。
【請求項４】
前記特徴ベクトルは、対応する既知の顔のセットの基準画像のセットのそれぞれから抽出及び圧縮され、前記入力画像の前記圧縮特徴ベクトルは、前記基準画像のセットの各前記特徴ベクトルと比較されて、前記未知の顔の各前記既知の顔との類似度スコアが求められる請求項１に記載の方法。
【請求項５】
ｎは、各前記特徴ベクトル内の特徴の数であり、ｖ＝［ｆ_１、ｆ_２、・・・、ｆ_ｎ］は、各前記画像から抽出される前記特徴ベクトルであり、ｆ_ｉは、前記特徴ベクトルｖ_ｘのｉ番目の特徴であり、ここで１≦ｉ≦ｎであり、μ＝［μ_１、μ_２、・・・、μ_ｎ］は、前記特徴の平均のベクトルであり、σ＝［σ_１、σ_２、・・・、σ_ｎ］は、前記特徴の標準偏差のベクトルであり、ｓは、μの周囲の切り捨て領域の幅を制御するスカラー定数であり、前記圧縮するステップは、
抽出された各特徴値ｆ_ｉに関して
【数１】

に従って値Ｆ_ｉを求めることをさらに含み、ここで、ｂは、前記値Ｆ_ｉを記憶するのに使用されるビット数である、請求項１に記載の方法。
【請求項６】
前記平均及び前記標準偏差は、トレーニング画像のセットから求められ、該トレーニング画像の総数は、ｒであり、ｎは、各前記特徴ベクトル内の特徴の総数であり、ｘ番目のトレーニング画像から抽出される特徴ベクトルは、ｖ_ｘ＝［ｆ_１、ｆ_２、・・・、ｆ_ｎ］であり、ここで１≦ｘ≦ｒであり、ｖ_ｘのｉ番目の特徴値は、ｆ_ｉであり、ここで１≦ｉ≦ｎであり、平均のベクトルμ＝［μ_１、μ_２、・・・、μ_ｎ］は、
【数２】

に従って求められ、標準偏差のベクトルσ＝［σ_１、σ_２、・・・、σ_ｎ］は、
【数３】

に従って求められる請求項５に記載の方法。
【請求項７】
Ｆ＝［Ｆ_１、Ｆ_２、・・・、Ｆ_ｎ］は、前記入力画像の前記圧縮特徴ベクトルであり、Ｇ＝［Ｇ_１、Ｇ_２、・・・、Ｇ_ｎ］は、前記基準画像の前記圧縮特徴ベクトルであり、Ｍは、前記圧縮特徴ベクトルＦ及び前記圧縮特徴ベクトルＧのＬ１ノルムの最大値であり、前記類似度スコアは
【数４】

に従って求められる請求項１に記載の方法。
【請求項８】
正規化特徴ベクトルを生成するために、前記特徴ベクトルを正規化するステップと、
量子化特徴ベクトルを生成するために、前記正規化特徴ベクトルを量子化するステップと
をさらに含み、
前記比較するステップは、前記量子化特徴ベクトルを使用する請求項１に記載の方法。
【請求項９】
各前記基準画像は、関連付けられるアイデンティティを有し、該基準画像の該関連付けられるアイデンティティは、最大類似度スコアが所定の閾値を上回っている限り、前記入力画像の顔と比較したときに前記最大類似度スコアを有する請求項４に記載の方法。
【請求項１０】
ｂは、８である請求項５に記載の方法。
【請求項１１】
ｂは、１である請求項５に記載の方法。
【請求項１２】
前記標準偏差は、ｓσの形態にあり、ｓは実数である請求項５に記載の方法。

【図１】

【図２】

【図３】

【公開番号】特開２０１０−１５７２１２（Ｐ２０１０−１５７２１２Ａ）
【公開日】平成２２年７月１５日（２０１０．７．１５）
【国際特許分類】

【外国語出願】
【出願番号】特願２００９−２４６４７８（Ｐ２００９−２４６４７８）
【出願日】平成２１年１０月２７日（２００９．１０．２７）
【出願人】（５９７０６７５７４）ミツビシ・エレクトリック・リサーチ・ラボラトリーズ・インコーポレイテッド (484)
【住所又は居所原語表記】２０１　ＢＲＯＡＤＷＡＹ，　ＣＡＭＢＲＩＤＧＥ，　ＭＡＳＳＡＣＨＵＳＥＴＴＳ　０２１３９，　Ｕ．Ｓ．Ａ．
【Ｆターム（参考）】

未知の顔の入力画像を既知の顔の基準画像と比較する方法

メニュー

スポンサーリンク

次の公報 »

« 前の公報

未知の顔の入力画像を既知の顔の基準画像と比較する方法

メニュー

スポンサー リンク

次の公報 »

« 前の公報

スポンサーリンク