説明

顔照合装置および方法並びにプログラム

【課題】顔画像に基づく顔照合において、照合可能な顔の表情や向きの対応範囲の拡大と照合精度の向上を同時に図る。
【解決手段】特定の人物の顔を表す特定顔画像について、第1の学習用顔画像群、例えば、無表情正面顔だけの顔画像群を分析して決められた、顔の固体判別が可能な第1の特徴量グループの特徴量と、第2の学習用顔画像群、例えば、表情・向きに変化のある顔からなる顔画像群を分析して決められた、顔の固体判別が可能な第2の特徴量グループの特徴量とを算出して記憶しておく。入力された被照合顔画像について、同様に各グループの特徴量を算出する。被照合顔画像と特定顔画像との間で、各グループの特徴量同士を比較して、それぞれ類似度を算出し、これら類似度を総合的に利用して両顔画像の照合判定を行う。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、照合対象画像が特定の人物の顔を表す顔画像であるか否か照合判定する顔照合装置および方法並びにそのためのプログラムに関するものである。
【背景技術】
【0002】
従来、照合対象となる顔画像が特定の人物の顔を表す顔画像であるか否か照合判定する顔照合手法について種々提案されている。
【0003】
例えば、非特許文献1では、画素を要素とする多次元の特徴量データを主成分分析により低次元化し、この低次元の特徴量空間における未知パターンの座標と登録パターンの座標との間のユークリッド距離に基づいて照合を行う手法が提案されている。
【0004】
また例えば、特許文献1では、非特許文献1を利用した手法であって、両目や唇などの顔の特徴点を検出し、アフィン変換を用いてその顔の位置や大きさを所定の位置や大きさに正規化する手法が提案されている。ここでは、正規化の際の顔の位置ずれに対応するため、フーリエ変換によって得られるパワースペクトルを特徴量データとして利用している。
【0005】
また例えば、非特許文献2では、判別分析を利用することで、クラス間の分離がよくなるような低次元の特徴量空間を作成し、その低次元の特徴量空間における未知パターンの座標と登録パターンの座標との比較により照合を行う手法が提案されている。
【特許文献1】特開平5−020442号公報
【非特許文献1】M.A.Turk and A.P.Pentland:“Face recognition using eigenfaces”, Proc. of IEEE CVPR, pp.586-591, June, 1991.
【非特許文献2】W.Zhao, R.Chakkeappa, A.Krishnaswamy:“Discriminant Analysis of Principle Components for Face Recognition”, Proc. of IEEE 3rd International Conference on AFGR, pp.336-341, April, 1998.
【発明の開示】
【発明が解決しようとする課題】
【0006】
ところで、上述の特許文献1および非特許文献1,2の顔を照合する手法は、多数の顔画像からなる顔画像群に基づいて、顔画像の特徴を低次元で効率よく表現できる特徴量空間を求め、その低次元の特徴量空間における未知パターンの座標と登録パターンの座標との比較により照合を行う手法であるが、これらの手法は、“固有顔”を用いた照合手法として知られており、顔の幾何学的正規化を行って正確に位置合せされた顔に対しては精度のよい照合を行うことができる。また、顔の幾何学的正規化に加えて照明に依存する画像成分の正規化(以下、照明正規化という)も前処理として行うことで、照明変化に対してロバストになる。
【0007】
ここで、どのような顔画像群(学習用画像)を用いてその学習により低次元の特徴量空間を決めるか、また、どのような顔の幾何学的正規化方法、照明正規化方法を用いるかによって、顔照合処理の特徴(長所および短所)に違いが生じてくる。
【0008】
例えば、特許文献1の手法のように、両目と唇を基準点に変換する方法(自由度6のアフィン変換)は、顔の向きに多少の変化があっても両目と唇の位置を一致させた顔の比較を行うことができるが、顔のアスペクト比(縦横比)という個人差を表す重要な情報を捨てていることになる。これに対して、顔のアスペクト比を変換せずに顔の位置、大きさの正規化を行う方法(自由度4のアフィン変換)は、略正面を向いた顔同士の比較には有効であるが、顔の向きの変化により両目の間の距離、目と唇の間の距離が変化する場合には、2つの顔の両目、唇位置にずれが生じるため不向きである。
【0009】
これは、学習画像や照明正規化方法についても同様のことが言え、正面顔同士を精度よく比較するための学習画像・照明正規化方法と、顔の向きや表情の変化等を考慮した学習画像・照明正規化方法が考えられ、どちらも長所・短所が存在する。
【0010】
このように、学習画像、幾何学的正規化方法、照明正規化方法として、ある特定の一手法を用いると、どうしても照合に不向きな画像(短所)が出てくるため、照合精度を保障しようとすると照合可能な顔の表情や向きが限定され、逆に、照合可能な顔の表情や向きを拡大しようとすると照合精度が抑えられるという問題がある。
【0011】
本発明は上記事情に鑑み、照合可能な顔の表情や向きの対応範囲の拡大と照合精度の向上を同時に図ることができる顔照合装置および方法並びにそのためのプログラムを提供することを目的とするものである。
【課題を解決するための手段】
【0012】
本発明の顔照合装置は、照合対象である被照合顔画像について、顔の態様が所定の条件を満たす第1の学習用顔画像群に対する所定の分析により決定された、該顔画像群における顔の固体判別が可能な第1の種類の特徴量を抽出する第1の特徴量抽出手段と、前記被照合顔画像について、顔の態様が前記所定の条件とは異なる条件を満たす第2の学習用顔画像群に対する所定の分析により決定された、該顔画像群における顔の固体判別が可能な第2の種類の特徴量を抽出する第2の特徴量抽出手段と、特定の人物の顔を表す特定顔画像について抽出された前記第1の種類の特徴量と、前記第1の特徴量抽出手段により抽出された特徴量とを比較して、前記被照合顔画像と前記特定顔画像との間の類似性を表す第1の類似度を算出する第1の類似度算出手段と、前記特定顔画像について抽出された前記第2の種類の特徴量と、前記第2の特徴量抽出手段により抽出された特徴量とを比較して、前記被照合顔画像と前記特定顔画像との間の類似性を表す第2の類似度を算出する第2の類似度算出手段と、前記第1および第2の類似度を用いて、前記被照合顔画像が表す顔と前記特定顔画像が表す顔の照合判定を行う照合判定手段とを備えたことを特徴とするものである。
【0013】
本発明の顔照合装置において、前記第1の学習用顔画像群を、顔の表情および向きが略同じである複数の顔画像からなるものとし、前記第2の学習用顔画像群を、顔の表情および向きの組合せが異なる複数の顔画像を含むものとしてもよい。この場合、前記第1の学習用顔画像群は、例えば、顔の表情が略無表情であり顔の向きが略正面である顔画像からなるものとすることができる。ここで、第2の学習用顔画像群としては、例えば、顔の表情が歯が見えるほどの笑顔、歯が見えない微笑んだ顔、無表情等の変化があり、顔の向きが正面、左向き、右向き、左斜め向き、右斜め向き、上方斜め向き、下方斜め向き等の変化がある顔画像群を考えることができる。
【0014】
本発明の顔照合装置において、前記被照合顔画像に対して顔のアスペクト比を維持する幾何学的正規化を行う第1の幾何学的正規化手段と、前記被照合顔画像に対して顔のアスペクト比を変え得る幾何学的正規化を行う第2の幾何学的正規化手段とをさらに備え、前記第1の特徴量抽出手段を、前記第1の幾何学的正規化手段により正規化された後の顔画像について特徴量を抽出するものとし、前記第2の特徴量抽出手段を、前記第2の幾何学的正規化手段により正規化された後の顔画像について特徴量を抽出するものとしてもよい。
【0015】
第1の幾何学的正規化としては、例えば、画像のアスペクト比固定の拡縮、回転、平行移動のみを考慮した自由度4のアフィン変換を考えることができ、第2の幾何学的正規化としては、例えば、画像の左右方向の拡縮、上下方向の拡縮、回転、平行移動を考慮した自由度6のアフィン変換を考えることができる。
【0016】
また、本発明の顔照合装置において、前記被照合顔画像に対して周波数が所定の閾値以下である低周波数成分を抑制する処理を施して、該顔画像の照明依存成分を正規化する第1の照明正規化手段と、前記被照合顔画像に対して輝度ヒストグラムを平滑化する処理を施して、該顔画像の照明依存成分を正規化する第2の照明正規化手段とをさらに備え、前記第1の特徴量抽出手段を、前記第1の照明正規化手段により正規化された後の顔画像について特徴量を抽出するものとし、前記第2の特徴量抽出手段を、前記第2の照明正規化手段により正規化された後の顔画像について特徴量を抽出するものとしてもよい。
【0017】
本発明の顔照合装置において前記所定の分析は、主成分分析または線形判別分析であることが望ましい。これらの分析により固有空間またはそれに準ずる空間を定義することができ、対象となる画像データをこの空間に射影して特徴量を抽出する。
【0018】
本発明の顔照合装置において、前記照合判定手段は、前記第1の類似度と前記第2の類似度との和の大小に基づいて照合判定するものであってもよいし、前記第1および第2の類似度のうち値がより大きい方の類似度の大小に基づいて照合判定するものであってもよい。
【0019】
本発明の顔照合方法は、照合対象である被照合顔画像について、顔の態様が所定の条件を満たす第1の学習用顔画像群に対する所定の分析により決定された、該顔画像群における顔の固体判別が可能な第1の種類の特徴量を抽出する第1の特徴量抽出ステップと、前記被照合顔画像について、顔の態様が前記所定の条件とは異なる条件を満たす第2の学習用顔画像群に対する所定の分析により決定された、該顔画像群における顔の固体判別が可能な第2の種類の特徴量を抽出する第2の特徴量抽出ステップと、特定の人物の顔を表す特定顔画像について抽出された前記第1の種類の特徴量と、前記第1の特徴量抽出手段により抽出された特徴量とを比較して、前記被照合顔画像と前記特定顔画像との間の類似性を表す第1の類似度を算出する第1の類似度算出ステップと、前記特定顔画像について抽出された前記第2の特徴量種類の特徴量と、前記第2の特徴量抽出手段により抽出された特徴量とを比較して、前記被照合顔画像と前記特定顔画像との間の類似性を表す第2の類似度を算出する第2の類似度算出ステップと、前記第1および第2の類似度を用いて、前記被照合顔画像が表す顔と前記特定顔画像が表す顔の照合判定を行う照合判定ステップとを有することを特徴とするものである。
【0020】
本発明のプログラムは、コンピュータを、照合対象である被照合顔画像について、顔の態様が所定の条件を満たす第1の学習用顔画像群に対する所定の分析により決定された、該顔画像群における顔の固体判別が可能な第1の種類の特徴量を抽出する第1の特徴量抽出手段と、前記被照合顔画像について、顔の態様が前記所定の条件とは異なる条件を満たす第2の学習用顔画像群に対する所定の分析により決定された、該顔画像群における顔の固体判別が可能な第2の種類の特徴量を抽出する第2の特徴量抽出手段と、特定の人物の顔を表す特定顔画像について抽出された前記第1の種類の特徴量と、前記第1の特徴量抽出手段により抽出された特徴量とを比較して、前記被照合顔画像と前記特定顔画像との間の類似性を表す第1の類似度を算出する第1の類似度算出手段と、前記特定顔画像について抽出された前記第2の特徴量種類の特徴量と、前記第2の特徴量抽出手段により抽出された特徴量とを比較して、前記被照合顔画像と前記特定顔画像との間の類似性を表す第2の類似度を算出する第2の類似度算出手段と、前記第1および第2の類似度を用いて、前記被照合顔画像が表す顔と前記特定顔画像が表す顔の照合判定を行う照合判定手段として機能させることを特徴とするものである。
【0021】
なお、本発明のプログラムは、コンピュータ読取り可能な記録媒体に記録して供給するようにしてもよいし、インターネット等のネットワークを介してダウンロードする形態で供給するようにしてもよい。
【発明の効果】
【0022】
本発明の顔照合装置および方法によれば、特定の人物の顔を表す特定顔画像について、顔の態様が第1の条件を満たす第1の学習用顔画像群を分析して決められた、顔の固体判別が可能な第1の特徴量グループの特徴量と、顔の態様が第2の条件を満たす第2の学習用顔画像群を分析して決められた、顔の固体判別が可能な第2の特徴量グループの特徴量とを算出して記憶しておき、入力された被照合顔画像について、同様に各グループの特徴量を算出し、被照合顔画像と特定顔画像との間で、各グループの特徴量同士で比較して、それぞれ類似度を算出し、これら類似度を総合的に利用して両顔画像の照合判定を行うようにしているので、それぞれの顔照合処理、すなわち、類似度の算出の短所を互いに補うことが可能となり、照合可能な顔の表情や向きの対応範囲の拡大と照合精度の向上を同時に図ることができる。
【発明を実施するための最良の形態】
【0023】
以下、本発明の実施形態について説明する。図1は本発明の実施形態である顔照合装置の構成を示す概略ブロック図である。この顔照合装置は、入力された被照合顔画像と既に登録された登録顔画像(特定顔画像)との間で、抽出された特徴量同士を比較して類似度を算出し、その類似度の大小に基づいて顔の照合判定を行うものであり、無表情で正面を向いた顔の固体判別に特に有効な特徴量の比較による類似度と、表情や向きに変化のある顔の固体判別に特に有効な特徴量の比較による類似度とを用いて、顔の照合判定を行うものである。
【0024】
図1に示すように、この顔照合装置1は、入力された被照合顔画像Pにおける顔を検出する顔検出部10と、検出された顔から顔部品等の顔の特徴点を検出する顔特徴点検出部20と、被照合顔画像Pに対して顔特徴点検出部20により検出された特徴点の位置に基づく第1の幾何学的正規化処理を施して正規化顔画像P1′を得る第1の幾何学的正規化部31と、正規化顔画像P1′に対して画像の照明依存成分を正規化する第1の照明正規化処理を施して正規化顔画像P1″を得る第1の照明正規化部41と、正規化顔画像P1″を第1の特徴量空間へ射影して第1の特徴量グループの特徴量FP1を抽出する第1の特徴量抽出部51と、登録された特定の人物の顔を表す登録顔画像Tに対して第1の幾何学的正規化処理および第1の照明正規化処理を施して得られた正規化顔画像T1″を第1の特徴量空間へ射影して抽出された第1の特徴量グループの特徴量FT1を記憶する第1の登録顔特徴量記憶部61と、特徴量FP1と特徴量FT1とを比較して被照合顔画像Pと登録顔画像Tとの間の第1の類似度R1を算出する第1の類似度算出部71と、被照合顔画像Pに対して顔特徴点検出部20により検出された特徴点の位置に基づく第2の幾何学的正規化処理を施して正規化顔画像P2′を得る第2の幾何学的正規化部32と、正規化顔画像P2′に対して画像の照明依存成分を正規化する第2の照明正規化処理を施して正規化顔画像P2″を得る第2の照明正規化部42と、正規化顔画像P2″を第2の特徴量空間へ射影して第2の特徴量グループの特徴量FP2を抽出する第2の特徴量抽出部52と、上記の特定の人物の顔を表す登録顔画像Tに対して第2の幾何学的正規化処理および第2の照明正規化処理を施して得られた正規化顔画像T2″を第2の特徴量空間へ射影して抽出された第2の特徴量グループの特徴量FT2を記憶する第2の登録顔特徴量記憶部62と、特徴量FP2と特徴量FT2とを比較して被照合顔画像Pと登録顔画像Tとの間の第2の類似度R2を算出する第2の類似度算出部72と、第1の類似度R1と第2の類似度R2を用いて総合類似度RTを算出する総合類似度算出部80と、総合類似度RTの大小に基づいて被照合顔画像Pと登録顔画像Tとの照合判定を行う照合判定部90とを備えている。
【0025】
なお、第1の幾何学的正規化部31、第1の照明正規化部41、第1の特徴量抽出部51、第1の登録顔特徴量記憶部61および第1の類似度算出部71は、特に無表情で正面を向いた顔の固体判別に有効な類似度算出手段を構成しており、一方、第2の幾何学的正規化部32、第2の照明正規化部42、第2の特徴量抽出部52、第2の登録顔特徴量記憶部62および第2の類似度算出部72は、特に表情や向きに変化のある顔の固体判別に有効な類似度算出手段を構成している。
【0026】
顔検出部10は、入力された被照合顔画像Pの画像データに基づいて、被照合顔画像Pに含まれる顔を検出するものであり、テンプレートマッチングによる手法や顔の多数のサンプル画像を用いたマシンラーニング学習により得られた顔判別器を用いる手法等により、顔のおおよその位置を検出するものである。
【0027】
顔特徴点検出部20は、被照合顔画像P上で顔検出部10により検出された顔の位置周辺において、顔を構成する主要な顔部品を顔の特徴点として検出するものであり、具体的には、各顔部品のテンプレートを用いたテンプレートマッチングによる手法や顔部品の多数のサンプル画像を用いたマシンラーニング学習により得られた、顔部品毎の判別器を用いる手法等により、左右目頭、左右目尻、左右小鼻、左右口角、上唇の計9個の特徴点の位置を検出するものである。
【0028】
図2は、第1および第2の幾何学的正規化処理の流れを示す図であり、図3は、第1および第2の幾何学的正規化処理の概念を表す図である。
【0029】
第1の幾何学的正規化部31は、被照合顔画像Pに対して第1の幾何学的正規化処理を施して正規化済みの正規化顔画像P1′を得るものであり、顔特徴点検出部20により検出された計9点の各特徴点が予め決められた基準位置に近づくように、被照合顔画像Pに施すアフィン変換のパラメータを求め、当該パラメータによるアフィン変換を実際に被照合顔画像Pに適用して変形し、変形された被照合顔画像Pから顔を含む画像を切り出して、顔位置検出部10により検出された顔が予め決められた位置や大きさで表された正規化顔画像P1′を取得するものである。このとき、検出された顔のアスペクト比(縦横比)を変えないように、縦横比固定の拡縮、回転、平行移動のみを考慮した自由度4のアフィン変換、すなわち、次式(1−1),(1−2)を満たすような変換を用いる。
【0030】
x′= ax+by+c (1−1)
y′=−bx+ay+d (1−2)
ここで、(x,y)は変換前の画素の座標、(x′,y′)は変換後の画素の座標、a,b,c,dはそれぞれ変換のパラメータを表している。
【0031】
一方、第2の幾何学的正規化部32は、被照合顔画像Pに対して第2の幾何学的正規化処理を施して正規化済みの正規化顔画像P2′を得るものであり、第1の幾何学的正規化部31と同様にアフィン変換を用いて被照合顔画像Pを変形するものであるが、この第2の幾何学的正規化処理では、被照合顔画像Pにおける顔のアスペクト比を変え得るように、縦の拡縮、横の拡縮、回転、平行移動を考慮した自由度6のアフィン変換、すなわち、次式(2−1),(2−2)を満たすような変換を用いる。
【0032】
x′=ax+by+c (2−1)
y′=dx+ey+f (2−2)
ここで、(x,y)は変換前の画素の座標、(x′,y′)は変換後の画素の座標、a,b,c,d,e,fはそれぞれ変換のパラメータを表している。
【0033】
図4は、第1および第2の照明正規化処理の流れを示す図であり、図5は、第1および第2の幾何学的正規化処理の概念を表す図である。
【0034】
第1の照明正規化部41は、正規化顔画像P1′に対して第1の照明正規化処理を施して正規化顔画像P1″を得るものである。具体的には、正規化顔画像P1′に対してDiffusion Normalizeを行った後、所定のマスクを適用して処理対象を顔領域に限定し、顔領域の直接照明に依存する成分を取り除く直接照明除去を行い、4分割ヒストグラム平滑化を行って照明の違いによるばらつきを抑えた正規化顔画像P1″を取得するものである。
【0035】
ここで、Diffusion Normalizeとは、画像に対して周波数が所定の閾値以下である低周波成分を抑制する処理の1つであり、ガウシアンフィルタ等を通して作成したボケ画像(低周波画像)で元画像を除算することで、照明に依存する低周波成分を取り除くものである。具体的には、文献G.Gilboa, YY Zeevi and N.Sochen, “Image Enhancement and Denoising by Complex Diffusion Processes”, IEEE Transaction on PAMI, Vol.25, No.8, pp.1020-1036, 2004.(参考文献1)の手法を用いる。
【0036】
また、直接照明除去とは、処理対象である顔領域の水平方向における画素値の変化曲線が、実際の変化曲線から直線成分を差し引いて得られた曲線となるように画素値の変換を行うものである。
【0037】
また、4分割ヒストグラム平滑化とは、処理対象である顔領域を縦横に割って4分割し、分割された各領域毎に画素値とその頻度を表す輝度ヒストグラムを作成し、各領域毎にこの輝度ヒストグラムが占有する画素値の幅が画素値の採り得る最大幅内でより広がるように画素値の変換を行うものである。
【0038】
一方、第2の照明正規化部42は、正規化顔画像P2′に対して第2の照明正規化処理を施して正規化顔画像P2″を得るものであり、第1の照明正規化部41と基本的に同様の手法を用いるものであるが、この第2の照明正規化処理では、Diffusion Normalizeは行わない。これは、文献JH Lai, PC Yuen and GC Feng, “Face recognition using holistic Fourier invariant features”, PR Vol.34 No.1, pp.95-109, 2001.(参考文献2)で述べられているように、顔の表情の変化に対して不変である特徴量が画像の低周波成分に含まれており、その低周波成分を照明依存成分として取り除いてしまうと、表情に変化のある顔を照合する場合に、顔の固体判別に有用な情報が欠落した状態で照合することとなるため、このような不具合を抑制するためである。
【0039】
なお、第1および第2の照明正規化処理の両方の処理においてDiffusion Normalizeを行った場合の顔の照合精度(認識性能)を、Diffusion Normalizeを行わない場合と比較して見てみると、無表情・正面顔で照合を行った場合には照合精度が大幅に向上するのに対し、表情に変化のある顔で照合を行った場合には照合精度が逆に低下するといった結果が得られた。
【0040】
図6は、第1および第2の特徴量空間を決定するために行われる第1および第2の学習の処理の流れを示す図である。
【0041】
第1の特徴量抽出部51は、正規化顔画像P1″における第1の特徴量グループの特徴量FP1を抽出するものであり、正規化顔画像P1″の画像データをより低次元の第1の特徴量空間へ第1の射影行列を用いて射影して特徴量を抽出するものである。ここで、第1の特徴量空間は、下記のような第1の学習により決定される。
【0042】
無表情で正面を向いた顔の多数の学習用顔画像に対して、上記の第1の幾何学的正規化処理および第1の照明正規化処理を施して得られた正規化学習用顔画像群を用いて、主成分分析または線形判別分析(LDA)等の分析により第1の射影行列を求め、この射影行列によって射影される固有空間もしくはこれに準ずる空間を第1の特徴量空間とする。このようにして決められた第1の特徴量空間は、無表情で正面を向いた顔の固体判別がしやすい空間となっている。
【0043】
一方、第2の特徴量抽出部52は、正規化顔画像P2″における第2の特徴量グループの特徴量FP2を抽出するものであり、正規化顔画像P2″の画像データをより低次元の第2の特徴量空間へ第2の射影行列を用いて射影して特徴量を抽出するものである。ここで、第2の特徴量空間は、下記のような第2の学習により決定される。
【0044】
表情および向きに変化のある顔の多数の学習用顔画像に対して、上記の第2の幾何学的正規化処理および第2の照明正規化処理を施して得られた正規化学習用顔画像群を用いて、主成分分析または線形判別分析(LDA)等の分析により第2の射影行列を求め、この射影行列によって射影される固有空間もしくはこれに準ずる空間を第2の特徴量空間とする。このようにして決められた第2の特徴量空間は、表情や向きに変化のある顔の固体判別がしやすい空間となっている。
【0045】
なお、表1は、上記の第1および第2の学習の特徴を対比してまとめたものである。
【表1】

【0046】
第1の登録顔特徴量記憶部61は、登録された特定の人物の顔を表す登録顔画像Tに対して上記の第1の幾何学的正規化処理および第1の照明正規化処理を施して得られた正規化顔画像T1″を、上記の第1の特徴量空間へ射影して抽出された第1の特徴量グループの特徴量FT1を記憶するものである。
【0047】
第2の登録顔特徴量記憶部62は、登録顔画像Tに対して上記の第2の幾何学的正規化処理および第2の照明正規化処理を施して得られた正規化顔画像T2″を、上記の第2の特徴量空間へ射影して抽出された第2の特徴量グループの特徴量FT2を記憶するものである。
【0048】
第1の類似度算出部71は、第1の特徴量抽出部51により抽出された特徴量FP1と第1の登録顔特徴量記憶部61に記憶されている特徴量FT1とを比較して、被照合顔画像Pと登録顔画像Tとの間の第1の類似度R1を算出するものであり、ここでは、特開2005−149506号公報に述べられているAGMモデル(付加ガウスモデル)を利用して算出する。
【0049】
AGMモデルとは、個人差を表す変数と個人内の見えの変化(照明変化、顔向き変化、経年変化など)を表す変数の和で顔データが表現できると仮定した確率モデルであり、各変数は正規分布に従うものとする。あらかじめ各正規分布のパラメータを推定しておくことで、登録顔画像数が少ない場合にも見えの変化を考慮したロバストな類似度算出処理が可能となる。各正規分布のパラメータ推定には、第1および第2の特徴量空間を決定する際に利用した学習用顔画像群を用いる。
【0050】
なお、第1の特徴量空間において、特徴量FP1で規定される被照合顔画像Pの座標と、特徴量FT1で規定される登録顔画像Tの座標との間のユークリッド距離をそのまま第1の類似度R1として用いる方法など、他の類似度算出方法を用いてもよい。
【0051】
第2の類似度算出部72は、第2の特徴量抽出部52により抽出された特徴量FP2と第2の登録顔特徴量記憶部62に記憶されている特徴量FT2とを比較して、被照合顔画像Pと登録顔画像Tとの間の第2の類似度R2を算出するものであり、第1の類似度算出部71と同様にAGMモデルを利用して算出する。
【0052】
総合類似度算出部80は、第1の類似度R1と第2の類似度R2とを用いて総合的な類似度を表す総合類似度RTを算出するものであり、ここでは、第1の類似度R1と第2の類似度R2との和を総合類似度RTとする。なお、総合類似度RTは、このような算出方法のほか、例えば、第1の類似度R1および第2の類似度R2のうち値がより大きい方を総合類似度RTとする方法や、第1の類似度R1および第2の類似度R2の値の組合せとそのときの実際の照合判定における正解とに基づく学習により得られた基準に従って総合類似度RTを算出する方法等を用いることもできる。
【0053】
照合判定部90は、総合類似度RTの大小に基づいて被照合顔画像Pと登録顔画像Tの照合判定を行ってその判定結果Jを出力するものであり、ここでは、総合類似度RTが所定の閾値TH以上である場合に、被照合顔画像Pの顔と登録顔画像Tの顔が同一人物の顔であると判定する。
【0054】
次に、本発明の実施形態である顔照合装置1における処理の流れについて説明する。
【0055】
図7は、顔照合装置1における処理の流れを示したフローチャートである。図6に示すように、顔照合装置1に被照合顔画像Pが入力されると(ステップS1)、顔検出部10が、テンプレートマッチング手法またはマシンラーニング学習で得られた判別器を用いた手法等により被照合顔画像Pに含まれる顔を検出し(ステップS2)、顔特徴点検出部20が、被照合顔画像P中の検出された顔の位置周辺でその顔の特徴点、すなわち、その顔における、左右目頭、左右目尻、左右小鼻、左右口角、上唇の計9個の特徴点を検出する(ステップS3)。
【0056】
顔の特徴点が検出されると、第1の幾何学的正規化部31が、検出された顔の特徴点を所定の基準位置に近づけるアフィン変換であって顔のアスペクト比が変わらない自由度4のアフィン変換のパラメータを求め、当該パラメータによるアフィン変換を被照合顔画像Pに適用して変形し、変形された被照合顔画像Pから顔を含む画像を切り出して、顔位置検出部10により検出された顔が予め決められた位置や大きさで表された正規化顔画像P1′を取得する(ステップS4)。そして、第1の照明正規化部41が、正規化顔画像P1′に対してDiffusion Normalizeを行った後、所定のマスクを適用して処理対象を顔領域に限定し、顔領域の直接照明に依存する成分を取り除き、4分割ヒストグラム平滑化を行って照明の違いによるばらつきを抑えた正規化顔画像P1″を取得する(ステップS5)。
【0057】
正規化顔画像P1″が取得されると、第1の特徴量抽出部51は、正規化顔画像P1″の画像データを、無表情で正面を向いた顔の固体判別がしやすい空間である第1の特徴量空間へ第1の射影行列を用いて射影して、正規化顔画像P1″における第1の特徴量グループの特徴量FP1を抽出する(ステップS6)。
【0058】
特徴量FP1が抽出されると、第1の類似度算出部71が、この特徴量FP1と第1の登録顔特徴量記憶部61に記憶されている特徴量FT1とに基づいて、AGMモデルを利用して第1の類似度R1を算出する(ステップS7)。
【0059】
同様に、第2の幾何学的正規化部32が、検出された顔の特徴点を所定の基準位置に近づけるアフィン変換であって顔のアスペクト比が変化し得る自由度6のアフィン変換のパラメータを求め、当該パラメータによるアフィン変換を被照合顔画像Pに適用して変形し、変形された被照合顔画像Pから顔を含む画像を切り出して、顔位置検出部10により検出された顔が予め決められた位置や大きさで表された正規化顔画像P2′を取得する(ステップS8)。そして、第2の照明正規化部42が、正規化顔画像P2′に対して所定のマスクを適用して処理対象を顔領域に限定し、顔領域の直接照明に依存する成分を取り除き、4分割ヒストグラム平滑化を行って照明の違いによるばらつきを抑えた正規化顔画像P2″を取得する(ステップS9)。
【0060】
正規化顔画像P2″が取得されると、第2の特徴量抽出部52は、正規化顔画像P2″の画像データを、表情および向きに変化のある顔の固体判別がしやすい空間である第2の特徴量空間へ第2の射影行列を用いて射影して、正規化顔画像P2″における第2の特徴量グループの特徴量FP2を抽出する(ステップS10)。
【0061】
特徴量FP2が抽出されると、第2の類似度算出部72が、この特徴量FP2と第2の登録顔特徴量記憶部62に記憶されている特徴量FT2とに基づいて、AGMモデルを利用して第2の類似度R2を算出する(ステップS11)。
【0062】
第1の類似度R1および第2の類似度R2が算出されると、総合類似度算出部80が、第1の類似度R1と第2の類似度R2の和を総合類似度RTとして算出(ステップS12)する。そして、照合判定部90が、この総合類似度RTが所定の閾値以上であるか否かを判定し、肯定される場合には被照合顔画像Pにおける顔と登録顔画像Tにおける顔とが同一人物の顔であると判定し、逆に否定される場合には同一人物の顔でないと判定し、その判定結果Jを出力する(ステップS13)。
【0063】
このように、本発明の実施形態である顔照合装置によれば、特定の人物の顔を表す登録顔画像Tについて、第1の学習用顔画像群である、無表情正面顔だけの顔画像群を分析して決められた、顔の固体判別が可能な第1の特徴量グループの特徴量FT1と、第2の学習用顔画像群である、表情・向きに変化のある顔からなる顔画像群を分析して決められた、顔の固体判別が可能な第2の特徴量グループの特徴量FT2とを算出して記憶しておき、入力された被照合顔画像Pについて、同様に各グループの特徴量FP1,FP2を算出し、被照合顔画像Pと登録顔画像Tとの間で、各グループの特徴量同士で比較して、すなわち、特徴量FP1とFT1の組合せ、特徴量FP2とFT2の組合せ毎に比較して、それぞれ類似度R1,R2を算出し、これら類似度R1,R2を総合的に利用して両顔画像の照合判定を行うようにしているので、それぞれの顔照合処理(類似度の算出)の短所を互いに補うことが可能となり、照合可能な顔の表情や向きの対応範囲の拡大と照合精度の向上を同時に図ることができる。
【0064】
また、本実施形態の顔照合装置によれば、第1の学習用顔画像群を、顔の表情および向きが略同じである複数の顔画像からなるものとし、第2の学習用顔画像群を、顔の表情および向きが異なる複数の顔画像からなるものとしているので、照合可能な顔の表情および向きが限定されないため、顔画像に基づく顔の照合を顔の向きや表情によらず安定して行うことができる。
【0065】
また、本実施形態の顔照合装置によれば、第1の学習用顔画像群を、顔の表情が略無表情であり顔の向きが略正面である顔画像からなるものとしているので、特に照合に用いられる頻度が高いと推定される、無表情正面顔の顔での高い照合精度を期待することができる。
【0066】
また、本実施形態の顔照合装置によれば、被照合顔画像Pに対して顔のアスペクト比を維持する幾何学的正規化を行う第1の幾何学的正規化部31と、被照合顔画像Pに対して顔のアスペクト比を変え得る幾何学的正規化を行う第2の幾何学的正規化部32とを備え、第1の特徴量抽出部51を、第1の幾何学的正規化部31により正規化された後の顔画像について特徴量を抽出するものとし、第2の特徴量抽出部52を、第2の幾何学的正規化部32により正規化された後の顔画像について特徴量を抽出するものとしているので、顔のアスペクト比という顔の個人差を表す重要な情報を有効に活かせる処理上ではその情報を保持し、一方、有効に活かせない処理上では幾何学的正規化本来の機能を優先して顔の正規化を行うことができ、照合精度の向上をより期待することができる。
【0067】
また、本実施形態の顔照合装置によれば、被照合顔画像Pに対して所定の閾値以下の周波数成分を抑制する処理を施して、当該顔画像の照明依存成分を正規化する第1の照明正規化部41と、被照合顔画像Pに対して輝度ヒストグラムを平滑化する処理を施して、当該顔画像の照明依存成分を正規化する第2の照明正規化部42とを備え、第1の特徴量抽出部51を、第1の照明正規化部41により正規化された後の顔画像について特徴量を抽出するものとし、第2の特徴量抽出部52を、第2の照明正規化部42により正規化された後の顔画像について特徴量を抽出するものとしているので、顔の表情の変化に対して不変である特徴が含まれる、画像の低周波成分の情報を有効に活かせる処理上ではその情報を保持し、一方、有効に活かせない処理上では照明正規化本来の機能を優先して顔の正規化を行うことができ、照合精度の向上をより期待することができる。
【0068】
以上、本発明の実施形態である顔照合装置について説明したが、上記顔照合装置における各処理をコンピュータに実行させるためのプログラムも、本発明の実施形態の1つである。また、そのようなプログラムを記録したコンピュータ読取可能な記録媒体も、本発明の実施形態の1つである。
【図面の簡単な説明】
【0069】
【図1】顔照合装置1の構成を示すブロック図
【図2】幾何学的正規化処理の流れを示す図
【図3】幾何学的正規化処理の概念を示す図
【図4】照明正規化処理の流れを示す図
【図5】第1および第2の幾何学的正規化処理の概念を表す図
【図6】特徴量空間を決定するために行われる学習の処理の流れを示す図
【図7】顔照合装置1における処理の流れを示す図
【符号の説明】
【0070】
1 顔検出システム
10 顔検出部
20 顔特徴点検出部
31 第1の幾何学的正規化部
32 第2の幾何学的正規化部
41 第1の照明正規化部
42 第2の照明正規化部
51 第1の特徴量算出部
52 第2の特徴量算出部
61 第1の登録顔特徴量記憶部
62 第2の登録顔特徴量記憶部
71 第1の特徴量抽出部
72 第2の特徴量抽出部
80 総合類似度算出部
90 照合判定部

【特許請求の範囲】
【請求項1】
照合対象である被照合顔画像について、顔の態様が所定の条件を満たす第1の学習用顔画像群に対する所定の分析により決定された、該顔画像群における顔の固体判別が可能な第1の種類の特徴量を抽出する第1の特徴量抽出手段と、
前記被照合顔画像について、顔の態様が前記所定の条件とは異なる条件を満たす第2の学習用顔画像群に対する所定の分析により決定された、該顔画像群における顔の固体判別が可能な第2の種類の特徴量を抽出する第2の特徴量抽出手段と、
特定の人物の顔を表す特定顔画像について抽出された前記第1の種類の特徴量と、前記第1の特徴量抽出手段により抽出された特徴量とを比較して、前記被照合顔画像と前記特定顔画像との間の類似性を表す第1の類似度を算出する第1の類似度算出手段と、
前記特定顔画像について抽出された前記第2の種類の特徴量と、前記第2の特徴量抽出手段により抽出された特徴量とを比較して、前記被照合顔画像と前記特定顔画像との間の類似性を表す第2の類似度を算出する第2の類似度算出手段と、
前記第1および第2の類似度を用いて、前記被照合顔画像が表す顔と前記特定顔画像が表す顔の照合判定を行う照合判定手段とを備えたことを特徴とする顔照合装置。
【請求項2】
前記第1の学習用顔画像群が、顔の表情および向きが略同じである複数の顔画像からなるものであり、
前記第2の学習用顔画像群が、顔の表情および向きの組合せが異なる複数の顔画像を含むものであることを特徴とする請求項1記載の顔照合装置。
【請求項3】
前記第1の学習用顔画像群が、顔の表情が略無表情であり顔の向きが略正面である顔画像からなるものであることを特徴とする請求項2記載の顔照合装置。
【請求項4】
前記被照合顔画像に対して顔のアスペクト比を維持する幾何学的正規化を行う第1の幾何学的正規化手段と、
前記被照合顔画像に対して顔のアスペクト比を変え得る幾何学的正規化を行う第2の幾何学的正規化手段とをさらに備え、
前記第1の特徴量抽出手段が、前記第1の幾何学的正規化手段により正規化された後の顔画像について特徴量を抽出するものであり、前記第2の特徴量抽出手段が、前記第2の幾何学的正規化手段により正規化された後の顔画像について特徴量を抽出するものであることを特徴とする請求項2または3記載の顔照合装置。
【請求項5】
前記被照合顔画像に対して周波数が所定の閾値以下である低周波数成分を抑制する処理を施して、該顔画像の照明依存成分を正規化する第1の照明正規化手段と、
前記被照合顔画像に対して輝度ヒストグラムを平滑化する処理を施して、該顔画像の照明依存成分を正規化する第2の照明正規化手段とをさらに備え、
前記第1の特徴量抽出手段が、前記第1の照明正規化手段により正規化された後の顔画像について特徴量を抽出するものであり、前記第2の特徴量抽出手段が、前記第2の照明正規化手段により正規化された後の顔画像について特徴量を抽出するものであることを特徴とする請求項2、3または4記載の顔照合装置。
【請求項6】
前記所定の分析が、主成分分析または線形判別分析であることを特徴とする請求項1から5いずれか記載の顔照合装置。
【請求項7】
前記照合判定手段が、前記第1の類似度と前記第2の類似度との和の大小に基づいて照合判定するものであることを特徴とする請求項1から6記載の顔照合装置。
【請求項8】
前記照合判定手段が、前記第1および第2の類似度のうち値がより大きい方の類似度の大小に基づいて照合判定するものであることを特徴とする請求項1から6いずれか記載の顔照合装置。
【請求項9】
照合対象である被照合顔画像について、顔の態様が所定の条件を満たす第1の学習用顔画像群に対する所定の分析により決定された、該顔画像群における顔の固体判別が可能な第1の種類の特徴量を抽出する第1の特徴量抽出ステップと、
前記被照合顔画像について、顔の態様が前記所定の条件とは異なる条件を満たす第2の学習用顔画像群に対する前記所定の分析により決定された、該顔画像群における顔の固体判別が可能な第2の種類の特徴量を抽出する第2の特徴量抽出ステップと、
特定の人物の顔を表す特定顔画像について抽出された前記第1の種類の特徴量と、前記第1の特徴量抽出手段により抽出された特徴量とを比較して、前記被照合顔画像と前記特定顔画像との間の類似性を表す第1の類似度を算出する第1の類似度算出ステップと、
前記特定顔画像について抽出された前記第2の特徴量種類の特徴量と、前記第2の特徴量抽出手段により抽出された特徴量とを比較して、前記被照合顔画像と前記特定顔画像との間の類似性を表す第2の類似度を算出する第2の類似度算出ステップと、
前記第1および第2の類似度を用いて、前記被照合顔画像が表す顔と前記特定顔画像が表す顔の照合判定を行う照合判定ステップとを有することを特徴とする顔照合方法。
【請求項10】
コンピュータを、
照合対象である被照合顔画像について、顔の態様が所定の条件を満たす第1の学習用顔画像群に対する所定の分析により決定された、該顔画像群における顔の固体判別が可能な第1の種類の特徴量を抽出する第1の特徴量抽出手段と、
前記被照合顔画像について、顔の態様が前記所定の条件とは異なる条件を満たす第2の学習用顔画像群に対する所定の分析により決定された、該顔画像群における顔の固体判別が可能な第2の種類の特徴量を抽出する第2の特徴量抽出手段と、
特定の人物の顔を表す特定顔画像について抽出された前記第1の種類の特徴量と、前記第1の特徴量抽出手段により抽出された特徴量とを比較して、前記被照合顔画像と前記特定顔画像との間の類似性を表す第1の類似度を算出する第1の類似度算出手段と、
前記特定顔画像について抽出された前記第2の特徴量種類の特徴量と、前記第2の特徴量抽出手段により抽出された特徴量とを比較して、前記被照合顔画像と前記特定顔画像との間の類似性を表す第2の類似度を算出する第2の類似度算出手段と、
前記第1および第2の類似度を用いて、前記被照合顔画像が表す顔と前記特定顔画像が表す顔の照合判定を行う照合判定手段として機能させるためのプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2007−316809(P2007−316809A)
【公開日】平成19年12月6日(2007.12.6)
【国際特許分類】
【出願番号】特願2006−143869(P2006−143869)
【出願日】平成18年5月24日(2006.5.24)
【出願人】(306037311)富士フイルム株式会社 (25,513)
【Fターム(参考)】