説明

パターン識別装置、パターン識別方法およびプログラム

【課題】全体的な照明変動および部分的な陰影の変動に対して精度の高いパターン識別ができるようにすることを目的とする。
【解決手段】所定の変動を加えた変動入力画像および変動登録画像を生成する変動画像生成手段と、変動入力画像から入力部分特徴を抽出し、変動登録画像の入力部分特徴に対応する登録部分特徴を抽出する部分特徴抽出手段と、入力部分特徴と登録部分特徴の部分特徴の類似度を、変動画像の所定の組み合わせ毎に算出する部分特徴類似度算出手段と、部分特徴類似度算出手段で計算された、少なくとも1つ以上の部分特徴類似度を所定の基準で統合した統合部分特徴類似度を算出する部分特徴類似度統合手段と、統合部分特徴類似度を部分領域毎に所定の基準で統合し、入力画像および登録画像間の識別類似度を算出する識別類似度算出手段と、を有することを特徴とする。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、識別対象のパターンが照明条件の違いによる影響を受けた場合であっても高精度かつ効率的に識別を行うことができるパターン識別装置等に関する。
【背景技術】
【0002】
パターン認識における識別技術、典型的には、画像データ中の被写体であるオブジェクトが、別の画像中の被写体であるオブジェクトと同一のものであると識別する技術として、例えば個人の顔を識別する顔識別技術がある。以下、パターン識別とは、パターンの個体の違い(例えば、個人としての人物の違い)を判定することを意味する。一方、パターンの検出は、個体を区別せず同じ範疇に入るものを判定する(例えば、個人を区別せず、顔を検出する)ことを意味するものとする。
【0003】
顔識別技術として、例えば非特許文献1のような方法がある。
このような、パターン(具体的には人物の顔)の識別を行う装置および方法において、識別性能を低下させる要因として、入力パターンと登録パターン間における照明条件の違いが挙げられる。照明条件が異なることで、顔全体の明暗の変化や顔の陰影の付き方が変化することで、識別性能が大幅に低下してしまう。
【0004】
特許文献1では、明示的な照明条件検出手段を設けることで照明変動に対応している。すなわち、入力画像と登録画像間の照明条件のずれを検出し、そのずれ量に応じた前処理を入力画像または登録画像あるいはその両方に行い、両者の照明条件を近づけた上で、顔認証を行うことで、照明条件にロバストな顔認証を行っている。
【0005】
また、特許文献2では、照明条件の差を吸収するための部分空間を事前に用意しておき、識別の際に、入力画像および登録画像のパターンをその部分空間に射影した上で、顔認証を行っている。これにより照明条件にロバストな顔認証を行っている。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2006−53774号公報
【特許文献2】特開2007−79710号公報
【非特許文献】
【0007】
【非特許文献1】"Learning Patch Correspondences for Improved Viewpoint Invariant Face Recognition", A. B. Ashraf, S. Lucey, T. Chen, Carnegie Mellon University, IEEE International Conference on Computer Vision and Pattern Recognition (CVPR), June, 2008.
【発明の概要】
【発明が解決しようとする課題】
【0008】
しかしながら、これらの方法は実用上の問題があると考えられる。例えば、特許文献1のように、明示的な照明条件検出手段を設けた場合には、その計算量が大きいだけでなく、照明条件検出手段を事前に大量の顔画像等を準備して学習しておかなければならない。また、特許文献2のように、部分空間を用いる方法でも同様に、事前に照明変動を吸収するような部分空間を、大量の顔画像等を準備して学習し、空間の基底データを記憶していなければならない。これは実用上の障害となってしまう。
【0009】
また、これらの方法だけでは実環境における照明変動に十分に対応できていないと考えられる。例えば、顔全体にわたる照明変動ではなく、部分的な陰影を生じるような照明変動のような場合には、画像の部分領域を考慮していない、上述の方法だけでは対応が難しい。
【課題を解決するための手段】
【0010】
本発明は、入力された画像のパターンが属するカテゴリを識別するパターン識別装置であって、所定の変動を加えた変動入力画像および変動登録画像を生成する変動画像生成手段と、前記変動入力画像から入力部分特徴を抽出し、前記変動登録画像の前記入力部分特徴に対応する登録部分特徴を抽出する部分特徴抽出手段と、前記入力部分特徴と前記登録部分特徴の部分特徴の類似度を、前記変動画像の所定の組み合わせ毎に算出する部分特徴類似度算出手段と、前記部分特徴類似度算出手段で計算された、少なくとも1つ以上の前記部分特徴類似度を所定の基準で統合した統合部分特徴類似度を算出する部分特徴類似度統合手段と、前記統合部分特徴類似度を部分領域毎に所定の基準で統合し、前記入力画像および前記登録画像間の識別類似度を算出する識別類似度算出手段と、を有することを特徴とする。
【発明の効果】
【0011】
本発明によれば、入力画像と登録画像に所定の前処理を部分領域毎に行うことにより、明示的な照明条件検出や事前の部分空間の学習を必要とせずに、全体的な照明変動および部分的な陰影の変動に対して、精度の高いパターン識別を行うことができる。
【図面の簡単な説明】
【0012】
【図1】本実施形態のパターン識別装置の構成を示すブロック図である。
【図2】本実施形態のパターン識別装置の処理を示すフローチャートである。
【図3】パターン登録部の構成の一例を示すブロック図である。
【図4】登録パターン辞書データ生成部の構成の一例を示すブロック図である。
【図5】登録パターン辞書データ生成部の処理を説明するための模式図である。
【図6】変動画像生成部および画像変換用パラメタ保持部の処理を示すフローチャートである。
【図7】特徴ベクトル抽出部および特徴ベクトル変換部の処理を示すフローチャートである。
【図8】入力パターン識別部の構成の一例を示すブロック図である。
【図9】入力パターン識別処理を示すフローチャートである。
【図10】入力パターン識別用データ生成部の構成の一例を示すブロック図である。
【図11】入力パターン識別演算部の構成の一例を示すブロック図である。
【図12】入力パターン識別演算処理を示すフローチャートである。
【図13】部分特徴類似度統合部の処理を示すフローチャートである。
【図14】複数特徴の登録パターン辞書データ生成部の構成の一例を示すブロック図である。
【図15】複数特徴の登録パターン辞書データ生成部の処理を説明するための模式図である。
【図16】複数特徴ベクトル抽出処理を示すフローチャートである。
【図17】複数特徴の入力パターン生成部の構成の一例を示すブロック図である。
【図18】複数特徴の入力パターン識別演算部の構成の一例を示すブロック図である。
【図19】複数特徴の入力パターン識別演算部の処理を示すフローチャートである。
【発明を実施するための形態】
【0013】
以下、図面を参照して本実施形態に係るパターン識別装置について説明する。
(第1の実施形態)
図1は、本実施形態に係るパターン識別装置100の構成を示すブロック図である。パターン識別装置100は、結像光学系1、撮像部2、撮像制御部3、画像記録部4、パターン登録部5、入力パターン識別部6、パターン識別結果を出力する外部出力部7、各構成要素の制御・データ接続を行うための接続バス8を含んで構成されている。なお、パターン登録部5および入力パターン識別部6は、典型的には、それぞれ専用回路(ASIC)、プロセッサ(リコンフィギュラブルプロセッサ、DSP、CPUなど)であってもよい。また、単一の専用回路および汎用回路(PC用CPU)内部において実行されるプログラムとして存在してもよい。
【0014】
結像光学系1は、ズーム機構を備えた光学レンズで構成される。また、結像光学系1は、パン・チルト軸方向の駆動機構を備えていてもよい。
撮像部2の映像センサとしては、典型的にはCCDまたはCMOSイメージセンサが用いられる。撮像部2は、不図示のセンサ駆動回路からの読み出し制御信号により所定の映像信号(例えば、サブサンプリング、ブロック読み出しして得られる信号)を画像データとして出力する。
撮像制御部3は、撮影者からの指示(画角調整指示、シャッター押下など)およびパターン登録部5または入力パターン識別部6からの情報に基づいて、実際に撮影が行われるタイミングを制御する。
【0015】
画像記録部4は、半導体メモリ等で構成され、撮像部2から転送された画像データを保持し、パターン登録部5、入力パターン識別部6からの要求に応じて所定のタイミングで画像データを転送する。
パターン登録部5は、画像データから識別の対象とするオブジェクトの情報を抽出し、記録・保持する。パターン登録部5のより詳細な構成および実際に行われる処理の具体的な内容については、後述する。
入力パターン識別部6は、画像データおよびパターン登録部5から取得したデータに基づいて、パターン、より典型的には、画像データ中のオブジェクトの識別を行う。入力パターン識別部6に関して、具体的な構成および行われる処理の詳細については、後述する。
【0016】
外部出力部7は、典型的には、CRTやTFT液晶などのモニタであり、撮像部2および画像記録部4から取得した画像データを表示、または、画像データにパターン登録部5および入力パターン識別部6の結果出力を重畳表示する。また、パターン登録部5および入力パターン識別部6の結果出力を電子データとして、外部メモリなどに出力する形式をとってもよい。
接続バス8は、上記構成要素間の制御・データ接続を行うためのバスである。
【0017】
<全体フロー>
図2は、本実施形態に係るパターン識別装置の全体処理の一例を示すフローチャートである。図2を参照しながら、パターン識別装置100が、入力パターンの識別を行う実際の処理について説明する。なお、以下では、識別するパターンが人物の顔である場合について説明するが、本発明の対象はこれに限るものではない。
始めに、入力パターン識別部6は、画像記録部4から画像データを取得する(S1)。続いて、入力パターン識別部6は、取得した画像データに対して、人の顔の検出処理を行う(S02)。画像中から、人物の顔を検出する方法については、公知の技術を用いればよい。例えば、「特許3078166号公報」や「特開2002−8032号公報」で提案されているような技術を用いることができる。
【0018】
入力パターン識別部6は、対象オブジェクトである人物の顔の検出処理をした後、画像中に人の顔が存在するか否かを判定する(S3)。存在する場合(S3でYesの場合)、入力パターン識別部6は、入力パターン識別処理、即ち個人の識別処理を行う(S4)。画像中に人の顔が存在しない場合(S3でNoの場合)、入力パターン識別部6は、処理を終了する。入力パターン識別処理(S4)の具体的な処理内容については、後述する。
入力パターン識別部6は、入力パターン識別処理の結果から、登録済みの人物に該当する顔があるか判定する(S5)。入力パターン識別部6はS1で検出された顔と同一人物が、登録済みの人物の中にあるか否かを判定し(S4)、ある場合(S5でYesの場合)、S8の処理に進む。検出された顔が登録済み人物の誰とも一致しない場合(S5でNoの場合)、入力パターン識別部6は、その人物を登録するかを判定する(S6)。これは、予め設定されている場合もあるが、例えばユーザが外部インターフェースやGUIなどを通じて、その場で登録するかどうか決定するようにしても良い。
【0019】
登録すると判定された場合(S6でYesの場合)、入力パターン識別部6は、後述するパターン(人物の顔)の登録処理を行う(S7)。登録を行わない場合(S6でNoの場合)、そのまま処理を続行する。
パターン登録処理(S7)の後およびS6で登録を行わない場合、入力パターン識別部6は、検出されたパターン全てについて処理が終了したか否かを判定する(S8)。未処理のパターンがある場合(S8でNoの場合)、S4に戻る。検出された全てのパターンについて処理が終了した場合(S8でYesの場合)入力パターン識別部6は、一連の入力パターン識別処理の結果を外部出力部7に出力する。
以上が、本実施形態に係るパターン識別装置100の全体の処理フローである。
【0020】
<パターン登録部>
パターン登録処理について説明する。図3は、パターン登録部5の構成の一例を示すブロック図である。図3に示すように、パターン登録部5は、登録パターン辞書データ生成部21、登録パターン辞書データ保持部22、登録パターン辞書データ選択部23を含んで構成されている。
【0021】
登録パターン辞書データ生成部21は、画像記録部4から取得した画像データから、パターンの個体を識別するために必要な登録パターン辞書データを生成する。ここでは、顔画像が同一のカテゴリであるか、別のカテゴリであるかの問題を判別するため、人物の顔画像から生成したデータを辞書データとして登録する。同一人物の複数枚の画像で登録することも考えられるが、本実施形態では一人につき1枚の画像を用いることとする。よって登録パターン辞書データは登録した人数の分だけ生成されることになる。画像を登録する際は、顔検出処理によって検出された人物の顔画像データを、大きさや向き(面内回転方向)などを正規化した後、登録パターン辞書データ保持部22に格納するようにしてもよい。画像データそのものではなく、識別時に必要なデータのみを保持するようにすることによって、辞書データ量を削減することもできる。当該パターンの部分領域のベクトル相関をとって識別演算を行う場合、予めその部分領域のみを切り出しておけばよい。
【0022】
以上のように、登録パターン辞書データ生成部21では、適宜必要な情報を画像から抽出し、後述する所定の変換を行った後、パターンの識別を行うための特徴ベクトルとして、登録パターン辞書データ保持部22に格納する。登録パターン辞書データ生成部21で行われる具体的な処理の内容については、後述する。登録パターン辞書データ選択部23は、後述する入力パターン識別部6の要求に応じて、登録パターン辞書データ保持部22から必要な登録パターン辞書データを読み出して、入力パターン識別部6に登録パターン辞書データを転送する。
【0023】
<登録パターン辞書データ生成部>
図4は、登録パターン辞書データ生成部21の構成の一例を示すブロック図である。図4に示すように、登録パターン辞書データ生成部21は、変動画像生成部30、画像変換用パラメタ保持部31、部分領域設定部32、特徴ベクトル抽出部33、特徴ベクトル変換部34、特徴ベクトル変換用データ保持部35を含んで構成されている。図5は、登録パターン辞書データ生成部21における処理の模式図を示しており、説明の補助として合わせて用いる。
【0024】
変動画像生成部30は、画像データに対して画像変換用パラメタ保持部31から変換用パラメタを取得し、画像変換を行い、変動登録画像を生成する(図5の画像取得および変動画像生成)。ここで用いる変換用パラメタは1種類だけでなく、複数種類用意しておき、変動登録画像を複数種類生成しておく。この処理の詳細は、後述する。部分領域設定部32は、画像データおよび変動画像データに対して、特徴ベクトル抽出部33が特徴ベクトルを抽出する位置と範囲を設定する(図5の部分領域設定)。
【0025】
部分領域の位置と範囲は、識別の対象が人の顔である場合には、顔の器官位置を基準とした領域を機械学習の方法を用いて予め決めておくとよい。例えば、部分領域の候補を複数設定しておいて、上記複数候補から、AdaBoostを用いて選択するようにしてもよい。また、後述するように、上記部分領域の組み合わせを多数用意しておいて、その組み合わせを1つの候補として、AdaBoostで選択するようにしてもよい。実際にAdaBoostを適用して、部分領域やその組み合わせを決める方法については、後述する入力パターン識別部6の説明で詳述する。部分領域の数は、処理時間などに応じて予め所定の数を決めておくとよい。また、予め用意した学習用サンプルに対して、十分な識別性能を得られる数を計測して決めるなどとしてもよい。
【0026】
本実施形態では、変動画像生成部30の後に部分領域設定部32という順番に構成されているが、これは逆の順番でもよい。すなわち、先に部分領域設定部32が部分領域を設定した上で、その部分領域に対して、変動画像生成部30が変動画像を生成してもよい。
【0027】
特徴ベクトル抽出部33は、変動登録画像から部分特徴抽出を行う。ここでは登録変動画像からの抽出であるため登録部分特徴の抽出(図5の「特徴ベクトル抽出、変換」のうちの抽出の処理)となる。本実施形態ではLBP(Local Binary Pattern)特徴量を部分領域から抽出し、特徴ベクトルとしている。この部分領域とは画像中の一定の大きさの矩形領域を指す。特徴ベクトルとしては、この他に、画像の輝度値やその他の特徴量を特徴ベクトルとして抽出してもよい。上述の通り、変動画像は複数種類あるため、変動画像の種類毎に特徴ベクトルを抽出する。また、特徴ベクトルを抽出する際には、輝度値を直接取得するのではなく、ガボアフィルタなど何らかのフィルタ演算を施した結果から特徴ベクトルを抽出してもよい。特徴ベクトル抽出部33で行われる処理の内容については後述する。また、本実施形態のように、変動画像から特徴ベクトルを抽出せずに、元の画像データ(登録画像)から抽出した特徴ベクトルを、あたかも変動画像から抽出した特徴ベクトルとなるような変換を行う変動特徴生成器を設けてもよい。こうすることにより、変動画像を生成し、記憶しておく必要がなくなる。ただし、変動画像生成部30で行う画像変換の種類によっては、変動特徴生成器で行う変換は非線形変換となることがあるため、近似計算等が必要な場合がある。
【0028】
特徴ベクトル変換部34は、特徴ベクトル抽出部33によって抽出された特徴ベクトルに所定の変換を施す(図5の特徴ベクトル抽出、変換のうちの変換)。特徴ベクトルの変換は、例えば、主成分分析(PCA)による次元圧縮や、独立成分分析(ICA)による次元圧縮などが行われる。また、局所性保存射影(LPP)や、局所フィッシャー判別分析(LFDA)による次元圧縮を行ってもよい。
特徴ベクトルの変換方法にPCAを用いた場合、その基底数(特徴ベクトルの次元削減数)や、どの基底を用いるか、などのパラメタが存在する。基底数の代わりに、基底ベクトルに対応する固有値の和、すなわち累積寄与率を指標としてもよい。これらのパラメタを部分領域毎に異なったものにしてもよいし、変動画像毎に異なったものにしてもよい。実際にどのようなパラメタを設定するかは、予め機械学習によって決めることができる。
【0029】
特徴ベクトル変換用データ保持部35は、特徴ベクトル変換部34において、特徴ベクトルの変換を行う際に必要なデータを保持している。ここで、特徴ベクトルの変換に必要なデータとは、上述のような基底数(次元削減数)などの設定情報や、予め学習によって求めておいた基底ベクトルの数値データなどである。
【0030】
図6は、変動画像生成部30および画像変換用パラメタ保持部31で行われる処理の一例を示すフローチャートである。このフローチャートでは、始めに、変動画像生成部30は、入力された画像データを取得する(S10)。次に、変動画像生成部30は、取得した画像に対して行う画像変換のパラメタを画像変換用パラメタ保持部31から取得する(S11)。このパラメタは画像変換方法および、その変換パラメタから構成される。続いて、変動画像生成部30は、これらの取得した画像データおよび画像変換のパラメタを用いて、画像変換を行う(S12)。画像変換として画像ボケ(ガウシアン)フィルタを用いた場合の変換式を以下に示す。
【0031】
【数1】

【0032】
x,yは、それぞれ画素位置のx座標、y座標を表し、Aは(式2)を満たすための正規化項を表わす。σは画像ボケ(ガウシアン)フィルタのパラメタで、これが大きいほど輝度の低周波成分の抽出度合いが強くなり、小さいほど弱くなる。このような画像変換により変動登録画像を生成する。ここで行う処理は、この他にエッジ強調フィルタ、コントラストフィルタといった公知の空間フィルタなどを用いることができるが、その他の画像変換手法を用いてもよい。また、画像変換を行っていない元画像も、変動登録画像として含めてもよい。
【0033】
図6に示すフローチャートに戻り、変動画像生成部30は、所定のパラメタによる変換が全て終了したか否かの判定を行う(S13)。終了していなければ(S13でNoの場合)、S11に戻り、変動画像生成部30は、残りの変換パラメタで変換を行う。終了しているならば(S13でYesの場合)、変動画像生成部30は、画像変換した変動画像データおよび画像変換に用いたパラメタを関連付けて保持し(S14)、処理を完了する。
【0034】
図7は、特徴ベクトル抽出部33および特徴ベクトル変換部34等で行われる処理の一例を示すフローチャートである。始めに、部分領域設定部32が部分領域の設定情報を取得する(S20)。続いて、部分領域設定部32は、画像記録部4から対象パターンの登録変動画像データを取得する(S21)。部分領域設定部32は、取得した登録変動画像データからS20で取得した部分領域の情報に基づいて部分領域画像データを切り出し(S22)、特徴ベクトル抽出部33は、部分領域画像データから特徴量を取得する(S23)。ここでは1種類の特徴量を抽出する。
【0035】
上述した通り、特徴ベクトル抽出部33は、LBP特徴量を抽出し、特徴ベクトルとするが、典型的には、輝度画像の画素値をそのまま特徴ベクトルとして抽出してもよいし、その他の特徴量抽出手法を用いてもよい。特徴ベクトル変換部34は、S23で取得した特徴ベクトルに対して、特徴ベクトル変換用データ保持部35から取得した設定に従って、所定の変換を行う(S24)。上述したように、典型的には、PCAによる次元削減や、ICAによる次元削減などを特徴ベクトルに対して行う。この際、取得した特徴ベクトルに対して、所定の統計値、典型的には、平均ベクトルや、要素の最大値などを求めておいてもよい。また、部分特徴として、画像から切り出した位置の情報を記録するようにしてもよい。後述するように、登録パターンと入力パターン間で対応する部分特徴の比較・評価を行うために、対応関係を示す識別子を記録するようにしてもよい。これらの情報は、登録パターン辞書データ生成部21の出力として、特徴ベクトルと共に出力するようにするとよい。以上が、特徴ベクトル抽出部33および特徴ベクトル変換部34等で行われる処理の一例の説明である。
以上のような処理を行って、部分領域を設定し、特徴ベクトルを抽出した後に、特徴ベクトルを変換したデータを、登録パターン辞書データ生成部21の出力として、登録パターン辞書データ保持部22に格納する。
【0036】
<入力パターン識別部>
次に、入力パターン識別処理について説明する。図8は、入力パターン識別部6の構成の一例を示すブロック図である。図8に示すように、入力パターン識別部6は、入力パターン識別用データ生成部41、登録パターン辞書データ取得部42、入力パターン識別演算部43を含んで構成されている。
入力パターン識別用データ生成部41は、画像記録部4から取得した画像データから対象パターンの識別に必要な情報の抽出を行う。
登録パターン辞書データ取得部42は、パターン登録部5から入力パターンの識別に必要な辞書データを取得する。
入力パターン識別演算部43は、入力パターン識別用データ生成部41から取得した識別用データと、登録パターン辞書データ取得部42から取得した辞書データとから入力パターンの識別処理を行う。ここで行われる処理については、後述する。
【0037】
図9は、入力パターン識別部6で行われる識別処理の一例を示すフローチャートである。まず、登録パターン辞書データ取得部42は、パターン登録部5から登録パターン辞書データを取得する(S30)。次に、入力パターン識別用データ生成部41は、画像記録部4より入力パターンの画像データを取得する(S31)。続いて、入力パターン識別演算部43は、入力パターン識別用データ生成処理を行う(S32)。ここで行われる処理については、後述する。次に、入力パターン識別演算部43は、入力パターン識別演算処理を行う(S33)。入力パターン識別演算処理の出力として、登録済みデータ(辞書データ)との一致をバイナリ(0or1)で出力する場合と、正規化した出力値を(0〜1の実数値)尤度として出力する場合が考えられる。さらに登録パターン(登録者)が複数(複数人)ある場合には、それぞれの登録パターン(登録者)に対して、尤度を出力しても良いが、最も良く一致した登録パターンに対する結果だけを出力しても良い。また、登録パターンに対する尤度ではなく、登録パターンが属するカテゴリに対しての尤度を出力してもよい。すなわち、人物の場合には、個々の登録顔画像への結果ではなく、人物のID(名前)に対する尤度を出力するようにする。なお、入力パターン識別演算処理の具体的な内容についても、後述する。以上が、入力パターン識別部6における処理の一例を示すフローチャートの説明である。
【0038】
<入力パターン識別用データ生成部>
図10は、入力パターン識別用データ生成部41の構成の一例を示すブロック図である。図10に示すように、入力パターン識別用データ生成部41は、変動画像生成部50、画像変換用パラメタ保持部51、部分領域設定部52、特徴ベクトル抽出部53、特徴ベクトル変換部54、特徴ベクトル変換用データ保持部55を含んで構成されている。入力パターン識別用データ生成部41の構成およびそこで行われる処理は、登録パターン辞書データ生成部21とほぼ同じであるので、詳細の説明は割愛する。相違点として、変動画像生成部30で生成される画像を変動入力画像と呼び、特徴ベクトル抽出部53で抽出される特徴ベクトルを入力部分特徴と呼ぶ点が異なる。
【0039】
<入力パターン識別演算処理>
入力パターン識別演算処理について説明する。ここでは、一例として、入力パターンの識別を対応する部分特徴間の類似性に基づいて判定する場合について説明する。図11は、入力パターン識別演算部43の構成の一例を示すブロック図である。入力パターン識別演算部43は、入力パターン識別用データ取得部61、登録パターン辞書データ取得部62、部分特徴類似度算出部63、部分特徴類似度統合部64、識別結果算出部65を含んで構成されている。
【0040】
図12は、入力パターン識別演算処理の一例を示すフローチャートである。以下、このフローチャートを用いて説明する。
まず、入力パターン識別用データ取得部61は、入力パターン識別用データを取得する(S40)。次に、登録パターン辞書データ取得部62は、登録パターンの辞書データを取得する(S41)。続いて、部分特徴類似度算出部63は、S40およびS41で取得した入力パターン識別用データと登録パターン辞書データとのそれぞれの特徴ベクトルから、部分特徴類似度を算出する(S42)。この特徴ベクトルは上述の通り、変動画像の部分領域から抽出した特徴量に変換を施したベクトルである。ここでは、類似度算出の方法として特徴ベクトル間の内積に基づくコサイン類似度を使用する。すなわち、入力パターン識別用データの特徴ベクトルをVI、登録パターン辞書データの特徴ベクトルをVR、VIとVRがなす角をθとすると、コサイン類似度Sは、以下の式で表わされる。
【0041】
【数2】

【0042】
ただし、VI・VRはそれぞれVIとVRの内積、|VI|と|VR|は、それぞれのベクトルのノルムを表わす。本実施形態では、このコサイン類似度を使用したが、その他の方法を用いてもよい。続いて、部分特徴類似度算出部63は、変動画像の全組み合わせについて、演算が終了したか否かを判定する(S43)。これについても、変動画像の全組み合わせ以外にも、事前に定めておいた組み合わせについてのみ演算する方法などが考えられる。全組み合わせの演算が終了した場合(S43でYesの場合)、部分特徴類似度統合部64は、組み合わせの数だけ算出された部分特徴類似度の統合を行う(S44)。統合方法の詳細は後述する。
【0043】
次に、部分特徴類似度統合部64は、S44で統合した部分特徴類似度を、さらに部分領域全体にわたって統合し、識別結果算出部65は、入力パターンと登録パターンの識別類似度算出を行う(S45)。本実施形態では、統合の方法として、部分特徴類似度の高い順に上位から所定個数を平均する方法を用いているが、その他の手法を用いてもよい。
最後に、識別結果算出部65は、全ての辞書データについて識別の演算が終了したか否かを判定する(S46)。演算が終了していない登録パターン辞書データがある場合(S46でNoの場合)、S41に戻り、登録パターン辞書データ取得部62は、まだ処理の完了していない人物の登録パターン辞書データに対して処理を行う。全ての人物の登録パターン辞書データの処理が終了している場合(S46でYesの場合)、識別結果算出部65は、識別類似度を保持する(S47)。ここでは、入力パターン識別用データと各登録パターン辞書データ間の類似度を類似度最大のものを識別結果として保持する。他にも、全ての類似度をリストで保持する方法が考えられる。以上が、パターン識別演算処理の説明である。
【0044】
<部分特徴類似度統合>
次に、部分特徴類似度統合処理について説明する。図13は、部分特徴類似度統合部64で行われる処理(S44)の一例を示すフローチャートである。
まず、部分特徴類似度統合部64は、部分特徴類似度データを取得する(S51)。
次に、部分特徴類似度統合部64は、複数ある部分特徴類似度を一つの値に統合する処理を行う(S52)。ここでは、類似度最大基準での統合を行う。すなわち、取得した複数の部分特徴類似度の中から類似度最大のものを選択し、部分特徴類似度統合部64は、それを統合結果として出力する。一般に、顔認証のような画像の詳細をマッチングする処理の場合には、他人同士の類似度が偶然高くなることは考えにくい。そのため、統合処理として、この類似度最大の選択を行うことにより、入力画像と登録画像間の照明変動差を軽減するような変換を施した上で、本当に本人同士ならば高い類似度、他人同士ならば低い類似度が得られることが期待できる。
最後に、部分特徴類似度統合部64は、統合した部分特徴類似度のデータを保持する(S53)。以上が、部分類似度統合処理の説明である。
【0045】
このように、本実施形態では、登録画像および入力画像の複数の変動画像から、部分領域毎に、特徴ベクトルを抽出し、複数の変動画像の総当たりで算出した類似度の最大のものを選択し、部分領域毎の類似度を統合している。これにより、登録パターンと入力パターンの照明条件を明示的に算出することなく、両者の照明条件差を軽減した変動画像同士の類似度を得ることができる。また、部分領域毎の処理により、画像の部分的な照明条件差に対するロバスト性も期待できる。
【0046】
(第2の実施形態)
本実施形態は、第1の実施形態の特徴ベクトル抽出部33、入力パターン識別用データ生成部41、入力パターン識別演算部43および部分特徴類似度統合部64が異なる。具体的には、第1の実施形態の特徴ベクトル抽出部33は、抽出する特徴ベクトルの種類は1種類だけであったのに対して、第2の実施形態では複数種類の特徴ベクトルを抽出する点が異なる。また、複数種類の特徴ベクトルに応じた入力パターン識別演算および部分特徴類似度統合を行う点も第1の実施形態とは異なる。
【0047】
以下、本実施形態について詳細に説明する。なお、重複を避けるため、以下の説明において、第1の実施形態と同じ部分は省略する。本実施形態に係るパターン識別装置100全体のハードウェア構成は、第1の実施形態と同じであるので、説明を省略する。以下の説明では、第1の実施形態と区別するため、処理内容が異なる登録パターン辞書データ生成部を、複数特徴の登録パターン辞書データ生成部70と呼ぶことにする。
また、本実施形態においても便宜上、識別対象のパターンを、画像中の人物の顔としているが、識別対象をその他のオブジェクトとしてもよい。
【0048】
<複数特徴の登録パターン辞書データ生成>
図14は、複数特徴の登録パターン辞書データ生成部70の構成の一例を示すブロック図である。複数特徴の登録パターン辞書データ生成部70は、変動画像生成部71、画像変換パラメタ保持部72、部分領域設定部73、複数特徴ベクトル抽出部74、特徴ベクトル変換部75、特徴ベクトル変換用データ保持部76を含んで構成されている。図15は、複数特徴の登録パターン辞書データ生成部70における処理を説明するための模式図であり、合わせて説明に用いる。変動画像生成部71における処理は、第1の実施形態とほぼ同じであるため、省略する(図15に示す「画像取得」および「変動画像生成」)。
【0049】
図16は、部分領域設定部73、複数特徴ベクトル抽出部74および特徴ベクトル変換部75における処理を示すフローチャートである。以下、このフローチャートを用いて説明する。始めに、部分領域設定部73は、部分領域の設定情報を取得し(S60)、特徴ベクトルを抽出する対象である変動画像データを取得する(S61)。部分領域設定部73は、取得した変動画像データに部分領域を設定し(図15に示す部分領域設定)、設定した部分領域から、複数特徴ベクトル抽出部74は、複数の特徴ベクトルを抽出する(S62)。ここでは、特徴ベクトルの種類として第1の実施形態でも使用したLBP特徴量とHOG特徴量、SIFT特徴量を抽出する(図15に示す「特徴ベクトル抽出、変換」のうちの抽出の処理)。ここで、HOGは、Histogram of Oriented Gradientsを表し、SIFTはScale−Invariant Feature Transformを表す。なお、特徴ベクトルの抽出は、その他の公知の手法を用いることができる。特徴ベクトル変換部75は、抽出した複数の特徴ベクトルを、特徴ベクトル変換用データ保持部76から取得した変換用データを用いて変換を行う(S63および図15に示す「特徴ベクトル抽出、変換」のうちの変換の処理)。この変換用データは、変換する対象の特徴ベクトルの種類毎に用意しておく。
【0050】
最後に、特徴ベクトル変換部75は、所定の種類の特徴ベクトルを全て取得したか否かの判定を行う(S64)。抽出していない特徴ベクトルが存在する場合(S64でNoの場合)、S62の処理に戻る。特徴ベクトルを全て取得している場合(S64でYesの場合)、特徴ベクトル変換部75は、抽出した全ての特徴ベクトルについて、特徴ベクトルの種類、抽出元の変動画像生成に用いたパラメタを関連づけて記憶し、保持する(S65)。
以上が、複数特徴の登録パターン辞書データ生成部70の説明である。
【0051】
<複数特徴の入力パターン生成>
図17は、複数特徴の入力パターン生成部80の構成の一例を示すブロック図である。ここでの処理は<複数特徴の登録パターン辞書データ生成>とほぼ同じであるため詳細の説明は省略する。
【0052】
<複数特徴の入力パターン識別演算>
図18は、複数特徴の入力パターン識別演算部90の構成の一例を示すブロック図である。複数特徴の入力パターン識別演算部90は、入力パターン識別用データ取得部91、登録パターン辞書データ取得部92、同種部分特徴類似度算出部93、特徴量別類似度統合部94、部分特徴類似度統合部95、識別結果算出部96を含んで構成される。入力パターン識別用データ取得部91と登録パターン辞書データ取得部92の処理は、第1の実施形態と同様の処理であるため、省略する。
【0053】
図19は、複数特徴の入力パターン識別演算部90の処理の一例を示すフローチャートである。以下、このフローチャートを用いて説明する。
まず、入力パターン識別用データ取得部91は、入力パターン識別用データを取得する(S70)。次に、登録パターン辞書データ取得部92は、登録パターンの辞書データを取得する(S71)。これらのデータは上述の通り、特徴ベクトルおよび特徴ベクトルの種類、抽出元の変動画像生成に用いたパラメタ、抽出した部分領域の情報、およびそれらの組み合わせ毎に抽出した特徴ベクトルを関連づけて記憶したデータである。同種部分特徴類似度算出部93は、部分特徴類似度を算出する(S72)。このとき、同種部分特徴類似度算出部93は、異なる種類の特徴ベクトル間では計算できないため、同種類の特徴ベクトル間でのみ演算を行う。具体的には、同種部分特徴類似度算出部93は、まず、登録パターン辞書データおよび入力パターン識別用データから処理を行う部分領域を選択し、その部分領域において同種類の特徴ベクトル間の類似度を算出する。そして、全ての部分領域ついてこの処理を行う。
【0054】
次に、同種部分特徴類似度算出部93は、所定の全ての変動画像の組み合わせについて演算が終了したか否かを判定する(S73)。終了した場合(S73でYesの場合)、S74の処理に進み、終了していない場合(S73でNoの場合)、S72に戻る。
S72では部分特徴類似度が変動画像の数だけ算出されるため、特徴量別類似度統合部94は、これらの複数の値を一つの値にまとめる統合を行う(S74)。ここでは、第1の実施形態と同じように、類似度の最大値を選択することで統合する。統合により、特徴ベクトルの種類の数だけ類似度が算出されるので、これをさらに次の処理で統合する。
【0055】
特徴ベクトルの種類を表わすインデックスをi、特徴ベクトルの種類数をN、類似度の最大値選択により統合された特徴量毎の類似度をSiと表わすと、Siは特徴量毎に算出された類似度であるため、その値を単純に統合することはできない。なぜなら、特徴量は、その種類によって、高い類似度が出やすいもの、その逆の傾向を持つものなど傾向が異なるためである。そこで、部分特徴類似度統合部95は、変動画像を生成した際の変動量の和の逆数を重み係数として、統合を行う(S75)。統合の計算式は以下の通りである。
【0056】
【数3】

【0057】
ただし、DR,DIはそれぞれ、登録パターン辞書データおよび入力パターン識別用データにおける変動画像生成の際の、変動画像の元の画像からの変動量である。このような重み付けの統合をすることにより、以下のような効果が期待できる。すなわち、変動画像生成の際の変動量が大きい際には、人の顔のような詳細を識別するのに必要な情報量は失われていると考えられるので、その変動画像間で算出された類似度の寄与を低くすることができる。逆に変動量が少ない場合には、元画像からのかい離が少ないため、情報量が残されていると考えられるため、その変動画像間での類似度の寄与を大きくすることができる。この統合方法以外にも、単純に類似度の和ΣNiSiを用いる方法なども考えられる。変動量DR,DIの算出方法としては、変動画像を生成する際に用いたパラメタ、(式1)におけるσを用いる。他の算出方法として、変動画像と元画像について画素毎の差分平均をとってもよい。
【0058】
この統合により算出された統合部分特徴類似度を、識別結果算出部96が、画像全体にわたって統合を行い、最終的な識別結果を得る(S76)。この処理は、第1の実施形態と同様であるため省略する。最後に、識別結果算出部96は、全辞書データについて演算が終了したか否かの判定を行い(S77)、終了していない場合(S77でNoの場合)、S71に戻り処理を行う。終了している場合(S77でYesの場合)、識別結果算出部96は、登録辞書パターンの数だけある識別類似度を第1の実施形態と同様に、リストとして出力するか、最も類似度の高いパターンを識別結果として出力し、結果を保持する(S78)。以上が、複数特徴の入力パターン識別演算の説明である。
【0059】
第2の実施形態では、第1の実施形態と比べ、複数の変動画像から、一種類ではなく、複数種類の特徴ベクトルを抽出することで、ある特徴量では頑健ではない照明条件の差を他の特徴量で対応することができる、という効果を期待できる。また、特徴量の種類毎に算出される類似度を、変動画像とその元画像との変動量の逆数で重み付けして統合することにより、変動画像の変動量が大きい場合は、そこから算出される類似度の寄与を小さく、逆に変動量が小さい場合には大きくすることができる。これにより、極端に大きな変動を与えられたことにより算出された、異常な類似度(例えば、極端に高い強度でかけたぼかしフィルタの変動画像同士の類似度は非常に高い数値になる)の影響を受けない、という効果を期待できる。
【0060】
以上、本発明を種々の実施形態と共に説明したが、本発明はこれらの実施形態にのみ限定されるものではなく、本発明の範囲内で変更等が可能である。上述した本発明の実施形態におけるパターン識別装置を構成する各手段、並びにパターン識別方法の各工程は、コンピュータのRAMやROM等に記憶されたプログラムが動作することによって実現できる。このプログラムおよびこのプログラムを記録したコンピュータ読み取り可能な記録媒体は本発明に含まれる。
【符号の説明】
【0061】
1:結像光学系 2:撮像部 3:撮像制御部 4:画像記録部 5:パターン登録部 6:入力パターン識別部 7:外部出力部 8:接続バス 21:登録パターン辞書生成部 22:登録パターン辞書データ保持部 23:登録パターン辞書データ選択部 30:変動画像生成部 31:画像変換用パラメタ保持部 32:部分領域設定部 33:特徴ベクトル抽出部 34:特徴ベクトル変換部 35:特徴ベクトル変換用データ保持部 41:入力パターン識別用データ生成部 42:登録パターン辞書データ取得部 43:入力パターン識別演算部 50:変動画像生成部 51:画像変換用パラメタ保持部 52:部分領域設定部 53:特徴ベクトル抽出部 54:特徴ベクトル変換部 55:特徴ベクトル変換用データ保持部 61:入力パターン識別用データ取得部 62:登録パターン辞書データ取得部 63:部分特徴類似度算出部 64:部分特徴類似度統合部 65:識別結果算出部 70:複数特徴の登録パターン辞書データ生成部 71:変動画像生成部 72:画像変換用パラメタ保持部 73:部分領域設定部 74:複数特徴ベクトル抽出部 75:特徴ベクトル変換部 76:特徴ベクトル変換用データ保持部 80:複数特徴の入力パターンデータ生成部 81:変動画像生成部 82:画像変換用パラメタ保持部 83:部分領域設定部 84:複数特徴ベクトル抽出部 85:特徴ベクトル変換部 86:特徴ベクトル変換用データ保持部 90:複数特徴入力パターン識別演算部 91:入力パターン識別用データ取得部 92:登録パターン辞書データ取得部 93:同種部分特徴類似度算出部 94:特徴量別類似度統合部 95:部分特徴類似度統合部 96:識別結果算出部

【特許請求の範囲】
【請求項1】
入力された画像のパターンが属するカテゴリを識別するパターン識別装置であって、
所定の変動を加えた変動入力画像および変動登録画像を生成する変動画像生成手段と、
前記変動入力画像から入力部分特徴を抽出し、前記変動登録画像の前記入力部分特徴に対応する登録部分特徴を抽出する部分特徴抽出手段と、
前記入力部分特徴と前記登録部分特徴の部分特徴の類似度を、前記変動画像の所定の組み合わせ毎に算出する部分特徴類似度算出手段と、
前記部分特徴類似度算出手段で計算された、少なくとも1つ以上の前記部分特徴類似度を所定の基準で統合した統合部分特徴類似度を算出する部分特徴類似度統合手段と、
前記統合部分特徴類似度を部分領域毎に所定の基準で統合し、前記入力画像および前記登録画像間の識別類似度を算出する識別類似度算出手段と、を有することを特徴とするパターン識別装置。
【請求項2】
前記部分特徴類似度統合手段は、前記部分特徴類似度の最大値を前記統合部分特徴類似度とすることを特徴とする請求項1に記載のパターン識別装置。
【請求項3】
前記部分特徴類似度統合手段は、前記変動画像生成手段で加えた変動の大きさを基準として前記部分特徴類似度を統合することを特徴とする請求項1に記載のパターン識別装置。
【請求項4】
前記部分特徴類似度算出手段が前記部分特徴類似度を算出する際に用いる、前記変動画像の所定の組み合わせは、前記変動画像の総当たりであることを特徴とする請求項1に記載のパターン識別装置。
【請求項5】
入力された画像のパターンが属するカテゴリを識別するパターン識別方法であって、
所定の変動を加えた変動入力画像および変動登録画像を生成する変動画像生成工程と、
前記変動入力画像から入力部分特徴を抽出し、前記変動登録画像の前記入力部分特徴に対応する登録部分特徴を抽出する部分特徴抽出工程と、
前記入力部分特徴と前記登録部分特徴の部分特徴の類似度を、前記変動画像の所定の組み合わせ毎に算出する部分特徴類似度算出工程と、
前記部分特徴類似度算出工程で計算された、少なくとも1つ以上の前記部分特徴類似度を所定の基準で統合した統合部分特徴類似度を算出する部分特徴類似度統合工程と、
前記統合部分特徴類似度を部分領域毎に所定の基準で統合し、前記入力画像および前記登録画像間の識別類似度を算出する識別類似度算出工程と、を有することを特徴とするパターン識別方法。
【請求項6】
入力された画像のパターンが属するカテゴリを識別するパターン識別するためのプログラムであって、
所定の変動を加えた変動入力画像および変動登録画像を生成する変動画像生成工程と、
前記変動入力画像から入力部分特徴を抽出し、前記変動登録画像の前記入力部分特徴に対応する登録部分特徴を抽出する部分特徴抽出工程と、
前記入力部分特徴と前記登録部分特徴の部分特徴の類似度を、前記変動画像の所定の組み合わせ毎に算出する部分特徴類似度算出工程と、
前記部分特徴類似度算出工程で計算された、少なくとも1つ以上の前記部分特徴類似度を所定の基準で統合した統合部分特徴類似度を算出する部分特徴類似度統合工程と、
前記統合部分特徴類似度を部分領域毎に所定の基準で統合し、前記入力画像および前記登録画像間の識別類似度を算出する識別類似度算出工程と、をコンピュータに実行させるためのプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate


【公開番号】特開2012−234500(P2012−234500A)
【公開日】平成24年11月29日(2012.11.29)
【国際特許分類】
【出願番号】特願2011−104621(P2011−104621)
【出願日】平成23年5月9日(2011.5.9)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】