画像処理装置および方法、並びにプログラム
【課題】簡単に画像の識別性能を向上させることができるようにする。
【解決手段】角度組合せ別学習辞書保持部44は、入力顔の向いている方向を示す角度と、登録顔の向いている方向を示す角度との組合せごとに、入力顔と登録顔との類似度を推定する際にそれぞれを対応付ける特徴点の位置に関する情報を少なくとも含んでいる角度組合せ別学習辞書44Aを保持し、角度組合せ別学習辞書選択部43は、入力顔角度情報および登録顔角度情報に基づいて、角度組合せ別学習辞書44Aのなかから、学習辞書LL乃至RRのいずれかを選択する。そして、顔類似度推定部45は、選択された角度組合せ別学習辞書44Aに含まれる特徴点の位置に対応する、入力顔と登録顔のそれぞれから抽出された特徴量に基づいて、入力顔と登録顔との顔の類似度を推定する。本発明は、画像を識別する画像識別装置に適用できる。
【解決手段】角度組合せ別学習辞書保持部44は、入力顔の向いている方向を示す角度と、登録顔の向いている方向を示す角度との組合せごとに、入力顔と登録顔との類似度を推定する際にそれぞれを対応付ける特徴点の位置に関する情報を少なくとも含んでいる角度組合せ別学習辞書44Aを保持し、角度組合せ別学習辞書選択部43は、入力顔角度情報および登録顔角度情報に基づいて、角度組合せ別学習辞書44Aのなかから、学習辞書LL乃至RRのいずれかを選択する。そして、顔類似度推定部45は、選択された角度組合せ別学習辞書44Aに含まれる特徴点の位置に対応する、入力顔と登録顔のそれぞれから抽出された特徴量に基づいて、入力顔と登録顔との顔の類似度を推定する。本発明は、画像を識別する画像識別装置に適用できる。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理装置および方法、並びにプログラムに関し、特に、簡単に、画像の識別性能を向上させることができるようにした画像処理装置および方法、並びにプログラムに関する。
【背景技術】
【0002】
従来より、顔画像が同一人物のものであるか否かを識別するための各種の技術が提案されている。
【0003】
本出願人は、2つの特徴量の相関を用いて認識処理を行う場合の認識の精度を向上させる画像処理装置を発明し、特願2006−332302号として既に特許出願(以下、先願と称する)している。
【0004】
かかる先願においては、認識処理の精度を向上させることはできるものの、正面方向あるいは特定の方向を向いている顔しか精度よく識別することができない。これは、顔の向いている方向が変化すると、顔特徴の画像パターンが大幅に変化してしまうために、同一人物間の特徴量の類似性がなくなってしまうためである。
【0005】
また、任意の方向を向いている顔を識別する手法としては、例えば、特許文献1が知られている。
【0006】
この特許文献1においては、人の顔の標準的な立体形状モデルを用いることで、任意の方向を向いている顔を識別している。この手法では、異なる方向で撮像された2枚の顔画像を比較するため、一方の顔画像を顔立体形状モデルに貼り付け、他方の顔画像と同じ方向に相当する顔画像を合成することにより、異なる方向の顔識別を実現している。
【0007】
また、Volker Blanzらにより発表されている論文、“Face Recognition Based on Fitting a 3D Morphable Model”では、標準3次元顔変形モデルを様々なパラメータを基に変形させて合成した顔画像から、入力顔画像に最も近似するパラメータを用いて顔識別を行う手法が提案されている。
【特許文献1】特開2000−322577号公報
【発明の開示】
【発明が解決しようとする課題】
【0008】
しかしながら、上記の特許文献1および論文を含む従来の技術においては、標準的な顔の立体形状モデルからCG(Computer Graphics)の手法を用いて、異なる方向の顔を合成する手法をベースとしているが、このような立体形状モデルを求めるためには、高精度な立体計測装置が必要となるため、一般的、特に家庭用の製品に搭載する際にはあらかじめ取得したデータから生成されたモデルしか使用することができない。
【0009】
このため、モデルに合わないような顔形状の人物に合わせてモデルを更新することや、家族などの限定された少人数の識別に特化したモデルに変更することは極めて困難となる。
【0010】
また、顔画像を標準的な顔立体形状モデルに当てはめて回転することにより合成した顔画像は、モデルと実際の顔形状との相違が大きい場合には正しく合成できないために識別性能が低下することが多く、3次元顔変形モデルをパラメータに基づき変形させて近似画像を求める手法は、計算に多くの時間を要するという問題がある。
【0011】
本発明はこのような状況に鑑みてなされたものであり、簡単に、画像の識別性能を向上させることができるようにするものである。
【課題を解決するための手段】
【0012】
本発明の第1の側面の画像処理装置は、人の顔を含んでいる第1の顔画像の顔の向いている方向を示す第1の角度と、人の顔を含んでいる第2の顔画像の顔の向いている方向を示す第2の角度との組合せごとに、前記第1の顔画像と前記第2の顔画像との類似度を推定する際にそれぞれを対応付ける特徴点の位置に関する情報を含んでいる学習辞書を保持する保持手段と、前記第1の角度と前記第2の角度との組合せに応じて、前記第1の角度と前記第2の角度との組合せごとに保持されている前記学習辞書を選択する選択手段と、選択された前記学習辞書に含まれる特徴点の位置に対応する、前記第1の顔画像と前記第2の顔画像から抽出された特徴量に基づいて、前記第1の顔画像と前記第2の顔画像との顔の類似度を推定する類似度推定手段とを備える。
【0013】
推定した前記類似度に基づいて、前記第1の顔画像と前記第2の顔画像とを識別する識別手段をさらに備える。
【0014】
前記第2の顔画像は、抽出された特徴量と、前記第2の角度とに対応付けられて、あらかじめ登録されている。
【0015】
人を含んでいる画像から前記第1の顔画像の部分を検出する顔検出手段と、検出された前記第1の顔画像から前記顔の特徴となる顔特徴位置を検出する顔特徴検出手段と、検出された前記第1の顔画像および前記顔特徴位置に基づいて、前記第1の角度を推定する顔角度推定手段と、検出された前記第1の顔画像における前記顔特徴位置近傍の画像から特徴量を抽出する抽出手段とをさらに備え、前記選択手段は、推定された前記第1の角度と、登録されている前記第2の角度との組合せに応じて、前記学習辞書を選択し、前記類似度推定手段は、選択された前記学習辞書に含まれる特徴点の位置に対応する、前記第1の顔画像から抽出した特徴量と、登録されている前記第2の顔画像の特徴量に基づいて、前記類似度を推定する。
【0016】
前記保持手段は、前記第1の角度の示す向きを、左方向、正面方向、および右方向の3段階とし、前記第2の角度を示す向きを、左方向、正面方向、および右方向の3段階とした場合、それらの方向のすべての組合せについての前記学習辞書を保持する。
【0017】
前記学習辞書には、前記第1の顔画像と前記第2の顔画像とを識別する際の基準となる所定の閾値が含まれており、前記識別手段は、推定された前記類似度と前記閾値とを比較した結果に基づいて、前記第1の顔画像と前記第2の顔画像との顔が、同一人物であるか、あるいは別人物であるか否かを識別する。
【0018】
本発明の第1の側面の画像処理方法は、人の顔を含んでいる第1の顔画像の顔の向いている方向を示す第1の角度と、人の顔を含んでいる第2の顔画像の顔の向いている方向を示す第2の角度との組合せに応じて、前記第1の角度と前記第2の角度との組合せごとに保持されている学習辞書であって、前記第1の角度と前記第2の角度との組合せごとに、前記第1の顔画像と前記第2の顔画像との類似度を推定する際にそれぞれを対応付ける特徴点の位置に関する情報を含んでいる前記学習辞書を選択し、選択された前記学習辞書に含まれる特徴点の位置に対応する、前記第1の顔画像と前記第2の顔画像から抽出された特徴量に基づいて、前記第1の顔画像と前記第2の顔画像との顔の類似度を推定するステップを含む。
【0019】
本発明の第1の側面のプログラムは、上述した本発明の第1の側面の画像処理方法に対応するプログラムである。
【0020】
本発明の第1の側面の画像処理装置および方法、並びにプログラムにおいては、人の顔を含んでいる第1の顔画像の顔の向いている方向を示す第1の角度と、人の顔を含んでいる第2の顔画像の顔の向いている方向を示す第2の角度との組合せごとに、第1の顔画像と第2の顔画像との類似度を推定する際にそれぞれを対応付ける特徴点の位置に関する情報を含んでいる学習辞書が保持され、第1の角度と第2の角度との組合せに応じて、第1の角度と第2の角度との組合せごとに保持されている学習辞書が選択され、選択された学習辞書に含まれる特徴点の位置に対応する、第1の顔画像と第2の顔画像から抽出された特徴量に基づいて、第1の顔画像と第2の顔画像との顔の類似度が推定される。
【0021】
本発明の第2の側面の画像処理装置は、所定の形状と特徴を有する物体または生物を含んでいる第1の画像の前記物体または前記生物の向いている方向を示す第1の角度と、所定の形状と特徴を有する物体または生物を含んでいる第2の画像の前記物質または前記生物の向いている方向を示す第2の角度との組合せごとに、前記第1の画像と前記第2の画像との類似度を推定する際にそれぞれを対応付ける特徴点の位置に関する情報を含んでいる学習辞書を保持する保持手段と、前記第1の角度と前記第2の角度との組合せに応じて、前記第1の角度と前記第2の角度との組合せごとに保持されている前記学習辞書を選択する選択手段と、選択された前記学習辞書に含まれる特徴点の位置に対応する、前記第1の画像と前記第2の画像から抽出された特徴量に基づいて、前記第1の画像と前記第2の画像との前記物体または前記生物の類似度を推定する類似度推定手段とを備える。
【0022】
本発明の第2の側面の画像処理方法は、所定の形状と特徴を有する物体または生物を含んでいる第1の画像の前記物体または前記生物の向いている方向を示す第1の角度と、所定の形状と特徴を有する物体または生物を含んでいる第2の画像の前記物質または前記生物の向いている方向を示す第2の角度との組合せに応じて、前記第1の角度と前記第2の角度との組合せごとに保持されている学習辞書であって、前記第1の角度と前記第2の角度との組合せごとに、前記第1の画像と前記第2の画像との類似度を推定する際にそれぞれを対応付ける特徴点の位置に関する情報を含んでいる前記学習辞書を選択し、選択された前記学習辞書に含まれる特徴点の位置に対応する、前記第1の画像と前記第2の画像から抽出された特徴量に基づいて、前記第1の画像と前記第2の画像との前記物体または前記生物の類似度を推定するステップを含む。
【0023】
本発明の第2の側面のプログラムは、上述した本発明の第2の側面の画像処理方法に対応するプログラムである。
【0024】
本発明の第2の側面の画像処理装置および方法、並びにプログラムにおいては、所定の形状と特徴を有する物体または生物を含んでいる第1の画像の物体または生物の向いている方向を示す第1の角度と、所定の形状と特徴を有する物体または生物を含んでいる第2の画像の物質または生物の向いている方向を示す第2の角度との組合せごとに、第1の画像と第2の画像との類似度を推定する際にそれぞれを対応付ける特徴点の位置に関する情報を含んでいる学習辞書が保持され、第1の角度と第2の角度との組合せに応じて、第1の角度と第2の角度との組合せごとに保持されている学習辞書が選択され、選択された学習辞書に含まれる特徴点の位置に対応する、第1の画像と第2の画像から抽出された特徴量に基づいて、第1の画像と第2の画像との物体または生物の類似度が推定される。
【発明の効果】
【0025】
以上のように、本発明によれば、簡単に、画像の識別性能を向上させることができる。
【発明を実施するための最良の形態】
【0026】
以下、図面を参照しながら本発明の実施の形態について説明する。
【0027】
本発明は、入力された顔画像(以下、入力顔とも称する)の顔の向いている方向(角度)と、登録されている顔画像(以下、登録顔とも称する)の顔の向いている角度とが大幅に異なる場合、顔の各特徴点の画像パターンが大きく変化してしまい、それらの顔画像の識別処理を高い精度で行うことが困難になることに着目し、それらの角度の組合せに応じて、同一人物か別人物かの識別の際に用いられる特徴点や特徴量などの情報を、適切に選択する点に特徴がある。
【0028】
そこで、はじめに、図1を参照して、入力顔と登録顔の向いている方向の組合せのパターンをパラメータとして、顔識別処理に取り入れることで、かかる顔識別の性能を向上させることが可能となる原理について説明する。
【0029】
図1において、上段に示す入力顔は、左側を向いている顔(L)、正面を向いている顔(F)、右側を向いている顔(R)のそれぞれの画像を表しており、図1の例では、L,F,RのすべてがユーザAの顔画像、すなわち、同一人物の顔画像となる。
【0030】
また、入力顔の各顔画像と各種の点線で結ばれた登録顔は、上段の入力顔と同様に、左側を向いている顔(L)、正面を向いている顔(F)、右側を向いている顔(R)のそれぞれの画像を表している。図1の例では、L,Fは、ユーザB、ユーザCの顔画像、すなわち、ユーザAとは別人物の顔画像となり、RだけがユーザAの顔画像、すなわち、ユーザAと同一人物の顔画像となる。
【0031】
図1の下段には、登録顔の各顔画像と各種の点線で結ばれた顔識別の結果が示されている。この顔識別結果は、同じ種類の点線で結ばれた入力顔と登録顔の組合せによる識別結果であり、例えば、入力顔Lと登録顔Lとの組合せについて注目すると、その組合せは、左側を向いているユーザAの横顔と、左側を向いているユーザBの横顔となるので、識別結果としては、LLで示すように別人物となる。
【0032】
同様にして、例えば、入力顔Lと登録顔Fとの組合せの場合、LFは別人物となるが、入力顔Lと登録顔Rとの組合せの場合、左右の向いている方向は異なるものの、ともにユーザAの横顔となるので、LRは同一人物となる。
【0033】
また、例えば、入力顔Fと、登録顔L,F,Rとをそれぞれ組み合わせた場合、FL,FFは別人物となるが、FRは同一人物となる。さらに同様にして、例えば、入力顔Rと、登録顔L,F,Rとをそれぞれ組み合わせた場合、RL,RFは別人物となるが、RRは同一人物となる。
【0034】
このように、入力顔の向いている方向を、L,F,Rの3方向とし、登録顔の向いている方向を、L,F,Rの3方向とした場合、それらの角度の組合せは、LL,LF,LR,FL,FF,FR,RL,RF,RRの9通りとなる。したがって、これらの角度の組合せごとに、どの特徴点におけるどの特徴量を用いて顔識別処理(顔画像の類似度を推定する処理)を行うべきかを示す情報を分類して保持し、顔識別処理の際に顔画像の角度の組合せに応じて参照することで、入力顔と登録顔との顔の向いている方向が異なっていても高い精度で顔識別を行うことが可能となる。
【0035】
なお、図1の例では、9通りの角度の組合せのうち、LFとFL,LRとRL,FRとRFは、入力顔と登録顔の向いている方向が逆であるものの、組合せとしては同じであるので、それぞれ、LF,LR,FRのように、まとめて1つの組合せとしている。以下、説明を簡略にするために、本実施の形態においても、図1の例と同様に、それらの組合せをまとめて、LL,LF,LR,FF,FR,RRの6通りの組合せで説明するが、勿論、9通りの組合せとしてもよいし、さらに、顔の向いている方向を、左方向、正面方向、右方向の3段階ではなく、さらに角度を細かく分けることで、角度の組合せを増やしてもよい。角度の組合せを増やした場合には、その組合せの数を増やした分だけ、顔識別の精度をさらに向上させることが可能となる。
【0036】
また、図1を参照して説明した、角度の組合せごとに分類して保持される情報を、以下、角度組合せ別学習辞書と称して説明する。
【0037】
次に、上述した原理によって、かかる角度組合せ別学習辞書を用いて、入力顔と登録顔の識別処理を行う画像識別装置について説明する。
【0038】
図2は、本発明を適用した画像識別装置の一実施の形態の構成を示すブロック図である。
【0039】
画像識別装置1は、例えば、デジタルカメラ、パーソナルコンピュータ、または監視カメラなどの、画像の識別処理を行う機器である。
【0040】
図2に示すように、画像識別装置1は、画像取得部11、顔検出部12、顔特徴検出部13、顔角度推定部14、顔類似度推定部15、登録顔データベース16、および顔識別部17を含むようにして構成される。
【0041】
画像取得部11は、例えば、カメラなどを含む構成とされ、人を撮像する機能を有するか、または、外部に備えられたカメラ若しくは他の装置から撮像された人の画像を取得する。つまり、画像取得部11により取得される画像は、人の顔の部分が少なくとも含まれている画像である。画像取得部11により取得された画像は、顔検出部12に供給される。
【0042】
なお、本実施の形態においては、人の顔画像の識別処理を一例にして説明するが、例えば、動物や自動車など、その他の物体を識別する処理にも適用することが可能である。すなわち、本発明は、所定の形状と特徴を有する物体または生物を含んでいる画像の識別処理にも適用することが可能である。
【0043】
顔検出部12は、画像取得部11から供給される画像に対し、所定の画像解析処理を施すことで、人の顔の部分を抽出する。
【0044】
具体的には、図3に示すように、顔検出部12は、画像切り出し部21、顔判定部22、および顔学習データベース23を含むようにして構成される。顔学習データベース23には、所定の画像に含まれる顔の部分を抽出するために必要とされる統計的に学習された情報が格納されている。
【0045】
ここでは、まず、画像切り出し部21によって、画像取得部11からの画像における所定の領域の画像(例えば20×20ピクセルの画像)が順次切り出され、顔判定部22に供給される。続いて、顔判定部22は、顔学習データベース23に格納されている顔画像の抽出情報に基づいて、画像切り出し部21から順次入力される切り出された画像が顔画像であるか否かを判定することで、人の顔の部分(顔の位置と大きさ)を抽出し、抽出された人の顔の部分の画像(顔画像)を検出する。
【0046】
画像取得部11から供給される画像は、認識対象のユーザの顔を含む画像であるが、例えば、全身像が撮影されているような画像など、顔の画像だけでない場合もある。顔検出部12は、そのような画像を走査して、人の顔の領域を識別し、人の顔の部分に対応する画像を抽出する。このようにして検出された顔画像(入力顔)は、顔特徴検出部13、顔角度推定部14、および顔類似度推定部15に供給される。
【0047】
図2に戻り、顔特徴検出部13は、顔検出部12から供給された顔画像に対し、所定の画像解析処理を施すことで、例えば、目、鼻、口といった人の顔のなかでも特徴となる部分、すなわち、顔特徴部分を検出する。
【0048】
具体的には、図4に示すように、顔特徴検出部13は、画像切り出し部31、顔特徴判定部32、および顔特徴学習データベース33を含むようにして構成される。顔特徴学習データベース33には、所定の顔画像に含まれる顔特徴部分を抽出するために必要とされる統計的に学習された情報が格納されている。
【0049】
ここでは、まず、画像切り出し部31によって、顔検出部12から供給される顔画像において、例えば目、鼻、口などの顔特徴部分が含まれると想定される様々な大きさの画像(例えば20×20ピクセルの画像)が順次切り出され、顔特徴判定部32に供給される。続いて、顔特徴判定部32は、顔特徴学習データベース33に格納されている顔特徴部分の抽出情報に基づいて、画像切り出し部31から順次入力される顔画像から切り出された画像に顔特徴部分が含まれるか否かを判定し、顔特徴部分を抽出する。
【0050】
例えば、顔特徴判定部32は、走査された顔画像の全体(あるいは顔画像の一部分であってもよい)について、顔特徴部分のそれぞれの特徴の度合いを表すスコアを付与し、最もスコアの高い位置と、その大きさを顔特徴位置として、顔角度推定部14および顔類似度推定部15に供給する。
【0051】
なお、顔特徴検出部13で行われる特徴検出処理は、顔検出部12の顔検出処理と同様の手法を採用してもよいし、例えば、頬やおでこなど、上記の手法では特徴検出をするのが困難な特徴点、あるいは、顔全体の多数の特徴点の位置を角度によらず精度よく同定したい場合には、例えば、アダプティブサンプリング法と称される手法などを採用して特徴点を検出するようにしてもよい。
【0052】
図2に戻り、顔角度推定部14には、顔検出部12からの顔画像と、顔特徴検出部13からの顔特徴位置が供給される。顔角度推定部14は、顔特徴位置に基づいて、顔画像(入力顔)の顔の向いている方向を推定し、入力顔角度情報として、顔類似度推定部15に出力する。これにより、入力顔の向いている方向(角度)が求められる。
【0053】
なお、入力顔の角度の推定方法は、顔画像と顔特徴位置を用いて求める方法に限らず、顔画像のみから推定してもよい。その場合、入力顔角度情報は、顔検出部12によって検出してもよい。但し、より精度の高い入力顔角度情報を求めるには、顔画像と顔特徴位置の両方を用いるものとすると好適である。
【0054】
登録顔データベース16には、1または複数の登録顔が格納されており、各登録顔ごとに、登録顔の向いている方向を示す情報(以下、登録顔角度情報)と、登録顔の局所特徴量があらかじめ演算され格納されている。
【0055】
すなわち、画像識別装置1は、例えば、新たな登録顔を登録顔データベース16に登録する場合には、新たな登録顔に対し、所定の画像解析処理を施すことで、登録顔角度情報と局所特徴量とを取得し、当該登録顔と対応付けて格納する。登録顔を新たに登録する度に、かかる登録処理を実行することで、登録顔データベース16には、登録顔角度情報と局所特徴量に対応付けられた登録顔が登録される。なお、登録処理においては、登録顔角度情報と局所特徴量の他に、例えば、登録顔の人物の名前、その他の個人情報なども、登録顔に対応付けて登録することができる。
【0056】
顔類似度推定部15には、顔検出部12からの顔画像、顔特徴検出部13からの顔特徴位置、顔角度推定部14からの入力顔角度情報、並びに、登録顔データベース16からの登録顔角度情報および局所特徴量がそれぞれ供給される。
【0057】
顔類似度推定部15は、入力顔角度情報と登録顔角度情報との組み合わせに応じた角度組合せ別学習辞書(図5の角度組合せ別学習辞書44A)を選択し、選択した角度組合せ別学習辞書に基づいて、類似度の推定に用いる特徴点と特徴量を決定し、入力顔と登録顔との顔の類似度を推定する。
【0058】
ここで、図5を参照して、顔類似度推定部15の詳細な構成について説明する。
【0059】
図5に示すように、顔類似度推定部15は、顔画像アライメント部41、局所特徴量抽出部42、角度組合せ別学習辞書選択部43、角度組合せ別学習辞書保持部44、および顔類似度推定部45を含むようにして構成される。
【0060】
顔画像アライメント部41は、顔特徴検出部13から供給される顔特徴位置、および、顔検出部12から供給される顔画像を解析することで顔画像をアライメントし、アライメントされた顔画像を局所特徴量抽出部42に供給する。
【0061】
局所特徴量抽出部42は、顔画像アライメント部41から供給される顔画像における顔特徴位置近傍の画像に対し、局所特徴量の抽出を行う。
【0062】
ここで、局所特徴量の抽出方法としては、例えば、顔特徴位置近傍の画像をそのまま用いて算出する方法や、特徴位置に対してガボアフィルタ(Gabor Filter)やガルシアンデリバティブフィルタ(Gaussian Derivative Filter)などの畳み込み演算を用いて算出する方法を適用することができる。
【0063】
このようにして求められた入力顔の局所特徴量は、顔類似度推定部45に供給される。
【0064】
一方、角度組合せ別学習辞書選択部43には、顔角度推定部14からの入力顔角度情報と、登録顔データベース16からの登録顔角度情報が供給される。角度組合せ別学習辞書選択部43は、入力顔角度情報と登録顔角度情報との組合せに応じて、角度組合せ別学習辞書保持部44に保持されている角度組合せ別学習辞書44Aを選択し、顔類似度推定部45に供給する。
【0065】
角度組合せ別学習辞書保持部44は、顔画像の角度の組合せ別に、例えば、学習辞書LL,LF,LR,FF,FR,RRの6つ角度組合せ別学習辞書44Aを保持している。これは、上記の本発明の原理でも説明したように、例えば、顔の向きを、左方向(L)、正面方向(F)、および右方向(R)の3段階に分ける場合には、角度組合せ別学習辞書44Aの組合せは、LL,LF,LR,FF,FR,RRの6通り必要となるため、角度の組合せ別に6つの学習辞書を保持している。
【0066】
角度組合せ別学習辞書44Aには、顔画像の各角度の組合せ別に、顔画像の類似度の推定時に着目する特徴点の位置とその特徴量の種類などに関する情報の他に、例えば、入力顔と登録顔とが同一人物となるか否かを識別する際に基準となる所定の閾値(以下、人物識別閾値と称する)その他の角度の組合せ別に付与して有用となる情報が記述される。
【0067】
顔類似度推定部45には、角度組合せ別学習辞書選択部43からの角度の組合せに応じた角度組合せ別学習辞書44Aの他に、局所特徴量抽出部42からの入力顔における複数の局所特徴量と、登録顔データベース16からの登録顔における複数の局所特徴量とが入力される。
【0068】
顔類似度推定部45は、入力顔および登録顔のそれぞれにおける複数の局所特徴量のなかから、角度組合せ別学習辞書44Aに記述されている顔類似度を推定する際に着目すべき特徴点とその特徴量の種類に対応する、入力顔の局所特徴量と、登録顔の局所特徴量をそれぞれ取得する。そして、顔類似度推定部45は、取得した入力顔の局所特徴量および登録顔の局所特徴量を用いて、所定の演算を行うことで、入力顔と登録顔と顔の類似度を推定する。
【0069】
なお、この顔類似度は、例えば、正規化相関演算などの演算手法により求められる。
【0070】
顔類似度推定部45は、推定した顔類似度を、角度組合せ別学習辞書44Aに記述された人物識別閾値とともに、顔識別部17に供給する。
【0071】
顔識別部17は、顔類似度推定部45により推定された顔類似度を、人物識別閾値と比較し、顔類似度が人物識別閾値を超える場合、入力顔と登録顔との顔は同一人物であると識別する。一方、顔類似度が人物識別閾値以下となる場合、顔識別部17は、入力顔と登録顔との顔は別人物であると識別する。顔識別部17は、かかる識別結果を、後段のブロック(図示せず)に出力する。
【0072】
以上のようにして、画像識別装置1は構成される。
【0073】
次に、かかる画像識別装置1で行われる処理について説明する。
【0074】
はじめに、図6のフローチャートを参照して、図1の画像識別装置1により実行される顔識別処理について説明する。
【0075】
ステップS1において、画像取得部11は、例えば、カメラにより撮像された画像など、人の顔の部分を少なくとも含まれている画像を取得し、顔検出部12に供給する。
【0076】
ステップS2において、顔検出部12は、画像取得部11から供給される画像に対し、顔検出処理を行い、人の顔の部分含んでいる画像から、顔画像を検出する。顔検出部12は、検出した顔画像を、顔特徴検出部13、顔角度推定部14、および顔類似度推定部15に供給する。
【0077】
ステップS3において、顔特徴検出部13は、顔検出部12から供給される顔画像に対し、例えば目、鼻、口などの顔特徴部分を検出する顔特徴検出処理を行い、それにより得られる顔特徴部分ごとの顔特徴位置を、顔角度推定部14および顔類似度推定部15に供給する。
【0078】
ステップS4において、顔角度推定部14は、顔検出部12から供給される顔画像と、顔特徴検出部13から供給される顔特徴位置に基づいて、入力顔の向いている方向を推定し、入力顔角度情報として、顔類似度推定部15に供給する。
【0079】
ステップS5において、顔類似度推定部15は、顔角度推定部14から供給される入力顔角度情報と、登録顔データベース16に格納された登録顔角度情報との組み合わせに応じた角度組合せ別学習辞書44Aを選択し、選択された角度組合せ別学習辞書44Aに基づいて、顔類似度推定処理を行う。顔類似度推定部15は、顔類似度の推定結果を、顔識別部17に供給する。顔類似度推定処理の詳細は、図7のフローチャートを参照して後述する。
【0080】
ステップS6において、顔識別部17は、顔類似度推定部15から供給される顔類似度の推定結果に基づいて、入力顔と登録顔との顔は、同一人物であるか、あるは別人物であるかを識別して、後段のブロック(図示せず)に出力し、顔識別処理は終了する。
【0081】
次に、図7のフローチャートを参照して、図6のステップS5の処理で行われる、顔類似度推定処理の詳細について説明する。
【0082】
ステップS11において、顔画像アライメント部41は、顔特徴検出部13から供給される顔特徴位置、および、顔検出部12から供給される顔画像を解析することで、顔画像のアライメントを行う。顔画像アライメント部41は、アライメントされた顔画像を、局所特徴量抽出部42に供給する。
【0083】
ステップS12において、局所特徴量抽出部42は、顔画像アライメント部41から供給される顔画像における顔特徴位置近傍の画像に対し、例えば、顔特徴位置近傍の画像をそのまま用いるか、あるいはガボアフィルタやガルシアンデリバティブフィルタなどの畳み込み演算を用いることで、局所特徴量を抽出する。局所特徴量抽出部42は、抽出した入力顔の局所特徴量を、顔類似度推定部45に供給する。
【0084】
ステップS13において、角度組合せ別学習辞書選択部43は、顔角度推定部14から供給される入力顔角度情報と、登録顔データベース16に格納されている登録顔角度情報との組合せに応じて、角度組合せ別学習辞書保持部44に保持されている角度組合せ別学習辞書44Aのなかから適切な学習辞書を選択し、顔類似度推定部45に供給する。
【0085】
例えば、角度組合せ別学習辞書選択部43は、入力顔が左方向(L)を向いており、登録顔が右方向(R)を向いている場合、角度組合せ別学習辞書44Aの学習辞書LL,LF,LR,FF,FR,RRのなかから、学習辞書LRを選択し、顔類似度推定部45に供給する。
【0086】
顔類似度推定部45は、角度組合せ別学習辞書選択部43により選択された角度組合せ別学習辞書44Aに記述されている顔類似度の推定時に着目すべき特徴点とその特徴量の種類に対応する、入力顔の局所特徴量と、登録顔の局所特徴量を取得し、それらの局所特徴量を用いて、例えば正規化相関演算により、入力顔と登録顔との顔類似度を推定する。
【0087】
例えば、入力顔が左方向(L)、登録顔が右方向(R)である場合には、学習辞書LRが選択されるので、顔類似度推定部45は、その学習辞書LRに記述してある、左方向(L)を向いている顔画像と、右方向(R)を向いている顔画像との類似度を推定する際に、最も適切な特徴点に対応する位置での入力顔の局所特徴量と登録顔の局所特徴量を取得する。つまり、顔類似度推定部45は、局所特徴量抽出部42から供給される入力顔の複数の局所特徴量と、登録顔データベース16に格納された登録顔の複数の局所特徴量のなかから、顔画像の角度組合せに応じて選択される角度組合せ別学習辞書44Aに記述された特徴点の位置に対応する、入力顔の局所特徴量と登録顔の局所特徴量を取得する。
【0088】
そして、顔類似度推定部45は、それにより得られた入力顔と登録顔の向いている方向の組合せでの最適な局所特徴量を用いて、顔類似度を推定する。
【0089】
このように、入力顔と登録顔との角度の組合せごとに、学習辞書LL乃至RRなどの複数の学習辞書を用意しておくことで、任意方向を向いている顔の識別を行う場合であっても、複数の学習辞書のなかから、角度の組合せに応じた適切な学習辞書を選択できるので、単一の学習辞書のみを用いる場合と比べて、精度のよい識別結果を得ることが可能となる。
【0090】
すなわち、一般的に顔の各特徴点の画像パターンは、顔の向きによる変化のほうが、個人の差よりもはるかに大きく変化するため、全ての方向の顔角度の画像パターンから識別可能な特徴点や特徴量(角度不変特徴量)を抽出することは、非常に困難であるため、本実施の形態においては、入力顔角度範囲と登録顔角度範囲とが限定されたものとなるように、角度別に複数の学習辞書をあらかじめ用意して、入力顔の方向と登録顔の方向との組合せにより、類似度推定に用いる学習辞書を切り替えているのである。
【0091】
このことは、例えば、上記の先願のような、ブースティング(Boosting)と称される、統計的に識別に最適な特徴点、特徴次元を選択する手法に適用することで、より高い精度の識別が可能となる。
【0092】
また、本実施の形態においては、顔角度の組合せを限定して、統計的に識別可能な特徴点、特徴量を選択することができるので、角度不変特徴量を獲得できる可能性が高くなり、結果として、顔識別の性能を向上させることが可能となる。
【0093】
そして、画像識別装置1においては、従来から行われている正面方向のみの顔識別処理と比較して、顔角度の組合せによる学習辞書を切り替える処理が追加されているだけであるため、従来の顔識別処理とほぼ同等の演算量で、自由視点顔識別処理を実行することが可能となる。つまり、簡単に、顔画像の識別性能を向上させることができる。
【0094】
なお、1つの入力顔に対し、複数の登録顔が登録されている場合、例えば、顔類似度推定部45は、全ての登録顔について、入力顔との顔類似度を求め、その後、それらの顔類似度に応じたスコアを順次出力する。すると、顔識別部17には、登録顔データベース16に登録されている登録顔の数だけスコアが入力されるので、顔識別部17は、顔類似度推定部15から入力されるスコアのうち、最も高いスコアを獲得した登録顔を、入力顔と類似している登録顔として識別すればよい。
【0095】
以上のようにして、顔類似度推定処理は行われる。
【0096】
ところで、角度組合せ別学習辞書44Aであるが、例えば、特定の顔の角度の組合せとなる、同一人物あるいは別人物の顔画像対を複数用意し、それらの顔画像対に対し、所定の学習処理を施すことにより、生成することができる。
【0097】
そこで、次に、角度組合せ別学習辞書44Aを生成する、辞書学習装置51について説明する。
【0098】
図8は、かかる辞書学習装置51の構成例を示す図である。
【0099】
図8で示すように、辞書学習装置51は、図5の角度組合せ別学習辞書保持部44に対応する角度組合せ別学習辞書44Aを保持する角度組合せ別学習辞書保持部44の他に、画像処理部61、顔画像アライメント部62、局所特徴量抽出部63、類似度ベクトル生成部64、および学習部65を含むようにして構成される。
【0100】
画像処理部61は、例えば、特定の角度の組合せとなる顔画像対を取得し、取得した顔画像対に対し、所定の画像解析処理を施し、顔画像と顔特徴位置を検出する。顔画像と顔特徴位置の検出処理は、上述した、図2の顔検出部12および顔特徴検出部13で行われる検出処理と基本的に同様であるので、その説明は省略する。
【0101】
顔画像対ごとに検出される顔画像および顔特徴位置は、顔画像アライメント部62に供給される。
【0102】
顔画像アライメント部62は、画像処理部61から供給される顔画像および顔特徴位置を解析することでアライメントを行い、アライメントされた顔画像対を、局所特徴量抽出部63に供給する。
【0103】
局所特徴量抽出部63は、顔画像アライメント部62から供給される顔画像対における顔特徴位置近傍の画像に対し、例えば、顔特徴位置近傍の画像をそのまま用いるか、あるいはガボアフィルタやガルシアンデリバティブフィルタなどの畳み込み演算を用いることで、それぞれの局所特徴量を抽出する。局所特徴量抽出部63は、抽出した顔画像対の局所特徴量を、類似度ベクトル生成部64に供給する。
【0104】
類似度ベクトル生成部64は、局所特徴量抽出部63から供給される顔画像対のそれぞれの局所特徴量の相関を求めることで、類似度ベクトルを生成する。類似度ベクトル生成部64は、生成した類似度ベクトルを学習部65に供給する。
【0105】
学習部65は、類似度ベクトル生成部64から供給される類似度ベクトルのうち、どの部分を用いればよいかを、いわゆるブースティングにより学習する。そして、学習部65は、学習により得られる角度組合せ別の最適な特徴点の位置などの情報を、角度組合せ別学習辞書44Aとして生成し、角度組合せ別学習辞書保持部44に登録する。
【0106】
次に、辞書学習装置51で行われる処理について説明する。
【0107】
図9のフローチャートは、図8の辞書学習装置51により実行される辞書学習処理について説明する。
【0108】
ステップS31において、画像処理部61は、特定の角度の組合せとなる顔画像対に対し、所定の画像解析処理を施して、顔画像対のそれぞれの顔画像と顔特徴位置を検出し、顔画像アライメント部62に供給する。
【0109】
なお、高い精度の角度組合せ別学習辞書44Aを生成するためには、サンプル数を増やす必要があるので、特定の顔の角度の組合せとなる、同一人物あるいは別人物の顔画像対をできるだけ多く用意すると好適である。
【0110】
ステップS32において、顔画像アライメント部62は、画像処理部61から供給される顔画像対のそれぞれの顔画像と顔特徴位置を解析することで、アライメントを行い、アライメントされた顔画像対を、局所特徴量抽出部63に供給する。
【0111】
ステップS33において、局所特徴量抽出部63は、顔画像アライメント部62から供給される顔画像対における顔特徴位置近傍の画像に対し、例えば、顔特徴位置近傍の画像をそのまま用いるなどして、それぞれの局所特徴量を抽出する。局所特徴量抽出部63は、抽出した顔画像対の局所特徴量を、類似度ベクトル生成部64に供給する。
【0112】
ステップS34において、類似度ベクトル生成部64は、局所特徴量抽出部63から供給される顔画像対のそれぞれの局所特徴量の相関を求めることで、類似度ベクトルを生成し、学習部35に供給する。
【0113】
ステップS35において、学習部35は、類似度ベクトル生成部64から供給される類似度ベクトルに基づいて、ブースティングにより学習を行う。
【0114】
ステップS36において、学習部35は、学習により得られる角度組合せ別の最適な特徴点の位置などの情報を、角度組合せ別学習辞書44Aとして生成し、角度組合せ別学習辞書保持部44に登録して、辞書学習処理は終了する。
【0115】
以上のようにして、角度組合せ別学習辞書保持部44は生成される。
【0116】
なお、本実施の形態では、画像識別装置1と、辞書学習装置51とは別の装置であるとして説明したが、それらの装置は、それぞれの有する機能を1つの装置で実現可能にすることで、1つの装置から構成されるようにしてもよい。その場合、辞書学習装置51を、辞書学習部として、画像識別装置1のなかに含めることで、顔画像検出処理などの顔識別処理と学習処理の両方で行われる処理については、同じブロックで処理を実行することが可能となる。
【0117】
以上のように、本発明によれば、顔角度の組合せを限定して、統計的に識別可能な特徴点、特徴量を選択することができるので、角度不変特徴量を獲得できる可能性が高くなり、結果として、顔識別の性能を向上させることが可能となる。その結果、角度が異なる顔同士での識別性能を向上させることができる。
【0118】
また、本発明によれば、従来より行われていた正面方向のみの顔識別処理と比較して、顔角度の組合せによる学習辞書を切り替える処理が追加されているだけであるため、従来の顔識別処理とほぼ同等の演算量で、より高い精度の顔識別処理を実行することが可能となる。その結果、簡単に、顔画像の識別性能を向上させることができる。
【0119】
上述した一連の処理は、ハードウェアにより実行させることもできるし、ソフトウェアにより実行させることもできる。一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、プログラム記録媒体からインストールされる。
【0120】
図10は、上述した一連の処理をプログラムにより実行するパーソナルコンピュータの構成の例を示すブロック図である。CPU(Central Processing Unit)111は、ROM(Read Only Memory)112、または記録部118に記録されているプログラムに従って各種の処理を実行する。RAM(Random Access Memory)113には、CPU111が実行するプログラムやデータなどが適宜記憶される。これらのCPU111、ROM112、およびRAM113は、バス114により相互に接続されている。
【0121】
CPU111にはまた、バス114を介して入出力インターフェース115が接続されている。入出力インターフェース115には、マイクロホンなどよりなる入力部116、ディスプレイ、スピーカなどよりなる出力部117が接続されている。CPU111は、入力部116から入力される指令に対応して各種の処理を実行する。そして、CPU111は、処理の結果を出力部117に出力する。
【0122】
入出力インターフェース115に接続されている記録部118は、例えばハードディスクからなり、CPU111が実行するプログラムや各種のデータを記録する。通信部119は、インターネットやローカルエリアネットワークなどのネットワークを介して外部の装置と通信する。
【0123】
また、通信部119を介してプログラムを取得し、記録部118に記録してもよい。
【0124】
入出力インターフェース115に接続されているドライブ120は、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア121が装着されたとき、それらを駆動し、そこに記録されているプログラムやデータなどを取得する。取得されたプログラムやデータは、必要に応じて記録部118に転送され、記録される。
【0125】
コンピュータにインストールされ、コンピュータによって実行可能な状態とされるプログラムを格納するプログラム記録媒体は、図10に示すように、磁気ディスク(フレキシブルディスクを含む)、光ディスク(CD-ROM(Compact Disc-Read Only Memory),DVD(Digital Versatile Disc)を含む)、光磁気ディスク、もしくは半導体メモリなどよりなるパッケージメディアであるリムーバブルメディア121、または、プログラムが一時的もしくは永続的に格納されるROM112や、記録部118を構成するハードディスクなどにより構成される。プログラム記録媒体へのプログラムの格納は、必要に応じてルータ、モデムなどのインターフェースである通信部119を介して、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の通信媒体を利用して行われる。
【0126】
なお、本明細書において、記録媒体に格納されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
【0127】
また、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。
【図面の簡単な説明】
【0128】
【図1】入力顔と登録顔の角度組合せついて説明する図である。
【図2】本発明を適用した画像識別装置の一実施の形態の構成を示す図である。
【図3】顔検出部の詳細な構成例を示す図である。
【図4】顔特徴検出部の詳細な構成例を示す図である。
【図5】顔類似度推定部の詳細な構成例を示す図である。
【図6】顔識別処理について説明するフローチャートである。
【図7】顔類似度推定処理について説明するフローチャートである。
【図8】辞書学習装置の構成例を示す図である。
【図9】辞書学習処理について説明するフローチャートである。
【図10】本発明が適用される画像処理をソフトウェアで実行するコンピュータの構成例を示す図である。
【符号の説明】
【0129】
1 画像識別装置, 11 画像取得部, 12 顔検出部, 13 顔特徴検出部, 14 顔角度推定部, 15 顔類似度推定部, 16 登録顔データベース, 17 顔識別部, 21 画像切り出し部, 22 顔判定部, 23 顔学習データベース, 31 画像切り出し部, 32 顔特徴判定部, 33 顔特徴学習データベース, 41 顔画像アライメント部, 42 局所特徴量抽出部, 43 角度組合せ別学習辞書選択部, 44 角度組合せ別学習辞書保持部, 44A 角度組合せ別学習辞書, 45 顔類似度推定部, 51 辞書学習装置, 61 画像処理部, 62 顔画像アライメント部, 63 局所特徴量抽出部, 64 類似度ベクトル生成部, 65 学習部, LL乃至RR 学習辞書
【技術分野】
【0001】
本発明は、画像処理装置および方法、並びにプログラムに関し、特に、簡単に、画像の識別性能を向上させることができるようにした画像処理装置および方法、並びにプログラムに関する。
【背景技術】
【0002】
従来より、顔画像が同一人物のものであるか否かを識別するための各種の技術が提案されている。
【0003】
本出願人は、2つの特徴量の相関を用いて認識処理を行う場合の認識の精度を向上させる画像処理装置を発明し、特願2006−332302号として既に特許出願(以下、先願と称する)している。
【0004】
かかる先願においては、認識処理の精度を向上させることはできるものの、正面方向あるいは特定の方向を向いている顔しか精度よく識別することができない。これは、顔の向いている方向が変化すると、顔特徴の画像パターンが大幅に変化してしまうために、同一人物間の特徴量の類似性がなくなってしまうためである。
【0005】
また、任意の方向を向いている顔を識別する手法としては、例えば、特許文献1が知られている。
【0006】
この特許文献1においては、人の顔の標準的な立体形状モデルを用いることで、任意の方向を向いている顔を識別している。この手法では、異なる方向で撮像された2枚の顔画像を比較するため、一方の顔画像を顔立体形状モデルに貼り付け、他方の顔画像と同じ方向に相当する顔画像を合成することにより、異なる方向の顔識別を実現している。
【0007】
また、Volker Blanzらにより発表されている論文、“Face Recognition Based on Fitting a 3D Morphable Model”では、標準3次元顔変形モデルを様々なパラメータを基に変形させて合成した顔画像から、入力顔画像に最も近似するパラメータを用いて顔識別を行う手法が提案されている。
【特許文献1】特開2000−322577号公報
【発明の開示】
【発明が解決しようとする課題】
【0008】
しかしながら、上記の特許文献1および論文を含む従来の技術においては、標準的な顔の立体形状モデルからCG(Computer Graphics)の手法を用いて、異なる方向の顔を合成する手法をベースとしているが、このような立体形状モデルを求めるためには、高精度な立体計測装置が必要となるため、一般的、特に家庭用の製品に搭載する際にはあらかじめ取得したデータから生成されたモデルしか使用することができない。
【0009】
このため、モデルに合わないような顔形状の人物に合わせてモデルを更新することや、家族などの限定された少人数の識別に特化したモデルに変更することは極めて困難となる。
【0010】
また、顔画像を標準的な顔立体形状モデルに当てはめて回転することにより合成した顔画像は、モデルと実際の顔形状との相違が大きい場合には正しく合成できないために識別性能が低下することが多く、3次元顔変形モデルをパラメータに基づき変形させて近似画像を求める手法は、計算に多くの時間を要するという問題がある。
【0011】
本発明はこのような状況に鑑みてなされたものであり、簡単に、画像の識別性能を向上させることができるようにするものである。
【課題を解決するための手段】
【0012】
本発明の第1の側面の画像処理装置は、人の顔を含んでいる第1の顔画像の顔の向いている方向を示す第1の角度と、人の顔を含んでいる第2の顔画像の顔の向いている方向を示す第2の角度との組合せごとに、前記第1の顔画像と前記第2の顔画像との類似度を推定する際にそれぞれを対応付ける特徴点の位置に関する情報を含んでいる学習辞書を保持する保持手段と、前記第1の角度と前記第2の角度との組合せに応じて、前記第1の角度と前記第2の角度との組合せごとに保持されている前記学習辞書を選択する選択手段と、選択された前記学習辞書に含まれる特徴点の位置に対応する、前記第1の顔画像と前記第2の顔画像から抽出された特徴量に基づいて、前記第1の顔画像と前記第2の顔画像との顔の類似度を推定する類似度推定手段とを備える。
【0013】
推定した前記類似度に基づいて、前記第1の顔画像と前記第2の顔画像とを識別する識別手段をさらに備える。
【0014】
前記第2の顔画像は、抽出された特徴量と、前記第2の角度とに対応付けられて、あらかじめ登録されている。
【0015】
人を含んでいる画像から前記第1の顔画像の部分を検出する顔検出手段と、検出された前記第1の顔画像から前記顔の特徴となる顔特徴位置を検出する顔特徴検出手段と、検出された前記第1の顔画像および前記顔特徴位置に基づいて、前記第1の角度を推定する顔角度推定手段と、検出された前記第1の顔画像における前記顔特徴位置近傍の画像から特徴量を抽出する抽出手段とをさらに備え、前記選択手段は、推定された前記第1の角度と、登録されている前記第2の角度との組合せに応じて、前記学習辞書を選択し、前記類似度推定手段は、選択された前記学習辞書に含まれる特徴点の位置に対応する、前記第1の顔画像から抽出した特徴量と、登録されている前記第2の顔画像の特徴量に基づいて、前記類似度を推定する。
【0016】
前記保持手段は、前記第1の角度の示す向きを、左方向、正面方向、および右方向の3段階とし、前記第2の角度を示す向きを、左方向、正面方向、および右方向の3段階とした場合、それらの方向のすべての組合せについての前記学習辞書を保持する。
【0017】
前記学習辞書には、前記第1の顔画像と前記第2の顔画像とを識別する際の基準となる所定の閾値が含まれており、前記識別手段は、推定された前記類似度と前記閾値とを比較した結果に基づいて、前記第1の顔画像と前記第2の顔画像との顔が、同一人物であるか、あるいは別人物であるか否かを識別する。
【0018】
本発明の第1の側面の画像処理方法は、人の顔を含んでいる第1の顔画像の顔の向いている方向を示す第1の角度と、人の顔を含んでいる第2の顔画像の顔の向いている方向を示す第2の角度との組合せに応じて、前記第1の角度と前記第2の角度との組合せごとに保持されている学習辞書であって、前記第1の角度と前記第2の角度との組合せごとに、前記第1の顔画像と前記第2の顔画像との類似度を推定する際にそれぞれを対応付ける特徴点の位置に関する情報を含んでいる前記学習辞書を選択し、選択された前記学習辞書に含まれる特徴点の位置に対応する、前記第1の顔画像と前記第2の顔画像から抽出された特徴量に基づいて、前記第1の顔画像と前記第2の顔画像との顔の類似度を推定するステップを含む。
【0019】
本発明の第1の側面のプログラムは、上述した本発明の第1の側面の画像処理方法に対応するプログラムである。
【0020】
本発明の第1の側面の画像処理装置および方法、並びにプログラムにおいては、人の顔を含んでいる第1の顔画像の顔の向いている方向を示す第1の角度と、人の顔を含んでいる第2の顔画像の顔の向いている方向を示す第2の角度との組合せごとに、第1の顔画像と第2の顔画像との類似度を推定する際にそれぞれを対応付ける特徴点の位置に関する情報を含んでいる学習辞書が保持され、第1の角度と第2の角度との組合せに応じて、第1の角度と第2の角度との組合せごとに保持されている学習辞書が選択され、選択された学習辞書に含まれる特徴点の位置に対応する、第1の顔画像と第2の顔画像から抽出された特徴量に基づいて、第1の顔画像と第2の顔画像との顔の類似度が推定される。
【0021】
本発明の第2の側面の画像処理装置は、所定の形状と特徴を有する物体または生物を含んでいる第1の画像の前記物体または前記生物の向いている方向を示す第1の角度と、所定の形状と特徴を有する物体または生物を含んでいる第2の画像の前記物質または前記生物の向いている方向を示す第2の角度との組合せごとに、前記第1の画像と前記第2の画像との類似度を推定する際にそれぞれを対応付ける特徴点の位置に関する情報を含んでいる学習辞書を保持する保持手段と、前記第1の角度と前記第2の角度との組合せに応じて、前記第1の角度と前記第2の角度との組合せごとに保持されている前記学習辞書を選択する選択手段と、選択された前記学習辞書に含まれる特徴点の位置に対応する、前記第1の画像と前記第2の画像から抽出された特徴量に基づいて、前記第1の画像と前記第2の画像との前記物体または前記生物の類似度を推定する類似度推定手段とを備える。
【0022】
本発明の第2の側面の画像処理方法は、所定の形状と特徴を有する物体または生物を含んでいる第1の画像の前記物体または前記生物の向いている方向を示す第1の角度と、所定の形状と特徴を有する物体または生物を含んでいる第2の画像の前記物質または前記生物の向いている方向を示す第2の角度との組合せに応じて、前記第1の角度と前記第2の角度との組合せごとに保持されている学習辞書であって、前記第1の角度と前記第2の角度との組合せごとに、前記第1の画像と前記第2の画像との類似度を推定する際にそれぞれを対応付ける特徴点の位置に関する情報を含んでいる前記学習辞書を選択し、選択された前記学習辞書に含まれる特徴点の位置に対応する、前記第1の画像と前記第2の画像から抽出された特徴量に基づいて、前記第1の画像と前記第2の画像との前記物体または前記生物の類似度を推定するステップを含む。
【0023】
本発明の第2の側面のプログラムは、上述した本発明の第2の側面の画像処理方法に対応するプログラムである。
【0024】
本発明の第2の側面の画像処理装置および方法、並びにプログラムにおいては、所定の形状と特徴を有する物体または生物を含んでいる第1の画像の物体または生物の向いている方向を示す第1の角度と、所定の形状と特徴を有する物体または生物を含んでいる第2の画像の物質または生物の向いている方向を示す第2の角度との組合せごとに、第1の画像と第2の画像との類似度を推定する際にそれぞれを対応付ける特徴点の位置に関する情報を含んでいる学習辞書が保持され、第1の角度と第2の角度との組合せに応じて、第1の角度と第2の角度との組合せごとに保持されている学習辞書が選択され、選択された学習辞書に含まれる特徴点の位置に対応する、第1の画像と第2の画像から抽出された特徴量に基づいて、第1の画像と第2の画像との物体または生物の類似度が推定される。
【発明の効果】
【0025】
以上のように、本発明によれば、簡単に、画像の識別性能を向上させることができる。
【発明を実施するための最良の形態】
【0026】
以下、図面を参照しながら本発明の実施の形態について説明する。
【0027】
本発明は、入力された顔画像(以下、入力顔とも称する)の顔の向いている方向(角度)と、登録されている顔画像(以下、登録顔とも称する)の顔の向いている角度とが大幅に異なる場合、顔の各特徴点の画像パターンが大きく変化してしまい、それらの顔画像の識別処理を高い精度で行うことが困難になることに着目し、それらの角度の組合せに応じて、同一人物か別人物かの識別の際に用いられる特徴点や特徴量などの情報を、適切に選択する点に特徴がある。
【0028】
そこで、はじめに、図1を参照して、入力顔と登録顔の向いている方向の組合せのパターンをパラメータとして、顔識別処理に取り入れることで、かかる顔識別の性能を向上させることが可能となる原理について説明する。
【0029】
図1において、上段に示す入力顔は、左側を向いている顔(L)、正面を向いている顔(F)、右側を向いている顔(R)のそれぞれの画像を表しており、図1の例では、L,F,RのすべてがユーザAの顔画像、すなわち、同一人物の顔画像となる。
【0030】
また、入力顔の各顔画像と各種の点線で結ばれた登録顔は、上段の入力顔と同様に、左側を向いている顔(L)、正面を向いている顔(F)、右側を向いている顔(R)のそれぞれの画像を表している。図1の例では、L,Fは、ユーザB、ユーザCの顔画像、すなわち、ユーザAとは別人物の顔画像となり、RだけがユーザAの顔画像、すなわち、ユーザAと同一人物の顔画像となる。
【0031】
図1の下段には、登録顔の各顔画像と各種の点線で結ばれた顔識別の結果が示されている。この顔識別結果は、同じ種類の点線で結ばれた入力顔と登録顔の組合せによる識別結果であり、例えば、入力顔Lと登録顔Lとの組合せについて注目すると、その組合せは、左側を向いているユーザAの横顔と、左側を向いているユーザBの横顔となるので、識別結果としては、LLで示すように別人物となる。
【0032】
同様にして、例えば、入力顔Lと登録顔Fとの組合せの場合、LFは別人物となるが、入力顔Lと登録顔Rとの組合せの場合、左右の向いている方向は異なるものの、ともにユーザAの横顔となるので、LRは同一人物となる。
【0033】
また、例えば、入力顔Fと、登録顔L,F,Rとをそれぞれ組み合わせた場合、FL,FFは別人物となるが、FRは同一人物となる。さらに同様にして、例えば、入力顔Rと、登録顔L,F,Rとをそれぞれ組み合わせた場合、RL,RFは別人物となるが、RRは同一人物となる。
【0034】
このように、入力顔の向いている方向を、L,F,Rの3方向とし、登録顔の向いている方向を、L,F,Rの3方向とした場合、それらの角度の組合せは、LL,LF,LR,FL,FF,FR,RL,RF,RRの9通りとなる。したがって、これらの角度の組合せごとに、どの特徴点におけるどの特徴量を用いて顔識別処理(顔画像の類似度を推定する処理)を行うべきかを示す情報を分類して保持し、顔識別処理の際に顔画像の角度の組合せに応じて参照することで、入力顔と登録顔との顔の向いている方向が異なっていても高い精度で顔識別を行うことが可能となる。
【0035】
なお、図1の例では、9通りの角度の組合せのうち、LFとFL,LRとRL,FRとRFは、入力顔と登録顔の向いている方向が逆であるものの、組合せとしては同じであるので、それぞれ、LF,LR,FRのように、まとめて1つの組合せとしている。以下、説明を簡略にするために、本実施の形態においても、図1の例と同様に、それらの組合せをまとめて、LL,LF,LR,FF,FR,RRの6通りの組合せで説明するが、勿論、9通りの組合せとしてもよいし、さらに、顔の向いている方向を、左方向、正面方向、右方向の3段階ではなく、さらに角度を細かく分けることで、角度の組合せを増やしてもよい。角度の組合せを増やした場合には、その組合せの数を増やした分だけ、顔識別の精度をさらに向上させることが可能となる。
【0036】
また、図1を参照して説明した、角度の組合せごとに分類して保持される情報を、以下、角度組合せ別学習辞書と称して説明する。
【0037】
次に、上述した原理によって、かかる角度組合せ別学習辞書を用いて、入力顔と登録顔の識別処理を行う画像識別装置について説明する。
【0038】
図2は、本発明を適用した画像識別装置の一実施の形態の構成を示すブロック図である。
【0039】
画像識別装置1は、例えば、デジタルカメラ、パーソナルコンピュータ、または監視カメラなどの、画像の識別処理を行う機器である。
【0040】
図2に示すように、画像識別装置1は、画像取得部11、顔検出部12、顔特徴検出部13、顔角度推定部14、顔類似度推定部15、登録顔データベース16、および顔識別部17を含むようにして構成される。
【0041】
画像取得部11は、例えば、カメラなどを含む構成とされ、人を撮像する機能を有するか、または、外部に備えられたカメラ若しくは他の装置から撮像された人の画像を取得する。つまり、画像取得部11により取得される画像は、人の顔の部分が少なくとも含まれている画像である。画像取得部11により取得された画像は、顔検出部12に供給される。
【0042】
なお、本実施の形態においては、人の顔画像の識別処理を一例にして説明するが、例えば、動物や自動車など、その他の物体を識別する処理にも適用することが可能である。すなわち、本発明は、所定の形状と特徴を有する物体または生物を含んでいる画像の識別処理にも適用することが可能である。
【0043】
顔検出部12は、画像取得部11から供給される画像に対し、所定の画像解析処理を施すことで、人の顔の部分を抽出する。
【0044】
具体的には、図3に示すように、顔検出部12は、画像切り出し部21、顔判定部22、および顔学習データベース23を含むようにして構成される。顔学習データベース23には、所定の画像に含まれる顔の部分を抽出するために必要とされる統計的に学習された情報が格納されている。
【0045】
ここでは、まず、画像切り出し部21によって、画像取得部11からの画像における所定の領域の画像(例えば20×20ピクセルの画像)が順次切り出され、顔判定部22に供給される。続いて、顔判定部22は、顔学習データベース23に格納されている顔画像の抽出情報に基づいて、画像切り出し部21から順次入力される切り出された画像が顔画像であるか否かを判定することで、人の顔の部分(顔の位置と大きさ)を抽出し、抽出された人の顔の部分の画像(顔画像)を検出する。
【0046】
画像取得部11から供給される画像は、認識対象のユーザの顔を含む画像であるが、例えば、全身像が撮影されているような画像など、顔の画像だけでない場合もある。顔検出部12は、そのような画像を走査して、人の顔の領域を識別し、人の顔の部分に対応する画像を抽出する。このようにして検出された顔画像(入力顔)は、顔特徴検出部13、顔角度推定部14、および顔類似度推定部15に供給される。
【0047】
図2に戻り、顔特徴検出部13は、顔検出部12から供給された顔画像に対し、所定の画像解析処理を施すことで、例えば、目、鼻、口といった人の顔のなかでも特徴となる部分、すなわち、顔特徴部分を検出する。
【0048】
具体的には、図4に示すように、顔特徴検出部13は、画像切り出し部31、顔特徴判定部32、および顔特徴学習データベース33を含むようにして構成される。顔特徴学習データベース33には、所定の顔画像に含まれる顔特徴部分を抽出するために必要とされる統計的に学習された情報が格納されている。
【0049】
ここでは、まず、画像切り出し部31によって、顔検出部12から供給される顔画像において、例えば目、鼻、口などの顔特徴部分が含まれると想定される様々な大きさの画像(例えば20×20ピクセルの画像)が順次切り出され、顔特徴判定部32に供給される。続いて、顔特徴判定部32は、顔特徴学習データベース33に格納されている顔特徴部分の抽出情報に基づいて、画像切り出し部31から順次入力される顔画像から切り出された画像に顔特徴部分が含まれるか否かを判定し、顔特徴部分を抽出する。
【0050】
例えば、顔特徴判定部32は、走査された顔画像の全体(あるいは顔画像の一部分であってもよい)について、顔特徴部分のそれぞれの特徴の度合いを表すスコアを付与し、最もスコアの高い位置と、その大きさを顔特徴位置として、顔角度推定部14および顔類似度推定部15に供給する。
【0051】
なお、顔特徴検出部13で行われる特徴検出処理は、顔検出部12の顔検出処理と同様の手法を採用してもよいし、例えば、頬やおでこなど、上記の手法では特徴検出をするのが困難な特徴点、あるいは、顔全体の多数の特徴点の位置を角度によらず精度よく同定したい場合には、例えば、アダプティブサンプリング法と称される手法などを採用して特徴点を検出するようにしてもよい。
【0052】
図2に戻り、顔角度推定部14には、顔検出部12からの顔画像と、顔特徴検出部13からの顔特徴位置が供給される。顔角度推定部14は、顔特徴位置に基づいて、顔画像(入力顔)の顔の向いている方向を推定し、入力顔角度情報として、顔類似度推定部15に出力する。これにより、入力顔の向いている方向(角度)が求められる。
【0053】
なお、入力顔の角度の推定方法は、顔画像と顔特徴位置を用いて求める方法に限らず、顔画像のみから推定してもよい。その場合、入力顔角度情報は、顔検出部12によって検出してもよい。但し、より精度の高い入力顔角度情報を求めるには、顔画像と顔特徴位置の両方を用いるものとすると好適である。
【0054】
登録顔データベース16には、1または複数の登録顔が格納されており、各登録顔ごとに、登録顔の向いている方向を示す情報(以下、登録顔角度情報)と、登録顔の局所特徴量があらかじめ演算され格納されている。
【0055】
すなわち、画像識別装置1は、例えば、新たな登録顔を登録顔データベース16に登録する場合には、新たな登録顔に対し、所定の画像解析処理を施すことで、登録顔角度情報と局所特徴量とを取得し、当該登録顔と対応付けて格納する。登録顔を新たに登録する度に、かかる登録処理を実行することで、登録顔データベース16には、登録顔角度情報と局所特徴量に対応付けられた登録顔が登録される。なお、登録処理においては、登録顔角度情報と局所特徴量の他に、例えば、登録顔の人物の名前、その他の個人情報なども、登録顔に対応付けて登録することができる。
【0056】
顔類似度推定部15には、顔検出部12からの顔画像、顔特徴検出部13からの顔特徴位置、顔角度推定部14からの入力顔角度情報、並びに、登録顔データベース16からの登録顔角度情報および局所特徴量がそれぞれ供給される。
【0057】
顔類似度推定部15は、入力顔角度情報と登録顔角度情報との組み合わせに応じた角度組合せ別学習辞書(図5の角度組合せ別学習辞書44A)を選択し、選択した角度組合せ別学習辞書に基づいて、類似度の推定に用いる特徴点と特徴量を決定し、入力顔と登録顔との顔の類似度を推定する。
【0058】
ここで、図5を参照して、顔類似度推定部15の詳細な構成について説明する。
【0059】
図5に示すように、顔類似度推定部15は、顔画像アライメント部41、局所特徴量抽出部42、角度組合せ別学習辞書選択部43、角度組合せ別学習辞書保持部44、および顔類似度推定部45を含むようにして構成される。
【0060】
顔画像アライメント部41は、顔特徴検出部13から供給される顔特徴位置、および、顔検出部12から供給される顔画像を解析することで顔画像をアライメントし、アライメントされた顔画像を局所特徴量抽出部42に供給する。
【0061】
局所特徴量抽出部42は、顔画像アライメント部41から供給される顔画像における顔特徴位置近傍の画像に対し、局所特徴量の抽出を行う。
【0062】
ここで、局所特徴量の抽出方法としては、例えば、顔特徴位置近傍の画像をそのまま用いて算出する方法や、特徴位置に対してガボアフィルタ(Gabor Filter)やガルシアンデリバティブフィルタ(Gaussian Derivative Filter)などの畳み込み演算を用いて算出する方法を適用することができる。
【0063】
このようにして求められた入力顔の局所特徴量は、顔類似度推定部45に供給される。
【0064】
一方、角度組合せ別学習辞書選択部43には、顔角度推定部14からの入力顔角度情報と、登録顔データベース16からの登録顔角度情報が供給される。角度組合せ別学習辞書選択部43は、入力顔角度情報と登録顔角度情報との組合せに応じて、角度組合せ別学習辞書保持部44に保持されている角度組合せ別学習辞書44Aを選択し、顔類似度推定部45に供給する。
【0065】
角度組合せ別学習辞書保持部44は、顔画像の角度の組合せ別に、例えば、学習辞書LL,LF,LR,FF,FR,RRの6つ角度組合せ別学習辞書44Aを保持している。これは、上記の本発明の原理でも説明したように、例えば、顔の向きを、左方向(L)、正面方向(F)、および右方向(R)の3段階に分ける場合には、角度組合せ別学習辞書44Aの組合せは、LL,LF,LR,FF,FR,RRの6通り必要となるため、角度の組合せ別に6つの学習辞書を保持している。
【0066】
角度組合せ別学習辞書44Aには、顔画像の各角度の組合せ別に、顔画像の類似度の推定時に着目する特徴点の位置とその特徴量の種類などに関する情報の他に、例えば、入力顔と登録顔とが同一人物となるか否かを識別する際に基準となる所定の閾値(以下、人物識別閾値と称する)その他の角度の組合せ別に付与して有用となる情報が記述される。
【0067】
顔類似度推定部45には、角度組合せ別学習辞書選択部43からの角度の組合せに応じた角度組合せ別学習辞書44Aの他に、局所特徴量抽出部42からの入力顔における複数の局所特徴量と、登録顔データベース16からの登録顔における複数の局所特徴量とが入力される。
【0068】
顔類似度推定部45は、入力顔および登録顔のそれぞれにおける複数の局所特徴量のなかから、角度組合せ別学習辞書44Aに記述されている顔類似度を推定する際に着目すべき特徴点とその特徴量の種類に対応する、入力顔の局所特徴量と、登録顔の局所特徴量をそれぞれ取得する。そして、顔類似度推定部45は、取得した入力顔の局所特徴量および登録顔の局所特徴量を用いて、所定の演算を行うことで、入力顔と登録顔と顔の類似度を推定する。
【0069】
なお、この顔類似度は、例えば、正規化相関演算などの演算手法により求められる。
【0070】
顔類似度推定部45は、推定した顔類似度を、角度組合せ別学習辞書44Aに記述された人物識別閾値とともに、顔識別部17に供給する。
【0071】
顔識別部17は、顔類似度推定部45により推定された顔類似度を、人物識別閾値と比較し、顔類似度が人物識別閾値を超える場合、入力顔と登録顔との顔は同一人物であると識別する。一方、顔類似度が人物識別閾値以下となる場合、顔識別部17は、入力顔と登録顔との顔は別人物であると識別する。顔識別部17は、かかる識別結果を、後段のブロック(図示せず)に出力する。
【0072】
以上のようにして、画像識別装置1は構成される。
【0073】
次に、かかる画像識別装置1で行われる処理について説明する。
【0074】
はじめに、図6のフローチャートを参照して、図1の画像識別装置1により実行される顔識別処理について説明する。
【0075】
ステップS1において、画像取得部11は、例えば、カメラにより撮像された画像など、人の顔の部分を少なくとも含まれている画像を取得し、顔検出部12に供給する。
【0076】
ステップS2において、顔検出部12は、画像取得部11から供給される画像に対し、顔検出処理を行い、人の顔の部分含んでいる画像から、顔画像を検出する。顔検出部12は、検出した顔画像を、顔特徴検出部13、顔角度推定部14、および顔類似度推定部15に供給する。
【0077】
ステップS3において、顔特徴検出部13は、顔検出部12から供給される顔画像に対し、例えば目、鼻、口などの顔特徴部分を検出する顔特徴検出処理を行い、それにより得られる顔特徴部分ごとの顔特徴位置を、顔角度推定部14および顔類似度推定部15に供給する。
【0078】
ステップS4において、顔角度推定部14は、顔検出部12から供給される顔画像と、顔特徴検出部13から供給される顔特徴位置に基づいて、入力顔の向いている方向を推定し、入力顔角度情報として、顔類似度推定部15に供給する。
【0079】
ステップS5において、顔類似度推定部15は、顔角度推定部14から供給される入力顔角度情報と、登録顔データベース16に格納された登録顔角度情報との組み合わせに応じた角度組合せ別学習辞書44Aを選択し、選択された角度組合せ別学習辞書44Aに基づいて、顔類似度推定処理を行う。顔類似度推定部15は、顔類似度の推定結果を、顔識別部17に供給する。顔類似度推定処理の詳細は、図7のフローチャートを参照して後述する。
【0080】
ステップS6において、顔識別部17は、顔類似度推定部15から供給される顔類似度の推定結果に基づいて、入力顔と登録顔との顔は、同一人物であるか、あるは別人物であるかを識別して、後段のブロック(図示せず)に出力し、顔識別処理は終了する。
【0081】
次に、図7のフローチャートを参照して、図6のステップS5の処理で行われる、顔類似度推定処理の詳細について説明する。
【0082】
ステップS11において、顔画像アライメント部41は、顔特徴検出部13から供給される顔特徴位置、および、顔検出部12から供給される顔画像を解析することで、顔画像のアライメントを行う。顔画像アライメント部41は、アライメントされた顔画像を、局所特徴量抽出部42に供給する。
【0083】
ステップS12において、局所特徴量抽出部42は、顔画像アライメント部41から供給される顔画像における顔特徴位置近傍の画像に対し、例えば、顔特徴位置近傍の画像をそのまま用いるか、あるいはガボアフィルタやガルシアンデリバティブフィルタなどの畳み込み演算を用いることで、局所特徴量を抽出する。局所特徴量抽出部42は、抽出した入力顔の局所特徴量を、顔類似度推定部45に供給する。
【0084】
ステップS13において、角度組合せ別学習辞書選択部43は、顔角度推定部14から供給される入力顔角度情報と、登録顔データベース16に格納されている登録顔角度情報との組合せに応じて、角度組合せ別学習辞書保持部44に保持されている角度組合せ別学習辞書44Aのなかから適切な学習辞書を選択し、顔類似度推定部45に供給する。
【0085】
例えば、角度組合せ別学習辞書選択部43は、入力顔が左方向(L)を向いており、登録顔が右方向(R)を向いている場合、角度組合せ別学習辞書44Aの学習辞書LL,LF,LR,FF,FR,RRのなかから、学習辞書LRを選択し、顔類似度推定部45に供給する。
【0086】
顔類似度推定部45は、角度組合せ別学習辞書選択部43により選択された角度組合せ別学習辞書44Aに記述されている顔類似度の推定時に着目すべき特徴点とその特徴量の種類に対応する、入力顔の局所特徴量と、登録顔の局所特徴量を取得し、それらの局所特徴量を用いて、例えば正規化相関演算により、入力顔と登録顔との顔類似度を推定する。
【0087】
例えば、入力顔が左方向(L)、登録顔が右方向(R)である場合には、学習辞書LRが選択されるので、顔類似度推定部45は、その学習辞書LRに記述してある、左方向(L)を向いている顔画像と、右方向(R)を向いている顔画像との類似度を推定する際に、最も適切な特徴点に対応する位置での入力顔の局所特徴量と登録顔の局所特徴量を取得する。つまり、顔類似度推定部45は、局所特徴量抽出部42から供給される入力顔の複数の局所特徴量と、登録顔データベース16に格納された登録顔の複数の局所特徴量のなかから、顔画像の角度組合せに応じて選択される角度組合せ別学習辞書44Aに記述された特徴点の位置に対応する、入力顔の局所特徴量と登録顔の局所特徴量を取得する。
【0088】
そして、顔類似度推定部45は、それにより得られた入力顔と登録顔の向いている方向の組合せでの最適な局所特徴量を用いて、顔類似度を推定する。
【0089】
このように、入力顔と登録顔との角度の組合せごとに、学習辞書LL乃至RRなどの複数の学習辞書を用意しておくことで、任意方向を向いている顔の識別を行う場合であっても、複数の学習辞書のなかから、角度の組合せに応じた適切な学習辞書を選択できるので、単一の学習辞書のみを用いる場合と比べて、精度のよい識別結果を得ることが可能となる。
【0090】
すなわち、一般的に顔の各特徴点の画像パターンは、顔の向きによる変化のほうが、個人の差よりもはるかに大きく変化するため、全ての方向の顔角度の画像パターンから識別可能な特徴点や特徴量(角度不変特徴量)を抽出することは、非常に困難であるため、本実施の形態においては、入力顔角度範囲と登録顔角度範囲とが限定されたものとなるように、角度別に複数の学習辞書をあらかじめ用意して、入力顔の方向と登録顔の方向との組合せにより、類似度推定に用いる学習辞書を切り替えているのである。
【0091】
このことは、例えば、上記の先願のような、ブースティング(Boosting)と称される、統計的に識別に最適な特徴点、特徴次元を選択する手法に適用することで、より高い精度の識別が可能となる。
【0092】
また、本実施の形態においては、顔角度の組合せを限定して、統計的に識別可能な特徴点、特徴量を選択することができるので、角度不変特徴量を獲得できる可能性が高くなり、結果として、顔識別の性能を向上させることが可能となる。
【0093】
そして、画像識別装置1においては、従来から行われている正面方向のみの顔識別処理と比較して、顔角度の組合せによる学習辞書を切り替える処理が追加されているだけであるため、従来の顔識別処理とほぼ同等の演算量で、自由視点顔識別処理を実行することが可能となる。つまり、簡単に、顔画像の識別性能を向上させることができる。
【0094】
なお、1つの入力顔に対し、複数の登録顔が登録されている場合、例えば、顔類似度推定部45は、全ての登録顔について、入力顔との顔類似度を求め、その後、それらの顔類似度に応じたスコアを順次出力する。すると、顔識別部17には、登録顔データベース16に登録されている登録顔の数だけスコアが入力されるので、顔識別部17は、顔類似度推定部15から入力されるスコアのうち、最も高いスコアを獲得した登録顔を、入力顔と類似している登録顔として識別すればよい。
【0095】
以上のようにして、顔類似度推定処理は行われる。
【0096】
ところで、角度組合せ別学習辞書44Aであるが、例えば、特定の顔の角度の組合せとなる、同一人物あるいは別人物の顔画像対を複数用意し、それらの顔画像対に対し、所定の学習処理を施すことにより、生成することができる。
【0097】
そこで、次に、角度組合せ別学習辞書44Aを生成する、辞書学習装置51について説明する。
【0098】
図8は、かかる辞書学習装置51の構成例を示す図である。
【0099】
図8で示すように、辞書学習装置51は、図5の角度組合せ別学習辞書保持部44に対応する角度組合せ別学習辞書44Aを保持する角度組合せ別学習辞書保持部44の他に、画像処理部61、顔画像アライメント部62、局所特徴量抽出部63、類似度ベクトル生成部64、および学習部65を含むようにして構成される。
【0100】
画像処理部61は、例えば、特定の角度の組合せとなる顔画像対を取得し、取得した顔画像対に対し、所定の画像解析処理を施し、顔画像と顔特徴位置を検出する。顔画像と顔特徴位置の検出処理は、上述した、図2の顔検出部12および顔特徴検出部13で行われる検出処理と基本的に同様であるので、その説明は省略する。
【0101】
顔画像対ごとに検出される顔画像および顔特徴位置は、顔画像アライメント部62に供給される。
【0102】
顔画像アライメント部62は、画像処理部61から供給される顔画像および顔特徴位置を解析することでアライメントを行い、アライメントされた顔画像対を、局所特徴量抽出部63に供給する。
【0103】
局所特徴量抽出部63は、顔画像アライメント部62から供給される顔画像対における顔特徴位置近傍の画像に対し、例えば、顔特徴位置近傍の画像をそのまま用いるか、あるいはガボアフィルタやガルシアンデリバティブフィルタなどの畳み込み演算を用いることで、それぞれの局所特徴量を抽出する。局所特徴量抽出部63は、抽出した顔画像対の局所特徴量を、類似度ベクトル生成部64に供給する。
【0104】
類似度ベクトル生成部64は、局所特徴量抽出部63から供給される顔画像対のそれぞれの局所特徴量の相関を求めることで、類似度ベクトルを生成する。類似度ベクトル生成部64は、生成した類似度ベクトルを学習部65に供給する。
【0105】
学習部65は、類似度ベクトル生成部64から供給される類似度ベクトルのうち、どの部分を用いればよいかを、いわゆるブースティングにより学習する。そして、学習部65は、学習により得られる角度組合せ別の最適な特徴点の位置などの情報を、角度組合せ別学習辞書44Aとして生成し、角度組合せ別学習辞書保持部44に登録する。
【0106】
次に、辞書学習装置51で行われる処理について説明する。
【0107】
図9のフローチャートは、図8の辞書学習装置51により実行される辞書学習処理について説明する。
【0108】
ステップS31において、画像処理部61は、特定の角度の組合せとなる顔画像対に対し、所定の画像解析処理を施して、顔画像対のそれぞれの顔画像と顔特徴位置を検出し、顔画像アライメント部62に供給する。
【0109】
なお、高い精度の角度組合せ別学習辞書44Aを生成するためには、サンプル数を増やす必要があるので、特定の顔の角度の組合せとなる、同一人物あるいは別人物の顔画像対をできるだけ多く用意すると好適である。
【0110】
ステップS32において、顔画像アライメント部62は、画像処理部61から供給される顔画像対のそれぞれの顔画像と顔特徴位置を解析することで、アライメントを行い、アライメントされた顔画像対を、局所特徴量抽出部63に供給する。
【0111】
ステップS33において、局所特徴量抽出部63は、顔画像アライメント部62から供給される顔画像対における顔特徴位置近傍の画像に対し、例えば、顔特徴位置近傍の画像をそのまま用いるなどして、それぞれの局所特徴量を抽出する。局所特徴量抽出部63は、抽出した顔画像対の局所特徴量を、類似度ベクトル生成部64に供給する。
【0112】
ステップS34において、類似度ベクトル生成部64は、局所特徴量抽出部63から供給される顔画像対のそれぞれの局所特徴量の相関を求めることで、類似度ベクトルを生成し、学習部35に供給する。
【0113】
ステップS35において、学習部35は、類似度ベクトル生成部64から供給される類似度ベクトルに基づいて、ブースティングにより学習を行う。
【0114】
ステップS36において、学習部35は、学習により得られる角度組合せ別の最適な特徴点の位置などの情報を、角度組合せ別学習辞書44Aとして生成し、角度組合せ別学習辞書保持部44に登録して、辞書学習処理は終了する。
【0115】
以上のようにして、角度組合せ別学習辞書保持部44は生成される。
【0116】
なお、本実施の形態では、画像識別装置1と、辞書学習装置51とは別の装置であるとして説明したが、それらの装置は、それぞれの有する機能を1つの装置で実現可能にすることで、1つの装置から構成されるようにしてもよい。その場合、辞書学習装置51を、辞書学習部として、画像識別装置1のなかに含めることで、顔画像検出処理などの顔識別処理と学習処理の両方で行われる処理については、同じブロックで処理を実行することが可能となる。
【0117】
以上のように、本発明によれば、顔角度の組合せを限定して、統計的に識別可能な特徴点、特徴量を選択することができるので、角度不変特徴量を獲得できる可能性が高くなり、結果として、顔識別の性能を向上させることが可能となる。その結果、角度が異なる顔同士での識別性能を向上させることができる。
【0118】
また、本発明によれば、従来より行われていた正面方向のみの顔識別処理と比較して、顔角度の組合せによる学習辞書を切り替える処理が追加されているだけであるため、従来の顔識別処理とほぼ同等の演算量で、より高い精度の顔識別処理を実行することが可能となる。その結果、簡単に、顔画像の識別性能を向上させることができる。
【0119】
上述した一連の処理は、ハードウェアにより実行させることもできるし、ソフトウェアにより実行させることもできる。一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、プログラム記録媒体からインストールされる。
【0120】
図10は、上述した一連の処理をプログラムにより実行するパーソナルコンピュータの構成の例を示すブロック図である。CPU(Central Processing Unit)111は、ROM(Read Only Memory)112、または記録部118に記録されているプログラムに従って各種の処理を実行する。RAM(Random Access Memory)113には、CPU111が実行するプログラムやデータなどが適宜記憶される。これらのCPU111、ROM112、およびRAM113は、バス114により相互に接続されている。
【0121】
CPU111にはまた、バス114を介して入出力インターフェース115が接続されている。入出力インターフェース115には、マイクロホンなどよりなる入力部116、ディスプレイ、スピーカなどよりなる出力部117が接続されている。CPU111は、入力部116から入力される指令に対応して各種の処理を実行する。そして、CPU111は、処理の結果を出力部117に出力する。
【0122】
入出力インターフェース115に接続されている記録部118は、例えばハードディスクからなり、CPU111が実行するプログラムや各種のデータを記録する。通信部119は、インターネットやローカルエリアネットワークなどのネットワークを介して外部の装置と通信する。
【0123】
また、通信部119を介してプログラムを取得し、記録部118に記録してもよい。
【0124】
入出力インターフェース115に接続されているドライブ120は、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア121が装着されたとき、それらを駆動し、そこに記録されているプログラムやデータなどを取得する。取得されたプログラムやデータは、必要に応じて記録部118に転送され、記録される。
【0125】
コンピュータにインストールされ、コンピュータによって実行可能な状態とされるプログラムを格納するプログラム記録媒体は、図10に示すように、磁気ディスク(フレキシブルディスクを含む)、光ディスク(CD-ROM(Compact Disc-Read Only Memory),DVD(Digital Versatile Disc)を含む)、光磁気ディスク、もしくは半導体メモリなどよりなるパッケージメディアであるリムーバブルメディア121、または、プログラムが一時的もしくは永続的に格納されるROM112や、記録部118を構成するハードディスクなどにより構成される。プログラム記録媒体へのプログラムの格納は、必要に応じてルータ、モデムなどのインターフェースである通信部119を介して、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の通信媒体を利用して行われる。
【0126】
なお、本明細書において、記録媒体に格納されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
【0127】
また、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。
【図面の簡単な説明】
【0128】
【図1】入力顔と登録顔の角度組合せついて説明する図である。
【図2】本発明を適用した画像識別装置の一実施の形態の構成を示す図である。
【図3】顔検出部の詳細な構成例を示す図である。
【図4】顔特徴検出部の詳細な構成例を示す図である。
【図5】顔類似度推定部の詳細な構成例を示す図である。
【図6】顔識別処理について説明するフローチャートである。
【図7】顔類似度推定処理について説明するフローチャートである。
【図8】辞書学習装置の構成例を示す図である。
【図9】辞書学習処理について説明するフローチャートである。
【図10】本発明が適用される画像処理をソフトウェアで実行するコンピュータの構成例を示す図である。
【符号の説明】
【0129】
1 画像識別装置, 11 画像取得部, 12 顔検出部, 13 顔特徴検出部, 14 顔角度推定部, 15 顔類似度推定部, 16 登録顔データベース, 17 顔識別部, 21 画像切り出し部, 22 顔判定部, 23 顔学習データベース, 31 画像切り出し部, 32 顔特徴判定部, 33 顔特徴学習データベース, 41 顔画像アライメント部, 42 局所特徴量抽出部, 43 角度組合せ別学習辞書選択部, 44 角度組合せ別学習辞書保持部, 44A 角度組合せ別学習辞書, 45 顔類似度推定部, 51 辞書学習装置, 61 画像処理部, 62 顔画像アライメント部, 63 局所特徴量抽出部, 64 類似度ベクトル生成部, 65 学習部, LL乃至RR 学習辞書
【特許請求の範囲】
【請求項1】
人の顔を含んでいる第1の顔画像の顔の向いている方向を示す第1の角度と、人の顔を含んでいる第2の顔画像の顔の向いている方向を示す第2の角度との組合せごとに、前記第1の顔画像と前記第2の顔画像との類似度を推定する際にそれぞれを対応付ける特徴点の位置に関する情報を含んでいる学習辞書を保持する保持手段と、
前記第1の角度と前記第2の角度との組合せに応じて、前記第1の角度と前記第2の角度との組合せごとに保持されている前記学習辞書を選択する選択手段と、
選択された前記学習辞書に含まれる特徴点の位置に対応する、前記第1の顔画像と前記第2の顔画像から抽出された特徴量に基づいて、前記第1の顔画像と前記第2の顔画像との顔の類似度を推定する類似度推定手段と
を備える画像処理装置。
【請求項2】
推定した前記類似度に基づいて、前記第1の顔画像と前記第2の顔画像とを識別する識別手段をさらに備える
請求項1に記載の画像処理装置。
【請求項3】
前記第2の顔画像は、抽出された特徴量と、前記第2の角度とに対応付けられて、あらかじめ登録されている
請求項1に記載の画像処理装置。
【請求項4】
人を含んでいる画像から前記第1の顔画像の部分を検出する顔検出手段と、
検出された前記第1の顔画像から前記顔の特徴となる顔特徴位置を検出する顔特徴検出手段と、
検出された前記第1の顔画像および前記顔特徴位置に基づいて、前記第1の角度を推定する顔角度推定手段と、
検出された前記第1の顔画像における前記顔特徴位置近傍の画像から特徴量を抽出する抽出手段と
をさらに備え、
前記選択手段は、推定された前記第1の角度と、登録されている前記第2の角度との組合せに応じて、前記学習辞書を選択し、
前記類似度推定手段は、選択された前記学習辞書に含まれる特徴点の位置に対応する、前記第1の顔画像から抽出した特徴量と、登録されている前記第2の顔画像の特徴量に基づいて、前記類似度を推定する
請求項3に記載の画像処理装置。
【請求項5】
前記保持手段は、前記第1の角度の示す向きを、左方向、正面方向、および右方向の3段階とし、前記第2の角度を示す向きを、左方向、正面方向、および右方向の3段階とした場合、それらの方向のすべての組合せについての前記学習辞書を保持する
請求項1に記載の画像処理装置。
【請求項6】
前記学習辞書には、前記第1の顔画像と前記第2の顔画像とを識別する際の基準となる所定の閾値が含まれており、
前記識別手段は、推定された前記類似度と前記閾値とを比較した結果に基づいて、前記第1の顔画像と前記第2の顔画像との顔が、同一人物であるか、あるいは別人物であるか否かを識別する
請求項2に記載の画像処理装置。
【請求項7】
人の顔を含んでいる第1の顔画像の顔の向いている方向を示す第1の角度と、人の顔を含んでいる第2の顔画像の顔の向いている方向を示す第2の角度との組合せに応じて、前記第1の角度と前記第2の角度との組合せごとに保持されている学習辞書であって、前記第1の角度と前記第2の角度との組合せごとに、前記第1の顔画像と前記第2の顔画像との類似度を推定する際にそれぞれを対応付ける特徴点の位置に関する情報を含んでいる前記学習辞書を選択し、
選択された前記学習辞書に含まれる特徴点の位置に対応する、前記第1の顔画像と前記第2の顔画像から抽出された特徴量に基づいて、前記第1の顔画像と前記第2の顔画像との顔の類似度を推定する
ステップを含む画像処理方法。
【請求項8】
人の顔を含んでいる第1の顔画像の顔の向いている方向を示す第1の角度と、人の顔を含んでいる第2の顔画像の顔の向いている方向を示す第2の角度との組合せに応じて、前記第1の角度と前記第2の角度との組合せごとに保持されている学習辞書であって、前記第1の角度と前記第2の角度との組合せごとに、前記第1の顔画像と前記第2の顔画像との類似度を推定する際にそれぞれを対応付ける特徴点の位置に関する情報を含んでいる前記学習辞書を選択し、
選択された前記学習辞書に含まれる特徴点の位置に対応する、前記第1の顔画像と前記第2の顔画像から抽出された特徴量に基づいて、前記第1の顔画像と前記第2の顔画像との顔の類似度を推定する
ステップを含む処理をコンピュータに実行させるプログラム。
【請求項9】
所定の形状と特徴を有する物体または生物を含んでいる第1の画像の前記物体または前記生物の向いている方向を示す第1の角度と、所定の形状と特徴を有する物体または生物を含んでいる第2の画像の前記物質または前記生物の向いている方向を示す第2の角度との組合せごとに、前記第1の画像と前記第2の画像との類似度を推定する際にそれぞれを対応付ける特徴点の位置に関する情報を含んでいる学習辞書を保持する保持手段と、
前記第1の角度と前記第2の角度との組合せに応じて、前記第1の角度と前記第2の角度との組合せごとに保持されている前記学習辞書を選択する選択手段と、
選択された前記学習辞書に含まれる特徴点の位置に対応する、前記第1の画像と前記第2の画像から抽出された特徴量に基づいて、前記第1の画像と前記第2の画像との前記物体または前記生物の類似度を推定する類似度推定手段と
を備える画像処理装置。
【請求項10】
所定の形状と特徴を有する物体または生物を含んでいる第1の画像の前記物体または前記生物の向いている方向を示す第1の角度と、所定の形状と特徴を有する物体または生物を含んでいる第2の画像の前記物質または前記生物の向いている方向を示す第2の角度との組合せに応じて、前記第1の角度と前記第2の角度との組合せごとに保持されている学習辞書であって、前記第1の角度と前記第2の角度との組合せごとに、前記第1の画像と前記第2の画像との類似度を推定する際にそれぞれを対応付ける特徴点の位置に関する情報を含んでいる前記学習辞書を選択し、
選択された前記学習辞書に含まれる特徴点の位置に対応する、前記第1の画像と前記第2の画像から抽出された特徴量に基づいて、前記第1の画像と前記第2の画像との前記物体または前記生物の類似度を推定する
ステップを含む画像処理方法。
【請求項11】
所定の形状と特徴を有する物体または生物を含んでいる第1の画像の前記物体または前記生物の向いている方向を示す第1の角度と、所定の形状と特徴を有する物体または生物を含んでいる第2の画像の前記物質または前記生物の向いている方向を示す第2の角度との組合せに応じて、前記第1の角度と前記第2の角度との組合せごとに保持されている学習辞書であって、前記第1の角度と前記第2の角度との組合せごとに、前記第1の画像と前記第2の画像との類似度を推定する際にそれぞれを対応付ける特徴点の位置に関する情報を含んでいる前記学習辞書を選択し、
選択された前記学習辞書に含まれる特徴点の位置に対応する、前記第1の画像と前記第2の画像から抽出された特徴量に基づいて、前記第1の画像と前記第2の画像との前記物体または前記生物の類似度を推定する
ステップを含む処理をコンピュータに実行させるプログラム。
【請求項1】
人の顔を含んでいる第1の顔画像の顔の向いている方向を示す第1の角度と、人の顔を含んでいる第2の顔画像の顔の向いている方向を示す第2の角度との組合せごとに、前記第1の顔画像と前記第2の顔画像との類似度を推定する際にそれぞれを対応付ける特徴点の位置に関する情報を含んでいる学習辞書を保持する保持手段と、
前記第1の角度と前記第2の角度との組合せに応じて、前記第1の角度と前記第2の角度との組合せごとに保持されている前記学習辞書を選択する選択手段と、
選択された前記学習辞書に含まれる特徴点の位置に対応する、前記第1の顔画像と前記第2の顔画像から抽出された特徴量に基づいて、前記第1の顔画像と前記第2の顔画像との顔の類似度を推定する類似度推定手段と
を備える画像処理装置。
【請求項2】
推定した前記類似度に基づいて、前記第1の顔画像と前記第2の顔画像とを識別する識別手段をさらに備える
請求項1に記載の画像処理装置。
【請求項3】
前記第2の顔画像は、抽出された特徴量と、前記第2の角度とに対応付けられて、あらかじめ登録されている
請求項1に記載の画像処理装置。
【請求項4】
人を含んでいる画像から前記第1の顔画像の部分を検出する顔検出手段と、
検出された前記第1の顔画像から前記顔の特徴となる顔特徴位置を検出する顔特徴検出手段と、
検出された前記第1の顔画像および前記顔特徴位置に基づいて、前記第1の角度を推定する顔角度推定手段と、
検出された前記第1の顔画像における前記顔特徴位置近傍の画像から特徴量を抽出する抽出手段と
をさらに備え、
前記選択手段は、推定された前記第1の角度と、登録されている前記第2の角度との組合せに応じて、前記学習辞書を選択し、
前記類似度推定手段は、選択された前記学習辞書に含まれる特徴点の位置に対応する、前記第1の顔画像から抽出した特徴量と、登録されている前記第2の顔画像の特徴量に基づいて、前記類似度を推定する
請求項3に記載の画像処理装置。
【請求項5】
前記保持手段は、前記第1の角度の示す向きを、左方向、正面方向、および右方向の3段階とし、前記第2の角度を示す向きを、左方向、正面方向、および右方向の3段階とした場合、それらの方向のすべての組合せについての前記学習辞書を保持する
請求項1に記載の画像処理装置。
【請求項6】
前記学習辞書には、前記第1の顔画像と前記第2の顔画像とを識別する際の基準となる所定の閾値が含まれており、
前記識別手段は、推定された前記類似度と前記閾値とを比較した結果に基づいて、前記第1の顔画像と前記第2の顔画像との顔が、同一人物であるか、あるいは別人物であるか否かを識別する
請求項2に記載の画像処理装置。
【請求項7】
人の顔を含んでいる第1の顔画像の顔の向いている方向を示す第1の角度と、人の顔を含んでいる第2の顔画像の顔の向いている方向を示す第2の角度との組合せに応じて、前記第1の角度と前記第2の角度との組合せごとに保持されている学習辞書であって、前記第1の角度と前記第2の角度との組合せごとに、前記第1の顔画像と前記第2の顔画像との類似度を推定する際にそれぞれを対応付ける特徴点の位置に関する情報を含んでいる前記学習辞書を選択し、
選択された前記学習辞書に含まれる特徴点の位置に対応する、前記第1の顔画像と前記第2の顔画像から抽出された特徴量に基づいて、前記第1の顔画像と前記第2の顔画像との顔の類似度を推定する
ステップを含む画像処理方法。
【請求項8】
人の顔を含んでいる第1の顔画像の顔の向いている方向を示す第1の角度と、人の顔を含んでいる第2の顔画像の顔の向いている方向を示す第2の角度との組合せに応じて、前記第1の角度と前記第2の角度との組合せごとに保持されている学習辞書であって、前記第1の角度と前記第2の角度との組合せごとに、前記第1の顔画像と前記第2の顔画像との類似度を推定する際にそれぞれを対応付ける特徴点の位置に関する情報を含んでいる前記学習辞書を選択し、
選択された前記学習辞書に含まれる特徴点の位置に対応する、前記第1の顔画像と前記第2の顔画像から抽出された特徴量に基づいて、前記第1の顔画像と前記第2の顔画像との顔の類似度を推定する
ステップを含む処理をコンピュータに実行させるプログラム。
【請求項9】
所定の形状と特徴を有する物体または生物を含んでいる第1の画像の前記物体または前記生物の向いている方向を示す第1の角度と、所定の形状と特徴を有する物体または生物を含んでいる第2の画像の前記物質または前記生物の向いている方向を示す第2の角度との組合せごとに、前記第1の画像と前記第2の画像との類似度を推定する際にそれぞれを対応付ける特徴点の位置に関する情報を含んでいる学習辞書を保持する保持手段と、
前記第1の角度と前記第2の角度との組合せに応じて、前記第1の角度と前記第2の角度との組合せごとに保持されている前記学習辞書を選択する選択手段と、
選択された前記学習辞書に含まれる特徴点の位置に対応する、前記第1の画像と前記第2の画像から抽出された特徴量に基づいて、前記第1の画像と前記第2の画像との前記物体または前記生物の類似度を推定する類似度推定手段と
を備える画像処理装置。
【請求項10】
所定の形状と特徴を有する物体または生物を含んでいる第1の画像の前記物体または前記生物の向いている方向を示す第1の角度と、所定の形状と特徴を有する物体または生物を含んでいる第2の画像の前記物質または前記生物の向いている方向を示す第2の角度との組合せに応じて、前記第1の角度と前記第2の角度との組合せごとに保持されている学習辞書であって、前記第1の角度と前記第2の角度との組合せごとに、前記第1の画像と前記第2の画像との類似度を推定する際にそれぞれを対応付ける特徴点の位置に関する情報を含んでいる前記学習辞書を選択し、
選択された前記学習辞書に含まれる特徴点の位置に対応する、前記第1の画像と前記第2の画像から抽出された特徴量に基づいて、前記第1の画像と前記第2の画像との前記物体または前記生物の類似度を推定する
ステップを含む画像処理方法。
【請求項11】
所定の形状と特徴を有する物体または生物を含んでいる第1の画像の前記物体または前記生物の向いている方向を示す第1の角度と、所定の形状と特徴を有する物体または生物を含んでいる第2の画像の前記物質または前記生物の向いている方向を示す第2の角度との組合せに応じて、前記第1の角度と前記第2の角度との組合せごとに保持されている学習辞書であって、前記第1の角度と前記第2の角度との組合せごとに、前記第1の画像と前記第2の画像との類似度を推定する際にそれぞれを対応付ける特徴点の位置に関する情報を含んでいる前記学習辞書を選択し、
選択された前記学習辞書に含まれる特徴点の位置に対応する、前記第1の画像と前記第2の画像から抽出された特徴量に基づいて、前記第1の画像と前記第2の画像との前記物体または前記生物の類似度を推定する
ステップを含む処理をコンピュータに実行させるプログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【公開番号】特開2009−187186(P2009−187186A)
【公開日】平成21年8月20日(2009.8.20)
【国際特許分類】
【出願番号】特願2008−25148(P2008−25148)
【出願日】平成20年2月5日(2008.2.5)
【出願人】(000002185)ソニー株式会社 (34,172)
【Fターム(参考)】
【公開日】平成21年8月20日(2009.8.20)
【国際特許分類】
【出願日】平成20年2月5日(2008.2.5)
【出願人】(000002185)ソニー株式会社 (34,172)
【Fターム(参考)】
[ Back to top ]