説明

画像処理装置、撮像装置、これらにおける処理方法およびプログラム

【課題】対象物の類似度算出の精度を高める。
【解決手段】顔特徴量RAM390には特定人物の顔特徴量が記憶されている。顔検出部200は撮像画像に含まれる顔を検出する。正規化部320は撮像画像から検出された顔を含む顔画像を正規化する。属性判定部330は検出された顔の属性を判定する。特徴点算出部340は、顔属性の判定結果に基づいて正規化顔画像に設定すべき特徴点の位置を決定する。顔特徴量抽出部350は、顔属性の判定結果に基づいてパラメータが変更されたガボア・フィルタを用いて正規化顔画像に設定された特徴点における特徴量を抽出する。類似度算出部360は、顔属性の判定結果に基づいて数または種類が変更された複数の弱判別器を用いて特定人物の特徴量と正規化顔画像に設定された特徴点における特徴量とを比較することにより、特定人物の顔と検出された顔との類似度を算出する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理装置に関し、特に、画像に含まれる所定の対象物を認識する画像処理装置、撮像装置、および、これらにおける処理方法ならびに当該方法をコンピュータに実行させるプログラムに関する。
【背景技術】
【0002】
近年、デジタルスチルカメラ、デジタルビデオカメラ、携帯電話機に搭載されている小型カメラ等の撮像装置の高性能化が進んでいる。これらの撮像装置に搭載されている機能として、最近では、被写体が何であるかを認識する被写体認識技術が注目を浴びている。被写体認識技術として、例えば、画像処理によって撮像画像から人物の顔を検出する顔検出技術が提案されている。
【0003】
この顔検出技術として、例えば、撮像画像の一部分を切り出し、この切り出された画像と、テンプレートと比較することによって、この切り出された画像が人物の顔である確からしさを算出して、人物の顔を検出する顔検出技術が提案されている(例えば、特許文献1参照。)。
【0004】
このように顔検出技術を用いて検出された顔について、さらに、特定人物の顔であるか否かを識別する技術(いわゆる、顔認識技術)が提案されている。
【0005】
例えば、入力された画像に含まれる顔上に一定の間隔で離れて位置する画素をその顔の特徴点として検出し、この特徴点の局所的な特徴量をガボア・フィルタにより検出し、この検出された特徴量が、予め登録されている顔の特徴量に対してどの程度類似しているかを演算することにより、人物の顔を識別する画像処理装置が提案されている(例えば、特許文献2参照。)。
【特許文献1】特開2007−4313号公報(図1)
【特許文献2】特開2006−4003号公報(図2)
【発明の開示】
【発明が解決しようとする課題】
【0006】
上述の従来技術によれば、入力された画像に含まれる顔上において一定の間隔で配置された特徴点の局所的な特徴量を検出し、この検出された特徴量を用いて人物の顔を識別することができる。
【0007】
しかしながら、人物の顔の輪郭に対する目、鼻、口等の顔の器官の位置やその比率について、大人と子供とを比較した場合には、ある程度の差異が生じることが知られている。また、大人の顔は、子供の顔に対して面長となっている傾向が強いことも知られている。さらに、顔の表情、性別、目の開閉、人種、眼鏡の有無や種類、ヒゲの有無や種類、顔向き等についても各個人によって差異が生じる。このように、撮像画像に含まれる人物によって各種の差異が生じる。このため、対象物の類似度算出の精度を高めるには、認識の対象となる人物の顔の属性に応じて適切な特徴点の設定等を行うことが重要となる。
【0008】
そこで、本発明は、対象物の類似度算出の精度を高めることを目的とする。
【課題を解決するための手段】
【0009】
本発明は、上記課題を解決するためになされたものであり、その第1の側面は、所定の対象物の特徴量を記憶する対象物特徴量記憶手段と、画像を入力する画像入力手段と、上記入力された画像に含まれる対象物を検出する対象物検出手段と、上記検出された対象物の属性を判定する属性判定手段と、上記判定された属性に基づいて上記入力された画像に設定すべき特徴点の位置を決定する特徴点決定手段と、上記対象物特徴量記憶手段に記憶されている特徴量と上記入力された画像に設定された特徴点における特徴量とを比較することにより上記対象物特徴量記憶手段に記憶されている特徴量に対応する対象物と上記検出された対象物との類似度を算出する類似度算出手段とを具備することを特徴とする画像処理装置およびその処理方法ならびに当該方法をコンピュータに実行させるプログラムである。これにより、入力された画像に含まれる対象物を検出すると、この検出された対象物の属性を判定し、この判定された属性に基づいて、入力された画像に設定すべき特徴点の位置を決定し、対象物特徴量記憶手段に記憶されている特徴量と、入力された画像に設定された特徴点における特徴量とを比較することによって、対象物特徴量記憶手段に記憶されている特徴量に対応する対象物と、検出された対象物との類似度を算出するという作用をもたらす。
【0010】
また、この第1の側面において、上記入力された画像に設定すべき特徴点の位置の初期値を保持する特徴点座標テーブル保持手段をさらに具備し、上記特徴点決定手段は、上記判定された属性に基づいて上記初期値における特徴点の位置を移動または上記初期値における特徴点の数を増減させることにより上記入力された画像に設定すべき特徴点の位置を決定することができる。これにより、判定された属性に基づいて、初期値における特徴点の位置を移動または初期値における特徴点の数を増減させることによって、入力された画像に設定すべき特徴点の位置を決定するという作用をもたらす。
【0011】
また、この第1の側面において、上記検出された対象物が一定の位置に配置されるように上記検出された対象物の周辺画像である対象物画像を正規化する正規化手段をさらに具備し、上記特徴点決定手段は、上記判定された属性に基づいて上記正規化された対象物画像に設定すべき特徴点の位置を決定することができる。これにより、検出された対象物が一定の位置に配置されるように対象物画像を正規化して、判定された属性に基づいて、その正規化された対象物画像に設定すべき特徴点の位置を決定するという作用をもたらす。
【0012】
また、この第1の側面において、上記入力された画像に設定された特徴点における特徴量を抽出する特徴量抽出手段をさらに具備することができる。これにより、入力された画像に設定された特徴点における特徴量を抽出するという作用をもたらす。
【0013】
また、この第1の側面において、上記特徴量抽出手段は、上記入力された画像に設定された特徴点を含むその周辺画像である近傍画像について特徴量抽出フィルタを用いて上記特徴点毎に特徴量を抽出することができる。これにより、近傍画像について特徴量抽出フィルタを用いて特徴点毎に特徴量を抽出するという作用をもたらす。
【0014】
また、この第1の側面において、上記特徴量抽出手段は、上記判定された属性に基づいて上記特徴量の抽出に用いられる上記特徴量抽出フィルタのパラメータを変更することができる。これにより、判定された属性に基づいて、特徴量抽出フィルタのパラメータを変更するという作用をもたらす。
【0015】
また、この第1の側面において、上記特徴量抽出フィルタはガボア・フィルタであり、上記特徴量抽出手段は、上記判定された属性に基づいて上記ガボア・フィルタのパラメータである通過帯域または特徴量抽出角度を変更することができる。これにより、判定された属性に基づいて、ガボア・フィルタのパラメータである通過帯域または特徴量抽出角度を変更するという作用をもたらす。
【0016】
また、この第1の側面において、上記算出された類似度に基づいて上記入力された画像について抽出された特徴量が一定の条件を満たしているか否かを判定して上記一定の条件を満たしていると判定された場合には上記入力された画像について抽出された特徴量を上記対象物特徴量記憶手段に記憶させる特徴量登録手段をさらに具備することができる。これにより、算出された類似度に基づいて、入力された画像について抽出された特徴量が一定の条件を満たしているか否かを判定し、この一定の条件を満たしていると判定された場合には、入力された画像について抽出された特徴量を、対象物特徴量記憶手段に記憶させるという作用をもたらす。
【0017】
また、この第1の側面において、上記特徴量登録手段は、上記一定の条件を満たしていると判定された場合には上記入力された画像について抽出された特徴量とともに上記判定された属性を上記対象物特徴量記憶手段に記憶させることができる。これにより、一定の条件を満たしていると判定された場合には、入力された画像について抽出された特徴量とともに、判定された属性を対象物特徴量記憶手段に記憶させるという作用をもたらす。
【0018】
また、この第1の側面において、上記類似度算出手段は、複数の弱判別器を用いて上記対象物特徴量記憶手段に記憶されている特徴量と上記入力された画像に設定された特徴点における特徴量とを比較することにより上記類似度を算出することができる。これにより、複数の弱判別器を用いて、対象物特徴量記憶手段に記憶されている特徴量と、入力された画像に設定された特徴点における特徴量とを比較することによって、類似度を算出するという作用をもたらす。
【0019】
また、この第1の側面において、上記類似度算出手段は、上記判定された属性に基づいて上記類似度の算出に用いられる上記弱判別器の数または種類を変更することができる。これにより、判定された属性に基づいて、弱判別器の数または種類を変更するという作用をもたらす。
【0020】
また、この第1の側面において、所定の対象物に関する属性を記憶する対象物属性記憶手段をさらに具備し、上記類似度算出手段は、上記判定された属性と上記対象物属性記憶手段に記憶されている属性とを比較することにより上記検出された対象物と上記対象物属性記憶手段に属性が記憶されている対象物との属性の類似度を判定して上記属性の類似度の判定結果に基づいて上記検出された対象物についての類似度を算出するか否かを判断することができる。これにより、判定された属性と、対象物属性記憶手段に記憶されている属性とを比較することによって、検出された対象物と対象物属性記憶手段に属性が記憶されている対象物との属性の類似度を判定し、この属性の類似度の判定結果に基づいて、検出された対象物についての類似度を算出するか否かを判断するという作用をもたらす。
【0021】
また、この第1の側面において、上記対象物検出手段は、上記入力された画像に含まれる人物の顔を検出することができる。これにより、入力された画像に含まれる人物の顔を検出するという作用をもたらす。
【0022】
また、この第1の側面において、上記属性判定手段は、人物の顔についての表情、年齢もしくは年代、性別、目の開閉、人種、眼鏡の有無もしくは種類、ヒゲの有無もしくは種類、帽子の有無もしくは種類、アクセサリーの有無もしくは種類、髪型、または、顔向きの少なくとも1つを上記検出された人物の顔の属性として判定することができる。これにより、人物の顔についての表情、年齢もしくは年代、性別、目の開閉、人種、眼鏡の有無もしくは種類、ヒゲの有無もしくは種類、帽子の有無もしくは種類、アクセサリーの有無もしくは種類、髪型、または、顔向きの少なくとも1つを、検出された人物の顔の属性として判定するという作用をもたらす。
【0023】
また、この第1の側面において、上記属性判定手段は、上記検出された対象物について複数の属性を順次判定するとともに既に判定された属性の判定結果に基づいて次に判定すべき属性を選択することができる。これにより、検出された対象物について複数の属性を順次判定するとともに、既に判定された属性の判定結果に基づいて次に判定すべき属性を選択するという作用をもたらす。
【0024】
また、本発明の第2の側面は、所定の対象物の特徴量を記憶する対象物特徴量記憶手段と、画像を入力する画像入力手段と、上記入力された画像に含まれる対象物を検出する対象物検出手段と、上記検出された対象物の属性を判定する属性判定手段と、上記判定された属性に基づいて数または種類が決定された複数の弱判別器を用いて上記対象物特徴量記憶手段に記憶されている特徴量と上記入力された画像に設定された特徴点における特徴量とを比較することにより上記対象物特徴量記憶手段に記憶されている特徴量に対応する対象物と上記検出された対象物との類似度を算出する類似度算出手段とを具備することを特徴とする画像処理装置およびその処理方法ならびに当該方法をコンピュータに実行させるプログラムである。これにより、入力された画像に含まれる対象物を検出すると、この検出された対象物の属性を判定し、この判定された属性に基づいて数または種類が決定された複数の弱判別器を用いて、対象物特徴量記憶手段に記憶されている特徴量と、入力された画像に設定された特徴点における特徴量とを比較することによって、対象物特徴量記憶手段に記憶されている特徴量に対応する対象物と、検出された対象物との類似度を算出するという作用をもたらす。
【0025】
また、本発明の第3の側面は、所定の対象物の特徴量を記憶する対象物特徴量記憶手段と、被写体からの入射光を撮像画像に変換する撮像手段と、上記撮像画像に含まれる対象物を検出する対象物検出手段と、上記検出された対象物の属性を判定する属性判定手段と、上記判定された属性に基づいて上記撮像画像に設定すべき特徴点の位置を決定する特徴点決定手段と、上記対象物特徴量記憶手段に記憶されている特徴量と上記撮像画像に設定された特徴点における特徴量とを比較することにより上記対象物特徴量記憶手段に記憶されている特徴量に対応する対象物と上記検出された対象物との類似度を算出する類似度算出手段とを具備することを特徴とする撮像装置およびその処理方法ならびに当該方法をコンピュータに実行させるプログラムである。これにより、撮像画像に含まれる対象物を検出すると、この検出された対象物の属性を判定し、この判定された属性に基づいて、撮像画像に設定すべき特徴点の位置を決定し、対象物特徴量記憶手段に記憶されている特徴量と、撮像画像に設定された特徴点における特徴量とを比較することによって、対象物特徴量記憶手段に記憶されている特徴量に対応する対象物と、検出された対象物との類似度を算出するという作用をもたらす。
【発明の効果】
【0026】
本発明によれば、対象物の類似度算出の精度を高めるという優れた効果を奏し得る。
【発明を実施するための最良の形態】
【0027】
次に本発明の実施の形態について図面を参照して詳細に説明する。
【0028】
図1は、本発明の実施の形態における撮像装置100の機能構成例を示すブロック図である。撮像装置100として、デジタルスチルカメラやデジタルビデオカメラ等の撮像装置、または、携帯電話機やパーソナルコンピュータ等の端末装置に付属するカメラ等の撮像装置が例として挙げられる。
【0029】
撮像装置100は、CPU(Central Processing Unit)110と、レンズ群121と、イメージセンサ122と、カメラ信号処理部123と、画像RAM(Random Access Memory)130と、画像圧縮伸張部140と、表示部150と、操作受付部160と、記憶媒体170と、揮発/不揮発性記憶媒体180と、画像バス190と、顔検出部200と、顔認識部300と、顔特徴量RAM390とを備える。なお、撮像装置100の各ブロック間における画像信号の送受信は、直接のやりとり、または、共有メモリである画像RAM130または画像バス190を経由したやりとりによって行われる。
【0030】
CPU110は、メモリ(図示せず)に格納されている各種制御プログラムに基づいて撮像装置100の各部を制御するCPUである。
【0031】
レンズ群121は、フォーカスレンズやズームレンズ等の複数のレンズにより構成され、これらのレンズを介して入力された被写体からの入射光をイメージセンサ122に出力する。また、レンズ群121における絞り制御やフォーカス制御がCPU110により行われる。
【0032】
イメージセンサ122は、レンズ群121を通過した被写体からの入射光を電気信号に光電変換し、光電変換された電気信号をカメラ信号処理部123に出力するものである。
【0033】
カメラ信号処理部123は、イメージセンサ122から出力された電気信号に対して各種の信号処理を施し、信号処理が施された画像データを画像RAM130、画像圧縮伸張部140、表示部150および顔検出部200に出力するものである。カメラ信号処理部123における信号処理として、ホワイトバランス調節、ノイズ軽減処理、レベル補正処理、A/D変換処理および色彩補正処理等の信号処理がある。
【0034】
画像RAM130は、撮像装置100において処理対象となる画像データを記憶するものである。
【0035】
画像圧縮伸張部140は、入力された各種画像データを各画像処理に応じて圧縮または伸張するものである。例えば、画像圧縮伸張部140により圧縮処理が施された画像データが記憶媒体170に出力されて記録される。また、画像圧縮伸張部140により伸張処理が施された画像データが画像RAM130、表示部150および顔検出部200に出力される。なお、圧縮形式として、例えばJPEG(Joint Photographic Experts Group)形式を採用することができる。
【0036】
表示部150は、カメラ信号処理部123または画像圧縮伸張部140が出力した画像データに対応する画像を表示する表示部である。
【0037】
操作受付部160は、ユーザにより行われた各種の操作を受け付ける操作受付部であり、受け付けられた操作内容をCPU110に出力する。なお、表示部150および操作受付部160については、タッチパネルとして一体で構成するようにしてもよく、表示部150を液晶ディスプレイ(LCD)とし、操作受付部160を十字キー等のハードキーとして双方を別体で構成するようにしてもよい。
【0038】
記憶媒体170は、画像圧縮伸張部140が出力した画像データを記憶するとともに、記憶されている画像データを画像圧縮伸張部140に出力する画像記憶媒体である。なお、画像記憶媒体としては、磁気ディスク、光ディスク、半導体記憶媒体、磁気テープ等の画像記憶媒体がある。また、画像記憶媒体は、外部取り外しの可能な記憶媒体または内蔵の記憶媒体とすることができる。
【0039】
揮発/不揮発性記憶媒体180は、各種情報を記憶する揮発/不揮発性の記憶媒体である。
【0040】
画像バス190は、画像データを伝達するための共有バスである。
【0041】
顔検出部200は、入力された画像データに対応する画像に含まれる人の顔を検出するものであり、検出された顔を含むその周辺画像である顔画像を画像バス190を介して画像RAM130に出力するとともに、検出された顔に関する情報を顔認識部300に出力する。なお、顔検出部200については、図2を参照して詳細に説明する。
【0042】
顔認識部300は、顔検出部200によって検出された顔について、顔特徴量RAM390に特徴量が記憶されている人物(登録人物)と同一人物の顔であるか否かを示す類似度を算出するものであり、算出された類似度をCPU110に出力する。なお、顔認識部300および顔特徴量RAM390については、図3を参照して詳細に説明する。
【0043】
なお、CPU110の制御に基づいて、画像圧縮伸張部140が出力した画像データを外部記憶媒体等の外部装置に出力するとともに、外部記憶媒体から入力された画像データを画像圧縮伸張部140に出力するための入出力端子を、撮像装置100に設けるようにしてもよい。
【0044】
図2は、顔検出部200の機能構成例を示すブロック図である。
【0045】
顔検出部200は、コントローラ210と、画像拡大縮小部220と、画像保持部230と、基準顔データ保持部240と、判定部250とを備える。
【0046】
コントローラ210は、CPU110からの指示に従って顔検出部200の各部を制御するものである。
【0047】
画像拡大縮小部220は、カメラ信号処理部123または画像圧縮伸張部140から出力された画像データ、または、画像RAM130に記憶されている画像データに対応する画像に対して、顔の検出に適する画像に拡大または縮小処理を実行するものである。なお、画像の拡大率または縮小率は、CPU110からの指示に基づいて決定される。
【0048】
画像保持部230は、画像拡大縮小部220により拡大処理または縮小処理が施された画像を保持する画像メモリであり、保持されている画像を判定部250に出力するとともに、画像バス190を介して画像RAM130に出力する。
【0049】
基準顔データ保持部240は、顔検出に用いる際に基準となる顔データを保持するものであり、保持されている顔データを判定部250に出力する。ここで基準となる顔データは、例えば、顔画像そのもの、人の顔に関する特徴データベース等である。
【0050】
判定部250は、画像保持部230に保持されている画像に顔が含まれているか否かを判定するものであり、顔検出結果をCPU110および顔認識部300に出力する。具体的には、判定部250は、画像保持部230に保持されている画像を一定のウィンドウサイズで部分的に取り出し、取り出された画像と、基準顔データ保持部240に保持されている顔データとでテンプレートマッチング処理を行い、相関性の高さに基づいて、顔らしさを算出する。そして、算出された顔らしさに基づいて、取り出された画像が顔画像であるか否かを判定する。例えば、算出された顔らしさが十分に高い場合には、取り出された画像が顔画像であると判定される。これらの判定が繰り返し実行され、画像保持部230に保持されている画像に含まれている顔が検出される。
【0051】
また、判定部250は、基準顔データ保持部240に保持されている顔データとの相関性の高さに基づいて、画像保持部230に保持されている画像に含まれている顔に関する各種データを抽出し、抽出された各種データを顔検出結果としてCPU110および顔認識部300に出力する。この顔検出結果は、顔領域の座標、顔領域の大きさ、顔の向き、顔らしさ等である。これらの顔検出結果はCPU110に蓄えられる。
【0052】
図3は、顔認識部300の機能構成例、および、顔認識部300と、画像RAM130、画像バス190および顔特徴量RAM390との概略関係を示すブロック図である。
【0053】
顔認識部300は、コントローラ310と、正規化部320と、属性判定部330と、属性判定基準データ保持部331と、特徴点算出部340と、特徴点座標テーブル保持部341と、顔特徴量抽出部350と、類似度算出部360と、類似度算出基準データ保持部361と、顔特徴量登録部370とを備える。また、顔認識部300は、画像バス190を介して、画像RAM130に記憶されている画像から、この画像に含まれる顔を含む顔画像を入力する。また、顔認識部300は、顔特徴量RAM390に記憶されている顔特徴量を取得して類似度算出を行い、一定の条件を満たす新規な顔特徴量を顔特徴量RAM390に記録する。
【0054】
コントローラ310は、CPU110からの指示に従って顔認識部300の各部を制御するものである。
【0055】
正規化部320は、顔検出部200から出力された顔検出結果に含まれる顔領域の座標および大きさに基づいて、画像RAM130に記憶されている画像から顔画像を読み出し、読み出された顔画像について正規化を行うものであり、正規化された顔画像である正規化顔画像を属性判定部330および特徴点算出部340に出力する。具体的には、正規化部320は、例えば、画像RAM130から読み出された顔画像に含まれる顔が一定の大きさになるように、その顔画像を解像度変換する(例えば、64×64画素程度)とともに、その顔に含まれる両目がほぼ水平に保たれるように、その顔画像に回転処理を施して正規化顔画像を生成する。なお、顔画像の正規化については、図4を参照して詳細に説明する。
【0056】
属性判定部330は、属性判定基準データ保持部331に保持されている属性判定基準データを用いて、正規化部320から出力された正規化顔画像に含まれる顔の属性を判定するものであり、判定結果を特徴点算出部340、顔特徴量抽出部350および類似度算出部360に出力する。例えば、正規化部320から出力された正規化顔画像について、属性判定基準データ保持部331に保持されている属性判定基準データがどの程度満たされるか否かを算出することにより、各属性についての積算結果値が得られる。ここで、属性判定部330により判定される顔の属性は、例えば、顔の表情、年齢や年代、性別、目の開閉、人種、眼鏡の有無や種類、ヒゲの有無や種類、帽子の有無や種類、アクセサリーの有無や種類、髪型、顔の向き等である。なお、顔の表情とは、例えば、笑顔、真剣な顔、悲しい顔、怒った顔等である。なお、顔の属性の判定については、図5乃至図8を参照して詳細に説明する。
【0057】
属性判定基準データ保持部331は、属性判定部330による判定に用いられる複数の属性判定基準データから構成されている属性判定用辞書を、顔の属性毎に保持するものである。この属性判定基準データは、属性判定部330により判定される顔の属性に関して予め十分に学習をさせた基準データである。なお、属性判定用辞書については、図6を参照して詳細に説明する。
【0058】
特徴点算出部340は、特徴点座標テーブル保持部341に保持されている特徴点座標テーブルに含まれる特徴点座標について、属性判定部330から出力された判定結果に基づいて変更等を行い、正規化部320から出力された正規化顔画像に含まれる顔上に設定すべき特徴点の位置を算出して決定するものであり、算出された特徴点の位置を含む正規化顔画像を顔特徴量抽出部350に出力する。なお、正規化顔画像に含まれる顔上に設定すべき特徴点の位置の算出については、図9乃至図11を参照して詳細に説明する。
【0059】
特徴点座標テーブル保持部341は、特徴点算出部340による特徴点の位置の算出に用いられる特徴点座標テーブルを保持するものである。なお、特徴点座標テーブルについては、図9を参照して詳細に説明する。
【0060】
顔特徴量抽出部350は、特徴点算出部340から出力された正規化顔画像に含まれる各特徴点における特徴量である顔特徴量を抽出するものであり、抽出された顔特徴量を類似度算出部360および顔特徴量登録部370に出力する。本発明の実施の形態では、特徴点における特徴量の抽出方法として、ガボア・フィルタを用いた抽出方法を例にして説明する。なお、ガボア・フィルタを用いて抽出された特徴量は、ガボア・ジェットと呼ばれている。また、本発明の実施の形態では、属性判定部330から出力された判定結果に基づいてガボア・フィルタの変更等を行う。なお、ガボア・フィルタを用いた特徴量の抽出方法については、図12乃至図14を参照して詳細に説明する。
【0061】
類似度算出部360は、類似度算出基準データ保持部361に保持されている類似度算出基準データを用いて、顔特徴量抽出部350から出力された顔特徴量と顔特徴量RAM390から読み出された顔特徴量とを比較することにより、これらの顔特徴量の類似度を算出する。この算出された類似度は、顔検出部200により検出された顔が、顔特徴量RAM390に顔特徴量が記憶されている特定人物と同一人物の顔であるか否かを示す類似度である。また、類似度算出部360は、この算出された類似度をCPU110および顔特徴量登録部370に出力する。本発明の実施の形態では、属性判定部330から出力された判定結果に基づいて、類似度の算出に用いられる類似度算出基準データの変更等を行う。なお、類似度の算出については、図15乃至図22を参照して詳細に説明する。
【0062】
類似度算出基準データ保持部361は、類似度算出部360の判定に用いられる複数の類似度算出基準データから構成されている類似度算出用辞書を、顔の属性毎に保持するものである。この類似度算出基準データは、類似度算出部360により算出される顔の類似度に関して予め十分に学習をさせた基準データである。類似度算出用辞書については、図17を参照して詳細に説明する。
【0063】
顔特徴量登録部370は、コントローラ310の指示に基づいて、顔特徴量抽出部350から出力された顔特徴量の中で一定の条件を満たす顔特徴量を顔特徴量RAM390に登録するものである。すなわち、ユーザが特定人物の顔特徴量の登録を指示した場合、または、撮像装置100の内部で一定の顔登録の条件が満たされたと判断された場合に登録処理が実行される。この登録処理については、図28を参照して詳細に説明する。
【0064】
顔特徴量RAM390は、特定人物の顔について抽出された顔特徴量と、この特定人物について判定された顔の属性とを人物毎に関連付けて記憶するものであり、記憶されている顔特徴量および顔の属性を画像バス190を介して類似度算出部360に供給する。また、顔特徴量RAM390は、顔特徴量登録部370から出力された顔特徴量を人物毎に上書きまたは追加して記録する。なお、顔特徴量RAM390の記憶内容については、図15を参照して詳細に説明する。
【0065】
次に、顔画像を正規化する場合について図面を参照して詳細に説明する。
【0066】
図4は、顔検出部200により検出された顔を含むその周辺画像である顔画像を正規化する場合における正規化の一例を示す図である。
【0067】
図4(a)は、カメラ信号処理部123から出力された画像データに対応する撮像画像400を示す図である。撮像画像400には人物401の顔402が含まれているものとする。この場合に、顔検出部200により撮像画像400から顔402が検出されると、顔402の検出結果が顔検出部200から顔認識部300に出力される。顔認識部300が顔402の検出結果を入力すると、顔402を含む顔画像403が画像RAM130から読み出され、この読み出された顔画像403が正規化部320に入力される。
【0068】
図4(b)および(c)は、顔検出部200により検出された顔402を含む顔画像403を正規化する場合における遷移を示す図である。この例では、顔画像を正規化する際に基準となる基準位置410が規定されている。基準位置410は、例えば、顔検出部200により検出された顔に含まれる両目が、ほぼ水平に保たれるとともに、正規化顔画像における一定の位置に配置されるように、顔画像を変換するための基準位置である。
【0069】
例えば、撮像画像400から取り出された顔画像403について、顔画像403に含まれる顔402が一定の大きさになるように解像度変換されるとともに、顔402に含まれる目404および405の中心位置が、基準位置410の線上に合致するとともに、ほぼ水平に保たれるように、顔画像がアフィン変換等によって回転処理されて、正規化顔画像420が生成される。
【0070】
なお、本発明の実施の形態では、両目の中心位置を基準として正規化を行う場合について説明するが、顔に含まれる両目以外の他の器官の位置を基準として用いるようにしてもよい。
【0071】
次に、顔の属性判定について図面を参照して詳細に説明する。
【0072】
図5は、属性の判定対象となる顔画像を概略的に示す図である。図5(a)には人物の顔として通常の顔431を含む正規化顔画像430を示し、図5(b)には人物の顔として笑顔441を含む正規化顔画像440を示す。ここで、通常の顔と笑顔とを比較した場合、一般的に、笑顔には、目が細くなる、眉尻や目尻が下がる、頬の位置が上がる、鼻の両脇が横に広がる、口が横に広がる、口が開く、口の両端が上がる等の特徴的な点が生じることが多い。そこで、これらの笑顔の特徴的な状態に対応する属性判定基準データを属性判定基準データ保持部331に保持しておき、この属性判定基準データを笑顔の属性判定または笑顔の度合い判定に用いる。この属性判定基準データを用いた判定方法については、図6乃至図8を参照して詳細に説明する。また、図5(b)に示す位置442乃至447については、図6を参照して詳細に説明する。
【0073】
図6は、正規化顔画像について顔の属性判定を行う場合に用いられる属性判定用辞書の構成例を示す図である。本発明の実施の形態では、画素差分での相関性判断手法を用いて顔の属性判定を行う例について説明する。
【0074】
属性判定用辞書450を構成する属性判定基準データは、正規化顔画像における2点の位置を示す正規化顔画像の座標0(x,y)451および正規化顔画像の座標1(x,y)452と、座標0および座標1のレベル差(輝度差)に対する閾値(θ)453と、座標0および座標1のレベル差の値と閾値(θ)との比較結果に基づいて加算される重み係数である基準データの重み(α)454とから構成されている。また、属性判定用辞書450には、これらの各値の組合せからなる基準データがn個格納されている。なお、本発明の実施の形態で示す基準データは、弱判別器(弱仮説)と称される。
【0075】
属性判定基準データを構成する各値は、例えば、アダブースト(AdaBoost)等の機械学習アルゴリズムにより学習されたもののうちで、最も効果的な上位300乃至1000組の組合せを用いて設定される。このように、各属性判定用辞書の形式が同一であるため、複数の判定処理を同一のアルゴリズムで行うことができる。
【0076】
次に、正規化顔画像について属性判定用辞書を用いて顔の属性判定を行う例について図面を参照して詳細に説明する。この例では、図5(b)に示す正規化顔画像440の左上隅を原点として、横軸をx軸とし、縦軸をy軸として、正規化顔画像440について属性判定用辞書450を用いた属性判定処理をする場合について説明する。
【0077】
例えば、属性判定用辞書450の1行目(基準データ0)に格納されている座標0(x,y)451の値に対応する正規化顔画像440の位置を位置442とし、座標1(x,y)452の値に対応する正規化顔画像440の位置を位置443とする。また、属性判定用辞書450の2行目(基準データ1)に格納されている座標0(x,y)451の値に対応する正規化顔画像440の位置を位置444とし、座標1(x,y)452の値に対応する正規化顔画像440の位置を位置445とする。さらに、属性判定用辞書450の3行目(基準データ2)に格納されている座標0(x,y)451の値に対応する正規化顔画像440の位置を位置446とし、座標1(x,y)452の値に対応する正規化顔画像440の位置を位置447とする。
【0078】
最初に、判定を行うためのスコアSの値に0がセットされ、属性判定用辞書450の基準データ0に含まれる各値を用いた演算が行われる。具体的には、属性判定用辞書450基準データ0に含まれる座標0(x,y)451の値に対応する位置442における輝度の値A(0)と、座標1(x,y)452の値に対応する位置443における輝度の値B(0)とが抽出され、次式を用いて、抽出された各輝度の値の差C(0)が算出される。
C(0)=A(0)−B(0)
【0079】
続いて、算出された各輝度の差の値C(0)と、属性判定用辞書450基準データ0に含まれる閾値(θ)453の値とを比較して、算出された値C(0)が閾値(θ)453の値よりも大きいか否かが判断される。算出された値C(0)が閾値(θ)453の値以下である場合には、属性判定用辞書450の基準データ0に含まれる重み(α)454の値をスコアSに加算する。一方、算出された値C(1)が閾値(θ)453の値よりも大きい場合には、属性判定用辞書450の基準データ0に含まれる重み(α)454の値をスコアSに加算しない。
【0080】
続いて、属性判定用辞書450の基準データ1に含まれる各値を用いて、上述した各演算を繰り返す。具体的には、属性判定用辞書450の基準データ1に含まれる座標0(x,y)451の値に対応する位置444における輝度の値A(1)と、座標1(x,y)452の値に対応する位置445における輝度の値B(1)とが抽出され、次式を用いて、抽出された各輝度の値の差C(1)が算出される。
C(1)=A(1)−B(1)
【0081】
続いて、算出された各輝度の差の値C(1)と、属性判定用辞書450の基準データ1に含まれる閾値(θ)453の値とを比較して、算出された値C(1)が閾値(θ)453の値よりも大きいか否かが判断される。算出された値C(1)が閾値(θ)453の値以下である場合には、属性判定用辞書450の基準データ1に含まれる重み(α)454の値をスコアSに加算する。一方、算出された値C(1)が閾値(θ)453の値よりも大きい場合には、属性判定用辞書450の基準データ1に含まれる重み(α)454の値をスコアSに加算しない。
【0082】
続いて、属性判定用辞書450の基準データ3以降、基準データn−1までの各値を順次用いて、上述した各演算を繰り返す。
【0083】
すなわち、正規化顔画像440について属性判定用辞書450を用いた判定処理をする場合には、属性判定用辞書450の基準データ0乃至n−1に含まれる各値を順次用いて、式1を用いてC(i)が算出され、算出されたC(i)が式2を満たすか否かが判定される。ここで、変数iは整数であり、0からn−1の値を示す。
C(i)=A(i)−B(i)……(式1)
C(i)>θ(i) ……(式2)
【0084】
そして、算出されたC(i)が式2を満たす場合には、α(i)の値がスコアSに加算されず、算出されたC(i)が式2を満たさない場合には、α(i)の値がスコアSに加算される。ここで、基準データiに含まれる座標0(x,y)451に対応する輝度の値をA(i)で表し、基準データiに含まれる座標1(x,y)452に対応する輝度の値をB(i)で表し、基準データiに含まれる閾値(θ)453の値をθ(i)で表し、基準データiに含まれる重み(α)454の値をα(i)で表す。
【0085】
そして、属性判定用辞書450の基準データn−1に含まれる各値を用いた各演算が終了した後に、積算結果値であるスコアSの値に基づいて各属性が判定される。
【0086】
ここで、属性判定用辞書の基準データ0乃至n−1に含まれる各値を用いた各演算の終了後におけるスコアS(P)は、次の式3で表すことができる。
【数1】

【0087】
ここで、S(P)は基準データ0乃至n−1の積算結果値を示し、αは基準データiに含まれる重み(α)454の値を示し、P(xi0,yi0)は基準データiに含まれる座標0(x,y)451に対応する輝度の値を示し、P(xi1,yi1)は基準データiに含まれる座標1(x,y)452に対応する輝度の値を示し、θは基準データiに含まれる閾値(θ)453の値を示し、nは基準データの数を示す。また、h(z)は、z>0の場合には0となり、z≦0の場合には1となる関数を表すものとする。
【0088】
次に、属性判定用辞書の基準データ0乃至n−1に含まれる各値を用いて算出された積算結果値に基づいて顔属性を判定する判定方法について図面を参照して詳細に説明する。
【0089】
図7は、正規化顔画像について属性判定用辞書を用いて求められる各顔属性に関する積算結果値の範囲を示す図である。図7(a)には、顔属性として笑顔に関する積算結果値の範囲を示し、図7(b)には、顔属性として性別に関する積算結果値の範囲を示し、図7(c)には、顔属性として年代に関する積算結果値の範囲を示す。図7(a)乃至(c)に示す各属性に関する積算結果値の範囲は、例えば、−1000〜+1000の範囲とする。
【0090】
例えば、上述の機械学習アルゴリズムによって学習時における笑顔の学習サンプルを正側とし、非笑顔の学習サンプルを負側として学習した場合において、顔属性として笑顔を判定する場合には、図7(a)に示す閾値461および462を用いて、笑顔/非笑顔が判定される。
【0091】
例えば、図7(a)に示す笑顔に関する積算結果値の範囲において、属性判定用辞書の基準データ0乃至n−1に含まれる各値を用いて算出された積算結果値であるスコアS(P)が閾値461未満である場合には、「非笑顔」であると判定される。一方、スコアS(P)が閾値462よりも大きい場合には、「笑顔」であると判定される。また、スコアS(P)が閾値461から閾値462の範囲内にある場合には、笑顔/非笑顔の何れにも判定されず、「あいまい」であると判定される。また、図7(b)および(c)に示す各属性についても、図7(a)と同様に判定することができる。これらの判定結果および積算結果値が、属性判定部330から特徴点算出部340、顔特徴量抽出部350および類似度算出部360に出力される。
【0092】
図8は、各属性に関する判定結果および積算結果値の一例を示す図である。同図に示すように、各正規化顔画像について判定結果および積算結果値が属性判定部330から出力される。例えば、顔の属性として笑顔/非笑顔471については、判定結果として「笑顔」、「非笑顔」、「あいまい」が出力されるとともに、積算結果値としてスコアS(P)の値が出力される。また、顔の属性として、男性/女性(性別)472、大人/子供(年代)473についても、同様に判定結果および積算結果値が出力される。
【0093】
次に、正規化顔画像における特徴点の位置の算出について図面を参照して詳細に説明する。
【0094】
図9は、正規化部320により生成された正規化顔画像に設定すべき特徴点の位置を算出する特徴点位置算出方法の一例を示す図である。図9(a)は、正規化顔画像に設定すべき特徴点の位置を算出する場合に用いられる特徴点座標テーブルの一例である特徴点座標テーブル500を示す図である。特徴点座標テーブル500は、正規化顔画像に設定すべき特徴点の座標を保持するものであり、特徴点座標テーブル保持部341に保持されている。図9(a)では、設定の対象となる正規化顔画像の大きさを白塗りの四角で示し、特徴点を設定すべき座標に対応する位置を黒塗りの丸で示す。ここで、例えば、特徴点座標の初期値として、大人の顔画像に合わせて各座標を定めておくものとする。また、図9乃至図11では、説明のため、特徴点の数を比較的少なくした例を図示する。
【0095】
図9(b)は、正規化部320により生成された正規化顔画像の一例である正規化顔画像510を示す図である。ここで、正規化顔画像510に含まれる顔511は、比較的普通の大人の顔であるものとする。図9(c)は、図9(b)に示す正規化顔画像510において、図9(a)に示す特徴点座標テーブル500に含まれる座標に特徴点が設定された場合を示す図である。なお、図9(c)では、正規化顔画像510に配置された特徴点を黒塗りの丸で示す。このように、正規化部320により生成された正規化顔画像510に含まれる顔が、比較的普通の大人の顔である場合には、特徴点座標テーブル500に含まれる座標に対応する位置に特徴点を設定することにより、比較的適切な位置に特徴点を設定することができる。
【0096】
しかしながら、類似度算出の対象となる正規化顔画像は、両目の位置に基づいて正規化されているものの、正規化顔画像に含まれる人物の属性によっては各部に差異が生じていることが多い。このため、正規化顔画像に設定すべき特徴点座標を一義的に定めておくことは困難である場合がある。そこで、本発明の実施の形態では、属性判定部330により判定された顔属性に基づいて、正規化顔画像に含まれる顔に適するように、特徴点を設定する位置について変更または追加等を行う。
【0097】
図10は、正規化部320により生成された正規化顔画像に特徴点を設定する場合における配置例を示す図である。図10(a)に示す正規化顔画像520は、図9(c)に示す正規化顔画像520と同じである。図10(b)は、子供の顔が含まれる正規化顔画像531を示す図であり、図10(c)は、西洋人の顔が含まれる正規化顔画像532を示す図であり、図10(d)は、東洋人の顔が含まれる正規化顔画像533を示す図であり、図10(e)は、左向きの顔が含まれる正規化顔画像534を示す図であり、図10(f)は、右向きの顔が含まれる正規化顔画像535を示す図である。
【0098】
図10(b)に示すように、子供の顔は、一般的に、目、鼻、口等の顔の器官が真中寄りに集まっている場合が多い。そこで、年代に関する顔属性の判定結果として、子供が判定されている場合(子供の度合いが比較的高い場合)には、積算結果値である子供の度合いに応じて、子供に比べておおむね面長(おもなが)である大人の特徴点(特徴点座標テーブル500に含まれる座標に対応する位置)を垂直方向に縮小(または、水平方向に拡大)するように変更する。
【0099】
また、図10(c)に示すように、西洋人の顔は、一般的に、比較的面長(おもなが)である場合が多い。これに対して、図10(d)に示すように、東洋人の顔は、一般的に、比較的丸顔である場合が多い。例えば、正規化顔画像532に含まれる西洋人の顔の横幅L1と、正規化顔画像533に含まれる東洋人の顔の横幅L2とを比較した場合には、東洋人の横幅L2の値が大きい。そこで、人種に関する顔属性の判定結果に基づいて、特徴点座標テーブル500に含まれる座標に対応する位置を水平方向に縮小または拡大するように変更する。
【0100】
また、図10(e)または(f)に示すように、左向きまたは右向きの顔については、顔の向きに応じて目、鼻、口等の顔の器官が左寄りまたは右寄りとなる。そこで、顔の向きに関する顔属性の判定結果に基づいて、特徴点座標テーブル500に含まれる座標に対応する位置を水平方向に移動させるように変更する。図10(b)乃至(f)に示すように、顔属性の判定結果に基づいて、特徴点の位置を変更することによって、類似度算出の対象となる顔に最適な特徴点の設定が可能となり、さらに高精度な特徴点算出が可能になる。これにより、人物認識の精度をさらに向上させることができる。
【0101】
図11は、正規化部320により生成された正規化顔画像に特徴点を設定する場合における配置例を示す図である。図11(a)乃至(c)に示す正規化顔画像520は、図9(c)に示す正規化顔画像520と同じである。
【0102】
図11(a)に示す正規化顔画像540は、正規化顔画像520に含まれる顔511に眼鏡541が付加された場合における正規化顔画像を示す図である。図11(b)に示す正規化顔画像550は、正規化顔画像520に含まれる顔511にヒゲ551が付加された場合における正規化顔画像を示す図である。図11(c)に示す正規化顔画像560は、正規化顔画像520に含まれる顔511に帽子561が付加された場合における正規化顔画像を示す図である。
【0103】
図11(a)に示すように、検出された顔の属性として、眼鏡の積算結果値が高い場合(眼鏡ありと判定された場合等)には、眼鏡の周辺と考えられる位置に特徴点が追加される。例えば、眼鏡541の周辺に特徴点542乃至545が追加して配置される。また、図11(b)に示すように、検出された顔の属性として、ヒゲの積算結果値が高い場合(ヒゲありと判定された場合等)には、ヒゲの周辺と考えられる位置に特徴点が追加される。例えば、ヒゲ551の周辺に特徴点552および553が追加して配置される。なお、図11(a)および(b)に示すように特徴点を追加する代わりに、他の特徴点を、眼鏡またはヒゲの周辺に移動させるようにしてもよい。眼鏡の種類や形状、ヒゲの位置や広さについても判定することができる場合には、これらの判定結果に応じて、特徴点座標を切り替えるようにしてもよい。
【0104】
ここで、帽子は特徴があるものの、変動し易い属性であることが多い。このため、図11(c)に示すように、検出された顔の属性として、帽子の積算結果値が高い場合(帽子ありと判定された場合等)には、頭の位置に相当すると考えられる範囲に存在する特徴点が削除される。例えば、図11(c)に示す正規化顔画像520において点線562で囲まれている特徴点が削除される。また、眼鏡、ヒゲ、帽子等の属性が複数存在する場合には、これらに応じて上述した追加または削除等を行う。図11(a)乃至(c)に示すように、顔属性の判定結果に基づいて、特徴点を追加または削除することによって、類似度算出の対象となる顔に最適な特徴点の設定が可能となり、さらに高精度な特徴点算出が可能になる。これにより、人物認識の精度をさらに向上させることができる。
【0105】
これらの特徴点座標の算出は、特徴点座標テーブル保持部341に保持されている特徴点座標テーブル500を初期値として、この初期値の座標を基準として、顔属性の判定結果に基づいて、拡大または縮小等の演算により行う。また、CPU110から特徴点座標を直接ロードするようにしてもよい。また、両者を組み合わせるようにしてもよい。また、顔属性の判定結果に応じた複数の特徴点座標テーブルを特徴点座標テーブル保持部341に保持しておき、顔属性の判定結果に応じて、特徴点座標テーブルを選択するようにしてもよい。また、積算結果値の大小に応じて、特徴点座標の位置の拡大または縮小等の演算を行うようにしてもよい。
【0106】
次に、正規化顔画像に設定された特徴点における特徴量の抽出について図面を参照して詳細に説明する。図9乃至図11に示すように、正規化部320により生成された正規化顔画像に各特徴点が設定された後に、各特徴点について特徴量抽出処理を行う。なお、本発明の実施の形態では、特徴量の抽出方法として、ガボア・フィルタ(gabor filter)を用いた抽出方法を例にして説明する。なお、ガボア・フィルタは、ガボール・フィルタと称されることもある。
【0107】
図12(a)は、特徴点における特徴量の抽出に用いられるガボア・フィルタの一例を示す図である。ガボア・フィルタには、抽出する帯域とフィルタをかける画像上の角度との2つのパラメータが主に存在する。図12(a)に示すガボア・フィルタは、横方向は角度の種類を示し、縦方向は帯域の種類を示す。この例では、帯域の種類は、下から上に進むに従って低い周波数から高い周波数となる。また、角度の種類は、22.5度ずつ回転させたものである。すなわち、角度の種類として、0度、22.5度、45度、67.5度、90度、112.5度、135度、157.5度のように等間隔に設定する。このように、本発明の実施の形態では、どのような属性の顔でも特徴量を抽出することができるようなパラメータ設定として、5種類の周波数と8種類の角度とからなる40種類のフィルタを例にして説明する。なお、本発明の実施の形態では、平均的な顔を広く対象とするパラメータ設定として40種類のフィルタを例にして説明するが、フィルタの数等について適宜増減するようにしてもよい。例えば、角度の種類としてさらに細かく分割した角度を設定することによって、高精度な特徴量を抽出することができる。例えば、角度の種類を10種類とする場合には、18度、36度、54度、72度、…、162度のように等間隔に設定することができる。また、角度の種類を12種類とする場合には、15度、30度、45度、60度、…、165度のように等間隔に設定することができる。ここで、角度の種類として細かく分割した角度を設定する場合には、角度の種類の増加に応じてデータ処理量が増えることになる。そこで、処理速度や処理装置の規模との兼ね合いを考慮して、角度の種類を設定することができる。
【0108】
図12(b)は、図12(a)に示す40種類のガボア・フィルタの中の1つのフィルタ600の係数を3次元空間上に表すグラフを示す図である。フィルタ600は、画像上の45度の方向に対して、比較的高めの帯域を抽出するフィルタである。また、図12(b)に示すように、フィルタ600の係数の特徴点における振幅が頂点となるようなガウス曲線が包絡線となる。
【0109】
図13は、正規化顔画像の一例である正規化顔画像630を示す図である。ここでは、正規化顔画像630に含まれる顔640上に設定されている複数の特徴点の中の3つの特徴点641乃至643を例にして説明する。
【0110】
特徴点641乃至643は、正規化顔画像630に含まれる顔640上に設定された特徴点であり、例えば、特徴点641は左目の下付近に配置され、特徴点642は右目の目尻付近に配置され、特徴点643は鼻の頭付近に配置されている。
【0111】
ガボア・フィルタを用いて特徴点における特徴量を抽出する場合には、特徴点の画素とその周辺に存在する画素とを含む近傍画素を用いる。この近傍画素として、例えば、特徴点を中心とする20画素×20画素を用いることができる。例えば、同図に示す正規化顔画像630に設定されている特徴点641乃至643の近傍画素をそれぞれ近傍画素645乃至647として、点線の四角で示す。
【0112】
そして、特徴点の近傍画像と、ガボア・フィルタに含まれる各帯域および各角度の係数とによって、次の(式4)に示すたたみ込み演算を行う。これにより、特定の人物を認識するための有意な値として、特徴点における特徴量であるガボア・ジェットが得られる。このたたみ込み演算を、各特徴点について順次演算することにより、各特徴点における特徴量(ガボア・ジェット)を得ることができる。
【数2】

【0113】
ここで、p(x,y)は近傍画像の輝度を示し、g(x,y)はガボア・フィルタ係数を示し、c(x,y)はたたみ込み結果値を示す。
【0114】
ここで、本発明の実施の形態では、顔特徴量抽出部350は、ガボア・フィルタのパラメータの初期値をロードして、属性判定部330により判定された顔の属性の判定結果に基づいて、初期値のガボア・フィルタのパラメータを変更する。すなわち、属性判定部330により判定された顔の属性の判定結果に基づいて、ガボア・フィルタのパラメータである通過帯域や特徴抽出角度を切り替える。
【0115】
例えば、属性判定部330により判定された顔属性の判定結果として、「子供」または「赤ちゃん」の積算結果値が高い場合(「子供」または「赤ちゃん」であると判定された場合)には、低周波数帯域のフィルタの種類を増やすことによりパラメータを最適化することができる。一方、「大人」の積算結果値が高い場合(「大人」であると判定された場合)には、高周波数帯域のフィルタの種類を増やすことによりパラメータを最適化することができる。ここで、一般的に、「子供」や「赤ちゃん」の顔は、「大人」と比較して、なめらかな肌(なだらかな肌)であることが多い。このように顔の表面がなめらかな肌である場合には、顔の表面の変化が少ない。このため、「子供」または「赤ちゃん」の顔について特徴量を抽出する場合には、高周波数帯域よりも低周波数帯域を重視することによって、さらに高精度な特徴量を抽出することができる。一方、「大人」の顔について特徴量を抽出する場合には、低周波数帯域よりも高周波数帯域を重視することによって、さらに高精度な特徴量を抽出することができる。また、例えば、笑顔の積算結果値が高い場合には、笑顔に最適なガボア・フィルタ帯域、または、最適なガボア・フィルタ角度に切り替える。このように顔の属性の判定結果に基づいて、ガボア・フィルタを変更することにより、さらに高精度な特徴点における特徴量の抽出が可能になる。
【0116】
なお、ガボア・フィルタのパラメータの初期値は、内部メモリに保持しておくようにしてもよく、CPU110から設定するようにしてもよい。
【0117】
図14は、図12(a)に示すガボア・フィルタを用いて、正規化顔画像に設定された特徴点における特徴量が抽出された場合における各特徴量の集合である顔特徴量650を模式的に示す図である。
【0118】
顔特徴量650は、正規化顔画像に20点の特徴点が設定されている場合において、5種類の帯域と8種類の角度とからなるガボア・フィルタを用いて各特徴点における特徴量が抽出された場合におけるガボア・ジェットの集合を示す。顔特徴量650は、例えば、特徴点毎に抽出された20個のガボア・ジェットを、行651乃至655と列656乃至659とからなる行列状に示すものである。また、1個のガボア・ジェットを構成する各特徴量の大きさについては、大小に応じて白黒の色レベルで示す。なお、図14に示すガボア・ジェットの配置構成は一例であり、保存形式とは無関係である。また、顔特徴量を用いた類似度の算出については、図18を参照して詳細に説明する。
【0119】
図15は、顔特徴量RAM390に格納されている各情報を模式的に示す図である。顔特徴量RAM390には、正規化顔画像の識別番号391に関連付けて、その正規化顔画像について抽出されたガボア・ジェットの集合である顔特徴量399が格納されるとともに、その正規化顔画像に含まれる顔に関する属性の判定結果が格納される。顔属性として、例えば、笑顔/非笑顔392、男性/女性(性別)393、大人/子供(世代)394、目の開閉395、顔の向き396、ヒゲの有無397、眼鏡の有無398が格納される。なお、顔特徴量RAM390への各特徴量の登録方法については、図28を参照して詳細に説明する。
【0120】
図16は、類似度算出基準データ保持部361に保持されている類似度算出用辞書を模式的に示す図である。類似度算出基準データ保持部361は、顔特徴量同士の類似度を算出する場合に最適な類似度算出用辞書を有限個数保持する内部メモリであり、例えば、一般用辞書701と、子供用辞書702と、大人用辞書703と、目閉じ用辞書704と、目開き用辞書705と、右向き用辞書706と、正面向き用辞書707と、左向き用辞書708と、ヒゲ用辞書709と、眼鏡用辞書710とが保持される。一般用辞書701は、年齢や性別等を全て平均化し、ごく一般的な顔に関して最適となる基準データのみを保持する辞書である。これに対して、子供用辞書702乃至眼鏡用辞書710は、所定の顔属性に限定して学習させた辞書であり、所定の顔属性に応じた顔に関して最適となる基準データを保持する辞書である。
【0121】
図17は、正規化顔画像に設定された各特徴点から抽出されたガボア・ジェットを用いて、判定対象の顔の類似度を算出する場合に用いられる類似度算出用辞書の構成例を示す図である。本発明の実施の形態では、顔属性判定と同様に、差分での相関性判断手法を用いて顔の類似度を算出する例について説明する。
【0122】
類似度算出用辞書660を構成する類似度算出基準データは、顔特徴量における2点の位置を示す顔特徴量の座標0(x,y)661および座標1(x,y)662と、座標0および座標1の差分値に対する閾値(θ)663と、座標0および座標1の差分値と閾値(θ)との比較結果に基づいて加算される重み係数である基準データの重み(α)664とから構成されている。また、類似度算出用辞書660には、これらの各値の組合せからなる基準データがn個格納されている。なお、顔特徴量における2点の位置を示す顔特徴量の座標の代わりに、他の位置情報を保持して用いるようにしてもよい。例えば、各ガボア・ジェットに識別番号を付与しておき、ガボア・ジェットの識別番号と、ガボア・ジェットの帯域の種類および角度の種類とを位置情報として用いることができる。
【0123】
次に、類似度算出用辞書を用いて判定対象の顔の類似度を算出する例について図面を参照して詳細に説明する。
【0124】
図18は、正規化顔画像に設定された各特徴点から抽出されたガボア・ジェットを用いて、判定対象の顔の類似度を算出する算出方法を概略的に示す図である。
【0125】
判定対象の顔特徴量670は、正規化顔画像に設定された各特徴点から抽出された複数のガボア・ジェットから構成される顔特徴量である。また、登録顔特徴量680は、顔特徴量RAM390に記憶されている特定人物の顔に関する複数のガボア・ジェットから構成される顔特徴量である。判定対象の顔特徴量670および登録顔特徴量680は、例えば、図14に示す顔特徴量650に対応するものであり、判定対象の顔特徴量670および登録顔特徴量680には、同じ形式であるとともに同じ数のガボア・ジェットが格納されているものとする。
【0126】
この例では、判定対象の顔特徴量670および登録顔特徴量680の左上隅を原点として、横軸をx軸とし、縦軸をy軸として、類似度算出用辞書660を用いて、判定対象の顔特徴量670と登録顔特徴量680との類似度を算出する場合について説明する。
【0127】
例えば、類似度算出用辞書660の1行目(基準データ0)に格納されている座標0(x,y)661の値に対応する判定対象の顔特徴量670の位置を位置671とし、座標0(x,y)661の値に対応する登録顔特徴量680の位置を位置681とする。また、座標1(x,y)662の値に対応する判定対象の顔特徴量670の位置を位置672とし、座標1(x,y)662の値に対応する登録顔特徴量680の位置を位置682とする。なお、判定対象の顔特徴量670および登録顔特徴量680において、座標0(x,y)661および座標1(x,y)662の値に対応する位置は、1個のガボア・ジェットを構成する各特徴量の中の1つの特徴量の位置である。この特徴量の位置は、例えば、図14に示す顔特徴量650において、行651および列656に対応する1個のガボア・ジェット(左上隅に存在するガボア・ジェット)の中の1つの特徴量(白黒の色レベルで示す四角)673の位置である。
【0128】
最初に、類似度算出のためのスコアS1の値に0がセットされ、類似度算出用辞書660の基準データ0に含まれる各値を用いた演算が行われる。具体的には、類似度算出用辞書660の基準データ0に含まれる座標0(x,y)661の値に対応する判定対象の顔特徴量670の位置671における特徴量の値A0(0)と、登録顔特徴量680の位置681における特徴量の値B0(0)とが取り出され、次式を用いて、取り出された特徴量の値の差の絶対値C0(0)が算出される(691)。
C0(0)=|A0(0)−B0(0)|
【0129】
続いて、類似度算出用辞書660の基準データ0に含まれる座標1(x,y)662の値に対応する判定対象の顔特徴量670の位置672における特徴量の値A1(0)と、登録顔特徴量680の位置682における特徴量の値B1(0)とが取り出され、次式を用いて、取り出された特徴量の値の差の絶対値C1(0)が算出される(692)。
C1(0)=|A1(0)−B1(0)|
【0130】
続いて、次式を用いて、算出された絶対値C0(0)と絶対値C1(0)との差の絶対値C2(0)が算出される(693)。
C2(0)=|C0(0)−C1(0)|
【0131】
続いて、算出された絶対値C2(0)と、類似度算出用辞書660の基準データ0に含まれる閾値(θ)663の値とを比較して、算出された絶対値C2(0)が閾値(θ)663の値よりも大きいか否かが判断される。算出された絶対値C2(0)が閾値(θ)663の値以下である場合には、類似度算出用辞書660の基準データ0に含まれる重み(α)454の値をスコアS1に加算する。一方、算出された値C(1)が閾値(θ)663の値よりも大きい場合には、類似度算出用辞書660の基準データ0に含まれる重み(α)454の値をスコアS1に加算しない。
【0132】
続いて、類似度算出用辞書660の基準データ2以降、基準データn−1までの各値を順次用いて、上述した各演算を繰り返す。
【0133】
すなわち、判定対象の顔特徴量670および登録顔特徴量680について類似度算出用辞書660を用いた類似度算出処理をする場合には、類似度算出用辞書660の基準データ0乃至n−1に含まれる各値を順次用いて、式5乃至7を用いてC2(i)が算出され、算出されたC2(i)が式8を満たすか否かが判定される。ここで、変数iは整数であり、0からn−1の値を示す。
C0(i)=|A0(i)−B0(i)|……(式5)
C1(i)=|A1(i)−B1(i)|……(式6)
C2(i)=|C0(i)−C1(i)|……(式7)
C2(i)>θ(i) ……(式8)
【0134】
そして、算出されたC2(i)が式8を満たす場合には、α(i)の値がスコアS1に加算されず、算出されたC2(i)が式8を満たさない場合には、α(i)の値がスコアS1に加算される。ここで、基準データiに含まれる座標0(x,y)661に対応する判定対象の顔特徴量670の特徴量をA0(i)で表すとともに、登録顔特徴量680の特徴量をB0(i)で表す。また、基準データiに含まれる座標1(x,y)662に対応する判定対象の顔特徴量670の特徴量をA1(i)で表すとともに、登録顔特徴量680の特徴量をB1(i)で表す。また、基準データiに含まれる閾値(θ)663の値をθ(i)で表し、基準データiに含まれる重み(α)454の値をα(i)で表す。
【0135】
そして、類似度算出用辞書660の基準データn−1に含まれる各値を用いた各演算が終了した後に、積算結果値であるスコアの値が、類似度を示す値として出力される。このように、ガボア・ジェットの状態で保持されている登録顔特徴量と判定対象の顔特徴量との間で、2段階に渡って類似度を算出する。
【0136】
ここで、属性判定用辞書の基準データ0乃至n−1に含まれる各値を用いた各演算の終了後におけるスコアS1(P)は、次の式9で表すことができる。
【数3】

【0137】
ここで、S1(P)は基準データ0乃至n−1の積算結果値を示し、αは基準データiに含まれる重み(α)664の値を示し、P(xi0,yi0)は基準データiに含まれる座標0(x,y)661に対応する判定対象の顔特徴量670における特徴量の値を示し、P(xi0,yi0)は基準データiに含まれる座標0(x,y)661に対応する登録顔特徴量680における特徴量の値を示し、P(xi1,yi1)は基準データiに含まれる座標1(x,y)662に対応する判定対象の顔特徴量670における特徴量の値を示し、P(xi1,yi1)は基準データiに含まれる座標1(x,y)662に対応する登録顔特徴量680における特徴量の値を示し、θは基準データiに含まれる閾値(θ)663の値を示し、nは基準データの数を示す。また、h(z)は、z>0の場合には0となり、z≦0の場合には1となる関数を表すものとする。
【0138】
なお、顔属性の判定結果または顔属性の積算結果値に基づいて、重み(α)664の値または閾値(θ)663の値を変更して最適化を図るようにしてもよい。例えば、顔属性の判定結果または顔属性の積算結果値に応じた値を、重み(α)664の値または閾値(θ)663の値に乗算することができる。
【0139】
次に、判定対象の顔の類似度を算出する場合に用いられる類似度算出用辞書について図面を参照して詳細に説明する。
【0140】
図19は、判定対象の顔の類似度算出に用いられる類似度算出用辞書の例を示す図である。この例では、年代に関する顔属性の判定結果に応じて類似度算出用辞書を選択する例を示す。
【0141】
例えば、同図に示すように、顔属性の判定結果にかかわらず、最初は一般用辞書701を用いる。一般用辞書701は、一般的な類似度算出の1000組の類似度算出基準データにより構成されている類似度算出用辞書である。一般用辞書701を用いた類似度算出処理が終了した後には、年代に関する顔属性の判定結果が大人であるか子供であるかに応じて、子供用辞書702または大人用辞書703を用いて類似度算出処理を行う。子供用辞書702は、子供の類似度算出に最適な1000組の類似度算出基準データにより構成されている類似度算出用辞書である。また、大人用辞書703は、大人の類似度算出に最適な500組の類似度算出基準データにより構成されている類似度算出用辞書である。ここで、一般に子供は大人よりも個体差が少なく、特徴量抽出が困難であると考えられているため、大人用辞書703では500組の類似度算出基準データを用いるのに対し、子供用辞書702では1000組の類似度算出基準データを用いる。このように、特徴量抽出の難易度に応じて類似度算出基準データの組数を変えて保持することにより、対象となる顔に最適な類似度算出基準データを、最適な組数だけ用いて類似度算出処理を行うことができ、高精度な人物認識を実現することができる。
【0142】
図20は、判定対象の顔の類似度算出に用いられる類似度算出用辞書の例を示す図である。この例では、目の開閉に関する顔属性の判定結果に応じて類似度算出用辞書を選択する例を示す。
【0143】
例えば、同図に示すように、顔属性の判定結果にかかわらず、最初は一般用辞書701を用いる。そして、一般用辞書701を用いた類似度算出処理が終了した後には、目の開閉に関する顔属性の判定結果に応じて、目開き用辞書705または目閉じ用辞書704を用いて類似度算出処理を行う。目開き用辞書705は、目が開いた状態の顔の類似度算出に最適な300組の類似度算出基準データにより構成されている類似度算出用辞書である。また、目閉じ用辞書704は、目が閉じた状態の顔の類似度算出に最適な300組の類似度算出基準データにより構成されている類似度算出用辞書である。
【0144】
また、顔特徴量RAM390の目の開閉395に「開」が格納されている登録顔について類似度算出をする場合において、判定対象の顔についての目の開閉に関する顔属性の判定結果が「閉」である場合には、例えば、一般用辞書701を用いた類似度算出処理が終了した後に、目閉じ用辞書704を用いて類似度算出処理を行うものの、目閉じ用辞書704を構成する類似度算出基準データの重みを軽減するようにしてもよい。または、一般用辞書701を用いた類似度算出処理が終了した後には、目閉じ用辞書704を用いた類似度算出処理を行わずに、処理を打ち切るようにしてもよい。このように、登録顔の属性に最適な類似度算出に切り替えることによって、さらに正確な類似度を得ることができる。
【0145】
図21は、判定対象の顔の類似度算出に用いられる類似度算出用辞書の例を示す図である。この例では、顔の向きに関する顔属性の判定結果に応じて類似度算出用辞書を選択する例を示す。
【0146】
例えば、同図に示すように、顔属性の判定結果にかかわらず、最初は一般用辞書701を用いる。そして、一般用辞書701を用いた類似度算出処理が終了した後には、顔の向きに関する顔属性の判定結果に応じて、右向き用辞書706、正面向き用辞書707または左向き用辞書708を用いて類似度算出処理を行う。右向き用辞書706は、右を向いた状態の顔の類似度算出に最適な300組の類似度算出基準データにより構成されている類似度算出用辞書である。また、正面向き用辞書707は、正面を向いた状態の顔の類似度算出に最適な300組の類似度算出基準データにより構成されている類似度算出用辞書である。また、左向き用辞書708は、左を向いた状態の顔の類似度算出に最適な300組の類似度算出基準データにより構成されている類似度算出用辞書である。このように、顔の向きに応じて類似度算出用辞書を選択することにより、登録顔と判定対象となっている顔とが必ずしも同じ方向を向いていなくても、最適な重み付けで類似度算出処理を行うことができるため、さらに正確な類似度を得ることができる。
【0147】
図22は、判定対象の顔の類似度算出に用いられる類似度算出用辞書の例を示す図である。この例では、眼鏡の有無およびヒゲの有無に関する顔属性の判定結果に応じて類似度算出用辞書を選択する例を示す。
【0148】
例えば、同図に示すように、顔属性の判定結果にかかわらず、最初は一般用辞書701を用いる。そして、一般用辞書701を用いた類似度算出処理が終了した後には、眼鏡の有無に関する顔属性の判定結果に応じて、眼鏡用辞書710を用いてさらに類似度算出処理を行うか、類似度算出処理を終了するかを選択する。この場合に、眼鏡用辞書710を用いて類似度算出処理を行うことが選択されて、眼鏡用辞書710を用いた類似度算出処理が終了した後には、ヒゲの有無に関する顔属性の判定結果に応じて、ヒゲ用辞書709を用いてさらに類似度算出処理を行うか、類似度算出処理を終了するかを選択する。眼鏡用辞書710は、眼鏡をかけた状態の顔の類似度算出に最適な500組の類似度算出基準データにより構成されている類似度算出用辞書である。ヒゲ用辞書709は、ヒゲを生やしている状態の顔の類似度算出に最適な500組の類似度算出基準データにより構成されている類似度算出用辞書である。このように、顔の向きに応じて類似度算出用辞書を選択することにより、登録顔と判定対象となっている顔とが必ずしも同じ方向を向いていなくても、最適な重み付けで類似度算出処理を行うことができるため、さらに正確な類似度を得ることができる。
【0149】
このように、顔属性の判定結果に応じて類似度算出用辞書を選択することにより、判定対象の顔について最適な類似度算出処理を行うことができるため、さらに正確な類似度を得ることができる。また、判定対象の顔について、不要な類似度算出基準データを用いた類似度算出処理を行わないため、処理時間の短縮を実現することができる。
【0150】
また、顔属性の中でも、髪型、眼鏡、ヒゲ等のように、同一人物であっても撮影時期や撮影場所によっては変化する要因が高い項目に関しては、対応する各類似度算出基準データの重みを小さく設定しておき、顔属性の差異によって、同一人物の類似度が損なわれないようにすることが可能である。
【0151】
また、判定対象の顔の顔属性の判定結果と、顔特徴量RAM390に記憶されている顔属性とを比較して、顔属性の類似性が明らかに低い場合には、類似度算出処理を打ち切るようにしてもよい。すなわち、属性判定部330から出力された顔属性の判定結果と、顔特徴量RAM390に記憶されている顔属性とを類似度算出部360が比較して、顔属性の類似性が明らかに低い場合には、類似度算出処理を打ち切る旨をコントローラ310に出力し、コントローラ310は、判定対象の顔に関する各処理を停止させる指示を特徴点算出部340、顔特徴量抽出部350および類似度算出部360に出力する。例えば、顔特徴量RAM390に記憶されている各顔属性が、子供の度合いが十分に高いものである場合において、判定対象の顔の顔属性の判定結果が、子供の度合いが十分に低いと判定された場合には、両者は同一人物ではないと判定することができる。このため、特徴点座標算出処理、顔特徴量抽出処理、類似度算出処理を早い段階で打ち切ることができる。このようにすることによって、処理高速化に寄与することが可能となる。
【0152】
次に、本発明の実施の形態における撮像装置100の動作について図面を参照して説明する。
【0153】
図23は、撮像装置100による顔認識(人物認識)処理の処理手順を示すフローチャートである。この顔認識処理は、全体の流れを、顔属性判定処理、特徴点座標算出処理、顔特徴量抽出処理、類似度算出処理の4つの処理に大別することができる。
【0154】
最初に、顔認識部300が、顔検出部200から出力された顔検出結果を取得して、この顔検出結果に含まれる顔領域の座標および大きさに基づいて、画像RAM130に記憶されている画像から顔画像を読み出す(ステップS901)。なお、顔認識部300は、顔検出部200から出力された顔検出結果をCPU110経由で取得するようにしてもよい。
【0155】
続いて、正規化部320は、読み出された顔画像について、顔の大きさが一定の大きさとなるとともに、両目がほぼ水平となるよう調整することにより正規化を行う(ステップS902)。続いて、正規化された顔画像である正規化顔画像について属性判定部330が顔属性判定処理を実行する(ステップS910)。この顔属性判定処理については、図24および図25を参照して詳細に説明する。
【0156】
続いて、特徴点算出部340は、特徴点座標テーブル保持部341に保持されている特徴点座標テーブルに含まれる特徴点座標の初期値をロードして、この特徴点座標の初期値を正規化顔画像に設定すべき特徴点の位置として配置する(ステップS903)。なお、特徴点座標については、CPU110から設定するようにしてもよい。続いて、特徴点算出部340は、属性判定部330から出力された顔属性の判定結果に基づいて初期値の特徴点座標を変更または増減することにより、特徴点座標を算出する(ステップS904)。
【0157】
続いて、顔特徴量抽出部350は、ガボア・フィルタについてのパラメータの初期値をロードする(ステップS905)。なお、ガボア・フィルタのパラメータについては、CPU110から設定するようにしてもよい。続いて、顔特徴量抽出部350は、属性判定部330から出力された顔属性の判定結果に基づいて、ガボア・フィルタのパラメータである通過帯域または特徴量抽出角度を変更する(ステップS906)。続いて、顔特徴量抽出部350は、ガボア・フィルタを用いて、特徴点算出部340により算出された各特徴点における特徴量を抽出する(ステップS907)。
【0158】
続いて、類似度算出部360は、類似度算出処理を実行する(ステップS950)。この類似度算出処理については、図26および図27を参照して詳細に説明する。
【0159】
図24は、撮像装置100による顔認識処理の処理手順のうちの顔属性判定処理手順(図23に示すステップS910の処理手順)を示すフローチャートである。ここでは、年代、目の開閉、髪型、眼鏡の有無およびヒゲの有無に関する顔属性について判定する例について説明する。なお、各顔属性の判定処理については、図25を参照して詳細に説明する。
【0160】
最初に、属性判定部330が、年代判定用辞書を用いて年代の属性判定処理を実行する(ステップS911)。続いて、属性判定部330が、目の開閉判定用辞書を用いて目の開閉の属性判定処理を実行する(ステップS912)。続いて、属性判定部330が、髪型判定用辞書を用いて髪形の属性判定処理を実行する(ステップS913)。続いて、属性判定部330が、眼鏡判定用辞書を用いて眼鏡の属性判定処理を実行する(ステップS914)。続いて、属性判定部330が、ヒゲ判定用辞書を用いてヒゲの属性判定処理を実行する(ステップS915)。続いて、属性判定部330が、これらの顔属性の判定結果を保持する(ステップS916)。なお、これらの顔属性の判定結果をCPU110に出力するようにしてもよい。
【0161】
続いて、判定対象の顔の顔属性の判定結果と、顔特徴量RAM390に記憶されている各顔属性の判定結果との間で顔属性の類似度が判断される(ステップS917およびS918)。すなわち、判定対象の顔の性別に関する顔属性の判定結果と、顔特徴量RAM390に記憶されている性別に関する各顔属性の判定結果とが明らかに不一致であるか否かが判断される(ステップS917)。ここで、性別に関する顔属性の判定結果が明らかに不一致である場合とは、完全に一致する場合、または、あいまいと判定されている場合以外の場合を示す。また、判定対象の顔の年代に関する顔属性の判定結果と、顔特徴量RAM390に記憶されている年代に関する各顔属性の判定結果とが明らかに不一致であるか否かが判断される(ステップS918)。
【0162】
性別に関する顔属性の判定結果が明らかに不一致である場合(ステップS917)、または、年代に関する顔属性の判定結果が明らかに不一致である場合には(ステップS918)、顔認識処理の動作を終了する。一方、性別に関する顔属性の判定結果が明らかに不一致ではなく(ステップS917)、年代に関する顔属性の判定結果が明らかに不一致ではない場合には(ステップS918)、判定対象の顔の属性が、顔特徴量RAM390に記憶されている各顔属性の判定結果との間で類似すると判定される(ステップS919)。
【0163】
なお、この例では、顔属性として性別または年代について顔属性の類似を判断する例について説明したが、他の顔属性についても類似を判断するようにしてもよい。
【0164】
このように、例えば、顔特徴量RAM390に記憶されている性別に関する顔属性の判定結果の全てが女と判定されている場合において、判定対象の顔の性別に関する顔属性の判定結果が男と判定された場合には、判定対象の顔が、同一人物の顔ではない可能性が極めて高い。同様に、顔特徴量RAM390に記憶されている年代に関する顔属性の判定結果の全てが大人と判定されている場合に、判定対象の顔の年代に関する顔属性の判定結果が子供と判定された場合には、判定対象の顔が、同一人物の顔ではない可能性が極めて高い。このように、登録顔の顔属性と判定対象顔の顔属性とが相反する属性である場合には、顔特徴点座標算出処理、顔特徴量抽出処理、類似度算出処理を実行するまでもなく、同一人物の顔ではない可能性が高い。このように、属性同士の類似度が極めて低い場合には、その後の全ての処理を打ち切ることによって、顔認識処理の高速化を図ることができる。
【0165】
図25は、撮像装置100による顔属性の判定処理の処理手順を示すフローチャートである。この顔属性の判定処理は、図24のステップS911乃至S915に示す各顔属性の判定処理に対応する処理である。ここでは、図6に示す属性判定用辞書450を用いて顔属性を判定する例について説明する。
【0166】
最初に、スコアSが「0」に初期化され(ステップS921)、変数iが「0」に初期化される(ステップS922)。続いて、正規化顔画像から抽出された輝度の値の中から、属性判定用辞書450の基準データiに含まれる座標0(x,y)451の値に対応する輝度の値A(i)と、座標1(x,y)452の値に対応する輝度の値B(i)とが取得される(ステップS923)。続いて、次式を用いて、取得された各輝度の値の差C(i)が算出される(ステップS924)。
C(i)=A(i)−B(i)
【0167】
続いて、算出された各輝度の差の値C(i)と、属性判定用辞書450基準データiに含まれる閾値(θ)453の値とを比較して、算出された値C(i)が閾値(θ)453の値よりも大きいか否かが判断される(ステップS925)。算出された値C(i)が閾値(θ)453の値以下である場合には(ステップS925)、属性判定用辞書450の基準データiに含まれる重み(α)454の値をスコアSに加算する(ステップS926)。一方、算出された値C(i)が閾値(θ)453の値よりも大きい場合には(ステップS925)、属性判定用辞書450の基準データiに含まれる重み(α)454の値をスコアSに加算せずに、ステップS927に進む。
【0168】
続いて、変数iに「1」が加算され(ステップS927)、変数iがn−1よりも大きいか否かが判断される(ステップS928)。変数iがn−1よりも大きくない場合には(ステップS928)、属性判定用辞書450の各基準データについての判定処理が終了していないため、ステップS923に戻り、判定処理を繰り返す(ステップS923乃至S927)。一方、変数iがn−1よりも大きい場合には(ステップS928)、スコアSの値が閾値1および閾値2の範囲内に存在するか否かが判断される(ステップS929)。なお、閾値1は、図7に示す閾値461、463、465に対応し、閾値2は、図7に示す閾値462、464、466に対応する。
【0169】
スコアSの値が閾値1および閾値2の範囲内に存在する場合には(ステップS929)、正規化顔画像は、属性判定用辞書450に対応する顔属性に関して「あいまい」であると判定される(ステップS930)。
【0170】
スコアSの値が閾値1および閾値2の範囲内に存在しない場合には(ステップS929)、スコアSの値が閾値2よりも大きいか否かが判断される(ステップS931)。スコアSの値が閾値2よりも大きい場合には(ステップS931)、正規化顔画像は、属性判定用辞書450に対応する顔属性に関して目的の画像であると判定される(ステップS932)。一方、スコアSの値が、閾値1よりも小さい場合には(ステップS931)、正規化顔画像は、属性判定用辞書450に対応する顔属性に関して目的の画像ではないと判定される(ステップS933)。
【0171】
図26は、撮像装置100による顔認識処理の処理手順のうちの顔類似度算出処理手順(図23に示すステップS950の処理手順)を示すフローチャートである。
【0172】
最初に、類似度算出部360は、類似度算出基準データ保持部361に保持されている類似度算出用辞書の中から、初期値の類似度算出用辞書を取得する(ステップS951)。例えば、図16に示す類似度算出基準データ保持部361から一般用辞書701が取得される。続いて、属性判定部330から出力された顔属性の判定結果に基づいて、類似度算出基準データ保持部361に保持されている類似度算出用辞書の中から、類似度算出用辞書を選択する(ステップS952)。続いて、初期値の類似度算出用辞書および選択された類似度算出用辞書を用いて、類似度算出処理を実行する(ステップS960)。この類似度算出処理については、図27を参照して詳細に説明する。
【0173】
図27は、撮像装置100による顔類似度算出処理の処理手順のうちの類似度算出処理手順(図26に示すステップS960の処理手順)を示すフローチャートである。ここでは、図17に示す類似度算出用辞書660を用いて類似度を算出する例について説明する。
【0174】
最初に、スコアSが「0」に初期化され(ステップS961)、変数iが「0」に初期化される(ステップS962)。続いて、類似度算出用辞書660の基準データiに含まれる座標0(x,y)661の値に対応する判定対象の顔特徴量に含まれる特徴量の値A0(i)と、登録顔特徴量に含まれる特徴量の値B0(i)とが取得されるとともに、類似度算出用辞書660の基準データiに含まれる座標1(x,y)662の値に対応する判定対象の顔特徴量に含まれる特徴量の値A1(0)と、登録顔特徴量680に含まれる特徴量の値B1(i)とが取得される(ステップS963)。
【0175】
続いて、次式を用いて、取得された特徴量の値の差の絶対値C0(i)が算出される(ステップS964)。
C0(i)=|A0(i)−B0(i)|
【0176】
続いて、次式を用いて、取得された特徴量の値の差の絶対値C1(i)が算出される(ステップS965)。
C1(i)=|A1(i)−B1(i)|
【0177】
続いて、次式を用いて、算出された絶対値C0(i)と絶対値C1(i)との差の絶対値C2(0)が算出される(ステップS966)。
C2(i)=|C0(i)−C1(i)|
【0178】
続いて、算出された絶対値C2(i)と、類似度算出用辞書660の基準データiに含まれる閾値(θ)663の値とを比較して、算出された絶対値C2(i)が閾値(θ)663の値よりも大きいか否かが判断される(ステップS967)。算出された絶対値C2(i)が閾値(θ)663の値以下である場合には(ステップS967)、類似度算出用辞書660の基準データiに含まれる重み(α)454の値をスコアS1に加算する(ステップS968)。一方、算出された値C2(i)が閾値(θ)663の値よりも大きい場合には(ステップS967)、類似度算出用辞書660の基準データiに含まれる重み(α)454の値をスコアS1に加算せずに、ステップS969に進む。
【0179】
続いて、変数iに「1」が加算され(ステップS969)、変数iがn−1よりも大きいか否かが判断される(ステップS970)。変数iがn−1よりも大きくない場合には(ステップS970)、類似度算出用辞書660の各基準データについての判定処理が終了していないため、ステップS963に戻り、類似度算出処理を繰り返す(ステップS963乃至S969)。一方、変数iがn−1よりも大きい場合には(ステップS970)、類似度算出処理がされていない類似度算出用辞書が存在するか否かが判断される(ステップS971)。類似度算出処理がされていない類似度算出用辞書が存在する場合には(ステップS971)、ステップS962に戻り、他の類似度算出用辞書を用いた類似度算出処理を繰り返す(ステップS962乃至S969)。例えば、図19に示すように、顔属性の判定結果が子供と判定されている場合において、一般用辞書701の類似度算出処理が終了した後には、子供用辞書702が存在するため、子供用辞書702を用いた類似度算出処理を実行する。
【0180】
一方、類似度算出処理がされていない類似度算出用辞書が存在しない場合には(ステップS971)、判定対象の顔特徴量に対応する顔と、登録顔特徴量に対応する顔との類似度を示す値としてスコアS1の値がCPU110に出力される(ステップS972)。
【0181】
図28は、撮像装置100による顔特徴量登録処理の処理手順を示すフローチャートである。
【0182】
顔特徴量登録部370は、顔特徴量抽出部350からの顔特徴量を入力する(ステップS981)。続いて、操作受付部160によりユーザからの登録指示の操作入力が受け付けられたか否かが判断される(ステップS982)。ユーザからの登録指示の操作入力が受け付けられていない場合には(ステップS982)、類似度算出部360から出力された類似度に基づいて、顔特徴量抽出部350から入力された顔特徴量と、顔特徴量RAM390に記憶されている顔特徴量との類似度が極めて高いか否かが判断される(ステップS983)。顔特徴量抽出部350から入力された顔特徴量と、顔特徴量RAM390に記憶されている顔特徴量との類似度が極めて高くない場合には(ステップS983)、顔特徴量登録処理の動作を終了する。
【0183】
一方、顔特徴量抽出部350から入力された顔特徴量と、顔特徴量RAM390に記憶されている顔特徴量との類似度が極めて高い場合には(ステップS983)、顔検出部200から出力されてCPU110に保持されている顔検出結果に基づいて、顔特徴量抽出部350から入力された顔特徴量に対応する顔(判定対象顔)が、顔特徴量RAM390に記憶されている顔特徴量に対応する顔(登録顔)よりも顔らしさが高いか否か(人の顔である確からしさが高いか否か)が判断される(ステップS984)。
【0184】
判定対象顔が登録顔よりも顔らしさが高くない場合には(ステップS984)、同様に、CPU110に保持されている顔検出結果に基づいて、判定対象顔が登録顔よりも正面向きの顔であるか否か(正面向きの度合いが高いか否か)が判断される(ステップS985)。判定対象顔が登録顔よりも正面向きの顔ではない場合には(ステップS985)。判定対象顔の入力時刻が、登録顔の登録時刻から一定以上の時間が経過しているか否かが判断される(ステップS986)。なお、ステップS985において、判定対象顔が登録顔よりも正面向きの顔であるか否かを判断する場合には、属性判定部330により判定された顔の向きに関する判定結果または積算結果を用いるようにしてもよい。
【0185】
また、ユーザからの登録指示の操作入力が受け付けられた場合(ステップS982)、または、顔特徴量抽出部350から入力された顔特徴量が顔特徴量RAM390に記憶されている顔特徴量と類似する場合において(ステップS983)、判定対象顔が登録顔よりも顔らしさが高い場合(ステップS984)、判定対象顔が登録顔よりも正面向きの顔である場合(ステップS985)、判定対象顔の入力時刻が、登録顔の登録時刻から一定以上の時間が経過している場合(ステップS986)には、顔特徴量登録部370は、顔特徴量抽出部350から入力された顔特徴量を顔特徴量RAM390に追加書き込み、または上書き処理する(ステップS987)。また、対応する顔属性の判定結果についても、顔特徴量RAM390に追加書き込み、または上書き処理を行う(ステップS987)。
【0186】
すなわち、顔特徴量抽出部350から入力された顔特徴量が、ステップS983乃至S986に示す顔登録に関する一定の条件を満たす場合には、撮像装置100内部で自動的に顔特徴量を追加書き込みまたは上書き処理する。これにより、撮像装置100は、適切で最新の顔特徴量を適切に取得することができる。
【0187】
図29は、撮像装置100による顔認識処理の処理手順のうちの顔属性判定処理手順を示すフローチャートである。この顔属性判定処理手順は、図24に示す顔属性判定処理手順を一部変形したものである。なお、ステップS916乃至S919については、図24に示すステップS916乃至S919と同じ処理手順であるため、ここでの説明を省略する。また、ここでは、年代、目の開閉、髪型、眼鏡の有無およびヒゲの有無に関する顔属性について選択的に実行する例について説明する。なお、年代に関する顔属性の判定では、乳幼児であるか乳幼児以外であるかを判定するものとする。また、眼鏡に関する顔属性の判定では、サングラス(透過度の低い眼鏡)であるか否かを判定するものとする。
【0188】
最初に、属性判定部330が、年代判定用辞書を用いて年代の属性判定処理を実行する(ステップS991)。続いて、年代に関する顔属性の判定結果として、乳幼児と判定されたか否かが判断される(ステップS992)。年代に関する顔属性の判定結果として、乳幼児と判定された場合には(ステップS992)、乳幼児には、「髪型の特徴が少ない」、「眼鏡をかけていない」、「性別が不明確である」、「ヒゲがない」という前提があるため、目の開閉に関する顔属性の判定処理のみを実行して(ステップS993)、他の顔属性の判定処理を実行しない。
【0189】
一方、年代に関する顔属性の判定結果として、乳幼児以外と判定された場合には(ステップS992)、属性判定部330が、髪型判定用辞書を用いて髪形の属性判定処理を実行し(ステップS994)、眼鏡判定用辞書を用いて眼鏡の属性判定処理を実行する(ステップS995)。
【0190】
続いて、眼鏡に関する顔属性の判定結果として、サングラスと判定されたか否かが判断される(ステップS996)。眼鏡に関する顔属性の判定結果として、サングラスと判定された場合には(ステップS996)、サングラスをかけている顔については、目の開閉を判定することが困難であるため、目の開閉に関する顔属性の判定処理を実行せずに、ステップS998に進む。一方、眼鏡に関する顔属性の判定結果として、サングラスと判定されない場合には(ステップS996)、目の開閉に関する顔属性の判定処理を実行する(ステップS997)。
【0191】
続いて、性別に関する顔属性の判定結果として、女性と判定された場合には(ステップS998)、女性には「ヒゲがない」という前提があるため、ヒゲに関する顔属性の判定処理を実行せずに、ステップS916に進む。一方、性別に関する顔属性の判定結果として、女性と判定されない場合には(ステップS998)、ヒゲに関する顔属性の判定処理を実行する(ステップS999)。
【0192】
このように、各種の顔属性の中には、子供や女性に対するひげのように、相反する内容や非常にまれな組合せの内容が存在することがある。そこで、既に判定されている顔属性の判定結果に基づいて、相反する顔属性については判定処理を行わないことにより、顔属性の判定処理時間を短縮することができるとともに、精度を改善することができる。
【0193】
なお、本発明の実施の形態では、レンズ、イメージセンサ等の撮像部を備える撮像装置を例にして説明したが、撮像部を備えていない画像処理装置においても本発明の実施の形態を適用することができる。例えば、外部の画像記憶媒体から入力された画像データ、または、外部装置から入出力端子を介して入力された画像データについて、上述した顔検出や顔認識の処理を画像処理装置が行うことができる。また、属性判定部330により判定された顔属性の判定結果、特徴点算出部340により算出された特徴点の位置、顔特徴量抽出部350により抽出された顔特徴量、類似度算出部360により算出された類似度等を、入出力端子を介して外部装置に出力するようにしてもよい。
【0194】
また、本発明の実施の形態では、被写体の対象物として顔を検出して顔認識を行う場合について説明したが、他の対象物を検出して物体認識を行う場合についても、本発明の実施の形態を適用することができる。例えば、猫や犬等のペットや動物、家、乗り物等の様々な対象物について本発明の実施の形態を適用することができる。
【0195】
また、本発明の実施の形態では、特徴量抽出フィルタとしてガボア・フィルタを用いた例について説明したが、他の特徴量抽出フィルタを用いて特徴量を抽出する場合についても本発明の実施の形態を適用することができる。
【0196】
以上で示したように、本発明の実施の形態によれば、画像に含まれる人の顔の領域に対して、顔属性(例えば、対象となる人の表情、年齢や年代、性別、目の開閉、人種、眼鏡の有無や種類、ヒゲの有無や種類、帽子の有無や種類、アクセサリーの有無や種類、髪型、顔向き)を判定することができる。また、顔属性の判定処理において、既に判定された顔属性と相反する顔属性については、判定処理を行わないことにより、効率的に有効な顔属性の判定結果を得ることができる。
【0197】
また、ユーザの希望する人物の顔を撮像装置100に顔特徴量として登録しておき、人物認識の登録顔として用いることができる。さらに、同一人物の登録顔について、さらに適切な顔特徴量を自動的に選び出し、登録内容を追加または上書きすることによって、登録顔に関する最適な顔特徴量を記憶させることができる。
【0198】
また、人物認識をする際の特徴点座標を、顔属性の判定結果に応じて切り替えることによって、判定対象顔に応じた最適な特徴量の抽出が可能となる。
【0199】
また、人物認識をする際の特徴量抽出フィルタを、顔属性の判定結果に応じて切り替えることによって、判定対象顔に応じた最適な特徴量の抽出が可能となる。
【0200】
また、人物認識をする際の類似度算出に用いられる類似度算出基準データを、顔属性の判定結果に応じて切り替えることによって、判定対象顔に応じた最適な類似度算出が可能となり、高精度な人物認識を実現することができる。
【0201】
また、人物認識をする際の類似度算出を、顔属性の判定結果に応じて途中で打ち切ることによって、処理時間の短縮を可能とし、高速化を図ることができる。特に、属性同士の類似性に着目し、相反する内容が存在する場合には、登録顔と判定対象顔とが同一人物でないことを早い段階で知ることができ、処理時間は大幅に短縮することができる。
【0202】
また、人物認識をする際の類似度算出を、顔属性の判定結果に応じてさらに延長することによって、類似度算出の難しい顔に対しても、さらに高精度な処理が可能となる。
【0203】
また、画像内に含まれる複数人の顔から、特定人物の顔を認識することによって、オートフォーカス、オートホワイトバランス、オート露出、オートストロボ発光、オートシャッター等、多様なカメラ制御を、特定人物に対して最適化することができる。
【0204】
また、高速で高精度な人物認識を可能とし、撮像装置のようなリアルタイム画像処理でも、特定人物の顔をユーザに知らせることができる。さらに、デジタルスチルカメラやカメラ付き携帯電話機のような小型の撮像装置が、十分なサイズの画像表示装置(液晶パネル等)を有していなくても、撮像装置がユーザに対して特定人物の顔を報知することにより、ユーザは容易に特定人物の顔を視認することができる。
【0205】
また、撮像装置以外の画像処理装置に適用することができるため、外部装置から入力された人の顔画像に対しても、顔属性の判定や人物認識処理を行うことが可能となる。
【0206】
また、多様な顔属性、顔特徴点座標、顔類似度を画像の付随データとして生成することができ、さらに豊富な情報を自動でユーザに提供することができる。
【0207】
また、多様な顔属性、顔特徴点座標、顔類似度を用いて、膨大な動画、または静止画のデータベースから、特定の個人の画像を迅速に検索することができる。
【0208】
なお、本発明の実施の形態は本発明を具現化するための一例を示したものであり、以下に示すように特許請求の範囲における発明特定事項とそれぞれ対応関係を有するが、これに限定されるものではなく本発明の要旨を逸脱しない範囲において種々の変形を施すことができる。
【0209】
すなわち、請求項1、16、17において、対象物特徴量記憶手段は、例えば顔特徴量RAM390に対応する。また、対象物検出手段は、例えば顔検出部200に対応する。また、属性判定手段は、例えば属性判定部330に対応する。また、類似度算出手段は、例えば類似度算出部360に対応する。
【0210】
また、請求項1、16において、画像入力手段は、例えばレンズ群121およびイメージセンサ122に対応する。
【0211】
また、請求項1、17において、特徴点決定手段は、例えば特徴点算出部340に対応する。
【0212】
また、請求項2において、特徴点座標テーブル保持手段は、例えば特徴点座標テーブル保持部341に対応する。
【0213】
また、請求項3において、正規化手段は、例えば正規化部320に対応する。
【0214】
また、請求項4において、特徴量抽出手段は、例えば顔特徴量抽出部350に対応する。
【0215】
また、請求項10において、特徴量登録手段は、例えば顔特徴量登録部370に対応する。
【0216】
また、請求項12において、対象物属性記憶手段は、例えば顔特徴量RAM390に対応する。
【0217】
また、請求項17において、撮像手段は、例えばレンズ群121およびイメージセンサ122に対応する。
【0218】
請求項18、19において、画像入力手順は、例えばレンズ群121およびイメージセンサ122により行われる。また、対象物検出手順は、例えば顔検出部200により行われる。属性判定手順は、例えばステップS910またはS990に対応する。また、特徴点決定手順は、例えばステップS904に対応する。また、類似度算出手順は、例えばステップS950に対応する。
【0219】
なお、本発明の実施の形態において説明した処理手順は、これら一連の手順を有する方法として捉えてもよく、また、これら一連の手順をコンピュータに実行させるためのプログラム乃至そのプログラムを記憶する記録媒体として捉えてもよい。
【図面の簡単な説明】
【0220】
【図1】撮像装置100の機能構成例を示すブロック図である。
【図2】顔検出部200の機能構成例を示すブロック図である。
【図3】顔認識部300の機能構成例、および、画像RAM130、画像バス190および顔特徴量RAM390との概略関係を示すブロック図である。
【図4】顔検出部200により検出された顔を含むその周辺画像である顔画像を正規化する場合における正規化の一例を示す図である。
【図5】属性の判定対象となる顔画像を概略的に示す図である。
【図6】正規化顔画像について顔の属性判定を行う場合に用いられる属性判定用辞書の構成例を示す図である。
【図7】正規化顔画像について属性判定用辞書を用いて求められる各顔属性に関する積算結果値の範囲を示す図である。
【図8】各属性に関する判定結果および積算結果値の一例を示す図である。
【図9】正規化部320により生成された正規化顔画像に設定すべき特徴点の位置を算出する特徴点位置算出方法の一例を示す図である。
【図10】正規化部320により生成された正規化顔画像に特徴点を設定する場合における配置例を示す図である。
【図11】正規化部320により生成された正規化顔画像に特徴点を設定する場合における配置例を示す図である。
【図12】特徴点における特徴量の抽出に用いられるガボア・フィルタおよびフィルタの係数の一例を示す図である。
【図13】正規化顔画像の一例である正規化顔画像630を示す図である。
【図14】ガボア・フィルタを用いて特徴量が抽出された場合における各特徴量の集合である顔特徴量650を模式的に示す図である。
【図15】顔特徴量RAM390に格納されている各情報を模式的に示す図である。
【図16】類似度算出基準データ保持部361に保持されている類似度算出用辞書を模式的に示す図である。
【図17】ガボア・ジェットを用いて判定対象の顔の類似度を算出する場合に用いられる類似度算出用辞書の構成例を示す図である。
【図18】ガボア・ジェットを用いて判定対象の顔の類似度を算出する算出方法を概略的に示す図である。
【図19】判定対象の顔の類似度算出に用いられる類似度算出用辞書の例を示す図である。
【図20】判定対象の顔の類似度算出に用いられる類似度算出用辞書の例を示す図である。
【図21】判定対象の顔の類似度算出に用いられる類似度算出用辞書の例を示す図である。
【図22】判定対象の顔の類似度算出に用いられる類似度算出用辞書の例を示す図である。
【図23】撮像装置100による顔認識(人物認識)処理の処理手順を示すフローチャートである。
【図24】撮像装置100による顔認識処理の処理手順のうちの顔属性判定処理手順を示すフローチャートである。
【図25】撮像装置100による顔属性の判定処理の処理手順を示すフローチャートである。
【図26】撮像装置100による顔認識処理の処理手順のうちの顔類似度算出処理手順を示すフローチャートである。
【図27】撮像装置100による顔類似度算出処理の処理手順のうちの類似度算出処理手順を示すフローチャートである。
【図28】撮像装置100による顔特徴量登録処理の処理手順を示すフローチャートである。
【図29】撮像装置100による顔認識処理の処理手順のうちの顔属性判定処理手順を示すフローチャートである。
【符号の説明】
【0221】
100 撮像装置
110 CPU
121 レンズ群
122 イメージセンサ
123 カメラ信号処理部
130 画像RAM
140 画像圧縮伸張部
150 表示部
160 操作受付部
170 記憶媒体
180 揮発/不揮発性記憶媒体
190 画像バス
200 顔検出部
210 コントローラ
220 画像拡大縮小部
230 画像保持部
240 基準顔データ保持部
250 判定部
300 顔認識部
310 コントローラ
320 正規化部
330 属性判定部
331 属性判定基準データ保持部
340 特徴点算出部
341 特徴点座標テーブル保持部
350 顔特徴量抽出部
360 類似度算出部
361 類似度算出基準データ保持部
370 顔特徴量登録部
390 顔特徴量RAM

【特許請求の範囲】
【請求項1】
所定の対象物の特徴量を記憶する対象物特徴量記憶手段と、
画像を入力する画像入力手段と、
前記入力された画像に含まれる対象物を検出する対象物検出手段と、
前記検出された対象物の属性を判定する属性判定手段と、
前記判定された属性に基づいて前記入力された画像に設定すべき特徴点の位置を決定する特徴点決定手段と、
前記対象物特徴量記憶手段に記憶されている特徴量と前記入力された画像に設定された特徴点における特徴量とを比較することにより前記対象物特徴量記憶手段に記憶されている特徴量に対応する対象物と前記検出された対象物との類似度を算出する類似度算出手段と
を具備することを特徴とする画像処理装置。
【請求項2】
前記入力された画像に設定すべき特徴点の位置の初期値を保持する特徴点座標テーブル保持手段をさらに具備し、
前記特徴点決定手段は、前記判定された属性に基づいて前記初期値における特徴点の位置を移動または前記初期値における特徴点の数を増減させることにより前記入力された画像に設定すべき特徴点の位置を決定する
ことを特徴とする請求項1記載の画像処理装置。
【請求項3】
前記検出された対象物が一定の位置に配置されるように前記検出された対象物の周辺画像である対象物画像を正規化する正規化手段をさらに具備し、
前記特徴点決定手段は、前記判定された属性に基づいて前記正規化された対象物画像に設定すべき特徴点の位置を決定する
ことを特徴とする請求項1記載の画像処理装置。
【請求項4】
前記入力された画像に設定された特徴点における特徴量を抽出する特徴量抽出手段をさらに具備する
ことを特徴とする請求項1記載の画像処理装置。
【請求項5】
前記特徴量抽出手段は、前記入力された画像に設定された特徴点を含むその周辺画像である近傍画像について特徴量抽出フィルタを用いて前記特徴点毎に特徴量を抽出する
ことを特徴とする請求項4記載の画像処理装置。
【請求項6】
前記特徴量抽出手段は、前記判定された属性に基づいて前記特徴量の抽出に用いられる前記特徴量抽出フィルタのパラメータを変更する
ことを特徴とする請求項5記載の画像処理装置。
【請求項7】
前記特徴量抽出フィルタはガボア・フィルタであり、
前記特徴量抽出手段は、前記判定された属性に基づいて前記ガボア・フィルタのパラメータである通過帯域または特徴量抽出角度を変更する
ことを特徴とする請求項6記載の画像処理装置。
【請求項8】
前記算出された類似度に基づいて前記入力された画像について抽出された特徴量が一定の条件を満たしているか否かを判定して前記一定の条件を満たしていると判定された場合には前記入力された画像について抽出された特徴量を前記対象物特徴量記憶手段に記憶させる特徴量登録手段をさらに具備する
ことを特徴とする請求項4記載の画像処理装置。
【請求項9】
前記特徴量登録手段は、前記一定の条件を満たしていると判定された場合には前記入力された画像について抽出された特徴量とともに前記判定された属性を前記対象物特徴量記憶手段に記憶させる
ことを特徴とする請求項8記載の画像処理装置。
【請求項10】
前記類似度算出手段は、複数の弱判別器を用いて前記対象物特徴量記憶手段に記憶されている特徴量と前記入力された画像に設定された特徴点における特徴量とを比較することにより前記類似度を算出する
ことを特徴とする請求項1記載の画像処理装置。
【請求項11】
前記類似度算出手段は、前記判定された属性に基づいて前記類似度の算出に用いられる前記弱判別器の数または種類を変更する
ことを特徴とする請求項10記載の画像処理装置。
【請求項12】
所定の対象物に関する属性を記憶する対象物属性記憶手段をさらに具備し、
前記類似度算出手段は、前記判定された属性と前記対象物属性記憶手段に記憶されている属性とを比較することにより前記検出された対象物と前記対象物属性記憶手段に属性が記憶されている対象物との属性の類似度を判定して前記属性の類似度の判定結果に基づいて前記検出された対象物についての類似度を算出するか否かを判断する
ことを特徴とする請求項1記載の画像処理装置。
【請求項13】
前記対象物検出手段は、前記入力された画像に含まれる人物の顔を検出する
ことを特徴とする請求項1記載の画像処理装置。
【請求項14】
前記属性判定手段は、人物の顔についての表情、年齢もしくは年代、性別、目の開閉、人種、眼鏡の有無もしくは種類、ヒゲの有無もしくは種類、帽子の有無もしくは種類、アクセサリーの有無もしくは種類、髪型、または、顔向きの少なくとも1つを前記検出された人物の顔の属性として判定する
ことを特徴とする請求項13記載の画像処理装置。
【請求項15】
前記属性判定手段は、前記検出された対象物について複数の属性を順次判定するとともに既に判定された属性の判定結果に基づいて次に判定すべき属性を選択する
ことを特徴とする請求項1記載の画像処理装置。
【請求項16】
所定の対象物の特徴量を記憶する対象物特徴量記憶手段と、
画像を入力する画像入力手段と、
前記入力された画像に含まれる対象物を検出する対象物検出手段と、
前記検出された対象物の属性を判定する属性判定手段と、
前記判定された属性に基づいて数または種類が決定された複数の弱判別器を用いて前記対象物特徴量記憶手段に記憶されている特徴量と前記入力された画像に設定された特徴点における特徴量とを比較することにより前記対象物特徴量記憶手段に記憶されている特徴量に対応する対象物と前記検出された対象物との類似度を算出する類似度算出手段と
を具備することを特徴とする画像処理装置。
【請求項17】
所定の対象物の特徴量を記憶する対象物特徴量記憶手段と、
被写体からの入射光を撮像画像に変換する撮像手段と、
前記撮像画像に含まれる対象物を検出する対象物検出手段と、
前記検出された対象物の属性を判定する属性判定手段と、
前記判定された属性に基づいて前記撮像画像に設定すべき特徴点の位置を決定する特徴点決定手段と、
前記対象物特徴量記憶手段に記憶されている特徴量と前記撮像画像に設定された特徴点における特徴量とを比較することにより前記対象物特徴量記憶手段に記憶されている特徴量に対応する対象物と前記検出された対象物との類似度を算出する類似度算出手段と
を具備することを特徴とする撮像装置。
【請求項18】
所定の対象物の特徴量を記憶する対象物特徴量記憶手段を備える画像処理装置における類似度算出処理方法であって、
画像を入力する画像入力手順と、
前記入力された画像に含まれる対象物を検出する対象物検出手順と、
前記検出された対象物の属性を判定する属性判定手順と、
前記判定された属性に基づいて前記入力された画像に設定すべき特徴点の位置を決定する特徴点決定手順と
前記対象物特徴量記憶手段に記憶されている特徴量と前記入力された画像に設定された特徴点における特徴量とを比較することにより前記対象物特徴量記憶手段に記憶されている特徴量に対応する対象物と前記検出された対象物との類似度を算出する類似度算出手順と
を具備することを特徴とする類似度算出処理方法。
【請求項19】
所定の対象物の特徴量を記憶する対象物特徴量記憶手段を備える画像処理装置において、
画像を入力する画像入力手順と、
前記入力された画像に含まれる対象物を検出する対象物検出手順と、
前記検出された対象物の属性を判定する属性判定手順と、
前記判定された属性に基づいて前記入力された画像に設定すべき特徴点の位置を決定する特徴点決定手順と
前記対象物特徴量記憶手段に記憶されている特徴量と前記入力された画像に設定された特徴点における特徴量とを比較することにより前記対象物特徴量記憶手段に記憶されている特徴量に対応する対象物と前記検出された対象物との類似度を算出する類似度算出手順と
をコンピュータに実行させることを特徴とするプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図13】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate

【図24】
image rotate

【図25】
image rotate

【図26】
image rotate

【図27】
image rotate

【図28】
image rotate

【図29】
image rotate

【図12】
image rotate

【図14】
image rotate


【公開番号】特開2009−87209(P2009−87209A)
【公開日】平成21年4月23日(2009.4.23)
【国際特許分類】
【出願番号】特願2007−258621(P2007−258621)
【出願日】平成19年10月2日(2007.10.2)
【出願人】(000002185)ソニー株式会社 (34,172)
【Fターム(参考)】