説明

判別器学習方法および対象判別装置ならびにプログラム

【課題】 画像内の判別対象の検出について誤検出率を低く保ちつつ高速化を図る。
【解決手段】 部分画像生成手段11によりサブウィンドウWが全体画像P上を複数画素間隔で走査し複数の部分画像PPが生成される。生成された部分画像PPは、候補判別器において顔(判別対象)であるか否かが判別され、顔である可能性のある候補画像CPが検出される。そして、対象検出手段20において、候補画像CPが顔であるか否かが判別される。ここで、候補判別器12は、基準サンプル画像と面内回転サンプル画像とを用いてにより学習されている。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、たとえば人物の顔等の判別対象が画像に含まれているか否かを判別する判別器学習方法および対象判別装置ならびにプログラムに関するものである。
【背景技術】
【0002】
たとえば顔検出の基本原理は顔か顔ではないかの2クラス判別であり、この判別方法としてブースティング(Boosting)と呼ばれる手法が広く用いられている。ブースティングアルゴリズムは複数の弱い判別器(弱判別器)を結合することにより1つの強い判別器を形成する2クラス判別器の学習方法であって、弱判別器における特徴量としてたとえば多重解像度平面のエッジ情報が用いられる。
【0003】
特に、ブースティングによる顔検出処理の高速化を図るために、弱判別器はカスケード構造を有し弱判別器が顔もしくは非顔の判別を行ったときに、上流側の弱判別器が顔であると判別した画像について下流側の弱判別器がさらに顔か非顔かの判別を行うようになっている(たとえば特許文献1参照)。
【0004】
上述した判別器に入力される画像には、顔が正面を向いた画像のみならず、顔が画像平面上において回転している(以下「面内回転」という)画像や、顔の向きが画像平面内において回転している(以下、「面外回転」という)画像が入力される。判別器1つあたりが判別可能な顔の回転範囲は限られており、面内回転している画像では30°程度、面外回転している画像では30°〜60°程度の回転であれば顔か非顔かを判別することができる。より広い範囲の顔の向きに対応するためには、それぞれの向きに対応した複数の判別器を用意し、各判別器のすべてに顔であるか否かの判別を行わせる必要がある(たとえば非特許文献2参照)。
【0005】
ここで、回転角度に応じた複数の判別器に入力する前に、面外回転している顔が含まれているか否かを判断し、その後複数の判別器を用いて顔か非顔かを判断する方法が提案されている(たとえば非特許文献3参照)。非特許文献3において面外回転された顔を検出する際、最初に−90°〜+90°の範囲において顔の向きが回転している面外回転画像であるか否かが判別される。そして、面内回転画像であると判別した画像に対し、−90°〜−30°までの面外回転画像を判別する判別器と、−20°〜+20°までの面外回転画像を判別する判別器と、+30°〜+90°までの面外回転画像を判別する判別器とを用いてそれぞれ顔であるか否かの判別を行う。さらに、各判別器において顔であると判別された画像に対し、より細かく回転角度範囲が分類された複数の判別器を用いて判別が行われるようになっている。
【特許文献1】米国特許出願公開2002/102024号明細書
【非特許文献2】Shihong LAO等、「高速全方向顔検出」、画像の認識・理解シンポジウム(MIRU2004)、2004年7月参照)
【非特許文献3】Stan Z. Li, ZhenQiu Zhang, FloatBoost Learning and Statistical Face Detection, IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, VOL. 26, NO.9, SEPTEMBER 2004
【発明の開示】
【発明が解決しようとする課題】
【0006】
ところで、判別処理の高速化を図るとき、たとえば背景、胴体等の全体画像の大部分を占める明らかに顔ではない候補をいかに早い段階で判別することができるか否かがポイントになる。しかし、非特許文献2に示す方法では各回転角度に対応する複数の判別器のすべてが、それぞれ明らかに顔ではない候補の判別を行うようになっているため、判別速度が遅くなってしまうという問題がある。また、非特許文献3においては、面外回転した画像(横顔)の検出は行うことができるが、面内回転した画像の検出することができないという問題がある。
【0007】
そこで、本発明は、面内回転画像おおよび面外回転画像を高い検出率を保ちつつ高速化を図ることができる判別器学習方法および対象判別装置ならびにプログラムを提供することを目的とするものである。
【課題を解決するための手段】
【0008】
本発明の判別器の学習方法は、画像が判別対象であるか否かの判別を複数の弱判別器による複数の判別結果を用いて最終的な判別を行う判別器の学習方法において、判別器が、前記判別対象が所定の方向を向いた基準サンプル画像と、基準サンプル画像の判別対象を基準サンプル画像の平面において回転させた面内回転サンプル画像とを用いて学習されたものであることを特徴とするものである。
【0009】
本発明の対象判別装置は、全体画像上に設定画素数の枠からなるサブウィンドウを走査させ部分画像を生成する部分画像生成手段と、部分画像生成手段により生成された部分画像が判別対象であるか否かを判別し、判別対象である可能性のある部分画像を候補画像として検出する候補検出手段と、候補検出手段により検出された候補画像に判別対象であるか否かを判別する対象判別手段とを有するものであり、候補検出手段が、複数の弱判別器による複数の判別結果を用いて部分画像が判別対象であるか否かを判別する候補判別器を備えたものであり、候補判別器が、判別対象が所定の方向を向いた基準サンプル画像と、基準サンプル画像の判別対象を基準サンプル画像の平面上において回転させた面内回転サンプル画像とを用いて学習されたものであることを特徴とするものである。
【0010】
本発明の対象判別プログラムは、コンピュータを、全体画像上に設定画素数の枠からなるサブウィンドウを走査させ部分画像を生成する部分画像生成手段と、部分画像生成手段により生成された部分画像が判別対象であるか否かを判別し、判別対象である可能性のある部分画像を候補画像として検出する候補検出手段と、候補検出手段により検出された候補画像に判別対象であるか否かを判別する対象判別手段として機能させるための対象判別プログラムであって、候補検出手段が、複数の弱判別器による複数の判別結果を用いて部分画像が判別対象であるか否かを判別する候補判別器を備えたものであり、候補判別器が、判別対象が正面を向いた基準サンプル画像と、基準サンプル画像の判別対象を基準サンプル画像の平面上において回転させた面内回転サンプル画像とを用いて学習されたものであることを特徴とするものである。
【0011】
ここで、基準サンプル画像内の判別対象は所定の方向を向いているものであれば、いずれの方向を向いているものであっても良いが、正面を向いていることが好ましい。
【0012】
また、候補判別器は、さらに基準サンプル画像内の判別対象の向きを回転させた面外回転サンプル画像と、面外回転サンプル画像を面内回転させた面外面内回転サンプル画像とを用いて学習されたものであってもよい。
【0013】
候補判別器は、複数の弱判別器による複数の判別結果を用いて部分画像が判別対象であるか否かを判別する候補判別器を備えたものであれば判別手法は問わず、たとえば部分画像について各弱判別器による判別を行い、その複数の判別結果を用いて最終的な判別を行うようにしてもよい。あるいは、複数の弱判別器がカスケード構造を有し、上流側の弱判別器において顔であると判別された部分画像について下流側の弱判別器による判別を行うものであってもよい。
【0014】
また、候補判別器が、回転角度の異なる複数の面内回転サンプル画像と、回転角度の異なる複数の面外回転サンプル画像とを用いて学習されたものであることが好ましい。
【0015】
さらに、候補検出手段は、候補判別器により判別された多数の候補画像をより少ない数の候補画像に絞り込む候補絞込手段を有するものであってもよい。このとき、候補絞込手段は、基準サンプル画像と面内回転サンプル画像とを用いて学習された複数の弱判別器を有する面内回転判別器と、基準サンプル画像と面外回転サンプル画像とを用いて学習された複数の弱判別器を有する面外回転判別器とを有するものであってもよい。なお、候補絞込手段は、基準サンプル画像と面外面内回転サンプル画像とを用いて学習された複数の弱判別器を有する面外面内回転判別器をさらに有するものであってもよい。あるいは、面外面内回転判別器を用いず、面外回転判別器がさらに面外面内回転サンプル画像をも用いて学習されたものであっても良い。
【0016】
候補検出手段はカスケード構造を有する複数の候補絞込手段を有していてもよい。このとき、候補絞込手段は、複数の面内回転判別器および面外回転判別器を備えたものであり、下流側の候補絞込手段における各面内回転判別器および各面外回転判別器は、上流側の候補絞込手段における各面内回転判別器および各面外回転判別器の判別可能な角度範囲よりも狭くなるように構成されていてもよい。
【発明の効果】
【0017】
本発明の判別器の学習方法によれば、画像が判別対象であるか否かの判別を複数の弱判別器による複数の判別結果を用いて最終的な判別を行う判別器の学習方法において、判別器が、判別対象が所定の方向を向いた基準サンプル画像と、基準サンプル画像の判別対象を基準サンプル画像の平面において回転させた面内回転サンプル画像とを用いて学習されたものであることにより、画像内において判別対象が面内回転している判別対象を判別することができるため、判別対象の検出率を向上させることができる。
【0018】
本発明の対象判別装置ならびにプログラムによれば、候補検出手段の候補判別器が、判別対象が正面を向いた基準サンプル画像と、基準サンプル画像の判別対象を基準サンプル画像の平面上において回転させた面内回転サンプル画像とを用いて学習されたものであることにより、たとえば風景や胴体等の明らかに面内回転画像ではない部分画像について候補検出手段において非顔であると判別し、対象判別手段による判別が行われないため、検出作業を高速化し検出時間を大幅に短縮することができる。
【0019】
なお、候補判別器が、さらに基準サンプル画像内の判別対象の向きを回転させた面外回転サンプル画像と、面外回転サンプル画像を面内回転させた面外面内回転サンプル画像とを用いて学習されたものであれば、候補判別器が面内回転画像のみならず面外回転画像および面外面内画像についても検出することができるため、検出作業を高速化し検出時間を大幅に短縮することができる。
【0020】
また、複数の弱判別器がカスケード構造を有し、上流側の弱判別器において顔であると判別された部分画像についてさらに下流側の弱判別器による判別を行うものであれば、下流側の弱判別器の計算量を大幅に低減することができるため、判別作業の高速化をさらに促進することができる。
【0021】
さらに、候補判別器が、回転角度の異なる複数の前記面内回転サンプル画像と、回転角度の異なる複数の面外回転サンプル画像とを用いて学習されたものであるとき、候補判別器が様々な回転角度の判別対象を判別することができるようになるため、判別対象の検出率を向上させることができる。
【0022】
さらに、候補検出手段が、候補判別器により判別された候補画像を絞り込む候補絞込手段を備えたものであり、候補絞込手段が、基準サンプル画像と面内回転サンプル画像とを用いて学習された複数の弱判別器を有する面内回転判別器と、基準サンプル画像と面内回転サンプル画像とを用いて学習された複数の弱判別器を有する面外回転判別器とを有するものであるとき、候補判別器よりも誤検出率の低い候補絞込判別器により候補画像の数を絞り込むことにより、対象検出手段により判別すべき候補画像の数を大幅に減らすことができるため、判別作業のさらなる高速化を図ることができる。
【0023】
また、候補検出手段がカスケード構造を有する複数の候補絞込手段を有し、下流側の候補絞込手段が、複数の面内回転判別器および面外回転判別器を備えたものであり、下流側の候補絞込手段の各面内回転判別器および面外回転判別器の判別可能な角度範囲が、上流側の候補絞込手段の面内回転判別器および面外回転判別器の判別可能な角度範囲よりも狭くなるように構成されているものであれば、下流側の候補絞込手段ほど誤検出率の低い候補絞込判別器を用いて候補画像の数の絞り込みが行うことにより、対象検出手段により判別すべき候補画像の数を大幅に減らすことができるため、判別作業のさらなる高速化を図ることができる。
【発明を実施するための最良の形態】
【0024】
以下、図面を参照して本発明の対象判別装置の実施の形態を詳細に説明する。図1は本発明の対象判別装置の好ましい実施の形態を示すブロック図である。なお、図1のような対象判別装置1の構成は、補助記憶装置に読み込まれたオブジェクト識別プログラムをコンピュータ(たとえばパーソナルコンピュータ等)上で実行することにより実現される。また、このオブジェクト識別プログラムは、CD−ROM等の情報記憶媒体に記憶され、もしくはインターネット等のネットワークを介して配布され、コンピュータにインストールされることになる。
【0025】
図1の対象判別装置1は判別対象である顔の判別を行うものであって、全体画像P上にサブウィンドウWを走査させることにより部分画像PPを生成する部分画像生成手段11と、部分画像生成手段11により生成された複数の部分画像PPにおいて、判別対象である顔である可能性のある候補画像CPを検出する候補検出手段10と、候補検出手段10により検出された候補画像CPが顔であるか否かを判別する対象検出手段20とを有している。
【0026】
部分画像生成手段11は、図2(A)に示すように、設定された画素数(たとえば32画素×32画素)を有するサブウィンドウWを全体画像P内において走査させ、サブウィンドウWにより囲まれた領域を切り出すことにより設定画素数からなる部分画像PPを生成するようになっている。特に、部分画像生成手段11は、一定画素数だけ飛ばしながらサブウィンドウWを走査させることにより、部分画像PPを生成するようになっている。
【0027】
なお、部分画像生成手段11は、図2(B)〜(D)に示すように、1つの全体画像Pから複数の低解像度画像P2、P3、P4を生成する機能を有し、生成した低解像度画像上においてサブウィンドウWを走査させたときの部分画像PPをも生成するようになっている。これにより、全体画像PにおいてサブウィンドウW内に顔(判別対象)が収まらなかった場合であっても、低解像度画像上においてはサブウィンドウW内に収めることが可能となり、顔の検出を確実に行うことができる。
【0028】
図1の候補判別手段12は、部分画像生成手段11により生成された部分画像PPがである否かの2値判別を行う機能を有し、図3に示すように複数の弱判別器を有する候補判別器からなっている。特に、候補判別器12は、画像平面上において判別対象が回転している画像(以下、「面内回転(in plane)画像」という)と、画像内の判別対象の向きが回転している(以下、「面外回転(out plane)画像」という)との双方を顔であると判別するようになっている。
【0029】
候補判別器12は、アダブースティングアルゴリズム(Adaboosting Algorithm)により学習されたものであって、複数の弱判別器CF〜CF(M:弱判別器の個数)を有している。各弱判別器CF〜CFはそれぞれ部分画像PPから特徴量xを抽出し、この特徴量xを用いて部分画像PPが顔であるか否かの判別を行う機能を有する。そして、候補判別器12は弱判別器CF〜CFおける判別結果を用いて顔であるか否かの最終的な判別を行うようになっている。
【0030】
具体的には、図4に示すように各弱判別器CF〜CFは部分画像PP内の設定された座標P1a、P1b、P1cにおける輝度値等を抽出する。さらに、部分画像PPの低解像度画像PP2内の設定された座標位置P2a、P2b、低解像度画像PP3内の設定された座標位置P3a、P3bにおける輝度値等をそれぞれ抽出する。その後、上述した7個の座標P1a〜P3bの2つをペアとして組み合わせ、この組み合わせた輝度の差分を特徴量xとする。各弱判別器CF〜CF毎にそれぞれ異なる特徴量が用いられるものであり、たとえば弱判別器CFでは座標P1a、P1cにおける輝度の差分を特徴量として用い、弱判別器CFでは座標P2a、P2bにおける輝度の差分を特徴量として用いるようになっている。
【0031】
なお、各弱判別器CF〜CFがそれぞれ特徴量xを抽出する場合について例示しているが、複数の部分画像PPについて上述した特徴量xを予め抽出しておき、各弱判別器CF〜CFに入力するようにしてもよい。さらに、輝度値を用いた場合について例示しているが、コントラスト、エッジ等の情報を用いるようにしても良い。
【0032】
各弱判別器CF〜CFは図4に示すようなヒストグラムを有しており、このヒストグラムに基づいて特徴量xの値に応じたスコアf(x)〜f(x)を出力するようになっている。さらに、各弱判別器CF〜CFは判別性能を示す信頼度β〜βを有している。そして、候補判別器12は、各弱判別器CF〜CFから出力されたスコアf(x)および信頼度β〜βとに基づいて最終的な判別結果を出力するようになっている。具体的には、以下の式(1)により表すことができる。
sign(Fm(x))=sign[Σm=1Mβm・fm(x))] ・・・(1)
式(1)において、候補判別器12からの判別結果sign(F(x))は、各弱判別器CF〜CFからそれぞれ算出される判定スコアβ・f(x)(m=1、2、・・・、M)の総和により判別されるようになっている。
【0033】
次に、図1を参照して対象検出手段20について説明する。対象検出手段20は、候補検出手段10において検出された候補画像CPが顔であるか否かをさらに判別するものであって、面内画像を判別する面内回転顔判別器30と、面外画像を判別する面外回転判別器40とを有している。
【0034】
面内回転判別器30は、画像の縦方向と顔の中心線との角度が0°の顔を判別する0°面内回転判別器30−1、30°の顔画像を判別する30°面内回転判別器30−2等を備えたものであって、30°〜330°の範囲で回転角度が30°ずつ異なる12個の面内回転判別器30−1〜30−12を有している。なお、たとえば0°面内回転判別器30−1は回転角度が0°を中心に−15°(=345°)〜+15°の範囲内にある顔を判別できるようになっている。
【0035】
同様に、面外回転判別器40は、画像内の顔の向き(角度)が0°の顔、すなわち正面顔を判別する0°面外回転判別器40−1、30°の顔画像を判別する30°面外回転判別器40−2等を備えたものであって、−90°〜+90°の範囲で30°ずつ回転角度の異なる7個の面外回転判別器40−1〜40−7を有している。また、たとえば0°面外回転判別器40−1は回転角度が0°を中心に−15°〜+15°の範囲内にある顔を判別できるようになっている。
【0036】
なお、複数の面内回転判別器30−1〜30−12および複数の面外回転判別器40−1〜40−7とは、それぞれ上述した候補検出手段12のように、ブースティングアルゴリズムにより学習された複数の弱判別器を有しており(図示せず)、候補検出手段12と同様の判別手法により判別が行われるようになっている。
【0037】
ここで、図1から図5を参照して対象判別装置1の動作例について説明する。まず、部分画像生成手段11において、全体画像P上をサブウィンドウWが一定の走査間隔で走査することにより複数の部分画像PPが生成される。生成された部分画像PPは、候補判別器12において顔であるか否かが判別され、顔である可能性のある候補画像CPが検出される。次に、対象検出手段20において候補画像CPが顔であるか否かが判別される。そして、顔が面内回転されているもの及び面外回転されている候補画像CPが対象検出手段20の各対象判別器30、40において検出される。
【0038】
ところで、上述した候補判別器12は、予め用意された複数の弱判別器CF〜CFに対し学習画像LPの重み付けを更新しながら繰り返し各弱判別器CF〜CFに入力していく(リサンプリング)というアダブースティング(AdaBoosting)アルゴリズムを用いて学習されている。図6は顔もしくは非顔を判別することができるように候補判別器12を学習させるための判別器学習装置50の一例を示すブロック図である。
【0039】
判別器学習装置50は、学習画像LPを記憶したデータベースDBと、データベースDBに記憶された学習画像LPに対し重み付けwm−1(i)を加える重み付け手段51と、重み付け手段51により重み付けwm−1(i)がなされた学習画像LPが弱判別器CFに入力されたときに、各弱判別器CFにおける信頼度を算出する信頼度算出手段52とを備えている。
【0040】
データベースDBに記憶された学習画像LPは、部分画像PPと同一の画素数からなる画像であって、図7に示すように、面内回転サンプル画像FSPと面外回転サンプル画像SSPとが記憶されている。面内回転サンプル画像FSPは、設定位置(たとえば中央)に配置された顔が30°ずつ回転した12種類の画像からなっている。同様に、面外回転サンプル画像SSPは、設定位置(たとえば中央)に配置された顔の向きが±90°ずつ回転した7種類の画像からなっている。さらに、学習画像LPは風景等の非顔である非対象サンプル画像NSPを有しており、面内回転サンプル画像FSP、面外回転サンプル画像SSPおよび非対象サンプル画像NSPを用いて弱判別器 また、各学習画像LP毎が顔であるのか否かを示す真偽パラメータyが付されている(i=1、2、・・・、N:Nは学習画像LPの数)。パラメータyは顔であれば「1」、非顔であれば「−1」を示し、サンプル画像SP、面内回転サンプル画像FSPおよび面外回転サンプル画像SSPの真偽パラメータyは「1」、非対象サンプル画像NSPの真偽パラメータyは「−1」に設定されている。
【0041】
重み付け手段51は、データベースDBに記憶された学習画像LPに重み付けwm−1(i)(i=1、2、・・・、N:N=学習画像LPの数)を付加するものである。重み付けwm−1(i)は学習画像LPの判別の困難性を示すパラメータであって、重み付けwm−1(i)が大きい学習画像LPは判別が難しいものであることを示し、小さい学習画像LPは判別が容易なものであることを示している。重み付け手段51は、各学習画像LPを弱判別器CFに入力されたときの判別結果に基づいて重み付けwm−1(i)を更新し、新たに重み付けw(i)がなされた複数の学習画像LPを用いて次の弱判別器CFm+1の学習を行うようになっている。なお、重み付け手段51は、最初の弱判別器CFの学習を行うときには、重み付けw(i)としてw(i)=1/Nを与えるようになっている。
【0042】
信頼度算出手段52は、重み付けwm−1(i)がなされた複数の学習画像LPが各弱判別器CFに入力されたときに、各弱判別器CFにおける正答率を信頼度βとして算出するものである。ここで、信頼度算出手段52は重み付けwm−1(i)に応じた信頼度βを与えるようになっている。つまり、重み付けwm−1(i)が大きい学習画像LPを正しく判別できた弱判別器には大きい信頼度βを与え、重み付けwm−1(i)が小さい学習サンプルを正しく判別できた弱判別器には小さい信頼度βを与えるようになっている。
【0043】
図8は本発明の判別器学習方法の好ましい実施の形態を示すフローチャートであり、図6から図8を参照して判別器学習方法について説明する。なお、各学習画像LPの重み付けは初期値w(i)=1/N(i=1、2、・・・、N)に設定されている。
【0044】
まず、学習画像LPが弱判別器CFに入力されたとき(ステップSS11)、弱判別器CFの判別結果に基づいて信頼度βが信頼度算出手段52により算出される(ステップSS12)。
具体的には、まず弱判別器CFにおける誤り率errが式(2)により算出される。
err=Σi=1Nwm-1(i)I(yi≠fm(xi)) ・・・(2)
式(2)において、学習画像LPの特徴量xiを弱判別器CFに入力したときに、その判別が学習画像LPに付された真偽パラメータyiと異なった場合(yi≠f(xi))、誤って判別された学習画像LPの重み付けwm−1(i)に比例して誤り率errが大きくなることを意味している。
【0045】
次に、算出した誤り率errに基づいて弱判別器CFの信頼度βが式(3)により算出される。
βm=log((1-err)/err) ・・・(3)
この信頼度βが弱判別器CFの判別性能を示すパラメータとして学習されたことになる。
【0046】
一方、重み付け手段51において弱判別器CFの判別結果に基づいて学習画像LPの重み付けw(i)が式(4)のように更新される(ステップSS13)。
wm(i)=wm-1(i)・exp[βm・I(yi≠fm(xi))] ・・・(4)
式(4)において、弱判別器CFが正しく判別した学習画像LPの重み付けが大きく更新され、誤った判別がなされた学習画像LPの重み付けが小さくなるように更新される。なお、各学習画像LPの重み付けは最終的にΣi=1N(i)=1となるように正規化される。
【0047】
重み付けw(i)の更新が行われた学習画像LPを用いて次の弱判別器CFm+1の学習が行われ(ステップSS11〜ステップSS14)、この学習の繰り返しがM回繰り返される。すると、以下の式(5)に示す候補判別器12が完成し、学習が終了する(ステップSS16)。
sign(Fm(x))=sign[βm・fm(x)] ・・・(5)
【0048】
なお、図8から図10において、候補判別器12の学習について説明してきたが、対象検出手段20の対象判別器30、40についても同様の学習方法により学習される。但し、面内回転判別器30の学習においては面外回転サンプル画像SSPを用いず、面内回転サンプル画像FSPおよび非対象サンプル画像NSPが用いられる。さらに、たとえば0°面内回転判別器30−1の学習には−15°(=345°)から+15°の範囲内において顔が面内回転している面内回転サンプル画像FSPを用いて学習するというように、各面内回転判別器30−1〜30−12は判別すべき回転角度で顔が配置された面内回転サンプル画像FSPを用いて学習されている。
【0049】
同様に、面外回転判別器40の学習においては面内回転サンプル画像FSPを用いず、面外回転サンプル画像SSPおよび非対象サンプル画像NSPが用いられる。たとえば0°面外回転判別器40−1の学習には−15°(=345°)から+15°の範囲内において顔が面外回転している面外回転サンプル画像SSPを用いて学習するというように、各面外回転判別器40−1〜40−7は判別すべき回転角度で顔が配置された面外回転サンプル画像SSPを用いて学習されている。
【0050】
ところで、上述のように候補判別器12は面内回転サンプル画像FSPおよび面外回転サンプル画像SSPの双方について顔であると判定させるように学習されたものである。このため、サンプル画像SPのように顔が所定の方向(正面)を向いている配置された部分画像PPのみならず、面内回転サンプル画像FSPおよび面外回転サンプル画像SSPように顔が面内回転および面外回転している場合であっても候補画像CPとして検出することができる。一方、候補判別器12において非顔の部分画像についても顔であると判断する場合が増加してしまい、結果として候補判別器12自体の誤検出率が上がってしまっている。
【0051】
しかし、たとえば空や海といった風景から切り出した画像等の明らかに非顔である部分画像PPについては、対象判別手段20により判別を行うまでもなく候補判別器12において非顔であると判別することができる。結果として、対象判別手段20が判別しなければならない候補画像CPの数を大幅に減少させることができるため、判別作業の高速化を図ることができる。さらに、対象判別手段20における面内回転判別器30および面外回転判別器40において、精密な判別作業が行われることになるため、対象判別装置1全体の誤検出率を低く保つことができる。つまり、一見、候補判別器12の誤検出率が上がり対象判別装置1全体の誤検出率が上がってしまうように思えるが、対象判別手段20により対象判別装置1全体の誤検出率を低く保ちながら、候補判別器12において判別処理される部分画像PPの数を減少させ判別作業の高速化を図ることができる。
【0052】
図9は本発明の第2の実施の形態を示すブロック図であり、図9を参照して対象判別装置について説明する。なお図9において図1に示す対象判別装置1と同一の構成を有する部位には同一の符号を付してその説明を省略する。
【0053】
図9の対象判別装置100が図1の対象判別装置1と異なる点は候補検出手段112が面内回転候補検出手段113と面外回転候補検出手段114とを有する点である。面内回転候補検出手段113は、面内回転している顔を判別するものであって、面外回転候補検出手段114は面外回転している顔(横顔)を判別するものである。面内回転候補検出手段113と面内回転検出手段30とはカスケード構造を有し、面内回転検出手段30は面内回転候補検出手段113が検出した面内回転候補画像をさらに判別するようになっている。さらに面外回転候補検出手段114と面外回転検出手段40とはカスケード構造を有し、横顔検出手段40は面外回転候補検出手段114が検出した面外回転候補画像をさらに判別するようになっている。
【0054】
この面内回転候補検出手段113および面外回転候補検出手段114とは、上述したようなアダブースティングアルゴリズムにより学習された複数の弱判別器を有するものである。そして、面内回転候補検出手段113は、面内回転サンプル画像FSPと基準サンプル画像SPとを用いて学習されたものであり、面外回転候補検出手段114は、面外回転サンプル画像SSPと基準サンプル画像SPとを用いて学習されたものである。
【0055】
このように、候補検出手段112に2つの各候補検出手段113、114を用いることにより、各候補検出手段113、114の誤検出率を低くすることができるため、対象判別装置1全体の誤検出率を低く保ちながら、対象検出手段20が判別すべき候補画像CPの数を減らし高速化を図ることができる。
【0056】
図10は本発明の第3の実施の形態を示すブロック図であり、図10を参照して対象判別装置について説明する。なお図10の判別装置200において図9に示す判別装置100と同一の構成を有する部位には同一の符号を付してその説明を省略する。
【0057】
図10の判別装置200が図9の判別装置100と異なる点は候補検出手段212がさらに候補絞込判別手段210を有する点である。候補絞込判別手段210は、0°〜150°の範囲内で面内回転している顔を判別する0°〜150°面内回転候補判別器220と、180°〜330°の範囲内で面内回転している顔を判別する180°〜330°面内回転候補判別器230とを備えている。さらに、候補絞込判別手段210は、−90°〜0°の範囲内で面外回転している顔を判別する−90°〜0°面外回転候補判別器240と、+30°〜+90°の範囲内で面外回転している顔を判別する+30°〜+90°面外回転候補判別器230とを備えている。
【0058】
そして、面内回転候補検出手段113において面内回転であると判断された候補画像CPが各面内回転候補絞込手段220、230に入力される。また、面外回転候補検出手段114において横顔であると判断された候補画像CPが各横顔候補絞込手段240、250に入力される。
【0059】
さらに、0°〜150°面内回転候補判別器220により顔であると判別された候補画像は、各面内回転判別器30−1〜30−6に入力され顔の判別が行われる。180°〜330°面内回転候補判別器230により顔であると判別された候補画像CPは、各面内回転判別器30−7〜30−12に入力され顔の判別が行われる。−90°〜0°面外回転候補判別器240により顔であると判別された候補画像は、各面外回転判別器40−1〜40−4に入力され顔の判別が行われる。+30°〜+90°面外回転候補判別器250により顔であると判別された候補画像は、各面外回転判別器40−5〜40−7に入力され顔の判別が行われる。このように、候補絞込手段210を有することにより、対象検出手段20が判別すべき候補画像CPの数を減らし高速化を図ることができるとともに、誤検出率を低くすることができる。
【0060】
なお、図10において、候補判別手段112が複数の候補判別器113、114を有する場合について例示しているが、図1のように1つの候補判別器12により構成されていても良い。さらに、候補絞込手段210は1つのみならず複数設けられていても良い。このとき、複数の候補絞込手段はカスケード構造を有し、上流側から下流側に向かって各絞込判別器が判別できる回転角度の範囲が狭くなるように構成されることになる。
【0061】
図11は本発明の第3の実施の形態を示すブロック図であり、図1を参照して対象判別装置について説明する。なお、図12の対象判別装置において図1の対象判別装置と同一の構成を有する部位には同一の符号を付してその説明を省略する。
【0062】
図11の対象判別装置200が図1の判別対象装置1と異なる点は、候補判別器12の構成である。なお、図11において候補判別器212について例示しているが、各対象判別器30、40、候補絞込判別器210においても適用することができる。
【0063】
候補判別器212の各弱判別器CF〜CFはカスケード構造を有している。つまり、式(1)では各弱判別器CF〜CFから出力される判定スコアβ・f(x)の総和として出力されるようになっているが、図12においては各弱判別器CF〜CFのすべてが顔であると判別した部分画像PPのみを候補画像CPとして出力するようになっている。
【0064】
具体的には、各弱判別器CFの判定スコアβ・f(x)自体が設定しきい値Sref以上であるか否かを判断し、設定しきい値以上であるときに顔であると判別する(β・f(x)≧Sref)。そして、弱判別器CFにおいて顔であると判別した部分画像PPのみ下流側の弱判別器CFm+1による判別を行い、弱判別器CFで非顔であると判別された部分画像PPは下流側の弱判別器CFm+1による判別は行わない。
【0065】
これにより、下流側の弱判別器により判別すべき部分画像PPの量を減らすことができるため、判別作業の高速化を図ることができる。さらにカスケード構造の弱判別器CF〜CFを有する候補判別器212の学習にサンプル画像SPのみならず面内回転サンプル画像FSPおよび面外回転サンプル画像SSPを用いることにより、候補判別器212において判別すべき部分画像PPの数を減らし判別作業の高速化を図ることができるとともに、対象判別器22において誤検出率を低く維持することができる。
【0066】
上述した候補判別器12の学習の詳細は特許文献2に開示されている。具体的には、各弱判別器CF〜CFに対し学習画像が入力され、各弱判別器CF〜CF毎に信頼度β〜βが算出される。そして、最も低いβminである弱判別器CFminが選択され、この弱判別器CFminが正解した学習画像LPの重み付けを低くなるように更新し、誤った学習画像LPの重み付けを大きくなるように更新する。この作業を設定回数だけ繰り返すことにより候補判別器212の学習が行われるようになっている。
【0067】
なお、図11のように、各弱判別器CF〜CFから出力された判定スコアS〜Sをそれぞれ個別に設定しきい値Sref以上であるか否かを判断するのではなく、弱判別器CFにおいて判別を行う際、弱判別器CFの上流側の弱判別器CF〜CFm−1での判定スコアの和Σr=1β・fが設定しきい値S1ref以上であるか否かにより判別を行うようにしても良い。
Σk=1mβk・fk(x)≧S1ref ・・・(6)
【0068】
これにより、上流側の弱判別器による判定スコアを考慮した判定を行うことができるため、判定精度の向上を図ることができる。この場合であっても、対象判別器22に対しサンプル画像とともに面内回転画像FSPおよび面外回転画像SSPを用いて学習を行うことにより、検出精度を維持しながら判別の高速化を図ることができる。なお、式(6)に示すような判別を行う候補判別器12を学習する際、ある弱判別器CFの学習が終わった後、その出力を次の弱判別器CFm+1に対する最初の弱判別器とし、弱判別器CFm+1の学習を開始するようになっている(詳細は、Shihong LAO等、「高速全方向顔検出」、画像の認識・理解シンポジウム(MIRU2004)、2004年7月参照)。この弱判別器の学習においても、サンプル画像SPとともに面内回転画像FSPおよび面外回転画像サンプル画像SSPが用いられる。
【0069】
本発明の実施の形態は、上記実施の形態に限定されない。上記実施の形態において判別対象が顔の場合について例示しているが、目、洋服や、自動車、等の全体画像に含まれる可能性のあるオブジェクトであれば何でもよい。
【0070】
さらに、たとえば図7において、さらに、各顔サンプル画像SPおよび面内回転画像FSPおよび面外回転画像SSPにつき、縦および/または横を0.7倍から1.2倍の範囲にて0.1倍単位で段階的に拡縮して得られる各サンプル画像を生成し学習に用いるようにしても良い。
【0071】
また、図3の候補判別器12において、面内回転サンプル画像FSPと面外回転サンプル画像SSPとを用いて学習する場合について例示しているが、面内回転サンプル画像FSPのみを用いて学習されたものであってもよい。このとき、対象検出手段20においては面外回転判別手段40は不要になる。
【0072】
さらに、候補判別器12が面内回転サンプル画像FSPと面外回転サンプル画像SSPとを用いて学習されている場合について例示しているが、面外回転サンプル画像SSPを面内回転させた面外面内回転サンプル画像をさらに用いて学習されたものであってもよい。
【0073】
また、図9および図10において、候補検出手段112、212が面内回転候補検出手段113と面外回転候補検出手段114とを有する場合について例示してるが、さらに面外回転サンプル画像SSPを面内回転させた面外面内回転サンプル画像を用いて学習された面外面内回転候補検出手段を有するものであってもよい。あるいは、面外回転候補検出手段114が、さらに面外面内回転画像サンプル画像を用いて学習されたものであってもよい。
【図面の簡単な説明】
【0074】
【図1】本発明の対象判別装置の好ましい実施の形態を示すブロック図
【図2】図1の部分画像生成手段においてサブウィンドウが走査される様子を示す模式図
【図3】図1の候補検出手段の候補判別器の一例を示すブロック図
【図4】図1の弱判別器により部分画像から特徴量が抽出される様子を示す模式図
【図5】図1の弱判別器が有するヒストグラムの一例を示すグラフ図
【図6】図1の候補判別器を学習させるための判別器学習装置の一例を示すブロック図
【図7】図6の判別器学習装置におけるデータベースに記憶された学習画像の一例を示す模式図
【図8】図6の判別器学習装置の動作例を示すフローチャート
【図9】本発明の対象判別装置の別の実施の形態を示すブロック図
【図10】本発明の対象判別装置の別の実施の形態を示すブロック図
【図11】本発明の対象判別装置の別の実施の形態を示すブロック図
【図12】本発明の対象判別装置の候補判別器の別の実施の形態を示すフローチャート
【符号の説明】
【0075】
1、100 対象判別装置
10 候補検出手段
11 部分画像生成手段
12 候補判別器
20 対象検出手段
21 周辺画像生成手段
22 対象判別器
50 判別器学習装置
51 重み付け手段
52 信頼度算出手段
100 対象判別装置
AP 周辺画像
CF 弱判別器
CP 候補画像
LP 学習画像
P 全体画像
PP 部分画像
SP 基準サンプル画像
FSP 面内回転サンプル画像
SSP 面外回転サンプル画像
NSP 非対象サンプル画像
W サブウィンドウ
i 特徴量
i 真偽パラメータ
β 信頼度

【特許請求の範囲】
【請求項1】
画像が判別対象であるか否かの判別を複数の弱判別器による複数の判別結果を用いて最終的な判別を行う判別器の学習方法において、
前記判別器が、前記判別対象が所定の方向を向いた基準サンプル画像と、該基準サンプル画像の前記判別対象を該基準サンプル画像の平面において回転させた面内回転サンプル画像とを用いて学習されたものであることを特徴とする判別器の学習方法。
【請求項2】
前記判別器が、さらに前記基準サンプル画像内の前記判別対象の向きを回転させた面外回転サンプル画像を用いて学習されたものであることを特徴とする請求項1に記載の判別器の学習方法。
【請求項3】
全体画像上に設定画素数の枠からなるサブウィンドウを走査させ部分画像を生成する部分画像生成手段と、
該部分画像生成手段により生成された前記部分画像が判別対象であるか否かを判別し、該判別対象である可能性のある前記部分画像を候補画像として検出する候補検出手段と、
該候補検出手段により検出された候補画像に前記判別対象であるか否かを判別する対象判別手段と
を有するものであり、
前記候補検出手段が、複数の弱判別器による複数の判別結果を用いて前記部分画像が前記判別対象であるか否かを判別する候補判別器を備えたものであり、
該候補判別器が、
前記判別対象が所定の方向を向いた基準サンプル画像と、該基準サンプル画像の前記判別対象を該基準サンプル画像の平面上において回転させた面内回転サンプル画像とを用いて学習されたものであることを特徴とする対象判別装置。
【請求項4】
前記候補判別器が、さらに前記基準サンプル画像内の前記判別対象の向きを回転させた面外回転サンプル画像と、該面外回転サンプル画像を面内回転させた面外面内回転サンプル画像とを用いて学習されたものであることを特徴とする請求項3に記載の判別器の学習方法。
【請求項5】
前記複数の弱判別器がカスケード構造を有し、上流側の前記弱判別器において前記判別対象であると判別された前記部分画像についてさらに下流側の前記弱判別器による判別を行うものであることを特徴とする請求項3または4記載の対象判別装置。
【請求項6】
前記候補判別器が、回転角度の異なる複数の前記面内回転サンプル画像と、回転角度の異なる複数の前記面外回転サンプル画像とを用いて学習されたものであることを特徴とする請求項4または5記載の対象判別装置。
【請求項7】
前記候補検出手段が、前記候補判別器により判別された多数の前記候補画像をより少ない数の該候補画像に絞り込む候補絞込手段をさらに有し、
該候補絞込手段が、
前記基準サンプル画像と前記面内回転サンプル画像とを用いて学習された複数の弱判別器を有する面内回転判別器と、
前記基準サンプル画像と前記面外回転サンプル画像とを用いて学習された複数の弱判別器を有する面外回転判別器と
を有するものであることを特徴とする請求項4または5記載の対象判別装置。
【請求項8】
前記候補検出手段がカスケード構造を有する複数の前記候補絞込手段を有し、該各候補絞込手段が、複数の前記面内回転判別器および面外回転判別器を備え、下流側の前記候補絞込手段の前記各面内回転判別器および前記各面外回転判別器が、それぞれ上流側の前記候補絞込手段の前記各面内回転判別器および前記各面外回転判別器の判別可能な角度範囲よりも狭くなるように構成されていることを特徴とする請求項7記載の対象判別装置。
【請求項9】
コンピュータを、
全体画像上に設定画素数の枠からなるサブウィンドウを走査させ部分画像を生成する部分画像生成手段と、
該部分画像生成手段により生成された前記部分画像が判別対象であるか否かを判別し、該判別対象である可能性のある前記部分画像を候補画像として検出する候補検出手段と、
該候補検出手段により検出された候補画像に前記判別対象であるか否かを判別する対象判別手段として機能させるための対象判別プログラムであって、
前記候補検出手段が、複数の弱判別器による複数の判別結果を用いて前記部分画像が前記判別対象であるか否かを判別する候補判別器を備えたものであり、
該候補判別器が、
前記判別対象が所定の方向を向いた基準サンプル画像と、該基準サンプル画像の前記判別対象を該基準サンプル画像の平面上において回転させた面内回転サンプル画像とを用いて学習されたものであることを特徴とする対象判別プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate


【公開番号】特開2007−66010(P2007−66010A)
【公開日】平成19年3月15日(2007.3.15)
【国際特許分類】
【出願番号】特願2005−251452(P2005−251452)
【出願日】平成17年8月31日(2005.8.31)
【出願人】(306037311)富士フイルム株式会社 (25,513)
【Fターム(参考)】