説明

顔検出方法およびこれを用いた撮影装置

【課題】顔検出処理全体の計算量を減らし処理速度を向上させる。
【解決手段】まず、撮像手段2により人物被写体の撮影が行われ、各色成分毎の光が受光素子2aにより受光され画素データPxが取得される。次に、画像生成手段3において、画素データPxを用いたカラー画像からなる原画像PとG画素データを用いたG信号画像Pとが生成される。その後、G信号画像Pを用いて顔検出を行うことにより、原画像P0における顔画像FPを検出する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像が人物の顔であるか否かを判別する顔検出方法およびこれを用いた撮影装置に関するものである。
【背景技術】
【0002】
顔検出の基本原理は顔か顔ではないかの2クラス判別であり、この判別方法としてブースティング(Boosting)と呼ばれる手法が広く用いられている(たとえば特許文献1参照)。ブースティングアルゴリズムは複数の弱い判別器(弱判別器)を結合することにより1つの強い判別器を形成する2クラス判別器の学習方法である。
【0003】
特に、ブースティングによる顔検出処理の高速化を図るために、複数の弱判別器でカスケードを構成する判別器が提案されている(たとえば特許文献2参照)。この判別器では、顔もしくは非顔の判別において、上流側の弱判別器が顔であると判別した画像について下流側の弱判別器がさらに顔か非顔かの判別を行うようになっている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開平8−329031号公報
【特許文献2】米国特許出願公開2002/102024号明細書
【発明の概要】
【発明が解決しようとする課題】
【0005】
特許文献1に示すようなブースティングアルゴリズムによる顔検出において、通常、画像の輝度情報(Y信号)が用いられる。一方、デジタルカメラ等により取得された画像のデータはRGB信号からなる場合が多い。したがって、デジタルカメラ等により取得された画像に対し顔検出処理を行うとき、RGB信号からY信号を生成することが必要になってしまい、情報処理量の増加が顔検出の高速化を妨げる原因になってしまう。特に、デジタルカメラに顔検出装置を実装し、取得した画像に直ぐ顔検出処理を施すような場合、Y信号の生成処理が高速化を阻害する大きな要因となってしまう。
【0006】
そこで、本発明は、高速に顔の検出を行うことができる顔検出方法およびこれを用いた撮影装置を提供することを目的とするものである。
【課題を解決するための手段】
【0007】
本発明の顔検出方法は、人物被写体からの入射光を複数の色成分毎に受光することにより複数の画素データを取得し、取得した複数の画素データを用いて人物被写体の原画像を生成するとともに、複数の画素データのうち緑成分の光を受光することにより取得された複数のG画素データを用いてG信号画像を生成し、生成したG信号画像から顔画像を検出することにより、原画像内の顔画像を検出することを特徴とするものである。
【0008】
本発明の撮影装置は、人物被写体からの入射光を複数の色成分毎に受光することにより複数の画素データを取得する撮像手段と、撮像手段により取得された複数の画素データを用いて人物被写体の原画像を生成するとともに、複数の画素データのうち緑成分の光を受光することにより取得された複数のG画素データを用いてG信号画像を生成する画像生成手段と、画像生成手段により生成されたG信号画像から顔画像を検出することにより、原画像内の顔画像を検出する顔検出手段とを備えたことを特徴とするものである。
【0009】
ここで、各色成分とは、緑成分の光を含むものであればどのような色成分からなるものであってもよく、たとえばRGB(レッド、グリーン、ブルー)からなるものであってもよいし、CYMG(シアン、イエロー、マゼンダ、グリーン)からなるものであっても良い。
【0010】
なお、顔検出手段は、いかなる手法により顔画像を検出するものであってもよく、たとえば設定画素数の枠からなるサブウィンドウを走査させ複数の部分画像を生成する部分画像生成手段と、部分画像生成手段により生成された複数の部分画像が顔であるか否かの判別を複数の弱判別器による複数の判別結果を用いて最終的な判別を行う顔判別器とを有し、顔判別器が複数の弱判別器による複数の判別結果を用いて最終的な判別を行う顔判別器を備えたものであってもよい。
【0011】
なお、判別器は、複数の弱判別器による複数の判別結果を用いて部分画像が顔であるか否かを判別する候補判別器を備えたものであれば判別手法は問わず、たとえば部分画像について各弱判別器による判別を行い、その複数の判別結果を用いて最終的な判別を行うようにしてもよいし、複数の弱判別器がカスケード構造を有し、上流側の弱判別器において顔であると判別された部分画像について下流側の弱判別器による判別を行うものであってもよい。
【0012】
また、顔検出手段は、部分画像生成手段により生成された部分画像が顔であるか否かを判別し、顔の可能性のある部分画像を候補画像として検出する候補検出手段とを有し、顔判別器が候補検出手段により検出された候補画像について顔であるか否かを判別するものであってもよい。
【発明の効果】
【0013】
本発明の顔検出方法およびこれを用いた撮影装置によれば、人物被写体からの入射光を複数の色成分毎に受光することにより各色成分毎の複数の画素データを取得し、取得した複数の色成分の複数の画素データを用いて人物被写体の原画像を生成するとともに、緑成分の光を受光することにより取得された複数のG画素データを用いてG信号画像を生成し、生成したG信号画像から顔画像を検出することにより、原画像内の顔画像を検出することにより、撮像手段により直接取得されるG信号画像を用いて顔検出を行い従来の顔検出処理において行われていたRGB信号からの輝度情報の抽出処理が不要になるため、顔検出処理全体の計算量を減らして処理速度を向上させることができる。
【0014】
なお、顔検出手段が、設定画素数の枠からなるサブウィンドウを走査させ複数の部分画像を生成する部分画像生成手段と、部分画像生成手段により生成された複数の部分画像が顔であるか否かの判別を複数の弱判別器による複数の判別結果を用いて最終的な判別を行う顔判別器とを有するものであるとき、効率的に精度良く顔画像の検出を行うことができる。
【0015】
また、複数の弱判別器でカスケードを構成し、上流側の弱判別器が顔画像であると判別した部分画像について下流側の弱判別器が判別を行うとすれば、下流側の弱判別器が判別すべき部分画像の数を大幅に低減することができるため、判別作業の高速化をさらに促進することができる。
【0016】
さらに、顔検出手段が、部分画像生成手段により生成された部分画像が顔であるか否かを判別し、顔である可能性のある部分画像を候補画像として検出する候補検出手段をさらに有し、顔判別器が、候補検出手段により判別された部分画像について顔であるか否かを判別するものであれば、顔判別器が検出すべき部分画像の数を低減することができるため、判別作業の高速化を図ることができる。
【図面の簡単な説明】
【0017】
【図1】本発明の撮影装置の好ましい実施の形態を示すブロック図
【図2】図1の撮像手段における受光素子の配列の一例を示す模式図
【図3】図1の部分画像生成手段においてサブウィンドウが走査される様子を示す模式図
【図4】図3の横顔候補検出手段の一例を示すブロック図
【図5】図3の候補判別器により部分画像から特徴量が抽出される様子を示す模式図
【図6】図3の弱判別器が有するヒストグラムの一例を示すグラフ図
【図7】RGB信号と輝度情報との関係を示すグラフ
【図8】本発明の顔検出方法の好ましい実施の形態を示すフローチャート
【発明を実施するための形態】
【0018】
以下、図面を参照して本発明の実施の形態を詳細に説明する。図1は本発明の撮影装置1の好ましい実施の形態を示すブロック図である。撮影装置1は、人物被写体からの入射光を複数の受光素子2aを用いて複数の色成分毎に受光することにより複数の画素データPxを取得する撮像手段2と、複数の画素データPxを用いて人物被写体の原画像P0とG信号画像Pを生成する画像生成手段3と、G信号画像Pを用いて顔画像FPを検出することにより、原画像P0内の顔画像FPを検出する顔検出手段10とを備えている。
【0019】
撮像手段2は、図2(A)に示すように、人物被写体からの入射光を各色成分(RGB)毎に受光する複数の受光素子2aを有しており、各受光素子2aは各色成分毎の光を受光し光電変換することにより各色成分毎の複数の画素データPxを取得するようになっている。ここで、図2(A)のようないわゆるベイヤー方式でRGBの受光画素が配列されている場合、緑成分の光を受光する受光画素2aは、所定のピッチで配列されることになり、いわゆる間引いたG画素データを取得すると言うことができる。なお、撮像手段2の配列方式として図2(B)のようなストライプ方式であってもよい。あるいは各受光素子2aは図2(C)のようにCYMG(シアン、イエロー、マゼンダ、グリーン)の各色成分の光を受光するものであってもよい。さらには、受光画素の形状としていわゆるハニカム形状を有するものであってもよい。
【0020】
画像生成手段3は、撮像手段2により取得された画素データを用いて画像を生成するものであって、RGB成分(CYMG成分)の複数の画素データを用いたカラー画像である原画像P0と、緑成分の光を受光して取得された複数の画素データのみを用いたG信号画像Pとを生成する機能を有している。なお、緑成分を受光する受光素子2aは図2に示すように受光面上に所定の配列で設けられているため、画像生成手段3は2次元のG信号画像Pを生成することができる。
【0021】
顔検出手段10は、画像生成手段3により生成されたG信号画像Pにアダブースティングアルゴリズム等による顔検出処理を施すものであって、G信号画像P上にサブウィンドウWを走査させることにより部分画像PPを生成する部分画像生成手段11と、部分画像生成手段11により生成された複数の部分画像PPにおいて、横顔である部分画像を検出する横顔検出手段20と、正面顔である部分画像を検出する正面顔検出手段30とを有している。
【0022】
部分画像生成手段11に入力されるG信号画像Pは前処理手段10aにより前処理が施されている。前処理手段10aは、CCDからのRGB信号が光量に比例した信号であることに伴い、人間のコントラスト感に近づける処理としてガンマ変換を行うようになっている。具体的には、前処理手段10aは例えばG信号値=log(G)、または、G信号値=G2.2 (2.2乗)、またはLUTによる変換等のガンマ変換後のG信号を生成する。さらに、前処理手段10aは、G信号画像Pに対し図3(A)〜(D)に示すように、G信号画像Pを多重解像度化して解像度の異なる複数のG信号画像P2、P3、P4を生成する機能を有している。さらに、前処理手段10aは、生成した複数のG信号画像Pに対して、局所的な領域におけるコントラストのばらつきを抑制しG信号画像Pの全領域においてコントラストを所定レベルに揃える正規化(以下、局所正規化という)を施す機能を有している。
【0023】
部分画像生成手段11は、図3(A)に示すように、設定された画素数(たとえば32画素×32画素)を有するサブウィンドウWをG信号画像P内において走査させ、サブウィンドウWにより囲まれた領域を切り出すことにより設定画素数からなる部分画像PPを生成するようになっている。
【0024】
なお、部分画像生成手段11は、図3(B)〜(D)に示すように、生成された低解像度画像上においてサブウィンドウWを走査させたときの部分画像PPをも生成するようになっている。このように、低解像度画像からも部分画像PPを生成することにより、G信号画像PにおいてサブウィンドウW内に正面顔もしくは横顔が収まらなかった場合であっても、低解像度画像上においてはサブウィンドウW内に収めることが可能となり、検出を確実に行うことができる。
【0025】
横顔検出手段20は、複数の部分画像PPの中から横顔である部分画像を検出するものであって、複数の部分画像PPについて横顔であるか否かを判別し、横顔である可能性のある部分画像PPを候補画像として判別する横顔候補判別手段21と、横顔候補判別手段21により検出された候補画像が横顔であるか否かを判別する横顔判別手段22とを有している。
【0026】
横顔候補判別手段21は、部分画像PPが横顔であるか否かの2値判別を行う機能を有し、図4に示すような複数の弱判別器を有する横顔候補判別器からなっている。横顔候補判別器21は、アダブースティングアルゴリズム(Adaboosting Algorithm)により学習されたものであって、複数の弱判別器CF〜CF(M:弱判別器の個数)を有している。各弱判別器CF〜CFはそれぞれ部分画像PPから特徴量xを抽出し、この特徴量xを用いて部分画像PPが顔であるか否かの判別を行う機能を有する。そして、横顔候補判別器21は弱判別器CF〜CFおける判別結果を用いて顔であるか否かの最終的な判別を行うようになっている。
【0027】
具体的には、図5に示すように各弱判別器CF〜CFは部分画像PP内の設定された座標P1a、P1b、P1cにおけるG信号値を抽出する。さらに、部分画像PPの低解像度画像PP2内の設定された座標位置P2a、P2b、低解像度画像PP3内の設定された座標位置P3a、P3bにおけるG信号値をそれぞれ抽出する。その後、上述した7個の座標P1a〜P3bの2つをペアとして組み合わせ、この組み合わせたG信号値の差分を特徴量xとする。各弱判別器CF〜CF毎にそれぞれ異なる特徴量が用いられるものであり、たとえば弱判別器CFでは座標P1a、P1cにおけるG信号値の差分を特徴量として用い、弱判別器CFでは座標P2a、P2bにおけるG信号値の差分を特徴量として用いるようになっている。
【0028】
なお、各弱判別器CF〜CFがそれぞれ特徴量xを抽出する場合について例示しているが、複数の部分画像PPについて上述した特徴量xを予め抽出しておき、各弱判別器CF〜CFに入力するようにしてもよい。
【0029】
各弱判別器CF〜CFは図6に示すようなヒストグラムを有しており、このヒストグラムに基づいて特徴量xの値に応じたスコアf(x)〜f(x)を出力する。さらに、各弱判別器CF〜CFは判別性能を示す信頼度β〜βを有している。各弱判別器CF〜CFは、スコアf(x)〜f(x)と信頼度β〜βとを用いて判定スコアβ・f(x)を算出するようになっている。そして、各弱判別器CFの判定スコアβ・f(x)自体が設定しきい値Sref以上であるか否かを判断し、設定しきい値以上であるときに顔であると判別する(β・f(x)≧Sref)。
【0030】
また、横顔候補判別器21の各弱判別器CF〜CFはカスケード構造を有しており、各弱判別器CF〜CFのすべてが顔であると判別した部分画像PPのみを候補画像CPとして出力するようになっている。つまり、弱判別器CFにおいて顔であると判別した部分画像PPのみ下流側の弱判別器CFm+1による判別を行い、弱判別器CFで非顔であると判別された部分画像PPは下流側の弱判別器CFm+1による判別は行わない。これにより、下流側の弱判別器において判別すべき部分画像PPの量を減らすことができるため、判別作業の高速化を図ることができる。
【0031】
なお、各弱判別器CF〜CFから出力された判定スコアS〜Sをそれぞれ個別に設定しきい値Sref以上であるか否かを判断するのではなく、弱判別器CFにおいて判別を行う際、弱判別器CFの上流側の弱判別器CF〜CFm−1での判定スコアの和Σr=1β・fが設定しきい値S1ref以上であるか否かにより判別を行うようにしても良い(Σr=1β・f(x)≧S1ref)。これにより、上流側の弱判別器による判定スコアを考慮した判定を行うことができるため、判定精度の向上を図ることができる。
【0032】
図1の横顔判別手段22は、画像内の顔の向き(角度)が90°の顔、すなわち正面顔を判別する90°横顔判別器22−1、60°の顔画像を判別する60°横顔判別器22−2等を備えたものであって、−90°〜+90°の範囲で30°ずつ回転角度の異なる7個の横顔判別器22−1〜22−7を有している。また、たとえば0°横顔判別器22−1は回転角度が0°を中心に−15°〜+15°の範囲内にある顔を判別できるようになっている。なお各横顔判別器22−1〜22−7は上述した横顔候補判別器21と同様にアダブースティングアルゴリズムを用いて学習された複数の弱判別器を有しており(図4参照)、横顔候補判別手段21と同様の判別手法により判別が行われるようになっている。
【0033】
次に、正面顔検出手段30について説明する。正面顔検出手段30は、複数の部分画像PPの中から正面顔である部分画像PPを検出するものであって、複数の部分画像PPについて正面顔であるか否かを判別し、正面顔である可能性のある部分画像PPを候補画像CPとして判別する正面顔候補判別手段31と、正面顔候補判別手段31により検出された候補画像が正面顔であるか否かを判別する正面顔判別手段32とを有している。
【0034】
正面顔候補判別手段31は、部分画像PPが正面顔であるか非顔かの2値判別を行う機能を有し、上記横顔候補検出器21と同様、アダブースティングアルゴリズムにより学習された複数の弱判別器を有する候補判別器からなっている(図4参照)。
【0035】
正面顔判別手段32は、画像の縦方向と顔の中心線との角度が0°の顔を判別する0°正面顔判別器32−1、30°の顔画像を判別する30°正面顔判別器32−2等を備えたものであって、30°〜330°の範囲で回転角度が30°ずつ異なる12個の正面顔判別器32−1〜32−12を有している。なお、たとえば0°正面顔判別器32−1は回転角度が0°を中心に−15°(=345°)〜+15°の範囲内にある顔を判別できるようになっている。そして、原画像P0とG信号画像Pとは同一の被写体を撮影するものであるため、原画像P0においてG信号画像Pと同じ領域に顔が存在する。よって、顔検出手段10はG信号画像Pから顔画像FPを検出することにより、原画像P0内から顔画像FPを検出することができる。
【0036】
なお、複数の正面顔判別器32−1〜32−12は、上述した横顔候補判別手段21のように、それぞれブースティングアルゴリズムにより学習された複数の弱判別器を有しており(図4参照)、横顔候補判別手段21と同様の判別手法により判別が行われるようになっている。
【0037】
ここで、上述した各候補判別器21、31および各顔判別器22、32において、G信号画像Pが用いられている。すなわち、従来の顔判別器のように原画像P0における輝度情報(Y信号)を用いて顔画像FPの判別を行うのではなく、G信号画像Pを用いて顔の判別を行うものである。従来のように、顔の判別に用いる信号として輝度情報を用いた場合、肌の色の違い等の個人差による顔検出のブレをなくすことができるが、RGB信号からなる画像から輝度情報を抽出する際には、輝度Y=0.299R+0.587G+0.114Bという人間の比視感度に基づく変換式によりデータ変換しなければならない。
【0038】
ところで、図7および上述した式に示すように、部分画像PPにおける輝度情報を最も多く含んでいるのはRGB信号のうちG信号である。この点に着目し、顔検出手段10における弱判別器はG信号画像Pを用いて判別を行う。すると、従来の輝度情報を用いたときの検出性能をほぼ維持しつつ、RGB信号から輝度情報への変換処理が不要となり、顔検出の高速化を図ることができる。
【0039】
図8は本発明の顔検出方法の好ましい実施の形態を示すフローチャートであり、図1から図8を参照して顔検出方法について説明する。まず、撮像手段2により人物被写体の撮影が行われ、各色成分毎の光が受光素子2aにより受光され画素データPxが取得される。次に、画像生成手段3において、画素データPxを用いたカラー画像からなる原画像P0とG画素データを用いたG信号画像Pとが生成される(ステップST1)。その後、顔検出手段10の前処理手段10aにおいて、G信号画像Pに対する規格化およびガンマ変換が行われる(ステップST2)。そして、部分画像生成手段11において、G信号画像P上をサブウィンドウWが一定の走査間隔で走査することにより複数の部分画像PPが生成される(ステップST3)。
【0040】
次に、各弱判別器CFにおいて部分画像PPのG信号を用いて特徴量xが生成され、部分画像PPが横顔候補判別器21もしくは正面顔候補判別器31において顔であるか否かが判別される(ステップST4)。そして、顔である可能性のある候補画像CPが検出され、さらに、候補画像CPが正面顔もしくは横顔であるか否かが横顔判別器22および正面顔判別器32により部分画像PPのG信号を用いて判別される(ステップST5)。これにより、G信号画像Pの中から正面顔もしくは横顔からなる顔画像FPが判別される。
【0041】
上記実施の形態によれば、各判別器21、22、31、32が、G信号画像Pを用いて原画像Pから顔画像FPを検出することにより、従来の顔検出処理において行われていたRGB信号から輝度情報の抽出処理が不要になるため、顔検出処理全体の計算量を減らし処理速度を向上させることができる。
【0042】
さらに、顔検出手段10が、設定画素数の枠からなるサブウィンドウを走査させ複数の部分画像PPを生成する部分画像生成手段11と、複数の部分画像PPが顔であるか否かの判別を複数の弱判別器CF〜CFによる複数の判別結果を用いて最終的な判別を行う顔判別器12とを有し、顔判別器12が複数の弱判別器CF〜CFによる複数の判別結果を用いて最終的な判別を行うものであるとき、判別作業の高速化を図ることができる。
【0043】
なお、複数の弱判別器CF〜CFがカスケード構造を有し、上流側の弱判別器が顔画像であると判別した部分画像PPについて下流側の弱判別器が判別を行うものであれば、下流側の弱判別器が判別すべき部分画像PPの数を大幅に低減することができるため、判別作業の高速化をさらに促進することができる。
【0044】
本発明の実施の形態は、上記実施の形態に限定されない。たとえば、図1において各候補検出手段21、31を有している場合について例示しているが、部分画像PPについて直接各顔検出手段22、32による顔検出が行われるようにしても良い。
【符号の説明】
【0045】
1 撮影装置
10 顔検出手段
11 部分画像生成手段
20 横顔検出手段
30 正面顔検出手段
CF〜CF 弱判別器
CP 候補画像
FP 顔画像
P0 原画像
P G信号画像
PP 部分画像

【特許請求の範囲】
【請求項1】
撮像手段を用い、人物被写体からの入射光を複数の色成分毎に受光することにより複数色の画素データを取得し、
前記撮像手段で取得した前記複数色の画素データを用いて前記人物被写体のカラー画像である原画像を生成するとともに、前記複数色の画素データのうち緑成分の光を受光することにより取得された複数のG画素データを用いて顔検出用のG信号画像を生成し、
生成した前記顔検出用のG信号画像にガンマ処理を施した後、顔の検出を行うことにより、前記原画像内の顔画像を検出し、
前記顔検出用のG信号画像の生成に用いられる前記複数のG画素データが、前記撮像手段から直接取得されることを特徴とする顔検出方法。
【請求項2】
人物被写体からの入射光を複数の色成分毎に受光することにより複数色の画素データを取得する撮像手段と、
該撮像手段により取得された前記複数色の画素データを用いて前記人物被写体のカラー画像である原画像を生成するとともに、前記複数色の画素データのうち緑成分の光を受光することにより取得された複数のG画素データを用いて顔検出用のG信号画像を生成する画像生成手段と、
該画像生成手段により生成された前記顔検出用のG信号画像にガンマ処理を施した後、顔の検出を行うことにより、前記原画像内の顔画像を検出する顔検出手段とを備え、
前記画像生成手段が、前記顔検出用のG信号画像の生成に用いる前記複数のG画素データを、前記撮像手段から直接取得するものであることを特徴とするカラー画像撮像用の撮影装置。
【請求項3】
前記顔検出手段が、
設定画素数の枠からなるサブウィンドウを走査させ複数の部分画像を生成する部分画像生成手段と、
該部分画像生成手段により生成された前記複数の部分画像が顔であるか否かの判別を複数の弱判別器による複数の判別結果を用いて最終的な判別を行う顔判別器とを有するものであることを特徴とする請求項2記載の撮影装置。
【請求項4】
前記複数の弱判別器がカスケード構造を有し、上流側の前記弱判別器が顔画像であると判別した前記部分画像について下流側の前記弱判別器が判別を行うものであることを特徴とする請求項3記載の撮影装置。
【請求項5】
前記顔検出手段が、前記部分画像生成手段により生成された前記部分画像が顔であるか否かを判別し、顔の可能性のある前記部分画像を候補画像として検出する候補検出手段を有し、前記顔判別器が該候補検出手段により検出された前記候補画像について顔であるか否かを判別するものであることを特徴とする請求項3または4記載の撮影装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2011−165204(P2011−165204A)
【公開日】平成23年8月25日(2011.8.25)
【国際特許分類】
【出願番号】特願2011−92770(P2011−92770)
【出願日】平成23年4月19日(2011.4.19)
【分割の表示】特願2006−85544(P2006−85544)の分割
【原出願日】平成18年3月27日(2006.3.27)
【出願人】(306037311)富士フイルム株式会社 (25,513)
【Fターム(参考)】