画像検出装置及び画像検出方法
【課題】顔画像検出装置が顔画像を検出する際の検出精度を向上させる。
【解決手段】顔画像検出領域分類部133は、領域13Aに分類された相対指標を有する基準領域200A,被判別領域200Bについては、同一人物の顔画像検出領域として判別し、領域13Bに分類された相対指標を有する基準領域200A,被判別領域200Bについては、異なる人物の顔画像検出領域として判別し、領域13C及び領域13Dに分類された相対指標を有する基準領域200A,被判別領域200Bについては、被判別領域200Bを誤検出領域として判別する。
【解決手段】顔画像検出領域分類部133は、領域13Aに分類された相対指標を有する基準領域200A,被判別領域200Bについては、同一人物の顔画像検出領域として判別し、領域13Bに分類された相対指標を有する基準領域200A,被判別領域200Bについては、異なる人物の顔画像検出領域として判別し、領域13C及び領域13Dに分類された相対指標を有する基準領域200A,被判別領域200Bについては、被判別領域200Bを誤検出領域として判別する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像から所定の画像を検出する画像検出装置及びその方法に関する。
【背景技術】
【0002】
入力画像から顔画像等の所定の画像を検出する技術は、例えば、顔の有無の判別、顔の識別、顔のパーツの検出のための前処理等として利用されている。
【0003】
入力画像から顔画像を検出する顔画像検出装置には、例えば、本来の顔画像領域の周辺にある複数の領域を検出するものがある。一般的に、このような顔画像検出装置では、複数の検出結果の内、所定のスコア値が最大である検出結果を選択する方法を用いるが、例えば、顔画像を探索する際の探索幅や画像の縮小倍率が離散的な値であること等に起因して、選択された検出結果が離散的な値になる場合がある。
【0004】
そこで、例えば、以下の特許文献1に示すように、解像度が異なる複数の画像において、各スケールの平均値を用いて検出された顔画像領域を安定化する方法がある。
【0005】
【特許文献1】特開2006−48328号公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
しかしながら、特許文献1に記載されている技術では、2人以上の人物の顔領域が互いに非常に接近している場合や、誤検出によって本来の顔画像領域の非常に近くに検出結果が得られてしまう場合がある。このような技術では、複数の顔検出領域から顔画像領域を安定化するための計算に用いられる顔検出領域を適切に選択しないと、検出精度が大きく低下してしまうことになる。
【0007】
本発明は、このような従来の実情に鑑みて提案されたものであり、検出された顔画像領域を安定化するための計算に用いられる顔検出領域を適切に選択する画像検出装置及びその方法を提供することを目的とする。
【課題を解決するための手段】
【0008】
上述した目的を達成するために、本発明は、入力画像から所定の画像を検出する画像検出装置において、所定サイズの検出対象領域と上記入力画像との相対サイズを変化させる毎に当該入力画像から当該検出対象領域を所定の画素ずつ移動させるようにスキャンして切り出し、当該切り出された検出対象領域内の画像が上記所定の画像であるか否かを判別して判別結果を出力する画像判別手段と、上記画像判別手段によって上記検出対象領域内の画像が上記所定の画像であると判別された場合に、当該所定の画像について検出された基準領域及び被判別領域からなる2つの検出領域の相対位置及び相対サイズに基づく所定の指標値を算出する指標値算出手段と、上記指標値算出手段によって算出された上記所定の指標値に基づいて分類された上記被判別領域を、上記所定の画像の検出結果を生成するための計算処理に採用するか否かについて判別する検出領域判別手段とを備えることを特徴とする。
【0009】
また、上述した目的を達成するために、本発明は、入力画像から所定の画像を検出する画像検出方法において、所定サイズの検出対象領域と上記入力画像との相対サイズを変化させる毎に当該入力画像から当該検出対象領域を所定の画素ずつ移動させるようにスキャンして切り出し、当該切り出された検出対象領域内の画像が上記所定の画像であるか否かを判別して判別結果を出力する画像判別工程と、上記画像判別工程にて上記検出対象領域内の画像が上記所定の画像であると判別された場合に、当該所定の画像について検出された基準領域及び被判別領域からなる2つの検出領域の相対位置及び相対サイズに基づく所定の指標値を算出する指標値算出工程と、上記指標値算出工程にて算出された上記所定の指標値に基づいて分類された上記被判別領域を、上記所定の画像の検出結果を生成するための計算処理に採用するか否かについて判別する検出領域判別工程とを有することを特徴とする。
【発明の効果】
【0010】
本発明は、入力画像から所定の画像を検出する画像検出装置及びその方法において、所定サイズの検出対象領域と上記入力画像との相対サイズを変化させる毎に当該入力画像から当該検出対象領域を所定の画素ずつ移動させるようにスキャンして切り出し、当該切り出された検出対象領域内の画像が上記所定の画像であるか否かを判別して判別結果を出力し、上記検出対象領域内の画像が上記所定の画像であると判別された場合に、当該所定の画像について検出された基準領域及び被判別領域からなる2つの検出領域の相対位置及び相対サイズに基づく所定の指標値を算出し、上記算出された上記所定の指標値に基づいて分類された上記被判別領域を、上記所定の画像の検出結果を生成するための計算処理に採用するか否かについて判別することにより、従来の画像検出装置及びその方法に比べて所定の画像の検出領域をより安定化させることができる。
【発明を実施するための最良の形態】
【0011】
以下、本発明を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。
【0012】
図1は、本発明を適用した一実施形態における顔画像検出装置1を示す図である。顔画像検出装置1は、入力された画像データに基づく画像から顔画像を検出し、顔画像検出領域等の検出結果を出力するものである。
【0013】
顔画像検出装置1は、例えば図2に示す内部構成を備えたパーソナルコンピュータとして構成される。
【0014】
図2に示すように、顔画像検出装置1は、例えばキーボード、マウス等を介してユーザの操作情報が入力される操作部11と、例えばデジタルカメラ、テレビジョン装置、ストレージ等より画像データが入力される画像入力部12と、入力された画像データに基づく画像中から顔画像を検出する顔画像検出部13と、画像データを記録する記録部14と、所定の画像処理を行ってディスプレイに画像を出力する画像出力部15と、バッファメモリ、RAM(Random Access Memory)、顔画像検出プログラムが記録されているROM(Read Only Memory)、CPU(Central Processing Unit)等を備えて顔画像検出装置1の信号処理全般を制御する制御部16とが内部バス17に接続されることにより構成される。
【0015】
顔画像検出部13は、図3に示すように、顔画像判別部131と、判別指標値算出部132と、顔画像検出領域分類部133と、顔画像領域平均化部134とを備えて構成される。
【0016】
顔画像判別部131は、制御部16の制御動作に基づいて画像入力部12を介して画像データが入力されると、入力された画像データに基づく80×100画素の画像100Aにおいて、顔画像を判別するための20×20画素の矩形領域101を、図4(A)に示す画像100Aの左上端から2画素ずつ右方向又は下方向に移動させ、図4(C)に示す画像100Aの右下端まで到達させる。顔画像判別部131は、矩形領域101を2画素ずつ移動させるごとに矩形領域101の画像をスキャンして切り出し、この矩形領域101中に存在する所定の画像が顔画像であるか否かを判別する。
【0017】
すなわち、顔画像判別部131は、例えば、サポート・ベクタ・マシーン(Support Vector Machine:SVM)、アダブースト等のブースティング、局所特徴量等の方法によって、矩形領域101中に存在する画像と予め設定された顔画像との大きさ及び相関度を比較することにより、矩形領域101中に存在する所定の画像が顔画像であるか否かを判別する。
【0018】
そして、顔画像判別部131は、予め設定された顔画像との相関度を示すスコア値Siを算出し、スコア値Siがある一定の閾値以上である場合には、矩形領域101中に存在する所定の画像が顔画像であると判別する。
【0019】
顔画像判別部131は、図4(A)に示す画像100Aの左上端から図4(C)に示す画像100Aの右下端まで矩形領域101を移動させながらスキャン及び切り出し処理を行う中で、図4(B)に示すように、矩形領域101中に存在する所定の画像が顔画像であると判別した場合、この矩形領域101の左上端におけるxy座標値xi,yi、顔画像検出領域幅wi、及び顔画像検出領域高さhiを算出し、このxy座標値xi,yi、顔画像検出領域幅wi、及び顔画像検出領域高さhiと、判別結果となるスコア値Siとを続く判別指標値算出部132に供給する。
【0020】
なお、スコア値Siは、検出された顔画像の形状が予め設定された一般的な人物の顔の形状に近いほど高いスコア値Siが算出されるようにしてもよいし、他の算出方法により算出されるようにしてもよい。
【0021】
一方、顔画像判別部131は、矩形領域101中に存在する所定の画像が顔画像ではないと判別した場合、上述した算出処理は一切行わずに矩形領域101を2画素移動させて、同様の顔画像判別処理を行う。
【0022】
顔画像判別部131は、画像100Aにおいて、矩形領域101を画像100Aの右下端まで移動させた後、図4(D)に示すように、画像100Aを所定の倍率で縮小させ(この画像を画像100Bとする。)、画像100Bにおいて、画像100Aでの処理と同様に20×20画素の矩形領域101を画像100B上の左上端から2画素ずつ右方向又は下方向に移動させる毎に矩形領域101をスキャンして切り出し、矩形領域101中に存在する所定の画像が顔画像であるか否かを判別する。
【0023】
顔画像判別部131は、図4(E)に示すように、画像100B上の右下端まで矩形領域101を移動させた後、何れの位置においても矩形領域101中に存在する所定の画像が顔画像ではないと判別した場合、図4(F)に示すように、画像100Bを所定の倍率で縮小し(この画像を画像100Cとする。)、この画像100Cにおいて、画像100A,100Bでの処理と同様に、20×20画素の矩形領域101を画像100C上の左上端から右下端まで2画素ずつ右方向又は下方向に移動させるごとに矩形領域101をスキャンして切り出し、矩形領域101中に存在する所定の画像が顔画像であるか否かを、スコア値Siを算出して判別する。
【0024】
顔画像判別部131は、矩形領域101を図4(F)に示す画像100Cの左上端から図4(H)に示す画像100Cの右下端まで移動させながらスキャン及び切り出し処理を行う中で、図4(G)に示すように、矩形領域101中に存在する所定の画像が顔画像であると判別した場合、この矩形領域101の左上端におけるxy座標値xi,yi、顔画像検出領域幅wi、及び顔画像検出領域高さhiを算出し、そして、顔画像判別部131は、xy座標値xi,yi、顔画像検出領域幅wi、及び顔画像検出領域高さhiと所定のスコア値Siとを続く判別指標値算出部132に供給する。
【0025】
顔画像判別部131は、図4(I)に示すように、画像の一辺の長さが矩形領域101の一辺の長さと同じになるまで縮小した画像100Dにおいて、上述の顔画像判別処理と同様の処理を行い、図4(J)に示すように、矩形領域101を画像100Dの右端まで到達させた後、一連の処理を終了させる。
【0026】
ここで、顔画像判別部131の処理動作を図5のフローチャートを用いて説明する。
【0027】
ステップS1において、顔画像判別部131には、制御部16の制御動作に基づいて画像入力部12を介して画像データが入力される。
【0028】
ステップS2において、顔画像判別部131は、画像データに基づく画像の一部である矩形領域101のスキャン及び切り出し処理を行う。
【0029】
ステップS3において、顔画像判別部131は、画像における矩形領域101中に存在する画像が顔画像であるか否かを、スコア値Siを算出して判別する。このステップS3において、顔画像判別部131は、矩形領域101中に存在する画像が顔画像であると判別した場合、ステップS4に進む。一方、このステップS3において、顔画像判別部131は、矩形領域101中に存在する画像が顔画像でないと判別した場合、ステップS5に進む。
【0030】
ステップS4において、顔画像判別部131は、矩形領域101左上端におけるxy座標値xi,yi、顔画像検出領域幅wi、及び顔画像検出領域高さhiを算出し、xy座標値xi,yi、顔画像検出領域幅wi、及び顔画像検出領域高さhiとスコア値Siとを判別指標値算出部132に供給する。
【0031】
ステップS5において、顔画像判別部131は、画像上の矩形領域101を右方向又は下方向に2画素移動させる。
【0032】
ステップS6において、顔画像判別部131は、矩形領域101のスキャン及び切り出し処理が画像の右下端まで到達したか否か、すなわち、画像全体における矩形領域101のスキャン及び切り出し処理が終了したか否かを判断する。このステップS6において、顔画像判別部131は、矩形領域101のスキャン及び切り出し処理が画像の右下端まで到達したと判断した場合、ステップS7に進む。一方、このステップS6において、顔画像判別部131は、矩形領域101のスキャン及び切り出し処理が画像の右下端まで到達していないと判断した場合、ステップS2に戻り、ステップS2〜ステップS6の処理動作を繰り返す。
【0033】
ステップS7において、顔画像判別部131は、画像を所定の縮小率で縮小する。
【0034】
ステップS8において、顔画像判別部131は、画像の一辺が矩形領域の一辺よりも短いか否かを判断する。このステップS8において、顔画像判別部131は、画像の一辺が矩形領域の一辺よりも短いと判断した場合は、ステップS9に進み、一連の処理動作を終了させる。一方、このステップS8において、顔画像判別部131は、顔画像判別部131は、画像の一辺が矩形領域の一辺よりも短くないと判断した場合、ステップS2に戻り、ステップS2〜ステップS8の処理動作を繰り返す。
【0035】
なお、上述の顔画像判別部131は、算出したスコア値Siを顔画像の判別結果として続く判別指標値算出部132に供給するとしたが、スコア値Siに基づいて、顔画像であると判別した場合にはデジタルデータの1を、顔画像でないと判別した場合にはデジタルデータの0を続く判別指標値算出部132に供給するようにしてもよい。
【0036】
顔画像判別部131は、このような顔画像判別処理によって、例えば図6(A)に示す入力画像から、図6(B)に示すように、検出位置及び検出サイズの異なる顔画像を検出することができる。
【0037】
上述の顔画像判別処理では、顔画像判別部131は、図7に示すように、本来の顔画像領域よりも僅かにずれた位置で顔画像を複数回検出し、また、画像の縮小によって本来の顔画像よりも僅かに小さいサイズの顔画像を検出してしまう。
【0038】
このように、同一の顔画像に対して複数回検出された顔画像から1つの顔画像を選択する処理として、例えば顔画像の検出精度を示す所定のスコア値が最大である顔画像を選択する処理(以下、スコア値最大領域選択処理という。)が挙げられる。しかしながら、このスコア値最大領域選択処理では、図8(A)に示すように、矩形領域101の画像におけるシフト単位や画像の縮小倍率に基づく離散的な検出結果しか得られないことになる。
【0039】
そこで、本発明を適用した一実施形態における顔画像検出装置1は、顔画像検出領域のシフト単位や画像の縮小倍率に基づく離散的な値によらない、複数の顔画像検出領域が平均化されて安定化した顔画像の検出領域(以下、顔画像検出領域という。)を得るための処理(以下、顔画像検出領域安定化処理という。)を適用する。
【0040】
顔画像検出部13では、後述する判別指標値算出部132及び顔画像検出領域分類部133における処理の後、顔画像領域平均化部134が、例えば以下に示すような計算処理を行うことにより顔画像検出領域を安定化する。
【0041】
すなわち、顔画像検出領域平均化部134は、顔画像番号i、顔画像検出領域の左上端におけるxy座標値xi,yi、顔画像検出領域幅wi、及び顔画像検出領域高さhiを用いて顔画像検出領域Ri(xi,yi,wi,hi)を示す場合、n回検出された顔画像検出領域R1〜Rnにおけるx座標値x1〜xn,y座標値y1〜yn,顔画像検出領域幅w1〜wn,顔画像検出領域高さh1〜hnに対して、顔画像判別部131によって算出された所定のスコア値siで重み付けすることにより平均値Rave(xave,yave,wave,have)を算出する(数式(1)〜数式(4))。
【0042】
【数1】
【0043】
【数2】
【0044】
【数3】
【0045】
【数4】
【0046】
顔画像検出領域平均化部134は、複数の顔画像検出領域について所定のスコア値Siで重み付けした平均値Rave(xave,yave,wave,have)を算出することによって、例えば図8(B)に示すように、顔画像検出領域のシフト単位や画像の縮小倍率に基づく離散的な値によらない、複数の顔画像検出領域が平均化された顔画像領域を得ることができる。
【0047】
なお、例えば顔画像判別部131が所定の画像が顔画像であると判別してデジタルデータの1を出力するように設定した場合や計算処理を簡素化する場合においては、単純に複数の検出結果の平均をとることにより、顔画像検出領域を安定化するようにしてもよい。この場合、数式(1)〜数式(4)は、それぞれ数式(5)〜数式(8)に書き換えられる。
【0048】
【数5】
【0049】
【数6】
【0050】
【数7】
【0051】
【数8】
【0052】
このような顔画像検出領域安定化処理において、複数の顔画像検出領域から顔画像検出領域平均化の計算に組み込む顔画像検出領域を選択する方法の一例について、図9を示しながら説明する。
【0053】
図9(A)に示すように、例えば、顔画像2Aの顔画像検出領域と顔画像2Bの顔画像検出領域とが接近している場合、顔画像検出領域安定化処理では、顔画像2Aについての顔画像検出領域20Aと顔画像2Bについての顔画像検出領域20Bとが何れの顔画像における顔画像検出領域として平均化の計算に採用されるについて正しく判別されなければならない。
【0054】
また、図9(B)に示すように、例えば、顔画像2Aの顔画像検出領域20A内に顔画像2Aとは異なる対象の検出領域20Cが存在する場合や、顔画像2Aの顔画像検出領域20Aと検出領域20Cとがほぼ重なる場合、顔画像検出領域安定化処理では、顔画像2Cとは異なる対象の検出領域20Cが誤検出領域として平均化の計算から除外され、正しく検出された顔画像検出領域20Aのみが安定化処理の計算に組み込まなければならない。
【0055】
このような例を踏まえ、顔画像検出装置1における顔画像検出領域安定化処理では、任意の2つの顔画像検出領域について、例えば(1)同一人物の顔画像検出領域として平均化の計算に組み込まれる、(2)異なる人物の顔画像検出領域として各人物における平均化の計算に組み込まれる、(3)誤検出領域として平均化の計算から除外される、といった分類が行われた後、顔画像検出領域平均化の計算が行われる。
【0056】
判別指標値算出部132は、図10に示すように、例えば、複数の顔画像検出領域の内、判別基準となる基準領域200A及び判別対象となる被判別領域200Bを任意に選択し、基準領域200Aの一辺a及び被判別領域200Bの一辺bを用いて示されて基準領域200Aと被判別領域200Bとの相対サイズの指標値となる検出領域サイズ指標値b/aと、基準領域200Aと被判別領域200Bとの中心間距離c及び基準領域200Aの一辺aを用いて示されて基準領域200Aと被判別領域200Bとの相対距離の指標値となる中心間距離指標値c/aとを算出する。
【0057】
そして、判別指標値算出部132は、複数の顔画像検出領域と、検出領域サイズ指標値b/a及び中心間距離指標値c/aとを続く顔画像検出領域分類部133に供給する。
【0058】
すなわち、判別指標値算出部132は、複数の顔画像検出領域における基準領域200A及び被判別領域200Bの全ての組み合わせについて、検出領域サイズ指標値b/a及び中心間距離指標値c/aを算出し、これら基準領域200A及び被判別領域200Bの全ての組み合わせにおける検出領域サイズ指標値b/a及び中心間距離指標値c/aを算出する毎に、続く顔画像検出領域分類部133に供給する。
【0059】
なお、判別指標値算出部132が算出する判別指標値はこれらに限られず、例えば2つの顔画像検出領域の合計面積に対する重なり面積、2つの顔画像検出領域の中心点間のマンハッタン距離等であってもよい。また、判別指標値の算出数は限定されない。
【0060】
図11は、検出領域サイズ指標値b/a及び中心間距離指標値c/aに応じて定められた基準領域200Aに対する被判別領域200Bの相対的サイズ・相対位置からなる相対指標を示す図である。
【0061】
顔画像検出領域分類部133は、この図11に示すような基準領域200Aに対する被判別領域200Bの相対指標を、例えば図12に示すような境界線131,132,133を設定することにより設定された領域13A,13B,13C,13D内にそれぞれ分類する。
【0062】
なお、顔画像検出領域分類部133が各境界線を設定する方法としては、例えばヒューリスティック法を用いて統計的に学習させることにより設定する方法が挙げられるが、より適当な方法としては、例えば十分量の顔画像データを用いて生成した分類タグを教示データとしてSVMやLDA(Linear Discriminant analysis)に適用して統計的に学習させる方法等が挙げられる。
【0063】
顔画像検出領域分類部133は、領域13Aに分類された相対指標を有する基準領域200A及び被判別領域200Bについては、同一人物の顔画像検出領域として判別する。
【0064】
また、顔画像検出領域分類部133は、領域13Bに分類された相対指標を有する基準領域200A及び被判別領域200Bについては、異なる人物の顔画像検出領域として判別する。
【0065】
また、顔画像検出領域分類部133は、領域13C及び領域13Dに分類された相対指標を有する基準領域200A及び被判別領域200Bについては、被判別領域200Bを誤検出領域として判別する。
【0066】
顔画像検出領域分類部133は、例えば相対指標31については、基準領域200Aのサイズと被判別領域200Bのサイズとが同一であり(検出領域サイズ指標値b/a=1)、且つ、基準領域200A及び被判別領域200Bの中心間距離が短い(中心間距離指標値c/aが小さい)ので、同一人物の顔画像検出領域と判別する。
【0067】
また、顔画像検出領域分類部133は、例えば相対指標32については、被判別領域200Bのサイズが基準領域200Aのサイズよりも小さく(検出領域サイズ指標値b/a<1)、且つ、基準領域200A及び被判別領域200Bの中心間距離が長い(中心間距離指標値c/aが大きい)ので、異なる人物の顔画像検出領域と判別する。
【0068】
また、顔画像検出領域分類部133は、例えば相対指標33については、被判別領域200Bのサイズが基準領域200Aのサイズよりも大きく(検出領域サイズ指標値1<b/a)、且つ、基準領域200A及び被判別領域200Bがほぼ重なる程度に中心間距離が長い(中心間距離指標値c/aが中程度の大きさ)ので、被判別領域200Bを誤検出領域として判別する。
【0069】
顔画像検出領域分類部133は、分類された基準領域200A及び被判別領域200Bの相対指標を続く顔画像検出領域安定化処理部134に供給する。また、顔画像検出領域分類部133は、顔画像検出領域の左上端におけるxy座標値xi,yi、顔画像検出領域幅wi、及び顔画像検出領域高さhiとスコア値Si又はデジタルデータ(1又は0)とを顔画像検出領域安定化処理部134に供給する。
【0070】
顔画像検出領域平均化部134は、顔画像検出領域分類部133で分類された相対指標を有する基準領域200A及び被判別領域200Bにおいて、上述したように、数式(1)〜数式(4)又は数式(5)〜数式(8)を用いて顔画像検出領域の平均化の計算を行うことにより、顔画像の検出結果を安定化させることが可能となる。
【0071】
すなわち、顔画像検出領域安定化処理部134は、領域13Aに分類された相対指標を有する基準領域200A及び被判別領域200Bに対しては、同一人物の顔画像検出領域として基準領域200Aのみに対して平均化の計算を行い、領域13Bに分類された相対指標を有する基準領域200A及び被判別領域200Bに対しては、異なる人物の顔画像検出領域として別々に平均化の計算を行い、領域13C及び領域13Dに分類された相対指標を有する基準領域200A及び被判別領域200Bに対しては、被判別領域200Bを誤検出として平均化の計算から削除して、基準領域200Aのみに対して平均化の計算を行うようにする。
【0072】
顔画像検出領域平均化部134は、このような領域を平均化する計算を行うことにより顔画像検出領域が安定化された顔画像を生成し、この顔画像を画像出力部15に供給する。
【0073】
ここで、顔画像検出領域の安定化の精度をスコア値最大領域選択処理と顔画像検出領域安定化処理とで比較した実験結果を示す。
【0074】
図13は、アダブーストによって検出された541サンプルの顔画像検出領域における右目の目頭と目尻との中間点(右目位置)、左目の目頭と目尻との中間点(左目位置)、及び前歯の位置(口位置)のばらつきを示す図である。
【0075】
図13に示すように、顔画像検出領域安定化処理が施された541サンプルの顔画像検出領域の右目位置、左目位置、及び口位置の分布は、スコア値最大領域選択処理が行われた場合の541サンプルの顔画像検出領域の右目位置、左目位置、及び口位置の分布に比べて分布幅が小さくなっており、顔画像検出領域安定化処理では、スコア値最大領域選択処理よりも顔画像検出領域が安定化されていることがわかる。
【0076】
また、表1は、この541サンプルの右目位置、左目位置、及び口位置における平均位置からの距離(誤差平均)と、この平均位置からの分散(誤差分散値)を算出した結果を示している。
【0077】
【表1】
【0078】
表1に示すように、541サンプルの右目位置、左目位置、及び口位置における誤差平均及び誤差分散は、何れも顔画像検出領域安定化処理を施した場合の値がスコア値最大領域選択処理を施した場合の値よりも小さくなっており、顔画像検出領域安定化処理では、スコア値最大領域選択処理よりも顔画像検出領域が安定化されていることがわかる。
【0079】
本発明を適用した一実施形態における顔画像検出装置1では、顔画像検出領域が複数検出された場合、これら複数の顔画像検出領域の平均領域を算出することによって、顔画像検出領域のシフト単位や画像の縮小倍率に基づく離散的な値によらない、複数の顔画像検出領域が安定化された顔画像領域を得ることができる。
【0080】
また、顔画像検出装置1では、顔画像判別部131が画素単位で矩形領域101を移動するとともに所定の縮小率で入力画像を縮小させるため、画素シフト量よりも細かい位置解像度、且つ画像縮小率よりも細かい領域サイズシフトの解像度で、安定化した顔画像領域の検出結果を得ることができる。
【0081】
また、顔画像検出装置1では、顔画像領域を検出した後に顔のパーツ画像領域を検出して顔画像領域を安定化させる方法と比べて計算量が少なく、顔のパーツ画像を検出する際の誤検出を防止することができ、高精度に顔検出領域を安定化させることができる。
【0082】
また、顔画像検出装置1では、固有の顔画像におけるベクトル特徴量を用いる場合に生じ得るベクトルの次元ずれの問題を考慮することがないため、顔画像の識別性能を向上させることができる。
【0083】
また、顔画像検出装置1では、安定した顔画像検出領域を顔のパーツ画像の検出の前処理として用いることにより、顔のパーツ画像の探索範囲を限定することができ、領域安定化処理における計算量の削減、及び誤認識率の低減が可能となる。
【0084】
なお、本発明は上述した実施の形態のみに限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能であることは勿論である。
【0085】
例えば、上述した実施の形態では、本発明を、入力された画像データに基づく画像から顔画像を検出し、顔画像検出領域等の検出結果を出力する顔画像検出装置に適用したが、入力された画像データに基づく画像から検出する画像は顔画像に限られず、人物の全体像、手等、何れのも画像であってもよい。
【0086】
また、例えば、上述した実施の形態では、顔画像判別部131は、入力された画像データに基づく80×100画素の画像100Aにおいて、顔画像を判別するための20×20画素の矩形領域101を、画像100Aの左上端から2画素ずつ右方向又は下方向に移動させ、画像100Aの右下端まで到達させるようにしたが、入力された画像データに基づく画像の画素サイズ、矩形領域の画像サイズ、矩形領域の移動幅及び移動方向等は、これに限られるものではない。
【図面の簡単な説明】
【0087】
【図1】本発明を適用した一実施形態における顔画像検出装置を示す図である。
【図2】本発明を適用した一実施形態における顔画像検出装置の内部構成を示すブロック図である。
【図3】顔画像検出部の構成を示すブロック図である。
【図4】顔画像判別部の処理工程を説明するための図である。
【図5】顔画像判別部の処理動作を説明するためのフローチャートである。
【図6】(A)は、入力画像の一例であり、(B)は、入力画像から顔画像を検出する様子を示す図である。
【図7】本来の顔画像領域よりも僅かにずれた位置で顔画像を複数回検出する様子を示す図である。
【図8】(A)は、スコア値最大領域選択処理による顔画像検出領域を示す図であり、(B)は、顔画像検出領域安定化処理による顔画像検出領域を示す図である。
【図9】顔画像検出領域安定化処理において、複数の顔画像検出領域から顔画像検出領域安定化処理の計算に組み込む顔画像検出領域を選択する方法例を示す図である。
【図10】判別指標値の算出例を説明するための図である。
【図11】2つの顔画像検出領域の相対指標を示す図である。
【図12】顔画像検出領域分類部によって設定された各領域内に2つの顔画像検出領域の相対指標を分類する様子を示す図である。
【図13】アダブーストによって検出された541サンプルの顔画像検出領域における顔のパーツのばらつきを示す図である。
【符号の説明】
【0088】
1 顔画像検出装置、11 操作部、12 画像入力部、13 顔画像検出部、14 記録部、15 画像出力部、16 制御部、131 顔画像判別部、132 判別指標値算出部、133 顔画像検出領域分類部、134 顔画像領域平均化部134
【技術分野】
【0001】
本発明は、画像から所定の画像を検出する画像検出装置及びその方法に関する。
【背景技術】
【0002】
入力画像から顔画像等の所定の画像を検出する技術は、例えば、顔の有無の判別、顔の識別、顔のパーツの検出のための前処理等として利用されている。
【0003】
入力画像から顔画像を検出する顔画像検出装置には、例えば、本来の顔画像領域の周辺にある複数の領域を検出するものがある。一般的に、このような顔画像検出装置では、複数の検出結果の内、所定のスコア値が最大である検出結果を選択する方法を用いるが、例えば、顔画像を探索する際の探索幅や画像の縮小倍率が離散的な値であること等に起因して、選択された検出結果が離散的な値になる場合がある。
【0004】
そこで、例えば、以下の特許文献1に示すように、解像度が異なる複数の画像において、各スケールの平均値を用いて検出された顔画像領域を安定化する方法がある。
【0005】
【特許文献1】特開2006−48328号公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
しかしながら、特許文献1に記載されている技術では、2人以上の人物の顔領域が互いに非常に接近している場合や、誤検出によって本来の顔画像領域の非常に近くに検出結果が得られてしまう場合がある。このような技術では、複数の顔検出領域から顔画像領域を安定化するための計算に用いられる顔検出領域を適切に選択しないと、検出精度が大きく低下してしまうことになる。
【0007】
本発明は、このような従来の実情に鑑みて提案されたものであり、検出された顔画像領域を安定化するための計算に用いられる顔検出領域を適切に選択する画像検出装置及びその方法を提供することを目的とする。
【課題を解決するための手段】
【0008】
上述した目的を達成するために、本発明は、入力画像から所定の画像を検出する画像検出装置において、所定サイズの検出対象領域と上記入力画像との相対サイズを変化させる毎に当該入力画像から当該検出対象領域を所定の画素ずつ移動させるようにスキャンして切り出し、当該切り出された検出対象領域内の画像が上記所定の画像であるか否かを判別して判別結果を出力する画像判別手段と、上記画像判別手段によって上記検出対象領域内の画像が上記所定の画像であると判別された場合に、当該所定の画像について検出された基準領域及び被判別領域からなる2つの検出領域の相対位置及び相対サイズに基づく所定の指標値を算出する指標値算出手段と、上記指標値算出手段によって算出された上記所定の指標値に基づいて分類された上記被判別領域を、上記所定の画像の検出結果を生成するための計算処理に採用するか否かについて判別する検出領域判別手段とを備えることを特徴とする。
【0009】
また、上述した目的を達成するために、本発明は、入力画像から所定の画像を検出する画像検出方法において、所定サイズの検出対象領域と上記入力画像との相対サイズを変化させる毎に当該入力画像から当該検出対象領域を所定の画素ずつ移動させるようにスキャンして切り出し、当該切り出された検出対象領域内の画像が上記所定の画像であるか否かを判別して判別結果を出力する画像判別工程と、上記画像判別工程にて上記検出対象領域内の画像が上記所定の画像であると判別された場合に、当該所定の画像について検出された基準領域及び被判別領域からなる2つの検出領域の相対位置及び相対サイズに基づく所定の指標値を算出する指標値算出工程と、上記指標値算出工程にて算出された上記所定の指標値に基づいて分類された上記被判別領域を、上記所定の画像の検出結果を生成するための計算処理に採用するか否かについて判別する検出領域判別工程とを有することを特徴とする。
【発明の効果】
【0010】
本発明は、入力画像から所定の画像を検出する画像検出装置及びその方法において、所定サイズの検出対象領域と上記入力画像との相対サイズを変化させる毎に当該入力画像から当該検出対象領域を所定の画素ずつ移動させるようにスキャンして切り出し、当該切り出された検出対象領域内の画像が上記所定の画像であるか否かを判別して判別結果を出力し、上記検出対象領域内の画像が上記所定の画像であると判別された場合に、当該所定の画像について検出された基準領域及び被判別領域からなる2つの検出領域の相対位置及び相対サイズに基づく所定の指標値を算出し、上記算出された上記所定の指標値に基づいて分類された上記被判別領域を、上記所定の画像の検出結果を生成するための計算処理に採用するか否かについて判別することにより、従来の画像検出装置及びその方法に比べて所定の画像の検出領域をより安定化させることができる。
【発明を実施するための最良の形態】
【0011】
以下、本発明を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。
【0012】
図1は、本発明を適用した一実施形態における顔画像検出装置1を示す図である。顔画像検出装置1は、入力された画像データに基づく画像から顔画像を検出し、顔画像検出領域等の検出結果を出力するものである。
【0013】
顔画像検出装置1は、例えば図2に示す内部構成を備えたパーソナルコンピュータとして構成される。
【0014】
図2に示すように、顔画像検出装置1は、例えばキーボード、マウス等を介してユーザの操作情報が入力される操作部11と、例えばデジタルカメラ、テレビジョン装置、ストレージ等より画像データが入力される画像入力部12と、入力された画像データに基づく画像中から顔画像を検出する顔画像検出部13と、画像データを記録する記録部14と、所定の画像処理を行ってディスプレイに画像を出力する画像出力部15と、バッファメモリ、RAM(Random Access Memory)、顔画像検出プログラムが記録されているROM(Read Only Memory)、CPU(Central Processing Unit)等を備えて顔画像検出装置1の信号処理全般を制御する制御部16とが内部バス17に接続されることにより構成される。
【0015】
顔画像検出部13は、図3に示すように、顔画像判別部131と、判別指標値算出部132と、顔画像検出領域分類部133と、顔画像領域平均化部134とを備えて構成される。
【0016】
顔画像判別部131は、制御部16の制御動作に基づいて画像入力部12を介して画像データが入力されると、入力された画像データに基づく80×100画素の画像100Aにおいて、顔画像を判別するための20×20画素の矩形領域101を、図4(A)に示す画像100Aの左上端から2画素ずつ右方向又は下方向に移動させ、図4(C)に示す画像100Aの右下端まで到達させる。顔画像判別部131は、矩形領域101を2画素ずつ移動させるごとに矩形領域101の画像をスキャンして切り出し、この矩形領域101中に存在する所定の画像が顔画像であるか否かを判別する。
【0017】
すなわち、顔画像判別部131は、例えば、サポート・ベクタ・マシーン(Support Vector Machine:SVM)、アダブースト等のブースティング、局所特徴量等の方法によって、矩形領域101中に存在する画像と予め設定された顔画像との大きさ及び相関度を比較することにより、矩形領域101中に存在する所定の画像が顔画像であるか否かを判別する。
【0018】
そして、顔画像判別部131は、予め設定された顔画像との相関度を示すスコア値Siを算出し、スコア値Siがある一定の閾値以上である場合には、矩形領域101中に存在する所定の画像が顔画像であると判別する。
【0019】
顔画像判別部131は、図4(A)に示す画像100Aの左上端から図4(C)に示す画像100Aの右下端まで矩形領域101を移動させながらスキャン及び切り出し処理を行う中で、図4(B)に示すように、矩形領域101中に存在する所定の画像が顔画像であると判別した場合、この矩形領域101の左上端におけるxy座標値xi,yi、顔画像検出領域幅wi、及び顔画像検出領域高さhiを算出し、このxy座標値xi,yi、顔画像検出領域幅wi、及び顔画像検出領域高さhiと、判別結果となるスコア値Siとを続く判別指標値算出部132に供給する。
【0020】
なお、スコア値Siは、検出された顔画像の形状が予め設定された一般的な人物の顔の形状に近いほど高いスコア値Siが算出されるようにしてもよいし、他の算出方法により算出されるようにしてもよい。
【0021】
一方、顔画像判別部131は、矩形領域101中に存在する所定の画像が顔画像ではないと判別した場合、上述した算出処理は一切行わずに矩形領域101を2画素移動させて、同様の顔画像判別処理を行う。
【0022】
顔画像判別部131は、画像100Aにおいて、矩形領域101を画像100Aの右下端まで移動させた後、図4(D)に示すように、画像100Aを所定の倍率で縮小させ(この画像を画像100Bとする。)、画像100Bにおいて、画像100Aでの処理と同様に20×20画素の矩形領域101を画像100B上の左上端から2画素ずつ右方向又は下方向に移動させる毎に矩形領域101をスキャンして切り出し、矩形領域101中に存在する所定の画像が顔画像であるか否かを判別する。
【0023】
顔画像判別部131は、図4(E)に示すように、画像100B上の右下端まで矩形領域101を移動させた後、何れの位置においても矩形領域101中に存在する所定の画像が顔画像ではないと判別した場合、図4(F)に示すように、画像100Bを所定の倍率で縮小し(この画像を画像100Cとする。)、この画像100Cにおいて、画像100A,100Bでの処理と同様に、20×20画素の矩形領域101を画像100C上の左上端から右下端まで2画素ずつ右方向又は下方向に移動させるごとに矩形領域101をスキャンして切り出し、矩形領域101中に存在する所定の画像が顔画像であるか否かを、スコア値Siを算出して判別する。
【0024】
顔画像判別部131は、矩形領域101を図4(F)に示す画像100Cの左上端から図4(H)に示す画像100Cの右下端まで移動させながらスキャン及び切り出し処理を行う中で、図4(G)に示すように、矩形領域101中に存在する所定の画像が顔画像であると判別した場合、この矩形領域101の左上端におけるxy座標値xi,yi、顔画像検出領域幅wi、及び顔画像検出領域高さhiを算出し、そして、顔画像判別部131は、xy座標値xi,yi、顔画像検出領域幅wi、及び顔画像検出領域高さhiと所定のスコア値Siとを続く判別指標値算出部132に供給する。
【0025】
顔画像判別部131は、図4(I)に示すように、画像の一辺の長さが矩形領域101の一辺の長さと同じになるまで縮小した画像100Dにおいて、上述の顔画像判別処理と同様の処理を行い、図4(J)に示すように、矩形領域101を画像100Dの右端まで到達させた後、一連の処理を終了させる。
【0026】
ここで、顔画像判別部131の処理動作を図5のフローチャートを用いて説明する。
【0027】
ステップS1において、顔画像判別部131には、制御部16の制御動作に基づいて画像入力部12を介して画像データが入力される。
【0028】
ステップS2において、顔画像判別部131は、画像データに基づく画像の一部である矩形領域101のスキャン及び切り出し処理を行う。
【0029】
ステップS3において、顔画像判別部131は、画像における矩形領域101中に存在する画像が顔画像であるか否かを、スコア値Siを算出して判別する。このステップS3において、顔画像判別部131は、矩形領域101中に存在する画像が顔画像であると判別した場合、ステップS4に進む。一方、このステップS3において、顔画像判別部131は、矩形領域101中に存在する画像が顔画像でないと判別した場合、ステップS5に進む。
【0030】
ステップS4において、顔画像判別部131は、矩形領域101左上端におけるxy座標値xi,yi、顔画像検出領域幅wi、及び顔画像検出領域高さhiを算出し、xy座標値xi,yi、顔画像検出領域幅wi、及び顔画像検出領域高さhiとスコア値Siとを判別指標値算出部132に供給する。
【0031】
ステップS5において、顔画像判別部131は、画像上の矩形領域101を右方向又は下方向に2画素移動させる。
【0032】
ステップS6において、顔画像判別部131は、矩形領域101のスキャン及び切り出し処理が画像の右下端まで到達したか否か、すなわち、画像全体における矩形領域101のスキャン及び切り出し処理が終了したか否かを判断する。このステップS6において、顔画像判別部131は、矩形領域101のスキャン及び切り出し処理が画像の右下端まで到達したと判断した場合、ステップS7に進む。一方、このステップS6において、顔画像判別部131は、矩形領域101のスキャン及び切り出し処理が画像の右下端まで到達していないと判断した場合、ステップS2に戻り、ステップS2〜ステップS6の処理動作を繰り返す。
【0033】
ステップS7において、顔画像判別部131は、画像を所定の縮小率で縮小する。
【0034】
ステップS8において、顔画像判別部131は、画像の一辺が矩形領域の一辺よりも短いか否かを判断する。このステップS8において、顔画像判別部131は、画像の一辺が矩形領域の一辺よりも短いと判断した場合は、ステップS9に進み、一連の処理動作を終了させる。一方、このステップS8において、顔画像判別部131は、顔画像判別部131は、画像の一辺が矩形領域の一辺よりも短くないと判断した場合、ステップS2に戻り、ステップS2〜ステップS8の処理動作を繰り返す。
【0035】
なお、上述の顔画像判別部131は、算出したスコア値Siを顔画像の判別結果として続く判別指標値算出部132に供給するとしたが、スコア値Siに基づいて、顔画像であると判別した場合にはデジタルデータの1を、顔画像でないと判別した場合にはデジタルデータの0を続く判別指標値算出部132に供給するようにしてもよい。
【0036】
顔画像判別部131は、このような顔画像判別処理によって、例えば図6(A)に示す入力画像から、図6(B)に示すように、検出位置及び検出サイズの異なる顔画像を検出することができる。
【0037】
上述の顔画像判別処理では、顔画像判別部131は、図7に示すように、本来の顔画像領域よりも僅かにずれた位置で顔画像を複数回検出し、また、画像の縮小によって本来の顔画像よりも僅かに小さいサイズの顔画像を検出してしまう。
【0038】
このように、同一の顔画像に対して複数回検出された顔画像から1つの顔画像を選択する処理として、例えば顔画像の検出精度を示す所定のスコア値が最大である顔画像を選択する処理(以下、スコア値最大領域選択処理という。)が挙げられる。しかしながら、このスコア値最大領域選択処理では、図8(A)に示すように、矩形領域101の画像におけるシフト単位や画像の縮小倍率に基づく離散的な検出結果しか得られないことになる。
【0039】
そこで、本発明を適用した一実施形態における顔画像検出装置1は、顔画像検出領域のシフト単位や画像の縮小倍率に基づく離散的な値によらない、複数の顔画像検出領域が平均化されて安定化した顔画像の検出領域(以下、顔画像検出領域という。)を得るための処理(以下、顔画像検出領域安定化処理という。)を適用する。
【0040】
顔画像検出部13では、後述する判別指標値算出部132及び顔画像検出領域分類部133における処理の後、顔画像領域平均化部134が、例えば以下に示すような計算処理を行うことにより顔画像検出領域を安定化する。
【0041】
すなわち、顔画像検出領域平均化部134は、顔画像番号i、顔画像検出領域の左上端におけるxy座標値xi,yi、顔画像検出領域幅wi、及び顔画像検出領域高さhiを用いて顔画像検出領域Ri(xi,yi,wi,hi)を示す場合、n回検出された顔画像検出領域R1〜Rnにおけるx座標値x1〜xn,y座標値y1〜yn,顔画像検出領域幅w1〜wn,顔画像検出領域高さh1〜hnに対して、顔画像判別部131によって算出された所定のスコア値siで重み付けすることにより平均値Rave(xave,yave,wave,have)を算出する(数式(1)〜数式(4))。
【0042】
【数1】
【0043】
【数2】
【0044】
【数3】
【0045】
【数4】
【0046】
顔画像検出領域平均化部134は、複数の顔画像検出領域について所定のスコア値Siで重み付けした平均値Rave(xave,yave,wave,have)を算出することによって、例えば図8(B)に示すように、顔画像検出領域のシフト単位や画像の縮小倍率に基づく離散的な値によらない、複数の顔画像検出領域が平均化された顔画像領域を得ることができる。
【0047】
なお、例えば顔画像判別部131が所定の画像が顔画像であると判別してデジタルデータの1を出力するように設定した場合や計算処理を簡素化する場合においては、単純に複数の検出結果の平均をとることにより、顔画像検出領域を安定化するようにしてもよい。この場合、数式(1)〜数式(4)は、それぞれ数式(5)〜数式(8)に書き換えられる。
【0048】
【数5】
【0049】
【数6】
【0050】
【数7】
【0051】
【数8】
【0052】
このような顔画像検出領域安定化処理において、複数の顔画像検出領域から顔画像検出領域平均化の計算に組み込む顔画像検出領域を選択する方法の一例について、図9を示しながら説明する。
【0053】
図9(A)に示すように、例えば、顔画像2Aの顔画像検出領域と顔画像2Bの顔画像検出領域とが接近している場合、顔画像検出領域安定化処理では、顔画像2Aについての顔画像検出領域20Aと顔画像2Bについての顔画像検出領域20Bとが何れの顔画像における顔画像検出領域として平均化の計算に採用されるについて正しく判別されなければならない。
【0054】
また、図9(B)に示すように、例えば、顔画像2Aの顔画像検出領域20A内に顔画像2Aとは異なる対象の検出領域20Cが存在する場合や、顔画像2Aの顔画像検出領域20Aと検出領域20Cとがほぼ重なる場合、顔画像検出領域安定化処理では、顔画像2Cとは異なる対象の検出領域20Cが誤検出領域として平均化の計算から除外され、正しく検出された顔画像検出領域20Aのみが安定化処理の計算に組み込まなければならない。
【0055】
このような例を踏まえ、顔画像検出装置1における顔画像検出領域安定化処理では、任意の2つの顔画像検出領域について、例えば(1)同一人物の顔画像検出領域として平均化の計算に組み込まれる、(2)異なる人物の顔画像検出領域として各人物における平均化の計算に組み込まれる、(3)誤検出領域として平均化の計算から除外される、といった分類が行われた後、顔画像検出領域平均化の計算が行われる。
【0056】
判別指標値算出部132は、図10に示すように、例えば、複数の顔画像検出領域の内、判別基準となる基準領域200A及び判別対象となる被判別領域200Bを任意に選択し、基準領域200Aの一辺a及び被判別領域200Bの一辺bを用いて示されて基準領域200Aと被判別領域200Bとの相対サイズの指標値となる検出領域サイズ指標値b/aと、基準領域200Aと被判別領域200Bとの中心間距離c及び基準領域200Aの一辺aを用いて示されて基準領域200Aと被判別領域200Bとの相対距離の指標値となる中心間距離指標値c/aとを算出する。
【0057】
そして、判別指標値算出部132は、複数の顔画像検出領域と、検出領域サイズ指標値b/a及び中心間距離指標値c/aとを続く顔画像検出領域分類部133に供給する。
【0058】
すなわち、判別指標値算出部132は、複数の顔画像検出領域における基準領域200A及び被判別領域200Bの全ての組み合わせについて、検出領域サイズ指標値b/a及び中心間距離指標値c/aを算出し、これら基準領域200A及び被判別領域200Bの全ての組み合わせにおける検出領域サイズ指標値b/a及び中心間距離指標値c/aを算出する毎に、続く顔画像検出領域分類部133に供給する。
【0059】
なお、判別指標値算出部132が算出する判別指標値はこれらに限られず、例えば2つの顔画像検出領域の合計面積に対する重なり面積、2つの顔画像検出領域の中心点間のマンハッタン距離等であってもよい。また、判別指標値の算出数は限定されない。
【0060】
図11は、検出領域サイズ指標値b/a及び中心間距離指標値c/aに応じて定められた基準領域200Aに対する被判別領域200Bの相対的サイズ・相対位置からなる相対指標を示す図である。
【0061】
顔画像検出領域分類部133は、この図11に示すような基準領域200Aに対する被判別領域200Bの相対指標を、例えば図12に示すような境界線131,132,133を設定することにより設定された領域13A,13B,13C,13D内にそれぞれ分類する。
【0062】
なお、顔画像検出領域分類部133が各境界線を設定する方法としては、例えばヒューリスティック法を用いて統計的に学習させることにより設定する方法が挙げられるが、より適当な方法としては、例えば十分量の顔画像データを用いて生成した分類タグを教示データとしてSVMやLDA(Linear Discriminant analysis)に適用して統計的に学習させる方法等が挙げられる。
【0063】
顔画像検出領域分類部133は、領域13Aに分類された相対指標を有する基準領域200A及び被判別領域200Bについては、同一人物の顔画像検出領域として判別する。
【0064】
また、顔画像検出領域分類部133は、領域13Bに分類された相対指標を有する基準領域200A及び被判別領域200Bについては、異なる人物の顔画像検出領域として判別する。
【0065】
また、顔画像検出領域分類部133は、領域13C及び領域13Dに分類された相対指標を有する基準領域200A及び被判別領域200Bについては、被判別領域200Bを誤検出領域として判別する。
【0066】
顔画像検出領域分類部133は、例えば相対指標31については、基準領域200Aのサイズと被判別領域200Bのサイズとが同一であり(検出領域サイズ指標値b/a=1)、且つ、基準領域200A及び被判別領域200Bの中心間距離が短い(中心間距離指標値c/aが小さい)ので、同一人物の顔画像検出領域と判別する。
【0067】
また、顔画像検出領域分類部133は、例えば相対指標32については、被判別領域200Bのサイズが基準領域200Aのサイズよりも小さく(検出領域サイズ指標値b/a<1)、且つ、基準領域200A及び被判別領域200Bの中心間距離が長い(中心間距離指標値c/aが大きい)ので、異なる人物の顔画像検出領域と判別する。
【0068】
また、顔画像検出領域分類部133は、例えば相対指標33については、被判別領域200Bのサイズが基準領域200Aのサイズよりも大きく(検出領域サイズ指標値1<b/a)、且つ、基準領域200A及び被判別領域200Bがほぼ重なる程度に中心間距離が長い(中心間距離指標値c/aが中程度の大きさ)ので、被判別領域200Bを誤検出領域として判別する。
【0069】
顔画像検出領域分類部133は、分類された基準領域200A及び被判別領域200Bの相対指標を続く顔画像検出領域安定化処理部134に供給する。また、顔画像検出領域分類部133は、顔画像検出領域の左上端におけるxy座標値xi,yi、顔画像検出領域幅wi、及び顔画像検出領域高さhiとスコア値Si又はデジタルデータ(1又は0)とを顔画像検出領域安定化処理部134に供給する。
【0070】
顔画像検出領域平均化部134は、顔画像検出領域分類部133で分類された相対指標を有する基準領域200A及び被判別領域200Bにおいて、上述したように、数式(1)〜数式(4)又は数式(5)〜数式(8)を用いて顔画像検出領域の平均化の計算を行うことにより、顔画像の検出結果を安定化させることが可能となる。
【0071】
すなわち、顔画像検出領域安定化処理部134は、領域13Aに分類された相対指標を有する基準領域200A及び被判別領域200Bに対しては、同一人物の顔画像検出領域として基準領域200Aのみに対して平均化の計算を行い、領域13Bに分類された相対指標を有する基準領域200A及び被判別領域200Bに対しては、異なる人物の顔画像検出領域として別々に平均化の計算を行い、領域13C及び領域13Dに分類された相対指標を有する基準領域200A及び被判別領域200Bに対しては、被判別領域200Bを誤検出として平均化の計算から削除して、基準領域200Aのみに対して平均化の計算を行うようにする。
【0072】
顔画像検出領域平均化部134は、このような領域を平均化する計算を行うことにより顔画像検出領域が安定化された顔画像を生成し、この顔画像を画像出力部15に供給する。
【0073】
ここで、顔画像検出領域の安定化の精度をスコア値最大領域選択処理と顔画像検出領域安定化処理とで比較した実験結果を示す。
【0074】
図13は、アダブーストによって検出された541サンプルの顔画像検出領域における右目の目頭と目尻との中間点(右目位置)、左目の目頭と目尻との中間点(左目位置)、及び前歯の位置(口位置)のばらつきを示す図である。
【0075】
図13に示すように、顔画像検出領域安定化処理が施された541サンプルの顔画像検出領域の右目位置、左目位置、及び口位置の分布は、スコア値最大領域選択処理が行われた場合の541サンプルの顔画像検出領域の右目位置、左目位置、及び口位置の分布に比べて分布幅が小さくなっており、顔画像検出領域安定化処理では、スコア値最大領域選択処理よりも顔画像検出領域が安定化されていることがわかる。
【0076】
また、表1は、この541サンプルの右目位置、左目位置、及び口位置における平均位置からの距離(誤差平均)と、この平均位置からの分散(誤差分散値)を算出した結果を示している。
【0077】
【表1】
【0078】
表1に示すように、541サンプルの右目位置、左目位置、及び口位置における誤差平均及び誤差分散は、何れも顔画像検出領域安定化処理を施した場合の値がスコア値最大領域選択処理を施した場合の値よりも小さくなっており、顔画像検出領域安定化処理では、スコア値最大領域選択処理よりも顔画像検出領域が安定化されていることがわかる。
【0079】
本発明を適用した一実施形態における顔画像検出装置1では、顔画像検出領域が複数検出された場合、これら複数の顔画像検出領域の平均領域を算出することによって、顔画像検出領域のシフト単位や画像の縮小倍率に基づく離散的な値によらない、複数の顔画像検出領域が安定化された顔画像領域を得ることができる。
【0080】
また、顔画像検出装置1では、顔画像判別部131が画素単位で矩形領域101を移動するとともに所定の縮小率で入力画像を縮小させるため、画素シフト量よりも細かい位置解像度、且つ画像縮小率よりも細かい領域サイズシフトの解像度で、安定化した顔画像領域の検出結果を得ることができる。
【0081】
また、顔画像検出装置1では、顔画像領域を検出した後に顔のパーツ画像領域を検出して顔画像領域を安定化させる方法と比べて計算量が少なく、顔のパーツ画像を検出する際の誤検出を防止することができ、高精度に顔検出領域を安定化させることができる。
【0082】
また、顔画像検出装置1では、固有の顔画像におけるベクトル特徴量を用いる場合に生じ得るベクトルの次元ずれの問題を考慮することがないため、顔画像の識別性能を向上させることができる。
【0083】
また、顔画像検出装置1では、安定した顔画像検出領域を顔のパーツ画像の検出の前処理として用いることにより、顔のパーツ画像の探索範囲を限定することができ、領域安定化処理における計算量の削減、及び誤認識率の低減が可能となる。
【0084】
なお、本発明は上述した実施の形態のみに限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能であることは勿論である。
【0085】
例えば、上述した実施の形態では、本発明を、入力された画像データに基づく画像から顔画像を検出し、顔画像検出領域等の検出結果を出力する顔画像検出装置に適用したが、入力された画像データに基づく画像から検出する画像は顔画像に限られず、人物の全体像、手等、何れのも画像であってもよい。
【0086】
また、例えば、上述した実施の形態では、顔画像判別部131は、入力された画像データに基づく80×100画素の画像100Aにおいて、顔画像を判別するための20×20画素の矩形領域101を、画像100Aの左上端から2画素ずつ右方向又は下方向に移動させ、画像100Aの右下端まで到達させるようにしたが、入力された画像データに基づく画像の画素サイズ、矩形領域の画像サイズ、矩形領域の移動幅及び移動方向等は、これに限られるものではない。
【図面の簡単な説明】
【0087】
【図1】本発明を適用した一実施形態における顔画像検出装置を示す図である。
【図2】本発明を適用した一実施形態における顔画像検出装置の内部構成を示すブロック図である。
【図3】顔画像検出部の構成を示すブロック図である。
【図4】顔画像判別部の処理工程を説明するための図である。
【図5】顔画像判別部の処理動作を説明するためのフローチャートである。
【図6】(A)は、入力画像の一例であり、(B)は、入力画像から顔画像を検出する様子を示す図である。
【図7】本来の顔画像領域よりも僅かにずれた位置で顔画像を複数回検出する様子を示す図である。
【図8】(A)は、スコア値最大領域選択処理による顔画像検出領域を示す図であり、(B)は、顔画像検出領域安定化処理による顔画像検出領域を示す図である。
【図9】顔画像検出領域安定化処理において、複数の顔画像検出領域から顔画像検出領域安定化処理の計算に組み込む顔画像検出領域を選択する方法例を示す図である。
【図10】判別指標値の算出例を説明するための図である。
【図11】2つの顔画像検出領域の相対指標を示す図である。
【図12】顔画像検出領域分類部によって設定された各領域内に2つの顔画像検出領域の相対指標を分類する様子を示す図である。
【図13】アダブーストによって検出された541サンプルの顔画像検出領域における顔のパーツのばらつきを示す図である。
【符号の説明】
【0088】
1 顔画像検出装置、11 操作部、12 画像入力部、13 顔画像検出部、14 記録部、15 画像出力部、16 制御部、131 顔画像判別部、132 判別指標値算出部、133 顔画像検出領域分類部、134 顔画像領域平均化部134
【特許請求の範囲】
【請求項1】
入力画像から所定の画像を検出する画像検出装置において、
所定サイズの検出対象領域と上記入力画像との相対サイズを変化させる毎に当該入力画像から当該検出対象領域を所定の画素ずつ移動させるようにスキャンして切り出し、当該切り出された検出対象領域内の画像が上記所定の画像であるか否かを判別して判別結果を出力する画像判別手段と、
上記画像判別手段によって上記検出対象領域内の画像が上記所定の画像であると判別された場合に、当該所定の画像について検出された基準領域及び被判別領域からなる2つの検出領域の相対位置及び相対サイズに基づく所定の指標値を算出する指標値算出手段と、
上記指標値算出手段によって算出された上記所定の指標値に基づいて分類された上記被判別領域を、上記所定の画像の検出結果を生成するための計算処理に採用するか否かについて判別する検出領域判別手段と
を備えることを特徴とする画像検出装置。
【請求項2】
上記検出領域判別手段は、上記2つの検出領域の相対距離が短く、且つ、上記2つの検出領域のサイズが略同一である場合、上記2つの検出領域を同一の検出領域として上記被判別領域を上記計算処理に採用すると判別することを特徴とする請求項1記載の画像検出装置。
【請求項3】
上記検出領域判別手段は、上記2つの検出領域の相対距離が短く、且つ、上記2つの検出領域のサイズが大きく異なる場合、上記基準領域のみを上記計算処理に採用すると判別することを特徴とする請求項1記載の画像検出装置。
【請求項4】
上記検出領域判別手段は、上記2つの検出領域の相対距離が長く、且つ、上記2つの検出領域のサイズが大きく異なる場合、上記基準領域と上記被判別領域とを別々の上記計算処理に採用すると判別することを特徴とする請求項1記載の画像検出装置。
【請求項5】
上記検出領域判別手段によって上記計算処理に採用すると判別された上記被判別領域を含む複数の上記検出領域の位置及び大きさの平均値を算出し、当該位置及び大きさが平均化された検出領域を生成する検出領域平均化手段
をさらに備えることを特徴とする請求項1記載の画像検出装置。
【請求項6】
上記所定画像は顔画像であることを特徴とする請求項1記載の画像検出装置。
【請求項7】
入力画像から所定の画像を検出する画像検出方法において、
所定サイズの検出対象領域と上記入力画像との相対サイズを変化させる毎に当該入力画像から当該検出対象領域を所定の画素ずつ移動させるようにスキャンして切り出し、当該切り出された検出対象領域内の画像が上記所定の画像であるか否かを判別して判別結果を出力する画像判別工程と、
上記画像判別工程にて上記検出対象領域内の画像が上記所定の画像であると判別された場合に、当該所定の画像について検出された基準領域及び被判別領域からなる2つの検出領域の相対位置及び相対サイズに基づく所定の指標値を算出する指標値算出工程と、
上記指標値算出工程にて算出された上記所定の指標値に基づいて分類された上記被判別領域を、上記所定の画像の検出結果を生成するための計算処理に採用するか否かについて判別する検出領域判別工程と
を有することを特徴とする画像検出方法。
【請求項1】
入力画像から所定の画像を検出する画像検出装置において、
所定サイズの検出対象領域と上記入力画像との相対サイズを変化させる毎に当該入力画像から当該検出対象領域を所定の画素ずつ移動させるようにスキャンして切り出し、当該切り出された検出対象領域内の画像が上記所定の画像であるか否かを判別して判別結果を出力する画像判別手段と、
上記画像判別手段によって上記検出対象領域内の画像が上記所定の画像であると判別された場合に、当該所定の画像について検出された基準領域及び被判別領域からなる2つの検出領域の相対位置及び相対サイズに基づく所定の指標値を算出する指標値算出手段と、
上記指標値算出手段によって算出された上記所定の指標値に基づいて分類された上記被判別領域を、上記所定の画像の検出結果を生成するための計算処理に採用するか否かについて判別する検出領域判別手段と
を備えることを特徴とする画像検出装置。
【請求項2】
上記検出領域判別手段は、上記2つの検出領域の相対距離が短く、且つ、上記2つの検出領域のサイズが略同一である場合、上記2つの検出領域を同一の検出領域として上記被判別領域を上記計算処理に採用すると判別することを特徴とする請求項1記載の画像検出装置。
【請求項3】
上記検出領域判別手段は、上記2つの検出領域の相対距離が短く、且つ、上記2つの検出領域のサイズが大きく異なる場合、上記基準領域のみを上記計算処理に採用すると判別することを特徴とする請求項1記載の画像検出装置。
【請求項4】
上記検出領域判別手段は、上記2つの検出領域の相対距離が長く、且つ、上記2つの検出領域のサイズが大きく異なる場合、上記基準領域と上記被判別領域とを別々の上記計算処理に採用すると判別することを特徴とする請求項1記載の画像検出装置。
【請求項5】
上記検出領域判別手段によって上記計算処理に採用すると判別された上記被判別領域を含む複数の上記検出領域の位置及び大きさの平均値を算出し、当該位置及び大きさが平均化された検出領域を生成する検出領域平均化手段
をさらに備えることを特徴とする請求項1記載の画像検出装置。
【請求項6】
上記所定画像は顔画像であることを特徴とする請求項1記載の画像検出装置。
【請求項7】
入力画像から所定の画像を検出する画像検出方法において、
所定サイズの検出対象領域と上記入力画像との相対サイズを変化させる毎に当該入力画像から当該検出対象領域を所定の画素ずつ移動させるようにスキャンして切り出し、当該切り出された検出対象領域内の画像が上記所定の画像であるか否かを判別して判別結果を出力する画像判別工程と、
上記画像判別工程にて上記検出対象領域内の画像が上記所定の画像であると判別された場合に、当該所定の画像について検出された基準領域及び被判別領域からなる2つの検出領域の相対位置及び相対サイズに基づく所定の指標値を算出する指標値算出工程と、
上記指標値算出工程にて算出された上記所定の指標値に基づいて分類された上記被判別領域を、上記所定の画像の検出結果を生成するための計算処理に採用するか否かについて判別する検出領域判別工程と
を有することを特徴とする画像検出方法。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【公開番号】特開2008−27058(P2008−27058A)
【公開日】平成20年2月7日(2008.2.7)
【国際特許分類】
【出願番号】特願2006−197156(P2006−197156)
【出願日】平成18年7月19日(2006.7.19)
【出願人】(000002185)ソニー株式会社 (34,172)
【Fターム(参考)】
【公開日】平成20年2月7日(2008.2.7)
【国際特許分類】
【出願日】平成18年7月19日(2006.7.19)
【出願人】(000002185)ソニー株式会社 (34,172)
【Fターム(参考)】
[ Back to top ]