情報処理装置、情報処理方法、及び、プログラム

【課題】入力画像に、所定の対象物が映っているか否かの判別の判別性能の低下を、容易に防止する。
【解決手段】補正部は、入力画像から抽出された特徴量を入力として、入力画像に所定の対象物が映っているか否かを表す弱仮説を出力する複数の弱識別器を有するアンサンブル識別器のパラメータを、補正情報を用いて補正する。判別処理部は、パラメータの補正後のアンサンブル識別器を用い、特徴量に対して、弱識別器が出力する弱仮説を積算し、その弱仮説の積算値に基づいて、入力画像に、対象物が映っているか否かを判別する。補正情報は、補正情報算出部５４において、対象物を照明する光源に基づいて算出される。本技術は、例えば、入力画像に対象物が映っているか否かを判別する場合等に適用できる。

【発明の詳細な説明】
【技術分野】
【０００１】
本技術は、情報処理装置、情報処理方法、及び、プログラムに関し、特に、入力画像に、所定の対象物が映っているか否かの判別の判別性能の低下を、容易に防止することができるようにする情報処理装置、情報処理方法、及び、プログラムに関する。
【背景技術】
【０００２】
複数の弱識別器(weak learner)の出力である弱仮説の多数決により識別を行うアンサンブル識別器の学習を行うアンサンブル学習(Ensemble learning)としては、例えば、ブースティング(boosting)や、バギング(bagging)がある。
【０００３】
また、アンサンブル学習により得られたアンサンブル識別器を用いて、画像に、所定の対象物が映っているか否かを判別する方法（対象物判別の方法）が提案されている（例えば、特許文献１を参照）。
【０００４】
特許文献１では、画像の特徴量として、減算という極めて簡単な処理だけで求めることができる、入力画像中の２つのピクセルどうしの画素値の差分であるピクセル間差分特徴量が採用されており、そのような減算だけで算出することができるピクセル間差分特徴量を用いて、十分な、対象物判別の判別性能を実現している。
【０００５】
なお、特許文献１では、アンサンブル識別器を構成する弱識別器ごとに、ピクセル間差分特徴量を求めるのに用いる２つのピクセルの位置が設定されるため、アンサンブル識別器を構成する弱識別器の数だけのピクセル間差分特徴量を算出する必要がある。
【０００６】
しかしながら、ピクセル間差分特徴量は、減算という極めて簡単な処理だけで求めることができ、アンサンブル識別器を構成する弱識別器の数だけのピクセル間差分特徴量であっても、高速に算出することができるので、結果として、対象物判別の処理を高速化することができる。
【先行技術文献】
【特許文献】
【０００７】
【特許文献１】特許第4517633号
【発明の概要】
【発明が解決しようとする課題】
【０００８】
アンサンブル学習において、アンサンブル識別器の学習に用いられる学習用画像には、対象物が映っているポジティブ画像と、対象物が映っていないネガティブ画像とが含まれる。このようなポジティブ画像とネガティブ画像とが含まれる学習用画像や、アンサンブル識別器を用いた対象物判別の対象となる入力画像としては、例えば、対象物を照明する光に、なるべく偏りがなく、対象物全体が、適切に照明された画像、すなわち、対象物全体が、万遍なく様々な方向からの光によって照明された画像（以下、適切照明画像ともいう）を用いることが望ましい。
【０００９】
一方、カメラで撮影される画像では、対象物を照明する光に偏りがあることが多く、対象物が、例えば、人の顔のように、ある程度左右対称であっても、顔の左側と右側とで異なる陰影がついた画像（以下、偏り陰影画像ともいう）になっていることがある。
【００１０】
学習用画像が、偏り陰影画像になっていても、そのような偏り陰影画像の多数を、学習用画像として用いて、アンサンブル識別器の学習を行うことで、学習用画像としての偏り陰影画像における対象物を照明する光の偏りが平均化され、適切照明画像を学習用画像として用いて学習を行ったかのようなアンサンブル識別器を得ることができる。そのため、そのようなアンサンブル識別器を用いた対象物判別では、入力画像が、偏り陰影画像である場合には、対象物判別に用いる画像の特徴量にかかわらず、対象物判別の判別性能が低下することがある。
【００１１】
本技術は、このような状況に鑑みてなされたものであり、対象物判別の判別性能の低下を、容易に防止することができるようにするものである。
【課題を解決するための手段】
【００１２】
本技術の一側面の情報処理装置、又は、プログラムは、入力画像から抽出された特徴量を入力として、前記入力画像に所定の対象物が映っているか否かを表す弱仮説を出力する複数の弱識別器を有するアンサンブル識別器のパラメータを補正するための補正情報であり、前記対象物を照明する光源に基づいて算出される前記補正情報を用いて、前記アンサンブル識別器のパラメータを補正する補正部と、前記パラメータの補正後のアンサンブル識別器を用い、前記特徴量に対して、前記弱識別器が出力する弱仮説を積算し、前記弱仮説の積算値に基づいて、前記入力画像に、前記対象物が映っているか否かを判別する判別部とを備える情報処理装置、又は、情報処理装置として、コンピュータを機能させるためのプログラムである。
【００１３】
本技術の一側面の情報処理方法は、入力画像から抽出された特徴量を入力として、前記入力画像に所定の対象物が映っているか否かを表す弱仮説を出力する複数の弱識別器を有するアンサンブル識別器のパラメータを補正するための補正情報であり、前記対象物を照明する光源に基づいて算出される前記補正情報を用いて、前記アンサンブル識別器のパラメータを補正し、前記パラメータの補正後のアンサンブル識別器を用い、前記特徴量に対して、前記弱識別器が出力する弱仮説を積算し、前記弱仮説の積算値に基づいて、前記入力画像に、前記対象物が映っているか否かを判別するステップを含む情報処理方法である。
【００１４】
本技術の一側面においては、入力画像から抽出された特徴量を入力として、前記入力画像に所定の対象物が映っているか否かを表す弱仮説を出力する複数の弱識別器を有するアンサンブル識別器のパラメータを補正するための補正情報であり、前記対象物を照明する光源に基づいて算出される前記補正情報を用いて、前記アンサンブル識別器のパラメータが補正される。そして、前記パラメータの補正後のアンサンブル識別器を用い、前記特徴量に対して、前記弱識別器が出力する弱仮説が積算され、前記弱仮説の積算値に基づいて、前記入力画像に、前記対象物が映っているか否かが判別される。
【００１５】
なお、情報処理装置は、独立した装置であっても良いし、１つの装置を構成している内部ブロックであっても良い。
【００１６】
また、プログラムは、伝送媒体を介して伝送することにより、又は、記録媒体に記録して、提供することができる。
【発明の効果】
【００１７】
本技術の一側面によれば、対象物判別の判別性能の低下を、容易に防止することができる。
【図面の簡単な説明】
【００１８】
【図１】アンサンブル識別器を用いた対象物判別を行う判別装置の構成例を示すブロック図である。
【図２】検出辞書記憶部２０に記憶されるアンサンブル識別器のアンサンブル学習を行う学習装置の構成例を示すブロック図である。
【図３】学習装置が行うアンサンブル識別器H(x)のアンサンブル学習の処理を説明するフローチャートである。
【図４】弱識別器h_t(x)を生成する弱識別器生成処理を説明するフローチャートである。
【図５】打ち切り閾値R_tを求める方法を説明する図である。
【図６】判別処理を説明するフローチャートである。
【図７】ウインドウ画像判別処理を説明するフローチャートである。
【図８】入力画像（動画）と、その入力画像を対象として判別処理を行った場合のROC曲線とを示す図である。
【図９】偏り陰影画像を対象とする対象物判別の判別性能が低下することを説明する図である。
【図１０】入力画像が、対象物全体が、適切に照明された適切照明画像でない場合に対処する方法を説明する図である。
【図１１】輝度変換フィルタを、部分的にかける場合を説明する図である。
【図１２】本技術の情報処理装置を適用した判別装置の一実施の形態の構成例を示すブロック図である。
【図１３】平均画像記憶部５７に記憶されている平均画像の例を示す図である
【図１４】本技術の原理を説明する図である。
【図１５】基準識別器のパラメータの補正を説明する図である。
【図１６】光源推定部５２が、キャリブレーション用画像から、そこに映っている対象物を照明する光源を推定する光源推定方法を説明する図である。
【図１７】光源推定部５２が光源を推定する他の光源推定方法を説明する図である。
【図１８】陰影領域認識部５３が、キャリブレーション用画像において、光源からの光によって陰影が生じる陰影境界を検出する境界検出方法を説明する図である。
【図１９】他の境界検出方法を説明する図である。
【図２０】補正情報算出部５４が補正係数k'を決定（算出）する方法を説明する図である。
【図２１】画像取得部５１において、キャリブレーション用画像を取得する取得方法を説明する図である。
【図２２】キャリブレーション処理を説明するフローチャートである。
【図２３】補正情報算出部５４が行う補正係数決定処理を説明するフローチャートである。
【図２４】判別装置が行う判別処理を説明するフローチャートである。
【図２５】画素の位置に応じて異なる倍率k'に増幅する輝度変換フィルタと、その輝度変換フィルタがかけられた平均画像とを示す図である。
【図２６】本技術を適用したコンピュータの一実施の形態の構成例を示すブロック図である。
【発明を実施するための形態】
【００１９】
本技術の実施の形態を説明する前に、前段階の準備として、アンサンブル学習と、アンサンブル学習により得られるアンサンブル識別器を用いた対象物判別とについて説明する。
【００２０】
［アンサンブル識別器を用いた対象物判別を行う判別装置］
【００２１】
図１は、アンサンブル識別器を用いた対象物判別を行う判別装置の構成例を示すブロック図である。
【００２２】
図１において、判別装置は、判別処理部１０、及び、検出辞書記憶部２０を有する。
【００２３】
判別処理部１０には、対象物判別を行う対象の入力画像が、外部から供給される。
【００２４】
判別処理部１０は、検出辞書記憶部２０に記憶された検出辞書としてのアンサンブル識別器（のパラメータ）を用いて、外部から供給（入力）される入力画像に、例えば、人の顔等の所定の対象物が映っているか否かを判別する対象物判別を行い、その判別結果を出力する。
【００２５】
検出辞書記憶部２０は、アンサンブル学習により得られた、対象物を検出（判別）するための検出辞書としてのアンサンブル識別器（のパラメータ）を記憶している。
【００２６】
図１において、判別処理部１０は、スケーリング部１１、走査部１２、及び、判別部１３を有する。
【００２７】
スケーリング部１１には、対象物判別を行う対象の入力画像が供給される。
【００２８】
スケーリング部１１は、入力画像を、例えば、バイリニア補間等によって、判別部１３からの制御に従った縮小率で縮小し、その縮小によって得られる縮小画像を、入力画像をスケーリングしたスケーリング画像として、走査部１２に供給する。
【００２９】
走査部１２は、判別部１３の制御に従い、スケーリング部１１からのスケーリング画像上において、例えば、横×縦が20×20ピクセル等の所定のサイズのウインドウを、例えば、いわゆるラスタスキャンのように走査することで、スケーリング画像上のウインドウの位置を移動させる。
【００３０】
そして、走査部１２は、スケーリング画像のうちの、ウインドウ内の画像（以下、ウインドウ画像ともいう）を切り出し、判別部１３に供給する。
【００３１】
判別部１３は、スケーリング部１１、及び、走査部１２を制御しながら、検出辞書記憶部２０に記憶されたアンサンブル識別器と、走査部１２から供給されるウインドウ画像とを用いて、入力画像に、例えば、人の顔等の所定の対象物が映っているか否かを判別し、その判別結果を表す判別結果情報を出力する。
【００３２】
すなわち、判別部１３は、所定の縮小率で、入力画像を縮小するように、スケーリング部１１を制御する。
【００３３】
スケーリング部１１は、判別部１３の制御に従い、所定の縮小率で、入力画像を縮小し、その結果得られる縮小画像を、スケーリング画像として、走査部１２に供給する。
【００３４】
さらに、判別部１３は、スケーリング部１１で得られるスケーリング画像上を、ラスタスキャン順に、ウインドウを移動させるように、走査部１２を制御する。
【００３５】
走査部１２は、判別部１３の制御に従い、ウインドウを、スケーリング画像の左上から、例えば、１ピクセル等の所定のピクセル数単位で、右方向に移動していき、ウインドウが、スケーリング画像の右端に到達すると、ウインドウを、例えば、１ピクセル等の所定のピクセル数だけ下げて、再び、左端から右方向に移動していくことを、ウインドウが、スケーリング画像の右下に到達するまで繰り返す。
【００３６】
そして、走査部１２は、ウインドウを移動するたびに、スケーリング画像から、移動後の位置のウインドウ内の画像であるウインドウ画像を切り出し、判別部１３に供給する。
【００３７】
判別部１３は、以上のようにして走査部１２から供給されるウインドウ画像に、対象物が映っているか否かを判別するウインドウ画像判別処理を行う。
【００３８】
そして、判別部１３は、ウインドウがスケーリング画像の右下に到達すると、前回より小さな（値の）縮小率で、入力画像を縮小するように、スケーリング部１１を制御し、以下、スケーリング画像が、ウインドウサイズ（以下）になるまで、同様の処理を繰り返す。
【００３９】
以上のように、判別部１３では、入力画像を、様々な値の縮小率で縮小することにより得られるスケーリング画像から切り出されるウインドウ画像に、対象物が映っているか否かを判別するウインドウ画像判別処理を行うので、入力画像に存在する様々な大きさの対象物を検出することができる。
【００４０】
判別部１３は、ウインドウ画像判別処理において、走査部１２からのウインドウ画像から、例えば、ピクセル間差分特徴量等の特徴量を抽出（算出）し、その特徴量を、検出辞書記憶部２０に記憶されたアンサンブル識別器を構成する弱識別器に入力することで、その特徴量に対する、弱識別器の出力である弱仮説を得る。
【００４１】
そして、判別部１３は、アンサンブル識別器を構成する各弱識別器が出力する弱仮説を順次積算し、その積算値に基づいて、ウインドウ画像に対象物が映っているか否かを判別する。
【００４２】
［アンサンブル学習を行う学習装置］
【００４３】
図２は、図１の検出辞書記憶部２０に検出辞書として記憶されるアンサンブル識別器のアンサンブル学習を行う学習装置の構成例を示すブロック図である。
【００４４】
図２において、学習装置は、学習用画像記憶部３１、特徴量抽出部３２、及び、学習部３３を有する。
【００４５】
学習用画像記憶部３１は、アンサンブル学習に用いられる複数の学習用画像を記憶している。
【００４６】
学習用画像は、ウインドウと同一サイズの画像であり、複数の学習用画像には、対象物が映っているポジティブ画像と、対象物が映っていないネガティブ画像とが含まれている。
【００４７】
さらに、各学習用画像には、その学習用画像が、ポジティブ画像及びネガティブ画像のうちのいずれであるのかを表すラベル（正解ラベル）が付されている。
【００４８】
特徴量抽出部３２は、学習用画像記憶部３１に記憶された学習用画像から、例えば、２つのピクセルの画素値の差分であるピクセル間差分特徴量等の特徴量を抽出し、学習部３３に供給する。
【００４９】
学習部３３は、学習用画像記憶部３１に記憶された複数の学習用画像を用いて、すなわち、複数の学習用画像から抽出されるピクセル間差分特徴量xを用いて、アンサンブル学習を行うことにより、画像に対象物が存在することを識別するアンサンブル識別器H(x)（のパラメータ）を求めて出力する。
【００５０】
ここで、アンサンブル識別器H(x)は、ピクセル間差分特徴量xを入力として、画像に対象物が映っているか否かを表す弱仮説を出力する複数であるT個の弱識別器h₁(x),h₂(x),・・・,h_T(x)を有する。
【００５１】
図１の判別部１３は、ウインドウ画像からピクセル間差分特徴量xを抽出（算出）し、アンサンブル識別器を構成する弱識別器h₁(x)ないしh_T(x)に入力することで、ピクセル間差分特徴量xに対する、弱識別器h₁(x)ないしh_T(x)の出力である弱仮説h₁(x),h₂(x),・・・,h_T(x)を得る。
【００５２】
すなわち、弱識別器h_t(x)は、パラメータとして、例えば、引数であるピクセル間差分特徴量xと比較される１つの閾値thを有し、式x>thが成り立つ場合には、弱仮説h_t(x)として、+1を出力し、式x>thが成り立たない場合には、弱仮説h_t(x)として、-1を出力する。
【００５３】
そして、判別部１３は、アンサンブル識別器を構成する各弱識別器h_t(x)が出力する弱仮説h_t(x)の重み付け多数決をとり、その重み付け多数決の結果に基づいて、ウインドウ画像に対象物が映っているか否かを判別するウインドウ画像判別処理を行う。
【００５４】
すなわち、弱識別器h_t(x)は、パラメータとして、閾値thの他、信頼度α_tを有する。
【００５５】
判別部１３は、アンサンブル識別器を構成する各弱識別器h_t(x)が出力する弱仮説h_t(x)について、信頼度α_tを重みとして、順次、(重み付け)積算を行い、その結果得られる積算値Σ(α_t×h_t(x))（＝α₁h₁(x)+α₂h₂(x)+・・・+α_Th_T(x)）に基づいて、ウインドウ画像に対象物が映っているか否かを判別するウインドウ画像判別処理を行う。
【００５６】
すなわち、弱仮説h_t(x)の、信頼度α_tを重みとする積算値Σ(α_t×h_t(x))が、0より大である場合（符号が正である場合）、ウインドウ画像は、対象物が映っているポジティブ画像であると判別される。
【００５７】
一方、積算値Σ(α_t×h_t(x))が、0より大でない場合（符号が正でない場合）、ウインドウ画像は、対象物が映っていないネガティブ画像であると判別される。
【００５８】
学習部３３では、アンサンブル学習によって、アンサンブル識別器を構成する各弱識別器h_t(x)のパラメータである閾値th、信頼度α_t、及び、弱識別器h_t(x)の引数となるピクセル間差分特徴量xを求めるのに用いる２つのピクセルの位置であるピクセル位置対が求められる。
【００５９】
ウインドウのサイズが、例えば、横×縦が20×20ピクセルである場合、ウインドウ画像のサイズも、20×20ピクセルとなる。そして、そのような20×20ピクセルのウインドウ画像から、ピクセル間差分特徴量xを抽出するのに用いる２つのピクセルの位置の組み合わせ（ピクセル位置対）は、79,800＝400×399/2通りだけ存在する。
【００６０】
なお、学習部３３では、その他、打ち切り長R_tが、弱識別器h_t(x)のパラメータとして求められる。打ち切り長R_tについては、後述する。
【００６１】
ここで、上述のように、式x>thが成り立つかどうかによって、弱仮説h_t(x)として、+1又は-1を出力する弱識別器h_t(x)は、スタンプ識別器(stump classifier)と呼ばれる。
【００６２】
すなわち、スタンプ識別器は、画像の特徴量xを用いて、画像を、例えば、人の顔等の対象物が映っているか否かを表す２つのクラスに識別するが、その識別を、特徴量xと閾値thとの大小関係によって行う。
【００６３】
弱仮説h_t(x)が+1のクラスが、対象物が映っていることを表すクラスであり、弱仮説h_t(x)が-1のクラスが、対象物が映っていないことを表すクラスである。
【００６４】
なお、アンサンブル識別器を構成する弱識別器は、スタンプ識別器に限定されるものではない。
【００６５】
弱識別器として、スタンプ識別器h_t(x)を有するアンサンブル識別器H(x)のアンサンブル学習は、例えば、ブースティング(boosting)の一種であるアダブースト(AdaBoost)等によって行うことができる。
【００６６】
［アンサンブル学習］
【００６７】
図３は、図２の学習装置が行うアンサンブル識別器H(x)のアンサンブル学習の処理を説明するフローチャートである。
【００６８】
図３のアンサンブル学習は、アダブーストを利用した学習であるが、アンサンブル学習は、アダブースト以外の、例えば、ジェントルブースト(GentleBoost)等のアンサンブル学習を利用して行うことが可能である。
【００６９】
ここで、学習装置（図２）において、学習用画像記憶部３１には、走査部１２（図１）で用いられるウインドウと同一サイズの学習用画像が、N枚記憶されていることとし、そのN枚の学習用画像のうちの、i番目の学習用画像を、学習用画像#iと表す。また、i番目の学習用画像#iの正解ラベルを、y_iと表す。学習用画像#iがポジティブ画像である場合の正解ラベルy_iは、例えば、+1とされ、学習用画像#iがネガティブ画像である場合の正解ラベルy_iは、例えば、-1とされていることとする。
【００７０】
アンサンブル学習では、ステップＳ１１において、学習部３３は、アンサンブル識別器を構成する弱識別器h_t(x)の個数をカウントする変数tを、1に初期化し、処理は、ステップＳ１２に進む。
【００７１】
ステップＳ１２では、学習部３３は、学習用画像記憶部３１に記憶された学習用画像#1ないし#Nそれぞれの、1番目の弱識別器h₁(x)に対する重みD₁(1)ないしD₁(N)を、例えば、1/Nに初期化し、処理は、ステップＳ１３に進む。
【００７２】
ここで、D_t(i)は、i番目の学習用画像#iの、t番目の弱識別器h_t(x)に対する重みを表す。
【００７３】
ステップＳ１３では、学習部３３は、t番目の弱識別器h_t(x)を生成する弱識別器生成処理を行い、処理は、ステップＳ１４に進む。
【００７４】
ステップＳ１４では、学習部３３は、変数tが、アンサンブル識別器を構成する弱識別器h_t(x)の総数として、あらかじめ設定された値である設定総数Tに等しいかどうかを判定する。
【００７５】
ステップＳ１４において、変数tが設定総数Tに等しくないと判定された場合、すなわち、設定総数Tに等しい数だけの弱識別器h₁(x)ないしh_T(x)が、まだ生成されていない場合、処理は、ステップＳ１５に進み、学習部３３は、例えば、アダブーストのアルゴリズムに従い、各学習用画像#iの、t番目の弱識別器h_t(x)に対する重みD_t(i)を、各学習用画像#iの、次に求めるt+1番目の弱識別器h_t+1(x)に対する重みD_t+1(i)に更新する。
【００７６】
すなわち、学習部３３は、重みD_t(i)を、式（１）に従って更新する。
【００７７】
D_t(i)＝D_t(i)exp（-y_ih_t(x_i))
・・・（１）
【００７８】
ここで、式（１）において、exp()は、ネイピア数eを底とする指数関数を表し、y_iは、i番目の学習用画像#iの正解ラベルを表す。
【００７９】
また、x_iは、i番目の学習用画像#iから抽出（算出）されたピクセル間差分特徴量を表し、h_t(x_i)は、直前のステップＳ１３で生成されたt番目の弱識別器h_t(x)が、ピクセル間差分特徴量x_iの入力に対して出力する弱仮説を表す。
【００８０】
式（１）によれば、正解ラベルy_iの符号と、弱仮説h_t(x_i)の符号とが一致しているときに（弱仮説h_t(x_i)が正解であるときに）、重みD_t(i)は、小さい値に更新され、正解ラベルy_iの符号と、弱仮説h_t(x_i)の符号とが一致していないときに（弱仮説h_t(x_i)が誤りであるときに）、重みD_t(i)は、大きい値に更新される。
【００８１】
その後、学習部３３は、更新後の重みD_t(i)を、式（２）に従って正規化し、正規化後の重みD_t(i)を、t+1番目の弱識別器h_t+1(x)に対する重みD_t+1(i)として求める。
【００８２】
D_t+1(i)＝D_t(i)／Σ_iD_t(i)
・・・（２）
【００８３】
ここで、式（２）において、Σ_iは、変数iを、1からNに変えて、D_t(i)のサメ−ション（D_t(i)の総和）をとることを表す。
【００８４】
以上のように、ステップＳ１５において、各学習用画像#iの、次に求めるt+1番目の弱識別器h_t+1(x)に対する重みD_t+1(i)が求められた後、処理は、ステップＳ１６に進み、学習部３３は、変数tを1だけインクリメントする。
【００８５】
そして、処理は、ステップＳ１６からステップＳ１３に戻り、以下、同様の処理が繰り返される。
【００８６】
一方、ステップＳ１４において、変数tが設定総数Tに等しいと判定された場合、すなわち、設定総数Tに等しい数だけの弱識別器h₁(x)ないしh_T(x)が生成された場合、処理は、ステップＳ１７に進み、学習部３３は、弱識別器h₁(x)ないしh_T(x)（のパラメータ）から構成されるアンサンブル識別器H(x)を、検出辞書として出力して、アンサンブル学習の処理を終了する。
【００８７】
図４は、図２の学習装置が図３のステップＳ１３で行う、弱識別器h_t(x)を生成する弱識別器生成処理を説明するフローチャートである。
【００８８】
ステップＳ２１において、学習部３３は、特徴量としてのピクセル間差分特徴量xの生成に用いる２つのピクセルの位置の組み合わせ（ピクセル位置対）として、例えば、学習用画像から選択しうる２つのピクセルの位置の全通りの組み合わせを設定する。
【００８９】
ここで、学習用画像から選択しうる２つのピクセルの位置の全通りの組み合わせの数が、M通りであるとする。
【００９０】
ステップＳ２１において、学習用画像から選択しうる２つのピクセルの位置の全通りの組み合わせであるM通りのピクセル位置対が設定されると、処理は、ステップＳ２２に進み、学習部３３は、M通りのピクセル位置対をカウントする変数mを、1に初期化して、処理は、ステップＳ２３に進む。
【００９１】
ステップＳ２３では、特徴量抽出部３２が、学習用画像記憶部３１に記憶された1ないしN番目の学習用画像#1ないし#Nそれぞれについて、M通りのピクセル位置対のうちのm番目のピクセル位置対の２つのピクセルの画素値（例えば、輝度）p₁及びp₂を抽出し、ピクセル間差分特徴量である特徴量x_i＝p₁-p₂を、t番目の弱新識別器h_t(x)に与える特徴量として求め、処理は、ステップＳ２４に進む。
【００９２】
ステップＳ２４では、学習部３３は、t番目の弱識別器h_t(x)のパラメータとしての閾値を表す変数thに、初期値としてのx_minをセットし、処理は、ステップＳ２５に進む。
【００９３】
ここで、初期値x_minとしては、例えば、8ビットや16ビット等の所定のビット数で表現されるピクセル間差分特徴量として取り得る値の最小値等が用いられる。
【００９４】
ステップＳ２５では、学習部３３は、1ないしN番目の学習用画像#1ないし#Nそれぞれについて、学習用画像#iから求められたピクセル間差分特徴量x_iを、閾値が変数thの弱識別器h_t(x)に与えることによって、弱仮説h_t(x_i)を求める。
【００９５】
さらに、学習部３３は、式（３）に従い、弱仮説h_t(x_i)が、式h_t(x_i)≠y_iを満たす学習用画像#iの重みD_t(i)の総和を、ピクセル位置対m及び閾値thについての誤り率ε_t(m,th)として求める。
【００９６】
ε_t(m,th)＝ΣD_t(i)［h_t(x_i)≠y_i］
・・・（３）
【００９７】
ここで、式（３）において、［h_t(x_i)≠y_i］は、式h_t(x_i)≠y_iが成り立つ場合は、1となり、成り立たない場合は、0となる。
【００９８】
式（３）によれば、誤り率ε_t(m,th)は、N枚の学習用画像のうちの、弱識別器h_t(x)の出力である弱仮説h_t(x_i)が誤る学習用画像（式h_t(x_i)≠y_iが成り立つ学習用画像）の重みD_t(i)のみを加算することで求められる。
【００９９】
ステップＳ２５において、ピクセル位置対m及び閾値thについての誤り率ε_t(m,th)が求められると、処理は、ステップＳ２６に進み、学習部３３は、変数thが、所定のビット数で表現されるピクセル間差分特徴量として取り得る値の最大値x_maxに等しいかどうかを判定する。
【０１００】
ステップＳ２６において、（閾値を表す）変数thが、最大値x_maxに等しくないと判定された場合、すなわち、閾値thが、最大値x_max未満の値である場合、処理は、ステップＳ２７に進み、学習部３３は、変数thを1だけインクリメントする。
【０１０１】
そして、処理は、ステップＳ２７からステップＳ２５に戻り、以下、同様の処理が繰り返される。
【０１０２】
また、ステップＳ２６において、閾値thが、最大値x_maxに等しいと判定された場合、処理は、ステップＳ２８に進み、学習部３３は、変数mが、所定数Mに等しいかどうかを判定する。
【０１０３】
ステップＳ２８において、変数mが、所定数Mに等しくないと判定された場合、処理は、ステップＳ２９に進み、学習部３３は、変数mを1だけインクリメントする。
【０１０４】
そして、処理は、ステップＳ２９からステップＳ２３に戻り、以下、同様の処理が繰り返される。
【０１０５】
また、ステップＳ２８において、変数mが、所定数Mに等しいと判定された場合、すなわち、M通りのピクセル位置対mのそれぞれ、及び、式x_min≦th≦x_maxで表される範囲の閾値thそれぞれについて、t番目の弱識別器h_t(x)の誤り率ε_t(m,th)が求められた場合、処理は、ステップＳ３０に進み、学習部３３は、M通りのピクセル位置対mのそれぞれ、及び、式x_min≦th≦x_maxで表される範囲の閾値thそれぞれについての誤り率ε_t(m,th)のうちの最小の誤り率である最小誤り率ε_t(m_min,th_min)を求める。
【０１０６】
さらに、学習部３３は、最小誤り率ε_t(m_min,th_min)が得られたときの閾値（以下、最適閾値ともいう）th_minと、ピクセル位置対（以下、最適ピクセル位置対ともいう）m_minを、それぞれ、t番目の弱識別器h_t(x)のパラメータとしての閾値と、引数xとしてのピクセル間差分特徴量を求める引数x用のピクセル位置対に決定する。
【０１０７】
そして、処理は、ステップＳ３０からステップＳ３１に進み、学習部３３は、弱識別器h_t(x)のパラメータとしての信頼度α_tを、最小誤り率e(m_min,th_min)を用い、式（４）に従って求めて、処理は、ステップＳ３２に進む。
【０１０８】
α_t＝(1/2)ln((1-ε_t(m_min,th_min))／ε_t(m_min,th_min))
・・・（４）
【０１０９】
式（４）によれば、最小誤り率ε_t(m_min,th_min)が大（小）であるほど、値が小（大）の信頼度α_tが求められる。なお、式（４）において、lnは、ネイピア数を底とする対数を表す。
【０１１０】
ステップＳ３２では、学習部３３は、t番目の弱識別器h_t(x)のパラメータとしての打ち切り長R_tを求めて、処理はリターンする。
【０１１１】
図５は、図４のステップＳ３２において打ち切り閾値R_tを求める方法を説明する図である。
【０１１２】
アンサンブル学習によって求められるアンサンブル識別器H(x)は、T個の弱識別器h₁(x),h₂(x),・・・,h_T(x)で構成され、検出辞書記憶部２０（図１）に記憶される。
【０１１３】
そして、図１の判別部１３は、走査部１２から供給されるウインドウ画像に、対象物が映っているか否かを判別するウインドウ画像判別処理を、検出辞書記憶部２０に記憶されたアンサンブル識別器H(x)を用いて行う。
【０１１４】
すなわち、ウインドウ画像判別処理では、ウインドウ画像から抽出される特徴量（本実施の形態では、ピクセル間差分特徴量）xが、アンサンブル識別器H(x)に与えられ、その特徴量xに対するアンサンブル識別器H(x)の出力である識別値H(x)に基づいて、ウインドウ画像に、対象物が映っているか否かが判別される。
【０１１５】
アンサンブル識別器H(x)の出力である識別値H(x)は、アンサンブル識別器H(x)を構成する弱識別器h_t(x)の出力である弱仮説ht(x)の積算値（重み付け多数決）の符号であり、式（５）で表される。
【０１１６】
H(x)＝sgn{Σ_tα_th_t(x)}
・・・（５）
【０１１７】
ここで、式（５）において、Σ_tは、変数tを1からTに変えて、弱仮説h_t(x)の、信頼度α_tを重みとする重み付け値α_th_t(x)のサメーションをとることを表す。また、sgn{}は、かっこ{}内の符号を表す（0の符号は、プラス及びマイナスのうちの一方（例えば、マイナス）とみなすこととする）。
【０１１８】
式（５）の識別値H(x)が、プラスである場合、ウインドウ画像に、対象物が映っていると判別され、プラスでない場合、ウインドウ画像に、対象物が映っていないと判別される。
【０１１９】
ウインドウ画像判別処理において、式（５）の識別値H(x)を求めるにあたり、弱仮説h_t(x)の重み付け値α_th_t(x)は、変数tを、1からTに、順次変えて、順番に求められ、積算されていく。
【０１２０】
すなわち、式（５）の識別値H(x)は、弱仮説h_t(x)を求め、その弱仮説h_t(x)の重み付け値α_th_t(x)を、既に求められている弱仮説h₁(x)ないしh_t-1(x)の重み付け値α₁h₁(x)ないしα_t-1h_t-1(x)の積算値に積算することを繰り返すことで求められる。
【０１２１】
図５は、t個の弱仮説h₁(x)ないしh_t(x)（の重み付け値α₁h₁(x)ないしα_th_t(x)）の積算値（以下、t個の弱仮説の積算値Σα_th_t(x)ともいう）の変数tに対する変化の例を示している。
【０１２２】
なお、図５には、５枚のウインドウ画像#1,#2,#3,#4,#5それぞれについてのt個の弱仮説の積算値Σh_t(x)を示してある。
【０１２３】
５枚のウインドウ画像#1ないし#5のうちの、ウインドウ画像#1ないし#4は、ポジティブ画像であり、残りのウインドウ画像#5は、ネガティブ画像である。
【０１２４】
また、図５には、打ち切り閾値R_tも、図示してある。
【０１２５】
ポジティブ画像であるウインドウ画像#1ないし#4については、t個の弱仮説の積算値Σα_th_t(x)は、変数t（積算される弱仮説の数）にかかわらず、打ち切り閾値R_t以上になっている。
【０１２６】
一方、ネガティブ画像であるウインドウ画像#5については、t個の弱仮説の積算値Σα_th_t(x)は、変数tがある値になったときに、打ち切り閾値R_t未満になっている。
【０１２７】
式（５）の識別値H(x)を求めるにあたり、弱仮説h_t(x)は、変数tを、1からTに変えて、順番に求められ、その弱仮説h_t(x)の重み付け値α_th_t(x)が積算されることで、t個の弱仮説の積算値Σα_th_t(x)が求められるが、そのt個の弱仮説の積算値Σα_th_t(x)が、打ち切り閾値R_t未満（又は、以下）になった時点で、弱仮説h_t(x)（の重み付け値α_th_t(x)）の積算は、打ち切られる（中止される）。
【０１２８】
なお、弱仮説h_t(x)の積算が打ち切られた場合、ウインドウ画像には、対象物が映っていない（ウインドウ画像はネガティブ画像である）と判別される。
【０１２９】
t個の弱仮説の積算値Σα_th_t(x)と比較される打ち切り閾値R_tは、学習部３３において、N枚の学習用画像のうちの、ポジティブ画像を用いて求められる。
【０１３０】
すなわち、N枚の学習用画像の中に、L枚のポジティブ画像があるとし、そのL枚のポジティブ画像のうちの、j番目のポジティブ画像#jから抽出されるピクセル間差分特徴量を、x_jと表すこととすると、学習部３３は、L枚のポジティブ画像#jそれぞれについて、t個の弱仮説の積算値Σα_th_t(x_j)を求める。
【０１３１】
そして、学習部３３は、L枚のポジティブ画像#jそれぞれについての、t個の弱仮説の積算値Σα_th_t(x_j)のうちの最小値を、打ち切り閾値R_tとして求める。
【０１３２】
具体的には、学習部３３は、例えば、式（６）に従って、打ち切り閾値R_tを求める。
【０１３３】
R_t＝min｛Σ_iα_ih_i(x₁)，Σ_iα_ih_i(x₂)，・・・，Σ_iα_ih_i(x_L)，0｝
・・・（６）
【０１３４】
ここで、式（６）において、Σ_iは、変数iを1からtに変えて、弱仮説h_i(x_j)（の重み付け値α_ih_i(x_j)）のサメーションをとることを表す。また、min{}は、かっこ{}内の値の最小値を表す。
【０１３５】
式（６）によれば、L枚のポジティブ画像#jそれぞれについての、t個の弱仮説の積算値Σα_ih_i(x_j)＝α₁h₁(x_j)+α₂h₂(x_j)+・・・+α_th_t(x_j)のうちの最小値が、打ち切り閾値R_tとして求められる。
【０１３６】
なお、式（６）では、L枚のポジティブ画像#jそれぞれについての、t個の弱仮説の積算値Σα_ih_i(x_j)＝α₁h₁(x_j)+α₂h₂(x_j)+・・・+α_th_t(x_j)のうちの最小値が、0より大である場合には、打ち切り閾値R_tは、0とされる。
【０１３７】
したがって、式（６）に従って求められる打ち切り閾値R_tは、0以下の値に制限される。
【０１３８】
なお、打ち切り閾値R_tの制限の方法（打ち切り閾値R_tを制限する値の他、打ち切り閾値R_tを制限するか否かを含む）は、アンサンブル学習の方法（種類）に依存する。
【０１３９】
［判別処理］
【０１４０】
図６は、図１の判別装置が行う、入力画像に対象物が映っているか否かを判別する対象物判別の処理（判別処理）を説明するフローチャートである。
【０１４１】
なお、以下では、対象物として、例えば、人の顔を採用することとする。
【０１４２】
スケーリング部１１は、そこに、外部からの入力画像が供給されるのを待って、ステップＳ５１において、外部からの入力画像を縮小し、その縮小によって得られる縮小画像を、入力画像をスケーリングしたスケーリング画像として、走査部１２に供給して、処理は、ステップＳ５２に進む。
【０１４３】
ここで、スケーリング部１１において、外部からの入力画像が供給された後、最初に、ステップＳ５１の処理が行われる場合、入力画像は、１倍の縮小率で縮小される。したがって、この場合、スケーリング部１１から走査部１２には、サイズが縮小されていない入力画像が、スケーリング画像として供給される。
【０１４４】
ステップＳ５２では、走査部１２は、スケーリング部１１からのスケーリング画像の左上の位置に、例えば、20×20ピクセル等の所定のサイズのウインドウを設定し、処理は、ステップＳ５３に進む。
【０１４５】
ステップＳ５３では、走査部１２は、スケーリング画像から、ウインドウ内の画像を切り出し、ウインドウ画像として、判別部１３に供給して、処理は、ステップＳ５４に進む。
【０１４６】
ステップＳ５４では、判別部１３は、走査部１２からのウインドウ画像に、対象物が映っているか否かを判別するウインドウ画像判別処理を、検出辞書記憶部２０に記憶されたアンサンブル識別器を用いて行い、処理は、ステップＳ５５に進む。
【０１４７】
ここで、判別部１３が行うウインドウ画像判別処理については、後述するが、ウインドウ画像判別処理では、ウインドウ画像が、対象物である人の顔が映っているポジティブ画像であるか、又は、人の顔が映っていないネガティブ画像であるかが判別される。
【０１４８】
ステップＳ５５では、判別部１３は、ウインドウがスケーリング画像の右下に位置しているかどうかを判定する。
【０１４９】
ステップＳ５５において、ウインドウがスケーリング画像の右下に位置していないと判定された場合、処理は、ステップＳ５６に進み、判別部１３は、ウインドウを移動させるように、走査部１２を制御する。
【０１５０】
走査部１２は、判別部１３の制御に従い、スケーリング画像上のウインドウを、ラスタスキャン順で、次の位置に移動させ、処理は、ステップＳ５６からステップＳ５３に戻る。
【０１５１】
ステップＳ５３では、走査部１２は、スケーリング画像から、移動後のウインドウ内の画像を切り出し、ウインドウ画像として、判別部１３に供給して、以下、同様の処理が繰り返される。
【０１５２】
また、ステップＳ５５において、ウインドウがスケーリング画像の右下に位置していると判定された場合、処理は、ステップＳ５７に進み、判別部１３は、スケーリング画像のサイズが、ウインドウのサイズに一致しているかどうかを判定する。
【０１５３】
ステップＳ５７において、スケーリング画像のサイズが、ウインドウのサイズに一致していないと判定された場合、すなわち、スケーリング画像のサイズが、ウインドウのサイズよりも大きい場合、処理は、ステップＳ５８に進み、判別部１３は、前回より小さな縮小率（入力画像を、より縮小する縮小率）で、入力画像を縮小するように、スケーリング部１１を制御し、処理は、ステップＳ５１に戻る。
【０１５４】
ステップＳ５１では、スケーリング部１１は、判別部１３の制御に従って、入力画像を縮小し、その結果得られる、前回よりもサイズが小さい縮小画像を、スケーリング画像として、走査部１２に供給して、以下、同様の処理が繰り返される。
【０１５５】
また、ステップＳ５７において、スケーリング画像のサイズが、ウインドウのサイズに一致すると判定された場合、すなわち、スケーリング部１１において、入力画像が、ウインドウと同一サイズにまで縮小された場合、処理は、ステップＳ５９に進み、判別部１３は、それまでに行われたステップＳ５４のウインドウ画像判別処理において、ポジティブ画像であると判別されたウインドウ画像それぞれに対応する入力画像上の領域を、対象物が映っている対象物領域として、入力画像から検出し、処理は、ステップＳ６０に進む。
【０１５６】
ステップＳ６０では、判別部１３は、入力画像に、対象物領域があるかどうか、つまり、ステップＳ５９で、入力画像から、１つ以上の対象物領域が検出されたかどうかを判定する。
【０１５７】
ステップＳ６０において、入力画像に、対象物領域がないと判定された場合、すなわち、ウインドウ画像判別処理において、入力画像から得られるウインドウ画像の中に、ポジティブ画像であると判別されたウインドウ画像が存在せず、したがって、入力画像に、対象物である人の顔が映っていない場合、処理は、ステップＳ６１に進み、判別部１３は、入力画像についての、対象物の存在の判別結果を表す判別結果情報として、例えば、対象物が存在しない旨のメッセージ等を出力し、判別処理を終了する。
【０１５８】
また、ステップＳ６０において、入力画像に、対象物領域があると判定された場合、すなわち、入力画像に、１つ以上の対象物領域が存在する場合、処理は、ステップＳ６２に進み、判別部１３は、入力画像に存在する対象物領域の中に、互いに重なっている対象物領域があるかどうかを判定する。
【０１５９】
ステップＳ６２において、入力画像に存在する対象物領域の中に、互いに重なっている対象物領域があると判定された場合、すなわち、入力画像に、複数の対象物領域が存在し、その複数の対象物領域の中に、互いに重なっている対象物領域がある場合、処理は、ステップＳ６３に進み、判別部１３は、入力画像において、互いに重なっている対象物領域の中から、任意の２つの互いに重なっている対象物領域を選択し、その２つの互いに重なっている対象物領域のうちの一方、すなわち、例えば、ウインドウ画像判別処理で求められる後述する評価値sが小さい方を、対象物領域から除外する。
【０１６０】
その後、処理は、ステップＳ６３からステップＳ６２に戻り、以下、ステップＳ６２において、入力画像に存在する対象物領域の中に、互いに重なっている対象物領域がないと判定されるまで、ステップＳ６２及びＳ６３の処理が繰り返される。
【０１６１】
そして、ステップＳ６２において、入力画像に存在する対象物領域の中に、互いに重なっている対象物領域がないと判定された場合、処理は、ステップＳ６１に進み、判別部１３は、入力画像についての、対象物の存在の判別結果を表す判別結果情報として、例えば、対象物が存在する旨のメッセージや、対象物領域を囲む枠を表示した入力画像等を出力し、判別処理を終了する。
【０１６２】
図７は、図６のステップＳ５４で行われるウインドウ画像判別処理を説明するフローチャートである。
【０１６３】
ステップＳ７１において、判別部１３は、検出辞書記憶部２０に記憶されたアンサンブル識別器H(x)を構成するT個の弱識別器h₁(x),h₂(x),・・・,h_T(x)をカウントする変数tを、1に初期化する。
【０１６４】
さらに、ステップＳ７１では、判別部１３は、走査部１２からのウインドウ画像に、対象物が映っているか否かを判別するための、ウインドウ画像を評価する評価値sを、0に初期化し、処理は、ステップＳ７２に進む。
【０１６５】
ステップＳ７２では、判別部１３は、走査部１２からのウインドウ画像から、t番目の弱識別器h_t(x)に与える特徴量であるピクセル間差分特徴量xを抽出する。
【０１６６】
ここで、弱識別器h_t(x)のパラメータであるピクセル位置対mは、ピクセル間差分特徴量xを求めるのに画素値を用いる、ウインドウ画像上の２つのピクセルのピクセル位置P₁及びP₂を表す。
【０１６７】
判別部１３は、弱識別器h_t(x)のパラメータであるピクセル位置対mが表すピクセル位置P₁及びP₂それぞれの画素値p₁及びp₂を、ウインドウ画像から抽出し、その画素値p₁及びp₂から、減算によって、ピクセル間差分特徴量x＝p₁-p₂を求める。
【０１６８】
その後、処理は、ステップＳ７２からステップＳ７３に進み、判別部１３は、直前のステップＳ７２で求めたピクセル間差分特徴量xを、t番目の弱識別器h_t(x)に与えて、その弱識別器h_t(x)の演算を行い、弱仮説h_t(x)を求めて、処理は、ステップＳ７４に進む。
【０１６９】
ここで、ステップＳ７３では、弱識別器h_t(x)の演算として、弱識別器h_t(x)の閾値thと、ピクセル間差分特徴量xとの比較が行われる。そして、式x＞thが成り立つ場合には、弱仮説h_t(x)として、+1が求められ、式x＞thが成り立たない場合には、弱仮説h_t(x)として、-1が求められる。
【０１７０】
ステップＳ７４では、判別部１３は、弱仮説h_t(x)の重み付け値α_th_t(x)を求める。さらに、判別部１３は、評価値sに、弱仮説h_t(x)の重み付け値α_th_t(x)を加算することで、評価値sを更新して、処理は、ステップＳ７４からステップＳ７５に進む。
【０１７１】
ここで、ステップＳ７４で得られる、更新後の評価値sが、図５で説明したt個の弱仮説の積算値Σα_th_t(x)であり、また、ステップＳ７４で行われる評価値sの更新が、式（５）のアンサンブル識別器H(x)の出力である識別値H(x)を求めるための、弱仮説h_t(x)（の重み付け値α_th_t(x)の）の積算である。
【０１７２】
ステップＳ７５では、判別部１３は、評価値sが、t番目の弱識別器h_t(x)のパラメータである打ち切り閾値R_tより大きい値であるかどうかを判定する。
【０１７３】
ステップＳ７５において、評価値sが、打ち切り閾値R_tより大きい値であると判定された場合、処理は、ステップＳ７６に進み、判別部１３は、変数tが、アンサンブル識別器H(x)を構成する弱識別器h_t(x)の個数Tに等しいかどうかを判定する。
【０１７４】
ステップＳ７６において、変数tが、アンサンブル識別器H(x)を構成する弱識別器h_t(x)の個数Tに等しくないと判定された場合、処理は、ステップＳ７７に進み、判別部１３は、変数tを1だけインクリメントする。
【０１７５】
そして、処理は、ステップＳ７７からステップＳ７２に戻り、以下、同様の処理が繰り返される。
【０１７６】
また、ステップＳ７６において、変数tが、アンサンブル識別器H(x)を構成する弱識別器h_t(x)の個数Tに等しいと判定された場合、すなわち、識別値H(x)を求めるための、式（５）右辺のサメーションで表される積算が、アンサンブル識別器H(x)を構成するT個の弱識別器h_t(x)の弱仮説h_t(x)すべてを対象として行われた場合、処理は、ステップＳ７８に進み、識別部１３は、評価値sが閾値0より大であるかどうかを判定する。
【０１７７】
ステップＳ７８において、評価値sが閾値0より大でないと判定された場合、すなわち、アンサンブル識別器H(x)を構成するT個の弱識別器h_t(x)の弱仮説h_t(x)すべてを対象とした積算値Σ_tα_th_t(x)（式（５）右辺のΣ_tα_th_t(x)）の符号である識別値H(x)がプラスでない場合、処理は、ステップＳ７９に進み、判別部１３は、ウインドウ画像がネガティブ画像であると判別して、処理はリターンする。
【０１７８】
なお、ステップＳ７５において、評価値sが、打ち切り閾値R_tより大きい値でないと判定された場合も、処理は、ステップＳ７９に進み、判別部１３は、ウインドウ画像がネガティブ画像であると判別し、処理はリターンする。
【０１７９】
したがって、評価値s、つまり、t個の弱仮説の積算値Σα_th_t(x)が、打ち切り閾値R_tより大きい値でない場合には、ステップＳ７４で行われる評価値sの更新、つまり、式（５）のアンサンブル識別器H(x)の出力である識別値H(x)を求めるための、弱仮説h_t(x)の積算は、打ち切られる。
【０１８０】
t個の弱仮説の積算値Σα_th_t(x)が、打ち切り閾値R_tより大きい値でない場合、ウインドウ画像がポジティブ画像である可能性は、極めて低いので、t個の弱仮説の積算値Σα_th_t(x)が、打ち切り閾値R_tより大きい値でなくなった時点で、弱仮説h_t(x)の積算を打ち切ることにより、判別処理（図６）全体の高速化（短時間化）を図ることができる。
【０１８１】
一方、ステップＳ７８において、評価値sが閾値0より大であると判定された場合、すなわち、アンサンブル識別器H(x)を構成するT個の弱識別器ht(x)の弱仮説h_t(x)すべてを対象とした積算値Σ_tα_th_t(x)（式（５）右辺のΣ_tα_th_t(x)）の符号である識別値H(x)がプラスである場合、処理は、ステップＳ８０に進み、判別部１３は、ウインドウ画像がポジティブ画像であると判別して、処理はリターンする。
【０１８２】
図８は、入力画像（動画）と、その入力画像を対象として、図１の判別装置において判別処理を行った場合のROC(Receiver Operating Characteristic)曲線とを示す図である。
【０１８３】
図８Ａ及び図８Ｂの入力画像は、いずれも、対象物として、同一の人の顔が映っているポジティブ画像になっている。
【０１８４】
但し、図８Ａの入力画像では、対象物全体に、なるべく偏りがないように、照明がされており、したがって、図８Ａの入力画像は、対象物全体が、適切に照明された画像（適切照明画像）になっている。
【０１８５】
一方、図８Ｂの入力画像では、外光が、（向かって）右側から入り込んでおり、そのため、図８Ｂの入力画像は、対象物である人の顔の右側が明るく、左側が暗い（左側に（右側にはない）陰影が生じた）画像（偏り陰影画像）になっている。
【０１８６】
ROC曲線は、左上隅に近いほど、対象物判別の判別性能が高い（良い）ことを表す。
【０１８７】
図８では、図８Ａの入力画像のROC曲線は、左上隅に寄っているが、図８Ｂの入力画像のROC曲線は、左上隅からやや離れている。
【０１８８】
すなわち、図８Ｂの入力画像である偏り陰影画像については、外光の影響により生じた、人の顔の左側の陰影によって、対象物判別の判別性能が低下している。
【０１８９】
図９は、図１の判別装置において、偏り陰影画像を対象とする対象物判別の判別性能が低下することを説明する図である。
【０１９０】
図９は、対象物である人の顔が映っているポジティブ画像である２つの入力画像（から切り出されたウインドウ画像）#1及び#2を示している。
【０１９１】
但し、入力画像#1は、対象物である人の顔全体が、適切に照明された適切照明画像になっているが、入力画像#2は、対象物である人の顔の右側に（左側にはない）陰影が生じた偏り陰影画像になっている。
【０１９２】
図９では、対象物判別において、入力画像の左側のあるピクセル位置P₁の画素値p₁と、右側のあるピクセル位置P₂の画素値p₂とから得られるピクセル間差分特徴量x=p₁-p₂が、弱識別器h_t(x)の閾値thと比較されている。
【０１９３】
対象物である人の顔の右側に（左側にはない）陰影が生じた偏り陰影画像になっている入力画像#2については、弱識別器h_t(x)の閾値thと比較されるピクセル間差分特徴量x=p₁-p₂が、適切照明画像である入力画像#1について求められる値に比較して大きく異なる値となって、弱識別器h_t(x)の弱仮説h_t(x)に悪影響を与え、対象物判別の判別性能が低下することがある。
【０１９４】
図１０は、入力画像が、対象物全体が適切に照明された適切照明画像でない場合に対処する方法を説明する図である。
【０１９５】
図１０では、入力画像の全体が暗くなっている。
【０１９６】
全体が暗い入力画像については、輝度を、1以上の所定数であるk倍に変換する輝度変換フィルタを、入力画像全体にかけることにより、入力画像の輝度分布を、ある程度適切な輝度分布にすることができる。
【０１９７】
そして、輝度変換フィルタがかけられることによって、適切な輝度分布となった入力画像としての適切照明画像を対象として、判別処理を行うことにより、判別性能の低下を防止することができる。
【０１９８】
ここで、輝度変換フィルタでは、画素値pがk倍されて出力される。輝度変換フィルタに入力される入力値Inputと、輝度変換フィルタから出力される出力値Outputとの関係は、式Output＝k×Inputで表される。
【０１９９】
なお、入力画像が、明るすぎる画像である場合には、輝度を、1以下の所定数であるk倍に変換する輝度変換フィルタを用いることによって、入力画像は、ある程度適切な輝度分布の画像としての適切照明画像に変換される。
【０２００】
以上のように、入力画像の全体が暗い（又は、明るすぎる）場合には、その入力画像の全体に、輝度変換フィルタをかけて、入力画像を、ある程度適切な輝度分布の画像に変換することにより、判別性能の低下を防止することができるが、入力画像の一部だけが暗い場合、判別性能の低下を防止するには、輝度変換フィルタは、その暗い部分にだけかける必要がある。
【０２０１】
すなわち、入力画像が、例えば、図８Ｂに示したように、右側からの光（外光）によって照明された対象物である人の顔が映っている偏り陰影画像である場合、人の顔の右側が明るく、左側に陰影が生じているので、陰影が生じている左側の部分にだけ、画素値pを、1以上の所定数k倍する輝度変換フィルタを、部分的にかける必要がある。
【０２０２】
図１１は、図１の判別装置が行う図６の判別処理において、輝度変換フィルタを、部分的にかける場合を説明する図である。
【０２０３】
図１の判別装置が行う図６の判別処理において、輝度変換フィルタを、部分的にかける場合には、入力画像がスケーリングされ、そのスケーリング後のスケーリング画像から、ウインドウ画像が切り出された後、ウインドウ画像判別処理（図６のステップＳ５４）が行われる前に、ウインドウ画像に対して、輝度変換フィルタを部分的にかける部分的フィルタ処理を行う必要がある。
【０２０４】
したがって、１枚の入力画像については、その入力画像から生成されるすべてのスケーリング画像から切り出されるすべてのウインドウ画像に、部分的フィルタ処理を行う必要があり、判別処理で行う必要がある部分的フィルタ処理の処理コストが膨大になる。
【０２０５】
［本技術を適用した判別装置の一実施の形態］
【０２０６】
そこで、図１２は、本技術の情報処理装置を適用した判別装置の一実施の形態の構成例を示すブロック図である。
【０２０７】
なお、図中、図１の場合と対応する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。
【０２０８】
図１２の判別装置は、判別処理部１０、及び、検出辞書記憶部２０を有する点で、図１の場合と共通する。
【０２０９】
但し、図１２の判別装置は、画像取得部５１、光源推定部５２、陰影領域認識部５３、補正情報算出部５４、補正情報記憶部５５、補正部５６、及び、平均画像記憶部５７が新たに設けられている点で、図１の場合と相違する。
【０２１０】
図１２の判別装置では、検出辞書記憶部２０に記憶されたアンサンブル識別器H(x)のパラメータを補正することで、入力画像について、その入力画像から生成されるすべてのスケーリング画像から切り出されるすべてのウインドウ画像に、部分的フィルタ処理を施す場合と同様の効果を得ることができるようになっている。
【０２１１】
画像取得部５１は、例えば、カメラ等で構成され、画像を撮影し、入力画像として、判別処理部１０、光源推定部５２、及び、陰影領域認識部５３に供給する。
【０２１２】
ここで、光源推定部５２ないし平均画像記憶部５７は、検出辞書記憶部２０に記憶された検出辞書としてのアンサンブル識別器H(x)のキャリブレーションを行うキャリブレーション装置として機能する。
【０２１３】
キャリブレーションは、例えば、対象物である人の顔が映っているポジティブ画像を、キャリブレーション用の入力画像として用いて行われる。
【０２１４】
画像取得部５１は、光源推定部５２、及び、陰影領域認識部５３には、キャリブレーション用の入力画像（以下、キャリブレーション用画像ともいう）を供給する。
【０２１５】
光源推定部５２は、画像取得部５１からのキャリブレーション用画像から、そこに映っている対象物（人の顔）を照明する光源を推定し、その推定結果を、陰影領域認識部５３に供給する。
【０２１６】
陰影領域認識部５３は、光源推定部５２からの光源の推定結果に基づいて、画像取得部５１からのキャリブレーション用画像において、光源によって陰影が生じる陰影領域を認識し、その陰影領域（を表す情報）を、補正情報算出部５４に供給する。
【０２１７】
すなわち、陰影領域認識部５３は、例えば、光源推定部５２からの光源の推定結果に基づいて、画像取得部５１からのキャリブレーション用画像（から切り出されるウインドウ画像）において、光源からの光によって陰影が生じる境界である陰影境界を検出する。
【０２１８】
さらに、陰影領域認識部５３は、画像取得部５１からのキャリブレーション用画像の、陰影境界によって分けられる２つの領域のうちの、光源推定部５２からの光源の推定結果から得られる光源の位置（方向）と逆側の領域を、光源によって陰影が生じる陰影領域として認識し、補正情報算出部５４に供給する。
【０２１９】
補正情報算出部５４は、光源推定部５２による光源の推定結果、ひいては、その光源の推定結果に基づいて陰影領域認識部５３で得られる陰影領域に基づき、必要に応じて、平均画像記憶部５７に記憶された平均画像を用いて、検出辞書記憶部２０に記憶された検出辞書としてのアンサンブル識別器H(x)のパラメータを補正する補正情報を算出し、補正情報記憶部５５に供給する。
【０２２０】
補正情報記憶部５５は、補正情報算出部５４からの補正情報を記憶する。
【０２２１】
補正部５６は、補正情報記憶部５５に記憶された補正情報を用い、必要に応じて、平均画像記憶部５７に記憶された平均画像を参照して、検出辞書記憶部２０に記憶された検出辞書としてのアンサンブル識別器H(x)のパラメータを補正し、補正後の検出辞書を、判別処理部１０に供給する。
【０２２２】
したがって、図１２では、判別処理部１０において、補正後の検出辞書、すなわち、パラメータが補正されたアンサンブル識別器H(x)を用いて、画像取得部５１から供給される入力画像に、対象物（人の顔）が映っているかどうかの対象物判別が行われる。
【０２２３】
平均画像記憶部５７は、複数のポジティブ画像、すなわち、例えば、アンサンブル学習に用いられた学習用画像に含まれるポジティブ画像（正解ラベルy_i=+1の画像）を平均化した平均画像を記憶している。
【０２２４】
なお、図１２の判別装置において、検出辞書記憶部２０に記憶された検出辞書としてのアンサンブル識別器H(x)のパラメータや、平均画像記憶部５７に記憶された平均画像は、判別装置を構成する各ブロックにおいて、必要に応じて参照することができる。
【０２２５】
図１３は、図１２の平均画像記憶部５７に記憶されている平均画像の例を示す図である。
【０２２６】
平均画像は、補正情報を用いたアンサンブル識別器H(x)のパラメータの補正（及び、補正情報の算出）に、必要に応じて用いられる。
【０２２７】
［本技術の原理］
【０２２８】
図１４は、本技術の原理を説明する図である。
【０２２９】
すなわち、図１４Ａは、入力画像から切り出されたウインドウ画像を示しており、図１４Ｂは、図１３に示した平均画像を示している。
【０２３０】
図１４Ａのウインドウ画像において、光源の影響によって、例えば、左半分が、右半分に比べて暗く、陰影領域になっている場合に、判別性能の低下を防止するには、ウインドウ画像判別処理（図７）の前に、図１４Ａのウインドウ画像の左半分の陰影領域（の画素値）だけを、右半分と同程度の輝度分布となるようにk倍する部分的フィルタ処理を行う必要がある。
【０２３１】
ところで、以上のような、左半分をk倍する部分的フィルタ処理後のウインドウ画像を対象として、アンサンブル識別器H(x)を用いて、ウインドウ画像判別処理を行うことは、ウインドウ画像の陰影領域に対応する、学習用画像の左半分だけを1/k倍した画像を用いて、アンサンブル学習を行うことにより得られるアンサンブル識別器H(x)を用いて、ウインドウ画像判別処理を行うことと等価である。
【０２３２】
すなわち、例えば、画素値をk=2倍にする部分的フィルタ処理を行った後のウインドウ画像を対象として、アンサンブル識別器H(x)を用いて、ウインドウ画像判別処理を行うことは、画素値を1/k=1/2倍にする部分的フィルタ処理を行った後の学習用画像を用いて、アンサンブル学習を行うことにより得られるアンサンブル識別器H(x)を用いて、ウインドウ画像判別処理を行うことと等価である。
【０２３３】
そこで、本技術では、学習用画像を用いて、アンサンブル学習を行うことにより得られたアンサンブル識別器（以下、基準識別器ともいう）のパラメータを、画素値を1/k倍にする部分的フィルタ処理を行った後の学習用画像を用いて、アンサンブル学習を行うことにより得られるアンサンブル識別器（以下、フィルタ処理後識別器ともいう）のパラメータに補正することにより、ウインドウ画像に部分的フィルタ処理を行うことなく、ウインドウ画像に部分的フィルタ処理を行う場合と同様の効果を得る。
【０２３４】
以上のように、本技術では、基準識別器のパラメータを、フィルタ処理後識別器のパラメータに補正するが、その補正は、平均画像を用いて、近似的に行われる。
【０２３５】
すなわち、本技術では、図１４Ｂに示すように、学習用画像の代わりに、その学習用画像を近似する、学習用画像に含まれるポジティブ画像を平均化した平均画像に、画素値を1/k倍にする部分的フィルタ処理を行い、その部分的フィルタ処理後の平均画像を必要に応じて用いて、基準識別器のパラメータが補正される。
【０２３６】
図１５は、基準識別器のパラメータの補正を説明する図である。
【０２３７】
すなわち、図１５は、ウインドウ画像の、例えば、右半分をk倍する部分的フィルタ処理を行う場合と同様の効果を得る基準識別器のパラメータの補正を説明する図である。
【０２３８】
例えば、いま、ウインドウ画像の、右半分が陰影領域になっており、その陰影領域を（≧1）k倍する部分的フィルタ処理を行うこととすると、学習用画像を近似する平均画像の右半分（陰影領域に対応する領域）を、1以下の正数であるk'=1/k倍する部分的フィルタ処理を行うことにより、ウインドウ画像の右半分をk倍する部分的フィルタ処理と同様の効果を得ることができる。
【０２３９】
ここで、陰影領域に対応する平均画像の右半分をk'=1/k倍する部分的フィルタ処理を行った平均画像において、ピクセル位置対である２つのピクセル位置P₁及びP₂が、いずれも、平均画像の左半分側のピクセル位置であるときには、右半分をk'=1/k倍する部分的フィルタ処理を行う前と後で、平均画像のピクセル位置P₁及びP₂の画素値p₁及びp₂は変わらない。
【０２４０】
したがって、ピクセル位置対である２つのピクセル位置P₁及びP₂が、いずれも、平均画像の左半分側のピクセル位置になっている弱識別器h_t(x)の引数xとなるピクセル間差分特徴量xは、右半分をk'=1/k倍する部分的フィルタ処理を行う前と後で、変わらない。
【０２４１】
弱識別器h_t(x)の演算（弱仮説h_t(x)の算出）は、図７で説明したように、弱識別器h_t(x)の閾値thと、その引数xとなっているピクセル間差分特徴量xとが、式x＞thを満たすかどうかによって行われるので、ピクセル間差分特徴量xが、右半分をk'=1/k倍する部分的フィルタ処理を行う前と後で変わらない場合には、アンサンブル識別器H(x)のパラメータである閾値thを補正する必要はない。
【０２４２】
一方、ピクセル位置対である２つのピクセル位置P₁及びP₂のうちの一方であるピクセル位置P₁が、平均画像の左半分側（陰影領域に対応する領域）のピクセル位置であるが、他方であるピクセル位置P₂が、右半分側（陰影領域に対応する領域でない領域）のピクセル位置であるときには、右半分をk'=1/k倍する部分的フィルタ処理を行う前と後で、ピクセル位置P₁の画素値は変わらないが、ピクセル位置P₂の画素値は変化する。
【０２４３】
すなわち、図１５Ａは、ピクセル位置対である２つのピクセル位置P₁及びP₂のうちの一方のピクセル位置P₁が、平均画像の左半分側のピクセル位置であり、他方のピクセル位置P₂が、右半分側のピクセル位置である場合の平均画像を示している。
【０２４４】
右半分をk'=1/k倍する部分的フィルタ処理を行う前の、ピクセル位置P₁の画素値をp₁と、ピクセル位置P₂の画素値をp₂と、それぞれ表すとともに、右半分をk'=1/k倍する部分的フィルタ処理を行った後の、ピクセル位置P₁の画素値をp₁'と、ピクセル位置P₂の画素値をp₂'と、それぞれ表すこととすると、右半分をk'=1/k倍する部分的フィルタ処理を行った後の、ピクセル位置P₁の画素値p₁'は、p₁のままであるが、ピクセル位置P₂の画素値p₂'は、k'p₂になる。
【０２４５】
したがって、ピクセル位置対である２つのピクセル位置P₁及びP₂のうちの一方のピクセル位置P₁が、平均画像の左半分側のピクセル位置であり、他方のピクセル位置P₂が、右半分側のピクセル位置になっている弱識別器h_t(x)の引数xとなるピクセル間差分特徴量xは、部分的フィルタ処理を行う前と後で、変化する。
【０２４６】
すなわち、部分的フィルタ処理を行う前では、ピクセル間差分特徴量xは、p₁-p₂であり、部分的フィルタ処理を行った後では、ピクセル間差分特徴量xは、p₁'-p₂'＝p₁-k'p₂となる。
【０２４７】
部分的フィルタ処理を行う前では、弱識別器h_t(x)の演算は、その弱識別器h_t(x)の閾値thと、ピクセル間差分特徴量x＝p₁-p₂とが、式x=p₁-p₂＞thを満たすかどうかによって行われる。
【０２４８】
一方、部分的フィルタ処理を行った後では、ピクセル間差分特徴量xは、p₁-k'p₂となるため、弱識別器h_t(x)の閾値thを、そのまま用いたのでは、部分的フィルタ処理を行う前と同様の、式p₁-p₂＞th（を満たすかどうか）の比較が行われない。
【０２４９】
ところで、式p₁-p₂＞thは、両辺に、(1-k')p₂を加算することにより、式p₁-k'p₂＞th＋(1-k')p₂に変形することができる。
【０２５０】
式p₁-k'p₂＞th＋(1-k')p₂において、左辺のp₁-k'p₂は、部分的フィルタ処理を行った後に求められるピクセル間差分特徴量x(=p₁-k'p₂)に等しい。
【０２５１】
そして、式p₁-k'p₂＞th＋(1-k')p₂の比較は、式p₁-p₂＞thの比較と等価であるから、th_new＝th＋(1-k')p₂を閾値として、式p₁-k'p₂＞th_newの比較を行うことにより、式p₁-p₂＞thの比較と等価な比較を行うことができる。
【０２５２】
したがって、部分的フィルタ処理を行った後で得られるピクセル間差分特徴量x＝p₁-k'p₂については、弱識別器h_t(x)の閾値thを、閾値th_new＝th＋(1-k')p₂に補正し、その補正後の閾値th_newを用いて、弱識別器h_t(x)の演算を行うことにより、部分的フィルタ処理を行う前に得られるピクセル間差分特徴量x＝p₁-p₂について行われる式p₁-p₂＞thの比較と等価な式p₁-k'p₂＞th_newの比較を行うことができる。
【０２５３】
なお、ピクセル位置対である２つのピクセル位置P₁及びP₂のうちの一方のピクセル位置P₁が、平均画像の右半分側（陰影領域に対応する領域）のピクセル位置であり、他方のピクセル位置P₂が、左半分側（陰影領域に対応する領域でない領域）のピクセル位置になっている弱識別器h_t(x)については、その弱識別器h_t(x)の閾値thを、閾値th_new＝th−(1-k')p₁に補正することで、式p₁-p₂＞thの比較と等価な式k'p₁-p₂＞th_newの比較を行うことができる。
【０２５４】
図１５Ｂは、ピクセル位置対である２つのピクセル位置P₁及びP₂のうちの両方のピクセル位置P₁及びP₂が、右半分側（陰影領域に対応する領域）のピクセル位置である場合の平均画像を示している。
【０２５５】
図１５Ａと同様に、右半分をk'=1/k倍する部分的フィルタ処理を行う前の、ピクセル位置P₁の画素値をp₁と、ピクセル位置P₂の画素値をp₂と、それぞれ表すとともに、右半分をk'=1/k倍する部分的フィルタ処理を行った後の、ピクセル位置P₁の画素値をp₁'と、ピクセル位置P₂の画素値をp₂'と、それぞれ表すこととすると、右半分をk'=1/k倍する部分的フィルタ処理を行った後の、ピクセル位置P₁の画素値p₁'は、k'p₁になり、ピクセル位置P₂の画素値p₂'は、k'p₂になる。
【０２５６】
したがって、ピクセル位置対である２つのピクセル位置P₁及びP₂のうちの両方が、右半分側のピクセル位置になっている弱識別器h_t(x)の引数xとなるピクセル間差分特徴量xは、部分的フィルタ処理を行う前と後で、変化する。
【０２５７】
すなわち、部分的フィルタ処理を行う前では、ピクセル間差分特徴量xは、p₁-p₂であり、部分的フィルタ処理を行った後では、ピクセル間差分特徴量xは、p₁'-p₂'＝k'p₁-k'p₂となる。
【０２５８】
部分的フィルタ処理を行う前では、弱識別器h_t(x)の演算は、その弱識別器h_t(x)の閾値thと、ピクセル間差分特徴量x＝p₁-p₂とが、式x=p₁-p₂＞thを満たすかどうかによって行われる。
【０２５９】
一方、部分的フィルタ処理を行った後では、ピクセル間差分特徴量xは、k'p₁-k'p₂となるため、弱識別器h_t(x)の閾値thを、そのまま用いたのでは、部分的フィルタ処理を行う前と同様の、式p₁-p₂＞th（を満たすかどうか）の比較が行われない。
【０２６０】
ところで、式p₁-p₂＞thは、両辺に、k'を乗算することにより、式k'p₁-k'p₂＞th×k'に変形することができる。
【０２６１】
式k'p₁-k'p₂＞th×k'において、左辺のk'p₁-k'p₂は、部分的フィルタ処理を行った後に求められるピクセル間差分特徴量x(=k'p₁-k'p₂)に等しい。
【０２６２】
そして、式k'p₁-k'p₂＞th×k'の比較は、式p₁-p₂＞thの比較と等価であるから、th_new＝th×k'を閾値として、式k'p₁-k'p₂＞th_newの比較を行うことにより、式p₁-p₂＞thの比較と等価な比較を行うことができる。
【０２６３】
したがって、部分的フィルタ処理を行った後で得られるピクセル間差分特徴量x＝k'p₁-k'p₂については、弱識別器h_t(x)の閾値thを、閾値th_new＝th×k'に補正し、その補正後の閾値th_newを用いて、弱識別器h_t(x)の演算を行うことにより、部分的フィルタ処理を行う前に得られるピクセル間差分特徴量x＝p₁-p₂について行われる式p₁-p₂＞thの比較と等価な式k'p₁-k'p₂＞th_newの比較を行うことができる。
【０２６４】
以上から、ウインドウ画像の一部が、陰影領域になっている場合は、弱識別器h_t(x)の引数xになっているピクセル間差分特徴量xを求めるためのピクセル位置対である２つのピクセル位置P₁及びP₂のうちの、少なくとも一方が、陰影領域内にあるときには、弱識別器h_t(x)の閾値thを、上述したように、閾値th_newに補正して弱識別器h_t(x)の演算を行うことで、ウインドウ画像の陰影領域（の画素値）をk倍する部分的フィルタ処理を行う場合と同様の効果を得ることができる。
【０２６５】
弱識別器h_t(x)の引数xになっているピクセル間差分特徴量xを求めるためのピクセル位置対である２つのピクセル位置P₁及びP₂、並びに、閾値thは、弱識別器h_t(x)のパラメータであるので、検出辞書記憶部２０（図１２）に記憶されている。
【０２６６】
また、平均画像は、平均画像記憶部５７に記憶されている。
【０２６７】
したがって、ウインドウ画像において、部分的フィルタ処理を行う（べき）陰影領域と、その陰影領域（の画素値）を、部分的フィルタ処理によって何倍にするかの倍率kとが決定されれば、アンサンブル識別器（基準識別器）H(x)を構成する弱識別器h_t(x)の中で、閾値thを補正する（補正すべき）弱識別器と、補正後の閾値th_newとを求めることができる。
【０２６８】
すなわち、陰影領域に基づき、ピクセル間差分特徴量xを求めるためのピクセル位置対である２つのピクセル位置P₁及びP₂のうちの、少なくとも一方が、陰影領域内にある弱識別器h_t(x)を、閾値thを補正すべき弱識別器h_t(x)として求めることができる。
【０２６９】
そして、上述したように、倍率kの逆数であるk'=1/kに基づき、ピクセル位置対である２つのピクセル位置P₁及びP₂のうちの一方だけが、陰影領域内にある弱識別器h_t(x)については、閾値thの補正後の閾値th_newは、式th_new＝th＋(1-k')p₂、又は、式th_new＝th−(1-k')p₁に従って求めることができ、ピクセル位置対である２つのピクセル位置P₁及びP₂の両方が、陰影領域内にある弱識別器h_t(x)については、閾値thの補正後の閾値th_newは、式th_new＝th×k'に従って求めることができる。
【０２７０】
ここで、ウインドウ画像の陰影領域を、部分的フィルタ処理によって何倍にするかの倍率kの逆数であるk'=1/kは、閾値thを、閾値th_newに補正するのに用いられる係数であるので、以下、補正係数ともいう。
【０２７１】
図１２の判別装置では、補正情報算出部５４において、補正係数k'が決定（算出）され、陰影領域認識部５３で得られる陰影領域とともに、補正情報として、補正情報記憶部５５に記憶される。
【０２７２】
そして、補正部５６において、補正情報記憶部５５に記憶された補正情報を用いて、検出辞書記憶部２０に記憶された検出辞書としてのアンサンブル識別器（基準識別器）が、フィルタ処理後識別器に補正される。
【０２７３】
すなわち、補正部５６では、検出辞書記憶部２０に記憶された検出辞書としてのアンサンブル識別器（基準識別器）を構成する各弱識別器h_t(x)の閾値thが、図１５で説明したように、閾値th_newに補正される。
【０２７４】
補正部５６は、各弱識別器h_t(x)の閾値thを閾値th_newに補正したアンサンブル識別器であるフィルタ処理後識別器（のパラメータ）を、判別処理部１０に供給する。判別処理部１０では、補正部５６からのフィルタ処理後識別器を用いて、画像取得部５１から供給される入力画像を対象とした対象物判別が行われる。
【０２７５】
なお、補正部５６では、画像取得部５１から判別処理部１０に入力画像が供給されるたびに、検出辞書記憶部２０からアンサンブル識別器（基準識別器）を読み出して、フィルタ処理後識別器に補正し、判別処理部１０に供給することができるが、入力画像の供給のたびに、検出辞書記憶部２０からアンサンブル識別器を読み出して補正するのでは、処理の高速化の妨げとなる。
【０２７６】
そこで、図１２の判別装置では、例えば、電源がオンにされた直後や補正情報記憶部５５に補正情報が記憶された直後に、初期化処理を行うことができる。
【０２７７】
初期化処理において、補正部５６が、検出辞書記憶部２０からアンサンブル識別器（基準識別器）を読み出して、フィルタ処理後識別器に補正し、判別処理部１０が、フィルタ処理後識別器（のパラメータ）を、図示せぬメモリに展開することで、以降は、判別処理部１０において、メモリに展開されたフィルタ処理後識別器を用いて、高速に、処理を行うことができる。
【０２７８】
［光源推定部５２の処理］
【０２７９】
図１６は、図１２の光源推定部５２が、キャリブレーション用画像から、そこに映っている対象物（人の顔）を照明する光源を推定する光源推定方法を説明する図である。
【０２８０】
すなわち、図１６は、光源が、ある方向（位置）にあると仮定した場合に、k'=1/k倍する部分的フィルタ処理を行う平均画像の領域、すなわち、入力画像から切り出されたウインドウ画像に生じる陰影領域に対応する、平均画像の領域（以下、フィルタ領域ともいう）を示している。
【０２８１】
図１６Ａは、光源が、（対象物の）右上方向にあると仮定した場合のフィルタ領域を示しており、矩形の平均画像の左上と右下とを結ぶ対角線を境界線とする、平均画像の左下側の領域と右上側の領域のうちの、左下側の領域が、フィルタ領域になっている。
【０２８２】
図１６Ｂは、光源が、左上方向にあると仮定した場合のフィルタ領域を示しており、矩形の平均画像の左下と右上とを結ぶ対角線を境界線とする、平均画像の左上側の領域と右下側の領域のうちの、右下側の領域が、フィルタ領域になっている。
【０２８３】
図１６Ｃは、光源が、右下方向にあると仮定した場合のフィルタ領域を示しており、矩形の平均画像の左下と右上とを結ぶ対角線を境界線とする、平均画像の左上側の領域と右下側の領域のうちの、左上側の領域が、フィルタ領域になっている。
【０２８４】
図１６Ｄは、光源が、左下方向にあると仮定した場合のフィルタ領域を示しており、矩形の平均画像の左上と右下とを結ぶ対角線を境界線とする、平均画像の左下側の領域と右上側の領域のうちの、右上側の領域が、フィルタ領域になっている。
【０２８５】
図１６Ｅは、光源が、下方向にあると仮定した場合のフィルタ領域を示しており、矩形の平均画像を上下に２等分する線を境界線とする、平均画像の上側の領域と下側の領域のうちの、上側の領域が、フィルタ領域になっている。
【０２８６】
図１６Ｆは、光源が、上方向にあると仮定した場合のフィルタ領域を示しており、矩形の平均画像を上下に２等分する線を境界線とする、平均画像の上側の領域と下側の領域のうちの、下側の領域が、フィルタ領域になっている。
【０２８７】
図１６Ｇは、光源が、右方向にあると仮定した場合のフィルタ領域を示しており、矩形の平均画像を左右に２等分する線を境界線とする、平均画像の左側の領域と右側の領域のうちの、左側の領域が、フィルタ領域になっている。
【０２８８】
図１６Ｈは、光源が、左方向にあると仮定した場合のフィルタ領域を示しており、矩形の平均画像を左右に２等分する線を境界線とする、平均画像の左側の領域と右側の領域のうちの、右側の領域が、フィルタ領域になっている。
【０２８９】
光源推定部５２は、図１６Ａないし図１６Ｈに示したように、複数としての、例えば、８つの方向（位置）それぞれにあると仮定した光源について、その光源によって生じる陰影領域に対応するフィルタ領域を想定し、図１５で説明したようにして、閾値thを閾値th_newに補正したフィルタ処理後識別器を求める。
【０２９０】
さらに、光源推定部５２は、各方向にあると仮定した光源について求められたフィルタ処理後識別器を用いて、画像取得部５１からのキャリブレーション用画像から対象物が映っている部分を切り出したウインドウ画像（以下、キャリブレーション用ウインドウ画像ともいう）を対象としたウインドウ画像判別処理（図７）を行う。
【０２９１】
なお、光源推定部５２において、フィルタ処理後識別器の算出（閾値thの、閾値th_newへの補正）、及び、そのフィルタ処理後識別器を用いたウインドウ画像判別処理は、補正係数k'=1/kを、1.0以下の、例えば、0.1から1.0の範囲で、0.1刻みで変えた複数の補正係数k'に対して行う。
【０２９２】
そして、光源推定部５２は、ウインドウ画像判別処理の結果、キャリブレーション用ウインドウ画像がポジティブ画像であると判別されたフィルタ処理後識別器を求めるのに仮定した光源の方向に、光源があると推定する。
【０２９３】
ここで、キャリブレーション用ウインドウ画像がポジティブ画像であると判別されたフィルタ処理後識別器が複数個ある場合には、例えば、対象物が存在することの尤もらしさを表すスコアとしての、例えば、ウインドウ画像判別処理で求められる評価値s（弱仮説h_t(x)の（信頼度α_tを重みとする）積算値Σ(α_t×h_t(x))）が最も高いフィルタ処理後識別器を求めるのに仮定した光源の方向に、光源があると推定することができる。
【０２９４】
図１７は、図１２の光源推定部５２が光源を推定する他の光源推定方法を説明する図である。
【０２９５】
図１７は、画像取得部５１から光源推定部５２に供給されるキャリブレーション用画像を示している。
【０２９６】
光源推定部５２は、図１７に示すように、例えば、キャリブレーション用画像の横と縦のそれぞれを、３等分することにより、キャリブレーション用画像を、複数である９個のブロックB#1,B#2,B#3,B#4,B#5,B#6,B#7,B#8,B#9に分割する。
【０２９７】
さらに、光源推定部５２は、例えば、入力画像の周辺側（画枠側）のブロックB#1ないしB#8それぞれのヒストグラムを求め、ブロックB#1ないしB#8の中で、例えば、最頻値（最大の度数）の輝度（画素値）が最大のブロックを、最も明るいブロックとして検出する。
【０２９８】
そして、光源推定部５２は、キャリブレーション用画像の中央（ブロック#9）から見て、最も明るいブロックがある方向に、光源があると推定する。
【０２９９】
すなわち、光源推定部５２では、最も明るいブロックがブロックB#1である場合には、左上方向に、最も明るいブロックがブロックB#2である場合には、上方向に、最も明るいブロックがブロックB#3である場合には、右上方向に、最も明るいブロックがブロックB#4である場合には、左方向に、最も明るいブロックがブロックB#5である場合には、右方向に、最も明るいブロックがブロックB#6である場合には、左下方向に、最も明るいブロックがブロックB#7である場合には、下方向に、最も明るいブロックがブロックB#8である場合には、右下方向に、それぞれ、光源があると推定される。
【０３００】
なお、光源推定部５２において光源を推定する光源推定方法は、図１６及び図１７で説明した方法に限定されるものではない。
【０３０１】
すなわち、画像から光源分布を推定する逆問題は、inverce lighting（又はrendering）と呼ばれ、主として、物体表面で観察される鏡面反射成分に基づくアプローチ、拡散反射成分に基づくアプローチ、及び、ある物体が他の物体に投げかける影（キャストシャドウ）を利用したアプローチの３つのアプローチがあるが、光源推定部５２での光源推定方法としては、このようなアプローチを採用することができる。
【０３０２】
また、光源推定部５２では、対象物が既知の物体である場合には、例えば、図１６で説明した光源推定方法で、光源の方向を推定した後に、対象物が既知の物体であることを利用して、光源の、より詳細な方向を推定することができる。
【０３０３】
光源推定部５２で採用する光源推定方法は、特に限定されるものではないが、対象物判別の判別性能の低下を防止する観点からは、光源の詳細な方向を推定することができることが望ましい。
【０３０４】
［陰影領域認識部５３の処理］
【０３０５】
図１８は、図１２の陰影領域認識部５３が、キャリブレーション用画像において、光源からの光によって陰影が生じる陰影境界を検出する境界検出方法を説明する図である。
【０３０６】
陰影領域認識部５３では、光源推定部５２による光源の推定結果に基づいて、キャリブレーション用画像のうちのキャリブレーション用ウインドウ画像上の陰影境界が検出される。
【０３０７】
すなわち、光源推定部５２において、例えば、図１７で説明したように、光源（の方向）が推定され、光源の推定結果が、光源が右上方向にあることを表している場合、陰影領域認識部５３は、図１８に示すように、矩形のキャリブレーション用ウインドウ画像の左上と右下とを結ぶ対角線を陰影境界として検出する。そして、陰影領域認識部５３は、その陰影境界によって分けられるキャリブレーション用ウインドウ画像の左下側の領域と右上側の領域のうちの、光源と逆側の左下側の領域を、陰影領域として認識する。
【０３０８】
同様に、光源の推定結果が、光源が左上方向にあることを表している場合、陰影領域認識部５３は、矩形のキャリブレーション用ウインドウ画像の左下と右上とを結ぶ対角線を陰影境界として検出する。そして、陰影領域認識部５３は、その陰影境界によって分けられるキャリブレーション用ウインドウ画像の左上側の領域と右下側の領域のうちの、光源と逆側の右下側の領域を、陰影領域として認識する。
【０３０９】
光源の推定結果が、右下方向にあることを表している場合、陰影領域認識部５３は、矩形のキャリブレーション用ウインドウ画像の左下と右上とを結ぶ対角線を陰影境界として検出する。そして、陰影領域認識部５３は、その陰影境界によって分けられるキャリブレーション用ウインドウ画像の左上側の領域と右下側の領域のうちの、光源と逆側の左上側の領域を、陰影領域として認識する。
【０３１０】
光源の推定結果が、左下方向にあることを表している場合、陰影領域認識部５３は、矩形のキャリブレーション用ウインドウ画像の左上と右下とを結ぶ対角線を陰影境界として検出する。そして、陰影領域認識部５３は、その陰影境界によって分けられるキャリブレーション用ウインドウ画像の左下側の領域と右上側の領域のうちの、光源と逆側の右上側の領域を、陰影領域として認識する。
【０３１１】
光源の推定結果が、下方向にあることを表している場合、陰影領域認識部５３は、矩形のキャリブレーション用ウインドウ画像を上下に２等分する線を陰影境界として検出する。そして、陰影領域認識部５３は、その陰影境界によって分けられるキャリブレーション用ウインドウ画像の上側の領域と下側の領域のうちの、光源と逆側の上側の領域を、陰影領域として認識する。
【０３１２】
光源の推定結果が、上方向にあることを表している場合、陰影領域認識部５３は、矩形のキャリブレーション用ウインドウ画像を上下に２等分する線を陰影境界として検出する。そして、陰影領域認識部５３は、その陰影境界によって分けられるキャリブレーション用ウインドウ画像の上側の領域と下側の領域のうちの、光源と逆側の下側の領域を、陰影領域として認識する。
【０３１３】
光源の推定結果が、左方向にあることを表している場合、陰影領域認識部５３は、矩形のキャリブレーション用ウインドウ画像を左右に２等分する線を陰影境界として検出する。そして、陰影領域認識部５３は、その陰影境界によって分けられるキャリブレーション用ウインドウ画像の左側の領域と右側の領域のうちの、光源と逆側の右側の領域を、陰影領域として認識する。
【０３１４】
光源の推定結果が、右方向にあることを表している場合、陰影領域認識部５３は、矩形のキャリブレーション用ウインドウ画像を左右に２等分する線を陰影境界として検出する。そして、陰影領域認識部５３は、その陰影境界によって分けられるキャリブレーション用ウインドウ画像の左側の領域と右側の領域のうちの、光源と逆側の左側の領域を、陰影領域として認識する。
【０３１５】
なお、陰影領域認識部５３において、陰影境界を検出する境界検出方法（及び、陰影領域を認識する認識方法）は、図１８で説明した方法に限定されるものではない。
【０３１６】
すなわち、例えば、光源推定部５２において、例えば、図１６で説明したように、光源（の方向）が推定される場合には、陰影領域認識部５３では、その光源の推定結果が表す方向に、光源があると仮定した場合の、図１６のフィルタ領域の境界が、陰影境界として検出されるとともに、そのフィルタ領域が、陰影領域として認識される。
【０３１７】
図１９は、他の境界検出方法を説明する図である。
【０３１８】
図１９Ａは、キャリブレーション用ウインドウ画像の画素値を、0又は1に２値化した２値化画像を用いて、陰影境界を検出する境界検出方法を説明する図である。
【０３１９】
図１９Ａでは、陰影領域認識部５３において、キャリブレーション用ウインドウ画像の画素値のヒストグラムが求められ、そのヒストグラムに基づき、例えば、画素値が0に２値化される画素の数と、画素値が1に２値化される画素の数とが、（ほぼ）同一の数になるように、２値化に用いる２値化用閾値が求められる。
【０３２０】
さらに、陰影領域認識部５３では、キャリブレーション用ウインドウ画像の画素値が、２値化用閾値を用いた閾値処理によって２値化され、２値化画像が求められる。
【０３２１】
そして、陰影領域認識部５３では、２値化画像を、画素値が1の画素が多い領域と、画素値が0の画素が多い領域とに分ける、例えば、光源の推定結果が表す光源の方向と直交する線形の境界線が、陰影境界として検出される。
【０３２２】
なお、この場合、２値化画像において、画素値が0の画素が多い領域を、陰影領域として認識することができる。
【０３２３】
図１９Ｂは、３次元モデルを用いて、陰影境界を検出する境界検出方法を説明する図である。
【０３２４】
光源推定部５２において、光源の推定結果として、光源と対象物との３次元的な位置関係を得ることができる場合には、陰影領域認識部５３において、キャリブレーション用ウインドウ画像に映る対象物の３次元モデルを用い、光源と対象物との３次元的な位置関係に基づき、光源による光が、対象物の３次元モデルを、どのように照明するかのシミュレーションを行うことができる。
【０３２５】
そして、陰影領域認識部５３では、そのシミュレーションの結果に基づいて、キャリブレーション用ウインドウ画像を、明るい領域と暗い領域とに分ける、線形又は非線形の境界である陰影境界が検出される。
【０３２６】
なお、この場合、キャリブレーション用ウインドウ画像の、暗い領域が、陰影領域として認識される。
【０３２７】
［補正情報算出部５４の処理］
【０３２８】
図２０は、図１２の補正情報算出部５４が補正係数k'を決定（算出）する方法を説明する図である。
【０３２９】
対象物判別の判別性能の低下を、より強固に防止する適切な補正係数k'は、光源の強さや、距離、方向等の環境条件により異なる。そこで、補正情報算出部５４は、例えば、以下のようにして、適切な補正係数k'を決定する。
【０３３０】
すなわち、補正情報算出部５４は、陰影領域認識部５３からの陰影領域に基づき、図１５で説明したように、ピクセル間差分特徴量xを求めるためのピクセル位置対である２つのピクセル位置P₁及びP₂のうちの、少なくとも一方が、陰影領域内にある弱識別器h_t(x)を、閾値thを補正すべき弱識別器（以下、補正対象弱識別器ともいう）h_t(x)として求める。
【０３３１】
また、補正情報算出部５４は、補正対象弱識別器h_t(x)の閾値thの補正を、例えば、0.1から1.0の範囲で、0.1刻みで変えた複数の補正係数k'の候補を用いて行い、複数の補正係数k'の候補それぞれについて、補正対象弱識別器h_t(x)の閾値thが補正されたアンサンブル識別器であるフィルタ処理後識別器を求める。
【０３３２】
さらに、補正情報算出部５４は、複数の補正係数k'の候補それぞれについて求められたフィルタ処理後識別器を用い、画像取得部５１から陰影領域認識部５３を経由して供給されるキャリブレーション用ウインドウ画像を対象としたウインドウ画像判別処理を行う。
【０３３３】
そして、補正情報算出部５４は、ウインドウ画像判別処理の結果、キャリブレーション用ウインドウ画像がポジティブ画像であると判別されたフィルタ処理後識別器を求めるのに用いられた補正係数k'の候補が、補正係数k'に決定される。
【０３３４】
ここで、キャリブレーション用ウインドウ画像がポジティブ画像であると判別されたフィルタ処理後識別器が２個以上ある場合には、その２個以上のフィルタ処理後識別器を求めるのに用いられた補正係数k'の候補の、例えば、中央値（メディアン）を、補正係数k'に決定することができる。
【０３３５】
図２０では、値が0.2,0.3,0.4,0.5,0.6の５個の補正係数k'の候補それぞれによって、補正対象弱識別器h_t(x)の閾値thの補正が行われたフィルタ処理後識別器を用いた場合に、キャリブレーション用ウインドウ画像がポジティブ画像であると判別されており、その５個の補正係数k'の候補のうちの中央値である0.4が、補正係数k'に決定されている。
【０３３６】
なお、キャリブレーション用ウインドウ画像がポジティブ画像であると判別されたフィルタ処理後識別器が２個以上ある場合には、その２個以上のフィルタ処理後識別器を求めるのに用いられた補正係数k'の候補の、中央値の他、例えば、対象物が存在することの尤もらしさを表すスコアとしての、ウインドウ画像判別処理で求められる評価値sが最も高いフィルタ処理後識別器を求めるのに用いられた補正係数k'の候補を、補正係数k'に決定することができる。
【０３３７】
［キャリブレーション用画像の取得方法］
【０３３８】
図２１は、図１２の画像取得部５１において、キャリブレーション用画像を取得する取得方法を説明する図である。
【０３３９】
画像取得部５１は、図２１に示すように、カメラで撮影した画像を、対象物としての人の顔が表示されるべき顔枠とともに、TV（テレビジョン受像機）等の表示装置に表示することで、例えば、所定の時間の間、顔枠内に、顔を表示させることを、ユーザに促す。
【０３４０】
そして、画像取得部５１では、顔枠内に、顔が表示されているときに、カメラで撮影した画像が、キャリブレーション用画像として取得される。なお、キャリブレーション用画像のうちの、例えば、顔枠内の画像が、キャリブレーション用ウインドウ画像として使用される。
【０３４１】
以上のように、画像取得部５１において、顔枠内に、顔を表示させることを、ユーザに促し、顔枠内に、顔が表示されている画像を、キャリブレーション用画像として取得することにより、適切な補正係数k'を決定することができる。
【０３４２】
ここで、図１２の判別装置は、例えば、人の有無に応じて、動作モードを通常モード又は省電力モードに切り替える機能を有するTVやPC(Personal Computer)、カメラで撮影した画像上の人の位置に応じて、各種の処理を行うゲーム機等に適用することができる。
【０３４３】
図１２の判別装置を適用したTVでは、キャリブレーション用画像の取得は、例えば、チャンネルスキャン等を行う初期設定時に行うことができる。また、図１２の判別装置を適用したゲーム機やPCでは、キャリブレーション用画像の取得は、例えば、ゲームやPCの初期設定時に行うことができる。
【０３４４】
［キャリブレーション処理］
【０３４５】
図２２は、図１２の判別装置が行う、検出辞書記憶部２０に記憶された検出辞書としてのアンサンブル識別器H(x)のキャリブレーションの処理であるキャリブレーション処理を説明するフローチャートである。
【０３４６】
ステップＳ１０１において、画像取得部５１は、例えば、図２１で説明したように、キャリブレーション用画像（キャリブレーション用の入力画像）であるポジティブ画像を取得し、光源推定部５２、及び、陰影領域認識部５３に供給して、処理は、ステップＳ１０２に進む。
【０３４７】
ステップＳ１０２では、光源推定部５２は、画像取得部５１からのキャリブレーション用画像から、そこに映っている対象物（人の顔）を照明する光源を推定し、その推定結果を、陰影領域認識部５３に供給して、処理は、ステップＳ１０３に進む。
【０３４８】
ステップＳ１０３では、陰影領域認識部５３は、画像取得部５１からのキャリブレーション用画像（を、必要に応じてスケーリングしたスケーリング画像）から、図２１の顔枠の部分を、対象物（人の顔）が映っているウインドウ画像であるキャリブレーション用ウインドウ画像として切り出し、処理は、ステップＳ１０４に進む。
【０３４９】
ステップＳ１０４では、陰影領域認識部５３は、例えば、光源推定部５２からの光源の推定結果に基づいて、キャリブレーション用ウインドウ画像において、光源からの光によって陰影が生じる陰影境界を検出する。
【０３５０】
さらに、陰影領域認識部５３は、キャリブレーション用ウインドウ画像の、陰影境界によって分けられる２つの領域のうちの、光源推定部５２からの光源の推定結果から得られる光源の位置（方向）と逆側の領域を、光源によって陰影が生じる陰影領域として認識し、補正情報算出部５４に供給して、処理は、ステップＳ１０５に進む。
【０３５１】
ステップＳ１０５では、補正情報算出部５４は、陰影領域認識部５３からの陰影領域に基づき、必要に応じて、平均画像記憶部５７に記憶された平均画像を用いて、検出辞書記憶部２０に記憶された検出辞書としてのアンサンブル識別器H(x)のパラメータとしての弱識別器h_t(x)の閾値thを閾値th_newに補正するための補正係数k'=1/kを決定する補正係数決定処理を行って、処理は、ステップＳ１０６に進む。
【０３５２】
ステップＳ１０６では、補正情報算出部５４は、補正係数決定処理において得られた補正係数k'を、陰影領域認識部５３からの陰影領域とともに、補正情報として、補正情報記憶部５５に出力して記憶させ、キャリブレーション処理は、終了する。
【０３５３】
図２３は、図２２のステップＳ１０５において補正情報算出部５４（図１２）が行う補正係数決定処理を説明するフローチャートである。
【０３５４】
ステップＳ１１１において、補正情報算出部５４は、補正係数の候補である候補係数を表す変数k'に、初期値としての、例えば、0.1をセットし、処理は、ステップＳ１１２に進む。
【０３５５】
ステップＳ１１２では、補正情報算出部５４は、陰影領域認識部５３からの陰影領域に基づき、図１５で説明したように、ピクセル間差分特徴量xを求めるためのピクセル位置対である２つのピクセル位置P₁及びP₂のうちの、少なくとも一方が、陰影領域内にある弱識別器h_t(x)を、閾値thを補正すべき弱識別器（補正対象弱識別器）h_t(x)として求める。
【０３５６】
さらに、ステップＳ１１２では、補正情報算出部５４は、図１５で説明したように、補正対象弱識別器h_t(x)の閾値thの補正を、候補係数k'を補正係数として用いるとともに、平均画像記憶部５７に記憶された平均画像を、必要に応じて用いて行い、閾値thが閾値（補正閾値）th_newに補正されたアンサンブル識別器であるフィルタ処理後識別器を求めて、処理は、ステップＳ１１３に進む。
【０３５７】
ステップＳ１１３では、補正情報算出部５４は、直前のステップＳ１１２で求められたフィルタ処理後識別器を用い、陰影領域認識部５３において図２２のステップＳ１０３で求められたキャリブレーション用ウインドウ画像を対象としたウインドウ画像判別処理（図７）を行って、処理は、ステップＳ１１４に進む。
【０３５８】
ステップＳ１１４では、補正情報算出部５４は、候補係数k'が1.0に等しいかどうかを判定する。
【０３５９】
ステップＳ１１４において、候補係数k'が1.0に等しくない判定された場合、すなわち、候補係数k'が、まだ1.0未満である場合、処理は、ステップＳ１１５に進み、補正情報算出部５４は、候補係数k'を、所定の値としての、例えば、0.1だけインクリメントする。
【０３６０】
そして、処理は、ステップＳ１１５からステップＳ１１２に戻り、以下、同様の処理が繰り返される。
【０３６１】
また、ステップＳ１１４において、候補係数k'が1.0に等しい判定された場合、すなわち、補正対象弱識別器h_t(x)の閾値thの補正が、0.1から1.0の範囲で、0.1刻みで変えた複数の候補係数k'を用いて行われ、その複数の候補係数k'それぞれについて、補正対象弱識別器h_t(x)の閾値thが補正されたアンサンブル識別器であるフィルタ処理後識別器を用いて、ウインドウ画像判別処理が行われた場合、処理は、ステップＳ１１６に進み、補正情報算出部５４は、ウインドウ画像判別処理の結果、キャリブレーション用ウインドウ画像がポジティブ画像であると判別された１個以上のフィルタ処理後識別器を求めるのに用いられた１個以上の候補係数k'のうちの例えば、中央値を、補正係数k'に決定し、処理はリターンする。
【０３６２】
［判別処理］
【０３６３】
図２４は、図１２の判別装置が行う判別処理を説明するフローチャートである。
【０３６４】
ステップＳ１３０において、補正部５６は、補正情報記憶部５５に記憶された補正情報を読み出し、その補正情報のうちの陰影領域に基づき、図１５で説明したように、ピクセル間差分特徴量xを求めるためのピクセル位置対である２つのピクセル位置P₁及びP₂のうちの、少なくとも一方が、陰影領域内にある弱識別器h_t(x)を、閾値thを補正すべき弱識別器（補正対象弱識別器）h_t(x)として求める。
【０３６５】
さらに、ステップＳ１３０では、補正部５６は、図１５で説明したように、補正対象弱識別器h_t(x)の閾値thの補正を、補正情報のうちの補正係数k'を用いるとともに、平均画像記憶部５７に記憶された平均画像を、必要に応じて用いて行い、閾値thが閾値（補正閾値）th_newに補正されたアンサンブル識別器であるフィルタ処理後識別器を求めて、判別処理部１０の判別部１３（図１）に供給する。
【０３６６】
その後、処理は、ステップＳ１３０からステップＳ１３１に進み、以下、ステップＳ１３１ないしＳ１４３では、図６のステップＳ５１ないしＳ６３とそれぞれ同様の処理が行われる。
【０３６７】
但し、図６のステップＳ５４に対応する図２４のステップＳ１３４のウインドウ画像判別処理では、検出辞書記憶部２０に記憶された検出辞書としてのアンサンブル識別器（基準識別器）に代えて、補正部５６から判別処理部１０（の判別部１３）に供給されたフィルタ処理後識別器が用いられる。
【０３６８】
したがって、図１２の判別装置では、補正部５６において、対象物を照明する光源に基づいて算出される補正情報を用いて、アンサンブル識別器のパラメータが補正され、判別処理部１０において、パラメータの補正後のアンサンブル識別器（フィルタ処理後識別器）を用いて、ピクセル間差分特徴量に対して、弱識別器が出力する弱仮説が積算され、その弱仮説の積算値に基づいて、入力画像に、対象物が映っているか否かが判別されるので、入力画像に、所定の対象物が映っているか否かの判別の判別性能の低下を、容易に防止することができる。
【０３６９】
すなわち、入力画像が、例えば、図８Ｂに示したような、人の顔の右側が明るく、左側に陰影が生じている偏り陰影画像である場合には、入力画像から切り出されたウインドウ画像において陰影が生じている左側の部分にだけ、画素値pをk（＞1）倍する輝度変換フィルタを、部分的にかけることで、判別性能の低下を防止することができる。
【０３７０】
しかしながら、図１１で説明したように、ウインドウ画像に対して、輝度変換フィルタを、部分的にかける場合には、入力画像がスケーリングされ、そのスケーリング後のスケーリング画像から、ウインドウ画像が切り出された後、ウインドウ画像判別処理（図７）が行われる前に、ウインドウ画像に対して、輝度変換フィルタを部分的にかける部分的フィルタ処理を行う必要がある。
【０３７１】
したがって、１枚の入力画像について、その入力画像から生成されるすべてのスケーリング画像から切り出されるすべてのウインドウ画像に、部分的フィルタ処理を行う必要があり、判別処理で行う必要がある部分的フィルタ処理の処理コストが膨大になる。
【０３７２】
これに対して、図１２の判別装置では、検出辞書記憶部２０に記憶されたアンサンブル識別器（基準識別器）H(x)のパラメータとしての弱識別器h_t(x)の閾値thを補正することで、入力画像について、その入力画像から生成されるすべてのスケーリング画像から切り出されるすべてのウインドウ画像に、部分的フィルタ処理を施す場合と同様の効果を得ることができるので、判別処理において増加する処理コストは、図２４のステップＳ１３で、フィルタ処理後識別器を求める分だけとなる。
【０３７３】
したがって、判別性能の低下を、容易に、すなわち、処理コストをほとんど増加させることなく、防止することができ、光源の環境に対してロバストな（頑強な）対象物判別を行うことができる。
【０３７４】
また、図１２の判別装置が判別処理（図２４）に要する処理時間は、図１の判別装置が判別処理（図６）に要する処理時間とほとんど変わらない。
【０３７５】
なお、本実施の形態では、平均画像に、画素値を一定値であるk'=1/k倍に増幅する輝度変換フィルタを部分的にかける部分的フィルタ処理を行うことに相当する、弱識別器h_t(x)の閾値thの補正を行うこととしたが、その他、例えば、画素の位置に応じて異なる倍率k'に増幅する輝度変換フィルタを、平均画像全体にかける全体フィルタ処理を行うことに相当する、弱識別器h_t(x)の閾値thの補正を行うことができる。
【０３７６】
図２５は、画素の位置に応じて異なる倍率k'に増幅する輝度変換フィルタと、その輝度変換フィルタがかけられた平均画像とを示す図である。
【０３７７】
図２５において、輝度変換フィルタは、画素の位置が、左端から右端に向かうにつれて、倍率k'=1/kが、1.0から0.0（0に近い微小値）に線形に変化する、いわば、倍率k'にグラディエントがついたフィルタになっている。
【０３７８】
画素の位置が、左端から右端に向かうにつれて線形に増加する倍率kに増幅する輝度変換フィルタを、ウインドウ画像全体にかけることによって、ウインドウ画像が適切照明画像に変換される場合に、図２５に示した、倍率k'にグラディエントがついた輝度変換フィルタを平均画像全体にかける全体フィルタ処理を行うことに相当する、弱識別器h_t(x)の閾値thの補正を行うことにより、光源に起因する、対象物判別の判別性能の低下を防止することができる。
【０３７９】
なお、フィルタ処理後識別器を求めて、対象物判別を行う図２４の判別処理は、静止画の入力画像を対象として行う場合は勿論、動画を対象として行うこともできる。光源の環境がほとんど変化しなければ、動画を対象とした図２４の判別処理によれば、ウインドウ画像に対して、輝度変換フィルタを部分的にかけながら、図６の判別処理を行う場合に比較して、高速に、判別性能が光源に影響しない対象物判別を行うことができる。
【０３８０】
ここで、図１２の判別装置を、例えば、据え置き型のゲーム機や、TV，PC等の、使用される位置が、ほぼ固定されている装置に適用する場合には、キャリブレーション処理（図２２）を、異なる複数の時刻に実行し、補正情報記憶部５５（図１２）では、キャリブレーション処理が行われた時刻と、そのキャリブレーション処理によって求められた補正情報とを対応付けて記憶しておくことができる。
【０３８１】
この場合、判別処理（図２４）での弱識別器h_t(x)の閾値thの補正（図２４のステップＳ１３０）は、補正情報記憶部５５に記憶された補正情報のうちの、例えば、現在時刻（判別処理が行われる時刻）に最も近い時刻に対応付けられている補正情報を用いて行うことができる。
【０３８２】
以上のように、現在時刻に最も近い時刻に対応付けられている補正情報を用いて、弱識別器h_t(x)の閾値thの補正を行うことにより、例えば、時間帯によって、光源の環境が変化する場合であっても、判別性能の低下を防止することができる。
【０３８３】
その他、補正情報記憶部５５（図１２）では、キャリブレーション処理が行われたときの光源の推定結果を表す推定情報と、そのキャリブレーション処理によって求められた補正情報とを対応付けて記憶しておくことができる。
【０３８４】
そして、補正情報記憶部５５に、推定情報と補正情報とのセットが、複数セット記憶されている場合には、判別処理（図２４）を行うときに、光源推定部５２で光源の推定を行い、その推定結果に最も近い推定情報に対応付けられている補正情報を用いて、弱識別器h_t(x)の閾値thの補正を行うことができる。
【０３８５】
なお、本実施の形態では、光源推定部５２（図１２）での光源の推定にあたって、光源が、ある一方向のみ存在することを暗黙の前提としたが、その他、光源については、光源が、複数の方向のそれぞれに存在することがあり得ることを考慮して、詳細な光源の推定が可能な光源推定方法によって推定を行い、そのような光源の推定結果に基づいて、補正情報を求めることができる。
【０３８６】
また、弱識別器h_t(x)の閾値thの補正は、判別処理（図２４）において、ウインドウ画像判別処理（図７）の対象となる、入力画像から切り出されるウインドウ画像の位置に応じて、異なる補正情報を用いて行うことが可能である。
【０３８７】
すなわち、キャリブレーション処理では、図２１で説明した顔枠を、複数の位置としての、キャリブレーション用画像としての入力画像の、例えば、図１７に示したブロックB#1ないしB#9それぞれの中央に相当する位置に順次表示し、そのブロックB#1ないしB#9それぞれについて、ブロックの中央に相当する位置の顔枠に表示された顔が映っているキャリブレーション用ウインドウ画像を用いて、補正情報を求めて、補正情報記憶部５５に記憶しておくことができる。
【０３８８】
そして、判別処理（図２４）では、補正情報記憶部５５に記憶された、ブロックB#1ないしB#9それぞれについての補正情報を用いて、弱識別器h_t(x)の閾値thを補正閾値th_newに補正し、ブロックB#1ないしB#9それぞれについての補正閾値th_newのうちの、例えば、ウインドウ画像が占める領域が最大のブロックについての補正閾値th_newを用いて、ウインドウ画像判別処理（図７）を行うことができる。
【０３８９】
［本技術を適用したコンピュータの説明］
【０３９０】
次に、上述した一連の処理は、ハードウェアにより行うこともできるし、ソフトウェアにより行うこともできる。一連の処理をソフトウェアによって行う場合には、そのソフトウェアを構成するプログラムが、汎用のコンピュータ等にインストールされる。
【０３９１】
そこで、図２６は、上述した一連の処理を実行するプログラムがインストールされるコンピュータの一実施の形態の構成例を示している。
【０３９２】
プログラムは、コンピュータに内蔵されている記録媒体としてのハードディスク１０５やROM１０３に予め記録しておくことができる。
【０３９３】
あるいはまた、プログラムは、リムーバブル記録媒体１１１に格納（記録）しておくことができる。このようなリムーバブル記録媒体１１１は、いわゆるパッケージソフトウエアとして提供することができる。ここで、リムーバブル記録媒体１１１としては、例えば、フレキシブルディスク、CD-ROM(Compact Disc Read Only Memory)，MO(Magneto Optical)ディスク，DVD(Digital Versatile Disc)、磁気ディスク、半導体メモリ等がある。
【０３９４】
なお、プログラムは、上述したようなリムーバブル記録媒体１１１からコンピュータにインストールする他、通信網や放送網を介して、コンピュータにダウンロードし、内蔵するハードディスク１０５にインストールすることができる。すなわち、プログラムは、例えば、ダウンロードサイトから、ディジタル衛星放送用の人工衛星を介して、コンピュータに無線で転送したり、LAN(Local Area Network)、インターネットといったネットワークを介して、コンピュータに有線で転送することができる。
【０３９５】
コンピュータは、CPU(Central Processing Unit)１０２を内蔵しており、CPU１０２には、バス１０１を介して、入出力インタフェース１１０が接続されている。
【０３９６】
CPU１０２は、入出力インタフェース１１０を介して、ユーザによって、入力部１０７が操作等されることにより指令が入力されると、それに従って、ROM(Read Only Memory)１０３に格納されているプログラムを実行する。あるいは、CPU１０２は、ハードディスク１０５に格納されたプログラムを、RAM(Random Access Memory)１０４にロードして実行する。
【０３９７】
これにより、CPU１０２は、上述したフローチャートにしたがった処理、あるいは上述したブロック図の構成により行われる処理を行う。そして、CPU１０２は、その処理結果を、必要に応じて、例えば、入出力インタフェース１１０を介して、出力部１０６から出力、あるいは、通信部１０８から送信、さらには、ハードディスク１０５に記録等させる。
【０３９８】
なお、入力部１０７は、キーボードや、マウス、マイク等で構成される。また、出力部１０６は、LCD(Liquid Crystal Display)やスピーカ等で構成される。
【０３９９】
ここで、本明細書において、コンピュータがプログラムに従って行う処理は、必ずしもフローチャートとして記載された順序に沿って時系列に行われる必要はない。すなわち、コンピュータがプログラムに従って行う処理は、並列的あるいは個別に実行される処理（例えば、並列処理あるいはオブジェクトによる処理）も含む。
【０４００】
また、プログラムは、１のコンピュータ（プロセッサ）により処理されるものであっても良いし、複数のコンピュータによって分散処理されるものであっても良い。さらに、プログラムは、遠方のコンピュータに転送されて実行されるものであっても良い。
【０４０１】
なお、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。
【０４０２】
すなわち、例えば、本実施の形態では、人の顔を、対象物判別の対象物としたが、本技術は、人の顔以外を対象物とする対象物判別にも適用可能である。
【０４０３】
また、画像の特徴量は、ピクセル間差分特徴量に限定されるものではない。
【０４０４】
なお、本技術は、以下のような構成もとることができる。
【０４０５】
［１］
入力画像から抽出された特徴量を入力として、前記入力画像に所定の対象物が映っているか否かを表す弱仮説を出力する複数の弱識別器を有するアンサンブル識別器のパラメータを補正するための補正情報であり、前記対象物を照明する光源に基づいて算出される前記補正情報を用いて、前記アンサンブル識別器のパラメータを補正する補正部と、
前記パラメータの補正後のアンサンブル識別器を用い、前記特徴量に対して、前記弱識別器が出力する弱仮説を積算し、前記弱仮説の積算値に基づいて、前記入力画像に、前記対象物が映っているか否かを判別する判別部と
を備える情報処理装置。
［２］
前記補正情報を算出する補正情報算出部をさらに備える
［１］に記載の情報処理装置。
［３］
前記特徴量は、前記入力画像の２つの位置のピクセルどうしの差分であるピクセル間差分特徴量である
［１］又は［２］に記載の情報処理装置。
［４］
前記アンサンブル識別器を求めるアンサンブル学習では、前記アンサンブル識別器を構成する各弱識別器について、前記特徴量を求めるのに用いられる２つのピクセルの位置であるピクセル位置対、及び、前記弱識別器が前記特徴量と比較する閾値として、前記弱識別器の誤り率を最小にするピクセル位置対、及び、閾値が、前記アンサンブル識別器のパラメータとして求められ、
前記補正部は、前記閾値を補正する
［３］に記載の情報処理装置。
［５］
前記入力画像から、前記対象物を照明する光源を推定する光源推定部と、
前記光源の推定結果に基づいて、前記入力画像において、前記光源によって陰影が生じる陰影領域を認識する陰影領域認識部と
をさらに備え、
前記補正情報算出部は、前記アンサンブル識別器を構成する複数の弱識別器の中で、前記ピクセル間差分特徴量を求めるのに用いるピクセル位置対のうちの、少なくとも一方のピクセルの位置が、前記陰影領域内にある弱識別器の前記閾値を補正する補正係数を求め、前記補正係数と前記陰影領域とを、前記補正情報として出力する
［４］に記載の情報処理装置。
［６］
前記補正部は、前記アンサンブル識別器を構成する複数の弱識別器の中で、前記ピクセル間差分特徴量を求めるのに用いるピクセル位置対のうちの、少なくとも一方のピクセルの位置が、前記陰影領域内にある弱識別器の前記閾値を、前記補正係数によって補正する
［５］に記載の情報処理装置。
［７］
前記アンサンブル学習は、複数の学習用画像を用いて行われ、
前記複数の学習用画像は、前記対象物が映っているポジティブ画像と、前記対象物が映っていないネガティブ画像とを含み、
前記補正部は、前記ピクセル間差分特徴量を求めるのに用いるピクセル位置対のうちの、一方のピクセルの位置が、前記陰影領域内にあり、他方のピクセルの位置が前記陰影領域外にある弱識別器の前記閾値を、1から1以下の正数である補正係数を減算した減算値と、前記学習用画像に含まれる複数のポジティブ画像を平均化した平均画像の前記一方のピクセルの位置の画素値との乗算値だけ補正する
［６］に記載の情報処理装置。
［８］
前記補正部は、前記ピクセル間差分特徴量を求めるのに用いるピクセル位置対の２つのピクセルの位置が、前記陰影領域内にある弱識別器の前記閾値を、1以下の正数である補正係数倍に補正する
［６］又は［７］に記載の情報処理装置。
［９］
入力画像から抽出された特徴量を入力として、前記入力画像に所定の対象物が映っているか否かを表す弱仮説を出力する複数の弱識別器を有するアンサンブル識別器のパラメータを補正するための補正情報であり、前記対象物を照明する光源に基づいて算出される前記補正情報を用いて、前記アンサンブル識別器のパラメータを補正し、
前記パラメータの補正後のアンサンブル識別器を用い、前記特徴量に対して、前記弱識別器が出力する弱仮説を積算し、前記弱仮説の積算値に基づいて、前記入力画像に、前記対象物が映っているか否かを判別する
ステップを含む情報処理方法。
［１０］
入力画像から抽出された特徴量を入力として、前記入力画像に所定の対象物が映っているか否かを表す弱仮説を出力する複数の弱識別器を有するアンサンブル識別器のパラメータを補正するための補正情報であり、前記対象物を照明する光源に基づいて算出される前記補正情報を用いて、前記アンサンブル識別器のパラメータを補正する補正部と、
前記パラメータの補正後のアンサンブル識別器を用い、前記特徴量に対して、前記弱識別器が出力する弱仮説を積算し、前記弱仮説の積算値に基づいて、前記入力画像に、前記対象物が映っているか否かを判別する判別部と
して、コンピュータを機能させるためのプログラム。
【符号の説明】
【０４０６】
１０判別処理部，１１スケーリング部，１２走査部，１３判別部，２０検出辞書記憶部，３１学習用画像記憶部，３２特徴量抽出部，３３学習部，５１画像取得部，５２光源推定部，５３陰影領域認識部，５４補正情報算出部，５５補正情報記憶部，５６補正部，５７平均画像記憶部，１０１バス，１０２ CPU，１０３ ROM，１０４ RAM，１０５ハードディスク，１０６出力部，１０７入力部，１０８通信部，１０９ドライブ，１１０入出力インタフェース，１１１リムーバブル記録媒体

【特許請求の範囲】
【請求項１】
入力画像から抽出された特徴量を入力として、前記入力画像に所定の対象物が映っているか否かを表す弱仮説を出力する複数の弱識別器を有するアンサンブル識別器のパラメータを補正するための補正情報であり、前記対象物を照明する光源に基づいて算出される前記補正情報を用いて、前記アンサンブル識別器のパラメータを補正する補正部と、
前記パラメータの補正後のアンサンブル識別器を用い、前記特徴量に対して、前記弱識別器が出力する弱仮説を積算し、前記弱仮説の積算値に基づいて、前記入力画像に、前記対象物が映っているか否かを判別する判別部と
を備える情報処理装置。
【請求項２】
前記補正情報を算出する補正情報算出部をさらに備える
請求項１に記載の情報処理装置。
【請求項３】
前記特徴量は、前記入力画像の２つの位置のピクセルどうしの差分であるピクセル間差分特徴量である
請求項１に記載の情報処理装置。
【請求項４】
前記アンサンブル識別器を求めるアンサンブル学習では、前記アンサンブル識別器を構成する各弱識別器について、前記特徴量を求めるのに用いられる２つのピクセルの位置であるピクセル位置対、及び、前記弱識別器が前記特徴量と比較する閾値として、前記弱識別器の誤り率を最小にするピクセル位置対、及び、閾値が、前記アンサンブル識別器のパラメータとして求められ、
前記補正部は、前記閾値を補正する
請求項３に記載の情報処理装置。
【請求項５】
前記入力画像から、前記対象物を照明する光源を推定する光源推定部と、
前記光源の推定結果に基づいて、前記入力画像において、前記光源によって陰影が生じる陰影領域を認識する陰影領域認識部と
をさらに備え、
前記補正情報算出部は、前記アンサンブル識別器を構成する複数の弱識別器の中で、前記ピクセル間差分特徴量を求めるのに用いるピクセル位置対のうちの、少なくとも一方のピクセルの位置が、前記陰影領域内にある弱識別器の前記閾値を補正する補正係数を求め、前記補正係数と前記陰影領域とを、前記補正情報として出力する
請求項４に記載の情報処理装置。
【請求項６】
前記補正部は、前記アンサンブル識別器を構成する複数の弱識別器の中で、前記ピクセル間差分特徴量を求めるのに用いるピクセル位置対のうちの、少なくとも一方のピクセルの位置が、前記陰影領域内にある弱識別器の前記閾値を、前記補正係数によって補正する
請求項５に記載の情報処理装置。
【請求項７】
前記アンサンブル学習は、複数の学習用画像を用いて行われ、
前記複数の学習用画像は、前記対象物が映っているポジティブ画像と、前記対象物が映っていないネガティブ画像とを含み、
前記補正部は、前記ピクセル間差分特徴量を求めるのに用いるピクセル位置対のうちの、一方のピクセルの位置が、前記陰影領域内にあり、他方のピクセルの位置が前記陰影領域外にある弱識別器の前記閾値を、1から1以下の正数である補正係数を減算した減算値と、前記学習用画像に含まれる複数のポジティブ画像を平均化した平均画像の前記一方のピクセルの位置の画素値との乗算値だけ補正する
請求項６に記載の情報処理装置。
【請求項８】
前記補正部は、前記ピクセル間差分特徴量を求めるのに用いるピクセル位置対の２つのピクセルの位置が、前記陰影領域内にある弱識別器の前記閾値を、1以下の正数である補正係数倍に補正する
請求項７に記載の情報処理装置。
【請求項９】
入力画像から抽出された特徴量を入力として、前記入力画像に所定の対象物が映っているか否かを表す弱仮説を出力する複数の弱識別器を有するアンサンブル識別器のパラメータを補正するための補正情報であり、前記対象物を照明する光源に基づいて算出される前記補正情報を用いて、前記アンサンブル識別器のパラメータを補正し、
前記パラメータの補正後のアンサンブル識別器を用い、前記特徴量に対して、前記弱識別器が出力する弱仮説を積算し、前記弱仮説の積算値に基づいて、前記入力画像に、前記対象物が映っているか否かを判別する
ステップを含む情報処理方法。
【請求項１０】
入力画像から抽出された特徴量を入力として、前記入力画像に所定の対象物が映っているか否かを表す弱仮説を出力する複数の弱識別器を有するアンサンブル識別器のパラメータを補正するための補正情報であり、前記対象物を照明する光源に基づいて算出される前記補正情報を用いて、前記アンサンブル識別器のパラメータを補正する補正部と、
前記パラメータの補正後のアンサンブル識別器を用い、前記特徴量に対して、前記弱識別器が出力する弱仮説を積算し、前記弱仮説の積算値に基づいて、前記入力画像に、前記対象物が映っているか否かを判別する判別部と
して、コンピュータを機能させるためのプログラム。

【図１】