学習装置および方法、認識装置および方法、並びにプログラム

【課題】処理速度、制度を向上させた画像認識を行う。
【解決手段】多重解像度画像生成部２２は、入力された画像から、複数の解像度（スケール係数）が異なる画像を生成する。スケール係数の異なる画像に対して、フィルタ処理が施される。フィルタは、例えば、ガウス幅σ＝１のガウス関数のフィルタである。複数の画像に対してフィルタ処理を施すが、ガウス幅の異なる複数のフィルタを用いて処理を行うのではないために、処理の低減をはかることができる。本発明は、画像から対象物を認識する認識装置や認識装置のための学習を行う学習装置に適用できる。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は学習装置および方法、認識装置および方法、並びにプログラムに関し、特に、画像から、より確実に対象物体を検出できるようにした学習装置および方法、認識装置および方法、並びにプログラムに関する。
【背景技術】
【０００２】
従来、画像から人を検出する技術は、主にセキュリティや車載用途のために研究開発されてきた（例えば、非特許文献１，２参照）。非特許文献１，２においては、画像から人を検出（認識）するための主な特徴量として、エッジ抽出により得られる特徴量が用いられている。これらの技術においては、エッジ抽出で得られた特徴量の様々な変化形が新たな特徴量として定義されて、人の認識が行われる。
【０００３】
例えば、非特許文献１では、エッジのある小領域内の方向のヒストグラムをとることで特徴量が得られ、この特徴量を用いることで多少の輪郭の歪みなどに強くなるという利点がある。
【先行技術文献】
【非特許文献】
【０００４】
【非特許文献１】Navneet Dalal and Bill Triggs「Histograms of Oriented Gradients for Human Detection」CVPR2005
【非特許文献２】B. Wu and R. Nevatia「Detection of multiple, partially occluded humans in a single image by bayesian combination of edgelet part detectors」In Proc. 10th Int. Conf. Computer Vision, 2005
【発明の開示】
【発明が解決しようとする課題】
【０００５】
上記した画像から人などを検出する方法では、輪郭の特徴を利用して物体を検出するが、より精度良く検出が行われるようにすることが望まれている。
【０００６】
本発明は、このような状況に鑑みてなされたものであり、より精度良く人などの対象物を検出できるようにするものである。
【課題を解決するための手段】
【０００７】
本発明の一側面の学習装置は、入力された画像から異なる解像度の画像を生成する生成手段と、前記生成手段により生成された画像から、処理対象とする特徴点を抽出する抽出手段と、前記特徴点に所定のフィルタを用いたフィルタ処理を施すことで、前記特徴点の特徴量を計算する計算手段と、前記特徴量を用いた統計学習により、前記画像から所定の対象物体を検出するための識別器を生成する識別器生成手段とを備え、前記フィルタは、複数の領域を有し、前記計算手段は、その領域内の差分の差分値を前記特徴量とする。
【０００８】
前記所定のフィルタの前記領域は、矩形であるようにすることができる。
【０００９】
前記計算手段は、任意の角度におけるガウス関数の所定の次数の微分関数における畳み込み演算を実行し、その演算結果の絶対値の総和を計算するようにすることができる。
【００１０】
前記計算手段は、任意の角度におけるガウス関数の所定の次数の微分関数における畳み込み演算を実行し、その演算結果の絶対値の最大値を計算するようにすることができる。
【００１１】
前記計算手段は、前記複数の領域毎に、領域内に位置する画素の画素値の総和または平均値を算出し、その総和または平均値の差分を算出し、その差分値の絶対値を前記特徴量とするようにすることができる。
【００１２】
前記計算手段は、前記複数の領域毎に、領域内に位置する画素の画素値からヒストグラムを作成し、その値の差分を算出し、その差分値の絶対値を前記特徴量とするようにすることができる。
【００１３】
前記計算手段は、前記複数の領域毎に、領域内に位置する画素の画素値からヒストグラムを作成し、そのヒストグラムの和が１となるように正規化し、正規化されたヒストグラムの値の差分を算出し、その差分値の絶対値を前記特徴量とするようにすることができる。
【００１４】
前記計算手段は、基準となる特徴点に対して適用したフィルタを、その基準となる特徴点の近傍に位置する複数の特徴点に対しても適用し、それらの複数の特徴点から算出された特徴量の総和または平均値を、前記基準となる特徴点の特徴量とするようにすることができる。
【００１５】
本発明の一側面の学習方法は、入力された画像から異なる解像度の画像を生成し、生成された画像から、特徴点を抽出し、前記特徴点に所定のフィルタを用いたフィルタ処理を施すことで、前記特徴点の特徴量を計算し、前記特徴量を用いた統計学習により、前記画像から所定の対象物体を検出するための識別器を生成するステップを含み、前記フィルタは、複数の領域を有し、その領域内の差分の差分値を前記特徴量とする。
【００１６】
本発明の一側面の第１のプログラムは、入力された画像から異なる解像度の画像を生成し、生成された画像から、特徴点を抽出し、前記特徴点に所定のフィルタを用いたフィルタ処理を施すことで、前記特徴点の特徴量を計算し、前記特徴量を用いた統計学習により、前記画像から所定の対象物体を検出するための識別器を生成するステップを含み、前記フィルタは、複数の領域を有し、その領域内の差分の差分値を前記特徴量とする処理を実行するコンピュータが読み取り可能なプログラム。
【００１７】
本発明の一側面の学習装置および方法、並びに第１のプログラムにおいては、入力された画像から異なる解像度の画像が生成され、その生成された画像から、処理対象とする特徴点が抽出され、特徴点に所定のフィルタを用いたフィルタ処理を施すことで、特徴点の特徴量が計算され、特徴量を用いた統計学習により、画像から所定の対象物体が検出されるための識別器が生成される。また、そのフィルタは、複数の領域を有し、その領域内の差分の差分値が特徴量とされるためのフィルタである。
【００１８】
本発明の一側面の認識装置は、入力された画像から異なる解像度の画像を生成する生成手段と、前記生成手段により生成された画像毎に、特徴点を抽出する抽出手段と、前記特徴点に所定のフィルタを用いたフィルタ処理を施すことで、前記特徴点の特徴量を計算する計算手段と、統計学習により得られた、画像から所定の対象物体を検出するための識別器に、前記特徴量を代入し、前記入力された画像から、前記対象物体を検出する検出手段とを備え、前記フィルタは、複数の領域を有し、前記計算手段は、その領域内の差分の差分値を前記特徴量とする。
【００１９】
前記フィルタの前記領域は、矩形であるようにすることができる。
【００２０】
前記計算手段は、任意の角度におけるガウス関数の所定の次数の微分関数における畳み込み演算を実行し、その演算結果の絶対値の総和を計算するようにすることができる。
【００２１】
前記計算手段は、任意の角度におけるガウス関数の所定の次数の微分関数における畳み込み演算を実行し、その演算結果の絶対値の最大値を計算するようにすることができる。
【００２２】
前記計算手段は、前記複数の領域毎に、領域内に位置する画素の画素値の総和または平均値を算出し、その総和または平均値の差分を算出し、その差分値の絶対値を前記特徴量とするようにすることができる。
【００２３】
前記計算手段は、前記複数の領域毎に、領域内に位置する画素の画素値からヒストグラムを作成し、その値の差分を算出し、その差分値の絶対値を前記特徴量とするようにすることができる。
【００２４】
前記計算手段は、前記複数の領域毎に、領域内に位置する画素の画素値からヒストグラムを作成し、そのヒストグラムの和が１となるように正規化し、正規化されたヒストグラムの値の差分を算出し、その差分値の絶対値を前記特徴量とするようにすることができる。
【００２５】
前記計算手段は、基準となる特徴点に対して適用したフィルタを、その基準となる特徴点の近傍に位置する複数の特徴点に対しても適用し、それらの複数の特徴点から算出された特徴量の総和または平均値を、前記基準となる特徴点の特徴量とするようにすることができる。
【００２６】
本発明の一側面の認識方法は、入力された画像から異なるスケール係数の画像を生成し、生成された画像から、特徴点を抽出し、前記特徴点に所定のフィルタを用いたフィルタ処理を施すことで、前記特徴点の特徴量を計算し、統計学習により得られた、画像から所定の対象物体を検出するための識別器に、前記特徴量を代入し、前記入力された画像から、前記対象物体を検出するステップを含み、前記フィルタは、複数の領域を有し、その領域内の差分の差分値を前記特徴量とする。
【００２７】
本発明の一側面の第２のプログラムは、入力された画像から異なるスケール係数の画像を生成し、生成された画像から、特徴点を抽出し、前記特徴点に所定のフィルタを用いたフィルタ処理を施すことで、前記特徴点の特徴量を計算し、統計学習により得られた、画像から所定の対象物体を検出するための識別器に、前記特徴量を代入し、前記入力された画像から、前記対象物体を検出するステップを含み、前記フィルタは、複数の領域を有し、その領域内の差分の差分値を前記特徴量とする処理を実行するコンピュータが読み取り可能なプログラム。
【００２８】
本発明の一側面の認識装置および方法、並びに第２のプログラムにおいては、入力された画像から異なる解像度の画像が生成され、その生成された画像から、特徴点が抽出され、その抽出された特徴点に所定のフィルタを用いたフィルタ処理が施されることで、特徴点の特徴量が計算され、統計学習により得られた、画像から所定の対象物体を検出するための識別器に、特徴量が代入され、入力された画像から、対象物体が検出される。適用されるフィルタは、複数の領域を有し、その領域内の差分の差分値を特徴量とするためのフィルタとされる。
【発明の効果】
【００２９】
本発明の一側面によれば、精度良く対象物を検出することが可能となる。
【図面の簡単な説明】
【００３０】
【図１】本発明を適用した識別システムの一実施の形態の構成を示す図である。
【図２】特徴量計算部の詳細な構成例を示す図である。
【図３】ステアラブルフィルタについて説明する図である。
【図４】矩形のフィルタについて説明するための図である。
【図５】識別器生成部の詳細な構成例を示す図である。
【図６】学習処理を説明するフローチャートである。
【図７】特徴量計算処理を説明するフローチャートである。
【図８】識別器生成処理を説明するフローチャートである。
【図９】識別器の生成について説明する図である。
【図１０】特徴点の抽出について説明する図である。
【図１１】特徴量を説明する図である。
【図１２】特徴点のペア毎の特徴量のサンプリングについて説明する図である。
【図１３】弱識別器の設定について説明する図である。
【図１４】他の矩形のフィルタについて説明するための図である。
【図１５】特徴量計算部の他の構成例を示す図である。
【図１６】他の矩形のフィルタについて説明するための図である。
【図１７】特徴量計算部の他の構成例を示す図である。
【図１８】他の矩形のフィルタについて説明するための図である。
【図１９】特徴量計算部の他の構成例を示す図である。
【図２０】物体検出処理について説明するためのフローチャートである。
【図２１】記録媒体について説明するための図である。
【発明を実施するための形態】
【００３１】
以下に、本発明の実施の形態について図面を参照して説明する。
【００３２】
［システム構成について］
図１は、本発明を適用した物体識別システムの一実施の形態の構成例を示すブロック図である。この物体識別システムは、学習装置１１、識別器記録部１２、および認識装置１３からなり、入力された画像における、対象物体として例えば人間の画像のある領域を認識させるものである。
【００３３】
学習装置１１は、入力された学習画像に基づいて、認識装置１３において画像上における対象物体の有無を識別する処理を行うときに用いられる識別器を生成し、識別器記録部１２に記録させる。認識装置１３は、識別器記録部１２に記録されている識別用特徴量および識別器を用いて、入力された入力画像に対象物体の画像が存在するか否かを識別し、その識別結果を出力する。
【００３４】
学習装置１１は、画像入力部２１、多重解像度画像生成部２２、特徴点抽出部２３、特徴量計算部２４、および識別器生成部２５から構成される。
【００３５】
多重解像度画像生成部２２は、画像入力部２１により入力された学習画像から、互いに解像度の異なる複数の画像を生成し、それらの画像を多重解像度画像として特徴点抽出部２３に供給する。例えば、レベルＬ１乃至レベルＬ８までの８つの解像度の階層の多重解像度画像が生成される。ここでは、レベルＬ１の多重解像度画像が最も解像度が高く、レベルＬ１からレベルＬ８まで順番に多重解像度画像の解像度が低くなるものとする。
【００３６】
特徴点抽出部２３は、多重解像度画像生成部２２で生成された多重解像度画像を構成する各画像（学習画像）から、その学習画像の画素のいくつかを識別器を生成するときに用いられる特徴点として抽出し、抽出した特徴点と学習画像とを特徴量計算部２４に供給する。ここで、識別器とは、統計学習により生成された、複数の弱識別器からなる強い識別器であり、例えば物体の輪郭を利用して、入力された画像中に物体の画像の領域が存在するか否かを識別するときに用いられる。
【００３７】
特徴量計算部２４は、特徴点抽出部２３からの学習画像に基づいて、例えばステアラブルフィルタ（Steerable Filter）を用いたフィルタ処理により、特徴点毎に、抽出された輪郭を示す特徴量を計算し、求められた特徴量と学習画像とを識別器生成部２５に供給する。識別器生成部２５は、特徴量計算部２４から供給された学習画像および特徴量に基づいて、例えばAdaboostによる統計学習処理を行い、対象物体である例えば人を認識する識別器を生成する。また、識別器生成部２６は、生成した識別器を識別器記憶部１２に供給する。
【００３８】
認識装置１３は、画像入力部３１、多重解像度画像生成部３２、特徴点抽出部３３、特徴量計算部３４、識別計算部３５、および識別結果出力部３６から構成されている。認識装置１３の画像入力部３１乃至特徴量計算部３４のそれぞれは、対象物体を認識しようとする入力画像に対して、学習装置１１の画像入力部２１乃至特徴量計算部２４のそれぞれと同様の処理を行うものであるので、その詳細な説明は省略する。
【００３９】
識別計算部３５は、識別器記録部１２に記録されている識別用特徴量および識別器を読み出す。また、識別計算部３５は、特徴量計算部３４からの特徴量のうちの識別用特徴量に対応するものを、読み出した識別器に代入して演算を行う。識別結果出力部３６は、識別計算部３５における演算結果を取得し、その演算結果に基づいて、対象物体が入力画像で認識されたか否かの識別結果を出力する。
【００４０】
特徴点抽出部２３（３３）、特徴量計算部２４（３４）は、どのようなフィルタを用いるかにより内部構成や、どのような処理を実行するかが異なる。まず、微分関数を用いたフィルタを適用した場合について説明する。
【００４１】
［フィルタとして微分関数を用いた場合について］
図２は、図１の特徴量計算部２４のより詳細な構成例を示す図である。特徴量計算部３４は、特徴量計算部２４と同様の構成を有するため、ここでは、特徴量計算部２４の構成を例にあげて説明する。特徴量計算部２４は、１次フィルタ処理部５１、２次フィルタ処理部５２、３次フィルタ処理部５３、および特徴量生成部５４から構成される。また、特徴点抽出部２３からの学習画像は、１次フィルタ処理部５１乃至特徴量生成部５４に供給され、特徴点は、１次フィルタ処理部５１乃至３次フィルタ処理部５３に供給される。
【００４２】
１次フィルタ処理部５１は、供給された特徴点毎に、特徴点に対してガウス関数Ｇの１次微分関数Ｇ₁によりフィルタ処理を施して特徴量を抽出し、特徴量生成部５４に供給する。ここで、ガウス関数Ｇ、および１次微分関数Ｇ₁は、次式（１）および式（２）により示される。
【００４３】
【数１】

【００４４】
【数２】

【００４５】
式（１）において、σはガウス幅を示している。式（２）において、θは任意の角度を示し、計算したいフィルタの方向を示している。
【００４６】
例えば、１次フィルタ処理部５１は、ガウス関数Ｇのガウス幅σを３つの所定値（例えば、ガウス幅σ１，σ２，σ３＝１，２，４）に変化させ、ガウス幅σ毎に所定の４方向（例えば、θ＝θ１，θ２，θ３，θ４）について式（２）を計算する。
【００４７】
なお、方向θは４方向に限らず、８方向、例えばｐｉを８方向に等分したときの各方向などとしてもよい。また、従来は、上記したように、複数のガウス幅を用いて処理を行っていたが、本実施の形態においては、後述するように、ガウス幅は１つだけ用意しておけば良い。換言すれば、ガウス幅を変化させる必要がない。よって、上記では、“ガウス幅を３つの所定値に変化させ、ガウス幅σ毎に所定の４方向について式（２）を計算する”と記載したが、本実施の形態においては、設定されているガウス幅σにおいて所定の方向の４方向について式（２）を計算するだけでよい。
【００４８】
よって、複数のガウス幅毎に計算する必要がないため、計算量を低減させることが可能となる。このようなことは、他のフィルタ、例えば、２次フィルタ処理部５２、３次フィルタ処理部５３においても同様である。
【００４９】
２次フィルタ処理部５２は、供給された特徴点毎に、特徴点に対してガウス関数Ｇの２次微分関数Ｇ₂によりフィルタ処理を施して特徴量を抽出し、特徴量生成部５４に供給する。次式（３）は、２次微分関数Ｇ₂を示しており、式（３）においてθは任意の角度を示している。
【００５０】
【数３】

【００５１】
また、式（３）における係数ｋ_2i（θ）（但し、ｉ＝１，２，３）は、次式（４）で示される関数である。
【００５２】
【数４】

【００５３】
例えば、２次フィルタ処理部５２は、ガウス関数Ｇの所定のガウス幅σにおいて、所定の４方向（例えば、θ＝θ１，θ２，θ３，θ４）について式（３）を計算する。
【００５４】
３次フィルタ処理部５３は、供給された特徴点毎に、特徴点に対してガウス関数Ｇの３次微分関数Ｇ₃によりフィルタ処理を施して特徴量を抽出し、特徴量生成部５４に供給する。次式（５）は、３次微分関数Ｇ₃を示しており、式（５）においてθは任意の角度を示している。
【００５５】
【数５】

【００５６】
また、式（５）における係数ｋ_3i（θ）（但し、ｉ＝１，２，３）は、次式（６）で示される関数である。
【００５７】
【数６】

【００５８】
例えば、３次フィルタ処理部５３は、ガウス関数Ｇの所定のガウス幅σにおいて、所定の４方向（例えば、θ＝θ１，θ２，θ３，θ４）について、式（５）を計算する。
【００５９】
特徴量生成部５４は、１次フィルタ処理部５１、２次フィルタ処理部５２、および３次フィルタ処理部５３のそれぞれから供給された、４つの方向θについて計算された各特徴点の特徴量の供給を受け、供給された合計１２個（＝３（次数）×４（方向））の特徴量を並べて特徴点における特徴量とする。
【００６０】
また、各フィルタ処理部には、多重解像度画像生成部２２から異なる解像度の複数の画像が供給されるため、各画像から４つの方向θについて計算された各特徴点の特徴量も供給される。この供給される特徴量は、多重解像度画像生成部２２が生成する画像の枚数に依存し、例えば、レベル１からレベル８までの８枚の画像が生成される場合、８枚分の４つの方向θについて計算された各特徴点の特徴量が供給されることになる。
【００６１】
また、特徴量生成部５４は、生成した特徴量と、供給された学習画像とを識別器生成部２５に供給する。
【００６２】
このように、特徴量計算部２４では、ガウス関数を微分して得られる、方向θに選択性を持つフィルタ（基底関数）が用いられて、微分の次数毎に異なる特徴量（輪郭）が抽出され、特徴量とされている。
【００６３】
特徴量の抽出にステアラブルフィルタを用いる場合、図３に示すように、方向θおよびガウス幅σの異なるフィルタを用意すれば、それらのフィルタの線形結合により、任意の方向θのフィルタ、すなわちガウス関数Ｇの微分関数Ｇ_n（但し、ｎ＝１，２，３）を表現することができる。
【００６４】
図３において、図中、左側の一番上の列の画像は、図中、左から順番にガウス幅σ＝２である場合における１次微分関数Ｇ₁（０°）および１次微分関数Ｇ₁（９０°）を表している。また、図中、左側の真ん中の列の画像は、図中、左から順番にガウス幅σ＝２である場合における２次微分関数Ｇ₂（０°）、２次微分関数Ｇ₂（６０°）、２次微分関数Ｇ₂（１２０°）、およびラプラシアンを表している。さらに、図中、左側の一番下の列の画像は、図中、左から順番にガウス幅σ＝２である場合における３次微分関数Ｇ₃（０°）、３次微分関数Ｇ₃（４５°）、３次微分関数Ｇ₃（９０°）、および３次微分関数Ｇ₃（１３５°）を表している。
【００６５】
また、図中、右側の横方向の列のうちの一番上の列の画像は、図中、左側から順番に、ガウス幅σ＝１である場合における１次微分関数Ｇ₁（θ）のθを０，１／８ｐｉ，２／８ｐｉ，３／８ｐｉ，４／８ｐｉ，５／８ｐｉ，６／８ｐｉ，７／８ｐｉとしたものを表している。
【００６６】
同様に、図中、右側の横方向の各列の画像は、図中、上から二番目から下方向に順番に、ガウス幅σ＝２である場合における１次微分関数Ｇ₁（θ）、ガウス幅σ＝４である場合における１次微分関数Ｇ₁（θ）、ガウス幅σ＝１である場合における２次微分関数Ｇ₂（θ）、ガウス幅σ＝２である場合における２次微分関数Ｇ₂（θ）、ガウス幅σ＝４である場合における２次微分関数Ｇ₂（θ）、ガウス幅σ＝１である場合における３次微分関数Ｇ₃（θ）、ガウス幅σ＝２である場合における３次微分関数Ｇ₃（θ）、およびガウス幅σ＝４である場合における３次微分関数Ｇ₃（θ）を示している。そして、それらの各列の画像は、図中、左側から順番に微分関数の方向θを０，１／８ｐｉ，２／８ｐｉ，３／８ｐｉ，４／８ｐｉ，５／８ｐｉ，６／８ｐｉ，７／８ｐｉとしたものを表している。
【００６７】
例えば、図中、左側のフィルタである１次微分関数Ｇ₁（０°）および１次微分関数Ｇ₁（９０°）を用いることで、図中、右側の上から二番目の列の各方向θにおける１次微分関数Ｇ₁（θ）を表すことができる。同様に、図中、左側の２次微分関数Ｇ₂を用いて、図中、右側の上から５番目の列に示す各方向θにおける２次微分関数Ｇ₂（θ）を表すことができ、図中、左側の３次微分関数Ｇ₃を用いて、図中、右側の上から８番目の列に示す各方向θにおける３次微分関数Ｇ₃（θ）を表すことができる。すなわち、各次元の任意の方向の微分関数は、その次元より１だけ多い数の基底関数があれば、それらの基底関数の線形結合により表現することができる。
【００６８】
図４は、他のフィルタの例を示す図である。図４に示したフィルタは、それぞれ、矩形が組み合わされたフィルタである。図４において、フィルタ１０１−１乃至１０１−１６は、１次微分関数Ｇ₁を表す。フィルタ１０２−１乃至１０２−１６は、それぞれ、フィルタ１０１−１乃至１０１−１６に対する２次微分関数Ｇ₂を表す。さらに、フィルタ１０３−１乃至１０３−１６は、それぞれ、フィルタ１０１−１乃至１０１−１６に対する３次微分関数Ｇ₃を表す。
【００６９】
フィルタ１０１−１は、所定の大きさを有するフィルタであり、図中右側が白色領域とされ、図中左側が黒色領域とされたフィルタである。フィルタ１０１−２乃至１０１−５は、それぞれ、フィルタ１０１−１と異なる大きさのフィルタであるが、フィルタ１０１−１と同じく図中右側が白色領域とされ、図中左側が黒色領域とされたフィルタである。
【００７０】
なお、ここでは、白色領域や黒色領域との表現を用いるが、白色や黒色に限定されることを意味するのではない。すなわち、フィルタとして用いられるのは、異なる色の領域であればよく、色自体に限定はない。そのため、ここでは、白色と黒色を例にあげて説明をする。
【００７１】
また、白色領域と黒色領域を入れ替えたフィルタとすることも可能である。例えば、フィルタ１０１−１の白色領域と黒色領域を入れ替え、図中、左側が白色領域、右側が黒色領域とすることも可能である。しかしながら、後述するように、本実施の形態においては、フィルタが適用されて算出された値の絶対値を特徴量とする。このことにより、領域を入れ替えていないフィルタと領域を入れ替えたフィルタの両方のフィルタを適用した場合と同様の効果を得られるように構成されている。
【００７２】
フィルタ１０１−６乃至１０１−１０は、それぞれ異なる大きさのフィルタであり、図中上側が白色領域とされ、図中下側が黒色領域とされたフィルタである。フィルタ１０１−１１乃至１０１−１３は、それぞれ異なる大きさのフィルタであり、図中左上がりの斜めの形状であり、図中上側が白色領域とされ、図中下側が黒色領域とされたフィルタである。フィルタ１０１−１４乃至１０１−１６は、それぞれ異なる大きさのフィルタであり、図中右上がりの斜めの形状であり、図中上側が白色領域とされ、図中下側が黒色領域とされたフィルタである。
【００７３】
このような１次微分関数Ｇ₁を表すフィルタ１０１−１乃至１０１−１６は、エッジ成分の抽出に適している。フィルタ１０１−１乃至１０１−１６は、隣あった領域との輝度平均の差分が計算されるので、例えば、白い領域から黒い領域に変化するところにエッジがあるといった意味あいになる。
【００７４】
フィルタ１０２−１は、所定の大きさを有するフィルタであり、図中左から順に、白色領域、黒色領域、白色領域とされたフィルタである。フィルタ１０２−２乃至１０２−５は、それぞれ、フィルタ１０２−１と異なる大きさのフィルタであるが、フィルタ１０２−１と同じく、図中左から順に、白色領域、黒色領域、白色領域とされたフィルタである。
【００７５】
フィルタ１０２−６乃至１０２−１０は、それぞれ異なる大きさのフィルタであり、図中上から順に、白色領域、黒色領域、白色領域とされたフィルタである。フィルタ１０２−１１乃至１０２−１３は、それぞれ異なる大きさのフィルタであり、図中左上がりの斜めの形状であり、図中上から順に、白色領域、黒色領域、白色領域とされたフィルタである。フィルタ１０２−１４乃至１０２−１６は、それぞれ異なる大きさのフィルタであり、図中右上がりの斜めの形状であり、図中上から順に、白色領域、黒色領域、白色領域とされたフィルタである。
【００７６】
このような２次微分関数Ｇ₂を表すフィルタ１０２−１乃至１０２−１６は、バー成分（棒形状の成分）の抽出に適している。
【００７７】
フィルタ１０３−１は、所定の大きさを有するフィルタであり、図中左から順に、黒色領域、白色領域、黒色領域、白色領域とされたフィルタである。フィルタ１０３−２乃至１０３−５は、それぞれ、フィルタ１０３−１と異なる大きさのフィルタであるが、フィルタ１０３−１と同じく、図中左から順に、黒色領域、白色領域、黒色領域、白色領域とされたフィルタである。
【００７８】
フィルタ１０３−６乃至１０３−１０は、それぞれ異なる大きさのフィルタであり、図中上から順に、白色領域、黒色領域、白色領域、黒色領域とされたフィルタである。フィルタ１０３−１１乃至１０３−１３は、それぞれ異なる大きさのフィルタであり、図中左上がりの斜めの形状であり、図中上から順に、白色領域、黒色領域、白色領域、黒色領域とされたフィルタである。フィルタ１０３−１４乃至１０３−１６は、それぞれ異なる大きさのフィルタであり、図中右上がりの斜めの形状であり、図中上から順に、白色領域、黒色領域、白色領域、黒色領域とされたフィルタである。
【００７９】
このような３次微分関数Ｇ₃を表すフィルタ１０３−１乃至１０３−１６は、人の足のような形状を抽出するのに適している。
【００８０】
［識別器生成部の構成について］
図５は、図１の識別器生成部２５のより詳細な構成例を示すブロック図である。識別器生成部２５は、サンプリング部６１、重み設定部６２、並び替え部６３、識別器設定部６４、識別器選択部６５、および重み更新部６６から構成される。
【００８１】
サンプリング部６１は、重み設定部６２により設定される学習画像単位の重みに応じて、特徴点のペア毎に、複数の学習画像のそれぞれの同じ位置の特徴点のペアの特徴量から、Ｍ個の特徴量をサンプリングして並び替え部６３に供給する。
【００８２】
並び替え部６３は、各特徴点のペアについて、サンプリングされたＭ個の特徴量を昇順、または降順に並び替えて識別器設定部６４に供給する。
【００８３】
識別器設定部６４は、特徴量が抽出された学習画像に認識しようとする対象物体が含まれているか否かを示す正誤情報に基づいて、昇順、または降順に並び替えられた各ペアの特徴量のそれぞれについて、閾値を変化させながら誤り率計算部６４ａを制御して、誤り率を計算させ、誤り率が最小となるように閾値を設定する（この閾値が、弱識別器として設定される）。さらに、識別器設定部６４は、弱識別器毎の誤り率を識別器選択部６５に供給する。
【００８４】
学習画像には、その学習画像に対象物体が含まれているか否かを示す正誤情報（ラベル）が付加されており、識別器設定部６４は、特徴量計算部２４から供給された学習画像に付加されている正誤情報に基づいて、弱識別器の設定を行う。
【００８５】
識別器選択部６５は、弱識別器のうち、誤り率が最小となる弱識別器を選択して、弱識別器からなる識別器を更新し、最終的な識別器および各弱識別器に対応する特徴量を識別器記憶部１２に供給する。さらに、識別器選択部６５は、選択した弱識別器の誤り率に基づいて信頼度を計算し、重み更新部６６に供給する。
【００８６】
重み更新部６６は、供給された信頼度に基づいて学習画像毎の重みを再計算するとともに、重みを正規化して更新し、更新結果を重み設定部６２に供給する。重み設定部６２は、重み更新部６６より供給されてくる重みの更新結果に基づいて、学習画像単位の重みを設定する。
【００８７】
［学習処理について］
次に、学習装置１１で行われる学習処理について説明を加える。学習装置１１に学習画像が入力され、識別器の生成が指示されると、学習装置１１は、学習処理を開始して統計学習により識別器を生成する。以下、図６乃至８のフローチャートを参照して、学習装置１１による学習処理について説明する。
【００８８】
ステップＳ１１において、多重解像度画像生成部２２は、入力された学習画像から、多重解像度画像を生成する。上記したように、多重解像度画像生成部２２は、例えば、レベルＬ１乃至レベルＬ８までの８つの解像度の階層の多重解像度画像を生成し、その生成した画像を特徴点抽出部２３に供給する。特徴点抽出部２３は、それぞれ、供給される多重解像度画像（異なる解像度の複数の画像）のうちの１つの画像を、処理対象の学習画像として、ステップＳ１１以下の処理を実行し、複数の画像毎に繰り返しステップＳ１１以下の処理を実行する。
【００８９】
ステップＳ１２において、特徴点抽出部２３は、入力された学習画像から特徴点を抽出する。例えば、特徴点抽出部２３に図９Ａに示す学習画像が入力された場合、特徴点抽出部２３は、図９Ｂに示すように、学習画像において所定の間隔で並んでいる画素を、特徴点として抽出する。なお、図９Ｂにおいて、学習画像上の円は特徴点とされた画素を表している。
【００９０】
図９Ａおよび図９Ｂに示す学習画像は、図中、横方向に３２画素、縦方向に６４画素からなる学習画像であり、特徴点抽出部２３は、学習画像上の画素を、横方向および縦方向に２画素おきに特徴点とする画素として選択する。これにより、学習画像において、図中、横方向に１２画素、縦方向に２８画素、合計３３６（＝１２×２８）画素が特徴点として選択される。
【００９１】
特徴点抽出部２３は、学習画像から特徴点を抽出すると、抽出した特徴点と、入力された学習画像とを特徴量計算部２４に供給する。
【００９２】
ステップＳ１３において、特徴量計算部２４は、特徴量計算処理を行い、特徴点抽出部２３から供給された特徴点および学習画像に基づいて、各特徴点の特徴量を計算する。ここで、図８のフローチャートを参照して、ステップＳ１３の処理に対応する特徴量計算処理について説明する。
【００９３】
ステップＳ５１において、特徴量計算部２４、より詳細には、特徴量計算部２４の１次フィルタ処理部５１、２次フィルタ処理部５２、および３次フィルタ処理部５３は、それぞれ特徴点抽出部２３から供給されてきた特徴点のうち、未処理の特徴点の１つを注目画素として選択する。このとき、１次フィルタ処理部５１、２次フィルタ処理部５２、および３次フィルタ処理部５３がそれぞれ用いるフィルタは、図３に示したフィルタであっても良いし、図４に示したフィルタであっても良い。または、両方用いても良い。
【００９４】
ステップＳ５２において、特徴量計算部２４は、方向θｑを示すカウンタｑを１とする。これにより、方向θｑはθ１とされる。
【００９５】
ステップＳ５３において、１次フィルタ処理部５１は、１次フィルタ処理を行う。すなわち、１次フィルタ処理部５１は、処理対象となる注目画素の画素値に基づいて、ガウス幅をσ＝１とし、かつ方向をθｑとして式（２）を演算し、フィルタ処理した結果を特徴量生成部５４に供給する。すなわち、式（２）における方向θがθｑとされて演算が行われ、輪郭が抽出される。
【００９６】
なお、“ガウス幅をσ＝１として”と記述したが、本実施の形態の場合、ガウス幅は、σ＝１と固定されている（予め１つのガウス幅のフィルタが設定されている）ため、この“ガウス幅をσ＝１として”という処理は省略することが可能である。すなわち、本実施の形態においては、ガウス幅σが１のフィルタの方向をθｑとして式（２）を演算するという処理が、ステップＳ５３において実行されることになる。また、ここでは、ガウス幅σをσ＝１として説明を続けるが、予め用意されているフィルタのガウス幅は、σ＝１以外のガウス幅でも勿論良い。
【００９７】
ステップＳ５４において、２次フィルタ処理部５２は、２次フィルタ処理を行う。すなわち、２次フィルタ処理部５２は、注目画素の画素値に基づいて、ガウス幅σ＝１のフィルタの方向をθｑとして式（３）を演算し、フィルタ処理した結果を特徴量生成部５４に供給する。すなわち、式（３）における方向θがθｑとされて演算が行われ、輪郭が抽出される。
【００９８】
ステップＳ５５において、３次フィルタ処理部５３は、３次フィルタ処理を行う。すなわち、３次フィルタ処理部５３は、注目画素の画素値に基づいて、ガウス幅σ＝１のフィルタの方向をθｑとして式（５）を演算し、フィルタ処理した結果を特徴量生成部５４に供給する。すなわち、式（５）における方向θがθｑとされて演算が行われ、輪郭が抽出される。
【００９９】
ステップＳ５６において、特徴量計算部２４は、方向θｑがθ４であるか否か、すなわちカウンタｑ＝４であるか否かを判定する。ステップＳ５６において、方向θｑがθ４でないと判定された場合、ステップＳ５７において、特徴量計算部２４は、カウンタｑをインクリメントする。例えば、カウンタｑ＝１であった場合、カウンタｑがインクリメントされてｑ＝２とされ、これにより方向θｑはθ２とされる。カウンタｑがインクリメントされると、処理はステップＳ５３に戻り、上述した処理が繰り返される。
【０１００】
これに対して、ステップＳ５６において、方向θｑがθ４であると判定された場合、ステップＳ５８において、特徴量生成部５４は、１次フィルタ処理部５１、２次フィルタ処理部５２、および３次フィルタ処理部５３から供給された演算結果を特徴量として合成し、１つの特徴点に対する特徴量を生成する。
【０１０１】
特徴量は、以下の式（７）または式（８）で求められる。
【数７】

【数８】

【０１０２】
式（７）、式（８）において、Ｇ_d,θは、式（２）などと同じく、任意の角度θにおけるガウス関数Ｇのｄ次微分関数である。また、Ｉ（ｘ_i，ｙ_i，ｓ_i）のうち、（ｘ_i，ｙ_i）は、処理対象とされている特徴点の画像内での座標を表し、（ｓ_i）は、多重解像度画像を構成する画像のうち、処理対象とされている画像のスケールを表す。
【０１０３】
式（７）は、任意の角度θにおけるガウス関数Ｇのｄ次微分関数と特徴量を畳込み演算し、その絶対値をΣで総和を演算する式である。式（８）は、任意の角度θにおけるガウス関数Ｇのｄ次微分関数と特徴量を畳込み演算し、その絶対値をｍａｘで最大値をとる式である。
【０１０４】
式（７）と式（８）は、ともに、特徴量を算出する式であるが、式（７）は、局所的なエネルギーを計算する式であり、式（８）は、局所的な最大値を計算する式である。ここで、この式の意味ついて説明を加える。
【０１０５】
上記したような処理により、任意の角度における関数とスケールで抽出されたフィルタ係数を特徴量として、教師あり統計学習を行い、人などの対象物を検出する検出識別器を生成できる。しかしながら、この検出識別器では、例えば、人の着ている服装と背景の関係に依存する特徴量となってしまう。また、人のように歪みや変形の大きな認証対象に関しては、特徴量として選択性がありすぎる。よって、これらのことを吸収して処理する必要があり、それぞれの特徴量を不変性のある特徴量にする必要がある。
【０１０６】
“人の着ている服装と背景に関係に依存する特徴量”を、不変性のある特徴量にするには、フィルタ処理後の出力値の絶対値を演算することで解決することができる。絶対値を演算することで、人の輪郭に近い特徴量が抽出できる。さらに本実施の形態においては、１次微分関数、２次微分関数、さらに３次微分関数を演算し、それぞれ絶対値の演算を行っている。よって、１次微分関数による絶対値だけで演算を行う場合に比べて、はるかに精度を良くすることができ、不変性を有する特徴量を算出できるようになる。
【０１０７】
また、“人のように歪みや変形の大きな認証対象に関しては、特徴量として選択性がありすぎる”といったことに対しては、位置ずれによる不変演算を行うことで、そのようなこと吸収した特徴量を演算できるようになる。位置ずれによる不変演算とは、例えば、人の顔の輪郭を検出したとき、顔の形によらずその輪郭の長さはほぼ同じになるといったことを利用した演算である。換言すれば、輪郭の所定の部分に注目したとき、その部分が位置的にずれても、例えば、ほぼ丸顔の人の輪郭が位置的に移動し、細長い顔の人の輪郭に重なるようにしたときに、位置がずれただけで、その長さなどの値は不変であるとみなせる演算である。
【０１０８】
このような演算として、式（７）のように、総和が演算される。総和を演算することにより、例えば、人の顔の輪郭の総和が演算されることになる。または、式（８）のように、最大値が演算される。最大値を演算することにより、例えば、人の顔の輪郭のうちの最大値が演算されることになる。
【０１０９】
ここでは、総和と最大値という２つの演算を示した。換言すれば、上記したように、式（７）に基づき、局所的なエネルギーを計算する演算か、式（８）に基づき、局所的な最大値を計算する演算を示した。この他にも、局所的な最大値を有する点の周辺の局所的なエネルギーを計算する演算が行われるようにしても良い。これは、式（８）の演算結果を受けて、式（７）の演算を行うようなイメージである。または、局所的なエネルギーの周辺の最大値を計算する演算が行われるようにしても良い。これは、式（７）の演算結果を受けて、式（８）の演算を行うようなイメージである。具体的な式は示さないが、このような演算で特徴量が算出されるようにしても良い。
【０１１０】
ここで、図１０を参照して特徴量の算出についてさらに説明を加える。図１０に示した画像２０１を、処理対象とされている画像とする。この画像２０１は、学習時においては学習対象とされた画像であり、認識においては、認識対象とされた画像である。画像２０１に対して、フィルタ１０１−１でフィルタリングの処理を行った結果が、画像２０２である。
【０１１１】
この画像２０２は、次式（９）で算出された特徴量を画像に反映した画像である。
【数９】

式（９）は、式（７）の演算において、総和と絶対値を演算しないのが式（９）である。
【０１１２】
画像２０３は、次式（１０）に基づく演算の結果、算出された特徴量を画像に反映した画像である。
【数１０】

式（１０）は、式（９）の演算結果の絶対値を算出する式である。
【０１１３】
画像２０３は、画像２０２を生成したときに用いられたフィルタ１０１−１の領域を反転したフィルタ１０１−１’を用いて処理した場合と同等の画像である。フィルタ１０１−１’は、図中左側が白色領域であり、図中右側が黒色領域とされたフィルタであり、フィルタ１０１−１の領域を反転したフィルタである。
【０１１４】
フィルタ１０１−１を適用し、式（９）に基づく絶対値を算出しない式に基づいて算出された特徴量を反映した画像は、例えば、白から黒に変化する部分（輪郭）が抽出された画像２０２となる。フィルタ１０１−１’を適用し、式（１０）に基づく絶対値を算出する式に基づいて算出された特徴量を反映した画像は、例えば、黒から白に変化する部分（輪郭）が抽出された画像２０３となる。このように、方向が異なるだけで、同じ輪郭を抽出することができる。
【０１１５】
さらに、図１０に示した画像２０４は、複数のフィルタ１０１−１を適用し、式（７）に基づく演算で、フィルタ毎の算出された値の総和を演算した結果（特徴量）を画像に反映した画像である。複数のフィルタ１０１−１と記述したが、同一のフィルタ１０１−１が、複数の位置（画素）に対して適用されるということを示している。換言すれば、フィルタ１０１−１ａが所定の画素ａに対して適用された場合、その画素ａの近傍に位置する画素ｂ乃至ｆのそれぞれに対してフィルタ１０１−１が適用された演算が行われる。ここでは、異なる位置に適用されるフィルタを区別するために、ａ乃至ｆの添え字を付して記述する。
【０１１６】
フィルタ１０１−１ａが適用され、式（１０）に基づく演算が行われ、特徴量Ａが算出される。同じく、フィルタ１０１−１ｂが適用され、式（１０）に基づく演算が行われ、特徴量Ｂが算出され、フィルタ１０１−１ｃが適用され、式（１０）に基づく演算が行われ、特徴量Ｃが算出される。
【０１１７】
さらに、同様に、フィルタ１０１−１ｄが適用され、式（１０）に基づく演算が行われ、特徴量Ｄが算出され、フィルタ１０１−１ｅが適用され、式（１０）に基づく演算が行われ、特徴量Ｅが算出され、フィルタ１０１−１ｆが適用され、式（１０）に基づく演算が行われ、特徴量Ｆが算出される。このようにして算出された特徴量Ａ乃至Ｆが加算されて、特徴量が算出される。この加算された特徴量が、基準とされた画素ａに対する特徴量とされる。
【０１１８】
なおここでは、加算された特徴量（すなわち、総和）が、基準とされた画素ａに対する特徴量とされるとして説明をしたが、加算された特徴量を、処理対象とされた特徴点の数で除算した値、すなわち平均値が特徴量とされるようにしても良い。
【０１１９】
このような特徴量は、位置ずれ、回転、大きさの変化などに強い特徴量である。この場合、異なる位置にフィルタを適用することで、それぞれの特徴量が算出されるわけだが、その、それぞれの特徴量は、例えば、画像内における所定の物体の輪郭を抽出するための特徴量となる。輪郭が異なる位置毎に抽出されることで、輪郭自体がぼけた感じになる。このぼけ具合を利用することで、位置ずれ、回転、大きさの変化などを吸収することができ、位置ずれ、回転、大きさの変化などに強い特徴量とすることが可能となる。
【０１２０】
図１０を参照した説明では、式（１０）を適用した場合を例にあげて説明したが、式（８）を適用した場合も、上記した場合と同様に特徴量を算出することが可能であるため、ここでは、その説明は省略する。
【０１２１】
図７に示したフローチャートの説明に戻る。ステップＳ５８において、このような演算により、各特徴点から特徴量が算出される。そして、ステップＳ５９において、特徴量計算部２４は、全ての特徴点について処理が終了したか否かを判定する。例えば、特徴点抽出部２３から供給された全ての特徴点について、特徴量が求められた場合、処理が終了したと判定される。
【０１２２】
ステップＳ５９において、全ての特徴点について処理が終了していないと判定された場合、処理はステップＳ５１に戻り、次の特徴点が注目画素として選択される。
【０１２３】
これに対して、ステップＳ５９において、全ての特徴点について処理が終了したと判定された場合、特徴量生成部５４は、特徴点抽出部２３から供給された学習画像と、生成された各特徴点の特徴量とを識別器生成部２６に供給する。そして、その後、処理は図６のステップＳ１４に進む。
【０１２４】
なお、学習画像からの特徴量の抽出には、ステアラブルフィルタに限らず、ガボアフィルタなどが用いられるようにしてもよい。
【０１２５】
図６のフローチャートの説明に戻り、各特徴点の特徴量が求められると、ステップＳ１４において、識別器生成部２６は、特徴量計算部２４から供給された学習画像および特徴量に基づいて、識別器生成処理を行い、識別器を生成する。このステップＳ１４において実行される識別器生成処理について、図８のフローチャートを参照して説明する。
【０１２６】
ステップＳ１０１において、重み設定部６２は、例えば、図１１で示される学習画像ＰＩ_i（１≦ｉ≦Ｍ）毎の重みＷｉを全て１／Ｍに初期化し、識別器選択部６５は、カウンタｊを１に、弱識別器の和からなる識別器Ｒ（ｘ）を０にそれぞれ初期化する。
【０１２７】
ここで、ｉは、図１１における学習画像ＰＩ_iを識別するものであり、１≦ｉ≦Ｍである。ステップＳ１０１の処理により、全ての学習画像ＰＩ_iの重みＷｉは、いずれも正規化された同一の重み（＝１／Ｍ）とされる。また、カウンタｊは、予め定められた、識別器Ｒ（ｘ）を更新する回数を示している。
【０１２８】
ステップＳ１０２において、サンプリング部６１は、各特徴点のペア毎に、複数の学習画像ＰＩ_iのそれぞれの同じ位置の特徴点のペアの特徴量から、学習画像ＰＩ_iの重みＷｉに応じて、Ｍ個の特徴量を選択し、並び替え部６３に供給する。
【０１２９】
例えば、特徴量計算部２４からサンプリング部６１に、図１２に示すように、Ｍ個の学習画像ＰＩ₁乃至学習画像ＰＩ_Mの特徴量が供給されたとする。図１２では、図中、横方向に学習画像ＰＩ_i（但し、１≦ｉ≦Ｍ）から得られた特徴量が並べられており、学習画像を表す文字ＰＩ_iの図中、左側の数字「＋１」または「−１」は、その学習画像ＰＩ_iに付加されたラベル（正誤情報）を示している。
【０１３０】
すなわち、図中、一番上側に横方向に並んでいる（Ａ₁，Ａ₂，Ａ₃，・・・，Ａ_N）は、学習画像ＰＩ₁の特徴点の各ペアの特徴量のそれぞれを表しており、学習画像ＰＩ₁を示す文字「ＰＩ₁」の図中、左側の文字「＋１」は、学習画像ＰＩ₁に対象物体が含まれている旨のラベルを表している。
【０１３１】
同様に、図中、上から二番目の横方向に並んでいる（Ｂ₁，Ｂ₂，Ｂ₃，・・・，Ｂ_N）は、学習画像ＰＩ₂の特徴点の各ペアの特徴量のそれぞれを表しており、学習画像ＰＩ₂を示す文字「ＰＩ₂」の図中、左側の文字「＋１」は、学習画像ＰＩ₂に対象物体が含まれている旨のラベルを表している。
【０１３２】
また、図中、上から三番目の横方向に並んでいる（Ｃ₁，Ｃ₂，Ｃ₃，・・・，Ｃ_N）は、学習画像ＰＩ₃の特徴点の各ペアの特徴量のそれぞれを表しており、文字「ＰＩ₃」の図中、左側の文字「−１」は、学習画像ＰＩ₃に対象物体が含まれていない旨のラベルを表している。さらに、図中、上からＭ番目の横方向に並んでいる（Ｍ₁，Ｍ₂，Ｍ₃，・・・，Ｍ_N）は、学習画像ＰＩ_Mの特徴点の各ペアの特徴量のそれぞれを表しており、文字「ＰＩ_M」の図中、左側の文字「−１」は、学習画像ＰＩ_Mに対象物体が含まれていない旨のラベルを表している。
【０１３３】
このように、図１２の例では、１つの学習画像ＰＩ_iからは、特徴点のＮ個のペアのそれぞれの特徴量が得られる。また、図１２では、縦方向に並んだＭ個の特徴量Ａ_k乃至特徴量Ｍ_k（但し、１≦ｋ≦Ｍ）が１つのグループＧｒ_kとされており、このグループＧｒ_kに属す特徴量は、各学習画像ＰＩ_iにおける同じ位置の特徴点のペアの特徴量とされている。
【０１３４】
例えば、グループＧｒ₁は、縦方向に並んだ特徴量Ａ₁乃至特徴量Ｍ₁からなり、特徴量Ａ₁が求められる学習画像ＰＩ₁のペアとなる２つの特徴点と、グループＧｒ₁に属す他の特徴量、例えば特徴量Ｍ₁が求められる学習画像ＰＩ_Mのペアとなる２つの特徴点とは、学習画像上の同じ位置にある。なお、以下において、各学習画像ＰＩ_iにおける特徴点のペアであって、グループＧｒ_k（１≦ｋ≦Ｎ）に属す特徴量が求まめられるペアをペアｋと称する。
【０１３５】
サンプリング部６１に、図１２に示される学習画像ＰＩ_i毎の特徴量が供給された場合、サンプリング部６１は、ペアｋ毎、すなわちグループＧｒ_k毎に、そのグループに属す特徴量から学習画像ＰＩ_iの重みＷｉに応じて、Ｍ個の特徴量を抽選で選択する。例えば、サンプリング部６１は、重みＷｉに応じて、グループＧｒ₁に属す特徴量Ａ₁乃至特徴量Ｍ₁から、Ｍ個の特徴量を選択する。なお、最初の処理においては、いずれの重みＷｉも１／Ｍであり、等しいため、Ｍ個が抽選されると、確率的には全ての特徴量が選択されることになる。そのため、ここでは、最初の処理では各グループＧｒ_kにおいて、全ての特徴量が選択されたものとする。もちろん、実際には、同一の特徴量が重複して選択されることもある。
【０１３６】
なお、重みＷｉは、特徴点のペア毎のエラー計算に用いることもできる。この場合、データ重み係数（重みＷｉ）がエラー値に掛け合わされてエラー計算が行われる。
【０１３７】
ステップＳ１０３において、並び替え部６３は、Ｎ個のグループＧｒ_kのそれぞれについて、グループＧｒ_k、すなわちペアｋ毎に選択されたＭ個の特徴量を昇順、または降順に並び替えて、識別器設定部６４に供給する。例えば、図１２のグループＧｒ₁に属す特徴量から選択された、Ｍ個の特徴量が順番に並び替えられる。
【０１３８】
ステップＳ１０４において、識別器設定部６４は、特徴量計算部２４から供給された学習画像に付加されている正誤情報（ラベル）に基づいて、グループＧｒ_k毎、すなわち特徴点のペアｋ毎に、閾値を変化させながら誤り率計算部６４ａを制御して、以下の式（１１）で示すように誤り率ｅ_jkを計算させ、誤り率ｅ_jkが最小となるように閾値を設定する。
【０１３９】
ここで、特徴点のペアｋ毎の閾値ｔｈ_jkが、１個の弱識別器ｆ_jkとなる。識別器設定部６４は、弱識別器ｆ_jkごとの誤り率ｅ_jkを識別器選択部６５に供給する。すなわち、Ｎ個のペアｋのそれぞれに対して、Ｎ個の弱識別器ｆ_jkのそれぞれが設定され、Ｎ個の弱識別器ｆ_jkのそれぞれについて誤り率ｅ_jkが求められることになる。なお、弱識別器ｆ_jkは、認識しようとする対象物体を含む場合「＋１」を出力し、認識しようとする対象物体を含まない場合「−１」を出力する関数である。
【０１４０】
例えば、図１３に示すように、ｊ＝１であって、特徴点のペアｋ＝１の特徴量がＬ₁，Ａ₁，Ｃ₁，Ｂ₁，・・・，Ｍ₁に昇順、または、降順に並べられた場合、閾値ｔｈ₁₁が特徴量Ａ₁とＣ₁の間に設定される。そして、閾値ｔｈ₁₁より小さい範囲では、認識しようとする対象物体がないと認識され（「−１」で示されている範囲）、閾値ｔｈ₁₁より大きい範囲では、認識しようとする対象物体があると認識される（「＋１」で示されている範囲）とき、図中の点線で囲まれた特徴量Ａ₁は、認識しようとする対象物体が含まれた学習画像の特徴量であるので、エラーであるとみなされる。また、特徴量Ｃ₁，Ｍ₁は、逆に、認識しようとする対象物体が含まれていない学習画像の特徴量であるので、エラーであるとみなされる。
【０１４１】
図１３の例では、閾値ｔｈ₁₁は、誤り率ｅ_jkが最小となる位置に設定されている。例えば、図１３に示す閾値ｔｈ₁₁が、誤り率ｅ_jkの最小となる位置ではない場合には、識別器設定部６４は、閾値ｔｈ₁₁の位置を変化させて、各位置における誤り率ｅ_jkを参照しながら、誤り率ｅ_jkが最小となる閾値ｔｈ₁₁の位置を探し出し、その位置を閾値ｔｈ₁₁の位置とする。
【０１４２】
誤り率計算部６４ａは、以下の式（１１）で示されるように、学習画像の正誤情報（ラベル）に基づいて、エラーであるとみなされた特徴量が抽出された学習画像の重みＷｉを加算し、誤り率ｅ_jkを計算する。
【０１４３】
【数１１】

【０１４４】
ここで、ｙ≠ｆ_jkはエラーとなっている特徴点のペアｋの条件を示しており、Ｅ_wは、エラーの発生したペアｋにおける重みが加算されることを示している。
【０１４５】
ステップＳ１０５において、識別器選択部６５は、識別器設定部６４から供給されたペアｋ毎のＮ個の誤り率ｅ_jkに基づいて、Ｎ個の弱識別器ｆ_jkのうち、誤り率ｅ_jkが最小となる弱識別器ｆ_jkを選択する。そして、識別器選択部６５は、識別器設定部６４から選択した弱識別器ｆ_jkを取得する。
【０１４６】
ステップＳ１０６において、識別器選択部６５は、選択した弱識別器ｆ_jkの誤り率ｅ_jkに基づいて、以下の式（１２）で示される信頼度ｃ_jを計算し、計算結果を重み更新部６６に供給する。
【０１４７】
【数１２】

【０１４８】
なお、式（１２）において、ｅ_jは、誤り率ｅ_jkのうち、選択された弱識別器ｆ_jkの誤り率ｅ_jk、すなわちＮ個の誤り率ｅ_jkのうちの最小の誤り率ｅ_jkを示している。また、以下において、ステップＳ１０５の処理において選択されたペアｋの弱識別器を、弱識別器ｆ_jとも称し、その弱識別器ｆ_jの誤り率ｅ_jkを誤り率ｅ_jとも称する。
【０１４９】
ステップＳ１０７において、重み更新部６６は、供給された信頼度ｃ_jに基づいて、以下の式（１３）を計算することで、学習画像ＰＩ_i毎に重みＷｉを再計算するとともに、全ての重みＷｉを正規化して更新し、更新結果を重み設定部６２に供給する。重み設定部６２は、重み更新部６６より供給されてくる重みの更新結果に基づいて、学習画像毎の重みを設定する。
【０１５０】
【数１３】

式（１３）においては、エラーの発生した特徴量を含む学習画像の重みＷｉが大きくなることが示されている。
【０１５１】
ステップＳ１０８において、識別器選択部６５は、新たに求められた弱識別器ｆ_jを用いて、保持している識別器Ｒ（ｘ）を更新する。すなわち、識別器選択部６５は、次式（１４）を計算することで識別器Ｒ（ｘ）を更新する。
【０１５２】
Ｒ（ｘ）＝Ｒ’（ｘ）＋ｃ_j×ｆ_j（ｘ）・・・（１４）
【０１５３】
式（１４）において、Ｒ’（ｘ）は、識別器選択部６５が保持している更新前の識別器を表しており、ｆ_j（ｘ）は、新たに求められた弱識別器ｆ_jを表している。すなわち、識別器選択部６５は、保持している識別器に、信頼度ｃ_jが乗算されて重み付けされた、新たに求められた弱識別器を加算することで識別器を更新する。
【０１５４】
ステップＳ１０９において、識別器選択部６５は、誤り率ｅ_jkが最小となる弱認識器ｆ_jkに対応する特徴点のペアｋの特徴量を、識別用特徴量として保持する。
【０１５５】
ステップＳ１１０において、識別器選択部６５は、カウンタｊがＬ以上であるか否かを判定する。ステップＳ１１０において、カウンタｊがＬ以上でないと判定された場合、ステップＳ１１１において、識別器選択部６５は、カウンタｊをインクリメントする。そして、その後、処理はステップＳ１０２に戻り、上述した処理が繰り返される。
【０１５６】
すなわち、新たに設定された学習画像毎の重みＷｉが用いられて、Ｎ個のペアｋについて、新たな弱識別器ｆ_jkが設定され、それらの弱識別器ｆ_jkから誤り率ｅ_jkが最小となる弱認識器ｆ_jkが選択される。そして、選択された弱認識器ｆ_jkにより、識別器が更新される。
【０１５７】
これに対して、ステップＳ１１０において、カウンタｊがＬ以上であると判定された場合、ステップＳ１１２において、識別器選択部６５は、保持している識別器および識別用特徴を識別器記憶部１２に出力する。
【０１５８】
以上の処理により、Ｌ個の比較的誤り率の低い弱識別器ｆ_j（１≦ｊ≦Ｌ）からなる識別器が識別器記憶部１２に供給されるとともに、それぞれの弱識別器ｆ_jで使用されるべき特徴点のペアｋの特徴量が識別器記憶部１２に供給される。ここでＬは、Ｌ≦Ｎである。
【０１５９】
なお、式（１４）の識別器を用いて、特徴量を代入した識別器が正である場合に「＋１」を出力し、識別器が負である場合に「−１」を出力する識別器（関数）を生成すると、その識別器は、Ｌ個の弱識別器の多数決により、認識しようとする対象物体の有無を出力する関数であると言える。また、図７のフローチャートを参照して説明した弱識別器を学習処理により重み付けしつつ付加することを繰り返し、識別器を生成する学習処理は、Discrete Adaboost Algorithmと呼ばれている。
【０１６０】
すなわち、以上の識別器生成処理により、誤り率の高い学習画像の特徴量の重みが順次大きくなり、誤り率の低い特徴量の重みが小さくなるように、特徴点のペア毎に弱識別器と誤り率が計算される処理が繰り返されることになる。したがって、繰り返し処理（ステップＳ１０２乃至Ｓ１１１の処理）の中で、弱識別器を設定する際に選択される特徴量（ステップＳ１０２で選択される特徴量）は、徐々に誤り率の高いものが選択されやすくなるので、認識し難い特徴量が繰り返されるほどに選択されて学習が繰り返されることになるため、認識し難い学習画像の特徴量がより多く選択されることになり、最終的に高い認識率にすることが可能となる。
【０１６１】
また、繰り返し処理（ステップＳ１０２乃至Ｓ１１１の処理）の中で、識別器選択部６５は、常に誤り率の最も低いペアに対応する弱識別器を選択することになるので、学習処理の繰り返しにより、常に信頼度の最も高い特徴点のペアについての弱識別器が選択されて識別器に加算されることになり、繰り返される毎に精度の高い弱識別器が順次加算されることになる。
【０１６２】
さらに、識別器は、特徴量を用いて画像に対象物体としての人が含まれているか否かを識別する識別器である。そして、識別器を構成する各弱識別器に代入される特徴量に対応する特徴点のペアは、特徴点のペアのうち、入力された画像から対象物体を検出するのに適したペアである。
【０１６３】
上述したように、入力された画像を、異なる解像度の画像にし、その異なる解像度の画像に対してフィルタ処理を施すことにより、計算効率を向上させることが可能となり、処理速度を向上させることが可能となる。よって、例えば、リアルタイムに人などの対象物を認識することが可能となる。
【０１６４】
例えば、複数のスケールの画像に、複数のフィルタを用いた処理を行うと、多くのフィルタ演算を必要とし、処理時間や処理能力が増大してしまう可能性があった。しかしながら本実施の形態のように、複数のスケールの画像に、１つのフィルタを用いた処理を行うため、換言すれば、畳み込みが１スケールですむため、多くの演算を必要とせず処理を行えるため、処理速度を向上させることが可能となる。
【０１６５】
また、マルチスケールフィルタの場合、周波数が低くなる（ガウス幅σが大きくなる）と、畳み込み演算に時間がかかるが、本実施の形態によれば、上記したように、１つのガウス幅でフィルタを構成することが可能であり、複数のガウス幅のフィルタを用意する必要がなく、複数のガウス幅のフィルタで演算する必要がない。よって、本実施の形態によれば、仮に、最も高周波のフィルタを１つだけ用意して処理したとしても、マルチスケールフィルタの場合に比べて、はるかに処理速度を向上させることが可能となる。
【０１６６】
［フィルタとして領域平均差分値を用いた場合について］
上記した例では、フィルタとして、図３や図４に示したような形状を有するフィルタを用いる場合を例にあげて説明した。次に、図１４に示したような形状のフィルタを用いた場合について説明を加える。
【０１６７】
図１４に示したフィルタＡは、所定の大きさの画像３０１（その画像内の所定の大きさの領域３０１）に、所定の間隔をあけて配置された、同じ大きさの領域３０２と領域３０３を有している。なお、以下の説明において、領域の大きさは、一例を示すものであり、限定を示すものではなく、例えば、領域３０２と領域３０３は、異なる大きさの領域であっても良い。
【０１６８】
領域３０２と領域３０３は、ともに縦方向（四角形を構成する長辺が、同一方向であり、その方向が図中縦方向）に配置されている。この配置も一例であり、領域間の間隔や配置位置、その配置方向など、限定を表すものではない。
【０１６９】
フィルタＡは、領域３０２内に位置する画素の画素値の総和（総和３０２とする）と、領域３０３内に位置する画素の画素値の総和（総和３０３とする）がそれぞれ算出され、その総和３０２から総和３０３が減算され、その差分値を特徴量とするためのフィルタである。総和３０２と総和３０３の差分の差分値の絶対値が特徴量とされることで、差分値の符号に依存する特徴量とならないため、絶対値が算出されるように構成されることが好ましい。
【０１７０】
図１４においては、白色で示した領域（フィルタＡでは、領域３０２）から、黒色で示した領域（フィルタＡでは、領域３０３）が減算されるとして説明を続ける。また、領域内の画素値の総和が算出されるとして説明をするが、総和ではなく、平均値でも良い。
【０１７１】
図１４に示したフィルタＢは、所定の大きさの画像３１１（その画像内の所定の大きさの領域３１１）に、所定の間隔をあけて配置された、異なる大きさの領域３１２と領域３１３を有している。また、領域３１２と領域３１３は、ともに縦方向（四角形を構成する長辺が、同一方向であり、その方向が図中縦方向）に配置されている。
【０１７２】
フィルタＢは、領域３１２内に位置する画素の画素値の総和から、領域３１３内に位置する画素の画素値の総和の差分を算出することで特徴量を算出するフィルタである。
【０１７３】
領域３１２と領域３１３は、異なる大きさであるので、例えば、領域３１２からは連続的に画素値を読み出し、領域３１３からは間引いて画素値を読み出すことで、領域内から読み出される画素値の個数を同一にして差分値が算出される。または、多重解像度画像が生成されるため、複数の多重解像度画像を用いて処理することで差分値が算出されるようにしても良い。
【０１７４】
例えば、領域３１３が、領域３１２の４倍の大きさであったとする。また、領域３１２を基準として、その領域３１２が適用される画像を基準画像とする。このとき、領域３１３が適用される画像は、基準画像の４倍に拡大された画像（多重解像度画像）とされる。このように多重解像度画像を利用することで、領域内から読み出される画像の個数などを同一にし、差分値が算出される。
【０１７５】
図１４に示したフィルタＣは、所定の大きさの画像３２１（その画像内の所定の大きさの領域３２１）に、所定の間隔をあけて配置された、異なる大きさ（同一の大きさの領域でも良い）の領域３２２乃至３２５を有している。また、領域３２２は、横方向（四角形を構成する長辺が、図中横方向）に配置され、領域３２３乃至３２５は、ともに縦方向（四角形を構成する長辺が、同一方向であり、その方向が図中縦方向）に配置されている。
【０１７６】
フィルタＣが適用された場合、まず、領域３２２内に位置する画素の画素値の総和（総和３２２とする）と、領域３２３内に位置する画素の画素値の総和（総和３２３とする）が算出され、総和３２２と総和３２３を加算した加算値（加算値３２２とする）が算出される。また同様に、領域３２４内に位置する画素の画素値の総和（総和３２４とする）と、領域３２５内に位置する画素の画素値の総和（総和３２５とする）が算出され、総和３２４と総和３２５を加算した加算値（加算値３２４とする）が算出される。
【０１７７】
加算値３２２と加算値３２４が算出されると、それらの差分が算出され、その差分値の絶対値が算出される。フィルタＣは、その算出された絶対値を特徴量とするフィルタである。領域３２２乃至３２５は、それぞれ異なる大きさの領域のため、フィルタＢのところで説明したように、各領域の大きさにあった多重解像度画像に対して、領域３２２乃至３２５がそれぞれ適用され、領域内の総和が算出される。
【０１７８】
図１４に示したフィルタＤは、所定の大きさの画像３３１（その画像内の所定の大きさの領域３３１）に、所定の間隔をあけて配置された、異なる大きさ（同一の大きさの領域でも良い）の領域３３２乃至３３４を有している。また、領域３３２は、横方向（四角形を構成する長辺が、図中横方向）に配置され、領域３３３，３３４は、ともに縦方向（四角形を構成する長辺が、同一方向であり、その方向が図中縦方向）に配置されている。また、領域３３３と領域３３４の一部分は、重なった状態で配置されている。
【０１７９】
フィルタＤが適用された場合、領域３３２内に位置する画素の画素値の総和（総和３３２とする）と、領域３３３内に位置する画素の画素値の総和（総和３３３とする）が算出され、総和３３２と総和３３３を加算した加算値（加算値３３２とする）が算出される。また同様に、領域３３４内に位置する画素の画素値の総和（総和３３４とする）が算出される。
【０１８０】
加算値３３２と加算値３３４が算出されると、それらの差分が算出され、その差分値の絶対値が算出される。フィルタＤは、その算出された絶対値を特徴量とするフィルタである。領域３３２乃至３３５は、それぞれ異なる大きさの領域のため、フィルタＢのところで説明したように、各領域の大きさにあった多重解像度画像に対して、領域３３２乃至３３４がそれぞれ適用され、領域内の総和が算出される。
【０１８１】
図１４に示したフィルタＥは、所定の大きさの画像３４１（その画像内の所定の大きさの領域３４１）に、所定の間隔をあけて配置された、異なる大きさ（同一の大きさの領域でも良い）の領域３４２と領域３４３を有している。また、領域３４２と領域３４３は、ともに縦方向（四角形を構成する長辺が、同一方向であり、その方向が図中縦方向）に配置されている。また、領域３４２は、領域３４３に含まれる状態（全てが重なった状態）で配置されている。
【０１８２】
フィルタＥが適用された場合、まず、領域３４２内に位置する画素の画素値の総和（総和３４２とする）が算出され、領域３４３内に位置する画素の画素値の総和（総和３４３とする）が算出される。総和３４２と総和３４３が算出されると、それらの差分が算出され、その差分値の絶対値が算出される。フィルタＥは、その算出された絶対値を特徴量とするフィルタである。領域３４２と領域３４３は、それぞれ異なる大きさの領域のため、フィルタＢのところで説明したように、各領域の大きさにあった多重解像度画像に対して、領域３４２、領域３４３がそれぞれ適用され、領域内の総和が算出される。
【０１８３】
図１４に示したフィルタＦは、所定の大きさの画像３５１（その画像内の所定の大きさの領域３５１）に、所定の間隔をあけて配置された、同一の大きさの領域３５２と領域３５３を有している。また、領域３５２は、領域３５１内で斜めに配置され、その傾きは、図１４に示した例では、図中右側が上になるような傾きである。また、領域３５３は、縦方向（四角形を構成する長辺が、図中縦方向）に配置されている。
【０１８４】
フィルタＦが適用された場合、まず、領域３５２内に位置する画素の画素値の総和（総和３５２とする）が算出され、領域３５３内に位置する画素の画素値の総和（総和３５３とする）が算出される。総和３５２と総和３５３が算出されると、それらの差分が算出され、その差分値の絶対値が算出される。フィルタＦは、その算出された絶対値を特徴量とするフィルタである。
【０１８５】
図１４に示したフィルタＧは、所定の大きさの画像３６１（その画像内の所定の大きさの領域３６１）に、所定の間隔をあけて配置された、異なる大きさの領域３６２と領域３６３を有している。また、領域３６２と領域３６３は、ともに領域３６１内で斜めに配置され、その傾きは、図１４に示した例では、図中右側が上になるような傾きである。
【０１８６】
フィルタＧが適用された場合、領域３６２内に位置する画素の画素値の総和（総和３６２とする）が算出され、領域３６３内に位置する画素の画素値の総和（総和３６３とする）が算出される。総和３６２と総和３６３が算出されると、それらの差分が算出され、その差分値の絶対値が算出される。フィルタＧは、その算出された絶対値を特徴量とするフィルタである。領域３６２と領域３６３は、それぞれ異なる大きさの領域のため、フィルタＢのところで説明したように、各領域の大きさにあった多重解像度画像に対して、領域３６２、領域３６３がそれぞれ適用され、領域内の総和が算出される。
【０１８７】
図１４に示したフィルタＨは、所定の大きさの画像３７１（その画像内の所定の大きさの領域３７１）に、所定の間隔をあけて配置された、異なる大きさ（同一の大きさの領域でも良い）の領域３７２乃至３７５を有している。また、領域３７２乃至３７４は、領域３７１内で斜めに配置され、その傾きは、図１４に示した例では、図中左側が上になるような傾きである。また、領域３７５は、領域３７１内で斜めに配置され、その傾きは、図１４に示した例では、図中右側が上になるような傾きである。
【０１８８】
フィルタＨが適用された場合、領域３７２内に位置する画素の画素値の総和（総和３７２とする）と、領域３７３内に位置する画素の画素値の総和（総和３７３とする）が算出され、総和３７２と総和３７３を加算した加算値（加算値３７２とする）が算出される。また同様に、領域３７４内に位置する画素の画素値の総和（総和３７４とする）と、領域３７５内に位置する画素の画素値の総和（総和３７５とする）が算出され、総和３７４と総和３７５を加算した加算値（加算値３７４とする）が算出される。
【０１８９】
加算値３７２と加算値３７４が算出されると、それらの差分が算出され、その差分値の絶対値が算出される。フィルタＨは、その算出された絶対値を特徴量とするフィルタである。領域３７２乃至３７５は、それぞれ異なる大きさの領域のため、フィルタＢのところで説明したように、各領域の大きさにあった多重解像度画像に対して、領域３７２乃至３７５がそれぞれ適用され、領域内の総和が算出される。
【０１９０】
図１４に示したフィルタＩは、所定の大きさの画像３８１（その画像内の所定の大きさの領域３８１）に、所定の間隔をあけて配置された、異なる大きさ（同一の大きさの領域でも良い）の領域３８２乃至３８４を有している。また、領域３８２は、領域３８１内で斜めに配置され、その傾きは、図１４に示した例では、図中左側が上になるような傾きである。領域３８３，３８４は、ともに縦方向（四角形を構成する長辺が、同一方向であり、その方向が図中縦方向）に配置されている。また、領域３８３と領域３８４の一部分は、重なった状態で配置されている。
【０１９１】
フィルタＩが適用された場合、領域３８２内に位置する画素の画素値の総和（総和３８２とする）と、領域３８３内に位置する画素の画素値の総和（総和３８３とする）が算出され、総和３８２と総和３８３を加算した加算値（加算値３８２とする）が算出される。また同様に、領域３８４内に位置する画素の画素値の総和（総和３８４とする）を算出する。
【０１９２】
加算値３８２と加算値３８４が算出されると、それらの差分が算出され、その差分値の絶対値が算出される。フィルタＩは、その算出された絶対値を特徴量とするフィルタである。領域３８２乃至３８５は、それぞれ異なる大きさの領域のため、フィルタＢのところで説明したように、各領域の大きさにあった多重解像度画像に対して、領域３８２乃至３８４がそれぞれ適用され、領域内の総和が算出される。
【０１９３】
図１４に示したフィルタＪは、所定の大きさの画像３９１（その画像内の所定の大きさの領域３９１）に、所定の間隔をあけて配置された、異なる大きさ（同一の大きさの領域でも良い）の領域３９２と領域３９３を有している。また、領域３９２は、領域３９１内で斜めに配置され、その傾きは、図１４に示した例では、図中右側が上になるような傾きである。また、領域３９３は、縦方向（四角形を構成する長辺が、図中縦方向）に配置されている。
【０１９４】
フィルタＪが適用された場合、領域３９２内に位置する画素の画素値の総和（総和３９２とする）が算出され、領域３９３内に位置する画素の画素値の総和（総和３９３とする）が算出される。総和３９２と総和３９３が算出されると、それらの差分が算出され、その差分値の絶対値が算出される。フィルタＪは、その算出された絶対値を特徴量とするフィルタである。領域３９２と領域３９３は、それぞれ異なる大きさの領域のため、フィルタＢのところで説明したように、各領域の大きさにあった多重解像度画像に対して、領域３９２、領域３９３がそれぞれ適用され、領域内の総和が算出される。
【０１９５】
このように、図１４に示したフィルタは、２以上の領域を備え、領域内の画素値の総和（または平均値）が算出され、その算出された総和の差分値の絶対値を特徴量とするようなフィルタである。また、それぞれの領域は、矩形とされ、その配置位置は、連続する（隣接する）必要性はなく、離れた位置に配置されていても良い。さらに、多重解像度画像を生成し、利用することで、異なる大きさの領域を有するフィルタを構成することも可能である。
【０１９６】
図１５は、図１４に示したようなフィルタを用いた場合の特徴量計算部２４の構成を示す図である。図１５に示した特徴量計算部２４は、画素値加算部４１１と差分値算出部４１２を備える。画素値加算部４１１は、特徴点抽出部２３（図１）から供給される特徴点の画素値を加算する。
【０１９７】
例えば、フィルタＡ（図１４）が用いられる場合、特徴点抽出部２３は、領域３０２内に位置する画素を特徴点として抽出するとともに、その特徴点の画素値を特徴量計算部２４の画素値加算部４１１に供給する。画素値加算部４１１は、供給される画素値を足し合わせることで、領域３０２内の画素値の総和を算出する。同様に、特徴点抽出部２３は、領域３０３内に位置する画素を特徴点として抽出するとともに、その特徴点の画素値を特徴量計算部２４の画素値加算部４１１に供給する。画素値加算部４１１は、供給される画素値を足し合わせることで、領域３０３内の画素値の総和を算出する。
【０１９８】
また、画素値加算部４１１は、例えば、フィルタＣのように、２以上の領域を備えるフィルタで特徴量を算出するときには、各領域の画素値の総和を、必要に応じて加算するといった処理も行う。例えば、フィルタＣが適用された場合、領域３２２の総和と領域３２３の総和が加算され、領域３２４の総和と領域３２５の総和が加算されるという処理も、画素値加算部４１１は行う。
【０１９９】
なお、フィルタＢのような領域３２１と領域３１３の大きさが異なるような場合、特徴点抽出部２３は、特徴点を抽出する画像（画素値を読み出す画像）を、領域の大きさに適した画像とするために、多重解像度画像生成部２２で生成される多重解像度画像から、領域の大きさに適した多重解像度画像を選択するという処理も含まれる。または、多重解像度画像生成部２２は、特徴点抽出部２３が適用するフィルタの領域に適した多重解像度画像を生成し、供給するように構成される。
【０２００】
特徴量計算部２４の画素値加算部４１１により算出された総和は、差分値算出部４１２に供給される。差分値算出部４１２は、供給された総和同士の差分を演算し、その差分値の絶対値を特徴量として、識別器生成部２５に供給する。
【０２０１】
このようにして算出された特徴量を用いて、識別器生成部２５は識別器を生成する。識別器生成部２５は、図５に示した識別器生成部２５と同様の構成とすることができ、その処理は、図８のフローチャートを参照して説明したので、ここでは、その説明を省略する。
【０２０２】
［フィルタとしてヒストグラムを用いた場合について］
上記した例では、フィルタとして、図３、図４、または図１４に示したような形状を有するフィルタを用いる場合を例にあげて説明した。次に、図１６に示したような形状のフィルタを用いた場合について説明を加える。
【０２０３】
図１６に示したフィルタＡは、所定の大きさの画像５０１（その画像内の所定の大きさの領域５０１）に、所定の間隔をあけて配置された、同じ大きさの領域５０２と領域５０３を有している。また、領域５０２と領域５０３は、ともに縦方向（四角形を構成する長辺が、同一方向であり、その方向が図中縦方向）に配置されている。
【０２０４】
フィルタＡが適用された場合、領域５０２内に位置する画素の画素値からヒストグラムが作成され、その値（値５０２とする）が算出される。同様に、領域５０３内に位置する画素の画素値からヒストグラムが作成され、その値（値５０３とする）が算出される。そして、値５０２から値５０３が減算されることで差分値が算出される。フィルタＡは、その差分値を特徴量とするフィルタである。
【０２０５】
値５０２と値５０３の差分の差分値の絶対値が特徴量とされることで、差分値の符号に依存する特徴量とならないため、絶対値が算出されるように構成されることが好ましい。以下の説明においては、絶対値が算出されるとして説明する。
【０２０６】
図１６においては、白色で示した領域（フィルタＡでは、領域５０２）から算出された値から、黒色で示した領域（フィルタＡでは、領域５０３）から算出された値が減算されるとして説明を続ける。また、領域内の画素値のヒストグラムの値が算出されるとして説明をするが、ヒストグラムとしては、SIFT（Scale-Invariant Feature Transform）や、HOG（Histograms of Oriented Gradients）に基づくヒストグラムを用いることが可能である。
【０２０７】
図１６に示したフィルタＢは、所定の大きさの画像５１１（その画像内の所定の大きさの領域５１１）に、所定の間隔をあけて配置された、異なる大きさの領域５１２と領域５１３を有している。また、領域５１２と領域５１３は、ともに縦方向（四角形を構成する長辺が、同一方向であり、その方向が図中縦方向）に配置されている。
【０２０８】
フィルタＢが適用された場合、領域５１２内に位置する画素の画素値からヒストグラムが作成され、その値（値５１２とする）が算出される。また、同様に、領域５１３内に位置する画素の画素値からヒストグラムが作成され、その値（値５１３とする）が算出される。そして、値５１２と値５１３の差分値が算出され、その差分値の絶対値がさらに算出される。フィルタＢは、算出された絶対値を特徴量とすることで、特徴量を算出するためのフィルタである。
【０２０９】
領域５１２と領域５１３は、異なる大きさであるので、例えば、領域５１２からは連続的に画素値を読み出し、領域５１３からは間引いて画素値を読み出すことで、領域内から読み出される画素値の個数を同一にして差分値が算出される。または、多重解像度画像が生成されるため、複数の多重解像度画像を用いて処理することで差分値が算出されるようにしても良い。すなわち、例えば、領域５１３が、領域５１２の４倍の大きさであったとする。また、領域５１２を基準として、その領域５１２が適用される画像を基準画像とする。このとき、領域５１３が適用される画像は、基準画像の４倍に拡大された画像（多重解像度画像）とされる。このように多重解像度画像を利用することで、領域内から読み出される画像の個数などを同一にし、差分値が算出される。
【０２１０】
図１６に示したフィルタＣは、所定の大きさの画像５２１（その画像内の所定の大きさの領域５２１）に、所定の間隔をあけて配置された、異なる大きさ（同一の大きさの領域でも良い）の領域５２２乃至５２５を有している。また、領域５２２は、横方向（四角形を構成する長辺が、図中横方向）に配置され、領域５２３乃至５２５は、ともに縦方向（四角形を構成する長辺が、同一方向であり、その方向が図中縦方向）に配置されている。
【０２１１】
フィルタＣが適用された場合、領域５２２内に位置する画素の画素値からヒストグラムが作成され、その値（値５２２とする）が算出される。同様に、領域５２３内に位置する画素の画素値のヒストグラムが作成され、その値（値５２３とする）が算出される。そして、値５２２と値５２３を加算した加算値（加算値３２２とする）が算出される。
【０２１２】
また同様に、領域５２４内に位置する画素の画素値からヒストグラムが作成され、その値（値５２４とする）が算出される。同様に、領域５２５内に位置する画素の画素値のヒストグラムが作成され、その値（値５２５とする）が算出される。そして、値５２４と値５２５を加算した加算値（加算値５２４とする）が算出される。
【０２１３】
加算値５２２と加算値５２４が算出されると、それらの差分が算出され、その差分値の絶対値が算出される。フィルタＣは、その算出された絶対値を特徴量とするフィルタである。領域５２２乃至５２５は、それぞれ異なる大きさの領域のため、フィルタＢのところで説明したように、各領域の大きさにあった多重解像度画像に対して、領域５２２乃至５２５がそれぞれ適用され、領域内のヒストグラムが作成され、その値が算出される。
【０２１４】
図１６に示したフィルタＤは、所定の大きさの画像５３１（その画像内の所定の大きさの領域５３１）に、所定の間隔をあけて配置された、異なる大きさ（同一の大きさの領域でも良い）の領域５３２乃至５３４を有している。また、領域５３２は、横方向（四角形を構成する長辺が、図中横方向）に配置され、領域５３３，５３４は、ともに縦方向（四角形を構成する長辺が、同一方向であり、その方向が図中縦方向）に配置されている。また、領域５３３と領域５３４の一部分は、重なった状態で配置されている。
【０２１５】
フィルタＤが適用された場合、領域５３２内に位置する画素の画素値からヒストグラムが作成され、その値（値５３２とする）が算出される。同様に、領域５３３内に位置する画素の画素値のヒストグラムが作成され、その値（値５３３とする）が算出される。そして、値５３２と値５３３が加算された加算値（加算値５３２とする）が算出される。また同様に、領域５３４内に位置する画素の画素値からヒストグラムが作成され、その値（値５３４とする）が算出される。
【０２１６】
加算値５３２と加算値５３４が算出されると、それらの差分が算出され、その差分値の絶対値が算出される。フィルタＤは、その算出された絶対値を特徴量とするフィルタである。領域５３２乃至５３５は、それぞれ異なる大きさの領域のため、フィルタＢのところで説明したように、各領域の大きさにあった多重解像度画像に対して、領域５３２乃至５３４がそれぞれ適用され、領域内のヒストグラムの値が算出される。
【０２１７】
図１６に示したフィルタＥは、所定の大きさの画像５４１（その画像内の所定の大きさの領域５４１）に、所定の間隔をあけて配置された、異なる大きさ（同一の大きさの領域でも良い）の領域５４２と領域５４３を有している。また、領域５４２と領域５４３は、ともに縦方向（四角形を構成する長辺が、同一方向であり、その方向が図中縦方向）に配置されている。また、領域５４２は、領域５４３に含まれる状態（全てが重なった状態）で配置されている。
【０２１８】
フィルタＥが適用された場合、領域５４２内に位置する画素の画素値からヒストグラムが作成され、その値（値５４２とする）が算出され、領域５４３内に位置する画素の画素値からヒストグラムが作成され、その値（値５４３とする）が算出される。値５４２と値５４３が算出されると、それらの差分が算出され、その差分値の絶対値が算出される。フィルタＥは、その算出された絶対値を特徴量とするフィルタである。領域５４２と領域５４３は、それぞれ異なる大きさの領域のため、フィルタＢのところで説明したように、各領域の大きさにあった多重解像度画像に対して、領域５４２、領域５４３がそれぞれ適用され、領域内のヒストグラムの値が算出される。
【０２１９】
図１６に示したフィルタＦは、所定の大きさの画像５５１（その画像内の所定の大きさの領域５５１）に、所定の間隔をあけて配置された、同一の大きさの領域５５２と領域５５３を有している。また、領域５５２は、領域５５１内で斜めに配置され、その傾きは、図１６に示した例では、図中右側が上になるような傾きである。また、領域５５３は、縦方向（四角形を構成する長辺が、図中縦方向）に配置されている。
【０２２０】
フィルタＦが適用された場合、領域５５２内に位置する画素の画素値からヒストグラムが作成され、その値（値５５２とする）が算出され、領域５５３内に位置する画素の画素値からヒストグラムが作成され、その値（値５５３とする）が算出される。値５５２と値５５３が算出されると、それらの差分が算出され、その差分値の絶対値が算出される。フィルタＦは、その算出された絶対値を特徴量とするフィルタである。
【０２２１】
図１６に示したフィルタＧは、所定の大きさの画像５６１（その画像内の所定の大きさの領域５６１）に、所定の間隔をあけて配置された、異なる大きさの領域５６２と領域５６３を有している。また、領域５６２と領域５６３は、ともに領域５６１内で斜めに配置され、その傾きは、図１６に示した例では、図中右側が上になるような傾きである。
【０２２２】
フィルタＧが適用された場合、領域５６２内に位置する画素の画素値からヒストグラムが作成され、その値（値５６２とする）が算出され、領域５６３内に位置する画素の画素値からヒストグラムが作成され、その値（値５６３とする）が算出される。値５６２と値５６３が算出されると、それらの差分が算出され、その差分値の絶対値が算出される。フィルタＧは、その算出された絶対値を特徴量とするフィルタである。領域５６２と領域５６３は、それぞれ異なる大きさの領域のため、フィルタＢのところで説明したように、各領域の大きさにあった多重解像度画像に対して、領域５６２、領域５６３がそれぞれ適用され、領域内のヒストグラムの値が算出される。
【０２２３】
図１６に示したフィルタＨは、所定の大きさの画像５７１（その画像内の所定の大きさの領域５７１）に、所定の間隔をあけて配置された、異なる大きさ（同一の大きさの領域でも良い）の領域５７２乃至５７５を有している。また、領域５７２乃至５７４は、領域５７１内で斜めに配置され、その傾きは、図１６に示した例では、図中左側が上になるような傾きである。また、領域５７５は、領域５７１内で斜めに配置され、その傾きは、図１６に示した例では、図中右側が上になるような傾きである。
【０２２４】
フィルタＨが適用された場合、領域５７２内に位置する画素の画素値からヒストグラムが作成され、その値（値５７２とする）が算出される。同様に、領域５７３内に位置する画素の画素値のヒストグラムが作成され、その値（値５７３とする）が算出される。そして、値５７２と値５７３が加算された加算値（加算値５７２とする）が算出される。
【０２２５】
また同様に、領域５７４内に位置する画素の画素値からヒストグラムが作成され、その値（値５７４とする）が算出される。同様に、領域５７５内に位置する画素の画素値のヒストグラムが作成され、その値（値５７５とする）が算出される。そして、値５７４と値５７５が加算された加算値（加算値５７４とする）が算出される。
【０２２６】
加算値５７２と加算値５７４が算出されると、それらの差分が算出され、その差分値の絶対値が算出される。フィルタＨは、その算出された絶対値を特徴量とするフィルタである。領域５７２乃至５７５は、それぞれ異なる大きさの領域のため、フィルタＢのところで説明したように、各領域の大きさにあった多重解像度画像に対して、領域５７２乃至５７５がそれぞれ適用され、領域内のヒストグラムの値が算出される。
【０２２７】
図１６に示したフィルタＩは、所定の大きさの画像５８６（その画像内の所定の大きさの領域５８６）に、所定の間隔をあけて配置された、異なる大きさ（同一の大きさの領域でも良い）の領域５８２乃至５８４を有している。また、領域５８２は、領域５８１内で斜めに配置され、その傾きは、図１６に示した例では、図中左側が上になるような傾きである。領域５８３，５８４は、ともに縦方向（四角形を構成する長辺が、同一方向であり、その方向が図中縦方向）に配置されている。また、領域５８３と領域５８４の一部分は、重なった状態で配置されている。
【０２２８】
フィルタＩが適用された場合、領域５８２内に位置する画素の画素値からヒストグラムが作成され、その値（値５８２とする）が算出される。同様に、領域５８３内に位置する画素の画素値のヒストグラムが作成され、その値（値５８３とする）が算出される。そして、値５８２と値５８３が加算された加算値（加算値５８２とする）が算出される。また同様に、領域５８４内に位置する画素の画素値からヒストグラムが作成され、その値（値５８４とする）が算出される。
【０２２９】
加算値５８２と加算値５８４が算出されると、それらの差分が算出され、その差分値の絶対値が算出される。フィルタＩは、その算出された絶対値を特徴量とするフィルタである。領域５８２乃至５８５は、それぞれ異なる大きさの領域のため、フィルタＢのところで説明したように、各領域の大きさにあった多重解像度画像に対して、領域５８２乃至５８４がそれぞれ適用され、領域内のヒストグラムの値が算出される。
【０２３０】
図１６に示したフィルタＪは、所定の大きさの画像５９１（その画像内の所定の大きさの領域５９１）に、所定の間隔をあけて配置された、異なる大きさ（同一の大きさの領域でも良い）の領域５９２と領域５９３を有している。また、領域５９２は、領域５９１内で斜めに配置され、その傾きは、図１６に示した例では、図中右側が上になるような傾きである。また、領域５９３は、縦方向（四角形を構成する長辺が、図中縦方向）に配置されている。
【０２３１】
フィルタＪが適用された場合、領域５９２内に位置する画素の画素値からヒストグラムが作成され、その値（値５９２とする）が算出され、領域５９３内に位置する画素の画素値からヒストグラムが作成され、その値（値５９３とする）が算出される。値５９２と値５９３が算出されると、それらの差分が算出され、その差分値の絶対値が算出される。フィルタＪは、その算出された絶対値を特徴量とするフィルタである。領域５９２と領域５９３は、それぞれ異なる大きさの領域のため、フィルタＢのところで説明したように、各領域の大きさにあった多重解像度画像に対して、領域５９２、領域５９３がそれぞれ適用され、領域内のヒストグラムの値が算出される。
【０２３２】
このように、図１６に示したフィルタは、２以上の領域を備え、領域内の画素値のヒストグラムが作成され、その値が算出され、その算出された値の差分値の絶対値を特徴量とするようなフィルタである。また、それぞれの領域は、矩形とされ、その配置位置は、連続する（隣接する）必要性はなく、離れた位置に配置されていても良い。さらに、多重解像度画像を生成し、利用することで、異なる大きさの領域を有するフィルタを構成することも可能である。
【０２３３】
なお、上述した実施の形態においては、２以上の領域を備え、領域内の画素値のヒストグラムが作成されるとしたが、ヒストグラムの和が１になるように正規化することでヒストグラムの値が算出されるようにしても良い。ヒストグラムの和が１になるように正規化され、その正規化後のヒストグラムの値が用いられ、上記したような演算、すなわち、領域間の差分が算出され、絶対値が算出されるという演算が行われるようにしても良い。
【０２３４】
そのように、ヒストグラムの和が１になるように正規化することで、例えば、フィルタＢのような異なる領域の領域５１２と領域５１３を備えるようなフィルタを適用した場合であっても、同じ尺度で比較することが可能となる。同じ尺度で比較するとは、例えば、同一の解像度の多重解像度画像を用いて処理することなどを意味する。同一の解像度の多重解像度画像を用いて処理することで、複数の解像度の多重解像度画像を用いて処理する場合よりも、処理工程を減らすことができ、処理速度を向上させることが可能になる。
【０２３５】
図１７は、図１６に示したようなフィルタを用いた場合の特徴量計算部２４の構成を示す図である。図１７に示した特徴量計算部２４は、ヒストグラム作成部６１１と差分値算出部６１２を備える。ヒストグラム作成部６１１は、特徴点抽出部２３（図１）から供給される特徴点の画素値からヒストグラムを作成し、その値を算出する。
【０２３６】
例えば、フィルタＡ（図１６）が適用される場合、特徴点抽出部２３は、領域５０２内に位置する画素を特徴点として抽出するとともに、その特徴点の画素値を特徴量計算部２４のヒストグラム作成部６１１に供給する。ヒストグラム作成部６１１は、供給される画素値からヒストグラムを作成し、その値を算出する。同様に、特徴点抽出部２３は、領域５０３内に位置する画素を特徴点として抽出するとともに、その特徴点の画素値を特徴量計算部２４のヒストグラム作成部６１１に供給する。ヒストグラム作成部６１１は、供給される画素値からヒストグラムを作成し、その値を算出する。
【０２３７】
また、ヒストグラム作成部６１１は、例えば、フィルタＣのように、２以上の領域を備えるフィルタで特徴量を算出するときには、各領域の画素値のヒストグラムの値を、必要に応じて加算するといった処理も行う。例えば、フィルタＣが適用された場合、領域５２２のヒストグラムの値と領域５２３のヒストグラムの値が加算され、領域５２４のヒストグラムの値と領域５２５のヒストグラムの値が加算されるという処理も、ヒストグラム作成部６１１は行う。
【０２３８】
なお、フィルタＢのような領域５２１と領域５１３の大きさが異なるような場合、特徴点抽出部２３は、特徴点を抽出する画像（画素値を読み出す画像）を、領域の大きさに適した画像とするために、多重解像度画像生成部２２で生成される多重解像度画像から、領域の大きさに適した多重解像度画像を選択するという処理も含まれる。または、多重解像度画像生成部２２は、特徴点抽出部２３が適用するフィルタの領域に適した多重解像度画像を生成し、供給するように構成されている。
【０２３９】
または、ヒストグラム作成部６１１が、ヒストグラムの和が１となるように正規化を行うように構成されている場合、異なる大きさのフィルタを適用した場合であっても、同一の解像度の多重解像度画像を用いて処理することができる。このような場合、特徴点抽出部２３は、多重解像度画像生成部２２から供給される多重解像度画像のうち、１の多重解像度画像を選択し、その選択された多重解像度画像から特徴点を抽出し、ヒストグラム作成部６１１に供給する。また、このようにした場合、ヒストグラム生成部６１１は、複数の多重解像度画像を用いて、それぞれの多重解像度画像に対して、同一のフィルタを適用して、特徴量を算出するようにしても良い。
【０２４０】
特徴量計算部２４のヒストグラム作成部６１１により算出されたヒストグラムの値は、差分値算出部６１２に供給される。差分値算出部６１２は、供給されたヒストグラムの値同士の差分を演算し、その差分値の絶対値を特徴量として、識別器生成部２５に供給する。
【０２４１】
このようにして算出された特徴量を用いて、識別器生成部２５は識別器を生成する。識別器生成部２５は、図５に示した識別器生成部２５と同様の構成とすることができ、その処理は、図８のフローチャートを参照して説明したので、ここでは、その説明を省略する。
【０２４２】
［フィルタとして領域差分値を用いた場合について］
上記した例では、フィルタとして、図３、図４、図１４、図１６に示したような形状を有するフィルタを用いる場合を例にあげて説明した。次に、図１８に示したような形状のフィルタを用いた場合について説明を加える。
【０２４３】
図１８に示したフィルタＡは、所定の大きさの画像７０１（その画像内の所定の大きさの領域７０１）に、所定の間隔をあけて配置された、同じ大きさの領域７０２と領域７０３を有している。また、領域７０２と領域７０３は、ともに縦方向（四角形を構成する長辺が、同一方向であり、その方向が図中縦方向）に配置されている。
【０２４４】
フィルタＡは、領域７０２内に位置する画素の画素値と、領域７０３内に位置する画素の画素値との差分値が算出され、その差分値が特徴量とされるフィルタである。領域７０２と領域７０３が同一の大きさの領域である場合、領域内の対応する位置に位置する画素同士が比較対象とされ、その差分値が算出される。
【０２４５】
差分値の絶対値が特徴量とされることで、差分値の符号に依存する特徴量とならないため、絶対値が算出されるように構成されることが好ましい。以下の説明においては、絶対値が算出されるとして説明を続ける。また、画素値として輝度値を用いることができる。
【０２４６】
図１８に示したフィルタＢは、所定の大きさの画像７１１（その画像内の所定の大きさの領域７１１）に、所定の間隔をあけて配置された、異なる大きさの領域７１２と領域７１３を有している。また、領域７１２と領域７１３は、ともに縦方向（四角形を構成する長辺が、同一方向であり、その方向が図中縦方向）に配置されている。
【０２４７】
フィルタＢは、領域７１２内に位置する画素の画素値と、領域７１３内に位置する画素の画素値との差分が算出されることで特徴量が算出されるようにするためのフィルタである。
【０２４８】
領域７１２と領域７１３は、異なる大きさであるので、例えば、領域７１２からは連続的に画素値を読み出し、領域７１３からは間引いて画素値を読み出すことで、領域内から読み出される画素値の個数を同一にして差分値が算出される。または、多重解像度画像が生成されるため、複数の多重解像度画像を用いて処理することで差分値が算出されるようにしても良い。すなわち、例えば、領域７１３が、領域７１２の４倍の大きさであったとする。また、領域７１２を基準として、その領域７１２が適用される画像を基準画像とする。このとき、領域７１３が適用される画像は、基準画像の４倍に拡大された画像（多重解像度画像）とされる。このように多重解像度画像を利用することで、領域内から読み出される画像の個数などを同一にし、差分値が算出される。
【０２４９】
図１８に示したフィルタＣは、所定の大きさの画像７２１（その画像内の所定の大きさの領域７２１）に、所定の間隔をあけて配置された、異なる大きさ（同一の大きさの領域でも良い）の領域７２２乃至７２５を有している。また、領域７２２は、横方向（四角形を構成する長辺が、図中横方向）に配置され、領域７２３乃至７２５は、ともに縦方向（四角形を構成する長辺が、同一方向であり、その方向が図中縦方向）に配置されている。
【０２５０】
フィルタＣが適用された場合、領域７２２内に位置する画素の画素値と、領域７２３内に位置する画素の画素値、領域７２４内に位置する画素の画素値、および領域７２５内に位置する画素値の差分値を算出する。このように２以上の領域がフィルタに含まれる場合、基準となる領域に位置する画素値から、順に、他の領域に位置する画素値が減算されることで差分値が算出される。または、２つの領域から画素値の差分値が算出され、差分値同士の差分値がさらに算出されるようにしても良い。
【０２５１】
図１８に示すフィルタは、所定の領域に位置する画素値同士の差分値を算出することで特徴量を算出するのであり、その差分値の出し方、例えば、どの領域からどの領域の差分値を算出するかなどは、適宜変更可能である。また、そのような差分値の出し方も、フィルタの特徴の１つとして利用することができる。
【０２５２】
例えば、領域３２２から領域３２３、領域３２４、領域３２５の順で減算する場合と、領域３２２から領域３２３、領域３２４、領域３２５の順で減算する場合とで、異なる特徴量が取得でき、それらの特徴量の違いから、検出できる物体や輪郭が異なる可能性がある。よって、同一のフィルタであっても、差分値の算出の仕方など変えて学習するようにしても良い。他のフィルタについても同様に、算出の仕方については様々な仕方が適用可能であるが、以下の説明においては、所定の領域を基準とし、その領域から順次減算されることで差分値が算出されるとして説明を続ける。
【０２５３】
図１８に示したフィルタＤは、所定の大きさの画像７３１（その画像内の所定の大きさの領域７３１）に、所定の間隔をあけて配置された、異なる大きさ（同一の大きさの領域でも良い）の領域７３２乃至７３４を有している。また、領域７３２は、横方向（四角形を構成する長辺が、図中横方向）に配置され、領域７３３，７３４は、ともに縦方向（四角形を構成する長辺が、同一方向であり、その方向が図中縦方向）に配置されている。また、領域７３３と領域７３４の一部分は、重なった状態で配置されている。
【０２５４】
フィルタＤが適用された場合、領域７３２内に位置する画素の画素値、領域７３３内に位置する画素値、および領域７３４内に位置する画素値の差分値が算出され、その差分値の絶対値が算出される。フィルタＤは、その算出される絶対値を特徴量とするためのフィルタである。領域７３２乃至７３３は、それぞれ異なる大きさの領域のため、フィルタＢのところで説明したように、各領域の大きさにあった多重解像度画像に対して、領域７３２乃至７３４がそれぞれ適用され、領域内の画素値同士の差分値が算出される。
【０２５５】
図１８に示したフィルタＥは、所定の大きさの画像７４１（その画像内の所定の大きさの領域７４１）に、所定の間隔をあけて配置された、異なる大きさ（同一の大きさの領域でも良い）の領域７４２と領域７４３を有している。また、領域７４２と領域７４３は、ともに縦方向（四角形を構成する長辺が、同一方向であり、その方向が図中縦方向）に配置されている。また、領域７４２は、領域７４３に含まれる状態（全てが重なった状態）で配置されている。
【０２５６】
フィルタＥは、領域７４２内に位置する画素の画素値、領域７４３内に位置する画素の画素値との差分値が算出され、その差分値の絶対値を特徴量とするためのフィルタである。領域７４２と領域７４３は、それぞれ異なる大きさの領域のため、フィルタＢのところで説明したように、各領域の大きさにあった多重解像度画像に対して、領域７４２、領域７４３がそれぞれ適用され、領域内の画素値同士の差分値が算出される。
【０２５７】
図１８に示したフィルタＦは、所定の大きさの画像７５１（その画像内の所定の大きさの領域７５１）に、所定の間隔をあけて配置された、同一の大きさの領域７５２と領域７５３を有している。また、領域７５２は、領域７５１内で斜めに配置され、その傾きは、図１８に示した例では、図中右側が上になるような傾きである。また、領域７５３は、縦方向（四角形を構成する長辺が、図中縦方向）に配置されている。
【０２５８】
フィルタＦは、領域７５２内に位置する画素の画素値と、領域７５３内に位置する画素の画素値との差分値が算出され、その差分値の絶対値を特徴量とするためのフィルタである。フィルタＦでは、領域７５２が斜め方向に配置されているが、領域７５２が領域７５３と同一方向に配置されていると仮定したときに、領域内の画素の位置が、対応している位置に存在している画素同士が比較され、差分値が算出される。
【０２５９】
図１８に示したフィルタＧは、所定の大きさの画像７６１（その画像内の所定の大きさの領域７６１）に、所定の間隔をあけて配置された、異なる大きさの領域７６２と領域７６３を有している。また、領域７６２と領域７６３は、ともに領域７６１内で斜めに配置され、その傾きは、図１８に示した例では、図中右側が上になるような傾きである。
【０２６０】
フィルタＧは、領域７６２内に位置する画素の画素値と、領域７６３内に位置する画素の画素値との差分値が算出され、その差分値の絶対値を特徴量とするためのフィルタである。領域７６２と領域７６３は、それぞれ異なる大きさの領域のため、フィルタＢのところで説明したように、各領域の大きさにあった多重解像度画像に対して、領域７６２、領域７６３がそれぞれ適用され、領域内の画素値同士の差分値が算出される。
【０２６１】
図１８に示したフィルタＨは、所定の大きさの画像７７１（その画像内の所定の大きさの領域７７１）に、所定の間隔をあけて配置された、異なる大きさ（同一の大きさの領域でも良い）の領域７７２乃至７７５を有している。また、領域７７２乃至７７４は、領域７７１内で斜めに配置され、その傾きは、図１８に示した例では、図中左側が上になるような傾きである。また、領域７７５は、領域７７１内で斜めに配置され、その傾きは、図１８に示した例では、図中右側が上になるような傾きである。
【０２６２】
フィルタＨは、領域７６２内に位置する画素の画素値、領域７６３内に位置する画素の画素値、領域７６４内に位置する画素の画素値、および領域７６５内に位置する画素の画素値との差分値が算出され、その差分値の絶対値を特徴量とするためのフィルタである。領域７７２乃至７７５は、それぞれ異なる大きさの領域のため、フィルタＢのところで説明したように、各領域の大きさにあった多重解像度画像に対して、領域７７２乃至７７５がそれぞれ適用され、領域内の画素値同士の差分値が算出される。
【０２６３】
図１８に示したフィルタＩは、所定の大きさの画像７８６（その画像内の所定の大きさの領域７８６）に、所定の間隔をあけて配置された、異なる大きさ（同一の大きさの領域でも良い）の領域７８２乃至７８４を有している。また、領域７８２は、領域７８１内で斜めに配置され、その傾きは、図１８に示した例では、図中左側が上になるような傾きである。領域７８３，７８４は、ともに縦方向（四角形を構成する長辺が、同一方向であり、その方向が図中縦方向）に配置されている。また、領域７８３と領域７８４の一部分は、重なった状態で配置されている。
【０２６４】
フィルタＩは、領域７８２内に位置する画素の画素値、領域７８３内に位置する画素の画素値、および領域７８３内に位置する画素の画素値との差分値が算出され、その差分値の絶対値を特徴量とするためのフィルタである。領域７８２乃至７８５は、それぞれ異なる大きさの領域のため、フィルタＢのところで説明したように、各領域の大きさにあった多重解像度画像に対して、領域７８２乃至７８４がそれぞれ適用され、領域内の画素値同士の差分値が算出される。
【０２６５】
図１８に示したフィルタＪは、所定の大きさの画像７９１（その画像内の所定の大きさの領域７９１）に、所定の間隔をあけて配置された、異なる大きさ（同一の大きさの領域でも良い）の領域７９２と領域７９３を有している。また、領域７９２は、領域７９１内で斜めに配置され、その傾きは、図１８に示した例では、図中右側が上になるような傾きである。また、領域７９３は、縦方向（四角形を構成する長辺が、図中縦方向）に配置されている。また、領域７９３は領域７９４に含まれる状態（重なる状態）で配置されている。
【０２６６】
フィルタＪは、領域７９２内に位置する画素の画素値、領域７９３内に位置する画素の画素値、および領域７８３内に位置する画素の画素値との差分値が算出され、その差分値の絶対値を特徴量とするためのフィルタである。領域７９２と領域７９３は、それぞれ異なる大きさの領域のため、フィルタＢのところで説明したように、各領域の大きさにあった多重解像度画像に対して、領域７９２、領域７９３がそれぞれ適用され、領域内の画素値同士の差分値が算出される。
【０２６７】
このように、図１８に示したフィルタは、２以上の領域を備え、領域内の画素値同士の差分値が算出され、その算出された差分値の絶対値を特徴量とするようなフィルタである。また、それぞれの領域は、矩形とされ、その配置位置は、連続する（隣接する）必要性はなく、離れた位置に配置されていても良い。さらに、多重解像度画像を生成し、利用することで、異なる大きさの領域を有するフィルタを構成することも可能である。
【０２６８】
図１９は、図１８に示したようなフィルタを用いた場合の特徴量計算部２４の構成を示す図である。図１９に示した特徴量計算部２４は、画素値減算部８１１を含む構成とされている。画素値減算部８１１は、特徴点抽出部２３（図１）から供給される特徴点の画素値を加算する。
【０２６９】
例えば、フィルタＡ（図１８）が用いられる場合、特徴点抽出部２３は、領域７０２内に位置する画素を特徴点として抽出するとともに、その特徴点の画素値を特徴量計算部２４の画素値減算部８１１に供給する。また、同様に、特徴点抽出部２３は、領域７０３内に位置する画素を特徴点として抽出するとともに、その特徴点の画素値を特徴量計算部２４の画素値減算部８１１に供給する。画素値減算部８１１は、供給される画素値の一方から他方を減算する。さらに、画素値減算部８１１は、その減算結果（差分値）の絶対値を算出し、特徴量として、識別器生成部２５に出力する。
【０２７０】
また、画素値減算部８１１は、例えば、フィルタＣのように、２以上の領域を備えるフィルタで特徴量を算出するときには、領域の画素値の差分値から、他の領域の画素値をさらに減算するといった処理も行う。例えば、フィルタＣが適用された場合、領域７２２と領域７２３の画素値同士の差分値が算出され、その後、領域７２４、領域７４５の画素値が順に減算されるという処理も、画素値減算部８１１は行う。
【０２７１】
なお、フィルタＢのような領域７２１と領域７１３の大きさが異なるような場合、特徴点抽出部２３は、特徴点を抽出する画像（画素値を読み出す画像）を、領域の大きさに適した画像とするために、多重解像度画像生成部２２で生成される多重解像度画像から、領域の大きさに適した多重解像度画像を選択するという処理も含まれる。または、多重解像度画像生成部２２は、特徴点抽出部２３が適用するフィルタの領域に適した多重解像度画像を生成し、供給するように構成されている。
【０２７２】
このようにして算出された特徴量を用いて、識別器生成部２５は識別器を生成する。識別器生成部２５における処理は、図８のフローチャートを参照して説明したので、ここでは、その説明を省略する。
【０２７３】
［変形例］
上述したフィルタは、それぞれ個々に、所定の画像に対して適用されるようにしても良いし、複数のフィルタが組み合わされて所定の画像に対して適用されるようにしても良い。
【０２７４】
［認識処理について］
次に、学習の結果を用いて、例えば、人などの対象物を検出（認識）するときの処理について説明を加える。認識装置１３に入力画像が入力され、対象物体としての人の検出が指示されると、認識装置１３は、人検出処理を開始して、入力画像から対象物体を検出する。以下、図２０のフローチャートを参照して、認識装置１３による人検出処理について説明する。
【０２７５】
なお、認識装置１３の画像入力部３１乃至特徴量計算部３４は、学習装置１１の画像入力部２１乃至特徴量計算部２４と同様に構成することが可能である。よって、上述した学習装置１１の画像入力部２１乃至特徴量計算部２４に関する説明や、フィルタなどの説明は、認識装置１３に対しても適用できる説明であり、同様の説明となるため、その詳細な説明は省略する。
【０２７６】
ステップＳ１５１において、認識装置１３の画像入力部３１（図１）に認識対象となる画像が入力され、多重解像度画像生成部３２に供給されると、多重解像度画像生成部３２により、多重解像度画像が生成される。この処理は、例えば、上述したステップＳ１１（図６）の処理と同様に行われ、その詳細な説明は既にしたので、ここではその説明を省略する。
【０２７７】
なお、多重解像度画像生成部３２で多重解像度画像を生成するとき、学習装置１１の多重解像度画像生成部２２が生成する多重解像度画像と同じスケール（解像度）の画像を生成するようにする。このように学習時のスケール係数（解像度に関する情報）と、認識時のスケール係数を合わせておくことで、認識時に効率の良いスキャンを行うことが可能となる。
【０２７８】
ステップＳ１５２において、特徴点抽出部３３は、図６のステップＳ１２の処理と同様の処理を行い、入力された入力画像から特徴点を抽出し、入力画像とともに特徴量計算部３４に供給する。よって、どのようなフィルタが用いられているかにより、抽出される特徴点の位置や、個数などは異なる。また、適用される多重解像度画像も、フィルタに適した画像が適用される。
【０２７９】
ステップＳ１５３において、特徴量計算部３４は、特徴点抽出部３３からの入力画像および特徴点に基づいて、特徴量計算処理を行い、各特徴点の特徴量を計算する。そして、特徴量計算部３４は、求められた特徴量を識別計算部３５に供給する。なお、この特徴量計算処理は、図７を参照して説明した特徴量計算処理と同様の処理であるため、その説明は省略する。また、特徴量計算処理を行うときのフィルタは、上記したようなフィルタ、例えば、図１４に示したフィルタＡなど、様々なフィルタを用いることが、本発明においては可能である。
【０２８０】
ステップＳ１５４において、識別計算部３５は、識別器記録部１２から識別用特徴量および識別器を読み出して、読み出した識別器に特徴量を代入して計算する。すなわち、識別計算部３５は、特徴量計算部３４からの特徴量のうちの識別用特徴量に対応するものを、式（７）または式（８）により示される識別器に代入して演算を行う。
【０２８１】
ここで、識別器を構成する弱識別器に代入される特徴量は、識別用特徴量とされた特徴量が求められた、学習画像の特徴点のペアまたは特徴点と同じ位置にある、入力画像上の特徴点のペアまたは特徴点から求められた特徴量である。また、識別用特徴量とされる特徴量は、統計学習処理時において、識別器を構成する弱識別器の設定に用いられた特徴量である。
【０２８２】
例えば、式（７）の演算が行われると、その演算の結果として、入力画像中に対象物体としての人が存在することを示す「＋１」、または入力画像中に対象物体としての人が存在しないことを示す「−１」が得られる。識別計算部３５は、識別器での演算結果を識別結果出力部３６に供給する。
【０２８３】
ステップＳ１５５において、識別結果出力部３６は、識別計算部３５からの演算結果に基づいて、物体（人）の検出結果を出力し、物体検出処理は終了する。すなわち、対象物体が入力画像で認識されたか否かの識別結果が出力される。
【０２８４】
例えば、対象物体が入力画像で認識されたか否かの識別結果として、対象物体としての人が検出された領域に枠が表示された入力画像などが、識別結果出力部３６に表示されるようにしてもよい。
【０２８５】
このようにして、認識装置１３は、入力画像から特徴点を抽出して、特徴点のペアの特徴量を求めるとともに、入力画像から特徴点を抽出して特徴量を求める。そして、認識装置１３は、求めた特徴量および特徴量と、識別器記録部１２に記録されている識別器とを用いて、入力画像から対象物体を検出する。
【０２８６】
このように、特徴量を用いて入力画像から対象物体を検出することで、より確実に画像から対象物体を検出することができる。
【０２８７】
［記録媒体について］
上述した一連の処理は、ハードウエアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどが含まれる。
【０２８８】
図２１は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。コンピュータにおいて、ＣＰＵ（Central Processing Unit）１００１、ＲＯＭ（Read Only Memory）１００２、ＲＡＭ（Random Access Memory）１００３は、バス１００４により相互に接続されている。バス１００４には、さらに、入出力インタフェース１００５が接続されている。入出力インタフェース１００５には、入力部１００６、出力部１００７、記憶部１００８、通信部１００９、及びドライブ１０１０が接続されている。
【０２８９】
入力部１００６は、キーボード、マウス、マイクロフォンなどよりなる。出力部１００７は、ディスプレイ、スピーカなどよりなる。記憶部１００８は、ハードディスクや不揮発性のメモリなどよりなる。通信部１００９は、ネットワークインタフェースなどよりなる。ドライブ１０１０は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのリムーバブルメディア１０１１を駆動する。
【０２９０】
以上のように構成されるコンピュータでは、ＣＰＵ１００１が、例えば、記憶部１００８に記憶されているプログラムを、入出力インタフェース１００５及びバス１００４を介して、ＲＡＭ１００３にロードして実行することにより、上述した一連の処理が行われる。
【０２９１】
コンピュータ（ＣＰＵ１００１）が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア１０１１に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。
【０２９２】
コンピュータでは、プログラムは、リムーバブルメディア１０１１をドライブ１０１０に装着することにより、入出力インタフェース１００５を介して、記憶部１００８にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部１００９で受信し、記憶部１００８にインストールすることができる。その他、プログラムは、ＲＯＭ１００２や記憶部１００８に、あらかじめインストールしておくことができる。
【０２９３】
なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
【０２９４】
また、本明細書において、システムとは、複数の装置により構成される装置全体を表すものである。
【０２９５】
なお、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。
【符号の説明】
【０２９６】
１１学習装置，１２識別器記録部，１３認識装置，２１画像入力部，２２多重解像度画像生成部，２３特徴点抽出部，２４特徴量計算部，２５識別器生成部，３１画像入力部，３２多重解像度画像生成部，３３特徴点抽出部，３４特徴量計算部，３５識別計算部，３６識別結果出力部

【特許請求の範囲】
【請求項１】
入力された画像から異なる解像度の画像を生成する生成手段と、
前記生成手段により生成された画像から、処理対象とする特徴点を抽出する抽出手段と、
前記特徴点に所定のフィルタを用いたフィルタ処理を施すことで、前記特徴点の特徴量を計算する計算手段と、
前記特徴量を用いた統計学習により、前記画像から所定の対象物体を検出するための識別器を生成する識別器生成手段と
を備え、
前記フィルタは、複数の領域を有し、前記計算手段は、その領域内の差分の差分値を前記特徴量とする
学習装置。
【請求項２】
前記所定のフィルタの前記領域は、矩形である
請求項１に記載の学習装置。
【請求項３】
前記計算手段は、任意の角度におけるガウス関数の所定の次数の微分関数における畳み込み演算を実行し、その演算結果の絶対値の総和を計算する
請求項１に記載の学習装置。
【請求項４】
前記計算手段は、任意の角度におけるガウス関数の所定の次数の微分関数における畳み込み演算を実行し、その演算結果の絶対値の最大値を計算する
請求項１に記載の学習装置。
【請求項５】
前記計算手段は、前記複数の領域毎に、領域内に位置する画素の画素値の総和または平均値を算出し、その総和または平均値の差分を算出し、その差分値の絶対値を前記特徴量とする
請求項１に記載の学習装置。
【請求項６】
前記計算手段は、前記複数の領域毎に、領域内に位置する画素の画素値からヒストグラムを作成し、その値の差分を算出し、その差分値の絶対値を前記特徴量とする
請求項１に記載の学習装置。
【請求項７】
前記計算手段は、前記複数の領域毎に、領域内に位置する画素の画素値からヒストグラムを作成し、そのヒストグラムの和が１となるように正規化し、正規化されたヒストグラムの値の差分を算出し、その差分値の絶対値を前記特徴量とする
請求項１に記載の学習装置。
【請求項８】
前記計算手段は、基準となる特徴点に対して適用したフィルタを、その基準となる特徴点の近傍に位置する複数の特徴点に対しても適用し、それらの複数の特徴点から算出された特徴量の総和または平均値を、前記基準となる特徴点の特徴量とする
請求項１に記載の学習装置。
【請求項９】
入力された画像から異なる解像度の画像を生成し、
生成された画像から、特徴点を抽出し、
前記特徴点に所定のフィルタを用いたフィルタ処理を施すことで、前記特徴点の特徴量を計算し、
前記特徴量を用いた統計学習により、前記画像から所定の対象物体を検出するための識別器を生成する
ステップを含み、
前記フィルタは、複数の領域を有し、その領域内の差分の差分値を前記特徴量とする
学習方法。
【請求項１０】
入力された画像から異なる解像度の画像を生成し、
生成された画像から、特徴点を抽出し、
前記特徴点に所定のフィルタを用いたフィルタ処理を施すことで、前記特徴点の特徴量を計算し、
前記特徴量を用いた統計学習により、前記画像から所定の対象物体を検出するための識別器を生成する
ステップを含み、
前記フィルタは、複数の領域を有し、その領域内の差分の差分値を前記特徴量とする
処理を実行するコンピュータが読み取り可能なプログラム。
【請求項１１】
入力された画像から異なる解像度の画像を生成する生成手段と、
前記生成手段により生成された画像から、特徴点を抽出する抽出手段と、
前記特徴点に所定のフィルタを用いたフィルタ処理を施すことで、前記特徴点の特徴量を計算する計算手段と、
統計学習により得られた、画像から所定の対象物体を検出するための識別器に、前記特徴量を代入し、前記入力された画像から、前記対象物体を検出する検出手段と
を備え、
前記フィルタは、複数の領域を有し、前記計算手段は、その領域内の差分の差分値を前記特徴量とする
認識装置。
【請求項１２】
前記フィルタの前記領域は、矩形である
請求項１１に記載の認識装置。
【請求項１３】
前記計算手段は、任意の角度におけるガウス関数の所定の次数の微分関数における畳み込み演算を実行し、その演算結果の絶対値の総和を計算する
請求項１１に記載の認識装置。
【請求項１４】
前記計算手段は、任意の角度におけるガウス関数の所定の次数の微分関数における畳み込み演算を実行し、その演算結果の絶対値の最大値を計算する
請求項１１に記載の認識装置。
【請求項１５】
前記計算手段は、前記複数の領域毎に、領域内に位置する画素の画素値の総和または平均値を算出し、その総和または平均値の差分を算出し、その差分値の絶対値を前記特徴量とする
請求項１１に記載の認識装置。
【請求項１６】
前記計算手段は、前記複数の領域毎に、領域内に位置する画素の画素値からヒストグラムを作成し、その値の差分を算出し、その差分値の絶対値を前記特徴量とする
請求項１１に記載の認識装置。
【請求項１７】
前記計算手段は、前記複数の領域毎に、領域内に位置する画素の画素値からヒストグラムを作成し、そのヒストグラムの和が１となるように正規化し、正規化されたヒストグラムの値の差分を算出し、その差分値の絶対値を前記特徴量とする
請求項１１に記載の認識装置。
【請求項１８】
前記計算手段は、基準となる特徴点に対して適用したフィルタを、その基準となる特徴点の近傍に位置する複数の特徴点に対しても適用し、それらの複数の特徴点から算出された特徴量の総和または平均値を、前記基準となる特徴点の特徴量とする
請求項１１に記載の認識装置。
【請求項１９】
入力された画像から異なるスケール係数の画像を生成し、
生成された画像から、特徴点を抽出し、
前記特徴点に所定のフィルタを用いたフィルタ処理を施すことで、前記特徴点の特徴量を計算し、
統計学習により得られた、画像から所定の対象物体を検出するための識別器に、前記特徴量を代入し、前記入力された画像から、前記対象物体を検出する
ステップを含み、
前記フィルタは、複数の領域を有し、その領域内の差分の差分値を前記特徴量とする
認識方法。
【請求項２０】
入力された画像から異なるスケール係数の画像を生成し、
生成された画像から、特徴点を抽出し、
前記特徴点に所定のフィルタを用いたフィルタ処理を施すことで、前記特徴点の特徴量を計算し、
統計学習により得られた、画像から所定の対象物体を検出するための識別器に、前記特徴量を代入し、前記入力された画像から、前記対象物体を検出する
ステップを含み、
前記フィルタは、複数の領域を有し、その領域内の差分の差分値を前記特徴量とする
処理を実行するコンピュータが読み取り可能なプログラム。

【図１】