説明

学習装置および方法、並びにプログラム

【課題】より高速に高精度な識別器を得ることができるようにする。
【解決手段】特徴量計算部は、学習画像の各特徴点から特徴量を抽出する。取得部は、既に学習により得られた識別器を転移識別器として取得する。識別器生成部は、転移識別器を構成する弱識別器に特徴量を代入し、それらの弱識別器の識別結果と学習画像の重みとに基づいて弱識別器の誤り率を算出するとともに、誤り率が最小となる弱識別器を選択する処理を複数回、繰り返し行う。また、識別器生成部は、選択した複数の弱識別器を線形結合することで、検出対象を検出するための識別器を生成する。本発明は、学習装置に適用することができる。

【発明の詳細な説明】
【技術分野】
【0001】
本技術は学習装置および方法、並びにプログラムに関し、特に、より高速に高精度な識別器を得ることができるようにした学習装置および方法、並びにプログラムに関する。
【背景技術】
【0002】
例えば、手形状検出器のような多クラス物体認識器の学習には、各手形状について大量の学習画像が必要となるが、大量の学習画像を用いると学習に時間がかかってしまう。そこで、すでに得られている知識を転移させることにより学習時間を削減する転移学習が提案されている(例えば、非特許文献1および非特許文献2参照)。
【0003】
また、近年、転移学習を用いた物体認識システムも提案されてきている(例えば、非特許文献3乃至非特許文献5参照)。
【0004】
これらの物体認識システムでは、物体が小さなパーツで表現され、そのパーツの見えの分布と位置の分布が学習され、さらに既知クラスの分布を転移することで未知なクラスの学習が行なわれる。また、物体認識システムではベイズ推定の枠組みが用いられており、1または複数という少数のサンプルからの学習にフォーカスされている。
【先行技術文献】
【非特許文献】
【0005】
【非特許文献1】L. Torrey and J. Shavlik. 「Transfer Learning」 In E. Soria, J. Martin, R. Magdalena, M. Martinez and A. Serrano, editors, Handbook of Research on Machine Learning Applications, IGI Global 2009
【非特許文献2】Sinno Jialin Pan and Qiang Yang.「A Survey on Transfer Learning」 IEEE Transactions on Knowledge and Data Engineering, VOL22,No.10,p1345-1359, Oct. 2010
【非特許文献3】L. Fei-Fei, R. Fergus and P. Perona. 「One-Shot learning of object categories」 IEEE Trans. Pattern Analysis and Machine Intelligence, Vol28, No.4, p594 - 611, 2006.
【非特許文献4】E. Bart, S. Ullman, 「Cross-generalization: learning novel classes from a single example by feature replacement」, in Proc. CVPR, 2005
【非特許文献5】「A Shape-Based Object Class Model for Knowledge Transfer」 M. Stark, M. Goesele and B. Schiele, Twelfth IEEE International Conference on Computer Vision (ICCV), 2009, Kyoto, Japan, (2009)
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、上述した技術では、実世界でのロバストな物体検出には多くの学習サンプルがないと、充分な性能を得ることができなかった。
【0007】
本技術は、このような状況に鑑みてなされたものであり、より高速に高精度な識別器を得ることができるようにするものである。
【課題を解決するための手段】
【0008】
本技術の第1の側面の学習装置は、検出対象が含まれている学習画像と、前記検出対象が含まれていない学習画像とからなる複数の学習画像のそれぞれについて、前記学習画像の特徴点から特徴量を抽出する特徴量抽出部と、統計学習により得られた前記検出対象を検出するための識別器である転移識別器を構成する複数の弱識別器のそれぞれについて、前記弱識別器に対応する前記特徴量を前記弱識別器に代入することで、前記学習画像ごとに前記弱識別器による前記検出対象の識別結果を算出する弱識別計算部と、前記識別結果に基づいて複数の前記弱識別器から選択された前記弱識別器を用いて、前記検出対象を検出するための識別器を生成する識別器生成部とを備える。
【0009】
学習装置には、前記識別結果に基づいて前記学習画像の重みを設定する重み設定部と、前記弱識別器による各前記学習画像の前記識別結果および前記重みに基づいて、前記弱識別器の誤り率を計算する誤り率計算部とをさらに設け、前記識別器生成部には、前記誤り率に基づいて前記弱識別器を選択させることができる。
【0010】
前記識別器生成部により生成される前記識別器は、多クラス物体認識に用いられるようにすることができる。
【0011】
前記識別器生成部により生成される前記識別器を、ツリー構造の識別器を構成する識別器とし、前記転移識別器を、前記ツリー構造の識別器のリーフを構成する識別器とすることができる。
【0012】
本技術の第1の側面の学習方法またはプログラムは、検出対象が含まれている学習画像と、前記検出対象が含まれていない学習画像とからなる複数の学習画像のそれぞれについて、前記学習画像の特徴点から特徴量を抽出し、統計学習により得られた前記検出対象を検出するための識別器である転移識別器を構成する複数の弱識別器のそれぞれについて、前記弱識別器に対応する前記特徴量を前記弱識別器に代入することで、前記学習画像ごとに前記弱識別器による前記検出対象の識別結果を算出し、前記識別結果に基づいて複数の前記弱識別器から選択された前記弱識別器を用いて、前記検出対象を検出するための識別器を生成するステップを含む。
【0013】
本技術の第1の側面においては、検出対象が含まれている学習画像と、前記検出対象が含まれていない学習画像とからなる複数の学習画像のそれぞれについて、前記学習画像の特徴点から特徴量が抽出され、統計学習により得られた前記検出対象を検出するための識別器である転移識別器を構成する複数の弱識別器のそれぞれについて、前記弱識別器に対応する前記特徴量を前記弱識別器に代入することで、前記学習画像ごとに前記弱識別器による前記検出対象の識別結果が算出され、前記識別結果に基づいて複数の前記弱識別器から選択された前記弱識別器が用いられて、前記検出対象を検出するための識別器が生成される。
【0014】
本技術の第2の側面の学習装置は、検出対象が含まれている学習画像と、前記検出対象が含まれていない学習画像とからなる複数の学習画像のそれぞれについて、前記学習画像の特徴点から特徴量を抽出する特徴量抽出部と、前記学習画像から抽出された前記特徴量のうち、統計学習により得られた前記検出対象を検出するための識別器である転移識別器を構成する転移弱識別器に対応する前記特徴量と、前記学習画像とに基づいて弱識別器を生成する弱識別器設定部と、前記弱識別器に対応する前記特徴量を前記弱識別器に代入することで、前記学習画像ごとに前記弱識別器による前記検出対象の識別結果を算出する弱識別計算部と、前記識別結果に基づいて複数の前記弱識別器から選択された前記弱識別器を用いて、前記検出対象を検出するための識別器を生成する識別器生成部とを備える。
【0015】
学習装置には、前記識別結果に基づいて前記学習画像の重みを設定する重み設定部と、前記弱識別器による各前記学習画像の前記識別結果および前記重みに基づいて、前記弱識別器の誤り率を計算する誤り率計算部とをさらに設け、前記識別器生成部には、前記誤り率に基づいて前記弱識別器を選択させることができる。
【0016】
前記識別器生成部により生成される前記識別器は、多クラス物体認識に用いられるようにすることができる。
【0017】
前記識別器生成部により生成される前記識別器を、ツリー構造の識別器を構成する識別器とし、前記転移識別器を、前記ツリー構造の識別器のリーフを構成する識別器とすることができる。
【0018】
本技術の第2の側面の学習方法またはプログラムは、検出対象が含まれている学習画像と、前記検出対象が含まれていない学習画像とからなる複数の学習画像のそれぞれについて、前記学習画像の特徴点から特徴量を抽出し、前記学習画像から抽出された前記特徴量のうち、統計学習により得られた前記検出対象を検出するための識別器である転移識別器を構成する転移弱識別器に対応する前記特徴量と、前記学習画像とに基づいて弱識別器を生成し、前記弱識別器に対応する前記特徴量を前記弱識別器に代入することで、前記学習画像ごとに前記弱識別器による前記検出対象の識別結果を算出し、前記識別結果に基づいて複数の前記弱識別器から選択された前記弱識別器を用いて、前記検出対象を検出するための識別器を生成するステップを含む。
【0019】
本技術の第2の側面においては、検出対象が含まれている学習画像と、前記検出対象が含まれていない学習画像とからなる複数の学習画像のそれぞれについて、前記学習画像の特徴点から特徴量が抽出され、前記学習画像から抽出された前記特徴量のうち、統計学習により得られた前記検出対象を検出するための識別器である転移識別器を構成する転移弱識別器に対応する前記特徴量と、前記学習画像とに基づいて弱識別器が生成され、前記弱識別器に対応する前記特徴量を前記弱識別器に代入することで、前記学習画像ごとに前記弱識別器による前記検出対象の識別結果が算出され、前記識別結果に基づいて複数の前記弱識別器から選択された前記弱識別器が用いられて、前記検出対象を検出するための識別器が生成される。
【発明の効果】
【0020】
本技術の第1の側面および第2の側面によれば、より高速に高精度な識別器を得ることができる。
【図面の簡単な説明】
【0021】
【図1】本技術の概要を説明する図である。
【図2】パラメータの転移による学習について説明する図である。
【図3】特徴量の転移による学習について説明する図である。
【図4】手形状識別システムの一実施の形態の構成例を示す図である。
【図5】識別器生成部の構成例を示す図である。
【図6】転移学習処理を説明するフローチャートである。
【図7】パラメータの転移による学習の効果について説明する図である。
【図8】識別処理を説明するフローチャートである。
【図9】学習装置の他の構成例を示す図である。
【図10】識別器生成部の構成例を示す図である。
【図11】転移学習処理を説明するフローチャートである。
【図12】識別器の設定について説明する図である。
【図13】識別器の設定について説明する図である。
【図14】特徴量の転移による学習の効果について説明する図である。
【図15】ツリー構造の識別器について説明する図である。
【図16】認識装置の構成例を示す図である。
【図17】識別処理を説明するフローチャートである。
【図18】コンピュータの構成例を示す図である。
【発明を実施するための形態】
【0022】
以下、図面を参照して、本技術を適用した実施の形態について説明する。
【0023】
〈本技術の概要〉
本技術はブースティングによる転移学習により、検出対象の物体を認識するのに用いられる識別器を生成するものである。検出対象の物体は人や顔など、どのような物体であってもよいが、以下では検出対象が人の手、特に所定形状の手である場合を例として説明する。
【0024】
例えば、多形状の手検出は画像認識タスクのなかでも困難な問題である。これは、手の形状変化により、画像上でパターン(手の見え方)が大きく変化するため、それぞれの手形状クラスをモデル化することが困難になるからである。加えて画像認識一般の問題として、照明の変化や一部分の隠れ、視点の変化、背景の複雑性などにより、特に実世界でのロバストな認識は難しいとされている。また、多くの形状に対応するために、各手形状について多くの学習サンプルを用意しなければならない。
【0025】
本技術による手形状検出の転移学習は、例えば図1に示すように、既に学習により得られている知識を利用して、他の手形状の新たな学習を行なうものであり、多形状の手検出などに利用可能である。
【0026】
例えば、矢印A11に示すように、手形状としてじゃんけんで用いられるグー,チョキ,パーの各手形状の識別器が、既に大量の学習サンプルが用いられて学習されているとする。ここで、グーとは全ての指を閉じた手の状態であり、チョキとは人差し指と中指を開き残りの指を閉じた手の状態であり、パーとは全ての指を開いた手の状態である。
【0027】
このようないくつかの手形状を検出するための識別器がある場合に、指差ししている手の形状、例えば人差し指のみを開いている手の形状を検出するための識別器を学習により得ようとするとき、既に得られている手形状の識別器が学習に用いられる。
【0028】
すなわち、グー,チョキ,パーの各手形状の識別器と、矢印A12に示す指差しの手形状の学習用の画像とが用いられてブースティングによる転移学習が行なわれ、矢印A13に示す指差しの手形状を検出するための識別器が生成される。
【0029】
ここで、既に得られている識別器での検出対象と、新たに生成される識別器での検出対象はともに同じ被写体(手)であり、それらの識別器で検出される手の形状や向きなど、被写体の態様のみが異なる。例えば、グーと指差しの手形状では、開いた人差し指の部分のみの形状が異なり、閉じられている指の部分など、他の多くの部分は類似した形状となっている。そこで、グーの手形状の識別器の学習で得られている知識を、指差しの手形状の識別器の学習に利用すれば、より迅速に高精度な識別器を得ることができる。
【0030】
このようにして得られる識別器は、複数の弱識別器から構成される。例えば、弱識別器は、次式(1)に示すように画像の所定領域から抽出された特徴量を代入すると、その所定領域が検出対象らしいか否かの判別結果を出力する関数である。
【0031】
n(x)=an×g(x>thwn)+bn ・・・(1)
【0032】
なお、式(1)においてanおよびbnは定数である。また、g(x>thwn)は、特徴量xが閾値thwnより大きい場合、所定領域が検出対象らしいことを示す数値「1」を出力し、特徴量xが閾値thwn以下である場合、所定領域が検出対象らしくないことを示す数値「0」を出力する関数である。したがって、fn(x)=an+bnである場合、所定領域は検出対象らしく、fn(x)=bnである場合、所定領域は検出対象らしくないとの判別がなされる。
【0033】
このような弱識別器fn(x)から構成される識別器F(x)は、例えば次式(2)で表される。
【0034】
F(x)=Σfn(x) ・・・(2)
【0035】
すなわち、識別器F(x)はN個の弱識別器f1(x)乃至fN(x)の和となる。また、識別器F(x)の出力値が所定の閾値thより大きい場合、画像中に検出対象があるとされ、識別器F(x)の出力値が閾値th以下である場合、画像中に検出対象がないとされる。
【0036】
新たな識別器F(x)を、既に得られた他の識別器を用いたブースティングによる転移学習で生成する場合、次の2つの手法が考えられる。
【0037】
(手法1)他の識別器からパラメータを転移させて学習を行なう手法
(手法2)他の識別器から特徴量を転移させて学習を行なう手法
【0038】
例えば、手法1のパラメータを転移させる学習では、図2に示すように既に学習により得られているグーを検出する識別器F11を構成する弱識別器と、チョキを検出する識別器F12を構成する弱識別器とから、指差しの手を検出する識別器F13が生成される。
【0039】
図2の例では、識別器F11は4つの弱識別器f11乃至弱識別器f14から構成されており、識別器F12は4つの弱識別器f15乃至弱識別器f18から構成されている。転移学習では、これらの8つの弱識別器f11乃至弱識別器f18のなかから、指差しの手形状を検出するのに適したいくつかの弱識別器が選択され、それらの選択された弱識別器が線形結合されて識別器F13とされる。ここでは識別器F13は、4つの弱識別器f11、弱識別器f13、弱識別器f17、および弱識別器f18から構成されている。
【0040】
例えば識別器F13を構成する弱識別器f11は、グーを検出する識別器F11を構成する弱識別器のうち、グーの閉じられた小指の部分から抽出された特徴量を用いて、グーらしさを判別する弱識別器などとされる。また、例えば識別器F13を構成する弱識別器f17は、チョキを検出する識別器F12を構成する弱識別器のうち、チョキの開かれた人差し指の部分から抽出された特徴量を用いて、チョキらしさを判別する弱識別器などとされる。
【0041】
このように、閉じられた小指の部分や開かれた人差し指の部分など、新たに生成しようとする識別器の検出対象と共通(類似)する部位について、検出対象らしさを判別する弱識別器を適切に組み合わせれば、より簡単に高精度な識別器を得ることができる。
【0042】
なお、ブースティングによる学習とは、弱識別器と呼ばれる単体では弱い識別器を多数集めることで、1つの強い識別器を構成する学習方法であり、学習で得られた識別器は、高速な物体検出システムによく利用される。このようなブースティングとして、アダブーストなどが知られている。また、ブースティングによる学習は、例えば「Paul Viola & Michael Jones, “Robust real-time Object Detection”, International Journal of Computer Vision 2001」などに詳細に記載されている。
【0043】
これに対して、上述した手法2の特徴量を転移させる学習では、図3に示すように既に学習により得られているグーを検出する識別器F21を構成する弱識別器の特徴量と、チョキを検出する識別器F22を構成する弱識別器の特徴量とが用いられて学習が行なわれる。
【0044】
すなわち、識別器F21は4つの弱識別器から構成されており、識別器F21では画像から特徴量t11乃至特徴量t14が抽出されて、それらの特徴量が各弱識別器に代入される。また、識別器F22は4つの弱識別器から構成されており、識別器F22では画像から特徴量t15乃至特徴量t18が抽出されて、それらの特徴量が各弱識別器に代入される。
【0045】
指差しの手形状を検出する識別器F23の転移学習では、これらの8つの特徴量t11乃至特徴量t18のなかから、指差しの手形状を検出するのに適したいくつかの特徴量が選択され、選択された特徴量から弱識別器が生成される。つまり、指差しの手形状の検出に適した特徴量が用いられて、弱識別器を構成する式(1)の定数an,bnや閾値thwn等のパラメータが学習し直される。
【0046】
図3の例では、特徴量t11、特徴量t16、特徴量t13、および特徴量t18が選択され、それらの特徴量から弱識別器f21乃至弱識別器f24が生成されている。具体的には、例えば学習に用いられるサンプルとしての複数の学習画像における、特徴量t11の抽出位置と同じ位置から、特徴量t11の抽出と同じ方法で特徴量が抽出され、抽出された特徴量が用いられて弱識別器f21が生成される。つまり、より詳細には特徴量t11は、指差しの手形状を検出するのに適した特徴量の抽出位置と抽出方法を示している。選択された特徴量に基づいて弱識別器f21乃至弱識別器f24が得られると、これらの弱識別器が線形結合されて識別器F23とされる。
【0047】
図3に示す転移学習では、既に得られた他の識別器の弱識別器に代入される特徴量のうち、指差しの手形状を検出するのに適した抽出位置と抽出方法の特徴量が用いられて、新たな識別器が生成される。
【0048】
次に、手法1のパラメータを転移させる学習、および手法2の特徴量を転移させる学習の順番で、具体的な実施の形態について説明する。
【0049】
〈第1の実施の形態〉
[手形状識別システムの構成例]
図4は、手法1のパラメータを転移させる学習を行なう場合における、手形状識別システムの一実施の形態の構成例を示す図である。
【0050】
この手形状識別システムは、学習装置11、識別器記録部12、および認識装置13からなり、入力された画像から、検出対象(対象物体)としての特定の形状の手を検出するものである。
【0051】
学習装置11は、入力された学習画像に基づいて、認識装置13において画像上の検出対象の有無を識別する処理を行うときに用いられる、識別用特徴量および識別器を生成し、識別器記録部12に記録させる。認識装置13は、識別器記録部12に記録されている識別用特徴および識別器を用いて、入力された入力画像に検出対象が存在するか否かを識別し、その識別結果を出力する。
【0052】
学習装置11は、特徴点抽出部21、特徴量計算部22、取得部23、および識別器生成部24から構成される。
【0053】
特徴点抽出部21は、入力された学習画像から、識別器を生成するときに用いられる特徴点を抽出し、抽出した特徴点と学習画像とを特徴量計算部22に供給する。特徴量計算部22は、特徴点抽出部21からの学習画像に基づいて、各特徴点の特徴量を計算し、求められた特徴量と学習画像とを識別器生成部24に供給する。
【0054】
取得部23は、外部の装置等から、検出対象となる物体がこれから生成しようとする識別器の検出対象と同じであるが、検出対象となる物体の態様が異なるいくつかの識別器(以下、転移識別器と称する)を取得し、識別器生成部24に供給する。
【0055】
識別器生成部24は、特徴量計算部22から供給された学習画像および特徴量と、取得部23から供給された転移識別器とに基づいて、例えばアダブーストによる転移学習処理を行い、検出対象を認識する識別器を生成する。また、識別器生成部24は、生成した識別器を用いて検出対象の認識を行うときに用いられる特徴点の特徴量を、識別用特徴量として、識別器および識別用特徴量を識別器記録部12に供給し、記録させる。
【0056】
また、認識装置13は、特徴点抽出部31、特徴量計算部32、識別計算部33、および識別結果出力部34から構成される。なお、認識装置13の特徴点抽出部31および特徴量計算部32は、検出対象を認識しようとする入力画像に対して、学習装置11の特徴点抽出部21および特徴量計算部22と同様の処理を行うものであるので、その説明は省略する。
【0057】
識別計算部33は、識別器記録部12に記録されている識別用特徴量および識別器を読み出す。また、識別計算部33は、特徴量計算部32からの特徴量のうちの識別用特徴量に対応するものを、読み出した識別器に代入して演算を行ない、その演算結果を識別結果出力部34に供給する。識別結果出力部34は、識別計算部33からの演算結果に基づいて、検出対象が入力画像から検出されたか否かの識別結果を出力する。
【0058】
[識別器生成部の構成例]
また、図4の識別器生成部24は、より詳細には図5に示すように構成される。
【0059】
識別器生成部24は、弱識別計算部61、誤り率計算部62、識別器更新部63、および重み設定部64から構成される。
【0060】
弱識別計算部61は、取得部23からの転移識別器を構成する各弱識別器について、特徴量計算部22から供給された、学習画像の特徴点から抽出された特徴量を弱識別器に代入し、弱識別器により検出対象が認識されたか否かの判定を行なう。
【0061】
誤り率計算部62は、弱識別計算部61から供給された各弱識別器による演算結果、特徴量計算部22からの学習画像に付加されているラベル、および重み設定部64からの学習画像ごとの重みに基づいて、各弱識別器による検出対象の認識の誤り率を算出する。なお、学習画像には、その学習画像に検出対象が含まれているか否かを示すラベルが予め付加されているものとする。例えば、学習画像に検出対象が含まれている場合、その学習画像にはラベルとして「1」が付加され、学習画像に検出対象が含まれていない場合、その学習画像にはラベルとして「−1」が付加されている。
【0062】
識別器更新部63は、各転移識別器を構成する弱識別器のうち、誤り率計算部62により算出された誤り率が最も低い弱識別器を選択し、選択したいくつかの弱識別器からなる識別器を生成して識別器と識別用特徴量を識別器記録部12に供給する。また、識別器更新部63は、選択した弱識別器の誤り率に基づいて信頼度を計算し、重み設定部64に供給する。重み設定部64は、識別器更新部63からの信頼度に基づいて学習画像ごとの重みを更新し、誤り率計算部62に供給する。
【0063】
[転移学習処理の説明]
次に、図6のフローチャートを参照して、学習装置11による転移学習処理について説明する。この転移学習処理は、学習装置11に検出対象が含まれている学習画像、および検出対象が含まれていない学習画像が供給されて、識別器の生成が指示されると開始される。すなわち、学習装置11には、ラベル「1」が付加された学習画像と、ラベル「−1」が付加された学習画像とが複数供給される。
【0064】
ステップS11において、取得部23は複数の転移識別器を取得し、識別器生成部24の弱識別計算部61に供給する。例えば、これから指差しの形状の手を認識するための識別器が生成される場合、アダブーストなどの統計学習により生成された、グーの識別器やチョキの識別器が転移識別器として取得される。
【0065】
ステップS12において、特徴点抽出部21は、供給された学習画像ごとに、学習画像上のいくつかの位置(画素)を特徴点として抽出し、抽出した特徴点と学習画像とを特徴量計算部22に供給する。
【0066】
ステップS13において、特徴量計算部22は、特徴点抽出部21から供給された学習画像と特徴点に基づいて特徴量を計算する。
【0067】
例えば、特徴量計算部22は、学習画像上の特徴点に対してレクタングルフィルタなどのフィルタを用いたフィルタ処理を施して、そのフィルタ処理結果を特徴点における特徴量とする。特徴量計算部22は、学習画像ごとに、学習画像上の各特徴点の特徴量を算出し、各特徴点の特徴量を弱識別計算部61に供給するとともに、学習画像を誤り率計算部62に供給する。
【0068】
ステップS14において、重み設定部64は、学習画像ごとの重みを初期化する。例えば、M個の学習画像P1乃至学習画像PMが供給された場合、各学習画像の重みWm(但し、1≦m≦M)が1/Mとされる。また、識別器更新部63は、保持している識別器F(x)を0に初期化する。
【0069】
ステップS15において、弱識別計算部61は、取得部23から供給された転移識別器を構成する弱識別器に、特徴量計算部22から供給された特徴点の特徴量を代入し、検出対象の認識(識別)を行う。
【0070】
例えば、取得部23から弱識別計算部61にk個の転移識別器が供給され、それらの転移識別器を構成する弱識別器の数の合計がN個であったとする。すなわち、N個の弱識別器f1(x)乃至弱識別器fN(x)が弱識別計算部61に供給されたとする。また、各学習画像Pm(但し、1≦m≦M)から、弱識別器f1(x)乃至弱識別器fN(x)に対応するN個の特徴点FPnの特徴量Fn(但し、1≦n≦N)が抽出されたとする。つまり、弱識別器fn(x)に対応する特徴点FPnは、弱識別器fn(x)に代入される特徴量が抽出される特徴点である。
【0071】
このような場合、弱識別計算部61は、各弱識別器fn(x)(但し、1≦n≦N)について、学習画像Pmごとに特徴点FPnの特徴量Fnを式(1)における変数xとして、弱識別器fn(x)を構成する関数g(x>thwn)に代入する。そして、その演算結果が弱識別器fn(x)の学習画像Pmにおける特徴点FPnについての識別結果とされる。
【0072】
すなわち、関数g(x>thwn)の閾値thwnよりも特徴量Fnが大きい場合、特徴点FPnには検出対象が含まれている、つまり検出対象が認識されたとされて、その旨を示す数値「1」が識別結果とされる。逆に、特徴量Fnが閾値thwn以下である場合、特徴点FPnには検出対象が含まれていない、つまり検出対象が認識されなかったとされて、その旨を示す数値「0」が識別結果とされる。弱識別計算部61は、このようにして得られた識別結果を誤り率計算部62に供給する。
【0073】
ステップS16において、誤り率計算部62は、弱識別計算部61からの識別結果、特徴量計算部22からの学習画像に付加されているラベル、および重み設定部64からの学習画像ごとの重みに基づいて、各弱識別器による検出対象の認識の誤り率を算出する。すなわち、各弱識別器fn(x)について誤り率En(但し、1≦n≦N)が算出される。
【0074】
具体的には、誤り率計算部62は、弱識別器fn(x)について、学習画像Pmごとに特徴点FPnにおける識別結果と、学習画像Pmに付加されたラベルとを比較し、識別結果が誤認識であった学習画像Pmの重みWmの総和を誤り率Enとする。
【0075】
例えば、学習画像Pmの特徴点FPnでの識別結果が「1」であるが、学習画像Pmのラベルが「−1」である場合、つまり実際には学習画像Pmには検出対象が含まれていないが、弱識別器fn(x)により学習画像Pmで検出対象が認識された場合、誤認識とされる。また、例えば学習画像Pmの特徴点FPnでの識別結果が「0」であるが、学習画像Pmのラベルが「1」である場合、つまり学習画像Pmに検出対象が含まれているが、弱識別器fn(x)により検出対象が認識されなかった場合、誤認識とされる。
【0076】
このようにして得られた弱識別器fn(x)の誤り率Enは、弱識別器fn(x)による検出対象の認識精度を示しており、誤り率Enが小さい弱識別器fn(x)ほど、より検出対象の検出に適した弱識別器であるということができる。
【0077】
誤り率計算部62は、各弱識別器fn(x)の誤り率Enを算出すると、それらの誤り率を識別器更新部63に供給する。
【0078】
ステップS17において、識別器更新部63は、誤り率計算部62から供給された各弱識別器fn(x)の誤り率Enに基づいて、N個の弱識別器f1(x)乃至弱識別器fN(x)のうち、誤り率Enが最小となる弱識別器fn(x)を選択する。すなわち、検出対象とされる指差し形状の手を検出するのに最も適した弱識別器が選択される。識別器更新部63は、選択した弱識別器fn(x)を、誤り率計算部62を介して弱識別計算部61から取得する。
【0079】
ステップS18において、識別器更新部63は、保持している識別器F(x)に、ステップS17で選択された弱識別器fn(x)を加算することで、識別器を更新する。
【0080】
すなわち、これまで保持されていた識別器がF’(x)であるとすると、F’(x)+fn(x)が新たな識別器F(x)とされる。また、このとき選択された弱識別器fn(x)に対応する特徴点FPnの特徴量Fnが識別用特徴量とされる。
【0081】
ステップS19において、重み設定部64は、学習画像Pmごとの重みWmを更新し、更新された各学習画像の重みを誤り率計算部62に供給する。
【0082】
例えば、識別器更新部63は、ステップS17で選択された弱識別器fn(x)の誤り率Enに基づいて、次式(3)で示される信頼度Cnを計算し、その計算結果を重み設定部64に供給する。
【0083】
【数1】

【0084】
そして、重み設定部64は、識別器更新部63からの信頼度Cnに基づいて次式(4)を計算することで、学習画像Pmの重みWmを再計算するとともに、全ての重みWmを正規化して更新し、誤り率計算部62に供給する。
【0085】
【数2】

【0086】
なお、式(4)においてy≠fnは、誤認識が発生した特徴点の条件を示しており、式(4)では、選択された弱識別器fn(x)による認識において、誤認識が発生した特徴点FPnを含む学習画像Pmの重みWmが大きくなることが示されている。また、式(4)では、誤認識が発生しなかった学習画像Pmの重みWmは、そのままの値とされる。
【0087】
誤認識が生じた学習画像Pmは検出対象の認識が困難な画像であるので、そのような画像の重みが大きくなるように各学習画像の重みを更新すれば、転移学習においてより高精度に検出対象の認識が可能となる識別器を得ることができるようになる。
【0088】
ステップS20において、識別器更新部63は、必要な数だけ弱識別器を選択したか否かを判定する。例えば、生成しようとする識別器がJ個の弱識別器から構成されるようにすると定められている場合、識別器を構成する弱識別器がJ個だけ選択されたとき、必要な数の弱識別器が選択されたと判定される。つまり、ステップS15乃至ステップS19の処理がJ回行われたとき、必要な数の弱識別器が選択されたと判定される。
【0089】
ステップS20において、まだ必要な数だけ弱識別器が選択されていないと判定された場合、処理はステップS15に戻り、上述した処理が繰り返される。
【0090】
これに対して、ステップS20において、必要な数だけ弱識別器が選択されたと判定された場合、処理はステップS21に進む。
【0091】
ステップS21において、識別器更新部63は、保持している識別器F(x)と、その識別器を構成する各弱識別器の識別用特徴量とを識別器記録部12に出力して記録させ、転移学習処理は終了する。例えば、ステップS15乃至ステップS19の処理がJ回行われた場合、選択されたJ個の弱識別器の和が識別器F(x)とされる。
【0092】
以上のようにして、学習装置11は、学習画像と既に統計学習により得られている転移識別器とを用いて、ブースティングによる転移学習を行なう。
【0093】
このように高精度な識別器が得られるブースティングによる学習に、既に得られている他の識別器の弱識別器を利用すれば、より高速に高精度な識別器を得ることができる。
【0094】
例えば、図7の上側に示すように、通常のブースティングによる学習では、L個の学習画像(学習サンプル)のそれぞれについて、H個の特徴点から特徴量を抽出する場合、各特徴点についてL個の学習画像ごとの特徴量が並び替えられて弱識別器が設定される。そして、得られたH個の弱識別器のなかから、最も適切な1つの弱識別器が選択されて識別器に加算され、このようにして識別器を更新していくことで最終的な識別器が得られる。
【0095】
これに対して、ブースティングによる転移学習では、図7の下側に示すように、L個の学習画像のそれぞれから、H個の特徴点の特徴量が抽出されて識別器が生成されると、その識別器を構成するZ個(但し、Z<H)の弱識別器が転移される。そして、転移されたZ個の弱識別器のなかから、最も適切な1つの弱識別器が選択されて識別器に加算され、このようにして識別器を更新していくことで最終的な識別器が得られる。
【0096】
したがって、各学習画像上の全特徴点の数であるH個よりも少ないZ個の特徴点について処理を行えばよく、また弱識別器を設定する必要もないので、通常のブースティングによる学習と比較して、L×(H/Z)倍だけ高速に識別器を得ることができる。
【0097】
[識別処理の説明]
以上において説明した転移学習処理が行われて、識別器記録部12に識別器と識別用特徴量が記録されると、認識装置13は、それらの識別器と識別用特徴量を用いて、供給された入力画像から検出対象を検出することができるようになる。
【0098】
以下、図8のフローチャートを参照して、認識装置13による識別処理について説明する。
【0099】
ステップS41において、特徴点抽出部31は、供給された入力画像上のいくつかの位置(画素)を特徴点として抽出し、抽出した特徴点と入力画像とを特徴量計算部32に供給する。
【0100】
ステップS42において、特徴量計算部32は、特徴点抽出部31から供給された入力画像と特徴点に基づいて特徴量を計算し、その計算結果を識別計算部33に供給する。
【0101】
例えば、特徴量計算部32は、入力画像上の特徴点に対してレクタングルフィルタなどのフィルタを用いたフィルタ処理を施して、そのフィルタ処理結果を特徴点における特徴量とする。
【0102】
なお、ステップS41およびステップS42では、図6のステップS12およびステップS13と同様の処理が行われる。
【0103】
ステップS43において、識別計算部33は、識別器記録部12から識別器F(x)および識別用特徴量を読み出して、読み出した識別器に特徴量を代入して計算する。すなわち、識別計算部33は、特徴量計算部32からの特徴量のうちの識別用特徴量に対応するものを、式(2)により示される識別器に代入して演算を行う。ここで、識別器を構成する弱識別器に代入される特徴量は、識別用特徴量とされた特徴量が求められた学習画像の特徴点と同じ位置にある、入力画像上の特徴点の特徴量である。
【0104】
識別計算部33は、式(2)の演算により得られた出力値が閾値thより大きい場合、入力画像に検出対象があるとして数値「1」を識別結果とし、出力値が閾値th以下である場合、入力画像に検出対象がないとして数値「−1」を識別結果とする。そして、識別計算部33は、このようにして得られた識別結果を識別結果出力部34に供給する。
【0105】
ステップS44において、識別結果出力部34は、識別計算部33から供給された識別結果を出力し、識別処理は終了する。例えば、識別結果出力部34は識別結果に基づいて、図示せぬ表示部に、入力画像から検出対象が検出された旨の表示、または入力画像から検出対象が検出されなかった旨の表示をさせる。
【0106】
以上のようにして、認識装置13は識別器記録部12に記録された識別器と識別用特徴量とを用いて、入力画像から検出対象を検出する。ブースティングによる転移学習で得られた識別器を用いて検出対象の検出を行なうことで、より高精度に検出対象を検出することができる。
【0107】
〈第2の実施の形態〉
[学習装置の構成例]
続いて上述した手法2の特徴量を転移させる学習を行なう場合における、学習装置の構成について説明する。
【0108】
図9は、特徴量を転移させて学習を行なう場合における学習装置の一実施の形態の構成例を示す図である。なお、図9において、図4における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。
【0109】
学習装置91は、特徴点抽出部21、特徴量計算部22、取得部23、および識別器生成部101から構成される。
【0110】
識別器生成部101は、特徴量計算部22から供給された学習画像および特徴量と、取得部23から供給された転移識別器を構成する各弱識別器の識別用特徴量とに基づいて、例えばアダブーストによる転移学習処理を行い、識別器を生成する。また、識別器生成部101は、生成した識別器と、その識別器を構成する弱識別器の識別用特徴量とを識別器記録部12に供給し、記録させる。
【0111】
[識別器生成部の構成例]
また、図9の識別器生成部101は、より詳細には図10に示すように構成される。なお、図10において、図5における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。
【0112】
識別器生成部101は、弱識別器設定部131、弱識別計算部61、誤り率計算部62、識別器更新部63、および重み設定部64から構成される。
【0113】
弱識別器設定部131は、特徴量計算部22から供給された学習画像の各特徴点の特徴量のうち、取得部23からの転移識別器を構成する各弱識別器の識別用特徴量と同じ特徴点の特徴量を用いて、それらの特徴点ごとに弱識別器を設定する。また、弱識別器設定部131は、設定した弱識別器と、各学習画像の特徴点の特徴量とを弱識別計算部61に供給する。
【0114】
[転移学習処理の説明]
次に、図11のフローチャートを参照して、学習装置91による転移学習処理について説明する。この転移学習処理では、学習装置91には、ラベル「1」が付加された学習画像と、ラベル「−1」が付加された学習画像とが複数供給される。
【0115】
なお、ステップS51乃至ステップS54の処理は、図6のステップS11乃至ステップS14の処理と同様であるので、その説明は省略する。但し、ステップS51では、取得部23により取得された転移識別器は弱識別器設定部131に供給される。また、ステップS53では、学習画像の各特徴点から抽出された特徴量が、特徴量計算部22から弱識別器設定部131に供給され、学習画像のラベルが特徴量計算部22から誤り率計算部62に供給される。
【0116】
ステップS55において、弱識別器設定部131は、特徴量計算部22から供給された学習画像の各特徴点の特徴量と、取得部23からの転移識別器を構成する各弱識別器の識別用特徴量とに基づいて、弱識別器を設定する。
【0117】
例えば、取得部23から弱識別器設定部131にk個の転移識別器が供給され、それらの転移識別器を構成する弱識別器の数の合計がN個であったとする。すなわち、N個の弱識別器f1(x)乃至弱識別器fN(x)が供給されたとする。
【0118】
このような場合、図12に示すように、各学習画像Pm(但し、1≦m≦M)から抽出された特徴量のうち、弱識別器f1(x)乃至弱識別器fN(x)に対応するN個の特徴点FPnの特徴量が用いられて、特徴点ごとに弱識別器が設定される。
【0119】
図12では、図中、横方向に学習画像Pmから抽出された特徴量が並べられている。例えば、図中、一番上側に横方向に並んでいる(A1,A2,A3,・・・,AN)は、学習画像P1の各特徴点の特徴量のうち、弱識別器f1(x)乃至弱識別器fN(x)の識別用特徴量に対応する特徴量のそれぞれを表している。つまり、学習画像P1の各特徴点の特徴量のうち、識別用特徴量とされた特徴量が求められた特徴点と同じ位置にある、学習画像P1上の特徴点の特徴量である。
【0120】
また、学習画像を表す文字「Pm」の図中、左側の数字「+1」または「−1」は、その学習画像Pmに付加されたラベルを示している。つまり、数字「+1」は、学習画像に検出対象が含まれている旨のラベルを示しており、数字「−1」は、学習画像に検出対象が含まれていない旨のラベルを示している。
【0121】
さらに、図12では、縦方向に並んだM個の特徴量An乃至特徴量Vnが1つのグループGrn(但し、1≦n≦N)とされており、このグループGrnに属す特徴量は、各学習画像における同じ特徴点の特徴量とされている。
【0122】
弱識別器設定部131は、グループGrnごとに、そのグループに属すM個の特徴量を昇べきの順、または降べきの順に並び替える。
【0123】
そして、弱識別器設定部131は、学習画像のラベルに基づいて、グループごとに式(1)に示した弱識別器の関数g(x>thwn)、定数an、および定数bnを定めることで、弱識別器を設定する。
【0124】
具体的には、図13に示すように、グループGr1に属す特徴量A1乃至特徴量V1が順番に並べられ、弱識別器設定部131が関数g(x>thw1)を定める閾値thw1を、特徴量A1と特徴量C1の間に設定したとする。
【0125】
ここで、特徴量が閾値thw1より小さい範囲、つまり図中、閾値thw1より左側の「−1」で示される範囲では、認識しようとする検出対象がないとされる。また、特徴量が閾値thw1より大きい範囲、つまり図中、閾値thw1より右側の「+1」で示される範囲では、認識しようとする検出対象があるとされる。
【0126】
この例では、図中の点線で囲まれた特徴量A1は、検出対象が含まれた学習画像の特徴量であるのでエラー(誤認識)であるとみなされる。同様に、点線で囲まれた特徴量C1と特徴量V1は、検出対象が含まれていない学習画像の特徴量であるのでエラー(誤認識)であるとみなされる。
【0127】
弱識別器設定部131は、例えば閾値thw1の値を変化させながら、各閾値thw1の値について上述した弱識別器f1(x)の誤り率E1を算出し、誤り率E1が最小となるように閾値thw1を定めることで、弱識別器を設定する。この場合、弱識別器設定部131は、重み設定部64から各学習画像の重みを取得して、誤り率の算出を行なう。
【0128】
弱識別器設定部131は、各グループ、つまり転移識別器の各弱識別器の識別用特徴量に対応する学習画像の特徴点について、弱識別器を設定すると、設定した弱識別器と、学習画像の各特徴点の特徴量とを弱識別計算部61に供給する。
【0129】
このようにして弱識別器が設定されると、その後、ステップS56乃至ステップS62の処理が行われて転移学習処理は終了するが、これらの処理は図6のステップS15乃至ステップS21の処理と同様であるので、その説明は省略する。
【0130】
但し、図6のステップS15では、転移識別器を構成する弱識別器が用いられて処理が行われるのに対して、図11のステップS56では、ステップS55の処理で設定された弱識別器が用いられて処理が行われる。
【0131】
以上のようにして、学習装置91は、学習画像と既に統計学習により得られている転移識別器とを用いて、ブースティングによる転移学習を行なう。
【0132】
このように高精度な識別器が得られるブースティングによる学習に、既に得られている他の識別器の弱識別器の識別用特徴量を利用すれば、より高速に高精度な識別器を得ることができる。
【0133】
例えば、図14に示すように、ブースティングによる転移学習では、L個の学習画像のそれぞれから、H個の特徴点の特徴量が抽出されて識別器が生成されると、その識別器を構成するZ個(但し、Z<H)の弱識別器の識別用特徴量が転移される。
【0134】
また、転移されたZ個の識別用特徴量に対応する学習画像の特徴点の特徴量が用いられて、特徴点ごとに弱識別器が設定される。そして、設定された弱識別器のなかから、最も適切な1つの弱識別器が選択されて識別器に加算され、このようにして識別器を更新していくことで、最終的な識別器が得られる。
【0135】
これに対して、通常のブースティングによる学習では、識別器の転移が行なわれないので、H個の特徴点ごとに弱識別器が設定されることになる。
【0136】
したがって、ブースティングによる転移学習では、各学習画像上の全特徴点の数であるH個よりも少ないZ個の特徴点について処理を行えばよいので、通常のブースティングによる学習と比較して、H/Z倍だけ高速に識別器を得ることができる。
【0137】
学習装置91により生成された識別器と識別用特徴量も、識別器記録部12に記録されると、それらの識別器と識別用特徴量は、認識装置13による識別処理に用いられる。すなわち、図8を参照して説明した識別処理に用いられる。
【0138】
〈第3の実施の形態〉
[ツリー構造の識別器について]
なお、以上においては、特定形状の手を検出するための識別器の学習に、既に得られた他の形状の手検出用の識別器を利用する例について説明したが、転移学習をツリー構造(木構造)の識別器を用いた認識システムに適用することも可能である。
【0139】
例えば、図15に示すように、11個の識別器TF11乃至識別器TF21からなるツリー構造の識別器を用いて、入力画像上の手の形状を識別する場合を例として説明する。
【0140】
このツリー構造の識別器は、入力された入力画像から、グー形状の右手若しくは左手、パー形状の右手若しくは左手、またはチョキ形状の右手若しくは左手のうちの何れかの形状の手を検出する、多クラス物体認識用の識別器である。
【0141】
ツリー構造の識別器を構成する識別器TF11は、入力画像から手を検出するための識別器であり、特にルートノードと呼ばれている。ここで、識別器TF11による手検出では、グーやパーなど、手の形状によらず入力画像に手らしいものがあれば、手が検出された旨の識別結果が出力される。また、識別器TF12は、入力画像からグー形状の手を検出するための識別器であり、識別器TF13は、入力画像からパーまたはチョキの形状の手を検出するための識別器である。
【0142】
識別器TF14および識別器TF15は、それぞれ入力画像から右手グーおよび左手グーを検出するためのものであり、識別器TF16および識別器TF17は、それぞれ入力画像からパー形状の手およびチョキ形状の手を検出するための識別器である。
【0143】
さらに、識別器TF18および識別器TF19は、それぞれ入力画像から右手パーおよび左手パーを検出するためのものであり、識別器TF20および識別器TF21は、それぞれ入力画像から右手チョキおよび左手チョキを検出するためのものである。
【0144】
特に、ツリーの末端にある識別器TF14、識別器TF15、および識別器TF18乃至識別器TF21は、リーフと呼ばれている。また、ルートノードとリーフの間にある識別器TF12、識別器TF13、識別器TF16、および識別器TF17は、ノードと呼ばれている。
【0145】
このようなツリー構造の識別器が用いられて手形状の識別が行なわれる場合、まず識別器TF11により入力画像に対して手検出が行なわれる。そして、入力画像から手が検出されると、次に識別器TF12により入力画像からグーの検出が行なわれるとともに、識別器TF13により入力画像からパーまたはチョキの検出が行なわれる。
【0146】
このとき、識別器TF13の識別結果よりも、識別器TF12の識別結果がより確からしい場合、つまり入力画像にグー形状の手があると推定される場合、入力画像に対して識別器TF14および識別器TF15による識別が行なわれる。
【0147】
その結果、識別器TF15の識別結果よりも識別器TF14の識別結果がより確からしい場合、入力画像から右手グーが検出されたとされ、識別器TF14の識別結果よりも識別器TF15の識別結果がより確からしい場合、入力画像から左手グーが検出されたとされる。
【0148】
また、識別器TF12の識別結果よりも、識別器TF13の識別結果がより確からしい場合、つまり入力画像にパーまたはチョキ形状の手があると推定される場合、入力画像に対して識別器TF16および識別器TF17による識別が行なわれる。
【0149】
その結果、識別器TF17の識別結果よりも、識別器TF16の識別結果がより確からしい場合、つまり入力画像にパー形状の手があると推定される場合、入力画像に対して識別器TF18および識別器TF19による識別が行なわれる。そして、それらの識別器の識別結果のうち、識別器TF18の識別結果がより確からしい場合、入力画像から右手パーが検出されたとされ、識別器TF19の識別結果がより確からしい場合、入力画像から左手パーが検出されたとされる。
【0150】
また、識別器TF16の識別結果よりも、識別器TF17の識別結果がより確からしい場合、つまり入力画像にチョキ形状の手があると推定される場合、入力画像に対して識別器TF20および識別器TF21による識別が行なわれる。そして、それらの識別器の識別結果のうち、識別器TF20の識別結果がより確からしい場合、入力画像から右手チョキが検出されたとされ、識別器TF21の識別結果がより確からしい場合、入力画像から左手チョキが検出されたとされる。
【0151】
このように、多クラスの物体認識が可能なツリー構造の識別器では、いくつかの識別器により入力画像に対して物体認識が行なわれ、その結果により右手パーや左手チョキなど、各クラスのうちの何れかのクラスの物体が検出される。
【0152】
また、例えばこのようなツリー構造の識別器を学習により得ようとする場合、リーフとなる識別器をアダブーストのようなブースティングによる学習により生成すれば、高精度な識別器を得ることができる。
【0153】
さらに、これらのリーフとなる識別器を転移識別器として、ブースティングによる転移学習により、各ノードやルートノードの識別器を生成すれば、より少ない学習サンプルで、より高速に高精度な識別器を得ることができる。
【0154】
特に、通常のブースティングによる学習でルートノードの識別器を生成しようとすると、パーやグーなど多くの形状の手の学習画像が大量に必要となるため、膨大な計算時間がかかってしまう。これに対して、リーフの識別器を転移させてルートノードの識別器を転移学習により生成すれば、大幅に学習効率を向上させることができる。
【0155】
例えば、ノードである識別器TF12を得ようとする場合には、リーフである識別器TF14、識別器TF15、および識別器TF18乃至識別器TF21を転移識別器として、転移学習を行なえばよい。
【0156】
具体的には、例えば図4に示した学習装置11が、識別器TF14、識別器TF15、および識別器TF18乃至識別器TF21を構成する弱識別器を転移させ、図6の転移学習処理を行なえば、識別器TF12を得ることができる。
【0157】
また、例えば図9に示した学習装置91が、識別器TF14、識別器TF15、および識別器TF18乃至識別器TF21を構成する弱識別器の識別用特徴量を転移させ、図11の転移学習処理を行なうことで識別器TF12を得ることも勿論可能である。
【0158】
[認識装置の構成例]
次に、図15に示したツリー構造の識別器を用いて多クラスの手形状認識を行なう認識装置について説明する。そのような認識装置は、例えば図16に示すように構成される。
【0159】
すなわち、認識装置161は、手識別部171、グー識別部172、チョキパー識別部173、比較部174、右グー識別部175、左グー識別部176、パー識別部177、チョキ識別部178、比較部179、右パー識別部180、左パー識別部181、右チョキ識別部182、左チョキ識別部183、および出力部184から構成される。
【0160】
認識装置161では、図15の識別器TF11乃至識別器TF21のそれぞれが、手識別部171、グー識別部172、チョキパー識別部173、右グー識別部175、左グー識別部176、パー識別部177、チョキ識別部178、右パー識別部180、左パー識別部181、右チョキ識別部182、および左チョキ識別部183に記録されている。
【0161】
手識別部171は、識別器TF11を用いて供給された入力画像から手を検出し、手が検出された場合、手が検出された旨の識別結果と入力画像をグー識別部172およびチョキパー識別部173に供給する。また、手識別部171は、入力画像から手が検出されなかった場合、手が検出されなかった旨の識別結果を出力部184に供給する。
【0162】
グー識別部172およびチョキパー識別部173は、記録している識別器TF12および識別器TF13に基づいて、手識別部171から供給された入力画像上のグー、およびパーまたはチョキを識別し、その識別結果と入力画像を比較部174に供給する。
【0163】
比較部174は、グー識別部172およびチョキパー識別部173から供給された識別結果を比較して、入力画像を右グー識別部175および左グー識別部176、またはパー識別部177およびチョキ識別部178に供給する。
【0164】
右グー識別部175および左グー識別部176は、記録している識別器TF14および識別器TF15に基づいて、比較部174から供給された入力画像上の右手グー、および左手グーを識別し、その識別結果を出力部184に供給する。
【0165】
パー識別部177およびチョキ識別部178は、記録している識別器TF16および識別器TF17に基づいて、比較部174から供給された入力画像上のパー、およびチョキを識別し、その識別結果と入力画像を比較部179に供給する。
【0166】
比較部179は、パー識別部177およびチョキ識別部178から供給された識別結果を比較して、入力画像を右パー識別部180および左パー識別部181、または右チョキ識別部182および左チョキ識別部183に供給する。
【0167】
右パー識別部180および左パー識別部181は、記録している識別器TF18および識別器TF19に基づいて、比較部179から供給された入力画像上の右手パー、および左手パーを識別し、その識別結果を出力部184に供給する。右チョキ識別部182および左チョキ識別部183は、記録している識別器TF20および識別器TF21に基づいて、比較部179から供給された入力画像上の右手チョキ、および左手チョキを識別し、その識別結果を出力部184に供給する。
【0168】
出力部184は、手識別部171、右グー識別部175、左グー識別部176、右パー識別部180、左パー識別部181、右チョキ識別部182、および左チョキ識別部183からの識別結果に基づいて、入力画像からの手の識別結果を出力する。
【0169】
[識別処理の説明]
図16の認識装置161に入力画像が供給され、手形状の認識が指示されると、認識装置161は識別処理を行なって、入力画像から手を検出する。以下、図17のフローチャートを参照して、認識装置161による識別処理について説明する。
【0170】
ステップS91において、手識別部171は、識別器TF11を用いて供給された入力画像から手を検出する。すなわち、手識別部171は、入力画像から特徴量を抽出して識別器TF11に代入し、その演算結果が所定の閾値より大きい場合、入力画像から手が検出されたとする。
【0171】
ステップS92において、手識別部171は、入力画像から手が検出されたか否かを判定する。ステップS92において、手が検出されなかったと判定された場合、その旨の識別結果を出力部184に供給し、処理はステップS105に進む。
【0172】
これに対して、ステップS92において、手が検出されたと判定された場合、手識別部171は、手が検出された旨の識別結果と入力画像をグー識別部172およびチョキパー識別部173に供給し、処理はステップS93に進む。
【0173】
ステップS93において、グー識別部172は、記録している識別器TF12に基づいて、手識別部171から供給された入力画像からのグーの識別を行なう。すなわち、グー識別部172は、入力画像から特徴量を抽出して識別器TF12に代入し、その演算結果として得られた出力値と入力画像を比較部174に供給する。
【0174】
このようにして得られた出力値は、入力画像のグーの手らしさを示しており、出力値が大きいほど、入力画像がグー形状の手らしい画像であるとされる。なお、他の識別器においても、識別器に特徴量を代入して得られる出力値は、その識別器により検出される物体、すなわちここでは、特定形状の手らしさを示している。
【0175】
ステップS94において、チョキパー識別部173は、記録している識別器TF13に基づいて、手識別部171から供給された入力画像からのパーまたはチョキの識別を行なう。すなわち、チョキパー識別部173は、入力画像から特徴量を抽出して識別器TF13に代入し、その演算結果として得られた出力値と入力画像を比較部174に供給する。
【0176】
ステップS95において、比較部174は、グー識別部172からの出力値とチョキパー識別部173からの出力値とを比較して、入力画像上のグーが識別されたか否かを判定する。例えば、グー識別部172からの出力値が、チョキパー識別部173からの出力値よりも大きい場合、入力画像には、チョキまたはパーよりもグーが含まれる可能性が高いので、グーが識別されたと判定される。
【0177】
ステップS95において、グーが識別されたと判定された場合、比較部174は、入力画像を右グー識別部175および左グー識別部176に供給し、処理はステップS96に進む。
【0178】
ステップS96において、右グー識別部175は、記録している識別器TF14に基づいて、比較部174から供給された入力画像からの右手グーの識別を行なう。すなわち、右グー識別部175は、入力画像から特徴量を抽出して識別器TF14に代入し、その演算結果として得られた出力値を出力部184に供給する。
【0179】
ステップS97において、左グー識別部176は、記録している識別器TF15に基づいて、比較部174から供給された入力画像からの左手グーの識別を行なう。すなわち、左グー識別部176は、入力画像から特徴量を抽出して識別器TF15に代入し、その演算結果として得られた出力値を出力部184に供給する。
【0180】
ステップS97の処理が行なわれると、その後、処理はステップS105に進む。
【0181】
また、ステップS95において、入力画像上のグーが識別されなかったと判定された場合、つまり入力画像上のパーまたはチョキが識別された場合、比較部174は、入力画像をパー識別部177およびチョキ識別部178に供給し、処理はステップS98に進む。
【0182】
ステップS98において、パー識別部177は、記録している識別器TF16に基づいて、比較部174から供給された入力画像からのパーの識別を行なう。すなわち、パー識別部177は、入力画像から特徴量を抽出して識別器TF16に代入し、その演算結果として得られた出力値と入力画像を比較部179に供給する。
【0183】
ステップS99において、チョキ識別部178は、記録している識別器TF17に基づいて、比較部174から供給された入力画像からのチョキの識別を行なう。すなわち、チョキ識別部178は、入力画像から特徴量を抽出して識別器TF17に代入し、その演算結果として得られた出力値と入力画像を比較部179に供給する。
【0184】
ステップS100において、比較部179は、パー識別部177からの出力値とチョキ識別部178からの出力値とを比較して、入力画像上のパーが識別されたか否かを判定する。例えば、パー識別部177からの出力値が、チョキ識別部178からの出力値よりも大きい場合、パーが識別されたと判定される。
【0185】
ステップS100において、パーが識別されたと判定された場合、比較部179は、入力画像を右パー識別部180および左パー識別部181に供給し、処理はステップS101に進む。
【0186】
ステップS101において、右パー識別部180は、記録している識別器TF18に基づいて、比較部179から供給された入力画像からの右手パーの識別を行なう。すなわち、右パー識別部180は、入力画像から特徴量を抽出して識別器TF18に代入し、その演算結果として得られた出力値を出力部184に供給する。
【0187】
ステップS102において、左パー識別部181は、記録している識別器TF19に基づいて、比較部179から供給された入力画像からの左手パーの識別を行なう。すなわち、左パー識別部181は、入力画像から特徴量を抽出して識別器TF19に代入し、その演算結果として得られた出力値を出力部184に供給する。
【0188】
ステップS102の処理が行なわれると、その後、処理はステップS105に進む。
【0189】
さらに、ステップS100において、パーが識別されなかった、すなわちチョキが識別されたと判定された場合、比較部179は、入力画像を右チョキ識別部182および左チョキ識別部183に供給し、処理はステップS103に進む。
【0190】
ステップS103において、右チョキ識別部182は、記録している識別器TF20に基づいて、比較部179から供給された入力画像からの右手チョキの識別を行なう。すなわち、右チョキ識別部182は、入力画像から特徴量を抽出して識別器TF20に代入し、その演算結果として得られた出力値を出力部184に供給する。
【0191】
ステップS104において、左チョキ識別部183は、記録している識別器TF21に基づいて、比較部179から供給された入力画像からの左手チョキの識別を行なう。すなわち、左チョキ識別部183は、入力画像から特徴量を抽出して識別器TF21に代入し、その演算結果として得られた出力値を出力部184に供給する。
【0192】
ステップS104の処理が行なわれると、その後、処理はステップS105に進む。
【0193】
ステップS92において手が検出されなかったと判定されたか、ステップS97で左手グーの識別が行なわれたか、ステップS102で左手パーの識別が行なわれたか、またはステップS104で左手チョキの識別が行なわれた場合、ステップS105の処理が行なわれる。
【0194】
すなわち、ステップS105において、出力部184は、手識別部171、右グー識別部175および左グー識別部176、右パー識別部180および左パー識別部181、または右チョキ識別部182および左チョキ識別部183からの識別結果に基づいて、入力画像からの最終的な手の識別結果を出力する。
【0195】
具体的には、出力部184は、ステップS92で手が検出されなかったと判定された場合、すなわち手識別部171から手が検出されなかった旨の識別結果が供給された場合、その識別結果を最終的な識別結果として出力する。
【0196】
また、出力部184は、ステップS96およびステップS97の処理により、右グー識別部175および左グー識別部176から出力値が供給された場合、それらの出力値のうちの大きい方により示される識別結果を最終的な識別結果として出力する。例えば、右グー識別部175からの出力値がより大きい場合、右手のグーが識別された旨の識別結果が出力される。
【0197】
さらに、出力部184は、ステップS101およびステップS102の処理により、右パー識別部180および左パー識別部181から出力値が供給された場合、それらの出力値のうちの大きい方により示される識別結果を最終的な識別結果として出力する。また、出力部184は、ステップS103およびステップS104の処理により、右チョキ識別部182および左チョキ識別部183から出力値が供給された場合、それらの出力値のうちの大きい方により示される識別結果を最終的な識別結果として出力する。
【0198】
このようにして出力部184から最終的な識別結果が出力されると、識別処理は終了する。
【0199】
以上のようにして認識装置161は、ツリー構造の識別器を用いて入力画像上の被写体の識別を行い、その識別結果を出力する。ツリー構造の識別器として、ブースティングによる転移学習で得られた識別器を用いれば、高精度に被写体の識別を行なうことができる。
【0200】
上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、プログラム記録媒体からインストールされる。
【0201】
図18は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示すブロック図である。
【0202】
コンピュータにおいて、CPU(Central Processing Unit)301,ROM(Read Only Memory)302,RAM(Random Access Memory)303は、バス304により相互に接続されている。
【0203】
バス304には、さらに、入出力インターフェース305が接続されている。入出力インターフェース305には、キーボード、マウス、マイクロホンなどよりなる入力部306、ディスプレイ、スピーカなどよりなる出力部307、ハードディスクや不揮発性のメモリなどよりなる記録部308、ネットワークインターフェースなどよりなる通信部309、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア311を駆動するドライブ310が接続されている。
【0204】
以上のように構成されるコンピュータでは、CPU301が、例えば、記録部308に記録されているプログラムを、入出力インターフェース305及びバス304を介して、RAM303にロードして実行することにより、上述した一連の処理が行われる。
【0205】
コンピュータ(CPU301)が実行するプログラムは、例えば、磁気ディスク(フレキシブルディスクを含む)、光ディスク(CD-ROM(Compact Disc-Read Only Memory),DVD(Digital Versatile Disc)等)、光磁気ディスク、もしくは半導体メモリなどよりなるパッケージメディアであるリムーバブルメディア311に記録して、あるいは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供される。
【0206】
そして、プログラムは、リムーバブルメディア311をドライブ310に装着することにより、入出力インターフェース305を介して、記録部308にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部309で受信し、記録部308にインストールすることができる。その他、プログラムは、ROM302や記録部308に、あらかじめインストールしておくことができる。
【0207】
なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
【0208】
また、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。
【0209】
さらに、本技術は、以下の構成とすることも可能である。
【0210】
[1]
検出対象が含まれている学習画像と、前記検出対象が含まれていない学習画像とからなる複数の学習画像のそれぞれについて、前記学習画像の特徴点から特徴量を抽出する特徴量抽出部と、
統計学習により得られた前記検出対象を検出するための識別器である転移識別器を構成する複数の弱識別器のそれぞれについて、前記弱識別器に対応する前記特徴量を前記弱識別器に代入することで、前記学習画像ごとに前記弱識別器による前記検出対象の識別結果を算出する弱識別計算部と、
前記識別結果に基づいて複数の前記弱識別器から選択された前記弱識別器を用いて、前記検出対象を検出するための識別器を生成する識別器生成部と
を備える学習装置。
[2]
前記識別結果に基づいて前記学習画像の重みを設定する重み設定部と、
前記弱識別器による各前記学習画像の前記識別結果および前記重みに基づいて、前記弱識別器の誤り率を計算する誤り率計算部と
をさらに備え、
前記識別器生成部は、前記誤り率に基づいて前記弱識別器を選択する
[1]に記載の学習装置。
[3]
前記識別器生成部により生成される前記識別器は、多クラス物体認識に用いられる
[1]または[2]に記載の学習装置。
[4]
前記識別器生成部により生成される前記識別器は、ツリー構造の識別器を構成する識別器であり、前記転移識別器は、前記ツリー構造の識別器のリーフを構成する識別器である
[1]乃至[3]の何れかに記載の学習装置。
[5]
検出対象が含まれている学習画像と、前記検出対象が含まれていない学習画像とからなる複数の学習画像のそれぞれについて、前記学習画像の特徴点から特徴量を抽出する特徴量抽出部と、
統計学習により得られた前記検出対象を検出するための識別器である転移識別器を構成する複数の弱識別器のそれぞれについて、前記弱識別器に対応する前記特徴量を前記弱識別器に代入することで、前記学習画像ごとに前記弱識別器による前記検出対象の識別結果を算出する弱識別計算部と、
前記識別結果に基づいて複数の前記弱識別器から選択された前記弱識別器を用いて、前記検出対象を検出するための識別器を生成する識別器生成部と
を備える学習装置の学習方法であって、
前記特徴量抽出部が前記学習画像から前記特徴量を抽出し、
前記弱識別計算部が前記識別結果を算出し、
前記識別器生成部が前記識別器を生成する
ステップを含む学習方法。
[6]
検出対象が含まれている学習画像と、前記検出対象が含まれていない学習画像とからなる複数の学習画像のそれぞれについて、前記学習画像の特徴点から特徴量を抽出し、
統計学習により得られた前記検出対象を検出するための識別器である転移識別器を構成する複数の弱識別器のそれぞれについて、前記弱識別器に対応する前記特徴量を前記弱識別器に代入することで、前記学習画像ごとに前記弱識別器による前記検出対象の識別結果を算出し、
前記識別結果に基づいて複数の前記弱識別器から選択された前記弱識別器を用いて、前記検出対象を検出するための識別器を生成する
ステップを含む処理をコンピュータに実行させるプログラム。
[7]
検出対象が含まれている学習画像と、前記検出対象が含まれていない学習画像とからなる複数の学習画像のそれぞれについて、前記学習画像の特徴点から特徴量を抽出する特徴量抽出部と、
前記学習画像から抽出された前記特徴量のうち、統計学習により得られた前記検出対象を検出するための識別器である転移識別器を構成する転移弱識別器に対応する前記特徴量と、前記学習画像とに基づいて弱識別器を生成する弱識別器設定部と、
前記弱識別器に対応する前記特徴量を前記弱識別器に代入することで、前記学習画像ごとに前記弱識別器による前記検出対象の識別結果を算出する弱識別計算部と、
前記識別結果に基づいて複数の前記弱識別器から選択された前記弱識別器を用いて、前記検出対象を検出するための識別器を生成する識別器生成部と
を備える学習装置。
[8]
前記識別結果に基づいて前記学習画像の重みを設定する重み設定部と、
前記弱識別器による各前記学習画像の前記識別結果および前記重みに基づいて、前記弱識別器の誤り率を計算する誤り率計算部と
をさらに備え、
前記識別器生成部は、前記誤り率に基づいて前記弱識別器を選択する
[7]に記載の学習装置。
[9]
前記識別器生成部により生成される前記識別器は、多クラス物体認識に用いられる
[7]または[8]に記載の学習装置。
[10]
前記識別器生成部により生成される前記識別器は、ツリー構造の識別器を構成する識別器であり、前記転移識別器は、前記ツリー構造の識別器のリーフを構成する識別器である
[7]乃至[9]の何れかに記載の学習装置。
[11]
検出対象が含まれている学習画像と、前記検出対象が含まれていない学習画像とからなる複数の学習画像のそれぞれについて、前記学習画像の特徴点から特徴量を抽出する特徴量抽出部と、
前記学習画像から抽出された前記特徴量のうち、統計学習により得られた前記検出対象を検出するための識別器である転移識別器を構成する転移弱識別器に対応する前記特徴量と、前記学習画像とに基づいて弱識別器を生成する弱識別器設定部と、
前記弱識別器に対応する前記特徴量を前記弱識別器に代入することで、前記学習画像ごとに前記弱識別器による前記検出対象の識別結果を算出する弱識別計算部と、
前記識別結果に基づいて複数の前記弱識別器から選択された前記弱識別器を用いて、前記検出対象を検出するための識別器を生成する識別器生成部と
を備える学習装置の学習方法であって、
前記特徴量抽出部が前記学習画像から前記特徴量を抽出し、
前記弱識別器設定部が前記弱識別器を生成し、
前記弱識別計算部が前記識別結果を算出し、
前記識別器生成部が前記識別器を生成する
ステップを含む学習方法。
[12]
検出対象が含まれている学習画像と、前記検出対象が含まれていない学習画像とからなる複数の学習画像のそれぞれについて、前記学習画像の特徴点から特徴量を抽出し、
前記学習画像から抽出された前記特徴量のうち、統計学習により得られた前記検出対象を検出するための識別器である転移識別器を構成する転移弱識別器に対応する前記特徴量と、前記学習画像とに基づいて弱識別器を生成し、
前記弱識別器に対応する前記特徴量を前記弱識別器に代入することで、前記学習画像ごとに前記弱識別器による前記検出対象の識別結果を算出し、
前記識別結果に基づいて複数の前記弱識別器から選択された前記弱識別器を用いて、前記検出対象を検出するための識別器を生成する
ステップを含む処理をコンピュータに実行させるプログラム。
【符号の説明】
【0211】
11 学習装置, 21 特徴点抽出部, 22 特徴量計算部, 23 取得部, 24 識別器生成部, 61 弱識別計算部, 62 誤り率計算部, 63 識別器更新部, 64 重み設定部, 91 学習装置, 101 識別器生成部, 131 弱識別器設定部

【特許請求の範囲】
【請求項1】
検出対象が含まれている学習画像と、前記検出対象が含まれていない学習画像とからなる複数の学習画像のそれぞれについて、前記学習画像の特徴点から特徴量を抽出する特徴量抽出部と、
統計学習により得られた前記検出対象を検出するための識別器である転移識別器を構成する複数の弱識別器のそれぞれについて、前記弱識別器に対応する前記特徴量を前記弱識別器に代入することで、前記学習画像ごとに前記弱識別器による前記検出対象の識別結果を算出する弱識別計算部と、
前記識別結果に基づいて複数の前記弱識別器から選択された前記弱識別器を用いて、前記検出対象を検出するための識別器を生成する識別器生成部と
を備える学習装置。
【請求項2】
前記識別結果に基づいて前記学習画像の重みを設定する重み設定部と、
前記弱識別器による各前記学習画像の前記識別結果および前記重みに基づいて、前記弱識別器の誤り率を計算する誤り率計算部と
をさらに備え、
前記識別器生成部は、前記誤り率に基づいて前記弱識別器を選択する
請求項1に記載の学習装置。
【請求項3】
前記識別器生成部により生成される前記識別器は、多クラス物体認識に用いられる
請求項2に記載の学習装置。
【請求項4】
前記識別器生成部により生成される前記識別器は、ツリー構造の識別器を構成する識別器であり、前記転移識別器は、前記ツリー構造の識別器のリーフを構成する識別器である
請求項3に記載の学習装置。
【請求項5】
検出対象が含まれている学習画像と、前記検出対象が含まれていない学習画像とからなる複数の学習画像のそれぞれについて、前記学習画像の特徴点から特徴量を抽出する特徴量抽出部と、
統計学習により得られた前記検出対象を検出するための識別器である転移識別器を構成する複数の弱識別器のそれぞれについて、前記弱識別器に対応する前記特徴量を前記弱識別器に代入することで、前記学習画像ごとに前記弱識別器による前記検出対象の識別結果を算出する弱識別計算部と、
前記識別結果に基づいて複数の前記弱識別器から選択された前記弱識別器を用いて、前記検出対象を検出するための識別器を生成する識別器生成部と
を備える学習装置の学習方法であって、
前記特徴量抽出部が前記学習画像から前記特徴量を抽出し、
前記弱識別計算部が前記識別結果を算出し、
前記識別器生成部が前記識別器を生成する
ステップを含む学習方法。
【請求項6】
検出対象が含まれている学習画像と、前記検出対象が含まれていない学習画像とからなる複数の学習画像のそれぞれについて、前記学習画像の特徴点から特徴量を抽出し、
統計学習により得られた前記検出対象を検出するための識別器である転移識別器を構成する複数の弱識別器のそれぞれについて、前記弱識別器に対応する前記特徴量を前記弱識別器に代入することで、前記学習画像ごとに前記弱識別器による前記検出対象の識別結果を算出し、
前記識別結果に基づいて複数の前記弱識別器から選択された前記弱識別器を用いて、前記検出対象を検出するための識別器を生成する
ステップを含む処理をコンピュータに実行させるプログラム。
【請求項7】
検出対象が含まれている学習画像と、前記検出対象が含まれていない学習画像とからなる複数の学習画像のそれぞれについて、前記学習画像の特徴点から特徴量を抽出する特徴量抽出部と、
前記学習画像から抽出された前記特徴量のうち、統計学習により得られた前記検出対象を検出するための識別器である転移識別器を構成する転移弱識別器に対応する前記特徴量と、前記学習画像とに基づいて弱識別器を生成する弱識別器設定部と、
前記弱識別器に対応する前記特徴量を前記弱識別器に代入することで、前記学習画像ごとに前記弱識別器による前記検出対象の識別結果を算出する弱識別計算部と、
前記識別結果に基づいて複数の前記弱識別器から選択された前記弱識別器を用いて、前記検出対象を検出するための識別器を生成する識別器生成部と
を備える学習装置。
【請求項8】
前記識別結果に基づいて前記学習画像の重みを設定する重み設定部と、
前記弱識別器による各前記学習画像の前記識別結果および前記重みに基づいて、前記弱識別器の誤り率を計算する誤り率計算部と
をさらに備え、
前記識別器生成部は、前記誤り率に基づいて前記弱識別器を選択する
請求項7に記載の学習装置。
【請求項9】
前記識別器生成部により生成される前記識別器は、多クラス物体認識に用いられる
請求項8に記載の学習装置。
【請求項10】
前記識別器生成部により生成される前記識別器は、ツリー構造の識別器を構成する識別器であり、前記転移識別器は、前記ツリー構造の識別器のリーフを構成する識別器である
請求項9に記載の学習装置。
【請求項11】
検出対象が含まれている学習画像と、前記検出対象が含まれていない学習画像とからなる複数の学習画像のそれぞれについて、前記学習画像の特徴点から特徴量を抽出する特徴量抽出部と、
前記学習画像から抽出された前記特徴量のうち、統計学習により得られた前記検出対象を検出するための識別器である転移識別器を構成する転移弱識別器に対応する前記特徴量と、前記学習画像とに基づいて弱識別器を生成する弱識別器設定部と、
前記弱識別器に対応する前記特徴量を前記弱識別器に代入することで、前記学習画像ごとに前記弱識別器による前記検出対象の識別結果を算出する弱識別計算部と、
前記識別結果に基づいて複数の前記弱識別器から選択された前記弱識別器を用いて、前記検出対象を検出するための識別器を生成する識別器生成部と
を備える学習装置の学習方法であって、
前記特徴量抽出部が前記学習画像から前記特徴量を抽出し、
前記弱識別器設定部が前記弱識別器を生成し、
前記弱識別計算部が前記識別結果を算出し、
前記識別器生成部が前記識別器を生成する
ステップを含む学習方法。
【請求項12】
検出対象が含まれている学習画像と、前記検出対象が含まれていない学習画像とからなる複数の学習画像のそれぞれについて、前記学習画像の特徴点から特徴量を抽出し、
前記学習画像から抽出された前記特徴量のうち、統計学習により得られた前記検出対象を検出するための識別器である転移識別器を構成する転移弱識別器に対応する前記特徴量と、前記学習画像とに基づいて弱識別器を生成し、
前記弱識別器に対応する前記特徴量を前記弱識別器に代入することで、前記学習画像ごとに前記弱識別器による前記検出対象の識別結果を算出し、
前記識別結果に基づいて複数の前記弱識別器から選択された前記弱識別器を用いて、前記検出対象を検出するための識別器を生成する
ステップを含む処理をコンピュータに実行させるプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate


【公開番号】特開2012−243180(P2012−243180A)
【公開日】平成24年12月10日(2012.12.10)
【国際特許分類】
【出願番号】特願2011−114379(P2011−114379)
【出願日】平成23年5月23日(2011.5.23)
【出願人】(000002185)ソニー株式会社 (34,172)
【Fターム(参考)】