情報生成装置、物体検出装置、情報生成方法、物体検出方法、およびプログラム
【課題】ローカルバイナリパターンを用いた物体の検出の精度をより向上させることが可能な、情報生成装置、物体検出装置、情報生成方法、物体検出方法、およびプログラムを提供する。
【解決手段】検出用情報を生成するための画像のエッジ画像に基づいて、画素ごとにローカルバイナリパターンによる物体の輪郭を示す特徴量を算出し、設定された領域ごとに特徴量のヒストグラムを算出する算出部と、領域を設定し、設定した領域を示す領域情報を検出用情報として生成する領域設定部と、算出されたヒストグラムを線形写像または非線形写像により異なる空間に写像し、写像に応じた領域情報に対応する行列情報を検出用情報として生成する写像部と、写像された空間において、ヒストグラムを用いたブースティングによる物体検出の統計学習を行い、物体の検出結果を示す判別情報を検出用情報として生成する統計学習部とを備える情報生成装置が提供される。
【解決手段】検出用情報を生成するための画像のエッジ画像に基づいて、画素ごとにローカルバイナリパターンによる物体の輪郭を示す特徴量を算出し、設定された領域ごとに特徴量のヒストグラムを算出する算出部と、領域を設定し、設定した領域を示す領域情報を検出用情報として生成する領域設定部と、算出されたヒストグラムを線形写像または非線形写像により異なる空間に写像し、写像に応じた領域情報に対応する行列情報を検出用情報として生成する写像部と、写像された空間において、ヒストグラムを用いたブースティングによる物体検出の統計学習を行い、物体の検出結果を示す判別情報を検出用情報として生成する統計学習部とを備える情報生成装置が提供される。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報生成装置、物体検出装置、情報生成方法、物体検出方法、およびプログラムに関する。
【背景技術】
【0002】
近年、画像に含まれる検出対象の物体を検出するための様々な技術が開発されている。画像に含まれる検出対象の物体を検出するためのテクスチャ認識の特徴量を取得する技術としては、例えば、非特許文献1、非特許文献2に記載されているローカルバイナリパターン(Local Binary Pattern。以下、「LBP」と示す場合がある。)を用いる技術が挙げられる。また、画像に含まれる検出対象の物体を検出するための統計学習に関する技術としては、例えば、非特許文献3に記載されているブースティング(Boosting)を用いる技術が挙げられる。
【先行技術文献】
【非特許文献】
【0003】
【非特許文献1】Ojala T,Pietikainen M & Maenpaa T (2002),Multiresolution gray-scale and rotation invariant texture classification with Local Binary Patterns.IEEE Transactions on Pattern Analysis and Machine Intelligence 24(7):971-987.
【非特許文献2】Maenpaa T,Ojala T,Pietikainen M & Soriano M(2000),Robust texture classification by subsets of Local Binary Patterns.Proc.15th International Conference on Pattern Recognition,Barcelona,Spain,3:947-950.
【非特許文献3】Paul Viola & Michael Jones,Robust Real-Time Object Detection,International Journal of Computer Vision 2001.
【発明の概要】
【発明が解決しようとする課題】
【0004】
LBPは、3×3の画素領域に着目したときに、中心の画素値と近傍8画素点の値の大小を比較して各画素点で0か1かの2ビットにコーディングする手法である。ここで、LBPを用いて画像に含まれる検出対象の物体の輪郭を示す特徴量を取得する従来の技術(以下、「従来の技術1」とよぶ場合がある。)は、輝度画像に対して処理を行うことによって、テクスチャ認識の特徴量(LBPによる物体の輪郭を示す特徴量。以下、「LBPに係る特徴量」という。)を算出する。よって、従来の技術1を用いる場合には、ある程度の精度を有するLBPに係る特徴量を取得できる可能性はある。
【0005】
しかしながら、輝度画像からLBPに係る特徴量を算出する場合、算出された当該特徴量は、例えば画像に含まれるノイズの影響を受けている可能性がある。また、輝度画像からLBPに係る特徴量を算出する場合には、算出された当該特徴量が、例えば画像に含まれる人物の服の色と背景との関係に依存する恐れもある。よって、従来の技術1を用いる場合、取得された(算出された)LBPに係る特徴量が、画像に含まれる物体を認識するために十分な精度を有するとは限らない。
【0006】
また、LBPに係る特徴量は画素ごとに算出されるが、画像に含まれる物体の検出において、LBPに係る特徴量それぞれが単独で用いられることは少ない。より具体的には、算出されたLBPに係る特徴量は、例えば、画像に含まれる物体を検出するための統計学習に関する従来の技術(以下、「従来の技術2」とよぶ場合がある。)のように、統計的に用いられる。例えば従来の技術2では、画像内のある領域においてLBPに係る特徴量のヒストグラムを算出し、LBPに係る特徴量を集団とすることにより統計的に用いる。
【0007】
ここで、上記のように、従来の技術1を用いる場合には、取得されたLBPに係る特徴量が画像に含まれる物体を認識するために十分な精度を有するとは限らない。よって、従来の技術1を用いて取得されたLBPに係る特徴量を、従来の技術2のように統計的に用いたとしても、画像に含まれる物体を十分に検出できない恐れがある。
【0008】
したがって、従来の技術1および従来の技術2(以下、総称して「従来の技術」とよぶ場合がある。)を用いたとしても、ローカルバイナリパターンを用いた物体の検出の精度を向上させることは、望むべくもない。
【0009】
本発明は、上記問題に鑑みてなされたものであり、本発明の目的とするところは、ローカルバイナリパターンを用いた物体の検出の精度をより向上させることが可能な、新規かつ改良された情報生成装置、物体検出装置、情報生成方法、物体検出方法、およびプログラムを提供することにある。
【課題を解決するための手段】
【0010】
上記目的を達成するために、本発明の第1の観点によれば、画像に含まれる物体を検出するために用いられる検出用情報を生成するための画像のエッジ画像に基づいて、画素ごとにローカルバイナリパターンによる物体の輪郭を示す特徴量を算出し、設定された領域ごとに算出した上記特徴量のヒストグラムを算出する算出部と、上記領域を設定し、設定した領域を示す領域情報を、上記検出用情報として生成する領域設定部と、上記算出部において算出されたヒストグラムを線形写像または非線形写像により異なる空間に写像し、上記写像に応じた上記領域情報に対応する行列情報を、上記検出用情報として生成する写像部と、上記写像部により写像された空間において、上記ヒストグラムを用いたブースティングによる物体検出の統計学習を行い、物体の検出結果を示す判別情報を、上記検出用情報として生成する統計学習部とを備える情報生成装置が提供される。
【0011】
かかる構成により、ローカルバイナリパターンを用いた物体の検出の精度をより向上させることが可能な検出用情報を生成することができる。よって、かかる構成により、ローカルバイナリパターンを用いた物体の検出の精度をより向上させることができる。
【0012】
また、上記領域設定部は、上記エッジ画像内において、任意の位置に任意の大きさの領域を設定してもよい。
【0013】
また、上記写像部は、線形判別法により上記写像を行ってもよい。
【0014】
また、上記写像部は、ロジスティック回帰分析により上記写像を行ってもよい。
【0015】
また、上記写像部は、潜在意味解析により上記写像を行ってもよい。
【0016】
上記目的を達成するために、本発明の第2の観点によれば、物体の検出を行う検出対象画像のエッジ画像に基づいて、画素ごとにローカルバイナリパターンによる物体の輪郭を示す特徴量を算出し、画像に含まれる物体を検出するために用いられる検出用情報として情報生成装置が生成した領域情報が示す領域ごとに、算出した上記特徴量のヒストグラムを算出する算出部と、上記検出用情報として上記情報生成装置が生成した上記領域情報に対応する行列情報に基づいて、上記算出部において算出されたヒストグラムを線形写像または非線形写像し、上記ヒストグラムを異なる空間に写像する写像部と、上記写像部により写像された空間において、上記検出用情報として上記情報生成装置が生成した物体の判別のための判別情報と、上記ヒストグラムとに基づいて、上記判別情報が示す物体が上記検出対象画像に含まれているかを評価する評価部とを備える物体検出装置が提供される。
【0017】
かかる構成により、ローカルバイナリパターンを用いた物体の検出の精度をより向上させることができる。
【0018】
上記目的を達成するために、本発明の第3の観点によれば、画像に含まれる物体を検出するために用いられる検出用情報を生成するための画像のエッジ画像に対して、ローカルバイナリパターンによる物体の輪郭を示す特徴量のヒストグラムを算出するための領域を設定するステップと、上記領域を設定するステップにおいて設定した領域を示す領域情報を、上記検出用情報として生成するステップと、上記エッジ画像に基づいて、画素ごとに上記特徴量を算出し、上記領域を生成するステップにおいて設定された領域ごとに算出した上記特徴量のヒストグラムを算出するステップと、上記算出するステップにおいて算出されたヒストグラムを線形写像または非線形写像により異なる空間に写像するステップと、上記写像するステップにおける上記写像に応じた上記領域情報に対応する行列情報を、上記検出用情報として生成するステップと、上記写像するステップにおいて写像された空間において、上記ヒストグラムを用いたブースティングによる物体検出の統計学習を行い、物体の検出結果を示す判別情報を、上記検出用情報として生成するステップとを有する情報生成方法が提供される。
【0019】
かかる方法を用いることによって、ローカルバイナリパターンを用いた物体の検出の精度をより向上させることが可能な検出用情報を生成することができる。よって、かかる方法を用いることによって、ローカルバイナリパターンを用いた物体の検出の精度をより向上させることができる。
【0020】
上記目的を達成するために、本発明の第4の観点によれば、物体の検出を行う検出対象画像のエッジ画像に基づいて、画素ごとにローカルバイナリパターンによる物体の輪郭を示す特徴量を算出し、画像に含まれる物体を検出するために用いられる検出用情報として情報生成装置が生成した領域情報が示す領域ごとに、算出した上記特徴量のヒストグラムを算出するステップと、上記検出用情報として上記情報生成装置が生成した上記領域情報に対応する行列情報に基づいて、上記算出するステップにおいて算出されたヒストグラムを線形写像または非線形写像し、上記ヒストグラムを異なる空間に写像するステップと、上記写像するステップにより写像された空間において、上記検出用情報として上記情報生成装置が生成した物体の判別のための判別情報と、上記ヒストグラムとに基づいて、上記判別情報が示す物体が上記検出対象画像に含まれているかを評価するステップとを有する物体検出方法が提供される。
【0021】
かかる方法を用いることによって、ローカルバイナリパターンを用いた物体の検出の精度をより向上させることができる。
【0022】
上記目的を達成するために、本発明の第5の観点によれば、画像に含まれる物体を検出するために用いられる検出用情報を生成するための画像のエッジ画像に対して、ローカルバイナリパターンによる物体の輪郭を示す特徴量のヒストグラムを算出するための領域を設定するステップ、上記領域を設定するステップにおいて設定した領域を示す領域情報を、上記検出用情報として生成するステップ、上記エッジ画像に基づいて、画素ごとに上記特徴量を算出し、上記領域を生成するステップにおいて設定された領域ごとに算出した上記特徴量のヒストグラムを算出するステップ、上記算出するステップにおいて算出されたヒストグラムを線形写像または非線形写像により異なる空間に写像するステップ、上記写像するステップにおける上記写像に応じた上記領域情報に対応する行列情報を、上記検出用情報として生成するステップ、上記写像するステップにおいて写像された空間において、上記ヒストグラムを用いたブースティングによる物体検出の統計学習を行い、物体の検出結果を示す判別情報を、上記検出用情報として生成するステップをコンピュータに実行させるためのプログラムが提供される。
【0023】
かかるプログラムを用いることによって、ローカルバイナリパターンを用いた物体の検出の精度をより向上させることが可能な検出用情報を生成することができる。よって、プログラムを用いることによって、ローカルバイナリパターンを用いた物体の検出の精度をより向上させることができる。
【0024】
上記目的を達成するために、本発明の第6の観点によれば、物体の検出を行う検出対象画像のエッジ画像に基づいて、画素ごとにローカルバイナリパターンによる物体の輪郭を示す特徴量を算出し、画像に含まれる物体を検出するために用いられる検出用情報として情報生成装置が生成した領域情報が示す領域ごとに、算出した上記特徴量のヒストグラムを算出するステップ、上記検出用情報として上記情報生成装置が生成した上記領域情報に対応する行列情報に基づいて、上記算出するステップにおいて算出されたヒストグラムを線形写像または非線形写像し、上記ヒストグラムを異なる空間に写像するステップ、上記写像するステップにより写像された空間において、上記検出用情報として上記情報生成装置が生成した物体の判別のための判別情報と、上記ヒストグラムとに基づいて、上記判別情報が示す物体が上記検出対象画像に含まれているかを評価するステップをコンピュータに実行させるためのプログラムが提供される。
【0025】
かかるプログラムを用いることによって、ローカルバイナリパターンを用いた物体の検出の精度をより向上させることができる。
【発明の効果】
【0026】
本発明によれば、ローカルバイナリパターンを用いた物体の検出の精度をより向上させることができる。
【図面の簡単な説明】
【0027】
【図1A】本発明の実施形態に係る情報生成装置における画像前処理の一例を説明するための説明図である。
【図1B】本発明の実施形態に係る情報生成装置における画像前処理の一例を説明するための説明図である。
【図2】本発明の実施形態に係る情報生成装置における領域生成処理の一例を説明するための説明図である。
【図3A】ローカルバイナリパターンを説明するための説明図である。
【図3B】ローカルバイナリパターンを説明するための説明図である。
【図4A】本発明の実施形態に係る情報生成装置におけるローカルバイナリパターンに係る特徴量の算出処理の他の例を説明するための説明図である。
【図4B】本発明の実施形態に係る情報生成装置におけるローカルバイナリパターンに係る特徴量の算出処理の他の例を説明するための説明図である。
【図4C】本発明の実施形態に係る情報生成装置におけるローカルバイナリパターンに係る特徴量の算出処理の他の例を説明するための説明図である。
【図4D】本発明の実施形態に係る情報生成装置におけるローカルバイナリパターンに係る特徴量の算出処理の他の例を説明するための説明図である。
【図4E】本発明の実施形態に係る情報生成装置におけるローカルバイナリパターンに係る特徴量の算出処理の他の例を説明するための説明図である。
【図5】本発明の実施形態に係る情報生成装置が算出したローカルバイナリパターンに係る特徴量のヒストグラムの一例を示す説明図である。
【図6】本発明の実施形態に係る情報生成装置が算出したローカルバイナリパターンに係る特徴量のヒストグラムの一例を示す説明図である。
【図7】本発明の実施形態に係る情報生成装置が算出したローカルバイナリパターンに係る特徴量のヒストグラムの他の例を示す説明図である。
【図8】本発明の実施形態に係る情報生成装置におけるヒストグラムの算出に係る処理の一例を示す説明図である。
【図9】本発明の実施形態に係る情報生成装置の構成の一例を示すブロック図である。
【図10】本発明の実施形態に係る情報生成装置のハードウェア構成の一例を示す説明図である。
【図11】本発明の実施形態に係る物体検出装置の構成の一例を示すブロック図である。
【発明を実施するための形態】
【0028】
以下に添付図面を参照しながら、本発明の好適な実施の形態について詳細に説明する。なお、本明細書および図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
【0029】
また、以下では、下記に示す順序で説明を行う。
1.本発明の実施形態に係るアプローチ
2.本発明の実施形態に係る情報生成装置、物体検出装置
3.本発明の実施形態に係るプログラム
【0030】
(本発明の実施形態に係るアプローチ)
本発明の実施形態では、本発明の実施形態に係る情報生成装置(以下、「情報生成装置100」という。)が、画像に含まれる物体を検出するために用いられる検出用情報を生成する。そして、本発明の実施形態では、本発明の実施形態に係る物体検出装置(以下、「物体検出装置200」という。)が、情報生成装置100が生成した検出用情報を用いて物体の検出を行う検出対象画像に対する物体の検出に係る処理を行う。なお、以下では、情報生成装置100と物体検出装置200とが別体の装置であるものとして説明するが、情報生成装置100と物体検出装置200とを1つの装置として実現することも可能である。
【0031】
情報生成装置100、物体検出装置200の構成について説明する前に、本発明の実施形態に係るローカルバイナリパターンを用いた物体の検出の精度向上アプローチについて説明する。
【0032】
[精度向上アプローチの概要]
上述したように、従来の技術1のように輝度画像に基づいてLBPに係る特徴量を算出する場合には、算出されたLBPに係る特徴量が、画像に含まれる物体を認識するために十分な精度を有するとは限らない。そこで、本発明の実施形態に係る情報生成装置100は、検出用情報を生成するための画像(以下、「学習用画像」とよぶ場合がある。)のエッジ画像に基づいて、画素ごとにLBPに係る特徴量を算出する。
【0033】
ここで、エッジ画像に基づいてLBPに係る特徴量を算出する場合には、従来の技術1のように輝度画像に基づいてLBPに係る特徴量を算出する場合よりも、ノイズの影響をより低減させることができる。また、エッジ画像に基づいてLBPに係る特徴量を算出する場合には、従来の技術1のように輝度画像に基づいてLBPに係る特徴量を算出する場合のように、LBPに係る特徴量が、例えば学習用画像に含まれる人物の服の色と背景との関係に依存する恐れはない。さらに、エッジ画像に基づいてLBPに係る特徴量を算出する場合には、学習用画像からエッジ画像を生成するときに検出するエッジの方向(例えば、水平方向、垂直方向など)に応じて、異なる観点の特徴量を算出することが可能となる。
【0034】
したがって、情報生成装置100は、エッジ画像に基づいてLBPに係る特徴量を算出することによって、従来の技術1のように輝度画像に基づいてLBPに係る特徴量を算出する場合よりもより精度が高いLBPに係る特徴量を算出することができる。
【0035】
また、情報生成装置100は、エッジ画像に基づいて算出されたLBPに係る特徴量に基づいて、従来の技術2のようにブースティングなどの統計学習を行うことによって、物体の検出結果を示す判別情報を、検出用情報として生成する。
【0036】
ここで、ブースティングとは、学習サンプルが従う分布による弱仮説(弱判別器)により繰り返し学習させ、学習に用いた弱仮説を、学習の結果得られるより強い仮説(判別器)の一部とするものである。ブースティングでは、前に生成した弱仮説の学習結果を使用して上記分布を加工し、加工された当該分布に基づき新たな弱仮説の学習を行う。つまり、ブースティングでは、後に生成された弱仮説はその前に生成された弱仮説に依存し、これによって、物体の判別が困難な学習サンプルを正解させるような弱判別器(より強い仮説)が選択されることとなる。
【0037】
情報生成装置100は、LBPに係る特徴量を用いて対象物(検出対象の物体)か非対象物かの判定を行う弱判別器によって、ブースティングを行う。よって、本発明の実施形態に係る検出用情報としての判別情報としては、例えば、判別器パラメータが挙げられる。なお、以下では、情報生成装置100がブースティングを用いて統計学習を行う場合を例に挙げて説明するが、本発明の実施形態に係る情報生成装置100は、エッジ画像に基づいて算出されたLBPに係る特徴量を用いて物体の検出が可能な、任意の統計学習方法を用いることが可能である。
【0038】
また、情報生成装置100は、従来の技術2を用いる場合のように、学習用画像内のある領域においてLBPに係る特徴量のヒストグラムを算出して当該ヒストグラムに対する統計学習を行うのでなく、当該ヒストグラムを異なる空間に線形写像または非線形写像(以下、単に「写像」と示す場合がある。)する。ここで、情報生成装置100が写像する異なる空間としては、例えば次元を減らすことが可能な空間など、LBPに係る特徴量のヒストグラムをより物体の認識が容易となる空間が挙げられる。そして、情報生成装置100は、写像された空間において、ヒストグラムを用いたブースティングによる物体検出の統計学習を行うことによって、検出用情報としての物体の検出結果を示す判別情報を生成する。
【0039】
情報生成装置100は、LBPに係る特徴量のヒストグラムをより物体の認識が容易となる異なる空間へ写像し、写像された空間においてLBPに係る特徴量のヒストグラムを用いたブースティングによる統計学習を行う。よって、情報生成装置100は、従来の技術を用いる場合よりも、より物体の検出の精度をより向上させることができる。なお、本発明の実施形態に係る情報生成装置100は、写像を行わずにLBPに係る特徴量のヒストグラムを用いたブースティングによる統計学習を行うこともできる。上記の場合であっても、本発明の実施形態に係る情報生成装置100は、エッジ画像に基づいて算出されたLBPに係る特徴量に基づいて統計学習を行うので、従来の技術を用いる場合よりもより物体の検出の精度をより向上させることが可能である。
【0040】
本発明の実施形態では、上記のように、情報生成装置100が、エッジ画像に基づいてLBPに係る特徴量を算出する。そして、本発明の実施形態では、情報生成装置100が、エッジ画像に基づいて算出されたLBPに係る特徴量に基づいてブースティングなどの統計学習を行うことによって、判別情報などの検出用情報(検出用情報としての役目を果たす他の情報については後述する。)を生成する。
【0041】
また、本発明の実施形態では、物体検出装置200が、情報生成装置100が生成した検出用情報を用いて、検出対象画像に対する物体の検出に係る処理を行う。
【0042】
したがって、情報生成装置100が上記のように検出用情報を生成することによって、従来の技術を用いる場合よりも、ローカルバイナリパターンを用いた物体の検出の精度をより向上させることができる。
【0043】
[精度向上アプローチに係る処理]
以下、より具体的に本発明の実施形態に係る精度向上アプローチに係る処理について説明する。以下では、本発明の実施形態に係る精度向上アプローチに係る処理として、情報生成装置100における処理(本発明の実施形態に係る情報生成方法に係る処理)と、物体検出装置200に係る処理(本発明の実施形態に係る物体検出方法に係る処理)とについて、それぞれ説明する。
【0044】
[1]情報生成装置100における処理
まず、情報生成装置100における処理について説明する。情報生成装置100は、例えば下記の(A)の処理〜(E)の処理を行うことによって、エッジ画像に基づく検出用情報を生成する。なお、下記に示す(A)の処理〜(E)の処理のうち、(A)の処理は、情報生成装置100の外部装置(例えば画像処理装置など)によって行われてもよい。上記の場合、情報生成装置100は、上記外部装置において(A)の処理がなされた画像(すなわち、学習用画像に基づくエッジ画像)が入力されることとなる。
【0045】
(A)画像前処理
情報生成装置100は、学習用画像に基づいてエッジ画像を生成する。図1A、図1Bは、本発明の実施形態に係る情報生成装置100における画像前処理の一例を説明するための説明図である。ここで、図1Aは、学習用画像の一例を示しており、図1Bは、図1Aに示す学習用画像に対して画像前処理を行った後に得られるエッジ画像の一例を示している。
【0046】
ここで、本発明の実施形態に係る学習用画像としては、例えば、図1Aに示すように検出対象の物体(図1Aでは人が検出対象である例を示している。)が含まれる画像と、検出対象の物体が含まれていない画像(図示せず)とが挙げられる。また、本発明の実施形態に係る学習用画像のうちの検出対象の物体が含まれる画像は、検出対象の物体が特定の位置(例えば、図1Aに示すように画像の中心付近)に存在する画像であってもよい。情報生成装置100は、例えば上記のように検出対象の物体の有無が明らかな学習用画像に基づいて、エッジ画像を生成する。
【0047】
情報生成装置100は、例えば、[−1,0,1]のフィルタ(学習用画像の水平方向のエッジを検出するためのフィルタの一例)や、[−1,0,1]’のフィルタ(学習用画像の垂直方向のエッジを検出するためのフィルタの一例)を用いて、学習用画像から特定の方向のエッジを検出してエッジ画像を生成する。なお、(A)の処理において情報生成装置100が生成するエッジ画像は、上記に限られない。例えば、情報生成装置100は、特定の方向のエッジが検出されたエッジ画像の画素値の絶対値をとったエッジ画像を生成することができる。また、情報生成装置100は、例えば、学習用画像の水平方向のエッジが検出されたエッジ画像と垂直方向のエッジが検出されたエッジ画像との双方を用いることによって、特定の方向に依存しないエッジ画像を生成することもできる。特定の方向に依存しないエッジ画像の生成方法としては、例えば、sqrt(Gx^2+Gy^2)の演算を行うことが挙げられる。ここで、“Gx”は、学習用画像の水平方向のエッジが検出されたエッジ画像の画素値を示し、“Gy”は、学習用画像の垂直方向のエッジが検出されたエッジ画像を示している。
【0048】
(B)領域生成処理
情報生成装置100は、上記(A)の処理により生成されたエッジ画像に対して、LBPに係る特徴量のヒストグラムを算出するための領域を設定する。図2は、本発明の実施形態に係る情報生成装置100における領域生成処理の一例を説明するための説明図である。ここで、図2では、図1Bに示すエッジ画像に対して設定される領域の一例を示している。
【0049】
図2に示すように、情報生成装置100は、エッジ画像内において、任意の位置に任意の大きさ(サイズ)の領域を設定する。ここで、図2では、情報生成装置100が複数の領域を設定した例を示しているが、情報生成装置100がエッジ画像内に設定する領域の数は1つであってもよい。情報生成装置100が、エッジ画像内において任意の位置に任意の大きさの領域を設定することによって、検出対象の物体における特徴部分を用いた統計学習を行うことができる可能性が高まるので、LBPを用いた物体の検出の精度をより向上させることができる。なお、本発明の実施形態に係る情報生成装置100が、エッジ画像の任意の位置または特定の位置に、任意の大きさまたは予め規定された大きさ領域を設定することもできることは、言うまでもない。また、図2では、情報生成装置100が矩形の領域を設定する例を示しているが、情報生成装置100が設定する領域は、上記に限られない。例えば、情報生成装置100は、後述する(C)の処理においてLBPに係る特徴量のヒストグラムを算出可能な、任意の形状の領域を設定することができる。
【0050】
また、情報生成装置100は、設定した領域を示す領域情報を、検出用情報として生成する。そして、情報生成装置100は、生成した領域情報を、例えば記憶部(後述する)に記憶させる。ここで、本発明の実施形態に係る領域情報としては、例えば、領域の原点および頂点を示す座標の情報(例えば設定された領域が矩形の領域の場合)が挙げられる。
【0051】
(C)LBPに係る特徴量のヒストグラム算出処理
情報生成装置100は、エッジ画像に基づいて画素ごとにLBPに係る特徴量を算出し、上記(B)の処理において設定された領域ごとにLBPに係る特徴量のヒストグラムを算出する。
【0052】
(C−1)LBPに係る特徴量の算出処理
まず、情報生成装置100におけるLBPに係る特徴量の算出処理について説明する。図3A、図3Bは、ローカルバイナリパターンを説明するための説明図である。ここで、図3Aは、注目画素Pを中心とする3×3の画素領域の画素値の一例を示しており、図3Bは、図3Aに示す画素領域に対してLBPを適用した場合の一例を示している。
【0053】
上述したように、LBPは、3×3の画素領域に着目したときに、中心の画素値と近傍8画素点の値の大小を比較して各画素点で0か1かの2ビットにコーディングする手法である。例えば図3Aの例では、注目画素Pの画素値が163であり、注目画素Pの周辺の画素の画素値が、左上から142、154、168、129、125、161、167、160である。よって、図3Aに示す画素領域を処理する場合、情報生成装置100は、注目画素Pの画素値と他の画素の画素値とを比較することによって、例えば(0,0,1,0,0,0,1,0)と合計8ビットでコーディングされる。ここで、3×3の画素領域における注目画素Pを除く全ての画素に着目した場合、LBPは8ビットでコーディングされるので、全部で256パターンのコーディング種類が存在しうることとなる。
【0054】
情報生成装置100は、エッジ画像の各画素について図3Bに示すようにLBPに係る演算を行うことによって、例えば8ビットでコーディングされたLBPに係る特徴量を算出する。ここで、情報生成装置100は、上記(B)の処理において設定された領域に含まれる画素に対してLBPに係る特徴量を算出するが、エッジ画像を構成する全画素に対してLBPに係る特徴量を算出してもよい。また、エッジ画像を構成する全画素に対してLBPに係る特徴量を算出する場合、情報生成装置100は、例えば、上記(B)の処理と平行してLBPに係る特徴量の算出処理を行うことができる。
【0055】
なお、本発明の実施形態に係る情報生成装置100におけるLBPに係る特徴量の算出方法は、図3A、図3Bに示す例に限られない。図4A〜図4Eは、本発明の実施形態に係る情報生成装置100におけるローカルバイナリパターンに係る特徴量の算出処理の他の例を説明するための説明図である。
【0056】
情報生成装置100は、例えば、図4A、図4Bに示すように、注目画素Pの画素値と、3×3の画素領域内の4つの画素の画素値とを比較することによってLBPに係る特徴量を算出することができる。また、情報生成装置100は、図4Cに示すように、注目画素Pの画素値と、3×3の画素領域内の3つの画素の画素値の平均値とを比較することによってLBPに係る特徴量を算出することもできる。図4A〜図4Cの場合には、LBPは4ビットでコーディングされるので、全部で16パターンのコーディング種類が存在しうることとなる。ここで、図4A〜図4Cに示すように、注目画素Pの画素値と3×3の画素領域内の4つの画素の画素値(または画素値の平均値)とに基づいてLBPに係る特徴量を算出する場合には、図3Bに示す場合よりも計算量が半分になるという利点がある。また、上記の場合には、図3Bに示す場合よりもコーディングするビット数が少なくなるので、必要なメモリも少なくなるという利点がある。
【0057】
また、情報生成装置100は、図4Dに示すように、方向ごとに計算したエッジ画像において対応する方向で比較することによってLBPに係る特徴量を算出してもよい。図4Dの場合には、LBPは方向ごとに8ビットでコーディングされるので、全部で(256×方向数)パターンのコーディング種類が存在しうることとなる。
【0058】
さらに、情報生成装置100は、図4Eに示すように、図4Aおよび図4Bを組み合わせてLBPに係る特徴量を算出することもできる。図4Eの場合には、LBPは、それぞれが4ビットでコーディングされるので、全部で(16×2)パターンのコーディング種類が存在しうることとなる。
【0059】
情報生成装置100は、例えば図4A〜図4Eに示すように、様々な方法でLBPに係る特徴量を算出することができる。なお、以下では、情報生成装置100が、図3Bに示すように8ビットでコーディングされたLBPに係る特徴量を算出する場合を例に挙げて説明する。
【0060】
(C−2)LBPに係る特徴量のヒストグラム算出処理
情報生成装置100は、上記(B)の処理において設定された領域ごとに、上記(C−1)の処理において算出されたLBPに係る特徴量のヒストグラムを算出する。より具体的には、情報生成装置100は、算出したLBPに係る特徴量のパターンを階級とし、算出したLBPに係る特徴量のパターンの個数を度数とすることによって、LBPに係る特徴量のヒストグラムを算出する。
【0061】
図5、図6は、本発明の実施形態に係る情報生成装置100が算出したローカルバイナリパターンに係る特徴量のヒストグラムの一例を示す説明図である。ここで、図5は、設定された領域内に検出対象の物体(例えば図1Aに示す人)が含まれる場合のヒストグラムの一例を示している。また、図6は、設定された領域内に検出対象の物体が含まれない場合のヒストグラム(例えば図1Aにおける背景におけるヒストグラム)の一例を示している。
【0062】
情報生成装置100は、上記(B)の処理において設定された領域ごとに、図5、図6に示すようなヒストグラムを算出する。
【0063】
なお、情報生成装置100が算出する、8ビットでコーディングされたLBPに係る特徴量のヒストグラムは、図5、図6に示すように階級が256である例に限られない。例えば、情報生成装置100は、非特許文献2に記載されているようなUniformLBPのパターンを階級とするヒストグラムを算出することもできる。ここで、UniformLBPとは、“0から1”または“1から0”への遷移が2箇所以下のLBPに係る特徴量を用いる手法である。図7は、本発明の実施形態に係る情報生成装置100が算出したローカルバイナリパターンに係る特徴量のヒストグラムの他の例を示す説明図である。UniformLBPを用いる場合、情報生成装置100は、図7に示すように、8ビットでコーディングされたLBPに係る特徴量のヒストグラムとして階級が56のヒストグラムを算出する。よって、情報生成装置100は、例えば使用するLBPの種類などに応じて、算出するヒストグラムの階級数を設定することが可能である。
【0064】
ここで、情報生成装置100は、例えば、エッジ画像をスキャンし、スキャンするごとにスキャンウィンドウでヒストグラムを計算することによりLBPに係る特徴量のヒストグラムの算出処理を行うが、情報生成装置100におけるヒストグラムの算出処理は、上記に限られない。例えば、情報生成装置100は、下記の(i)、(ii)に示す方法を用いてヒストグラムを算出することによって、ヒストグラムの算出に係る処理時間の短縮(処理の高速化)を図ることもできる。
【0065】
(i)第1の処理時間の短縮方法
図8は、本発明の実施形態に係る情報生成装置100におけるヒストグラムの算出に係る処理の一例を示す説明図である。情報生成装置100は、エッジ画像をスキャンして次の画素点に移るときに、移動した分だけの領域のヒストグラム(図8に示すA)をひいて、新しく追加する領域のヒストグラム(図8に示すC)を加える。
【0066】
より具体的には、情報生成装置100は、エッジ画像の各画素におけるLBPに係る特徴量を算出しておき、ヒストグラムを算出するときには、スキャニングによる差分のみを加算する。つまり、情報生成装置100は、A+BからB+Cへと動かした場合、“A+B−A+C=B+C”という演算を行うので、スキャンするごとにスキャンウィンドウでヒストグラムを計算する場合よりも計算量を低減させることができる。よって、情報生成装置100は、ヒストグラムの算出に係る処理時間の短縮を図ることが可能となる。
【0067】
(ii)第2の処理時間の短縮方法
情報生成装置100は、Violaたちによって導入されたIntegral画像(Integral Image)という表現を用いてヒストグラムの算出に係る処理時間の短縮を図ることもできる。より具体的には、情報生成装置100は、エッジ画像の各画素におけるLBPに係る特徴量を算出しておき、LBPのパターン数(例えば、58、256など)分のIntegral画像(エッジ画像と同じ画像サイズのIntegral画像)を用意する。そして、情報生成装置100は、ヒストグラムを算出するときは領域内のLBPの和をIntegral画像を用いて計算する。ここで、Integral画像は、通常、輝度画像について計算され、この場合、Integral画像のLBPパターンがある画素点で存在すれば1、存在しなければ0、というような表現となる。情報生成装置100は、輝度画像について計算される場合と同様に、エッジ画像に対してIntegral画像を用いる。例えば、LBPのパターン数が58である場合、ある画素点でのLBPは1つしか存在しないので、情報生成装置100は、58枚あるIntegral画像のうち、1枚だけが当該画素点で1がカウントし、残りの57枚全てで当該画素点での値を0とカウントする。
【0068】
情報生成装置100は、例えば、上記の(i)、(ii)に示す方法を用いてヒストグラムを算出することによって、ヒストグラムの算出に係る処理時間の短縮を図ることができる。
【0069】
(D)写像処理
情報生成装置100は、上記(C)の処理において算出されたLBPに係る特徴量のヒストグラムを、より物体の認識が容易となる異なる空間へと写像する。つまり、情報生成装置100における(D)の処理は、後述する(E)の処理において統計学習に用いる特徴量を、LBPに係る特徴量のヒストグラムから、より物体の認識が容易となる新たな特徴量へと変換する処理に該当する。
【0070】
より具体的には、情報生成装置100は、下記の数式1、数式2に示す「ある領域におけるLBPに係る特徴量のヒストグラム」を、数式3、数式4に示すように関数hで写像する。
【0071】
【数1】
・・・(数式1)
【数2】
・・・(数式2)
【0072】
【数3】
・・・(数式3)
【数4】
・・・(数式4)
【0073】
ここで、情報生成装置100は、例えば、Fisherの線形判別法などの線形判別法や、ロジスティック回帰分析(Logistic Regression)、潜在意味解析(pLSA)を用いて線形写像を行う。また、情報生成装置100は、例えば、カーネルSVM(Support Vector Machine)などを用いて非線形写像を行うこともできる。なお、本発明の実施形態に係る情報生成装置100が写像に用いる方法は、上記に限られず、LBPに係る特徴量のヒストグラムを直接用いるよりもより物体の認識が容易となる空間へと写像することが可能な、任意の方法を用いることができる。
【0074】
また、情報生成装置100は、写像に応じた線形行列または非線形行列を示す行列情報を、検出用情報として生成する。そして、情報生成装置100は、例えば記憶部(後述する)に、生成した行列情報を領域情報と対応付けて記憶させる。ここで、情報生成装置100は、例えば、行列情報を識別するためのファイル名を領域情報と関連付けることによって、行列情報を領域情報に対応付けるが、情報生成装置100における行列情報を領域情報に対応付ける方法は、上記に限られない。例えば、情報生成装置100は、行列情報に領域情報と対応付ける情報が記録されたメタデータを付加するなど、行列情報を領域情報に対応付けることが可能な任意の方法を用いることができる。なお、情報生成装置100は、例えば、さらに領域情報に行列情報と対応付ける情報が記録されたメタデータを付加することもできる。
【0075】
(E)統計学習処理
情報生成装置100は、上記(D)の処理において写像された空間において、LBPに係る特徴量のヒストグラムを用いたブースティングによる物体検出の統計学習(すなわち、判別器学習)を行う。そして、情報生成装置100は、検出用情報としての判別情報を生成し、生成した判別情報を記憶部(後述する)に記憶させる。ここで、情報生成装置100における判別情報の生成とは、例えば、判別情報の新規生成に限られず、記憶部(後述する)に既に判別情報が記憶されている場合における当該判別情報の更新も含まれる。
【0076】
情報生成装置100は、例えば、上記(A)の処理(画像前処理)〜(E)の処理(統計学習処理)を行うことによって、エッジ画像に基づく検出用情報を生成することができる。よって、情報生成装置100は、上記(A)の処理(画像前処理)〜(E)の処理(統計学習処理)を行うことによって上述した精度向上アプローチを実現することが可能となるので、ローカルバイナリパターンを用いた物体の検出の精度をより向上させることができる。
【0077】
[2]物体検出装置200における処理
次に、物体検出装置200における処理について説明する。物体検出装置200は、例えば下記の(a)の処理〜(d)の処理を行うことによって、情報生成装置100が生成した検出用情報を用いて検出対象画像から検出対象の物体を検出する。なお、下記に示す(a)の処理〜(e)の処理のうち、(a)の処理は、物体検出装置200の外部装置(例えば画像処理装置など)によって行われてもよい。上記の場合、物体検出装置200は、上記外部装置において(a)の処理がなされた画像(すなわち、エッジ画像)が入力されることとなる。
【0078】
また、物体検出装置200は、例えば、ネットワークを介して情報生成装置100が生成した検出用情報を取得する。ここで、上記ネットワークとしては、例えば、LAN(Local Area Network)やWAN(Wide Area Network)などの有線ネットワーク、無線LAN(WLAN;Wireless Local Area Network)や基地局を介した無線WAN(WWAN;Wireless Wide Area Network)などの無線ネットワーク、あるいは、TCP/IP(Transmission Control Protocol/Internet Protocol)などの通信プロトコルを用いたインターネットなどが挙げられる。
【0079】
なお、物体検出装置200における検出用情報の取得方法は、上記に限られない。例えば、物体検出装置200は、例えば、DVD(Digital Versatile Disc)などの光ディスクやUSB(Universal Serial Bus)メモリなど、情報生成装置100が生成した検出用情報が記録された外部記録媒体を介して、検出用情報を取得することもできる。
【0080】
(a)画像前処理
物体検出装置200は、情報生成装置100における(A)の処理と同様に、検出対象画像に基づいてエッジ画像を生成する。
【0081】
(b)LBPに係る特徴量のヒストグラム算出処理
物体検出装置200は、情報生成装置100における(C)の処理と同様に、エッジ画像に基づいて画素ごとにLBPに係る特徴量を算出する。また、物体検出装置200は、情報生成装置100が生成した検出用情報としての領域情報に基づいて領域を設定し、情報生成装置100における(C)の処理と同様に、設定された領域ごとにLBPに係る特徴量のヒストグラムを算出する。
【0082】
(c)写像処理
物体検出装置200は、情報生成装置100が生成した検出用情報としての行列情報に基づいて、上記(b)の処理において算出されたLBPに係る特徴量のヒストグラムを、情報生成装置100における(D)の処理と同様に、より物体の認識が容易となる異なる空間へと写像する。
【0083】
(d)評価処理
物体検出装置200は、上記(c)の処理において写像された空間において、情報生成装置100が生成した検出用情報としての判別情報と、LBPに係る特徴量のヒストグラムとに基づいて、検出対象画像に基づくエッジ画像を評価する。ここで、物体検出装置200は、例えば、領域ごとにエッジ画像に対するスコアリングを行うことによって、検出対象画像に検出対象が含まれているか否かを評価する。つまり、物体検出装置200における(d)の処理は、検出対象画像から検出対象を検出する処理に相当する。
【0084】
物体検出装置200は、例えば(a)の処理(画像前処理)〜(d)の処理(評価処理)を行うことによって、情報生成装置100が生成した検出用情報を用いて検出対象画像に対する物体の検出に係る処理を行う。したがって、物体検出装置200は、従来の技術を用いる場合よりも、ローカルバイナリパターンを用いた物体の検出の精度をより向上させることができる。
【0085】
本発明の実施形態では、上述したように、情報生成装置100が、例えば(A)の処理(画像前処理)〜(E)の処理(統計学習処理)を行うことによって、エッジ画像に基づく検出用情報を生成する。また、本発明の実施形態では、上述したように、物体検出装置200が、例えば(a)の処理(画像前処理)〜(d)の処理(評価処理)を行うことによって、検出対象画像に対する物体の検出に係る処理を行う。よって、本発明の実施形態では、上述した本発明の実施形態に係る精度向上アプローチが実現される。
【0086】
したがって、本発明の実施形態では、情報生成装置100が上記のように検出用情報を生成することによって、従来の技術を用いる場合よりも、ローカルバイナリパターンを用いた物体の検出の精度をより向上させることができる。
【0087】
(本発明の実施形態に係る情報生成装置、物体検出装置)
次に、上述した本発明の実施形態に係る精度向上アプローチに係る処理を実現することが可能な、情報生成装置100、物体検出装置200の構成の一例について説明する。
【0088】
[情報生成装置100]
図9は、本発明の実施形態に係る情報生成装置100の構成の一例を示すブロック図である。情報生成装置100は、記憶部102と、画像処理部104と、領域設定部106と、算出部108と、写像部110と、統計学習部112とを備える。
【0089】
また、情報生成装置100は、例えば、制御部(図示せず)、ROM(Read Only Memory;図示せず)や、RAM(Random Access Memory;図示せず)、ユーザが操作可能な操作部(図示せず)、各種画面を表示画面に表示する表示部(図示せず)、外部装置と通信を行うための通信部(図示せず)などを備えていてもよい。情報生成装置100は、例えば、データの伝送路としてのバス(bus)により上記各構成要素間を接続する。
【0090】
ここで、制御部(図示せず)は、例えば、MPU(Micro Processing Unit)や、各種処理回路などで構成され情報生成装置100全体を制御する。また、制御部(図示せず)は、例えば、画像処理部104、領域設定部106、算出部108、写像部110、および統計学習部112の役目を果たすこともできる。
【0091】
ROM(図示せず)は、制御部(図示せず)が使用するプログラムや演算パラメータなどの制御用データを記憶する。RAM(図示せず)は、制御部(図示せず)により実行されるプログラムなどを一次記憶する。
【0092】
また、操作部(図示せず)としては、例えば、後述する操作入力デバイスが挙げられる。また、表示部(図示せず)としては、例えば、後述する表示デバイスが挙げられる。
【0093】
〔情報生成装置100のハードウェア構成例〕
図10は、本発明の実施形態に係る情報生成装置100のハードウェア構成の一例を示す説明図である。図10を参照すると、情報生成装置100は、例えば、MPU150と、ROM152と、RAM154と、記録媒体156と、入出力インタフェース158と、操作入力デバイス160と、表示デバイス162と、通信インタフェース164とを備える。また、情報生成装置100は、例えば、データの伝送路としてのバス166で各構成要素間を接続する。
【0094】
MPU150は、MPUや、制御機能を実現するための複数の回路が集積された集積回路などで構成され、情報生成装置100全体を制御する制御部(図示せず)として機能する。また、MPU150は、情報生成装置100において、後述する画像処理部104、領域設定部106、算出部108、写像部110、および統計学習部112としての役目を果たすこともできる。
【0095】
ROM152は、MPU150が使用するプログラムや演算パラメータなどの制御用データなどを記憶し、また、RAM154は、例えば、MPU150により実行されるプログラムなどを一次記憶する。
【0096】
記録媒体156は、記憶部102として機能し、例えば、学習用画像データや、領域情報、行列情報、および判別情報などの情報生成装置100が生成した検出用情報、アプリケーションなど、様々なデータを記憶する。ここで、記録媒体156としては、例えば、ハードディスクなどの磁気記録媒体や、EEPROM(Electrically Erasable and Programmable Read Only Memory)、フラッシュメモリ(flash memory)、MRAM(Magnetoresistive Random Access Memory)、FeRAM(Ferroelectric Random Access Memory)、PRAM(Phase change Random Access Memory)などの不揮発性メモリ(nonvolatile memory)が挙げられる。また、情報生成装置100は、情報生成装置100から着脱可能な記録媒体156を備えることもできる。
【0097】
入出力インタフェース158は、例えば、操作入力デバイス160や、表示デバイス162を接続する。操作入力デバイス160は、操作部(図示せず)として機能し、また、表示デバイス162は、表示部(図示せず)として機能する。ここで、入出力インタフェース158としては、例えば、USB端子や、DVI(Digital Visual Interface)端子、HDMI(High-Definition Multimedia Interface)端子、各種処理回路などが挙げられる。また、操作入力デバイス160は、例えば、情報生成装置100上に備えられ、情報生成装置100の内部で入出力インタフェース158と接続される。操作入力デバイス160としては、例えば、ボタン、方向キー、ジョグダイヤルなどの回転型セレクター、あるいは、これらの組み合わせなどが挙げられる。また、表示デバイス162は、例えば、情報生成装置100上に備えられ、情報生成装置100の内部で入出力インタフェース158と接続される。表示デバイス162としては、例えば、液晶ディスプレイ(Liquid Crystal Display;LCD)や有機ELディスプレイ(organic ElectroLuminescence display。または、OLEDディスプレイ(Organic Light Emitting Diode display)ともよばれる。)などが挙げられる。なお、入出力インタフェース158が、情報生成装置100の外部装置としての操作入力デバイス(例えば、キーボードやマウスなど)や、表示デバイス(例えば、外部ディスプレイなど)と接続することもできることは、言うまでもない。また、表示デバイス162は、例えばタッチスクリーンなど、表示とユーザ操作とが可能なデバイスであってもよい。
【0098】
通信インタフェース164は、情報生成装置100が備える通信手段であり、ネットワークを介して(あるいは、直接的に)、1または2以上の物体検出装置200などの外部装置と無線/有線で通信を行うための通信部(図示せず)として機能する。ここで、通信インタフェース164としては、例えば、IEEE802.11gポートおよび送受信回路(無線通信)や、IEEE802.15.1ポートおよび送受信回路(無線通信)、通信アンテナおよびRF回路(無線通信)、あるいはLAN端子および送受信回路(有線通信)などが挙げられる。
【0099】
情報生成装置100は、例えば図10に示す構成によって、本発明の実施形態に係る精度向上アプローチに係る処理を行う。なお、本発明の実施形態に係る情報生成装置100のハードウェア構成が、図10に示す構成に限られないことは、言うまでもない。
【0100】
再度図9を参照して、情報生成装置100の構成要素について説明する。記憶部102は、情報生成装置100が備える記憶手段である。ここで、記憶部102としては、例えば、ハードディスクなどの磁気記録媒体や、フラッシュメモリなどの不揮発性メモリなどが挙げられる。
【0101】
また、記憶部102は、例えば、学習用画像データや、領域情報、行列情報、および判別情報などの情報生成装置100が生成した検出用情報、アプリケーションなど、様々なデータを記憶する。ここで、図9では、学習用画像データ130、…、領域情報132、行列情報134、判別情報136が記憶部102に記憶されている例を示している。
【0102】
画像処理部104は、上記(A)の処理(画像前処理)を主導的に行う役目を果たす。より具体的には、画像処理部104は、記憶部102から学習用画像データを読み出し、読み出した学習用画像データに基づいてエッジ画像を生成する。
【0103】
領域設定部106は、上記(B)の処理(領域生成処理)を主導的に行う役目を果たす。より具体的には、領域設定部106は、画像処理部104により生成されたエッジ画像に対して、LBPに係る特徴量のヒストグラムを算出するための領域を設定する。また、領域設定部106は、設定した領域を示す領域情報を生成して記憶部102に記録する。
【0104】
算出部108は、上記(C)の処理(LBPに係る特徴量のヒストグラム算出処理)を主導的に行う役目を果たす。より具体的には、算出部108は、画像処理部104により生成されたエッジ画像に基づいて画素ごとにLBPに係る特徴量を算出し、領域設定部106において設定された領域ごとにLBPに係る特徴量のヒストグラムを算出する。
【0105】
写像部110は、上記(D)の処理(写像処理)を主導的に行う役目を果たす。より具体的には、写像部110は、算出部108において算出されたLBPに係る特徴量のヒストグラムを、より物体の認識が容易となる異なる空間へと写像する。また、写像部110は、写像に応じた行列情報を生成して記憶部102に記録する。
【0106】
統計学習部112は、上記(E)の処理(統計学習処理)を主導的に行う役目を果たす。より具体的には、統計学習部112は、写像部110において写像された空間において、LBPに係る特徴量のヒストグラムを用いたブースティングによる物体検出の統計学習(すなわち、判別器学習)を行う。また、統計学習部112は、学習結果に応じた判別情報を記憶部102に記録(新規記録、または更新)する。
【0107】
情報生成装置100は、例えば、図9に示す構成によって、本発明の実施形態に係る精度向上アプローチに係る処理を実現することができる。したがって、情報生成装置100は、例えば図9に示す構成によって、従来の技術を用いる場合よりも、ローカルバイナリパターンを用いた物体の検出の精度をより向上させることができる。
【0108】
なお、本発明の実施形態に係る情報生成装置100の構成は、図9に示す構成に限られない。例えば、本発明の実施形態に係る情報生成装置100が外部装置において生成されたエッジ画像を処理する構成である場合(情報生成装置100が上記(A)の処理を行わない構成である場合)には、情報生成装置100は、画像処理部104を備えない構成であってもよい。上記の場合には、領域設定部106に外部装置が生成したエッジ画像が入力されることとなる。
【0109】
また、本発明の実施形態に係る情報生成装置100は、物体検出装置200に係る(d)の処理(評価処理)を行う評価部(後述する)を備えることによって、物体検出装置200として機能することもできる。
【0110】
[物体検出装置200]
図11は、本発明の実施形態に係る物体検出装置200の構成の一例を示すブロック図である。物体検出装置200は、記憶部202と、画像処理部204と、算出部206と、写像部208と、評価部210とを備える。
【0111】
また、物体検出装置200は、例えば、制御部(図示せず)、ROM(図示せず)や、RAM(図示せず)、ユーザが操作可能な操作部(図示せず)、各種画面を表示画面に表示する表示部(図示せず)、外部装置と通信を行うための通信部(図示せず)などを備えていてもよい。物体検出装置200は、例えば、データの伝送路としてのバスにより上記各構成要素間を接続する。
【0112】
ここで、制御部(図示せず)は、例えば、MPUや、各種処理回路などで構成され物体検出装置200全体を制御する。また、制御部(図示せず)は、例えば、画像処理部204、算出部206、写像部208、および評価部210の役目を果たすこともできる。
【0113】
ROM(図示せず)は、制御部(図示せず)が使用するプログラムや演算パラメータなどの制御用データを記憶する。RAM(図示せず)は、制御部(図示せず)により実行されるプログラムなどを一次記憶する。また、操作部(図示せず)としては、例えば、上述した操作入力デバイスが挙げられる。また、表示部(図示せず)としては、例えば、上述した表示デバイスが挙げられる。
【0114】
〔物体検出装置200のハードウェア構成例〕
物体検出装置200は、例えば、図10に示す情報生成装置100と同様のハードウェア構成を有する。上記構成をとる場合、物体検出装置200では、MPUが制御部(図示せず)としての役目を果たし、記録媒体が記憶部202としての役目を果たす。また、上記構成をとる場合、物体検出装置200では、操作入力デバイス160が操作部(図示せず)の役目を果たし、表示デバイス162が表示部(図示せず)の役目を果たす。また、上記構成をとる場合、物体検出装置200では、通信インタフェース164が通信部(図示せず)としての役目を果たす。なお、本発明の実施形態に係る物体検出装置200の構成が、図10に示す情報生成装置100と同様の構成に限られないことは、言うまでもない。
【0115】
記憶部202は、物体検出装置200が備える記憶手段である。ここで、記憶部202としては、例えば、ハードディスクなどの磁気記録媒体や、フラッシュメモリなどの不揮発性メモリなどが挙げられる。
【0116】
また、記憶部202は、例えば、検出対象画像や、領域情報、行列情報、および判別情報などの情報生成装置100が生成した検出用情報、アプリケーションなど、様々なデータを記憶する。ここで、図11では、検出対象画像220、…と、情報生成装置100から取得された領域情報132、行列情報134、および判別情報136とが、記憶部202に記憶されている例を示している。
【0117】
画像処理部204は、上記(a)の処理(画像前処理)を主導的に行う役目を果たす。より具体的には、画像処理部204は、記憶部102から検出対象画像データを読み出し、検出対象画像に基づいて、情報生成装置100の画像処理部104と同様にエッジ画像を生成する。
【0118】
算出部206は、上記(b)の処理(LBPに係る特徴量のヒストグラム算出処理)を主導的に行う役目を果たす。より具体的には、算出部206は、情報生成装置100の算出部108と同様に、エッジ画像に基づいて画素ごとにLBPに係る特徴量を算出する。また、算出部206は、記憶部202に記憶された領域情報に基づいて領域を設定し、情報生成装置100の算出部108と同様に、設定された領域ごとにLBPに係る特徴量のヒストグラムを算出する。なお、算出部206は、通信部(図示せず)を介して情報生成装置100と通信を行い、領域情報を情報生成装置100から適宜取得して処理を行ってもよい。
【0119】
写像部208は、上記(c)の処理(写像処理)を主導的に行う役目を果たす。より具体的には、写像部208は、算出部206が処理に用いた領域情報に対応する、記憶部202に記憶された行列情報に基づいて、算出部206において算出されたLBPに係る特徴量のヒストグラムを、より物体の認識が容易となる異なる空間へと写像する。なお、写像部208は、通信部(図示せず)を介して情報生成装置100と通信を行い、算出部206が処理に用いた領域情報に対応する行列情報を情報生成装置100から適宜取得して処理を行ってもよい。
【0120】
評価部210は、上記(d)の処理(評価処理)を主導的に行う役目を果たす。より具体的には、評価部210は、写像部208により写像された空間において、記憶部202に記憶された判別情報と、LBPに係る特徴量のヒストグラムとに基づいて、画像処理部204により生成された検出対象画像に基づくエッジ画像を評価する。なお、評価部210は、通信部(図示せず)を介して情報生成装置100と通信を行い、判別情報を情報生成装置100から適宜取得して処理を行ってもよい。
【0121】
また、評価部210は、例えば、評価結果(物体の検出結果)を表示部(図示せず)に表示させるなどによって物体検出装置200のユーザに通知する、および/または、評価結果を記憶部202に記録する。なお、評価部210は、例えば、物体検出装置200が備える他の処理部(図示せず)や外部装置などに評価結果を伝達して、当該他の処理部(図示せず)や外部装置などに当該評価結果に応じた処理を行わせてもよい。
【0122】
物体検出装置200は、例えば、図11に示す構成によって、本発明の実施形態に係る精度向上アプローチに係る(a)の処理(画像前処理)〜(d)の処理(評価処理)を実現することができる。したがって、物体検出装置200は、例えば図11に示す構成によって、従来の技術を用いる場合よりも、ローカルバイナリパターンを用いた物体の検出の精度をより向上させることができる。
【0123】
なお、本発明の実施形態に係る物体検出装置200の構成は、図11に示す構成に限られない。例えば、本発明の実施形態に係る物体検出装置200が外部装置において生成されたエッジ画像を処理する構成である場合(物体検出装置200が上記(a)の処理を行わない構成である場合)には、物体検出装置200は、画像処理部204を備えない構成であってもよい。上記の場合には、算出部206に外部装置が生成したエッジ画像が入力されることとなる。
【0124】
以上のように、本発明の実施形態では、情報生成装置100が、(A)の処理(画像前処理)〜(E)の処理(統計学習処理)を行うことにより画像に含まれる物体を検出するために用いられる検出用情報を生成する。ここで、情報生成装置100は、学習用画像を処理したエッジ画像に対して処理を行うので、輝度画像に対して処理を行う従来の技術を用いる場合よりもローカルバイナリパターンを用いた物体の検出の精度をより向上させることができる。また、情報生成装置100は、LBPに係る特徴量のヒストグラムをより物体の認識が容易となる異なる空間へと線形写像または非線形写像して、写像された空間においてブースティングによる統計学習を行うので、従来の技術を用いる場合よりもローカルバイナリパターンを用いた物体の検出の精度をより向上させることが可能である。
【0125】
したがって、情報生成装置100は、上記のように検出用情報を生成することによって、従来の技術を用いる場合よりも、ローカルバイナリパターンを用いた物体の検出の精度をより向上させることができる。
【0126】
また、本発明の実施形態では、物体検出装置200が、(a)の処理(画像前処理)〜(d)の処理(評価処理)を行うことにより、情報生成装置100が生成した検出用情報を用いて検出対象画像に対する物体の検出に係る処理を行う。したがって、従来の技術を用いる場合よりも物体の検出の精度をより向上させることが可能な検出用情報を用いて処理を行うので、物体検出装置200は、従来の技術を用いる場合よりも、ローカルバイナリパターンを用いた物体の検出の精度をより向上させることができる。
【0127】
以上、本発明の実施形態として情報生成装置100を挙げて説明したが、本発明の実施形態は、かかる形態に限られない。本発明の実施形態は、例えば、PC(Personal Computer)やサーバなどのコンピュータなど、様々な機器に適用することができる。
【0128】
また、本発明の実施形態として物体検出装置200を挙げて説明したが、本発明の実施形態は、かかる形態に限られない。本発明の実施形態は、例えば、PCやサーバなどのコンピュータ、携帯電話やPHS(Personal Handyphone System)などの携帯型通信装置、映像/音楽再生装置、映像/音楽記録再生装置、ゲーム機など、様々な機器に適用することができる。
【0129】
(本発明の実施形態に係るプログラム)
[情報生成装置100に係るプログラム]
コンピュータを、本発明の実施形態に係る情報生成装置として機能させるためのプログラムによって、エッジ画像に基づく検出用情報を生成することができる。したがって、コンピュータを、コンピュータを、本発明の実施形態に係る情報生成装置として機能させるためのプログラムによって、ローカルバイナリパターンを用いた物体の検出の精度をより向上させることができる。
【0130】
[物体検出装置200に係るプログラム]
コンピュータを、本発明の実施形態に係る物体検出装置として機能させるためのプログラムによって、情報生成装置100が生成した検出用情報を処理し、ローカルバイナリパターンを用いた物体の検出の精度をより向上させることができる。
【0131】
以上、添付図面を参照しながら本発明の好適な実施形態について説明したが、本発明は係る例に限定されないことは言うまでもない。当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
【0132】
例えば、図9では、情報生成装置100が、画像処理部104、領域設定部106、算出部108、写像部110、および統計学習部112とを備える構成を示したが、本発明の実施形態に係る情報生成装置の構成は、上記に限られない。例えば、本発明の実施形態に係る情報生成装置は、図9に示す画像処理部104、領域設定部106、算出部108、写像部110、および統計学習部112のうちの、(任意の)複数の構成要素を1つの部として備える(例えば、複数の部が有する機能を実現する処理回路を備える)こともできる。
【0133】
また、例えば、図11では、物体検出装置200が、画像処理部204、算出部206、写像部208、および評価部210とを備える構成を示したが、本発明の実施形態に係る物体検出装置の構成は、上記に限られない。例えば、本発明の実施形態に係る物体検出装置は、図11に示す画像処理部204、算出部206、写像部208、および評価部210のうちの、(任意の)複数の構成要素を1つの部として備える(例えば、複数の部が有する機能を実現する処理回路を備える)こともできる。
【0134】
さらに、上記では、コンピュータを、本発明の実施形態に係る情報生成装置、物体検出装置それぞれとして機能させるためのプログラム(コンピュータプログラム)が提供されることを示したが、本発明の実施形態は、さらに、上記プログラムを記憶させた記憶媒体も併せて提供することができる。
【0135】
上述した構成は、本発明の実施形態の一例を示すものであり、当然に、本発明の技術的範囲に属するものである。
【符号の説明】
【0136】
100 情報生成装置
102、202 記憶部
104、204 画像処理部
106 領域設定部
108、206 算出部
110、208 写像部
112 統計学習部
200 物体検出装置
210 評価部
【技術分野】
【0001】
本発明は、情報生成装置、物体検出装置、情報生成方法、物体検出方法、およびプログラムに関する。
【背景技術】
【0002】
近年、画像に含まれる検出対象の物体を検出するための様々な技術が開発されている。画像に含まれる検出対象の物体を検出するためのテクスチャ認識の特徴量を取得する技術としては、例えば、非特許文献1、非特許文献2に記載されているローカルバイナリパターン(Local Binary Pattern。以下、「LBP」と示す場合がある。)を用いる技術が挙げられる。また、画像に含まれる検出対象の物体を検出するための統計学習に関する技術としては、例えば、非特許文献3に記載されているブースティング(Boosting)を用いる技術が挙げられる。
【先行技術文献】
【非特許文献】
【0003】
【非特許文献1】Ojala T,Pietikainen M & Maenpaa T (2002),Multiresolution gray-scale and rotation invariant texture classification with Local Binary Patterns.IEEE Transactions on Pattern Analysis and Machine Intelligence 24(7):971-987.
【非特許文献2】Maenpaa T,Ojala T,Pietikainen M & Soriano M(2000),Robust texture classification by subsets of Local Binary Patterns.Proc.15th International Conference on Pattern Recognition,Barcelona,Spain,3:947-950.
【非特許文献3】Paul Viola & Michael Jones,Robust Real-Time Object Detection,International Journal of Computer Vision 2001.
【発明の概要】
【発明が解決しようとする課題】
【0004】
LBPは、3×3の画素領域に着目したときに、中心の画素値と近傍8画素点の値の大小を比較して各画素点で0か1かの2ビットにコーディングする手法である。ここで、LBPを用いて画像に含まれる検出対象の物体の輪郭を示す特徴量を取得する従来の技術(以下、「従来の技術1」とよぶ場合がある。)は、輝度画像に対して処理を行うことによって、テクスチャ認識の特徴量(LBPによる物体の輪郭を示す特徴量。以下、「LBPに係る特徴量」という。)を算出する。よって、従来の技術1を用いる場合には、ある程度の精度を有するLBPに係る特徴量を取得できる可能性はある。
【0005】
しかしながら、輝度画像からLBPに係る特徴量を算出する場合、算出された当該特徴量は、例えば画像に含まれるノイズの影響を受けている可能性がある。また、輝度画像からLBPに係る特徴量を算出する場合には、算出された当該特徴量が、例えば画像に含まれる人物の服の色と背景との関係に依存する恐れもある。よって、従来の技術1を用いる場合、取得された(算出された)LBPに係る特徴量が、画像に含まれる物体を認識するために十分な精度を有するとは限らない。
【0006】
また、LBPに係る特徴量は画素ごとに算出されるが、画像に含まれる物体の検出において、LBPに係る特徴量それぞれが単独で用いられることは少ない。より具体的には、算出されたLBPに係る特徴量は、例えば、画像に含まれる物体を検出するための統計学習に関する従来の技術(以下、「従来の技術2」とよぶ場合がある。)のように、統計的に用いられる。例えば従来の技術2では、画像内のある領域においてLBPに係る特徴量のヒストグラムを算出し、LBPに係る特徴量を集団とすることにより統計的に用いる。
【0007】
ここで、上記のように、従来の技術1を用いる場合には、取得されたLBPに係る特徴量が画像に含まれる物体を認識するために十分な精度を有するとは限らない。よって、従来の技術1を用いて取得されたLBPに係る特徴量を、従来の技術2のように統計的に用いたとしても、画像に含まれる物体を十分に検出できない恐れがある。
【0008】
したがって、従来の技術1および従来の技術2(以下、総称して「従来の技術」とよぶ場合がある。)を用いたとしても、ローカルバイナリパターンを用いた物体の検出の精度を向上させることは、望むべくもない。
【0009】
本発明は、上記問題に鑑みてなされたものであり、本発明の目的とするところは、ローカルバイナリパターンを用いた物体の検出の精度をより向上させることが可能な、新規かつ改良された情報生成装置、物体検出装置、情報生成方法、物体検出方法、およびプログラムを提供することにある。
【課題を解決するための手段】
【0010】
上記目的を達成するために、本発明の第1の観点によれば、画像に含まれる物体を検出するために用いられる検出用情報を生成するための画像のエッジ画像に基づいて、画素ごとにローカルバイナリパターンによる物体の輪郭を示す特徴量を算出し、設定された領域ごとに算出した上記特徴量のヒストグラムを算出する算出部と、上記領域を設定し、設定した領域を示す領域情報を、上記検出用情報として生成する領域設定部と、上記算出部において算出されたヒストグラムを線形写像または非線形写像により異なる空間に写像し、上記写像に応じた上記領域情報に対応する行列情報を、上記検出用情報として生成する写像部と、上記写像部により写像された空間において、上記ヒストグラムを用いたブースティングによる物体検出の統計学習を行い、物体の検出結果を示す判別情報を、上記検出用情報として生成する統計学習部とを備える情報生成装置が提供される。
【0011】
かかる構成により、ローカルバイナリパターンを用いた物体の検出の精度をより向上させることが可能な検出用情報を生成することができる。よって、かかる構成により、ローカルバイナリパターンを用いた物体の検出の精度をより向上させることができる。
【0012】
また、上記領域設定部は、上記エッジ画像内において、任意の位置に任意の大きさの領域を設定してもよい。
【0013】
また、上記写像部は、線形判別法により上記写像を行ってもよい。
【0014】
また、上記写像部は、ロジスティック回帰分析により上記写像を行ってもよい。
【0015】
また、上記写像部は、潜在意味解析により上記写像を行ってもよい。
【0016】
上記目的を達成するために、本発明の第2の観点によれば、物体の検出を行う検出対象画像のエッジ画像に基づいて、画素ごとにローカルバイナリパターンによる物体の輪郭を示す特徴量を算出し、画像に含まれる物体を検出するために用いられる検出用情報として情報生成装置が生成した領域情報が示す領域ごとに、算出した上記特徴量のヒストグラムを算出する算出部と、上記検出用情報として上記情報生成装置が生成した上記領域情報に対応する行列情報に基づいて、上記算出部において算出されたヒストグラムを線形写像または非線形写像し、上記ヒストグラムを異なる空間に写像する写像部と、上記写像部により写像された空間において、上記検出用情報として上記情報生成装置が生成した物体の判別のための判別情報と、上記ヒストグラムとに基づいて、上記判別情報が示す物体が上記検出対象画像に含まれているかを評価する評価部とを備える物体検出装置が提供される。
【0017】
かかる構成により、ローカルバイナリパターンを用いた物体の検出の精度をより向上させることができる。
【0018】
上記目的を達成するために、本発明の第3の観点によれば、画像に含まれる物体を検出するために用いられる検出用情報を生成するための画像のエッジ画像に対して、ローカルバイナリパターンによる物体の輪郭を示す特徴量のヒストグラムを算出するための領域を設定するステップと、上記領域を設定するステップにおいて設定した領域を示す領域情報を、上記検出用情報として生成するステップと、上記エッジ画像に基づいて、画素ごとに上記特徴量を算出し、上記領域を生成するステップにおいて設定された領域ごとに算出した上記特徴量のヒストグラムを算出するステップと、上記算出するステップにおいて算出されたヒストグラムを線形写像または非線形写像により異なる空間に写像するステップと、上記写像するステップにおける上記写像に応じた上記領域情報に対応する行列情報を、上記検出用情報として生成するステップと、上記写像するステップにおいて写像された空間において、上記ヒストグラムを用いたブースティングによる物体検出の統計学習を行い、物体の検出結果を示す判別情報を、上記検出用情報として生成するステップとを有する情報生成方法が提供される。
【0019】
かかる方法を用いることによって、ローカルバイナリパターンを用いた物体の検出の精度をより向上させることが可能な検出用情報を生成することができる。よって、かかる方法を用いることによって、ローカルバイナリパターンを用いた物体の検出の精度をより向上させることができる。
【0020】
上記目的を達成するために、本発明の第4の観点によれば、物体の検出を行う検出対象画像のエッジ画像に基づいて、画素ごとにローカルバイナリパターンによる物体の輪郭を示す特徴量を算出し、画像に含まれる物体を検出するために用いられる検出用情報として情報生成装置が生成した領域情報が示す領域ごとに、算出した上記特徴量のヒストグラムを算出するステップと、上記検出用情報として上記情報生成装置が生成した上記領域情報に対応する行列情報に基づいて、上記算出するステップにおいて算出されたヒストグラムを線形写像または非線形写像し、上記ヒストグラムを異なる空間に写像するステップと、上記写像するステップにより写像された空間において、上記検出用情報として上記情報生成装置が生成した物体の判別のための判別情報と、上記ヒストグラムとに基づいて、上記判別情報が示す物体が上記検出対象画像に含まれているかを評価するステップとを有する物体検出方法が提供される。
【0021】
かかる方法を用いることによって、ローカルバイナリパターンを用いた物体の検出の精度をより向上させることができる。
【0022】
上記目的を達成するために、本発明の第5の観点によれば、画像に含まれる物体を検出するために用いられる検出用情報を生成するための画像のエッジ画像に対して、ローカルバイナリパターンによる物体の輪郭を示す特徴量のヒストグラムを算出するための領域を設定するステップ、上記領域を設定するステップにおいて設定した領域を示す領域情報を、上記検出用情報として生成するステップ、上記エッジ画像に基づいて、画素ごとに上記特徴量を算出し、上記領域を生成するステップにおいて設定された領域ごとに算出した上記特徴量のヒストグラムを算出するステップ、上記算出するステップにおいて算出されたヒストグラムを線形写像または非線形写像により異なる空間に写像するステップ、上記写像するステップにおける上記写像に応じた上記領域情報に対応する行列情報を、上記検出用情報として生成するステップ、上記写像するステップにおいて写像された空間において、上記ヒストグラムを用いたブースティングによる物体検出の統計学習を行い、物体の検出結果を示す判別情報を、上記検出用情報として生成するステップをコンピュータに実行させるためのプログラムが提供される。
【0023】
かかるプログラムを用いることによって、ローカルバイナリパターンを用いた物体の検出の精度をより向上させることが可能な検出用情報を生成することができる。よって、プログラムを用いることによって、ローカルバイナリパターンを用いた物体の検出の精度をより向上させることができる。
【0024】
上記目的を達成するために、本発明の第6の観点によれば、物体の検出を行う検出対象画像のエッジ画像に基づいて、画素ごとにローカルバイナリパターンによる物体の輪郭を示す特徴量を算出し、画像に含まれる物体を検出するために用いられる検出用情報として情報生成装置が生成した領域情報が示す領域ごとに、算出した上記特徴量のヒストグラムを算出するステップ、上記検出用情報として上記情報生成装置が生成した上記領域情報に対応する行列情報に基づいて、上記算出するステップにおいて算出されたヒストグラムを線形写像または非線形写像し、上記ヒストグラムを異なる空間に写像するステップ、上記写像するステップにより写像された空間において、上記検出用情報として上記情報生成装置が生成した物体の判別のための判別情報と、上記ヒストグラムとに基づいて、上記判別情報が示す物体が上記検出対象画像に含まれているかを評価するステップをコンピュータに実行させるためのプログラムが提供される。
【0025】
かかるプログラムを用いることによって、ローカルバイナリパターンを用いた物体の検出の精度をより向上させることができる。
【発明の効果】
【0026】
本発明によれば、ローカルバイナリパターンを用いた物体の検出の精度をより向上させることができる。
【図面の簡単な説明】
【0027】
【図1A】本発明の実施形態に係る情報生成装置における画像前処理の一例を説明するための説明図である。
【図1B】本発明の実施形態に係る情報生成装置における画像前処理の一例を説明するための説明図である。
【図2】本発明の実施形態に係る情報生成装置における領域生成処理の一例を説明するための説明図である。
【図3A】ローカルバイナリパターンを説明するための説明図である。
【図3B】ローカルバイナリパターンを説明するための説明図である。
【図4A】本発明の実施形態に係る情報生成装置におけるローカルバイナリパターンに係る特徴量の算出処理の他の例を説明するための説明図である。
【図4B】本発明の実施形態に係る情報生成装置におけるローカルバイナリパターンに係る特徴量の算出処理の他の例を説明するための説明図である。
【図4C】本発明の実施形態に係る情報生成装置におけるローカルバイナリパターンに係る特徴量の算出処理の他の例を説明するための説明図である。
【図4D】本発明の実施形態に係る情報生成装置におけるローカルバイナリパターンに係る特徴量の算出処理の他の例を説明するための説明図である。
【図4E】本発明の実施形態に係る情報生成装置におけるローカルバイナリパターンに係る特徴量の算出処理の他の例を説明するための説明図である。
【図5】本発明の実施形態に係る情報生成装置が算出したローカルバイナリパターンに係る特徴量のヒストグラムの一例を示す説明図である。
【図6】本発明の実施形態に係る情報生成装置が算出したローカルバイナリパターンに係る特徴量のヒストグラムの一例を示す説明図である。
【図7】本発明の実施形態に係る情報生成装置が算出したローカルバイナリパターンに係る特徴量のヒストグラムの他の例を示す説明図である。
【図8】本発明の実施形態に係る情報生成装置におけるヒストグラムの算出に係る処理の一例を示す説明図である。
【図9】本発明の実施形態に係る情報生成装置の構成の一例を示すブロック図である。
【図10】本発明の実施形態に係る情報生成装置のハードウェア構成の一例を示す説明図である。
【図11】本発明の実施形態に係る物体検出装置の構成の一例を示すブロック図である。
【発明を実施するための形態】
【0028】
以下に添付図面を参照しながら、本発明の好適な実施の形態について詳細に説明する。なお、本明細書および図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
【0029】
また、以下では、下記に示す順序で説明を行う。
1.本発明の実施形態に係るアプローチ
2.本発明の実施形態に係る情報生成装置、物体検出装置
3.本発明の実施形態に係るプログラム
【0030】
(本発明の実施形態に係るアプローチ)
本発明の実施形態では、本発明の実施形態に係る情報生成装置(以下、「情報生成装置100」という。)が、画像に含まれる物体を検出するために用いられる検出用情報を生成する。そして、本発明の実施形態では、本発明の実施形態に係る物体検出装置(以下、「物体検出装置200」という。)が、情報生成装置100が生成した検出用情報を用いて物体の検出を行う検出対象画像に対する物体の検出に係る処理を行う。なお、以下では、情報生成装置100と物体検出装置200とが別体の装置であるものとして説明するが、情報生成装置100と物体検出装置200とを1つの装置として実現することも可能である。
【0031】
情報生成装置100、物体検出装置200の構成について説明する前に、本発明の実施形態に係るローカルバイナリパターンを用いた物体の検出の精度向上アプローチについて説明する。
【0032】
[精度向上アプローチの概要]
上述したように、従来の技術1のように輝度画像に基づいてLBPに係る特徴量を算出する場合には、算出されたLBPに係る特徴量が、画像に含まれる物体を認識するために十分な精度を有するとは限らない。そこで、本発明の実施形態に係る情報生成装置100は、検出用情報を生成するための画像(以下、「学習用画像」とよぶ場合がある。)のエッジ画像に基づいて、画素ごとにLBPに係る特徴量を算出する。
【0033】
ここで、エッジ画像に基づいてLBPに係る特徴量を算出する場合には、従来の技術1のように輝度画像に基づいてLBPに係る特徴量を算出する場合よりも、ノイズの影響をより低減させることができる。また、エッジ画像に基づいてLBPに係る特徴量を算出する場合には、従来の技術1のように輝度画像に基づいてLBPに係る特徴量を算出する場合のように、LBPに係る特徴量が、例えば学習用画像に含まれる人物の服の色と背景との関係に依存する恐れはない。さらに、エッジ画像に基づいてLBPに係る特徴量を算出する場合には、学習用画像からエッジ画像を生成するときに検出するエッジの方向(例えば、水平方向、垂直方向など)に応じて、異なる観点の特徴量を算出することが可能となる。
【0034】
したがって、情報生成装置100は、エッジ画像に基づいてLBPに係る特徴量を算出することによって、従来の技術1のように輝度画像に基づいてLBPに係る特徴量を算出する場合よりもより精度が高いLBPに係る特徴量を算出することができる。
【0035】
また、情報生成装置100は、エッジ画像に基づいて算出されたLBPに係る特徴量に基づいて、従来の技術2のようにブースティングなどの統計学習を行うことによって、物体の検出結果を示す判別情報を、検出用情報として生成する。
【0036】
ここで、ブースティングとは、学習サンプルが従う分布による弱仮説(弱判別器)により繰り返し学習させ、学習に用いた弱仮説を、学習の結果得られるより強い仮説(判別器)の一部とするものである。ブースティングでは、前に生成した弱仮説の学習結果を使用して上記分布を加工し、加工された当該分布に基づき新たな弱仮説の学習を行う。つまり、ブースティングでは、後に生成された弱仮説はその前に生成された弱仮説に依存し、これによって、物体の判別が困難な学習サンプルを正解させるような弱判別器(より強い仮説)が選択されることとなる。
【0037】
情報生成装置100は、LBPに係る特徴量を用いて対象物(検出対象の物体)か非対象物かの判定を行う弱判別器によって、ブースティングを行う。よって、本発明の実施形態に係る検出用情報としての判別情報としては、例えば、判別器パラメータが挙げられる。なお、以下では、情報生成装置100がブースティングを用いて統計学習を行う場合を例に挙げて説明するが、本発明の実施形態に係る情報生成装置100は、エッジ画像に基づいて算出されたLBPに係る特徴量を用いて物体の検出が可能な、任意の統計学習方法を用いることが可能である。
【0038】
また、情報生成装置100は、従来の技術2を用いる場合のように、学習用画像内のある領域においてLBPに係る特徴量のヒストグラムを算出して当該ヒストグラムに対する統計学習を行うのでなく、当該ヒストグラムを異なる空間に線形写像または非線形写像(以下、単に「写像」と示す場合がある。)する。ここで、情報生成装置100が写像する異なる空間としては、例えば次元を減らすことが可能な空間など、LBPに係る特徴量のヒストグラムをより物体の認識が容易となる空間が挙げられる。そして、情報生成装置100は、写像された空間において、ヒストグラムを用いたブースティングによる物体検出の統計学習を行うことによって、検出用情報としての物体の検出結果を示す判別情報を生成する。
【0039】
情報生成装置100は、LBPに係る特徴量のヒストグラムをより物体の認識が容易となる異なる空間へ写像し、写像された空間においてLBPに係る特徴量のヒストグラムを用いたブースティングによる統計学習を行う。よって、情報生成装置100は、従来の技術を用いる場合よりも、より物体の検出の精度をより向上させることができる。なお、本発明の実施形態に係る情報生成装置100は、写像を行わずにLBPに係る特徴量のヒストグラムを用いたブースティングによる統計学習を行うこともできる。上記の場合であっても、本発明の実施形態に係る情報生成装置100は、エッジ画像に基づいて算出されたLBPに係る特徴量に基づいて統計学習を行うので、従来の技術を用いる場合よりもより物体の検出の精度をより向上させることが可能である。
【0040】
本発明の実施形態では、上記のように、情報生成装置100が、エッジ画像に基づいてLBPに係る特徴量を算出する。そして、本発明の実施形態では、情報生成装置100が、エッジ画像に基づいて算出されたLBPに係る特徴量に基づいてブースティングなどの統計学習を行うことによって、判別情報などの検出用情報(検出用情報としての役目を果たす他の情報については後述する。)を生成する。
【0041】
また、本発明の実施形態では、物体検出装置200が、情報生成装置100が生成した検出用情報を用いて、検出対象画像に対する物体の検出に係る処理を行う。
【0042】
したがって、情報生成装置100が上記のように検出用情報を生成することによって、従来の技術を用いる場合よりも、ローカルバイナリパターンを用いた物体の検出の精度をより向上させることができる。
【0043】
[精度向上アプローチに係る処理]
以下、より具体的に本発明の実施形態に係る精度向上アプローチに係る処理について説明する。以下では、本発明の実施形態に係る精度向上アプローチに係る処理として、情報生成装置100における処理(本発明の実施形態に係る情報生成方法に係る処理)と、物体検出装置200に係る処理(本発明の実施形態に係る物体検出方法に係る処理)とについて、それぞれ説明する。
【0044】
[1]情報生成装置100における処理
まず、情報生成装置100における処理について説明する。情報生成装置100は、例えば下記の(A)の処理〜(E)の処理を行うことによって、エッジ画像に基づく検出用情報を生成する。なお、下記に示す(A)の処理〜(E)の処理のうち、(A)の処理は、情報生成装置100の外部装置(例えば画像処理装置など)によって行われてもよい。上記の場合、情報生成装置100は、上記外部装置において(A)の処理がなされた画像(すなわち、学習用画像に基づくエッジ画像)が入力されることとなる。
【0045】
(A)画像前処理
情報生成装置100は、学習用画像に基づいてエッジ画像を生成する。図1A、図1Bは、本発明の実施形態に係る情報生成装置100における画像前処理の一例を説明するための説明図である。ここで、図1Aは、学習用画像の一例を示しており、図1Bは、図1Aに示す学習用画像に対して画像前処理を行った後に得られるエッジ画像の一例を示している。
【0046】
ここで、本発明の実施形態に係る学習用画像としては、例えば、図1Aに示すように検出対象の物体(図1Aでは人が検出対象である例を示している。)が含まれる画像と、検出対象の物体が含まれていない画像(図示せず)とが挙げられる。また、本発明の実施形態に係る学習用画像のうちの検出対象の物体が含まれる画像は、検出対象の物体が特定の位置(例えば、図1Aに示すように画像の中心付近)に存在する画像であってもよい。情報生成装置100は、例えば上記のように検出対象の物体の有無が明らかな学習用画像に基づいて、エッジ画像を生成する。
【0047】
情報生成装置100は、例えば、[−1,0,1]のフィルタ(学習用画像の水平方向のエッジを検出するためのフィルタの一例)や、[−1,0,1]’のフィルタ(学習用画像の垂直方向のエッジを検出するためのフィルタの一例)を用いて、学習用画像から特定の方向のエッジを検出してエッジ画像を生成する。なお、(A)の処理において情報生成装置100が生成するエッジ画像は、上記に限られない。例えば、情報生成装置100は、特定の方向のエッジが検出されたエッジ画像の画素値の絶対値をとったエッジ画像を生成することができる。また、情報生成装置100は、例えば、学習用画像の水平方向のエッジが検出されたエッジ画像と垂直方向のエッジが検出されたエッジ画像との双方を用いることによって、特定の方向に依存しないエッジ画像を生成することもできる。特定の方向に依存しないエッジ画像の生成方法としては、例えば、sqrt(Gx^2+Gy^2)の演算を行うことが挙げられる。ここで、“Gx”は、学習用画像の水平方向のエッジが検出されたエッジ画像の画素値を示し、“Gy”は、学習用画像の垂直方向のエッジが検出されたエッジ画像を示している。
【0048】
(B)領域生成処理
情報生成装置100は、上記(A)の処理により生成されたエッジ画像に対して、LBPに係る特徴量のヒストグラムを算出するための領域を設定する。図2は、本発明の実施形態に係る情報生成装置100における領域生成処理の一例を説明するための説明図である。ここで、図2では、図1Bに示すエッジ画像に対して設定される領域の一例を示している。
【0049】
図2に示すように、情報生成装置100は、エッジ画像内において、任意の位置に任意の大きさ(サイズ)の領域を設定する。ここで、図2では、情報生成装置100が複数の領域を設定した例を示しているが、情報生成装置100がエッジ画像内に設定する領域の数は1つであってもよい。情報生成装置100が、エッジ画像内において任意の位置に任意の大きさの領域を設定することによって、検出対象の物体における特徴部分を用いた統計学習を行うことができる可能性が高まるので、LBPを用いた物体の検出の精度をより向上させることができる。なお、本発明の実施形態に係る情報生成装置100が、エッジ画像の任意の位置または特定の位置に、任意の大きさまたは予め規定された大きさ領域を設定することもできることは、言うまでもない。また、図2では、情報生成装置100が矩形の領域を設定する例を示しているが、情報生成装置100が設定する領域は、上記に限られない。例えば、情報生成装置100は、後述する(C)の処理においてLBPに係る特徴量のヒストグラムを算出可能な、任意の形状の領域を設定することができる。
【0050】
また、情報生成装置100は、設定した領域を示す領域情報を、検出用情報として生成する。そして、情報生成装置100は、生成した領域情報を、例えば記憶部(後述する)に記憶させる。ここで、本発明の実施形態に係る領域情報としては、例えば、領域の原点および頂点を示す座標の情報(例えば設定された領域が矩形の領域の場合)が挙げられる。
【0051】
(C)LBPに係る特徴量のヒストグラム算出処理
情報生成装置100は、エッジ画像に基づいて画素ごとにLBPに係る特徴量を算出し、上記(B)の処理において設定された領域ごとにLBPに係る特徴量のヒストグラムを算出する。
【0052】
(C−1)LBPに係る特徴量の算出処理
まず、情報生成装置100におけるLBPに係る特徴量の算出処理について説明する。図3A、図3Bは、ローカルバイナリパターンを説明するための説明図である。ここで、図3Aは、注目画素Pを中心とする3×3の画素領域の画素値の一例を示しており、図3Bは、図3Aに示す画素領域に対してLBPを適用した場合の一例を示している。
【0053】
上述したように、LBPは、3×3の画素領域に着目したときに、中心の画素値と近傍8画素点の値の大小を比較して各画素点で0か1かの2ビットにコーディングする手法である。例えば図3Aの例では、注目画素Pの画素値が163であり、注目画素Pの周辺の画素の画素値が、左上から142、154、168、129、125、161、167、160である。よって、図3Aに示す画素領域を処理する場合、情報生成装置100は、注目画素Pの画素値と他の画素の画素値とを比較することによって、例えば(0,0,1,0,0,0,1,0)と合計8ビットでコーディングされる。ここで、3×3の画素領域における注目画素Pを除く全ての画素に着目した場合、LBPは8ビットでコーディングされるので、全部で256パターンのコーディング種類が存在しうることとなる。
【0054】
情報生成装置100は、エッジ画像の各画素について図3Bに示すようにLBPに係る演算を行うことによって、例えば8ビットでコーディングされたLBPに係る特徴量を算出する。ここで、情報生成装置100は、上記(B)の処理において設定された領域に含まれる画素に対してLBPに係る特徴量を算出するが、エッジ画像を構成する全画素に対してLBPに係る特徴量を算出してもよい。また、エッジ画像を構成する全画素に対してLBPに係る特徴量を算出する場合、情報生成装置100は、例えば、上記(B)の処理と平行してLBPに係る特徴量の算出処理を行うことができる。
【0055】
なお、本発明の実施形態に係る情報生成装置100におけるLBPに係る特徴量の算出方法は、図3A、図3Bに示す例に限られない。図4A〜図4Eは、本発明の実施形態に係る情報生成装置100におけるローカルバイナリパターンに係る特徴量の算出処理の他の例を説明するための説明図である。
【0056】
情報生成装置100は、例えば、図4A、図4Bに示すように、注目画素Pの画素値と、3×3の画素領域内の4つの画素の画素値とを比較することによってLBPに係る特徴量を算出することができる。また、情報生成装置100は、図4Cに示すように、注目画素Pの画素値と、3×3の画素領域内の3つの画素の画素値の平均値とを比較することによってLBPに係る特徴量を算出することもできる。図4A〜図4Cの場合には、LBPは4ビットでコーディングされるので、全部で16パターンのコーディング種類が存在しうることとなる。ここで、図4A〜図4Cに示すように、注目画素Pの画素値と3×3の画素領域内の4つの画素の画素値(または画素値の平均値)とに基づいてLBPに係る特徴量を算出する場合には、図3Bに示す場合よりも計算量が半分になるという利点がある。また、上記の場合には、図3Bに示す場合よりもコーディングするビット数が少なくなるので、必要なメモリも少なくなるという利点がある。
【0057】
また、情報生成装置100は、図4Dに示すように、方向ごとに計算したエッジ画像において対応する方向で比較することによってLBPに係る特徴量を算出してもよい。図4Dの場合には、LBPは方向ごとに8ビットでコーディングされるので、全部で(256×方向数)パターンのコーディング種類が存在しうることとなる。
【0058】
さらに、情報生成装置100は、図4Eに示すように、図4Aおよび図4Bを組み合わせてLBPに係る特徴量を算出することもできる。図4Eの場合には、LBPは、それぞれが4ビットでコーディングされるので、全部で(16×2)パターンのコーディング種類が存在しうることとなる。
【0059】
情報生成装置100は、例えば図4A〜図4Eに示すように、様々な方法でLBPに係る特徴量を算出することができる。なお、以下では、情報生成装置100が、図3Bに示すように8ビットでコーディングされたLBPに係る特徴量を算出する場合を例に挙げて説明する。
【0060】
(C−2)LBPに係る特徴量のヒストグラム算出処理
情報生成装置100は、上記(B)の処理において設定された領域ごとに、上記(C−1)の処理において算出されたLBPに係る特徴量のヒストグラムを算出する。より具体的には、情報生成装置100は、算出したLBPに係る特徴量のパターンを階級とし、算出したLBPに係る特徴量のパターンの個数を度数とすることによって、LBPに係る特徴量のヒストグラムを算出する。
【0061】
図5、図6は、本発明の実施形態に係る情報生成装置100が算出したローカルバイナリパターンに係る特徴量のヒストグラムの一例を示す説明図である。ここで、図5は、設定された領域内に検出対象の物体(例えば図1Aに示す人)が含まれる場合のヒストグラムの一例を示している。また、図6は、設定された領域内に検出対象の物体が含まれない場合のヒストグラム(例えば図1Aにおける背景におけるヒストグラム)の一例を示している。
【0062】
情報生成装置100は、上記(B)の処理において設定された領域ごとに、図5、図6に示すようなヒストグラムを算出する。
【0063】
なお、情報生成装置100が算出する、8ビットでコーディングされたLBPに係る特徴量のヒストグラムは、図5、図6に示すように階級が256である例に限られない。例えば、情報生成装置100は、非特許文献2に記載されているようなUniformLBPのパターンを階級とするヒストグラムを算出することもできる。ここで、UniformLBPとは、“0から1”または“1から0”への遷移が2箇所以下のLBPに係る特徴量を用いる手法である。図7は、本発明の実施形態に係る情報生成装置100が算出したローカルバイナリパターンに係る特徴量のヒストグラムの他の例を示す説明図である。UniformLBPを用いる場合、情報生成装置100は、図7に示すように、8ビットでコーディングされたLBPに係る特徴量のヒストグラムとして階級が56のヒストグラムを算出する。よって、情報生成装置100は、例えば使用するLBPの種類などに応じて、算出するヒストグラムの階級数を設定することが可能である。
【0064】
ここで、情報生成装置100は、例えば、エッジ画像をスキャンし、スキャンするごとにスキャンウィンドウでヒストグラムを計算することによりLBPに係る特徴量のヒストグラムの算出処理を行うが、情報生成装置100におけるヒストグラムの算出処理は、上記に限られない。例えば、情報生成装置100は、下記の(i)、(ii)に示す方法を用いてヒストグラムを算出することによって、ヒストグラムの算出に係る処理時間の短縮(処理の高速化)を図ることもできる。
【0065】
(i)第1の処理時間の短縮方法
図8は、本発明の実施形態に係る情報生成装置100におけるヒストグラムの算出に係る処理の一例を示す説明図である。情報生成装置100は、エッジ画像をスキャンして次の画素点に移るときに、移動した分だけの領域のヒストグラム(図8に示すA)をひいて、新しく追加する領域のヒストグラム(図8に示すC)を加える。
【0066】
より具体的には、情報生成装置100は、エッジ画像の各画素におけるLBPに係る特徴量を算出しておき、ヒストグラムを算出するときには、スキャニングによる差分のみを加算する。つまり、情報生成装置100は、A+BからB+Cへと動かした場合、“A+B−A+C=B+C”という演算を行うので、スキャンするごとにスキャンウィンドウでヒストグラムを計算する場合よりも計算量を低減させることができる。よって、情報生成装置100は、ヒストグラムの算出に係る処理時間の短縮を図ることが可能となる。
【0067】
(ii)第2の処理時間の短縮方法
情報生成装置100は、Violaたちによって導入されたIntegral画像(Integral Image)という表現を用いてヒストグラムの算出に係る処理時間の短縮を図ることもできる。より具体的には、情報生成装置100は、エッジ画像の各画素におけるLBPに係る特徴量を算出しておき、LBPのパターン数(例えば、58、256など)分のIntegral画像(エッジ画像と同じ画像サイズのIntegral画像)を用意する。そして、情報生成装置100は、ヒストグラムを算出するときは領域内のLBPの和をIntegral画像を用いて計算する。ここで、Integral画像は、通常、輝度画像について計算され、この場合、Integral画像のLBPパターンがある画素点で存在すれば1、存在しなければ0、というような表現となる。情報生成装置100は、輝度画像について計算される場合と同様に、エッジ画像に対してIntegral画像を用いる。例えば、LBPのパターン数が58である場合、ある画素点でのLBPは1つしか存在しないので、情報生成装置100は、58枚あるIntegral画像のうち、1枚だけが当該画素点で1がカウントし、残りの57枚全てで当該画素点での値を0とカウントする。
【0068】
情報生成装置100は、例えば、上記の(i)、(ii)に示す方法を用いてヒストグラムを算出することによって、ヒストグラムの算出に係る処理時間の短縮を図ることができる。
【0069】
(D)写像処理
情報生成装置100は、上記(C)の処理において算出されたLBPに係る特徴量のヒストグラムを、より物体の認識が容易となる異なる空間へと写像する。つまり、情報生成装置100における(D)の処理は、後述する(E)の処理において統計学習に用いる特徴量を、LBPに係る特徴量のヒストグラムから、より物体の認識が容易となる新たな特徴量へと変換する処理に該当する。
【0070】
より具体的には、情報生成装置100は、下記の数式1、数式2に示す「ある領域におけるLBPに係る特徴量のヒストグラム」を、数式3、数式4に示すように関数hで写像する。
【0071】
【数1】
・・・(数式1)
【数2】
・・・(数式2)
【0072】
【数3】
・・・(数式3)
【数4】
・・・(数式4)
【0073】
ここで、情報生成装置100は、例えば、Fisherの線形判別法などの線形判別法や、ロジスティック回帰分析(Logistic Regression)、潜在意味解析(pLSA)を用いて線形写像を行う。また、情報生成装置100は、例えば、カーネルSVM(Support Vector Machine)などを用いて非線形写像を行うこともできる。なお、本発明の実施形態に係る情報生成装置100が写像に用いる方法は、上記に限られず、LBPに係る特徴量のヒストグラムを直接用いるよりもより物体の認識が容易となる空間へと写像することが可能な、任意の方法を用いることができる。
【0074】
また、情報生成装置100は、写像に応じた線形行列または非線形行列を示す行列情報を、検出用情報として生成する。そして、情報生成装置100は、例えば記憶部(後述する)に、生成した行列情報を領域情報と対応付けて記憶させる。ここで、情報生成装置100は、例えば、行列情報を識別するためのファイル名を領域情報と関連付けることによって、行列情報を領域情報に対応付けるが、情報生成装置100における行列情報を領域情報に対応付ける方法は、上記に限られない。例えば、情報生成装置100は、行列情報に領域情報と対応付ける情報が記録されたメタデータを付加するなど、行列情報を領域情報に対応付けることが可能な任意の方法を用いることができる。なお、情報生成装置100は、例えば、さらに領域情報に行列情報と対応付ける情報が記録されたメタデータを付加することもできる。
【0075】
(E)統計学習処理
情報生成装置100は、上記(D)の処理において写像された空間において、LBPに係る特徴量のヒストグラムを用いたブースティングによる物体検出の統計学習(すなわち、判別器学習)を行う。そして、情報生成装置100は、検出用情報としての判別情報を生成し、生成した判別情報を記憶部(後述する)に記憶させる。ここで、情報生成装置100における判別情報の生成とは、例えば、判別情報の新規生成に限られず、記憶部(後述する)に既に判別情報が記憶されている場合における当該判別情報の更新も含まれる。
【0076】
情報生成装置100は、例えば、上記(A)の処理(画像前処理)〜(E)の処理(統計学習処理)を行うことによって、エッジ画像に基づく検出用情報を生成することができる。よって、情報生成装置100は、上記(A)の処理(画像前処理)〜(E)の処理(統計学習処理)を行うことによって上述した精度向上アプローチを実現することが可能となるので、ローカルバイナリパターンを用いた物体の検出の精度をより向上させることができる。
【0077】
[2]物体検出装置200における処理
次に、物体検出装置200における処理について説明する。物体検出装置200は、例えば下記の(a)の処理〜(d)の処理を行うことによって、情報生成装置100が生成した検出用情報を用いて検出対象画像から検出対象の物体を検出する。なお、下記に示す(a)の処理〜(e)の処理のうち、(a)の処理は、物体検出装置200の外部装置(例えば画像処理装置など)によって行われてもよい。上記の場合、物体検出装置200は、上記外部装置において(a)の処理がなされた画像(すなわち、エッジ画像)が入力されることとなる。
【0078】
また、物体検出装置200は、例えば、ネットワークを介して情報生成装置100が生成した検出用情報を取得する。ここで、上記ネットワークとしては、例えば、LAN(Local Area Network)やWAN(Wide Area Network)などの有線ネットワーク、無線LAN(WLAN;Wireless Local Area Network)や基地局を介した無線WAN(WWAN;Wireless Wide Area Network)などの無線ネットワーク、あるいは、TCP/IP(Transmission Control Protocol/Internet Protocol)などの通信プロトコルを用いたインターネットなどが挙げられる。
【0079】
なお、物体検出装置200における検出用情報の取得方法は、上記に限られない。例えば、物体検出装置200は、例えば、DVD(Digital Versatile Disc)などの光ディスクやUSB(Universal Serial Bus)メモリなど、情報生成装置100が生成した検出用情報が記録された外部記録媒体を介して、検出用情報を取得することもできる。
【0080】
(a)画像前処理
物体検出装置200は、情報生成装置100における(A)の処理と同様に、検出対象画像に基づいてエッジ画像を生成する。
【0081】
(b)LBPに係る特徴量のヒストグラム算出処理
物体検出装置200は、情報生成装置100における(C)の処理と同様に、エッジ画像に基づいて画素ごとにLBPに係る特徴量を算出する。また、物体検出装置200は、情報生成装置100が生成した検出用情報としての領域情報に基づいて領域を設定し、情報生成装置100における(C)の処理と同様に、設定された領域ごとにLBPに係る特徴量のヒストグラムを算出する。
【0082】
(c)写像処理
物体検出装置200は、情報生成装置100が生成した検出用情報としての行列情報に基づいて、上記(b)の処理において算出されたLBPに係る特徴量のヒストグラムを、情報生成装置100における(D)の処理と同様に、より物体の認識が容易となる異なる空間へと写像する。
【0083】
(d)評価処理
物体検出装置200は、上記(c)の処理において写像された空間において、情報生成装置100が生成した検出用情報としての判別情報と、LBPに係る特徴量のヒストグラムとに基づいて、検出対象画像に基づくエッジ画像を評価する。ここで、物体検出装置200は、例えば、領域ごとにエッジ画像に対するスコアリングを行うことによって、検出対象画像に検出対象が含まれているか否かを評価する。つまり、物体検出装置200における(d)の処理は、検出対象画像から検出対象を検出する処理に相当する。
【0084】
物体検出装置200は、例えば(a)の処理(画像前処理)〜(d)の処理(評価処理)を行うことによって、情報生成装置100が生成した検出用情報を用いて検出対象画像に対する物体の検出に係る処理を行う。したがって、物体検出装置200は、従来の技術を用いる場合よりも、ローカルバイナリパターンを用いた物体の検出の精度をより向上させることができる。
【0085】
本発明の実施形態では、上述したように、情報生成装置100が、例えば(A)の処理(画像前処理)〜(E)の処理(統計学習処理)を行うことによって、エッジ画像に基づく検出用情報を生成する。また、本発明の実施形態では、上述したように、物体検出装置200が、例えば(a)の処理(画像前処理)〜(d)の処理(評価処理)を行うことによって、検出対象画像に対する物体の検出に係る処理を行う。よって、本発明の実施形態では、上述した本発明の実施形態に係る精度向上アプローチが実現される。
【0086】
したがって、本発明の実施形態では、情報生成装置100が上記のように検出用情報を生成することによって、従来の技術を用いる場合よりも、ローカルバイナリパターンを用いた物体の検出の精度をより向上させることができる。
【0087】
(本発明の実施形態に係る情報生成装置、物体検出装置)
次に、上述した本発明の実施形態に係る精度向上アプローチに係る処理を実現することが可能な、情報生成装置100、物体検出装置200の構成の一例について説明する。
【0088】
[情報生成装置100]
図9は、本発明の実施形態に係る情報生成装置100の構成の一例を示すブロック図である。情報生成装置100は、記憶部102と、画像処理部104と、領域設定部106と、算出部108と、写像部110と、統計学習部112とを備える。
【0089】
また、情報生成装置100は、例えば、制御部(図示せず)、ROM(Read Only Memory;図示せず)や、RAM(Random Access Memory;図示せず)、ユーザが操作可能な操作部(図示せず)、各種画面を表示画面に表示する表示部(図示せず)、外部装置と通信を行うための通信部(図示せず)などを備えていてもよい。情報生成装置100は、例えば、データの伝送路としてのバス(bus)により上記各構成要素間を接続する。
【0090】
ここで、制御部(図示せず)は、例えば、MPU(Micro Processing Unit)や、各種処理回路などで構成され情報生成装置100全体を制御する。また、制御部(図示せず)は、例えば、画像処理部104、領域設定部106、算出部108、写像部110、および統計学習部112の役目を果たすこともできる。
【0091】
ROM(図示せず)は、制御部(図示せず)が使用するプログラムや演算パラメータなどの制御用データを記憶する。RAM(図示せず)は、制御部(図示せず)により実行されるプログラムなどを一次記憶する。
【0092】
また、操作部(図示せず)としては、例えば、後述する操作入力デバイスが挙げられる。また、表示部(図示せず)としては、例えば、後述する表示デバイスが挙げられる。
【0093】
〔情報生成装置100のハードウェア構成例〕
図10は、本発明の実施形態に係る情報生成装置100のハードウェア構成の一例を示す説明図である。図10を参照すると、情報生成装置100は、例えば、MPU150と、ROM152と、RAM154と、記録媒体156と、入出力インタフェース158と、操作入力デバイス160と、表示デバイス162と、通信インタフェース164とを備える。また、情報生成装置100は、例えば、データの伝送路としてのバス166で各構成要素間を接続する。
【0094】
MPU150は、MPUや、制御機能を実現するための複数の回路が集積された集積回路などで構成され、情報生成装置100全体を制御する制御部(図示せず)として機能する。また、MPU150は、情報生成装置100において、後述する画像処理部104、領域設定部106、算出部108、写像部110、および統計学習部112としての役目を果たすこともできる。
【0095】
ROM152は、MPU150が使用するプログラムや演算パラメータなどの制御用データなどを記憶し、また、RAM154は、例えば、MPU150により実行されるプログラムなどを一次記憶する。
【0096】
記録媒体156は、記憶部102として機能し、例えば、学習用画像データや、領域情報、行列情報、および判別情報などの情報生成装置100が生成した検出用情報、アプリケーションなど、様々なデータを記憶する。ここで、記録媒体156としては、例えば、ハードディスクなどの磁気記録媒体や、EEPROM(Electrically Erasable and Programmable Read Only Memory)、フラッシュメモリ(flash memory)、MRAM(Magnetoresistive Random Access Memory)、FeRAM(Ferroelectric Random Access Memory)、PRAM(Phase change Random Access Memory)などの不揮発性メモリ(nonvolatile memory)が挙げられる。また、情報生成装置100は、情報生成装置100から着脱可能な記録媒体156を備えることもできる。
【0097】
入出力インタフェース158は、例えば、操作入力デバイス160や、表示デバイス162を接続する。操作入力デバイス160は、操作部(図示せず)として機能し、また、表示デバイス162は、表示部(図示せず)として機能する。ここで、入出力インタフェース158としては、例えば、USB端子や、DVI(Digital Visual Interface)端子、HDMI(High-Definition Multimedia Interface)端子、各種処理回路などが挙げられる。また、操作入力デバイス160は、例えば、情報生成装置100上に備えられ、情報生成装置100の内部で入出力インタフェース158と接続される。操作入力デバイス160としては、例えば、ボタン、方向キー、ジョグダイヤルなどの回転型セレクター、あるいは、これらの組み合わせなどが挙げられる。また、表示デバイス162は、例えば、情報生成装置100上に備えられ、情報生成装置100の内部で入出力インタフェース158と接続される。表示デバイス162としては、例えば、液晶ディスプレイ(Liquid Crystal Display;LCD)や有機ELディスプレイ(organic ElectroLuminescence display。または、OLEDディスプレイ(Organic Light Emitting Diode display)ともよばれる。)などが挙げられる。なお、入出力インタフェース158が、情報生成装置100の外部装置としての操作入力デバイス(例えば、キーボードやマウスなど)や、表示デバイス(例えば、外部ディスプレイなど)と接続することもできることは、言うまでもない。また、表示デバイス162は、例えばタッチスクリーンなど、表示とユーザ操作とが可能なデバイスであってもよい。
【0098】
通信インタフェース164は、情報生成装置100が備える通信手段であり、ネットワークを介して(あるいは、直接的に)、1または2以上の物体検出装置200などの外部装置と無線/有線で通信を行うための通信部(図示せず)として機能する。ここで、通信インタフェース164としては、例えば、IEEE802.11gポートおよび送受信回路(無線通信)や、IEEE802.15.1ポートおよび送受信回路(無線通信)、通信アンテナおよびRF回路(無線通信)、あるいはLAN端子および送受信回路(有線通信)などが挙げられる。
【0099】
情報生成装置100は、例えば図10に示す構成によって、本発明の実施形態に係る精度向上アプローチに係る処理を行う。なお、本発明の実施形態に係る情報生成装置100のハードウェア構成が、図10に示す構成に限られないことは、言うまでもない。
【0100】
再度図9を参照して、情報生成装置100の構成要素について説明する。記憶部102は、情報生成装置100が備える記憶手段である。ここで、記憶部102としては、例えば、ハードディスクなどの磁気記録媒体や、フラッシュメモリなどの不揮発性メモリなどが挙げられる。
【0101】
また、記憶部102は、例えば、学習用画像データや、領域情報、行列情報、および判別情報などの情報生成装置100が生成した検出用情報、アプリケーションなど、様々なデータを記憶する。ここで、図9では、学習用画像データ130、…、領域情報132、行列情報134、判別情報136が記憶部102に記憶されている例を示している。
【0102】
画像処理部104は、上記(A)の処理(画像前処理)を主導的に行う役目を果たす。より具体的には、画像処理部104は、記憶部102から学習用画像データを読み出し、読み出した学習用画像データに基づいてエッジ画像を生成する。
【0103】
領域設定部106は、上記(B)の処理(領域生成処理)を主導的に行う役目を果たす。より具体的には、領域設定部106は、画像処理部104により生成されたエッジ画像に対して、LBPに係る特徴量のヒストグラムを算出するための領域を設定する。また、領域設定部106は、設定した領域を示す領域情報を生成して記憶部102に記録する。
【0104】
算出部108は、上記(C)の処理(LBPに係る特徴量のヒストグラム算出処理)を主導的に行う役目を果たす。より具体的には、算出部108は、画像処理部104により生成されたエッジ画像に基づいて画素ごとにLBPに係る特徴量を算出し、領域設定部106において設定された領域ごとにLBPに係る特徴量のヒストグラムを算出する。
【0105】
写像部110は、上記(D)の処理(写像処理)を主導的に行う役目を果たす。より具体的には、写像部110は、算出部108において算出されたLBPに係る特徴量のヒストグラムを、より物体の認識が容易となる異なる空間へと写像する。また、写像部110は、写像に応じた行列情報を生成して記憶部102に記録する。
【0106】
統計学習部112は、上記(E)の処理(統計学習処理)を主導的に行う役目を果たす。より具体的には、統計学習部112は、写像部110において写像された空間において、LBPに係る特徴量のヒストグラムを用いたブースティングによる物体検出の統計学習(すなわち、判別器学習)を行う。また、統計学習部112は、学習結果に応じた判別情報を記憶部102に記録(新規記録、または更新)する。
【0107】
情報生成装置100は、例えば、図9に示す構成によって、本発明の実施形態に係る精度向上アプローチに係る処理を実現することができる。したがって、情報生成装置100は、例えば図9に示す構成によって、従来の技術を用いる場合よりも、ローカルバイナリパターンを用いた物体の検出の精度をより向上させることができる。
【0108】
なお、本発明の実施形態に係る情報生成装置100の構成は、図9に示す構成に限られない。例えば、本発明の実施形態に係る情報生成装置100が外部装置において生成されたエッジ画像を処理する構成である場合(情報生成装置100が上記(A)の処理を行わない構成である場合)には、情報生成装置100は、画像処理部104を備えない構成であってもよい。上記の場合には、領域設定部106に外部装置が生成したエッジ画像が入力されることとなる。
【0109】
また、本発明の実施形態に係る情報生成装置100は、物体検出装置200に係る(d)の処理(評価処理)を行う評価部(後述する)を備えることによって、物体検出装置200として機能することもできる。
【0110】
[物体検出装置200]
図11は、本発明の実施形態に係る物体検出装置200の構成の一例を示すブロック図である。物体検出装置200は、記憶部202と、画像処理部204と、算出部206と、写像部208と、評価部210とを備える。
【0111】
また、物体検出装置200は、例えば、制御部(図示せず)、ROM(図示せず)や、RAM(図示せず)、ユーザが操作可能な操作部(図示せず)、各種画面を表示画面に表示する表示部(図示せず)、外部装置と通信を行うための通信部(図示せず)などを備えていてもよい。物体検出装置200は、例えば、データの伝送路としてのバスにより上記各構成要素間を接続する。
【0112】
ここで、制御部(図示せず)は、例えば、MPUや、各種処理回路などで構成され物体検出装置200全体を制御する。また、制御部(図示せず)は、例えば、画像処理部204、算出部206、写像部208、および評価部210の役目を果たすこともできる。
【0113】
ROM(図示せず)は、制御部(図示せず)が使用するプログラムや演算パラメータなどの制御用データを記憶する。RAM(図示せず)は、制御部(図示せず)により実行されるプログラムなどを一次記憶する。また、操作部(図示せず)としては、例えば、上述した操作入力デバイスが挙げられる。また、表示部(図示せず)としては、例えば、上述した表示デバイスが挙げられる。
【0114】
〔物体検出装置200のハードウェア構成例〕
物体検出装置200は、例えば、図10に示す情報生成装置100と同様のハードウェア構成を有する。上記構成をとる場合、物体検出装置200では、MPUが制御部(図示せず)としての役目を果たし、記録媒体が記憶部202としての役目を果たす。また、上記構成をとる場合、物体検出装置200では、操作入力デバイス160が操作部(図示せず)の役目を果たし、表示デバイス162が表示部(図示せず)の役目を果たす。また、上記構成をとる場合、物体検出装置200では、通信インタフェース164が通信部(図示せず)としての役目を果たす。なお、本発明の実施形態に係る物体検出装置200の構成が、図10に示す情報生成装置100と同様の構成に限られないことは、言うまでもない。
【0115】
記憶部202は、物体検出装置200が備える記憶手段である。ここで、記憶部202としては、例えば、ハードディスクなどの磁気記録媒体や、フラッシュメモリなどの不揮発性メモリなどが挙げられる。
【0116】
また、記憶部202は、例えば、検出対象画像や、領域情報、行列情報、および判別情報などの情報生成装置100が生成した検出用情報、アプリケーションなど、様々なデータを記憶する。ここで、図11では、検出対象画像220、…と、情報生成装置100から取得された領域情報132、行列情報134、および判別情報136とが、記憶部202に記憶されている例を示している。
【0117】
画像処理部204は、上記(a)の処理(画像前処理)を主導的に行う役目を果たす。より具体的には、画像処理部204は、記憶部102から検出対象画像データを読み出し、検出対象画像に基づいて、情報生成装置100の画像処理部104と同様にエッジ画像を生成する。
【0118】
算出部206は、上記(b)の処理(LBPに係る特徴量のヒストグラム算出処理)を主導的に行う役目を果たす。より具体的には、算出部206は、情報生成装置100の算出部108と同様に、エッジ画像に基づいて画素ごとにLBPに係る特徴量を算出する。また、算出部206は、記憶部202に記憶された領域情報に基づいて領域を設定し、情報生成装置100の算出部108と同様に、設定された領域ごとにLBPに係る特徴量のヒストグラムを算出する。なお、算出部206は、通信部(図示せず)を介して情報生成装置100と通信を行い、領域情報を情報生成装置100から適宜取得して処理を行ってもよい。
【0119】
写像部208は、上記(c)の処理(写像処理)を主導的に行う役目を果たす。より具体的には、写像部208は、算出部206が処理に用いた領域情報に対応する、記憶部202に記憶された行列情報に基づいて、算出部206において算出されたLBPに係る特徴量のヒストグラムを、より物体の認識が容易となる異なる空間へと写像する。なお、写像部208は、通信部(図示せず)を介して情報生成装置100と通信を行い、算出部206が処理に用いた領域情報に対応する行列情報を情報生成装置100から適宜取得して処理を行ってもよい。
【0120】
評価部210は、上記(d)の処理(評価処理)を主導的に行う役目を果たす。より具体的には、評価部210は、写像部208により写像された空間において、記憶部202に記憶された判別情報と、LBPに係る特徴量のヒストグラムとに基づいて、画像処理部204により生成された検出対象画像に基づくエッジ画像を評価する。なお、評価部210は、通信部(図示せず)を介して情報生成装置100と通信を行い、判別情報を情報生成装置100から適宜取得して処理を行ってもよい。
【0121】
また、評価部210は、例えば、評価結果(物体の検出結果)を表示部(図示せず)に表示させるなどによって物体検出装置200のユーザに通知する、および/または、評価結果を記憶部202に記録する。なお、評価部210は、例えば、物体検出装置200が備える他の処理部(図示せず)や外部装置などに評価結果を伝達して、当該他の処理部(図示せず)や外部装置などに当該評価結果に応じた処理を行わせてもよい。
【0122】
物体検出装置200は、例えば、図11に示す構成によって、本発明の実施形態に係る精度向上アプローチに係る(a)の処理(画像前処理)〜(d)の処理(評価処理)を実現することができる。したがって、物体検出装置200は、例えば図11に示す構成によって、従来の技術を用いる場合よりも、ローカルバイナリパターンを用いた物体の検出の精度をより向上させることができる。
【0123】
なお、本発明の実施形態に係る物体検出装置200の構成は、図11に示す構成に限られない。例えば、本発明の実施形態に係る物体検出装置200が外部装置において生成されたエッジ画像を処理する構成である場合(物体検出装置200が上記(a)の処理を行わない構成である場合)には、物体検出装置200は、画像処理部204を備えない構成であってもよい。上記の場合には、算出部206に外部装置が生成したエッジ画像が入力されることとなる。
【0124】
以上のように、本発明の実施形態では、情報生成装置100が、(A)の処理(画像前処理)〜(E)の処理(統計学習処理)を行うことにより画像に含まれる物体を検出するために用いられる検出用情報を生成する。ここで、情報生成装置100は、学習用画像を処理したエッジ画像に対して処理を行うので、輝度画像に対して処理を行う従来の技術を用いる場合よりもローカルバイナリパターンを用いた物体の検出の精度をより向上させることができる。また、情報生成装置100は、LBPに係る特徴量のヒストグラムをより物体の認識が容易となる異なる空間へと線形写像または非線形写像して、写像された空間においてブースティングによる統計学習を行うので、従来の技術を用いる場合よりもローカルバイナリパターンを用いた物体の検出の精度をより向上させることが可能である。
【0125】
したがって、情報生成装置100は、上記のように検出用情報を生成することによって、従来の技術を用いる場合よりも、ローカルバイナリパターンを用いた物体の検出の精度をより向上させることができる。
【0126】
また、本発明の実施形態では、物体検出装置200が、(a)の処理(画像前処理)〜(d)の処理(評価処理)を行うことにより、情報生成装置100が生成した検出用情報を用いて検出対象画像に対する物体の検出に係る処理を行う。したがって、従来の技術を用いる場合よりも物体の検出の精度をより向上させることが可能な検出用情報を用いて処理を行うので、物体検出装置200は、従来の技術を用いる場合よりも、ローカルバイナリパターンを用いた物体の検出の精度をより向上させることができる。
【0127】
以上、本発明の実施形態として情報生成装置100を挙げて説明したが、本発明の実施形態は、かかる形態に限られない。本発明の実施形態は、例えば、PC(Personal Computer)やサーバなどのコンピュータなど、様々な機器に適用することができる。
【0128】
また、本発明の実施形態として物体検出装置200を挙げて説明したが、本発明の実施形態は、かかる形態に限られない。本発明の実施形態は、例えば、PCやサーバなどのコンピュータ、携帯電話やPHS(Personal Handyphone System)などの携帯型通信装置、映像/音楽再生装置、映像/音楽記録再生装置、ゲーム機など、様々な機器に適用することができる。
【0129】
(本発明の実施形態に係るプログラム)
[情報生成装置100に係るプログラム]
コンピュータを、本発明の実施形態に係る情報生成装置として機能させるためのプログラムによって、エッジ画像に基づく検出用情報を生成することができる。したがって、コンピュータを、コンピュータを、本発明の実施形態に係る情報生成装置として機能させるためのプログラムによって、ローカルバイナリパターンを用いた物体の検出の精度をより向上させることができる。
【0130】
[物体検出装置200に係るプログラム]
コンピュータを、本発明の実施形態に係る物体検出装置として機能させるためのプログラムによって、情報生成装置100が生成した検出用情報を処理し、ローカルバイナリパターンを用いた物体の検出の精度をより向上させることができる。
【0131】
以上、添付図面を参照しながら本発明の好適な実施形態について説明したが、本発明は係る例に限定されないことは言うまでもない。当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
【0132】
例えば、図9では、情報生成装置100が、画像処理部104、領域設定部106、算出部108、写像部110、および統計学習部112とを備える構成を示したが、本発明の実施形態に係る情報生成装置の構成は、上記に限られない。例えば、本発明の実施形態に係る情報生成装置は、図9に示す画像処理部104、領域設定部106、算出部108、写像部110、および統計学習部112のうちの、(任意の)複数の構成要素を1つの部として備える(例えば、複数の部が有する機能を実現する処理回路を備える)こともできる。
【0133】
また、例えば、図11では、物体検出装置200が、画像処理部204、算出部206、写像部208、および評価部210とを備える構成を示したが、本発明の実施形態に係る物体検出装置の構成は、上記に限られない。例えば、本発明の実施形態に係る物体検出装置は、図11に示す画像処理部204、算出部206、写像部208、および評価部210のうちの、(任意の)複数の構成要素を1つの部として備える(例えば、複数の部が有する機能を実現する処理回路を備える)こともできる。
【0134】
さらに、上記では、コンピュータを、本発明の実施形態に係る情報生成装置、物体検出装置それぞれとして機能させるためのプログラム(コンピュータプログラム)が提供されることを示したが、本発明の実施形態は、さらに、上記プログラムを記憶させた記憶媒体も併せて提供することができる。
【0135】
上述した構成は、本発明の実施形態の一例を示すものであり、当然に、本発明の技術的範囲に属するものである。
【符号の説明】
【0136】
100 情報生成装置
102、202 記憶部
104、204 画像処理部
106 領域設定部
108、206 算出部
110、208 写像部
112 統計学習部
200 物体検出装置
210 評価部
【特許請求の範囲】
【請求項1】
画像に含まれる物体を検出するために用いられる検出用情報を生成するための画像のエッジ画像に基づいて、画素ごとにローカルバイナリパターンによる物体の輪郭を示す特徴量を算出し、設定された領域ごとに算出した前記特徴量のヒストグラムを算出する算出部と;
前記領域を設定し、設定した領域を示す領域情報を、前記検出用情報として生成する領域設定部と;
前記算出部において算出されたヒストグラムを線形写像または非線形写像により異なる空間に写像し、前記写像に応じた前記領域情報に対応する行列情報を、前記検出用情報として生成する写像部と;
前記写像部により写像された空間において、前記ヒストグラムを用いたブースティングによる物体検出の統計学習を行い、物体の検出結果を示す判別情報を、前記検出用情報として生成する統計学習部と;
を備える、情報生成装置。
【請求項2】
前記領域設定部は、前記エッジ画像内において、任意の位置に任意の大きさの領域を設定する、請求項1に記載の情報生成装置。
【請求項3】
前記写像部は、線形判別法により前記写像を行う、請求項1、または2のいずれか1項に記載の情報生成装置。
【請求項4】
前記写像部は、ロジスティック回帰分析により前記写像を行う、請求項1、または2のいずれか1項に記載の情報生成装置。
【請求項5】
前記写像部は、潜在意味解析により前記写像を行う、請求項1、または2のいずれか1項に記載の情報生成装置。
【請求項6】
物体の検出を行う検出対象画像のエッジ画像に基づいて、画素ごとにローカルバイナリパターンによる物体の輪郭を示す特徴量を算出し、画像に含まれる物体を検出するために用いられる検出用情報として情報生成装置が生成した領域情報が示す領域ごとに、算出した前記特徴量のヒストグラムを算出する算出部と;
前記検出用情報として前記情報生成装置が生成した前記領域情報に対応する行列情報に基づいて、前記算出部において算出されたヒストグラムを線形写像または非線形写像し、前記ヒストグラムを異なる空間に写像する写像部と;
前記写像部により写像された空間において、前記検出用情報として前記情報生成装置が生成した物体の判別のための判別情報と、前記ヒストグラムとに基づいて、前記判別情報が示す物体が前記検出対象画像に含まれているかを評価する評価部と;
を備える、物体検出装置。
【請求項7】
画像に含まれる物体を検出するために用いられる検出用情報を生成するための画像のエッジ画像に対して、ローカルバイナリパターンによる物体の輪郭を示す特徴量のヒストグラムを算出するための領域を設定するステップと;
前記領域を設定するステップにおいて設定した領域を示す領域情報を、前記検出用情報として生成するステップと;
前記エッジ画像に基づいて、画素ごとに前記特徴量を算出し、前記領域を生成するステップにおいて設定された領域ごとに算出した前記特徴量のヒストグラムを算出するステップと;
前記算出するステップにおいて算出されたヒストグラムを線形写像または非線形写像により異なる空間に写像するステップと;
前記写像するステップにおける前記写像に応じた前記領域情報に対応する行列情報を、前記検出用情報として生成するステップと;
前記写像するステップにおいて写像された空間において、前記ヒストグラムを用いたブースティングによる物体検出の統計学習を行い、物体の検出結果を示す判別情報を、前記検出用情報として生成するステップと;
を有する、情報生成方法。
【請求項8】
物体の検出を行う検出対象画像のエッジ画像に基づいて、画素ごとにローカルバイナリパターンによる物体の輪郭を示す特徴量を算出し、画像に含まれる物体を検出するために用いられる検出用情報として情報生成装置が生成した領域情報が示す領域ごとに、算出した前記特徴量のヒストグラムを算出するステップと;
前記検出用情報として前記情報生成装置が生成した前記領域情報に対応する行列情報に基づいて、前記算出するステップにおいて算出されたヒストグラムを線形写像または非線形写像し、前記ヒストグラムを異なる空間に写像するステップと;
前記写像するステップにより写像された空間において、前記検出用情報として前記情報生成装置が生成した物体の判別のための判別情報と、前記ヒストグラムとに基づいて、前記判別情報が示す物体が前記検出対象画像に含まれているかを評価するステップと;
を有する、物体検出方法。
【請求項9】
画像に含まれる物体を検出するために用いられる検出用情報を生成するための画像のエッジ画像に対して、ローカルバイナリパターンによる物体の輪郭を示す特徴量のヒストグラムを算出するための領域を設定するステップ;
前記領域を設定するステップにおいて設定した領域を示す領域情報を、前記検出用情報として生成するステップ;
前記エッジ画像に基づいて、画素ごとに前記特徴量を算出し、前記領域を生成するステップにおいて設定された領域ごとに算出した前記特徴量のヒストグラムを算出するステップ;
前記算出するステップにおいて算出されたヒストグラムを線形写像または非線形写像により異なる空間に写像するステップ;
前記写像するステップにおける前記写像に応じた前記領域情報に対応する行列情報を、前記検出用情報として生成するステップ;
前記写像するステップにおいて写像された空間において、前記ヒストグラムを用いたブースティングによる物体検出の統計学習を行い、物体の検出結果を示す判別情報を、前記検出用情報として生成するステップ;
をコンピュータに実行させるためのプログラム。
【請求項10】
物体の検出を行う検出対象画像のエッジ画像に基づいて、画素ごとにローカルバイナリパターンによる物体の輪郭を示す特徴量を算出し、画像に含まれる物体を検出するために用いられる検出用情報として情報生成装置が生成した領域情報が示す領域ごとに、算出した前記特徴量のヒストグラムを算出するステップ;
前記検出用情報として前記情報生成装置が生成した前記領域情報に対応する行列情報に基づいて、前記算出するステップにおいて算出されたヒストグラムを線形写像または非線形写像し、前記ヒストグラムを異なる空間に写像するステップ;
前記写像するステップにより写像された空間において、前記検出用情報として前記情報生成装置が生成した物体の判別のための判別情報と、前記ヒストグラムとに基づいて、前記判別情報が示す物体が前記検出対象画像に含まれているかを評価するステップ;
をコンピュータに実行させるためのプログラム。
【請求項1】
画像に含まれる物体を検出するために用いられる検出用情報を生成するための画像のエッジ画像に基づいて、画素ごとにローカルバイナリパターンによる物体の輪郭を示す特徴量を算出し、設定された領域ごとに算出した前記特徴量のヒストグラムを算出する算出部と;
前記領域を設定し、設定した領域を示す領域情報を、前記検出用情報として生成する領域設定部と;
前記算出部において算出されたヒストグラムを線形写像または非線形写像により異なる空間に写像し、前記写像に応じた前記領域情報に対応する行列情報を、前記検出用情報として生成する写像部と;
前記写像部により写像された空間において、前記ヒストグラムを用いたブースティングによる物体検出の統計学習を行い、物体の検出結果を示す判別情報を、前記検出用情報として生成する統計学習部と;
を備える、情報生成装置。
【請求項2】
前記領域設定部は、前記エッジ画像内において、任意の位置に任意の大きさの領域を設定する、請求項1に記載の情報生成装置。
【請求項3】
前記写像部は、線形判別法により前記写像を行う、請求項1、または2のいずれか1項に記載の情報生成装置。
【請求項4】
前記写像部は、ロジスティック回帰分析により前記写像を行う、請求項1、または2のいずれか1項に記載の情報生成装置。
【請求項5】
前記写像部は、潜在意味解析により前記写像を行う、請求項1、または2のいずれか1項に記載の情報生成装置。
【請求項6】
物体の検出を行う検出対象画像のエッジ画像に基づいて、画素ごとにローカルバイナリパターンによる物体の輪郭を示す特徴量を算出し、画像に含まれる物体を検出するために用いられる検出用情報として情報生成装置が生成した領域情報が示す領域ごとに、算出した前記特徴量のヒストグラムを算出する算出部と;
前記検出用情報として前記情報生成装置が生成した前記領域情報に対応する行列情報に基づいて、前記算出部において算出されたヒストグラムを線形写像または非線形写像し、前記ヒストグラムを異なる空間に写像する写像部と;
前記写像部により写像された空間において、前記検出用情報として前記情報生成装置が生成した物体の判別のための判別情報と、前記ヒストグラムとに基づいて、前記判別情報が示す物体が前記検出対象画像に含まれているかを評価する評価部と;
を備える、物体検出装置。
【請求項7】
画像に含まれる物体を検出するために用いられる検出用情報を生成するための画像のエッジ画像に対して、ローカルバイナリパターンによる物体の輪郭を示す特徴量のヒストグラムを算出するための領域を設定するステップと;
前記領域を設定するステップにおいて設定した領域を示す領域情報を、前記検出用情報として生成するステップと;
前記エッジ画像に基づいて、画素ごとに前記特徴量を算出し、前記領域を生成するステップにおいて設定された領域ごとに算出した前記特徴量のヒストグラムを算出するステップと;
前記算出するステップにおいて算出されたヒストグラムを線形写像または非線形写像により異なる空間に写像するステップと;
前記写像するステップにおける前記写像に応じた前記領域情報に対応する行列情報を、前記検出用情報として生成するステップと;
前記写像するステップにおいて写像された空間において、前記ヒストグラムを用いたブースティングによる物体検出の統計学習を行い、物体の検出結果を示す判別情報を、前記検出用情報として生成するステップと;
を有する、情報生成方法。
【請求項8】
物体の検出を行う検出対象画像のエッジ画像に基づいて、画素ごとにローカルバイナリパターンによる物体の輪郭を示す特徴量を算出し、画像に含まれる物体を検出するために用いられる検出用情報として情報生成装置が生成した領域情報が示す領域ごとに、算出した前記特徴量のヒストグラムを算出するステップと;
前記検出用情報として前記情報生成装置が生成した前記領域情報に対応する行列情報に基づいて、前記算出するステップにおいて算出されたヒストグラムを線形写像または非線形写像し、前記ヒストグラムを異なる空間に写像するステップと;
前記写像するステップにより写像された空間において、前記検出用情報として前記情報生成装置が生成した物体の判別のための判別情報と、前記ヒストグラムとに基づいて、前記判別情報が示す物体が前記検出対象画像に含まれているかを評価するステップと;
を有する、物体検出方法。
【請求項9】
画像に含まれる物体を検出するために用いられる検出用情報を生成するための画像のエッジ画像に対して、ローカルバイナリパターンによる物体の輪郭を示す特徴量のヒストグラムを算出するための領域を設定するステップ;
前記領域を設定するステップにおいて設定した領域を示す領域情報を、前記検出用情報として生成するステップ;
前記エッジ画像に基づいて、画素ごとに前記特徴量を算出し、前記領域を生成するステップにおいて設定された領域ごとに算出した前記特徴量のヒストグラムを算出するステップ;
前記算出するステップにおいて算出されたヒストグラムを線形写像または非線形写像により異なる空間に写像するステップ;
前記写像するステップにおける前記写像に応じた前記領域情報に対応する行列情報を、前記検出用情報として生成するステップ;
前記写像するステップにおいて写像された空間において、前記ヒストグラムを用いたブースティングによる物体検出の統計学習を行い、物体の検出結果を示す判別情報を、前記検出用情報として生成するステップ;
をコンピュータに実行させるためのプログラム。
【請求項10】
物体の検出を行う検出対象画像のエッジ画像に基づいて、画素ごとにローカルバイナリパターンによる物体の輪郭を示す特徴量を算出し、画像に含まれる物体を検出するために用いられる検出用情報として情報生成装置が生成した領域情報が示す領域ごとに、算出した前記特徴量のヒストグラムを算出するステップ;
前記検出用情報として前記情報生成装置が生成した前記領域情報に対応する行列情報に基づいて、前記算出するステップにおいて算出されたヒストグラムを線形写像または非線形写像し、前記ヒストグラムを異なる空間に写像するステップ;
前記写像するステップにより写像された空間において、前記検出用情報として前記情報生成装置が生成した物体の判別のための判別情報と、前記ヒストグラムとに基づいて、前記判別情報が示す物体が前記検出対象画像に含まれているかを評価するステップ;
をコンピュータに実行させるためのプログラム。
【図1A】
【図1B】
【図2】
【図3A】
【図3B】
【図4A】
【図4B】
【図4C】
【図4D】
【図4E】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図1B】
【図2】
【図3A】
【図3B】
【図4A】
【図4B】
【図4C】
【図4D】
【図4E】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【公開番号】特開2011−186595(P2011−186595A)
【公開日】平成23年9月22日(2011.9.22)
【国際特許分類】
【出願番号】特願2010−49037(P2010−49037)
【出願日】平成22年3月5日(2010.3.5)
【出願人】(000002185)ソニー株式会社 (34,172)
【Fターム(参考)】
【公開日】平成23年9月22日(2011.9.22)
【国際特許分類】
【出願日】平成22年3月5日(2010.3.5)
【出願人】(000002185)ソニー株式会社 (34,172)
【Fターム(参考)】
[ Back to top ]