説明

目的物検出装置および目的物検出方法

【課題】少ない演算量と小さな回路規模で、画像データにおける目的物の検出を効率的かつ精度良く行うこと。
【解決手段】画像データにおける部分領域を特徴検出のために切り出すスキャンウインドウSWに関する要件を設定するスキャンウインドウ設定部52と、走査のためにスキャンウインドウの位置を順次に制御するスキャンウインドウ制御部51と、スキャンウインドウに含まれる画像データ部分領域から少なくとも1種類の特徴を検出し、その特徴値から検出結果の信頼度R1を算出する特徴検出・検出結果信頼度算出部53と、複数位置のスキャンウインドウでそれぞれの検出特徴値から算出された検出結果の信頼度の組み合わせに基づいて、目的物がその画像データに含まれている確からしさを表す検出対象包含の信頼度R2を算出する包含信頼度算出部55と、検出対象包含の信頼度に基づいて画像データにおける目的物を検出する目的物検出部56を備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像データの中から目的物(被写体データ)を検出する目的物検出装置および目的物検出方法にかかわり、詳しくは、目的物検出の判定の精度の向上と処理効率の向上とを両立させるための技術に関する。
【背景技術】
【0002】
従来より、連続的に撮像された画像を利用して人物の脚部を検出し、前回検出された検出対象領域と身体の位置に応じて定められる所定位置から身体を検出する人物検出システムが知られている(例えば特許文献1参照)。
【0003】
また、検出対象領域から複数の局所パターンを抽出し、抽出された局所パターンからそれぞれの局所特徴量を抽出し、局所特徴量の組み合わせに基づいて人物の上半身を検出する手法が知られている(例えば特許文献2参照)。
【0004】
また、検出対象領域を部分領域毎に分割し、部分領域毎に特徴を検出し、部分領域毎の特徴から顔らしさを検出するシステムが知られている(例えば特許文献3参照)。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2008−288684号公報
【特許文献2】特開2009−221311号公報
【特許文献3】特開2006−12130号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかし、特許文献1に記載の技術では、異なるフレーム間で脚部位置を参照する必要があるため、脚部位置の記憶用に大きな記憶容量が必要になる。さらに、同一フレーム内で処理を完結する構成でも、脚部位置から上半身位置を推定するための検出対象領域を再設定するオーバーヘッドが発生する、という問題がある。
【0007】
また、特許文献2に記載の技術では、顔全体を包含する検出対象領域から局所パターンを抽出する構成となっており、検出対象領域を表現するために検出処理には使用されないデータの記憶領域を余分に必要とする。
【0008】
さらに、より複雑な物体を検出対象の目的物とした場合には、より多数の局所パターンが必要となり、例えば特許文献2に開示されている特徴量であるエッジパターン等を繰り返して大量に算出しなければならない、という問題がある。
【0009】
また、特許文献3に記載の技術では、分割された複数の部分領域において、ある部分領域が他の部分領域に完全に包含される状態となっており、検出を行うための演算処理において無駄な処理が発生する、という問題がある。
【0010】
本発明は、このような事情に鑑みて創作したものであり、目的物検出の判定の精度の向上と処理効率の向上とを両立できるようにすることを目的としている。
【課題を解決するための手段】
【0011】
本発明は、次のような手段を講じることにより上記の課題を解決する。《1》,《2》,《3》…等の括弧付き数字は〔特許請求の範囲〕の請求項番号と呼応するが、説明の都合上、以下の記載においては必ずしも通し番号とはならず、順番が飛んだり前後が入れ替わったりする場合がある。
【0012】
《1》画像データにおいて被写体人物などの目的物(被写体データ)を検出する目的物検出装置において、画像データにおける部分領域を切り出す機能としてスキャンウインドウ(探索枠)を考える。これは、画像データからある大きさの領域を切り出すための枠である。このスキャンウインドウを画像データの2次元的広がりの中で2次元的に走査する。スキャンウインドウを走査しながら、個々の走査位置のスキャンウインドウにおいて、それに含まれる部分画像の画素値に基づいて特徴を検出し、さらにその検出した特徴値から検出結果の信頼度を算出する。この検出結果の信頼度は、個々の走査位置におけるスキャンウインドウに該当する画像データが目的物の部分領域に対応していることの確からしさを示す。この検出結果の信頼度が高いほどその部分画像データが目的物の部分領域に対応している確度が高いものとなる。さらに、走査される一連のスキャンウインドウそれぞれでの検出結果の信頼度に基づいて目的物の全領域がその画像データに含まれている確からしさを表す検出対象包含の信頼度を算出する。そして、検出対象包含の信頼度に基づいて目的物の検出の判定、つまり画像データに目的物が存在しているか否かの判定を行う。
【0013】
上記の一連の処理を実行させるため、本発明の目的物検出装置は、それぞれ次のように構成されたスキャンウインドウ設定手段、スキャンウインドウ制御手段、特徴検出・検出結果信頼度算出手段、包含信頼度算出手段および目的物検出手段を備えて構成されている。
【0014】
外部からの画像データの入力の形態については、撮像装置に直結されて撮像で得られた画像データを撮像装置から入力する形態でもよいし、撮像装置とは切り離されたもので、画像データを記録している記録装置から読み出した画像データを入力する形態でもよい。
【0015】
外部から入力した画像データにおける部分領域を特徴検出のために切り出す枠がスキャンウインドウであるが、上記のスキャンウインドウ設定手段は、スキャンウインドウに関する要件(サイズ、初期位置、スキップ量、走査方向、走査態様など)を設定するものとして構成されている。
【0016】
上記のスキャンウインドウ制御手段は、画像データにおけるスキャンウインドウの走査のためにスキャンウインドウ設定手段の設定によるスキャンウインドウの位置を順次に制御するものとして構成されている。スキャンウインドウ制御手段によってスキャンウインドウの位置を順次に制御することにより、スキャンウインドウを原則として画像データの全域で走査する。
【0017】
上記の特徴検出・検出結果信頼度算出手段は、スキャンウインドウ制御手段による走査中の各位置におけるスキャンウインドウに含まれる画像データ部分領域から少なくとも1種類の特徴を検出するとともに、その検出した特徴値から検出結果の信頼度を算出するものとして構成されている。この検出結果の信頼度は、スキャンウインドウ内の画像データが目的物の部分領域に対応していることの検出についての確からしさを示すものである。
【0018】
上記の包含信頼度算出手段は、走査によって展開される複数位置のスキャンウインドウでそれぞれの検出特徴値から算出された検出結果の信頼度の組み合わせに基づいて、目的物がその画像データに含まれている確からしさを表す検出対象包含の信頼度を算出するものとして構成されている。
【0019】
上記の目的物検出手段は、包含信頼度算出手段により算出された検出対象包含の信頼度に基づいて画像データにおける目的物の存在の有無を判定するものとして構成されている。
【0020】
上記構成による作用は次のとおりである。演算の基になる特徴値の検出は、スキャンウインドウにおいて行われる。そのスキャンウインドウは2次元的な走査によって画像データの全領域(原則)をカバーするものである。したがって、スキャンウインドウの大きさは画像データ全領域の大きさに比べて充分に小さいものですむ。その結果として、特徴値検出のための記憶領域の容量は比較的少ないものでよいことになる。
【0021】
また、スキャンウインドウを走査しながら一連の処理を行うので、目的物検出の処理効率が高いものとなる。
【0022】
さらに、画像データにおける検出対象包含の信頼度は、複数位置のスキャンウインドウでそれぞれの検出特徴値から算出された検出結果の信頼度の組み合わせに基づいて算出されるから、スキャンウインドウのための記憶容量を削減しながら、目的物検出の判定の精度を比較的高いものにすることが可能となる。
【0023】
また、スキャンウインドウ該当の画像データに対する記憶容量が少ないので、処理効率も比較的高いものとすることが可能となる。
【0024】
《34》上記《1》の構成の目的物検出装置にかかわる発明をカメラにおいて、次のように展開することが可能である。すなわち、本発明によるカメラは、光学レンズを介して入射した被写体光を受光して撮像信号に変換して出力する撮像素子と、前記撮像素子から出力される撮像信号から輝度信号または色信号のうち少なくとも1種類を生成するYC処理部と、前記YC処理部による前記輝度信号または色信号のうち少なくとも1種類を用いて目的物検出を行うもので上記《1》の目的物検出装置とを備えたものである。なお、本項の技術内容は、後述する《2》〜《33》にも適用可能である。
【0025】
《35》上記《1》の構成の目的物検出装置にかかわる発明を目的物検出方法において、次のように展開することが可能である。すなわち、本発明による目的物検出方法は、外部から画像データを入力するステップと、前記入力画像データにおける部分領域を特徴検出のために切り出すスキャンウインドウに関する要件を設定するステップと、画像データにおけるスキャンウインドウの走査のために前記の設定によるスキャンウインドウの位置を順次に制御するステップと、走査中の各位置におけるスキャンウインドウに含まれる画像データ部分領域から少なくとも1種類の特徴を検出するとともに、その検出した特徴値から検出結果の信頼度を算出するステップと、走査によって展開される複数位置のスキャンウインドウでそれぞれの検出特徴値から算出された検出結果の信頼度の組み合わせに基づいて、目的物がその画像データに含まれている確からしさを表す検出対象包含の信頼度を算出するステップと、前記検出対象包含の信頼度に基づいて画像データにおける目的物を検出するステップとを備える。
【発明の効果】
【0026】
本発明によれば、特徴値検出を行うスキャンウインドウを走査しながら個々の走査位置において検出結果の信頼度を算出するように構成してあるので、特徴値検出・検出結果信頼度算出のための記憶容量の削減と処理効率の向上とを図ることができる。さらに、検出対象包含の信頼度を複数位置のスキャンウインドウで得られた検出結果の信頼度の組み合わせに基づいて算出するので、高い検出結果の信頼度を確保することができる。すなわち、従来ではむずかしいとされていた検出結果の信頼度の向上と処理効率の向上とを両立させることができるようになった。
【図面の簡単な説明】
【0027】
【図1】本発明の実施例にかかわる目的物検出装置を搭載したデジタルビデオカメラの構成を示すブロック図
【図2】本発明実施例のデジタルビデオカメラの人物検出部およびその周辺の詳細な構成を示すブロック図
【図3】本発明実施例のデジタルビデオカメラの正立時の撮影とイメージセンサ走査の関係を示す図
【図4】本発明実施例のデジタルビデオカメラの正立時のスキャンウインドウ走査の説明図
【図5】本発明実施例におけるスキャンウインドウ上のアドレスと選択されたデータの関係を示す図
【図6】本発明実施例におけるスキャンウインドウと検出対象である目的物の関係を示す図
【図7】本発明実施例におけるスキャンウインドウ走査による目的物の検出の説明図
【図8】本発明実施例におけるスキャンウインドウと目的物の位置の関係を示す図
【図9】本発明実施例におけるスキャンウインドウと演算並列度の処理時間の関係を示す図およびスキャンウインドウ位置と目的物の関係を示す図
【図10】本発明実施例におけるスキャンウインドウの走査密度の説明図(その1)
【図11】本発明実施例におけるスキャンウインドウの走査密度の説明図(その2)
【図12】本発明実施例におけるスキャンウインドウの走査密度の説明図(その3)
【図13】本発明実施例におけるスキャンウインドウの走査密度の説明図(その4)
【図14】本発明実施例におけるスキャンウインドウの走査方法の説明図(その1)
【図15】本発明実施例におけるスキャンウインドウの走査方法の説明図(その2)
【図16】本発明実施例におけるスキャンウインドウの走査方法の説明図(その3)
【図17】本発明実施例のデジタルビデオカメラの右90度回転時の撮影とイメージセンサ走査の関係を示す図
【図18】本発明実施例のデジタルビデオカメラの右90度回転時のスキャンウインドウ走査の説明図
【図19】本発明実施例のデジタルビデオカメラの左90度回転時の撮影とイメージセンサ走査の関係を示す図
【図20】本発明実施例のデジタルビデオカメラの左90度回転時のスキャンウインドウ走査の説明図
【図21】本発明実施例のデジタルビデオカメラの180度回転時の撮影とイメージセンサ走査の関係を示す図
【図22】本発明実施例のデジタルビデオカメラの180度回転時のスキャンウインドウ走査の説明図
【図23】本発明実施例のデジタルビデオカメラの回転状態とスキャンウインドウに入力されるデータ例の説明図
【図24】本発明実施例の検出対象である目的物が非検出対象により隠れている例の説明図
【図25】本発明実施例の顔を目的物としたときのスキャンウインドウと目的物の関係を示す図
【発明を実施するための形態】
【0028】
上記した《1》の構成の本発明の目的物検出装置は、次のような実施の形態においてさらに有利に展開することが可能である。
【0029】
《2》上記《1》の構成の目的物検出装置における前記のスキャンウインドウ設定手段については、スキャンウインドウとして画像データ上で目的物の画像の大きさよりも小さい大きさのスキャンウインドウを設定するように構成されているというのが一般的態様である。
【0030】
《3》上記《1》,《2》の構成の目的物検出装置における前記のスキャンウインドウ制御手段については、スキャンウインドウの近接するものどうしを、重なり領域を持つ状態で配置することは好ましい態様である。もし、重なり領域がなければ、特徴検出・検出結果信頼度算出手段による特徴値の抽出において見落としが生じる可能性がある。これに対して上記のように重なり領域をもつ構成にすれば、特徴検出・検出結果信頼度算出手段による特徴値からの検出結果の信頼度の算出の精度が高いものとなり、ひいては検出結果の信頼度の組み合わせに基づく検出対象包含の信頼度の算出の精度がアップし、最終的に目的物検出手段による目的物検出の判定の精度が向上する。
【0031】
《4》目的物は、その一部領域(部分領域)がスキャンウインドウ内に位置する。スキャンウインドウ内に位置することになる目的物は、目的物の全領域ではなく、目的物の部分領域である。目的物は、それ自体がいくつかの領域からなり、個々の領域にはそれぞれの特徴がある。特徴検出・検出結果信頼度算出手段は、スキャンウインドウ内に位置する目的物のある領域の特徴を検出し、検出結果の信頼度を算出する。スキャンウインドウには目的物が複数存在していることもある。ある目的物がスキャンウインドウ内に位置する部分領域は、他の目的物がスキャンウインドウ内に位置する部分領域と同じこともあれば、異なることもある。一例を挙げると、あるスキャンウインドウに、人物Aの頭部が存在しかつ人物Bの頭部が存在する場合があり、あるいは、あるスキャンウインドウに、人物Aの頭部が存在しかつ人物Bの胸部が存在する場合もある。前者の場合は、検出される特徴は両人物とも頭部で同じということになり、後者の場合は、検出される特徴は一方の人物は頭部であり、別の人物は胸部であり、両人物で相違することになる。
【0032】
このような場合を想定して、上記の特徴検出・検出結果信頼度算出手段は、個々の走査位置のスキャンウインドウにおいて、目的物の互いに異なる複数の領域対応の特徴をすべて検出対象として検出を行うものとする。この複数の特徴をすべて検出対象として検出を行う方式に2種類がある。本項《4》と次項《5》である。
【0033】
本項では、目的物の互いに異なる複数の領域対応の特徴をすべて検出対象として検出を行うに際して、特徴ごとに互いにタイミングを異にして検出するものとして構成する。すなわち、個々の走査位置のスキャンウインドウにおいて、そのスキャンウインドウが展開されている時間帯を特徴の種類数に応じて複数に分割し、ある時間帯においてはある1つの特徴の検出を行い、別の時間帯においては別の1つの特徴の検出を行う。
【0034】
要するに本項の目的物検出装置は、上記《1》〜《3》の構成の目的物検出装置における前記の特徴検出・検出結果信頼度算出手段について、この手段は、個々の走査位置のスキャンウインドウにおいて、そのスキャンウインドウが展開されている時間帯を特徴の種類数に応じて複数に分割し、目的物の互いに異なる複数の部分領域にそれぞれ対応する特徴を互いにタイミングを異にして検出するとともに、その検出した複数の特徴値それぞれにつき検出結果の信頼度を算出するように構成されているというものである。このように構成すれば、1つのスキャンウインドウで複数の特徴値、検出結果の信頼度を順次に得ればよいので、並列度が低く処理速度が遅いものの、その順次処理ゆえに処理に要する記憶容量が相対的に少なくてすみ、回路規模を小さくすることが可能となる。なお、本項の構成については、後述する実施例における図9(a)を参照することができる。
【0035】
《5》本項は、上記の《4》で説明したような場合を想定して、特徴検出・検出結果信頼度算出手段は、個々の走査位置のスキャンウインドウにおいて、そのスキャンウインドウが展開されている時間帯を《4》のように特徴の種類数に応じて複数に分割するのではなく、その時間帯の全体を用いて、複数種類の特徴のうちのすべての種類の特徴を検出するようにし、別のスキャンウインドウでも、その時間帯の全体を用いて、すべての種類の特徴を検出する。
【0036】
要するに本項の目的物検出装置は、上記《1》〜《3》の構成の目的物検出装置における前記の特徴検出・検出結果信頼度算出手段について、この手段は、個々の走査位置のスキャンウインドウにおいて、そのスキャンウインドウが展開されている時間帯の全体を用いて、複数種類の特徴のうちのすべての種類の特徴を同時並列的に検出するとともに、その検出した複数の特徴値それぞれにつき検出結果の信頼度を算出するように構成されているというものである。このように構成すれば、個々の走査位置のスキャンウインドウにおいて、毎回すべての種類の特徴値、検出結果の信頼度を同一タイミングで得るので、並列度が高くて処理に要する記憶容量が相対的に多く回路規模が大きくなるものの、その同時処理ゆえに処理速度を相対的に速いものにすることが可能となる。なお、本項の構成については、後述する実施例における図9(b)を参照することができる。
【0037】
《6》ある位置のスキャンウインドウにおいて、算出された検出結果の信頼度が、本来の目的物であれば期待できる検出結果の信頼度に比べて大幅に低い値を示すのであれば、そのスキャンウインドウでの目的物検出は実質的に失敗すると推定される。このような場合には、その検出動作を中止してもよいはずである。なお、これについては、後述する実施例の場合の図24を用いた説明を参照することができる。
【0038】
そこで、上記《1》〜《5》の構成の目的物検出装置における前記の特徴検出・検出結果信頼度算出手段については、走査中の任意の位置におけるスキャンウインドウでの検出特徴値から算出した検出結果の信頼度の低さによっては、その特徴検出・検出結果信頼度算出の動作を中止するように構成する。このように構成すれば、実行中の処理が無駄な処理でないかの判断を通じて無駄な処理を抑制するため、処理効率を向上させることが可能となる。
【0039】
《7》ある位置のスキャンウインドウで例えば人物の頭部領域を検出したとすると、続く直後のスキャンウインドウには脚部領域は存在しないのが普通である。このような場合には、その検出動作を中止してもよいはずである。
【0040】
そこで、上記《1》〜《5》の構成の目的物検出装置における前記の特徴検出・検出結果信頼度算出手段については、走査中の任意の位置におけるスキャンウインドウでの検出特徴値から算出した検出結果の信頼度の高さによっては、後続のスキャンウインドウでの特徴検出・検出結果信頼度算出の動作を中止するように構成する。このように構成すれば、次に実行する処理が無駄な処理にならないかの判断を通じて無駄な処理を抑制するため、処理効率を向上させることが可能となる。
【0041】
《8》上記《7》の発展形として、次のような構成も有効である。上記《7》では、後続のスキャンウインドウでの特徴検出・検出結果信頼度算出の動作を中止する要件について、原則的な考え方として、単一のスキャンウインドウでの検出結果の信頼度の高さが一定以上であることを要件とするものである。これに対して、本項では、単一のスキャンウインドウでの検出結果の信頼度に代えて、複数のスキャンウインドウでの検出結果の信頼度についての総合結果を用いるものである。例えば、脚部領域は顔領域の直下でも存在しないのが普通であり、このような場合に脚部領域の検出動作を中止させるに当たって、頭部領域単一のスキャンウインドウでの検出結果の信頼度だけでなく、目部や鼻部や口部など別の領域を含む複数のスキャンウインドウでの検出結果の信頼度をも加味して、その総合の信頼度が一定以上に高ければ、続く直後のスキャンウインドウでは脚部領域の検出動作を中止する。このように構成すれば、後続のスキャンウインドウでの特徴検出・検出結果信頼度算出の動作を中止する処理の信頼性を向上させることが可能となる。
【0042】
《9》包含信頼度算出手段は、複数位置のスキャンウインドウでそれぞれの検出特徴値から算出された検出結果の信頼度の組み合わせに基づいて検出対象包含の信頼度を算出するものであるが、本項《9》以下《17》までは、検出対象包含の信頼度を算出する際の複数の検出結果の信頼度の組み合わせの態様を検討する。
【0043】
本項では、上記《1》〜《8》の構成の目的物検出装置における前記の包含信頼度算出手段については、走査中の各位置におけるスキャンウインドウで特徴検出・検出結果信頼度算出手段によって検出される複数の検出結果の信頼度の総和をもって検出対象包含の信頼度とする。総和は最も基本的な計算手法である。
【0044】
《10》上記《1》〜《8》の構成の目的物検出装置における前記の包含信頼度算出手段については、走査中の各位置におけるスキャンウインドウで特徴検出・検出結果信頼度算出手段によって検出される複数の検出結果の信頼度にそれぞれ重み付けをした総和をもって検出対象包含の信頼度としてもよい。なお、これについては、後述する実施例での式(1)を参照することができる。その式で重み付けの係数につき、α=β=γ=δ=ζ=1とすると、上記《9》場合の例になる。重み付けをした総和を用いると、目的物の複数の部分領域につき、それぞれに重要度(優先度)を設定して、目的物検出の合理性ないし検出結果の信頼度の向上を図ることが可能となる。例えば、目的物が人物の場合に、頭部の重み係数は高めに設定し、腹部の重み係数は低めに設定するといった具合である。
【0045】
《11》上記《10》の構成の目的物検出装置における前記の包含信頼度算出手段に関しては、複数の検出結果の信頼度に付する重みについて、撮影シーンに応じて重みを変更可能に構成されているという態様がある。
【0046】
《12》さらに、上記の《11》における前記の包含信頼度算出手段は、撮影シーンに応じた重みの変更について、手動にて前記重みを変更可能に構成されているという態様がある。例えば、街中で歩行中の人物を映している撮影シーンにおいて立ち姿勢の人物を探索する場合と、劇場などで椅子に座っている人物を映している撮影シーンにおいて座り姿勢の人物を探索する場合とで、それぞれに適した重みを設定すれば、合理的で効率の良い処理が期待される。
【0047】
《13》あるいは、上記の《11》における前記の包含信頼度算出手段は、撮影シーンに応じた重みの変更について、自動にてYC信号から撮影シーンを取得し、取得した撮影シーンに基づいて重みを調整するように構成されているという態様がある。
【0048】
《14》上記《1》〜《8》の構成の目的物検出装置における前記の包含信頼度算出手段については、走査中の各位置におけるスキャンウインドウで特徴検出・検出結果信頼度算出手段によって検出される複数の検出結果の信頼度のうちの最大の検出結果の信頼度をもって検出対象包含の信頼度としてもよい。このように構成すれば、目的物存在が間違いない状況では、目的物検出の判定において必ず肯定的結論を出す。すなわち、目的物が存在するにもかかわらず存在していないと誤判定してしまうことを確実に防止することが可能となる。
【0049】
《15》上記《1》〜《8》の構成の目的物検出装置における前記の包含信頼度算出手段については、走査中の各位置におけるスキャンウインドウで特徴検出・検出結果信頼度算出手段によって検出される複数の検出結果の信頼度のうちの最小の検出結果の信頼度をもって検出対象包含の信頼度としてもよい。このように構成すれば、目的物が存在しないにもかかわらず存在していると誤判定してしまうことを確実に防止することが可能となる。
【0050】
《16》上記《1》〜《8》の構成の目的物検出装置における前記の包含信頼度算出手段については、走査中の各位置におけるスキャンウインドウで特徴検出・検出結果信頼度算出手段によって検出される複数の検出結果の信頼度のうちの中間の検出結果の信頼度をもって検出対象包含の信頼度としてもよい。このように構成すれば、極端なデータを排除することを通じて、ノイズ等の外乱等による誤判定を軽減することが可能となる。
【0051】
《17》上記《1》〜《8》の構成の目的物検出装置における前記の包含信頼度算出手段については、走査中の各位置におけるスキャンウインドウで特徴検出・検出結果信頼度算出手段によって検出される複数の検出結果の信頼度のうちの最大と最小のものを除いた残りの検出結果の信頼度にそれぞれ重み付けをした総和をもって検出対象包含の信頼度としてもよい。このように構成すれば、上記の《16》に比べて演算量は増加するものの、ノイズ等の外乱等による誤判定をさらに軽減することが可能となる。
【0052】
《18》上記《1》〜《17》の構成の目的物検出装置における目的物検出手段は、包含信頼度算出手段による検出対象包含の信頼度に基づいて画像データにおける目的物を検出するものであるが、より詳しくは、検出対象包含の信頼度をある閾値と比較することにより目的物検出の成否の判定を行うとするのが好ましい。これは、目的物検出の成否を判定する上で最も簡単な方式の1つである。
【0053】
《19》上記《18》の構成の目的物検出装置における前記の目的物検出手段に関しては、検出対象包含の信頼度に対する比較基準としての閾値について、撮影シーンに応じて閾値を変更可能に構成されているという態様がある。例えば、繁華街やショッピングセンターなど人間が大勢いる撮影シーンでは閾値を低めに設定し、サバンナなど猛獣が出没するために人間はほとんどいないような撮影シーンでは閾値を高めに設定するといった具合である。閾値を低めに設定すれば人間を検知する可能性が増し、また閾値を高めに設定すれば人間を検知する可能性が小さくなる。このようにそれぞれの撮影シーンに適した閾値を設定すれば、合理的で効率の良い処理が期待される。
【0054】
《20》さらに、上記の《19》における前記の目的物検出手段は、検出対象包含の信頼度に対する比較基準としての閾値の変更について、手動にて閾値を変更可能に構成されているという態様がある。
【0055】
《21》あるいは、上記の《19》における前記の目的物検出手段は、検出対象包含の信頼度に対する比較基準としての閾値の変更について、自動にてYC信号から撮影シーンを取得し、取得した撮影シーンに基づいて閾値を調整するように構成されているという態様がある。
【0056】
《22》上記《1》〜《18》の構成の目的物検出装置における前記のスキャンウインドウ制御手段は、画像データにおけるスキャンウインドウの走査のためにスキャンウインドウ設定手段の設定によるスキャンウインドウの位置を順次に制御するものであるが、より詳しくは、画像データにおけるスキャンウインドウの走査を画像の垂直方向において行うとするのが好ましい。スキャンウインドウを画像の水平方向に細長い短冊状とするのが一般的であるが、この場合にはスキャンウインドウを垂直に走査するのが合理的である。
【0057】
《23》上記《1》〜《22》の構成の目的物検出装置における前記のスキャンウインドウ設定手段は、入力画像データにおける部分領域を特徴検出のために切り出すスキャンウインドウに関する要件を設定するものであるが、より詳しくは、スキャンウインドウの設定において、画像データにおける目的物の全体を囲む大きさの仮想矩形枠において、その垂直方向で複数に分割したものに相当する短冊状枠をスキャンウインドウとして設定するのが好ましい。
【0058】
《24》上記《1》〜《23》の構成の目的物検出装置における前記のスキャンウインドウ制御手段については、スキャンウインドウをその長手方向に対して直交する方向で走査するように構成することは好ましい態様である。これにより、2次元的に展開される画像データを隈なくかつ効率良く走査することが可能となる。
【0059】
《25》上記《1》〜《23》の構成の目的物検出装置における前記のスキャンウインドウ制御手段については、スキャンウインドウをその長手方向に対して平行な方向で走査するように構成してもよい。
【0060】
《26》上記《24》,《25》の構成の目的物検出装置における前記のスキャンウインドウ制御手段については、スキャンウインドウの長手方向またはスキャンウインドウの走査方向の少なくともいずれか一方を、外部からの指示によって切り替え可能に構成することは好ましい態様である。被写体の姿勢と画像の姿勢との相対的関係については、正立の場合もあれば、左または右への90度回転の場合や180度回転の場合もある。上記の構成は、このような関係の変化に対して容易に対応することが可能となる。
【0061】
《27》上記《24》,《25》の構成の目的物検出装置における前記のスキャンウインドウ制御手段については、スキャンウインドウの長手方向またはスキャンウインドウの走査方向の少なくともいずれか一方を、カメラの向きまたは目的物の特徴に応じて切り替え可能に構成することは好ましい態様である。このように構成すれば、被写体の姿勢と画像の姿勢との正立、左または右への90度回転、180度回転の関係の変化に対して適正な対応を自動的に確保することが可能となる。
【0062】
《28》上記《24》,《25》の構成の目的物検出装置における前記のスキャンウインドウ制御手段については、画像データの一時的記憶の際のデータ書き込み方向を、外部からの指示によって水平・垂直間で切り替え可能に構成することは好ましい態様である。このように構成すれば、被写体の姿勢と画像の姿勢との正立、左または右への90度回転、180度回転の関係の変化に対して容易に対応することが可能となる。
【0063】
《29》上記《24》,《25》の構成の目的物検出装置における前記のスキャンウインドウ制御手段については、画像データの一時的記憶の際のデータ書き込み方向を、カメラの向きまたは目的物の特徴に応じて切り替え可能に構成することは好ましい態様である。このように構成すれば、被写体の姿勢と画像の姿勢との正立、左または右への90度回転、180度回転の関係の変化に対して適正な対応を自動的に確保することが可能となる。
【0064】
《30》上記《24》,《25》の構成の目的物検出装置における前記のスキャンウインドウ制御手段については、一時的に記憶されている画像データのデータ読み出し方向を、外部からの指示によって水平・垂直間で切り替え可能に構成することは好ましい態様である。このように構成すれば、被写体の姿勢と画像の姿勢との正立、左または右への90度回転、180度回転の関係の変化に対して容易に対応することが可能となる。
【0065】
《31》上記《24》,《25》の構成の目的物検出装置における前記のスキャンウインドウ制御手段については、一時的に記憶されている画像データのデータ読み出し方向を、カメラの向きまたは目的物の特徴に応じて水平・垂直間で切り替え可能に構成することは好ましい態様である。このように構成すれば、被写体の姿勢と画像の姿勢との正立、左または右への90度回転、180度回転の関係の変化に対して適正な対応を自動的に確保することが可能となる。
【0066】
《32》上記《1》〜《31》の構成の目的物検出装置における前記の特徴検出・検出結果信頼度算出手段については、スキャンウインドウに含まれる画像データ部分領域から人物の部分領域の特徴または人物の部分領域のさらに部分領域の特徴を検出するように構成することは好ましい態様である。目的物として人物を対象とする場合、スキャンウインドウで検査するのは人物の部分領域(頭部、胸部、腹部、大腿部、脚部のいずれか1つ。図10参照)の特徴ということになる。また、目的物として人物の顔を対象とする場合、スキャンウインドウで検査するのは人物の部分領域のさらに部分領域(頭部、目部、鼻部、口部、顎部のいずれか1つ。図25参照)の特徴ということになる。
【0067】
《33》上記《32》の構成の目的物検出装置における前記の特徴検出・検出結果信頼度算出手段については、スキャンウインドウに含まれる画像データ部分領域から人物の顔領域の特徴を検出するように構成されているという態様がある。人物の顔検出は、最も多く利用されるものの1つである。
【0068】
《36》〔課題を解決するための手段〕の項で説明した上記《35》の構成の目的物検出方法における前記の特徴検出と検出結果の信頼度算出のステップにおいては、個々の走査位置のスキャンウインドウにおいて、そのスキャンウインドウが展開されている時間帯を特徴の種類数に応じて複数に分割し、目的物の互いに異なる複数の部分領域にそれぞれ対応する特徴を互いにタイミングを異にして検出するとともに、その検出した複数の特徴値それぞれにつき検出結果の信頼度を算出するという態様がある。これは、上記の《4》の目的物検出装置に対応している。
【0069】
《37》上記《35》の構成の目的物検出方法における前記の特徴検出と検出結果の信頼度算出のステップにおいては、個々の走査位置のスキャンウインドウにおいて、そのスキャンウインドウが展開されている時間帯の全体を用いて、複数種類の特徴のうちのすべての種類の特徴を同時並列的に検出するとともに、その検出した複数の特徴値それぞれにつき検出結果の信頼度を算出するという態様がある。これは、上記の《5》の目的物検出装置に対応している。
【0070】
《38》上記《35》〜《37》の構成の目的物検出方法における前記の特徴検出と検出結果の信頼度算出のステップにおいては、走査中の任意の位置におけるスキャンウインドウでの検出特徴値から算出した検出結果の信頼度の低さによっては、その特徴検出・検出結果信頼度算出の動作を中止するという態様がある。これは、上記の《6》の目的物検出装置に対応している。
【0071】
《39》上記《35》〜《37》の構成の目的物検出方法における前記の特徴検出と検出結果の信頼度算出のステップにおいては、走査中の任意の位置におけるスキャンウインドウでの検出特徴値から算出した検出結果の信頼度の高さによっては、後続のスキャンウインドウでの特徴検出・検出結果信頼度算出の動作を中止するという態様がある。これは、上記の《7》の目的物検出装置に対応している。
【0072】
《40》上記《35》〜《39》の構成の目的物検出方法における前記のスキャンウインドウの位置を順次に制御するステップにおいては、スキャンウインドウをその長手方向に対して直交する方向で走査するという態様がある。これは、上記の《24》の目的物検出装置に対応している。
【0073】
《41》上記《35》〜《39》の構成の目的物検出方法における前記の前記スキャンウインドウの位置を順次に制御するステップにおいては、スキャンウインドウをその長手方向に対して平行な方向で走査するという態様がある。これは、上記の《25》の目的物検出装置に対応している。
【0074】
《42》上記《35》〜《39》の構成の目的物検出方法における前記の前記スキャンウインドウの位置を順次に制御するステップにおいては、スキャンウインドウの長手方向またはスキャンウインドウの走査方向の少なくともいずれか一方を、カメラの向きまたは目的物の特徴に応じて切り替えるという態様がある。これは、上記の《27》の目的物検出装置に対応している。
【実施例】
【0075】
以下、本発明の目的物検出装置・目的物検出方法の実施例について図面を参照しながら説明する。以下の実施例は好ましい例示であり、本発明およびその適用物またはその用途の範囲を制限するものではない。以下の実施例や変形例の説明において、一度説明した構成要素と同様の機能を有する構成要素については、同一の符号を付して説明を省略する。
【0076】
本実施例の目的物検出装置は、動画用の撮像システム、静止画用の撮像システムあるいは動画と静止画の両方の撮像システムの何れにも適用可能である。以下では、一例として動画撮像が可能なデジタルビデオカメラの例を説明する。そのデジタルビデオカメラは、撮像した動画あるいは予め記録されている動画において人物を検出した場合に、それぞれの表示用の動画に人物を検出したことを示す検出表示枠を付加するようになっている。
【0077】
図1は本発明の実施例にかかわる目的物検出装置を搭載したデジタルビデオカメラの構成を示すブロック図である。デジタルビデオカメラ1は、デジタル信号処理回路(DSP)10、撮像モジュール20、CPU(中央演算処理装置)31、画像メモリ(SDRAM(同期ダイナミックランダムアクセスメモリ))32、SD(Secure Digital)カード33、表示装置(LCD)34および外部インターフェース35を備えている。以下、デジタルビデオカメラ1の各構成要素について説明する。
【0078】
撮像モジュール20は、光学レンズ21、イメージセンサ22およびタイミングジェネレータ23を備えている。光学レンズ21は、被写体からの光をイメージセンサ22上に結像させる。タイミングジェネレータ23は、イメージセンサ22を駆動するのに必要な制御信号を生成する。イメージセンサ22は固体撮像素子の一例であり、本実施例ではMOSイメージセンサが用いられている。イメージセンサ22は、複数の画素が2次元状に配置された画素アレイを備えている。画素アレイでは、それぞれの画素が光電変換を行って光学レンズ21からの入射光を電荷に変換している。そして、イメージセンサ22は、各画素の信号をA/D変換して撮像信号S1としてデジタル信号処理回路10へ出力する。
【0079】
デジタル信号処理回路10は、メモリコントローラ11、YC処理部12、圧縮処理部13、デジタル信号処理部14および目的物検出装置の典型例である人物検出装置15を備え、イメージセンサ22から入力されてくる撮像信号S1を処理する。
【0080】
メモリコントローラ11は、YC処理部12、圧縮処理部13およびデジタル信号処理部14(以下これらの各部を総称して機能ブロックと呼ぶ)のそれぞれと、画像メモリ32との間のデータの転送(読み出しや書き込み)を行う。デジタル信号処理回路10では、それぞれの機能ブロックにおける処理に必要な画素数分の撮像信号S1が揃うまで画像メモリ32に撮像信号S1を書き込む。必要な画素数分の撮像信号S1が揃うと、メモリコントローラ11は必要に応じて画像メモリ32から撮像信号S1を読み出し、撮像信号S1を必要とする機能ブロックに出力する。また、画像メモリ32には、YC処理部12で得られる輝度信号や色信号(R,G,Bの各信号)、さらには圧縮処理部13で得られる符号データ等も記録される。そのため、メモリコントローラ11は、これらの種類のデータや信号の読み出しや書き込みも行う。さらには、人物検出装置15での人物検出処理(後述)において発生する中間データや処理結果の読み出しや書き込みも行う。
【0081】
YC処理部12は、撮像信号S1に対して実際に信号処理を行う機能ブロックである。具体的に、YC処理部12は、所定の画像処理用のパラメータを用いて同時化、フィルタリング処理、周波数補正等を行うとともに、輝度信号と色差信号(以下これらの信号をまとめてYC信号S2と呼ぶ)を生成する。YC信号S2は画像信号の一例である。なお、デジタル信号処理回路10は、画像信号として、YC信号S2の代わりに色信号やイメージセンサ22に入射した光に応じたレベル出力などを扱うように構成してもよい。
【0082】
圧縮処理部13は、YC信号S2(輝度信号や色差信号)を所定のフォーマットに従って圧縮する。具体的には例えば静止画ならばJPEGのフォーマットに従ってデータ量の圧縮を行い、動画ならばH.264等のフォーマットに従ってデータ量の圧縮を行う。
【0083】
デジタル信号処理部14は、画角サイズの調整のための拡大縮小処理(いわゆるズーム処理)、傷補正、照明光色温度検出等の動作に必要な信号処理を行う。また、デジタル信号処理部14は、装着されているSDカード33に対してデータの書き込みおよび読み出しを行う。さらに、デジタル信号処理部14は、表示媒体である表示装置34に対してプレビュー等の画像を表示する。
【0084】
図2は人物検出装置15の詳細な構成を示す。人物検出装置15は、スキャンウインドウ制御部51、スキャンウインドウ設定部52、特徴検出・検出結果信頼度算出部53、学習ROM54、包含信頼度算出部55および目的物検出部56を備えている。
【0085】
スキャンウインドウ制御部51は、YC信号S2中のアドレス位置を処理に応じて選択する。スキャンウインドウ制御部51によって指定されたアドレス位置を画像メモリ32上のアドレスに変換し、メモリコントローラ11は画像メモリ32に保持されているYC信号S2を読み出す。スキャンウインドウ設定部52は、設定したスキャンウインドウSWの領域に、スキャンウインドウ制御部51により画像メモリ32から読み出されたYC信号S2を保持する。
【0086】
スキャンウインドウ設定部52は、画像データにおける部分領域を特徴検出のために切り出すスキャンウインドウSWに関する要件(サイズ、初期位置、スキップ量、走査方向、走査態様など)を設定する。スキャンウインドウ制御部51は、このとき、画像データにおけるスキャンウインドウSWの走査のためにスキャンウインドウ設定部52の設定によるスキャンウインドウSWの位置を順次に制御する。
【0087】
特徴検出・検出結果信頼度算出部53は、スキャンウインドウ設定部52によるスキャンウインドウSWの領域に保持されているYC信号S2とスキャンウインドウ設定部52におけるアドレスを予め決められている特徴値F1(後述)に変換する。
【0088】
学習ROM54は、予め外部の計算機(不図示)等で決定された特徴値F1と検出対象の目的物に対応した検出結果の信頼度R1を格納したリードオンリーメモリであり、特徴値F1をアドレス信号として、学習ROM54から特徴値F1に対応した検出結果の信頼度R1を出力する。
【0089】
包含信頼度算出部55は、学習ROM54から出力される1つ以上の検出結果の信頼度R1に基づいて、スキャンウインドウSWの領域に保持されているYC信号S2に目的物が含まれている確からしさを示す検出対象包含の信頼度R2を算出する。
【0090】
目的物検出部56は、包含信頼度算出部55から出力される検出対象包含の信頼度R2に対し閾値判定を行うことで、スキャンウインドウSWの領域に保持されているYC信号S2に目的物が含まれるかどうかの判定を行う。さらに、目的物検出部56は、YC信号S2に目的物が含まれていた場合は、目的物が含まれていたという検出結果と、スキャンウインドウ制御部51で選択されたアドレス情報をYC信号S2中のアドレスに変換したデータを、メモリコントローラ11を介して画像メモリ32に書き込む。
【0091】
CPU31は制御部の一例であり、撮像動作の制御や、デジタル信号処理回路10における信号処理の制御を行う。例えば撮影時には、CPU31は、デジタルビデオカメラ1がユーザの期待する動作を実現するのに必要な制御信号を撮像モジュール20(イメージセンサ22)およびデジタル信号処理回路10、人物検出装置15の各機能ブロックに出力する。CPU31はまた、イメージセンサ22の露光時間の制御や、人物検出装置15による人物検出処理(後述)等を制御する。このような処理の制御を行えるようにするため、CPU31にはレリーズボタンやデジタルビデオカメラ1の動作を設定するための信号(外部入力S3)が外部から入力されるとともに、外部インターフェース35からの情報(推定用情報S4)も入力されている。CPU31は、これらの情報を適宜利用して制御を行う(詳細な動作は後述)。
【0092】
画像メモリ32は、デジタル信号処理回路10での信号処理(後述)において、処理中の信号(データ)を一時的に保持し、あるいは人物検出装置15での人物検出処理(後述)において発生する中間データや処理結果を一時的に保持するためなどに使用される記録媒体である。
【0093】
SDカード33は、YC信号S2(画像信号)を所定のフォーマットで記録するとともに、人物検出装置15により出力された人物検出結果を格納する記録媒体である。本実施例では、SDカード33にはSDメモリカードを採用している。もちろん他の種類の記録媒体の採用も可能である。
【0094】
表示装置34は液晶ディスプレイにより構成され、撮像した画像のプレビューや、SDカード33に予め記録されている画像の再生表示や、デジタルビデオカメラ1の設定を行う際のOSD(On Screen Display)によるメニュー表示に使用される。
【0095】
外部インターフェース35は情報取得部の一例であり、デジタルビデオカメラ1の向きを推定するための推定用情報S4を取得する。本実施例では、外部インターフェース35にジャイロ36が接続され、推定用情報S4としてデジタルビデオカメラ1の向き、傾きを取得し、取得したこれらの情報をCPU31に送信するようになっている。
【0096】
次に、本実施例のデジタルビデオカメラの動作の概要を説明する。
【0097】
デジタルビデオカメラ1で撮影を行うと、被写体からの光が光学レンズ21を通してイメージセンサ22に入光し、イメージセンサ22上の画素において光電変換される。CPU31は、このときの露光量の制御や撮像モジュール20の動作モードの制御などの撮像動作の制御を行う。イメージセンサ22は、光電変換した信号を撮像信号S1としてデジタル信号処理回路10へ出力する。また、CPU31は、所定の制御信号をメモリコントローラ11やデジタル信号処理回路10の各機能ブロックに出力する。これにより、メモリコントローラ11が画像メモリ32への撮像信号S1の書き込みや画像メモリ32からの読み出し行い、YC処理部12、圧縮処理部13、デジタル信号処理部14、人物検出装置15、SDカード33、表示装置34に対する信号の入出力が実現される。また、デジタル信号処理回路10では、YC処理部12が、CPU31の制御に応じて、入力された撮像信号S1に所定の信号処理を行い、処理結果であるYC信号S2(画像信号)をSDカード33に記録したり、表示装置34に表示したりする。ここで、CPU31は、外部インターフェース35を介して入力された外部入力S3の設定に従って前記撮像動作の制御やデジタル信号処理回路10における信号処理の制御を行う。
【0098】
次に、本実施例における人物検出の処理フローについて説明する。
【0099】
図3(a)はデジタルビデオカメラ1により撮影を行うイメージを示している。デジタルビデオカメラ1は、その向きが正立の状態にあり、被写体(人物)Q0と被写体(非人物)Q1を撮影している。撮影結果61は図3(b)の状態になり、イメージセンサ22から読み出される撮像信号S1は、走査経路a1で示すような走査により出力される。撮像信号S1は、デジタル信号処理部14、YC処理部12、メモリコントローラ11を介して画像メモリ32にYC信号S2として書き込まれる。画像メモリ32に書き込まれるYC信号S2は、ビットパッキングやエンディアン等が異なる場合もあるが、概ね撮影結果61の状態となる。画像メモリ32へのYC信号S2の書き込みが完了すると、人物検出装置15が動作を開始する。
【0100】
スキャンウインドウ設定部52は、図4に示すように四角形のスキャンウインドウSWを設定する。スキャンウインドウ制御部51は、走査経路a2で示すようにスキャンウインドウSWで画面全体を走査をするためのアドレス情報を出力する。スキャンウインドウ設定部52は、スキャンウインドウ制御部51により画像メモリ32から読み出されたスキャンウインドウSWに該当するYC信号S2を保持する。
【0101】
図5はスキャンウインドウSWを拡大した図であり、x,yはスキャンウインドウSWにおけるアドレスを示している。特徴検出・検出結果信頼度算出部53はD1で示すYC信号S2を特徴空間へ変換し、指定されたスキャンウインドウSW内のアドレス位置と組み合わせて特徴値F1とする。本実施例においては、特徴空間への変換によりYC信号S2をSIFT(Scale Invariant Feature Transform)特徴へ変換する。
【0102】
SIFT(スケール不変特徴変換)特徴量とは、局所領域における勾配情報(空間方向およびスケール方向の変化)をベースとした特徴量である。画像中の特徴点を検出し、特徴点ごとに周辺のエッジ勾配を求める。学習時の画像からSIFT特徴を抽出して記憶しておき、位置推定時に画像中のSIFT特徴を抽出し、記憶したものと照合して同じ特徴があるかどうかで位置推定を行う。SIFT特徴は、画像の回転・スケール変化・照明変化等に頑健で、物体までの距離や見る角度が変わっても安定的に特徴点を抽出できるため、物体認識によく用いられる。
【0103】
SIFTの処理により、YC信号S2から得られた特徴値とアドレスとが関連付けられた特徴値F1が生成されることになる。なお、図5のイメージでは、選択するYC信号S2が図示の都合上で1画素分のように見えるが、実際には複数の画素を選択している。
【0104】
学習ROM54は、予め外部の計算機(不図示)等で決定された特徴値F1と検出対象の目的物に対応した検出結果の信頼度R1を格納している。検出結果の信頼度R1を決定するのに幾つかの機械学習が知られているが、本実施例ではブースティングを使用することで検出結果の信頼度R1を決定している。ブースティングというのは、精度の高い判別機1つで直接判別するのではなく、精度の低い判別機(弱学習機)を多数組み合わせることによって高精度な判別を行う手法である。
【0105】
特徴検出・検出結果信頼度算出部53により生成された特徴値F1を学習ROM54に入力すると、スキャンウインドウSWに該当するYC信号S2から得られる特徴値F1に基づいて目的物(人物)検出の確からしさである検出結果の信頼度R1が生成される。
【0106】
なお、通常のブースティングでは、スキャンウインドウSW内の複数のアドレスから複数の検出結果の信頼度R1を算出し、それらを組み合わせて検出対象である目的物の有無を判断する。本実施例では、検出結果の信頼度R1を決定するためにブースティングを使用するとしているものの、説明の煩雑さを回避するために、1つの検出結果の信頼度R1のみで目的物の有無を判断するような記述となっている。この先、特に注釈を加えない限りは、1つの検出結果の信頼度R1のみであっても複数を指し示していることを意味し、特に必要な場合は、複数の検出結果の信頼度R1として説明することがある。
【0107】
ところで、図4の撮影結果61とスキャンウインドウSWの関係からも分かるように、スキャンウインドウSWはそのサイズが人物全体をカバーできるものとはなっていない。例えば、図6の場合、Lyで示すように、検出結果の信頼度R1が算出されるのは概ね頭部についてだけである。これは、検出処理においてある特定のタイミングだけを抜き出しているからである。実際には、スキャンウインドウSWは走査方向a2に従って画面を走査しており、一定回数の処理により図7の走査経路a3に示すように、人物全体についての検出結果の信頼度R1を求める。なお、スキャンウインドウSWの形状は、被写体の長辺方向に対して直交した方向に細長い短冊状が好ましい。
【0108】
上記では説明を簡単化するために、ある位置に存在することが分かっている人物を検出する場合において、その人物を検出するための手順として説明を行っている。しかし実際には、どの位置に人物が存在するか不明であるため、すべてのアドレスにおいて検出結果の信頼度R1を求める必要がある。例えば具体的には、図8に示すP1は、スキャンウインドウSWが着目している部分が人物か非人物かが不明であり、人物であったとしても人物のどの部分であるかが不明である。左側に列挙した被写体Q0は、P1が複雑で識別が困難であるので分けて示したものである。スキャンウインドウSWが画面を走査している間は、そのアドレスにおいて、それぞれ異なる位置に存在するであろう人物が持つ概ね頭部、胸部、腹部、大腿部、脚部のそれぞれに対応する検出結果の信頼度R1を算出する必要がある。この処理の考え方をタイミングチャートで示したものが図9(a)である。
【0109】
図9(a)の横軸は時間方向を示している。スキャンウインドウSWは図4のように走査方向a2に従って画面を走査している。時間帯t0のスキャンウインドウSWにおいて、時刻(t0+Δt)で頭部について検出結果の信頼度R1[頭]を検出し、時刻(t0+2Δt)で胸部について検出結果の信頼度R1[胸]を検出し、時刻(t0+3Δt)で腹部について検出結果の信頼度R1[腹]を検出し、時刻(t0+4Δt)で大腿部について検出結果の信頼度R1[大腿]を検出し、時刻(t0+5Δt)で脚部について検出結果の信頼度R1[脚]を検出する。同様に時間帯t1以降も、その時点のスキャンウインドウSWにおいて、時刻(t1+Δt)で頭部について検出結果の信頼度R1[頭]を検出し、時刻(t1+2Δt)で胸部について検出結果の信頼度R1[胸]を検出し、時刻(t1+3Δt)で腹部について検出結果の信頼度R1[腹]を検出し、時刻(t1+4Δt)で大腿部について検出結果の信頼度R1[大腿]を検出し、時刻(t1+5Δt)で脚部について検出結果の信頼度R1[脚]を検出する。
【0110】
被写体Q0全体の検出結果の信頼度R1は、黒で塗りつぶした頭部、胸部、腹部、大腿部、脚部のすべてが揃う時間帯t4で算出される。なお、塗りつぶしていない頭部、胸部、腹部、大腿部、脚部は、他の位置に存在するであろう人物の検出結果の信頼度R1に相当する。
【0111】
ここまでの処理において、スキャンウインドウSWの走査で目的物である人物のサイズをカバーでき、それぞれのスキャンウインドウSWからそれぞれ検出結果の信頼度R1が求められることになる。
【0112】
続いて、包含信頼度算出部55に検出結果の信頼度R1が入力されたときの動作について説明を行う。本実施例においては、図10に示されるようなスキャンウインドウSWの走査が行われているものとして説明を行う。検出結果の信頼度R1については、R1[頭]、R1[胸]、R1[腹]、R1[大腿]、R1[脚]の5種類が算出される。包含信頼度算出部55は、これら5種類の検出結果の信頼度R1を用いて、次のような演算を行い、検出対象包含の信頼度R2を算出する。
【0113】
R2=α・R1[頭]+β・R1[胸]+γ・R1[腹]+δ・R1[大腿]+ζ・R1[脚] …………(1)
ここで、α,β,γ,δ,ζは重み係数である。α,β,γ,δ,ζは、学習ROM54に格納される検出結果の信頼度R1を予め外部の計算機(不図示)等で決定する際に決定していた値と同一としている。式(1)において重み係数につき、α=β=γ=δ=ζ=1とすると、単純な総和となるが、これは、検出対象包含の信頼度R2の計算における最も基本的な手法である。重み係数α,β,γ,δ,ζに差を持たせて重要度(優先度)を設定すれば、目的物検出の合理性ないし検出結果の信頼度の向上を図ることができる。例えば人物の場合に、頭部の重み係数は高めに設定し、腹部の重み係数は低めに設定するといった具合である。
【0114】
上記の式(1)における重み係数α,β,γ,δ,ζの設定については、これらを固定値とする方式以外に、撮影シーンに応じてこれらの重み係数を動的に変更する方式もある。後者の場合、重み係数の変更の態様については、ユーザが撮影シーンを判断し、その撮影シーンに応じて手動で重み係数α,β,γ,δ,ζを調整する手動方式でもよいし、あるいは、YC信号S2に基づいて撮影シーンを判別し、その判別結果に応じて重み係数α,β,γ,δ,ζを自動的に調整する自動方式でもよい。手動の場合、撮影シーンは、外部インターフェース35において情報S4として設定すればよい。
【0115】
自動方式に関しては、単語の出現頻度によりテキストを表現するbag-of-words法の考え方を画像に応用した画像認識手法であるBag-of-visual-words(BoVW)法などにより、画面内に存在するオブジェクトの含有率を求め、その結果をコンテキスト情報として撮影シーンを判別し、その判別結果に基づいて重み係数α,β,γ,δ,ζを算出する。
なお、Bag-of-visual-wordsは、bag-of-wordsで語順を無視するのと同様に、位置を無視する。Bag-of-featuresともBag-of-keypointsとも言う。
【0116】
具体的には、例えば人物を目的物としている場合、Bag-of-visual-words法で得られるコンテキスト情報が樹木と動物を多く含んでいることを示しているときは人物が画面内に含まれる可能性が減ることになるため、重み係数を小さくする方向へ補正する。また、コンテキスト情報が空を多く含んでいることを示しているときは顔より下に位置する部位が存在する可能性が低くなるため、顔の位置に相当する重み係数を高めに設定し、顔より下に位置する部位に相当する重み係数を低めに設定する。特に、Bag-of-visual-words法で使用する特徴を目的物を検出するための特徴と同一にしておくことで、構成の合理化を図ることが可能となる。もっとも、特徴が同一でなくてもよい。
【0117】
一方、重み係数を変更することに代えて、あるいは重み係数を変更することとともに、判別に使用する閾値を動的に補正する方式でもよい。
【0118】
さらには、撮影シーンに応じて、スキャンウインドウのスキャン方法を変更するように構成してもよい。
【0119】
上記の空を多く含んでいる場合においては、画面上部に人が存在する可能性は低くなるので、スキャンウインドウの探索範囲を画面下部に限定するようにしてもよい。例えば、画面中にライオンが多く含まれていると判定した場合、そのようなところに人間がいる可能性は低くなるので、人間を検出する可能性を下げるために重み係数を低めに設定する。
【0120】
ここまでの処理で包含信頼度算出部55から検出対象包含の信頼度R2が算出されている。目的物検出部56は、検出対象包含の信頼度R2を予め設定されている閾値と比較することで、人物が検出されたか否かの判定を行う。人物が検出されていた場合は、人物が検出された画像上のアドレスと、検出対象包含の信頼度R2か人物検出フラグの少なくとも一方とを、メモリコントローラ11を介して画像メモリ32に書き込む。CPU31は、画像メモリ32に書き込まれている人物検出結果と画像上のアドレスを基にOSD(オンスクリーンディスプレイ)を作成し、表示装置34に表示したり、あるいは人物検出ログとしてSDカード33に記録する。
【0121】
以上のように本実施例によれば、次のような利点がある。
【0122】
すなわち、特徴値の検出を行うスキャンウインドウSWは、その2次元的な走査によって画像データの全領域をカバーする。よって、スキャンウインドウSWは、画像データ全領域の大きさに比べて充分に小さいサイズのものでよい。その分、特徴値検出のために必要とする記憶容量は少なくてすむことになる。
【0123】
また、目的物検出の処理は、スキャンウインドウSWを順次走査しながらの一連の処理であるので、処理効率を高いものとすることができる。
【0124】
さらに、検出対象包含の信頼度R2は、複数位置のスキャンウインドウSWそれぞれで得られた検出結果の信頼度R1の組み合わせに基づいて算出するから、目的物検出の判定の精度を高いものにすることができる。
【0125】
以上の結果として、従来むずかしいとされていた検出結果の信頼度の向上と処理効率の向上との両立を実現することができるようになった。
【0126】
特に、図9(a)の方式によれば、特徴検出・検出結果信頼度算出部53は、個々の走査位置のスキャンウインドウSWにおいて、そのスキャンウインドウSWが展開されている時間帯を特徴の種類数に応じて複数に分割し、目的物の互いに異なる複数の部分領域にそれぞれ対応する特徴を互いにタイミングを異にして検出するとともに、その検出した複数の特徴値それぞれにつき検出結果の信頼度R1を算出する。したがって、1つのスキャンウインドウSWで複数の特徴値、検出結果の信頼度R1を順次に得ればよいので、並列度が低く処理速度が遅いものの、その順次処理ゆえに処理に要する記憶容量が相対的に少なくてすみ、回路規模の抑制に有効である。
[変形例]
【0127】
以下、上記の実施例についての変形例を説明する。
【0128】
<a>特徴空間への変換により得る特徴はSIFT特徴に限らず、HOG(Histograms of Oriented Gradients)特徴、エッジ検出特徴、濃淡検出特徴、あるいはその他の特徴であってもよいし、何れかの特徴変換を組み合わせて使用してもよい。HOG特徴量とは、局所領域における輝度の勾配方向をヒストグラム化した特徴量である。近接画素の勾配を局所領域によってヒストグラム化するため、照明の影響を受けにくく、局所的な幾何学変化に頑健という特徴がある。
【0129】
<b>図5のイメージでは特徴検出・検出結果信頼度算出部53は実際には複数の画素のYC信号S2を選択するとしたが、対象が画素値ではなく特徴空間に変換された特徴値である場合には1画素分としてもよいし、複数画素分であってもよい。
【0130】
<c>上記の実施例では、イメージセンサ22からの撮像信号S1が画像メモリ32へ書き込まれる時点においてYC信号S2に変換されるとしたが、YC信号S2から特徴空間に変換した後の特徴値としてもよい。
【0131】
<d>上記の実施例では、画像メモリ32へのYC信号S2の書き込みが完了した時点で人物検出装置15が動作を開始するとしたが、人物検出装置15の処理は処理時間を要するため、人物検出装置15で処理を行うのに必要なYC信号S2が揃った時点で動作を開始してもよい。
【0132】
<e>上記の実施例では検出対象である目的物の画像の大きさについては言及していない。ここで、目的物の画像を縮小/拡大し、スキャンウインドウSWのサイズを固定したまま検出処理を行うように構成する。この場合、目的物の画像の大きさを変更することができる。
【0133】
同様に、目的物の画像の大きさを固定したまま、スキャンウインドウSWのサイズを拡大/縮小しながら検出処理を行うように構成する。この場合も、目的物の画像の大きさを変更することが可能となる。
【0134】
これらの何れの場合においても、拡大/縮小を行うことで目的物の元画像の座標系とズレが生じるが、このズレを吸収する演算を施した後に人物検出結果として出力するとよい。
【0135】
<f>上記の実施例では、目的物を人物としたが、図25に示すように人の顔Q2にも同様に適用可能であるので、目的物は顔でもよい。さらに、動物でもよいし、他のオブジェクトであってもよい。さらに、YC処理部12等も人物検出結果に基づいて処理動作を変更してもよい。
【0136】
<g>処理の並列度に関する変形例について。図9(b)は図9(a)と同じ目的物を検出する内容を示しているが、処理の並列度という点で異なっている。図9(a)においては頭部、胸部、腹部、大腿部、脚部をすべて逐次処理しているのに対し、図9(b)では頭部、胸部、腹部、大腿部、脚部をすべて同時処理している。回路規模と処理の並列度は密接な関係がある。図9(a)の構成の方が図9(b)の構成より回路規模を小さくすることが期待できる。つまり、回路規模と処理時間の制約を加味した上で並列度を決定でき、処理速度と回路規模を最適なバランスで選択することができる。
【0137】
別言すれば、図9(b)の方式によれば、特徴検出・検出結果信頼度算出部53は、個々の走査位置のスキャンウインドウSWにおいて、そのスキャンウインドウSWが展開されている時間帯の全体を用いて、複数種類の特徴のうちのすべての種類の特徴を同時並列的に検出するとともに、その検出した複数の特徴値それぞれにつき検出結果の信頼度R1を算出する。したがって、個々の走査位置のスキャンウインドウSWにおいて、毎回すべての種類の特徴値、検出結果の信頼度R1を同一タイミングで得るので、並列度が高くて処理に要する記憶容量が相対的に多く回路規模が大きくなるものの、その同時処理ゆえに処理速度を相対的に速いものにすることができる。
【0138】
<h−1>スキャンウインドウの走査ステップ(密度)に関する変形例(その1)について。図10は、スキャンウインドウSWが画像データを走査するイメージの一例を示している。この場合、走査方向で隣接するスキャンウインドウSWどうしにおいて、重複することなく隣接して走査が行われる。この場合は、処理データに見落としが生じにくい。
【0139】
<h−2>スキャンウインドウの走査ステップに関する変形例(その2)について。図11の場合には、走査方向で隣接するスキャンウインドウSWどうしの間において、スキャンウインドウSWに参照されない領域を挟みながら走査が行われる。この場合は、高速の処理が期待できる。
【0140】
<h−3>スキャンウインドウの走査ステップに関する変形例(その3)について。図12の場合には、走査方向で隣接するスキャンウインドウSWどうしにおいて、重複する領域wを伴いながら走査が行われる。重複領域wをもって走査するので、特徴検出・検出結果信頼度算出部53による特徴値からの検出結果の信頼度R1の算出の精度が高いものとなり、ひいては包含信頼度算出部55による検出結果の信頼度R1の組み合わせに基づく検出対象包含の信頼度R2の算出の精度がアップし、最終的に目的物検出部56による目的物検出の判定の精度が向上する。
【0141】
<h−4>スキャンウインドウの走査ステップに関する変形例(その4)について。図13の場合には、走査方向で隣接するスキャンウインドウSWどうしにおいて、重複する領域w(不図示)を伴いながら走査が行われ、かつ、走査方向に離れた位置のスキャンウインドウSWとも重複する領域(不図示)を伴いながら操作が行われる。この場合は、検出の精度が充分にアップする。
【0142】
以上図10〜図13ではスキャンウインドウSWの密度が異なる。これは、人物を検出するための精度とスキャンウインドウSWにおける演算量のバランスを選択できることを示している。また、いずれの走査方法においても、少なくとも1つの走査位置におけるスキャンウインドウSWを使用しない構成とすることで、演算処理量を削減できる。例えば、画面の最上部において、脚部用としてスキャンウインドウSWを使用しない場合であれば、人物検出の結果において大きな悪影響をもたらすことなく、演算処理量を削減できる。
【0143】
<i>式(1)の重み係数に関する変形例について。α,β,γ,δ,ζを外部で予め算出した値としたが、特に、δ=ζ=0とすることで、人物の検出ではなく上半身のみの検出を行うようにしてもよい。例えば、検出結果の信頼度R1[大腿],R1[脚]を算出するための演算処理自体を停止しておくことで、消費電力や演算処理量を抑制できる。
【0144】
包含信頼度算出部55は、これら5種類の検出結果の信頼度R1を用いて次のような演算を行い、検出対象包含の信頼度R2を算出してもよい。
【0145】
<j−1>包含信頼度算出に関する変形例(その1)について。上記の実施例では、検出対象包含の信頼度R2を重み付き設定可能な線形一次結合による演算で算出したが、次の要領で算出してもよい。
【0146】
R2=MAX(α・R1[頭],β・R1[胸],γ・R1[腹],δ・R1[大腿],ζ・R1[脚])
………(2)
ここで、MAX( )は要素の最大値を返す関数である。検出対象包含の信頼度R2を検出結果の信頼度R1の最大値とすることで、「人物が存在しないにもかかわらず存在している」という誤判定率は増えるものの、「人物が存在するにもかかわらず存在していない」という誤判定を防止できる。
【0147】
<j−2>包含信頼度算出に関する変形例(その2)について。
【0148】
R2=MIN(α・R1[頭],β・R1[胸],γ・R1[腹],δ・R1[大腿],ζ・R1[脚])
………(3)
ここで、MIN( )は要素の最小値を返す関数である。検出対象包含の信頼度R2を検出結果の信頼度R1の最小値とすることで、「人物が存在するにもかかわらず存在していない」という誤判定率は増えるものの、「人物が存在しないにもかかわらず存在している」という誤判定を防止できる。
【0149】
<j−3>包含信頼度算出に関する変形例(その3)について。
【0150】
R2=MID(α・R1[頭],β・R1[胸],γ・R1[腹],δ・R1[大腿],ζ・R1[脚])
………(4)
ここで、MID( )は要素の中間値を返す関数である。検出対象包含の信頼度R2を検出結果の信頼度R1の中間値とすることで、ノイズ等の外乱等による誤判定を軽減することができる。
【0151】
<j−4>包含信頼度算出に関する変形例(その4)について。
【0152】
R2=(α・R1[頭]+β・R1[胸]+γ・R1[腹]+δ・R1[大腿]+ζ・R1[脚])
−MAX(α1・R1[頭],β1・R1[胸],γ1・R1[腹],δ1・R1[大腿],ζ1・R1[脚])
−MIN(α2・R1[頭],β2・R1[胸],γ2・R1[腹],δ2・R1[大腿],ζ2・R1[脚])
………(5)
ここで、α1,β1,γ1,δ1,ζ1とα2,β2,γ2,δ2,ζ2は重み係数である。検出対象包含の信頼度R2を検出結果の信頼度R1の最大値と最小値を除いたものの重み付け加算値とすることで、演算量は増加するものの、ノイズ等の外乱等による誤判定をさらに軽減することができる。
【0153】
<k>人物検出結果取扱いに関する変形例について。人物が検出された結果の数を記憶しておき、所定の数を超えた場合は処理を中断したり、一部のスキャンウインドウSWによる人物検出を省略する構成としてもよい。
【0154】
<l−1>スキャンウインドウの走査方法(方向)に関する変形例(その1)について。図14は、画面全体に対するスキャンウインドウSWの走査方法の変形例(その1)である。図4に示されている走査経路a2では、画面上端から画面下端に向け走査を行い、上端から下端への走査が終わった時点で右側の上端に走査開始位置を設定し直し、再度上端から下端への走査を行うという動作を画面全体を走査するまで繰り返している。これに対して、図14に示している走査経路a4では、画面下端から画面上端に向け走査を行い、下端から上端への走査が終わった時点で右側の下端に走査開始位置を設定し直し、再度下端から上端への走査を行うという動作を画面全体を走査するまで繰り返している。
【0155】
走査経路a2の走査方法によれば、ある画面上の人物を検出する際には、検出結果の信頼度R1が[頭]、[胸]、[腹]、[大腿]、[脚]の順番に出力される。これに対して走査経路a4の走査方法によれば、検出結果の信頼度R1が[脚]、[大腿]、[腹]、[胸]、[頭]の順番に出力され、下半身部が存在する信頼度が先に確定する。したがって、例えば、人物が動いている状態の脚部の形状の検出結果を利用して動いている人物のみを選択的に検出したいような場合に、上半身側から検出するよりも効率的に検出処理の中断等の制御が行え、不要な演算処理を削減できる。また、目的物が人物でなく、画面下端側に人物における顔のような重要な判断材料が存在するようなオブジェクトを検出する際にも、検出処理の絞り込みを早期に行え、不要な演算処理を削減できる。
【0156】
<l−2>スキャンウインドウの走査方法に関する変形例(その2)について。図15は、画面全体に対するスキャンウインドウSWの走査方法の変形例(その2)である。図15に示している走査経路a5では、画面下端から画面上端に向け走査を行い、下端から上端への走査が終わった時点で右側の上端に走査開始位置を設定し直す。その後、画面上端から画面下端に向け走査を行い、上端から下端への走査が終わった時点で右側の下端に走査開始位置を設定し直す。これらの一連の動作を画面全体を走査するまで繰り返している。
【0157】
スキャンウインドウSWを用いて矩形領域のデータを画像メモリ32から読み出すので、走査経路a2,a4のように、垂直方向の走査が終了した時点で上端から右側の下端あるいは下端から右側の上端のように走査対象がジャンプする場合には、スキャンウインドウSW内のデータをすべて更新する必要がある。これに対し、走査経路a5のように、上端から右側の上端あるいは下端から右側の下端のように走査対象がジャンプする場合には、走査対象を右側に移す際に、走査対象のジャンプ前とジャンプ後の一部のデータが重複するような構成とできる。その結果、スキャンウインドウSW内のデータをすべて更新する必要はなくなる。すなわち、画像メモリ32からの読み出し動作を軽減し、消費電力やメモリトラフィック等を低減することができる。
【0158】
<l−3>スキャンウインドウの走査方法に関する変形例(その3)について。図16は、画面全体に対するスキャンウインドウSWの走査方法の変形例(その3)である。図16に示している走査経路a6では、画面下端から画面上端に向け走査を行い、下端から上端への走査が終わった時点で右側の上端か下端かのいずれかに走査開始位置を設定し直す。垂直方向の走査が終了した時点で、右側の上端か下端かのいずれかに走査開始位置を設定し直すときに、直前の垂直方向の走査時における検出結果を利用して上端と下端の選択を行っている。その後、画面垂直方向の走査を行い、走査が終わった時点で右側の上端から下端のいずれかの走査開始位置を設定し直す。これらの一連の動作を画面全体を走査するまで繰り返している。例えば、垂直方向に対する検出結果の状況を記憶しておき、画面下端側に人物が集中しているような場合は、画面の下端側から走査を開始するように下端側を走査開始位置と設定し、画面上端側に人物が集中しているような場合は、画面の上端側から走査を開始するように上端側を走査開始位置と設定する。
【0159】
すなわち、被写体の姿勢と画像の姿勢との相対的関係については、正立の場合もあれば、左または右への90度回転の場合や180度回転の場合もある。ここでの方式によれば、このような関係の変化に対して容易に対応することができる。
【0160】
<m−1>スキャンウインドウの走査方法(方向)とデジタルビデオカメラの回転に関する変形例(その1)について。図17(a)は実施例にかかわるデジタルビデオカメラ1により撮影を行うイメージを示している。デジタルビデオカメラ1は被写体(人物)Q0と被写体(非人物)Q1とを撮影し、デジタルビデオカメラ1の向きは右方向に90度回転した状態にある。撮影された結果は図17(b)の62に示すような状態になり、イメージセンサ22から読み出される撮像信号S1は、走査経路a1で示すような走査により出力される。撮像信号S1は、デジタル信号処理部14、YC処理部12、メモリコントローラ11を介して画像メモリ32にYC信号S2として書き込まれる。画像メモリ32に書き込まれたYC信号S2は、ビットパッキングやエンディアン等が異なる場合もあるが、概ね図18の63の状態となる。この場合、図18の走査経路a7に示されるような要領で画面全体をスキャンウインドウSWで走査するとなると、異なる時間の複数のスキャンウインドウSWを使用しても目的物である人物をすべてカバーすることができず、人物を検出する動作が実現できない。そこで、走査経路a8に示されるような要領で画面全体をスキャンウインドウSWで走査するような構成とする。このようにすれば、前述の「デジタルビデオカメラ1が正立」の場合と同様の処理を導入でき、好ましい人物検出を行うことができる。また、スキャンウインドウSWの水平走査の方向の選択や、水平方向の走査が終了した時点で垂直方向へスキャンウインドウSWをシフトして次の水平走査を行う場合に、起点を再設定する方法も同様の考え方を援用できる。
【0161】
<m−2>スキャンウインドウの走査方法(方向)とデジタルビデオカメラの回転に関する変形例(その2)について。図19、図20は、デジタルビデオカメラ1が左方向に90度回転した状態を示し、図17、図18で示した「デジタルビデオカメラ1が右方向に90度回転」した状態と同様の考え方を援用できる。
【0162】
<m−3>スキャンウインドウの走査方法(方向)とデジタルビデオカメラの回転に関する変形例(その3)について。図21、図22は、デジタルビデオカメラ1が180度回転した状態を示した図で、図3、図4で示した「デジタルビデオカメラ1が正立」の状態と同様の考え方を援用できる。
【0163】
上記した<m−1>ないし<m−3>においては、画像メモリ32からスキャンウインドウSWに読み出されるYC信号S2の回転をケアする必要がある。例えば、図23の71,72,73,74はそれぞれ正立、左方向に90度回転、右方向に90度回転、180度回転であり、スキャンウインドウSWに「永」という文字と「△」の記号が保持されている状態を示している。このとき、特徴検出・検出結果信頼度算出部53が「△」記号の配置位置のYC信号S2に着目していたとすると、正立の場合の81を選択することに相当する。当然のように、正立の場合は何もケアする必要がなく、特徴検出・検出結果信頼度算出部53は正しく着目しているYC信号S2を選択することが可能である。
【0164】
ところが、左方向に90度回転の場合は、92に相当する位置のYC信号S2を選択することになり、そのデータから検出結果の信頼度R1を算出しても正しく検出できない。同様に、右方向に90度回転、180度回転の場合も、正しく検出できない。従って、デジタルビデオカメラ1の回転状態に対応して、特徴検出・検出結果信頼度算出部53がスキャンウインドウSW内から選択するYC信号S2の位置を回転する必要がある。
【0165】
また、特徴検出・検出結果信頼度算出部53はスキャンウインドウSW内から複数のデータを選択する構成となっているので、例えば、エッジの方向を抽出するような特徴を使用しているならば、スキャンウインドウSW内から選択した複数のデータの位置関係も回転させる必要がある。
【0166】
<n−1>デジタルビデオカメラが回転しているときの対応に関する変形例(その1)について。もちろん、デジタルビデオカメラ1の回転状態に対応する方法はこれに限らず、画像メモリ32にYC信号S2を書き込む際にデジタルビデオカメラ1の回転状態に対応して、予め回転を補正する方向でデータを書き込むようにしてもよい。この構成によれば、被写体の姿勢と画像の姿勢との正立、左または右への90度回転、180度回転の関係の変化に対して容易に対応することができる。
【0167】
<n−2>デジタルビデオカメラが回転しているときの対応に関する変形例(その2)について。画像メモリ32からYC信号S2を読み出す際にデジタルビデオカメラ1の回転状態に対応して、回転を補正した状態で読み出すようにしてもよい。この構成によれば、被写体の姿勢と画像の姿勢との正立、左または右への90度回転、180度回転の関係の変化に対して適正な対応を自動的に確保することができる。
【0168】
<o−1>デジタルビデオカメラに回転状態を通知する変形例(その1)について。デジタルビデオカメラ1の回転状態を人物検出装置15に通知する方法としては、ユーザが外部から情報S4として手動で設定してもよい。
【0169】
<o−2>デジタルビデオカメラに回転状態を通知する変形例(その2)について。ジャイロ36のようなデジタルビデオカメラ1の姿勢情報を取得するデバイスからの情報を使用してもよい。
【0170】
<o−3>デジタルビデオカメラに回転状態を通知する変形例(その3)について。撮影画像中で任意の線分を抽出し、抽出した線分の傾き具合を追跡することで自動的に推定してもよい。
【0171】
<o−4>デジタルビデオカメラに回転状態を通知する変形例(その4)について。すべての方向に対して目的物を検出するような人物検出装置15より簡易機能の目的物検出装置(不図示)を別途用意し、検出された目的物の向き情報によって回転情報を取得するようにしてもよい。
【0172】
また、これらを組み合わせた方法であってもよい。
【0173】
<p>検出結果による検出中断判定について。図24は、被写体(人物)Q0の手前に被写体(非人物)Q1が存在している状況を検出する場合を示している。被写体Q0の上半身は被写体Q1によって蔽われており、被写体Q1に該当するスキャンウインドウSWからは、検出結果の信頼度R1として非人物であることを示す結果が出力されていることになる。このような場合は、人物の一部として脚部が見えているような状況でも、該当位置の人物が存在するかどうかを推定するための検出動作は中止する。この構成によれば、実行中の処理が無駄な処理でないかの判断を通じて無駄な処理を抑制するため、処理効率を向上させることができる。
【0174】
<q>検出結果による周辺画像の検出中断判定について。図10のように明らかに人である場合にも、例えば、頭部の直下に脚部が配置されることは極めて稀であるので、頭部の検出結果の信頼度が高かったスキャンウインドウSWの真下の位置のスキャンウインドウSWにおいては、脚部が存在するかどうかを推定するための検出動作を中止する。この構成によれば、次に実行する処理が無駄な処理にならないかの判断を通じて無駄な処理を抑制するため、処理効率を向上させることができる。
【0175】
<r>YC信号S2に関して上記の実施例ではイメージセンサ23で取得しYC処理を経たものを取り扱ったが、これ以外に、イメージセンサとは別にSDカード33に記録されている映像信号を再生した結果に対して検知を行うのでもよい。
<s>検出対象領域を部分領域に分割するときの分割数に関しては、上記の実施例の分割数は一例であり、これ以外に任意の分割数で実施してもよいことは言うまでもない。
以上、本発明の実施例について説明してきたが、本発明が上述の実施例に限定されないのはもちろんであり、各実施例、各変形例を組み合わせる等してもよい。
【産業上の利用可能性】
【0176】
本発明の技術は、撮像装置における人物検出など画像の中から目的物を検出する目的物検出装置等において、必要とする記憶容量の削減と処理効率の向上とを図りつつ、高い検出結果の信頼度を確保する技術として有用である。
【符号の説明】
【0177】
1 デジタルビデオカメラ
10 デジタル信号処理回路(DSP)
12 YC処理部
15 人物検出装置(目的物検出装置)
21 光学レンズ
23 イメージセンサ(撮像素子)
32 画像メモリ(SDRAM)
51 スキャンウインドウ制御部
52 スキャンウインドウ設定部
53 特徴検出・検出結果信頼度算出部
54 学習ROM
55 包含信頼度算出部
56 目的物検出部
SW スキャンウインドウ
Q0 被写体(人物)
Q1 被写体(非人物)
Q2 目的物のオブジェクト例(顔)

【特許請求の範囲】
【請求項1】
外部から入力する画像データにおける部分領域を特徴検出のために切り出すスキャンウインドウに関する要件を設定するスキャンウインドウ設定手段と、
画像データにおけるスキャンウインドウの走査のために前記スキャンウインドウ設定手段の設定によるスキャンウインドウの位置を順次に制御するスキャンウインドウ制御手段と、
前記スキャンウインドウ制御手段による走査中の各位置におけるスキャンウインドウに含まれる画像データ部分領域から少なくとも1種類の特徴を検出するとともに、その検出した特徴値から検出結果の信頼度を算出する特徴検出・検出結果信頼度算出手段と、
走査によって展開される複数位置のスキャンウインドウでそれぞれの検出特徴値から算出された検出結果の信頼度の組み合わせに基づいて、目的物がその画像データに含まれている確からしさを表す検出対象包含の信頼度を算出する包含信頼度算出手段と、
前記包含信頼度算出手段による検出対象包含の信頼度に基づいて画像データにおける目的物を検出する目的物検出手段とを備えた目的物検出装置。
【請求項2】
前記スキャンウインドウ設定手段は、前記スキャンウインドウとして画像データ上で目的物の画像の大きさよりも小さい大きさのスキャンウインドウを設定するように構成されている請求項1に記載の目的物検出装置。
【請求項3】
前記スキャンウインドウ制御手段は、スキャンウインドウを近接するものどうしが重なり領域を持つ状態で配置するように構成されている請求項1または請求項2に記載の目的物検出装置。
【請求項4】
前記特徴検出・検出結果信頼度算出手段は、個々の走査位置のスキャンウインドウにおいて、そのスキャンウインドウが展開されている時間帯を特徴の種類数に応じて複数に分割し、目的物の互いに異なる複数の部分領域にそれぞれ対応する特徴を互いにタイミングを異にして検出するとともに、その検出した複数の特徴値それぞれにつき検出結果の信頼度を算出するように構成されている請求項1から請求項3までのいずれか1項に記載の目的物検出装置。
【請求項5】
前記特徴検出・検出結果信頼度算出手段は、個々の走査位置のスキャンウインドウにおいて、そのスキャンウインドウが展開されている時間帯の全体を用いて、複数種類の特徴のうちのすべての種類の特徴を同時並列的に検出するとともに、その検出した複数の特徴値それぞれにつき検出結果の信頼度を算出するように構成されている請求項1から請求項3までのいずれか1項に記載の目的物検出装置。
【請求項6】
前記特徴検出・検出結果信頼度算出手段は、走査中の任意の位置におけるスキャンウインドウでの検出特徴値から算出した検出結果の信頼度の低さによっては、その特徴検出・検出結果信頼度算出の動作を中止するように構成されている請求項1から請求項5までのいずれか1項に記載の目的物検出装置。
【請求項7】
前記特徴検出・検出結果信頼度算出手段は、走査中の任意の位置におけるスキャンウインドウでの検出特徴値から算出した検出結果の信頼度の高さによっては、後続のスキャンウインドウでの特徴検出・検出結果信頼度算出の動作を中止するように構成されている請求項1から請求項5までのいずれか1項に記載の目的物検出装置。
【請求項8】
前記特徴検出・検出結果信頼度算出手段は、前記後続のスキャンウインドウでの特徴検出・検出結果信頼度算出の動作の中止について、単一のスキャンウインドウでの検出結果の信頼度に代えて、複数のスキャンウインドウでの検出結果の信頼度の総合結果を用いるように構成されている請求項7に記載の目的物検出装置。
【請求項9】
前記包含信頼度算出手段は、走査中の各位置におけるスキャンウインドウで前記特徴検出・検出結果信頼度算出手段によって検出される複数の検出結果の信頼度の総和をもって前記検出対象包含の信頼度とするように構成されている請求項1から請求項8までのいずれか1項に記載の目的物検出装置。
【請求項10】
前記包含信頼度算出手段は、走査中の各位置におけるスキャンウインドウで前記特徴検出・検出結果信頼度算出手段によって検出される複数の検出結果の信頼度にそれぞれ重み付けをした総和をもって前記検出対象包含の信頼度とするように構成されている請求項1から請求項8までのいずれか1項に記載の目的物検出装置。
【請求項11】
前記包含信頼度算出手段は、前記複数の検出結果の信頼度に付する重みについて、撮影シーンに応じて前記重みを変更可能に構成されている請求項10に記載の目的物検出装置。
【請求項12】
前記包含信頼度算出手段は、前記撮影シーンに応じた重みの変更について、手動にて前記重みを変更可能に構成されている請求項11に記載の目的物検出装置。
【請求項13】
前記包含信頼度算出手段は、前記撮影シーンに応じた重みの変更について、自動にてYC信号から撮影シーンを取得し、取得した前記撮影シーンに基づいて前記重みを調整するように構成されている請求項11に記載の目的物検出装置。
【請求項14】
前記包含信頼度算出手段は、走査中の各位置におけるスキャンウインドウで前記特徴検出・検出結果信頼度算出手段によって検出される複数の検出結果の信頼度のうちの最大の検出結果の信頼度をもって前記検出対象包含の信頼度とするように構成されている請求項1から請求項8までのいずれか1項に記載の目的物検出装置。
【請求項15】
前記包含信頼度算出手段は、走査中の各位置におけるスキャンウインドウで前記特徴検出・検出結果信頼度算出手段によって検出される複数の検出結果の信頼度のうちの最小の検出結果の信頼度をもって前記検出対象包含の信頼度とするように構成されている請求項1から請求項8までのいずれか1項に記載の目的物検出装置。
【請求項16】
前記包含信頼度算出手段は、走査中の各位置におけるスキャンウインドウで前記特徴検出・検出結果信頼度算出手段によって検出される複数の検出結果の信頼度のうちの中間の検出結果の信頼度をもって前記検出対象包含の信頼度とするように構成されている請求項1から請求項8までのいずれか1項に記載の目的物検出装置。
【請求項17】
前記包含信頼度算出手段は、走査中の各位置におけるスキャンウインドウで前記特徴検出・検出結果信頼度算出手段によって検出される複数の検出結果の信頼度のうちの最大と最小のものを除いた残りの検出結果の信頼度にそれぞれ重み付けをした総和をもって前記検出対象包含の信頼度とするように構成されている請求項1から請求項8までのいずれか1項に記載の目的物検出装置。
【請求項18】
前記目的物検出手段は、前記包含信頼度算出手段による検出対象包含の信頼度を閾値と比較することにより目的物検出の成否の判定を行うように構成されている請求項1から請求項17までのいずれか1項に記載の目的物検出装置。
【請求項19】
前記目的物検出手段は、前記検出対象包含の信頼度に対する比較基準としての前記閾値について、撮影シーンに応じて前記閾値を変更可能に構成されている請求項18に記載の目的物検出装置。
【請求項20】
前記目的物検出手段は、前記検出対象包含の信頼度に対する比較基準としての前記閾値の変更について、手動にて前記閾値を変更可能に構成されている請求項19に記載の目的物検出装置。
【請求項21】
前記目的物検出手段は、前記検出対象包含の信頼度に対する比較基準としての前記閾値の変更について、自動にてYC信号から撮影シーンを取得し、取得した前記撮影シーンに基づいて前記閾値を調整するように構成されている請求項19に記載の目的物検出装置。
【請求項22】
前記スキャンウインドウ制御手段は、画像データにおけるスキャンウインドウの走査を画像の垂直方向において行うように構成されている請求項1から請求項21までのいずれか1項に記載の目的物検出装置。
【請求項23】
前記スキャンウインドウ設定手段は、スキャンウインドウの設定において、画像データにおける目的物の全体を囲む大きさの仮想矩形枠において、その垂直方向で複数に分割したものに相当する短冊状枠をスキャンウインドウとして設定するように構成されている請求項1から請求項22までのいずれか1項に記載の目的物検出装置。
【請求項24】
前記スキャンウインドウ制御手段は、スキャンウインドウをその長手方向に対して直交する方向で走査するように構成されている請求項1から請求項23までのいずれか1項に記載の目的物検出装置。
【請求項25】
前記スキャンウインドウ制御手段は、スキャンウインドウをその長手方向に対して平行な方向で走査するように構成されている請求項1から請求項23までのいずれか1項に記載の目的物検出装置。
【請求項26】
前記スキャンウインドウ制御手段は、スキャンウインドウの長手方向またはスキャンウインドウの走査方向の少なくともいずれか一方が外部からの指示によって切り替え可能に構成されている請求項24または請求項25に記載の目的物検出装置。
【請求項27】
前記スキャンウインドウ制御手段は、スキャンウインドウの長手方向またはスキャンウインドウの走査方向の少なくともいずれか一方がカメラの向きまたは目的物の特徴に応じて切り替え可能に構成されている請求項24または請求項25に記載の目的物検出装置。
【請求項28】
前記スキャンウインドウ制御手段は、画像データの一時的記憶の際のデータ書き込み方向が外部からの指示によって水平・垂直間で切り替え可能に構成されている請求項24または請求項25に記載の目的物検出装置。
【請求項29】
前記スキャンウインドウ制御手段は、画像データの一時的記憶の際のデータ書き込み方向がカメラの向きまたは目的物の特徴に応じて切り替え可能に構成されている請求項24または請求項25に記載の目的物検出装置。
【請求項30】
前記スキャンウインドウ制御手段は、一時的に記憶されている画像データのデータ読み出し方向が外部からの指示によって水平・垂直間で切り替え可能に構成されている請求項24または請求項25に記載の目的物検出装置。
【請求項31】
前記スキャンウインドウ制御手段は、一時的に記憶されている画像データのデータ読み出し方向がカメラの向きまたは目的物の特徴に応じて水平・垂直間で切り替え可能に構成されている請求項24または請求項25に記載の目的物検出装置。
【請求項32】
前記特徴検出・検出結果信頼度算出手段は、スキャンウインドウに含まれる画像データ部分領域から人物の部分領域の特徴または人物の部分領域のさらに部分領域の特徴を検出するように構成されている請求項1から請求項31までのいずれか1項に記載の目的物検出装置。
【請求項33】
前記特徴検出・検出結果信頼度算出手段は、スキャンウインドウに含まれる画像データ部分領域から人物の顔領域の特徴を検出するように構成されている請求項32に記載の目的物検出装置。
【請求項34】
光学レンズを介して入射した被写体光を受光して撮像信号に変換して出力する撮像素子と、
前記撮像素子から出力される撮像信号から輝度信号または色信号のうち少なくとも1種類を生成するYC処理部と、
前記YC処理部による前記輝度信号または色信号のうち少なくとも1種類を用いて目的物検出を行うもので請求項1から請求項33までのいずれか1項に記載の目的物検出装置とを備えたカメラ。
【請求項35】
外部から画像データを入力するステップと、
前記入力画像データにおける部分領域を特徴検出のために切り出すスキャンウインドウに関する要件を設定するステップと、
画像データにおけるスキャンウインドウの走査のために前記の設定によるスキャンウインドウの位置を順次に制御するステップと、
走査中の各位置におけるスキャンウインドウに含まれる画像データ部分領域から少なくとも1種類の特徴を検出するとともに、その検出した特徴値から検出結果の信頼度を算出するステップと、
走査によって展開される複数位置のスキャンウインドウでそれぞれの検出特徴値から算出された検出結果の信頼度の組み合わせに基づいて、目的物がその画像データに含まれている確からしさを表す検出対象包含の信頼度を算出するステップと、
前記検出対象包含の信頼度に基づいて画像データにおける目的物を検出するステップとを備えた目的物検出方法。
【請求項36】
前記特徴検出と検出結果の信頼度算出のステップにおいては、個々の走査位置のスキャンウインドウにおいて、そのスキャンウインドウが展開されている時間帯を特徴の種類数に応じて複数に分割し、目的物の互いに異なる複数の部分領域にそれぞれ対応する特徴を互いにタイミングを異にして検出するとともに、その検出した複数の特徴値それぞれにつき検出結果の信頼度を算出するように構成されている請求項35に記載の目的物検出方法。
【請求項37】
前記特徴検出と検出結果の信頼度算出のステップにおいては、個々の走査位置のスキャンウインドウにおいて、そのスキャンウインドウが展開されている時間帯の全体を用いて、複数種類の特徴のうちのすべての種類の特徴を同時並列的に検出するとともに、その検出した複数の特徴値それぞれにつき検出結果の信頼度を算出する請求項35に記載の目的物検出方法。
【請求項38】
前記特徴検出と検出結果の信頼度算出のステップにおいては、走査中の任意の位置におけるスキャンウインドウでの検出特徴値から算出した検出結果の信頼度の低さによっては、その特徴検出・検出結果信頼度算出の動作を中止する請求項35から請求項37までのいずれか1項に記載の目的物検出方法。
【請求項39】
前記特徴検出と検出結果の信頼度算出のステップにおいては、走査中の任意の位置におけるスキャンウインドウでの検出特徴値から算出した検出結果の信頼度の高さによっては、後続のスキャンウインドウでの特徴検出・検出結果信頼度算出の動作を中止する請求項35から請求項37までのいずれか1項に記載の目的物検出方法。
【請求項40】
前記スキャンウインドウの位置を順次に制御するステップにおいては、スキャンウインドウをその長手方向に対して直交する方向で走査する請求項35から請求項39までのいずれか1項に記載の目的物検出方法。
【請求項41】
前記スキャンウインドウの位置を順次に制御するステップにおいては、スキャンウインドウをその長手方向に対して平行な方向で走査する請求項35から請求項39までのいずれか1項に記載の目的物検出方法。
【請求項42】
前記スキャンウインドウの位置を順次に制御するステップにおいては、スキャンウインドウの長手方向またはスキャンウインドウの走査方向の少なくともいずれか一方がカメラの向きまたは目的物の特徴に応じて切り替える請求項35から請求項39までのいずれか1項に記載の目的物検出方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate

【図24】
image rotate

【図25】
image rotate


【公開番号】特開2012−133445(P2012−133445A)
【公開日】平成24年7月12日(2012.7.12)
【国際特許分類】
【出願番号】特願2010−282834(P2010−282834)
【出願日】平成22年12月20日(2010.12.20)
【出願人】(000005821)パナソニック株式会社 (73,050)
【Fターム(参考)】