説明

画像処理装置

【課題】高解像度カメラおいて、認識対象領域を容易に設定できるようにする。
【解決手段】映像の解像度とフレームレートとを制御し、上限の解像度に制御された映像から移動物体の大きさを認識する。そして、この認識結果を基に、映像の解像度を決定する。さらに、この決定された解像度と、前記解像度で取り得るフレームレートの上限に制御された所定領域の映像から移動物体の移動速度を認識し、この認識結果を基に、映像のフレームレートを決定する。そして、決定されたフレームレートが、前記解像度で取り得るフレームレートの上限を超えた場合に、ユーザに警告を発する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は画像処理装置に関し、特に、人物などを検出するために用いて好適な技術に関する。
【背景技術】
【0002】
従来、店舗等の入り口や通路を通行する人をカメラで撮影し、撮影した映像より人物の顔の位置を検出して、通過した人数を計測する技術が開示されている。このような所定領域における通行人をカメラ映像から自動的にカウントする技術として、例えば特許文献1に開示されている。この特許文献1に記載の技術では、通路の上方から真下に向けてカメラを設置し、カメラ上方から見た人物の頭の形状が円であることから、カメラ映像から円形の物体を抽出することで人物を検知、カウントするようにしている。
【0003】
一方、近年、画像から顔を検出する技術の実用化が進んでいる。このような技術を利用して、通路の前方にカメラを設置し、カメラ映像から顔を検出することで人物をカウントすることも可能である。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開平4−199487号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、カメラが高解像度の撮像素子を持っている場合、例えば撮像素子数が640×480画素に比べ100倍以上であるような場合は、以下のような問題が生じる。なお、レンズを通して撮像素子の面に投影される映像が同じであれば、解像度は撮像素子の総数によって決定される。従って、以下、「解像度」と「撮像素子の総数」とは同義であるものとして、説明する。
【0006】
例えば、図5に示す人物504のように、通路の天井501に設置されたカメラ503から遠い距離にいるときは、人物504を検出してカウントするため、図6に示すようにユーザは認識対象領域604を設定する。このとき、フレーム画像中の認識対象領域604では、人物602が小さく写る。なお、図5の502は通路の床であり、図6の601はフレーム画像である。従って、小さな人物を認識する必要があるため、認識対象領域604において高解像度な映像が必要である。また、人物に対するカメラの角度が浅いために、フレーム画像内での人物の位置が変化するためには長い時間が必要である。即ち、認識対象領域604における人物の移動速度は遅くなる。従って、認識対象領域604におけるフレームレートは低くても、認識結果は大きく変化しない。
【0007】
次に、図5に示す人物505のようにカメラ503に近い距離にいるときは、図6に示すようにユーザは認識対象領域605を設定する。このとき、フレーム画像中の認識対象領域605では、人物603が大きく写る。従って、小さな人物を認識する必要がないため、認識対象領域605では低解像度な映像であっても、認識は可能である。また、人物に対するカメラの角度が深くなるために、フレーム画像中の認識対象領域605での人物の位置は、短い時間の間に、大きく変化する。従って、認識対象領域605では高フレームレートな映像が必要である。
【0008】
ところで、高解像度カメラでは、撮像素子上の全ての画素を読み出そうとすると、通常のフレーム1枚あたり、100倍以上のデータ量を読み出すことになる。640×480画素で、30fps(フレーム毎秒)で読み出し可能な回路で読み出そうとしても、フレーム1枚当たり3秒以上かかってしまうため、実用に耐えない。そこで、例えば、撮像素子上で認識対象領域(604、605)の画素を飛ばし読みすることにより、640×480画素など、取得可能な解像度で、映像を取得する。
【0009】
ここで、単位時間当たりの読み出しのデータ量は、解像度とフレームレートとの乗算になる。従って、解像度とフレームレートは、解像度の値を上限まで出せば、フレームレートは下限の値になり、解像度を下限にすれば、フレームレートは上限の値になるという、トレードオフの関係にある。
【0010】
従って、ユーザの指定した検出対象領域において、認識に必要な解像度とフレームレートを確保できないことがある。前述の認識対象領域605では、大きく写るため低解像度でよいが高フレームレートが必要である。もし、必要なフレームレートを確保できなければ、より低解像度にする必要があるが、これを行うと、認識に必要な解像度を下回ることになってしまい、認識そのものが不可能になる。このような場合は認識対象領域を狭くすることにより、認識対象領域に対する人物の大きさが相対的に大きくなるようにする必要がある。しかしながら、予めこのような条件をユーザが把握し、適切に認識対象領域を設定するのは非常に困難である。
【0011】
本発明は前述の問題点に鑑み、高解像度カメラおいて、認識対象領域を容易に設定できるようにすることを目的としている。
【課題を解決するための手段】
【0012】
本発明の画像処理装置は、撮像手段と、前記撮像手段により得られた映像から認識対象領域を指定する指定手段と、前記指定手段により指定された認識対象領域の映像を取得する取得手段と、前記取得手段により取得された映像の解像度とフレームレートとを制御する制御手段と、前記制御手段により上限の解像度に制御された映像から移動する物体の大きさを認識する第1の認識手段と、前記第1の認識手段による認識結果を基に、映像の解像度を決定する解像度決定手段と、前記解像度決定手段により決定された解像度と、前記制御手段により前記解像度で取り得るフレームレートの上限に制御された所定の領域の映像から前記物体の移動速度を認識する第2の認識手段と、前記第2の認識手段による認識結果を基に、映像のフレームレートを決定するフレームレート決定手段と、前記フレームレート決定手段により決定されたフレームレートが、前記解像度で取り得るフレームレートの上限を超えた場合に、ユーザに警告を発する警告手段とを備えたことを特徴とする。
【発明の効果】
【0013】
本発明によれば、認識の対象領域の設定を容易に行うことができる。
【図面の簡単な説明】
【0014】
【図1】実施形態に係る画像処理装置の設置例を示す図である。
【図2】実施形態に係る画像処理装置の機能構成例を示すブロック図である。
【図3】図4のステップS414の処理の概要を示す図である。
【図4】実施形態において全体の処理手順の一例を示すフローチャートである。
【図5】人物とカメラとの位置関係を示す図である。
【図6】認識対象領域と人物とのサイズの関係を示す図である。
【図7】顔検出の概要を示す図である。
【図8】実施形態に係る画像処理装置のハード構成例を示すブロック図である。
【図9】2つの認識結果と中心間の距離とを示す図である。
【図10】図4のステップS403の詳細な手順の一例を示すフローチャートである。
【発明を実施するための形態】
【0015】
以下、添付図面を参照して、本発明の好適な実施形態について詳細に説明する。
本実施形態では、通路を通行する人数をカウントするだけでなく、所定のエリアの混雑率を計測したり、動線を分析したり、特定の人物に対してアラームを発生させたりするなど、様々な用途に適用可能である。以下、本実施形態では、人数カウントに適用した例について説明する。
【0016】
図1は、本実施形態に係る画像処理装置の設置例を示す図である。
図1において、101は通路の天井であり、102は通路の床である。103は通路を通行している人物である。104は撮像部(カメラ)であり、人物103を斜め上から撮影できるように、天井101に設置されている。105はLANケーブルであり、撮像部104で撮像される映像を送信する。106は映像を解析して計数するパーソナルコンピュータ(PC)である。
【0017】
図8は、本実施形態におけるPC106のハード構成例を示すブロック図である。
図8において、801はCPUであり、本実施形態の画像処理装置における各種制御を実行する。802はROMであり、本装置の立ち上げ時に実行されるブートプログラムや各種データを格納する。803はRAMであり、CPU801が処理するための制御プログラムを格納するとともに、CPU801が各種制御を実行する際の作業領域を提供する。804はキーボード、805はマウスであり、ユーザによる各種入力操作環境を提供する。
【0018】
806は外部記憶装置であり、ハードディスクや光ディスク等で構成される。ただし、外部記憶装置806は、制御プログラムや各種データを全てROM802に保持するようにすれば、必ずしも必要な構成要素ではない。807は表示器であり、ディスプレイなどで構成され、結果等をユーザに対して表示する。808はネットワークインターフェースであり、ネットワーク上の撮像部104とLANケーブルを介した通信を可能とする。809はビデオインターフェースであり、撮像部104と同軸ケーブルを解したフレーム画像の取り込みを可能とする。また、810は上記の各構成を接続するバスである。
【0019】
図2は、本実施形態に係る画像処理装置の機能構成例を示すブロック図である。
図2において、200はカメラであり、図1の撮像部104に相当する。201は、撮像レンズ、および、CCD、CMOSなどの撮像素子からなる撮像部である。なお、撮像素子は640×480画素に比べ100倍以上ものあるような高解像度なものである。
【0020】
202は、映像読出部であり、撮像部201の撮像素子から、後述するユーザに指定された認識対象領域より、後述するフレームレート及び解像度で、映像を読み出して取得すものである。203は、映像送信部であり、映像読出部202で読み出された映像を、LANケーブル105を介してhttpプロトコルのパケットデータとしてPC210へ送る。
【0021】
204は、映像読出制御パラメータ設定部であり、後述する映像読出制御パラメータ決定部216で決定されたフレームレート及び解像度を、LANケーブル105を介して受信し、受信した値を映像読出部202に設定する。これにより、映像読出制御パラメータ決定部216で決定されたフレームレート及び解像度で映像が読み出され、フレーム画像として送信されるようになる。また、後述する認識対象領域設定部215により設定された認識対象領域を、LANケーブル105を介して受信し、受信した値を映像読出部202に設定する。これにより、認識対象領域設定部215により設定された認識対象領域を、撮像素子から読み出し、フレーム画像として送信されるようになる。
【0022】
210はPCであり、図1のPC106に相当する。211は、映像受信部であり、PC210上のネットワークインターフェース808を介してパケットデータを受信する。そして、受信したパケットデータよりフレーム画像へ戻し、物体認識部212へ出力する。212は、物体認識部であり、映像受信部211より入力されたフレーム画像に所望の物体が映っているかどうかを認識する。
【0023】
213は、認識結果分析部であり、物体認識部212で認識した結果を分析する。214は、出力部であり、認識結果分析部213の分析結果を、例えば、表示器807に表示するように出力する。215は、認識対象領域設定部であり、フレーム画像中でユーザが所望する物体を認識する領域を、ユーザがキーボード804、マウス805などを使用して、設定するものである。
【0024】
216は、映像読出制御パラメータ決定部であり、認識結果分析部213による認識結果の分析結果より、フレームレートと解像度とを決定する。決定結果は、LANケーブル105を介してカメラ200に送信される。
【0025】
次に、本実施形態における処理の流れについて図4のフローチャートを用いて説明する。本実施形態の画像処理装置の処理は、映像処理制御パラメータ設定モード時の処理と人数カウントモード時の処理とに大きく分かれる。まず、カメラを設置後や、認識対象領域の変更を行う場合など、人数のカウントを開始する前は、映像処理制御パラメータ設定モードとし、ステップS401からステップS410までの処理において、フレームレートと解像度を最適化する処理を行う。その後、人数カウントモードに移行し、人数のカウント処理(ステップS412からステップ416)を開始する。
【0026】
まず、ステップS400において、映像処理制御パラメータ設定モードであるかどうかを判定する。設定モードでないときは、ステップS401からステップS410をスキップする。本映像処理制御パラメータ設定モードは、一般的に人数をカウントするための初期設定を行うためのモードである。
【0027】
次に、ステップS401において、認識対象領域設定部215は、認識対象領域を設定する。具体的には、ユーザがキーボード804やマウス805を用いて、図6の認識対象領域604、605に示すような矩形領域をフレーム画像内に指定する。なお、本実施形態では説明のために一箇所のみ指定するものとして説明する。認識対象領域設定部215は、指定された矩形領域を認識対象領域として、カメラ200の映像読出制御パラメータ設定部204へ、ネットワークを介して送信する。
【0028】
なお、認識対象領域の設定時は、カメラ200は撮像素子全体を画素飛ばし読みをすることにより、640×480画素などでPC210へフレーム画像として送信する。例えば、640×480画素の100倍の画素数を持つ撮像素子(6400×4800画素)であれば、縦方向、横方向それぞれ10画素に1回、画素を読み出すようにすればよい。設定後は、カメラ200は認識対象領域のみをフレーム画像としてPC210へ送信する。なお、ユーザの設定・確認用に常に別のチャンネルで撮像素子全体をフレーム画像として送信するようにして、出力部214には、こちらのフレーム画像を表示するようにしてもよい。
【0029】
次に、ステップS402において、映像読出制御パラメータ決定部216は、初期値として認識対象領域の解像度を利用可能な上限の値に設定する。この値は、映像読出部202の撮像素子からの画像の読み出し能力、映像送信部203の送信能力、ネットワークの帯域の広さによって決まる。従って、決定方法としては、まず、カメラ200に対してネットワークを介して問い合わせを行い、カメラ200で利用可能な解像度とフレームレートの組み合わせを得る。例えば、640×480画素で2fps(フレーム毎秒)、320×240画素で8fpsといった情報である。この組み合わせの中から、解像度を上限の値に設定する(前記例では、640×480画素)。なお、フレームレートは必然的に下限の値を設定することになる(前記例では、2fps)。
【0030】
次に、ネットワークを介して映像読出制御パラメータ設定部204へ送信する。そして、映像読出制御パラメータ設定部204は、映像読出部202を、解像度を上限の値に、フレームレートを下限の値になるように制御する。もし、ユーザの設定した認識対象利用域内の撮像素子の画素数が、指定した解像度よりも多いときは前述したように撮像素子の画素を飛ばし読みすることで、所望の解像度を得る。
【0031】
次に、ステップS403において、第1の認識として物体を認識して物体のサイズで最小の値を求める。以下、処理の詳細を示した図10のフローチャートを用いて述べる。図10は、図4のステップS403の詳細な処理手順の一例を示すフローチャートである。
図10のステップS1001からステップS1003において、所定時間分の認識を行うが、このとき、ユーザは指定した認識対象領域内を予め決められたパターンで歩行する。例えば、認識対象領域の上端から下端までの往復を繰り返すように歩行する。これは認識する内容を予め決めておくことにより、後の認識結果の分析を容易にするためである。
【0032】
まず、ステップS1001において、映像受信部211によってフレーム画像を受信し、物体認識部212へ出力する。ここで読み込まれた画像データは、例えば8ビットの画素により構成される2次元配列のデータであり、R、G、B、3つの面により構成される。このとき、画像データがJPEG等の方式により圧縮されている場合は、画像データを所定の解凍方式にしたがって解凍し、RGB各画素により構成される画像データとする。さらに、本実施形態では、RGBデータを輝度データに変換し、輝度画像データを以後の処理に適用するものとし、不図示の画像メモリに格納する。画像データとしてYCrCbのデータを入力する場合はY成分をそのまま輝度データとしてもよい。
【0033】
次に、ステップS1002において、物体認識部212は、内部の画像メモリに転送された画像データから辞書データと照合を行い、認識対象領域設定部215で設定された領域に対して、所望の物体を認識する。物体認識方法については、例えば、ニューラル・ネットワークにより画像中の顔パターンを検出している。以下、その方法について簡単に説明する。
【0034】
まず、顔の検出を対象とする画像データをメモリに読み込み、顔と照合する所定の領域を読み込んだ画像中から切り出す。そして、切り出した領域の画素値の分布を入力としてニューラル・ネットワークによる演算で一つの出力を得る。このとき、ニューラル・ネットワークの重み、閾値が膨大な顔画像パターンと非顔画像パターンによりあらかじめ学習されており、例えば、ニューラル・ネットワークの出力が0以上なら顔、それ以外は非顔であると判別する。ここで、重みや閾値が辞書データとなる。そして、ニューラル・ネットワークの入力である顔と照合する画像パターンの切り出し位置を、例えば、図7に示すように画像全域から縦横順次に走査していくことにより、画像中から顔を検出する。また、様々な大きさの顔の検出に対応するため、図7のA列に示すように読み込んだ画像を所定の割合で順次縮小し、それに対して前述した顔検出の走査を行うようにしている。
【0035】
また、処理の高速化に着目した例としては、AdaBoostを使って多くの弱判別器を有効に組合せて顔判別の精度を向上させる。一方、夫々の弱判別器をHaarタイプの矩形特徴量で構成し、しかも矩形特徴量の算出を、積分画像を利用して高速に行っている。また、AdaBoost学習によって得た判別器を直列に繋ぎ、カスケード型の顔検出器を構成するようにしている。このカスケード型の顔検出器は、まず前段の単純な(すなわち計算量のより少ない)判別器を使って明らかに顔でないパターンの候補をその場で除去する。そして、それ以外の候補に対してのみ、より高い識別性能を持つ後段の複雑な(すなわち計算量のより多い)判別器を使って顔かどうかの判定を行っており、すべての候補に対して複雑な判定を行う必要がないので高速である。
【0036】
次に、ステップS1003において、所定時間経過しているかどうかを判定し、経過していない場合は、ステップS1001からステップS1002の処理を繰り返す。経過している場合は、ステップS1004へ進む。
【0037】
次に、ステップS1004において、認識結果分析部213は、所定時間分の認識結果を分析し、映像受信部211で受信したフレーム画像から物体認識部212で認識した顔の最小サイズを求める。顔の最小サイズは、所定時間内に認識された結果を、顔のサイズについてヒストグラムを取り、顔のサイズが小さい方から順に見て、所定数以上の頻度があるサイズを採用する。
【0038】
図4の説明に戻り、次に、ステップS404において、映像読出制御パラメータ決定部216は、ステップS403で求めた顔の最小サイズより、認識するのに必要な解像度の下限値を決定する。このとき、解像度決定処理では、認識可能な最小サイズにより解像度が決定される。図7を用いて説明したように、照合に使用する画像パターンは所定のサイズであり、走査を行う画像を縮小していくことで、様々なサイズの顔を認識する。従って、図7のA列の先頭のフレーム画像のサイズ(縮小を行う前のサイズ)に対する画像パターンのサイズが、認識可能な最小のサイズになる。
【0039】
例えば、照合に使用する画像パターンが20×20画素である場合、フレーム画像の解像度が640×480画素であるときは、もちろん認識可能な顔の最小サイズは20×20画素である。ここで、後述するステップS406で得られた顔の最小サイズが40×40画素であったとする。照合に使用する画像パターンに比べて縦横それぞれ2倍であるから、フレームの解像度は640×480画素の縦横がそれぞれ1/2であれば十分である。従って、必要なフレーム画像の解像度の下限値は320×240画素と決定できる。
【0040】
次に、ステップS405において、解像度をステップS404で決定された値(前記例では、320×240画素)に変更し、フレームレートをこのとき取り得る上限の値(前記例では、8fps)に変更する。そして、ステップS402と同様に、解像度及びフレームレートについて、この変更した値を、ネットワークを介して映像読出制御パラメータ設定部204へ送信する。そして、映像読出制御パラメータ設定部204は、解像度をステップS404で決定された値になるように映像読出部202を制御し、さらにフレームレートをこのときとりうる上限の値になるように映像読出部202を制御する。
【0041】
次に、ステップS406において、第2の認識として物体を認識して物体の移動速度を求める。本処理の詳細は、ステップS403と概ね同じであるので、以下に違いのあるステップS1004についてのみ述べる。この場合、ステップS1004においては、認識結果分析部213は所定時間分の認識結果を分析し、映像受信部211で受信したフレーム画像から物体認識部212で認識した顔の移動速度を求める。
【0042】
顔の移動速度は、2つのフレーム間の認識された顔の位置の間の距離(画素数)を求めればよい。2つのフレーム間の時間はフレームレートから判別することができる。また、認識位置の精度のばらつきを除くため、所定時間分、前述の方法で移動速度を算出し、その平均値を顔の移動速度とする。
【0043】
次に、ステップS407において、映像読出制御パラメータ決定部216は、ステップS406で求めた顔の移動速度より、認識するのに必要なフレームレートの下限値を決定する。フレームレート決定処理では、ステップS406で求めた認識対象領域内の顔の移動速度と前後のフレームの認識結果の位置ずれの許容範囲とによってフレームレートが決まる。人数をカウントするには、後述するようにフレームごとの認識結果から、同一の人物ごとに軌跡を作成する必要がある。即ち、前後のフレーム間の認識結果が同一人物の顔のものであるかどうかが判定できなければならない。例えば、前後のフレーム間で認識結果が重ならなくなると同じ顔であったかどうかの判断は難しくなる。そこで、前後のフレームの認識結果が常に重なる範囲の位置ずれを、許容範囲とすることができる。
【0044】
例えば、ステップS406で得られた顔の最小サイズより、解像度は320×240画素となっている。このとき、フレームレートは320×240画素で取り得る値の上限値が8fpsであったとする。ここで、認識可能な顔のサイズは20×20であるので、2つの認識結果が認識可能な顔サイズ1辺の20画素以上ずれると重ならなくなる。例えば、図9に示すように、2つの認識結果901、902があり、長さ903を2つの中心間の距離とする。この長さ903は1辺の半分の10画素の2倍に相当するので20画素になる。つまり、前後のフレーム間で20画素以上ずれると認識結果が重ならなくなる。そこで、許容する位置ずれの範囲を15画素以内とする。認識した結果、8fpsで計測すると移動量が30画素であったとすると、16fpsにすれば、15画素となり、前記許容する位置ずれの範囲内となる。
【0045】
ステップS408において、ステップS407で決定されたフレームレートの下限値が、ステップS404で決められた解像度で取り得る値の上限を超えているかどうかチェックする。前述の例では、8fpsが上限であったときに、16fps必要である場合は、上限を超えてしまっている。この場合、16fpsを確保できるようにするためには、解像度を低くしなければならないが、解像度は既に認識に必要な下限値となっている。従って、認識対象領域を狭く設定し直すことで、検出最小サイズがより大きくなるようにする。即ち、認識に必要な解像度が320×240画素の半分となるまで、認識対象領域を狭くする必要がある。
【0046】
そこで、ステップS408のチェックの結果、上限を超えた場合は、ステップS409において、例えば「認識対象領域を狭く設定しなおしてください。」などのようなアラートメッセージを出力部214に表示し、ユーザに認識対象領域の再設定を促す。そして、ステップS401に戻り、ユーザが再設定を行うと、既に説明したステップS402からステップS407の処理が再度行われる。
【0047】
一方、ステップS408のチェックの結果、ステップS407で決定されたフレームレートの下限値が、ステップS404で決められた解像度で取り得る値の上限を超えていない場合は、ステップS410へ進む。そして、ステップS410において、ネットワークを介してカメラ200の映像読出制御パラメータ設定部204へ前記フレームレートの値(下限値)を送信する。そして、映像読出制御パラメータ設定部204は、映像読出部202が、ステップS407で求めたフレームレートの映像を送信するようパラメータを設定する。これにより、以降、撮像部201で撮像されたフレーム画像は映像読出制御パラメータ決定部216によって決定されたフレームレートと解像度で、映像読出部202によって読み出され、映像送信部203によって送信される。
【0048】
ステップS411は終了判定であり、電源OFFやキーボード804やマウス805によりユーザからの指示があるまで、後述するステップS412からステップS416の処理を繰り返す。そして、ステップS412においては、フレーム画像を映像受信部211によって受信し、物体認識部212へ出力する。
【0049】
次に、ステップS413において、ステップS412にて入力されたフレーム画像について、物体認識部212にて物体の認識を行う。詳細は図10のステップS1002と同じであるので説明は省略する。次に、ステップS414において、認識結果分析部213は、現在から所定時間前までの間に検出された被写体領域をRAM803より読み出し、軌跡を生成する。この処理は、所定時間内に検出された複数ある顔のうち、どれが同一の人物の動きに対応するかを求める処理である。
【0050】
ステップS414の処理の詳細について図3を用いて説明する。図3において、301は撮像しているフレーム全体である。ここで、所定の時間に検出された顔の領域303〜305を、矩形で表現して重ね描きしている。図3の例では、3フレーム分が重ね描きしており、最も古いフレームでは領域303が、次のフレームでは領域304が、その次の現在のフレームでは、領域305が検出されているものとする。これらの軌跡を求める方法としては、各領域の中心を求め、各領域の中心間の距離が最小となるもの同士を同一の被写体とみなし、線分で接続するようにすればよい。図3に示す例では、軌跡309がこのようにして求めた軌跡となる。
【0051】
次に、ステップS415において、認識結果分析部213はステップS414で作成された軌跡が、所定の条件を満たすかどうかをチェックし、条件を満たしていればカウントする。ここで所定の条件とは例えば、図3に示すような計測ライン302を横切っているかどうかについてである。なお、この計測ライン302は、ユーザによってフレーム画面内に設定される。また、図3の例では、軌跡309が計測ライン302を横切っているので、1とカウントされる。もし、まだ、計測ライン302を横切っていない軌跡が存在すれば、この時点では、カウントされない。
【0052】
次に、ステップS416において、出力部214でカウントされた結果をユーザに対して表示する。そして、ステップS400へ戻る。以上のように、所定時間分の認識結果から認識に必要な入力映像のフレームレートと解像度を求めることにより、ユーザにより設定された認識対象領域が適切であるかどうかを判定し、ユーザへ警告または通知することが可能となる。
【0053】
本実施形態では、顔の位置を検出する例で説明したが、人体全体や上半身、頭部など人物の様々な部位や、自動車や自転車など、様々な物体においても適用可能である。また、本実施形態では、認識対象領域が適切でない場合、アラートを出して、ユーザに再設定をさせたが、認識手対象領域を自動的に補正するようにしてもよい。本実施形態で挙げた例では、必要なフレームレートを確保するために320×240画素の半分にする必要があった。このような解像度を確保できるまで、認識対象領域を、その中心位置を変えずに、各辺を漸次、短くするようにすればよい。
【0054】
さらに本実施形態では、カメラとPCをネットワークで接続した構成とした。しかしながら本発明の適用範囲はこれに限ったものではない。例えば、カメラ内で物体認識や認識結果分析を行うように構成してもよい。
【0055】
(その他の実施形態)
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
【符号の説明】
【0056】
201 撮像部、202 映像読出部、203 映像送信部、204 映像読出制御パラメータ設定部、211 映像受信部、212 物体認識部、213 認識結果分析部、214 出力部、215 認識対象領域設定部、216 映像読出制御パラメータ決定部

【特許請求の範囲】
【請求項1】
撮像手段と、
前記撮像手段により得られた映像から認識対象領域を指定する指定手段と、
前記指定手段により指定された認識対象領域の映像を取得する取得手段と、
前記取得手段により取得された映像の解像度とフレームレートとを制御する制御手段と、
前記制御手段により上限の解像度に制御された映像から移動する物体の大きさを認識する第1の認識手段と、
前記第1の認識手段による認識結果を基に、映像の解像度を決定する解像度決定手段と、
前記解像度決定手段により決定された解像度と、前記制御手段により前記解像度で取り得るフレームレートの上限に制御された所定の領域の映像から前記物体の移動速度を認識する第2の認識手段と、
前記第2の認識手段による認識結果を基に、映像のフレームレートを決定するフレームレート決定手段と、
前記フレームレート決定手段により決定されたフレームレートが、前記解像度で取り得るフレームレートの上限を超えた場合に、ユーザに警告を発する警告手段とを備えたことを特徴とする画像処理装置。
【請求項2】
撮像手段と、
前記撮像手段により得られた映像から認識対象領域を指定する指定手段と、
前記指定手段により指定された認識対象領域の映像を取得する取得手段と、
前記取得手段により取得された映像の解像度とフレームレートとを制御する制御手段と、
前記制御手段により上限の解像度に制御された映像から移動する物体の大きさを認識する第1の認識手段と、
前記第1の認識手段による認識結果を基に、映像の解像度を決定する解像度決定手段と、
前記解像度決定手段により決定された解像度と、前記制御手段により前記解像度で取り得るフレームレートの上限に制御された所定の領域の映像から前記物体の移動速度を認識する第2の認識手段と、
前記第2の認識手段による認識結果を基に、映像のフレームレートを決定するフレームレート決定手段と、
前記フレームレート決定手段により決定されたフレームレートが、前記解像度で取り得るフレームレートの上限を超えた場合に、前記認識対象領域を変更する変更手段とを備えたことを特徴とする画像処理装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate


【公開番号】特開2012−48476(P2012−48476A)
【公開日】平成24年3月8日(2012.3.8)
【国際特許分類】
【出願番号】特願2010−189712(P2010−189712)
【出願日】平成22年8月26日(2010.8.26)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】