説明

映像解析装置及びシステム

【課題】 多様な動的物体が現れるシーンを高速に解析する映像解析装置を提供する。
【解決手段】 入力された映像のフレーム画像102から、動的な物体が存在する領域を検出する動的物体領域検出部103と、この検出された動的物体領域検出部で検出された物体のカテゴリを判別する物体カテゴリ判別部104とを有し、この物体領域と物体カテゴリ判別部で判別されたカテゴリから、映像中の各座標において物体が現れる確率を表す「存在確率マップ」を生成し、それを時系列データで保存することで、一定のタイムスパンにおける各カテゴリの存在確率マップを生成する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、映像中の動的物体の解析を行うための映像解析装置、システムに関するものである。
【背景技術】
【0002】
映像監視システムにおいては、映像中の動的物体を検出し、検出された物体を解析・検索する機能が実用化されている。例えば、映像中から人物の顔領域を検出し、過去に蓄積された顔画像と照合することで、不審人物や重要人物が写った際にユーザに通知する、といった機能を備える映像監視システムが存在する。
【0003】
検出対象の物体は、現在のところ人物の顔が最も一般的であるが、今後例えば、車両や種々の物品など多様な動的物体を検出・解析対象に入れることが望まれている。ここで、処理の軽減を図るために、解析処理効率の向上が必要とされている。
【0004】
解析処理効率の向上に関して、例えば特許文献1には、物体の存在確率を利用して、物体領域を検出するための画像処理を実施する領域を限定する手段が示されている。特許文献1の手法は、焦点距離や解像度など、撮像系の静的な情報を利用して、画像処理を行う領域を決定するものであり、車載カメラのように撮影環境や撮影機器が限定された環境では有効である。
【0005】
一方、画像照合以外でのシーン解析手法としては、特許文献2において、人物の動線をデータベースに保存しておくことで、特定の人物行動を表す条件データに該当する人物が現れたシーンを検索する方法について述べている。動線による検索は、ひとつの物体の動作に着目したシーン検索を行うのには有効である。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2010-003254号
【特許文献2】特開2009-284167号
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、監視カメラのように、撮影状況や映像中の被写体の位置が事前に予測できない環境(非統制環境)において、特許文献1の手法を適用することはできない。
【0008】
また、特許文献2では、不正行為等の特定の行為の検出には有効であるが、多様な動的物体が現れるシーンを高速に解析するものではない。
【課題を解決するための手段】
【0009】
本発明に係る映像解析装置は、入力された映像のフレーム画像から、動的な物体が存在する領域を検出する動的物体領域検出部と、この検出された動的物体領域検出部で検出された物体のカテゴリを判別する物体カテゴリ判別部とを有し、この物体カテゴリ判別部で判別されたカテゴリ毎に、前記検出された動的物体領域(座標又は場)において物体が現れる確率を表す「存在確率マップ」を生成し、それを時系列データで保存することで、一定のタイムスパンにおける各カテゴリの存在確率マップを生成する。
【発明の効果】
【0010】
上記構成により、映像空間における物体の存在確率マップを、物体のカテゴリ毎に求めることができる。その結果、存在確率マップを利用して、物体検出処理における画像認識処理の実施領域を限定することで、物体検出を高速化することが可能である。
【図面の簡単な説明】
【0011】
【図1】本発明による映像解析システム100の機能ブロック図である。
【図2】本発明による映像解析システム100における存在確率マップの生成を説明するための図である。
【図3】本発明による映像解析システム100における存在確率マップの生成処理手順を表すフローチャートである。
【図4】複数カテゴリの物体検出の一例を説明するための図である。
【図5】複数カテゴリの物体検出の一例の処理手順を表すフローチャートである。
【図6】物体検出の信頼度を算出する処理手順を表すフローチャートである。
【図7】存在確率マップを用いた物体検出の高速化を説明するための図である。
【図8】存在確率マップを用いた物体検出の高速化の処理手順を表すフローチャートである。
【図9】存在確率マップを用いた異常シーン検知を説明するための図である。
【図10】存在確率マップを用いた異常シーン検知の処理手順を表すフローチャートである。
【図11】存在確率マップを用いた類似シーン検索を説明するための図である。
【図12】類似シーン検索用の映像データベースの構成とデータ例を示す図である。
【図13】類似シーン検索システムの構成を示す図。
【図14】類似シーン検索のシーケンスを示す図。
【図15】マーケティングへの応用の実施例を説明する図。
【図16】PTZカメラを用いた広域存在確率マップ生成の実施例を説明する図。
【図17】時刻毎の広域存在確率マップを用いたカメラのPTZ制御の実施例を説明する図。
【発明を実施するための形態】
【0012】
以下、図面を参照して、本発明の好適な実施例について詳細に説明する。
【実施例1】
【0013】
図1は、映像解析システム100の全体構成図の一例である。映像解析システム100は、映像入力装置101、操作情報入力装置107、表示装置110、計算機111から構成される。計算機111は、映像入力部102、動的物体領域検出部103、物体カテゴリ判別部104、存在確率算出部105、存在確率蓄積部106、操作情報入力部108、存在確率出力部109、を備え、汎用のコンピュータ上に実装可能である。映像入力装置101は、映像再生機器やカメラなど、外部映像をシステムに取り込むための入力インタフェースである。
【0014】
映像入力部102は、映像入力装置101から映像データを受け取り、フレーム画像(静止画像)に変換し、動的物体領域検出部103に出力する。
【0015】
動的物体領域検出部103は、映像入力部102からフレーム画像を受け取り、画像認識処理によってフレーム画像中で動的物体が映っている領域の座標を特定する。なお、動的物体とは、それ自身で移動可能な物体を意味するもので、動物や車、自転車等が挙げられる。本実施例において動的物体領域検出部103では、複数の種類(カテゴリ)の物体を検出できるものとする。動的物体領域検出部103は、検出した物体領域の座標情報と検出結果の信頼度を出力する。例えば、物体領域は矩形データとして導出され、座標情報は[矩形の左上隅の水平座標, 矩形の左上隅の垂直座標, 矩形の右下隅の水平座標, 矩形の右下隅の垂直座標]という形式で出力される。検出結果の信頼度は、矩形画像の「物体らしさ」を表す値である。
【0016】
物体カテゴリ判別部104は、動的物体検出部103で検出された領域に映っている物体の意味論的カテゴリを特定する。カテゴリは、例えば、「人」や「車」などである。カテゴリの粒度に関しては、使用目的と判別精度に応じて自由に変更可能であり、例えば、「人」カテゴリをさらに分類し、「男性」、「女性」のように下位カテゴリを出力しても良い。
【0017】
存在確率算出部105は、カテゴリ毎に存在確率マップを生成する。存在確率算出部105は、まず、動的物体検出部103で検出された矩形データと信頼度、および物体カテゴリ判別部104で求められたカテゴリを用いて、単一フレームの存在確率マップを導出する。存在確率マップはカメラ映像のXY座標に対応するテーブル状のデータ構造であり、各座標における存在確率は、例えば、単純に検出領域の信頼度を元に算出される。単一フレームの存在確率マップは、存在確率蓄積部106に、時系列データとして格納される。次に、存在確率蓄積部106から一定のタイムスパンの存在確率マップを読み出し集計することで、そのタイムスパンにおける存在確率マップを生成し、存在確率出力部109に出力する。
【0018】
存在確率蓄積部106は、存在確率算出部105で計算されたカテゴリ毎の存在確率マップを時系列データとして保存する。
【0019】
操作情報入力装置107は、マウスやキーボード、タッチデバイスなど、ユーザの操作をシステムに伝えるための入力インタフェースである。
【0020】
操作情報入力部108は、操作情報入力装置107から入力されたユーザの操作情報を、存在確率算出部105に伝える。例えば、存在確率蓄積部106で保持されている存在確率を初期化したり、存在確率を蓄積するタイムスパンを指定したりするための指示をシステムに伝える。
【0021】
存在確率出力部109は、存在確率算出部105で算出された存在確率マップのデータを解析結果として表示装置110に出力する。
【0022】
表示装置110は、液晶ディスプレイやCRTなどの出力インタフェースであり、存在確率出力部109から受け取った解析結果を画面表示する。
【0023】
図2は、存在確率算出部105が、存在確率マップを生成する様子を示す図であり、左から右への時系列での処理を表す。201、202、203は、映像入力部102で抽出されたフレーム画像である。画像中の太枠の矩形は、動的物体領域検出部103で検出された物体の領域を表す。フレーム画像201では、「車」と「人」という2種類のカテゴリの物体が検出されている。この結果を元に、それぞれ存在確率マップ204、207を算出する。存在確率マップの各座標の値は、該当する物体領域の信頼度に比例した値とする。次のフレーム画像202についても同様に存在確率マップを求め、フレーム画像201で生成した存在確率マップと合わせて集計する。集計方法は、例えば、時系列データにおける各座標の信頼度の最大値または平均値を用いる方法がある。この結果、205や208のような2フレームのタイムスパンにおける存在確率マップが生成される。以上の処理をフレーム画像203まで繰り返すことで、最終的に206や209のような存在確率マップが生成される。このように、データ自体は「点」である座標で管理し、更新時や利用時には、領域単位で「場」として管理する。
【0024】
図3は、映像解析システム100が存在確率マップを出力する処理を説明するフローチャートである。以下、図3の各ステップについて説明する。
【0025】
ステップS301では、映像入力部102において、入力画像からフレーム画像(静止画像)を取得する。フレーム画像は、一定の時間間隔で繰り返し取得される。ここで、入力映像は必ずしも固定カメラからの映像である必要はなく、映像の座標と存在確率マップの座標との対応がとれていれば、自由視点カメラを用いても良い。以下では、簡略のために、固定カメラを用いた場合について説明する。
【0026】
ステップS302では、動的物体領域検出部103によって、ステップS301で取得したフレーム画像に対して画像認識処理を行い、動的物体領域の座標データを求める。検出処理においては、各動的物体領域に対して「物体らしさ」を表す信頼度が与えられるものとする。複数カテゴリの物体検出を行う方法は様々であるが、その一例として複数テンプレートを用いた照合手法に基づく方法について図4の説明として後述する。
【0027】
ステップS303では、処理対象のフレーム画像に関する存在確率マップを初期化する。ここでは、物体カテゴリ判別部104で判別可能なカテゴリ数と同数の存在確率マップを作成する。
【0028】
ステップS304からステップS307は、動的物体領域検出部103で検出された全ての領域に対する繰り返し処理である。
【0029】
ステップS305では、物体カテゴリ判別部104によって、検出された物体のカテゴリを判定する。判定方法は、例えば、ステップS302で複数テンプレートを用いた照合手法を用いた場合は、対象物体と一致したテンプレートのカテゴリを出力すれば良い。
【0030】
ステップS306では、ステップS305で判定されたカテゴリについての存在確率マップを更新する。本ステップでは、物体領域に対応する座標の値として、領域の信頼度に比例した値を設定する。すでに設定済みの場合は、大きい方の値を採用する。
【0031】
ステップS308では、各カテゴリの単一フレームにおける存在確率マップを、存在確率蓄積部106に保存する。
【0032】
ステップS309では、一定のタイムスパンにおける存在確率マップを存在確率蓄積部106から読み出し、カテゴリごとに集計する。集計方法としては、図2の説明で述べたとおり、最大値や平均値を用いる。
【0033】
ステップS310は、ステップS309で求めた一定のタイムスパンにおける存在確率マップを、存在確率出力部109に出力する。
【0034】
ステップS311は、映像入力部102において全てのフレーム画像の切り出しが終わっていれば、本処理フローを終了する。処理が済んでいないフレーム画像が残っていれば、ステップS301に戻り、次のフレーム画像を処理する。
【0035】
以上、本発明の映像解析システムにおける、存在確率マップの生成処理について説明した。次に、図4を用いて、図3のステップS302における複数カテゴリの動的物体領域の検出方法の一例について説明する。以下で説明する手法は、複数テンプレートに対する照合手法に基づく物体検出手法である。
【0036】
図4が表す方法では、予め、検出したい物体の典型的な画像(テンプレート)の画像特徴量を抽出し、テンプレートデータベースに保存しておく。画像特徴量は、色特徴や形状特徴など画像そのものが有する特徴を数値化したものであり、例えば固定長ベクトルデータで与えられる。
【0037】
入力画像401が与えられると、まず、走査窓402の位置やサイズを機械的に変更して、物体の候補領域を抽出する。次に、全ての候補領域に対して、予め用意した複数のテンプレートの中から、特徴量ベクトル空間上での最近傍テンプレートを探索する。最近傍のテンプレートとのベクトル間距離が閾値以下であれば、物体であると判定して、候補領域を検出結果に加える。このとき、最近傍テンプレートとの距離を検出結果の信頼度として用いる事ができる。
【0038】
図5のフローチャートを用いて、複数カテゴリの物体検出の一例の処理手順を説明する。
【0039】
ステップS501は、入力画像から候補領域を抽出する。候補領域は、走査窓を一定ステップ毎に移動、サイズ変更することで、機械的に抽出される。全ての候補領域について、ステップS502〜ステップS506の処理を行う。
【0040】
ステップS503では、候補領域の信頼度を算出する。信頼度の算出方法としては、図4で述べたように、複数テンプレートとの特徴量ベースの照合を用いる方法がある。処理手順については、図6のフローチャートで詳しく説明する。また、別の方法として、機械学習ベースの識別器を用いる方法も知られている。この場合は、システムが扱うカテゴリの数だけ識別器を用意する必要がある。
【0041】
ステップS504では、ステップS503で求めた候補領域の信頼度が閾値以下であれば、ステップS505に移動し、それ以外はステップS505をスキップする。
【0042】
ステップS505は、処理中の候補領域を検出結果リストに追加する。
【0043】
全ての候補領域に対して、ステップS502〜ステップS506の処理が済んだ場合、ステップS507は検出結果リストを出力し、本処理フローを終了する。検出結果は、領域の座標情報(例えば、[矩形の左上隅の水平座標, 矩形の左上隅の垂直座標, 矩形の右下隅の水平座標, 矩形の右下隅の垂直座標])と信頼度の組として出力される。
【0044】
図6は、図5のステップS503における、候補領域の信頼度を算出する処理手順を表すフローチャートである。図6は、図4で説明した複数テンプレートとの照合手法に基づく信頼度算出方法である。
【0045】
ステップS601では、最近傍テンプレートT=null、最近傍テンプレートからの距離d=0、として状態を初期化する。
【0046】
ステップS602では、候補領域の画像特徴量を抽出する。画像特徴量は、図4で述べたテンプレートデータベースと同様の方法で抽出する。
【0047】
次に、テンプレートデータベースの全てのテンプレートに対して、ステップS603〜ステップS607の処理を行う。
【0048】
ステップS604では、入力画像と処理対象のテンプレートT’との特徴量ベクトル間距離d’を求める。
【0049】
ステップS605では、ステップS605で求めた距離がdより小さければステップS606に移動し、そうでなければ、ステップS606をスキップする。
【0050】
ステップS606は、最近傍テンプレートTを処理中のテンプレートT’に置き換え、最近傍テンプレートからの距離dをステップS604で求めたd’に置き換える。
【0051】
データベース中の全てのテンプレートに対して処理が済んだ場合、ステップS601に移動する。
【0052】
ステップS601では、候補領域の信頼度を出力する。信頼度は、例えば、最近傍テンプレートからの距離dの逆数1/d(d≠0)と定義できる。
【0053】
以上、映像解析システム100による、存在確率マップの生成手法について説明した。映像解析システム100は、映像入力部102において、入力映像からフレーム画像を切り出し、動的物体領域検出部103と物体カテゴリ判別部104において、フレーム画像中の物体の位置、カテゴリ、検出の信頼度を算出する。これらの情報から、存在確率算出部105では、処理中のフレーム画像における存在確率マップをカテゴリ毎に生成する。また、存在確率蓄積部に保存された存在確率マップの時系列データを集計することで、一定のタイムスパンにおける存在確率マップを求める。これにより、映像中の特定の場所に特定カテゴリ物体が現れる可能性を求めることができる。
【実施例2】
【0054】
以下では、存在確率マップを利用した物体検出の高速化について述べる。
【0055】
図4〜図6で述べたように、画像中から複数カテゴリの物体を検出する場合、全ての候補領域に対して、全てのテンプレートとの照合処理を行う必要があり、処理負荷が非常に大きい。これは機械学習によるカテゴリ毎の識別器を用いて判別を行う場合でも同様である。
【0056】
そこで、本発明では、存在確率マップを利用し、対象カテゴリが現れにくい領域については認識処理を省略することにより、物体検出の高速化を実現する。以下、図7と図8を用いて、処理手順を説明する。
【0057】
図7は、存在確率マップを用いた物体検出の高速化を説明するための図である。
【0058】
図7の例においては、あらかじめ映像解析装置100を用いて、「車」カテゴリの存在確率マップ702と「人」カテゴリの存在確率マップ704が生成済みであるとする。
【0059】
フレーム画像701が入力されると、「車」、「人」それぞれの存在確率マップをチェックし、存在確率の高い領域(703、705の太枠の内側)のみを、抽出手段によって抽出し、検出処理対象とする。また、「車」カテゴリの存在確率が高い領域については、「車」カテゴリのテンプレート707だけを使って、信頼度を求める。同様に「人」カテゴリの存在確率の高い領域については、「人」カテゴリのテンプレート708だけを使って、信頼度を求める。
【0060】
機械学習による識別器を用いる場合も、判別に使用する識別器の数を減らす事ができるため、同様に処理を効率化することができる。
【0061】
このように、候補領域の削減と信頼度計算の簡略化という2段階の効率化によって、検出処理全体が高速化される。検出対象のカテゴリが1種類だけの場合でも、前段の候補領域の削減によって高速な検出が可能である。
【0062】
図8は、存在確率マップを用いた物体検出の高速化の処理手順を表すフローチャートである。図8は、図5の複数カテゴリの物体検出処理を高速化するものである。
【0063】
S801〜S808は、カテゴリ毎の存在確率マップに対する処理である。
【0064】
S802は、図5のステップS501と同様に、候補領域を抽出する処理であるが、存在確率の低い領域は無視される。ここで、存在確率の高い領域か低い領域かは、予め定められた閾値か、あるいはユーザが設定した値を基準とする。
【0065】
S803〜S807は、S802で抽出された全ての候補領域に対する処理である。図5からの変化分はS804の信頼度算出に関する処理である。
【0066】
S804では、対象カテゴリについての候補領域の信頼度を算出する。図5のS503が「物体らしさ」を求めるのに対して、S804では「特定のカテゴリの物体らしさ」を求める。図7の説明で述べたように、カテゴリを限定することによって、例えば、比較対象となるテンプレート数を削減できるため、判別処理を効率化することができる。
【0067】
S805、S806、S809については、図5と同様の処理である。
【0068】
以上、存在確率を用いた物体検出の高速化について説明した。過去に蓄積した存在確率マップを利用することで、新規に入力されたフレーム画像に対する画像処理の処理数を削減することができ、複数カテゴリの物体を効率的に検出することができる。
【実施例3】
【0069】
存在確率マップの別の利用方法として、以下では図9と図10を用いて異常シーン検知について述べる。実施例2では、存在確率の高い領域を利用していたが、ここでは逆に存在確率の低い領域を活用する。
【0070】
図9は、存在確率マップを用いた異常シーン検知の説明のための図である。
【0071】
図9の例において、「人」の存在確率マップ905が事前に生成済みであるとする。
【0072】
フレーム画像901が入力されると、動的物体領域検出部103によって物体検出結果902のように、「人」カテゴリの物体903と904が検出される。ここで、抽出手段によって、存在確率マップ905において存在確率が閾値以下である領域を抽出しておく。次に、検出結果領域の存在確率マップ905上での領域906、907を求める。この例では、領域906は、存在確率の高い領域で検出されているが、領域907は存在確率の低い領域での検出結果となっている。ここで、存在確率の高い領域か低い領域かは、予め定められた閾値か、あるいはユーザが設定した値を基準とする。このような検出結果は、「滅多に起こらない事象」であり、異常シーンとして捉えることができる。実施例3では、異常シーンを検知すると、例えば、表示装置110に警告メッセージを表示する。
【0073】
図10は、存在確率マップを用いた異常シーン検出の処理手順を説明するためのフローチャートである。
【0074】
ステップS1001では、映像入力部102によって、入力映像からフレーム画像を取得する。
【0075】
ステップS1002では、動的物体領域検出部103によって、ステップS1001で取得したフレーム画像中から、物体の領域を特定する。
【0076】
ステップS1003からステップS1008は、ステップS1002で検出された全ての物体領域に対する処理である。
【0077】
ステップS1004では、物体カテゴリ判別部104によって、検出された物体のカテゴリのカテゴリを判別する。
【0078】
ステップS1005では、ステップS1004で判別したカテゴリの存在確率マップを、存在確率蓄積部106から読み出し、検出された領域の存在確率を求める。
【0079】
ステップS1006では、ステップS1005で計算した、検出された領域における物体の存在確率が閾値以下である場合は、ステップS1007に移動し、そうでなければステップS1007をスキップする。ステップS1006の判定処理は、以上のように、単純に領域の存在確率だけを用いてもよいし、それに加えてステップS1002で得られる検出領域の信頼度を利用することもできる。例えば、領域の存在確率をqとし、信頼度から求めた存在確率をpとすると、pとqの確率差の尺度K=p×Log(p/q)+(1−p)×Log((1−p)/(1−q))を用いても良い。Kは、pとqが異なる程、大きな値になるため、Kの値が大きいほど異常なシーンであると捉えることができる。
【0080】
ステップS1007では、異常シーンを検知したことをユーザに伝えるために、表示装置110に警告メッセージを表示する。
【0081】
ステップS1009では、映像に次のフレームが存在すれば、ステップS1001に戻り処理を続行し、そうでなければ本処理を終了する。
【0082】
以上、存在確率マップを利用した異常シーン検知について説明した。存在確率マップを用いることで、システムは入力映像から自動的に異常シーンを発見し、ユーザに警告を出すことができる。
【実施例4】
【0083】
実施例2と実施例3は、存在確率マップをリアルタイムに利用した方法である。以下では、過去の蓄積映像に対して存在確率マップから得られる情報を関連付けて保存しておくことで、類似シーン検索を実現する方法について説明する。
【0084】
図11は、存在確率マップを用いた類似シーン検索を説明する図である。
【0085】
類似シーン検索を行うためは、映像の特徴を表す数値データ(映像特徴量)を算出し、映像データベース1109に保存しておく必要がある。
【0086】
図11の例では、まず、蓄積映像1101に対して、実施例1の映像解析システム100を用いて存在確率マップ1103、1104を導出する。
【0087】
次に、存在確率マップを検索に利用可能な特徴量に変換する。特徴量は、例えば、存在確率マップ1103、1104をそれぞれ1106、1107のように格子状に分割し、各格子における存在確率の平均値を求め、それらを連結してベクトル化することで得られる。
【0088】
図11の例は、「車」「人」という2種類のカテゴリの存在確率マップを用いて特徴量を計算しているが、カテゴリが1種類の時や2種類以上の場合も、各カテゴリに対して同様の処理を適用することで、特徴量ベクトルを得ることができる。
【0089】
得られた特徴量は、映像データを関連付けて、映像データベース1109に登録する。データベースの構造については、後述の図12で改めて説明する。
【0090】
検索を行う際は、クエリ映像1110にたいして、同様に存在確率マップの導出、存在確率マップの特徴量化を行う。
【0091】
この結果、得られた特徴量を、データベースに保存された映像の特徴量と比較し、ベクトル間距離が小さい順に出力する。
【0092】
図12は、映像データベース1109の構成とデータ例を示す図である。ここではテーブル形式の構成例を示すが、データ形式は任意で良い。
【0093】
データベースは、基本項目として、映像IDフィールド1201、映像データフィールド1202、映像特徴量フィールド1203を有する。必要に応じて、他の書誌情報(映像の撮影場所、日時など)を追加しても良い。
【0094】
映像IDフィールド1201は、各映像の識別番号を保持する。映像データフィールド1202は、ユーザが検索結果の確認する際に再生される動画像データを保持する。映像特徴量フィールド1203は、存在確率マップから算出した映像特徴量を保持する。映像特徴量は、例えば、図11のように、各カテゴリの存在確率マップを格子状に分割し、各領域の存在確率の平均値を数値化したものであり、固定長のベクトルデータで表される。
【0095】
図13は、類似シーンの検索を可能とする映像解析装置100の全体構成図である。図13は、図1の構成に映像データベース1109を接続したシステム構成であり、計算機111には特徴量算出部1301と検索結果出力部1302が追加される。
【0096】
特徴量算出部1301は、存在確率算出部105で算出された存在確率マップから、映像特徴量を計算する。映像特徴量は、図12で説明したように、固定長のベクトルデータとして出力される。
【0097】
映像データベース1109は、映像登録時には、特徴量算出部1301で計算された映像特徴量と映像入力部102で入力された映像データを関連付けて格納する。また、類似シーン検索時には、特徴量算出部1301で抽出されたクエリ映像の特徴量とベクトル間距離の近いデータを探し、距離の小さい順に出力する。
【0098】
検索結果出力部1302は、映像データベース1109から得られた検索結果を表示装置110に出力する。
【0099】
図14は、類似シーン検索のシーケンス図である。図14の1401は、映像登録時のデータの流れであり、1402は、類似シーン検索時のデータの流れである。
【0100】
映像登録時1401では、まず、映像入力装置101から入力された映像1403が計算機111に送られる。
【0101】
計算機111では、図3の処理フローに従い、存在確率マップの生成1404が行われる。続いて、特徴量算出部1301において、存在確率マップの特徴量化1405が行われる。最後に、特徴量と映像データの組1406を映像データベース1109に送る。
【0102】
映像データベース1109は、計算機111から送られてきた特徴量と映像データの組1406を関連付けて登録する(1407)。
【0103】
類似シーン検索時1402では、ユーザが操作情報入力部107から検索要求1409を計算機111に対して発行する。この時、映像入力装置101からクエリ映像1408が計算機111に送られる。
【0104】
計算機111では、登録時と同様に、存在確率マップの生成1410、特徴量化1411を行い、クエリ特徴量としてデータベース1109に送信する。
【0105】
データベース1109は、クエリ特徴量とベクトル間距離の近いデータを検索し(1413)、検索結果の類似映像リスト1414を計算機111に返す。
【0106】
計算機111では、類似映像リストを整形して表示データを構成し、表示装置110に送信する。
【0107】
表示装置110は、表示データ1415を検索結果としてユーザに提示する(1416)。
【0108】
以上、存在確率マップを利用した類似シーン検索について説明した。
【0109】
映像の「場」における物体の存在確率に着目した映像特徴量を用いることで、見た目の特徴量を用いただけでは得られない検索結果を取得する事ができ、多様なアプリケーションを実現可能である。
【0110】
例えば、路上カメラ映像において、交通事故の発生現場の映像データをクエリとすることで、人物や車の数に着目して、同様に事故の起きやすい場所や時間帯をさがすことができる。
【0111】
また、マーケティングへの応用として、店舗内の監視映像の検出対象を性別や年齢などに応じて詳細なカテゴリに分けることで、人流が類似する場所やレイアウトを発見することができる。
【0112】
例えば、図15は本発明の類似シーン検索をマーケティングへ応用した際の表示画面例を表す図である。表示画面は、クエリ映像1501、検索条件入力フォーム1502、検索ボタン1503、検索結果表示領域1504から構成され、表示装置110に表示される。
【0113】
この例では、映像データベースには、映像データと特徴量の他に、撮影日時や販促活動の実施状況、販売数の推移などが保存されている。販促活動とは、例えば、商品に関するアナウンスや、デジタルサイネージへの商品情報や売り場情報の表示などである。
【0114】
ユーザは、入力装置101を用いて、クエリ映像1501と追加の検索条件(日時の範囲など)を指定し、検索ボタン1503をクリックする。映像解析装置100は、クエリ映像から存在確率マップを生成し、それを元に計算した特徴量によって、データベースから類似シーンを検索する。またこの時、追加条件によって検索結果の絞り込みを行う。得られた検索結果を、映像と関連付けられた情報と合わせて表示装置110に送ることで、検索結果表示領域1504に類似店舗の情報が表示される。この結果を用いて、ユーザが効果的な販促活動を実施してもよいし、販売数の推移が好ましい店舗と同じ販促活動を自動的に実施してもよい。例えば、デジタルサイネージへの広告表示などは自動化が比較的容易であると考えられる。
【0115】
以上の説明では、固定カメラを前提として処理フローを述べてきたが、図3の説明においても触れたとおり、映像の座標と存在確率マップの座標との対応がとれていれば、広域の存在確率マップを生成することができる。以下では、広域の存在確率マップの生成方法と、その活用例について述べる。
【実施例5】
【0116】
図16は、パン、チルト、ズーム(PTZ)が可能なカメラによって撮影された広域映像から広域の存在確率マップを生成する方法を説明する図である。
【0117】
映像入力装置101のカメラは、PTZを制御することで1601の範囲の映像を撮影可能である。ただし、最大にズームアウトした状態でも一度に1602の範囲しか撮影することができない。
【0118】
そこで、本発明の映像解析装置においては、カメラPTZを制御し、広域映像を複数の部分領域映像(1602、1603、1604など)に分割し、各部分領域映像に対して一定時間映像を撮りため、存在確率マップを生成する。この結果得られた部分領域の存在確率マップを結合することで、広域の存在確率マップ1608を得る。
【0119】
図17は、広域の存在確率マップの活用例として、カメラのPTZの自動制御を表した図である。
【0120】
上記の広域存在確率マップを、時間帯毎に集計することで、その時間に限定した存在確率を求める。1701、1702、1703は、それぞれ6時、12時、18時の時間帯に撮影した映像から得られた存在確率マップである。広域を撮影する場合には、時間帯毎に動的物体が映る可能性の高い領域が変わるため、その時間帯にあったPTZ制御をすることで、有用な映像を重点的に記録することができる。図の例では、6時にはA、B、C、Dの領域に動的物体が多く存在するため、遷移図1704のようにA、B、C、Dを撮影するようにPTZ制御のスケジューリングを行う。同様に、12時には遷移図1705のようにB、C、D、F、G、Hを、18時には遷移図1706のようにF、G、Hを優先的に撮影する。
【符号の説明】
【0121】
100:映像解析装置、101:映像入力装置、102:映像入力部、103:動的物体領域検出部、104:物体カテゴリ判別部、105:存在確率算出部、106:存在確率蓄積部、107:操作情報入力装置、108:操作情報入力部、109:存在確率出力部、110:表示装置、111:計算機

【特許請求の範囲】
【請求項1】
入力された映像のフレーム画像から、動的な物体が存在する領域を検出する動的物体領域検出部と、
前記動的物体領域検出部で検出された物体のカテゴリを判別する物体カテゴリ判別部と、
前記物体カテゴリ判別部で判別されたカテゴリ毎に、前記検出された動的物体領域において物体が現れる確率を表す存在確率マップを生成する存在確率算出部と、
前記存在確率マップを時系列データとして保存する存在確率蓄積部とを有し、
前記存在確率算出部では、前記存在確率蓄積部に保存された前記時系列データの前記存在確率マップから一定のタイムスパンにおけるカテゴリ毎の存在確率マップを生成し、
前記一定のタイムスパンにおけるカテゴリ毎の存在確率マップを出力する存在確率出力部と
を有することを特徴とする映像解析装置。
【請求項2】
更に、前記一定のタイムスパンにおけるカテゴリ毎の存在確率マップから、存在確率が閾値以上の領域を抽出する抽出手段を有し、
前記動的物体検出部は、前記存在確率が閾値以上の領域を対象に、前記動的な物体を検出する
ことを特徴とする請求項1記載の映像解析装置。
【請求項3】
更に、前記一定のタイムスパンにおけるカテゴリ毎の存在確率マップから、存在確率が閾値以下の領域を抽出する抽出手段を有し、
前記動的物体検出部にて、前記存在確率が閾値以下の領域に、前記動的な物体が検出された場合に、異常シーンとして検知する
ことを特徴とする請求項1記載の映像解析装置。
【請求項4】
前記入力される映像は、パン、チルト、ズームが可能なカメラによって撮影された広域映像であることを特徴とする請求項1記載の映像解析装置。
【請求項5】
前記存在確率マップは、時間帯毎に生成され、
前記時間帯毎に、存在確率が高い領域が撮影されるように、前記カメラのパン、チルト、ズームを制御する制御手段を有することを特徴とする請求項4記載の映像解析装置。
【請求項6】
入力された映像のフレーム画像から、動的な物体が存在する領域を検出する動的物体領域検出部と、
前記動的物体領域検出部で検出された物体のカテゴリを判別する物体カテゴリ判別部と、
前記物体カテゴリ判別部で判別されたカテゴリ毎に、前記検出された動的物体領域において物体が現れる確率を表す存在確率マップを生成する存在確率算出部と、
前記存在確率マップから、映像特徴量を算出する特徴量算出部と、
前記映像特徴量と前記入力された映像とを関連付けて格納する映像データベースとを有し、
クエリ映像と類似するシーンの検索要求を受け付けると、前記特徴量算出部で算出された前記クエリ映像の前記映像特徴量と類似する特徴量の映像を、前記映像データベースから検索し、類似映像として出力する
ことを特徴とする映像解析装置。
【請求項7】
映像入力装置と、
前記映像入力装置から入力された映像からフレーム画像を抽出する映像入力部と、
前記フレーム画像から、動的な物体が存在する領域を検出する動的物体領域検出部と、
前記動的物体領域検出部で検出された物体のカテゴリを判別する物体カテゴリ判別部と、
前記物体カテゴリ判別部で判別されたカテゴリ毎に、前記検出された動的物体領域において物体が現れる確率を表す存在確率マップを生成する存在確率算出部と、
前記存在確率マップを時系列データとして保存する存在確率蓄積部と、
前記存在確率算出部では、前記存在確率蓄積部に保存された前記時系列データの前記存在確率マップから一定のタイムスパンにおけるカテゴリ毎の存在確率マップを生成し、
前記一定のタイムスパンにおけるカテゴリ毎の存在確率マップを出力する存在確率出力部と、
前記出力された存在確率マップを表示する表示装置と
を有することを特徴とする映像解析システム。

【図1】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図8】
image rotate

【図10】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図2】
image rotate

【図7】
image rotate

【図9】
image rotate

【図11】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate


【公開番号】特開2013−92955(P2013−92955A)
【公開日】平成25年5月16日(2013.5.16)
【国際特許分類】
【出願番号】特願2011−235601(P2011−235601)
【出願日】平成23年10月27日(2011.10.27)
【出願人】(000005108)株式会社日立製作所 (27,607)
【Fターム(参考)】