映像監視システム及び人数推定方法
【課題】撮像された画像内に存在する人物の人数を推定することが可能な映像監視システム及び人数推定方法を実現する。
【解決手段】撮像機器から取得した映像信号に基づく画像データから方向に関する特徴を算出するとともに、前記方向に関する特徴についてのヒストグラムを所定の大きさの時空間において算出した時空間ヒストグラムを作成し、前記時空間ヒストグラムから動きの複雑さを表す時空間評価値を算出するとともに、前記時空間評価値の時間変化を算出し、前記時空間評価値の時間変化から画像内または特定領域に存在する人数が2人以上の所定人数以上か否かを推定する。
【解決手段】撮像機器から取得した映像信号に基づく画像データから方向に関する特徴を算出するとともに、前記方向に関する特徴についてのヒストグラムを所定の大きさの時空間において算出した時空間ヒストグラムを作成し、前記時空間ヒストグラムから動きの複雑さを表す時空間評価値を算出するとともに、前記時空間評価値の時間変化を算出し、前記時空間評価値の時間変化から画像内または特定領域に存在する人数が2人以上の所定人数以上か否かを推定する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、カメラなどの撮像機器から取得する映像から画像データを記録する機能を有し、いわゆる映像記録装置などの監視装置や画像認識機能による侵入者検知や、移動ロボットなどに搭載する接近者検知などの機能を実現する映像監視システムであって、特に、カメラ内に出現した人物の人数を検出することに優れた映像監視システム及び人数推定方法に関する。
【背景技術】
【0002】
カメラなどの撮像機器から取得した映像に画像処理を施し、監視エリアに現れる人や車両などの移動物体を検出する機能を有する映像監視システムがある。この映像監視システムは、検出結果を利用することで移動物体の出現した映像のみ記録する機能,表示装置に警告アイコンを提示する機能,ブザー等を鳴らして監視員に注意を促す機能などを有する。このため、以前は常時確認作業が必要であった監視業務の負担低減に役立っている。また、この映像監視システムでは、窃盗などの犯罪行為や不正行為が発生した場合、記録した映像を事後の犯罪捜査などに役立てることも可能である。
【0003】
近年、犯罪の多様化,犯罪件数の増加,検挙率の低下などにより量販店や金融機関,ビル・オフィス等での防犯意識が高まり、映像監視システムの導入が進んでいる。映像記録装置も大容量化し、ネットワークカメラなどの普及により様々な場所にカメラが設置されることで、カメラ台数も増加している。先に述べたように犯罪行為等を監視員の目視作業により記録映像から洗い出すことは非常に負担が大きいため、監視業務を支援する機能への要望が高まっている。例えば、特許文献1では、カメラ映像から時空間豊富度を用いて移動体を検出する技術について記載されている。
【0004】
さらに、セキュリティ意識の高まりによって、入退室管理システムと映像監視システムの連動によるシステムについても導入される場面が多くなってきている。そこで問題となるのが、入室権限を持つ人物の後に続き、権限を持たない人物が入室する、共連れと呼ばれる事象である。セキュリティエリアに権限を持たない人物が入室しないようなアプリケーションを、システムを導入した管理者は強く希望している。
【0005】
従来、こういった問題に関しては、人物を検出した大きさによって、複数人数を検出する手法が考えられる。また、特許文献2では、画像認識により顔を検出し、顔の個数によって人数を推定する方法について記載されている。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2010−204860号公報
【特許文献2】特開2008−40828号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、特許文献1に記載された技術では、移動体の有無を検出するのみで、人数推定までは行っていない。人数推定を行うものとして特許文献2があるが、特許文献2に記載の画像処理装置では、カメラに顔が撮像されるという条件のため、カメラの設置状況に大きく依存する。これは、人物を撮像する際に、上部から見下ろす形でカメラが設置されていると、顔検出の性能は全く期待できない。
【0008】
また、これらを解決するために、例えばステレオカメラなどを用いた距離計測、他のセンサを用いることが考えられるが、この場合は、システム全体のコストを増大させる。ユーザにとっては既設のカメラによる検出を望む場合が多く、これに対処する必要がある。
【0009】
上記の課題を鑑みて、本発明は、カメラ画像を用いて、撮像された画像内に存在する人物の人数を推定することが可能な映像監視システム及び人数推定方法の実現と、これらの機能をカメラ内蔵可能な規模で実現することを課題とする。
【0010】
尚、上記した課題以外のその他の課題は、本願明細書全体の記載または図面から明らかにされる。
【課題を解決するための手段】
【0011】
前記課題を解決するために、本発明における映像監視システム及び人数推定方法は、撮像機器から取得した映像信号に基づく画像データから方向に関する特徴を算出するとともに、前記方向に関する特徴についてのヒストグラムを所定の大きさの時空間において算出した時空間ヒストグラムを作成し、前記時空間ヒストグラムから動きの複雑さを表す時空間評価値を算出するとともに、前記時空間評価値の時間変化を算出し、前記時空間評価値の時間変化から画像内または特定領域に存在する人数が2人以上の所定人数以上か否かを推定する。
【0012】
尚、上記した構成はあくまで一例であり、本発明は、技術思想を逸脱しない範囲内で適宜変更が可能である。また、上記した構成以外の本発明の構成の例は、本願明細書全体の記載または図面から明らかにされる。
【発明の効果】
【0013】
本発明によれば、カメラ画像から、例えば時空間豊富度などの時空間評価値を求め、その時空間評価値の時間変化を判定することで、画像内に存在する人物の人数を推定することが可能な映像監視システム及び人数推定方法が実現でき、これらの機能をカメラ内蔵可能な規模で実現することが可能となる。
【0014】
本発明のその他の効果については、明細書全体の記載から明らかにされる。
【図面の簡単な説明】
【0015】
【図1】本発明による一実施形態の映像監視システムを示すブロック図である。
【図2】本発明の処理の概念図を示す図である。
【図3】動き情報算出部の処理ブロック図である。
【図4】方向符号化を説明する説明図であり、(a)は、原画像を示す図であり、(b)は、エッジ強調フィルタを施した画像を示す図であり、(c)は、(b)に示す画像の明度勾配方向を示す図であり、(d)は、(c)に示す明度勾配方向に方向符号を割り当てた状態を示す図である。
【図5】時空間ヒストグラム作成部における処理の一例を示すフローチャートである。
【図6】時空間を説明する図であり、(a)は、時空間の概念を示す図であり、(b)は、(a)に示す時空間における時空間ヒストグラムの例を示す図である。
【図7】時間・空間変化算出部の処理フローの一例を示している。
【図8】時空間ヒストグラムと人数の関係を示す図である。
【図9】推定人数部の処理フローの一例である。
【図10】本実施例の設定画面の例である。
【図11】本実施例で警報を出力する画面例である。
【発明を実施するための形態】
【0016】
本発明の実施例を、図面を参照しながら説明する。尚、各図において、同一又は類似の構成要素には同じ符号を付し、説明を省略する。
【0017】
図1は、本発明による一実施形態の映像監視システムを示すブロック図である。
【0018】
この映像監視システムは、カメラ10と、画像認識部20と、判定部30と、出力部40とを備えている。この映像監視システムは電子計算機システムを適用した構成となる。この電子計算機システムのハードウェアは、CPU,メモリ,I/Oなどを含み、所定のソフトウェアが実行可能にインストールされることによって、各図にブロックで表現される各機能部が実現されている。
【0019】
カメラ10は、ズーム機能を有するカメラレンズ、およびCMOS(Complementary Metal Oxide Semiconductor)やCCD(Charge Coupled Device)などの撮像素子(いずれも図示せず)を含む撮像機器である。このカメラ10は、取得した映像信号を画像認識部20(後記)へ出力する。また、このカメラ10は、雲台に載置され俯仰および旋回が可能なパンチルトズームカメラである。
【0020】
判定部30は、画像認識部20で出力した結果を用いてどのように出力部40で出力するかを判断する部分である。例えば、画像認識部20で出力した結果により、アラームを出力すべきか、もしくは周辺機器への動作信号を出力すべきかなどを判断する処理を実行する。そして、判断結果を用いて制御を行い、例えば周辺機器等に例えば警報などを出力させる。
【0021】
出力部40は、液晶表示装置やCRT(Cathode Ray Tube)表示装置などの表示装置である。出力部40を備える代わりに、RGB(Red-Green-Blue)モニタ出力、または、ネットワーク経由でのデータ出力などを行う構成としてもよい。
【0022】
画像認識部20や判定部30等で用いられるパラメータのパラメータ設定は、図示しないユーザインターフェースにより実行される。本実施例の映像監視システムのユーザインターフェースは、マウスやキーボードなどの入力装置(図示せず)を含み、ユーザによるパラメータなどの入力を受け付ける。
【0023】
次に、画像認識部20について、詳細に説明する。
【0024】
画像認識部20は、カメラ10から取得した映像信号(あるいは画像データ)から、映像内の動き領域を算出する動き情報算出部100と、同じくカメラ10から取得した映像信号(あるいは画像データ)から、時空間ヒストグラムを作成する時空間ヒストグラム作成部101と、時空間ヒストグラム作成部101で作成した時空間ヒストグラムから、動きの複雑さを表す時空間評価値を算出するととともにこの時空間評価値の時間変化を算出する時間・空間変化算出部102と、動き領域内の時空間評価値の時間変化から人数を推定する人数推定部103とを備えている。人数推定部103の出力は判定部30に入力される。
【0025】
ここで、人数推定部103の人数の推定とは、単に人が存在するか否か、すなわち0人か1人以上かを判定するのではなく、画像内または特定領域に存在する人数が2人以上の所定人数以上か否かを推定する機能を有する。尚、動き情報算出部100は必須ではなく、人数推定部103は、動き領域の情報を用いずに例えば画面全体の時空間評価値の時間変化から人数を推定してもよい。
【0026】
また、時空間ヒストグラムは、画像データから方向に関する特徴を算出するとともに、この方向に関する特徴についてのヒストグラムを所定の大きさの時空間において算出することによって算出できる。尚、方向に関する特徴としては、例えば方向符号や動きの方向を用いることができるが、ここでは方向符号を用いた場合を例に説明する。
【0027】
また、時空間評価値としては、例えば時空間ヒストグラムの分散や、時空間豊富度を用いることができるが、ここでは時空間豊富度を用いた場合を例に説明する。
【0028】
図2を用いて画像認識部20の流れについて説明する。図2(A)は入力画像を示す。図2(A)から、動き情報算出部100により、人物の動き領域を抽出する。図2(B)はその結果を示しており、図2(B)のC1は人物の領域、図2(B)のC2は人物の動き領域を表し、人物の領域C1に外接する領域がこれに該当する。また、図2(C)は時空間豊富度の時間変化を算出した結果であり、C3は時空間豊富度の時間変化の分布を表す。図2(D)は、図2(B)の動き領域C2の領域内における図2(C)の時空間豊富度の時間変化の分布C3を抽出したものであり、この情報を用いて、人数推定部103にて人数を推定する。
【0029】
次に画像認識部20の各ブロックの処理について詳細に説明する。
【0030】
図3は動き情報算出部100の内部処理を表す図である。
【0031】
動き情報算出部100は、フレーム差分部200と、基準画像作成部201と、基準画像202と、ラベリング部203とを備えている。動き情報算出部100は、画像データに対して、映像内に出現する移動体の領域(動き領域)を算出する処理を行う。尚、動き情報算出部100は、動き領域を算出することが目的であるため、その方法としてはこれから説明するフレーム差分による手法に限定されず、ヒストグラムマッチングやオプティカルフローなどの画像処理を用いて動き領域を算出してもよい。
【0032】
ここではまず、カメラ10から取得した映像信号は、画像認識処理や映像記録に適した画像データに変換して用いる。ここで、画像データは、1次元配列または2次元配列の画像データとして取得される。ここでは、さらに、この画像データに、ノイズやフリッカなどの影響を低減するため、前処理として平滑化フィルタや輪郭強調フィルタ,濃度変換などの処理を施してもよい。また、用途に応じてRGBカラーやモノクロなどのデータ形式を選択してもよい。あるいは、処理コスト低減のために、所定の大きさで画像データに縮小処理を施してもよい。
【0033】
次に、フレーム差分部200における処理について説明する。本実施形態では、一般的な方法として、動き情報を算出するためにフレーム差分を用いている。フレーム差分とは、例えば、あるフレームの画像データと、その前時間などにおけるフレームの画像データとの差分を取得して、短時間に発生する画像の変化を検出したものである。
【0034】
まず、フレーム差分部200による処理に先立って、基準画像作成部201において、前時間の画像データから基準画像202を生成する(または、予め基準画像202を生成しておく)。ここでは処理の軽減のため、単に、前フレームの画像を基準画像202とする。フレーム差分は移動体候補領域やノイズを検出するので、明らかに背景である領域を削除することにも役立つ。入力画像をIxyとし、基準画像202をBxyと表現するとフレーム差分Subxyは、
Subxy=|Bxy−Ixy|
と表現される。ここで、x及びyは画像上の画素の位置を表す。フレーム差分Subxyは例えば輝度値の差分で表現されるが、Subxyはしきい値Γsubによる処理を実行して、2値化画像として表現してもよい。
【0035】
次にラベリング部203について説明する。ラベリング部203は、Subxyを物体ごとにラベリング処理し、外接する矩形領域や面積などを算出する。この外接する矩形領域が図2(B)の符号C2で示した動き領域である。ラベリング処理を実施する前に、2値化画像の膨張収縮処理やフィルタリングすることで動き領域の連結を実施すると性能が向上する場合がある。
【0036】
このように算出した動き領域の情報を含む動き情報は人数推定部103に出力する。人数推定部103では、この情報のうち動き領域を用いて、動き領域内の人数を出力する処理を実行する。
【0037】
次に、図1における時空間ヒストグラム作成部101及び時間・空間変化算出部102について説明する。これらの処理は、例えば時空間豊富度などの時空間評価値と、この時空間評価値の時間変化を算出する機能を有する。
【0038】
図4は、方向符号化を説明する説明図であり、図4(a)は、原画像を示す図であり、図4(b)は、エッジ強調フィルタを施した画像を示す図であり、図4(c)は、図4(b)に示す画像の明度勾配方向を示す図であり、図4(d)は、図4(c)に示す明度勾配方向に方向符号を割り当てた状態を示す図である。
【0039】
図4に示すように、方向符号化とは、まず画像の明度勾配を算出し、その勾配方向を所定の方向に量子化し符号化する処理である。以下、その方法について詳述する。
【0040】
図5は、時空間ヒストグラム作成部101における処理の一例を示すフローチャートである。
【0041】
まず、画像内の各画素p(x,y)の入力画像Ixyについて、水平方向,垂直方向(鉛直方向)の各エッジ勾配ΔIu,ΔIvを算出する(ステップS1)。ここで、エッジ勾配ΔIu,ΔIvの算出にはエッジ強調フィルタを用いることとする。エッジ強調フィルタとしてソーベル(Sobel)フィルタを用いる場合、その水平方向の算出係数FLTh,垂直方向の算出係数FLTvは、次の式(1)のとおりとなる。ソーベルフィルタの代わりに、プレヴィット(Prewitt)フィルタなどの他のエッジ強調フィルタを用いてもよい。
【0042】
【数1】
【0043】
次に、式(1)のフィルタを用いたフィルタ演算によって算出されたエッジ勾配ΔIu,ΔIvを用いて、エッジ強度ρxyを、式(2)により算出する(ステップS2)。
【0044】
【数2】
【0045】
次に、ρxy>Γρであるか否かを判断する(ステップS3)。ここで、Γρは、予め設定されているしきい値である。
【0046】
ρxy>Γρである場合(ステップS3のY)、すなわちエッジ強度ρxyが所定のしきい値Γρより大きい場合、エッジ方向θxyを後述するとおり算出し(ステップS4)、次のステップ(ステップS5)へ進む。
【0047】
ρxy>Γρでない場合(ステップS3のN)、すなわちエッジ強度ρxyが所定のしきい値Γρ以下である場合、エッジ方向θxyを算出せず、次のステップ(ステップS5)へ進む。
【0048】
つまり、エッジ強度ρxyの値が低い場合、ノイズ等の影響を大きく受けている場合があるため、予め設定したしきい値Γρを用いて、しきい値以下の画素ではステップS4を飛ばすことで方向符号を与えないようにする。しきい値を超えた画素p(x,y)では、ステップS4においてエッジ方向θxyを、式(3)により算出する。
【0049】
【数3】
【0050】
次に、算出したエッジ方向θxyから方向符号Cxyを式(4)により算出する(ステップS5)。ステップS4を経由して処理が行われた場合、すなわちρxy>Γρであった場合、θxy/Δθにより、方向符号Cxyを求める。ステップS4を経由しないで処理が行われた場合、すなわちρxy>Γρでなかった場合、方向符号CxyはN=2π/Δθとなる。
【0051】
なお、ここでは、予め定めた量子化数Nで、全勾配方向2πを分割角度Δθごとに分割し、分割した勾配方向ごとに方向符号Cxyを割り当てている。例えば、図4(d)に示すように量子化数Nを16とした場合では、方向符号Cxyは、Cxy={0,1,…,15}となる。また、ステップS3でしきい値Γρ以下であった画素p(x,y)については、方向符号Cxyは、量子化数Nに等しい値とする。例えば、前記したように量子化数を16とした場合、Cxy=16となる。この方向符号を与えられた画素は、無効な方向符号を有する画素である。ここまでが、画像データの方向符号化処理である。
【0052】
【数4】
【0053】
ステップS6では、ステップS1〜S5の処理を全画面で行ったか否かを判定し、終了していない場合はx,yを変化させて残りの画素についてステップS1に戻って繰り返し(ステップS6でN)、終了した場合はステップS7へ進む(ステップS6でY)。
【0054】
次に、ステップS7の時空間ヒストグラムPxytの算出について説明する。
【0055】
図6は、時空間を説明する図であり、図6(a)は、時空間の概念を示す図であり、図6(b)は、図6(a)に示す時空間における時空間ヒストグラムPxytの例を示す図である。図6(a)に示すように、この時空間では、xy平面からなる画像が時刻t方向にわたって、時刻T−TMから時刻TまでM枚連なっている。各画像には、寸法がL×Lである平面領域が設定されている。こうして、所定の大きさ(xy領域での寸法がL×Lで、時間的長さがM)である、時空間での形状が直方体状の領域(所定の大きさの時空間)が設定される。この領域を時空間S(図示せず)とする。
【0056】
図6(b)に示す時空間ヒストグラムPxytは、この所定の大きさの時空間Sについて、後記するように処理を行って得たものであり、縦軸方向に方向符号Cxyの出現頻度、横軸方向に方向符号Cxyの値を示したものである。なお、図6において、iはCxyの値である。
【0057】
ステップS7では、所定の大きさ(xy領域L×L、時間方向にM)の時空間Sにおいて既にこれまで算出していた方向符号群Cxyt∈Sから、方向符号Cxyの出現頻度の時空間ヒストグラムPxytを算出する。ここで、Cxytは、時刻tにおける画素p(x,y)の方向符号である。時空間ヒストグラムPxytは、まず、方向符号Cxytの出現頻度を表すhxytを式(5)で算出する。ここで、δはクロネッカーデルタであり、iとCxytの値が等しい場合には1、それ以外の場合には0となる。
【0058】
【数5】
【0059】
式(5)では、画素p(x,y)をxy領域の中心とした画素p(x,y)およびその周囲のL×Lの領域で、時間方向に現在の時刻Tから時刻T−TMまでの時空間Sにおける方向符号Cxytの出現頻度を算出している。
【0060】
さらに、エッジ強度ρxyがしきい値Γρ以下であり無効な方向符号と考えられるhxyt(N)と、時空間Sの大きさを考慮して相対度数により表現される時空間ヒストグラムPxytを式(6)で算出する。
【0061】
【数6】
【0062】
この式(6)で求まった時空間ヒストグラムPxytは、画素p(x,y),時刻tにおける時空間ヒストグラムであるため、これを画素p(x,y)を変化させて全画面に対して算出する(ステップS7内でのこのループ処理は図示省略)。
【0063】
なお、これまでの説明では、方向に関する特徴として方向符号を用いて時空間ヒストグラムを作成する例を示した。しかしながら、この方法に限られず、方向に関する特徴としてオプティカルフロー等で得られた動きの方向を用いたものとし、この動きの方向について時空間ヒストグラムを作成するようにしてもよい。この場合の時空間ヒストグラムをHOF(Histgram of Flow)と呼ぶこともある。この場合でも、これ以降の処理は同様に行える。
【0064】
次に、図1における時間・空間変化算出部102について説明する。
【0065】
図7は時間・空間変化算出部102の処理フローの一例を示している。時間・空間変化算出部102では、上記の手順で求めた時空間ヒストグラムPxytを用いて時空間評価値の一例である時空間豊富度Rxytと、この時空間評価値の時間変化を求める処理である。
【0066】
まず、時空間ヒストグラムPxytから時空間豊富度Rxytを算出する(ステップS11)。ここでは、時空間エントロピーExytを時空間ヒストグラムの評価値として表現し、最大エントロピーEmaxを考慮した上で、時空間豊富度Rxytを算出する。式(7)に最大エントロピーEmax、式(8)に時空間エントロピーExytと時空間豊富度Rxytの数式を示す。αeはしきい値の重み係数であり、画像の特徴に応じて適宜設定する。尚、最大エントロピーEmaxは、式(8)の時空間エントロピーExytにおいて時空間ヒストグラムPxytが全てのiにおいて同じ1/Nの確率になっている場合(時空間ヒストグラムがフラットな場合)に相当する。
【0067】
【数7】
【0068】
【数8】
【0069】
画素p(x,y)の位置における時空間豊富度Rxytは、図8(a)に示すように、例えば少数の人物が存在する空間Sでは特定の方向符号の出現確率が高い。つまり、エントロピーの値が小さくなる。これは、人物のエッジが1つの方向に偏る傾向があることを示す。他方、図8(b)に示すように、少数の場合よりも多い複数の人物がいる場合、その移動により様々な方向符号が検出された場合は、時空間豊富度が高くなる。つまり、エントロピーの値が大きくなる。
【0070】
ここでさらに、時空間豊富度の時間変化(時空間評価値の時間変化)を調べると、少数の場合よりも多い複数人の場合の方が複雑な動きが行われるため、時空間豊富度の時間変化が大きくなる。したがって、この時空間豊富度の時間変化(時空間評価値の時間変化)を調べることで、より正確な人数の推定が可能となる。
【0071】
そのために、次に、時空間豊富度の時間的な変化を表す時空間豊富度変化Rsubxyを求める。まず、予め算出している1つ前の時刻(T−1)における時空間豊富度Rxyt(T−1)と現在(時刻T)の時空間豊富度Rxyt(T)との差を画素p(x,y)において求める(ステップS12)。
【0072】
この一連の処理を、全画面について処理したか否か判断する(ステップS13)。処理していない場合(ステップS13のN)、ステップS1に戻り、未処理の画素について処理を繰り返し、画像データのxy空間全体に対して実行する。全画面について処理した場合(ステップS13のY)、次のフィルタリング処理を実施する(ステップS14)。
【0073】
フィルタリング処理は、式(9)のようにステップS12で算出した差分に対して、ガウシアンフィルタGを実行する処理であり、ガウスフィルタ関数と時空間豊富度変化との畳込みである。フィルタの窓は画像の撮影状況により、人物の高さに応じて変更することが望ましい。例えば、7×15など縦長にすると、より人物領域に沿った情報が得られる。これらの処理により、時空間豊富度の時間変化(時空間評価値の時間変化)が算出される。
【0074】
【数9】
【0075】
尚、以上の説明では時空間評価値の一例として時空間豊富度を用い、時空間豊富度の時間変化を算出する例を示したが、これに限られず、時空間ヒストグラムの統計量を時空間評価値として用いても良い。この統計量としては、例えば、エントロピーと近い概念で用いられる、モーメントにより求められる分散,標準偏差,歪度,尖度がある。このうち何れか1つ以上の統計量を時空間評価値として用い、この時空間ヒストグラムの統計量の時間変化を、時空間評価値の時間変化として算出するようにしてもよい。この場合でも、後述する人数推定部103における処理は時空間評価値の時間変化の中身が置き換わるだけで基本的に同じである。
【0076】
次に、図1における、人数推定部103について述べる。この処理は図2における(B),(C)から(D)を求め、人数を推定する処理である。図9は人数推定部103の処理フローの一例である。
【0077】
動き情報算出部100で求めた動き領域(図2(B)のC2に相当)と、時間・空間変化算出部102で求めた時空間評価値の時間変化(ここでは時空間豊富度変化Rsubxyを用いた場合について説明する)を利用し、動き領域内における時空間豊富度変化Rsubxyの平均値Raveを求める(ステップS21)。
【0078】
次に、求めた平均値Raveをしきい値thrと比較し、しきい値thr以上であれば(ステップS22)、所定の人数以上であると判断し推定人数のデータを出力する。あるいは、比較した結果から所定の人数以上であるか否かを出力する。尚、しきい値を複数設けて、多段階で人数推定を行うようにしてもよい。ここで、所定の人数あるいはしきい値thrは、ユーザが設定によって決定することができ、1人か2人以上かを判断する場合は、それに見合うようにthrを設定すればよい。設定方法については後述する。
【0079】
これらの処理を、動き領域が複数ある場合にはすべてについて繰り返し行い、動き領域の全領域に対して処理したかを判断し(ステップS33)、すべて終わった場合は処理を終了する。
【0080】
尚、図9では動き領域を利用する場合について説明したが、動き領域を利用せず、画面上の全領域について処理を行うようにしてもよい。
【0081】
次に画像認識部20の結果を判断する判定部30について説明する。図10は判定部30で用いる条件を設定する画面の一例である。例えば所定の人数以上の場合にアラーム出力する場合は、図10のC4にてこの所定の人数を設定すればよい。この際に、この設定された人数に応じて前述のしきい値thrを変更する。また、アラームが発報された際の動作は図10のC5の警報を出力するか否か、施錠をするか否かなど設定することができる。また入退室管理装置と連動した際に、例えば2人以上であれば、ドアを施錠するなどの運用が可能となる。これにより、共連れ防止が可能となる。
【0082】
また本実施例の警報を出力する人数を、例えば10人と設定すれば、群衆が発生した際に警報を出力する装置としても応用が可能である。
【0083】
図10のC5にて警報がONと設定された場合は、図11に示すように、画面上に警告画面を出力するなどの運用が可能となる。
【0084】
本発明によれば、カメラ画像から、例えば時空間豊富度などの時空間評価値を求め、その時空間評価値の時間変化を判定することで、画像内に存在する人物の人数を推定することが可能な映像監視システム及び人数推定方法が実現でき、これらの機能をカメラ内蔵可能な規模で実現できる。
【0085】
以上、本発明を実施例を用いて説明してきたが、これまでの実施例で説明した構成はあくまで一例であり、本発明は、技術思想を逸脱しない範囲内で適宜変更が可能である。また、実施例で説明した変形例の構成は、互いに矛盾しない限り、組み合わせて用いても良い。
【符号の説明】
【0086】
10 カメラ(撮像機器)
20 画像認識部
30 判定部
40 出力部
100 動き情報算出部
101 時空間ヒストグラム作成部
102 時間・空間変化算出部
103 人数推定部
200 フレーム差分部
201 基準画像作成部
202 基準画像
203 ラベリング部
【技術分野】
【0001】
本発明は、カメラなどの撮像機器から取得する映像から画像データを記録する機能を有し、いわゆる映像記録装置などの監視装置や画像認識機能による侵入者検知や、移動ロボットなどに搭載する接近者検知などの機能を実現する映像監視システムであって、特に、カメラ内に出現した人物の人数を検出することに優れた映像監視システム及び人数推定方法に関する。
【背景技術】
【0002】
カメラなどの撮像機器から取得した映像に画像処理を施し、監視エリアに現れる人や車両などの移動物体を検出する機能を有する映像監視システムがある。この映像監視システムは、検出結果を利用することで移動物体の出現した映像のみ記録する機能,表示装置に警告アイコンを提示する機能,ブザー等を鳴らして監視員に注意を促す機能などを有する。このため、以前は常時確認作業が必要であった監視業務の負担低減に役立っている。また、この映像監視システムでは、窃盗などの犯罪行為や不正行為が発生した場合、記録した映像を事後の犯罪捜査などに役立てることも可能である。
【0003】
近年、犯罪の多様化,犯罪件数の増加,検挙率の低下などにより量販店や金融機関,ビル・オフィス等での防犯意識が高まり、映像監視システムの導入が進んでいる。映像記録装置も大容量化し、ネットワークカメラなどの普及により様々な場所にカメラが設置されることで、カメラ台数も増加している。先に述べたように犯罪行為等を監視員の目視作業により記録映像から洗い出すことは非常に負担が大きいため、監視業務を支援する機能への要望が高まっている。例えば、特許文献1では、カメラ映像から時空間豊富度を用いて移動体を検出する技術について記載されている。
【0004】
さらに、セキュリティ意識の高まりによって、入退室管理システムと映像監視システムの連動によるシステムについても導入される場面が多くなってきている。そこで問題となるのが、入室権限を持つ人物の後に続き、権限を持たない人物が入室する、共連れと呼ばれる事象である。セキュリティエリアに権限を持たない人物が入室しないようなアプリケーションを、システムを導入した管理者は強く希望している。
【0005】
従来、こういった問題に関しては、人物を検出した大きさによって、複数人数を検出する手法が考えられる。また、特許文献2では、画像認識により顔を検出し、顔の個数によって人数を推定する方法について記載されている。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2010−204860号公報
【特許文献2】特開2008−40828号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、特許文献1に記載された技術では、移動体の有無を検出するのみで、人数推定までは行っていない。人数推定を行うものとして特許文献2があるが、特許文献2に記載の画像処理装置では、カメラに顔が撮像されるという条件のため、カメラの設置状況に大きく依存する。これは、人物を撮像する際に、上部から見下ろす形でカメラが設置されていると、顔検出の性能は全く期待できない。
【0008】
また、これらを解決するために、例えばステレオカメラなどを用いた距離計測、他のセンサを用いることが考えられるが、この場合は、システム全体のコストを増大させる。ユーザにとっては既設のカメラによる検出を望む場合が多く、これに対処する必要がある。
【0009】
上記の課題を鑑みて、本発明は、カメラ画像を用いて、撮像された画像内に存在する人物の人数を推定することが可能な映像監視システム及び人数推定方法の実現と、これらの機能をカメラ内蔵可能な規模で実現することを課題とする。
【0010】
尚、上記した課題以外のその他の課題は、本願明細書全体の記載または図面から明らかにされる。
【課題を解決するための手段】
【0011】
前記課題を解決するために、本発明における映像監視システム及び人数推定方法は、撮像機器から取得した映像信号に基づく画像データから方向に関する特徴を算出するとともに、前記方向に関する特徴についてのヒストグラムを所定の大きさの時空間において算出した時空間ヒストグラムを作成し、前記時空間ヒストグラムから動きの複雑さを表す時空間評価値を算出するとともに、前記時空間評価値の時間変化を算出し、前記時空間評価値の時間変化から画像内または特定領域に存在する人数が2人以上の所定人数以上か否かを推定する。
【0012】
尚、上記した構成はあくまで一例であり、本発明は、技術思想を逸脱しない範囲内で適宜変更が可能である。また、上記した構成以外の本発明の構成の例は、本願明細書全体の記載または図面から明らかにされる。
【発明の効果】
【0013】
本発明によれば、カメラ画像から、例えば時空間豊富度などの時空間評価値を求め、その時空間評価値の時間変化を判定することで、画像内に存在する人物の人数を推定することが可能な映像監視システム及び人数推定方法が実現でき、これらの機能をカメラ内蔵可能な規模で実現することが可能となる。
【0014】
本発明のその他の効果については、明細書全体の記載から明らかにされる。
【図面の簡単な説明】
【0015】
【図1】本発明による一実施形態の映像監視システムを示すブロック図である。
【図2】本発明の処理の概念図を示す図である。
【図3】動き情報算出部の処理ブロック図である。
【図4】方向符号化を説明する説明図であり、(a)は、原画像を示す図であり、(b)は、エッジ強調フィルタを施した画像を示す図であり、(c)は、(b)に示す画像の明度勾配方向を示す図であり、(d)は、(c)に示す明度勾配方向に方向符号を割り当てた状態を示す図である。
【図5】時空間ヒストグラム作成部における処理の一例を示すフローチャートである。
【図6】時空間を説明する図であり、(a)は、時空間の概念を示す図であり、(b)は、(a)に示す時空間における時空間ヒストグラムの例を示す図である。
【図7】時間・空間変化算出部の処理フローの一例を示している。
【図8】時空間ヒストグラムと人数の関係を示す図である。
【図9】推定人数部の処理フローの一例である。
【図10】本実施例の設定画面の例である。
【図11】本実施例で警報を出力する画面例である。
【発明を実施するための形態】
【0016】
本発明の実施例を、図面を参照しながら説明する。尚、各図において、同一又は類似の構成要素には同じ符号を付し、説明を省略する。
【0017】
図1は、本発明による一実施形態の映像監視システムを示すブロック図である。
【0018】
この映像監視システムは、カメラ10と、画像認識部20と、判定部30と、出力部40とを備えている。この映像監視システムは電子計算機システムを適用した構成となる。この電子計算機システムのハードウェアは、CPU,メモリ,I/Oなどを含み、所定のソフトウェアが実行可能にインストールされることによって、各図にブロックで表現される各機能部が実現されている。
【0019】
カメラ10は、ズーム機能を有するカメラレンズ、およびCMOS(Complementary Metal Oxide Semiconductor)やCCD(Charge Coupled Device)などの撮像素子(いずれも図示せず)を含む撮像機器である。このカメラ10は、取得した映像信号を画像認識部20(後記)へ出力する。また、このカメラ10は、雲台に載置され俯仰および旋回が可能なパンチルトズームカメラである。
【0020】
判定部30は、画像認識部20で出力した結果を用いてどのように出力部40で出力するかを判断する部分である。例えば、画像認識部20で出力した結果により、アラームを出力すべきか、もしくは周辺機器への動作信号を出力すべきかなどを判断する処理を実行する。そして、判断結果を用いて制御を行い、例えば周辺機器等に例えば警報などを出力させる。
【0021】
出力部40は、液晶表示装置やCRT(Cathode Ray Tube)表示装置などの表示装置である。出力部40を備える代わりに、RGB(Red-Green-Blue)モニタ出力、または、ネットワーク経由でのデータ出力などを行う構成としてもよい。
【0022】
画像認識部20や判定部30等で用いられるパラメータのパラメータ設定は、図示しないユーザインターフェースにより実行される。本実施例の映像監視システムのユーザインターフェースは、マウスやキーボードなどの入力装置(図示せず)を含み、ユーザによるパラメータなどの入力を受け付ける。
【0023】
次に、画像認識部20について、詳細に説明する。
【0024】
画像認識部20は、カメラ10から取得した映像信号(あるいは画像データ)から、映像内の動き領域を算出する動き情報算出部100と、同じくカメラ10から取得した映像信号(あるいは画像データ)から、時空間ヒストグラムを作成する時空間ヒストグラム作成部101と、時空間ヒストグラム作成部101で作成した時空間ヒストグラムから、動きの複雑さを表す時空間評価値を算出するととともにこの時空間評価値の時間変化を算出する時間・空間変化算出部102と、動き領域内の時空間評価値の時間変化から人数を推定する人数推定部103とを備えている。人数推定部103の出力は判定部30に入力される。
【0025】
ここで、人数推定部103の人数の推定とは、単に人が存在するか否か、すなわち0人か1人以上かを判定するのではなく、画像内または特定領域に存在する人数が2人以上の所定人数以上か否かを推定する機能を有する。尚、動き情報算出部100は必須ではなく、人数推定部103は、動き領域の情報を用いずに例えば画面全体の時空間評価値の時間変化から人数を推定してもよい。
【0026】
また、時空間ヒストグラムは、画像データから方向に関する特徴を算出するとともに、この方向に関する特徴についてのヒストグラムを所定の大きさの時空間において算出することによって算出できる。尚、方向に関する特徴としては、例えば方向符号や動きの方向を用いることができるが、ここでは方向符号を用いた場合を例に説明する。
【0027】
また、時空間評価値としては、例えば時空間ヒストグラムの分散や、時空間豊富度を用いることができるが、ここでは時空間豊富度を用いた場合を例に説明する。
【0028】
図2を用いて画像認識部20の流れについて説明する。図2(A)は入力画像を示す。図2(A)から、動き情報算出部100により、人物の動き領域を抽出する。図2(B)はその結果を示しており、図2(B)のC1は人物の領域、図2(B)のC2は人物の動き領域を表し、人物の領域C1に外接する領域がこれに該当する。また、図2(C)は時空間豊富度の時間変化を算出した結果であり、C3は時空間豊富度の時間変化の分布を表す。図2(D)は、図2(B)の動き領域C2の領域内における図2(C)の時空間豊富度の時間変化の分布C3を抽出したものであり、この情報を用いて、人数推定部103にて人数を推定する。
【0029】
次に画像認識部20の各ブロックの処理について詳細に説明する。
【0030】
図3は動き情報算出部100の内部処理を表す図である。
【0031】
動き情報算出部100は、フレーム差分部200と、基準画像作成部201と、基準画像202と、ラベリング部203とを備えている。動き情報算出部100は、画像データに対して、映像内に出現する移動体の領域(動き領域)を算出する処理を行う。尚、動き情報算出部100は、動き領域を算出することが目的であるため、その方法としてはこれから説明するフレーム差分による手法に限定されず、ヒストグラムマッチングやオプティカルフローなどの画像処理を用いて動き領域を算出してもよい。
【0032】
ここではまず、カメラ10から取得した映像信号は、画像認識処理や映像記録に適した画像データに変換して用いる。ここで、画像データは、1次元配列または2次元配列の画像データとして取得される。ここでは、さらに、この画像データに、ノイズやフリッカなどの影響を低減するため、前処理として平滑化フィルタや輪郭強調フィルタ,濃度変換などの処理を施してもよい。また、用途に応じてRGBカラーやモノクロなどのデータ形式を選択してもよい。あるいは、処理コスト低減のために、所定の大きさで画像データに縮小処理を施してもよい。
【0033】
次に、フレーム差分部200における処理について説明する。本実施形態では、一般的な方法として、動き情報を算出するためにフレーム差分を用いている。フレーム差分とは、例えば、あるフレームの画像データと、その前時間などにおけるフレームの画像データとの差分を取得して、短時間に発生する画像の変化を検出したものである。
【0034】
まず、フレーム差分部200による処理に先立って、基準画像作成部201において、前時間の画像データから基準画像202を生成する(または、予め基準画像202を生成しておく)。ここでは処理の軽減のため、単に、前フレームの画像を基準画像202とする。フレーム差分は移動体候補領域やノイズを検出するので、明らかに背景である領域を削除することにも役立つ。入力画像をIxyとし、基準画像202をBxyと表現するとフレーム差分Subxyは、
Subxy=|Bxy−Ixy|
と表現される。ここで、x及びyは画像上の画素の位置を表す。フレーム差分Subxyは例えば輝度値の差分で表現されるが、Subxyはしきい値Γsubによる処理を実行して、2値化画像として表現してもよい。
【0035】
次にラベリング部203について説明する。ラベリング部203は、Subxyを物体ごとにラベリング処理し、外接する矩形領域や面積などを算出する。この外接する矩形領域が図2(B)の符号C2で示した動き領域である。ラベリング処理を実施する前に、2値化画像の膨張収縮処理やフィルタリングすることで動き領域の連結を実施すると性能が向上する場合がある。
【0036】
このように算出した動き領域の情報を含む動き情報は人数推定部103に出力する。人数推定部103では、この情報のうち動き領域を用いて、動き領域内の人数を出力する処理を実行する。
【0037】
次に、図1における時空間ヒストグラム作成部101及び時間・空間変化算出部102について説明する。これらの処理は、例えば時空間豊富度などの時空間評価値と、この時空間評価値の時間変化を算出する機能を有する。
【0038】
図4は、方向符号化を説明する説明図であり、図4(a)は、原画像を示す図であり、図4(b)は、エッジ強調フィルタを施した画像を示す図であり、図4(c)は、図4(b)に示す画像の明度勾配方向を示す図であり、図4(d)は、図4(c)に示す明度勾配方向に方向符号を割り当てた状態を示す図である。
【0039】
図4に示すように、方向符号化とは、まず画像の明度勾配を算出し、その勾配方向を所定の方向に量子化し符号化する処理である。以下、その方法について詳述する。
【0040】
図5は、時空間ヒストグラム作成部101における処理の一例を示すフローチャートである。
【0041】
まず、画像内の各画素p(x,y)の入力画像Ixyについて、水平方向,垂直方向(鉛直方向)の各エッジ勾配ΔIu,ΔIvを算出する(ステップS1)。ここで、エッジ勾配ΔIu,ΔIvの算出にはエッジ強調フィルタを用いることとする。エッジ強調フィルタとしてソーベル(Sobel)フィルタを用いる場合、その水平方向の算出係数FLTh,垂直方向の算出係数FLTvは、次の式(1)のとおりとなる。ソーベルフィルタの代わりに、プレヴィット(Prewitt)フィルタなどの他のエッジ強調フィルタを用いてもよい。
【0042】
【数1】
【0043】
次に、式(1)のフィルタを用いたフィルタ演算によって算出されたエッジ勾配ΔIu,ΔIvを用いて、エッジ強度ρxyを、式(2)により算出する(ステップS2)。
【0044】
【数2】
【0045】
次に、ρxy>Γρであるか否かを判断する(ステップS3)。ここで、Γρは、予め設定されているしきい値である。
【0046】
ρxy>Γρである場合(ステップS3のY)、すなわちエッジ強度ρxyが所定のしきい値Γρより大きい場合、エッジ方向θxyを後述するとおり算出し(ステップS4)、次のステップ(ステップS5)へ進む。
【0047】
ρxy>Γρでない場合(ステップS3のN)、すなわちエッジ強度ρxyが所定のしきい値Γρ以下である場合、エッジ方向θxyを算出せず、次のステップ(ステップS5)へ進む。
【0048】
つまり、エッジ強度ρxyの値が低い場合、ノイズ等の影響を大きく受けている場合があるため、予め設定したしきい値Γρを用いて、しきい値以下の画素ではステップS4を飛ばすことで方向符号を与えないようにする。しきい値を超えた画素p(x,y)では、ステップS4においてエッジ方向θxyを、式(3)により算出する。
【0049】
【数3】
【0050】
次に、算出したエッジ方向θxyから方向符号Cxyを式(4)により算出する(ステップS5)。ステップS4を経由して処理が行われた場合、すなわちρxy>Γρであった場合、θxy/Δθにより、方向符号Cxyを求める。ステップS4を経由しないで処理が行われた場合、すなわちρxy>Γρでなかった場合、方向符号CxyはN=2π/Δθとなる。
【0051】
なお、ここでは、予め定めた量子化数Nで、全勾配方向2πを分割角度Δθごとに分割し、分割した勾配方向ごとに方向符号Cxyを割り当てている。例えば、図4(d)に示すように量子化数Nを16とした場合では、方向符号Cxyは、Cxy={0,1,…,15}となる。また、ステップS3でしきい値Γρ以下であった画素p(x,y)については、方向符号Cxyは、量子化数Nに等しい値とする。例えば、前記したように量子化数を16とした場合、Cxy=16となる。この方向符号を与えられた画素は、無効な方向符号を有する画素である。ここまでが、画像データの方向符号化処理である。
【0052】
【数4】
【0053】
ステップS6では、ステップS1〜S5の処理を全画面で行ったか否かを判定し、終了していない場合はx,yを変化させて残りの画素についてステップS1に戻って繰り返し(ステップS6でN)、終了した場合はステップS7へ進む(ステップS6でY)。
【0054】
次に、ステップS7の時空間ヒストグラムPxytの算出について説明する。
【0055】
図6は、時空間を説明する図であり、図6(a)は、時空間の概念を示す図であり、図6(b)は、図6(a)に示す時空間における時空間ヒストグラムPxytの例を示す図である。図6(a)に示すように、この時空間では、xy平面からなる画像が時刻t方向にわたって、時刻T−TMから時刻TまでM枚連なっている。各画像には、寸法がL×Lである平面領域が設定されている。こうして、所定の大きさ(xy領域での寸法がL×Lで、時間的長さがM)である、時空間での形状が直方体状の領域(所定の大きさの時空間)が設定される。この領域を時空間S(図示せず)とする。
【0056】
図6(b)に示す時空間ヒストグラムPxytは、この所定の大きさの時空間Sについて、後記するように処理を行って得たものであり、縦軸方向に方向符号Cxyの出現頻度、横軸方向に方向符号Cxyの値を示したものである。なお、図6において、iはCxyの値である。
【0057】
ステップS7では、所定の大きさ(xy領域L×L、時間方向にM)の時空間Sにおいて既にこれまで算出していた方向符号群Cxyt∈Sから、方向符号Cxyの出現頻度の時空間ヒストグラムPxytを算出する。ここで、Cxytは、時刻tにおける画素p(x,y)の方向符号である。時空間ヒストグラムPxytは、まず、方向符号Cxytの出現頻度を表すhxytを式(5)で算出する。ここで、δはクロネッカーデルタであり、iとCxytの値が等しい場合には1、それ以外の場合には0となる。
【0058】
【数5】
【0059】
式(5)では、画素p(x,y)をxy領域の中心とした画素p(x,y)およびその周囲のL×Lの領域で、時間方向に現在の時刻Tから時刻T−TMまでの時空間Sにおける方向符号Cxytの出現頻度を算出している。
【0060】
さらに、エッジ強度ρxyがしきい値Γρ以下であり無効な方向符号と考えられるhxyt(N)と、時空間Sの大きさを考慮して相対度数により表現される時空間ヒストグラムPxytを式(6)で算出する。
【0061】
【数6】
【0062】
この式(6)で求まった時空間ヒストグラムPxytは、画素p(x,y),時刻tにおける時空間ヒストグラムであるため、これを画素p(x,y)を変化させて全画面に対して算出する(ステップS7内でのこのループ処理は図示省略)。
【0063】
なお、これまでの説明では、方向に関する特徴として方向符号を用いて時空間ヒストグラムを作成する例を示した。しかしながら、この方法に限られず、方向に関する特徴としてオプティカルフロー等で得られた動きの方向を用いたものとし、この動きの方向について時空間ヒストグラムを作成するようにしてもよい。この場合の時空間ヒストグラムをHOF(Histgram of Flow)と呼ぶこともある。この場合でも、これ以降の処理は同様に行える。
【0064】
次に、図1における時間・空間変化算出部102について説明する。
【0065】
図7は時間・空間変化算出部102の処理フローの一例を示している。時間・空間変化算出部102では、上記の手順で求めた時空間ヒストグラムPxytを用いて時空間評価値の一例である時空間豊富度Rxytと、この時空間評価値の時間変化を求める処理である。
【0066】
まず、時空間ヒストグラムPxytから時空間豊富度Rxytを算出する(ステップS11)。ここでは、時空間エントロピーExytを時空間ヒストグラムの評価値として表現し、最大エントロピーEmaxを考慮した上で、時空間豊富度Rxytを算出する。式(7)に最大エントロピーEmax、式(8)に時空間エントロピーExytと時空間豊富度Rxytの数式を示す。αeはしきい値の重み係数であり、画像の特徴に応じて適宜設定する。尚、最大エントロピーEmaxは、式(8)の時空間エントロピーExytにおいて時空間ヒストグラムPxytが全てのiにおいて同じ1/Nの確率になっている場合(時空間ヒストグラムがフラットな場合)に相当する。
【0067】
【数7】
【0068】
【数8】
【0069】
画素p(x,y)の位置における時空間豊富度Rxytは、図8(a)に示すように、例えば少数の人物が存在する空間Sでは特定の方向符号の出現確率が高い。つまり、エントロピーの値が小さくなる。これは、人物のエッジが1つの方向に偏る傾向があることを示す。他方、図8(b)に示すように、少数の場合よりも多い複数の人物がいる場合、その移動により様々な方向符号が検出された場合は、時空間豊富度が高くなる。つまり、エントロピーの値が大きくなる。
【0070】
ここでさらに、時空間豊富度の時間変化(時空間評価値の時間変化)を調べると、少数の場合よりも多い複数人の場合の方が複雑な動きが行われるため、時空間豊富度の時間変化が大きくなる。したがって、この時空間豊富度の時間変化(時空間評価値の時間変化)を調べることで、より正確な人数の推定が可能となる。
【0071】
そのために、次に、時空間豊富度の時間的な変化を表す時空間豊富度変化Rsubxyを求める。まず、予め算出している1つ前の時刻(T−1)における時空間豊富度Rxyt(T−1)と現在(時刻T)の時空間豊富度Rxyt(T)との差を画素p(x,y)において求める(ステップS12)。
【0072】
この一連の処理を、全画面について処理したか否か判断する(ステップS13)。処理していない場合(ステップS13のN)、ステップS1に戻り、未処理の画素について処理を繰り返し、画像データのxy空間全体に対して実行する。全画面について処理した場合(ステップS13のY)、次のフィルタリング処理を実施する(ステップS14)。
【0073】
フィルタリング処理は、式(9)のようにステップS12で算出した差分に対して、ガウシアンフィルタGを実行する処理であり、ガウスフィルタ関数と時空間豊富度変化との畳込みである。フィルタの窓は画像の撮影状況により、人物の高さに応じて変更することが望ましい。例えば、7×15など縦長にすると、より人物領域に沿った情報が得られる。これらの処理により、時空間豊富度の時間変化(時空間評価値の時間変化)が算出される。
【0074】
【数9】
【0075】
尚、以上の説明では時空間評価値の一例として時空間豊富度を用い、時空間豊富度の時間変化を算出する例を示したが、これに限られず、時空間ヒストグラムの統計量を時空間評価値として用いても良い。この統計量としては、例えば、エントロピーと近い概念で用いられる、モーメントにより求められる分散,標準偏差,歪度,尖度がある。このうち何れか1つ以上の統計量を時空間評価値として用い、この時空間ヒストグラムの統計量の時間変化を、時空間評価値の時間変化として算出するようにしてもよい。この場合でも、後述する人数推定部103における処理は時空間評価値の時間変化の中身が置き換わるだけで基本的に同じである。
【0076】
次に、図1における、人数推定部103について述べる。この処理は図2における(B),(C)から(D)を求め、人数を推定する処理である。図9は人数推定部103の処理フローの一例である。
【0077】
動き情報算出部100で求めた動き領域(図2(B)のC2に相当)と、時間・空間変化算出部102で求めた時空間評価値の時間変化(ここでは時空間豊富度変化Rsubxyを用いた場合について説明する)を利用し、動き領域内における時空間豊富度変化Rsubxyの平均値Raveを求める(ステップS21)。
【0078】
次に、求めた平均値Raveをしきい値thrと比較し、しきい値thr以上であれば(ステップS22)、所定の人数以上であると判断し推定人数のデータを出力する。あるいは、比較した結果から所定の人数以上であるか否かを出力する。尚、しきい値を複数設けて、多段階で人数推定を行うようにしてもよい。ここで、所定の人数あるいはしきい値thrは、ユーザが設定によって決定することができ、1人か2人以上かを判断する場合は、それに見合うようにthrを設定すればよい。設定方法については後述する。
【0079】
これらの処理を、動き領域が複数ある場合にはすべてについて繰り返し行い、動き領域の全領域に対して処理したかを判断し(ステップS33)、すべて終わった場合は処理を終了する。
【0080】
尚、図9では動き領域を利用する場合について説明したが、動き領域を利用せず、画面上の全領域について処理を行うようにしてもよい。
【0081】
次に画像認識部20の結果を判断する判定部30について説明する。図10は判定部30で用いる条件を設定する画面の一例である。例えば所定の人数以上の場合にアラーム出力する場合は、図10のC4にてこの所定の人数を設定すればよい。この際に、この設定された人数に応じて前述のしきい値thrを変更する。また、アラームが発報された際の動作は図10のC5の警報を出力するか否か、施錠をするか否かなど設定することができる。また入退室管理装置と連動した際に、例えば2人以上であれば、ドアを施錠するなどの運用が可能となる。これにより、共連れ防止が可能となる。
【0082】
また本実施例の警報を出力する人数を、例えば10人と設定すれば、群衆が発生した際に警報を出力する装置としても応用が可能である。
【0083】
図10のC5にて警報がONと設定された場合は、図11に示すように、画面上に警告画面を出力するなどの運用が可能となる。
【0084】
本発明によれば、カメラ画像から、例えば時空間豊富度などの時空間評価値を求め、その時空間評価値の時間変化を判定することで、画像内に存在する人物の人数を推定することが可能な映像監視システム及び人数推定方法が実現でき、これらの機能をカメラ内蔵可能な規模で実現できる。
【0085】
以上、本発明を実施例を用いて説明してきたが、これまでの実施例で説明した構成はあくまで一例であり、本発明は、技術思想を逸脱しない範囲内で適宜変更が可能である。また、実施例で説明した変形例の構成は、互いに矛盾しない限り、組み合わせて用いても良い。
【符号の説明】
【0086】
10 カメラ(撮像機器)
20 画像認識部
30 判定部
40 出力部
100 動き情報算出部
101 時空間ヒストグラム作成部
102 時間・空間変化算出部
103 人数推定部
200 フレーム差分部
201 基準画像作成部
202 基準画像
203 ラベリング部
【特許請求の範囲】
【請求項1】
撮像機器から取得した映像信号に基づく画像データから方向に関する特徴を算出するとともに、前記方向に関する特徴についてのヒストグラムを所定の大きさの時空間において算出した時空間ヒストグラムを作成する時空間ヒストグラム作成部と、
前記時空間ヒストグラムから動きの複雑さを表す時空間評価値を算出するとともに、前記時空間評価値の時間変化を算出する時間・空間変化算出部と、
前記時空間評価値の時間変化から画像内または特定領域に存在する人数が2人以上の所定人数以上か否かを推定する人数推定部とを有することを特徴とする映像監視システム。
【請求項2】
前記画像データから動き領域を算出する動き情報算出部を有し、
前記人数推定部は、前記動き領域における前記時空間評価値の時間変化から前記動き領域に存在する人数が2人以上の所定人数か否かを推定することを特徴とする請求項1に記載の映像監視システム。
【請求項3】
前記時間・空間変化算出部は、前記時空間ヒストグラムのエントロピーに基づき時空間豊富度を算出し、前記時空間評価値として用いることを特徴とする請求項1または2に記載の映像監視システム。
【請求項4】
前記時間・空間変化算出部は、前記時空間ヒストグラムの分散,標準偏差,歪度,尖度の何れか1つ以上を算出し、前記時空間評価値として用いることを特徴とする請求項1または2に記載の映像監視システム。
【請求項5】
前記時空間ヒストグラム作成部は、前記画像データから、前記方向に関する特徴として明度勾配方向を量子化した方向符号を算出し、前記時空間内の前記方向符号の出現頻度を表す前記時空間ヒストグラムを作成することを特徴とする請求項1から4の何れかに記載の映像監視システム。
【請求項6】
前記時空間ヒストグラム作成部は、前記画像データから、前記方向に関する特徴として動きの方向を算出し、前記時空間内の前記動きの方向の出現頻度を表す前記時空間ヒストグラムを作成することを特徴とする請求項1から4の何れかに記載の映像監視システム。
【請求項7】
前記人数推定部は、前記時空間評価値の時間変化から画像内または特定領域に存在する人数が1人か2人以上かを推定することを特徴とする請求項1から6の何れかに記載の映像監視システム。
【請求項8】
前記人数推定部によって推定された人数が前記所定人数以上である場合に警報を出力させる判定部を有することを特徴とする請求項1から7の何れかに記載の映像監視システム。
【請求項9】
撮像機器から取得した映像信号に基づく画像データから方向に関する特徴を算出するとともに、前記方向に関する特徴についてのヒストグラムを所定の大きさの時空間において算出した時空間ヒストグラムを作成し、
前記時空間ヒストグラムから動きの複雑さを表す時空間評価値を算出するとともに、前記時空間評価値の時間変化を算出し、
前記時空間評価値の時間変化から画像内または特定領域に存在する人数が2人以上の所定人数以上か否かを推定することを特徴とする人数推定方法。
【請求項1】
撮像機器から取得した映像信号に基づく画像データから方向に関する特徴を算出するとともに、前記方向に関する特徴についてのヒストグラムを所定の大きさの時空間において算出した時空間ヒストグラムを作成する時空間ヒストグラム作成部と、
前記時空間ヒストグラムから動きの複雑さを表す時空間評価値を算出するとともに、前記時空間評価値の時間変化を算出する時間・空間変化算出部と、
前記時空間評価値の時間変化から画像内または特定領域に存在する人数が2人以上の所定人数以上か否かを推定する人数推定部とを有することを特徴とする映像監視システム。
【請求項2】
前記画像データから動き領域を算出する動き情報算出部を有し、
前記人数推定部は、前記動き領域における前記時空間評価値の時間変化から前記動き領域に存在する人数が2人以上の所定人数か否かを推定することを特徴とする請求項1に記載の映像監視システム。
【請求項3】
前記時間・空間変化算出部は、前記時空間ヒストグラムのエントロピーに基づき時空間豊富度を算出し、前記時空間評価値として用いることを特徴とする請求項1または2に記載の映像監視システム。
【請求項4】
前記時間・空間変化算出部は、前記時空間ヒストグラムの分散,標準偏差,歪度,尖度の何れか1つ以上を算出し、前記時空間評価値として用いることを特徴とする請求項1または2に記載の映像監視システム。
【請求項5】
前記時空間ヒストグラム作成部は、前記画像データから、前記方向に関する特徴として明度勾配方向を量子化した方向符号を算出し、前記時空間内の前記方向符号の出現頻度を表す前記時空間ヒストグラムを作成することを特徴とする請求項1から4の何れかに記載の映像監視システム。
【請求項6】
前記時空間ヒストグラム作成部は、前記画像データから、前記方向に関する特徴として動きの方向を算出し、前記時空間内の前記動きの方向の出現頻度を表す前記時空間ヒストグラムを作成することを特徴とする請求項1から4の何れかに記載の映像監視システム。
【請求項7】
前記人数推定部は、前記時空間評価値の時間変化から画像内または特定領域に存在する人数が1人か2人以上かを推定することを特徴とする請求項1から6の何れかに記載の映像監視システム。
【請求項8】
前記人数推定部によって推定された人数が前記所定人数以上である場合に警報を出力させる判定部を有することを特徴とする請求項1から7の何れかに記載の映像監視システム。
【請求項9】
撮像機器から取得した映像信号に基づく画像データから方向に関する特徴を算出するとともに、前記方向に関する特徴についてのヒストグラムを所定の大きさの時空間において算出した時空間ヒストグラムを作成し、
前記時空間ヒストグラムから動きの複雑さを表す時空間評価値を算出するとともに、前記時空間評価値の時間変化を算出し、
前記時空間評価値の時間変化から画像内または特定領域に存在する人数が2人以上の所定人数以上か否かを推定することを特徴とする人数推定方法。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【公開番号】特開2012−221331(P2012−221331A)
【公開日】平成24年11月12日(2012.11.12)
【国際特許分類】
【出願番号】特願2011−87852(P2011−87852)
【出願日】平成23年4月12日(2011.4.12)
【出願人】(000005108)株式会社日立製作所 (27,607)
【Fターム(参考)】
【公開日】平成24年11月12日(2012.11.12)
【国際特許分類】
【出願日】平成23年4月12日(2011.4.12)
【出願人】(000005108)株式会社日立製作所 (27,607)
【Fターム(参考)】
[ Back to top ]