説明

映像監視システム

【課題】
監視センター側の復号処理の負荷を低減することができる映像監視システムを提供する。
【解決手段】
カメラとこのカメラから映像データが転送される監視装置とを有する映像監視システムにおいて、監視装置が、カメラから転送される映像データを復号する復号部と、カメラ画像認識部の画像処理の結果に基づき復号部の復号手段を選択する画像認識部とを有する。
【効果】
カメラ側での認識情報に応じた復号処理を選択することができるので、効率の良い映像監視システムが実現できる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、カメラなどの撮像装置から取得される映像から侵入者などを検知する映像監視システムに関する。
【背景技術】
【0002】
カメラから取得した映像から画像処理により監視エリアに現れる人や車両などの移動物体を検知する機能を有する映像監視システムは、検出結果を利用することで移動物体の出現した映像のみ記録する機能や、表示装置に警告アイコンを提示する機能を有するため、またブザー等を鳴らして監視員の注意を促すことができるため、従来は監視員による常時確認作業が必要であった監視業務の負担低減に役立つ。また、このような映像監視システムは、窃盗などの不正行為が発生した場合、記録した映像を事後の犯罪立証に役立てることも可能である。
【0003】
近年、犯罪の多様化や、犯罪検挙数の増加などにより、量販店,金融機関,オフィスビル等での防犯意識が高まり、映像監視システムの導入が進んでいる。映像記録装置も大容量化し、ネットワークカメラなどの普及により様々な場所にカメラが設置されることで、カメラ台数も増加している。このため、犯罪者を監視員の目視作業により記録映像から洗い出すことは非常に困難であり、監視業務を支援する機能への要望が高まっている。
【0004】
ネットワークカメラで取得した映像は、ネットワークカメラもしくは監視機器に内蔵された符号化手段を用いて映像を圧縮し、監視センター等に蓄積される。この際に映像を効率的に圧縮するため、画像認識機能を用いて、動きのあるような注目したい領域のみ高精細に画像を圧縮する技術が、例えば特開2004−200739号公報(特許文献1)に記載されている。特許文献1の技術では映像符号化手段の一つであるJPEG2000のROI(Region of Interest)と呼ばれる機能が採用されている。
【0005】
【特許文献1】特開2004−200739号公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
映像監視システムは、複数台のカメラと制御装置および記録装置によって構成されるが、ネットワークカメラに割り当てられる計算リソースは限られており、高度な画像認識を実現することが困難な場合が多い。また、複数のカメラ間に跨る追跡処理や検索処理を行う場合は、映像の集約される監視センター側の装置で実行することが望ましく、この際に、符号化された映像データを一度復号化し、画像認識処理に適したデータへ変更することが必要である。複数台のカメラ映像が監視センターに集約された場合、膨大な映像に対して、復号処理を実行する必要があり、処理負荷が高まるという問題が発生する。このように、映像監視システムでは、その限られた処理リソースの中で効率的に所望の処理を実現させるという課題がある。
【0007】
本発明は、上記の課題を考慮してなされたものであり、監視センター側の復号処理の負荷を低減することができる映像監視システムを提供する。
【課題を解決するための手段】
【0008】
本発明による映像監視システムにおいては、監視装置が、カメラから転送される映像データを復号する復号部と、カメラ画像認識部の画像処理の結果に基づき復号部の復号手段を選択する画像認識部とを有する。
【発明の効果】
【0009】
本発明によれば、監視装置側での画像認識処理において、カメラ側での認識情報に応じた復号処理を選択することができるので、効率の良い映像監視システムが実現できる。
【発明を実施するための最良の形態】
【0010】
以下に、本発明の一実施形態について図面を参照しながら説明する。
【0011】
図1は本発明の一実施形態であるネットワーク型の映像監視システムの構成を示す。本実施形態において、ハードウェアはCPU,メモリ,LSI等を備えた電子計算機システムにより構成され、夫々の機能を実行するようになっている。ここでは、ハードウェアの構成単位ではなく、それらのハードウェアやソフトウェアにより構成される各機能をブロックで表現している。
【0012】
映像監視システムは、ネットワークカメラ10と、監視装置20を備え、ネットワーク30を介してネットワークカメラ10から監視装置20へ映像やパラメータ情報などを転送する。ネットワーク30としては、ユーザの所有する専用回線や公衆網が用いられる。また、通信プロトコル等も本実施形態を実現できるものであれば如何なるものであっても良い。ネットワークカメラ10から監視装置20へ転送された映像は、記録媒体40に保存される。記録媒体40としては、ハードディスクドライブ,フラッシュメモリなどの電子記録媒体や磁気テープなどが用いられる。また、本システムにおいては、RGBモニタ出力,ネットワーク経由でのデータ出力なども備えられ、パラメータ設定はユーザインターフェース50で実行される。ユーザインターフェース50における入力は、マウスやキーボードなどの入出力機器や、監視装置20の入力機能とする。
【0013】
ネットワークカメラ10は、カメラレンズとCMOSやCCDなどの撮像媒体により構成される撮像装置から取得した映像信号を取得する映像取得部101と、取得した映像信号をMPEG(Moving Picture Experts Group)やJPEG(Join Photographic Expert Group)など所定のデータへ符号化する符号部102と、映像取得部101から取得した画像認識用の画像データに対して所定の画像認識処理を実行するカメラ画像認識部103を備える。
【0014】
監視装置20は、ネットワークカメラ10から転送された映像に対して時間情報などの付加情報も含めて記録媒体40に保存する記録部201と、ユーザインターフェース50にて監視することを目的としたモニタ出力、もしくは画像認識処理を実行するのに適したデータへ変換処理を実行する復号部202と、監視装置20で画像認識処理を実行する画像認識部203を備える。
【0015】
映像取得部101は、撮像装置から取得した映像信号を後述する符号部102に適した映像信号として出力する。また、映像取得部101は、カメラ画像認識部103での処理に適した画像データを生成する。
【0016】
ここで、画像データは1次元配列もしくは2次元配列の画像データとして取得することができ、この画像データにおいては、ノイズやフリッカなどの影響を低減するために、前処理として平滑化フィルタや輪郭強調フィルタ,濃度変換などの処理を施してもよい。また、用途に応じてRGBカラーやモノクロなどのデータ形式を選択してもよい。さらには、処理コスト低減のために、所定の大きさで画像データに縮小処理を施してもよい。以下、簡単のため、フレーム単位の符号化処理および画像処理として説明する。
【0017】
符号部102では、MPEG(Moving Picture Experts Group)や、JPEG(Join Photographic Expert Group),H.26xなどの標準符号化規格を採用し、設定手段により符号化手段を設定することが可能である。符号部102は、映像取得部101から取得した映像信号を受け取り、映像信号を所定の符号化規格に準拠したデータとして出力する。
【0018】
カメラ画像認識部103では、映像取得部101から取得した画像データに対して所定の画像処理を実行する。カメラ画像認識部103では映像内に発生するイベントを検出する。このイベント検出処理を、本実施例では映像内の動きを背景差分法により検知した場合について図2を用いて説明する。ここでは、映像取得部101から取得した画像データを入力画像とする。動き検知は入力画像と比較するための背景画像を保持していることを前提とする。背景画像とは入力画像のなかで移動物体を含まない画像のことである。背景差分法とは、入力画像と背景画像とを比較することで、背景画像に対して変化のある部分を人物等の移動物体とみなして映像の動きとするものである。この手段により、映像内の動きをイベントとして検出することが可能である。
【0019】
図2に示すカメラ画像認識部103のイベント検出は、映像取得部101にて転送された画像にて、事前に背景画像生成手段302にて背景画像を生成し保持する。背景画像は動きのない部分を背景画像と設定したり、もしくは入力画像の時系列データから背景画像を生成したりするが、いずれの場合でもよい。この背景画像と入力画像とを変化算出手段301にて比較する。その結果を動き検知手段303にて動きであるか否かを判断し、動きの領域やその大きさなどの結果を含む画像データを符号部102およびネットワークを介して監視装置20内の画像認識部203へ転送する。
【0020】
本実施例のカメラ画像認識部103でのイベント検出処理おいては、各手段を様々なイベントに対して変更し、イベントを検出することが可能である。例えば、顔(特定の顔も含む),車両,移動する人物,所定の服や性別等の属性を持つ人物,犯罪や不審行動,荷物の置き去り等、画像処理で検出可能なイベントであればいずれの場合でもよい。さらに、赤外線センサやレーダーセンサ,音声センサなどの外部モジュールから取得したイベント,入退室管理装置などから発生するイベントとすることも可能である。
【0021】
監視装置20内のカメラ画像認識部203がネットワークカメラ10から取得した画像データの特徴記述について、図3を用いて説明する。図3(a)の401はモニタ出力および画像処理の一例である。検出された物体などイベント検知領域402のように検知領域に接するような矩形で表示される。この際に始点座標403は(始点x座標,始点y座標)、終点座標404(終点x座標,終点y座標)を情報として取得する。
【0022】
図3(b)は特徴記述の一例を示す。画面全体のフレーム情報405のように、カメラID406,タイムスタンプ407(時刻のフレーム情報),フレーム特徴408を記述する。カメラID406はシステム設定時に各カメラに対する識別番号として設定する。これは、ネットワークのIPアドレスや番号や記号によってカメラを識別するものである。タイムスタンプ407はネットワークカメラ10間で同期を取るために用いられる。ネットワークカメラ10から伝送したデータを監視装置20で管理する場合に、時間同期をとりながら記録媒体40に記録し、検索などに利用する。
【0023】
フレーム特徴408は映像フレーム全体の特徴量であり、明るさやテクスチャ、またオブジェクトの数などの特徴を指す。具体的には、画像全体の色ヒストグラムや、画像の輝度勾配ヒストグラム,天候変化や照明変化による時間的変化の情報であり、さらにはオブジェクトの数(例えば人物,物体,顔,通過車両など)を含む。また、ここでは映像情報に限らず、騒音や悲鳴,人物の声など音声情報も加味することも可能であり、フレーム単位の情報として取得可能なあらゆる情報を記載できる。
【0024】
映像フレーム内に発生する各オブジェクト情報はオブジェクト情報409のように記述する。オブジェクト番号410にはカメラ内に発生したオブジェクトを識別するために、オブジェクトの識別番号を記載する。種別411にはオブジェクトの認識種別である、人,人物の顔,物体、また動作の種別など、画像認識で識別可能な種別を分類するために記載する。また座標情報412には先述したイベント検知領域の始点および終点に対応するオブジェクトの始点座標および終点座標を記載する。これには、オブジェクトの時間的な移動を含めることができ、動きベクトルやイベントの座標情報の変化も記入することができる。オブジェクト情報413には、種別411で記載した情報の詳細情報,顔検知であれば顔データの特徴量や、顔検知の検知確信度(顔らしさの度合い)や動きの大きさ(動きベクトルの分布)を含む。またイベント検知領域402の矩形の大きさ,重心,モーメントなども含む。これら画像処理で取得した特徴量などをオブジェクト毎に記載することとする。
【0025】
画像認識部203で取得した画像データの特徴記述は、監視装置20側で画像認識する際の復号処理に利用する。この際の動作について図4および図5を用いて説明する。監視装置20での画像処理は、ネットワークカメラ10側のカメラ画像認識部103で画像処理を実行した物体に対して、所定の条件に従い監視装置側で詳細な認識を行う。処理選択手段601では、図4に示すように、種別501とオブジェクト情報502の組み合わせから、復号条件503を復号部202に対して送信する。復号条件には、画像を復元する位置,画像の解像度や画質,フレームレート,ビットレートなどの情報が含まれ、これらの内の一つあるいはいくつかの復号手段を選択できる。なお、図4に示すような、種別およびオブジェクト情報の組み合わせと、復号条件および画像認識実行条件との対応を示すデータは、監視装置20内に予め登録されている。
【0026】
復号部202は、復号条件503および、座標情報412に基づいて復号処理を実行する。例えば、復元領域が始点座標(sx,sy)−終点座標(ex,ey)であり、解像度が現画像サイズの1/4、標準画質などというように設定することができる。復号された画像データは画像認識手段602に送信され、画像認識手段602は画像認識実行条件504に基づき処理を実行する。ここでは、種別501とオブジェクト情報502の組み合わせによって実行される処理が変更される。例えば、顔検知とされた領域であれば、詳細情報を取得するために高解像度の画像に対して実行することとし、その情報から年齢や性別識別のための画像認識実行条件504を選択しタグ情報を取得するなど、後段の処理に相当する。画像認識手段602の処理結果は記録媒体40へ送信し、映像情報とともに、映像のタグとして保存される。この場合、カメラID406とタイムスタンプ407も同時に保存することで、後の時間による検索やカメラ位置による検索に利用することができる。
【0027】
次に図6を用いて画像処理決定方法について述べる。画像処理条件の設定については、ユーザインターフェース50より、モニタへの設定画面出力,監視装置20の入力機能を用いて実行する。カメラ側での処理に対して、監視装置20側の認識実行条件を設定することができる。例えば、前述のようにカメラ側で顔検知を実行し、監視装置側で年齢推定などの詳細情報を検出する機能を実行することができる。カメラ側の処理は、基本的な認識機能に留めておき、監視装置側に後段の処理を実行させることで、処理の負荷分散が可能となる。
【0028】
本実施形態はカメラ画像認識部103と所定の処理選択条件に基づき、符号化処理および画像認識処理を選択しているが、これはユーザインターフェース50を介して、ユーザが一意に設定することも可能であり、所定の領域に対して固定の解像度やフレームレートでの符号化処理や、所望の画像認識処理を実行できるものとする。
【0029】
本実施形態は、記録媒体40に保存された符号化データに対して、復号部202において所定の処理を実行することも可能である。復元領域を始点座標(sx,sy)−終点座標(ex,ey)と設定し、フレームレートや解像度などの復号条件503と画像認識実行条件504を選択して実行することが可能である。
【0030】
図7は、本発明の別の実施形態である映像監視システムを示す。ここでは、画像認識情報の転送手段が前述の実施形態と異なり、そのほかの手段については、前述の実施形態と同様である。本実施形態においては、カメラ画像認識部103での処理結果を符号部102の映像情報のヘッダファイルに書き込み、復号部202ではヘッダファイルから画像認識部203へ処理の指示を実行する。図8に示すように、例えば映像符号化時のデータ集合であるGOP(Group of Pictures)ヘッダ901に情報を記述する。GOPヘッダ901と共に映像情報がフレーム情報902に格納されている。ここでは、GOP内のヘッダ領域に、座標903,画像特徴904を記載しておくことが可能である。これらの情報は図3に示した例と同様に、オブジェクトの座標やテクスチャなどの情報,顔検知などの確信度情報などを記述することが可能である。先の実施形態と同様に図4に記載した条件に基づき画像認識部203は画像処理を実行する。
【0031】
符号化手段を有するネットワーク型のシステム形態の場合、監視装置20側で映像の利用形態に応じて複数の符号化手段を選択できることが望ましい。例えば、映像を単に記録したい場合は高圧縮率を有する符号化手段を選択し、画像1枚単位での処理を実行したい場合は静止画の符号化手段であるJPEGを選択する。これにより、映像ストリーム型のデータよりも、静止画の方が扱いやすいなど状況に応じた使い分けが可能となる。図9では、各特徴量に対して所定の符号化方法を選択するようにするものである。
【0032】
なお、上述した各実施形態に限らず、本発明の技術的思想の範囲内において、種々の実施形態が可能である。
【図面の簡単な説明】
【0033】
【図1】本発明の一実施形態である映像監視システムの構成を示す図である。
【図2】図1の実施形態におけるカメラ画像認識部を示す図である。
【図3】カメラ画像認識部で取得する情報について説明した図である。
【図4】図1の実施形態における復号処理および画像処理を選択するための情報記述について説明した図である。
【図5】図1の実施形態における画像認識部について示した図である。
【図6】画像認識機能の設定画面について示した図である。
【図7】本発明の他の実施形態である映像監視システムの構成を示す図である。
【図8】図7の実施形態におけるフレーム情報の記載方法について示した図である。
【図9】図7の実施形態における符号化種別の設定画面について示した図である。
【符号の説明】
【0034】
10 ネットワークカメラ
20 監視装置
30 ネットワーク
40 記録媒体
50 ユーザインターフェース
101 映像取得部
102 符号部
103 カメラ画像認識部
201 記録部
202 復号部
203 画像認識部
301 変化算出手段
302 背景画像生成手段
303 動き検知手段
401 モニタ出力
402 イベント検知領域
403 始点座標
404 終点座標
405,902 フレーム情報
406 カメラID
407 タイムスタンプ
408 フレーム特徴
409,413,502 オブジェクト情報
410 オブジェクト番号
411,501 種別
412 座標情報
503 復号条件
504 画像認識実行条件
601 処理選択手段
602 画像認識手段
901 GOPヘッダ
903 座標
904 画像特徴

【特許請求の範囲】
【請求項1】
カメラと前記カメラから映像データが転送される監視装置とを有する映像監視システムにおいて、
前記カメラは、撮像装置から信号を取得する映像取得部と、前記映像取得部より取得した入力画像に画像処理を実行するカメラ画像認識部と、前記カメラ画像認識部の処理結果に基づき符号化処理を実行し前記映像データを生成する符号部と、を有し、
前記監視装置は、前記映像データを復号する復号部と、前記カメラ画像認識部の前記処理結果に基づき前記復号部の復号手段を選択する画像認識部と、を有することを特徴とする映像監視システム。
【請求項2】
請求項1に記載の映像監視システムにおいて、前記カメラ画像認識部は、各映像フレームにおいて、フレーム情報およびオブジェクト情報を生成することを特徴とする映像監視システム。
【請求項3】
請求項1または2に記載の映像監視システムにおいて、前記フレーム情報には、前記映像フレームの特徴が記述され、前記オブジェクト情報には前記映像フレーム内に発生する各オブジェクト情報が記述されることを特徴とする映像監視システム。
【請求項4】
請求項1乃至3のいずれか一項に記載の映像監視システムにおいて、前記画像認識部は、前記カメラ画像認識部から転送された前記フレーム情報および前記オブジェクト情報から前記復号部の復号手段を選択する処理選択手段を有し、前記復号部は復元箇所,解像度,フレームレート,画質のうち少なくとも一つを選択することを特徴とする映像監視システム。
【請求項5】
請求項1乃至4のいずれか一項に記載の映像監視システムにおいて、前記画像認識部は、前記復号部で復号された前記映像データに対して所定の画像認識を実行する画像認識手段を有することを特徴とする映像監視システム。
【請求項6】
請求項1乃至5のいずれか一項に記載の映像監視システムにおいて、前記画像認識部は、前記カメラ画像認識部と前記画像認識部の処理を所望の形態に選択する手段を有することを特徴とする映像監視システム。
【請求項7】
請求項1乃至6のいずれか一項に記載の映像監視システムにおいて、前記処理結果を前記映像データ内に記述することを特徴とする映像監視システム。
【請求項8】
請求項1乃至7のいずれか一項に記載の映像監視システムにおいて、前記符号化部において複数の符号化手段を選択的可能であり、前記カメラ画像認識部の処理結果に基づき、前記符号化手段を設定することを特徴とする映像監視システム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate