説明

監視情報生成装置

【課題】 監視者が常駐することを必要とせず、過去に発生したイベントの有無と、イベントが検知された際のイベント内容を容易に確認することが可能な表示情報を生成する。
【解決手段】 イベントが発生したときの典型的な音声データと当該イベントの内容を示すイベント内容データとを対応させた参照音声データを予め記憶する参照データ記憶部608と、マイク20から受信した解析対象の音声データに該当する参照音声データがあれば対応するイベント内容データを抽出する音声解析部609と、所定期間前までに受信した音声データの音圧レベル値を時間軸上にグラフ表示するための音声情報表示データを生成し、時間軸上の該当する位置にイベント内容データを関連付ける音声情報生成部610と、監視カメラ10から受信された映像データに生成された音声情報表示データを重畳して表示用のディスプレイ表示データを生成するデータ重畳部612とを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、監視エリアの映像情報および音声に関する情報を表示させるための表示情報を生成する監視情報生成装置に関する。
【背景技術】
【0002】
近年、監視カメラで撮影したデジタル映像信号やデジタル音声信号を表示装置または記録装置へ伝送するときの伝送媒体として、イーサネット(登録商標)等の通信ネットワークを用いるネットワーク型の監視システムが急速に普及している。
【0003】
このようなネットワーク型の監視システムにおいては、複数の監視カメラで撮影した映像信号や音声信号を1本のケーブルで重畳して伝送することが可能である。
【0004】
そのため、監視対象の施設内に予めネットワークケーブルを配線しておくことにより、設置する監視カメラの台数を後から任意に変更することが可能になる。
【0005】
また、このようなネットワーク型の監視システムでは、監視カメラにおけるパン・チルト・ズーム等の撮影方向、尺度の制御を行うための制御信号もネットワークケーブルを利用して遠隔から送信することが可能であり、アナログ信号で伝送する監視システムのように別途制御信号送信用の配線をする必要がないという利点がある。
【0006】
このような監視システムにおいては、従来は映像情報のみによる監視が主であったが、監視対象の場所の状況をより詳しく知るために音声情報も加えたいという要求が高まってきている。
【0007】
監視の対象に音声情報も加えることにより、映像に映っていないエリアの情報、例えば映像に映っていないエリアで不審者によりガラスが割られた場合の情報などを検知できる可能性が高くなる。ここで、音声情報を加えた監視システムに関する技術として、特許文献1および2に記載された技術がある。
【0008】
特許文献1には、監視エリアから得られた映像情報と音声情報とを単に監視者に提示するだけでなく、音声情報を分析することにより異常音が検出されたときに、表示する映像情報を異常音の発生場所の監視カメラで撮影された映像情報に切り替える監視モニター装置が記載されている。この監視モニター装置により、監視エリアで異常音が発生したときの映像による確認を容易に行うことができる。
【0009】
しかし、この特許文献1の監視モニター装置については、監視者が常にモニター装置の前に常駐する必要があり、監視者が不在のときに発生したイベントに関する情報を残すことが困難であった。
【0010】
また、特許文献2には、映像情報の表示とともに、過去から現在に至るまでに取得した音声情報をグラフを用いてモニター上に履歴表示する監視システム装置が記載されている。この監視システム装置によれば、監視者がモニターの前に常駐することなく過去に取得した音声情報の履歴を確認することが可能になる。
【特許文献1】特開2004−139261号公報
【特許文献2】特開2001−307252号公報
【発明の開示】
【発明が解決しようとする課題】
【0011】
特許文献1記載の監視モニター装置によれば、モニターの表示が切り替えられたことにより監視者は何らかの異常が発生したことは知ることができるが、異常が発生してからどのくらいの時間が経過しているかを知る手段や、異常音の発生に関する映像が映っていなかった場合にどのような異常が発生したかを知る手段が提供されていないという問題があった。
【0012】
また、特許文献2の技術では、あくまでも音声情報がどのように変化したかを示すのみであり、示された情報から異常発生に関する有意な情報を得るためには監視映像を確認する作業が別途必要であるという問題があった。
【0013】
そこで本発明は、上記問題に鑑みなされたものであり、監視者が常駐することを必要とせず、過去に発生したイベントの有無、およびイベントが検知された際のイベント内容を容易に確認することが可能な表示情報を生成する監視情報生成装置を提供することを目的とする。
【課題を解決するための手段】
【0014】
上記目的を達成するための本発明の監視情報生成装置(60−1〜60−3)は、監視エリアを撮影する監視カメラ(10−1〜10−3)と、前記監視エリアおよびその近傍の音を集音するマイク(20−1〜20−3)と、表示装置(70−1〜70−3)と、監視情報生成装置(60−1〜60−3)とを備えた監視システム(1)における監視情報生成装置(60−1〜60−3)であって、前記監視カメラ(10−1〜10−3)で撮影された前記監視エリアの映像の映像データと、前記マイク(20−1〜20−3)で集音された前記監視エリアおよびその近傍の音の音声データとを受信するデータ受信部(601)と、音声発生イベントに応じた典型的な音声データを所定の周波数帯域ごとの音圧レベル値で示した参照周波数特徴データと、前記音声発生イベントの内容を示すテキストデータであるイベント内容データとにより構成された参照音声データを、予め複数個記憶する参照データ記憶部(608)と、前記受信された音声データを取得し、この音声データの一定期間ごとの音圧レベル値を算出する音圧レベル値算出部(607)と、前記受信された音声データを取得し、この音声データを前記周波数帯域ごとの音圧レベル値で示した解析周波数特徴データに変換して参照データ記憶部(608)に記憶されている各前記参照周波数特徴データと帯域ごとに比較し、前記解析周波数特徴データに該当する前記参照周波数特徴データがある場合にこの参照周波数特徴データに対応するイベント内容データを抽出する音声解析部(609)と、前記算出された現在から所定期間前までの音圧レベル値を取得して時間軸上にグラフ表示するための音声情報表示データを生成し、前記音声解析部(609)でいずれかのイベント内容データが抽出されている場合には、抽出された時刻に該当する前記時間軸上の位置にイベント発生を示すマークを付すとともに、前記抽出されたイベント内容データを前記マークに関連付ける音声情報生成部(610)と、前記受信された映像データに、前記生成された音声情報表示データを重畳して表示用のディスプレイ表示データを生成するデータ重畳部(612)と、前記生成されたディスプレイ表示データを、前記表示装置(70−1〜70−3)に出力する映像出力部(613)とを備えたことを特徴とする。
【0015】
また、本発明の他の形態の監視情報生成装置(60−1〜60−3)は、監視エリアを撮影する監視カメラ(10−1〜10−3)と、前記監視エリアおよびその近傍の音を集音するマイク(20−1〜20−3)と、表示装置(70−1〜70−3)と、監視情報生成装置(60−1〜60−3)とを備えた監視システム(2)における監視情報生成装置(60−1〜60−3)であって、前記監視カメラ(10−1〜10−3)で撮影された前記監視エリアの映像の映像データと、前記マイク(20−1〜20−3)で集音された前記監視エリアおよびその近傍の音の音声データとを受信するデータ受信部(601)と、音声発生イベントに応じた典型的な音声データの、所定期間の音圧レベル値の変動パターンを示す参照変動パターンデータと、前記音声発生イベントの内容を示すテキストデータであるイベント内容データとにより構成された参照音声データを、予め複数個記憶する参照データ記憶部(608)と、前記受信された音声データを取得し、この音声データの一定期間ごとの音圧レベル値を算出する音圧レベル値算出部(607)と、前記算出された音圧レベル値を解析対象データとして取得し、この解析対象データと前記参照データ記憶部(608)に記憶されている前記各参照変動パターンデータとを所定時間幅ごとに比較し、前記解析対象データに該当する前記参照変動パターンデータがある場合にこの参照変動パターンデータに対応するイベント内容データを抽出する音声解析部(609)と、前記算出された現在から所定期間前までの音圧レベル値を取得して時間軸上にグラフ表示するための音声情報表示データを生成し、前記音声解析部(609)でいずれかのイベント内容データが抽出されている場合には、抽出された時刻に該当する前記時間軸上の位置にイベント発生を示すマークを付すとともに、前記音声解析部(609)で抽出されたイベント内容データを前記マークに関連付ける音声情報生成部(610)と、前記受信された映像データに、前記生成された音声情報表示データを重畳して表示用のディスプレイ表示データを生成するデータ重畳部(612)と、前記生成されたディスプレイ表示データを、前記表示装置(70−1〜70−3)に出力する映像出力部(613)とを備えたことを特徴とする。
【発明の効果】
【0016】
本発明の監視情報生成装置によれば、監視者が常駐することを必要とせず、過去に発生した音声発生イベントの有無、および音声発生イベントが検知された際のイベント内容を容易に確認することが可能な表示情報を生成することができる。
【発明を実施するための最良の形態】
【0017】
《第1実施形態》
本発明の第1実施形態による監視情報生成装置は、監視エリアおよびその近辺の音声の周波数特性に基づいて音声を発する特異な事態(イベントまたは音声発生イベントと言う)が起こったか否かを判断するとともに、イベントが起こったと判断されたときにこのイベントの内容を特定し、これらの情報を表示装置に表示させることを特徴としている。
【0018】
〈第1実施形態による監視システムの構成〉
本実施形態である監視情報生成装置を適用した監視システムの構成を、図1を参照して説明する。
【0019】
〈第1実施形態による監視システム〉
本実施形態による監視システム1は、複数の監視カメラ10−1〜10−3と、これらの監視カメラ10−1〜10−3にそれぞれ接続されたマイク20−1〜20−3と、監視カメラ10−1〜10−3に接続されたネットワークハブ30と、ネットワーク40を介してネットワークハブ30に接続されたネットワークハブ50と、ネットワークハブ50に接続され、監視カメラ10−1〜10−3にそれぞれ対応させた複数の監視情報生成装置60−1〜60−3と、これらの監視情報生成装置60−1〜60−3にそれぞれ接続された表示装置としてのディスプレイ70−1〜70−3およびスピーカ80−1〜80−3とを備えている。
【0020】
監視カメラ10−1〜10−3は、それぞれ、各監視エリアを撮影して映像データを生成した後JPEG等の形式で圧縮し、ネットワークハブ30、ネットワーク40、およびネットワークハブ50を介して、それぞれ対応する監視情報生成装置60−1〜60−3に送信する。
【0021】
また、監視カメラ10−1〜10−3は、それぞれ接続されたマイク20−1〜20−3から音声データを取得し、MP3等の形式で圧縮して映像データと同様にネットワークハブ30、ネットワーク40、およびネットワークハブ50を介して、対応する監視情報生成装置60−1〜60−3に送信する。
【0022】
マイク20−1〜20−3は、それぞれ、監視エリアおよびその近辺の音声を取得して音声データに変換し、接続された監視カメラ10−1〜10−3に送出する。
【0023】
監視情報生成装置60−1〜60−3は、それぞれ図2に示す(同図においては、監視情報生成装置60と記す)ように、データ受信部601と、映像復号部602と、映像メモリ部603と、音声復号部604と、音声メモリ部605と、音声出力部606と、音圧レベル値算出部607と、参照データ記憶部608と、音声解析部609と、音声情報生成部610と、音声情報記憶部611と、データ重畳部612と、映像出力部613とを有する。
【0024】
データ受信部601は、監視カメラ10−1〜10−3から送信された、圧縮された映像データおよび音声データを受信する。映像復号部602は、データ受信部601で受信された、圧縮された映像データを伸張する。映像メモリ部603は、映像復号部602で復号された映像データを記憶する。
【0025】
音声復号部604は、データ受信部601で受信された、圧縮された音声データを復号する。音声メモリ部605は、音声復号部604で復号された音声データを記憶する。音声出力部606は、音声メモリ部605に記憶されたデジタル音声データを一定の周期で取得してアナログ音声データに変換し、接続されたスピーカ80−1〜80−3に送信する。
【0026】
音圧レベル値算出部607は、音声復号部604で復号された音声データを取得し、一定期間ごとの音圧レベル値を算出する。
【0027】
参照データ記憶部608には、イベントが発生したときの典型的な音声データである、ガラスが破壊されたときの音やドアが閉まるときの音などを、所定の周波数帯域ごとの音圧レベル値で示した参照周波数特徴データと、イベントの内容を示すテキストデータであるイベント内容データとから構成された参照音声データを、予め複数個記憶しておく。
【0028】
音声解析部609は、音声復号部604で復号された音声データを取得し、参照周波数特徴データと同様の周波数帯域ごとの音圧レベル値で示した解析対象データである解析周波数特徴データに変換して参照データ記憶部608に記憶されている各参照周波数特徴データと帯域ごとに比較し、変換した解析周波数特徴データに該当する参照周波数特徴データがあればこの参照周波数特徴データに対応するイベント内容データを抽出する。音声データを解析周波数特徴データに変換する際は、FFT(高速フーリエ変換)の手法を用いることができる。
【0029】
音声情報生成部610は、音圧レベル値算出部607で算出された過去の音圧レベル値を取得して時間軸上にグラフ表示するための音声情報表示データを生成し、音声解析部609でいずれかのイベント内容データが抽出されたときには、抽出された時刻に該当する時間軸上の位置にイベント発生を示すマークを付し、さらに音声解析部609で抽出されたイベント内容データをこのマークに関連付ける。
【0030】
音声情報記憶部611は、音声情報生成部610で生成された音声情報表示データを記憶する。
【0031】
データ重畳部612は、映像メモリ部603に蓄積された映像データおよび音声情報記憶部611に記憶された音声情報表示データを取得して、取得した映像データに当該音声情報表示データを重畳して表示用のディスプレイ表示データを生成する。
【0032】
映像出力部613は、データ重畳部612で生成されたディスプレイ表示データをD/A変換し、接続されたディスプレイ70−1〜70−3のいずれかに送信する。
【0033】
ディスプレイ70−1〜70−3は、接続された監視情報生成装置60−1〜60−3から送信されたディスプレイ表示データを取得して表示する。
【0034】
スピーカ80−1〜80−3は、音声出力部606から送信された音声データを取得して出力する。
【0035】
〈第1実施形態による監視システムの動作〉
次に、本実施形態である監視システム1の動作について説明する。
【0036】
本実施形態の監視システム1の監視カメラ10−1〜10−3は、それぞれ、各監視エリアを撮影して映像データを生成し、さらにこの映像データをJPEG等の形式で圧縮する。
【0037】
また、監視カメラ10−1〜10−3にそれぞれ接続されたマイク20−1〜20−3では、それぞれ、監視エリアおよびその近辺の音声が音声データに変換され、接続された監視カメラ10−1〜10−3に送出される。そして、監視カメラ10−1〜10−3においてMP3等の形式で圧縮される。
【0038】
圧縮された映像データおよび音声データは、監視カメラ10−1〜10−3からネットワークハブ30、ネットワーク40、およびネットワークハブ50を介して、それぞれ対応する監視情報生成装置60−1〜60−3に送信される。
【0039】
次に、監視情報生成装置60−1〜60−3が、圧縮された映像データおよび音声データを受信し、接続されたディスプレイ70−1〜70−3に表示させるための表示データを生成する場合の処理について、図3のフローチャートを併せ参照して説明する。
【0040】
まず、監視情報生成装置60−1〜60−3のデータ受信部601が圧縮された映像データおよび音声データを受信すると(S1)、これらのうち圧縮された映像データが映像復号部602で伸張され、映像メモリ部603に記憶される。また、データ受信部601で受信された圧縮された音声データは、音声復号部604で復号され、音声メモリ部605に記憶される(S2)。
【0041】
音声復号部604で復号された音声データは音圧レベル値算出部607でも取得され、一定期間ごと(例えば1秒ごと)の音圧レベル値が算出される(S3)。
【0042】
また、音声復号部604で復号された音声データは音声解析部609でも取得され、一定期間ごとの音声データが、参照周波数特徴データと同様の周波数帯域ごとの音圧レベル値で示した解析対象データである解析周波数特徴データに変換される。
【0043】
変換された解析周波数特徴データは、音声解析部609において参照データ記憶部608に記憶されている各参照周波数特徴データと帯域ごとに比較され、当該解析周波数特徴データに該当する参照周波数特徴データがあるか否かが判定される(S4)。
【0044】
音声解析部609における解析周波数特徴データと参照周波数特徴データとの比較処理について、図4のフローチャートおよび図5の周波数特徴データの例を併せ参照して説明する。
【0045】
参照データ記憶部608には複数の第n参照周波数特徴データが記憶されており、図5(a)においては、第1〜第3参照周波数特徴データの3つが記憶されている(n=1〜3)。
【0046】
これらの参照周波数特徴データは分割された周波数帯域(m)ごとの音圧レベル値で示されており、図5(a)においては、6つの周波数帯域(1)〜(6)ごとの音圧レベル値で示されている(m=1〜6)。
【0047】
また、図5(b)は、音声解析部609において変換された解析周波数特徴データの例である。ここでは、解析周波数特徴データも、参照周波数特徴データと同様の周波数帯域(m)(m=1〜6)ごとの音圧レベル値で示されているものとする。
【0048】
まず、音声解析部609において解析周波数特徴データと参照周波数特徴データとの比較処理が開始されると、参照周波数特徴データの中の1つの第n参照周波数特徴データが取得される。nの初期値は1であり、まずは第1参照周波数特徴データが取得され、mの初期値が1となる(S11、S12)。
【0049】
第1参照周波数特徴データが取得されると、このデータの中の1つの周波数帯域(m)について第1参照周波数特徴データと解析周波数特徴データとが比較される。mの初期値は1であり、まずは周波数帯域(1)について第1参照周波数特徴データと解析周波数特徴データとが比較される。
【0050】
比較の結果、解析周波数特徴データの周波数帯域(1)の音圧レベル値が参照周波数特徴データの周波数帯域(1)の音圧レベル値の一定の可変範囲内に含まれるか否かが判定される(S13)。
【0051】
この参照周波数特徴データの周波数帯域の音圧レベル値の一定の可変範囲とは、同一のイベントによる当該周波数帯域(m)の音声データであると認めるための許容範囲であり、ここでは当該周波数帯域の音圧レベル値の±5%以内の値を可変範囲内の値として定める。
【0052】
図5においては、解析周波数特徴データの周波数帯域(1)の音圧レベル値は第1参照周波数特徴データの周波数帯域(1)の可変範囲内には含まれないと判定され(S13の「NO」)、ステップS14に移動する。
【0053】
ステップS14において第2参照周波数特徴データの処理に移り、ステップS12に戻って第2参照周波数特徴データが取得される(S14、S15、S12)。
【0054】
第2参照周波数特徴データが取得されると、周波数帯域(m)について第2参照周波数特徴データと解析周波数特徴データとが比較される。mの初期値は1となり、まずは周波数帯域(1)について第2参照周波数特徴データと解析周波数特徴データとが比較される。
【0055】
比較の結果、解析周波数特徴データの周波数帯域(1)の音圧レベル値が参照周波数特徴データの周波数帯域(1)の音圧レベル値の一定の可変範囲内に含まれるか否かが判定される(S13)。
【0056】
図5においては、解析周波数特徴データの周波数帯域(1)の音圧レベル値は第2参照周波数特徴データの周波数帯域(1)の可変範囲内には含まれないと判定され(S13の「NO」)、ステップS14に移動する。
【0057】
ステップS14では第3参照周波数特徴データの処理に移り、ステップS12に戻って第3参照周波数特徴データが取得される(S14、S15、S12)。
【0058】
第3参照周波数特徴データが取得されると、周波数帯域(m)について第3参照周波数特徴データと解析周波数特徴データとが比較される。mの初期値は1となり、まずは周波数帯域(1)について第3参照周波数特徴データと解析周波数特徴データとが比較される。
【0059】
比較の結果、解析周波数特徴データの周波数帯域(1)の音圧レベル値が参照周波数特徴データの周波数帯域(1)の音圧レベル値の一定の可変範囲内に含まれるか否かが判定される(S13)。
【0060】
図5において、解析周波数特徴データの周波数帯域(1)の音圧レベル値は第3参照周波数特徴データの周波数帯域(1)の可変範囲内には含まれると判定され(S13の「YES」)、ステップS16に移動する。
【0061】
ステップS16では周波数帯域(2)の処理に移り、ステップS13に戻って、解析周波数特徴データの周波数帯域(2)の音圧レベル値が第3参照周波数特徴データの周波数帯域(2)の音圧レベル値の一定の可変範囲内に含まれるか否かが判定される(S16、S17、S13)。
【0062】
図5において、解析周波数特徴データの周波数帯域(2)の音圧レベル値は第3参照周波数特徴データの周波数帯域(2)の可変範囲内には含まれると判定され(S13の「YES」)、ステップS16に移動する。
【0063】
図5においては、ステップS13、S16の処理を周波数帯域(6)(m=6)まで繰り返すことにより、全ての周波数帯域において解析周波数特徴データの音圧レベル値が第3参照周波数特徴データの音圧レベル値の可変範囲内に含まれると判定され(S13、S16、S17)、この第3参照周波数特徴データは解析周波数特徴データに該当するデータであると判定される(S18)。
【0064】
また、ステップS13において、解析周波数特徴データの周波数帯域(m)の音圧レベル値は第n参照周波数特徴データの周波数帯域(m)の可変範囲内には含まれないと判定され、参照データ記憶部608内の全ての参照周波数特徴データについての比較処理が終了したとき(S15の「YES」)は、解析周波数特徴データに該当する参照周波数特徴データはないと判定される(S19)。
【0065】
以上で、音声解析部609における解析周波数特徴データと参照周波数特徴データとの比較処理についての説明を終了する。
【0066】
図3の説明に戻り、ステップS4において解析周波数特徴データに該当する参照周波数特徴データがあると判定されたときには、この参照周波数特徴データに対応するイベント内容データが抽出される(S5)。
【0067】
ステップS5においてイベント内容データが抽出されたとき、またはステップS4において解析周波数特徴データに該当する参照周波数特徴データがないと判定されたとき(S4の「NO」)は、音声情報生成部610において音圧レベル値算出部607で算出された過去の音圧レベル値が取得され、時間軸上にグラフ表示するための音声情報表示データが生成される(S6)。ここで取得される音圧レベル値は過去数十分〜数時間程度が好ましい。
【0068】
ここで、音声解析部609においていずれかのイベント内容データが抽出されているときには、音声情報生成部610により、この音声情報表示データにイベント内容データが抽出された時刻に該当するグラフデータの時間軸上の位置にイベント発生を示すマークが付され、さらに音声解析部609で抽出されたイベント内容データがこのマークに関連付けられる。
【0069】
音声情報生成部610で生成された音声情報表示データは、音声情報記憶部611に記憶される(S7)。
【0070】
次に、データ重畳部612において映像メモリ部603に蓄積された映像データおよび音声情報記憶部611に記憶された音声情報表示データが取得され、取得した映像データに当該音声情報表示データが重畳されて表示用のディスプレイ表示データが生成される(S8)。
【0071】
データ重畳部612で生成されたディスプレイ表示データは、映像出力部613においてD/A変換されて接続されたディスプレイ70−1〜70−3のいずれかに送信される。
【0072】
映像出力部613から送信されたディスプレイ表示データは、ディスプレイ70−1〜70−3でそれぞれ表示される。ディスプレイ70−1〜70−3に表示されたディスプレイ表示データの例を、図6に示す。
【0073】
図6(a)は監視カメラ10−1で撮影された映像データおよびマイク20−1で取得された音声データに基づいて監視情報生成装置60−1で生成されたディスプレイ表示データがディスプレイ70−1に表示された例であり、図6(b)は監視カメラ10−2で撮影された映像データおよびマイク20−2で取得された音声データに基づいて監視情報生成装置60−2で生成されたディスプレイ表示データがディスプレイ70−2に表示された例であり、図6(c)は監視カメラ10−3で撮影された映像データおよびマイク20−3で取得された音声データに基づいて監視情報生成装置60−3で生成されたディスプレイ表示データがディスプレイ70−3に表示された例である。
【0074】
それぞれのディスプレイ表示データは、映像データ71−1〜71−3と、音声情報表示データ72−1〜72−3とから構成されている。
【0075】
また、音声情報表示データ72−1〜72−3内には、イベントが発生したと認識された時刻位置に付せられたマーク73−1〜73−3が表示されるとともに、これらのマーク73−1〜73−3のいずれかにカーソルを近づけると、当該マークに関連付けられたイベント内容データが表示される。
【0076】
図6(b)においては、マーク73−2にカーソルが近づけられたことにより、マーク73−2に関連付けられたイベント内容データである「ガラス破壊音」のテキストデータ74−2が表示されている。
【0077】
また、音声メモリ部605に蓄積された音声データは、音声出力部606においてD/A変換されて接続されたスピーカ80−1〜80−3に送信され、スピーカ80−1〜80−3から出力される(S9)。
【0078】
以上の第1実施形態の監視システム1によれば、監視エリアおよびその近辺から取得された音声データの周波数特性に基づいてイベントの有無を検知し、さらにイベントが検知された際にこのイベントの内容を容易に確認することができるため、監視者が常駐することを必要とせずに所定期間の適切な監視を行うことができる。
【0079】
この第1実施形態においては、音声解析部609において解析周波数特徴データと参照周波数特徴データとが比較される際、設定された全ての周波数帯域において解析周波数特徴データの音圧レベル値が参照周波数特徴データの音圧レベル値の可変範囲内に含まれると判定されたときに当該参照周波数特徴データが解析周波数特徴データに該当するデータであると判定される場合について説明したが、周波数帯域の数が多い場合(数十〜数百等)には、設定された周波数帯域のうちある程度の割合(例えば95%)の帯域で解析周波数特徴データの音圧レベル値が参照周波数特徴データの音圧レベル値の可変範囲内に含まれれば、当該参照周波数特徴データが解析周波数特徴データに該当するデータであると判定するようにしてもよい。
【0080】
《第2実施形態》
本発明の第2実施形態による監視情報生成装置は、監視エリアおよびその近辺の音声の音声レベル変動パターンに基づいてイベントが起こったか否かを判断するとともに、イベントが起こったと判断されたときにこのイベントの内容を特定し、これらの情報を表示させることにより監視者に提供する。
【0081】
〈第2実施形態による監視システムの構成〉
本実施形態による監視システムの構成2は、第1実施形態による監視システム1の構成と同様であるため、同一の機能の構成部については詳細な説明は省略する。
【0082】
本実施形態における監視情報生成装置60−1〜60−3の参照データ記憶部608は、イベントが発生したときの典型的な音声データの音圧レベル値の所定期間の変動パターンを示す参照変動パターンデータと、当該イベントの内容を示すテキストデータであるイベント内容データとからなる参照音声データを、予め複数個記憶しておく。
【0083】
音声解析部609は、音圧レベル値算出部607で算出された音圧レベル値を解析対象データとして取得し、この解析対象データの所定期間ごとの音圧レベル値の変動データを参照データ記憶部608に記憶されている各参照変動パターンデータと比較し、当該解析対象データに該当する参照変動パターンデータがあればこの参照変動パターンデータに対応するイベント内容データを抽出する。
【0084】
〈第2実施形態による監視システムの動作〉
次に、本実施形態による監視システム2の動作について説明する。
【0085】
本実施形態の監視システム2においても、第1実施形態で説明した場合と同様に、監視カメラ10−1〜10−3で撮影された映像の映像データおよびマイク20−1〜20−3で取得された監視エリアおよびその近辺の音声の音声データが圧縮され、ネットワーク40を介して対応する監視情報生成装置60−1〜60−3に送信される。
【0086】
監視情報生成装置60−1〜60−3において、圧縮された映像データおよび音声データを受信し、接続されたディスプレイ70−1〜70−3に表示させるための表示データを生成するときの処理は、図3のフローチャートのステップS4における参照データ記憶部608に記憶されたデータを用いた比較処理を除いては第1実施形態と同様であるため、詳細な説明は省略する。
【0087】
本実施形態においては、ステップS3において算出された音圧レベル値が解析対象データとして音声解析部609で取得され、この解析対象データの所定期間ごとの音圧レベル値の変動データが参照データ記憶部608に記憶されている各参照変動パターンデータと比較され、当該解析対象データの変動データに該当する参照変動パターンデータがあるか否かが判定される(S4)。
【0088】
参照変動パターンデータと解析対象データとは、参照変動パターンデータの時間幅が予め設定された数で分割されたときの単位時間(m)ごとに、図4のフローチャートで示した処理と同様の手順で平均音圧レベル値が比較されることにより、解析対象データに該当する参照変動パターンデータの有無が判定される。
【0089】
ここでも、参照変動パターンデータの分割された単位時間ごとの平均音圧レベル値は可変範囲を有しており、解析対象データの各単位時間あたりの平均音圧レベル値が、参照変動パターンデータのそれぞれの対応する単位時間あたりの平均音圧レベル値の可変範囲内に含まれていれば、同一のイベントによる音声データであると認められる。
【0090】
以下、ステップS5〜S9の処理は、第1実施形態で説明した処理と同様であるため、詳細な説明は省略する。
【0091】
以上の第2実施形態の監視システム2によれば、監視エリアおよびその近辺から取得された音声の変動データに基づいてイベントの有無を検知し、さらにイベントが検知された際にこのイベントの内容を容易に確認することができるため、監視者が常駐することを必要とせずに所定期間の適切な監視を行うことができる。
【0092】
この第2実施形態においては、音声解析部609において解析対象データと参照変動パターンデータとが比較される際、分割された全ての単位時間において解析対象データの音圧レベル値が参照変動パターンデータの音圧レベル値の可変範囲内に含まれると判定されたときに当該参照変動パターンデータが解析対象データに該当するデータであると判定される場合について説明したが、参照変動パターンデータの時間幅の分割数が多い場合(数十〜数百等)には、分割された単位時間のうちある程度の割合(例えば95%)で解析対象データの音圧レベル値が参照変動パターンデータの音圧レベル値の可変範囲内に含まれれば、当該参照変動パターンデータが解析対象データに該当するデータであると判定するようにしてもよい。
【0093】
また、上記の各実施形態の監視情報生成装置の機能構成をプログラム化してコンピュータに組み込むことにより、当該コンピュータを監視情報生成装置として機能させることも可能である。
【図面の簡単な説明】
【0094】
【図1】本発明の第1実施形態および第2実施形態である監視情報生成装置60を利用した監視システム1,2の構成を示す全体図である。
【図2】本発明の第1実施形態および第2実施形態である監視情報生成装置60の構成を示すブロック図である。
【図3】本発明の第1実施形態および第2実施形態である監視情報生成装置60の動作を示すフローチャートである。
【図4】本発明の第1実施形態および第2実施形態である監視情報生成装置60の音声解析部609の動作を示すフローチャートである。
【図5】本発明の第1実施形態である監視情報生成装置60の参照データ記憶部608に記憶されている参照周波数特徴データの例(a)、および音声解析部609で変換された解析周波数特徴データの例(b)である。
【図6】本発明の第1実施形態および第2実施形態である監視情報生成装置60に接続されたディスプレイ70−1〜70−3に表示された表示データの例(a)〜(c)である。
【符号の説明】
【0095】
1…監視システム
2…監視システム
10…監視カメラ
20…マイク
30…ネットワークハブ
40…ネットワーク
50…ネットワークハブ
60…監視情報生成装置
70…ディスプレイ
71…映像データ
72…音声情報表示データ
73…マーク
74…テキストデータ
80…スピーカ
601…データ受信部
602…映像復号部
603…映像メモリ部
604…音声復号部
605…音声メモリ部
606…音声出力部
607…音圧レベル値算出部
608…参照データ記憶部
609…音声解析部
610…音声情報生成部
611…音声情報記憶部
612…データ重畳部
613…映像出力部

【特許請求の範囲】
【請求項1】
監視エリアを撮影する監視カメラと、前記監視エリアおよびその近傍の音を集音するマイクと、表示装置と、監視情報生成装置とを備えた監視システムにおける監視情報生成装置であって、
前記監視カメラで撮影された前記監視エリアの映像の映像データと、前記マイクで集音された前記監視エリアおよびその近傍の音の音声データとを受信するデータ受信部と、
音声発生イベントに応じた典型的な音声データを所定の周波数帯域ごとの音圧レベル値で示した参照周波数特徴データと、前記音声発生イベントの内容を示すテキストデータであるイベント内容データとにより構成された参照音声データを、予め複数個記憶する参照データ記憶部と、
前記受信された音声データを取得し、この音声データの一定期間ごとの音圧レベル値を算出する音圧レベル値算出部と、
前記受信された音声データを取得し、この音声データを前記周波数帯域ごとの音圧レベル値で示した解析周波数特徴データに変換して参照データ記憶部に記憶されている各前記参照周波数特徴データと帯域ごとに比較し、前記解析周波数特徴データに該当する前記参照周波数特徴データがある場合にこの参照周波数特徴データに対応するイベント内容データを抽出する音声解析部と、
前記算出された現在から所定期間前までの音圧レベル値を取得して時間軸上にグラフ表示するための音声情報表示データを生成し、前記音声解析部でいずれかのイベント内容データが抽出されている場合には、抽出された時刻に該当する前記時間軸上の位置にイベント発生を示すマークを付すとともに、前記抽出されたイベント内容データを前記マークに関連付ける音声情報生成部と、
前記受信された映像データに、前記生成された音声情報表示データを重畳して表示用のディスプレイ表示データを生成するデータ重畳部と、
前記生成されたディスプレイ表示データを、前記表示装置に出力する映像出力部と、
を備えた監視情報生成装置。
【請求項2】
監視エリアを撮影する監視カメラと、前記監視エリアおよびその近傍の音を集音するマイクと、表示装置と、監視情報生成装置とを備えた監視システムにおける監視情報生成装置であって、
前記監視カメラで撮影された前記監視エリアの映像の映像データと、前記マイクで集音された前記監視エリアおよびその近傍の音の音声データとを受信するデータ受信部と、
音声発生イベントに応じた典型的な音声データの、所定期間の音圧レベル値の変動パターンを示す参照変動パターンデータと、前記音声発生イベントの内容を示すテキストデータであるイベント内容データとにより構成された参照音声データを、予め複数個記憶する参照データ記憶部と、
前記受信された音声データを取得し、この音声データの一定期間ごとの音圧レベル値を算出する音圧レベル値算出部と、
前記算出された音圧レベル値を解析対象データとして取得し、この解析対象データと前記参照データ記憶部に記憶されている前記各参照変動パターンデータとを所定時間幅ごとに比較し、前記解析対象データに該当する前記参照変動パターンデータがある場合にこの参照変動パターンデータに対応するイベント内容データを抽出する音声解析部と、
前記算出された現在から所定期間前までの音圧レベル値を取得して時間軸上にグラフ表示するための音声情報表示データを生成し、前記音声解析部でいずれかのイベント内容データが抽出されている場合には、抽出された時刻に該当する前記時間軸上の位置にイベント発生を示すマークを付すとともに、前記音声解析部で抽出されたイベント内容データを前記マークに関連付ける音声情報生成部と、
前記受信された映像データに、前記生成された音声情報表示データを重畳して表示用のディスプレイ表示データを生成するデータ重畳部と、
前記生成されたディスプレイ表示データを、前記表示装置に出力する映像出力部と、
を備えた監視情報生成装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2009−111506(P2009−111506A)
【公開日】平成21年5月21日(2009.5.21)
【国際特許分類】
【出願番号】特願2007−279328(P2007−279328)
【出願日】平成19年10月26日(2007.10.26)
【出願人】(000004329)日本ビクター株式会社 (3,896)
【Fターム(参考)】