説明

音源位置特定方法

【課題】 ネットワーク配線に加えて、マイクロホン接続のための追加配線を不要する、音源位置特定方法を提供する。また複数個あるマイクロホンで2種類以上のクロックを用いても音源位置特定を可能にした、音源位置特定方法を提供する。
【解決手段】 監視カメラ1、11は、マイクロホン2、3、12、13を有し、マイクロホン2、3、12、13により受音したオーディオ信号を元に音源方向情報を求め、サーバー20は、監視カメラ1、11で求められた音源方向情報に基づき、音源位置情報を特定する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、複数のマイクロホンを用いた音源位置特定方法に関し、たとえばマイクロホンを具備したのカメラシステムで、音源位置を特定するシステムでは好適なものである。
【背景技術】
【0002】
従来音源を求める方法として、3つ以上のマイクロホンを用い、音源からの音波の到達時間に基づき音源位置を求める、さまざまな方法が開示されている。
【0003】
そのひとつとして、三角形の合同条件のひとつである2角挟辺相当法を用いて、音源位置の推定方法がある。2角挟辺相当法とは、二つの角と二つの角にはさまれる一辺の距離がわかれば、2次元上の三角形は一意に決まる方法であり、音源である、三角形の頂点を求めることができる。
【0004】
図9(A)は2角挟辺相当法により、音源位置を推定する方法を示すイメージ図である。
【0005】
図9(A)において、101は音源。102,103,104はマイクロホン。108はマイクロホン102と103の中点。109はマイクロホン103と104の中点。105は中点108と中点109間の距離。106はマイクロホン102と103に到達する、音波の到達時間に基づき、求めることができる音源101方向の角度。107はマイクロホン103と104に到達する、音波の到達時間に基づき、求めることができる音源101方向の角度。
【0006】
2角挟辺相当法によれば、二つの角106,107と二つの角にはさまれる距離105により図9に示すように三角形110が一意で決まり、音源位置101を決定できる。
【0007】
図9(A)示の角度106,107を求める方法について、図9(B)とともに説明する。
【0008】
よく知られているように、音速Cは秒速340mである。したがって音源の音発生時間をt1、マイクロホンの音波の受信時間をt2とすると、音源から、マイクロホンまでの距離をLは下記式で表される。
L=(t2−t1)/C・・・・式1
【0009】
図9(B)において、121,122はマイクロホンである。マイクロホン121に音源128からの音波が入ってくる時間をt3とすると、音源128とマイクロホン121間の距離126は、下記式で表される。
距離126=(t3−t1)/C・・・式2
【0010】
同様にマイクロホン122に音源128からの音波が入ってくる時間をt4とすると、音源128とマイクロホン122間の距離127は、下記式で表される。
距離127=(t4−t1)/C・・・式3
上記式2および式3から、距離126と距離127の差である距離123は、下記式で表される。
距離123=距離127−距離126=(t4−t3)/C・・・式4
距離123を求めることにより、マイクロホン121,122の間隔124がわかっていれば、三角関数の公式により、下記式で音源の方向を示す角度125を求めることができる。
距離123=間隔124 x cos(角度125)
したがって
角度125=arccos(距離123/間隔124)・・・式5
図9(B)とともに説明したように、音波のマイクロホン到達時間t3、t4の差(t4−t3)がわかれば、式4および式5により音源方向の角度125を求めることができる。
【0011】
また、図9(A)とともに説明したように、3つのマイクロホンを用いて、音源方向の二つの角度を求めることができ、音源を一意に特定できる。
【0012】
複数マイクロホンへの到達時間の差である、式4での(t4−t3)を求める方法として、遅延和法と相互相関法などがある。
【0013】
遅延和法は複数マイクロホンの内のひとつを基準マイクロホンとし、基準マイクロホンに入ってくる受音信号と、他のマイクロホンに入ってくる受音信号を徐々に遅らせて、加算する。加算した受音信号のパワーが最大になったときの遅らせた時間を複数マイクロホンへの到達時間の差(t4−t3)とする方法である。
【0014】
相互相関法は、複数マイクロホンへの到達時間の差(t4−t3)を、相互相関関数が最大値になったときの時間差とみなす方法である。
【0015】
たとえば、特許文献1においては、まず、基準マイクロホンとほかのマイクロホンとの間の相互相関関数の最大値を与える予備推定時間差を求める。そして遅延和法によりすべてのマイクロホンの遅延和を最大にする時間差を、相互相関関数で求めた予備推定時間差の近傍で探索して、音源位置を推定する方法を開示している。
【0016】
相互相関関数で推定時間差を求める方法は、ノイズに弱い欠点があるものの、処理時間が早い。遅延和法は、徐々に受音信号を遅らせる処理を繰り返し行う必要が有り、処理時間がかかるものの、ノイズに強い長所がある。このため、特許文献1では相互相関係数および遅延和法の、お互いの長所を引き出す技術を開示している。
【0017】
また、特許文献2において、複数マイクロホンの受音信号の音圧レベルをもとに、音源位置を特定する方法を開示している。
【先行技術文献】
【特許文献】
【0018】
【特許文献1】特開平11−304906号公報
【特許文献2】特開2006−254277号公報
【発明の概要】
【発明が解決しようとする課題】
【0019】
しかしながら、上述の特許文献に開示された従来技術では、3個以上のマイクロホンを使用し、遅延回路などにより、個々のマイクロホンが受音した受音信号の遅延量を求め、求めた遅延量を用いて音源位置を特定している。
【0020】
第1の課題として、個々の受音信号の遅延量を求めるためには、受音信号が同期している必要がある。たとえば受音信号をネットワーク経由で送信すると、送信するため処理により遅れが生じて、同期していない受音信号同士の遅延量を計算することになり、計算結果に誤差が発生してしまう。
【0021】
また、受音信号をデジタル化する場合、同一クロックを用いて、AD変換器でデジタル化する必要がある。異なるクロックでAD変換すると、デジタル化した受音信号にずれが生じ、遅延量を計算する際に誤差が生じてしまう。
【0022】
第2の課題として、3個以上のマイクロホン間は一定以上の距離を離して配置する必要がある。たとえば最大10m先の音源を特定する場合、マイクロホン間は最低2m程度あける必要がある。背景技術で述べたように音源を求める際、2角挟辺相等法でもとめることができる。しかし、二つの角にはさまれる1辺の距離が短いと、音源位置変化に応じて、二つの角度の変化が小さくなってしまい、音源特定が難しくなるためである。
【0023】
このため、従来技術では、3個以上のマイクロホンの出力を、長い電線を使って単一の制御手段へ接続し、音源特定している。しかしながら複数のネットワークカメラをネットワークケーブルで接続しているようなネットワークシステムだと、すでに、ネットワークケーブルの配線が存在し、加えて、マイクロホン接続のための配線を追加しなければならず煩雑な配線になってしまう。
【0024】
本発明の目的は、複数個あるマイクロホンで2種類以上のクロックを用いても音源位置特定を可能とした音源位置特定方法を提供することである。
【0025】
また、ネットワーク配線に加えて、マイクロホン接続のための追加配線を不要とした音源位置特定方法を提供することである。
【課題を解決するための手段】
【0026】
上記目的を達成するために、本発明は、複数マイクロホンにより受音したオーディオ信号を元に、音源方向を計算する音源方向処理部と、前記音源方向処理部は、複数装置に具備され複数音源方向情報として計算し、前記複数装置からの複数音源方向情報に基づき、音源位置情報を計算することを特徴とする。
【発明の効果】
【0027】
本発明によれば、ネットワーク配線網とは別に、複数マイクロホンから、音源位置を特定する装置への配線を不要にする、監視カメラシステム提供することができる。
【0028】
また、本発明によれば、複数装置それぞれに音源方向処理部を持ち、複数装置それぞれが発生するクロック信号の制御により、複数音源方向情報を処理できるので、装置の設置場所の自由度を向上したシステムを提供することができる。
【図面の簡単な説明】
【0029】
【図1】実施例1における監視カメラシステムのブロック図
【図2】実施例1における監視カメラシステムのイメージ図
【図3】実施例1における監視カメラの処理流れ図
【図4】実施例1におけるサーバーの処理流れ図
【図5】実施例1におけるオーディオ信号処理部のブロック図
【図6】実施例1における音源位置計算のためのイメージ図
【図7】実施例2におけるカメラシステムのイメージ図
【図8】実施例2におけるカメラシステムのブロック図
【図9】従来技術での音源位置特定方法を説明するためのイメージ図
【発明を実施するための形態】
【0030】
以下に、本発明の好ましい実施の形態を、添付の図面に基づいて詳細に説明する。
【実施例1】
【0031】
以下、図1〜図6を参照して、本発明の第1の実施例による、監視カメラシステムについて説明する。本実施例では、犯罪者によりガラスが割られたり、シャッターを棒のようなものでたたいたりなどの犯罪行為が行われた際に、警備室に設置されたサーバーにより、警備員が認知し正確に監視できるようにした監視システムである。
【0032】
図2は商店街における監視カメラシステムを示すイメージ図である。
【0033】
1は1台目の監視カメラ、2および3は監視カメラ1に内蔵されているマイクロホンを示す。4はインターネットなどのネットワーク、5はネットワーク4に1台目の監視カメラ1を接続するケーブルを示す。また、6は商店街、7は商店街6の一店舗C店、8は異常音の音源、9は監視カメラ1から音源8への方向を示す。
【0034】
11は2台目の監視カメラ、12および13は監視カメラ11に内蔵されているマイクロホン、14は監視カメラ11から音源8への方向を示す。15はネットワーク4に2台目の監視カメラ11を接続するケーブルを示す。20はサーバー20はネットワーク4にサーバー20を接続するケーブルを示す。監視カメラ1、11は、それぞれ、複数のマイクロホンを有する装置である。
【0035】
なお、音源位置を特定する際、従来技術ではマイクロホン間を最低2m程度あける必要があった。詳細は図1とともに説明するが、本実施例では、監視カメラ1と監視カメラ11の間隔を10m離して設置することにより、音源位置の特定を正確に行えるようにしている。また、マイクロホンは監視カメラ1および監視カメラ11に内蔵されており、課題のひとつであった、マイクロホン接続のための配線を本実施例では不要にしている。
【0036】
図2において、異常音が音源8から発生すると、監視カメラ1および監視カメラ11で、音圧が一定以上であることを検出し、検出した結果、音圧が一定以上である場合、異常音処理を行う。異常音処理として、本実施例では映像および音声信号をサーバー20に伝達する。
【0037】
マイクロホン2,3,12,13により検出した受音信号を元に、音源8の方向である、方向9および方向14を監視カメラ1および監視カメラ11で求める。求めた方向データをネットワーク4経由で、サーバー20に伝達する。サーバーでは方向データに基づき、音源位置8を特定する。サーバー20は、音源位置を特定する音源位置特定装置である。特定した音源位置8に基づき、異常音に近いカメラを指定して、撮像方向が音源を向き、また、音源までの距離に応じたズーム倍率になるように、PTZ処理(パン処理、チルト処理、ズーム処理)を行う。
【0038】
上記のように行うことにより、音源8に近い監視カメラ11で異常発生位置をズームし、高解像度映像を得ることができる。
【0039】
図1とともに詳細説明するが、マイクロホン2,3からの受音信号は監視カメラ1で、受音信号同士を、同期させて遅延量を計算し、方向9を求めている。またマイクロホン12,13からの受音信号は監視カメラ11で、受音信号同士を、同期させて遅延量を計算し、方向14を求めている。
【0040】
マイクロホン2,3からの受音信号は監視カメラ1で、同一クロックでAD変換している。マイクロホン12,13からの受音信号は監視カメラ11で、同一クロックでAD変換している。課題であった遅延量の計算時、計算結果に誤差が出ることを本実施例では防止している。
【0041】
なお、パン処理は、カメラ内部に具備されているモータおよびメカ機構により、撮像部を水平方向に回転処理である。チルト処理は、カメラ内部に具備されているモータおよびメカ機構により、撮像部を垂直方向に上下移動処理である。ズーム処理は、カメラの撮像部に具備されているモータおよびズーム機構により、撮影映像を拡大、縮小する処理である。上記のパン処理、チルト処理、ズーム処理をあわせて、以下の説明ではPTZ処理と略して説明する。パン処理、チルト処理により、撮像方向を、所望の方向に向けることができる。
【0042】
図1は監視カメラ1およびサーバーのブロック図を示す。図2と同一ブロックについては同一番号を付している。
【0043】
図1において、1は図2で示した1台目の監視カメラである。11は図2で示した2台目の監視カメラである。内部ブロックについて記載していないが、監視カメラ1と基本的に同じブロック構成である。2,3は図2で示した監視カメラ1に内蔵しているマイクロホンである。2,3のマイクロホンは後述のPTZ駆動部36により、監視カメラ1の撮影方向が変化しても位置が変化しないところに具備されている。撮影方向により、後述の音源方向処理部32の出力である、音源方向情報が変化しないようにするためである。
【0044】
本実施例では、マイクロホン2,3は10cmの間隔でカメラ内部に設置されている。後述の音源方向処理部32で音源方向を計算する際に、マイクロホン2,3の間隔を用いる。
【0045】
31はオーディオ信号処理部であり、2個のマイクロホンから入ってきた受音信号を、増幅、AD変換し、デジタルオーディオ信号を出力する。また、受音信号の音圧が閾値以上であるかの検出し、異常音検出信号を出力する。また、2個のマイクロホン間の遅延時間を決定し、遅延時間情報を出力する。なお、オーディオ信号処理部31については、詳細を図5とともに後述する。
【0046】
32は音源方向生成部である。オーディオ信号処理部31から送られてきた、遅延時間情報を受け取り、音源方向を計算した後、音源方向情報を出力する。
【0047】
背景技術の項で図9(B)とともに説明したように、二つのマイクロホン間の遅延時間(t4−t3)がわかれば、式4により、距離123が計算できる。また、マイクロホン間隔124と距離123がわかれば、式5により音源方向である、図9(B)示の角度125が計算できる。式4および、式5の計算を、音源方向処理部32で行う。
【0048】
具体例を下記する。
【0049】
例として遅延時間情報が250usの場合を下記する。250usは秒に直すと0.00025秒である音速が1秒間に340mとすると、図9(B)に示す距離123は、0.00025x340=0.085m すなわち8.5cmとなる。
【0050】
マイクロホンの間隔は本実施例では、10cmであり、図9(B)に示す距離124は10cmである。式5より図9(B)示の角度125は下記計算となる。
角度125=arccos(8.5cm/10cm)=31.3°
音源方向処理部32は音源方向情報として上記角度31.3°を出力する。
33は撮像部であり、CCDやCMOSセンサーなどの光電変換素子により、映像を撮影し、アナログ映像信号を出力する。34は映像信号処理部であり、撮像部33から受け取ったアナログ映像信号をデジタル化するとともに、ホワイトバランスなどの映像最適化を行い、デジタル映像信号を出力する。
【0051】
35は第一ネットワーク処理部である。オーディオ信号処理部31からの異常音検出信号をトリガーとして、オーディオ信号処理部31からのデジタルオーディオ信号および、映像信号処理部34からのデジタル映像信号をネットワーク4に送出する。また、音源方向処理部32から音源方向情報を受け取り、ネットワーク4に送出する。
【0052】
上述した例では31.3°の音源方向情報を受け取り、ネットワーク4に送出する。加えて、ネットワーク4からパン処理指令、チルト処理指令、ズーム処理指令を、ネットワーク4を介して受け取り、PTZ処理指令として出力する。
【0053】
36はPTZ駆動部であり、第一ネットワーク処理部35から受け取ったPTZ処理指令に基づき、モータおよびメカ機構を用いてPTZ処理を行う。
【0054】
次にサーバー20の内部ブロックに付き説明する。
【0055】
41は第2ネットワーク処理部である。ネットワーク4を介して、第一ネットワーク処理部35から、デジタルオーディオ信号、デジタル映像信号を受信する。受信したデジタルオーディオ信号およびデジタル映像信号は、後述の制御部43に出力される。また、音源方向処理部32で求めた音源方向情報を、第一ネットワーク処理部35経由で受信する。
【0056】
音源方向処理部32のところで、説明した例では角度31.3°を、監視カメラ1から受信する。音源方向情報は、監視カメラ11からも受信する。以下の説明では角度20°を監視カメラ11から受信した例で説明する。
【0057】
42は音源位置計算部である。音源位置計算部42の処理内容を図6とともに説明する。
【0058】
1は一台目の監視カメラ、11は2台目の監視カメラ、8は音源である。80は監視カメラ1と監視カメラ11間の直線(装置間の距離)であり、設置時あらかじめ、測定しておき、サーバー20の音源位置計算部42に記憶しておく。
【0059】
以下の説明で、直線80の距離は10mとした例で説明する。
81は監視カメラ1と音源間の直線
82は監視カメラ11と音源間の直線
78は直線80から直角に音源に向かって引いた直線である。
79は直線80と直線78が交わる交点である。
76は監視カメラ1と交点79間の距離
77は監視カメラ11と交点79間の距離を示す
71は監視カメラ1から入手した音源方向情報である。
上述した例では角度31.3°である。
72は監視カメラ11から入手した音源方向情報である。角度20°として、以下に述べる例では説明する。
【0060】
さて、まず直線78の距離を計算する。補助線83と直線78の距離は同じである。また、補助線84と76の距離は同じである。したがって、下記式10および式11が成り立つ。
tan(角度71)=距離76/距離78・・・・式10
tan(角度72)=距離77/距離78・・・・式11
式10と式11の両辺を加算すると、
tan(角度71)+tan(角度72)=(距離76+距離77)/距離78・・・・式12
距離76+距離77は直線80の距離なので式12は式13となる。
tan(角度71)+tan(角度72)=距離80/距離78・・・式13
式13から距離78を求める式にすると
距離78=距離80/(tan(角度71)+tan(角度72))・・・式14
例として距離80=10m 角度71=31.3° 角度72=20°として計算すると
距離78=10/(0.608+0.364)=10/0.972=10.29m・・・・式15
となる。
【0061】
次に直線81の距離を求める。
距離78=距離81xcos(角度71)・・・・式16
したがって、距離81=距離78/cos(角度71)・・・・式17
例題の数値を当てはめると、角度71=31.3°
距離78=式15から10.29m
式17から、距離81=10.29/0.85=12.1mとなる。
同様に直線82の距離を求める。
距離78=距離82xcos(角度72)・・・・式18
したがって、距離82=距離78/cos(角度72)・・・・式19
例題の数値を当てはめると、角度72=20°
距離78=式15から10.29m
式19から、距離82=10.29/0.94=10.95mとなる。
【0062】
以上のように、式17および式19から直線81および直線82の距離を求めることができ、音源8の位置を音源位置計算部42で計算できる。計算した直線81および直線82の距離は後述の制御部43に出力する。
【0063】
式14に記載した距離78は下記式20のように表わすことができる。
Y=X/(tanθ1+tanθ2)・・・・・式20
ただし、Y=距離78、X=距離80 θ1=角度71 θ2=角度72
なお、tanθ1およびtanθ2は角度が90度のとき、すなわち音源が監視カメラ1と監視カメラ11のちょうど直線80上にあるとき、tan計算の結果が∞になってしまう。音源位置計算部42では、tan計算の結果が∞場合は、例外処理として距離81=距離82=距離80/2として制御部43に出力する。
【0064】
図1の説明に戻って、制御部43では音源位置計算部42から入手した距離情報を元に、監視カメラ1または監視カメラ11に、PTZ指令を生成する。本実施例では、音源に近いほうの監視カメラに対して、撮像方向が音源に向き、ズーム倍率が音源までの距離に応じたズーム倍率になるようにPTZ指令を送信するようにしている。上記、音源位置計算部42で説明した例では、監視カメラ11の方が音源に近いので、監視カメラ11に対し、PTZ指令を出力する。
【0065】
また、制御部43では第2ネットワーク処理部41から受け取ったデジタルオーディオ信号およびデジタル映像信号を元に、アナログ変換し、スピーカー45にオーディオ出力および表示部44に映像表示する。また、制御部43では、図示していないがキーボードなどの操作により終了操作を行い、第2ネットワーク処理部41を経由して終了指令を送信する。
【0066】
図5はオーディオ信号処理部31の内部ブロックを示す。図において、2,3は第1の監視カメラ1に装着されているマイクロホンである。51,52は電圧増幅アンプである。53,54は電圧増幅されたオーディオ信号をアナログからデジタルに変換するAD変換器である。55はAD変換するクロックを生成するCPG(クロックパルスジェネレータ)である。AD変換器53、54は、単一のCPG55からのクロック信号で、それぞれ、オーディオ信号をAD変換する。本実施例ではAD変換用クロックは1MHz(周期1us)で生成している。
【0067】
音速を340m/秒とすると、1usで音波が進む距離は0.34mmとなる。これは図9(B)示したイメージ図で、距離123の分解能が0.34mmであり、マイクロホン121,122間の距離124である10cmと比較して、実用上十分な分解能である。計算によると、音源8の位置が監視カメラ1から10m離れた位置で、10cmまで音源が変化したことを、上記分解能は検出可能である。そのときの角度の変化は0.28°である。ズーム機能を有した本実施例の監視カメラ1および監視カメラ11の、水平画角は1.5°〜55.8°である。水平画角に比べ、上記分解能は5倍以上の精度であり、最大に拡大しても、音源位置を含んだ映像を取得可能である。
【0068】
CPG55で生成するクロックは、後述の遅延回路58にもシフトクロックとして供給される。本実施例において重要なことは、監視カメラ1と監視カメラ11それぞれ異なるクロックパルスジェネレータを具備している。このように、本実施例では、2種類のクロックを用いて音源位置を特定することができる。
【0069】
56は音圧レベル検出部である。AD変換器53でAD変換された、マイクロホン2からのオーディオ信号のレベルを検出し、一定レベル以上の場合、異常音が発生したことを、図1図示の第1ネットワーク処理部35に伝達する。58は遅延回路である。57は加算器である。また59は遅延時間決定部である。
【0070】
背景技術で述べたように、複数マイクロホンへの到達時間の差を求める方法として、遅延和法と相互相関法などがある。本実施例では遅延和法を用い、到達時間の差を求めている。遅延時間決定部59の指令により、遅延回路58の遅延時間を徐々に延ばして、加算器57で繰り返し加算する。加算した結果が最大値になる時間を遅延時間決定部59でもとめ、到達時間の差として、図1図示の音源方向処理部32に出力する。
【0071】
なお、本実施例では、遅延回路58の遅延時間を徐々に延ばして、加算器57で繰り返し加算しているが、たとえば10usごとに遅延時間を延ばして、荒く最大値を検出した後、細かく最大値を検出するようにしても良い。また、AD変換器53および、54のあとにメモリを具備し、一定期間のオーディオ信号を記憶しておき、記憶したオーディオ信号に対して、遅延時間を求める処理をしても良い。
【0072】
図3は監視カメラ1の処理流れを示すフローチャートである。図1、図5で示したブロック図と対比しながら、処理流れを説明する。
【0073】
流れ201は図5に図示したAD変換器53,54の処理を示す。流れ202はAD変換した音圧が一定レベルK1以上かどうか、図5図示の音圧レベル検出部56で検出する処理を示す。音圧がK1のレベル以上の場合流れ203に進み、K1以下のレベルの場合は、流れ201に戻りAD変換を繰り返す。流れ202は異常音が発生したかどうかの判別である。流れ203は、図5図示の遅延時間決定部59の制御により遅延時間を求める処理を示す。流れ204は図1図示の音源方向処理部32で音源方向情報を計算する処理を示す。流れ205は図1図示の第1ネットワーク処理部35で音源方向情報を送信する処理を示す。
【0074】
流れ206は第1ネットワーク処理部35経由で、PTZ指令が来たかどうかの判別である。PTZ指令が来た場合は、流れ207に進み、図1図示のPTZ駆動部36で監視カメラ1のPTZ処理を行う。PTZ指令がこなかった場合は、流れ208へ進む流れ208は、オーディオ信号処理部31でAD変換したオーディオ信号、映像信号処理部34でAD変換した映像信号を、第1ネットワーク処理部35経由でネットワークに送出する処理を示す。映像信号は一般的には、一秒間に30フレーム程度の速度で、ネットワークから送信する。
【0075】
流れ209はサーバー20から終了指令が送られてきたかどうかの判別であり、終了指令が送られてきていないときは、流れ206から209を繰り返す。流れ210は映像・音声信号送信終了処理を示す。第1ネットワーク処理部35を経由してネットワークに配信していた映像・音声の配信を中止する処理である。
以上図3とともに、監視カメラ1の処理流れを説明した。
なお、図2図示の監視カメラ11の処理流れも基本的には同じである。
【0076】
図4はサーバー20の処理流れを示すフローチャートである。図1で示したブロック図と対比しながら、処理流れを説明する。
【0077】
流れ251は第2ネットワーク処理部41で音源方向情報を受信する処理を示す。音源方向情報を受信すると、流れ252に進む。流れ252は図1図示の音源位置計算部42で音源位置を計算する処理を示す。具体的には図6の直線81の距離と直線82の距離を計算する。
【0078】
なお、監視カメラ1、11で遅延時間から音源方向情報を計算してから、サーバー20で音源方向情報を計算した。また、監視カメラ1、11から音源方向情報として遅延時間をサーバー20に送って、監視カメラ1、11で、遅延時間から音源方向情報を計算し、さらに、音源位置情報(監視カメラ1、11から音源までの距離)を計算してもよい。監視カメラ1、11のマイクロホン間の距離は、サーバー20に既知としてもよいし、監視カメラ1、11から遅延時間と共にサーバー20に送ってもよい。
【0079】
流れ253は、図1図示の制御部43の処理により、音源位置の計算結果から、複数カメラのうちの一台にPTZ指令を送信する処理を示す。ここでは、撮像方向が音源を向き、ズーム倍率が音源までの距離に応じたズーム倍率になるように指令する。流れ254は映像・音声信号を受信したかどうかの判別である。受信していない場合は、流れ254の判別を繰り返す。受信した場合は、流れ255に進む。流れ255は、制御部43の処理により、受信した映像信号を表示部44に表示する処理である。流れ256は、制御部43の処理により、受信したオーディオ信号をスピーカー45からオーディオ出力する処理を示す。
【0080】
流れ257は、制御部43の処理により、終了操作が行われたかどうかの判別である。終了操作が行われなかった場合、流れ254から257を繰り返し、第2ネットワーク処理部41で受信した映像信号、オーディオ信号を、繰り返し表示部44に表示およびスピーカー45への出力処理を行う。終了操作が行われた場合は、流れ258に進み終了指示を第2ネットワーク処理部41経由で送信する。
以上本発明の第1の実施例を説明した。
【0081】
本実施例では、図1図示の監視カメラ1および監視カメラ11の、音源方向処理部32で音源方向情報をそれぞれ計算し、サーバー20の音源位置計算部で音源位置する計算を行うことで、目的を実現している。
【0082】
すなわち、マイクロホン間の遅延量の計算が必要な、音源方向情報を計算するときは、同一クロックを使用している。図2図示のマイクロホン2,3で音源方向9を計算する際は、監視カメラ1のクロックを用い、マイクロホン12,13で音源方向14を計算する際は、監視カメラ11のクロックを用いている。このため、上述した、異なるクロックによる誤差の影響を排除している。
【0083】
また、従来例では、図9図示の距離105を用いて、音源位置の計算を行っていた。
従来技術の課題のひとつであった、最大10m先の音源を特定する場合、マイクロホン間は最低2m程度あける必要があった。しかし、本実施例では、マイクロホン間の距離の変わりに、図6図示した、監視カメラ1と監視カメラ11の距離80用いて音源位置の計算を行うようにし、距離80を10m離すとともに、マイクロホン接続のための追加配線を不要とした。
【0084】
なお、本実施例では、2台の監視カメラでの実施例で説明したが、むろん3台以上の監視カメラシステムでもよい。
【0085】
本実施例では、方向情報のみをサーバーに送信していたが、3台以上のカメラシステムで、音圧レベルもサーバーに送るようにして、音圧レベルが高い2台のカメラを選択した後、選択した2台のカメラだけで図3に示した処理を行うようにしてもよい。
【0086】
また、音源の方向を生成する際、本実施例では、遅延和法を用いて処理したが、相互相関法を用いて処理してもよい。
【0087】
本実施例では異常音の検出を音圧レベルで検出していたが、受音信号の周波数により異常音検出しても良い。異常音を検出した際に、本実施例では、映像および音声信号を、ネットワーク経由でサーバーに送るようにしているが、常時映像および音声信号を送るようにしてもよく、また異常音が発生したときに異常通知を送るようにしてもよい。また、映像および音声信号をサーバーで録画録音するようにしても良い。サーバーが異常通知を受け取った際に音源を特定し、特定された店舗に異常事態を、たとえば携帯電話に自動的にメール連絡するようにしてもよい。
【実施例2】
【0088】
以下、図7,8を参照して、本発明の第2の実施例による、カメラシステムについて説明する。
【0089】
図7は電池駆動のカメラ301と、電池駆動の外部ユニット311で構成されたカメラシステムである。音源321の位置を特定し、カメラ301に具備されているPTZ駆動部を用いて、PTZ駆動し、音源付近の被写体を撮影する。たとえば、鳥の鳴き声から音源位置を特定して撮影するのに好適なカメラシステムである。
【0090】
図において302,303はカメラ301に具備されているマイクロホンである。304は着脱可能な記憶素子であるSDカードなどのメモリカードである。305は外部ユニット311からの情報を赤外線で受信する赤外線受信部である。312,313は外部ユニット311に具備されているマイクロホンである。314は外部ユニットで生成した情報を赤外線で送信する赤外線送信部である。
【0091】
カメラ301、外部ユニット311は、それぞれ、複数のマイクロホンを有する装置である。また、カメラ301は、音源位置情報を特定する音源位置特定装置である。
【0092】
音源321で音が鳴ったとき、たとえば小鳥の鳴き声が鳴ったとき、カメラ301で音源の方向322を計算する。また外部ユニットでも、音源の方向323を計算し、計算した音源方向情報を、赤外線送信部314を用いて送信する。音源の方向323を赤外線受信部で受信したカメラ301は、音源の方向322と323を用いて、音源位置を計算し、PTZ駆動部を用いてカメラの水平方向の角度、垂直方向の角度、ズーム倍率を変更し、音源近くの被写体を撮影可能にしている。
【0093】
図8は外部ユニット311およびカメラ301の内部ブロックを示したブロック図である。図において外部ユニット311のオーディオ信号処理部315は、マイクロホン312,313からのアナログ信号を増幅し、AD変換する。また、第1の実施例と同様、図9(B)の123にしめす、二つのマイクロホンが受けた、受音信号の遅延時間を遅延和法により求め、出力する。
【0094】
316は音源方向処理部である。オーディオ信号処理部315から受け取った遅延時間を元に、第1の実施例と同様、背景技術で記載した式5により、音源方向情報をもとめる。音源方向処理部316で求めた音源方向情報は、赤外線送信部314に伝達され、赤外線をもちいて、外部ユニット311からカメラ301に送信される。
【0095】
カメラ301のオーディオ信号処理部320は、マイクロホン302,303からのアナログ信号を増幅し、AD変換する。また、外部ユニット311と同様、図9(B)の123にしめす、二つのマイクロホンが受けた受音信号の遅延時間を、遅延和法により求め、出力する。321は音源方向処理部である。オーディオ信号処理部320から受け取った遅延時間を元に、外部ユニット311と同様、背景技術で記載した式5により、音源方向情報をもとめる。
【0096】
326は音源位置計算部である。カメラ301の音源方向処理部321からの音源方向情報と、外部ユニット311の音源方向処理部316からの音源方向情報を用い、音源位置を特定する。第1の実施例と同様、式17および式19を使って、図7図示の距離322および距離323を求めることにより音源位置を特定している。
【0097】
なお、外部ユニット311で遅延時間から音源方向情報を計算してから、カメラ301で音源方向情報を計算した。また、外部ユニット311から音源方向情報として遅延時間をカメラ301に送って、カメラ301で、遅延時間から音源方向情報を計算し、さらに、音源位置情報(カメラ301から音源までの距離)を計算してもよい。外部ユニット311のマイクロホン間の距離は、カメラ301に既知としてもよいし、外部ユニット311から遅延時間と共にカメラ301に送ってもよい。
【0098】
322は撮像部であり、CCDやCMOSセンサーなどの光電変換素子により、映像を撮影し、アナログ映像信号を出力する。323は映像信号処理部であり、撮像部322から受け取ったアナログ映像信号をデジタル化するとともに、ホワイトバランスなどの映像最適化を行い、デジタル映像信号を出力する。
【0099】
324は制御部であり、音源位置計算部326から入手した距離情報を元に、カメラ301内部のPTZ駆動部325に、PTZ制御命令を送信する。また、制御部324は一定以上の音圧を検知すると、映像信号処理部323からのデジタル映像信号およびオーディオ信号処理部320からのデジタルオーディオ信号を入手する。入手したデジタル映像信号および、デジタルオーディオ信号は、SDカード304に送信し記憶する。
【0100】
325はPTZ駆動部であり、制御部324から受け取ったPTZ処理指令に基づき、モータおよびメカ機構を用いてPTZ処理を行う。
【0101】
以上本発明の第2の実施例に付き説明した。本実施例では、図8図示の外部ユニット311およびカメラ301で音源方向情報を計算し、カメラ301内部の音源位置計算部で音源を特定する計算を行うことで、本発明の目的を実現している。
【0102】
なお、本実施例では、外部ユニット311が一台しかない場合の実施例を説明したが、外部ユニットを2台用意し、一台は水平方向での音源位置を特定し、もう一台は垂直方向での音源位置を特定するようにしても良い。
【0103】
音源の方向を生成する際、本実施例では、遅延和法を用いて処理したが、相互相関法を用いて処理してもよい。
【0104】
本実施例では、一台のカメラに外部ユニットを赤外線接続する場合を示したが、複数台のカメラ間を赤外線接続するようにしても良い。また赤外線通信でなく、無線による通信を用いても良い。
【0105】
以上、本発明の好ましい実施形態について説明したが、本発明はこれらの実施形態に限定されず、その要旨の範囲内で種々の変形及び変更が可能である。
【符号の説明】
【0106】
1 1台目の監視カメラ
11 2台目の監視カメラ
2,3,12,13 マイクロホン
4 ネットワーク
8 音源

【特許請求の範囲】
【請求項1】
複数の装置のそれぞれは、複数のマイクロホンを有し、前記複数のマイクロホンのそれぞれにより受音したオーディオ信号を元に音源方向情報を求め、
音源位置特定装置は、前記複数の装置で求められた音源方向情報に基づき、音源位置情報を特定することを特徴とする音源位置特定方法。
【請求項2】
前記複数のマイクロホンで受音したオーディオ信号は、単一のクロックパルスジェネレータからのクロック信号で、AD変換されることを特徴とする請求項1に記載の音源位置特定方法。
【請求項3】
前記音源位置特定装置は、前記複数の装置で求められた音源方向情報と、前記複数の装置間の距離を元に、前記音源位置情報を特定することを特徴とする請求項1又は2に記載の音源位置特定方法。
【請求項4】
前記複数の装置の少なくともひとつは撮像手段を備えており、前記特定された音源位置に応じて前記撮像手段の撮像方向またはズーム倍率を変更することを特徴とする請求項1から3のいずれか1項に記載の音源位置特定方法。
【請求項5】
前記複数の装置の少なくともふたつは撮像手段を備えており、前記特定された音源位置に応じて前記音源に近い方の前記撮像手段の撮像方向またはズーム倍率を変更することを特徴とする請求項1から4のいずれか1項に記載の音源位置特定方法。
【請求項6】
前記複数の装置のひとつが前記音源位置特定装置であることを特徴とする請求項1から3のいずれか1項に記載の音源位置特定方法。
【請求項7】
複数の装置のそれぞれは、複数のマイクロホンを有し、前記複数のマイクロホンのそれぞれにより受音したオーディオ信号を元に音源方向情報を求め、
前記複数の装置のひとつは、前記複数の装置で求められた音源方向情報に基づき、音源位置を特定することを特徴とする音源位置特定方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2011−166608(P2011−166608A)
【公開日】平成23年8月25日(2011.8.25)
【国際特許分類】
【出願番号】特願2010−29280(P2010−29280)
【出願日】平成22年2月12日(2010.2.12)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】