説明

音源推定方法及び音源推定装置

【課題】観測点で採取した音の音圧信号と映像信号とから音源を推定するとともに、推定された音源と観測点との距離をリアルタイムで算出する。
【解決手段】マイクロフォンM1〜M5とカメラとを備えた音・映像採取ユニットを第1の観測点P1に配置して音圧信号と映像信号とを採取し、マイクロフォンM6〜M9を備えた音採取ユニットを第2の観測点P2に配置して音圧信号を採取し、これらの音圧信号をA/D変換した音圧波形データを用いて推定した第1の観測点P1からみた音源方向の水平角θ1及び仰角φ1と第2の観測点P2からみた音源方向の水平角θ2とから第1の観測点P1と音源との距離Lを求めるとともに、第1の観測点P1で採取した映像信号をA/D変換した画像データと水平角θ1と仰角φ1とを用いて作成した画像中に音源の方向を示す図形が描画された音源推定用画像Gkと距離Lのデータとを表示画面に表示するようにした。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、複数のマイクロフォンで採取した音の情報と撮影手段で撮影した映像の情報とを用いて音源を推定する方法とその装置に関するもので、特に推定された音源と観測点との距離を求める方法に関する。
【背景技術】
【0002】
従来、音の到来方向を推定する方法としては、観測点に多数のマイクロフォンを等間隔に配置したマイクロフォンアレーを構築し、基準となるマイクロフォンに対する各マイクロフォンの位相差から音波の到来方向である音源の方向を推定する、いわゆる音響学的手法が考案されている(例えば、非特許文献1参照)。
一方、観測点に配置された複数のマイクロフォンの出力信号の位相差からではなく、複数のマイクロフォンから互いに交わる直線状に配置された複数のマイクロフォン対を構成し、対となる2つのマイクロフォン間の位相差に相当する到達時間差と、他の対となる2つのマイクロフォン間の到達時間差との比から音源の方向を推定する方法が提案されている(例えば、特許文献1〜3参照)。
【0003】
具体的には、図7に示すように、4個のマイクロフォンM1〜M4を、互いに直交する2直線上にそれぞれ所定の間隔で配置された2組のマイクロフォン対(M1,M3)及びマイクロフォン対(M2,M4)を構成するように配置し、前記マイクロフォン対(M1,M3)を構成するマイクロフォンM1,M3に入力する音圧信号の到達時間差D13と、前記マイクロフォン対(M2,M4)を構成するマイクロフォンM2,M4に入力する音圧信号の到達時間差D24との比から、観測点と音源の位置との水平角θを推定するとともに、第5のマイクロフォンM5を前記マイクロフォンM1〜M4の作る平面上にない位置に配置して、更に4組のマイクロフォン対(M5, M1),(M5, M2),(M5, M3),(M5, M4)を構成し、前記各マイクロフォン対を構成するマイクロフォン間の到達時間差D13,D24及びD5j(j=1〜4)から、観測点と音源の位置との成す仰角φを推定する。
観測点から測った音源方向は、前記水平角θと前記仰角φとにより表わせる。
【0004】
これにより、マイクロフォンアレーを用いて音源方向を推定する場合に比較して、少ないマイクロフォン数で音源方向を正確に推定することができる。
また、このとき、CCDカメラ等の映像採取手段を設けて前記推定された音源方向の画像を撮影した後、この画像データと音源方向のデータとを合成して、映像中に前記推定した音源方向と音圧レベルとを図形で表示した音源推定用画像をディスプレイ等の表示画面に表示するようにすれば、音源を視覚的に把握することができる。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2002−181913号公報
【特許文献2】特開2006−324895号公報
【特許文献3】特開2008−224259号公報
【非特許文献】
【0006】
【非特許文献1】大賀寿郎,山崎芳男,金田豊;音響システムとディジタル処理,コロナ社,1995
【発明の概要】
【発明が解決しようとする課題】
【0007】
ところで、前記従来の方法では、ディスプレイ等の表示画面に表示された図形からマイクロフォンで採取した音の音源については推定することはできるが、推定された音源と観測点との距離を測定するには、別の観測点にて前記推定された音源の音源方向を推定し、これら2つの観測点で推定された音源方向から音源と観測点との距離を算出しなければならなかった。そのため、移動する音源や間欠的に音を発する音源などについては、音源と観測点との距離をリアルタイムで算出することが困難であった。
【0008】
本発明は、従来の問題点に鑑みてなされたもので、観測点で観測した音の情報である音圧信号と映像の情報である映像信号とから音源を推定するとともに、推定された音源と観測点との距離をリアルタイムで算出する方法とその装置を提供することを目的とする。
【課題を解決するための手段】
【0009】
本願の請求項1に記載の発明は、複数のマイクロフォンと撮影手段とを用いて音の情報である音圧信号と映像の情報である映像信号とを採取し、この採取した音圧信号のデータと画像データとを用いて音源を推定する方法であって、互いに交わる2つの直線上にそれぞれ所定の間隔で配置されて2組のマイクロフォン対を構成する第1〜第4のマイクロフォンと前記2組のマイクロフォン対の作る平面上にない第5のマイクロフォンと撮影手段とを備えた音・映像採取ユニットを第1の観測点に設置し、前記第1〜第4のマイクロフォンと同じ状態に配置された第6〜第9のマイクロフォンを備えた音採取ユニットを前記第1の観測点とは異なる第2の観測点に設置して音の情報である音圧信号と映像の情報である映像信号とを採取するステップ(a)と、前記第1の観測点にて採取した音圧信号と映像信号と前記第2の観測点にて採取した音圧信号とをA/D変換してそれぞれ第1の音圧波形データ、画像データ、及び、第2の音圧波形データとして記憶するステップ(b)と、前記第1及び第2の音圧波形データを用いて、前記第1〜第5のマイクロフォンで採取した音圧信号の位相差を算出して前記第1の観測点から見た音源方向の水平角θ1と仰角φ1とを推定するとともに、前記第6〜第9のマイクロフォンで採取した音圧信号の位相差を算出して前記第2の観測点から見た音源方向の水平角θ2を推定するステップ(c)と、予め入力された前記第1の観測点における第1〜第4のマイクロフォンの中心座標と前記第2の観測点における第6〜第9のマイクロフォンの中心座標、及び、前記ステップ(c)で推定された水平角θ1,θ2を用いて、前記第1の観測点と音源との水平距離Lxyを求めるステップ(d)と、前記求められた水平距離Lxyと前記仰角φ1とを用いて前記第1の観測点と音源との距離Lを求めるステップ(e)と、前記ステップ(c)で推定された前記第1の観測点から見た音源方向の水平角θ1と仰角φ1と前記ステップ(b)で記憶した画像データとを合成し、前記推定された音源方向を示す図形が描画された音源推定用画像を作成するステップ(f)と、前記音源推定用画像を表示手段の表示画面に表示して音源を推定するステップ(g)とを有し、前記ステップ(a)では、前記第6〜第9のマイクロフォンを、第1〜第4のマイクロフォンと同一平面内で、かつ、前記第1〜第4のマイクロフォンが配列される互いに交わる2つの直線の方向と前記第6〜第9のマイクロフォンが配列される互いに交わる2つの直線の方向とが一致するように前記第2の観測点に設置し、前記ステップ(c)では、前記音・映像採取ユニットの2組のマイクロフォン対を構成するマイクロフォン間の位相差と、前記第5のマイクロフォンと前記2組のマイクロフォン対を構成する4個のマイクロフォンのそれぞれとで構成される4組のマイクロフォン対を構成するマイクロフォン間の位相差とを用いて前記第1の観測点から見た音源方向の水平角θ1と仰角φ1を推定し、前記音採取ユニットの2組のマイクロフォン対を構成するマイクロフォン間の位相差を用いて前記第2の観測点から見た音源方向の水平角θ2を推定することを特徴とする。
このように、第1の観測点にて採取した音圧信号のデータから推定された水平角θ1及び仰角φ1と第1の観測点にて採取した映像信号の画像データとを用いて作成した音源推定用画像から音源を推定するとともに、前記水平角θ1及び仰角φ1と第2の観測点で推定された水平角θ2とから第1の観測点と音源との距離Lを求めるようにしたので、音源の推定と推定された音源と観測点との距離とをリアルタイムで計測することができる。
【0010】
請求項2に記載の発明は、複数のマイクロフォンと撮影手段とを用いて音の情報である音圧信号と映像の情報である映像信号とを採取し、この採取した音圧信号のデータと画像データとを用いて音源を推定する装置であって、互いに交わる2つの直線上にそれぞれ所定の間隔で配置されて2組のマイクロフォン対を構成する第1〜第4のマイクロフォンと前記2組のマイクロフォン対の作る平面上にない第5のマイクロフォンと撮影手段とを備え、第1の観測点に設置されて、音の情報である音圧信号と映像の情報である映像信号とを採取する音・映像採取ユニットと、前記第1〜第4のマイクロフォンと同じ状態に配置された第6〜第9のマイクロフォンを備え、前記第1の観測点とは異なる第2の観測点に設置されて音圧信号を採取する音採取ユニットと、前記第1の観測点にて採取した音圧信号と映像信号と前記第2の観測点にて採取した音圧信号とをA/D変換するA/D変換器と、前記A/D変換された前記第1の観測点にて採取した音圧信号と、前記第2の観測点にて採取した音圧信号と、前記第1の観測点にて採取した映像信号とを、それぞれ第1の音圧波形データ、第2の音圧波形データ、及び、画像データとして記憶する記憶手段と、前記音・映像採取ユニットの2組のマイクロフォン対を構成するマイクロフォン間の位相差と、前記第5のマイクロフォンと前記第1〜第4のマイクロフォンのそれぞれとで構成される4組のマイクロフォン対を構成するマイクロフォン間の位相差とを用いて前記第1の観測点から見た音源方向の水平角θ1と仰角φ1とを推定し、前記音採取ユニットの2組のマイクロフォン対を構成するマイクロフォン間の位相差を用いて前記第2の観測点から見た音源方向の水平角θ2を推定する音源方向推定手段と、前記推定された第1の観測点から見た音源方向の水平角θ1と仰角φ1と前記記憶手段に記憶されている画像データとを合成し、前記推定された音源の方向を示す図形が描画された音源推定用画像を作成する音源推定用画像作成手段と、前記音源推定用画像を表示画面に表示する表示手段と、予め入力された前記第1の観測点における第1〜第4のマイクロフォンの中心座標と前記第2の観測点における第6〜第9のマイクロフォンの中心座標、及び、前記音源方向推定手段にて推定された水平角θ1,θ2を用いて、前記第1の観測点と前記推定された音源方向にある音源との水平距離Lxyを求める水平距離算出手段と、前記求められた水平距離Lxyと前記仰角φ1とを用いて前記第1の観測点と音源との距離Lを求める距離算出手段とを備え、前記音採取ユニットは、前記第6〜第9のマイクロフォンが前記第1〜第4のマイクロフォンと同一平面内にあり、かつ、前記第1〜第4のマイクロフォンが配列される互いに交わる2つの直線の方向と前記第6〜第9のマイクロフォンが配列される互いに交わる2つの直線の方向とが一致するように、前記第2の観測点に設置されていることを特徴とする。
このような構成を採ることにより、第1の観測点にて採取した音圧信号のデータから推定された水平角θ1及び仰角φ1と第1の観測点にて採取した映像信号の画像データとを用いて作成した音源推定用画像から音源を推定できるとともに、前記水平角θ1及び仰角φ1と第2の観測点で推定された水平角θ2とから第1の観測点と音源との距離Lを求めることができるので、音源の推定、及び、音源と観測点との距離をリアルタイムで計測できる。
【0011】
請求項3に記載の発明は、請求項2に記載の音源推定装置において、前記第1の観測点と音源との水平距離Lxyを半径とし、前記水平角θ1を回転角とした音源の水平投影画像を作成する手段を設け、前記表示手段が、前記作成された音源の水平投影画像を前記表示手段に表示することを特徴とする。
このように、第1の観測点と音源との距離Lと水平角θ1とを極座標表示した水平投影画像を表示画面に表示すれば、音源が観測点からどの方向にありかつどれだけ離れているのかを容易に把握することができる。
請求項4に記載の発明は、請求項3に記載の音源推定装置において、前記水平投影画像を予め設定した時間間隔毎に作成して前記表示手段に表示するようにしたので、音源が移動している場合でも、音源が観測点からどの方向にどれだけ移動しているかを容易に把握することができる。
【0012】
なお、前記発明の概要は、本発明の必要な全ての特徴を列挙したものではなく、これらの特徴群のサブコンビネーションもまた、発明となり得る。
【図面の簡単な説明】
【0013】
【図1】本発明の実施の形態に係る音源推定システムの構成を示す図である。
【図2】音・映像採取ユニットと音採取ユニットの配置例を示す図である。
【図3】本発明による音源推定方法を示すフローチャートである。
【図4】第1の観測点と音源との水平距離Lxyを算出する方法を示す図である。
【図5】第1の観測点と音源との距離Lを算出する方法を示す図である。
【図6】表示画面の一例を示す図である。
【図7】従来マイクロフォン対を用いた音源探査方法におけるマイクロフォンの配列を示す図である。
【発明を実施するための形態】
【0014】
以下、実施の形態を通じて本発明を詳説するが、以下の実施の形態は特許請求の範囲に係る発明を限定するものでなく、また、実施の形態の中で説明される特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。
【0015】
以下、本発明の実施の形態について、図面に基づき説明する。
図1は音源推定システムの構成を示す機能ブロック図である。
本発明の音源推定システムは、音・映像採取ユニット10と音採取ユニット20と演算・表示装置30とを備える。音・映像採取ユニット10は第1の観測点P1に設置され、音採取ユニット20は第1の観測点P1とは異なる第2の観測点Pに設置される。
音・映像採取ユニット10は、図2にも示すように、第1の音採取手段11と、映像採取手段としてのCCDカメラ(以下、カメラという)12と、マイクロフォン支持台13と、カメラ支持部材14と、回転台15と、基台16とを備える。
第1の音採取手段11は複数のマイクロフォンM1〜M5を備える。
マイクロフォンM1〜M5は、図示しない音源から伝播される音の音圧信号の大きさである音圧レベルをそれぞれ測定する。
マイクロフォンM1〜M5の配置は、図7に示したものと同様で、4個のマイクロフォンM1〜M4を、互いに直交する2直線上にそれぞれ所定の間隔で配置された2組のマイクロフォン対(M1,M3)及びマイクロフォン対(M2,M4)を構成するように配置するとともに、第5のマイクロフォンM5を前記マイクロフォンM1〜M4の作る平面上にない位置、詳細には、マイクロフォンM1〜M4の作る正方形を底面とする四角錐の頂点の位置に配置する。これにより、更に4組のマイクロフォン対(M5, M1)〜(M5, M4)が構成される。
以下、マイクロフォンM1〜M4は水平面上に設置されるものとし、音・映像採取ユニット10の向きを図2の矢印Dの方向(マイクロフォンM3からマイクロフォンM1に向かう方向)をx方向、矢印Dに直交する方向をy方向という。
【0016】
マイクロフォン支持台13は、第1〜第3の支持板131〜133と、連結板134と、脚部135,136とを備える。
第1の支持板131は、x方向に延長してマイクロフォン対(M1,M3)を搭載する棒状の部材で、マイクロフォンM1,M3は第1の支持板131の両端部にそれぞれ固定される。第2の支持板132は、y方向に延長してマイクロフォン対(M2,M4)を搭載する棒状の部材で、マイクロフォンM2,M4は第2の支持板132の両端部にそれぞれ固定される。連結板134は、第1及び第2の支持板131,132をその中心にて連結する板状の部材で、第1及び第2の支持板131,132と連結板134とは、マイクロフォンM1〜M4が水平面上に設置されるように一体に構成される。
連結板134の中心、すなわち、マイクロフォンM1〜M4の中心点の位置が第1の観測点P1の位置(x1,y1,z1)である(図2(b)参照)。
第3の支持板133は、第2の支持板132上で連結板134の中心から等距離の位置にそれぞれ立設された脚部135,136上に取付けられた板状の部材で、この板状の部材の中心に第5のマイクロフォンM5が搭載される。
第1の観測点P1の位置座標をP1(x1,y1,z1)=(0,0,0)とすると、マイクロフォンM1〜M5はそれぞれ、M1=(L/2,0,0)、M2=(0,L/2,0)、M3=(−L/2,0,0)、M4=(0,−L/2,0,0)、M5=(0,0,L/2)となる。Lはマイクロフォン対(M1,M3),(M2,M4)のマイクロフォン間隔で、計測する音の最大波長により決定される値で、本例では、周波数帯域が50Hz〜500Hzの範囲のいわゆる低周波数帯域の音を含む音源を計測するため、L=300mmとした。
【0017】
カメラ支持部材14は、第1の支持板131のマイクロフォンM1が搭載されている端部側で、かつ、マイクロフォンM1が搭載されている側とは反対側の面である裏面側に設けられてカメラ12を支持する。本例では、カメラ12の撮影方向を音・映像採取ユニット10の向きである図2の矢印Dの方向とし、カメラ12により、音・映像採取ユニット10の向きに応じた映像を採取する。
回転台15は、図示しないモータを内蔵した固定部151とモータの出力に連結された回転軸152とを備える。回転軸152は連結板134の中心に連結されている。
基台16は3脚から成る支持部材で、この基台16上に回転台15が設置されている。
したがって、回転台15の回転軸152を回転させることにより、音採取手段11とカメラ12とを一体に回転させることができる。
【0018】
音採取ユニット20は、第2の音採取手段21と、マイクロフォン支持台23と、回転台25と、基台26とを備える。
第2の音採取手段21は複数のマイクロフォンM6〜M9を備える。
マイクロフォンM6〜M9は、図示しない音源から伝播される音の音圧信号の大きさである音圧レベルをそれぞれ測定する。
マイクロフォンM6〜M9の配置はマイクロフォンM1〜M4の配置と同じで、マイクロフォン対(M1,M3)とマイクロフォン対(M6,M8)とが対応し、マイクロフォン対(M2,M4)とマイクロフォン対(M7,M9)とが対応する。
マイクロフォンM6〜M9も水平面上に設置される。音採取ユニット20の向きは音・映像採取ユニット10の向きと同じく、図2の矢印Dの方向である。
音採取ユニット20は、第5のマイクロフォンとカメラとを有しないこと以外は音・映像ユニット10と同構成で、マイクロフォン支持台23は、第1及び第2の支持板231,232と連結板234とを備えている。すなわち、第3の支持板133に相当する部材と脚部135,136に相当する部材とカメラ支持部材14に相当する部材はなく、回転台15に相当する部材が回転台25で、基台16に相当する部材が基台26である。
音採取ユニット20も回転台25の回転軸252を回転させることにより、マイクロフォンM6〜M9を一体に回転させることができる。
連結板234の中心、すなわち、マイクロフォンM5〜M9の中心点の位置が第2の観測点P2となる(図2(b)参照)。
本例では、第2の観測点P2を、第1の観測点P1から測って、マイクロフォンM4からマイクロフォンM2に向かう方向(y方向)に距離をKだけ離れた箇所に設けている。なお、第1の観測点P1と第2の観測点P2とは同じ水平面上に設けられる。すなわち、第1の観測点P1の位置座標をP1(x1,y1,z1)とすると、第2の観測点P2の位置座標はP2(x2,y2,z2)=(x1,y1+K,z1)である。
【0019】
演算・表示装置30は、増幅器31と、A/D変換器32と、映像入出力手段33と、記憶手段34と、音源方向推定手段35と、音源距離算出手段36と、水平投影画像作成手段37と、音源推定用画像作成手段38と、表示画像作成手段39と、表示手段40とを備える。音源方向推定手段35から表示画像作成手段39までの各手段は、例えば、コンピュータのソフトウェアにより構成され、記憶手段34はコンピュータのハードディスクなどのメモリーが使用される。なお、A/D変換器32及び映像入出力手段33についてもコンピュータに組み込んでもよい。
増幅器31はローパスフィルタを備え、指令信号が入力されると、マイクロフォンM1〜M5で採取した音の音圧信号とマイクロフォンM6〜M9で採取した音の音圧信号とからそれぞれ高周波ノイズ成分を除去するとともに、前記各音圧信号を増幅してA/D変換器32に出力する。
A/D変換器32は、前記各音圧信号をA/D変換した音圧波形データを作成し、これを所定時間Tp(例えば、Tp=1/30秒)毎に記憶手段34に送る。音圧波形データは、第1の観測点P1で観測された音の音圧波形データA1と第2の観測点Pで観測された音の音圧波形データA2とが記憶手段34の別領域にそれぞれ記憶される。
映像入出力手段33は、カメラ12で撮影された映像信号を入力してA/D変換し、このA/D変換されたデータである画像データG1を前記所定時間Tp毎に記憶手段34に送る。
記憶手段34には、音圧波形データA1,A2と、画像データG1とが前記所定時間Tp毎に順次保存される。なお、第1の観測点P1の位置座標P1(x1,y1,z1)と、第2の観測点Pの位置座標P2(x2,y2,z2)も記憶手段34に保存される。
【0020】
音源方向推定手段35は、記憶手段34から、前記所定時間Tp毎に音源方向の推定演算を行うための音圧波形データA1を取出して各マイクロフォンM1〜M5間の位相差を求め、求められた位相差から第1の観測点P1からみた音源方向の水平角θ1と仰角φ1とを演算するとともに、音圧波形データA2を取出して各マイクロフォンM6〜M9間の位相差を求め、求められた位相差から第2の観測点P2からみた音源方向の水平角θ2を演算する。
第1の観測点P1からみた音源方向の水平角θ1と仰角φ1と第2の観測点P2からみた音源方向の水平角θ2とが音源距離算出手段36に出力され、前記水平角θ1と仰角φ1とが音源推定用画像作成手段38に出力される。また、前記水平角θ1は水平投影画像作成手段37に出力される。
音源距離算出手段36は水平距離算出部36aと音源距離算出部36bとを備える。
水平距離算出部36aは、第1の観測点P1からみた音源方向の水平角θ1と第2の観測点P2からみた音源方向の水平角θ2とから音源の位置座標の水平成分(xk,yk)を求め、求められた水平成分(xk,yk)と第1の観測点P1の位置座標の水平成分(x1,y1)とから第1の観測点P1と音源との水平距離Lxyを算出する。水平距離Lxyは水平投影画像作成手段37に出力される。
音源距離算出部36bは、前記水平距離Lxyと第1の観測点P1からみた音源方向の仰角φ1とから第1の観測点P1と音源との距離Lを算出する。距離Lは表示画像作成手段39に出力される。
【0021】
水平投影画像作成手段37は、音源方向推定手段35で推定された第1の観測点P1からみた音源方向の水平角θ1と音源距離算出手段36の水平距離算出部36aで算出された第1の観測点P1と音源との水平距離Lxyとから、水平距離Lxyと水平角θ1とを極座標表示した水平投影画像Rkを作成して表示画像作成手段39に出力する。水平投影画像においては、半径方向の長さが水平距離Lxyで回転角が水平角θ1である。
音源推定用画像作成手段38は、記憶手段34に記憶された画像データG1と音源方向推定手段35で推定された第1の観測点P1からみた音源方向の水平角θ1と仰角φ1とから画像中に音源の方向を示す図形が描画された音源推定用画像Gkを作成して表示画像作成手段39に出力する。
表示画像作成手段39は、音源距離算出手段36で算出された第1の観測点P1と音源との距離Lを表示する距離表示画像Lkを作成するとともに、この距離表示画像Lkと水平投影画像Rkと音源推定用画像Gkとを組み合わせた表示画像Mkを表示手段40に出力する。
表示手段40は、ディスプレイなどの表示画面40Mを備え、表示画像作成手段39で作成された表示画像Mkを表示画面40Mに表示する。
【0022】
次に、本発明による音源推定方法について、図3のフローチャートを参照して説明する。
まず、音・映像採取ユニット10を第1の観測点P1にセットし、音採取ユニット20を第2の観測点P2にセットするとともに、第1の観測点P1の位置座標P1(x1,y1,z1)と第2の観測点P2の位置座標P2(x2,y2,z2)とを演算・表示装置30に入力して記憶手段34に記憶させる(ステップS10)。
このとき、音・映像採取ユニット10と音採取ユニット20とを、所定距離Kだけ離して、同じ水平面上に設置するとともに、音・映像採取ユニット10の向きと音採取ユニット20との向きを一致させることが肝要である。マイクロフォンM1〜M4の高さと水平度は基台16の脚の長さを調整して確保し、マイクロフォンM6〜M9の高さと水平度は基台26の脚の長さを調整して確保する。また、音・映像採取ユニット10の向きと音採取ユニット20の向きとは回転台15と回転台25とをそれぞれ調整して確保する。マイクロフォン支持台13の第2の支持板132とマイクロフォン支持台23の第2の支持板232とを一直線上にかつ同じ方向に配置するにはレーザー墨出し器を用い、音・映像採取ユニット10と音採取ユニット20との距離Kを確認するにはレーザー距離計を用いると、音・映像採取ユニット10と音採取ユニット20とを精度よく配置することができる。なお、カメラ12はマイクロフォン支持台13の第1の支持板131に取付けられているので、特に調整の必要はない。
【0023】
次に、マイクロフォンM1〜M5にて第1の観測点P1に到達した音の音圧信号を採取するとともに、カメラ12にて第1の観測点P1から測定場所の映像を採取する。このとき、同時に、マイクロフォンM6〜M9にて第2の観測点P2に到達した音の音圧信号を採取する(ステップS11)。
マイクロフォンM1〜M5で採取された音圧信号とマイクロフォンM6〜M9で採取された音圧信号は、増幅器31で増幅された後、A/D変換器32でA/D変換される。一方、カメラ12で採取された映像信号は映像入出力手段33でA/D変換される(ステップS12)。
A/D変換された音圧信号と映像信号とは、それぞれ、記憶手段34に、音圧波形データA1,A2、及び、画像データG1として保存される(ステップS13)。
次に、音源方向推定手段35にて音圧波形データA1を取出してFFTにて周波数解析し、各マイクロフォンM1〜M4間の位相差を求め、求められた位相差から第1の観測点P1からみた音源方向の水平角θ1を演算する(ステップS14)とともに、音圧波形データA2を取出してFFTにて周波数解析し、各マイクロフォンM6〜M9間の位相差を求め、求められた位相差から第2の観測点P2からみた音源方向の水平角θ2を演算する(ステップS15)。ステップS16では、各マイクロフォンM1〜M5間の位相差から第1の観測点P1からみた音源方向の仰角φ1を演算する。ステップS14〜ステップS16の各処理は並列に行ってもよいし、ステップ順に行ってもよい。なお、本例では、位相差に代えて、位相差に比例する物理量である到達時間差Dijを用いて水平角θ及び仰角φを求めている。
このステップS14〜ステップS16における水平角θ及び仰角φの計算方法については後述する。
【0024】
次に、ステップS17で、図4に示すように、第1の観測点P1からみた音源方向の水平角θ1と第1の観測点P1の位置座標の水平成分p1(x1,y1)とを用いて、第1の観測点P1を通り傾きが水平角θ1に等しい直線l1の式を求め、ステップS18で、第2の観測点P2からみた音源方向の水平角θ2と第2の観測点P2の位置座標の水平成分p2(x2,y2)とを用いて、第2の観測点P2を通り傾きが水平角θ2に等しい直線l2の式を求める。
ステップS19では、直線l1と直線l2との交点pkの座標を求めて、第1の観測点P1と音源Pkとの水平距離Lxyを算出する。交点pkの座標pk(xk,yk)が音源Pkの位置座標の水平成分であるので、この音源Pkの位置座標の水平成分pk(xk,yk)と第1の観測点P1の位置座標の水平成分p1(x1,y1)とから、第1の観測点P1と音源Pkとの水平距離Lxyを算出することができる。
ステップS20では、図5に示すように、第1の観測点P1と音源Pkとの水平距離LxyとステップS16で推定した第1の観測点P1からみた音源方向の仰角φ1とを用いて、第1の観測点P1と音源Pkとの距離Lを算出する。なお、同図において、P’kは音源PkのマイクロフォンM1〜M4の作る平面への正射影である。
【0025】
ステップ21では、図6の右下の円形のグラフに示すような、水平投影画像用の極座標画像を作成し、この極座標画像上に、ステップS19で算出した第1の観測点P1と音源との水平距離LxyとステップS14で推定された第1の観測点P1からみた音源方向の水平角θ1とを成分とする点(r,θ)=(Lxy,θ1)を描画した水平投影画像Rkを作成する。
また、ステップ22では、ステップS14,S16で推定した第1の観測点P1からみた音源方向の水平角θ1と仰角φ1、ステップS13で保存した画像データG1とを合成し、図6の中央上側に示すような、合成された画像中に網目模様の丸印などの周波数毎の音源の方向を示す図形Cが描画された音源推定用画像Gkを作成する。この図形Cの模様は周波数を示し大きさは音圧信号の大きさを表すので、大きな図形Cがある領域で、かつ、図形Cの重なりの重心位置を算出し、この重心位置を音源Pkの位置とし、音源推定用画像Gk上に描画する。図6の映像は、建設現場に導入されたショベルカーを撮影したもので、ショベルカーのエンジン付近での音が最も大きい。なお、図には示していないが、ショベルカーが移動しているときには、キャタピラ近傍の振動音も観測される。
ステップ21とステップ22の処理が終了すると、ステップS23に進み、表示画面40Mの水平投影画像表示欄40aに水平投影画像Rkを表示し、音源推定用画像表示欄40bに音源推定用画像Gkを表示するとともに、音源データ表示欄40cに音源Pkの位置データである水平角θ1と仰角φ1と距離Lとを表示する。
なお、前記処理を保存された音圧波形データA1,A2及び画像データG1について、所定時間Tp毎に行って、水平投影画像Rkと音源推定用画像Gkとを作成して表示するとともに、水平角θ1と仰角φ1と距離Lとを表示するようにすれば、音源Pkが移動している場合や音源Pkが間欠的に音を発する音源である場合でも、音源Pkと観測点との距離をリアルタイムで把握することができる。
【0026】
ステップS14〜ステップS16における水平角θ及び仰角φの計算方法は以下の通りである。
各マイクロフォン対(Mi, Mj)のマイクロフォンMiとマイクロフォンMjとの間の到達時間差をDijとすると、音の入射方向の水平角θは以下の式(1)で表わせるので、マイクロフォンM1〜M4の出力信号、及び、マイクロフォンM6〜M9の出力信号をFFTを用いて周波数分析し、対象となる周波数fにおける各マイクロフォンM,M間の到達時間差Dijを算出することにより、第1の観測点P1からみた音源方向の水平角θ1及び第2の観測点P2からみた音源方向の水平角θ2を推定することができる。
また、音の入射方向の仰角φは以下の式(2)で表わせるので、マイクロフォンM1〜M5の出力信号をFFTを用いて周波数分析し、対象となる周波数fにおける各マイクロフォンM,M間の到達時間差Dijを算出することにより、第1の観測点P1からみた音源方向の水平角φ1を推定することができる。
【数1】

すなわち、互いに直交する2直線上にそれぞれ所定の間隔で配置された2組のマイクロフォン対(M1,M3)及びマイクロフォン対(M2,M4)を構成するマイクロフォンM1,M3に入力する音圧信号の到達時間差D13と、前記マイクロフォン対(M2,M4)を構成するマイクロフォンM2,M4に入力する音圧信号の到達時間差D24との比から、第1の観測点P1からみた音源方向の水平角θ1を推定することができる。第2の観測点P2からみた音源方向の水平角θ2の推定も水平角θ1の推定と同様に行うことができる。
また、マイクロフォンM1〜M5間の到達時間差Dijから第1の観測点P1からみた音源方向の仰角φ1を推定することができる。
なお、前記到達時間差Dijは、2つのマイクロフォン対(M,M)に入力される信号のクロススペクトルPij(f)を求め、更に、対象とする前記周波数fの位相角情報Ψ(rad)を用いて、以下の式(3)を用いて算出される。
【数2】

【0027】
このように、本実施の形態では、複数のマイクロフォンM1〜M5とカメラ12とを備えた音・映像採取ユニット10を第1の観測点P1に配置して音圧信号と映像信号とを採取するとともに、複数のマイクロフォンM6〜M9を備えた音採取ユニット20を第2の観測点P2に配置して音圧信号を採取し、これらの音圧信号をA/D変換した第1及び第2の観測点P1,P2の音圧波形データA1,A2を用いて第1の観測点P1からみた音源Pkの水平角θ1及び仰角φ1と第2の観測点P2からみた音源Pkの水平角θ2を求めた後、水平角θ1,θ2と第1及び第2の観測点P1,P2の位置座標から音源Pkと第1の観測点P1との水平距離Lxyを求め、この水平距離Lxyと水平角θ1とを極座標表示した水平投影画像Rkを作成するとともに、第1の観測点P1で採取した映像信号をA/D変換した画像データG1と水平角θ1及び仰角φ1とから、画像中に音源Pkの方向を示す図形が描画された音源推定用画像Gkを作成し、水平投影画像Rkと音源推定用画像Gkと距離Lのデータとを表示手段40の表示画面40Mに表示するようにしたので、音源Pkを確実に把握できるとともに、音源Pkが移動している場合や音源Pkが間欠的に音を発する音源である場合でも、音源Pk及び音源Pkと観測点との距離をリアルタイムで把握することができる。
【0028】
なお、前記実施の形態では、低周波数帯域の音源を計測する音源推定システムについて説明したが、これに限るものではなく、注目する音の周波数帯域により、マイクロフォンの間隔を変更することで、任意の周波数帯域の音を含む音源を計測することが可能である。
また、前記例では、音・映像採取ユニット10と音採取ユニット20とを用いたが、2台の音・映像採取ユニット10を用いてもよい。この場合には、装置の備品点数は増えるが、音源Pkが中央に映っている方の画像データを用いて音源推定用画像Gkを作成できるという利点がある。また、音源Pkが移動している場合には、音源推定用画像Gkを切換えるなどできるので、音源Pkを確実に把握できる。
【0029】
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は前記実施の形態に記載の範囲には限定されない。前記実施の形態に、多様な変更または改良を加えることが可能であることが当業者にも明らかである。そのような変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲から明らかである。
【産業上の利用可能性】
【0030】
以上説明したように、本発明によれば、観測点で採取した音の音圧信号と映像信号とから音源を推定するとともに、推定された音源と観測点との距離を算出することができるので、音源を確実にかつリアルタイムで把握することができる。
【符号の説明】
【0031】
10 音・映像採取ユニット、11 第1の音採取手段、
12 CCDカメラ(カメラ)、13,23 マイクロフォン支持台、
131〜133 支持板、134 連結板、
135,136 脚部、14 カメラ支持部材、15,25 回転台、151 固定部、
152 回転軸、16,26 基台、
M1〜M5 音・映像採取ユニットのマイクロフォン、
20 音採取ユニット、21 第2の音採取手段、
M6〜M9 音採取ユニットのマイクロフォン、
30 演算・表示装置、31 増幅器、32 A/D変換器、33 映像入出力手段、
34 記憶手段、35 音源方向推定手段、36 音源距離算出手段、
36a 水平距離算出部、36b 音源距離算出部、37 水平投影画像作成手段、
38 音源推定用画像作成手段、39 表示画像作成手段、40 表示手段、
40M 表示画面。

【特許請求の範囲】
【請求項1】
互いに交わる2つの直線上にそれぞれ所定の間隔で配置されて2組のマイクロフォン対を構成する第1〜第4のマイクロフォンと前記2組のマイクロフォン対の作る平面上にない第5のマイクロフォンと撮影手段とを備えた音・映像採取ユニットを第1の観測点に設置し、前記第1〜第4のマイクロフォンと同じ状態に配置された第6〜第9のマイクロフォンを備えた音採取ユニットを前記第1の観測点とは異なる第2の観測点に設置して音の情報である音圧信号と映像の情報である映像信号とを採取するステップ(a)と、
前記第1の観測点にて採取した音圧信号と映像信号と前記第2の観測点にて採取した音圧信号とをA/D変換してそれぞれ第1の音圧波形データ、画像データ、及び、第2の音圧波形データとして記憶するステップ(b)と、
前記第1及び第2の音圧波形データを用いて、前記第1〜第5のマイクロフォンで採取した音圧信号の位相差を算出して前記第1の観測点から見た音源方向の水平角θ1と仰角φ1とを推定するとともに、前記第6〜第9のマイクロフォンで採取した音圧信号の位相差を算出して前記第2の観測点から見た音源方向の水平角θ2を推定するステップ(c)と、
予め入力された前記第1の観測点における第1〜第4のマイクロフォンの中心座標と前記第2の観測点における第6〜第9のマイクロフォンの中心座標、及び、前記ステップ(c)で推定された水平角θ1,θ2を用いて、前記第1の観測点と音源との水平距離Lxyを求めるステップ(d)と、
前記求められた水平距離Lxyと前記仰角φ1とを用いて前記第1の観測点と音源との距離Lを求めるステップ(e)と、
前記ステップ(c)で推定された前記第1の観測点から見た音源方向の水平角θ1と仰角φ1と前記ステップ(b)で記憶した画像データとを合成し、前記推定された音源方向を示す図形が描画された音源推定用画像を作成するステップ(f)と、
前記音源推定用画像を表示手段の表示画面に表示して音源を推定するステップ(g)と、を有し、
前記ステップ(a)では、前記第6〜第9のマイクロフォンを、第1〜第4のマイクロフォンと同一平面内で、かつ、前記第1〜第4のマイクロフォンが配列される互いに交わる2つの直線の方向と前記第6〜第9のマイクロフォンが配列される互いに交わる2つの直線の方向とが一致するように前記第2の観測点に設置し、
前記ステップ(c)では、
前記音・映像採取ユニットの2組のマイクロフォン対を構成するマイクロフォン間の位相差と、前記第5のマイクロフォンと前記2組のマイクロフォン対を構成する4個のマイクロフォンのそれぞれとで構成される4組のマイクロフォン対を構成するマイクロフォン間の位相差とを用いて前記第1の観測点から見た音源方向の水平角θ1と仰角φ1とを推定し、前記音採取ユニットの2組のマイクロフォン対を構成するマイクロフォン間の位相差を用いて前記第2の観測点から見た音源方向の水平角θ2を推定することを特徴とする音源推定方法。
【請求項2】
互いに交わる2つの直線上にそれぞれ所定の間隔で配置されて2組のマイクロフォン対を構成する第1〜第4のマイクロフォンと前記2組のマイクロフォン対の作る平面上にない第5のマイクロフォンと撮影手段とを備え、第1の観測点に設置されて、音の情報である音圧信号と映像の情報である映像信号とを採取する音・映像採取ユニットと、
前記第1〜第4のマイクロフォンと同じ状態に配置された第6〜第9のマイクロフォンを備え、前記第1の観測点とは異なる第2の観測点に設置されて音圧信号を採取する音採取ユニットと、
前記第1の観測点にて採取した音圧信号と映像信号と前記第2の観測点にて採取した音圧信号とをA/D変換するA/D変換器と、
前記A/D変換された前記第1の観測点にて採取した音圧信号と、前記第2の観測点にて採取した音圧信号と、前記第1の観測点にて採取した映像信号とを、それぞれ第1の音圧波形データ、第2の音圧波形データ、及び、画像データとして記憶する記憶手段と、
前記音・映像採取ユニットの2組のマイクロフォン対を構成するマイクロフォン間の位相差と、前記第5のマイクロフォンと前記第1〜第4のマイクロフォンのそれぞれとで構成される4組のマイクロフォン対を構成するマイクロフォン間の位相差とを用いて前記第1の観測点から見た音源方向の水平角θ1と仰角φ1とを推定し、前記音採取ユニットの2組のマイクロフォン対を構成するマイクロフォン間の位相差を用いて前記第2の観測点から見た音源方向の水平角θ2を推定する音源方向推定手段と、
前記推定された第1の観測点から見た音源方向の水平角θ1と仰角φ1と前記記憶手段に記憶されている画像データとを合成し、前記推定された音源の方向を示す図形が描画された音源推定用画像を作成する音源推定用画像作成手段と、
前記音源推定用画像を表示画面に表示する表示手段と、
予め入力された前記第1の観測点における第1〜第4のマイクロフォンの中心座標と前記第2の観測点における第6〜第9のマイクロフォンの中心座標、及び、前記音源方向推定手段にて推定された水平角θ1,θ2を用いて、前記第1の観測点と前記推定された音源方向にある音源との水平距離Lxyを求める水平距離算出手段と、
前記求められた水平距離Lxyと前記仰角φ1とを用いて前記第1の観測点と音源との距離Lを求める距離算出手段と、
を備え、
前記音採取ユニットは、前記第6〜第9のマイクロフォンが前記第1〜第4のマイクロフォンと同一平面内にあり、かつ、前記第1〜第4のマイクロフォンが配列される互いに交わる2つの直線の方向と前記第6〜第9のマイクロフォンが配列される互いに交わる2つの直線の方向とが一致するように、前記第2の観測点に設置されていることを特徴とする音源推定装置。
【請求項3】
前記第1の観測点と音源との水平距離Lxyを半径とし、前記水平角θ1を回転角とした音源の水平投影画像を作成する手段を設け、
前記表示手段は、前記作成された音源の水平投影画像を前記表示手段に表示することを特徴とする請求項2に記載の音源推定装置。
【請求項4】
前記水平投影画像を予め設定した時間間隔毎に作成して前記表示手段に表示することを特徴とする請求項3に記載の音源推定装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2012−150059(P2012−150059A)
【公開日】平成24年8月9日(2012.8.9)
【国際特許分類】
【出願番号】特願2011−10184(P2011−10184)
【出願日】平成23年1月20日(2011.1.20)
【出願人】(000213297)中部電力株式会社 (811)
【出願人】(000001317)株式会社熊谷組 (551)
【Fターム(参考)】