説明

音源の推定方法とその装置

【課題】突発的な音や間欠的な音が発生した場合でも、音源の推定を確実に行うことのできる方法とその装置を提供する。
【解決手段】複数のマイクロフォンとカメラとを一体化した音・映像採取ユニットを用いて音と映像とを同時に採取した後、音圧波形データと画像データとをバッファに一時保存しておき、時刻t0にて、制御ユニットから測定開始信号の指令が発せられたときには、時刻t0から所定の遡行時間長Tz分だけ遡った時刻t1=t0−Tzと時刻t2=t0+(Tw−Tz)との間にバッファに保存されたデータを取出して音ファイルと動画ファイルとを作成してメモリーに保存し、この保存された音ファイルの音圧波形データを用いて、複数のマイクロフォンで採取した音の音圧信号間の位相差を算出して音源方向を推定するようにした。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、複数のマイクロフォンで採取した音の情報と、撮影手段で撮影した映像の情報とを用いて、音源を推定する方法とその装置に関するものである。
【背景技術】
【0002】
従来、音の到来方向を推定する方法としては、多数のマイクロフォンを等間隔に配置したマイクロフォンアレーを構築し、基準となるマイクロフォンに対する各マイクロフォンの位相差から音波の到来方向である音源方向を推定する、いわゆる音響学的手法が考案されている(例えば、非特許文献1参照)。
一方、計測点に配置された複数のマイクロフォンの出力信号の位相差からではなく、複数のマイクロフォンから互いに交わる直線状に配置された複数のマイクロフォン対を構成し、対となる2つのマイクロフォン間の位相差に相当する到達時間差と、他の対となる2つのマイクロフォン間の到達時間差との比から音源方向を推定する方法が提案されている(例えば、特許文献1〜3参照)。
【0003】
具体的には、図6に示すように、4個のマイクロフォンM1〜M4を、互いに直交する2直線上にそれぞれ所定の間隔で配置された2組のマイクロフォン対(M1,M3)及びマイクロフォン対(M2,M4)を構成するように配置し、前記マイクロフォン対(M1,M3)を構成するマイクロフォンM1,M3に入力する音圧信号の到達時間差と、前記マイクロフォン対(M2,M4)を構成するマイクロフォンM2,M4に入力する音圧信号の到達時間差との比から、計測点と音源の位置との成す水平角θを推定するとともに、第5のマイクロフォンM5を前記マイクロフォンM1〜M4の作る平面上にない位置に配置して、更に4組のマイクロフォン対(M5, M1),(M5, M2),(M5, M3),(M5, M4)を構成し、前記各マイクロフォン対を構成するマイクロフォン間の到達時間差から、計測点と音源の位置との成す仰角φを推定する。
【0004】
これにより、マイクロフォンアレーを用いて音源方向を推定する場合に比較して、少ないマイクロフォン数で音源方向を正確に推定することができる。
また、このとき、CCDカメラ等の映像採取手段を設けて前記推定された音源方向の映像を撮影した後、この映像のデータと音源方向のデータとを合成して、映像中に前記推定した音源方向と音圧レベルとを図形で表示するようにすれば、音源を視覚的に把握することができる。
また、音の採取と同時に映像採取手段にて映像を連続的に撮影し、音の情報とともに、映像の情報を動画としてコンピュータに保存しておき、その後音源方向の計算を行って映像中に推定した音源方向と音圧レベルとを図形を表示して音源を推定する方法も行われている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2002−181913号公報
【特許文献2】特開2006−324895号公報
【特許文献3】特開2008−224259号公報
【非特許文献】
【0006】
【非特許文献1】大賀寿郎,山崎芳男,金田豊;音響システムとディジタル処理,コロナ社,1995
【発明の概要】
【発明が解決しようとする課題】
【0007】
ところで、前記従来の方法では、予め設定された所定の測定時間(例えば、120秒)だけ採取した音の情報と映像の情報とをコンピュータに取り込んだ後に、この取り込んだ情報を用いて音源方向の計算を行っていた。そのため、突発的な音や間欠的な音が発生した場合、測定仕損じたりすることがあり、不要なデータのみを解析してしまうなど、効率的な測定が困難であるといった問題点があった。
【0008】
本発明は、従来の問題点に鑑みてなされたもので、突発的な音や間欠的な音が発生した場合でも、音源の推定を確実に行うことのできる方法とその装置を提供することを目的とする。
【課題を解決するための手段】
【0009】
本願の請求項1に記載の発明は、複数のマイクロフォンと撮影手段とを一体に組み込んだ音・映像採取ユニットを用いて音の情報と映像の情報とを同時に採取して、この採取した音の音圧信号のデータである音圧波形データと採取した映像の画像データとを用いて音源を推定する音源の推定方法であって、前記採取した音の音圧波形データと採取した映像の画像データとをそれぞれ一時保存ファイルに保存するとともに、音源方向の測定開始の指令が発せられたときには、前記測定開始の指令が発せられた時刻から所定の遡行時間長だけ遡った時刻から予め設定された解析時間長分だけ経過した時刻までの間に前記一時保存ファイルに保存される音圧波形データと画像データとを抽出し、これらのデータをそれぞれ音ファイル及び動画ファイルとして記憶手段に保存し、この保存された音ファイルの音圧波形データを用いて、前記複数のマイクロフォンで採取した音の音圧信号間の位相差を算出して音源方向を推定した後、前記推定された音源方向と前記動画ファイルに保存されている前記音源方向の推定に用いられた時間内に撮影された画像データとを合成して、前記推定された音源方向を示す図形が描画された音源位置推定画像を作成し、この音源位置推定画像を用いて音源を推定することを特徴とする。
【0010】
請求項2に記載の発明は、請求項1に記載の音源の推定方法であって、複数のマイクロフォンと撮影手段とを一体に組み込んだ音・映像採取ユニットを用いて音の情報と映像の情報とを同時に採取する第1のステップと、前記採取した音の音圧信号と映像の信号とをA/D変換してそれぞれ音圧波形データ及び画像データとして、データを所定の期間だけ保存する第1の記憶手段に保存する第2のステップと、音源方向の測定開始の指令を発する第3のステップと、前記第1の記憶手段から音源の推定に用いる解析時間長分の音圧波形データと画像データとを抽出して、前記抽出された音圧波形データと画像データとをそれぞれ音ファイル及び動画ファイルとして第2の記憶手段に保存する第4のステップと、前記音ファイルから、音源方向の推定演算に用いる演算時間長分の音圧波形データを抽出して、前記複数のマイクロフォンで採取した音の音圧信号の位相差を算出して音源方向を推定する第5のステップと、前記動画ファイルから、前記演算の開始時刻と終了時刻との間の時刻の画像データを抽出する第6のステップと、前記第5のステップで推定された音源方向と、前記第6のステップで抽出された画像データとを合成し、前記推定された音源方向を示す図形が描画された音源位置推定画像を作成して表示する第7のステップと、前記音源位置推定画像を用いて音源を推定する第8のステップとを備え、前記第4のステップで第1の記憶手段から抽出する前記解析時間長分の音圧波形データと画像データが、前記測定開始の指令が発せられた時刻である第1の時刻よりも予め設定された遡行時間長だけ前の時刻である第2の時刻から前記第1の時刻までの間に前記第1の記憶手段に保存された音圧波形データと画像データと、前記第1の時刻から、前記第1の時刻から前記解析時間長よりも前記遡行時間長分だけ短い時間長だけ経過した第3の時刻までの間に前記第1の記憶手段に保存される音圧波形データと画像データであることを特徴とする。
【0011】
請求項3に記載の発明は、請求項2に記載の音源の推定方法であって、前記第4のステップと前記第5のステップとの間に、前記音ファイルに保存された音圧波形のデータから、音圧波形の時系列波形のグラフを作成して表示するステップと、前記表示されたグラフの任意の時刻を指定するステップとを設け、前記第5のステップでは、指定された時刻から前記演算時間長分の音圧波形データを前記音ファイルから抽出することを特徴とする。
【0012】
また、請求項4に記載の発明は、互いに交わる2つの直線上にそれぞれ所定の間隔で配置された2組のマイクロフォン対を有するマイクロフォン群と音源方向の映像を撮影する撮影手段と表示手段とを備え、前記マイクロフォン群で採取した音源から伝播する音の音圧信号と音源方向を撮影した映像信号とから、音源方向を示す図形が描画された画像を作成して表示手段に表示して音源を推定する音源の推定装置であって、前記各マイクロフォンで採取した音圧信号と撮影手段で撮影した映像信号とをそれぞれデジタル信号に変換するA/D変換器と、前記A/D変換された音圧信号を音圧波形データとし、前記A/D変換された映像信号を画像データとして所定の期間一時的に保存する第1の記憶手段と、音源方向の推定を開始するための指令信号を出力する手段と、音源の推定に用いる音圧波形データと画像データとを保存する第2の記憶手段と、前記指令信号が入力されたときに、前記第1の記憶手段から音源の推定に用いる解析時間長分の音圧波形データと画像データとを抽出して、音ファイルと動画ファイルとを作成し、これらのファイルを前記第2の記憶手段に出力する解析ファイル作成手段と、前記音ファイルから音源方向の推定演算に用いる演算時間長分の音圧波形データを抽出し、この抽出された音圧波形データを周波数解析して前記2組のマイクロフォン対を構成するマイクロフォン間のそれぞれの位相差を求め、この求められた2組のマイクロフォン対の位相差の比から音源方向を推定する音源方向推定手段と、前記動画ファイルから、前記推定演算の開始時刻と終了時刻との間の時刻における画像データを抽出する画像データ抽出手段と、前記推定された音源方向のデータと前記抽出された画像データとを合成して、前記推定された音源方向を示す図形が描画された音源位置推定画像を作成する音源位置推定画像作成手段とを備え、前記解析ファイル作成手段は、前記測定開始の指令が発せられた時刻である第1の時刻よりも予め設定された遡行時間長だけ前の時刻である第2の時刻から前記第1の時刻までの間に前記第1の記憶手段に保存された音圧波形データと画像データと、前記第1の時刻から、前記第1の時刻から前記解析時間長よりも前記遡行時間長分だけ短い時間長だけ経過した第3の時刻までの間に前記第1の記憶手段に保存される音圧波形データと画像データとを抽出して前記音ファイルと前記動画ファイルとを作成することを特徴とする。
【0013】
請求項5に記載の発明は、請求項4に記載の音源の推定装置において、前記マイクロフォン群に、前記2組のマイクロフォン対の作る平面上にない第5のマイクロフォンを追加するとともに、前記音源方向推定手段では、前記2組のマイクロフォン対を構成するマイクロフォン間の位相差と、前記第5のマイクロフォンと前記2組のマイクロフォン対を構成する4個のマイクロフォンのそれぞれとで構成される4組のマイクロフォン対を構成するマイクロフォン間の位相差とを用いて音源方向を推定することを特徴とする。
【発明の効果】
【0014】
本発明によれば、複数のマイクロフォンと撮影手段とを一体に組み込んだ音・映像採取ユニットを用いて音の情報と映像の情報とを同時に採取して、この採取した音の音圧信号のデータである音圧波形のデータと映像の画像データとをそれぞれ記憶手段の一次保存ファイルに保存するとともに、音源方向の測定開始の指令が発せられたときには、指令が発せられた時刻から所定の遡行時間長だけ遡った時刻から予め設定された解析時間長分だけ経過した時刻までの間に前記一時保存ファイルに保存される音圧波形データと画像データとを抽出し、これらのデータを音ファイル及び動画ファイルとして記憶手段に保存し、この保存された音ファイルの音圧波形データを用いて、前記複数のマイクロフォンで採取した音の音圧信号間の位相差を算出して音源方向を推定するようにしたので、突発的な音や間欠的な音が発生した場合でも、これらの音の発生源の方向を確実に推定することができる。したがって、測定の仕損じをなくすことができるとともに、不要な測定データの増加を防ぐことができるので、音源位置の推定を効率良く行うことができる。
また、音源を推定する際には、推定された音源方向と前記推定演算時間内に撮影された画像データとを合成して、推定された音源方向を示す図形が描画された音源位置推定画像を作成し、この音源位置推定画像を用いて、前記音源を推定するようにしたので、音源を確実に推定できる。
【0015】
また、請求項2に記載のステップに従って音源を推定するようにすれば、突発的な音や間欠的な音の発生源を確実に推定することができる。
また、表示する音圧レベルの時系列波形を採取音の大きさの時系列波形とすれば、伝播音の大きさに応じた音源位置の推定を行うことができる。
また、音ファイルに保存された音圧波形のデータから、音圧波形の時系列波形のグラフを作成して表示するとともに、このグラフの任意の時刻を指定し、指定された時刻から演算時間長分の音圧波形データを音ファイルから抽出して音源方向を推定することにより、音ファイルに保存された音圧波形のデータを効率良くかつ効果的に利用することができるので、音源位置の推定を効率良く行うことができる。
【0016】
また、請求項4に記載の音源の推定装置を用いることにより、突発的な音や間欠的な音の発生源を確実に推定することができる。
このとき、互いに交わる2つの直線上にそれぞれ所定の間隔で配置された2組のマイクロフォン対を構成する第1〜第4のマイクロフォンと、2組のマイクロフォン対の作る平面上にない第5のマイクロフォンとから成る音採取手段を構成し、2組のマイクロフォン対を構成するマイクロフォン間の位相差の比と、前記第1〜第5のマイクロフォン間の位相差とを用いて音源方向を推定するようにすれば、少ないマイクロフォン数で、効率良くかつ正確に水平角θと仰角φとを推定することができる。
【0017】
なお、前記発明の概要は、本発明の必要な全ての特徴を列挙したものではなく、これらの特徴群のサブコンビネーションもまた、発明となり得る。
【図面の簡単な説明】
【0018】
【図1】本実施の形態に係る音源推定システムの構成を示す機能ブロック図である。
【図2】本発明による音源の推定方法を示すフローチャートである。
【図3】遡行モードにおけるデータの取出し方法を説明するための図である。
【図4】音源位置推定画面が表示された表示画面の一例を示す図である。
【図5】音圧レベルの時系列波形のグラフが表示された表示画面の一例を示す図である。
【図6】従来のマイクロフォン対を用いた音源探査方法における各マイクロフォンの配列を示す図である。
【発明を実施するための形態】
【0019】
以下、実施の形態を通じて本発明を詳説するが、以下の実施の形態は特許請求の範囲に係る発明を限定するものでなく、また、実施の形態の中で説明される特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。
【0020】
以下、本発明の実施の形態について、図面に基づき説明する。
図1は音源推定システムの構成を示す機能ブロック図である。
音源推定システムは、音・映像採取ユニット10と制御ユニット20と音源位置推定装置30とを備える。
音・映像採取ユニット10は、音採取手段11と、映像採取手段としてのCCDカメラ(以下、カメラという)12と、マイクロフォン固定部13と、カメラ支持台14と、支柱15と、回転台16と、基台17とを備える。音採取手段11は複数のマイクロフォンM1〜M5を備える。
マイクロフォン固定部13にはマイクロフォンM1〜M5が設置され、カメラ支持台14にはカメラ12が設置され、マイクロフォン固定部13とカメラ支持台14とは、3本の支柱15によって連結されている。つまり、音採取手段11とカメラ12とは一体化されている。なお、マイクロフォンM1〜M5は、カメラ12の上部に配置される。
基台17は3脚から成る支持部材で、この基台17上に回転台16が設置されている。カメラ支持台14は回転台16の回転部材16rに搭載されている。
したがって、回転部材16rを回転させることにより、音採取手段11とカメラ12とを一体に回転させることができる。
マイクロフォンM1〜M5は、図示しない音源から伝播される音の音圧レベルをそれぞれ測定する。
【0021】
マイクロフォンM1〜M5の配置は、前記図6に示したものと同様で、4個のマイクロフォンM1〜M4を、互いに直交する2直線上にそれぞれ所定の間隔で配置された2組のマイクロフォン対(M1,M3)及びマイクロフォン対(M2,M4)を構成するように配置するとともに、第5のマイクロフォンM5を前記マイクロフォンM1〜M4の作る平面上にない位置、詳細には、マイクロフォンM1〜M4の作る正方形を底面とする四角錐の頂点の位置に配置する。これにより、更に4組のマイクロフォン対(M5, M1)〜(M5, M4)が構成される。
本例では、カメラ12の撮影方向を、前記直交する2直線の交点を通り前記2直線とほぼ45°を成す方向に設定している。したがって、音・映像採取ユニット10の向きは、図1の白抜きの矢印Dの方向となる。カメラ12は、音・映像採取ユニット10の向きに応じた映像を採取する。
【0022】
制御ユニット20は、モード切換手段21と、増幅器22と、A/D変換器23と、映像入出力手段24と、第1の記憶手段であるバッファ25と、解析時間長設定手段26と、遡行時間長設定手段27と、ファイル作成手段28とを備える。
音源位置推定装置30は、第2の記憶手段であるメモリー31と、表示手段32と、音圧波形データ取出手段33と、音源方向推定手段34と、画像データ取出手段35と、データ合成手段36とを備える。
【0023】
本例の音源推定システムは、通常モードと遡行モードの2つの測定モードを有する。
通常モードは、音源方向の推定を開始するための指令信号である測定開始信号が入力された時刻から所定の解析時間長分のデータを用いて音源推定を行う。遡行モードは、測定開始信号の入力時より所定時間遡った時刻のデータを用いて音源推定を行う。
モード切換手段21は、モード切換部21aと測定開始信号出力部21bと測定可能表示部21pと遡行有効表示部21qと測定開始用スイッチ21Sとを備える。
モード切換部21aは、測定モードを通常モードと遡行モードの何れか一方に切換えるとともに、ファイル作成手段28にバッファ25からのデータの取出方法を指示する。
測定開始信号出力部21bは、測定開始用スイッチ21Sが押されたときに、測定開始信号を出力する。
測定可能表示部21pは、LEDを点灯させるなどして、バッファ25に測定が可能なデータ数が保存されたことを測定者に視認させる。
遡行有効表示部21qは、LEDを点灯させるなどして、バッファ25に遡行分のデータ数が保存されたことを測定者に視認させる。なお、遡行モードにおいては、遡行有効表示部21qのLEDが点灯していない状態では、測定開始信号は出力されない。
【0024】
増幅器22はローパスフィルタを備え、マイクロフォンM1〜M5で採取した音の音圧信号から高周波ノイズ成分を除去するとともに、前記音圧信号を増幅してA/D変換器23に出力する。A/D変換器23は、前記音圧信号をA/D変換した音圧波形データを作成し、これを、バッファ25に出力する。
映像入出力手段24は、カメラ12で連続的に撮影された映像信号を入力し、所定時間(例えば、1/30秒)毎に撮影方向の画像データを前記バッファ25に出力する。
バッファ25は、音圧波形データと画像データとを所定の期間だけ一時的に保存する。このバッファ25は、第1のバッファ25aと第2のバッファ25bとを備えている。
第1のバッファ25aが一杯になったら、第2のバッファ25bに新たな音圧波形データと画像データとを保存する。そして、第2のバッファ25bが一杯になったら、第1のバッファ25aに保存されているデータを全て消去し、第1のバッファ25aに新たな音圧波形データと画像データとを保存する。
音圧波形データと画像データとを第1のバッファ25aもしくは第2のバッファ25bに記憶する際には、音圧波形データと画像データとを同期させて記憶するか、あるいは、音圧波形データと画像データとにそれぞれに時刻データを付けて記憶するなど、周知の方法を用いることができる。
【0025】
解析時間長設定手段26は、音圧波形データと画像データとを解析して音源を推定するための時間長である解析時間長Twを設定する。
遡行時間長設定手段27は、音源を推定するための測定開始信号が発せられた時刻である第1の時刻t0からの遡行時間長Tzを設定する。
ファイル作成手段28は、バッファ25から、第2の時刻である時刻t1=t0−Tzと第3の時刻である時刻t2=t0+(Tw−Tz)との間に前記バッファ25に保存された音圧波形データと画像データとを取出し、音圧波形データから音ファイル31aを作成し、画像データから動画ファイル31bを作成して、これらのファイル31a,31bをメモリー31に保存する。
【0026】
メモリー31は、ファイル作成手段28で作成された音ファイル31aと動画ファイル31bとを保存する。メモリー31はRAMで構成され書き換え可能である。
表示手段32は、後述する音源位置を推定するための画像である音源位置推定画像を表示する画像表示部32aと、音源方向の水平角θと音圧レベルとの関係を示す音圧レベル表示部32bとを有する表示画面32Mを備える。
音圧波形データ取出手段33は、音源方向の推定演算を行う音圧波形データ、すなわち、予め設定された解析時間長分の音圧波形データをメモリー31に保存されている音ファイル31aから取出して音源方向推定手段34に出力する。
音源方向推定手段34は、取出された音圧波形データから各マイクロフォンM1〜M5間の位相差を求め、この求められた位相差から音源方向を推定し、その推定結果をデータ合成手段36に出力する。なお、音源方向の推定の詳細については後述する。
【0027】
画像データ取出手段35は、メモリー31に保存されている動画ファイル31bから、前記解析時間の開始時刻と終了時刻との真中の時刻における画像データを取出してこれをデータ合成手段36に出力する。
データ合成手段36は、音源方向推定手段34で推定された音源方向のデータと画像データ取出手段35から出力される画像データとを合成し、画像中に音源方向を示す図形が描画された音源方向推定画像を作成して表示手段32に出力する。
【0028】
次に、音源推定システムを用いて音源方向を推定する方法について、図2のフローチャートを参照して説明する。
まず、音・映像採取ユニット10と制御ユニット20と音源位置推定装置30とを接続した後、音・映像採取ユニット10を計測点にセットする(ステップS11)。
次に、解析時間長Twと遡行時間長Tzとを設定した後(ステップS12)、測定モードを選択する(ステップS13)。
始めにステップS13で測定モードを遡行モードとした場合について説明する。
測定モードの選択後には、カメラ12の撮影方向を測定予定場所に向け、マイクロフォンM1〜M5にて音を採取し、カメラ12にて測定予定場所の映像を採取する(ステップS14)。
本例では、測定予定場所を音が間欠的に発生する噴水としたので、音・映像採取ユニット10を固定して測定した。なお、噴水の近くで測定する場合には、噴水全体が映像視野に入らなくなるので、回転台16を、例えば、3°/sec.程度のゆっくりした速度で、噴水の中央部を中心に往復させながら、音と映像とを採取するようにすればよい。回転範囲としては±60°程度が適当である。
次に、マイクロフォンM1〜M5の出力信号とカメラ12の映像信号とをそれぞれA/D変換し、音圧波形データと画像データ(以下、データという)とをバッファ25に保存する(ステップS15)。
【0029】
バッファ25に遡行時間長Tz分のデータが保存されると、遡行有効表示部21qのLEDが点灯するので、測定者はこのLEDの点灯により、遡行モードでの測定が可能か否かを判定する(ステップS16)。
遡行有効表示部21qのLEDが点灯していない場合には、バッファ25に遡行時間長Tz分のデータが保存されていない。したがって、遡行モードでの測定はできないので、遡行有効表示部21qのLEDが点灯するまでデータの保存を継続する。
遡行有効表示部21qのLEDが点灯した場合には、遡行モードでの測定が可能になるので、いつでも測定開始信号を出力できる。
【0030】
次に、測定開始信号が出力されているか否かを判定する(ステップS17)。測定開始信号が出力されていない場合には、データの保存を継続する。
測定開始信号が出力された後も、マイクロフォンM1〜M5の出力信号とカメラ12の映像信号とをそれぞれ音圧波形データと画像データとしてバッファ25に保存する操作を継続する(ステップS18)。
そして、バッファ25に解析時間長Tw分のデータが保存されているか否かを、測定可能表示部21pのLEDの点灯により判定する(ステップS19)。
バッファ25に解析時間長Tw分のデータが保存されていないときには、データの保存を継続する。
バッファ25に解析時間長Tw分のデータが保存された場合には、測定可能表示部21pのLEDが点灯するので、バッファ25からデータを取出して音ファイル31aと動画ファイル31bとを作成し、これらのファイル31a,31bをメモリー31に保存する(ステップS20)。
ステップS20において、バッファ25から取出されるデータは、図3に示すように、第2の時刻t1=t0−Tzから測定開始時刻である第1の時刻t0までの間にバッファ25に保存されたデータである遡行データDzと、第1の時刻t0から第3の時刻t2=t0+(Tw−Tz)までの間に前記バッファ25に保存されたデータである残測定データDrとにより構成される。すなわち、測定開始信号が出力されてから、バッファ25に解析時間長Tw分のデータが保存されるまでの待ち時間は(Tw−Tz)である。
【0031】
次に、音ファイルから、予め設定された演算時間長Tcの音圧波形データを抽出して、音源方向の推定を行う(ステップS21)。
音源方向の推定は、音圧波形データをFFTにて周波数解析し、各周波数毎にマイクロフォンM1〜M5間のそれぞれの位相差を求め、この求められた位相差から各周波数毎に音源方向を推定する。なお、本例では、位相差に代えて、位相差に比例する物理量である到達時間差を用いて水平角θ及び仰角φを求めている。
このステップS21の水平角θ及び仰角φの計算方法については後述する。
【0032】
次に、演算時間の中心時刻tm、すなわち、演算開始時刻tcから演算時間長Tcの半分の長さだけ過ぎた時刻tm=tc+(Tc/2)に位置する画像データGcを動画ファイルから抽出する(ステップS22)。
そして、前記計算された周波数毎の音源方向のデータ(θf,φf)と前記画像データGcとを合成し、この合成された画像である音源位置推定画像を表示手段32の表示画面32Mに設けられた画像表示部32aに音源位置推定画面として表示する(ステップS23)。
図4はその一例を示す図で、画像表示部32aには、前記画像データGcの上に、音源方向を表す図形(網目模様の丸印)37が描画された音源位置推定画面38が表示される。音源位置推定画面38の横軸は水平角θfで、縦軸は仰角φfである。また、丸の大きさは音圧レベルを表す。
なお、推定された音源方向を、予め設定した周波数帯域毎に表示することも可能である。この場合には、周波数帯域毎に網目模様の丸印37の色を設定すればよい。
また、音圧レベル表示部32bには、横軸を水平角θ(deg.)としたときの音圧レベル(dB)を表示した音圧レベル表示画面39が表示される。
最後に、音源位置推定画面38から音源を推定する(ステップS24)。音源位置推定画面38において、音源方向を表す図形37が描画されている箇所に映っている映像が推定される音源の映像である。
【0033】
ステップS13において、通常モードが選択された場合には、ステップS25に進んで、カメラ12の撮影方向を測定予定場所に向け、マイクロフォンM1〜M5にて音を採取し、カメラ12にて測定予定場所の映像を採取するとともに、マイクロフォンM1〜M5の出力信号とカメラ12の映像信号とをそれぞれA/D変換し、音圧波形データと画像データとをバッファ25に保存する。
次に、測定開始信号が出力されているか否かを判定する(ステップS26)。測定開始信号が出力されていない場合には、データの保存を継続する。
測定開始信号が出力された後も、マイクロフォンM1〜M5の出力信号とカメラ12の映像信号とをそれぞれ音圧波形データと画像データとしてバッファ25に保存する操作を継続する(ステップS27)。
そして、バッファ25に解析時間長Tw分のデータが保存されているか否かを、測定可能表示部21pのLEDの点灯により判定する(ステップS28)。
バッファ25に解析時間長Tw分のデータが保存されていないときには、データの保存を継続する。
バッファ25に解析時間長Tw分のデータが保存された場合には、測定可能表示部21pのLEDが点灯するので、バッファ25からデータを取出して音ファイル31aと動画ファイル31bとを作成し、これらのファイル31a,31bをメモリー31に保存する(ステップS29)。
ステップS29において、バッファ25から取出されるデータは、測定開始時刻t0から、解析時間長Tw分経過した時刻tw=t0+Twまでの間に前記バッファ25に保存されたデータである。
ステップS29以降に行う、音源方向の推定、画像データの抽出、音源位置推定画面の作成と表示、及び、音源の推定ついての処理ステップは、通常モードも遡行モードも同じであるので、音ファイル31aと動画ファイル31bとをメモリー31に保存した後には、ステップS21に進み、ステップS21からステップS24までの処理を行って音源を推定する。
【0034】
ステップS21における水平角θ及び仰角φの計算方法は以下の通りである。
各マイクロフォン対(Mi, Mj)のマイクロフォンMiとマイクロフォンMjとの間の到達時間差をDijとすると、音の入射方向である水平角θと仰角φとは以下の式(1),(2)で表せるので、各マイクロフォンM1〜M5の出力信号をFFTを用いて周波数解析し、対象となる周波数fにおける各マイクロフォンM,M間の到達時間差Dijを算出することにより、前記水平角θ及び仰角φを求めることができる。
【数1】

すなわち、互いに直交する2直線上にそれぞれ所定の間隔で配置された2組のマイクロフォン対(M1,M3)及びマイクロフォン対(M2,M4)を構成するマイクロフォンM1,M3に入力する音圧信号の到達時間差D13と、前記マイクロフォン対(M2,M4)を構成するマイクロフォンM2,M4に入力する音圧信号の到達時間差D24との比から、計測点と音源位置との水平角θを推定し、前記到達時間差D13,D24と、前記第5のマイクロフォンM5と他のマイクロフォンM1〜M4との到達時間差D5j(j=1〜4)とから計測点と音源位置との成す仰角φを推定する。
【0035】
なお、前記到達時間差Dijは、2つのマイクロフォン対(M,M)に入力される信号のクロススペクトルPij(f)を求め、更に、対象とする前記周波数fの位相角情報Ψ(rad)を用いて、以下の式(3)により算出される。
【数2】

音源方向の推定結果は、所定時間毎に記憶された撮影方向の画像データ毎に行う。
【0036】
このように、本実施の形態では、複数のマイクロフォンM1〜M5とカメラ12とを一体化した音・映像採取ユニット10を用いて音と映像とを同時に採取した後A/D変換して、バッファ25に一時保存しておき、制御ユニット20から測定開始信号の指令が発せられたときには、指令が発せられた第1の時刻t0から所定の遡行時間長Tz分だけ遡った第2の時刻t1=t0−Tzと第3の時刻である時刻t2=t0+(Tw−Tz)との間に前記バッファ25に保存された音圧波形データと画像データとを取出し、音圧波形データから音ファイル31aを作成し、画像データから動画ファイル31bを作成して、これらのファイル31a,31bをメモリー31に保存し、この保存された音ファイル31aの音圧波形データを用いて、複数のマイクロフォンM1〜M5で採取した音の音圧信号間の位相差を算出して音源方向である水平角θと仰角φとを推定するようにしたので、突発的な音や間欠的な音が発生した場合でも、これらの音の発生源の方向を確実に推定することができる。したがって、測定の仕損じをなくすことができる。
また、音源を推定する際には、推定された音源方向(θ,φ)と演算時間長Tc内に撮影された画像データGcとを合成して、推定された音源方向を示す図形37が描画された音源位置推定画面38を表示して、前記音源を推定するようにしたので、音源を確実に推定することができる。
【0037】
なお、前記実施の形態では、音ファイルの先頭から、音源方向の推定を行ったが、前記音ファイルから音圧波形データを呼び出し、音圧レベルの時系列波形のグラフを作成し、このグラフを用いて音ファイル抽出する演算時間長Tcの音圧波形データの時間位置を特定するようにしてもよい。
図5は音圧レベルの時系列波形のグラフの一例を示す図で、音圧レベルの時系列波形のグラフを表示画面32Mに表示する場合には、音圧レベル表示画面39が表示される音圧レベル表示部32bに、音圧レベルの時系列波形のグラフを表示する。グラフの横軸は時間(秒)で、縦軸は音圧レベル(dB)である。この音圧レベルの時系列波形のグラフ上の特定の点(ここでは、測定後3秒のところにあるピーク)を指定することで、音源方向の解析を行う時間位置を指定することができる。
音圧レベルの時系列波形のグラフとしては、採取音の大きさ、すなわち、全周波数の音圧レベルの時間変化を示すグラフであってもよいし、予め設定した周波数帯域における音圧レベルの時間変化を示すグラフであってもよい。
図5では、水が噴き上る毎に音圧レベルが増加しているので、グラフ上のピークを指定して音源方向を推定することで、その指定されたピークが噴水のどの部分から発生した音であるかを推定することができる。
【0038】
また、前記例では、5本のマイクロフォンM1〜M5を用いて、計測点と音源位置との成す水平角θと仰角φとを推定したが、音源位置が水平角θだけで十分な場合には、マイクロフォンM5を省略して、互いに交わる2つの直線上にそれぞれ所定の間隔で配置された2組のマイクロフォン対(M1,M3),(M2,M4)のみを用いればよい。
【0039】
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は前記実施の形態に記載の範囲には限定されない。前記実施の形態に、多様な変更または改良を加えることが可能であることが当業者にも明らかである。そのような変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲から明らかである。
【産業上の利用可能性】
【0040】
以上説明したように、本発明によれば、突発的な音や間欠的な音が発生した場合でも、音源の推定を確実に行うことができるので、測定の仕損じをなくすことができ、音源の推定を効率良く行うことができる。
【符号の説明】
【0041】
10 音・映像採取ユニット、11 音採取手段、M1〜M5 マイクロフォン、
12 CCDカメラ、13 マイクロフォン固定部、14 カメラ支持台、15 支柱、16 回転台、17 基台、20 制御ユニット、21 モード切換手段、
21a モード切換部、21b 測定開始信号出力部、21p 測定可能表示部、
21q 遡行有効表示部、22 増幅器、23 A/D変換器、24 映像入出力手段、25 バッファ、25a 第1のバッファ、25b 第2のバッファ、
26 解析時間長設定手段、27 遡行時間長設定手段、28 ファイル作成手段、
30 音源位置推定装置、31 メモリー、31a 音ファイル、
31b 動画ファイル、32 表示手段、32M 表示画面、32a 画像表示部、
32b 音圧レベル表示部、33 音圧波形データ取出手段、
34 音源方向推定手段、35 画像データ取出手段、36 データ合成手段、
37 音源方向を表す図形、38 音源位置推定画面、39 音圧レベル表示画面。

【特許請求の範囲】
【請求項1】
複数のマイクロフォンと撮影手段とを一体に組み込んだ音・映像採取ユニットを用いて音の情報と映像の情報とを同時に採取して、この採取した音の音圧信号のデータである音圧波形データと採取した映像の画像データとをそれぞれ一時保存ファイルに保存するとともに、音源方向の測定開始の指令が発せられたときには、前記測定開始の指令が発せられた時刻から所定の遡行時間長だけ遡った時刻から予め設定された解析時間長分だけ経過した時刻までの間に前記一時保存ファイルに保存される音圧波形データと画像データとを抽出し、これらのデータをそれぞれ音ファイル及び動画ファイルとして記憶手段に保存し、この保存された音ファイルの音圧波形データを用いて、前記複数のマイクロフォンで採取した音の音圧信号間の位相差を算出して音源方向を推定した後、前記推定された音源方向と前記動画ファイルに保存されている前記音源方向の推定に用いられた時間内に撮影された画像データとを合成して、前記推定された音源方向を示す図形が描画された音源位置推定画像を作成し、この音源位置推定画像を用いて音源を推定することを特徴とする音源の推定方法。
【請求項2】
複数のマイクロフォンと撮影手段とを一体に組み込んだ音・映像採取ユニットを用いて音の情報と映像の情報とを同時に採取する第1のステップと、
前記採取した音の音圧信号と映像の信号とをA/D変換してそれぞれ音圧波形データ及び画像データとして、データを所定の期間だけ保存する第1の記憶手段に保存する第2のステップと、
音源方向の測定開始の指令を発する第3のステップと、
前記第1の記憶手段から音源の推定に用いる解析時間長分の音圧波形データと画像データとを抽出して、前記抽出された音圧波形データと画像データとをそれぞれ音ファイル及び動画ファイルとして第2の記憶手段に保存する第4のステップと、
前記音ファイルから、音源方向の推定演算に用いる演算時間長分の音圧波形データを抽出して、前記複数のマイクロフォンで採取した音の音圧信号の位相差を算出して音源方向を推定する第5のステップと、
前記動画ファイルから、前記演算の開始時刻と終了時刻との間の時刻の画像データを抽出する第6のステップと、
前記第5のステップで推定された音源方向と、前記第6のステップで抽出された画像データとを合成し、前記推定された音源方向を示す図形が描画された音源位置推定画像を作成して表示する第7のステップと、
前記音源位置推定画像を用いて音源を推定する第8のステップとを備え、
前記第4のステップで第1の記憶手段から抽出する前記解析時間長分の音圧波形データと画像データが、前記測定開始の指令が発せられた時刻である第1の時刻よりも予め設定された遡行時間長だけ前の時刻である第2の時刻から前記第1の時刻までの間に前記第1の記憶手段に保存された音圧波形データと画像データと、前記第1の時刻から、前記第1の時刻から前記解析時間長よりも前記遡行時間長分だけ短い時間長だけ経過した第3の時刻までの間に前記第1の記憶手段に保存される音圧波形データと画像データであることを特徴とする請求項1に記載の音源の推定方法。
【請求項3】
前記第4のステップと前記第5のステップとの間に、前記音ファイルに保存された音圧波形のデータから、音圧波形の時系列波形のグラフを作成して表示するステップと、
前記表示されたグラフの任意の時刻を指定するステップとを設け、
前記第5のステップでは、指定された時刻から前記演算時間長分の音圧波形データを前記音ファイルから抽出することを特徴とする請求項2に記載の音源の推定方法。
【請求項4】
互いに交わる2つの直線上にそれぞれ所定の間隔で配置された2組のマイクロフォン対を有するマイクロフォン群と音源方向の映像を撮影する撮影手段と表示手段とを備え、前記マイクロフォン群で採取した音源から伝播する音の音圧信号と音源方向を撮影した映像信号とから、音源方向を示す図形が描画された画像を作成して表示手段に表示して音源を推定する音源の推定装置であって、
前記各マイクロフォンで採取した音圧信号と撮影手段で撮影した映像信号とをそれぞれデジタル信号に変換するA/D変換器と、
前記A/D変換された音圧信号を音圧波形データとし、前記A/D変換された映像信号を画像データとして所定の期間一時的に保存する第1の記憶手段と、
音源方向の推定を開始するための指令信号を出力する手段と、
音源の推定に用いる音圧波形データと画像データとを保存する第2の記憶手段と、
前記指令信号が入力されたときに、前記第1の記憶手段から音源の推定に用いる解析時間長分の音圧波形データと画像データとを抽出して、音ファイルと動画ファイルとを作成し、これらのファイルを前記第2の記憶手段に出力する解析ファイル作成手段と、
前記音ファイルから音源方向の推定演算に用いる演算時間長分の音圧波形データを抽出し、この抽出された音圧波形データを周波数解析して前記2組のマイクロフォン対を構成するマイクロフォン間のそれぞれの位相差を求め、この求められた2組のマイクロフォン対の位相差の比から音源方向を推定する音源方向推定手段と、
前記動画ファイルから、前記推定演算の開始時刻と終了時刻との間の時刻における画像データを抽出する画像データ抽出手段と、
前記推定された音源方向のデータと前記抽出された画像データとを合成して、前記推定された音源方向を示す図形が描画された音源位置推定画像を作成する音源位置推定画像作成手段とを備え、
前記解析ファイル作成手段は、前記測定開始の指令が発せられた時刻である第1の時刻よりも予め設定された遡行時間長だけ前の時刻である第2の時刻から前記第1の時刻までの間に前記第1の記憶手段に保存された音圧波形データと画像データと、前記第1の時刻から、前記第1の時刻から前記解析時間長よりも前記遡行時間長分だけ短い時間長だけ経過した第3の時刻までの間に前記第1の記憶手段に保存される音圧波形データと画像データとを抽出して前記音ファイルと前記動画ファイルとを作成することを特徴とする音源の推定装置。
【請求項5】
前記マイクロフォン群に、前記2組のマイクロフォン対の作る平面上にない第5のマイクロフォンを追加するとともに、前記音源方向推定手段では、前記2組のマイクロフォン対を構成するマイクロフォン間の位相差と、前記第5のマイクロフォンと前記2組のマイクロフォン対を構成する4個のマイクロフォンのそれぞれとで構成される4組のマイクロフォン対を構成するマイクロフォン間の位相差とを用いて音源方向を推定することを特徴とする請求項4に記載の音源の推定装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2010−203800(P2010−203800A)
【公開日】平成22年9月16日(2010.9.16)
【国際特許分類】
【出願番号】特願2009−46835(P2009−46835)
【出願日】平成21年2月27日(2009.2.27)
【出願人】(000001317)株式会社熊谷組 (551)
【出願人】(000005326)本田技研工業株式会社 (23,863)
【Fターム(参考)】