説明

音源信号抽出装置、方法及びプログラム

【課題】従来よりも小さい計算コストで音源信号を抽出する音源信号抽出技術を提供する。
【解決手段】周波数領域変換部が、二次元平面上又は一次元直線上に配置されたマイクアレーで収音した信号を周波数領域信号に変換する。窓関数部が、周波数領域信号に窓関数を乗じて窓関数後周波数領域信号を生成する。フィルタ部が、不均質波を無視した逆伝播演算に基づくフィルタを用いて、窓関数後周波数領域信号に対してフィルタ処理を行う。時間領域変換部が、フィルタ処理を行った後の信号を逆フーリエ変換により時間領域信号に変換する。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は、ある音場に設置されたマイクアレーで音信号を収音し、音源信号等を高いSN比で抽出する技術に関する。
【背景技術】
【0002】
非特許文献1には、多数のマイクアレーで収音された音を遠隔地で多数のスピーカアレーで再現するために、マイクアレー平面と平行な平面上の音圧勾配分布を推定する技術が記載されている。この非特許文献1に記載された技術により、マイクアレー平面と平行な平面であって音源位置を含む平面の音圧勾配分布を取得することで、音源信号を抽出することができる。
【先行技術文献】
【非特許文献】
【0003】
【非特許文献1】Shoichi Koyama, 他4名, ”Inverse Wave Propagation in Wave Field Synthesis”, AES 40th International Conference, Tokyo, Japan, October 8-10, pp.2-10
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、音源位置を含む平面全体の音圧勾配分布を取得するには、大きな計算コストを要するという問題があった。
【0005】
この発明の課題は、従来よりも小さい計算コストで音源信号を抽出する音源信号抽出装置、方法及びプログラムを提供することである。
【課題を解決するための手段】
【0006】
上記の課題を解決するために、不均質波を無視した逆伝播演算に基づくフィルタを用いて、音源位置のみの音圧を推定することにより音源信号を抽出する。
【発明の効果】
【0007】
平面全体の音圧勾配分布ではなく、音源位置のみの音圧を推定することにより、従来よりも小さい計算コストで音源信号を抽出することができる。
【図面の簡単な説明】
【0008】
【図1】第一実施形態の音源信号抽出装置の例の機能ブロック図。
【図2】第一実施形態の音源信号抽出装置のマイクアレーの配置の例を説明するための図。
【図3】第二実施形態の音源信号抽出装置の例の機能ブロック図。
【図4】第二実施形態の音源信号抽出装置のマイクアレーの配置の例を説明するための図。
【図5】音源信号抽出方法の例を示す流れ図。
【図6】音源信号の例を示す図。
【図7】マイクロホンで収音した音信号を示す図。
【図8】第二実施形態の音源信号抽出方法で抽出した音源信号を示す図。
【図9】従来の音源信号抽出方法で抽出した音源信号を示す図。
【発明を実施するための形態】
【0009】
以下、図面を参照してこの発明の一実施形態を説明する。
【0010】
[第一実施形態]
第一実施形態の音源信号抽出装置及び方法は、図2に示すように、z=zの位置に配置されたN×N個の無指向性のマイクロホンで構成される二次元マイクアレーM1−1,M2−1,…,MN−Nで収音した音信号を用いて、以下に説明する方法で、(x,y,z)に位置する音源Sが発する音の信号を抽出する。
【0011】
,Nは正の整数である。マイクアレーM1−1,M2−1,…,MN−Nを構成するマイクロホンの数は基本的には任意である。もっとも、空間的な音圧分布を取得できるだけの数のマイクロホンがあることが望ましい。マイクアレーM1−1,M2−1,…,MN−Nを構成するマイクロホンの各間隔は、収音する音信号の半波長以下の長さに設定することが望ましい。
【0012】
z=zの位置に配置された二次元マイクアレーM1−1,M2−1,…,MN−Nを構成する各マイクの位置をrij=(x,y,z)と表わすことにする。音源Sの位置(x,y,z)及び二次元マイクアレーM1−1,M2−1,…,MN−Nを構成する各マイクロホンの位置(x,y,z)は既知であるとする。
【0013】
第一実施形態の音源信号抽出装置は、図1に示すように周波数領域変換部1、窓関数部2、フィルタ部3、時間領域変換部4を例えば備える。音源信号抽出装置は、図5に例示された音源信号抽出方法の各ステップの処理を行う。
【0014】
二次元マイクアレーM1−1,M2−1,…,MN−Nは、音源Sで発せられた音を収音して時間領域の音信号を生成する。生成された音信号は、周波数領域変換部1に送られる。r=(x,y,z)のマイクMi−jで収音された時間領域の時刻tの音信号をf(i,j,t)と表記する。
【0015】
周波数領域変換部1は、マイクアレーM1−1,M2−1,…,MN−Nで収音された音信号f(i,j,t)をフーリエ変換により周波数領域信号F(i,j,ω)に変換する(ステップS1)。生成された周波数領域信号F(i,j,ω)は、窓関数部2に送られる。ωは周波数である。例えば、短時間離散フーリエ変換により周波数領域信号F(i,j,ω)が生成される。もちろん、他の既存の方法により周波数領域信号F(i,j,ω)を生成してもよい。
【0016】
窓関数部2は、周波数領域信号F(i,j,ω)に窓関数を乗じて窓関数後周波数領域信号F(j,j,ω)を生成する(ステップS2)。窓関数後周波数領域信号F(j,j,ω)は、フィルタ部3に送られる。窓関数として、以下の式より定義されるいわゆるターキー(Turkey)窓関数w(i,j)を例えば用いる。Ntprは、テーパーを適用する点数であり1以上N,N以下の整数である。なお、後述するように、窓関数部2はなくてもよい。
【0017】
【数1】

【0018】
フィルタ部3は、下式で定義されるフィルタ処理を窓関数後周波数領域信号F(i,j,ω)に対して行い(ステップS3)、音源位置の音圧を取得することで周波数領域の音源信号であるS(ω)を抽出する。フィルタ処理を行った後の信号S(ω)は、時間領域変換部4に送られる。kは波数であり、cを音速としてk=ω/cである。下式において、波数kの左にあるjは虚数単位を意味する。H(i,j,ω)は、フィルタである。
【0019】
【数2】

【0020】
時間領域変換部4は、フィルタ処理を行った後の信号S(ω)を逆フーリエ変換により時間領域信号s(t)に変換する(ステップS4)。逆フーリエ変換は短時間離散逆フーリエ変換等の既存の方法を用いればよい。この時間領域信号s(t)が、音源Sの位置における信号となる。
【0021】
[第二実施形態]
第一実施形態の音源信号抽出装置及び方法は二次元マイクアレーを用いるのに対して、第二実施形態の音源信号抽出装置及び方法は一次元マイクアレーを用いる。これにより、マイク数、すなわちチャネル数を少なくすることができるため、実装が比較的容易となる。
【0022】
第二実施形態の音源信号抽出装置及び方法は、図4に示す第一の部屋のy=y,z=zの位置に配置されたN個の無指向性のマイクで構成されるマイクアレーM1−1,M2−1,…,MN−1で収音した音信号を用いて、(x,y,z)に位置する音源Sが発する音の信号を抽出する。
【0023】
は正の整数である。マイクアレーM1−1,M2−1,…,MN−1を構成するマイクロホンの数は基本的には任意である。もっとも、空間的な音圧分布を取得できるだけの数のマイクロホンがあることが望ましい。マイクアレーM1−1,M2−1,…,MN−1を構成するマイクロホンの各間隔は、収音する音信号の半波長以下の長さに設定することが望ましい。
【0024】
z=z,y=yの位置に配置されたマイクアレーM1−1,M2−1,…,MN−1を構成する各マイクの位置をr=(x,y,z)と表わすことにする。音源Sの位置(x,y,z)及びマイクアレーM1−1,M2−1,…,MN−1を構成する各マイクロホンの位置(x,y,z)は既知であるとする。
【0025】
第二実施形態の音源信号抽出装置は、図3に示すように周波数領域変換部1、窓関数部2、フィルタ部3、時間領域変換部4を例えば備える。音源信号抽出装置は、図5に例示された音源信号抽出方法の各ステップの処理を行う。
【0026】
マイクアレーM1−1,M2−1,…,MN−1は、音源Sで発せられた音を収音して時間領域の音信号を生成する。生成された音信号は、周波数領域変換部1に送られる。r=(x,y,z)のマイクMi−1で収音された時間領域の時刻tの音信号をf(i,t)と表記する。
【0027】
周波数領域変換部1は、マイクアレーM1−1,M2−1,…,MN−1で収音された音信号f(i,t)をフーリエ変換により周波数領域信号F(i,ω)に変換する(ステップS1)。生成された周波数領域信号F(i,ω)は、窓関数部2に送られる。ωは周波数である。例えば、短時間離散フーリエ変換により周波数領域信号F(i,ω)が生成される。もちろん、他の既存の方法により周波数領域信号F(i,ω)を生成してもよい。
【0028】
窓関数部2は、周波数領域信号F(i,ω)に窓関数を乗じて窓関数後周波数領域信号F(i,ω)を生成する(ステップS2)。窓関数後周波数領域信号F(i,ω)は、フィルタ部3に送られる。窓関数として、以下の式より定義されるいわゆるターキー(Turkey)窓関数w(i)を例えば用いる。Ntprは、テーパーを適用する点数であり1以上N以下の整数である。
【0029】
【数3】

【0030】
フィルタ部3は、下式で定義されるフィルタ処理を窓関数後周波数領域信号F(i,ω)に対して行い(ステップS3)、音源位置の音圧を取得することで周波数領域の音源信号であるS(ω)を抽出する。フィルタ処理を行った後の信号S(ω)は、時間領域変換部4に送られる。kは波数であり、cを音速としてk=ω/cである。下式において、波数kの左にあるjは虚数単位を意味する。H(i,ω)は、フィルタである。
【0031】
【数4】

【0032】
上記式において、H(1)(・)は、第一種ハンケル関数である。第一種ハンケル関数H(1)(x)は、第一種ベッセル関数J(x)及び第二種ベッセル関数Y(x)を用いて以下のように定義される。
【0033】
【数5】

【0034】
時間領域変換部4は、フィルタ処理を行った後の信号S(ω)を逆フーリエ変換により時間領域信号s(t)に変換する(ステップS4)。逆フーリエ変換は短時間離散逆フーリエ変換等の既存の方法を用いればよい。この時間領域信号s(t)が、音源Sの位置における信号となる。
【0035】
[理論的背景]
以下、第一実施形態、第二実施形態においてフィルタ部3の処理がそれぞれ式(1)、式(2)となる理由を説明する。以下では、表記の簡略化のためにωを記載しない場合がある。
【0036】
レイリー方程式に基づいて、図2においてz=zの平面上の位置r0=(x,y,z)の音圧P(r)を用いて音源位置rの音圧P(r)を推定すると以下のようになる。
【0037】
【数6】

【0038】
ここで、κ−1は、核関数である。
【0039】
【数7】

【0040】
、kは、それぞれx方向の波数、y方向の波数である。核関数κ−1は、均質波に対応する成分κ−1と不均質波に対応する成分κ−1との和に分解することが可能である。一般に音場の再生に寄与しないと考えられる不均質波に対応する成分を無視すると、核関数κ−1は、以下のように近似できる。
【0041】
【数8】

【0042】
式(4)の右辺を式(3)に代入すると以下のようになる。
【0043】
【数9】

【0044】
上記式のP(r)が第一実施形態のS(ω)に対応し、P(r)がF(i,j,ω)に対応する。上記式を離散的に表現したものが式(1)である。
【0045】
直線上にマイクロホンが配置されている第二実施形態においても、上記と同様に核関数κ−1の不均質波に対応する成分κ−1を無視することにより、式(2)が得られる。
【0046】
[シミュレーション結果]
4cm間隔で直線状に96ch配置された直線上のマイクアレーの中心から2mの位置に一般的な密閉型スピーカを置き、第二実施形態の音源信号抽出方法によって音源信号を抽出した結果を示す。スピーカから再生した音源信号は、図6のような10秒間の音声(女声+男声)である。
【0047】
このとき,音源から最も近い距離にあるマイクによる収音信号は、図7のようになった。この信号と原音声のSN比は、5.55dBである。SN比の計算に際しては、相互相関を用いて時間差を補正し、最小二乗法によって誤差が最小になるように振幅を補正した。
【0048】
図8が提案法によって抽出した音源信号である。音源位置は既知としている。このときのSN比は20.07dBとなった。
【0049】
図9は、マイクアレー信号に時間差を与え和をとる従来の焦点形成による結果である。この際、SN比最大化の観点から焦点位置までの距離で信号を割る処理を加えている。このときのSN比は5.43dBであった。
【0050】
このように、音源位置の音圧を推定することにより、従来よりも高いSN比で音源信号を抽出することができる。
【0051】
[変形例等]
窓関数部2はなくてもよい。この場合、フィルタ部3は、窓関数後周波数領域信号F(i,j,ω)又はF(i,ω)ではなく周波数領域信号F(i,j,ω)又はF(i,ω)に対して、窓関数部2がある場合と同様のフィルタ処理を行う。この場合、第一実施形態のフィルタ部3は、具体的には以下の式により定義されるフィルタ処理を行う。
【0052】
【数10】

【0053】
また、この場合、第二実施形態のフィルタ部3は、具体的には以下の式により定義されるフィルタ処理を行う。
【0054】
【数11】



【0055】
音源信号抽出装置は、コンピュータによって実現することができる。この場合、この装置の各部の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、この装置における各部がコンピュータ上で実現される。
【0056】
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、これらの装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
【0057】
この発明は、上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。
【符号の説明】
【0058】
1 周波数領域変換部
2 窓関数部
3 フィルタ部
4 時間領域変換部

【特許請求の範囲】
【請求項1】
(x,y,z)に位置する音源から発せられた音をマイクアレーで収音することにより得られた音信号をフーリエ変換により周波数領域信号に変換する周波数領域変換部と、
,Nを正の整数とし、上記マイクアレーはz=zの二次元平面上に配置されたN×N個のマイクロホンで構成されており、x方向にi番目でありy方向にj番目のマイクロホンの位置を(x,y,z)と表記し、ωを周波数、cを音速、k=ω/cを波数、H(i,j,ω)をフィルタ、(x,y,z)に位置するマイクロホンに対応する周波数領域信号をF(i,j,ω)として、
【数12】


上記式で定義されるフィルタ処理を上記周波数領域信号F(i,j,ω)に対して行うフィルタ部と、
上記フィルタ処理を行った後の信号を逆フーリエ変換により時間領域信号に変換する時間領域変換部と、
を含む音源信号抽出装置。
【請求項2】
請求項1の音源信号抽出装置において、
上記周波数領域信号に窓関数を乗じて窓関数後周波数領域信号を生成する窓関数部を更に含み、
上記フィルタ部は、上記(x,y,z)に位置するマイクロホンに対応する窓関数後周波数領域信号をF(i,j,ω)として、
【数13】


上記式で定義されるフィルタ処理を上記周波数領域信号F(i,j,ω)に対して行うことを特徴とする、
音源信号抽出装置。
【請求項3】
(x,y,z)に位置する音源から発せられた音をマイクアレーで収音することにより得られた音信号をフーリエ変換により周波数領域信号に変換する周波数領域変換部と、
を正の整数とし、上記マイクアレーは(z,y)=(z,y)の直線上に配置されたN個のマイクロホンで構成されており、x方向にi番目のマイクロホンの位置を(x,y,z)と表記し、ωを周波数、cを音速、k=ω/cを波数、H(i,ω)をフィルタ、(x,y,z)に位置するマイクロホンに対応する周波数領域信号をF(i,ω)、H(1)(・)を第一種ハンケル関数として、
【数14】


上記式で定義されるフィルタ処理を上記周波数領域信号F(i,ω)に対して行うフィルタ部と、
上記フィルタ処理を行った後の信号を逆フーリエ変換により時間領域信号に変換する時間領域変換部と、
を含む音源信号抽出装置。
【請求項4】
請求項3の音源信号抽出装置において、
上記周波数領域信号に窓関数を乗じて窓関数後周波数領域信号を生成する窓関数部を更に含み、
上記フィルタ部は、上記(x,y,z)に位置するマイクロホンに対応する窓関数後周波数領域信号をF(i,ω)として、
【数15】


上記式で定義されるフィルタ処理を上記周波数領域信号F(i,j,ω)に対して行うことを特徴とする、
音源信号抽出装置。
【請求項5】
周波数領域変換部が、(x,y,z)に位置する音源から発せられた音をマイクアレーで収音することにより得られた音信号をフーリエ変換により周波数領域信号に変換する周波数領域変換ステップと、
フィルタ部が、N,Nを正の整数とし、上記マイクアレーはz=zの二次元平面上に配置されたN×N個のマイクロホンで構成されており、x方向にi番目でありy方向にj番目のマイクロホンの位置を(x,y,z)と表記し、ωを周波数、cを音速、k=ω/cを波数、H(i,j,ω)をフィルタ、(x,y,z)に位置するマイクロホンに対応する周波数領域信号をF(i,j,ω)として、
【数16】


上記式で定義されるフィルタ処理を上記周波数領域信号F(i,j,ω)に対して行うフィルタステップと、
時間領域変換部が、上記フィルタ処理を行った後の信号を逆フーリエ変換により時間領域信号に変換する時間領域変換ステップと、
を含む音源信号抽出方法。
【請求項6】
周波数領域変換部が、(x,y,z)に位置する音源から発せられた音をマイクアレーで収音することにより得られた音信号をフーリエ変換により周波数領域信号に変換する周波数領域変換ステップと、
フィルタ部が、Nを正の整数とし、上記マイクアレーは(z,y)=(z,y)の直線上に配置されたN個のマイクロホンで構成されており、x方向にi番目のマイクロホンの位置を(x,y,z)と表記し、ωを周波数、cを音速、k=ω/cを波数、H(i,ω)をフィルタ、(x,y,z)に位置するマイクロホンに対応する周波数領域信号をF(i,ω)、H(1)(・)を第一種ハンケル関数として、
【数17】


上記式で定義されるフィルタ処理を上記周波数領域信号F(i,ω)に対して行うフィルタステップと、
時間領域変換部が、上記フィルタ処理を行った後の信号を逆フーリエ変換により時間領域信号に変換する時間領域変換ステップと、
を含む音源信号抽出方法。
【請求項7】
請求項1から4に記載された音源信号抽出装置の各部としてコンピュータを機能させるための音源信号抽出プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate