説明

残響除去方法、残響除去装置、プログラム

【課題】ロバストにブラインド残響しノイズの増幅を抑える残響除去方法を提供する。
【解決方法】Nチャネル(N≧2)の収音信号間の相関関数からL×L相関行列(Lは逆フィルタの1チャネルあたりのタップ数)を生成し、当該相関行列からNL×NL多チャネル相関行列を算出する多チャネル相関行列算出ステップと、多チャネル相関行列を特異値分解して特異値を出力する特異値分解サブステップと、特異値の減衰傾向に基づいて信号部分空間の次元を推定する信号部分空間次元推定サブステップと、信号部分空間の次元に基づいて信号部分空間成分のみからなる多チャネル相関行列の疑似逆行列を推定する疑似逆行列推定サブステップと、疑似逆行列に基づいて逆フィルタ係数ベクトルを推定する逆フィルタ係数推定サブステップと、逆フィルタ係数ベクトルを各チャネルのフィルタ係数ベクトルに分解しNチャネルの各収音信号に適用する逆フィルタステップとを有する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は残響とノイズを含む多チャネル収音信号から音源の発する本来の信号を抽出する残響除去方法、残響除去装置、プログラムに関する。
【背景技術】
【0002】
マイクロホンで音声等を収音する場合、マイクロホンに到達する音は、音源から発せられて直接到達した直接音と、壁等に1回反射して到達した反射音と、複数回反射して到達した反射音の混ざったものになる。マイクロホンが音源に近接していない場合は、この反射音からなる残響成分が多くなる。話者音声を離れた位置で収音する場合や残響時間が長い部屋で収音する場合には、残響により音声の明瞭度が低下して聞き取り難くなり、例えば音声認識システムの音声認識率も著しく低下することが知られている。話者位置からマイクロホン位置までのインパルス応答が予め測定されている場合には、MINT(Multi−input/output Inverse Theorem)法(非特許文献1)を用いてインパルス応答から逆フィルタ係数を求め、収音信号に逆フィルタを適用することで残響に含まれる収音信号から原音を回復することができる。
【0003】
MINT法を簡単に説明する。マイクロホンがN個あり、目的音源からi番目のマイクロホンまでの音響経路のインパルス応答をh(0)〜h(K)とする。Lタップの逆フィルタを求めるとき、MINT法は目的インパルス応答ベクトルをb、i番目のマイクロホン収音信号に適用するL次元の逆フィルタ係数ベクトルをg(n=1〜N)としてサイズ(L+K)×Lのインパルス応答畳み込み行列(式(1))を用いて、式(2)若しくは式(3)の連立方程式を解いて逆フィルタ係数ベクトルgを求める。
【0004】
【数1】

【0005】
完全な逆フィルタを求めるには、L+K≧NLが満たされている必要がある。L+K<NLの関係を満たすLをもちいた場合、近似の逆フィルタが求まる。Lを小さくしていくと、その近似精度は下がってく。目的インパルス応答ベクトルbはL+K次元のベクトルで、無遅延のパルス(式(4))や遅延付きのパルスが(式(5))用いられる。
【0006】
【数2】

【0007】
通常は、音源位置(話者位置)からマイクロホン位置までのインパルス応答を予め測定することが出来ないため、残響に含まれる収音信号のみから原音を回復するブラインド残響除去法が用いられる。ブラインド残響除去の一方法としてblind−MINT法(特許文献1、非特許文献2)がある。
【0008】
図1、図2を参照してblind−MINT法を簡単に説明する。図1は従来技術(blind−MINT法)に係る残響除去装置900の構成を示すブロック図である。図2は従来技術(blind−MINT法)に係る残響除去装置900の動作を示すフローチャートである。残響除去装置900は、Nチャネルのマイクロホン10−1〜10−N(Nは2以上の整数)と、多チャネル相関行列算出部20と、逆フィルタ推定部90と、逆フィルタ部70とを備える。
【0009】
目的音源1はスペクトルがフラットな音を発し、N個のマイクロホン10−1〜10−Nで収音される。収音信号y(k)〜y(k)は、多チャネル相関行列算出部20に入力される。ここで、収音信号y(k)〜y(k)は、例えば標本化周波数は16kHzで離散値化されたディジタル信号であり、kは時刻を表す。なお、収音信号をディジタル化するA/D変換器等については省略している。多チャネル相関行列算出部20は、収音信号y(k)〜y(k)間の相関関数rij(τ)を式(6)で計算する。
【0010】
【数3】

【0011】
ここでτは、2時点の時間間隔である。多チャネル相関行列算出部20は、相関関数rij(τ)からL×L相関行列Rij(式(7))を生成し、NL×NL多チャネル相関行列R(式(8))を生成する(S20)。
【0012】
【数4】

【0013】
但し、Lは逆フィルタの1チャネル当りのタップ数である。逆フィルタ推定部90は、式(9)の連立一次方程式を解いて逆フィルタ係数ベクトルgを推定する(S90)。
【0014】
【数5】

【0015】
ここで、目的インパルス応答ベクトルb(式(10))はLN次元ベクトルであり、L次元縦ベクトルb〜bが縦に並んでいる(式(11))。
【0016】
【数6】

【0017】
L次元ベクトルb中のδは、第n番目のマイクロホン10−nと目的音源との位置関係で決まる。第n番目のマイクロホン10−nが全マイクロホンの中で目的音源1に最も近いときにδは1を取り、それ以外のときは0を取る。逆フィルタ係数ベクトルgは、n番目のマイクロホンの収音信号y(k)に適用するL次元の逆フィルタ係数ベクトル(式(12))を用いると、式(13)と書ける。
【0018】
【数7】

【0019】
逆フィルタ部70は、式(14)に示すように各収音信号y(k)〜y(k)に逆フィルタ係数gを適用して最終出力信号x^(k)を得る。この出力信号は、残響の除去された目的信号になる。
【0020】
【数8】

【0021】
従来のブラインド残響除去装置900は、目的音源1から各マイクロホンまでの未知音響経路インパルス応答h(0)〜h(L−1)から成る行列Hと収音信号から求めた相関行列Rとの間に式(15)の関係があることを利用し、逆フィルタ係数を求めている。αは比例定数(スカラー量)である。
【0022】
【数9】

【先行技術文献】
【特許文献】
【0023】
【特許文献1】特開2006−66989号公報
【非特許文献】
【0024】
【非特許文献1】大賀寿郎、山崎芳男、金田豊著、「音響システムとディジタル処理」、電子情報通信学会、1995年4月
【非特許文献2】K. Furuya and A. Kataoka, "Robust Speech Dereverberatio Using Multichannel Blind Deconvolution With Spectral Subtraction", IEEE Transactions on Audio, Speech, and Language Processing, 2007 July, vol. 15, no. 5, pp. 1579-1591.
【発明の概要】
【発明が解決しようとする課題】
【0025】
しかしながら、従来法では、音源に由来する直接音と反射音のみが収音されることが前提になっている。上記のほかに、収音信号にノイズが含まれている場合には、従来法で求めた逆フィルタは目的音以上にノイズを大幅に増幅してしまう。またノイズに由来する推定誤差のために、残響の除去も保証されない。そこで本発明では、収音信号にノイズが含まれている場合でも、ロバストにブラインド残響し、ノイズの増幅を抑えることができる残響除去方法を提供することを目的とする。
【課題を解決するための手段】
【0026】
本発明の残響除去方法は、多チャネル相関行列算出ステップと、信号部分空間抽出ステップと、逆フィルタ推定ステップと、逆フィルタステップとを有する。信号部分空間抽出ステップは、特異値分解サブステップと、信号部分空間次元推定サブステップとを有する。逆フィルタ推定ステップは、疑似逆行列推定サブステップと、逆フィルタ係数推定サブステップとを有する。
【0027】
多チャネル相関行列算出ステップは、Nチャネル(Nは2以上の整数)の収音信号間の相関関数から、L行L列(Lは逆フィルタの1チャネルあたりのタップ数)の相関行列を生成し、当該相関行列からNL行NL列の多チャネル相関行列を算出する。特異値分解サブステップは、算出された多チャネル相関行列を特異値分解して、NL個の特異値を出力する。信号部分空間次元推定サブステップは、出力されたNL個の特異値の減衰傾向に基づいて信号部分空間の次元Dを推定する。疑似逆行列推定サブステップは、推定された信号部分空間の次元Dに基づいて信号部分空間成分のみからなる多チャネル相関行列の疑似逆行列を推定する。逆フィルタ係数推定サブステップは、推定された疑似逆行列に基づいて逆フィルタ係数ベクトルを推定する。逆フィルタステップは、推定された逆フィルタ係数ベクトルを各チャネルのフィルタ係数ベクトルに分解し、Nチャネルの収音信号のそれぞれに適用する。
【発明の効果】
【0028】
本発明の残響除去方法によれば、収音信号にノイズが含まれている場合でも、ロバストにブラインド残響し、ノイズの増幅を抑えることができる。
【図面の簡単な説明】
【0029】
【図1】従来技術に係る残響除去装置の構成を示すブロック図。
【図2】従来技術に係る残響除去装置の動作を示すフローチャート。
【図3】実施例1に係る残響除去装置の構成を示すブロック図。
【図4】実施例1に係る残響除去装置の動作を示すフローチャート。
【図5】実施例2に係る残響除去装置の構成を示すブロック図。
【図6】実施例2に係る残響除去装置の動作を示すフローチャート。
【図7】実施例3に係る残響除去装置の構成を示すブロック図。
【図8】実施例3に係る残響除去装置の動作を示すフローチャート。
【図9】実施例4に係る残響除去装置の構成を示すブロック図。
【図10】実施例4に係る残響除去装置の動作を示すフローチャート。
【図11】特異値番号と特異値の関係を収音SN比毎に示す図。
【図12】特異値の最大値から最小値に一定比率で減衰する関数p(j)を示す図。
【図13】関数p(j)とj番目の特異値σの比で定義される関数q(j)を示す図。
【図14】特異値番号と所定値以上の特異値逆数を一定値に置き換えた特異値逆数の関係を示す図。
【図15】特異値の最大値から最小値に一定比率で減衰する関数p(i)を示す図。
【図16】関数p(i)とi番目の特異値σの比で定義される関数q(i)を示す図。
【図17】シュミレーションに用いたインパルス応答と残響曲線を示す図。
【図18】従来技術の残響除去装置のシュミレーション結果を示す図。
【図19】実施例1の残響除去装置のシュミレーション結果を示す図。
【図20】実施例2の残響除去装置のシュミレーション結果を示す図。
【図21】実施例3(共通多項式除算後)の残響除去装置のシュミレーション結果を示す図。
【図22】実施例1(共通多項式除算前)の残響除去装置のシュミレーション結果を示す図。
【発明を実施するための形態】
【0030】
以下、本発明の実施の形態について、詳細に説明する。なお、同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。
【実施例1】
【0031】
図3、図4を参照して本発明の最も基本的な構成である実施例1の残響除去装置について説明する。図3は本実施例に係る残響除去装置100の構成を示すブロック図である。図4は本実施例に係る残響除去装置100の動作を示すフローチャートである。本実施例の残響除去装置100は、Nチャネルのマイクロホン10−1〜10−N(Nは2以上の整数)と、多チャネル相関行列算出部20と、信号部分空間抽出部30と、逆フィルタ推定部40と、逆フィルタ部70とを備える。信号部分空間抽出部30は、特異値分解手段31と、信号部分空間次元推定手段32とを備える。逆フィルタ推定部40は、疑似逆行列推定手段41と、逆フィルタ係数推定手段42とを備える。
【0032】
N個のマイクロホン10−1〜10−Nから収音される収音信号y(k)〜y(k)には、目的音源1から放出された音およびノイズが含まれている。この収音信号y(k)〜y(k)から以下のステップで残響除去信号を得る。多チャネル相関行列算出部20は、式(6)(7)(8)をもちいてNチャネル(Nは2以上の整数)の収音信号間y(k)〜y(k)の相関関数rij(τ)から、L行L列(Lは逆フィルタの1チャネルあたりのタップ数)の相関行列Rijを生成し、当該相関行列RijからNL行NL列の多チャネル相関行列Rを算出する(S20)。次に、信号部分空間抽出部30において、ステップS20で求めた多チャネル相関行列Rから、観測空間を信号部分空間とノイズ部分空間に分割する(S30)。そして逆フィルタ推定部40においてノイズ部分空間に含まれる信号成分のキャンセル、および信号部分空間に含まれる信号成分の残響除去を同時におこなう逆フィルタを求める(S40)。具体的には、特異値分解手段31は、算出された多チャネル相関行列Rを特異値分解して、NL個の特異値を出力する(SS31)。より具体的には、特異値分解手段31は、NL×NL多チャネル相関行列Rを式(16)に示すように特異値分解する。行列Uは多チャネル相関行列Rの左特異値ベクトルを並べた行列である。σ、…σNLは特異値を表す。Vは、多チャネル相関行列Rの右特異値ベクトルを並べた行列の転置行列である。
【0033】
【数10】

【0034】
次に、信号部分空間次元推定手段32は、出力されたNL個の特異値の減衰傾向に基づいて信号部分空間の次元Dを推定する(SS32)。行列Vの各縦ベクトルは、観測空間の基底ベクトルになる。信号部分空間次元推定手段32は、特異値σ〜σNLのカーブから、信号部分空間を構成する基底ベクトルの本数D、すなわち信号部分空間の次元Dを推定する。推定された信号部分空間の次元Dをもちいて、観測空間を信号部分空間Vとノイズ部分空間Vに分割し、式(17−1)のように信号部分空間成分のみからなる多チャネル相関行列R2を算出することができる。
【0035】
【数11】

【0036】
ただし行列VのサイズはNL×Dであり、その縦ベクトルが信号部分空間の基底ベクトルになる。また行列Vの縦ベクトルがノイズ部分空間の基底ベクトルになる。行列VとVはそれぞれ正規直交基底であり、行列Vと行列Vは直交する。
【0037】
以下、信号部分空間次元推定手段32が信号部分空間の次元Dを推定する方法を詳細に説明する。そのために、まず収音SN比の特異値への影響を示す。図11に収音信号に付加する無相関白色雑音のレベルを上げていったときの、収音信号の多チャネル相関行列Rの特異値カーブを示す。図11は特異値番号と特異値の関係を収音SN比毎に示す図である。多チャネル相関行列Rは、逆フィルタのフィルタ長を1チャネル当り1000タップに設定して、4チャネル収音信号から求めた。4チャネル収音信号は、残響時間450msの部屋において、サンプリング周波数8kHzで実測し、5500タップに打ち切ったインパルス応答を白色雑音に畳み込んで生成した。この図からは、(1)SN比が低くノイズが多いほど、最小特異値は大きくなること、(2)ノイズが多いほど、特異値の減少は早く飽和すること、(3)特異値のカーブは、信号に由来する急峻な減衰カーブAとノイズに由来する比較的フラットなカーブBからなること、(4)カーブAとカーブBが交錯するところで、特異値カーブの傾きが大きく変化していること、以上(1)〜(4)の特徴を読み取ることができる。
【0038】
以下、図12、13を参照して信号部分空間の次元Dを求める方法を記載する。図12は特異値の最大値から最小値に一定比率で減衰する関数p(j)を示す図である。図13は関数p(j)とj番目の特異値σの比で定義される関数q(j)を示す図である。まず、σからσNLに一定比率で減衰するカーブp(j)を求める(図12参照)。
【0039】
【数12】

【0040】
p(j)とσの比q(j)をとり、その最大値の位置から変曲点位置Joを求める(図13参照)。
【0041】
【数13】

【0042】
変曲点での値q(Jo)よりβ[dB]小さい値をとる点J、J(J<J)求め、信号部分空間の次元をD=Jとする。βは例えば0〜8[dB]の範囲で指定する。以上のステップにより信号部分空間の抽出が可能である。
【0043】
次に、疑似逆行列推定手段41は、推定された信号部分空間の次元Dに基づいて信号部分空間成分のみからなる多チャネル相関行列R2の疑似逆行列R2を推定する(SS41)。より具体的には、疑似逆行列推定手段41は、式(20)をもちいて、疑似逆行列すなわち信号部分空間の逆行列R2を求める。
【0044】
【数14】

【0045】
逆フィルタ係数推定手段42は、推定された疑似逆行列R2に基づいて逆フィルタ係数ベクトルを推定する(SS42)。より具体的には、逆フィルタ係数推定手段42は、サブステップSS41で求めた疑似逆行列R2をもちい、式(21)により逆フィルタ係数ベクトルを求める。
【0046】
【数15】

【0047】
逆フィルタ部70は、推定された逆フィルタ係数ベクトルを各チャネルのフィルタ係数ベクトルに分解し、Nチャネルの収音信号のそれぞれに適用する(S70)。より具体的には、逆フィルタ部70では、ステップS40(SS41、SS42)で求めた逆フィルタ係数ベクトルgを式(12)(13)により各チャネルのフィルタ係数ベクトルg〜gに分解し、式(14)により、Nチャネル収音信号に適用する。上記で算出した逆フィルタの効果を見るために、逆フィルタ後の信号の特性を調べる。Lサンプル分のNチャネル収音信号ベクトルyは、信号部分空間とノイズ部分空間に射影することで、式(22)のように信号部分空間の成分とノイズ部分空間の成分に分解できる。
【0048】
【数16】

【0049】
これに逆フィルタを適用すると行列VとVが直交しているために、式(23)のように信号部分空間の成分のみが残り、ノイズ部分空間の成分はキャンセルされる。
【0050】
【数17】

【0051】
本実施例の残響除去装置100によれば、信号部分空間抽出部30が特異値のカーブの減衰傾向から信号部分空間の次元Dを推定して観測空間を信号部分空間とノイズ部分空間に分割し、逆フィルタ推定部40が、推定された次元Dに基づいて推定した逆フィルタにより、信号部分空間に含まれる信号成分の残響を除去すると同時に、ノイズ部分空間に含まれる信号成分をキャンセルすることができるため、収音信号にノイズが含まれている場合でも、ロバストにブラインド残響し、かつノイズの増幅を抑えることができる。
【実施例2】
【0052】
次に、図5、図6を参照して実施例1の残響除去装置における疑似逆行列推定手段に変更を加えた実施例2の残響除去装置について説明する。図5は本実施例に係る残響除去装置200の構成を示すブロック図である。図6は本実施例に係る残響除去装置200の動作を示すフローチャートである。本実施例の残響除去装置200は、Nチャネルのマイクロホン10−1〜10−N(Nは2以上の整数)と、多チャネル相関行列算出部20と、信号部分空間抽出部30と、逆フィルタ推定部50と、逆フィルタ部70とを備える。信号部分空間抽出部30は、特異値分解手段31と、信号部分空間次元推定手段32とを備える。逆フィルタ推定部50は、疑似逆行列推定手段51と、逆フィルタ係数推定手段42とを備える。本実施例の残響除去装置200と、実施例1の残響除去装置100の違いは、実施例1の残響除去装置100の疑似逆行列推定手段41が本実施例の残響除去装置200において疑似逆行列推定手段51に置き換えられている点、および当該疑似逆行列推定手段51を有する逆フィルタ推定部50について実施例1の残響除去装置100において対応する逆フィルタ推定部40と番号を変えて表示した点のみである。従って、実施例1の残響除去装置100と共通する番号を有する各構成部は、実施例1の残響除去装置100において同一番号を有する各構成部と全く同じ機能を有するため説明を割愛する。
【0053】
以下、実施例1との相違点であるサブステップSS51について説明する。疑似逆行列推定手段51は、信号部分空間成分のみからなる多チャネル相関行列R2の疑似逆行列R2の対角行列の要素である特異値の逆数1/σ、1/σ、…、1/σのうち、予め定めたしきい値以上となる要素1/σD−、…、1/σを1/σ'<1/σ(D≦Z≦D)を充たす要素1/σ'D−、…、1/σ'に置き換えて信号部分空間成分のみからなる多チャネル相関行列の疑似逆行列を推定する(SS51)。
【0054】
参考非特許文献1(参考非特許文献1:浅野太著、「(音響テクノロジーシリーズ16)音のアレイ信号処理−音源の定位・追跡と分離−」、コロナ社、2011年1月27日、p.111-p.113)によれば、特異値は対応する特異値ベクトルの張る空間における信号パワーと雑音パワーの和である。信号パワーは偏在する傾向があり、雑音パワーは均一に分布する傾向がある。そのため、小さい特異値に対応する特異ベクトルの張る空間では、雑音パワーの占める比率がより大きくなる。このことを念頭に、疑似逆行列推定手段51は、上記実施例で使用している疑似逆行列
【0055】
【数18】

【0056】
を変形する。式(24)によれば、疑似逆行列の対角項は特異値の逆数になっている。このため、疑似逆行列は雑音パワー比の大きい成分に、より大きい値を乗算し、ノイズを増幅しやすいことが分かる。そこで、雑音パワー比の大きい成分に特異値の逆数よりも小さい値を乗算することで、ノイズ成分の増幅を抑える。そのために、疑似逆行列推定手段51は、疑似逆行列Rの代わりに行列Qを用いる。
行列Qの対角項は、
【0057】
【数19】

【0058】
に設定されている。これにより、残響除去の性能をほぼ維持しつつ、逆フィルタによるノイズ増幅を抑えることができる。行列Qの一具体形として、式(25)のように1/σD−をもちいる方法が考えられる。
【0059】
【数20】

【0060】
なおD−は、J〜Jの範囲から指定する。図14に、特異値、特異値の逆数、行列Qの対角項の関係を示す。図14(a)は特異値番号と特異値の関係を示す図である。図14(b)は特異値番号と所定値以上の特異値逆数を一定値に置き換えた特異値逆数(行列Qの対角項)の関係を示す図である。
【0061】
以下、実施例1の残響除去装置100、実施例2の残響除去装置200について、シミュレーションにより検証した効果について図17、図18、図19、図20を参照して説明する。図17はシュミレーションに用いたインパルス応答(a)と残響曲線(b)を示す図である。図18は従来技術の残響除去装置のシュミレーション結果を示す図である。図19は実施例1の残響除去装置100のシュミレーション結果を示す図である。図20は実施例2の残響除去装置200のシュミレーション結果を示す図である。シュミレーションに用いた音源は白色雑音であり、4チャネル収音信号は、残響時間450msの部屋において、サンプリング周波数8kHzで実測したインパルス応答を5500タップに打ち切って使用した。各マイクロホンには無相関の白色ノイズをSN比25dBになるよう加えている。逆フィルタのフィルタ長は1チャネル当り1000タップに設定した。相関関数を算出するときには、20sの収音信号を使用した。図18、図19、図20はいずれも(a)音響経路+逆フィルタのインパルス応答、(b)収音経路+逆フィルタのインパルス応答の残響曲線(実線)、収音経路インパルス応答の残響曲線(点線)、(c)逆フィルタ後の信号、(d)逆フィルタ後のノイズである。なお、図18〜図22のグラフ(a)は縦軸を信号強度、横軸をタップ、グラフ(b)は縦軸をエネルギー、横軸を時間、グラフ(c)は縦軸を信号強度、横軸を時間、グラフ(d)は縦軸を信号強度、横軸を時間、としてそれぞれプロットしたものである。図18の従来法の処理結果では、逆フィルタをうまく求められていないため、音響経路+逆フィルタのインパルス応答は、ピーク位置が拡散している。その残響曲線もほとんど減衰していない。また逆フィルタ後は、ノイズの振幅が信号の4倍にも達している。図19の実施例1の処理結果では、逆フィルタがうまく求められており、音響経路+逆フィルタのインパルス応答は、ピークが1つ立っている。その残響曲線も、80サンプル目のところで−10dB減衰している。そして逆フィルタ後は、ノイズの振幅が信号振幅の半分程度に抑えられている。図20の実施例2の処理結果では、より良い逆フィルタが求められており、音響経路+逆フィルタインパルス応答の残響曲線の減衰は、実施例1の処理結果と比較して2dB改善している。そして逆フィルタ後は、ノイズの振幅が信号振幅の1/3程度に抑えられている。
【0062】
本実施例の残響除去装置200によれば、実施例1の残響除去装置100の効果に加え、疑似逆行列推定手段51が雑音パワー比の大きい成分に乗算される特異値の逆数を当該特異値の逆数よりも小さな値に置き換えて疑似逆行列を推定するため、残響除去の性能をほぼ維持しつつ、逆フィルタによるノイズ増幅を抑えることができる。
【実施例3】
【0063】
次に、図7、図8、図15、図16を参照して実施例1の残響除去装置100に共通多項式を除去する機能を追加した実施例3に係る残響除去装置について説明する。図7は本実施例に係る残響除去装置300の構成を示すブロック図である。図8は本実施例に係る残響除去装置300の動作を示すフローチャートである。図15は特異値の最大値から最小値に一定比率で減衰する関数p(i)を示す図である。図16は関数p(i)とi番目の特異値σの比で定義される関数q(i)を示す図である。本実施例の残響除去装置300は、Nチャネルのマイクロホン10−1〜10−N(Nは2以上の整数)と、多チャネル相関行列算出部20と、信号部分空間抽出部30と、逆フィルタ推定部40と、共通多項式除去部60と、逆フィルタ部70とを備える。信号部分空間抽出部30は、特異値分解手段31と、信号部分空間次元推定手段32とを備える。逆フィルタ推定部40は、疑似逆行列推定手段41と、逆フィルタ係数推定手段42とを備える。共通多項式除去部60は、シルベスタ行列生成手段61と、左ゼロ空間抽出手段62と、共通多項式次元推定手段63と、共通多項式フィルタ係数推定手段64と、共通多項式除算手段65とを備える。本実施例の残響除去装置300と、実施例1の残響除去装置100の違いは、実施例1の残響除去装置100が備えない共通多項式除去部60を、本実施例の残響除去装置300が備える点のみである。従って、実施例1の残響除去装置100と共通する番号を有する各構成部は、実施例1の残響除去装置100において同一番号を有する各構成部と全く同じ機能を有するため説明を割愛する。
【0064】
実施例1の残響除去装置100は、音源信号が白色であること、すなわち音源信号のスペクトルがフラットなことを前提としている。音源信号が音声のように有色な場合には、実施例1の逆フィルタは音響経路に由来する残響を除去すると同時に、音源信号の周波数特性の平坦化もはかってしまう。有色音源信号に対応するには、逆フィルタg(k’)〜g(k’)で音源周波数特性を平坦化している部分、すなわち共通多項式を求めて除去すればよい。以下、共通多項式の次元を推定し、この推定次元をもとに参考非特許文献2のQiuの手法で共通多項式を求め、第一の逆フィルタから共通多項式を除算する処理を説明する(参考非特許文献2:W. Qiu, Y. Hua, and K. Abed-Meraim, " Subspace Method for the Computation of the GCD of Polynomials" Automatica,1997,vol. 33, no. 4, pp. 741-743)。なお次元が既知のとき共通多項式を求めるアルゴリズムは、参考非特許文献2以外に参考非特許文献3などの手法があり、これらを代わりに使用してもよい(参考非特許文献3:R. M. Corless, S. M. Watt, and L. Zhi, QR "Factoring to Compute the GCD of Univariate Approximate Polynomials", IEEE Transactions on Signal Processing, 2004, vol. 52, no. 12, pp. 3394-3402)。
【0065】
まず、シルベスタ行列生成手段61は、逆フィルタ係数推定手段42において推定された逆フィルタ係数ベクトル(以下、第1の逆フィルタ係数ベクトルという)から(2L−1)行NL列のシルベスタ行列を生成する(SS61)。より具体的には、シルベスタ行列生成手段61は、逆フィルタ係数推定手段42で求められた第一の逆フィルタ係数ベクトルから、式(26)(27)で(2L−1)×NLシルベスタ行列を生成する。
【0066】
【数21】

【0067】
左ゼロ空間抽出手段62は、生成されたシルベスタ行列を特異値分解して(2L−1)個の特異値を出力する(SS62)。共通多項式の次元がDのとき、特異値分解は式(28)のように分割される(非特許文献6)。
【0068】
【数22】

【0069】
行列Uの縦ベクトルが行列Gの左ゼロ空間の基底ベクトルになり、その本数がDになる。特異値カーブは図15のようになる。共通多項式次元推定手段63は、左ゼロ空間抽出手段62が出力した特異値の減衰傾向に基づいて共通多項式の次元を推定する(SS63)。より具体的には、共通多項式次元推定手段63は、行列Gの特異値σからσ2L−1に一定比率で減衰するカーブp(i)を求める(図15参照)。
【0070】
【数23】

【0071】
次に、p(i)とσの比q(i)をとり、その最小値の位置から変曲点位置Ioを求める(図16参照)。
【0072】
【数24】

【0073】
変曲点での値q(I)よりγ[dB]小さい値をとる二点のうち大きいほうの点Iを求める(図16参照)。そして共通多項式の次元をD=2L−1−Iとする。なおγは3〜20dBの範囲で指定する。共通多項式フィルタ係数推定手段64は、シルベスタ行列の左ゼロ空間の基底ベクトルから共通多項式のフィルタ係数を推定する(SS64)。より具体的には、共通多項式フィルタ係数推定手段64は、左ゼロ空間の基底ベクトルから、式(31−1〜31−3)で行列Wを算出する。行列Wの最小固有値に対応する固有ベクトルが共通多項式のフィルタ係数cとなる。
【0074】
【数25】

【0075】
共通多項式除算手段65は、第1の逆フィルタ係数ベクトルをチャネル毎の共通多項式で除算して第2の逆フィルタ係数ベクトルを推定する(SS65)。より具体的には、共通多項式除算手段65は、逆フィルタ推定手段42で求めた第一の逆フィルタを、チャネルごとに共通多項式で除算する。そのために式(32)を解いて、チャネルごとに第2の逆フィルタ係数
【0076】
【数26】

【0077】
を求める。
【0078】
【数27】

【0079】
逆フィルタ部70では、式(33)により収音信号y(k)〜y(k)に逆フィルタ係数を適用して出力信号x^(k)を得る。
【0080】
【数28】

【0081】
実施例3の残響除去装置300について、シミュレーションにより効果を検証した。音源は音声であり、4チャネル収音信号は、残響時間450msの部屋において、サンプリング周波数8kHzで実測したインパルス応答を5500タップに打ち切って使用した。各マイクロホンには無相関の白色ノイズをSN比20dBになるよう加えている。逆フィルタのフィルタ長は1チャネル当り1000タップに設定した。相関関数を算出するときには、20sの収音信号を使用した。実施例2の手法を適用した結果を図21に、実施例1の手法を適用した結果を図22に示す。いずれも(a)音響経路+逆フィルタのインパルス応答、(b)収音経路+逆フィルタのインパルス応答の残響曲線(実線)、収音経路インパルス応答の残響曲線(点線)、(c)逆フィルタ後の信号、(d)逆フィルタ後のノイズである。
【0082】
実施例1の手法を適用した場合には、図22(a)インパルス応答ではきれいなピーク形状が得られず、ピーク後部に成分が残留している。また図22(b)の残響曲線でも80サンプル付近からなだらかに減衰しており、残響がうまく取れていないことが分かる。
【0083】
しかし実施例3の手法を適用することで、図21(a)の音響経路+逆フィルタのインパルス応答ではきれいなピークが得られており、その残響曲線も80サンプル付近で0dBから−10dBに急激に減衰している、このことから、音源が音声信号であっても実施例3の手法により残響を効果的に除去できることが分かる。
【0084】
本実施例の残響除去装置300によれば、実施例1の残響除去装置100の効果に加えて、音源信号が有色である場合であっても、共通多項式除去部60が共通多項式を求めて除去することにより、有色音源信号にも対応することができる。
【実施例4】
【0085】
以下、図9、図10を参照して実施例2の残響除去装置200に実施例3の残響除去装置300が備える共通多項式除去部60を加えた実施例4の残響除去装置について説明する。図9は本実施例に係る残響除去装置400の構成を示すブロック図である。図10は本実施例に係る残響除去装置400の動作を示すフローチャートである。本実施例の残響除去装置400は、実施例2の残響除去装置200と共通してNチャネルのマイクロホン10−1〜10−N(Nは2以上の整数)と、多チャネル相関行列算出部20と、信号部分空間抽出部30と、逆フィルタ推定部50と、逆フィルタ部70とを備える。また、本実施例の残響除去装置400は、実施例3の残響除去装置300と共通して共通多項式除去部60を備える。従って、実施例2の残響除去装置200と共通する番号を有する各構成部の機能は、実施例2の記載を参照されたい。また、実施例3の残響除去装置300と共通する番号を有する各構成部の機能は、実施例3の記載を参照されたい。
【0086】
また、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
【0087】
また、上述の構成をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。
【0088】
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。
【0089】
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
【0090】
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
【0091】
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

【特許請求の範囲】
【請求項1】
Nチャネル(Nは2以上の整数)の収音信号間の相関関数から、L行L列(Lは逆フィルタの1チャネルあたりのタップ数)の相関行列を生成し、当該相関行列からNL行NL列の多チャネル相関行列を算出する多チャネル相関行列算出ステップと、
前記算出された多チャネル相関行列を特異値分解して、NL個の特異値を出力する特異値分解サブステップと、
前記出力されたNL個の特異値の減衰傾向に基づいて信号部分空間の次元Dを推定する信号部分空間次元推定サブステップと、を有する信号部分空間抽出ステップと、
前記推定された信号部分空間の次元Dに基づいて信号部分空間成分のみからなる多チャネル相関行列の疑似逆行列を推定する疑似逆行列推定サブステップと、
前記推定された疑似逆行列に基づいて逆フィルタ係数ベクトルを推定する逆フィルタ係数推定サブステップと、を有する逆フィルタ推定ステップと、
前記推定された逆フィルタ係数ベクトルを各チャネルのフィルタ係数ベクトルに分解し、前記Nチャネルの収音信号のそれぞれに適用する逆フィルタステップと、
を有することを特徴とする残響除去方法。
【請求項2】
請求項1に記載の残響除去方法であって、
前記信号部分空間次元推定サブステップが、
前記NL個の特異値をσ、σ、…、σNLとし、j(1≦j≦NL)を変数として、
【数29】


により定義される関数q(j)の変曲点位置j=Jから信号部分空間の次元を推定すること
を特徴とする残響除去方法。
【請求項3】
請求項1または2に記載の残響除去方法であって、
前記疑似逆行列推定サブステップが、
前記信号部分空間成分のみからなる多チャネル相関行列の疑似逆行列の対角行列の要素である特異値の逆数1/σ、1/σ、…、1/σのうち、予め定めたしきい値以上となる要素1/σD−、…、1/σを1/σ'<1/σ(D≦Z≦D)を充たす要素1/σ'D−、…、1/σ'に置き換えて前記信号部分空間成分のみからなる多チャネル相関行列の疑似逆行列を推定すること
を特徴とする残響除去方法。
【請求項4】
請求項1から3の何れかに記載の残響除去方法であって、
共通多項式除去ステップをさらに有し、
前記共通多項式除去ステップが、
前記逆フィルタ係数推定サブステップにおいて推定された逆フィルタ係数ベクトル(以下、第1の逆フィルタ係数ベクトルという)から(2L−1)行NL列のシルベスタ行列を生成するシルベスタ行列生成サブステップと、
前記生成されたシルベスタ行列を特異値分解して(2L−1)個の特異値を出力する左ゼロ空間抽出サブステップと、
前記左ゼロ空間抽出サブステップが出力した特異値の減衰傾向に基づいて共通多項式の次元を推定する共通多項式次元推定サブステップと、
前記シルベスタ行列の左ゼロ空間の基底ベクトルから共通多項式のフィルタ係数を推定する共通多項式フィルタ係数推定サブステップと、
前記第1の逆フィルタ係数ベクトルを前記チャネル毎の共通多項式で除算して第2の逆フィルタ係数ベクトルを推定する共通多項式除算サブステップと、
を有することを特徴とする残響除去方法。
【請求項5】
請求項4に記載の残響除去方法であって、
前記共通多項式次元推定サブステップが、
前記シルベスタ行列を特異値分解して得られた(2L−1)個の特異値をσ、σ、…、σ2L−1とし、i(1≦i≦2L−1)を変数として、
【数30】


により定義される関数q(i)の変曲点位置i=Iから共通多項式の次元を推定すること
を特徴とする残響除去方法。
【請求項6】
Nチャネル(Nは2以上の整数)の収音信号間の相関関数から、L行L列(Lは逆フィルタの1チャネルあたりのタップ数)の相関行列を生成し、当該相関行列からNL行NL列の多チャネル相関行列を算出する多チャネル相関行列算出部と、
前記算出された多チャネル相関行列を特異値分解して、NL個の特異値を出力する特異値分解手段と、
前記出力されたNL個の特異値の減衰傾向に基づいて信号部分空間の次元Dを推定する信号部分空間次元推定手段と、を備える信号部分空間抽出部と、
前記推定された信号部分空間の次元Dに基づいて信号部分空間成分のみからなる多チャネル相関行列の疑似逆行列を推定する疑似逆行列推定手段と、
前記推定された疑似逆行列に基づいて逆フィルタ係数ベクトルを推定する逆フィルタ係数推定手段と、を備える逆フィルタ推定部と、
前記推定された逆フィルタ係数ベクトルを各チャネルのフィルタ係数ベクトルに分解し、前記Nチャネルの収音信号のそれぞれに適用する逆フィルタ部と、
を有することを特徴とする残響除去装置。
【請求項7】
請求項1から5の何れかに記載の残響除去方法を実行すべき指令をコンピュータに対してするプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate


【公開番号】特開2013−113866(P2013−113866A)
【公開日】平成25年6月10日(2013.6.10)
【国際特許分類】
【出願番号】特願2011−257135(P2011−257135)
【出願日】平成23年11月25日(2011.11.25)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】