説明

音響結合量算出装置とその方法と、プログラム

【課題】音響結合量の推定精度を向上させる。
【解決手段】この発明の音響結合量算出装置は、第1音響結合量推定値を、周波数領域の再生信号スペクトルと収音信号スペクトルを入力として、同一時刻のフレームの再生信号スペクトルと収音信号スペクトルを所定フレーム数Nの範囲で掛け合わせて加算した値を、再生信号スペクトルの所定フレーム数のパワーを加算した値で除した値を結合量として求める。そして、収音信号スペクトルに対して再生信号スペクトルを、過去の時刻m(m=1〜M−1)にずらして第1音響結合量推定値と同様に計算した結合量を第2音響結合量推定値乃至第M音響結合量推定値として求め、第1音響結合量推定値から第M音響結合量推定値までの合計の絶対値を自乗した値を音響結合量の推定値として出力する。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は、音響再生系を有する例えば通信会議システムにおいて、ハウリングの原因及び聴覚上の障害となる音響エコーを消去する音響エコー消去装置に用いられる音響結合量算出装置と、その方法とプログラムに関する。
【背景技術】
【0002】
従来の音響結合量算出装置を用いたエコー消去の考えは、例えば非特許文献1に開示されている。図5に従来の音響エコー消去装置500の機能構成例を示してその動作を簡単に説明する。
【0003】
音響エコー消去装置500は、受話端1、スピーカ2、マイクロホン3、送話端4、エコーキャンセルフィルタ5、ノイズフィルタ6、減算器7を備える。受話端1に入力されスピーカ2で音響信号に変換される再生信号x(t)と、マイクロホン3が出力する収音信号y(t)は、時間領域のアナログ信号である。音響結合量算出装置は、エコーキャンセルフィルタ5に含まれ図示されていない。収音信号y(t)は、スピーカ2から放出された再生信号x(t)に、図示しない屋内のインパルス応答(伝達関数)の影響を受けたエコー成分が重畳した信号である。
【0004】
図5において再生信号x(t)と収音信号y(t)を、周波数領域のディジタル信号であるX(f)とY(f)に変換するためのA/D変換器とD/A変換器、及び周波数分析部は省略している。また、ノイズフィルタ6とエコーキャンセルフィルタ5は、デジタルフィルタである。
【0005】
音響エコー消去装置500は、収音信号Y(f)からエコー成分を消去した近端話者信号推定値S^(f)を送話端4に出力する。近端話者信号推定値S^(f)は式(1)で表せる。^は式及び図中の表記が正しい。
【0006】
【数1】

【0007】
雑音、近端話者信号、エコーが統計的に無相関であるとすると、近端話者信号推定値S^(f)は式(2)で表せる。
【0008】
【数2】

【0009】
ここでW(f)は、ノイズフィルタ6のフィルタ係数であり、Sは近端話者信号、Nは雑音である。E[・]は期待値を表す。エコーキャンセルフィルタ5に含まれる音響結合量算出装置は、スピーカ2からマイクロホン3に回りこむエコー経路の伝達関数の推定値W(f)を式(4)で計算する。そして更に、その伝達関数の推定値W(f)の振幅値を自乗した音響結合量の推定値|Hω^(i)|を式(5)で計算する。
【0010】
【数3】

【0011】
式(3)において、雑音Nを0とするとノイズフィルタ6のフィルタ係数W(f)は1となる。よって、近端話者信号推定値S^(f)は、雑音N=0の場合、再生信号X(f)に音響結合量の推定値|Hω^(i)|を乗算して求めたエコー成分を、収音信号Y(f)から減算して求められる。なお、以降、音響結合量の推定値を|Hω^(i)|、再生信号スペクトルをXω(i)、収音信号スペクトルをYω(i)と表記する。なお、式(2)では、近端話者信号推定値S^(f)を、伝達関数の推定値W(f)を用いて求めているが、音響結合量の推定値|Hω^(i)|を用いて求めても良い。
【0012】
ここで、j=0〜N−1までの合計ΣはN×E[・]と同じ意味であり、期待値を求めるものである。*は共役複素数、Nは加算フレーム数を示す。図6に式(5)の計算を示す。図6の横方向は時間経過を表し、フレーム(i)が現在時刻である。
【0013】
式(5)の分子は、例えばN=4とすると、現在時刻のフレーム(i)から3フレーム過去の時刻フレーム(i−3)までの再生信号スペクトルXω(・)と、収音信号スペクトルYω(・)の同時刻同士の積であるクロススペクトルの合計を表す。分母は、同じN=4の区間、(i)〜(i−3)の範囲の再生信号スペクトルXω(・)のパワーの合計を表す。このように音響結合量の推定値|Hω^(i)|は、所定フレーム数Nの範囲における再生信号のパワーに対するクロススペクトルの比で与えられる。
【先行技術文献】
【非特許文献】
【0014】
【非特許文献1】Christophe Beaugeant, Valerie Turbin, Pascal Scalart, Andre Gilloire, “New optimal filtering approaches for hands-free telecommunication terminals ” Signal Processing 64, 1998, 33-47
【発明の概要】
【発明が解決しようとする課題】
【0015】
式(5)又は式(4)に示す従来の音響結合量の計算方法は、同時刻同士の再生信号スペクトルXω(・)と収音信号スペクトルYω(・)の短い時間幅のフレーム同士を乗算したクロススペクトルを用いていた。そのため、音響結合量の推定値の誤差が大きかった。つまり、スピーカから発せられた再生信号x(t)が、マイクロホンで収音されて収音信号y(t)として観測されるまでには、必ず時間遅れが生じる。その遅れ時間は、エコー経路のインパルス応答長の影響を受け、凡そ数10ms〜数100msである。
【0016】
一方、フレームの時間幅は、例えばサンプリング周波数を16kHzとし、周波数分析のデータ量を256点とした場合、16msである。したがって、遅れ時間の方が大きくなる場合が多い。また、フレームの時間幅に比べて、エコー経路のインパルス応答長は、大抵200ms〜400msと非常に長い。そのため、短い時間幅のフレームではエコー経路のインパルス応答全体を考慮できない場合が多い。そのため、従来の音響結合量の計算方法では、音響結合量の推定値に誤差が生じ易く、ミュージカルノイズ発生の原因の一つになっていた。
【0017】
この発明はこの点に鑑みてなされたものであり、エコー経路のインパルス応答長に関わらず高精度に音響結合量を推定できる計算方法と、その方法による音響結合量算出装置と、そのプログラムを提供することを目的とする。
【課題を解決するための手段】
【0018】
この発明の音響結合量算出装置は、第1音響結合量推定値を、周波数領域の再生信号スペクトルと収音信号スペクトルを入力として、同一時刻のフレームの再生信号スペクトルと収音信号スペクトルを所定フレーム数Nの範囲で掛け合わせて加算した値を、再生信号スペクトルの所定フレーム数のパワーを加算した値で除した値を結合量として求める。そして、収音信号スペクトルに対して再生信号スペクトルを、過去の時刻m(m=1〜M−1)にずらして第1音響結合量推定値と同様に計算した結合量を第2音響結合量推定値乃至第M音響結合量推定値として求め、第1音響結合量推定値から第M音響結合量推定値までの合計の絶対値を自乗した値を音響結合量の推定値として出力する。
【発明の効果】
【0019】
この発明による音響結合量の推定値は、収音信号スペクトルに対する再生信号スペクトルを過去にずらして求めた結合量を合計して求められる。したがって、エコー経路のインパルス応答長に関わらず高精度に音響結合量を推定することができる。つまり、或るフレームの再生信号とそれ以外のフレームの再生信号は統計的に無相関であることから、過去の時刻の再生信号と現在時刻のフレームの収音信号とのクロススペクトル加算値から、無相関成分を除去すれば、現在時刻のフレームの収音信号スペクトルと過去フレームの再生信号スペクトルとの間に相関のあるエコー経路の音響結合量(つまり、エコー経路中の残響成分に相当する値)を推定することが可能である。よって、現在時刻のフレームと過去の時刻のフレームを用いて計算した複数の音響結合量を合計することで、エコー経路のインパルス応答長がフレームより長い場合でも、高精度に音響結合量の推定ができる。
【図面の簡単な説明】
【0020】
【図1】この発明の音響結合量算出装置100が出力する音響結合量の推定値|Hω^(i)|を求める信号の入出力関係と、計算式(6)を示す図。
【図2】計算式(6)の計算を説明する図。
【図3】音響結合量算出装置100′の機能構成例を示す図。
【図4】音響結合量算出装置100′の動作フローを示す図。
【図5】非特許文献1に開示された従来の音響エコー消去装置の機能構成を示す図。
【図6】従来の音響結合量の推定値の計算を説明する図。
【発明を実施するための形態】
【0021】
以下に、この発明の実施の形態を図面を参照して説明する。
【実施例1】
【0022】
図1にこの発明の音響結合量算出装置100の信号の入出力の関係と、音響結合量の推定値|Hω^(i)|を計算する式(6)を示す。
【0023】
【数4】

【0024】
ここでmは、m=0,1,…,M−1の整数値をとる値であり、収音信号スペクトルY
ω(・)に対して再生信号スペクトルXω(・)を過去の時刻にずらすフレーム数を表す。N(m)は、所定フレーム数であり、音響結合量の推定値を求めるフレーム幅を表す。C(m)は調整定数であり、例えばC(m)=1とする。
【0025】
式(6)は、周波数領域の再生信号スペクトルXω(・)と収音信号スペクトルYω(・)を入力として、同一時刻のフレームの再生信号スペクトルXω(・)と収音信号スペクトルYω(・)を所定フレーム数N(m)の範囲で掛け合わせて加算した値を、再生信号スペクトルXω(・)の所定フレーム数Nのパワーを加算した値で除した結合量を第1音響結合量推定値として計算する。そして更に、収音信号スペクトルYω(・)に対して再生信号スペクトルXω(・)を、過去の時刻(m=1〜M−1)にずらして第1音響結合量推定値と同様に計算した結合量を第2音響結合量推定値乃至第M音響結合量推定値として求め、第1音響結合量推定値から第M音響結合量推定値までの合計の絶対値を自乗した値を、音響結合量の推定値|Hω^(i)|として出力する計算である。
【0026】
図2に、例えばN=4,M=3とした場合の式(6)の計算を示す。m=0の時が第1音響結合量を求める計算になる。この場合、式(6)の分子のクロススペクトルは、現在時刻(i)から4個のフレーム数過去の時刻(i−3)までの、同一時刻同士の再生信号スペクトルXω(・)と収音信号スペクトルYω(・)とが乗算され、それぞれの乗算値が合計された値である。分母は、現在時刻(i)〜(i−3)までのそれぞれの時刻の再生信号スペクトルXω(・)のパワーの合計である。
【0027】
m=1の時が第2音響結合量の計算になる。この場合、分子のクロススペクトルは、現在時刻の収音信号スペクトルYω(i)に対して1フレーム過去の時刻の再生信号スペクトルXω(i−1)が乗算され、以後、時刻(i−3)の収音信号スペクトルYω(i−3)に時刻(i−4)の再生信号スペクトルXω(i−4)が乗算されまで繰り返され、それぞれの乗算値が合計される。m=1の場合の分母は、時刻(i−1)〜(i−4)までのそれぞれの時刻の再生信号スペクトルXω(・)のパワーの合計である。
m=2の時が第3音響結合量の計算になる。この場合は、収音信号スペクトルYω(i)に対して2フレーム過去の時刻の再生信号スペクトルXω(i−2)が乗算され、以下同様に計算される。
【0028】
音響結合量算出装置100は、このようにして計算された第1音響結合量〜第3音響結合量の合計の絶対値を自乗した値を、音響結合量の推定値として出力する。このように現在時刻の収音信号スペクトルYω(i)に、過去の時刻の再生信号スペクトルXω(i−j−m)を乗算したクロススペクトルの加算値から音響結合量の推定値を求めるので、エコー経路中の残響成分に相当する音響結合量を抽出することができる。この結果、エコー経路全体の音響結合量を高精度に推定することが可能になる。
【実施例2】
【0029】
図3に、音響結合量の推定値を振幅特性の値から求めるようにした音響結合量算出装置100′の機能構成例を示す。音響結合量算出装置100′は、例えばROM、RAM、CPU等で構成されるコンピュータに所定のプログラムが読み込まれて、CPUがそのプログラムを実行することで実現されるものである。音響結合量算出装置100′は、音響結合量の推定値|Hω^(i)|を式(7)で計算する。
【0030】
【数5】

【0031】
式(7)は、実施例1の結合量が自乗されて振幅特性の値に変換され、その結合量の振
幅値を合計した値を音響結合量の推定値とするものである。音響結合量算出装置100′
の動作フローを図4に示す。
【0032】
音響結合量算出装置100′は、クロススペクトル加算部10、パワースペクトル加算部20、音響結合量演算部30、を具備する。クロススペクトル加算部10は、収音信号スペクトルYω(・)と再生信号スペクトルXω(・)を入力としてクロススペクトルの加算値CRS(m)を式(8)で計算する(ステップS10)。式(8)は、式(7)の右辺の絶対値記号内の分子の計算と同じである。
【0033】
【数6】

【0034】
ステップ10は、クロススペクトルを算出する過程(ステップS101)と、クロススペクトルを加算する過程(ステップS102)を含む。
パワースペクトル加算部20は、再生信号スペクトルXω(・)を入力として所定フレーム数Nの範囲の再生信号スペクトルXω(・)のパワーの合計値P(m)を式(9)で計算する(ステップS20)。式(9)は、式(7)の右辺の絶対値記号内の分母の計算と同じである。
【0035】
【数7】

【0036】
ステップ20は、各フレームのパワーを算出する過程(ステップS201)と、所定フ
レーム数Nの範囲で合計する過程(ステップS202)を含む。
音響結合量演算部30は、クロススペクトルの加算値CRS(m)とパワーの合計値P(m)を入力として音響結合量の推定値|Hω^(i)|を式(10)で計算する(ステップS30)。
【0037】
【数8】

【0038】
ステップ30の過程は、第1〜第M音響結合量振幅値算出過程(ステップS301)と、ステップS301で求めた複数の音響結合量振幅値を合計する過程(ステップS302)と、その合計値の絶対値の自乗値を算出する過程(ステップS303)とを含む。
【0039】
なお、調整定数C(m)について、C(m)=1として特に説明しなかったがmによっ
て異なる値に設定しても良い。例えばmが大であるとより過去のフレーム時刻が計算対象
になるので、mが小の場合の音響結合量よりもSN比が相対的に低下する。そこでmが大
の時は、例えばC(m)を小さくするようにしても良い。つまり、過去分の重みを小さく
する。また、同様に過去のフレーム時刻のSN比は低下することから、所定のフレーム
数N(m)もmの値によって変化させても良い。例えばmが大であればN(m)も大とす
る。そうすることで、クロススペクトル加算値やパワー値がより平均化されるので精度向
上が期待できる。また、実施例1の式(6)の場合でも、図3に示す機能構成で実現でき
る。
【0040】
以上説明したこの発明の音響結合量算出装置とその方法は、上述の実施形態に限定されるものではなく、この発明の趣旨を逸脱しない範囲で適宜変更が可能である。例えば、上記した装置及び方法において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。なお、この音響結合量算出装置は、音響エコー消去装置以外の例えばボイススイッチ装置にも利用することが可能である。
【0041】
上記装置における処理手段をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、各装置における処理手段がコンピュータ上で実現される。
【0042】
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD-RAM
(Random Access Memory)、CD-ROM(Compact Disc Read Only Memory)、CD-R
(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto Optical disc)等を、半導体メモリとしてフラッシュメモリー等を用いることができる。
【0043】
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記録装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
【0044】
また、各手段は、コンピュータ上で所定のプログラムを実行させることにより構成することにしてもよいし、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

【特許請求の範囲】
【請求項1】
周波数領域の再生信号スペクトルと収音信号スペクトルを入力として、同一時刻のフレームの上記再生信号スペクトルと上記収音信号スペクトルを所定フレーム数Nの範囲で掛け合わせて加算した値を、上記再生信号スペクトルの上記所定フレーム数のパワーを加算した値で除した結合量を第1音響結合量推定値とし、
上記収音信号スペクトルに対して上記再生信号スペクトルを、過去の時刻m(m=1〜M−1)にずらして上記第1音響結合量推定値と同様に計算した結合量を第2音響結合量推定値乃至第M音響結合量推定値とし、上記第1音響結合量推定値から第M音響結合量推定値までの合計の絶対値を自乗した値を音響結合量の推定値として出力する音響結合量算出装置。
【請求項2】
請求項1に記載した音響結合量算出装置において、
上記第1音響結合量推定値から第M音響結合量推定値は、上記結合量が自乗された振幅特性の値を合計した値であることを特徴とする音響結合量算出装置。
【請求項3】
請求項1又は2に記載した音響結合量算出装置において、
上記第1音響結合量推定値から第M音響結合量推定値のそれぞれに対して調整定数が乗算され、上記調整定数は上記過去の時刻を示すmの値によって異なる値であることを特徴とする音響結合量算出装置。
【請求項4】
請求項1乃至3の何れかに記載した音響結合量算出装置において、
上記所定フレーム数Nは、上記過去の時刻を示すmの値が大であれば大きくなる値であることを特徴とする音響結合量算出装置。
【請求項5】
周波数領域の再生信号スペクトルと収音信号スペクトルを入力として、同一時刻のフレームの上記再生信号スペクトルと上記収音信号スペクトルを所定フレーム数Nの範囲で掛け合わせて加算した値を、上記再生信号スペクトルの上記所定フレーム数のパワーを加算した値で除した結合量を第1音響結合量推定値とし、
上記収音信号スペクトルに対して上記再生信号スペクトルを、過去の時刻m(m=1〜M−1)にずらして上記第1音響結合量推定値と同様に計算した結合量を第2音響結合量推定値から第M音響結合量推定値とし、上記第1音響結合量推定値から第M音響結合量推定値までの合計の絶対値を自乗した値を音響結合量の推定値として出力する音響結合量算出方法。
【請求項6】
請求項5に記載した音響結合量算出方法において、
上記第1音響結合量推定値から第M音響結合量推定値は、上記結合量が自乗された振幅特性の値を合計した値であることを特徴とする音響結合量算出方法。
【請求項7】
請求項5又は6に記載した音響結合量算出方法において、
上記第1音響結合量推定値から第M音響結合量推定値のそれぞれに対して調整定数が乗算され、上記調整定数は、上記過去の時刻を示すmの値によって異なる値であることを特徴とする音響結合量算出装置。
【請求項8】
請求項5乃至7の何れかに記載した音響結合量算出方法において、
上記所定フレーム数Nは、上記過去の時刻を示すmの値が大であれば大きくなる値であることを特徴とする音響結合量算出方法。
【請求項9】
請求項1乃至4の何れかに記載した音響結合量算出装置としてコンピュータを機能させる装置プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2010−187085(P2010−187085A)
【公開日】平成22年8月26日(2010.8.26)
【国際特許分類】
【出願番号】特願2009−28485(P2009−28485)
【出願日】平成21年2月10日(2009.2.10)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】