説明

音響エコー除去装置

【課題】ダブルトークにおける近端話者の音声v(t)を誤検出が少なく簡単な構成で検出することが可能な音響エコー除去装置を提供する。
【解決手段】エコーy(t)を模擬した擬似エコーy’(t)を生成する適応フィルタ11と、マイクロホン17により収音した音声信号s(t)から擬似エコーy’(t)を減算する減算部13と、マイクロホン17により収音した音声信号s(t)を基に、スピーカ16からマイクロホン17までのエコー経路EPにおいて信号強度が減衰する所定の周波数帯域成分を抽出し、該抽出された信号成分e(t)の信号強度に基づいてダブルトークの有無を検出するダブルトーク検出部12と、ダブルトーク検出部12によりダブルトークが検出された場合に適応フィルタ11における擬似エコーy’(t)の生成を停止させるステップサイズ制御部14と、を備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音響エコー除去装置に関する。
【背景技術】
【0002】
マイクロホンとスピーカを備えた通話装置を用いて、離れた2地点の話者(一方を近端話者、他方を遠端話者と呼ぶ)が通話を行うシステムは、電話やテレビ会議システムなどに広く用いられている。上記通話装置を用いて通話を行う際、スピーカから送出される音声の一部がマイクロホンに回り込んで相手側の通話装置へ送信され、その相手が自分の声をエコーとして聴取してしまう現象が起きることがある。このような現象が発生すると、通話者は不快感を感じることとなり、また、エコーが激しい場合にはハウリングが起こって通話不能の状態となってしまうおそれもある。こうしたエコーを除去するため、従来、適応フィルタを使ったエコーキャンセラ(音響エコー除去装置)が開発されている。
【0003】
図5は、従来のエコーキャンセラ20の構成を示すブロック図である。同図において、近端話者の通話装置(エコーキャンセラ20を備えている)が受信した遠端話者からの音声信号x(t)は、当該通話装置のスピーカ26へ入力されて音声として発音されるとともに、適応フィルタ21へ入力される。スピーカ26から発音された音声はインパルス応答h(t)で特徴付けられるエコー経路EPを伝達(エコー経路EPやインパルス応答h(t)は時々刻々変化する)して、エコーy(t)となってマイクロホン27により収音される。マイクロホン27はこのエコーy(t)の他、近端話者の音声v(t)も収音し、これらを合成した音声信号s(t)=v(t)+y(t)を出力する。
【0004】
一方、適応フィルタ21は、スピーカ26からマイクロホン27までのエコー経路EPのインパルス応答をh’(t)として推定することによりそのフィルタ係数を設定し、入力された音声信号x(t)から実際のエコーy(t)を模擬した擬似エコーy’(t)を動的に生成する。ここでインパルス応答h’(t)の推定は、減算部23の出力であるエコーを除去した信号e(t)が最も小さくなるように、適応的に行う。減算部23は、マイクロホン27の出力s(t)から擬似エコーy’(t)を減算する。これにより、マイクロホン27で収音した音声からエコーを除去(キャンセル)した信号e(t)を得ることができる。
【0005】
ここで、適応フィルタ21には、NLMS(Normalized Least Mean Square:規格化最小2乗平均)、RLS(Recursive Least Square:再帰最小2乗)、APA(Affine Projection Algorithm:アフィン射影アルゴリズム)等の各種アルゴリズムを用いることができるが、いずれのアルゴリズムを用いた場合も、近端話者の音声v(t)がある時に適応フィルタ21のフィルタ係数を更新すると、フィルタ係数が誤って調整されることとなり、エコーの除去が適切に行われなくなってしまう。これを避けるため、近端話者の音声v(t)をダブルトーク検出部22(遠端話者と近端話者が同時に音声を発することをダブルトークと呼ぶ)により検出して、近端話者の音声v(t)が存在する時は適応フィルタ21がフィルタ係数を更新しないようにしている。つまり、近端話者の音声v(t)がない時は、随時インパルス応答h’(t)を推定してフィルタ係数の更新を行うことで精度良くエコーを除去し、近端話者の音声v(t)がある時は、フィルタ係数の更新を停止することでエコー除去が適切に行われるようにする。
【0006】
ダブルトーク検出部22が近端話者の音声v(t)を検出する検出方法には、第1の検出方法として、遠端話者からの音声信号x(t)のレベルに対するマイクロホン27の出力信号s(t)のレベルの比を計算し、その比が所定の閾値より大きい場合は近端話者の音声v(t)が存在する、その比が所定の閾値より小さい場合は近端話者の音声v(t)が存在しない、と判定する方法がある(例えば非特許文献1参照)。また、第2の検出方法として、近端話者の音声v(t)がない場合はエコーが精度良くキャンセルされるので残留エコーのパワーは小さく、近端話者の音声v(t)がある場合は残留エコーのパワーが増加する、ということを利用し、残留エコーのパワーを監視して、そのパワーが増加した時に近端話者の音声v(t)が存在すると判定する方法がある。但し、この方法を用いる際は、エコー経路が変化することによっても残留エコーのパワーが増加してしまうので、別途、エコー経路の変化を検出することが必要である(例えば非特許文献2参照)。その他にも、エコーy(t)のコヒーレンスを利用する方法や、相互相関関数等を利用する方法が提案されている(例えば非特許文献3参照)。
【0007】
なお、図5のエコーキャンセラ20では、より効果的にエコーを除去するために、損失挿入部24とゲイン制御部25が用いられている。実際の環境下では、マイクロホン27が近端話者の音声v(t)とエコーy(t)に加えて更にノイズも拾ってしまうこと、エコー経路EPが動的に変化すること、等が原因となって、減算部23からの出力信号e(t)にエコーが残留している。損失挿入部24は、この残留エコーを抑圧するために、信号e(t)のゲインを調節して信号e(t)に損失を挿入する。また、ゲイン制御部25は、近端話者の音声v(t)がある時に、信号e(t)のゲインを信号e(t)に損失が生じないように制御する(ゲインを1にする等)ことで、近端話者の音声の語頭や語尾の欠落がない通話を実現する。
【非特許文献1】T. Gansler et al.、“The fast normalized cross-correlation double-talk detector”、「Signal Processing」、vol.86、pp.1124-1139、2006年6月
【非特許文献2】藤井健作他、“エコー経路変動検出を併用するダブルトーク検出法”、「電子情報通信学会論文誌A」、第J78−A巻、第3号、314−322頁、1995年3月
【非特許文献3】J. Benesty et al.、“A New Class of Doubletalk Detectors Based on Cross-Correlation”、「IEEE Transactions on Speech and Audio Processing」、vol.8、pp.168-172、2000年3月
【発明の開示】
【発明が解決しようとする課題】
【0008】
上述したように、ダブルトークの際に適応フィルタ21のフィルタ係数が更新されないようにして適切なエコー除去を実現するためには、近端話者の音声v(t)を検出することが必要である。しかしながら、上記第1の検出方法はエコー経路EPの利得が1より小さいことや、近端話者の音声v(t)のレベルがエコーy(t)のレベルより高いこと等を前提とするものであるが、実際にはそのような前提が必ずしも成り立つわけではないため、近端話者の音声v(t)を誤って検出したり、誤検出により通話品質が劣化したりといったようなことが起きてしまう。また、上記第2の方法は、上述のとおりエコー経路の変化を検出する仕組みが必要であるので、エコーキャンセラの構成が複雑になり、また必要な演算量やメモリ容量が多くなってしまう問題がある。更に、上記したエコーy(t)のコヒーレンスを利用する方法では、エコー経路における遅延を正確に計算することが必要なため演算量が多いという問題があり、相互相関関数等を利用する方法は、適応フィルタ21のフィルタ係数が収束した状態でないと使用できない問題がある。
【0009】
本発明は上記の点に鑑みてなされたものであり、その目的は、ダブルトークにおける近端話者の音声v(t)を誤検出が少なく簡単な構成で検出することが可能な音響エコー除去装置を提供することにある。
【課題を解決するための手段】
【0010】
本発明は上記の課題を解決するためになされたものであり、スピーカから放音されてマイクロホンにより収音された音声信号から、前記スピーカから放音された音のエコーを除去する音響エコー除去装置において、前記スピーカから前記マイクロホンまでのエコー経路のインパルス応答を推定して順次更新し、該更新したインパルス応答に基づいて前記エコーを模擬した擬似エコーを生成する適応フィルタと、前記マイクロホンにより収音した音声信号から前記適応フィルタにより生成した擬似エコーを減算する減算手段と、前記減算手段の出力信号を基に、前記スピーカから前記マイクロホンまでのエコー経路において信号強度が減衰する所定の周波数帯域成分を抽出し、該抽出された信号成分の信号強度に基づいてダブルトークの有無を検出するダブルトーク検出手段と、前記ダブルトーク検出手段によりダブルトークが検出された場合に前記適応フィルタにおけるインパルス応答の更新を停止又は更新量を減少させる制御手段と、を備えることを特徴とする。
【0011】
また、本発明は、上記音響エコー除去装置において、前記所定の周波数帯域は、前記スピーカから放音された音の強度が他の周波数帯域よりも小さくなる周波数帯域に設定されたことを特徴とする。
【0012】
また、本発明は、上記音響エコー除去装置において、前記ダブルトーク検出手段は、前記抽出された信号成分の信号レベルを計算する信号レベル計算手段と、前記抽出された信号成分を基に騒音レベルを計算する騒音レベル計算手段と、前記計算された騒音レベルに対する前記計算された信号レベルの比を計算し、該計算された比が、所定の閾値より大きい場合にダブルトークと判断し、所定の閾値より小さい場合にダブルトークでないと判断する比較手段と、を有することを特徴とする。
【0013】
また、本発明は、上記音響エコー除去装置において、前記減算手段の出力にゲインを乗じて損失を挿入する損失挿入手段と、前記ダブルトーク検出手段によりダブルトークが検出された場合に前記損失挿入手段の前記ゲインを増加させるゲイン制御手段と、を更に備えることを特徴とする。
【発明の効果】
【0014】
本発明によれば、スピーカからマイクロホンまでのエコー経路において信号強度が減衰する所定の周波数帯域成分を用いることによって、ダブルトークの有無を検出する。この周波数帯域においては、エコーの信号強度は減衰するが、エコー以外の近端話者の音声は減衰しないので、当該周波数帯域の成分の信号強度に基づいてダブルトークを検出することができる。この原理では従来方法のような特別な条件を前提としていないので、ダブルトークを検出する際の誤検出が少なく、また、上記の周波数帯域成分を抽出すればよいので、簡単な構成でダブルトークの検出が可能である。
【発明を実施するための最良の形態】
【0015】
以下、図面を参照しながら本発明の実施形態について詳しく説明する。
図1は、本発明の一実施形態によるエコーキャンセラ10(音響エコー除去装置)の構成を示すブロック図である。エコーキャンセラ10は、携帯電話端末1の内部に設けられて携帯電話端末1による通話時のエコーを除去する装置であり、適応フィルタ11と、ダブルトーク検出部12と、減算部13と、ステップサイズ制御部14と、から構成されている。ダブルトーク検出部12は、低域抽出部121と、信号レベル計算部122と、騒音レベル計算部123と、比較部124と、から構成されている。
【0016】
ここで、携帯電話端末1はスピーカ16とマイクロホン17とを有しており、近端話者は、この携帯電話端末1を用いて遠端話者との通話を行う。当該通話において、遠端話者の音声は遠端話者の使用する携帯電話端末から送信されて本携帯電話端末1により受信され、音声信号x(t)となる。この音声信号x(t)は、スピーカ16へ入力されて遠端話者からの音声として発音される。そして、スピーカ16から発音された音声はインパルス応答h(t)で特徴付けられるエコー経路EPを伝達(エコー経路EPやインパルス応答h(t)は時々刻々変化する)して、エコーy(t)となってマイクロホン17に到達する。マイクロホン17は、近端話者の音声v(t)を、このエコーy(t)とともに収音し、これらを合成した音声信号s(t)=v(t)+y(t)を出力する。エコーキャンセラ10は、その各部の処理によって当該音声信号s(t)からエコーy(t)を除去した信号e(t)を生成し、該生成した信号e(t)を遠端話者の携帯電話端末へ送信する。以下、エコーキャンセラ10の各部について説明する。
【0017】
適応フィルタ11は、遠端話者からの音声信号x(t)を入力として、該音声信号x(t)から実際のエコーy(t)を模擬した擬似エコーy’(t)を生成し出力する。具体的には、適応フィルタ11は、入力x(t)に対して所定のフィルタ係数を作用させる演算を行うことによって、擬似エコーy’(t)を算出する。適応フィルタ11のフィルタ係数は、スピーカ16からマイクロホン17までのエコー経路EPのインパルス応答を推定した推定インパルス応答h’(t)を表すものである。ここでインパルス応答h’(t)の推定は、減算部13の出力であるエコーを除去した信号e(t)が最も小さくなるように、適応的に行う。インパルス応答h(t)は時々刻々変化するので、適応フィルタ11は、推定インパルス応答h’(t)の推定、即ちフィルタ係数の更新を必要に応じた適宜の頻度で動的に行う。一般には、この頻度が高いほど、擬似エコーy’(t)を精度良く算出することができるため、エコー除去の精度も良くなる。但し、ダブルトークの際にはフィルタ係数の更新を実施するとフィルタ係数が誤って調整されてしまうので、ステップサイズ制御部14の指示(後述)に従ってフィルタ係数の更新を停止する(あるいは更新量を非常に小さくする)。これにより、適応フィルタ11は、ダブルトークでない時には随時、推定インパルス応答h’(t)に応じたフィルタ係数で擬似エコーy’(t)を生成して出力し、ダブルトークの際にはその直前のフィルタ係数による擬似エコーy’(t)を生成して出力する。
【0018】
なお、適応フィルタ11は、FIR(Finite Impulse Response:有限インパルス応答)型のフィルタ回路をデジタル信号処理回路によって実現したものであり、そのフィルタ係数を更新するアルゴリズムとしては、NLMS(Normalized Least Mean Square:規格化最小2乗平均)、RLS(Recursive Least Square:再帰最小2乗)、APA(Affine Projection Algorithm:アフィン射影アルゴリズム)等の各種アルゴリズムを用いることができる。
【0019】
減算部13は、適応フィルタ11が生成した擬似エコーy’(t)をマイクロホン17の出力s(t)から減算することによって、マイクロホン17で収音した音声からエコーを除去(キャンセル)した信号e(t)を生成する。この信号e(t)は、遠端話者の携帯電話端末へ送信されるとともに、近端話者の音声v(t)があるか否か、即ちダブルトークの状態であるか否かを判定するために、ダブルトーク検出部12へ入力される。
【0020】
ダブルトーク検出部12では、上記の信号e(t)が低域抽出部121へ入力される。低域抽出部121は、入力された信号e(t)から所定の周波数fcより低周波側の信号e(t)のみを抽出して出力するローパスフィルタである。
【0021】
本発明において低域抽出部121が果たす技術的な意義を説明する。携帯電話端末1は小型の装置であるため、スピーカ16には、小型のスピーカ、つまり低音域の再生能力に劣るスピーカが用いられるのが通常である。このようなスピーカを用いて再生した音声があるエコー経路を伝達し、マイクロホンで収音されたときの周波数特性の一例を図2に示す。図の横軸は周波数、縦軸は信号レベル(相対値)である。同図において、周波数がおよそ1kHz以下の低音域の信号レベルが大きく減衰している。スピーカ16(小型で低音再生能力が弱いスピーカ)から発音されてマイクロホン17へ到達したエコーy(t)も、図2と同様に低音域成分が少ない周波数特性を持つ。一方、近端話者の音声v(t)は、その発音源である近端話者にスピーカ16のような周波数特性はないため、低音域成分が減衰されることはなく、低音域成分は高音域成分と同等の信号レベルを有する。したがって、近端話者の音声v(t)が存在するダブルトークの際、低域抽出部121への入力信号e(t)には低音域成分が多く含まれるからその出力信号e(t)のレベルが大きくなり、反対にダブルトークでない時は、入力信号e(t)の低音域成分が少なくなって出力信号e(t)のレベルが小さくなることとなる。このように、本発明では、スピーカ16の音声再生能力が劣る周波数帯域の信号成分に着目している。これにより、当該信号成分が大きい場合はダブルトークと判断し、当該信号成分が小さい場合はダブルトークでないと判断することができる。
【0022】
なお、図2のような周波数特性の場合、低域抽出部121の所定周波数fcは、例えば800Hzとすればよい。
【0023】
ダブルトークの有無の判断は、低域抽出部121の出力信号e(t)から計算される信号対騒音比(Signal to Noise Ratio:SNR)を用いて行う。
具体的に、信号レベル計算部122は、信号e(t)を入力とし、該信号e(t)のピックを計算し得られたピックを信号レベルPs(t)として出力する。また騒音レベル計算部123は、信号レベル計算部122から出力される信号レベルPs(t)を入力とし、このPs(t)のボトム値(時間変化するPs(t)の局所的な最小値)を求め騒音レベルPn(t)として出力する。そして、比較部124は、信号レベル計算部122から出力される信号レベルPs(t)と騒音レベル計算部123から出力される騒音レベルPn(t)とを入力とし、騒音レベルPn(t)に対する信号レベルPs(t)の比を計算して、この比が所定の閾値Th以上であればダブルトークと判断し、閾値Thより小さければダブルトークでないと判断する。比較部124はこの判断結果に応じて、次式で表される制御情報Fをステップサイズ制御部14へ出力する。
【0024】
【数1】

【0025】
ステップサイズ制御部14は、入力された制御情報Fが0の場合、即ちダブルトークでない場合、適応フィルタ11に随時フィルタ係数の更新を実施するよう指示し、制御情報Fが1の場合、即ちダブルトークの場合、適応フィルタ11にフィルタ係数の更新を停止するよう指示する。この結果、適応フィルタ11からは、ダブルトークでない時には随時更新されたフィルタ係数により生成された精度の良い最適な擬似エコーy’(t)が出力され、ダブルトークの際にはその直前のフィルタ係数による擬似エコーy’(t)が出力される。これにより、エコーキャンセラ10から出力される信号e(t)は、ダブルトークでない時はエコーが精度良く除去されたものとなり、ダブルトークの際は不適切なフィルタ係数を用いたエコー除去が行われてしまうことによるエコー除去精度の劣化を防ぎつつ、適度にエコーが除去されたものとなる。
【0026】
なお、ここで適応フィルタ11のフィルタ係数の更新を「停止」するとは、フィルタ係数を更新するステップサイズを0とする場合、及びステップサイズを0に近い小さい値とする場合のいずれをも含むものとする。また、フィルタ係数を随時更新する際のステップサイズは、固定値としてもよいし、あるいは何らかの制御アルゴリズムに基づいて可変としてもよい。
【0027】
図3及び図4は、信号レベル計算部122と騒音レベル計算部123の具体的構成の一例を示すブロック図である。
図3において、信号レベル計算部122は、絶対値計算部1221と、乗算部1222と、加算部1223と、最大値計算部1224と、遅延部1225と、乗算部1226とから構成されている。絶対値計算部1221は、入力信号e(t)の絶対値を計算して出力する。乗算部1222は、絶対値計算部1221の出力に係数(1−α)を乗じて出力する。遅延部1225は、最大値計算部1224の出力を1サンプリング周期だけ遅延させて出力し、乗算部1226は、その出力に係数αを乗じて出力する。加算部1223は、乗算部1222及び乗算部1226の出力を加算して出力する。この値は、現在の入力信号の値と直前(1サンプリング周期前)における最大値(最大値計算部1224の出力)とを係数αで按分したものとなる。最大値計算部1224は、絶対値計算部1221の出力と加算部1223の出力を比較し、いずれか大きい方を信号レベルPs(t)として出力する。なお、係数αは、α=exp(−1/(Tr×Fs))であり、Trはリリースタイム、Fsはサンプリングレート(いずれも定数)である。信号レベル計算部122からは、現在の入力信号e(t)の絶対値が過去の値より大きければ現在の値が出力され、その逆であれば過去の値が出力されることとなり、入力信号e(t)の最大値が保持されて出力が行われることとなる。
【0028】
また、図4において、騒音レベル計算部123は、絶対値計算部1231と、乗算部1232と、加算部1233と、最小値計算部1234と、遅延部1235と、乗算部1236とから構成されている。絶対値計算部1231は、入力信号Ps(t)の絶対値を計算して出力する。乗算部1232は、絶対値計算部1231の出力に係数(1−β)を乗じて出力する。遅延部1235は、最小値計算部1234の出力を1サンプリング周期だけ遅延させて出力し、乗算部1236は、その出力に係数βを乗じて出力する。加算部1233は、乗算部1232及び乗算部1236の出力を加算して出力する。この値は、現在の入力信号の値と直前(1サンプリング周期前)における最小値(最小値計算部1234の出力)とを係数βで按分したものとなる。最小値計算部1234は、絶対値計算部1231の出力と加算部1233の出力を比較し、いずれか小さい方を信号レベルPn(t)として出力する。なお、係数βは、β=exp(−1/(Tr×Fs))であり、Trはリリースタイム、Fsはサンプリングレート(いずれも定数)である。騒音レベル計算部123からは、現在の入力信号Ps(t)の絶対値が過去の値より小さければ現在の値が出力され、その逆であれば過去の値が出力されることとなり、入力信号Ps(t)の最小値が保持されて出力が行われることとなる。
【0029】
以上説明したように、本実施形態によれば、スピーカ16の音声再生能力が劣る周波数帯域の信号成分に着目して、当該信号成分が大きい場合はダブルトークと判断し、当該信号成分が小さい場合はダブルトークでないと判断するようにした。したがって、従来方法のように特別な条件を前提としていないのでダブルトークを誤検出してしまうおそれが低減されるとともに、低域周波数成分を抽出すればよいので従来方法より構成が簡単且つ少ない演算量で正確にダブルトークを検出することができる。これにより、精度良くエコーを除去可能なエコーキャンセラを低コストに実現することができる。
【0030】
以上、図面を参照してこの発明の一実施形態について詳しく説明してきたが、具体的な構成は上述のものに限られることはなく、この発明の要旨を逸脱しない範囲内において様々な設計変更等をすることが可能である。
【0031】
例えば、上記実施形態ではスピーカ16が小型であるため低音の再生能力が十分でないことを想定しており、低域抽出部121によって低音域の周波数成分を抽出してダブルトークの有無の判断に利用したが、これに限られず、エコー経路EP(ここでいうエコー経路EPには、スピーカ16から発音される音声に音響的な影響を与えるスピーカ16以外の全ての存在を含む)によってエコーy(t)が減衰する周波数帯域であれば、同様にその周波数の信号を抽出することによってダブルトークの有無を判断することができる。つまり、低域抽出部121に代えて、近端話者の音声v(t)は減衰しないがエコーy(t)は減衰する周波数の信号を抽出するバンドパスフィルタを用いることによって、上記実施形態と同様の機能を有するエコーキャンセラを実現することができる。
【0032】
また、本発明のエコーキャンセラ10は、携帯電話端末1以外にも、スピーカ16とマイクロホン17を備えた装置であれば、例えばPDA(携帯情報端末)、携帯ゲーム機、ポータブル型カーナビ(カーナビゲーション装置)、固定電話端末、などにも適用することができる。
【0033】
また、低域抽出部121へ、マイクロホン17からの信号s(t)を直接入力する構成としてもよい。
【0034】
また、比較部124は、誤検出を更に低減するために、一旦Ps(t)/Pn(t)≧Thとなってダブルトークと判断した後、所定の時間内ではPs(t)/Pn(t)<Thでもダブルトークが継続しているとみなすようにしてもよい。
【0035】
また、上記実施形態のエコーキャンセラ10に、図5と同様、信号e(t)に残留している残留エコーを抑圧するために信号e(t)のゲインを調節して(信号e(t)にゲインを乗じて)信号e(t)に損失を挿入する損失挿入部と、ダブルトーク時に信号e(t)のゲインを信号e(t)に損失が生じないように制御する(ゲインを1にする、あるいは0から1の範囲内で大きくする等)ゲイン制御部と、を更に追加し、近端話者の音声の語頭や語尾の欠落がない通話を行えるようにしてもよい。
【図面の簡単な説明】
【0036】
【図1】本発明の一実施形態によるエコーキャンセラ(音響エコー除去装置)の構成を示すブロック図である。
【図2】スピーカを用いて再生した音声があるエコー経路を伝達し、マイクロホンで収音されたときの周波数特性の一例を示す図である。
【図3】信号レベル計算部の具体的構成の一例を示すブロック図である。
【図4】騒音レベル計算部の具体的構成の一例を示すブロック図である。
【図5】従来のエコーキャンセラの構成を示すブロック図である。
【符号の説明】
【0037】
1…携帯電話端末 10…エコーキャンセラ(音響エコー除去装置) 11…適応フィルタ 12…ダブルトーク検出部 13…減算部 14…ステップサイズ制御部 16…スピーカ 17…マイクロホン 121…低域抽出部 122…信号レベル計算部 123…騒音レベル計算部 124…比較部

【特許請求の範囲】
【請求項1】
スピーカから放音されてマイクロホンにより収音された音声信号から、前記スピーカから放音された音のエコーを除去する音響エコー除去装置において、
前記スピーカから前記マイクロホンまでのエコー経路のインパルス応答を推定して順次更新し、該更新したインパルス応答に基づいて前記エコーを模擬した擬似エコーを生成する適応フィルタと、
前記マイクロホンにより収音した音声信号から前記適応フィルタにより生成した擬似エコーを減算する減算手段と、
前記減算手段の出力信号を基に、前記スピーカから前記マイクロホンまでのエコー経路において信号強度が減衰する所定の周波数帯域成分を抽出し、該抽出された信号成分の信号強度に基づいてダブルトークの有無を検出するダブルトーク検出手段と、
前記ダブルトーク検出手段によりダブルトークが検出された場合に前記適応フィルタにおけるインパルス応答の更新を停止又は更新量を減少させる制御手段と、
を備えることを特徴とする音響エコー除去装置。
【請求項2】
前記所定の周波数帯域は、前記スピーカから放音された音の強度が他の周波数帯域よりも小さくなる周波数帯域に設定されたことを特徴とする請求項1に記載の音響エコー除去装置。
【請求項3】
前記ダブルトーク検出手段は、
前記抽出された信号成分の信号レベルを計算する信号レベル計算手段と、
前記抽出された信号成分を基に騒音レベルを計算する騒音レベル計算手段と、
前記計算された騒音レベルに対する前記計算された信号レベルの比を計算し、該計算された比が、所定の閾値より大きい場合にダブルトークと判断し、所定の閾値より小さい場合にダブルトークでないと判断する比較手段と、
を有することを特徴とする請求項1または請求項2に記載の音響エコー除去装置。
【請求項4】
前記減算手段の出力にゲインを乗じて損失を挿入する損失挿入手段と、
前記ダブルトーク検出手段によりダブルトークが検出された場合に前記損失挿入手段の前記ゲインを増加させるゲイン制御手段と、
を更に備えることを特徴とする請求項1から請求項3のいずれか1の項に記載の音響エコー除去装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公開番号】特開2009−246628(P2009−246628A)
【公開日】平成21年10月22日(2009.10.22)
【国際特許分類】
【出願番号】特願2008−89733(P2008−89733)
【出願日】平成20年3月31日(2008.3.31)
【出願人】(000004075)ヤマハ株式会社 (5,930)
【Fターム(参考)】