説明

クリアな信号の取得のための方法及びシステム

【課題】携帯電話等のハンズフリーの動作において背景雑音及びエコーの影響を低減する。
【解決手段】サブバンドのエコーキャンセラを用いて、エコーをキャンセルする構成を基本とする。更に、スピーカーの非線形を補償する。又、周波数領域での残留エコーに基づき規定した一群の周波数帯域に周波数依存非線形減衰ベクトルを適用する。周波数帯域毎に残留エコーを減少させつ為に付加的な減衰を与える。更に、適用アルゴリズムのステップサイズを可変する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、信号を取り込むための方法及びシステムに関し、さらには関連する信号処理技術に関する。さらに、本発明は、携帯電話又は非携帯電話のハンズフリー動作についての方法及びシステムに関する。
【背景技術】
【0002】
信号を取り込むための何らかのシステムにおいては、望ましくない信号を拒絶しながら所望の信号を取得することが目的となっている。信号処理技術は、受信した入力信号を処理するのに採用されており、望ましくない信号を除去しながら所望の信号を増強する。
【発明の開示】
【発明が解決しようとする課題】
【0003】
携帯型又は非携帯型の電話機のハンズフリー動作に関するシステムが直面する特定の問題は、音響エコー除去(AEC)問題である。AEC問題は、よく知られた問題で、図1に示すように説明することができ、遠端受信信号(x(n))が(例えば)自動車の中のスピーカに送信される。この信号は、音響経路(q(n))を介して自動車の内部を伝播して、エコー信号(c(n))を生成するマイクに戻る。エコー信号を除去するために、適応フィルタを使用するが、その目的は、適応フィルタ(g(n))を具えた音響エコー経路(q(n))を識別して、マイクの信号から得られる信号(y(n))を差し引くことである。(g(n))=(q(n))の場合、(y(n)=c(n))であり、マイクの信号から適応フィルタの出力信号を差し引くことで、エコー信号を除去する。
【0004】
AEC問題は、最小二乗平均アルゴリズム(LMS)、正規化最小二乗平均アルゴリズム(NLMS)、データ再利用正規化最小二乗平均アルゴリズム(DRNLMS)、再帰的最小二乗アルゴリズム(RLS)、アフィン射影アルゴリズム(APA)等といった、様々なタイプの適応フィルタアルゴリズムを使用することによって、従来のアプリケーションの中で扱われている。
【0005】
関連する別の問題は、適応フィルタアルゴリズムが、遠端の送信信号及び近端の受信信号アルゴリズムが同時に存在する場合にアルゴリズムの相違を防ぐために、いくつかのタイプの制御を要する。
【0006】
相違の問題は、ダブルトーク検出器(DTD)を導入することによって、既存のアプリケーションで扱われている。DTDは、適応フィルタアルゴリズム適応する条件を制限する。
【0007】
システムに対する特別な要請は、ノイズ信号(v(n))の存在下でうまく機能しなければならないことである。このような要請に合わせようとする試みの中で、雑音除去アルゴリズム(NC)が導入されている。様々な異なるアプローチが、スペクトル減算法、カルマンフィルタ、ニューラル・ネットワーク等に基づくアプローチを有するNCアルゴリズムを実施するために取られている。
【0008】
別の態様では、既存のアプリケーションが非線形プロセッサ(NLP)に導入されている。NLPは、最小平均二乗誤差(MSE)に達しない適応フィルタアルゴリズムの実施上の問題を補償し、特にソースのうちの一つが非線形スピーカである場合の非線形性を補償する。
【0009】
全体として、既存のアプリケーションは、様々なアプローチを取っており、音響エコー、適合アルゴリズムの相違、雑音、及びシステムの非線形性を扱う。音響エコー除去に関する初期の問題は、多くの様々な設計態様を含む変化をもたらす複雑な問題へと発展している。特定の問題を扱う際において様々なアプローチが取られているが、全体的な複雑な問題を未だ十分に扱っていない。
【0010】
参考資料が、S.Haykinによる「Adaptive Filter Theory」,Prentice Hall,Upper Saddle River,New Jersey,4th Edition,2002、P.S.R.Diniz,による「Adaptive Filtering−Algorithms and Practical Implementation」,Kluwer Academic Publishers,Dordrecht,The Netherlands,2nd Edition,2002、P.P.Vaidyanathanによる「Multirate Systems and Filter Banks」,Prentice Hall Signal Processing Series,Englewood Cliffs,New Jersey,1993、R.E.Crochiere,L.R.Rabinerによる「Multirate Digital Signal Processing」,Prentice Hall,Englewood Cliffs,NewJersey、S.T.Gay,J.Benestyによる「Acoustic Signal Processing for Telecommunication」,Kluwer Academic Publishers,Dordrecht,The Netherlands,2000、S.F.Bollによる「Suppression of acoustic noise in speech using spectral subtraction」,IEEE Trans.Acoust.,Speech,Signal Proc,vol.ASSP−27,Apr.1979、R.B.Jeannes,P.Scalart,G.Faucon,C.Beaugeantによる「Combined noise and echo reduction in hands free systems:A survey」,IEEE Trans.Speech Audio Processing,vol.9,pp808−820,November 2001、R.Martin,J.Altenhonerによる「Coupled Adaptive Filters for Acoustic Echo Control and Noise Reduction」,Proc.ICASSP 95,pp.3043−3046,May 1995、M.R.Petraglia,R.G.Alves,P.S.R.Dinizによる「New Structures for Adaptive Filtering in Subbands with Critical Sampling」,IEEE Transactions on Signal Processing,Vol.48,No.12,December 2000、M.R.Petraglia,R.G.Alves,P.S.R.Dinizによる「Convergence Analysis of an Oversampled Subband Adaptive Filtering Structure with Local Errors,」Proc.IEEE Int.Symp.on Circuits and Systems(ISCAS),May 2000に見られる。
【0011】
さらに、参考資料が、A.Stenger及びW.Kellermannによる「Adaptation of a Memoryless Preprocessor for Nonlinear Acoustic Echo Cancelling」In Signal Processing,vol.80,pp.1747−1760,Elsevier,September,2000、J.Sjoberg及びL.S.H.Ngiaによる、Nonlinear Modeling,Advanced Black−Box Techniques,chapter「Some Aspects of Neural Nets and Related Model Structures for Nonlinear System Identification」pages1−28,Kluwer Academic Publisher,1998、及びJ.E.Dennis及びR.B.Schnabelによる「Numerical Methods for Unconstrained Optimization and Nonlinear Equations」,Prentice−Hall,Englewood Cliffs,New Jersey,1983に見られる。
【0012】
前述の理由により、このような複雑な問題に対する現実的な解決法を提供するクリアな信号を取得するための方法及びシステムを改善する必要性がある。
【課題を解決するための手段】
【0013】
本発明の目的は、クリアな信号の取り込みのための改善した方法及びシステムを提供することである。このような改善した方法及びシステムは、改善した方法で特定の問題を扱ういくつかの個別的な態様を包含している。さらに、このような改善した方法及びシステムは、非常に複雑な問題の実際の解決法であるハンズフリーの実施を包含している。
【0014】
本発明は、5つの非線形処理方法を包含している。これらの方法は、非対称非線形適応フィルタ(ANLAF)と、周波数依存非線形プロセッサ(FD_NLP)と、非線形処理を改善するためのステップサイズ制御(SSC_NLP)と、仮想状態マシン(VSM)とダイナミック非線形補償(DNLC)とを有する。実際の適用では、非線形性のタイプに応じて、非線形パッケージの必要なパーツを使用して、システムの所望の性能に達する。
【0015】
本発明の一態様では、音響エコー除去(AEC)を提供する。背景雑音及び音響エコーの双方の付加によって破損した識別できない信号に起因するマイク信号が、識別できない信号を修復する目的で処理される。音響エコーは、音響パスによって変調されるスピーカ信号である。適応フィルタがエコーパスを形成する。本方法は、マイク信号を受信するステップと、スピーカ信号に全帯域で第1の非対称非線形適応フィルタを適用して、第1の出力信号を生成するステップとを具える。第1の出力信号に全帯域で第1の適応フィルタを適用して、音響エコーを形成する第1のエコー信号を生成する。マイク信号から第1のエコー信号を差し引いて、識別できない信号に類似する第1のエコーレス信号を生成する。第1のエコーレス信号に基づいて、第1の非線形適応フィルタを全帯域で適応し且つ適応フィルタを調整する。
【0016】
非対称非線形適応フィルタ法は、システムが、スピーカのパワーアンプのハードクリップ又はスピーカのソフトクリップのような非線形性を有するかどうかを判断する。非線形性を識別した後に、十分な補償がシステムに自動的に導入される。
【0017】
本発明の別の態様では、周波数領域のエコーレス信号に残留エコー減少フィルタを適用する。残留エコー減少フィルタの係数に基づいて平均帯域幅減衰ファクタを決定する。さらに、このような方法では、閾値を決定し、平均帯域幅減衰ファクタが閾値よりも小さい場合に、規定した一群の周波数帯域に周波数依存非線形減衰ベクトルを適用する。このような周波数依存非線形処理は、様々な周波数における音響エコー除去システムの様々な効果に基づいている。
【0018】
本発明の別の態様では、システムが極小から抜けて最小に達することができるように、適用アルゴリズムのステップサイズが増加する。これらの極小を非線形性によって生成して、適応フィルタアルゴリズムを潜在的に捕らえることができる。本発明の一態様によれば、近端及び遠端音声間の顕著な非線形関係を検出するための近端及び遠端音声の分類が行われる。顕著な非線形関係を検出する事象では、周波数領域における適応フィルタの調整レートを増やして、極小から抜けて最小に達する。
【0019】
さらに、本発明の別の態様によれば、状態微分器を使用してシステムの高性能を維持する。このような方法では、残留エコー減少フィルタを周波数領域エコー信号に適用する。状態微分器を使用して、近端及び遠端音声を分類し、近端及び遠端音声間の顕著な非線形関係を検出する。顕著な非線形関係が検出された場合には、残留エコー減少フィルタを調整して、顕著な非線形性がない場合に与えられる減衰量と比較して付加的な減衰を残留エコーに生成する。
【0020】
さらに、本発明の別の態様では、ダイナミック非線形補償を提供する。音量情報がシステムに与えられるケースでは、音量の動作範囲がパワーアンプ又はスピーカの非線形範囲の中にあり、このような非線形性の補償を基準信号で行うことができる。このような方法では、付加的な非線形処理を防止できるが、システムの音量情報を事前に知らなければならない。本発明のこのような態様によれば、適応フィルタの入力に先だって、システムの音量情報によって大きさが決まる非線形補償を入力信号に適用して、このようなダイナミック非線形予歪とともに、線形システムとしてシステムを処理することができる。
【発明を実施するための形態】
【0021】
図2は、サブバンド適応フィルタの構成を示す。使用する適応フィルタのアルゴリズムは、周波数領域の二次のDRNLMSである。雑音除去アルゴリズムを図3に示しており、周波数領域で実施される。このようにして、スピーカ及びマイク信号が周波数サブバンドに分けられ、AEC及びNCを周波数領域で実行して、出力信号を時間領域に変換して戻す。
【0022】
引き続き図2を参照すると、サブバンド適応フィルタ構造を使用して、スピーカ(x(n))及びマイク(d(n))信号をM個の帯域に各々分ける2つの解析フィルタバンクから成るサブバンドでNLMSを実行する。サブバンド信号を、ファクタLによって減らした後に、適応フィルタによって補正し、対応する帯域(E)の別々のエラー信号を使用する各サブフィルタ(G)の係数を独立して適応させる。エイリアシング効果を防止するために、このような構造は、サブバンドMの数よりも少ないダウンサンプリングファクタLを使用する。解析及び合成フィルターバンクを均一なDFTフィルタバンクによって実行できるため、解析及び合成フィルタは、ローパスプロトタイプフィルタのシフトバージョンである。すなわち、



ここで、iはi=0,1,...,M−1で、H(z)及びF(z)は、それぞれ、解析及び合成プロトタイプフィルタであり、さらに、



である。均一のフィルタバンクをWeighted Overlap−Add(WOA)法によって効果的に実行可能である。
【0023】
図2に関するNLMSアルゴリズムに基づくサブバンド構造の係数更新式は、



で与えられ、「」は、(k)の共役値を表す。さらに:



は、それぞれ、エラー信号、適応フィルタの出力及び各サブバンドのステップサイズ(刻み幅)である。
【0024】
ステップサイズが、基準信号の累乗で規格化した状態で現れることに留意されたい。また、μは実定数で、P(k)は、

0<β<1について、式:P(k+1)=βP(k)+(1−β)|X(k)|

によって帰納的に得られる基準信号X(k)の出力推定である。
【0025】
図示したサブバンド適応フィルタの2〜3の観測を行うことができる。識別すべきシステムが全帯域にN個の係数を有する場合、各サブバンド適応フィルタ((k))は、(k)とともに、N/Lの複素係数を具える列ベクトルである。D(k),X(k),Y(k)及びE(k)は、複素数である。Nの選択は、除去するエコー信号のテール長さに関し、例えば、fs=8kHzの場合、全帯域の時間領域適応フィルタに関する所望のテール長さは64msで、N=8000*0.064=512個の係数である。βは適応フィルタ((N−L)/N)の係数の数に関する。実入力信号についてのサブバンドの数は、M=(Number of FFT points)/2+1である。
【0026】
上式は、サブバンドのNLMSを記述しており、サブバンド適応フィルタ係数の更新値を使用して「新たな」エラー信号(E(k))を計算するのに必要なDRNLMSを取得して、サブバンド適応フィルタの係数を再び更新する:



ここで、j=2,...Rは、アルゴリズムで再使用する数を表しており、アルゴリズムの階数としても知られる。


及び



であることに注目されたい。
【0027】
引き続き図3を参照すると、雑音除去アルゴリズムが、音声信号s(n)が付加的な背景雑音ν(n)によって破損しているものと見なすため、得られる雑音のある音声信号d(n)を以下のように表すことができる。

d(n)=s(n)+ν(n)
【0028】
理想的には、雑音除去アルゴリズムの目的は、d(n)に基づいて観測できないs(n)を修復することである。AEC問題とは異なり、マイク信号から除去する必要のあるものが明白な場合、雑音除去問題は通常存在しない。このような雑音除去アルゴリズムの目的のために、背景雑音が、音声信号と比較して著しく遅い速度で変化する準安定雑音として規定される。
【0029】
雑音除去アルゴリズムは、周波数領域ベースのアルゴリズムである。長さ(2M−2)のDFTを具えたDFT解析フィルタバンクを具えて、雑音信号d(n)が、中心周波数を具えるDCからナイキスト周波数までの等間隔のM個のサブバンド信号、D(k),i=0,1...,M−1に分割される。DC及びナイキスト帯域(それぞれ、帯域0及びM−1)を除いて、他の全てのサブバンドは、全有効帯域幅の1/(M−1)に等しい同一の帯域幅を有する。各サブバンドにおいて準安定背景雑音の平均出力を探知し、それに応じてゲインを決定してサブバンド信号に適用する。続いて、DFT合成フィルタバンクによって、変調したサブバンド信号を結合して出力信号を生成する。他の周波数領域モジュール(例えばAEC)と結合する場合、DFT解析及び合成バンクを全てのモジュールの前部又は後部にそれぞれ移動させる。
【0030】
背景雑音は音声信号と比較してゆっくりと変化すると仮定するため、帰納的な推定量によって各サブバンドの出力を探知できる。

NZ,i(k)=(1−αNZ)PNZ(k−1)+αNZ|D(k)|
=PNZ,i(k−1)+αNZ(|D(k)|−PNZ,i(k−1))

ここで、パラメータαNZは、各フレームの重みを決める0と1との間の定数であり、平均有効時間である。また、このような推定に伴う問題は、推定が音声信号の平均出力を有することである。音声が散在的でない場合、顕著な過大評価となる可能性がある。このような問題を避けるために、背景雑音出力の確率モデルを使用して、現在のフレームがサブバンドの中に音声出力を有しているかどうかの尤度を推定する。尤度が低い場合、時定数αNZを減らして、出力推定における現在のフレームの影響を落とす。尤度が現在の入力及び最新の雑音出力の推定に基づいて計算される:



そして、雑音出力が、

NZ,i(k)=PNZ,i(k−1)+(αNZNZ,i(k))(|D(k)|−PNZ,i(k−1))

のように推定される。
【0031】
NZ(k)は、0と1との間であることが観測できる。それは、|D(k)|がPNZ,i(k−1)に等しい場合にのみ1に達するが、その差がより大きくなると0に向かって減少する。これにより、探知するために滑らかに移行できるが、劇的な変化が雑音の推定に影響を及ぼすのを防ぐことが可能となる。
【0032】
実際には、PNZ,i(k)の上界及び下界として機能するよう、あまり制約されない推定値を算出する。PNZ,i(k)がこのような境界によって規定される領域内にもはや無いものと検出される場合、PNZ,i(k)がこれらの境界に従って調整され適応を続行する。これにより、アルゴリズムの性能が強化されて、偶発的且つ突発的な雑音レベルの変化に適合し、又は雑音出力の推定が一貫性のない音声入力ストリームにより捕らえられるのを防ぐ。
【0033】
一般に、音声信号及び背景雑音は独立しているものと仮定することができるため、マイク信号の出力は、各サブバンドにおける音声信号の出力と背景雑音の出力とを合わせたものに等しい。マイク信号出力を|D(k)|として算出できる。有効な雑音出力を用いて、音声出力の推定は、

SP,i(k)=max(|D(k)|−PNZ,i(k),0)

であるため、最適なウィーナーフィルタ(Wiener filter)ゲインを、



のように、算出できる。
【0034】
しかしながら、背景雑音はランダム処理であるため、所定の時間におけるその正確な出力が、定常状態でさえもその平均出力付近を変動する。平均雑音出力を単に除去することによって、音楽性雑音又は湿った雑音(watery noise)と多くの場合称される素早い変化を伴う雑音レベルを生成する。これは、スペクトル減算法に基づくアルゴリズムに関連する主要な問題である。このため、適用する前に瞬間的なゲインGT,i(k)をさらに処理する必要がある。
【0035】
|D(k)|が、PNZ,i(k)よりも非常に大きい場合、雑音出力の変動が|D(k)|と比較して小さいため、GT,i(k)は非常に信頼性がある。一方、|D(k)|がPNZ,i(k)にぼぼ等しい場合、雑音出力の変動が顕著になるため、GT,i(k)が素早く変化して信頼できない。本発明の態様によれば、このようなケースでは、ゲイン係数の信頼性を改善するためにさらなる平均化が必要である。ゲイン係数に関する同じような規格化した変化を得るために、平均速度がゲインの二乗に比例することが必要である。このため、以下のアルゴリズムでGT,i(k)を平滑化することによって、ゲイン係数Goms,i(k)を算出する。



ここで、αは、0と1との間の時定数で、G0,i(k)は、最新のゲイン及び瞬間的なゲインの推定に基づいて既に推定されたGoms,i(k)である。出力信号を、



のように算出できる。
【0036】
oms,i(k)を、それがゼロに近い場合に長い時間かかって平均化し、それがほぼ1の場合に、短時間で平均化する。これにより、周囲の音声を生成することを避けながら、滑らかな雑音レベルを生成する。
【0037】
図4は、AEC性能を最適化するよう構成されたサブバンド適応フィルタ構成及び雑音除去アルゴリズムを示す。
【0038】
図1に示す従来技術のシステムを考慮すると、適応フィルタアルゴリズムをまず実施して、雑音除去の実行がその後に続く。適応フィルタアルゴリズムは従来では時間領域で実現されるために、このような方法では雑音除去アルゴリズムを周波数領域で実現するものと理解される。適応フィルタ及び雑音除去アルゴリズムの順序を変えると、NCアルゴリズムに起因するマイク信号経路での遅れを導入し、NCアルゴリズムに起因する非線形性を導入する。適応フィルタは、(それが線形システム(FIRフィルタ)であるため)非線形性を補償できない。
【0039】
図4の構成は、まずNCアルゴリズムを、その後で適応フィルタアルゴリズムを実行することによって、これらの制限を克服する。このような方法では、周囲の雑音を除去して、適応フィルタアルゴリズムの収束速度及びシステムによって取得される最大エコーリターンロスエンハンスメント(ERLE)が増加する。
【0040】
OMSゲイン係数の複製をサブバンド適応フィルタの出力にセットすることにより、OMSゲイン係数によって導入されるマイク入力の非線形性が補償される。さらに、周波数領域でサブバンド適応フィルタ構造及び雑音除去アルゴリズムを実施することによって、時間遅れの問題を回避することができる。
【0041】
図5は、AEC及びNC性能を最適化するよう構成されたサブバンド適応フィルタ構造及び雑音除去アルゴリズムを示す。図4は、NCアルゴリズムをAECアルゴリズムの前に置くことによって実現されるAECの改良を示すが、NCアルゴリズムの観点から、エコーの除去の後に適用すれば、NCアルゴリズムをもっと良く実行できるであろう。図5の構成は、双方のアルゴリズムを同時に最適化する。図示するように、第2のNCアルゴリズム(OMSブロック)をエコーレス信号の中で実行する。すなわち、適応フィルタがOMS及びOMSコピーブロックの存在の利益を享受する一方で、OMSブロックが適応フィルタの利益を享受する。このようにして、OMSブロックの出力がAEC及びNCの性能の点から見て顕著に利益を得る。
【0042】
図5に示す音響モデルから、マイク信号d(n)を以下のように分解できる。

d(n)=dne(n)+dfe(n)

ここで、近端成分dne(n)は、音声s(n)及び背景雑音ν(n)の合計であり、遠端成分dfe(n)は、音響経路:c(n)=q(n)×x(n)によって変調されるスピーカ信号である音響エコーである。NLMSフィルタは、相関関係を介してスピーカ信号(x(n))をマイク信号(d(n))に適合させることによって、音響経路を推定する。近端の音声及び背景雑音の双方が基準信号と相関関係がないと仮定するため、適応フィルタが音響経路q(n)に収束する。
【0043】
しかしながら、NLMSは、実際の勾配を単一のサンプルで近似している勾配ベースの適応アルゴリズムであるため、フィルタが収束した後でさえもフィルタ係数が理想的な解の周りをドリフトする。ドリフト又は誤調整の範囲は、主に2つの要因:すなわち、適応ゲイン定数μ及び近端及び遠端成分のエネルギ比に依存する。
【0044】
誤調整は、AEC性能の中で重要な役割を演じる。近端の音声又は背景雑音が存在する場合、これが近端遠端比を増加させるため誤調整を増加させる。このため、フィルタ係数がさらに理想的な解から逸れて、結果として残留エコーが大きくなる。このような問題は、通常、発散(divergence)と称される。
【0045】
従来のAECアルゴリズムは、現在の事象を4つのカテゴリ:すなわち、無音(遠端及び近端の音声がいずれも存在しない)、受信のみ(遠端音声のみ存在する)、送信のみ(近端音声のみ存在する)、ダブルトーク(遠端及び近端の双方の音声が存在する)、のうちの1つに分類するステートマシン(state machine)を配置することによって、発散の問題を扱っている。受信のみの状態の際にフィルタ係数を適応することによって、及びそうでなければ不完全な適応によって、従来のAECアルゴリズムは、近端遠端比の増加による発散を防止する。ステートマシンは両端での音声活動の方向に基づくため、このような方法は、多くの場合、ダブルトーク検出(DTD)と称される。
【0046】
多くのアプリケーションでうまく動作するが、DTDは2つの基本的な問題を受け継いでいる。第1に、それは近端の背景雑音をファクタとして完全に無視している。第2に、それは、受信のみの状態でフィルタの適応ができるだけであるため、他の状態の際にエコー経路の変化を扱うことができない。DTDは、背景雑音のレベルが無視できて近端音声が散在的である場合に、これらの問題を切り抜けることができる。しかしながら、背景雑音が顕著である場合、状態検出の精度が劣っているだけでなく、ダイナミックトラッキングと発散の防止との間のバランスもまた難しくなる。このため、従来のDTDベースのシステムに多くのチューニング効果が必要であり、システムのロバスト性が多くの場合問題である。
【0047】
さらに、従来のDTDベースのシステムは、多くの場合検出状態に従った出力信号を扱っており、より優れたエコーの減少を実現する。これは、多くの場合、雑音下で半二重のような性能となる。
【0048】
従来のDTDの欠陥を克服するために、より精巧なダブルトーク制御を使用して、より優れたAEC全体の性能を実現する。上記のように、誤調整は主として2つのファクタに依存する:すなわち、適応ゲイン定数及び近端遠端比である。このため、近端遠端比に対するカウンタバランスとして適応ゲイン定数を使用することによって、一定のレベルに誤調整を保持できるため、発散を減らす。これを実現するために、



である必要がある。
【0049】
近端成分が無い場合、フィルタ適応がフルスピードで進むことができる。近端遠端比が増加すると、フィルタ適応がそれに応じて減少する。最終的に、遠端成分が無い場合に、有効なエコー経路に関する情報が無いため、フィルタ適応が停止する。理論的には、このような方策は、ダイナミックトラッキングの能力とフィルタ発散制御との最適なバランスを実現する。さらに、各サブバンドの適応フィルタが他のサブバンドのフィルタから独立しているため、このようなゲイン制御の決定は各サブバンドで独立してなされて、より効果的となる。
【0050】
このような方策の大きな支障は、遠端(又は同様に近端)成分の利用可能性である。これらの成分へのアクセスとともに、AECシステムの必要性が無い。このため、適応ゲイン制御で近似した形式を使用する。



ここで、最大適応ゲインを表すγは定数である。フィルタが合理的に収束に近い場合、Y(k)がi番目のサブバンドの遠端成分に近づくため、E{D(k)Y(k)}が遠端エネルギに近づく。実際は、エネルギ比が、0と1とを(包含して)境界とするその理論的な範囲に限定されることに留意されたい。このようなゲイン制御の決定は、次の議論で扱うこととする2つの例外とともに、多くの条件下で効果的に機能する。
【0051】
上記から、E{D(k)Y(k)}が、適応フィルタが発散する場合のみ遠端成分のエネルギに近づく。これは、フィルタが発散しない場合、遠端エネルギの過大評価又は過小評価が起きる可能性があることを意味する。しかしながら、フィルタが発散する後だけに誤調整又は発散の増加が問題となるため、過大評価された遠端エネルギは、ネガティブな得失なしに、実際には発散プロセスを速めるのを促進する。一方、過小評価した遠端エネルギは、発散プロセスを抑制するか又は無効にさえするため、上記のゲイン制御の決定に影響する。
【0052】
特に、遠端エネルギの過小評価は、E{D(k)Y(k)}が遠端成分のエネルギE{|Dfe(k)|}よりも非常に小さい場合に発生する。全ての可能性のあるシナリオを解析することによって、過小評価が主として以下の2つの状況において生じる:すなわち、(1)システムをリセットして全てのフィルタ係数をゼロに初期化し、Y(k)がゼロになる場合。これにより、適応ゲインμがゼロになって、適応システムが結果としてトラップされる。(2)エコー経路のゲインが突発的に増加して、以前のサンプルに基づいて算出されるY(k)が、実際の遠端成分よりも大きく弱まる場合。これは、スピーカとマイクとの間の距離が突発的に減少する場合に発生する。さらに、基準信号が、スピーカに到達する前に独立した音量制御器を通過する場合、音量制御ゲインもまたエコー経路に影響を与えるであろう。このため、音量を上げるとエコー経路ゲインもまた大幅に増加させる。
【0053】
第1の状況では、適応ゲイン制御が、システムをリセットした直後に短い時間停止して、フィルタ適応の開始を促進する。第2の状況では、補助フィルタ((k))を導入して過小評価の問題を取り除く。この補助フィルタは、図6に示すように、メインフィルタと平行な、単純なサブバンドNLMSフィルタであり、タップの数がメインのエコー経路をカバーするのに十分である。その適応ゲイン定数は、適応ゲイン又はダブルトーク制御機構無しに顕著な発散が起きないように、十分小さくなければならない。各適応の後、各サブバンドにおける2基準のメイン及び補助フィルタを算出する:



これらは、それぞれ双方のフィルタからのエコー経路のゲインの推定である。補助フィルタはゲイン制御決定によって制約されないため、いつでも自由に適応できる。メインフィルタの過小評価のファクタを、



のように推定することができ、ダブルトークベースの適合ゲイン制御決定を



にように、修正可能である。
【0054】
エコー経路のゲインがメインフィルタのそれを上回る場合、補助フィルタは、システムの性能のみに影響することが認められる。さらに、RatSqGが0と1との間に限定されるため、補助フィルタは、メインフィルタの適応のみを加速させる。
【0055】
上記のように、音響エコー除去問題は、エコー経路を線形有限インパルス応答(FIR)システムによってモデル化できるという仮定に基づいて取り組まれるが、これはマイクによって受信される遠端成分が、FIRフィルタによって変換されるスピーカ信号の結果であることを意味する。AECフィルタは、サブバンドNLMSベースの適応アルゴリズムを使用して、スピーカ及びマイク信号からのフィルタを推定し、マイク信号から遠端成分を除去する。
【0056】
残留エコーは、通常適応フィルタの出力の中に残される。まず第一に、線形FIRモデルは厳密に満足しないようである。さらに、エコー経路は時間とともに変化し、適応フィルタが、それがどんなに速く適応しようとも遅れを取る。最後に、適応フィルタの誤調整が、モデルが完全なものであってもフィルタ推定エラーとなり、エコー経路は時間不変で、アルゴリズムが完全に収束する。残留エコーは、通常は、AEC性能を満足できないものにする。このため、さらに、近端音声を顕著に損傷することなしに残留エコーを減衰させることが望ましい。
【0057】
残留エコー減少(RER)フィルタを図7に示しており、このような目的を実現するために使用する。システム全体の構造を受けて、それは各サブバンドで独立して働く。各サブバンドでは、ワンタップのNLMSフィルタをメインのAECフィルタ出力(E(k))で理想的な信号として実施する。マイク信号(D(k))を基準信号として使用する場合、ワンタップのフィルタが



に収束する。
【0058】
マイク信号が遠端成分を大部分含む場合、それの多くはメインのAECフィルタによってE(k)から除去すべきであるため、Gr,i(k)の絶対値は、ゼロに近くなければならない。一方、マイク信号が近端信号を大部分含む場合、E(k)はD(k)に近くなければならないため、Gr,i(k)は1に近づく。このため、E(k)に対するゲインとして|Gr,i(k)|を適用することにより、近端の音声をほとんど損なわずに残留エコーを大きく減衰させることができる。
【0059】
近端音声をさらに保護するために、ワンタップのNLMフィルタへの入力信号をD(k)からF(k)に変えることができる。F(k)は、D(k)及びE(k)の重みを付けされた線形結合であり、

(k)=(1−RNE,i(k))D(k)+RNE(k)E(k)

のように定義される。
ここで、RNE(k)は、近端エネルギ比の瞬間的な推定である。このような変化と共に、G(k)の解が



となる。RNE(k)が1に近づくとF(k)が事実上E(k)になると認められるため、G(k)が1に留まらざるを得ない。一方、RNE(k)が0に近づくとF(k)が事実上D(k)になるため、G(k)が上記の定義に戻る。このため、RERフィルタは、同様な残留エコーの減少性能を実現しつつ、このような修正と共に近端音声を良好に維持する。
【0060】
|G(k)|をE(k)に対するゲインとして適用するため、RERフィルタの適応レートが出力信号の質に著しく影響を及ぼす。適応が遅すぎる場合、エコー事象の後のオンセットの近端音声を著しく減衰させることができ、近端音声を同様に周囲音とすることができる。一方、適応が速すぎる場合、望ましくない残留エコーが急に出現して背景が湿る可能性がある。最適なバランスを実現するために、適応ステップサイズ制御(ASC)をRERフィルタの適応ゲイン定数に適用する。



ASC(k)|Gr,iが、最新の推定に加えてワンステップ先の推定によって決定されるものと認められる。周波数に依存するパラメータαASC,iは、ワンステップ先の重みを決定するが、以下のように定義される。

αASC,i=1−exp(−M/(2i)),i=0,1...,(M/2)

ここで、MはDFTサイズである。これは、同じ数のサンプルが高周波数のサブバンドの長い区間をカバーするため、より高周波数のサブバンドのワンステップ先を強調し、これによりワンステップ先でより信頼性の高いものとなる。このような構成により、高周波数で柔軟性がより高くなり、近端音声の高周波成分を維持する。
【0061】
発散制御システムは、適応アルゴリズムのまれな発散からシステムの出力を基本的に保護するが、それは、ハンズフリーシステムの各サブバンドのエネルギ保存理論に基づいている。
【0062】
図8は、発散制御システムのブロック図を示しており、それは、各サブバンドで適応フィルタ(Y(k))の出力とマイク信号(D(k))の出力とを比較する。マイク信号からエネルギ(エコー)が引き出されているため、適応フィルタの出力パワーは各サブバンドにおいてマイク信号の出力と同じかそれ以下でなくてはならず、これが生じていなければ、適応サブフィルタがシステムにエネルギを加えることを意味するとともに適応アルゴリズムが分岐したことが仮定され、これが生じていれば減算ブロック(E(k))の出力はマイク信号(D(k))により置換される。
【0063】
また、発散制御システムをOMS1の後及びRER計算の前の減算ブロックとして使用し、メイン適応フィルタの発散のケースにおけるRERの性能を改善する。
【0064】
快適ノイズジェネレータ(CNG)の目的は、残留エコーの減少による出力信号における雑音レベルでの不規則性を補償することである。基本的に、各サブバンドについて、残留エコー減少ブロックの前の雑音レベルの大きさの推定が行われ、残留エコー減少ブロックの後の信号強度と比較される。RERブロックの後の信号強度がRERブロックの前の信号強度よりも小さい場合、これら2つの信号間の差による強度を有する信号及びランダム位相が出力信号に加わるか、そうでなければ何も加わらない。また、提案されたCNGが、マイク信号の周波数領域の中に存在する不連続性を補償でき、これがシステムの出力信号の質の可聴型の改善を与えることに注目されたい。
【0065】
また、非線形プロセッサ(NLP)として知られるセンタークリッピングを実施して、出力信号にさらに存在する同じような残留エコーを除去するが、それは、時間領域で動作し、予め規定した閾値(Th)よりも小さな絶対値を有するサンプルを基本的にゼロにする。2つの異なる方法があり、それらが、図9A−9Bに与えられている。
【0066】
完全なシステムのブロック図を図10に与える。図10は、システムの異なる部分をどのように一緒に実施するのかを示す。
【0067】
ブロックTD−CCは、時間領域におけるセンタークリッピングの実施を示す。ブロックCNGは、快適ノイズジェネレータを示しており、Gr1...M−1コピーブロックで表されるRERアルゴリズムの後の周波数領域で実施される。
【0068】
図10に示すシステムは、ある状況、特に強い非線形性が存在する場合には、残留エコーを具えた出力信号を生成する。非線形性は、一般に、アンプ及び/又はスピーカによるものであり、さらには、高い音量でシステムを動作させる要求により複雑になる。スピーカ及びマイクが非常に近接しているハンズフリーの携帯電話機といったアプリケーションでは、エコーと近端音声との比の大きな差が問題となる。このような非線形性の結果、新たなハーモニック成分がエコー信号の中に生成され、これによりある種の非線形プロセッサを必要として音響エコー除去器の性能を改善する。
【0069】
本発明に係るこのような好適な実施例は、5つの異なる方法を用いて、非線形性によるシステムの残留エコーを除去する。これらの方法は、非対称的な非線形適応フィルタ(ANLAF)と、周波数依存非線形プロセッサ(FD_NLP)と、非線形処理(SSC_NLP)を改善するためのステップサイズ制御と、仮想状態マシン(VSM)と、ダイナミック非線形補償(DNLC)とを有する。本発明に係る好適な実施例によれば、非線形パッケージがこれらのパーツから成る。
【0070】
非線形パッケージの様々な部分についての基本的な説明:
【0071】
ANLAF−非対称性の非線形性適応フィルタ
この部分は、システムが、スピーカのパワーアンプのハードクリップ又はスピーカのソフトクリップといった非線形性を有するかどうかを判定する。非線形性を認識した後に、十分な補償をシステムに自動的に導入する。
【0072】
FD_NLP−周波数依存非線形性プロセッサ
この部分は、様々な周波数における音響エコー除去システムの異なる効果に基づいている。まず、ハンズフリーの携帯電話といった適用において、高い音量における動作が高周波数帯域のみにおいて残留エコーを生成する場合に、非線形性の存在が認められる。このような情報を使用して、高い周波数残留エコーを減らす音響アルゴリズムを開発した。
【0073】
SSC_NLP−非線形処理を改善するためのステップサイズ制御
MSE(平均平方誤差)の最小化の際に、非線形性は、適応フィルタアルゴリズムを捕捉する極小を生成できる。適応アルゴリズムのステップサイズを増加させることによって、システムが極小から抜けて最小に達することができる。
【0074】
VSM−仮想状態マシン
この部分は、従来の状態マシンと同様な方法で動作するが、それは、非線形性を検出する場合のみ使用され、通常の状態におけるシステムの高質の性能を保存する。
【0075】
DNLC−ダイナミック非線形補償
上記の4つの方法を、基本的に、HFKシステムが音量制御についての情報を有しないシステムに使用する。言い換えれば、音量の変更を、HFKシステムが参照信号を取り込んだ後に独立して行う。しかしながら、音量情報をHFKシステムに与えるケースでは、音量の動作範囲がパワーアンプ又はスピーカの非線形範囲の中にあり、このような非線形性の補償を基準信号で行うことができる。このような方法では、付加的な非線形処理を防止できるが、システムの音量情報を事前に知らなければならない。
【0076】
非線形パッケージの実施とともに、ハンズフリーの携帯電話及び非常に音量が大きいハンズフリーの自動車システムといった非常に難しい適用を含む、様々な状況において優れた性能を得ることができるものと考えられている。非線形パッケージからの様々なユニットの選択が、目的とする適用に基づいてなされることに注目されたい。
【0077】
非線形パッケージは、様々な方法を含んでおり、非線形性によりシステムに残存するエコーを除去する。これらの方法は、以下のものを含む:
・非対称クリッピングポイントのためのANLAFの導出
・何らかのタイプの非線形性が、選択した周波数帯域のみに残留エコーを生成するものと仮定するFD_NLPの提案
・適応フィルタのMSE面で何らかの非線形性が極小を生成するものと仮定するSSC_NLP
・非線形性を検出した場合に限り使用可能な仮想状態マシン
・音量に依存する非線形補償
【0078】
非線形パッケージ
非線形パッケージは、5つの異なる成分を含んでいる、すなわち、ANLAF、FD_NLP、SSC_NLP、VSM及びDNLCである。このセクションでは、これら全てのパーツを詳細に説明することとする。
【0079】
非対称非線形適応フィルタ
AEC(音響エコー除去)システムにおける非線形性の主要な原因の1つは、大きなアンプ信号のためにパワーアンプ又はスピーカにおける非線形性が存在することによるものである。このような問題を扱うために、メモリレスの非線形適応フィルタが従来技術で提案された。
【0080】
従来技術では、適応アルゴリズムが、対称ハードクリップポイントのみを考慮する。しかしながら、いくつかのアプリケーションでは、パワーアンプ又はスピーカの様々な特性のため、クリップポイントを非対称的にできる。
【0081】
ANLAFを示すブロック図を図11に示しており、システム、パワーアンプ(Amp.)及びスピーカが、ポイント「a」及び「b」で異なるハードクリッピングポイントを有すると仮定する。クリップした後に、基準信号x(n)が音響経路q(n)を通って伝播して、エコー信号c(n)を生成するマイクによって取り込まれる。エコー信号を除去するために、非線形適応フィルタを使用して、音響エコー経路q(n)を識別するためのFIR(有限インパルス応答)適応フィルタg(n)と直列なクリッピングポイント(図11において「c」及び「d」で表す)を決定する。そして、適応フィルタの出力がマイク信号から差し引かれる。c=a、d=b及びg(n)=q(n)の場合、y(n)=c(n)であることが容易に認められる。このため、マイク信号から適応フィルタの出力信号を減算することで、エコー信号を除去できる。
【0082】
プリプロセッサ及びFIRフィルタのジョイントNLMS適応アルゴリズムは、表1のように与えられる。


【0083】
x(n)は、基準信号を示しており、Nは、適応フィルタのタップの数で、z(n)は、一般にR次の多項式からなる非線形プロセッサであり、このようなケースでは、



となる。
【0084】
p(n)は、非線形プロセッサの出力であり、g(n)は、適応フィルタの係数を具えたN次のベクトルで、d(n)は、マイク信号で、e(n)は、エラー信号で、μは、多項式z(n)の係数を特定する適応フィルタの更新のステップサイズで、一次の導関数を表しており、αgは、適応フィルタg(n)のステップサイズである。
【0085】
非線形性が対称的なハードクリップ(l_clip(lower clipping)=u_clip(upper clipping)=p_clip)に起因する第1のケースでは、関数f(z,x)及び導関数f’(z,x)が、



によって与えられる。
【0086】
非対称のクリッピングポイントシステムについては、上記のような考え方を一連の2つの非線形システムに拡張しており、図2に示すように、一方は、上位クリッピングポイントを表し、他方は下位クリッピングポイントを表す。
【0087】
ここで、様々なクリッピングポイントについての更新式及び適応フィルタを、表2で与えることとする。


【0088】
このとき、関数f(z_upper,x),f(z_lower,pl)及び導関数が以下のように与えられる:


【0089】
図10のAECシステムを考えると、この部分で提案されたアプローチは、並列経路として独立してANLAFを使用してクリッピングポイントを決定し、必要に応じてアルゴリズムのメイン経路のフィルタにおける非線形性を補償することである。このような方法の構造を図13に示す。
【0090】
また、このような構造に導入される時間領域適応フィルタはダブルトーク制御(DTC)を有して、適応アルゴリズムの安定性を保証する。それは、以下の式、



で与えられる周波数領域の中で既に計算された各成分を平均化することで得られる。ここでMは、FFTの大きさを2で除算したもので、D(k)は、マイク信号d(n)のスペクトルで、Y(k)は、メインフィルタのアウトプットy(n)のスペクトルである。
【0091】
表2に示すように、DTCfullbmdは、μz_upper,μz_lower及びαの項を乗算したものであることに注目されたい。
【0092】
メインの適応フィルタにおけるクリッピングを補償するための判定の例は、
−入力信号x(n)が、クリップポイントに対してどのくらい大きいか又は小さいか、すなわち、補償がx(n)> Th_up*z_upper又はx(n)>−Th_lower*z_lowerの場合に限りなされるか。

−アルゴリズムの性能を保護するためにクリッピングポイントの下部閾値を規定できて、クリップポイントがこの閾値よりも小さい場合に、補償が成されないかどうか。

−また、レシーブ・イン及びレシーブ・アウト信号を用いてERLEの推定ができるかどうか、そして、クリッピングポイントの補償がERLEを改善しない場合、それを不能にできるか。
【0093】
様々なシステム又はアプリケーションが、ANLAFのための様々なチューニングパラメータを生成できることに注目されたい。
【0094】
周波数に依存する非線形プロセッサ
FD_NLPは、所定のタイプの非線形性がシステムに存在する場合に、様々な周波数におけるAECシステムの有効性に基づいている。基本的に、高い音量で動作するハンズフリーの送受話器といったシステム用に実験的に検証されたように、アルゴリズムの性能は、低周波数帯域のエコーに対して非常に良好である。しかしながら、高周波数帯域では、システムは同じ性能を有しない。言い換えれば、残留エコーの大部分が高周波数特性のみを有するということができる。
【0095】
システムの一連の動作を改善するために、パラメータGr,i(k)(残留エコーの減衰)から引き出される情報をファクタの算出に使用する。



ここで、



Eは、期待値を示し、D(k)はマイク信号d(n)のスペクトルであり、E(k)は、エラー信号e(n)のスペクトルであり、*は複素共役演算を表し、L_band及びH_bandは、Gr,i(k)がシステムの良好な動作を有する領域の下界及び上界に対応する。明らかに、この領域は、実際の適用及びハードウェアの特性に依存するため、各システムが異なる境界を有する。
【0096】
算出したBattが、ある閾値(Th_B)よりも小さい場合に、規定した一群の周波数帯域に周波数領域における一定の減衰Att_FDNLPを適用する。すなわち、

if Batt(k)≦Th_B
FDNLP_vector(G_band)=Att_FDNLP
end
である。
【0097】
一般に、G_bandは一群の高周波数帯域であり、得られるFDNLP_vectorを、図15に示すように、AECシステムに適用する。
【0098】
図10に示すシステムでは、メインの適用フィルタi番目のサブバンドのステップサイズμ



で与えられる。ここで、



であり、γは、最大適応ゲインで、D(k)はマイク信号d(n)のスペクトルで、Y(k)は、メインフィルタの出力y(n)で、SqGa(k),SqGb(k)は、それぞれ、メイン及び補助的な適応フィルタの2次の係数である。遠端信号x(n)(又はフィルタ出力y(n))及びマイク信号d(n)が、エコー経路の変化又は非線形性により、線形従属でないケースでは、パラメータμが、所望の値よりも小さくなる。これが高い残留エコーの原因となる。
【0099】
以下のように与えられる、任意の信号a及びbのコヒーレンス関数を考える。

ab,i(k)=|Pab,i(k)|/(P(k)+P(k))

ここで、Pab,i(k)は、a及びbのクロスパワースペクトルで、P(k)は、aのパワースペクトルで、P(k)はbのパワースペクトルである。コヒーレンス関数は、a、b間の周波数依存関係を示す。Cab,i(k)が、ある周波数iにおいて1の場合、その周波数においてa、b間の完全相関(又はaはbに対して線形従属する)関係を有する。
【0100】


の変動が、リアルタイムの実施ではCab,i(k)のそれよりも小さいという事実により、実際の実施では、以下の近似を使用する:



このため、RatFEは、

をRatFEと比較することにより、すでに近似されたコヒーレンス関数である。
【0101】
そして、提案された解決法は、近端及び遠端音声を以下のように分類する際に、RatFEをD(k)及びY(k)間で線形従属する測定値として使用することである。

【0102】
一般に、上界LT_HBとして0.7を選択し、下界LT_LBとして0.4を選択する。
【0103】
分類2のケースでは、補助フィルタGb(k)の適応ステップサイズが、初期値0.1の代わりに1に設定される。このステップサイズは、補助フィルタの収束速度を増加させ、所望のμの値を最終的に増加させる小さなRatSqGとなる。このため、μは通常推定されるよりも大きな値を有し、2つの効果を与える。第1の効果は、最急降下方向での大きなステップサイズにより、非線形推定問題においてメインの適応フィルタが極小から抜け易くなることである。第2の効果は、大きなステップサイズがメインフィルタの収束をスピードアップすることである。これら2つの効果は、残留エコーを減少させるための組み合わせた結果を与える。
【0104】
分類1及び3のケースにおいて、補助フィルタGb(k)のための適応ステップサイズを初期値0.1に設定していることに注目されたい。この解は、好適な実施では、メインフィルタGa(k)のステップサイズを直接変える代わりに、補助フィルタGb(k)のための適応ステップサイズを修正して、近端及び遠端音声の誤判別によるGb(k)における収束を避ける。
【0105】
仮想状態マシン
仮想状態マシン(VSM)は、一般に知られた「状態マシン」と同じ機能を有している。ここでの一番の違いは、非線形状態がシステムの中に検出された場合にのみVSMが有効になることである。
【0106】
状態マシンの実施は、一般に、様々な状態(すなわち、送信のみ、受信のみ、ダブルトーク、及び待機)についての情報を含む一連の変数の計算と、これらの変数についての閾値の定義してこの状態を微分することを有する。図10に示すAECシステムでは、状態の微分器として、変数Gr,i(k)及びRatFEを使用できる。それら双方は、「0」と「1」との間で規格化される。Gr,i(k)は、受信のみの場合に「0」に近づき、送信のみの場合に「1」に近づき、ダブルトークの状態の場合に「0」と「1」との間となるか、又はシステムの中に非線形性が存在する。RatFEは、受信のみの場合に「1」に近づき、送信のみの場合に「0」に近づき、ダブルトークの状態の場合に「0」と「1」との間となるか、又は非線形性が存在する。2つの変数が逆に変化することが認められる。
【0107】
これらの2つの変数に基づいて、以下の2つのタイプの仮想状態マシンを提案する。それらを、個別又はカスケード接続で組み合わせて実施できる。
【0108】
方法1:
図10に示すシステムでは、ゲインGr,i(k)をメインのAECフィルタの出力に適用して、残留エコーをさらに減らす。基準信号x(n)とマイク信号d(n)との間の線形依存性が、非線形性により減少する場合、e(n)がd(n)とより相関するため、Gr,i(k)が所望の値よりも大きくなって高い残留エコーの原因となる。
【0109】
ゲインGr,i(k)を、

とGr,i(k)とを比較することによって、近似コヒーレンス関数と考えることができる。Gr,i(k)はRatFEに関係するため、ステップサイズコントロールについて上記したように、線形性の尺度として、Gr,i(k)の代わりにRatFEを使用することが提案される。
【0110】
残留エコーに追加の減衰を与えるゲインRERCを以下のように導入する:

(k)=RERCr,i(k)*E(k)

ここで、


【0111】
HF及びLFは、このような決定で含まれる周波数帯域の上界及び下界である。
は、0<A<1の範囲を有し、ステップサイズ制御について異なる分類1,2及び3の値を有する。一般に、Aは、以下のように選択できる:


【0112】
RERCの目的は、分類1及び2の際に残留エコーを除去して、分類3の際に近端音声を通過することである。個別のi番目のサブバンドにゲインAの代わりに平均ゲインRERCを使用して、近端及び遠端音声の誤判別による音声の質の劣化を防止する。
【0113】
方法2:
平均値Gr,i(k)とRatFEとの間の差によって与えられる新たな変数を考える。すなわち、



ここで、SM_HB及びSM_LBは、平均値が実行される周波数帯域の上界及び下界に対応する。クロスバンド平均を使用して状態判定の精度を改善し、待機時間の使用を防ぐ。このような適用では、音声信号の出力がこのような領域でより強いため、結果がより信頼度の高いという事実により、300Hzと1500Hzとの間の帯域を使用する。
【0114】
算出したSM_valueattをある閾値(Th_SM)と比較して、減衰Att_SMを周波数領域に適用し、周波数帯域群(G_band_SM)を規定する。すなわち、



である。
【0115】
図15に示すように、得られるSM_ベクトルをAECシステムに適用する。SM_valueattを「−1」及び「1」との間で規格化し、受信のみの場合に「−1」に近付き、送信のみの場合に「1」に近付き、ダブルトークの場合又はシステムに非線形性ある場合に「−1」と「1」の間となる。また、Att_SMは、適応によって決まり、異なる周波数帯域で異なる値を有する。
【0116】
ダイナミック非線形補償
ダイナミック非線形補償は、既知の非線形性が、パワーアンプ及びスピーカ(例えば、図14に示すように、ポイントbでのハードクリップ)のシステムに存在する場合に、図14に示すように、HFKシステムで適用フィルタを入力する前に、ポイントa(a<b)でのハードクリップによる非線形補償を基準信号に適用できるという事実を使用する。非線形性は、簡単のためハードクリッピングによって表される。明らかに、それは、ソフトクリッピング又は他の適切な機能によって置換される。
【0117】
スピーカの出力で所望の音量を得るために、入力信号x(n)が全体的に大いにクリップされることが実際のシステム(例えば、ハンズフリーの携帯電話)の中で認められる。明らかに、それは音声信号の中の歪みによるものであるが、電圧レベルが、出力システム、Amp2及びスピーカに制限される場合、音量を増やすのが唯一の方法である。図14に示すハンドセットと同じような適用では、Amp2のゲインを固定することが提案され、音量をデジタル領域においてAmp1のみで変える。システムのダイナミックレンジを具えたデジタルシステムのコーデックの出力、Amp2及びスピーカの間のダイナミックレンジに適合することが重要であることに注目されたい。このような方法を使用すると、音量の変化をAmp1のみによって実行でき、所望の音量に達することができ、恐らく余分な非線形処理を要しない。
【0118】
非線形パッケージを具えた完全なHFKシステム
ここで提案された非線形パッケージとともに図10のAECシステムのブロック図が図15に示されている。上記のように、非線形パッケージがANLAF、FD_NLF、SSC_NLP、VSM及びDNPによって構成されることに注目されたい。実際の適用では、非線形性のタイプに応じて、非線形性のうちの必要な部分を使用して、所望のシステムの性能に達する。
【0119】
本発明の実施例を図示及び記載したが、これらの実施例は本発明の全ての可能な形態を図示及び記載を意図するものではない。むしろ、明細書で使用される用語は、限定のためではなく説明のための用語であり、本発明の精神及び範囲から逸脱することなしに、様々な変更を行ってもよいことに留意されたい。
【図面の簡単な説明】
【0120】
【図1】図1は、従来技術のハンズフリーの実施を示す。
【図2】図2は、サブバンド適応フィルタ構造を示す。
【図3】図3は、雑音除去アルゴリズムを示す。
【図4】図4は、AECアルゴリズムの性能を最適化する構成を示す。
【図5】図5は、AEC及びNCアルゴリズムの性能を最適化する構成を示す。
【図6】図6は、従来のDTD構成の欠陥を克服する構成のメイン及び補助適応フィルタを示す。
【図7】図7は、残存エコー減少フィルタを示す。
【図8】図8は、相違制御システムを示す。
【図9】図9A−9Bは、非線形プロセッサの実施を示す。
【図10】図10は、複数の態様を組み込んだクリアな信号を取得するための方法及びシステムを示す。
【図11】図11は、非対称非線形適応フィルタ(ANLAF)を示す。
【図12】図12は、一方が上部クリッピングポイントを表し他方が下部クリッピングポイントを表す2つの非線形システムのカスケードを有するANLAFを示す。
【図13】図13は、並列経路としてANLAFを独立して使用し、クリッピングポイントを決定することを示す。
【図14】図14は、適応フィルタの入力の前に参照信号に非線形補償ハードクリップを適用して
【図15】図15は、本発明に係る好適な実施例に従った、非線形パッケージを有するAECシステムのブロックダイヤグラムを示す。

【特許請求の範囲】
【請求項1】
音響エコー除去(AEC)のための方法であって、付加的な背景雑音及び音響エコーの双方によって破損した識別できない信号に起因するマイク信号が、前記識別できない信号を修復する目的で処理され、前記音響エコーが音響パスによって変調されるスピーカ信号であり、適応フィルタが周波数領域においてエコーパスを形成し、
前記方法が、前記マイク信号を受信するステップと、
前記スピーカ信号にサブハンドで適応フィルタを適用して、前記音響エコーを形成するエコー信号を生成するステップと、
前記マイク信号から前記エコー信号を差し引いて、前記識別できない信号に類似する周波数領域のエコーレス信号を生成するステップと、
前記周波数領域のエコーレス信号に基づいて、前記適応フィルタを調整するステップとを有しており、
さらに、前記方法が、前記周波数領域のエコーレス信号に残留エコー減少フィルタを適用するステップと、
前記残留エコー減少フィルタの係数に基づいて平均帯域幅減衰ファクタを決定するステップと、
閾値を決定するステップと、
前記平均帯域幅減衰ファクタが前記閾値よりも小さい場合に、規定した一群の周波数帯域に周波数依存非線形減衰ベクトルを適用するステップとを具えることを特徴とする方法。
【請求項2】
前記規定した一群の周波数帯域が一群の高周波数帯域であり、これにより周波数に依存する非線形プロセスが生じ、高周波数のエコーをさらに減らすことを特徴とする請求項1に記載の方法。
【請求項3】
音響エコー除去(AEC)のための方法であって、付加的な背景雑音及び音響エコーの双方によって破損した識別できない信号に起因するマイク信号が、前記識別できない信号を修復する目的で処理され、前記音響エコーが音響パスによって変調されるスピーカ信号であり、前記適応フィルタが周波数領域においてエコーパスを形成し、
前記方法が、前記マイク信号を受信するステップと、
前記スピーカ信号にサブハンドで適応フィルタを適用して、前記音響エコーを形成するエコー信号を生成するステップと、
前記マイク信号から前記エコー信号を差し引いて、前記識別できない信号に類似する周波数領域のエコーレス信号を生成するステップと、
前記周波数領域のエコーレス信号に基づいて、前記適応フィルタを調整するステップとを有しており、
さらに、前記方法が、近端及び遠端音声を分類して、近端及び遠端音声との間の顕著な非線形関係を検出するステップと、
顕著な非線形関係が検出された場合には、周波数領域での前記適応フィルタの調整レートを増やして、極小値を抜けて最小値に達するステップとを具えることを特徴とする方法。
【請求項4】
前記分類するステップが、周波数領域での前記適応フィルタによって生成される前記マイク信号及び前記エコー信号のコヒーレンスを考慮するステップを有することを有することを特徴とする請求項3に記載の方法。
【請求項5】
前記周波数領域での前記適応フィルタが、メインフィルタ及び補助フィルタから成り、
前記メインフィルタによるエコーの過小評価をもたらす顕著な非線形関係の際に、ある所定の状況で補助フィルタを使用し、
前記調整レートを増やすステップが、前記補助フィルタの前記調整レートを増やすことによりメインフィルタの前記調整レートを増やすことを特徴とする請求項3に記載の方法。
【請求項6】
音響エコー除去(AEC)のための方法であって、付加的な背景雑音及び音響エコーの双方によって破損した識別できない信号に起因するマイク信号が、前記識別できない信号を修復する目的で処理され、前記音響エコーが音響パスによって変調されるスピーカ信号であり、前記適応フィルタが周波数領域においてエコーパスを形成し、
前記方法が、前記マイク信号を受信するステップと、
前記スピーカ信号にサブハンドで適応フィルタを適用して、前記音響エコーを形成するエコー信号を生成するステップと、
前記マイク信号から前記エコー信号を差し引いて、前記識別できない信号に類似する周波数領域のエコーレス信号を生成するステップと、
前記周波数領域のエコーレス信号に基づいて、前記適応フィルタを調整するステップとを有しており、
さらに、前記方法が、前記周波数領域のエコーレス信号に残留エコー減少フィルタを適用するステップと、
状態微分器を使用して近端及び遠端音声を分類し、近端及び遠端音声間の顕著な非線形関係を検出するステップと、
顕著な非線形関係が検出された場合には、前記残留エコー減少フィルタを調整して、顕著な非線形性がない場合に与えられる減衰量と比較して付加的な減衰を前記残留エコーに生成することを特徴とするアコースティック・エコー・キャンセレーション(AEC)の方法。
【請求項7】
前記分類が、前記周波数領域での適応フィルタによって生成する前記マイク信号及び前記エコー信号のコヒーレンスを考慮するステップを有することを特徴とする請求項6に記載の方法。
【請求項8】
前記残留エコー減少フィルタに適用されるゲイン定数が、前記周波数領域での適応フィルタによって生成される前記マイク信号及び前記エコー信号のコヒーレンスな関係を有する平均ゲインを反映することを特徴とする請求項7に記載の方法。
【請求項9】
さらに、前記分類が、前記マイク信号及び前記周波数領域のエコーレス信号の予測されるコヒーレンスを考慮することを有することを特徴とする請求項7に記載の方法。
【請求項10】
前記分類が、前記マイク信号/エコー信号コヒーレンス及び前記マイク信号/周波数領域エコーレス信号の予測されるコヒーレンスの平均値間の差に基づいていることを特徴とする請求項9に記載の方法。
【請求項11】
さらに、閾値を決定するステップと、
所定の平均値間の差が前記閾値よりも小さく、顕著な非線形性を示す場合に、規定された一群の周波数帯域に周波数依存非線形減衰ベクトルを適用するステップとを具えることを特徴とする請求項10に記載の方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate


【公開番号】特開2012−85314(P2012−85314A)
【公開日】平成24年4月26日(2012.4.26)
【国際特許分類】
【出願番号】特願2011−248486(P2011−248486)
【出願日】平成23年11月14日(2011.11.14)
【分割の表示】特願2008−526155(P2008−526155)の分割
【原出願日】平成18年8月9日(2006.8.9)
【出願人】(508036086)クラリティー テクノロジーズ,インク. (2)
【Fターム(参考)】