説明

エコー及びノイズキャンセレーション

【課題】高いエコー抑制比(ESR:echo supression ratio)レベルを達成する。
【解決手段】スピーカ102はスピーカ信号x(t)を受信する。マイクロフォン104は、ローカル信号s(t)とエコー信号x(t)を含むマイクロフォン信号d(t)を受け取る。エコー信号x(t)は、スピーカ信号x(t)に依存する。マイクロフォン信号d(t)は、互いに相補的なエコーキャンセレーション特性を有する第1適応フィルタ、および第2適応フィルタによって、パラレルにフィルタリング処理される。最小エコー出力e(t)は、第1適応フィルタからの出力e(t)と、第2適応フィルタからの出力e(t)か決定される。最小エコー出力のエネルギはより小さく、最小エコー出力とスピーカ信号x(t)との間の相関はより小さい。そして、マイクロフォン出力が、最小エコー出力e(t)を用いて生成される。

【発明の詳細な説明】
【技術分野】
【0001】
[優先権の主張]
本出願は、本出願と譲受人が共通であって本出願と同時に係属する特許文献1の恩恵を主張し、その開示内容全体をここに援用する。本出願は、本出願と譲受人が共通であって本出願と同時に係属する特許文献2の恩恵を主張し、その開示内容全体をここに援用する。本出願はまた、本出願と譲受人が共通であって本出願と同時に係属する特許文献3の恩恵を主張し、その開示内容全体をここに援用する。本出願はまた、本出願と譲受人が共通であって本出願と同時に係属する特許文献4の恩恵を主張し、その開示内容全体をここに援用する。本出願はまた、本出願と譲受人が共通であって本出願と同時に係属する特許文献5の恩恵を主張し、その開示内容全体をここに援用する。本出願はまた、本出願と譲受人が共通であって本出願と同時に係属する特許文献6の恩恵を主張し、その開示内容全体をここに援用する。本出願はまた、本出願と譲受人が共通であって本出願と同時に係属する特許文献7の恩恵を主張し、その開示内容全体をここに援用する。本出願はまた、本出願と譲受人が共通であって本出願と同時に係属する特許文献8の恩恵を主張し、その開示内容全体をここに援用する。本出願はまた、本出願と譲受人が共通であって本出願と同時に係属する特許文献9の恩恵を主張し、その開示内容全体をここに援用する。本出願はまた、本出願と譲受人が共通であって本出願と同時に係属する特許文献10の恩恵を主張し、その開示内容全体をここに援用する。
【先行技術文献】
【特許文献】
【0002】
【特許文献1】米国特許出願 第11/381,728号,シャドン マオ, "ECHO AND NOISE CANCELATION", 2006年5月4日出願, (代理人整理番号SCEA05064US00)
【特許文献2】米国特許出願 第11/381,729号,シャドン マオ, "ULTRA SMALL MICROPHONE ARRAY", 2006年5月4日出願, (代理人整理番号SCEA05062US00)
【特許文献3】米国特許出願 第11/381,725号,シャドン マオ, "METHODS AND APPARATUS FOR TARGETED SOUND DETECTION", 2006年5月4日出願, (代理人整理番号SCEA05072US00),
【特許文献4】米国特許出願 第11/381,727号,シャドン マオ, "NOISE REMOVAL FOR ELECTRONIC DEVICE WITH FAR FIELD MICROPHONE ON CONSOLE", 2006年5月4日出願, (代理人整理番号SCEA05073US00)
【特許文献5】米国特許出願 第11/381,724号,シャドン マオ, "METHODS AND APPARATUS FOR TARGETED SOUND DETECTION AND CHARACTERIZATION", 2006年5月4日出願, (代理人整理番号SCEA05079US00)
【特許文献6】米国特許出願 第11/381,721号,シャドン マオ, "SELECTIVE SOUND SOURCE LISTENING IN CONJUNCTION WITH COMPUTER INTERACTIVE PROCESSING", 2006年5月4日出願, (代理人整理番号SCEA04005 JUMBOUS)
【特許文献7】PCT出願 PCT/US06/17483号,シャドン マオ, "SELECTIVE SOUND SOURCE LISTENING IN CONJUNCTION WITH COMPUTER INTERACTIVE PROCESSING", 2006年5月4日出願, (代理人整理番号SCEA04005 JUMBOPCT)
【特許文献8】米国特許出願 第11/418,988号,シャドン マオ, "METHODS AND APPARATUSES FOR ADJUSTING A LISTENING AREA FOR CAPTURING SOUNDS", 2006年5月4日出願, (代理人整理番号SCEA-00300)
【特許文献9】米国特許出願 第11/418,989号,シャドン マオ, "METHODS AND APPARATUSES FOR CAPTURING AN AUDIO SIGNAL BASED ON VISUAL IMAGE", 2006年5月4日出願, (代理人整理番号SCEA-00400)
【特許文献10】米国特許出願 第11/429,047号,シャドン マオ, "METHODS AND APPARATUSES FOR CAPTURING AN AUDIO SIGNAL BASED ON A LOCATION OF THE SIGNAL", 2006年5月4日出願, (代理人整理番号SCEA-00500)
【0003】
[本発明の技術分野]
本発明は、音響信号処理に関し、とくに、音響信号処理におけるエコーおよびキャンセリングに関する。
【背景技術】
【0004】
インタラクティブテレビゲームコントローラなどのような多くの携帯電子装置は、双方向音響信号を扱うことができる。このような装置は、典型的にはその装置のユーザからのローカルスピーチ信号s(t)を受けるマイクロフォンと、ユーザが聞くことができるスピーカ信号x(t)を発信するスピーカとを備える。テレビゲームコントローラをより小型化するために、マイクロフォンとスピーカは、比較的近く(例えば20cm以内など)に設置することが望ましい。これに対してユーザは、マイクロフォンからより離れたところ(例えば3メートルから5メートルなど)に位置するかもしれない。マイクロフォンはローカルスピーチ信号s(t)とスピーカエコー信号x(t)との両方を含む信号d(t)を生成する。これに加えて、マイクロフォンはバックグランドノイズn(t)を受けるかもしれない。そのため、全体のマイクロフォン信号は、d(t)=s(t)+x(t)+n(t)となる。比較的スピーカの近傍にあるため、マイクロフォン信号d(t)は、スピーカエコー信号x(t)によって、占められるかもしれない。
【0005】
電気通信の応用例において、スピーカエコーは広くみられる現象であり、エコーサプレッションとエコーキャンセレーションは比較的成熟した手法である。エコーサプレッサは、回線において1方向に向かう音声信号の存在を検出した場合に作動し、他の方向に大きな損失を挿入する。通常、回線の遠端にあるエコーサプレッサが回線の近端からの音声を検出した場合に、そのエコーサプレッサがこの損失を加える。この加えられた損失により、スピーカ信号x(t)が、ローカルスピーチ信号d(t)へと再送出されることを阻止することができる。
【発明の概要】
【発明が解決しようとする課題】
【0006】
エコーサプレッションは効果的ではあるが、多くの場合、いくつかの問題につながる。例えば、ローカルスピーチ信号s(t)とリモートスピーカ信号x(t)は、少なくとも短時間に限れば、同時に生ずることがよくある。この状況はダブルトークとも呼ばれる。リモートスピーカ信号のみが存在するような状況は、リモートシングルトークとも呼ばれる。各エコーサプレッサが回路の遠端(far-end)からの音声エネルギを検出するため、その結果、通常、同時に双方向に損失が挿入されることとなり、両側の通話がブロックされる。これを防止するため、エコーサプレッサを、近端のスピーカからの音声アクティビティのみを検出するように設定することができる。これにより、近端話者と遠端話者が同時に話しているときには、損失が挿入されなくなる(または、より小さい損失のみ挿入される)。残念ながら、これは、当初のエコーサプレッサの効果まで、一時的にうち消してしまう。
【0007】
さらに、エコーサプレッサは、交互に、損失を挿入し、除去するため、新たな話者が話し始めたときにしばしば小さな遅延が生じ、その話者のスピーチの初めの方の音がクリッピングされてしまう。さらに、遠端の相手方の周囲がうるさいときには、遠端話者が話しているときには、近端話者にそのバックグラウンド音が聞こえるが、近端話者が話し始めるとエコーサプレッサがそのバックグラウンド音を抑制する。これにより、バックグラウンド音が突然無くなるため、近端のユーザは回線が切れたかのような印象を受けることになる。
【0008】
上述の問題に対処するため、エコーキャンセレーション手法が開発された。エコーキャンセレーションは、アナログまたはデジタルフィルタを用いて、望ましくないノイズやエコーを入力信号から取り除き、フィルタリング処理された信号e(t)を生成する。エコーキャンセレーションにおいては、スピーチモデルを計算するために複雑なアルゴリズム手順が用いられる。この手順は、マイクロフォン信号d(t)と、リモート信号x(t)の一部を、エコーキャンセレーションプロセッサに入力するステップと、スピーカエコー信号x(t)を予測するステップと、そしてこれをマイクロフォン信号d(t)から差し引ステップとを含む。エコー予測方式は、適用(adaptation)として知られるプロセスにおいて、エコーキャンセレーションプロセッサにより学習されなければならない。
【0009】
このような手法の効果は、エコー抑制比(ESR:echo supression ratio)によって測定される。これは単に、マイクロフォンが受ける真のエコーエネルギと、フィルタリング処理された信号x(t)に残る残余エコーエネルギとの比である(典型的にはデシベルで表される)。国際電気通信ユニオン(ITC)が定めた基準によると、リモートシングルトークの場合、エコーレベルについて、少なくとも45デシベルの減衰が必要である。ダブルトークの最中(または強いバックグラウンドノイズの最中)には、この減衰レベルは30デシベルまで低くなってもよい。しかしながら、これらの推奨基準は、ローカルスピーチ信号を発生するユーザが、マイクロフォンに、より近いようなシステムにおいて開発されたものである。したがって録音されたSN比(ターゲット音声エネルギのエコーノイズエネルギに対する比)は、大抵、5デシベルよりも良い。例えばテレビゲームコントローラのような、ユーザが3メートルから5メートルも離れており、オープンマイクロフォンから0.5メートルよりも近傍にあるラウドスピーカが大きなエコーを発生するようなアプリケーションにおいては、これらの推奨基準はあてはまらない。このようなアプリケーションにおいては、SN比は−15デシベルから−30デシベル未満であろう。リモートシングルトークにおいては60デシベル以上のESR、ダブルトークについては35デシベル以上ESRが要求されるかもしれない。現存のエコーキャンセレーション手法ではこのような高いESRレベルを達成することができない。
【0010】
したがって、当該技術分野においては前述の不利な点を克服するエコーキャンセレーションシステムおよび方法が必要とされている。
【課題を解決するための手段】
【0011】
[発明の概要]
前述の不利な点を克服するため、本発明の実施形態は、スピーカとマイクロフォンを有するシステムにおけるエコーキャンセレーション方法および装置に照準を合わせる。スピーカはスピーカ信号x(t)を受信する。マイクロフォンは、ローカル信号s(t)とエコー信号x(t)を含むマイクロフォン信号d(t)を受け取る。エコー信号x(t)は、スピーカ信号x(t)に依存する。マイクロフォン信号d(t)は、互いに相補的なエコーキャンセレーション特性を有する第1適応フィルタ、および第2適応フィルタによって、パラレルにフィルタリング処理される。最小エコー出力e(t)は、第1適応フィルタからの出力e(t)と、第2適応フィルタからの出力e(t)か決定される。最小エコー出力のエネルギはより小さく、最小エコー出力とスピーカ信号x(t)との間の相関はより小さい。そして、マイクロフォン出力が、最小エコー出力e(t)を用いて生成される。オプションとして、残差エコーキャンセレーション、かつ/または、ノイズキャンセレーションが、最小エコー出力に適用されてもよい。
【図面の簡単な説明】
【0012】
【図1A】本発明の実施形態にかかるエコーキャンセレーション装置の概略図である。
【図1B】図1Aのエコーキャンセレーション装置において用いられうる音声アクティビティ検出適応フィルタの概略図である。
【図1C】図1Aのエコーキャンセレーション装置において用いられうる相互相関解析を伴う適応フィルタの概要図である。
【図2A】本発明の実施形態にかかるエコーキャンセレーション方法を説明するフローチャートである。
【図2B】本発明の実施形態にかかるエコーキャンセレーションのための別の方法を説明するフローチャートである。
【図3】本発明の別の実施形態にかかるエコーキャンセレーション装置の概略図である。
【実施例】
【0013】
[具体的な実施形態の説明]
以下の詳細な説明は、説明の目的のため、具体的な細部を含むが、本発明の範囲内において、後述の細部について多くの変形や変更が可能であることは、当該技術分野において通常の知識を有する者に理解されるところである。したがって、以下に記述される本発明の実施例の説明により、特許請求の範囲に記載されている発明が一般性を失うことなく、また、以下の説明は、特許請求の範囲に記載されている発明について制限を課すものではない。
【0014】
本発明の実施形態によると、機能的に同一である二つのフィルタを有する一体型のエコーおよびノイズキャンセラの新しい構成が提案される。これらのフィルタは、直交制御と表現(orthogonal controls and representations)を伴う。このような構成においては、雑音のあるハンドフリー音声通信において、システム全体のロバスト性(robustness)を引き上げるように、二つの直交フィルタは互いに補完し合う。
【0015】
特に、一体型のエコーノイズキャンセラは、別個に制御される二つのサブシステムを並行に用いる。これらのサブシステムはそれぞれ、直行制御メカニズムを伴う。エコーノイズキャンセラは、フロント・エコーキャンセラと、バックアップ・エコーキャンセラとを含む。フロント・エコーキャンセラは、ダブルトーク検出を用いる。ローカル音声に対して確実にロバストであるようにするために、フロント・エコーキャンセラは、保守的な適応アプローチをとりながらも、提供するエコーサプレッションはより小さく、スピーチ、エコーの変化への適応は遅い。バックアップ・エコーキャンセラは、相互相関を用いて、エラー信号とエコー信号との間の類似性を測定する。バックアップ・エコーキャンセラは、フィルタが迅速に更新されるように、積極的な戦略をとる。バックアップ・エコーキャンセラは、大きなエコーサプレッションを提供しながらも、過剰に適応してしまう可能性があるため、ローカル音声/ノイズに対して不安定である。これらの二つのエコーキャンセラの出力の統合は、どちらのエコーキャンセラとエコー信号との差が大きいかを測定する相互相関解析に基づいて実行される。この統合においてはまた、両方のエコーキャンセラのフィルタ安定性がチェックされる。一のフィルタが過大予測または過小予測されている場合、そのフィルタは他方のフィルタによって補完される。このようなシステムは、いかなるときでも確実に一のフィルタが正しく動作するように設計される。
【0016】
本システムはオプションで、同様のアプローチをとるエコー残差ノイズ予測部を含んでもよい。エコー残差ノイズ予測部は、直行制御を伴う二つの独立なサブ予測部を並行に用いる。第1予測部は、ロバストなダブルトーク検出部に依存するエコー距離ミスマッチ(echo−distance−mismatch)に基づく。第1予測部は、比較的正確でありながら、ダブルトーク検出エラーのために不安定である。第2予測部は相互スペクトル解析(cross−spectrum−analysis)に基づく。第2予測部の予測にはバイアスがかかっているが安定であり、ローカル音声検出に依存せず、一貫性がある。これらの二つの残差エコーの予測の統合においては、遠端通話のみの場合、またはダブルトークの場合にそれぞれ、最小/最大アプローチがとられる。
【0017】
図1Aは、本発明の一実施形態にかかるエコーキャンセレーション装置100を用いたオーディオシステム99を示す図である。装置100の動作は、図2Aに示される方法200のフローチャート、および図2Bに示される方法220を参照することによって理解されるであろう。オーディオシステム99は一般的に、リモート信号x(t)を受け取るスピーカ102とマイクロフォン104とを含む。ローカル音源101は、ローカルスピーチ信号s(t)を発する。マイクロフォン104は、ローカルスピーチ信号s(t)と、スピーカ信号x(t)に関連するエコー信号x(t)の両方を受け取る。マイクロフォン104はまた、マイクロフォン104が位置する環境から発生するノイズn(t)をも受け取る。そして、マイクロフォン104は、マイクロフォン信号d(t)を生成する。マイクロフォン信号d(t)は、d(t)=s(t)+x(t)+n(t)によって与えられるだろう。
【0018】
エコーキャンセレーション装置100は、一般的に、第1適応エコーキャンセレーションフィルタEC(1)と第2適応エコーキャンセレーションフィルタEC(2)とを含む。それぞれの適応フィルタは、マイクロフォン信号d(t)とスピーカ信号x(t)とを受け取る。図2A−2Bに示されるように、フィルタEC(1)はステップ202に示されるようにマイクロフォン信号d(t)を適応フィルタリング処理し、フィルタEC(2)は、ステップ204に示されるように、第1フィルタEC(1)と並行してマイクロフォン信号d(t)を適応フィルタリング処理する。ここで用いられているように、フィルタが「並行にオペレーションする」とは、実質的に同じ入力d(t)を受け取ることをいう。並行オペレーションは、一のフィルタの出力が、他方のフィルタの入力となるシリアルオペレーションとは、区別される。二つのフィルタEC(1)、EC(2)の状態によって、一のフィルタが、主要な「フロント」フィルタの役目を果たし、他方のフィルタが「バックアップ」フィルタの役目を果たす。一のフィルタは、エコーキャンセレーションに対して慎重なアプローチをとる一方、他方のフィルタはより積極的なアプローチをとる。
【0019】
フィルタEC(1)、EC(2)の状態は、以下の信号モデルに関連して理解されるであろう。
y(t)=x(t)h(n)
d(t)=y(t)+s(t)
e(t)=d(t)−y(t)
ここで、y(t)は、エコーキャンセラフィルタによって合成されたエコーである。
x(t)は、ラウドスピーカにおいてプレイするエコーである。
h(n)は、エコーキャンセラフィルタの適応フィルタ関数である。
d(t)は、マイクロフォンが受けた雑音の多い信号である。
(t)は、マイクロフォンにおいて現れる、真のエコーである。
s(t)は、ローカル音声である。
そして、e(t)は、エコーキャンセラフィルタによって生成されたエコーキャンセル済み残差信号である。
【0020】
二つのフィルタEC(1)、EC(2)は、相補的なエコーキャンセレーション特質を有する。ここで用いられるように、「相補的エコーキャンセレーションを有する」とは、同じ入力を受け取る二つの適応フィルタにおいて、一のフィルタが入力にうまく適応していないときに、他方のフィルタが入力にうまく適応しているような場合をいう。本アプリケーションの文脈において、フィルタ関数h(n)が、「うまく適応している」とは、そのフィルタ関数h(n)が安定であり、真のエコーパスフィルタ(echo−path−filter)に収束しており、過大予測でもなく過小予測でもないときをいう。
【0021】
h(n)が真のエコーパスフィルタに収束している(y(t)〜=y(t))場合、すなわち、予測されたエコーが真のエコーと近似的に等しい場合、コヒーレンス関数αを用いて、エコーキャンセラフィルタEC(1)、EC(2)の状態が定量化されるだろう。αは、y(t)とe(t)の間の相互相関に関連し、式1が成り立つ。
(式1)

ここで”E”は、統計的期待値である。
式2に示す演算子は、相互相関演算を表す。
(式2)

離散的な関数fとgについて、相互相関は式3で定義される。
(式3)

ここで、和は適切な値の整数jについてとられており、アスタリスクは、複数共役を表す。連続関数f(x)とg(x)について、相互相関は式4で定義される。
(式4)

ここで積分は適切なtの値についてとられる。
【0022】
コヒーレンス関数αにおいて、分子は、e(t)とy(t)の相互相関を表す。分母は、y(t)の自己相関を表し、正規化項の役目を果たす。
【0023】
理想的には、h(n)が収束するならば、αは「0」に近いはずである(残差信号e(t)はy(t)を含まないからである)。h(n)が収束しないならば、αは「1」に近いはずである(e(t)はy(t)の強いエコーを含むからである)。h(n)がおかしな挙動をし、または発散するならば、αは負であるはずである(フィルタの発散のため、e(t)は、位相が180度シフトした強いエコーを含むからである)。
【0024】
したがって、例えば、コヒーレンス関数αの値は、フィルタEC(1)、EC(2)の状態について、四つの可能な状態を定義するために用いられてもよい。ただしこれに制限されるものではない。
(1)フィルタh(n)が安定であり、収束し、過大予測でも過小予測でもない場合には、0<=α<=0.1
(2)フィルタh(n)が安定ではあるが、過小予測されているときには(まだ収束していない)α>0.2
(3)フィルタh(n)が過大予測されているときは、α<−0.1
(4)フィルタh(n)が発散するときには、α<−0.25
これらの異なる状態について、異なるαの値の範囲が決定されうることは当業者には理解されるであろう。
【0025】
フィルタの状態がよいならば(例えば状態(1))、その後に発散したときのリカバリのために、その設定が保存されてもよい。フィルタが発散し、または過小予測され、または過大予測されている場合には、フロントおよびバックアップ・エコーキャンセラはその役割を交換する。フロントフィルタがバックアップとなる一方、バックアップフィルタがフロントフィルタの役割を担う。一のフィルタが慎重な適応アプローチをとり、他方が積極的な適応アプローチをとるため、この交換により、最終的には、両方のフィルタがより早く収束し、よりダイナミックに安定する。
【0026】
さらにフィルタが過小予測または過大予測されている場合、より早い収束、またはトラッキングのよりよい安定のために、適応スピードを加速させ、または減速させるように、適応ステップサイズが小さなデルタ値で増加または減少されてもよい。通常、収束を速くするためにはより大きなステップサイズが必要である。これにより、細部に関するよいトラッキングは犠牲となり、エコーサプレッション比ESRは、低くなる。小さなステップサイズを用いてよりゆっくりと収束させる場合は、より安定的であり、わずかな変化もトラックする機能を有するが、エコーディスロケーションを速くトラッキングするには適さない。
【0027】
動的なステップサイズと、フロント/バックアップでのフィルタ交換を組み合わせることにより、速いトラッキング対詳細なトラッキング、安定性対収束の観点において、システム全体のバランスが良くなる。この二つが、適応システム設計において本当に重要な双子の課題である。
【0028】
フィルタの一が発散した場合において、他方のフィルタがよい状態にあるならば、発散したフィルタを再初期化するために、その他方のフィルタの設定が複製されてもよい。別の方法では、発散したフィルタは、以前に保存された、よい状態のフィルタ設定を用いて復旧されて(recovered)もよい。
【0029】
例えば、エコーキャンセリング適応フィルタEC(1)とEC(2)は、周波数領域正規化最小二乗適応フィルタに基づいてもよい。ただし、これに制限されるものではない。各フィルタは、ハードウェア、ソフトウェア、またはハードウェアとソフトウェアの組み合わせとして実装されうる。
【0030】
図1Bと図1Cは、適切な相補適応フィルタの例を示す。具体的には、図1Bは、音声アクティビティ検出を伴う適応エコーキャンセレーションフィルタ120を示す。フィルタ120は、第1適応フィルタEC(1)として用いることができる。フィルタ120は、フィルタ係数wによって特徴付けられる有限インパルス応答(FIR)フィルタを有する可変フィルタ122を含む。可変フィルタ122は、マイクロフォン信号d(t)を受け取り、フィルタ係数wの値に従ってフィルタリング処理し、フィルタリング処理された信号d’(t)を生成する。可変フィルタ124は、入力信号を、係数wt1によって決定されるインパルス応答で畳み込むことにより、望ましい信号を予測する。各フィルタ係数wt1は、更新アルゴリズム124にしたがって、量Δwの規則的な間隔で更新される。一例として、フィルタ信号d’(t)が、望ましい信号としてスピーカエコー信号x(t)を予測しようと試みるように、フィルタ係数wが選択されてもよい。差分ユニット126は、マイクロフォン信号d(t)からフィルタリング処理された信号d’(t)を差し引いて、予測信号e(t)を供給する。予測信号e(t)は、ローカルスピーチ信号s(t)を予測する。フィルタリング処理された信号d’(t)をリモート信号x(t)から差し引いて、誤差信号e(t)を生成してもよい。誤差信号e(t)は、更新アルゴリズム124によってフィルタ係数wを調整するために用いられる。適応アルゴリズム124は、リモート信号x(t)と誤差信号に基づいて、補正因子(correction factor)を生成する。係数更新アルゴリズムの例には、最小2乗法(LMS)と再帰最小2乗法(RLS: recursive least squares)が含まれる。LMS更新アルゴリズムにおいては、例えば、フィルタ係数は、式wt1+1=wt1+μe(t)x(t)に基づいて更新される。ここで、μはステップサイズである。初めは、すべてのwt1について、wt1=0である。この例において、量μe(t)x(t)は、量Δwであることに注意されたい。上述のように、ステップサイズμは、適応フィルタの状態によって、動的に調整されてもよい。具体的には、フィルタが過小予測されている場合には、早く収束するように適応スピードを加速するために、ステップサイズμを、小さなデルタ量増加させてもよい。フィルタが過大予測されている場合には、この代わりに、トラッキングがよりよく安定するように適応スピードを減速させるために、適応ステップサイズμが、小さなデルタ量でそれぞれ引き下げられてもよい。
【0031】
時間領域表現e(t)x(t)は、乗算である。この計算は、以下のように周波数領域において実装されてもよい。初めに、e(t)、x(t)、およびh(n)は、時間領域から周波数領域に、例えば高速フーリエ変換(FFT)によって変換されてもよい。
E(k)=fft(e(t))
X(k)=fft(x(t))
H(k)=fft(h(n))
【0032】
実際の周波数領域におけるLMS更新アルゴリズムは、以下のようになる。
H(k)=H(k)+(μconj(X(k)).E(k))/(Δ+X(k)conj(X(k))
ここで、μはフィルタ適応ステップサイズであり、動的である。
conj(a)は、複素数aの複素共役を示す。
は、複素乗算(complex multiplication)を示す。
そして、Δは、分母が数量的に不安定になるのを防ぐレギュレータ(regulator)である。
【0033】
上の方程式において、「conj(X(k)).E(k)」は、「e(t)x(t)」タスクを実行する。分母において、「X(k)conj(X(k))」は、安定性を高める目的で正規化する役割を果たす。
【0034】
音声アクティブ化された検出VADは、更新アルゴリズム124を調整して、リモート信号x(t)が存在するときに(例えば所定の閾値以上であるならば)、可変フィルタ122が、マイクロフォン信号d(t)のみを適応的にフィルタリング処理するようにしてもよい。図1Bに示される音声アクティブ化された検出(ダブルトーク検出と呼ばれることもある)を用いる適応フィルタは、比較的ゆっくりと適応するフィルタである。しかし、このフィルタはまた、擬陽性をほとんど生じないという点において、非常に正確である。フィルタ120に対する相補適応フィルタは、例えば、比較的早く適応するが、しばしば擬陽性を生じる傾向があるフィルタであるかもしれない。
【0035】
一例として、図1Cは、図1Bのフィルタ120に対して相補的な適応フィルタ130を示す。適応フィルタ130は、フィルタ係数wt2と更新アルゴリズム134(例えば上述のLMS更新アルゴリズム)によって特徴づけられる可変フィルタを含む。フィルタ132は、スピーカエコー信号x(t)を望ましい信号として予測しようと試みる。差分ユニット136は、フィルタリング処理された信号d’(t)をマイクロフォン信号d(t)から差し引いて、ローカルスピーチ信号s(t)を予測する予測信号e(t)を提供する。フィルタリング処理された信号d’(t)をリモート信号x(t)から差し引いて、誤差信号e(t)を発生させてもよい。誤差信号e(t)はフィルタ係数wt2を調整するために更新アルゴリズム134によって用いられる。フィルタ130において相互相関解析CCAは、可変フィルタ132が、予測信号e(t)とスピーカエコー信号x(t)との間の相互相関を低減させようとするように、更新アルゴリズム134を調整する。
【0036】
(t)とx(t)が非常に強く相関しているとき、フィルタリング処理は過小予測されているといわれ、更新アルゴリズム134は、Δwt2を増加させるように調整される。e(t)とx(t)との間の相互相関が閾値未満であるとき、フィルタリング処理は過大予測されているといわれ、更新アルゴリズム134は、Δwt2を減少させるように調整される。
【0037】
図1Cに示されるタイプの相互相関解析(クロススペクトラム解析ともいわれる)を用いる適応フィルタは、比較的速くフィルタを適応させる。しかし、このフィルタはまた、しばしば擬陽性を生じるという点において、不安定である。したがって、フィルタ120とフィルタ130は、相補フィルタの例となる。
【0038】
再び図1Aを参照する。インテグレータ106は、第1適応フィルタEC(1)と第2適応フィルタEC(2)に接続される。インテグレータ106は、第1および第2適応フィルタのそれぞれの出力e(t)、e(t)から、最小エコー出力e(t)を決定するように構成されている。最小エコー出力e(t)は、e(t)とe(t)のいずれかであり、エネルギがより小さく、スピーカ信号x(t)との相関がより小さい方である。e(t)とe(t)のうちの一方のエネルギの方がより小さいが、x(t)との相関は、他方がより小さい場合には、相関がより小さい方を最小エコー出力e(t)として用いる。例えば、フィルタのうちの一が過大予測されている(すなわち目標音声をキャンセルしがちであるためにエネルギ出力が小さい)とき、エネルギにかかわらず相関が小さいほうがよい。最小エネルギは、E{e(t)}とE{e(t)}との最小値を決定することにより決定されてもよい。ここで、E{}はカッコ内の量の期待値を決定する演算を示す。再び図2A−2Bを参照する。ステップ206において、e(t)とe(t)のどちらがスピーカ信号x(t)との相互相関が小さいか決定するために、e(t)とe(t)について相互相関解析が実行されてもよい。相互相関解析は、下記の式5と式6の最小値を決定するステップを含んでもよい。
(式5)

(式6)

ここで、式7の演算子
(式7)

は、例えば、上で定義されたように演算子の両側の量について、その間の相互相関をとる演算を表現する。最小エコー出力e(t)は、マイクロフォン104のフィルタリング処理された出力として用いられてもよい。
【0039】
いくつかの状況においては、フィルタEC(1)、EC(2)のうちの一が、ローカル信号を過度にフィルタリング処理するかもしれない。そのような状況においては、そのフィルタは「発散した」といわれる。これは、特にEC(2)が、例えば図1Cに示されるようなタイプの相互相関フィルタであるときに実際に起こりうる。この可能性に対処するために、ステップ208においてEC(2)が発散するかどうか、決定される。一例としてインテグレータ106は、第2適応エコーキャンセレーションフィルタが、過度にフィルタリング処理することにより、ローカル信号s(t)を除去していないか、決定するように構成されてもよい。これはe(t)とスピーカエコー信号x(t)との間の相互相関の期待値を調べることにより実行することができる。すなわち、式8で表される。
(式8)

典型的には、式9が成り立つ。
(式9)

しかしながら、式10が、ある閾値(例えば約0.2)未満であるときには、EC(2)が過度にフィルタリング処理することにより、ローカル信号s(t)が除去されている。
(式10)

このような状況において、インテグレータ106は、e(t)を最小エコー出力e(t)として選択してもよい。適応フィルタリング処理を安定させるために、ステップ212において、EC(2)のフィルタ係数wt2が、EC(1)のフィルタ係数wt1として設定されてもよい。そしてステップ215において、EC(2)は、0、または、以前のうまく適応したことが知られている状態に、再初期化されてもよい。例えば、フィルタ係数は、規則的な間隔で(例えば約10秒から20秒ごとに)保存されて、EC(2)が発散したときにこれを再初期化するために用いられてもよい。
【0040】
通常、相互相関フィルタが発散しないときに、そのフィルタはうまく適応していると言われる。EC(2)とEC(1)は相補的なフィルタリング特性を有するため、EC(2)がうまく適応しているとき、EC(1)は過小予測されていることになる。適応フィルタリング処理を安定化させるため、ステップ214に示されるように、第1適応フィルタEC(1)のフィルタ係数wt1が、第2適応フィルタEC(2)のフィルタ係数wt2と交換される。フィルタをソフトウェアに実装する際には、係数wt1、wt2は、メモリにおいてポインタによって特定される位置に格納されてもよい。係数wt1、wt2は、例えば、wt1およびwt2へのポインタを切り替えることによって、交換されてもよい。
【0041】
最小エコー出力e(t)は、いくばくかの、スピーカ信号x(t)からの残差エコーxe(t)を含むかもしれない。装置100は、オプションで、インテグレータ106に接続された第1および第2エコー残差予測部ER(1)とER(2)、および、エコー残差予測部ER(1)とER(2)に接続された残差エコーキャンセレーションモジュール108を含んでもよい。
【0042】
第1エコー残差予測部ER(1)は、最小エコー出力e(t)とスピーカ信号x(t)との間の相互相関解析を含む第1残差エコー予測ER(t)を生成するように構成されてもよい。図2Bのステップ222に示されるように、最小エコー出力e(t)とスピーカ信号x(t)との間の相互相関解析から、例えば、式11の値を決定することにより、第1残差エコー予測ER(t)が決定されてもよい。
(式11)

ここで、式11の値は、e(t)が式12の相互相関の期待値を最小化するときに、真である。
(式12)

この最小化問題は、本質的に、適応により実現されるであろう。例えば、エコー残差予測部ER(1)が、初期状態においては単位フィルタ(すべて値”1”)であると仮定されたい。すべてのフレームにおいて、サーチサーフェス(search surphace)の接線方向(tangent direction)に向かうにつれて、第1残差エコー予測ER(t)は、増加するかもしれない。これは、ニュートンソルバ(Newton solver)アルゴリズムによって実現されてもよい。第2残差エコー予測部ER(2)は、最小エコー出力e(t)とスピーカ信号x(t)との間のエコー距離ミスマッチ(echo−distance mismatch)を含む第2残差エコー予測ER(t)を決定するように構成されてもよい。図2Bのステップ224に示されるように、最小エコー出力e(t)とスピーカ信号x(t)との間のエコー距離ミスマッチから、例えば、argmin(E{(e(t))/(x(t))})を決定することにより、第2残差エコー予測ER(t)が決定されてもよい。ここで、e(t)が商(e(t))/(x(t))の期待値を最小化するとき、argmin(E{(e(t))/(x(t))})は真である。ここでも再び、最小化は、ニュートンソルバアルゴリズムを用いて実現されてもよい。
【0043】
残差エコーキャンセレーションモジュール108は、二つの残差エコー予測ER(t)とER(t)の最小残差エコー予測ER(t)を決定して、その最小値ER(t)に従ってフィルタリング処理された信号e(t)を調整してもよい。一例として、最小残差エコー予測ER(t)は、ER(t)とER(t)のうち、エネルギが最小であり、x(t)に対する相関が最小であるものであってもよい。例えば図2Bのステップ226に示されるように、ER(t)とER(t)のうちの最小値に設定され、ステップ228に示されるように、その結果であるERの値がe(t)から差しひかれて、残差エコーキャンセルフィルタリング処理された信号e’(t)が生成される。ERがER(t)に等しいならば、残差エコーxe(t)は、ローカルスピーチ信号s(t)の強度が0でないときに、最小限に除去される。ER(t)がER(t)に等しいならば、残差エコーxe(t)は、遠端のエコーx(t)のみが存在するとき(遠端発話のみの期間)最大限に除去される。
【0044】
一例として、2次のノルムN(1)とN(2)が、二つのエコー残差予測部ER(1)とER(2)のためにそれぞれ計算されてもよい。
N(1)=‖ER(1)‖
N(2)=‖ER(2)‖
【0045】
ダブルトーク状況下においては、より小さいノルムを有するエコー残差予測部が、エコー残差ノイズを取り除くために、e(t)に適用されてもよい。シングルトーク状況下においては、より大きいノルムを有するエコー残差予測部が、エコー残差ノイズを取り除くために、e(t)に適用されてもよい。
【0046】
エコーキャンセレーションにおいては、フィルタリング処理された信号e(t)、または、残差エコーキャンセルフィルタリング処理された信号e’(t)から、ノイズn(t)が除去されてもよい。ただし、このようなノイズキャンセレーションは、望ましくないかもしれない。なぜならば、信号e(t)またはe’(t)のリモート受信者は、ノイズがない状態を、マイクロフォン104からのすべての通信が失われた徴候であると解釈するかもしれないからである。この問題に対処するために、装置100はオプションで、ノイズキャンセラユニット110を含んでもよい。ノイズキャンセレーションモジュール110は、例えば図2A−2Bのステップ217に示されるように、マイクロフォン信号d(t)から予測ノイズ信号n’(t)を計算するように構成されてもよい。予測ノイズ信号n’(t)は、減衰係数αで減衰されて、低減されたノイズ信号n”(t)=αn’(t)を形成してもよい。減衰されたノイズ信号n”(t)は、図2Aのステップ218に示されるようにe(t)に加算されることにより、または、図2Bのステップ230に示されるようにe’(t)に加算されることにより、マイクロフォン出力信号s’(t)に組み込まれてもよい。
【0047】
本発明の実施形態においては、図1A−1Cに関連して説明された装置、および図2A−2Cに関連して説明された方法は、プログラマブルなプロセッサとメモリを有するシステム上のソフトウェアとして実装されてもよい。
【0048】
本発明の実施形態によると、図1および図2A−Bに関連して説明されたタイプの、前述のように動作する信号処理方法は、図3に示されるように、信号処理装置300の一部として実装されてもよい。システム300は、プロセッサ301とメモリ302(例えば、RAM、DRAM、ROMなど)を含んでもよい。信号処理装置300はさらに、並行処理が実装される場合には、複数のプロセッサ301を有してもよい。メモリ302は前述のように構成されたデータおよびコードを含む。具体的には、メモリ302には、プログラムコード304と信号データ306が格納されてもよい。コード304は、上述の、エコーキャンセリング適応フィルタEC(1)、ER(2)、インテグレータ106、エコー残差フィルタER(1)、ER(2)、残差エコーキャンセレーションモジュール108、ノイズキャンセラ110を実装してもよい。信号データ306は、マイクロフォン信号d(t)、かつ/または、スピーカ信号x(t)のデジタル表現を含んでもよい。
【0049】
装置300はまた、入出力(I/O)エレメント311、電源(P/S)312、クロック(CLK)313、キャッシュメモリ314といった、周知のサポート機能310を含んでもよい。装置300は、プログラム、かつ/または、データを格納するためのディスクドライブ、CD−ROMドライブ、テープドライブといった大容量記憶装置315をオプションで含んでもよい。コントローラは、また、オプションで、コントローラ300とユーザの間の対話を手助けするためのディスプレイユニット316と、ユーザインタフェイスユニット318を含んでもよい。ディスプレイユニット316は、ブラウン管型でもよく、またフラットパネルスクリーンでもよい。これらはテキスト、数値、グラフィックシンボル、画像を表示する。ユーザインタフェイス318は、キーボード、マウス、ジョイスティック、ライトペン(light pen)やそのほかの装置を含んでもよい。さらに、スピーカ322とマイクロフォン324は、入出力構成エレメント311を介してプロセッサ301に接続されていてもよい。プロセッサ301、メモリ302、そしてシステム300のほかの構成要素は、図3に示されるようにシステムバス320を介して互いに信号(例えば、コード・インストラクションとデータ)を交換してもよい。
【0050】
ここで用いられるように、入出力という言葉は、一般的に、システム300への、またはシステム300からの、および周辺装置への、または周辺装置からのデータを転送する任意のプログラム、オペレーション、または装置を指す。すべてのデータ転送が、一の装置からの出力であり、他の一の装置への入力であると見なすことができるであろう。周辺装置は、キーボードやマウスなどの入力のみの装置や、プリンタなどの出力のみの装置、そして上書き可能CD−ROMなどの入力および出力装置として動作する装置を含む。周辺装置という言葉には、マウス、キーボード、プリンタ、モニタ、マイクロフォン、ゲームコントローラ、カメラ、外部Zipドライブ、スキャナなどの外部装置と、CD−ROMドライブ、CD−Rドライブ、内部モデムなどの内部装置、および、フラッシュメモリ用リーダ/ライタ、ハードドライブなどのそのほかの周辺装置を含む。
【0051】
プロセッサ301は、信号データ306およびメモリ302によって格納され、獲得されプロセッサモジュール301によって実行されるプログラム304のプログラムコード命令に応えて、信号データ306にデジタル信号処理を実行する。プログラム304のコードの一部はアセンブリ、C++、Java(登録商標)またはそのほかの多くの言語のような様々な異なるプログラミング言語のうちの一であってよい。プロセッサモジュール301は、プログラムコード304のようなプログラムを実行するときには特別な目的のコンピュータとなる汎用コンピュータを構成する。プログラムコード304は、ここでは、汎用コンピューター上で実行されるソフトウェアとして実装されるものとして説明されたが、これに代えて、アプリケーション特定集積回路(ASIC)のようなハードウェアを用いて、タスク管理方法が実現されることは当業者には理解されるであろう。そのように、本発明の実施形態は、全体的にまたは部分的に、ソフトウェア、ハードウェア、またはこれらの組合せによって実現されることは理解されるであろう。
【0052】
ある実施形態においては、とりわけプログラムコード304は、図2Aの方法200や図2Bの方法220に共通な特徴を有する方法を実現するためのプロセッサ可読命令のセットを含んでもよい。プログラムコード304は、一般的に、以下のような命令を含んでもよい。すなわち、プロセッサ301に、相補的エコーキャンセレーション特性を有する第1および第2適応フィルタによって並行にマイクロフォン信号d(t)をフィルタリング処理させ、エコーキャンセル処理された出力e(t)とe(t)を生成させる命令、e(t)とe(t)から最小エコー出力e(t)を決定する命令、最小エコー出力を用いてマイクロフォン出力を生成する命令である。
【0053】
本発明の実施形態によると、相互相関解析のみ、または音声アクティビティ検出(ダブルトーク検出)のみで可能な、よりロバストでありながら正確なエコーキャンセレーションが可能となる。このような改良されたエコーキャンセレーションによると、スピーカエコーx(t)に大部分を占められているマイクロフォン信号d(t)からローカルスピーチをs(t)を抽出することが可能となる。
【0054】
本発明の実施形態は、ここで提示されたように用いられてもよく、また他のユーザ入力メカニズムと共に用いられてもよい。方位角方向や音声のボリュームを追跡したり測定したりするメカニズム、かつ/または、能動的または受動的にオブジェクトの位置を追跡するメカニズム、マシン・ビジョンを用いるメカニズム、これらの組み合わせなどである。追跡されるオブジェクトは、システムへのフィードバックを操作する補助的なコントロール装置やボタンを含んでもよい。そのようなフィードバックには、光源からの光の放射、音質の歪曲手段、その他の適切な送信機、変調器、コントロール装置、ボタン、圧力パッドなどが含まれてもよいが、これらに制限されるものではない。それは、同じ符号化状態の転送や変調に影響を及ぼしてもよく、かつ/または、システムによって追跡されている装置への命令や、その装置からの命令を転送してもよい。そのような装置は、本発明の実施形態に関連して用いられるシステムの一部であったり、またはシステムと相互作用したり、またはシステムに影響を与えたりする。
【0055】
上記は、本発明の好ましい実施形態の完全な記述であるが、他の様々な変形、変更、等価物への置換が可能である。それゆえ、本発明の範囲は、上記の記述によって決定されるのではなく、以下の請求項によって決定されるべきであり、その完全な等価物もその範囲に含まれる。ここで記述された特徴は、好ましいものであるか否かに関わらず、ここで述べたいずれの特徴と組み合わされてもよい。以下の請求項においては、特に明示的に断らない限りは、各要素の数量は一以上である。ここに、添付される請求項は、所与の請求項において、「〜ための手段」との語句を用いて明示的に示される場合の他は、ミーンズ・プラス・ファンクションの制限を含むと解されてはならない。

【特許請求の範囲】
【請求項1】
スピーカ信号x(t)を受け取るスピーカと、ローカル信号s(t)とエコー信号x(t)とを含むマイクロフォン信号d(t)を受け取るマイクロフォンとを有するシステムにおけるエコーキャンセレーション方法であって、エコー信号x(t)は、スピーカ信号x(t)に依存しており、
前記マイクロフォン信号d(t)を、第2適応フィルタに対して相補的なキャンセレーション特性を有する第1適応フィルタと、前記第2適応フィルタとで並行にフィルタリング処理するステップとを備え、
前記第1適応フィルタは、有限インパルス応答フィルタを含み、
前記第2適応フィルタは、可変フィルタを含み、
前記第1適応フィルタおよび前記第2適応フィルタは、係数を更新するための周波数領域正規化最小2乗適応フィルタを含み、
前記第1および第2適応フィルタのフィルタリング特性は、該第1および第2適応フィルタのうちの一方がその入力にうまく適応していないときに、他方はその入力にうまく適応するような特性であり、
前記第1および第2適応フィルタのうちの一方がうまく適応するのは、そのフィルタ関数h(n)が安定しており、真のエコーパスフィルタに収束し、過大予測も過小予測もされていないときであり、
本方法はさらに、
前記第1適応フィルタからの出力e(t)と、前記第2適応フィルタからの出力e(t)とから、前記スピーカ信号x(t)との相関がより小さい最小エコー出力e(t)を決定するステップと、
前記最小エコー出力e(t)を用いてマイクロフォン出力を生成するステップと、
を備える方法。
【請求項2】
前記マイクロフォン信号d(t)を前記第1適応フィルタと前記第2適応フィルタとで並行にフィルタリング処理するステップは、
x(t)の強度が閾値を超えた場合に、前記第1適応フィルタのフィルタ係数の組を適応させるステップと、
前記第2適応フィルタで、e(t)とx(t)の相互相関を解析するステップを含む請求項1に記載の方法。
【請求項3】
前記最小エコー出力e(t)を決定するステップは、前記第2適応フィルタが前記ローカル信号s(t)をフィルタリング処理により過度に除去していないか決定するステップと、
前記第2適応フィルタが前記ローカル信号s(t)をフィルタリング処理により過度に除去している場合に、前記第1適応フィルタの出力を前記最小エコー出力として用いるステップとを含む請求項2に記載の方法。
【請求項4】
前記第2適応フィルタが前記ローカル信号s(t)をフィルタリング処理により過度に除去していないか決定するステップは、
前記第2適応フィルタの出力e(t)と、前記スピーカ信号x(t)との間の相互相関をとるステップと、
前記第2適応フィルタの出力e(t)と前記スピーカ信号x(t)との間の相互相関の期待値が所定の閾値未満であるか判定するステップと、
前記相互相関の期待値が前記閾値未満である場合に、前記第2適応フィルタが前記ローカル信号s(t)をフィルタリング処理により過度に除去していることを決定するステップとを含む請求項3に記載の方法。
【請求項5】
前記第2適応フィルタが前記ローカル信号s(t)をフィルタリング処理により過度に除去している場合に、前記第2適応フィルタのフィルタ係数の組を前記第1エコーキャンセレーションフィルタのフィルタ係数の組で置き換えるステップをさらに含む請求項3に記載の方法。
【請求項6】
前記最小エコー出力e(t)を用いて前記マイクロフォン出力を生成するステップは、前記最小エコー出力e(t)と前記スピーカ信号x(t)との間の相互相関の解析を含む第1残差予測ER(t)を並行に決定するステップと、前記最小エコー出力e(t)と前記スピーカ信号x(t)との間のエコー距離ミスマッチを含む第2残差予測ER(t)を決定するステップとを含む請求項1に記載の方法。
【請求項7】
前記相互相関解析は、e(t)とx(t)との間の相互相関の期待値を計算するステップを含む請求項6に記載の方法。
【請求項8】
前記エコー距離ミスマッチは、{e(t)/x(t)}の期待値を計算するステップを含む請求項6に記載の方法。
【請求項9】
前記第1残差予測ER(t)を決定するステップは、第1残差予測部ER(1)の2次ノルムN(1)を計算するステップを含み、
前記第2残差予測ER(t)を決定するステップは、第2残差予測部ER(2)の2次ノルムN(2)を計算するステップを含み、
本方法はさらに、ダブルトークの間、e(t)に、対応するノルムN(1)またはN(2)がより小さい前記エコー残差予測部ER(1)またはER(2)を適用するステップを含む請求項6に記載の方法。
【請求項10】
前記第1残差予測ER(t)を決定するステップは、第1残差予測部ER(1)の2次ノルムN(1)を計算するステップを含み、
前記第2残差予測ER(t)を決定するステップは、第2残差予測部ER(2)の2次ノルムN(2)を計算するステップを含み、
本方法はさらに、シングルトークの間、e(t)に、対応するノルムN(1)またはN(2)がより大きい前記エコー残差予測部ER(1)またはER(2)を適用するステップを含む請求項6に記載の方法。
【請求項11】
前記最小エコー出力e(t)を用いてマイクロフォン出力を生成するステップはさらに、最小残差エコー予測ER(t)を決定するステップを含み、
前記最小残差エコー予測ER(t)は、ER(t)とER(t)のうちの一で、エネルギが最小でありx(t)との相関が最小である請求項6に記載の方法。
【請求項12】
前記最小エコー出力e(t)からER(t)を選択的に除去するステップをさらに含む請求項11に記載の方法。
【請求項13】
前記マイクロフォン出力からER(t)を選択的に除去するステップは、遠端通話のみの期間に、前記マイクロフォン出力からER(t)を最大限に除去するステップを含む請求項12に記載の方法。
【請求項14】
前記マイクロフォン出力からER(t)を選択的に除去するステップは、前記ローカル信号s(t)の強度が0でないときに、前記マイクロフォン出力からER(t)を最小限に除去するステップを含む請求項12に記載の方法。
【請求項15】
前記マイクロフォン信号d(t)から予測ノイズ信号n’(t)を計算するステップと、
前記予測ノイズ信号n’(t)のレベルを低減させて、低減ノイズ信号n”(t)を形成するステップと、
前記マイクロフォン出力信号に、前記低減ノイズ信号n”(t)を組み込むステップとをさらに含む請求項1に記載の方法。
【請求項16】
スピーカとマイクロフォンを有するシステムにおいて用いられるエコーキャンセレーション装置であって、スピーカは、スピーカ信号x(t)を受けるように適合され、マイクロフォンは、ローカル信号s(t)とエコー信号x(t)とを含むマイクロフォン信号d(t)を受け取るように適合され、エコー信号x(t)は、スピーカ信号x(t)に依存しており、
本装置は、
前記スピーカと前記マイクロフォンに接続され、有限インパルス応答フィルタを含む第1適応フィルタと、
前記第1適応フィルタと並行に前記スピーカと前記マイクロフォンに接続され、可変フィルタを含む第2適応フィルタとを備え、
前記第1適応フィルタおよび前記第2適応フィルタは、係数を更新するための周波数領域正規化最小2乗適応フィルタを含み、
前記第2適応フィルタは、前記第1適応フィルタに対して相補的なエコーキャンセレーション特性を有し、
前記第1および第2適応フィルタのフィルタリング特性は、該第1および第2適応フィルタのうちの一方がその入力にうまく適応していないときに、他方はうまく適応するような特性であり、
前記第1および第2適応フィルタのうちの一方がうまく適応するのは、そのフィルタ関数h(n)が安定しており、真のエコーパスフィルタに収束し、過大予測も過小予測もされていないときであり、
本装置はさらに、
前記第1適応フィルタと前記第2適応フィルタに接続されたインテグレータとを備え、
前記インテグレータは、前記第1適応フィルタからの出力e(t)と、前記第2適応フィルタからの出力e(t)から、最小エコー出力e(t)を決定するように構成されており、
前記最小エコー出力e(t)と前記スピーカ信号x(t)との相関はより小さい装置。
【請求項17】
前記インテグレータは、前記第2エコーキャンセレーションフィルタが前記ローカル信号s(t)をフィルタリング処理により過度に除去していないか決定するように構成され、前記第2適応フィルタが前記ローカル信号s(t)をフィルタリング処理により過度に除去している場合に、インテグレータは、最小エコー出力e(t)として前記出力e(t)を選択する請求項16に記載の装置。
【請求項18】
前記第1適応フィルタは、音声アクティビティ検出フィルタである請求項16に記載の装置。
【請求項19】
前記第2適応フィルタは、相互相関解析フィルタである請求項16に記載の装置。
【請求項20】
前記インテグレータに接続された第1エコー残差予測部ER(1)と、
前記インテグレータに接続された第2エコー残差予測部ER(2)とをさらに備える請求項16に記載の装置。
【請求項21】
前記第1エコー残差予測部ER(1)は、前記最小エコー出力e(t)と前記スピーカ信号x(t)との相互相関の解析を含む第1残差予測ER(t)を生成するように構成され、
前記第2エコー残差予測部ER(2)は、前記最小エコー出力e(t)と前記スピーカ信号x(t)との間のエコー距離ミスマッチを含む第2残差予測ER(t)を決定するように構成されている請求項20に記載の装置。
【請求項22】
前記相互相関解析は、e(t)とx(t)との相互相関の期待値の計算を含む請求項21に記載の装置。
【請求項23】
前記エコー距離ミスマッチは、{e(t)/x(t)}の期待値の計算を含む請求項21に記載の装置。
【請求項24】
前記第1および第2エコー残差予測部に接続された残差エコーキャンセレーションモジュールをさらに備える装置であって、
前記残差エコーキャンセレーションモジュールは、
第1残差予測部ER(1)の2次ノルムN(1)を計算し、第2残差予測ER(2)の2次ノルムN(2)を計算するように構成され、
前記残差エコーキャンセレーションモジュールは、ダブルトークの間、対応するノルムN(1)またはN(2)がより小さい前記エコー残差予測部ER(1)またはER(2)を、e(t)に適用するように構成されている請求項21に記載の装置。
【請求項25】
前記第1および第2エコー残差予測部に接続された残差エコーキャンセレーションモジュールをさらに備える装置であって、
前記残差エコーキャンセレーションモジュールは、
第1残差予測部ER(1)の2次ノルムN(1)を計算し、第2残差予測ER(2)の2次ノルムN(2)を計算するように構成され、
前記残差エコーキャンセレーションモジュールは、シングルトークの間、対応するノルムN(1)またはN(2)がより大きい前記エコー残差予測部ER(1)またはER(2)を、e(t)に適用するように構成されている請求項21に記載の装置。
【請求項26】
前記第1および第2エコー残差予測部に接続された残差エコーキャンセレーションモジュールをさらに備える装置であって、
前記残差エコーキャンセレーションモジュールは、最小残差エコー予測ER(t)を決定するように構成されており、
前記最小残差エコー予測ER(t)は、ER(t)とER(t)のうちの一で、エネルギが最小でありx(t)との相関が最小である請求項21に記載の装置。
【請求項27】
前記残差エコーキャンセレーションモジュールは、前記最小エコー出力e(t)からER(t)を選択的に除去するように構成されている請求項26に記載の装置。
【請求項28】
前記残差エコーキャンセレーションモジュールは、遠端通話のみの期間に、前記マイクロフォン出力からER(t)を最大限に除去するように構成されている請求項27に記載の装置。
【請求項29】
前記残差エコーキャンセレーションモジュールは、前記ローカル信号s(t)の強度が0でない場合に、前記マイクロフォン出力からER(t)を最小限に除去するように構成されている請求項27に記載の装置。
【請求項30】
前記マイクロフォンに接続されたノイズキャンセレーションモジュールをさらに備え、 前記ノイズキャンセレーションモジュールは、
マイクロフォン信号d(t)から予測ノイズ信号n’(t)を計算し、
予測ノイズ信号n’(t)レベルを減少させて、低減ノイズ信号n”(t)を形成し、
マイクロフォン出力信号に、その低減ノイズ信号n”(t)を取り入れるように構成されている請求項16に記載の装置。
【請求項31】
マイクロフォンと、
スピーカと、
前記マイクロフォンとスピーカとに接続されているプロセッサと、
前記プロセッサに接続されているメモリとを備える音響信号処理システムであって、
前記メモリは、
スピーカ信号x(t)を受け取るスピーカと、
ローカル信号s(t)と、前記スピーカ信号x(t)に依存するエコー信号x(t)とを含むマイクロフォン信号d(t)を受け取るマイクロフォンを有するシステムにおけるエコーキャンセレーション方法を実装するためのプロセッサ可読命令の組を格納し、
前記プロセッサ可読命令は、
前記マイクロフォン信号d(t)を、第2適応フィルタに対して相補的なキャンセレーション特性を有する第1適応フィルタと、前記第2適応フィルタとで並行にフィルタリング処理するための命令を含み、
前記第1適応フィルタは、有限インパルス応答フィルタを含み、
前記第2適応フィルタは、可変フィルタを含み、
前記第1適応フィルタおよび前記第2適応フィルタは、係数を更新するための周波数領域正規化最小2乗適応フィルタを含み、
前記第1および第2適応フィルタのフィルタリング特性は、該第1および第2適応フィルタのうちの一方がその入力にうまく適応していないときに、他方はうまく適応するような特性であり、
前記第1および第2適応フィルタのうちの一方がうまく適応するのは、そのフィルタ関数h(n)が安定しており、真のエコーパスフィルタに収束し、過大予測も過小予測もされていないときであり、
前記プロセッサ可読命令はさらに、
前記第1適応フィルタからの出力e(t)と前記第2適応フィルタからの出力e(t)から、スピーカ信号x(t)との相関がより少ない最小エコー出力e(t)を決定するための命令と、
前記最小エコー出力e(t)を用いて、マイクロフォン出力を生成するための命令と、
を含む音響信号処理システム。
【請求項32】
プロセッサに接続されているメモリを備えるプロセッサ可読媒体であって、
前記メモリは、
スピーカ信号x(t)を受け取るスピーカと、
ローカル信号s(t)と、スピーカ信号x(t)に依存するエコー信号x(t)とを含むマイクロフォン信号d(t)を受け取るマイクロフォンを有するシステムにおけるエコーキャンセレーション方法を実装するためのプロセッサ可読命令の組を格納し、
前記プロセッサ可読命令は、
前記マイクロフォン信号d(t)を、第2適応フィルタに対して相補的なキャンセレーション特性を有する第1適応フィルタと、前記第2適応フィルタとで並行にフィルタリング処理するための命令を含み、
前記第1適応フィルタは、有限インパルス応答フィルタを含み、
前記第2適応フィルタは、可変フィルタを含み、
前記第1適応フィルタおよび前記第2適応フィルタは、係数を更新するための周波数領域正規化最小2乗適応フィルタを含み、
前記第1および第2適応フィルタのフィルタリング特性は、該第1および第2適応フィルタのうちの一方がその入力にうまく適応していないときに、他方はうまく適応するような特性であり、
前記第1および第2適応フィルタのうちの一方がうまく適応するのは、そのフィルタ関数h(n)が安定しており、真のエコーパスフィルタに収束し、過大予測も過小予測もされていないときであり、
前記プロセッサ可読命令はさらに、
前記第1適応フィルタからの出力e(t)と前記第2適応フィルタからの出力e(t)から、スピーカ信号x(t)との相関がより小さい最小エコー出力e(t)を決定するための命令と、
前記最小エコー出力e(t)を用いてマイクロフォン出力を生成するための命令と、
を含む媒体。

【図1A】
image rotate

【図1B】
image rotate

【図1C】
image rotate

【図2A】
image rotate

【図2B】
image rotate

【図3】
image rotate


【公開番号】特開2010−171985(P2010−171985A)
【公開日】平成22年8月5日(2010.8.5)
【国際特許分類】
【出願番号】特願2010−19147(P2010−19147)
【出願日】平成22年1月29日(2010.1.29)
【分割の表示】特願2009−509908(P2009−509908)の分割
【原出願日】平成19年3月30日(2007.3.30)
【出願人】(395015319)株式会社ソニー・コンピュータエンタテインメント (871)
【Fターム(参考)】