説明

音声信号処理装置

【課題】ドライブスルー等において近端集音環境が変換する場合のエコー消去能力を向上できる音声信号処理装置を提供する。
【解決手段】エコーキャンセラ23は遠端信号に基づいて疑似エコー信号を生成する適応フィルタ41と、適応フィルタ41のエコーキャンセラ係数を係数更新処理により収束させる係数更新制御部43とを有する。環境変化検知部である車両検知部9が、近端集音環境の変化として車両到来を検知したとき、係数更新制御部43は、検知後の時間経過に応じてエコーキャンセラ係数の収束速度を低下させるように係数更新処理を変更する。係数更新制御部43はNLMS法のステップサイズを時間経過に応じて低下させてよい。係数更新制御部43は、収束速度が低下するように係数更新処理を切り替えてよく、例えばRLS法からNLMS法へ切り替えてよい。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、エコーキャンセルを行う音声信号処理装置に関する。
【背景技術】
【0002】
従来、エコーキャンセラを備えた音声信号処理装置が音声伝送システムにて用いられている。この種の音声伝送技術では、音声伝送の一端を近端といい、他端を遠端という。遠端側の音声は、遠端信号として近端側へ伝送され、近端側のスピーカから出力される。近端側のマイクは近端信号を入力し、近端信号が近端側から遠端側へ伝送される。このとき、スピーカから出力された音声がマイクに回り込むと、エコーが発生する。エコーは、近端信号に含まれて遠端側に伝送され、音声品質を劣化させる。そこで、エコーを消去(キャンセル)するためにエコーキャンセラが設けられる。
【0003】
従来、エコーキャンセルは、下記のようにして、適応フィルタを用いて行われる。遠端側から近端側に伝送された遠端信号は、近端側のスピーカに供給されると共に、適応フィルタに入力される。適応フィルタは、フィルタ処理によって遠端信号から疑似エコー信号を生成する。疑似エコー信号が、マイクより入力される近端信号から減算される。これにより、エコーキャンセラは、近端信号からエコーを消去できる。
【0004】
上記の適応フィルタは、近端信号に含まれる実際のエコーと同じ疑似エコー信号を生成するためにフィルタ係数を更新するように構成されている。以下、適応フィルタのフィルタ係数をエコーキャンセラ係数と呼ぶ。
【0005】
従来のエコーキャンセラの係数更新処理として、学習同定法(NLMS)が広く知られている。学習同定法は、学習処理の一つであり、下記の式に従ってエコーキャンセラ係数を繰り返し更新し、これによりエコーキャンセラ係数が学習されて、収束する。
【数1】

【0006】
ここで、w(k)は、時刻kにおける適応フィルタの係数ベクトル(エコーキャンセラ係数)であり、x(k)は、時刻kにおける適応フィルタへの入力信号(遠端信号)ベクトルである。βは、分母項が0になるのを防ぐための微小定数である。μは、ステップサイズである。e(k)は、時刻kにおける近端信号から疑似エコー信号を引いた残差信号である。
【0007】
学習同定法において、ステップサイズμは、音声信号処理装置の使用条件に合わせて0〜2程度の値で固定される場合が多い。このステップサイズμは下記のような性質を持つ。すなわち、ステップサイズμの値が小さい程、エコー消去能力における学習収束速度が遅くなるが、収束後は安定してエコーを消去できる。反対に、ステップサイズμの値が大きい程、学習収束速度は速くなるが、収束後の処理は不安定で、エコー消去能力は低下する。学習同定法を用いたエコーキャンセラは特許文献1に開示されている。
【0008】
例えば、エコーキャンセラは、ファストフード店のドライブスルーシステムに好適に備えられる。ドライブスルーにおける顧客側を近端側とし、店員側を遠端側とする。店員の音声が遠端信号として伝送されて、近端側のスピーカから出力される。顧客が発した音声は、近端信号として近端側のマイクから入力されて、遠端側(店員)へと伝送される。このとき、店員の音声がスピーカからマイクに回り込むと、エコーが発生する。このエコーが、エコーキャンセラにより好適に消去される。
【特許文献1】特開2004−357053号公報
【発明の開示】
【発明が解決しようとする課題】
【0009】
しかしながら、従来のエコーキャンセラを備えた音声信号処理装置においては、近端集音環境が大きく変化した場合に、エコーキャンセラ係数の収束が間に合わず、エコー抑圧が遅れ、エコーが遠端側に戻ってしまうことがあるという問題があった。
【0010】
近端集音環境が大きく変化する場合とは、例えば、前出のドライブスルーシステムである。ドライブスルーでは、常に車両が入れ替わっており、近端集音環境が激しく変換しており、そのためにエコーキャンセラ係数の収束が間に合わず、エコーが遠端側に送られてしまうことがあり得る。
【0011】
上記の問題を防ぐために、エコーキャンセラ係数の収束速度を大きく設定することも考えられる。例えば、学習同定法(NLMS)では、ステップサイズを大きく設定することにより、収束速度を増大できる。しかしながら、収束速度を増大すると、収束後の消去処理が不安定になり、エコー消去能力が低下してしまう。
【0012】
本発明は、従来の問題を解決するためになされたもので、その目的は、近端集音環境が変化する場合のエコー消去能力を向上できる音声信号処理装置を提供することにある。
【課題を解決するための手段】
【0013】
本発明は、遠端側から近端側へ伝送された遠端信号を近端側のスピーカから出力し、近端側のマイクから入力された近端信号を遠端側に伝送する音声伝送システムに設けられた音声信号処理装置であって、前記スピーカへ供給される前記遠端信号に基づいて前記マイクに入力される前記近端信号からエコーを消去するエコーキャンセラと、前記スピーカ及び前記マイクが設けられた前記近端側における音響伝達関数に影響する近端集音環境の変化を検知する環境変化検知部とを備え、前記エコーキャンセラは、前記遠端信号に基づいて疑似エコー信号を生成する適応フィルタと、前記適応フィルタのフィルタ係数であるエコーキャンセラ係数を係数更新処理により収束させる係数更新制御部とを有し、前記係数更新制御部は、前記環境変化検知部が前記近端集音環境の変化を検知したときに、前記近端集音環境の変化の検知後の時間経過に応じて前記エコーキャンセラ係数の収束速度を低下させるように前記係数更新処理を変更する。
【0014】
この構成により、近端集音環境の変化が検知されたときに、近端集音環境の変化の検知後の時間経過に応じてエコーキャンセラ係数の収束速度を低下させるように係数更新処理が変更される。したがって、近端集音環境の変化が検知された直後は、係数収束速度を大きくして、エコー抑圧速度を大きくできる。そして、検知後の時間経過に応じて係数収束速度を低下させることにより、収束後のエコー消去を安定化できる。こうして、エコー抑圧速度(係数収束速度)と収束後の安定性とを両立でき、集音環境変化時のエコー消去能力を向上できる。
【0015】
本発明の音声信号処理装置において、前記環境変化検知部は、前記近端集音環境の変化として前記近端側への車両の到来を検知する。
【0016】
この構成により、近端側に車両が到来するような音声伝送システムにおいて、近端集音環境の変化を適切に検知して、エコー処理能力を向上できる。例えば、ファストフード店のドライブスルーシステムにおいてエコー処理能力を向上できる。
【0017】
本発明の音声信号処理装置において、前記係数更新制御部は、前記近端集音環境の変化の検知後の時間経過に応じて前記エコーキャンセラ係数の係数更新処理のステップサイズを低減させることにより、前記エコーキャンセラ係数の収束速度を低下させる。
【0018】
この構成により、近端集音環境の変化の検知後の時間経過に応じてエコーキャンセラ係数の収束速度を好適に低下させることができる。そして、エコー抑圧速度(係数収束速度)と収束後の安定性とを両立し、集音環境変化時のエコー消去能力を向上できる。
【0019】
本発明の音声信号処理装置において、前記係数更新制御部は、収束速度が異なる複数の係数更新処理を切替可能に構成されており、前記近端集音環境の変化の検知後の時間経過に応じて前記収束速度が低下するように前記複数の係数更新処理の切替を行う。
【0020】
この構成により、複数種類の係数更新処理が切り替えられ、これにより、近端集音環境の変化の検知後の時間経過に応じてエコーキャンセラ係数の収束速度を好適に低下させることができる。そして、エコー抑圧速度(係数収束速度)と収束後の安定性とを両立し、集音環境変化時のエコー消去能力を向上できる。
【0021】
本発明の音声信号処理装置において、前記係数更新制御部は、前記近端集音環境の変化が検知されたとき、RLS法の係数更新処理を行い、続いてNLMS法の係数更新処理を行う。
【0022】
この構成により、近端集音環境の変化の検知後の時間経過に応じてエコーキャンセラ係数を好適に制御でき、エコー抑圧速度(係数収束速度)と収束後の安定性とを両立し、エコー消去能力を向上できる。
【0023】
本発明の音声信号処理装置において、前記係数更新制御部は、前記近端集音環境が検知されたときに、検知前の前記エコーキャンセラ係数をクリアする。
【0024】
この構成により、近端集音環境が変化したときにエコーキャンセラ係数を一旦クリアすることで、変化後の環境に応じてエコーキャンセラ係数を好適に制御でき、エコー消去能力を向上できる。
【0025】
本発明の音声信号処理装置において、前記エコーキャンセラは、さらに、前記適応フィルタと別のキャンセル実行フィルタと、前記適応フィルタから前記キャンセル実行フィルタへ前記エコーキャンセラ係数を転送する係数転送部とを備え、前記係数転送部は、前記適応フィルタと前記キャンセル実行フィルタのエコー消去効果を比較して、前記適応フィルタが前記キャンセル実行フィルタより有意に前記近端信号のエコーを消去すると判定したときに、前記適応フィルタのエコーキャンセラ係数を前記キャンセル実行フィルタに転送し、前記キャンセル実行フィルタが、前記適応フィルタから転送された前記エコーキャンセラ係数を用いてエコー消去を実行する。
【0026】
この構成により、キャンセル実行フィルタよりも有意にエコーを消去するエコーキャンセラ係数を係数更新制御部が算出したときに、エコーキャンセラ係数がキャンセル実行フィルタに転送される。係数収束中にエコーを有意に消去しないエコーキャンセラ係数を係数更新制御部が算出しても、係数転送が行われない。エコー抑圧効果がより大きくなるエコーキャンセラ係数を用いてキャンセル実行フィルタがエコー消去を実行でき、エコー消去の安定性を向上できる。
【0027】
本発明の音声信号処理装置は、前記近端集音環境における雑音を前記近端信号から学習することにより、前記近端信号の雑音を抑圧する雑音抑圧部を有し、前記雑音抑圧部は、前記環境変化検知部が前記近端集音環境の変化を検知したときに、検知前の雑音学習をリセットし、雑音学習を新たに開始する。
【0028】
この構成により、近端集音環境の変化が検知されたときに、検知前の雑音学習がリセットされ、雑音学習が新たに開始される。したがって、変化後の近端集音環境に合わせて雑音学習の推定精度を最適化でき、雑音抑圧効果を向上できる。
【0029】
本発明の別の態様は、遠端側から近端側へ伝送された遠端信号を近端側のスピーカから出力し、近端側のマイクから入力された近端信号を遠端側に伝送する音声伝送システムにて行われる音声信号処理方法であって、前記スピーカへ供給される前記遠端信号に基づいて前記マイクに入力される前記近端信号からエコーを消去するエコーキャンセル処理と、前記スピーカ及び前記マイクが設けられた前記近端側における音響伝達関数に影響する近端集音環境の変化を検知する環境変化検知処理とを行い、前記エコーキャンセル処理は、前記遠端信号に基づいて疑似エコー信号を生成する適応フィルタ処理と、前記適応フィルタ処理のフィルタ係数であるエコーキャンセラ係数を係数更新処理により収束させる係数更新制御処理とを含み、前記係数更新制御処理は、前記環境変化検知処理にて前記近端集音環境の変化が検知されたときに、前記近端集音環境の変化の検知後の時間経過に応じて前記エコーキャンセラ係数の収束速度を低下させるように前記係数更新処理を変更する。この方法によっても上述した本発明の利点が得られる。
【0030】
本発明の別の態様は、遠端側から近端側へ伝送された遠端信号を近端側のスピーカから出力し、近端側のマイクから入力された近端信号を遠端側に伝送する音声伝送システムに設けられた音声信号処理装置であって、前記近端集音環境における雑音を前記近端信号から学習することにより、前記近端信号の雑音を抑圧する雑音抑圧部と、前記スピーカ及び前記マイクが設けられた前記近端側における音響伝達関数に影響する近端集音環境の変化を検知する環境変化検知部とを備え、前記雑音抑圧部は、前記環境変化検知部が前記近端集音環境の変化を検知したときに、検知前の雑音学習をリセットし、雑音学習を新たに開始する。この構成によっても、近端集音環境の変化が検知されたときに、検知前の雑音学習がリセットされ、雑音学習が新たに開始される。したがって、変化後の近端集音環境に合わせて雑音学習の推定精度を最適化でき、雑音抑圧効果を向上できる。
【0031】
本発明の別の態様は、遠端側から近端側へ伝送された遠端信号を近端側のスピーカから出力し、近端側のマイクから入力された近端信号を遠端側に伝送する音声伝送システムにて行われる音声信号処理方法であって、前記近端集音環境における雑音を前記近端信号から学習することにより、前記近端信号の雑音を抑圧する雑音抑圧処理と、前記スピーカ及び前記マイクが設けられた前記近端側における音響伝達関数に影響する近端集音環境の変化を検知する環境変化検知処理とを行い、前記雑音抑圧処理は、前記環境変化検知処理が前記近端集音環境の変化を検知したときに、検知前の雑音学習をリセットし、雑音学習を新たに開始する。この方法によっても上記装置の態様と同様の利点が得られる。
【発明の効果】
【0032】
本発明は、近端集音環境の変化の検知後の時間経過に応じてエコーキャンセラ係数の収束速度を低下させる構成を備え、これにより、近端集音環境が変化する場合のエコー消去能力を向上できるという効果を有する音声信号処理装置を提供することができる。
【発明を実施するための最良の形態】
【0033】
以下、本発明の実施の形態の音声信号処理装置について、図面を用いて説明する。
【0034】
本発明の第1の実施の形態の音声信号処理装置を図1に示し、図1の音声信号処理装置を含む音声伝送システムの全体構成を図2に示す。
【0035】
図2を参照すると、本実施の形態の例では、本発明が、ファストフード店のドライブスルーシステムに適用される。音声伝送システム1は、顧客側のスピーカ3、マイク5及び音声信号処理装置7と、店員側のスピーカ11、マイク13及び音声信号処理装置15を含む。そして、顧客側のスピーカ3及びマイク5は屋外のドライブスルー用の停車場所に設置され、店員側のスピーカ11及びマイク13は店員の頭部に片耳タイプのヘッドセットとして装着される。
【0036】
本実施の形態では、本発明が顧客側の音声信号処理装置7に適用される。したがって、図2に示されるように、本実施の形態では、顧客側を近端側とし、店員側を遠端側とする。店員の音声は、遠端側(店員側)のマイク13に入力されて、遠端信号として伝送され、近端側(顧客側)のスピーカ3から出力される。顧客の音声は、近端側のマイク5に近端信号として入力され、遠端側に送られて、スピーカ11から出力される。
【0037】
また、音声信号処理装置7は図示のように車両検知部9を備える。車両検知部9は、ドライブスルーの停車場所に車両が到来したことを検知する。車両検知部9は、本発明の環境変化検知部の一例であり、環境変化検知部は、近端側における音響伝達関数に影響する近端集音環境の変化を検知する構成である。ドライブスルーでは、車体の入替りで近端集音環境が変化し、この環境変化が車両検知部9により検知される。
【0038】
図1は、本実施の形態の音声信号処理装置7の構成を示している。図示のように、音声信号処理装置7は、音声スイッチ21、エコーキャンセラ23、雑音抑制部25及びエコーサプレッサ27を有し、また、前述したように車両検知部9を有する。
【0039】
音声スイッチ21は、遠端信号と近端信号の一方を通過させるようにスイッチ動作を行う。遠端信号はエコーキャンセラ23を通り、D/A変換部31にてアナログ信号に変換されて、スピーカ3から出力される。また、顧客の音声は、マイク5から入力され、A/D変換部33にてデジタル信号に変換される。このデジタル音声信号は、近端信号としてエコーキャンセラ23、雑音抑圧部25及びエコーサプレッサ27を通る。エコーキャンセラ23は、後述するように適応フィルタで構成されており、遠端信号を用いて疑似エコー信号を生成することにより、近端信号からエコーを消去する。雑音抑圧部25もフィルタで構成されており、雑音学習を行って近端信号の雑音を抑圧する。エコーサプレッサ27はアッテネータで構成されており、エコーキャンセラ23の処理にて残ったエコーを抑圧する。近端信号は、これらの構成にて処理され、さらに音声スイッチ21を通って遠端側へ伝送される。
【0040】
車両検知部9は、既に説明したように、ドライブスルーの停車場所に車両が到来したことを検知することにより、本発明の環境変化検知部として機能する。図の例では、ドライブスルーコースにセンサコイルが設置されている。車両が到来したときにセンサコイルに流れる電流を利用して、車両が検知される。車両検知部9は、車両の検知を示す車両検知信号を、近端集音環境の変化の検知の情報として、エコーキャンセラ23及び雑音抑圧部25に供給する。
【0041】
次に、エコーキャンセラ23について説明する。遠端側から近端側に伝送された遠端信号は、近端側のスピーカ3から出力される。この遠端信号がマイク5に回り込むと、エコーとして遠端側に戻ってしまい、音質を低下させる。このようなエコーがエコーキャンセラ23により消去される。
【0042】
エコーキャンセラ23は、図示のように、適応フィルタ41、係数更新制御部43及び減算器45で構成されている。適応フィルタ41には遠端信号が入力され、適応フィルタ41は遠端信号から擬似エコー信号を生成する。すなわち、適応フィルタ41は、遠端信号にフィルタ処理を施すことにより、マイク5に回り込むエコーと同様の音声信号を生成する。
【0043】
減算器45には、マイク5からA/D変換器33を介して近端信号が入力され、また、適応フィルタ41から擬似エコー信号が入力される。減算器45は近端信号から擬似エコー信号を減算し、これにより近端信号からエコーが消去される。
【0044】
係数更新制御部43は、近端信号に含まれる実際のエコーと同じ疑似エコー信号が生成されるように、適応フィルタ41のフィルタ係数を制御する。既述の通り、適応フィルタのフィルタ係数をエコーキャンセラ係数と呼ぶ。係数更新制御部43は、学習処理によってエコーキャンセラ係数を繰り返し更新し、これによりエコーキャンセラ係数が収束して、適応フィルタ41が実際のエコーとほぼ同じ擬似エコー信号を生成できる。
【0045】
係数更新制御部43には、車両検知部9から、車両の到来を示す車両検知信号が入力される。車両検知信号の入力は、近端集音環境が変化し、近端の音響伝達関数が変化したことを意味する。係数更新制御部43は、変化後の近端集音環境とその音響伝達関数に合わせてエコーキャンセラ係数を収束させる必要がある。このとき、係数更新制御部43は下記のように動作する。
【0046】
すなわち、係数更新制御部43は、車両検知信号が入力されると、車両検知後の時間経過に応じてエコーキャンセラ係数の収束速度を低下させるように係数更新処理を変更する。この制御によって、車両検知直後は収束速度が高く設定され、車両検知後の近端集音環境に合わせたエコーキャンセラ係数の調整を短期間で行える。そして、検知後の時間経過に応じて収束速度を低下させることにより、収束後のエコー消去を安定化できる。
【0047】
上述した係数収束速度の制御は、例えば、一つの係数更新処理におけるパラメータの制御によって実現され、また例えば、収束速度が異なる複数種類の係数更新処理を切り替えることによって実現できる。本実施の形態の例では、下記に説明するように、パラメータ制御が行われる。
【0048】
図3は、エコーキャンセラ23の構成をより詳細に示している。このエコーキャンセラ23は、学習同定法(NLMS法)によってエコーキャンセラ係数を更新するように構成されている。NLMS法は、下記の式に従ってエコーキャンセラ係数を繰り返し更新する。
【数2】

【0049】
ここで、w(k)は、時刻kにおける適応フィルタの係数ベクトル(エコーキャンセラ係数)であり、x(k)は、時刻kにおける適応フィルタへの入力信号(遠端信号)ベクトルである。βは、分母項が0になるのを防ぐための微小定数である。μは、ステップサイズである。e(k)は、時刻kにおける近端信号から疑似エコー信号を引いた残差信号である。
【0050】
図3を参照すると、係数更新制御部43には、遠端信号xが入力される。また、係数更制御部43には、減算器45を通過後の残差信号eが入力される。残差信号eは、近端信号から擬似エコー信号を引いた信号である。さらに、係数更新制御部43には、現在のエコーキャンセラ係数wが適応フィルタ41から入力される。係数更新制御部43は、これらの入力信号から、上記のNLMS法の計算式に従って、次ステップのエコーキャンセラ係数を計算し、算出したエコーキャンセラ係数を適応フィルタ41に送り、適応フィルタ41に係数更新を行わせる。
【0051】
上記構成において、車両検知部9から車両検知信号が入力されると、係数更新制御部43は、エコーキャンセラ係数を一旦0クリアする。すなわち、車両検知前の学習結果が破棄され、係数更新制御部43は未学習状態から学習を開始することになる。エコーキャンセラ係数をクリアするのは、車両の到来による近端集音環境の大幅な変化により早く適応するためである。車両検知前の学習結果を継続利用するのと比べて、未学習状態から学習を開始することにより、変化後の環境に応じた適切な値へとエコーキャンセラ係数がより早く収束する。そこで、上記のようにエコーキャンセラ係数がクリアされる。
【0052】
エコーキャンセラ係数をクリアした後、係数更新制御部43は、上述のNLMS法の式に従って、エコーキャンセラ係数を繰り返し更新する。このときステップサイズμが、車両検知後(リセット後)の時間経過に応じて小さく変更される。ステップサイズμは例えば0〜2程度の範囲で変更される。
【0053】
図4は、ステップサイズμの変更制御を示している。この例では、ステップサイズμは、所定の初期値に設定され、それから、所定幅ずつ低減される。後述するように、所定のステップサイズ低減制御期間にわたってステップサイズμが低減され、最後に所定の固定値に固定される。図の例ではステップサイズμが、複数回変更される。しかし、ステップサイズμが1回のみ、すなわち2段階で変更されてもよい。
【0054】
このようなステップサイズμの変更により、係数収束速度を可変制御できる。ステップサイズμの初期値は所定の比較的大きい値に設定される。ステップサイズμが大きいと、学習収束速度を大きくできる。ただし、学習収束速度が大きいままだと、収束後の安定性が低くなる。そこで、収束途中でステップサイズμがクリア後(検知後)の初期値と比べて小さく変更される。これにより、係数収束速度が低下するが、収束後に高い安定性が得られる。
【0055】
適応フィルタ41及び係数更新制御部43は、遠端信号のみが音声を含むときに係数更新を実行するように構成されている。この判断のため、遠端信号及び近端信号が係数更新制御部43に入力される。そして、遠端信号と近端信号が比較されて、遠端の人間(店員)のみが話しているときに(遠端信号が遠端の音声を含み、近端信号が近端の音声を含まないときに)、エコーキャンセラ係数が更新される。ここでは、遠端信号中の音声の有無が、周波数スペクトルから判定される。さらに、遠端信号と近端信号の相関が求められる。相関は、具体的には、周波数スペクトルの波形の類似度である。遠端信号に音声が存在し、かつ、遠端信号と近端信号の類似度が所定レベル以上であれば、遠端信号のみが音声を含んでいる。なお、この判断処理は一例であり、別の処理により同様の判断が行われてもよい。
【0056】
また、エコーキャンセラ23はサブバンド処理を行うように構成されてよい。エコーキャンセラ23は、DFT−SB−AEC(ディスクリートフーリエ変換サブバンドアコースティックエコーキャンセラ)であってよい。
【0057】
以上に本実施の形態におけるエコーキャンセラ23について詳しく説明した。次に、雑音抑圧部25(ノイズリダクション)の詳細構成を説明する。本実施の形態の場合、マイク5がドライブスルーに設けられており、雑音抑圧部25は車両のエンジン音等の雑音を抑圧する。
【0058】
雑音抑圧部25は、近端信号から雑音を学習するように構成されている。本実施の形態では、車両検知信号がエコーキャンセラ23だけでなく雑音抑圧部25にも入力される。車両検知信号は近端集音環境の変化の情報として入力される。近端集音環境が変わると、近端信号中の雑音が変わる。特に、ドライブスルーでは、車両が頻繁に入れ替わり、エンジン音や停車位置が変化し、雑音状態も変化する。雑音変化に対しては雑音抑圧部25が好適に対処することが求められる。こうした要求に応えるため、雑音抑圧部25は、車両検知信号が入力されると、検知前の雑音学習をリセットし、雑音抑圧のためのフィルタ係数もクリアし、そして、雑音学習を新たに開始するように構成されている。
【0059】
図5は、雑音抑圧部25の構成を示している。雑音抑圧部25は、近端信号から雑音を抑圧するための適応FIRフィルタ51を有する。ここでは、適応FIRフィルタ51のフィルタ係数を雑音抑圧フィルタ係数という。雑音抑圧部25は、さらに、雑音抑圧フィルタ係数を制御するために、FFT及びパワースペクトル算出部53、ノイズ区間推定部55、雑音パワースペクトル推定部57、wiener伝達特性算出部59及びIFFT部61を有する。さらに、雑音抑圧部25は、車両検知部9の車両検知に応答して雑音学習をリセットするための構成としてリセット部63を有する。
【0060】
FFT及びパワースペクトル算出部53は、近端信号に対してFFT(高速フーリエ変換)を行って、時間領域(時間軸)の信号を周波数領域(周波数軸)の信号に変換し、近端信号のパワースペクトルを算出する。
【0061】
ノイズ区間推定部55は、近端信号がノイズ区間の信号であるか、音声区間の信号であるかを推定する。ノイズ区間は、音声がマイク5から入力されず、近端環境の雑音のみを近端信号が含んでいる区間である。これに対して、音声区間は、近端信号に雑音だけでなく音声が含まれている区間である。
【0062】
ノイズ区間推定部55は、1サンプル遅延の短時間平均振幅差関数(Short-time Average Magnitude Differential Function, AMDF)を用いてノイズ区間を推定する。AMDFは、ある取り込まれたフレームの音声信号を単純に1サンプルずらしてフレーム分の差分をとり、差分の平均値を算出する関数である。AMDFの値に積分器で平滑化処理が施されて、AMDFの平滑化パラメータが求められる。この平滑化パラメータが大きいほど、音声信号の振幅差が大きい。振幅差が大きいということは、音声信号が音声を含むということを意味する。反対にノイズ区間では振幅差が小さい。そこで、ノイズ区間推定部55は、AMDFの平滑化パラメータを所定のノイズ判定閾値と比較する。AMDFの平滑化パラメータがノイズ判定閾値以上であれば、近端信号が音声区間の信号であると判定し、同パラメータがノイズ判定閾値より小さければ、近端信号がノイズ区間の信号であると判定する。
【0063】
ノイズ区間推定部55は、近端信号がノイズ区間の信号である場合に、スイッチ55aを閉じて、雑音のパワースペクトルを雑音パワースペクトル推定部57に供給する。雑音パワースペクトル推定部57は、雑音学習として、雑音のパワースペクトルを学習する処理を行う。雑音パワースペクトル推定部57は、積分器を有し、積分器による平滑化処理を雑音のパワースペクトルに施し、これにより、雑音のパワースペクトルを少しずつ更新する処理を行う。
【0064】
学習された雑音のパワースペクトルは、wiener伝達特性算出部59に入力される。また、FFT及びパワースペクトル算出部53からwiener伝達特性算出部59へ、雑音を含む音声のパワースペクトルが入力される。wiener伝達特性算出部59は、音声のパワースペクトルと雑音のパワースペクトルから、下記の式に従って、雑音抑圧のための伝達特性を求める。
【0065】
H(w)=(X(k)−N(k))/X(k)
【0066】
ここで、H(w)は、周波数領域での抑圧伝達特性(wiener伝達特性)の値であり、X(k)は、雑音を含む音声のパワースペクトルであり、N(k)は、学習された雑音のパワースペクトルである。
【0067】
wiener伝達特性算出部59は、算出した抑圧伝達特性をIFFT部61へ送る。IFFT部61は、抑圧伝達特性に逆高速フーリエ変換処理を施して、周波数領域の抑圧伝達特性を時間領域の抑圧伝達特性に変換して、変換結果を用いて適応FIRフィルタ51の雑音抑圧フィルタ係数が更新される。
【0068】
リセット部63には、車両検知部9から車両検知信号が入力される。車両検知信号が入力されると、リセット部63は、雑音パワースペクトル59の雑音パワースペクトルをリセットし、また、適応FIRフィルタ51の雑音抑圧フィルタ係数を一旦クリアする。これにより、雑音パワースペクトル59は、リセット後に供給される雑音パワースペクトルを用いて、学習及び推定処理を新たに開始する。適応FIRフィルタ51も、リセット後に設定される雑音抑圧フィルタ係数を用いて雑音抑圧を行う。
【0069】
車両検知信号は、既に説明したように、近端集音環境が変化したことを示す情報に相当する。車両が到来したために近端集音環境が大きく変化すると、雑音パワースペクトルの学習値が実際の雑音からずれ、適応FIRフィルタ51の雑音抑圧フィルタ係数も近端集音環境に合わなくなる。そこで、雑音抑圧部25は、上記の処理により、近端集音環境の変化が検知されたときに、検知前の雑音学習をリセットし、雑音学習を新たに開始する。これにより、変化後の近端集音環境に合わせて、すなわちドライブスルーに新しい車両が到来している状態に合わせて、雑音学習の推定精度を最適化でき、雑音抑圧効果を向上できる。
【0070】
以上に、本実施の形態の音声信号処理装置7の構成を説明した。次に、音声信号処理装置7の動作を説明する。
【0071】
まず、音声信号処理装置7の全体的な動作を説明する。音声信号処理装置7は、遠端側から送られてきた遠端信号をスピーカ3から出力し、また、マイク5から入力された近端信号を遠端側に伝送する。音声信号処理装置7において、音声スイッチ21は、遠端信号と近端信号の一方を通過させるようにスイッチ動作を行う。遠端信号は、音声スイッチ21を通り、D/A変換部31にてアナログ信号に変換されて、スピーカ3から出力される。また、遠端信号は、エコーキャンセラ23に入力され、エコーキャンセラ23は遠端信号を用いて、マイク5に入力される近端信号からエコーを消去する。近端信号は、さらに、雑音抑圧部25及びエコーサプレッサ27を通る。雑音抑圧部25で雑音が抑圧される。エコーサプレッサ27は、エコーキャンセラ23の処理で残ったエコーを抑圧する。そして、近端信号は、音声スイッチ21を通り遠端側へ送られる。
【0072】
次に、エコーキャンセラ23の動作を説明する。エコーキャンセラ23においては、遠端信号が適応フィルタ41に入力される。適応フィルタ41は、遠端信号から疑似エコー信号を生成して減算器45に供給する。減算器45には近端信号も入力される。減算器45が近端信号から疑似エコー信号を減算し、これによりエコーが消去される。
【0073】
適応フィルタ41のエコーキャンセラ係数は、係数更新制御部43により繰り返し更新される。係数更新制御部43は学習処理を行い、これによりエコーキャンセラ係数が収束して、適切な疑似エコー信号を生成する。具体的には、前述の学習同定法(NLMS)の処理が行われる。
【0074】
近端集音環境が大きく変化しなければ、エコーキャンセラ係数が適切に値に維持され、エコーが効果的に消去され続ける。しかし、本実施の形態の例では、スピーカ3及びマイク5がドライブスルーに設置されており、車両が到来すると近端集音環境が大きく変化する。そのため、変化後の近端集音環境に合わせて、エコーキャンセラ係数が更新されなければならない。特に、ドライブスルーのような例では、車両が到来すると、客がマイク5に向かって発声する。したがって、エコーキャンセラ係数が極力早く適切な値に更新される必要がある。このような要求に応えるために、本実施の形態では、車両が到来したときに音声信号処理装置7が以下のように動作する。
【0075】
図6は、車両の到来時の音声信号処理装置7の動作を示している。車両が到来したとき、車両検知部9が車両を検知して、車両検知信号を係数更新制御部43に供給する(S1)。
【0076】
車両検知信号が入力されると、係数更新制御部43は、適応フィルタ41のエコーキャンセラ係数を0クリアし(S3)、学習同定法(NLMS)のステップサイズμを初期化する(S5)。ステップサイズμは、所定の初期値に設定される。
【0077】
次に、係数更新制御部43は、ステップS7〜S11にて、車両検知(ステップサイズ初期化)からの時間経過に応じてステップサイズμを低下させながら、係数更新処理を行う。係数更新制御部43は、ステップS7にて、初期値のステップサイズμをNLMSの式に適用して係数更新処理を行う。次に、係数更新制御部43は、ステップサイズμを所定幅だけデクリメントし(S9)、車両検知(ステップサイズ初期化)から所定のステップサイズ低減制御期間が経過したか否かを判定する(S11)。ステップS11の判定がNoであれば、係数更新制御部43は、ステップS7に戻り、デクリメントされたステップサイズμをNLMSに適用してエコーキャンセラ係数を更新する。こうして、係数更新制御部43は、所定幅ずつステップサイズμを低下させながら、係数更新を繰り返す。
【0078】
車両検知から所定のステップサイズ低減制御期間が経過し、ステップS11の判定がYesになると、係数更新制御理部43は、ステップサイズμを所定の固定値に固定し、固定値をNLMSに適用してエコーキャンセラ係数の更新を行う(S13)。したがって、現在の車両が移動し、次の車両が検知されるまで、ステップサイズμは固定されることになる。
【0079】
以上に、エコーキャンセラ23の動作を説明した。次に、雑音抑圧部25の動作を説明する。
【0080】
図7は、雑音抑圧部25の動作を示している。図示のように、雑音抑圧部25では、適応FIRフィルタ51がIFFT部61から供給される雑音抑圧フィルタ係数を用いて、FIRフィルタの畳込み処理を近端信号に施して、近端信号の雑音成分を抑圧し(S21)、雑音抑圧フィルタ係数の更新処理を行う(S23)。また、近端信号はFFT及びパワースペクトル算出部53に入力され、近端信号がFFT(高速フーリエ変換)により時間領域(時間軸)の信号から周波数領域(周波数軸)の信号に変換されて、近端信号のパワースペクトルが算出される(S25)。
【0081】
また、近端信号はノイズ区間推定部55に入力され、ノイズ区間推定部55が、近端信号がノイズ区間の信号であるか、音声区間の信号であるかを推定する(S27)。ステップS27の判定結果が「ノイズ」の場合、ノイズ区間推定部55はスイッチ55aを閉じて、雑音パワースペクトル推定部57へパワースペクトルを供給するように動作する。
【0082】
また、ステップS27の判定結果が「ノイズ」の場合、リセット部63が車両検知信号の入力の有無を判定する(S29)。車両検知信号が入力されなければ、ステップS29の判定結果はNoになり、雑音パワースペクトル推定部57が雑音パワースペクトルの推定処理を行う(S33)。ここでは、雑音パワースペクトル推定部57が、FFT及びパワースペクトル算出部53から供給された雑音パワースペクトルを用いて、雑音パワースペクトルの推定値を更新する。
【0083】
一方、車両検知信号がリセット部63に入力された場合、ステップS29の判定がYesになる。リセット部63は、雑音パワースペクトル推定部57の学習データをリセットし、また、適応FIRフィルタ51の雑音抑圧フィルタ係数をクリアし(S31)、ステップS33へ進む。したがって、ステップS33では、雑音パワースペクトル推定部57が、FFT及びパワースペクトル算出部53から供給された雑音パワースペクトルを用いて、雑音パワースペクトルの学習を開始する。
【0084】
wiener伝達特性算出部59は、音声のパワースペクトルと雑音のパワースペクトルとを処理して、周波数領域における抑圧伝達特性を算出する(S35)。ステップS27の判定が「ノイズ」であり、ステップS33で雑音パワースペクトルが学習された場合には、学習後の雑音パワースペクトル推定値がステップS35で使用される。ステップS27の判定が「音声」の場合には、雑音パワースペクトルの現在の推定値がステップS35で使用される。
【0085】
ステップS35で周波数領域の抑圧伝達特性が算出されると、IFFT部61が、逆高速フーリエ変換により、周波数領域の抑圧伝達特性を、時間領域の抑圧伝達特性に変換する(S37)。変換後の抑圧伝達特性を用いて、適応FIRフィルタ51のフィルタ処理と係数更新が行われる。これらの処理は、図中のステップS21、S23に対応しており、次のルーチンで行われることになる。
【0086】
以上に本実施の形態に係る音声信号処理装置7の動作を説明した。次に、本実施の形態の変形例を説明する。本実施の形態では、エコーキャンセラ23の係数更新制御部43が、係数更新処理としてNLMS法(学習同定法)の処理を行うように構成されている。そして、係数更新制御部43は、車両が検知されたときに、係数更新のステップサイズを変化させ、これにより、時間経過に応じて係数収束速度を低下させている。
【0087】
変形例では、係数更新制御部43が、収束速度が異なる複数の係数更新処理を切替可能に構成され、車両検知後の時間経過に応じて学習収束速度が低下するように複数の係数更新処理の切替を行う。
【0088】
複数の係数更新処理は、例えば、NLMS法とRLS法である。RLS(Recursive Least-Squares)法も、エコーキャンセラの係数更新処理として知られている。RLSは、入出力関係の2乗誤差評価値を最小にするようにエコーキャンセラ係数を求める処理であり、忘却係数というパラメータが用いられて、時間を遡るにつれて2乗誤差の値を小さくするように重み付けが行われる。
【0089】
本来、NLMS法と比べて、RLS法は収束速度が大きく、安定性も高く、性能がよい。しかし、エコーキャンセラとしては固定小数点型のDSPを用いられることが多く、この場合、RLS法では精度が低下する。したがって、RLS法とNLMS法を比べると、RLS法は収束速度が大きく、NLMS法は収束後の安定性が高いといえる。
【0090】
そこで、本実施の形態では、車両が検知されたとき(すなわち近端集音環境の変化が検知されたとき)、係数更新制御部43が、エコーキャンセラ係数をクリアし(このクリア処理は上記の実施の形態と同様である)、それからRLS法の係数更新処理を行い、続いてNLMS法の係数更新処理を行うように構成される。まず、所定時間(所定サイクル数)、RLS法によりエコーキャンセラ係数が更新される。所定時間が経過すると、係数更新制御部43は、係数更新処理をRLS法からNLMS法に切り替えて、NLMS法にてエコーキャンセラ係数を更新する。RLS法からNLMS法への切替時は、エコーキャンセラ係数が引き継がれる。このような係数制御により、車両検知直後は、RLS法にて係数収束が高速に行われ、続いてNLMS法にて収束後の高い安定性が得られる。
【0091】
以上に本発明の第1の実施の形態について説明した。本実施の形態によれば、近端集音環境の変化が検知されたときに、近端集音環境の変化の検知後の時間経過に応じてエコーキャンセラ係数の収束速度を低下させるように係数更新処理が変更される。したがって、近端集音環境の変化が検知された直後は、収束速度を高くして、エコー抑圧速度を大きくできる。そして、検知後の時間経過に応じてし収束速度を低下させることにより、収束後のエコー消去を安定化できる。こうして、エコー抑圧速度(係数収束速度)と収束後の安定性とを両立でき、集音環境変化時のエコー消去能力を向上できる。
【0092】
また、本実施の形態によれば、近端集音環境の変化として近端側への車両の到来が検知される。したがって、近端側に車両が到来するような音声伝送システムにおいて、近端集音環境の変化を適切に検知して、エコー処理能力を向上できる。上記の例では、ファストフード店のドライブスルーシステムにおいてエコー処理能力を向上できる。
【0093】
また、本実施の形態によれば、近端集音環境の変化の検知後の時間経過に応じてエコーキャンセラ係数の係数更新処理のステップサイズを低減させることにより、エコーキャンセラ係数の収束速度が低下する。より具体的には学習同定法のステップサイズが小さく変更される。これにより、近端集音環境の変化の検知後の時間経過に応じてエコーキャンセラ係数の収束速度を好適に低下させることができる。そして、エコー抑圧速度(係数収束速度)と収束後の安定性とを両立し、集音環境変化時のエコー消去能力を向上できる。
【0094】
また、本実施の形態では、近端集音環境が検知されたときに、検知前のエコーキャンセラ係数がクリアされる。これにより、近端集音環境の変化の検知後の時間経過に応じてエコーキャンセラ係数を好適に制御でき、エコー抑圧速度(係数収束速度)と収束後の安定性とを両立し、エコー消去能力を向上できる。
【0095】
また、本実施の形態の変形例として説明したように、係数更新制御部43は、収束速度が異なる複数の係数更新処理を切替可能に構成されており、近端集音環境の変化の検知後の時間経過に応じて収束速度が低下するように複数の係数更新処理の切替を行う。この構成により、複数種類の係数更新処理が切り替えられ、これにより、近端集音環境の変化の検知後の時間経過に応じてエコーキャンセラ係数の収束速度を好適に低下させることができる。そして、エコー抑圧速度(係数収束速度)と収束後の安定性とを両立し、集音環境変化時のエコー消去能力を向上できる。
【0096】
具体的には、RLS法の係数更新処理が行われて、続いてNLMS法の係数更新処理を行われてよい。これにより、近端集音環境の変化の検知後の時間経過に応じてエコーキャンセラ係数を好適に制御でき、エコー抑圧速度(係数収束速度)と収束後の安定性とを両立し、エコー消去能力を向上できる。
【0097】
また、本実施の形態によれば、音声信号処理装置7は、近端集音環境における雑音を前記近端信号から学習することにより、近端信号の雑音を抑圧する雑音抑圧部25を有し、雑音抑圧部25は、環境変化検知部が近端集音環境の変化を検知したときに、検知前の雑音学習をリセットし、雑音学習を新たに開始する。これにより、近端集音環境の変化が検知されたときに、検知前の雑音学習がリセットされ、雑音学習が新たに開始される。したがって、変化後の近端集音環境に合わせて雑音学習の推定精度を最適化でき、雑音抑圧効果を向上できる。上記の雑音抑圧部を備えた音声信号処理装置は、上述のエコーキャンセラの収束速度制御機能を備えない音声信号処理装置においても実現可能である。
【0098】
次に、本発明の第2の実施の形態について説明する。第1の実施の形態と第2の実施の形態を比べると、エコーキャンセラの構成が相違する。以下では、第1の実施の形態との相違点について説明する。
【0099】
図8は、本実施の形態の音声信号処理装置に備えられたエコーキャンセラ71を示している。概略としては、本実施の形態では、エコーキャンセラ71が、適応フィルタ73とキャンセル実行フィルタ75からなるツインフィルタ構成を有している。そして、適応フィルタ73からキャンセル実行フィルタ75へエコーキャンセラ係数を転送する構成として、係数転送部77が設けられている。適応フィルタ73はエコーキャンセラ係数を調整するように機能し、実際のエコー消去はキャンセル実行フィルタ75によって行われる。
【0100】
適応フィルタ73は、係数更新制御部79及び第1減算器81と共に設けられている。これら適応フィルタ73、係数更新制御部79及び第1減算器81は、第1の実施の形態の係数適応フィルタ41、係数更新制御部43及び減算器45と同様の構成であり、同様の機能を有する。したがって、係数更新制御部43により係数適応フィルタ41のエコーキャンセラ係数が更新される。また、第1の実施の形態と同様に、係数更新制御部79が車両検知信号に応答してエコーキャンセラ係数をクリアし、ステップサイズを変更する。あるいは、第1の実施の形態の変形例と同様に、係数更新制御部79は、車両検知信号に応答して、係数更新処理を切り替える制御を行ってもよい。ただし、第1の実施の形態と異なり、第1減算器81にて近端信号から疑似エコー信号が引かれた後、近端信号(残差信号)が係数転送部77に供給される。
【0101】
キャンセル実行フィルタ75は、フィルタ係数を変更可能なフィルタである。キャンセル実行フィルタ75は、係数転送部77からエコーキャンセラ係数を受け取ると、受け取ったエコーキャンセラ係数をフィルタ係数として設定し、使用する。そして、次にエコーキャンセラ係数が転送されるまでは、キャンセル実行フィルタ75は、エコーキャンセラ係数を固定して使用する。
【0102】
キャンセル実行フィルタ75には、適応フィルタ73と同様に遠端信号が入力される。キャンセル実行フィルタ75は、適応フィルタ73から転送されたエコーキャンセラ係数を用いて遠端信号にフィルタ処理を施し、疑似エコー信号を生成し、第2減算器83に供給する。第2減算器83には第1減算器81と同様に近端信号が入力される。第2減算器83は近端信号から疑似エコー信号を減算する。この残差信号が、エコーが消去された近端信号として遠端側に伝送される。
【0103】
第2減算器83の出力は係数転送部77に供給される。すなわち、係数転送部77は、適応フィルタ73を用いてエコーを消去した残差信号を第1減算器81から取得し、かつ、キャンセル実行フィルタ75を用いてエコーを消去した残差信号を第2減算器83から取得する。
【0104】
係数転送部77は、これら2つの残差信号を比較し、これにより、適応フィルタ73とキャンセル実行フィルタ75のエコー消去効果を比較して、適応フィルタ73がキャンセル実行フィルタ75よりも有意にエコーを消去するか否かを判定する。係数転送部77は、具体的には、2つの残差信号を比較して大小関係を判定する。第1減算器81からの残差信号の方が小さければ、すなわち適応フィルタ73を用いてエコーを消去した残差信号の方が小さければ、係数転送部77は、適応フィルタ73の方が有意にエコーを消去していると判定する。そして、係数転送部73は、適応フィルタ73が有意にエコーを消去している場合、適応フィルタ73のエコーキャンセラ係数をキャンセル実行フィルタ75に転送する。
【0105】
上記の有意性判定および係数転送は、遠端信号が音声を含み、近端信号が音声を含まない時に行われる。より詳細に説明すると、図8に示されるように、係数転送部77には遠端信号および近端信号が入力される。係数転送部77は、遠端信号と近端信号を比較して、遠端信号のみが音声を含むこと(遠端信号が遠端の音声を含み、近端信号が近端の音声を含まないこと)を判断する。この判断は、第1の実施の形態にて係数更新部にて行われた判断と同様でよい。すなわち、遠端信号中の音声の有無が、周波数スペクトルから判定される。さらに、遠端信号と近端信号の相関が求められる。相関は、具体的には、周波数スペクトルの波形の類似度である。遠端信号に音声が存在し、かつ、遠端信号と近端信号の類似度が所定レベル以上であれば、遠端信号のみが音声を含んでいる。
【0106】
遠端信号のみが音声を含んでいれば、エコー消去後の残差信号が無音に近くなる。そこで、係数転送部77は、2つのフィルタにより作成された残差信号を比較し、残差信号が小さい方のフィルタが有意にエコーを消去していると判定し、上述の如く判定結果に応じて係数転送を行うように構成されている。
【0107】
次に、本実施の形態の動作を説明する。遠端信号は、スピーカ3(図1)から出力されると共に、適応フィルタ73及びキャンセル実行フィルタ75に供給される。適応フィルタ73は、係数更新制御部79及び第1減算器81と協働し、適切な疑似エコー信号を生成するための学習動作をする。一方、キャンセル実行フィルタ75は、係数転送部77により適応フィルタ73から転送されたエコーキャンセラ係数を固定係数として用いて、遠端信号から疑似エコー信号を生成する。
【0108】
第1減算器81は、適応フィルタ73で生成された疑似エコー信号を近端信号から減算し、第2減算器83は、キャンセル実行フィルタ75で生成された疑似エコー信号を近端信号から減算する。第1減算器81の出力は、係数更新のために係数更新制御部79に入力されると共に、係数転送部77に供給される。第2減算器83の出力は、遠端側(より詳細には次の雑音抑圧部)に伝送されると共に、係数転送部77に入力される。
【0109】
係数転送部77は、第1減算器81及び第2減算器83からの入力を比較し、適応フィルタ73がキャンセル実行フィルタ75より有意に近端信号のエコーを消去しているか否かを判定する。適応フィルタ73が有意にエコーを消去していれば、係数転送部77は、適応フィルタ73のエコーキャンセラ係数をキャンセル実行フィルタ75に転送する。キャンセル実行フィルタ75は、転送されたエコーキャンセラ係数を用いて疑似エコーを生成する。このエコーキャンセラ係数は、次にエコーキャンセラ係数が転送されてくるまで、固定係数として設定及び利用される。
【0110】
以上に説明したように、本実施の形態では、適応フィルタ73とキャンセル実行フィルタ75が設けられる。キャンセル実行フィルタ75よりも有意にエコーを消去するエコーキャンセラ係数を係数更新制御部79が算出したときに、エコーキャンセラ係数がキャンセル実行フィルタ75に転送される。係数収束中にエコーを有意に消去しないエコーキャンセラ係数を係数更新制御部79が算出しても係数転送が行われない。エコー抑圧効果がより大きくなるエコーキャンセラ係数を用いてキャンセル実行フィルタ75がエコー消去を実行でき、エコー消去の安定性を向上できる。
【0111】
特に、本実施の形態では、車両が検知されたとき、最初に収束速度が高く設定され、次に収束速度が低減される。この収束過程で、エコー抑圧効果が順調に増大しているときは、エコーキャンセラ係数がキャンセル実行フィルタ75に順次転送される。しかし、エコー抑圧効果を増大しないエコーキャンセラ係数が算出されときは、係数転送が抑制される。エコー抑圧効果を増大するエコーキャンセラ係数が算出されれば、再び係数転送が行われる。こうして、より効果的なエコーキャンセル係数を用いることができる。
【0112】
以上に本発明の好適な実施の形態を説明した。しかし、本発明は上述の実施の形態に限定されず、当業者が本発明の範囲内で上述の実施の形態を変形可能なことはもちろんである。
【産業上の利用可能性】
【0113】
以上のように、本発明にかかる音声信号処理装置は、近端集音環境が変換する場合のエコー消去能力を向上できるという効果を有し、ファストフード店のドライブスルー等の音声信号処理装置として有用である。
【図面の簡単な説明】
【0114】
【図1】本発明の第1の実施の形態における音声信号処理装置のブロック図
【図2】第1の実施の形態における音声信号処理装置を含む音声伝送システムの全体構成を示す図
【図3】第1の実施の形態におけるエコーキャンセラの構成を示す図
【図4】ステップサイズの変更制御を示す図
【図5】第1の実施の形態における雑音抑圧部の構成を示す図
【図6】第1の実施の形態におけるエコーキャンセラの動作を示す図
【図7】第1の実施の形態における雑音抑圧部の動作を示す図
【図8】第2の実施の形態におけるエコーキャンセラの構成を示す図
【符号の説明】
【0115】
1 音声伝送システム
3 スピーカ
5 マイク
7 音声信号処理装置
9 車両検知部
21 音声スイッチ
23 エコーキャンセラ
25 雑音抑圧部
27 エコーサプレッサ
41 適応フィルタ
43 係数更新制御部
45 減算器
51 適応FIRフィルタ
53 FFT及びパワースペクトル算出部
55 ノイズ区間推定部
57 雑音パワースペクトル推定部
59 wiener伝達特性算出部
61 IFFT部

【特許請求の範囲】
【請求項1】
遠端側から近端側へ伝送された遠端信号を近端側のスピーカから出力し、近端側のマイクから入力された近端信号を遠端側に伝送する音声伝送システムに設けられた音声信号処理装置であって、
前記スピーカへ供給される前記遠端信号に基づいて前記マイクに入力される前記近端信号からエコーを消去するエコーキャンセラと、
前記スピーカ及び前記マイクが設けられた前記近端側における音響伝達関数に影響する近端集音環境の変化を検知する環境変化検知部とを備え、
前記エコーキャンセラは、前記遠端信号に基づいて疑似エコー信号を生成する適応フィルタと、前記適応フィルタのフィルタ係数であるエコーキャンセラ係数を係数更新処理により収束させる係数更新制御部とを有し、前記係数更新制御部は、前記環境変化検知部が前記近端集音環境の変化を検知したときに、前記近端集音環境の変化の検知後の時間経過に応じて前記エコーキャンセラ係数の収束速度を低下させるように前記係数更新処理を変更することを特徴とする音声信号処理装置。
【請求項2】
前記環境変化検知部は、前記近端集音環境の変化として前記近端側への車両の到来を検知することを特徴とする請求項1に記載の音声信号処理装置。
【請求項3】
前記係数更新制御部は、前記近端集音環境の変化の検知後の時間経過に応じて前記エコーキャンセラ係数の係数更新処理のステップサイズを低減させることにより、前記エコーキャンセラ係数の収束速度を低下させることを特徴とする請求項1又は2に記載の音声信号処理装置。
【請求項4】
前記係数更新制御部は、収束速度が異なる複数の係数更新処理を切替可能に構成されており、前記近端集音環境の変化の検知後の時間経過に応じて前記収束速度が低下するように前記複数の係数更新処理の切替を行うことを特徴とする請求項1又は2に記載の音声信号処理装置。
【請求項5】
前記係数更新制御部は、前記近端集音環境の変化が検知されたとき、RLS法の係数更新処理を行い、続いてNLMS法の係数更新処理を行うことを特徴とする請求項4に記載の音声信号処理装置。
【請求項6】
前記係数更新制御部は、前記近端集音環境が検知されたときに、検知前の前記エコーキャンセラ係数をクリアすることを特徴とする請求項3乃至5のいずれかに記載の音声信号処理装置。
【請求項7】
前記エコーキャンセラは、さらに、前記適応フィルタと別のキャンセル実行フィルタと、前記適応フィルタから前記キャンセル実行フィルタへ前記エコーキャンセラ係数を転送する係数転送部とを備え、
前記係数転送部は、前記適応フィルタと前記キャンセル実行フィルタのエコー消去効果を比較して、前記適応フィルタが前記キャンセル実行フィルタより有意に前記近端信号のエコーを消去すると判定したときに、前記適応フィルタのエコーキャンセラ係数を前記キャンセル実行フィルタに転送し、前記キャンセル実行フィルタが、前記適応フィルタから転送された前記エコーキャンセラ係数を用いてエコー消去を実行することを特徴とする請求項1乃至6のいずれかに記載の音声信号処理装置。
【請求項8】
前記近端集音環境における雑音を前記近端信号から学習することにより、前記近端信号の雑音を抑圧する雑音抑圧部を有し、
前記雑音抑圧部は、前記環境変化検知部が前記近端集音環境の変化を検知したときに、検知前の雑音学習をリセットし、雑音学習を新たに開始することを特徴とする請求項1乃至7のいずれかに記載の音声信号処理装置。
【請求項9】
遠端側から近端側へ伝送された遠端信号を近端側のスピーカから出力し、近端側のマイクから入力された近端信号を遠端側に伝送する音声伝送システムにて行われる音声信号処理方法であって、
前記スピーカへ供給される前記遠端信号に基づいて前記マイクに入力される前記近端信号からエコーを消去するエコーキャンセル処理と、
前記スピーカ及び前記マイクが設けられた前記近端側における音響伝達関数に影響する近端集音環境の変化を検知する環境変化検知処理とを行い、
前記エコーキャンセル処理は、前記遠端信号に基づいて疑似エコー信号を生成する適応フィルタ処理と、前記適応フィルタ処理のフィルタ係数であるエコーキャンセラ係数を係数更新処理により収束させる係数更新制御処理とを含み、前記係数更新制御処理は、前記環境変化検知処理にて前記近端集音環境の変化が検知されたときに、前記近端集音環境の変化の検知後の時間経過に応じて前記エコーキャンセラ係数の収束速度を低下させるように前記係数更新処理を変更することを特徴とする音声信号処理方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate