説明

エコー消去装置、エコー消去方法、そのプログラム、記録媒体

【課題】低計算コストで、適応ビームフォーミング処理により音響指向性の変動が生じたとしても、所望のエコー消去量に達する。
【解決手段】N個の収音手段で収音された収音信号に含まれるエコー信号を消去し、当該収音信号に含まれる雑音信号を抑圧して、出力信号として出力するものであり、収音手段毎に収音信号の、予め定められた基準値より低い周波数帯域に含まれるエコー信号の成分を消去し、残留エコー信号を出力し、N個の残留エコー信号から雑音信号を抑圧して、適応ビームフォーミング信号を出力し、適応ビームフォーミング信号から、エコー信号を消去することで出力信号を出力する。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は、複数の収音手段で収音された収音信号に含まれるエコー信号を消去し、収音信号に含まれる雑音信号を抑圧して出力信号として出力するエコー消去装置、エコー消去方法、そのプログラム、記録媒体に関する。
【背景技術】
【0002】
従来の電話会議やテレビ会議に加えて、近年PC(パーソナルコンピュータ)を用いたテレビ電話デスクトップ会議などハンズフリー拡声通話が利用される機会が増加している。ハンズフリー拡声通話においては、受信した相手の声は再生手段(例えば、スピーカ)から放出される一方、受話者の音声は収音手段(例えば、マイクロホン)で収音されることから、通話しながら議事録の筆記やPCの操作ができるという大きな利点がある。
【0003】
しかし、スピーカで放出された相手の声は、受話者に届くだけでなく、マイクロホンにも回り込んで収音され、音響エコーとして通話品質を劣化させるとともに、ハウリングの原因にもなる。そこで、このようなエコー信号の成分を消去し、ハウリングの発生を未然に防ぐために、ハンズフリー拡声通話においてエコー消去技術が導入されている。
【0004】
また、種々の環境雑音の中から利用者の音声を選択的に受音、追従し、雑音抑圧を行ったあと、高精度に話者の音声を収音する適応ビームフォーミング技術がある。この技術は特許文献1の収音方法及び収音装置「マイクロホンアレイによるエコー抑圧、方向別AGCマイクロホンアレイ」に記載されている。この技術は、複数のマイクロホンを用いて音響的指向性を制御することにより、雑音源からの雑音信号を抑圧し、高精度に話者の音声を収音するものである。近年、この適応ビームフォーミング技術はエコー消去装置にも備えられている(非特許文献1参照)。
【0005】
図1に、適応ビームフォーミングを備えた従来のエコー消去装置100の機能構成例を示す。エコー消去装置100は、N(Nは1以上の整数)個の収音手段(例えば、マイクロホン)に接続されている。エコー消去装置100は、N個のエコー消去部102(n=1,...,N)と適応ビームフォーミング部104とを有する。また、以下の説明では、再生手段2から放出された再生信号をx(t)とし、再生信号x(t)が収音手段4に回り込んだ信号をエコー信号a(t)とし、雑音源よりの雑音信号をb(t)とし、話者8からの話者信号をc(t)とする。エコー信号a(t)、雑音信号b(t)、話者信号c(t)からなる信号を収音信号とし、収音手段4で収音された信号を収音信号をy(t)と示し、エコー信号、雑音信号、話者信号をそれぞれa(t)b(t)c(t)と示す。tは離散時刻を示し、連続時間信号を一定のサンプル間隔Tでサンプリングしたことにより示されるものである。例えば、サンプリング周波数f=48kHz(1秒間に48000回)とする。サンプリング周波数f=1/Tである。また、エコー信号、雑音信号、話者信号が収音手段まで到達するまでは離散時刻ではなく、実時刻で表すべきであるが、説明簡略化のために、全て離散時刻tで示す。エコー消去装置100、以下で説明するエコー消去装置200、300においても離散時刻tで表された信号であるディジタル信号を扱うので、入力されるアナログ信号をDA変換器によりディジタル信号に変換し、出力するディジタル信号をAD変換器によりアナログ信号に変換する必要があるのであるが、このことは当然のことであるので、図1〜図3において、AD変換器、DA変換器については図示しない。また、雑音源6、話者8が存在しない場合は、収音信号には雑音信号、話者信号は含まれない。
【0006】
説明を図1に戻す。収音信号y(t)は、エコー消去部102に入力される。エコー消去部102は収音信号y(t)からエコー信号a(t)を抑圧する。そして、エコー信号が消去された信号である残留エコー信号e(t)が適応ビームフォーミング部104に入力される。
【0007】
適応ビームフォーミング部104はN個の残留エコー信号e(t)(=1,...,N)から雑音信号を抑圧し、出力信号z(t)として出力する。エコー消去部102、適応ビームフォーミング部104の詳細な処理については、以下の「発明を実施するための最良の形態」で説明する。
【0008】
エコー消去装置100の構成は、N個のエコー消去部102の後段に適応ビームフォーミング部104を設置している。従って、適応ビームフォーミング部104の適応ビームフォーミングによる音響的指向性の変動をエコー消去部102のエコー経路モデルに含まないようにできる。
【0009】
次に、図2に、適応ビームフォーミングを備えた従来のエコー消去装置200の機能構成例を示す。エコー消去装置200の構成は、適応ビームフォーミング部202が前段に、エコー消去部204が後段に設けられる。このように構成することで、適応ビームフォーミング部202よりの出力信号が1つである場合には、エコー消去部204は、その出力信号に対して1回のエコー消去処理(適応フィルタ処理)を行うだけでよく、低演算・低メモリ量の構成となっている。
【特許文献1】特許第4104626号
【非特許文献1】Kellermann,W.,"Strategies for combining acoustic echo cancellation and adaptive beamforming microphone arrays,"IEEE International Conference on Acoustics,Speech,and Signal Processing,vol.1,21-24,pp.219-222,Apr.1997.
【発明の開示】
【発明が解決しようとする課題】
【0010】
上記エコー消去装置100の構成であると、計算コストの高いエコー消去部102を収音手段の数であるN個分、備える必要があるため、膨大な計算コストが必要であった。また、上記エコー消去装置200の構成であると、エコー消去部のエコー経路モデルにおいて、時変ビームフォーミングを考慮しなければならないため、適応ビームフォーミング部202によって音響的指向性の変動が生じれば、エコー消去部204がエコー経路モデル(適応フィルタ)の再推定を行わなければならず、所望のエコー消去量に達しない場合がある。
【0011】
この発明の目的は、(1)計算コストを少なくし、(2)エコー消去部の所望エコー消去量に達するまでの時間を短くすることで、適応ビームフォーミング処理による音響的指向性の変動に関わらず、所望のエコー消去量に達するエコー消去装置を提供することである。
【課題を解決するための手段】
【0012】
この発明のエコー消去装置は、N個の収音手段で収音された収音信号に含まれるエコー信号を消去し、当該収音信号に含まれる雑音信号を抑圧して、出力信号として出力するものである。そして当該エコー消去装置は、N個の低域エコー消去部と、適応ビームフォーミング部と、エコー消去部と、を有する。低域エコー消去部は、収音信号の、予め定められた基準値より低い周波数帯域に含まれるエコー信号の成分を消去し、残留エコー信号を出力する。適応ビームフォーミング部は、N個の残留エコー信号から雑音信号を抑圧して、適応ビームフォーミング信号を出力する。エコー消去部は、適応ビームフォーミング信号から、エコー信号を消去することで出力信号を出力する。
【発明の効果】
【0013】
この発明では、パワーが低周波数帯域(以下、単に「低域」という。)に集中する話者音声の性質から低周波数帯域の所望エコー消去量が高周波数帯域(以下、単に「高域」という。)の所望エコー消去量より大きいことに着目する。そして、N個の低域エコー消去部は、入力された収音信号の予め定められた基準値より低い低域についてのみエコーを消去するので、エコー消去装置100中のN個のエコー消去部と比較して計算コストを削減できる。従って、エコー消去装置100の問題点を解決できる。
【0014】
また、この発明のエコー消去装置の構成は、前段からN個の低域エコー消去部、低域ビームフォーミング部、エコー消去部、の順番で構成されている。従って、低域エコー消去部のエコー経路モデルでは、適応ビームフォーミング部104の音響的指向性の変動による再推定を回避できる。また、エコー消去部については、低域エコー消去部によって、低域のエコーを消去したもの、つまり、大半のエコー信号の成分が消去された信号(適応ビームフォーミング信号)についてエコー信号の成分を消去する。従って、エコー消去部内で用いる全域残留エコー信号のパワーを最初から小さくでき、結果として、エコー消去部の所望エコー消去量に達するまでの時間を短くできる。よって、適応ビームフォーミング部による音響指向性変動が生じたとしても、エコー消去部は安定的に所望のエコー消去量を達成できる。また、上記非特許文献1には、エコー消去技術、適応ビームフォーミング技術のそれぞれの処理手順については記載されていない。
【発明を実施するための最良の形態】
【0015】
以下に、発明を実施するための最良の形態を示す。なお、同じ機能を持つ構成部や同じ処理を行う過程には同じ番号を付し、重複説明を省略する。
【実施例1】
【0016】
図3にエコー消去装置300の機能構成例を示し、図4に処理フローを示す。エコー消去装置300はN個の低域エコー消去部302、適応ビームフォーミング部104、エコー消去部304を有する。図5に低域エコー消去部302の機能構成例を示し、図6に適応ビームフォーミング部104の機能構成例を示し、図7にエコー消去部304の機能構成例を示す。なお、全ての低域エコー消去部302(n=1,...,N)の構成手段は全て同じであるので、図5記載の各構成手段の参照番号については添え字「n」を省略している。また、エコー消去部304は、図2記載のエコー消去部204と同一である。
【0017】
図5記載のように、この実施例の低域エコー消去部302は、ローパスフィルタ手段3014と、ダウンサンプリング手段3016と、適応フィルタ手段3018と、帯域分割手段3012と、減算手段3020と、帯域合成手段3022と、により構成される。帯域分割手段3012は、ローパスフィルタ手段30122、ハイパスフィルタ手段30124、2つのダウンサンプリング手段30126により構成される。また、図6記載のように、この実施例の適応ビームフォーミング部104は、周波数領域変換手段1042と、適応ビームフォーミング手段1044と、時間領域変換手段1046と、インパルス応答記憶部1050(またはステアリングベクトル記憶部1048)と、により構成される。また、図7記載のように、この実施例のエコー消去部304は、適応フィルタ手段3048、減算手段3051、により構成される。
【0018】
[低域エコー消去部302の処理(ステップS102)]
まず、収音信号y(t)が、低域エコー消去部302に入力される。エコー消去部302は、収音信号y(t)の予め定められた基準値αより低い周波数帯域に含まれるエコー信号a(t)の成分を消去し、残留エコー信号e(t)を出力する。まず、基準値αについて説明する。この発明では、パワーが低域に集中する話者音声の性質から、低域の所望エコー消去量が高域の所望エコー消去量より大きいことに着目する。例えば、全周波数帯域を24kHzとすると、再生信号の周波数帯域12kHz未満に話者音声は集中する場合が多く、結果として、収音信号の周波数帯域12kHz未満に含まれるエコー信号の成分を消去すれば、大半のエコー信号の成分を消去できることになる。基準値αとは、エコー信号の元となる信号(例えば、話者音声の信号)が集中している帯域の上限の周波数値を示すものである。基準値αは予め定められるものであり、上記の例ではα=12kHzとなる。このように、低域エコー消去部302は、計算コスト削減のために、低域の収音信号y(t)についてのみ、エコー消去処理を行う。この周波数帯域の基準値αは事前に設定しておけばよい。以下、低域エコー消去部302の処理を図5を用いて具体的に説明する。また、収音信号y(t)について、低域エコー消去部302に入力される収音信号を説明簡略化のために「y(t)」と示す。
【0019】
収音手段により収音され、入力された収音信号y(t)は、帯域分割手段3012中のローパスフィルタ手段30122およびハイパスフィルタ手段30124に入力される。ローパスフィルタ手段30122は収音信号y(t)に対して、ローパスフィルタ(上記の例では、12kHz未満の信号のみ通過させるもの)の係数を畳み込み、低域の収音信号y(t)を出力する。
【0020】
一方、ハイパスフィルタ手段30124は収音信号y(t)に対して、ハイパスフィルタ(上記の例では、12kHz以上の信号のみ通過させるもの)の係数を畳み込み、高域の収音信号y(t)を出力する。ローパスフィルタ手段30122、ローパスフィルタ手段3014において、通過させる周波数帯域の基準値αを同一にすることが好ましい。
【0021】
低域収音信号y(t)、高域収音信号y(t)はそれぞれ、ダウンサンプリング手段30126、30128に入力される。そして、ダウンサンプリング手段30126は、低域収音信号y(t)について、例えばM−1個、間引くダウンサンプリング処理を行う。間引き数Mは1以上の正の実数であり、例えば「2」とする。ダウンサンプリング処理後の信号をy(Mt)と表す。同様に、ダウンサンプリング手段30128は、高域収音信号y(t)について、例えばM−1個、間引くダウンサンプリング処理を行う。ダウンサンプリング処理後の信号をy(Mt)と表す。低域収音信号y(Mt)は減算手段3020に入力され、高域収音信号y(Mt)は帯域合成手段3022に入力される。
【0022】
一方、再生信号x(t)は、再生手段2およびローパスフィルタ手段3014に入力される。ローパスフィルタ手段3014は、ローパスフィルタ(上記の例では、12kHz未満の信号のみ通過させるもの)の係数を再生信号x(t)に対して畳み込むことで、再生信号x(t)の低域の信号(以下、「低域再生信号x(t)」という。)を出力する。低域再生信号x(t)はダウンサンプリング手段3016に入力される。ダウンサンプリング手段3016は、低域再生信号x(t)について、M−1個、間引くダウンサンプリング処理を行う。ダウンサンプリング処理後の信号x(Mt)は適応フィルタ手段3018に入力される。
【0023】
ここでダウンサンプリング手段3016、30126、30128によるダウンサンプリング処理については、元の標本化周波数より低くなればよい。有理数のダウンサンプリングに関しては、例えば、特願2007−262986号のアップダウンサンプリング装置とアップダウンサンプリング装置およびそのプログラムに詳細に記載されている。また、ダウンサンプリング手段3016、30126、30128は無くても良い。
【0024】
適応フィルタ手段3018は、低域再生信号x(Mt)に適応フィルタの係数h(Mt)を畳み込むことで、低域擬似エコー信号d(Mt)を出力する。当該畳み込みの式は以下のようになる。
【数1】

ここで、Sはタップ数を示す。
【0025】
減算手段3020は、低域収音信号y(Mt)と、低域擬似エコー信号d(Mt)との差をとることで、低域残留エコー信号e(Mt)を出力する。図5の例では、低域収音信号y(Mt)から低域擬似エコー信号d(Mt)が差し引かれる。低域残留エコー信号e(Mt)は帯域合成手段3022および適応フィルタ手段3018に入力される。適応フィルタ手段3018の適応フィルタの係数は、低域再生信号x(Mt)および過去の低域残留エコー信号e(Mt)により更新される。この更新については、様々なアルゴリズムが知られており、例えば、学習同定アルゴリズム(NLMS:Normalized Least-Mean-Squares)や指数重みつけアルゴリズムがあるが、念のため学習同定アルゴリズムについて簡単に説明する。学習同定アルゴリズムにより低域再生信号x(Mt)のベクトルX(Mt)を用いて、以下の式で適応フィルタ係数ベクトルH(Mt)は更新される。
【数2】

ただし、
(Mt)=[x(Mt)、x(M(t−1))、...、x(M(t−S+1))]
(Mt)=[hL、0(Mt)、hL、1(Mt)、...、hL、S−1(Mt)]であり、βはスカラ量のステップサイズであって、取りうる範囲は0<β<2である。また、δは分母が0になることを防止するための微小な定数である。<学習同定アルゴリズムの説明は以上>
【0026】
帯域合成手段3022は、低域残留エコー信号e(Mt)と高域収音信号y(Mt)について、帯域合成を行うことで、残留エコー信号e(t)を出力する。処理の詳細の具体例として、低域残留エコー信号e(Mt)と高域収音信号y(Mt)に対して、サンプル間にM−1個の零値を挿入し、アップサンプルで生じるイメージング(アップサンプリングする前のサンプリング周波数の折り返しスペクトル)を取り除くフィルタを畳み込んだそれぞれの出力信号を加算することで、残留エコー信号e(t)を出力する。そして、上記の処理が全ての低域エコー消去部302(n=1,...,N)で行われ、それぞれの低域エコー消去部302から残留エコー信号e(t)が出力される。
【0027】
[適応ビームフォーミング部104の処理(ステップS104)]
全てのN個の残留エコー信号e(t)(n=1,...,N)は、適応ビームフォーミング部104に入力される。適応ビームフォーミング部104は、N個の残留エコー信号e(t)から雑音信号を抑圧して、適応ビームフォーミング信号s(t)を出力する。以下、図6を用いて具体例を説明する。なお、以下の適応ビームフォーミング部104の説明の詳細については、特開2008−60635号の段落[0004]〜[0010]等に記載されている。
【0028】
入力されたN個の残留エコー信号e(t)は周波数領域変換手段1042に入力される。周波数領域変換手段1042は、時間領域の信号である残留エコー信号e(t)を周波数領域信号E(f、τ)に変換する。ここで、fは周波数を示し、τは任意の時間を示す。周波数領域の変換については、公知の技術であるフーリエ変換などを用いればよい。E(f、τ)(n=1,...,N)は全て適応ビームフォーミング手段1044に入力される。
【0029】
適応ビームフォーミング手段1044は、目的信号である話者信号c(t)を強調し、不要信号である雑音信号b(t)をできるだけ抑圧するフィルタ(W(f)、...、W(f)]を推定することで実現される。適応ビームフォーミング手段1044を設計する際には、「話者から各収音手段へのインパルス応答ベクトルg(f)もしくは、g(f)の近似であるステアリングベクトルa(f)=[exp(−i2πfτ),...,exp(−i2πfτ)]が既知である」ということを仮定する。ここでτは話者8よりの話者信号(目的信号)が収音手段nに達する時刻と原点0に達する時間差である。そして、図8に示すように収音手段4を直線状に配置させることが多い。話者8の方向をθとし、収音s手段4を基準(原点)とした場合の収音手段4の座標dとすると、上述のτは、τ=dcosθ/cで与えられる。ここでcは信号の速度である。
【0030】
図6に説明を戻すと、不要信号を抑圧する適応ビームフォーミング手段1044として、以下の式で表される出力パワーA(W(f))を最小にする適応フィルタ群(ベクトル)1048(n=1,...,N)であるW(f)=[W(f),...,W(f)]を推定する。
A(W(f))=V{|S|(f、τ)}
=V{S(f、τ)S(f、τ)}
=V{W(f)E(f、τ)E(f、τ)W(f)}
=W(f)R(f)W(f) (1)
【0031】
ここで、V{}は時間τに関する平均操作、AはAの複素共役、R(f)=V{E(f、τ)E(f、τ)}は入力信号の相関行列、S(f、τ)は適応ビームフォーミング手段1044の出力であり、以下の式で表すことが出来る。
S(f、τ)=W(f)E(f、τ) (2)
ここで、意味のない解(W(f)=0=[0、...、0])を回避するために、目的信号が無歪みで得られるという以下の式に示す拘束条件を付与する。
(f)g(f)=1 (3)
【0032】
これにより、式(3)を満たし、かつ上記式(1)のA(W(f))の値が最小となるW(f)の値を求める問題はLagurangeの未定乗数pを用いて、以下の式(4)で表すことができる。
A’(W(f))=A(W(f))+p(W(f)g(f)−1)(4)
式(4)を解くことにより、適応フィルタ群(ベクトル)W(f)は、以下の式(5)で得られる。
【数3】

【0033】
適応ビームフォーミング手段1044から出力された周波数領域の適応ビームフォーミング信号S(f、τ)は時間領域変換手段1046に入力される。時間領域変換手段1046は、例えば公知の技術である逆フーリエ変換などを用いて、周波数領域の信号である適応ビームフォーミング信号S(f、τ)を時間領域の適応ビームフォーミング信号s(t)に変換して出力する。
【0034】
[エコー消去部304の処理(ステップS106)]
適応ビームフォーミング信号s(t)は、エコー消去部304に入力される。エコー消去部304は、適応ビームフォーミング信号s(t)から、エコー信号を消去することで、出力信号z(t)として出力する。エコー消去部304の処理内容は公知であるが、図7を用いて念のため説明する。
【0035】
再生信号x(t)は、適応フィルタ手段3048に入力される。適応フィルタ手段3048は、以下の式のように、再生信号x(t)に適応フィルタの係数h(t)を畳み込むことで擬似エコー信号のベクトルd(t)を出力する。
【数4】

【0036】
そして、減算手段3051は、適応ビームフォーミング信号s(t)から擬似エコー信号d(t)差し引くことで、残留エコー信号e(t)を出力する。そして、適応フィルタ手段3048の適応フィルタのベクトルは、過去の残留エコー信号と再生信号により、上述した学習同定法等を用いて更新される。
【0037】
ここで、N個の低域エコー消去部302により、収音信号の低周波数帯域に含まれるエコー信号の成分は消去されており、つまり、適応ビームフォーミング信号に含まれるエコー信号の成分は大半が消去されているので、残留エコー信号e(t)のパワーはかなり小さくなる。従って、所望エコー消去量に達するまでの時間を短くでき、適応ビームフォーミング部104の音響的指向性の変動が生じたとしても、所望のエコー消去量に達することが出来る。
【0038】
そして、残留エコー信号e(t)は出力信号z(t)として出力される。また、話者信号c(t)が存在する場合には、残留エコー信号e(t)と話者信号c(t)とが出力信号z(t)として出力される。
【実施例2】
【0039】
実施例1のエコー消去部304は入力信号の全周波数帯域についてエコー信号の成分を消去した。しかし、N個の低域エコー消去部302で、低域のエコー信号の成分を消去されているので、エコー消去部では、基準値α(上記の例ではα=12kHz)より高い周波数帯域の適応ビームフォーミング信号から、エコー信号を消去するようにしてもよい。このようにすることで、エコー消去部の計算コストを大幅に削減できる。この場合のエコー消去部の参照符号を306とし、エコー消去部306の機能構成例を図9に示す。エコー消去部306は低域エコー消去部302(図5参照)のハイパスフィルタ手段とローパスフィルタ手段とを入れ替えた構成になっている。エコー消去部306の処理内容を簡単に説明する。
【0040】
まず、適応ビームフォーミング信号s(t)が、帯域分割手段3062中のハイパスフィルタ手段30622およびローパスフィルタ手段30624に入力される。ハイパスフィルタ手段30622は適応ビームフォーミングs(t)に対して、ハイパスフィルタ(上記の例では、12kHz(=基準値α)以上の信号のみ通過させるもの)の係数を畳み込み、高域の適応ビームフォーミング信号s(t)を出力する。ローパスフィルタ手段30624は適応ビームフォーミング信号s(t)に対して、ローパスフィルタ(上記の例では、12kHz未満の信号のみ通過させるもの)の係数を畳み込み、低域の適応ビームフォーミング信号s(t)を出力する。
【0041】
高域適応ビームフォーミング信号s(t)、低域適応ビームフォーミング信号s(t)、はそれぞれ、ダウンサンプリング手段30626、30628に入力される。そして、ダウンサンプリング手段30626、30628はそれぞれ、高域適応ビームフォーミング信号s(t)、低域適応ビームフォーミング信号s(t)について、ダウンサンプリング処理を行う。ダウンサンプリング処理後の高域適応ビームフォーミング信号s(Mt)は、減算手段3070に入力され、ダウンサンプリング処理後の低域適応ビームフォーミング信号s(Mt)は、帯域合成手段3072に入力される。
【0042】
一方、ハイパスフィルタ手段3064は、再生信号x(t)に対して、ハイパスフィルタ(上記の例では、12kHz(=基準値α)以上の信号のみ通過させるもの)の係数を再生信号x(t)に対して畳み込むことで、高域再生信号x(t)を出力する。高域再生信号x(t)はダウンサンプリング手段3066に入力される。ダウンサンプリング手段3066は、高域再生信号x(t)について、ダウンサンプリング処理を行う。ダウンサンプリング処理後の信号x(Mt)は適応フィルタ手段3068に入力される。また、ダウンサンプリング手段3066、30626、30628は無くても良い。
【0043】
適応フィルタ手段3068は、低域再生信号に適応フィルタを畳み込むことで、高域擬似エコー信号d(Mt)を出力する。減算手段3070は、高域適応ビームフォーミング信号s(Mt)から高域擬似エコー信号d(Mt)を差し引くことで、高域残留エコー信号e(Mt)を出力する。高域残留エコー信号e(Mt)は帯域合成手段3072および適応フィルタ手段3068に入力される。適応フィルタ手段3068の適応フィルタ係数は、高域再生信号x(Mt)および過去の高域残留エコー信号e(Mt)により、上記学習同定アルゴリズム等を用いて、更新される。
【0044】
帯域合成手段3072は、高域残留エコー信号e(Mt)と低域適応ビームフォーミング信号s(Mt)について、帯域合成およびアップサンプリング処理を行うことで、残留エコー信号e(t)を出力する。帯域合成手段3072の処理の詳細は、帯域合成手段3022の処理と同様なので、省略する。そして、帯域合成手段3072から残留エコー信号e(t)が、出力信号z(t)として出力される。<エコー消去部306の処理の説明以上>
【0045】
上記のエコー消去装置300は、再生手段2が1つの場合について説明したが、再生手段が2以上の場合であっても、適用できる。
また、低域エコー消去部302、エコー消去部304の処理は時間領域で行い、適応ビームフォーミング部104の処理は周波数領域で行った例を説明した。しかし、低域エコー消去部302、エコー消去部304の処理を周波数領域で行い、適応ビームフォーミング部104の処理は時間領域で行ってもよい。
【0046】
この発明では、パワーが低域に集中する話者音声の性質から、低域の所望エコー消去量が高域の所望エコー消去量より大きいことに着目する。そして、本実施例のエコー消去装置は、「低域エコー消去部302による低域のエコー消去処理」→「適応ビームフォーミング部104による適応ビームフォーミング処理」→「エコー消去部304によるエコー消去」、の順番で処理を行う。まず、低域エコー消去部302は、収音信号の低周波数帯域のみに含まれるエコー信号の成分を消去する。従って、エコー消去装置100よりも計算コストを削減できる。また、適応ビームフォーミング処理の前に、低域のエコー消去処理を行う。従って、低域エコー消去部のエコー経路モデルでは、適応ビームフォーミング部104の音響的指向性の変動による再推定を回避できる。また、低域のエコー消去処理により収音信号に含まれる大半のエコー信号の成分を消去している。従って、エコー消去部304中の減算手段3051よりの残留エコー信号e(t)のパワーは小さいものとなり、結果として、エコー消去部の所望エコー消去量に達するまでの時間を短くできる。よって、適応ビームフォーミング部104による音響的指向特性の変動が生じたとしても、所望のエコー消去量に達することが出来る。
【0047】
また、この実施例1のエコー消去装置300が従来のエコー消去装置100よりも優れていることを示す実験結果について説明する。マイクロホン数N=4とし、全周波数帯域を24kHzとし、周波数帯域の基準値α=12kHz、つまり、低域を12kHz未満、高域を12〜24kHzとした場合に、本実施例のエコー消去装置300の計算コストは、エコー消去装置100のエコー消去処理にかかる計算コストより約40%削減できる。
【0048】
<ハードウェア構成>
本発明は上述の実施の形態に限定されるものではない。また、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
また、上述の構成をコンピュータによって実現する場合、エコー消去装置300が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、処理機能がコンピュータ上で実現される。
【0049】
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよいが、具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
【0050】
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
【0051】
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
【0052】
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
また、本実施例で説明したエコー消去装置300は、CPU(Central Processing Unit)、入力部、出力部、補助記憶装置、RAM(Random Access Memory)、ROM(Read Only Memory)及びバスを有している(何れも図示せず)。
CPUは、読み込まれた各種プログラムに従って様々な演算処理を実行する。補助記憶装置は、例えば、ハードディスク、MO(Magneto-Optical disc)、半導体メモリ等であり、RAMは、SRAM(Static Random Access Memory)、DRAM (Dynamic Random Access Memory)等である。また、バスは、CPU、入力部、出力部、補助記憶装置、RAM及びROMを通信可能に接続している。
【0053】
<ハードウェアとソフトウェアとの協働>
本実施例の単語追加装置は、上述のようなハードウェアに所定のプログラムが読み込まれ、CPUがそれを実行することによって構築される。以下、このように構築される各装置の機能構成を説明する。
エコー消去装置300の低域エコー消去部302、適応ビームフォーミング部104、エコー消去部304は、所定のプログラムがCPUに読み込まれ、実行されることによって構築される演算部である。エコー消去装置300の記憶部(図示せず)は上記補助記憶装置として機能する。
【図面の簡単な説明】
【0054】
【図1】従来のエコー消去装置の機能構成例を示した図。
【図2】従来のエコー消去装置の機能構成例を示した図。
【図3】実施例1のエコー消去装置の機能構成例を示した図。
【図4】実施例1のエコー消去装置の処理フローを示した図。
【図5】実施例1の低域エコー消去部の機能構成例を示した図。
【図6】実施例1の適応ビームフォーミング部の機能構成例を示した図。
【図7】実施例1のエコー消去部の機能構成例を示した図。
【図8】適応ビームフォーミング処理で用いるτを説明するための図。
【図9】実施例2のエコー消去部の機能構成例を示した図。

【特許請求の範囲】
【請求項1】
N個の収音手段で収音された収音信号に含まれるエコー信号を消去し、当該収音信号に含まれる雑音信号を抑圧して、出力信号として出力するエコー消去装置において、
それぞれが前記収音信号の、予め定められた基準値より低い周波数帯域に含まれるエコー信号の成分を消去し、残留エコー信号を出力するN個の低域エコー消去部と、
N個の前記残留エコー信号から前記雑音信号を抑圧して、適応ビームフォーミング信号を出力する適応ビームフォーミング部と、
前記適応ビームフォーミング信号から、エコー信号を消去することで前記出力信号を出力するエコー消去部と、
を有するエコー消去装置。
【請求項2】
請求項1記載のエコー消去装置であって、
前記低域エコー消去部は、
前記再生信号の低域周波数帯の信号(以下、「低域再生信号」という。)を出力するローパスフィルタ手段と、
前記収音信号を帯域分割することで、低域収音信号と高域収音信号に分けて出力する帯域分割手段と、
前記低域再生信号に適応フィルタを畳み込むことで、低域擬似エコー信号を出力する適応フィルタ手段と、
前記低域収音信号と前記低域擬似エコー信号との差をとることで、低域残留エコー信号を出力する減算手段と、
前記低域残留エコー信号と前記高域収音信号について帯域合成を行うことで、前記残留エコー信号を出力する帯域合成手段と、を有し、
前記適応フィルタは、過去の低域残留エコー信号と前記低域再生信号とを用いて更新されることを特徴とするエコー消去装置。
【請求項3】
請求項1または2記載のエコー消去装置であって、
前記エコー消去部は、
前記基準値より高い周波数帯域の適応ビームフォーミング信号から、エコー信号を消去するものであることを特徴とするエコー消去装置。
【請求項4】
N個の収音手段で収音された収音信号に含まれるエコー信号を消去し、当該収音信号に含まれる雑音信号を抑圧して、出力信号として出力するエコー消去方法において、
収音手段毎に、前記収音信号の予め定められた基準値より低い周波数帯域に含まれるエコー信号の成分を消去し、残留エコー信号を出力する低域エコー消去過程と、
N個の前記残留エコー信号から前記雑音信号を抑圧して、適応ビームフォーミング信号を出力する適応ビームフォーミング過程と、
前記適応ビームフォーミング信号から、エコー信号を消去することで前記出力信号を出力するエコー消去過程と、
を有するエコー消去方法。
【請求項5】
請求項4記載のエコー消去方法であって、
前記低域エコー消去過程は、
前記再生信号の低域周波数帯の信号(以下、「低域再生信号」という。)を出力するローパスフィルタステップと、
前記収音信号を帯域分割することで、低域収音信号と高域収音信号に分けて出力する帯域分割ステップと、
前記低域再生信号に適応フィルタを畳み込むことで、低域擬似エコー信号を出力する適応フィルタステップと、
前記低域収音信号と前記低域擬似エコー信号との差をとることで、低域残留エコー信号を出力する減算ステップと、
前記低域残留エコー信号と前記高域収音信号について帯域合成を行うことで、前記残留エコー信号を出力する帯域合成ステップと、を有し、
前記適応フィルタは、過去の低域残留エコー信号と前記低域再生信号とを用いて更新されることを特徴とするエコー消去方法。
【請求項6】
請求項4または5記載のエコー消去方法であって、
前記エコー消去過程は、
前記基準値より高い周波数帯域の適応ビームフォーミング信号から、エコー信号を消去することを特徴とするエコー消去方法。
【請求項7】
請求項1〜3に記載のエコー消去装置としてコンピュータを動作させるプログラム。
【請求項8】
請求項7記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。






【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2010−28653(P2010−28653A)
【公開日】平成22年2月4日(2010.2.4)
【国際特許分類】
【出願番号】特願2008−189910(P2008−189910)
【出願日】平成20年7月23日(2008.7.23)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】