説明

ノイズ低減による多重チャンネル適応の音声信号処理

【課題】改善された音響特性、特に、良好なSN比を示し、および経済的に実行できる音声信号処理のためのシステムを提供すること。
【解決手段】本発明によるノイズ低減による音声信号処理のためのシステムは、マイクロホン信号を検出する少なくとも2つのマイクロホンを有するマイクロホンアレイ、マイクロホン信号を受信するためのマイクロホンアレイに接続される前処理手段(11)、少なくとも1つのノイズ参照信号を生成するように構成される手段を有する第1の信号処理手段(12)、ビームフォームされた信号を得るために適応ビームフォーマーを有する前処理信号を受信するための第2の信号処理手段(14)、および少なくとも1つのノイズ参照信号に基づいてビームフォームされた信号のノイズを低減するように構成される適応ノイズキャンセリング手段(13)、を備える。

【発明の詳細な説明】
【技術分野】
【0001】
(発明の記載)
本発明は、ノイズ低減による音声信号処理に関する。詳細には、多重チャンネルの音声信号処理に関する。
【背景技術】
【0002】
音声信号処理は、ノイズが存在する環境において多く達成されている。顕著な例は、車中におけるハンズフリーの音声通信である。このようなハンズフリー通信においては、マイクロホン信号が相対的に低いSN比(SNR)の影響を受ける。その結果、この音声信号の質を改善するために、一定のノイズの低減が使用されなければならない。
【0003】
音声を取得する距離において、この信号の質を改善するための一般的な方法では、多重チャンネルシステムを活用する(例えば、「Microphone Arrays: Signal Processing Techniques and Applications」,eds. Brandstein,M.およびWard,D.,Springer,Berlin 2001に記載のマイクロホンアレイ)。
【0004】
現在の多重チャンネルシステムは主に、いわゆる「General Sidelobe Canceller」(GSC)を使用する(参照、例えば、Griffiths,L.J.およびJim,C.W.による「An alternative approach to linearly constrained adaptive beamforming」、アンテナおよび伝搬についてのIEEE報告書,vol.30.,p27,1982)。GSCは、2つの信号処理経路からなり、それは、ブロッキングマトリクスおよび適応するノイズキャンセリング手段を用いる第1の(または下側の)適応経路、および固定ビームフォーマーを用いる第2の(上側の)非適応経路である。
【0005】
固定ビームフォーマーは、例えば、固定ビームパターンを使用する時間遅延補償によって、前処理された信号を改善する。適応処理方法は、例えばシステム操作中のフィルター係数のような、処理パラメータの永久適応により特徴付けられる。このGSCの下側の信号処理経路では、固定ビームフォーマーの出力信号の残余ノイズを低減するために使用されるノイズ参照信号を生成するように最適化される。
【0006】
下側の信号処理手段は、マイクロホン信号からノイズ参照信号を生成するために使用されるブロッキングマトリクスを備える(例えば、Herbordt,W.,およびKellermann.による「Adaptive beamforming for audio signal acquisition」,「Adaptive signal processing:applications to real−world problems」中のp155,Springer,Berlin 2003)。この妨害信号によって、固定ビームフォーマーの出力信号の残余ノイズは低減され得、適応フィルターを使用する一定の適応ノイズキャンセリング手段を与える。
【0007】
現在のGSC設計における焦点は、固定ビームフォーマーの出力信号を歪ませることなく、下側の経路によってノイズを最適に抑制することにある。しかし、この固定ビームフォーマーに対する、いずれの最適化もこれまで決してなされてこなかった。むしろ、音声信号は一定の時間遅延の分だけ異なるのみで、音声信号およびノイズ信号はマイクロホンアレイの各マイクロホンにおいて同じエネルギーレベルを示すと考えられる。
【0008】
多くの実用化に対しては、マイクロホンアレイの異なるマイクロホンのSNRはお互いに異なり、GSCの性能を低下させる結果となる。低いSNRをもつチャンネルにより、非最適化の固定ビームフォーマーの性能が悪化さえし得、改善し得ない。このようにして、実際のGSCの実行は信頼できるほどに十分働かず、無指向性のマイクロホンまたは同じ方向にポインティングする同じ型の指向性のマイクロホンからなるマイクロホンアレイに対していくらか実際に使用するのみである。
【発明の開示】
【発明が解決しようとする課題】
【0009】
それゆえ、本発明に存在する課題は、上述のようなドローバックを克服し、音声信号処理システムおよび方法および改善された音響特性、特に、良好なSN比(SNR)を示し、および経済的に実行できるハンズフリーシステムシステムを提供することである。
【課題を解決するための手段】
【0010】
この課題は、請求項1に記載のノイズ低減による音声信号処理のためのシステム、および請求項12に記載の方法によって解決される。本発明によるこのシステムは、
マイクロホン信号を検出するために少なくとも2つのマイクロホンを有するマイクロホンアレイと、
前処理信号を得るために該マイクロホン信号の時間遅延補償を達成するように構成される手段を有し、該マイクロホン信号を受信するために該マイクロホンアレイに接続される前処理手段と、
少なくとも1つのノイズ参照信号、特に、各マイクロホン信号に対して1つのノイズ参照信号)を生成するように構成される手段を有し、前処理信号を受信するために前処理手段に接続される第1の信号処理手段と、
ビームフォームされた信号を得るために適応するビームフォーマーを有し、前処理信号を受信するための前処理手段に接続される第2の信号処理手段と、
少なくとも1つのノイズ参照信号に基づいて、ビームフォームされた信号のノイズを低減するように構成される適応するノイズキャンセリング手段と
を備える。
【0011】
音声信号処理のための本発明のシステム、特に、例えば、音声信号およびノイズ信号が、マイクロホンアレイの各マイクロホンにおいて同じレベルを示さない場合、第2の信号処理手段の最適化は、主に音声信号のSNRを改善する。実際の適用においては、このような場合が一般的であり、それは、例えば、a)話し手とマイクロホンとの距離が会話中で異なり得るために、そのマイクロホンにおいて異なる音声レベルが生ずる、b)ノイズ領域が不均一であり得、このため、異なるノイズレベルがそのマイクロホンにおいて生ずる、およびc)そのマイクロホンアレイが、空間において異なる方向にポインティングする指向性マイクロホンからなり得るために、異なるノイズおよび音声レベルを得る、ためである。
【0012】
所望のターゲット信号にマイクロホン信号を同期するために、各信号の時間遅延が、その前処理手段によって計算および補償される必要がある。
【0013】
第2の信号処理手段はビームフォーマーを備える。本発明によるビームフォーマーは、適応する重み付きの和で表されたビームフォーマーであり、これはM個のマイクロホンの前処理信号、詳細には時間遅延信号XT,mを重ね合わせ、改善されたSNRを有する1つの出力信号Yを得る。
【0014】
【数1】

重みAは、従来の遅延和(delay−and−sum)ビームフォーマーにおけるように時間に関して独立ではないが、例えば、所望の方向における感度を維持し、およびノイズ源の方向において感度を最小化するために、必要数を繰り返して再計算される必要がある。
詳細には、第1の信号処理手段は、ノイズ参照信号をできるだけ正確に評価するように設計される。これらのノイズ参照信号は、当業者に周知の適応ノイズキャンセリング手段により、入力信号として使用される。
【0015】
適応ノイズキャンセリング手段は、第2の信号処理手段により生成された出力信号からの低減されたノイズ信号を生成する。適応ノイズキャンセリング手段は、反復計算(例えば、正規化された最小二乗(NLMS)アルゴリズムにより)される適応するフィルターを備える。
【0016】
有利には、少なくとも1つのノイズ参照信号を生成するように構成される手段は、非適応のブロッキングマトリクスまたは適応するブロッキングマトリクスを備え得る。
【0017】
非適応のブロッキングマトリクスは使用するのに技術的に容易であり、製造するのに安価でもあるが、適応するブロッキングマトリクスの使用は主に、ノイズ参照信号における音声信号部分の低減を改善する。ブロッキングマトリクスは、隣のチャンネルを単に低減することによって働き得る。異なるチャンネルのうち1つを除く各チャンネルの場合には、参照信号が、時間遅延マイクロホン信号により生成される。
【0018】
好ましくは、この前処理手段は、時間遅延補償された各マイクロホン信号の位相および振幅を一致させるように構成される適応するセルフキャリブレーション手段をさらに備え得る。適応するノイズキャンセリング手段の場合のように、適応するセルフキャリブレーション手段の適応するフィルターがNLMSアルゴリズムの手段により計算され得る。
【0019】
時間遅延補償の後、このマイクロホン信号は正確には一致し得ない(例えば、話し手の動きおよび異なるマイクロホンの位相および振幅の不一致のため)。この適応するセルフキャリブレーションによって、位相および振幅の不一致は最小化される。したがって、各チャンネルにおける所望の信号が時間(位相)調整され、所望信号部分の振幅は各チャンネルにおいてほぼ等しく、この信号はほぼ同じ周波数特性を示すことが予測される。
【0020】
結果的には、実際の適用により要求されるSNRに依存して、第1の信号処理手段における非適応のブロッキングマトリクスを使用するのに十分であり得、この処理手段は少なくとも1つのノイズ参照信号を得る。しかし、適応するブロッキングマトリクスは、少なくとも1つのノイズ参照信号の正確性を改善するために使用され得る。
【0021】
本発明のシステムの好ましい実施形態によれば、適応する処理手段の適応を制御するように構成される適応する制御手段が使用され得る。これらの適応する処理手段は、適応するビームフォーマー、適応するノイズキャンセリング手段および適応するものとして選択される場合にはブロッキングマトリクスを備え得る。
【0022】
さらに、適応する制御手段は、瞬時のSNR、および/または音声が検出されるかどうか、および/または検出された音声信号のエネルギーが一定の規定値で同時に検出されたバックグラウンドノイズのエネルギーを超過するかどうか、および/または音響信号が到来する方向、に依存して適応を開始するように構成され得る。
【0023】
適応する制御が、第2の適応処理手段に依存して第1の適応処理手段の適応を開始するように構成されることが望まれ得、ここで、第1の適応処理手段および第2の適応処理手段は、適応するビームフォーマー、適応するブロッキングマトリクスおよび適応するノイズキャンセリング手段のうちの1つである。
【0024】
例えば、適応するビームフォーマーにより使用される重みが適応する場合、適応するブロッキングマトリクス、適応される場合には、および/または適応するノイズキャンセリング手段のフィルターを適応させることも望まれ得る。
【0025】
さらに、前処理手段および/または第1の処理手段および/または第2の処理手段は、時間領域でまたは周波数領域でまたはサブバンド周波数領域で音声信号処理を達成するように構成され得る。
【0026】
次の信号処理が周波数領域でなされる場合、前処理手段は高速フーリエ変換を達成するための手段を備え得る。フーリエ変換を避けるために、全時間領域における少なくとも一部分の処理がなされ得る。
【0027】
本発明のシステムのマイクロホンアレイは、少なくとも1つの指向性マイクロホンを備え得る。詳細には、このマイクロホンアレイは1より多くの指向性マイクロホンを備え得、これらは異なる方向を向く(例えば、コンパクトマイクロホンアレイは、異なる方向を向く少なくとも2つの指向性マイクロホンを備える)。同じ方向を向かない複数のマイクロホンが与えられる場合には、固定ビームフォームを使用する従来の音声信号処理のシステムは相対的に低い性能を示すが、本発明はマイクロホンが異なる方向を向く場合でさえ、高いSNRを補償する。
【0028】
1つの有利な実施形態によれば、本発明のシステムは少なくとも2つのサブアレイを備え得る。この場合、各サブアレイは、改善された全体の指向性および感度を生ずる特定の周波数帯域に最適化され得る。
【0029】
好ましくは、本発明のシステムはフレームを備え、このフレーム内外に所定の、さらに詳細には定位置にマイクロホンアレイの各マイクロホンが配列される。このことから、マイクロホンを有するフレームの製造後に、マイクロホンの相対位置が既知となることが保証される。
【0030】
低減されたノイズにより改善された音声信号処理の本発明のシステムおよび方法は、特に、ハンズフリーシステムに有効であり、これは、ハンズフリー通信がノイズ環境で達成されるからである。
【0031】
さらに、本発明は、車中における音声信号処理のための、およびハンズフリーシステムのための先述のシステムの使用に向ける。改善されたSNRは、車両キャビン中の通信装置の音響的に興味深いコンテンツにおいて特に望まれる。上述した実施形態にしたがって、マイクロホンアレイがフレームにおいて配置される場合、マイクロホンアレイは容易に車両キャビン中に搭載され得る。
【0032】
本発明により、音声信号処理およびハンズフリーシステムための、上述したシステムの1つを備える車両も提供される。
【0033】
さらに、本発明は、ノイズ低減による音声信号処理のための方法を提供し、該方法は、
少なくとも2つのマイクロホンを備えるマイクロホンアレイによってマイクロホン信号を検出することと、マイクロホン信号を前処理することであって、前処理することが、前処理信号を得るためにマイクロホン信号の時間遅延補償を包含することと、第1信号処理のための、および第2の信号処理のための入力信号として前処理信号を使用することであって、該第1信号処理が少なくとも1つのノイズ参照信号生成することを含み、第2の信号処理がビームフォームされた信号を得るために、適応するビームフォーミングをすることを含む、ことと、適応ノイズキャンセリング手段を使用してノイズ参照信号に基づくビームフォームされた信号のノイズを低減することとを包含する。
【0034】
非適応のブロッキングマトリクスまたは適応のブロッキングマトリクスを使用して、少なくとも1つのノイズ参照信号が生成され得る。
【0035】
マイクロホン信号の前処理は、時間遅延補償された信号を、適応するセルフキャリブレーションすることを包含し得、これらの信号の位相および振幅を一致させる。
【0036】
適応する処理ステップの適応、特に、適応するビームフォーミング、適応するブロッキングマトリクスの計算、適応するものであるように選択される場合には、および適応するノイズキャンセリングが、一定の適応する制御手段によって達成され得る。
【0037】
さらに、適応ステップの制御は第1の適応処理手段に適応することを包含し得、この処理手段は、第2の適応処理手段の適応に依存し、ここで、第1の適応処理手段および第2の適応処理手段は、適応するビームフォーマー、適応するブロッキングマトリクス、および適応するノイズキャンセリング手段のうち1つである。
【0038】
有利には、瞬時のSNR、および/または音声が検出されるかどうか、および/または検出された音声信号のエネルギーが一定の規定値で同時に検出されたバックグラウンドノイズのエネルギーを超過するかどうか、および/または音響信号が到来する方向、に依存して適応が制御され得る。
【0039】
前処理手段および/または第1の処理手段および/または第2の処理手段が、時間領域または周波数領域またはサブバンド周波数領域で、処理を達成し得る。
【0040】
本発明はコンピュータプログラム製品をさらに提供し、この製品は、上述のようなノイズ低減による音声信号処理のための本発明のステップを達成するためのコンピュータの実行可能な命令を有する1以上のコンピュータ読み取り可能な媒体を備える。
【0041】
本発明は、さらに以下の手段を提供する。
【0042】
(項目1)
ノイズ低減による音声信号処理のためのシステムであって、
マイクロホン信号を検出するために少なくとも2つのマイクロホンを有するマイクロホンアレイと、
前処理信号を得るために該マイクロホン信号の時間遅延補償を達成するように構成される手段を有し、マイクロホン信号を受信するために該マイクロホンアレイに接続される前処理手段と、
少なくとも1つのノイズ参照信号、特に、各マイクロホン信号に対して1つのノイズ参照信号を生成するように構成される手段を有し、該前処理信号を受信するために該前処理手段に接続される第1の信号処理手段と、
ビームフォームされた信号を得るために適応するビームフォーマーを有し、該前処理信号を受信するための該前処理手段に接続される第2の信号処理手段と、
該少なくとも1つのノイズ参照信号に基づいて、該ビームフォームされた信号のノイズを低減するように構成される適応するノイズキャンセリング手段と
を備える、システム。
【0043】
(項目2)
上記少なくとも1つのノイズ参照信号を生成するように構成される手段が、非適応のブロッキングマトリクスまたは適応のブロッキングマトリクスを備える、項目1に記載のシステム。
【0044】
(項目3)
上記前処理手段が、時間遅延補償されたマイクロホン信号の位相および振幅を一致するように構成される適応するセルフキャリブレーション手段をさらに備える、項目1から項目2のいずれか1項に記載のシステム。
【0045】
(項目4)
上記適応処理手段、特に、上記適応ビームフォーマーおよび上記適応ノイズキャンセリング手段の適応を制御するように構成される適応する制御手段をさらに備える、項目1から項目3のいずれか1項に記載のシステム。
【0046】
(項目5)
第2の適応処理手段の適応に依存する第1の適応処理手段の適応を開始するように上記適応制御手段が構成され、該第1の適応処理手段および該第2の適応処理手段が上記適応ビームフォーマー、上記適応ブロッキングマトリクスおよび上記適応ノイズキャンセリング手段のうちの1つである、項目4に記載のシステム。
【0047】
(項目6)
上記適応制御手段が、瞬時のSNR、および/または音声が検出されるかどうか、および/または検出された音声信号のエネルギーが一定の規定値で同時に検出されたバックグラウンドノイズのエネルギーを超過するかどうか、および/または音響信号が到来する方向、に依存して適応を開始するように構成される、項目4または項目5に記載のシステム。
【0048】
(項目7)
上記前処理手段および/または上記第の1処理手段および/または上記第2の処理手段が、時間領域または周波数領域またはサブバンド周波数領域で、処理を達成するように構成される、項目1から項目6のいずれか1項に記載のシステム。
【0049】
(項目8)
上記マイクロホンアレイが、少なくとも1つの指向性マイクロホン、詳しくは、異なる方向を向く1より多い指向性マイクロホンを備える、項目1から項目7のいずれか1項に記載のシステム。
【0050】
(項目9)
上記マイクロホンアレイが少なくとも2つのサブアレイを備える、項目1から項目8のいずれか1項に記載のシステム。
【0051】
(項目10)
フレームをさらに備え、上記マイクロホンアレイが、該フレーム中または該フレーム上に、所定の、特に、定位置に配置される、項目1から項目9のいずれか1項に記載のシステム。
【0052】
(項目11)
項目1から項目10のいずれか1項に記載のノイズ低減による音声信号処理のためのシステムを備えるハンズフリーシステム。
【0053】
(項目12)
ノイズ低減による音声信号を処理するための方法であって、
少なくとも2つのマイクロホンを備えるマイクロホンアレイによってマイクロホン信号を検出することと、
該マイクロホン信号を前処理することであって、該前処理することが、前処理信号を得るために該マイクロホン信号の時間遅延補償を包含することと、
第1の信号処理のためのおよび第2の信号処理のための入力信号として該前処理信号を使用することであって、該第1の信号処理が少なくとも1つのノイズ参照信号を生成することを含み、該第2の信号処理がビームフォームされた信号を得るために、適応するビームフォーミングをすることを含む、ことと、
適応するノイズキャンセリング手段を使用して、該ノイズ参照信号に基づいてビームフォームされた信号のノイズを低減すること
を包含する、方法。
【0054】
(項目13)
上記少なくとも1つのノイズ参照信号が、非適応のブロッキングマトリクスまたは適応のブロッキングマトリクスを使用して生成される、項目12に記載の方法。
【0055】
(項目14)
上記マイクロホン信号を前処理することが、これらの信号の位相および振幅を一致させるために、上記時間遅延補償された信号を適応セルフキャリブレーションすることをさらに包含する、項目12または項目13に記載の方法。
【0056】
(項目15)
適応処理ステップ、特に、上記適応ビームフォーミングおよび上記適応ノイズキャンセリングの適応を制御することをさらに包含する、項目12から項目14のいずれか1項に記載の方法。
【0057】
(項目16)
上記制御することが、第2の適応処理手段の適応に依存する第1の適応処理手段を適応することを包含し、該第1の適応処理手段および該第2の適応処理手段が、上記適応ビームフォーマー、上記適応ブロッキングマトリクス、および上記適応ノイズキャンセリング手段のうちの1つである、項目15に記載の方法。
【0058】
(項目17)
上記適応が、瞬時のSNR、および/または音声が検出されるかどうか、および/または検出された音声信号のエネルギーが一定の規定値で同時に検出されたバックグラウンドノイズのエネルギーを超過するかどうか、および/または音響信号が到来する方向、に依存して制御される、項目12から項目16のいずれか1項に記載の方法。
【0059】
(項目18)
上記前処理手段および/または上記第1の処理手段および/または上記第2の処理手段が、時間領域または周波数領域またはサブバンド周波数領域において、処理を達成する、項目12から項目17のいずれか1項に記載のシステム。
【0060】
(項目19)
項目12から項目18のいずれか1項に記載の方法のステップを達成するためのコンピュータ実行可能な命令を有する1以上のコンピュータ読み取り可能な媒体を備える、コンピュータプログラム製品。
【発明を実施するための最良の形態】
【0061】
本発明のさらなる特徴および利点は図面を参照して記載される。この明細書では、本発明の好ましい実施形態を例示することを意味する添付図面を参照する。このような実施形態は本発明の全ての範囲を表現していないことが理解される。
【0062】
本発明による音声信号処理の一実施形態の一般的な構成が図1に示される。例示目的のでは、記載されるサブバンド領域において、この処理がなされる。代替的には、このアルゴリズムが、全時間領域において適用され得る。
【0063】
図1に示されるこの音声処理手段は、GSCの一般的な表現とみなされ得る。しかし、標準的なGSC法によると、2つの信号処理手段または経路がある。それは、1つの非適応経路(上側の経路、固定ビームフォーマー)および1つの適応する経路(下側の経路、適応するノイズキャンセリング手段)である。本発明においては、上側の経路においてビームフォーマーと適応することも提案される。
【0064】
例えば、車両の内側に搭載されるマイクロホンアレイ(示されてない)は、音声信号を検出する。検出されるマイクロホン信号は、ノイズを低減する前に、前処理される。前処理は、高速フーリエ変換を包含し得る。サブバンド領域における複素数のマイクロホン信号X(n,k)〜X(n,k)は、時間遅延補償11をされ、ここで、Mはマイクロホン数を示し、ならびにnおよびkは、周波数の引数(index)、時間の引数それぞれを示す。各マイクロホン信号に対して、この時間遅延は、所望のターゲット信号に対応してマイクロホン信号を同期するために、例えば、マイクロホンの幾何形状に基づいて、計算および補償される必要がある。この遅延は、音速により音が伝播するための、および異なる方向および/または位置から伝播するための音響での時間遅延に対応する。
【0065】
この時間遅延信号XT,1〜XT,Mは、2つの異なる信号処理手段によってさらに処理され、これらは例えば、2つの信号処理経路に入力される:この経路は、ブロッキングマトリクス12を有する第1の(下側の)適応する経路および適応するノイズキャンセリング手段13および適応する重み付き和のビームフォーマー14を有する第2の(上側の)経路である。
各チャンネルにおける信号部分のノイズレベルは互いに異なることが多い。異なるチャンネルの単純平均をとる(遅延和ビームフォーマー)ことにより、まさに低いSNRを有するチャンネルは、出力信号のSNRを低減し得る。このように、異なるチャンネルには重み係数(重み)を導入することが望まれ得る。
【0066】
平均をとる前に、各サブバンドnにおける各チャンネルmに実数の重みA(n)を適用することによって、出力信号YのSNRは、原理的に最大化され得る。
【0067】
【数2】

次の手順により、重みA(n)を決定することが可能になる。入力信号XT,Mはそれぞれ、信号部分S(n,k)およびノイズ部分N(n,k)からなる。
【0068】
【数3】

簡単のために、この信号部分は正の実数のスケーリングファクターαによってのみ変化することを仮定する。
【0069】
【数4】

ノイズ部分は、互いに完全な直交性を有し、異なるパワーεを有し得ると仮定される。
【0070】
【数5】

ここで、βはある正の実数値である。これらの仮定に対する最適な重みは、以下のように計算され得る(参照:Van Veen,B.D.およびBuckley,K.M.による「Beamforming:A Versatile Approach to Spatial Filtering」,IEEE ASSP Magazine,vol.5,no.2,p.4,1999)。
【0071】
【数6】

この重みは、所望の信号部分に対する唯一の応答を得るために正規化され得る。
【0072】
【数7】

実際の適用では、α(n)およびβ(n)の数は時刻に依存し得る。このようにして、一時的な変化をトラックする(例えば、ε{|N(n,k)|}ノイズのパワーおよび異なるチャンネルの音声振幅比を評価することによって)ことが必要である。その結果、最適な重みA(n,k)はさらに、時刻の変化量でもあり、繰り返し計算される必要があり、これにより、ビームフォーマーが適応するものとなる。
【0073】
適応する重み和ビームフォーマーY(n,k)の出力信号は中間値として示される。このSNRが出来るだけ適切であり得るために、このビームフォーマーは適応する重みA(n,k)の決定により達成される。
【0074】
ブロッキングマトリクス12は、ノイズ参照信号を得るために設計される。これらの信号の中には、所望の音声はできる限り存在し得ない。容易な理解のために、このブロッキングマトリクスは、隣のチャンネルとの減算を達成する。
【0075】
好ましくは、このブロッキングマトリクス12は適応するものである。入力信号XT,1〜XT,Mは、「ノイズプレーン(noise plane)」上に作られる。XB,1〜XB,M−1は、このブロッキングマトリクスによって生じるノイズ参照信号出力であり、このブロッキングマトリクスは、この入力信号内で、所望のまたは有効な信号を理論的には完全にブロックし得る。Walsh−Hadamard型のブロッキングマトリクスは、Griffiths−Jim型のブロッキングマトリクスよりも一般的に好まれるが、それは、Walsh−Hadamard型のブロッキングマトリクスを用いると、多くのフィルターが省略され得るからである。他方、Walsh−Hadamard型のブロッキングマトリクスは、M=2のマイクロホンのみからなるアレイに成り立ち得る。
【0076】
好ましくは、ノイズ参照信号XB,1〜XB,Mは、適応するノイズキャンセリング手段13の入力信号として使用される。適応するノイズキャンセルはフィルターHGSC,m(n,k)により行われる。これらのフィルターは、出力信号パワーε{|YGSC,m(n,k)|}を最小化するように適応される。参照信号は理論的には信号部分を有しないので、この残余ノイズの信号Y(n,k)が低減され、これにより、SNRが増加する。
【0077】
フィルターの適応のために、NLMSアルゴリズムは使用され得、このアルゴリズムは次のとおりである:
【0078】
【数8】

ここで、アスタリスクは、このノイズ参照信号の複素共役を示す。したがって、ノイズ参照信号およびフィルターHGSC,m(n,k)は、ノイズ信号を生成するために使用され、該ノイズ信号は、適応するビームフォーマー14によって、ビームフォームされた信号Y出力から減算される。この減算によって得られた最終的な出力信号YGSCは、当業者に周知のものよりも高品質な音声取得を可能にする、高品質の音声信号を示す。
【0079】
第1の信号処理および第2の信号処理の適応するステップは、適応する制御15によって制御される必要がある。上側の信号処理経路が適応されると、一般的に下側の信号処理経路の最適解の設定は変化する。それゆえ、下側の信号処理経路は、有利的に再適応される必要がある。
【0080】
出力信号における結果を得るために、この適応ステップは注意深く制御される必要がある。好ましくは、SNRを最適化する重み和ビームフォーマー14は瞬間にのみ適応され、ここで、(音声)信号は、バックグラウンドノイズ上で十分なエネルギーを有して存在する。有利なことに、適応するノイズキャンセリング手段13は、ノイズが存在する場合、および音声信号が検出されないかまたはほとんど音声信号が検出されない場合にのみ適用され得る。
【0081】
異なるユニットの適応のためのステップ数を制御するために、いくつかの情報のソースが考慮され得る。例えば、このステップ数は、SNR、および/または音声が検出されるかどうか、および/または音声の伝播方向に依存し得る。
【0082】
図2は、本発明のGSCの他の実施形態を示す。ここで、図1に示される構成は、適応するセルフキャリブレーティングユニット26により提供される。この実施形態による前処理手段は、時間遅延補償21、およびマイクロホン入力を前処理するために適応するセルフキャリブレーティングユニット26を備える。
【0083】
実際の適用では、時間遅延補償後に、このマイクロホン信号は最適方法においてまだ一致していない。いくつかのマイクロホンは、異なるチャンネルにおける位相および振幅に関して一致し得ないが、それは、所望の方向から外れた話し手の動きおよびエコーがかかる部屋の音響(例えば、境界反射のような)が理想的でない条件を引き起こすからである。
【0084】
適応するセルフキャリブレーションユニット26によって、異なるチャンネルの不一致は最小化される。これは、位相および振幅に対してなされる。次いで、各チャンネルにおける所望の信号は時刻歴信号であり得、ほぼ同じ周波数特性を有し得る。
【0085】
適応するセルフキャリブレーションのための1つの効果的な方法は次の通りである。このセルフキャリブレーションフィルターHC,m(n,k)は、以下に示す各チャンネルにおける信号の一致を達成する。
【0086】
【数9】

ここで、EC,m(n,k)は誤差信号を示す。(複素数の)フィルターHC,m(n,k)は、
誤差信号のパワーε{|NC,m(n,k)|}を最小化することを目的とするNLMSアルゴリズムにより再度適応され得る。
【0087】
【数10】

次いで、このフィルターは再計測されて、唯一の手段応答を得る。
【0088】
【数11】

図2に示される実施形態による前処理手段は、適応するようにセルフキャリブレートされた信号XC,Mを出力し、この信号は、第1の処理手段(下側の処理経路)および第2の処理手段(上側の処理経路)によって、詳細には本発明の実施形態による、ブロッキングマトリクス22および適応するビームフォーマー24によって、さらに処理される。
【0089】
ブロッキングマトリクス22は、非適応または適応するものであり得る。この入力信号は前に、適応してセルフキャリブレートされるので、実際の適用に基づいて、非適応のマトリクスは、十分正確なノイズ参照信号を生成し得るとみなされ得る。
【0090】
音声信号がバックグラウンドノイズ上で十分なエネルギーを有し、適応するセルフキャリブレーションユニット26が適用される場合には、その適応のみ達成され得る。
【0091】
図3は、ノイズ低減による音声信号処理のための本発明の方法に記載の選択されたステップの機能を示す。少なくとも2つのマイクロホンが口頭発声を検出する(31)。ステップ33において、マイクロホン出力が生成され、次いで、この出力は、例えば、高速フーリエ変換(例えば、毎秒128点の変換)によりマイクロホン出力32を通すことにより周波数領域において処理される。次のステップにおいては、時間遅延補償が周波数領域34において達成される。このステップは、マイクロホン信号を前処理する間においては最終ステップであり得る。
【0092】
時間遅延補償後の多くの適用としては、マイクロホン信号は十分に一致しない。それゆえ、信号を適応的にセルフキャリブレートする(35)ことによって、多重チャンネルの不一致を最小化することは有利な点であり、その後、キャリブレートされた信号を前処理するステップは、所望の信号に関して位相整列され、所望信号部分の振幅は、各多重チャンネルにおいて等しい。
【0093】
ノイズ部分のレベルはまだ概して、他の各チャンネルとは異なる。キャリブレートされた信号はさらに、適応するビームフォーマーによって処理され、最大のSNRを有するビームフォームされた信号を得る。このためには、重み付きの係数(重み)A(n)が計算される必要があり(36)、前処理された異なる入力信号の重み付きの和をとる。従来の遅延和ビームフォーマーと異なり、この計算は、本発明の方法に従って、時間依存で達成される。
【0094】
計算された重み付きの係数A(n)により、適応するビームフォーマー出力信号Y(N,k)が決定される(37)。この信号は、適応するノイズキャンセリング手段によってノイズ部分を減算することによりさらに処理され得、このノイズキャンセリング手段は、異なるチャンネルに対するノイズ参照信号に基づいて働き、このノイズ参照信号はブロッキングマトリクス(示されてない)により得られる。結果的に、生じた信号は高速逆フーリエ変換により時間領域に戻るように変換される。
【0095】
先に議論されたすべての実施形態は限定として意図されるのではなく、本発明の特徴および利点を示す例示として示される。上記されたいくつかまたはすべての特徴は異なる方法で結合されることが理解される。
【図面の簡単な説明】
【0096】
【図1】本発明による音声信号処理手段の一実施形態を示し、この手段は、適応するビームフォーマー、時間遅延補償を達成するように構成される手段、ブロックマトリクスおよび適応するノイズキャンセリング手段を備える。
【図2】図1において示されるものと同様な音声信号処理手段の他の実施形態を示すが、さらに、適応するセルフキャリブレーション手段を備える。
【図3】ノイズ低減による音声信号処理のための本発明の方法の選択されたステップを示す。
【符号の説明】
【0097】
11、21 時間遅延補償
12、22 ブロッキングマトリクス
13、23 適応ノイズキャンセラ
14、24 重み付き和ビームフォーマー
15、25 適応制御
26 セルフキャリブレーティングユニット

【特許請求の範囲】
【請求項1】
ノイズ低減による音声信号処理のためのシステムであって、
マイクロホン信号を検出するために少なくとも2つのマイクロホンを有するマイクロホンアレイと、
前処理信号を得るために該マイクロホン信号の時間遅延補償を達成するように構成される手段を有し、マイクロホン信号を受信するために該マイクロホンアレイに接続される前処理手段と、
少なくとも1つのノイズ参照信号、特に、各マイクロホン信号に対して1つのノイズ参照信号を生成するように構成される手段を有し、該前処理信号を受信するために該前処理手段に接続される第1の信号処理手段と、
ビームフォームされた信号を得るために適応するビームフォーマーを有し、該前処理信号を受信するための該前処理手段に接続される第2の信号処理手段と、
該少なくとも1つのノイズ参照信号に基づいて、該ビームフォームされた信号のノイズを低減するように構成される適応するノイズキャンセリング手段と
を備える、システム。
【請求項2】
前記少なくとも1つのノイズ参照信号を生成するように構成される手段が、非適応のブロッキングマトリクスまたは適応のブロッキングマトリクスを備える、請求項1に記載のシステム。
【請求項3】
前記前処理手段が、時間遅延補償されたマイクロホン信号の位相および振幅を一致するように構成される適応するセルフキャリブレーション手段をさらに備える、請求項1から請求項2のいずれか1項に記載のシステム。
【請求項4】
前記適応処理手段、特に、前記適応ビームフォーマーおよび前記適応ノイズキャンセリング手段の適応を制御するように構成される適応する制御手段をさらに備える、請求項1から請求項3のいずれか1項に記載のシステム。
【請求項5】
第2の適応処理手段の適応に依存する第1の適応処理手段の適応を開始するように前記適応制御手段が構成され、該第1の適応処理手段および該第2の適応処理手段が前記適応ビームフォーマー、前記適応ブロッキングマトリクスおよび前記適応ノイズキャンセリング手段のうちの1つである、請求項4に記載のシステム。
【請求項6】
前記適応制御手段が、瞬時のSNR、および/または音声が検出されるかどうか、および/または検出された音声信号のエネルギーが一定の規定値で同時に検出されたバックグラウンドノイズのエネルギーを超過するかどうか、および/または音響信号が到来する方向、に依存して適応を開始するように構成される、請求項4または請求項5に記載のシステム。
【請求項7】
前記前処理手段および/または前記第の1処理手段および/または前記第2の処理手段が、時間領域または周波数領域またはサブバンド周波数領域で、処理を達成するように構成される、請求項1から請求項6のいずれか1項に記載のシステム。
【請求項8】
前記マイクロホンアレイが、少なくとも1つの指向性マイクロホン、詳しくは、異なる方向を向く1より多い指向性マイクロホンを備える、請求項1から請求項7のいずれか1項に記載のシステム。
【請求項9】
前記マイクロホンアレイが少なくとも2つのサブアレイを備える、請求項1から請求項8のいずれか1項に記載のシステム。
【請求項10】
フレームをさらに備え、前記マイクロホンアレイが、該フレーム中または該フレーム上に、所定の、特に、定位置に配置される、請求項1から請求項9のいずれか1項に記載のシステム。
【請求項11】
請求項1から請求項10のいずれか1項に記載のノイズ低減による音声信号処理のためのシステムを備えるハンズフリーシステム。
【請求項12】
ノイズ低減による音声信号を処理するための方法であって、
少なくとも2つのマイクロホンを備えるマイクロホンアレイによってマイクロホン信号を検出することと、
該マイクロホン信号を前処理することであって、該前処理することが、前処理信号を得るために該マイクロホン信号の時間遅延補償を包含することと、
第1の信号処理のためのおよび第2の信号処理のための入力信号として該前処理信号を使用することであって、該第1の信号処理が少なくとも1つのノイズ参照信号を生成することを含み、該第2の信号処理がビームフォームされた信号を得るために、適応するビームフォーミングをすることを含む、ことと、
適応するノイズキャンセリング手段を使用して、該ノイズ参照信号に基づいてビームフォームされた信号のノイズを低減すること
を包含する、方法。
【請求項13】
前記少なくとも1つのノイズ参照信号が、非適応のブロッキングマトリクスまたは適応のブロッキングマトリクスを使用して生成される、請求項12に記載の方法。
【請求項14】
前記マイクロホン信号を前処理することが、これらの信号の位相および振幅を一致させるために、前記時間遅延補償された信号を適応セルフキャリブレーションすることをさらに包含する、請求項12または請求項13に記載の方法。
【請求項15】
適応処理ステップ、特に、前記適応ビームフォーミングおよび前記適応ノイズキャンセリングの適応を制御することをさらに包含する、請求項12から請求項14のいずれか1項に記載の方法。
【請求項16】
前記制御することが、第2の適応処理手段の適応に依存する第1の適応処理手段を適応することを包含し、該第1の適応処理手段および該第2の適応処理手段が、前記適応ビームフォーマー、前記適応ブロッキングマトリクス、および前記適応ノイズキャンセリング手段のうちの1つである、請求項15に記載の方法。
【請求項17】
前記適応が、瞬時のSNR、および/または音声が検出されるかどうか、および/または検出された音声信号のエネルギーが一定の規定値で同時に検出されたバックグラウンドノイズのエネルギーを超過するかどうか、および/または音響信号が到来する方向、に依存して制御される、請求項12から請求項16のいずれか1項に記載の方法。
【請求項18】
前記前処理手段および/または前記第1の処理手段および/または前記第2の処理手段が、時間領域または周波数領域またはサブバンド周波数領域において、処理を達成する、請求項12から請求項17のいずれか1項に記載のシステム。
【請求項19】
請求項12から請求項18のいずれか1項に記載の方法のステップを達成するためのコンピュータ実行可能な命令を有する1以上のコンピュータ読み取り可能な媒体を備える、コンピュータプログラム製品。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate