説明

電子的信号からノイズを除去するための方法および装置

【課題】人間のスピーチからの音響ノイズの除去のための方法およびシステムを提供し、これにおいては、ノイズのタイプ、大きさあるいは方位に無関係にノイズを除去してその信号を復元する。
【解決手段】 本システムは、プロセッサに結合したマイクロホンおよびセンサを備える。マイクロホンは、音響信号を受け、そしてVADは、スピーチ(有声および無声の両方)が生起しているとき二進1であり、そしてスピーチの不在時に二進0の信号を供給する。プロセッサは、デノイズ処理アルゴリズムを備え、これは、伝達関数を発生する。これら伝達関数は、指定された時間の間受けた音響信号に発声情報が存在しないとの判定に応答して発生する伝達関数を含む。また、それら伝達関数は、指定された時間の間その音響信号に発声情報が存在するとの判定に応答して発生する伝達関数を含む。少なくとも1つのデノイズ処理した音響データ・ストリームは、それら伝達関数を使用して発生する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音響的な伝送または録音から望ましくない音響ノイズを除去あるいは抑制するための数学的方法並びに電子的システムに関するものである。
【背景技術】
【0002】
代表的な音響用途においては、人間のユーザからのスピーチは、録音されるかあるいは格納されそして様々な場所にいる受け手に送信される。
【発明の概要】
【発明が解決しようとする課題】
【0003】
そのユーザの環境においては、問題とする信号(ユーザのスピーチ)を、望まない音響ノイズで汚染する1つまたはこれより多いノイズ・ソースが存在することがある。これは、受け手が人であろうと機械であろうと、その受け手がユーザのスピーチを理解するのを困難にしたりあるいは不可能にしたりする。このことは、特に、セルラ電話およびパーソナル・デジタル・アシスタントのようなポータブル通信デバイスの普及と共に、現在特に問題となっている。これらノイズ付加物を抑制する既存の方法があるが、これらは、いずれも、長過ぎる計算時間あるいは嵩張るハードウェアを必要としたり、問題の信号を歪ませ過ぎたり、あるいは有用な性能に欠けたりするものである。これら方法の多くは、ヴァセギ(Vaseghi)による“先進のデジタル信号処理およびノイズ低減(Advanced Digital Signal Processing and Noise Reduction)”(ISBN 0-471-62692-9)の教本に記載されている。結果として、代表的なシステムの上記欠点に対処しそして歪みなしで問題の音響信号をクリーンにする新たな技術を提供するノイズ除去および低減法に対するニーズがあることになる。
【課題を解決するための手段】
【0004】
人間のスピーチからの音響ノイズの除去のための方法およびシステムを提供し、これにおいては、ノイズ・タイプ、大きさあるいは方位に無関係にノイズを除去してその信号を復元する。本システムは、プロセッサに結合したマイクロホンおよびセンサを備える。マイクロホンは、ノイズと人間の信号ソースからのスピーチ信号の両方を含む音響信号を受ける。センサは、二進の発声活動検出(VAD)を発生し、これは、スピーチ(有声および無声の両方)が生起しているとき二進“1”であり、そしてスピーチが生起していないとき二進“0”の信号を供給する。このVAD信号は、種々の方法、例えば音響利得、加速度計、および無線周波(RF)センサを使用して得ることができる。
【0005】
このプロセッサ・システムおよび方法は、デノイズ処理アルゴリズム(denoizing algorithm)を備え、これは、ノイズ・ソースとマイクロホンとの間の伝達関数、並びに人間のユーザとマイクロホンとの間の伝達関数を計算する。これら伝達関数を使用することにより、受けた音響信号からノイズを除去して、少なくとも1つのデノイズ処理した音響データ・ストリームを発生する。
【図面の簡単な説明】
【0006】
【図1】図1は、1実施形態のデノイズ・システムのブロック図。
【図2】図2は、単一のノイズ・ソースとマイクロホンへの直接経路を想定したときの、1実施形態のノイズ除去アルゴリズムのブロック図。
【図3】図3は、n個の区別できるノイズ・ソース(これらノイズ・ソースは、互いに他のものの反射またはエコーであることもある)に一般化した、1実施形態のノイズ除去アルゴリズムのフロントエンドのブロック図。
【図4】図4は、n個の区別できるノイズ・ソースと信号反射とがある最も一般的なケースにおける、1実施形態のノイズ除去アルゴリズムのフロントエンドのブロック図。
【図5】図5は、1実施形態のデノイズ方法のフロー図。
【図6】図6は、空港ターミナルのノイズ(他の多くの話しをする人および公共のアナウンスを含む)の存在下でのアメリカの英語を話す女性に対しての、1実施形態のノイズ抑制アルゴリズムの結果を示す。
【発明を実施するための形態】
【0007】
図1は、1実施形態のデノイズ処理システム(denoising system)のブロック図であって、このシステムは、発声活動に関する生理学的情報から得た、いつスピーチが生起しているかについての知識を使用する。本システムは、複数のマイクロホン10と複数のセンサ20とを備え、そしてこれらは、少なくとも1つのプロセッサ30へ信号を供給する。プロセッサは、デノイズ処理を行うサブシステムまたはアルゴリズムを備えている。
【0008】
図2は、単一のノイズ・ソースとマイクロホンへの直接経路を仮定したときの、1実施形態のノイズ除去システム/アルゴリズムのブロック図である。このノイズ除去システム図は、1実施形態のこのプロセスの図式記述を含み、単一の信号ソース(100)と、単一のノイズ・ソース(101)とがある。このアルゴリズムは、2つのマイクロホン、すなわち“信号”マイクロホン(MIC1,102)と、“ノイズ”マイクロホン(MIC2,103)とを使用する(但し、これに限定されるものではない)。MIC1は、大部分の信号といくらかのノイズを捕獲する一方で、MIC2は、大部分のノイズといくらかの信号とを捕獲すると仮定する。これは、従来の先進の音響システムと共通の構成である。MIC1への信号からのデータはs(n)で示し、MIC2への信号からのデータはs(n)で示し、MIC2へのノイズからのデータはn(n)で示し、MIC1へのノイズからのデータはn(n)で示している。同様に、MIC1からのデータはm(n)で、そしてMIC2からのデータはm(n)で示し、ここで、s(n)はソースからのアナログ信号の離散的なサンプルを示している。
【0009】
信号からMIC1への伝達関数およびノイズからMIC2への伝達関数は、1であると仮定するが、信号からMIC2への伝達関数はH(z)、ノイズからMIC1への伝達関数はH(z)で示す。1の伝達関数のこの仮定は、このアルゴリズムの一般性を妨げるものでなく、その理由は、信号とノイズとマイクロホンとの実際の関係が単に比率であり、そしてこの比率は、簡単のためこのようにして再定義されるからである。
【0010】
従来のノイズ除去システムにおいては、MIC2からの情報は、MIC1からのノイズを除去しようとする試みにおいて使用されている。しかし、語られていない仮定は、発声活動検出(VAD(Voice Activity Detection))が決して完全ではないことであり、したがってそのデノイズ処理は、ノイズと一緒に信号をもかなり除去してしまうことのないよう、注意深く実行しなければならない。しかし、このVADが完全であり、そしてこれが、スピーチが全くユーザによって発されていないときにゼロに等しく、そしてスピーチが発生されているときに1に等しいと仮定すると、このノイズ除去においてかなりの改善を行うことができる。
【0011】
マイクロホンへの単一のノイズ・ソースおよび直接経路の分析においては、図2において、MIC1へ入来する音響情報は、m(n)で示される。MIC2へ入来する情報は、同様にm(n)で示される。z(デジタル周波数)ドメインにおいては、これらは、M(z)およびM(z)として表される。このとき、
【0012】
【数1】

【0013】
ここで、
【0014】
【数2】

【0015】
したがって、以下となる。
【0016】
【数3】

【0017】
これは、2個のマイクロホン・システムの全てに対する一般的なケースである。実際のシステムでは、常に、MIC1へのノイズにいくらかの漏れと、MIC2への信号にいくらかの漏れとがある。式1には、未知数が4つで、既知の関係が2つしかないため、これを明快に解くことはできない。
【0018】
しかし、式1中の未知数のいくつかに対し解を与える別の方法がある。この分析は、信号が発生されていないケース、すなわちVAD信号がゼロに等しくかつスピーチが発生されていない場合を調べることから始まる。このケースでは、s(n)=S(z)=0であり、したがって式1は、以下となる。
【0019】
【数4】

【0020】
ここで、変数Mの下付文字nは、ノイズのみを受けていることを示す。これにより、以下となる。
【0021】
【数5】

【0022】
(z)は、本システムがノイズのみを受信していることが確かであれば、利用可能なシステム識別アルゴリズムおよびマイクロホン出力の任意のものを使用して計算することができる。この計算は、適応的に行うことができ、これにより、本システムは、そのノイズにおける変化に反応することができる。
【0023】
式1中の未知数のうちの1つに対し、解がこれで入手可能である。別の未知数、すなわちH(z)は、VADが1に等しくしかもスピーチが発生されている場合を使用することにより、決定することができる。その場合が発生しているが、マイクロホンの最近(おそらく、1秒未満)の履歴が低レベルのノイズを示している場合、n(s)=N(z)〜0とみなすことができる。このとき、式1は、以下となる。
【0024】
【数6】

【0025】
これはさらに、以下となる。
【0026】
【数7】

【0027】
これは、H(z)の逆である。しかし、分かるように、異なった入力を使用している、すなわち、これでは、信号のみが発生しており、そしてこれに対し、以前では、ノイズのみが発生していた。H(z)の計算の間、H(z)に対し計算した値は、一定に保持し、そして逆の場合もそうである。したがって、H(z)およびH(z)は、その他方を計算している間は実質上変化しない、と仮定する。
【0028】
(z)およびH(z)を計算した後、これらは、信号からノイズを除去するのに使用する。もし、式1を以下にように書き直すと、
【0029】
【数8】

【0030】
このとき、N(z)は、S(z)を解くために、示したように以下のように置換することができる。
【0031】
【数9】

【0032】
もし、伝達関数H(z)およびH(z)が十分な正確さで記述することができる場合、このときには、ノイズを完全に除去することができ、そして元の信号を復元することができる。このことは、ノイズの大きさまたはスペクトル特性に無関係に当てはまる。行った仮定は、完全なVAD、十分に正確なH(z)およびH(z)と、H(z)およびH(z)がその他方を計算しているときに実質上変化しない、ということのみである。実際、これら仮定は、妥当なものであると判明した。
【0033】
記述したこのノイズ除去アルゴリズムは、任意の数のノイズ・ソースを含むように容易に一般化できる。図3は、n個の区別できるノイズ・ソースに対し一般化した、1実施形態のノイズ除去アルゴリズムのフロントエンドのブロック図である。これら区別できるノイズ・ソースは、互いの他の反射またはエコーであるとすることができる(但し、これに限定されるものではない)。図示したように、いくつかのノイズ・ソースがあり、その各々は、各マイクロホンに対し伝達関数または経路を有している。先に名称を付与した経路Hは、Hとしてラベルを付与しており、これにより、MIC1へのノイズ・ソース2の経路にラベルを付与することは、より都合よくなる。各マイクロホンの出力は、zドメインに変換したときには、以下となる。
【0034】
【数10】

【0035】
信号が全くないとき(VAD=0)、このとき(簡単のためzを抑制する)、以下となる。
【0036】
【数11】

【0037】
これにより、上記のH(z)と同じように、新たな伝達関数を定義することができる。
【0038】
【数12】

【0039】
したがって、H~は、ノイズ・ソースとそれらの各々の伝達関数にのみ依存し、したがって伝送されている信号がないどのような時にも計算することができる。もう一度繰り返すと、マイクロホン入力の下付文字nは、ノイズが検出されていることのみを示し、その一方で、下付文字sは、信号のみをマイクロホンが受信していることを示している。
【0040】
ノイズが全く発生されていないと仮定している間において、式4を調べると、以下となる。
【0041】
【数13】

【0042】
したがって、Hは、任意の利用可能な伝達関数計算アルゴリズムを使って、前と同じように解くことができる。数学的には、以下となる。
【0043】
【数14】

【0044】
式6で定義したH~を使って、式4を書き直すと、以下となる。
【0045】
【数15】

【0046】
Sに関し解くと、以下となる。
【0047】
【数16】

【0048】
これは、式3と同じとなり、ここで、HがHに取って代わり、H~がHに取って代わっている。したがって、このノイズ除去アルゴリズムは、依然として、ノイズ・ソースの多数のエコーを含む任意の数のノイズ・ソースに対し、数学的に有効である。再び、HとH~を十分に高い正確さで推定することができ、そして信号からマイクロホンに対しての経路が1つのみであるという仮定が保たれる場合、ノイズは、完全に除去することができる。
【0049】
最も一般的なケースは、多数のノイズ・ソースと多数の信号ソースが関係する場合である。図4は、n個の区別できるノイズ・ソースおよび信号反射とがある最も一般的なケースにおける、1実施形態のノイズ除去アルゴリズムのフロントエンドのブロック図である。ここで、信号の反射は、両方のマイクロホンに入る。これは、最も一般的なケースであるが、それは、マイクロホンへのノイズ・ソースの反射が、単純な追加のノイズ・ソースとして正確にモデル化できるからである。簡単のため、信号からMIC2への直接経路は、H(z)からH00(z)に変えてあり、そしてマイクロホン1および2へのその反射経路は、それぞれ、H01(z)およびH02(z)として示している。
【0050】
これにより、マイクロホンへの入力は、以下となる。
【0051】
【数17】

【0052】
VAD=0のとき、それら入力は、以下となる(zを再び抑制する)。
【0053】
【数18】

【0054】
これは、式5と同じである。したがって、式6におけるH~の計算は、予期した通り、変化しない。ノイズがないこの状況を検討すると、式9は、以下となる。
【0055】
【数19】

【0056】
これは、H~の定義となる。
【0057】
【数20】

【0058】
再び、(式7におけるのと同じように)H~に対する定義を使用して式9を書き直すと、以下となる。
【0059】
【数21】

【0060】
いくらかの代数的操作により、以下のようになる。
【0061】
【数22】

【0062】
最後には、以下となる。
【0063】
【数23】

【0064】
式12は、式8と同じであるが、但し、HがH~で置き換わっており、また、(1+H01)の要素が左辺に追加されている。この余分な要素は、Sがこの状況では直接解くことができないということを意味しているが、解は、信号にそのエコーの全ての追加に対し生成することができる。このことは、それほど悪い状況ではないが、それは、エコー抑制を取り扱う多くの従来の方法があるからであり、そしてこれらエコーが抑制されない場合でも、それらがスピーチの理解度に意味のある程度にまで影響を与えることは起きそうにない。H~のより複雑な計算は、マイクロホン2における信号エコーを考慮する必要がある。
【0065】
図5は、1実施形態のデノイズ処理方法のフロー図である。動作を説明すると、音響信号を受ける(502)。さらに、人の発声活動に関連する生理学的情報を受ける(504)。音響信号からの発声情報が少なくとも1つの指定した時間の間存在しないと判定したときに、音響信号を表す第1の伝達関数を計算する(506)。音響信号を表す第2の伝達関数は、この音響信号において発声情報が少なくとも1つの指定した時間の間存在すると判定したときに、計算する(508)。この音響信号からのノイズの除去は、第1伝達関数と第2伝達関数の少なくとも1つの組み合わせを使用して行い、これによりデノイズ処理した音響データ・ストリームを発生する(510)。
【0066】
ノイズ除去のためのアルゴリズム、すなわちデノイズ処理アルゴリズムは、直接経路をもつ単一のノイズ・ソースの最も単純なケースから、反射およびエコーをもつ多数のノイズ・ソースまでここに記述した。このアルゴリズムは、どのような環境条件下においても実行可能であることを示した。ノイズのタイプおよび量は、H~およびH~について良好な推定を行った場合で、しかもそれらが他方の計算中に実質上変化しない場合には、重要ではない。ユーザ環境が、エコーが存在するようなものである場合、それらは、ノイズ・ソースから来たものである場合には、補償を行うことができる。もし、信号エコーも存在する場合、それらは、クリーンにした信号に影響を与えるが、その影響は、ほとんどの環境においては、無視できる程度のものである。
【0067】
動作について説明すると、1実施形態のアルゴリズムは、様々なノイズのタイプ、大きさ、方位の取り扱いにおいて、優れた結果を示した。しかし、数学的概念からエンジニアリング用途へ移行するときには、常に近似および調節を行わなければならない。式3では、1つの仮定を行っており、これでは、H(z)は小さく、したがってH(z)H(z)≒0と仮定し、このため、式3は、以下のようになる。
【0068】
【数24】

【0069】
このことは、H(z)のみ計算しなければならないことを意味し、これにより、本プロセスをスピードアップし、そして必要な計算数をかなり減少させる。マイクロホンを適切に選択すれば、この近似は容易に実現することができる。
【0070】
もう1つの近似は、1実施形態において使用するフィルタに関係する。実際のH(z)は、疑いなく、極とゼロの両方を有することになるが、しかし、安定性および簡単さのためには、全ゼロの有限インパルス応答(FIR)フィルタを使用する。十分なタップ(およそ60)では、実際のH(z)に対する近似は、非常に良好となる。
【0071】
サブバンド選択に関しては、伝達関数を計算しなければならない周波数範囲が広くなるにつれて、それを正確に計算することがより難しくなる。したがって、音響データは、16個のサブバンドに分割し、そして最も低い周波数を50Hz、最も高いものを3700とした。次に、本デノイズ処理アルゴリズムを各サブバンドに順番に適用し、そしてこの16個のデノイズ処理したデータ・ストリームを組み合わせることによって、デノイズ処理した音響データを発生した。これは、非常にうまく機能するが、サブバンドのどのような組み合わせ(すなわち、4,6,8,32個の等しく離間させ、知覚できる程離間させたもの)も使用でき、そしてこれは、同様に機能することが分かった。
【0072】
ノイズの大きさは、1実施形態においては抑制することにより、使用したマイクロホンが飽和(すなわち、線形応答領域外での動作)しないようにした。重要なことは、マイクロホンが線形に動作することによって、最良の性能を確保することである。この抑制を伴う場合でも、非常に高い信号対雑音比(SNR)のテストを行うことができた(約−10dBまで)。
【0073】
(z)の計算は、最小二乗平均法(LMS)、一般的な適応性伝達関数を使用して、10ミリ秒毎に実行した。この説明は、Prentice-Hall発行のWidrowおよびStearnsによる“適応性信号処理(Adaptive Signal Processing)”(1985),ISBN0-13-004029-0に見ることができる。
【0074】
1実施形態に対するVADは、無線周波数センサおよび2つのマイクロホンから得て、これにより、有声のスピーチおよび無声のスピーチの両方に対し、非常に高い正確さ(>99%)を発生した。1実施形態に対するこのVADは、無線周波数(RF)干渉計を使用して、人のスピーチ発生に関係する組織運動を検出する(但しこれに限定されるものではない)。したがって、これは、完全に音響ノイズなしであり、このため、どのような音響ノイズ環境においても機能することができる。簡単なエネルギ測定を使用することにより、有声スピーチが生起しているかどうかを判定することができる。無声スピーチは、有声部分への近さにより、または上記の組み合わせによって、従来の周波数ベースの方法を使用して判定することができる。無声スピーチには、それほど多くのエネルギがないため、その活性化の正確さは、有声スピーチ程には重要でない。
【0075】
有声スピーチおよび無声スピーチを信頼性良く検出することにより、1実施形態のアルゴリズムを実現することができる。ここで再び、ノイズ除去アルゴリズムは、VADを得る方法に依存しないこと、これは有声スピーチに対しては特に正確であることのみを繰り返すことは有益である。もしスピーチが検出されずしかもトレーニングがそのスピーチに対して起きる場合、その後続のデノイズ処理された音響データは、歪むことがある。
【0076】
データは、4つのチャンネルで、すなわち、MIC1に対して1つ、MIC2に対して1つ、有声スピーチに関連する組織運動を検出する無線周波数センサに対して2つで、収集した。このデータは、40KHzで同時にサンプリングし、そして次に、デジタル的にフィルタしそして8KHzにデシメートした。この高いサンプリング・レートを使用することによって、このアナログ−デジタル・プロセスから生じることのあるどのようなエリアシングも低減するようにした。4チャンネルのナショナル・インスツルメンツのA/Dボード(National Instruments A/D board)を、Labviewと共に使用して、上記データをキャプチャし格納した。このデータは、次にCプログラムに読み込み、そして一時に10ミリ秒デノイズ処理した。
【0077】
図6は、空港ターミナルのノイズ(他の多くの話しをする人および公共のアナウンスを含む)の存在下でのアメリカの英語を話す女性に対しての、1実施形態のノイズ抑制アルゴリズムの結果を示している。この話し手は、中位の空港ターミナル・ノイズの真っ只中で、番号406−5562を発している。汚れた音響データは、一時に10ミリ秒デノイズ処理し、そしてデータの10ミリ秒のデノイズ処理の前に50〜3700Hzにプレフィルタ処理した。およそ17dBのノイズ低減が明かとなった。このサンプルには、ポストフィルタ処理は行わなかったため、実現したノイズ低減は全て、1実施形態のこのアルゴリズムに起因するものである。本アルゴリズムは、ノイズに瞬時に適応し、したがって他の人の話者の非常に困難なノイズを除去する能力がある。多くの異なったタイプのノイズ(ほんのいくつかを挙げると、ストリートのノイズ、ヘリコプター、音楽、正弦波)は、その全てをテストしたが、同様の結果となった。また、ノイズの方位は、ノイズ抑制性能を有意に変化させずとも、実質的に変化させることができる。最後に、クリーンにしたスピーチの歪みは、非常に低く、スピーチ認識エンジン並びに人間の受け手に対しても同様に、良好な性能を確保する。
【0078】
1実施形態のノイズ除去アルゴリズムは、どのような環境条件の下でも実行可能であることを示した。ノイズのタイプおよび量は、H~およびH~について良好な推定が行われた場合には、取るに足りない。もしユーザ環境が、エコーが存在するようなものである場合、これらがノイズ・ソースから来たものである場合にはそれを補償することができる。もし信号エコーも存在する場合、これらは、クリーンにした信号に影響を与えるが、その影響は、ほとんどの環境においては無視できるものである。
【0079】
各種の実施形態について、図面を参照して説明したが、詳細な説明および図面は、限定を意図するものではない。記述した要素の種々の組み合わせについて示さなかったが、これらは、冒頭の特許請求の範囲に記載の本発明の範囲内にあるものである。

【特許請求の範囲】
【請求項1】
音響信号からノイズを除去するノイズ除去方法であって、
複数の音響信号を受けるステップと、
人間の発声活動に関連した生理学的情報を受けるステップと、
少なくとも1つの指定された時間の間前記複数の音響信号に発声情報が存在しないと判定したときに、前記複数の音響信号を表す少なくとも1つの第1の伝達関数を発生するステップと、
少なくとも1つの指定された時間の間前記複数の音響信号に発声情報が存在すると判定したときに、前記複数の音響信号を表す少なくとも1つの第2の伝達関数を発生するステップと、
前記少なくとも1つの第1の伝達関数と前記少なくとも1つの第2の伝達関数との少なくとも1つの組み合わせを使用することにより、前記複数の音響信号からノイズを除去して、少なくとも1つのデノイズ処理した音響データ・ストリームを発生するステップと、
から成るノイズ除去方法。
【請求項2】
請求項1記載の方法において、前記複数の音響信号は、少なくとも1つの関連するノイズ・ソース信号の少なくとも1つの反射と、少なくとも1つの音響ソース信号の少なくとも1つの反射とを含むこと、を特徴とするノイズ除去方法。
【請求項3】
請求項1記載の方法において、生理学的情報を受けるステップは、無線周波デバイス、電気グロットグラフ、超音波デバイス、音響喉当てマイクロホン、空気流検出器から成るグループから選択した少なくとも1つの検出器を使用することによって、人間の発声に関連する生理学的データを受けること、を含むことを特徴とするノイズ除去方法。
【請求項4】
請求項1記載の方法において、複数の音響信号を受けるステップは、複数の独立に位置付けたマイクロホンを使用して受けること、を含むことを特徴とするノイズ除去方法。
【請求項5】
請求項1記載の方法において、ノイズを除去するステップは、さらに、前記少なくとも1つの第1伝達関数と前記少なくとも1つの第2伝達関数とを使用して少なくとも1つの第3の伝達関数を発生すること、を含むことを特徴とするノイズ除去方法。
【請求項6】
請求項1記載の方法において、前記少なくとも1つの第1伝達関数の発生は、少なくとも1つの予め指定したインターバルの間において、前記少なくとも1つの第1伝達関数を再計算すること、を含むことを特徴とするノイズ除去方法。
【請求項7】
請求項1記載の方法において、前記少なくとも1つの第2伝達関数の発生は、少なくとも1つの予め指定したインターバルの間において、前記少なくとも1つの第2伝達関数を再計算すること、を含むことを特徴とするノイズ除去方法。
【請求項8】
請求項1記載の方法において、前記少なくとも1つの第1伝達関数と前記少なくとも1つの第2伝達関数の発生は、適応形技術と再帰的技術とから成るグループから選択した少なくとも1つの技術の使用を含むこと、を特徴とするノイズ除去方法。
【請求項9】
電子的信号からノイズを除去するノイズ除去方法であって、
少なくとも1つの時間の間において発声情報の不在を検出するステップと、
前記少なくとも1つの時間の間において、少なくとも1つのノイズ・ソース信号を受けるステップと、
前記少なくとも1つのノイズ・ソース信号を表す少なくとも1つの伝達関数を発生するステップと、
音響信号とノイズ信号とを含む少なくとも1つの複合信号を受けるステップと、
前記少なくとも1つの複合信号から、前記少なくとも1つの伝達関数を使用して前記ノイズ信号を除去することにより、少なくとも1つのデノイズ処理された音響データ・ストリームを発生するステップと、
から成るノイズ除去方法。
【請求項10】
請求項9記載の方法において、前記少なくとも1つのノイズ・ソース信号は、少なくとも1つの関連するノイズ・ソース信号の少なくとも1つの反射を含むこと、を特徴とするノイズ除去方法。
【請求項11】
請求項9記載の方法において、前記少なくとも1つの複合信号は、少なくとも1つの関連する複合信号の少なくとも1つの反射を含むこと、を特徴とするノイズ除去方法。
【請求項12】
請求項9記載の方法において、検出することは、無線周波デバイス、電気グロットグラフ、超音波デバイス、音響喉当てマイクロホン、空気流検出器から成るグループから選択した少なくとも1つの検出器を使用することによって、人間の発声に関連する生理学的データを収集すること、を含むことを特徴とするノイズ除去方法。
【請求項13】
請求項9記載の方法において、受けることは、少なくとも1つのマイクロホンを使用して前記少なくとも1つのノイズ・ソース信号を受けること、を含むことを特徴とするノイズ除去方法。
【請求項14】
請求項13記載の方法において、前記少なくとも1つのマイクロホンは、複数の独立に位置付けたマイクロホンを含むこと、を特徴とするノイズ除去方法。
【請求項15】
請求項9記載の方法において、前記少なくとも1つの複合信号から前記少なくとも1つの伝達関数を使用して前記ノイズ信号を除去することは、前記少なくとも1つの伝達関数を使用して少なくとも1つの他の伝達関数を発生すること、を含むことを特徴とするノイズ除去方法。
【請求項16】
請求項9記載の方法において、少なくとも1つの伝達関数を発生することは、少なくとも1つの予め指定したインターバルの間において前記少なくとも1つの伝達関数を再計算すること、を含むことを特徴とするノイズ除去方法。
【請求項17】
請求項9記載の方法において、少なくとも1つの伝達関数を発生することは、適応形技術と再帰的技術とから成るグループから選択した少なくとも1つの技術の使用して、前記少なくとも1つの伝達関数を計算すること、を含むことを特徴とするノイズ除去方法。
【請求項18】
電子的信号からノイズを除去するノイズ除去方法であって、
有声情報がその間において不在である少なくとも1つの無発声時間を判定するステップと、
前記少なくとも1つの無発声時間の間において少なくとも1つのノイズ信号入力を受け、そして前記少なくとも1つのノイズ信号を表す少なくとも1つの無発声伝達関数を発生するステップと、
有声情報がその間において存在する少なくとも1つの発声時間を判定するステップと、
前記少なくとも1つの発声時間に間において少なくとも1つの信号検知デバイスから少なくとも1つの音響信号入力を受け、そして前記少なくとも1つの音響信号を表す少なくとも1つの発声伝達関数を発生するステップと、
音響信号およびノイズ信号を含む少なくとも1つの複合信号を受けるステップと、
前記少なくとも1つの無発声伝達関数と前記少なくとも1つの発声伝達関数の少なくとも1つの組み合わせを使用して、前記少なくとも1つの複合信号から前記ノイズ信号を除去することにより、少なくとも1つのデノイズ処理した音響データ・ストリームを発生するステップと、
から成るノイズ除去方法。
【請求項19】
音響信号からノイズを除去するためのノイズ除去システムであって、
少なくとも1つの音響信号を受ける少なくとも1つの受信器と、
人間の発声活動に関連する生理学的情報を受ける少なくとも1つのセンサと、
前記少なくとも1つの受信器と、複数の伝達関数を発生する前記少なくとも1つのセンサとの間に結合した少なくとも1つのプロセッサであって、前記少なくとも1つの音響信号を表す少なくとも1つの第1伝達関数は、発声情報が、少なくとも1つの指定された時間の間に前記少なくとも1つの音響信号に不在であるとの判定に応答して発生され、前記少なくとも1つの音響信号を表す少なくとも1つの第2伝達関数は、発声情報が、少なくとも1つの指定された時間の間に前記少なくとも1つの音響信号に存在しているとの判定に応答して発生され、前記少なくとも1つの第1伝達関数と前記少なくとも1つの第2伝達関数との少なくとも1つの組み合わせを使用して、前記少なくとも1つの音響信号からノイズを除去することにより、少なくとも1つのデノイズ処理した音響データ・ストリームを発生する、前記の少なくとも1つのプロセッサと、
から成るノイズ除去システム。
【請求項20】
請求項19記載のシステムにおいて、前記少なくとも1つのセンサは、人間のスピーチ発生に関連した組織運動を検出する少なくとも1つの無線周波(RF)干渉計を含むこと、を特徴とするノイズ除去システム。
【請求項21】
請求項19記載のシステムにおいて、前記少なくとも1つのセンサは、無線周波デバイス、電気グロットグラフ、超音波デバイス、音響喉当てマイクロホン、空気流検出器から成るグループから選択した少なくとも1つのセンサを含むこと、を特徴とするノイズ除去システム。
【請求項22】
請求項19記載のシステムであって、さらに、
前記少なくとも1つの音響信号の音響データを複数のサブバンドに分割し、
前記少なくとも1つの第1伝達関数と前記少なくとも1つの第2伝達関数の前記少なくとも1つの組み合わせを使用して、前記複数のサブバンドの各々からノイズを除去し、複数のデノイズ処理した音響データ・ストリームが発生され、
前記複数のデノイズ処理した音響データ・ストリームを組み合わせることによって、前記少なくとも1つのデノイズ処理した音響データ・ストリームを発生すること、
を含むこと、を特徴とするノイズ除去システム。
【請求項23】
請求項19記載のシステムにおいて、前記少なくとも1つの受信器は、複数の独立に位置付けたマイクロホンを含むこと、を特徴とするノイズ除去システム。
【請求項24】
音響信号からノイズを除去するためのノイズ除去システムであって、少なくとも1つのマイクロホンと少なくとも1つの発声センサとの間に結合した少なくとも1つのプロセッサとを備え、前記少なくとも1つの発声センサが、発声に関連した生理学的データを収集し、少なくとも1つの時間の間において前記少なくとも1つの発声センサを使用して有声情報の不在を検出し、前記少なくとも1つの時間において前記少なくとも1つのマイクロホンを使用して少なくとも1つのノイズ・ソース信号を受け、前記少なくとも1つのプロセッサが、前記少なくとも1つのノイズ・ソース信号を表す少なくとも1つの伝達関数を発生し、前記少なくとも1つのマイクロホンが、音響信号およびノイズ信号を含む少なくとも1つの複合信号を受け、前記少なくとも1つのプロセッサが、前記少なくとも1つの伝達関数を使用して前記少なくとも1つの複合信号から前記ノイズ信号を除去することにより、少なくとも1つのデノイズ処理した音響データ・ストリームを発生すること、を特徴とするノイズ除去システム。
【請求項25】
少なくとも1人のユーザと少なくとも1つの電子デバイスとの間に結合した信号処理システムであって、該信号処理システムが、音響信号からノイズを除去するための少なくとも1つのデノイズ処理サブシステムを含み、該デノイズ処理サブシステムが、少なくとも1つの受信器と少なくとも1つのセンサとの間に結合した少なくとも1つのプロセッサとを備え、前記少なくとも1つの受信器を、少なくとも1つの音響信号を受けるように結合し、前記少なくとも1つのセンサを、人間の発声活動に関連した生理学的情報を受けるように結合し、前記少なくとも1つのプロセッサが、複数の伝達関数を発生し、前記少なくとも1つの音響信号を表す少なくとも1つの第1伝達関数が、発声情報が、少なくとも1つの指定された時間の間に前記少なくとも1つの音響信号に不在であるとの判定に応答して発生され、前記少なくとも1つの音響信号を表す少なくとも1つの第2伝達関数は、発声情報が、少なくとも1つの指定された時間の間に前記少なくとも1つの音響信号に存在しているとの判定に応答して発生され、前記少なくとも1つの第1伝達関数と前記少なくとも1つの第2伝達関数との少なくとも1つの組み合わせを使用して、前記少なくとも1つの音響信号からノイズを除去することにより、少なくとも1つのデノイズ処理した音響データ・ストリームを発生すること、を特徴とする信号処理システム。
【請求項26】
請求項25記載のシステムにおいて、前記少なくとも1つの電子デバイスは、セルラ電話、パーソナル・デジタル・アシスタント、ポータブル通信デバイス、コンピュータ、ビデオ・カメラ、デジタル・カメラ、テレマチック・システムから成るグループから選択した少なくとも1つのデバイスを含むこと、を特徴とする信号処理システム。
【請求項27】
実行可能な命令を含むコンピュータ読み取り可能媒体であって、前記実行可能な命令が、処理システムにおいて実行されたときに、
少なくとも1つの音響信号を受け、
人間の発声活動に関連する生理学的情報を受け、
前記少なくとも1つの音響信号を表す少なくとも1つの第1伝達関数を、発声情報が、少なくとも1つの指定された時間の間に前記少なくとも1つの音響信号に不在であるとの判定に応答して発生し、
前記少なくとも1つの音響信号を表す少なくとも1つの第2伝達関数を、発声情報が、少なくとも1つの指定された時間の間に前記少なくとも1つの音響信号に存在しているとの判定に応答して発生し、
前記少なくとも1つの第1伝達関数と前記少なくとも1つの第2伝達関数との少なくとも1つの組み合わせを使用して、前記少なくとも1つの音響信号からノイズを除去することにより、少なくとも1つのデノイズ処理した音響データ・ストリームを発生すること、
により、受けた音響信号からノイズを除去すること、を特徴とするコンピュータ読み取り可能媒体。
【請求項28】
実行可能な命令を含む電磁的媒体であって、前記実行可能な命令が、処理システムにおいて実行されたときに、
少なくとも1つの音響信号を受け、
人間の発声活動に関連する生理学的情報を受け、
前記少なくとも1つの音響信号を表す少なくとも1つの第1伝達関数を、発声情報が、少なくとも1つの指定された時間の間に前記少なくとも1つの音響信号に不在であるとの判定に応答して発生し、
前記少なくとも1つの音響信号を表す少なくとも1つの第2伝達関数を、発声情報が、少なくとも1つの指定された時間の間に前記少なくとも1つの音響信号に存在しているとの判定に応答して発生し、
前記少なくとも1つの第1伝達関数と前記少なくとも1つの第2伝達関数との少なくとも1つの組み合わせを使用して、前記少なくとも1つの音響信号からノイズを除去することにより、少なくとも1つのデノイズ処理した音響データ・ストリームを発生すること、
により、受けた音響信号からノイズを除去すること、を特徴とする実行可能な命令を含む電磁的媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2011−203755(P2011−203755A)
【公開日】平成23年10月13日(2011.10.13)
【国際特許分類】
【外国語出願】
【出願番号】特願2011−139645(P2011−139645)
【出願日】平成23年6月23日(2011.6.23)
【分割の表示】特願2002−512971(P2002−512971)の分割
【原出願日】平成13年7月17日(2001.7.17)
【出願人】(503029522)
【Fターム(参考)】