高度に相関する混合のための強調ブラインド信号源分離アルゴリズム
【課題】高度に相関する信号混合の分離を改善するための、強調ブラインド信号源分離技法を提供する。
【解決手段】ビームフォーミングアルゴリズムは、相関する第1および第2の入力信号S1、S2を事前調整する。ビームフォーミングアルゴリズムは、他の方向からの信号を減衰させながら、第1の方向からの信号を増幅するために、第1の信号および第2の信号に空間フィルタ211を適用する。そのような指向性は、第1の信号中の所望のスピーチ信号を増幅し、第2の信号から所望のスピーチ信号を減衰する。次いで、ブラインド信号源分離210が、所望のスピーチ信号と周囲ノイズとを分離し、所望のスピーチ信号の推定値を再構成するために、ビームフォーマ出力信号に対して実行される。ビームフォーマおよび/またはブラインド信号源分離の動作を強調するために、1つまたは複数の段208、213、215において較正が実行される。
【解決手段】ビームフォーミングアルゴリズムは、相関する第1および第2の入力信号S1、S2を事前調整する。ビームフォーミングアルゴリズムは、他の方向からの信号を減衰させながら、第1の方向からの信号を増幅するために、第1の信号および第2の信号に空間フィルタ211を適用する。そのような指向性は、第1の信号中の所望のスピーチ信号を増幅し、第2の信号から所望のスピーチ信号を減衰する。次いで、ブラインド信号源分離210が、所望のスピーチ信号と周囲ノイズとを分離し、所望のスピーチ信号の推定値を再構成するために、ビームフォーマ出力信号に対して実行される。ビームフォーマおよび/またはブラインド信号源分離の動作を強調するために、1つまたは複数の段208、213、215において較正が実行される。
【発明の詳細な説明】
【技術分野】
【0001】
少なくとも1つの態様は、信号処理に関し、より詳細には、ブラインド信号源分離(blind source separation)(BSS)技法とともに使用される処理技法に関する。
【背景技術】
【0002】
いくつかのモバイル通信デバイスは、1つまたは複数の信号源からキャプチャされたサウンド信号および/またはオーディオ信号の品質を改善しようとして複数のマイクロホンを採用することができる。これらのオーディオ信号は、バックグラウンドノイズ、妨害、干渉、漏話および他の不要な信号でしばしば乱される。したがって、所望のオーディオ信号を強調するために、そのような通信デバイスは、一般に、複数のマイクロホンによってキャプチャされたオーディオ信号を処理するために、高度信号処理方法を使用する。このプロセスは、他の無関係な信号を抑制しながら、所望のオーディオ信号において改善されたサウンド/ボイス品質、低減されたバックグラウンドノイズなどを提供する信号強調としばしば呼ばれる。スピーチ通信では、所望の信号は通常スピーチ信号であり、信号強調はスピーチ強調と呼ばれる。
【0003】
ブラインド信号源分離(BSS)は信号強調のために使用されることができる。ブラインド信号源分離は、信号源信号の複数の独立した信号混合を使用して、独立した信号源信号を復元するために使用される技術である。各センサは異なる位置に配置され、各センサは、信号源信号の混合である信号を記録する。BSSアルゴリズムは、両方のセンサによって記録された共通情報の空間ダイバーシチを明示する信号差を利用することによって、信号を分離するために使用されることができる。スピーチ通信処理では、異なるセンサは、記録されているスピーチの信号源に対して異なる位置に配置されたマイクロホンを備えることができる。
【0004】
ビームフォーミングは、信号強調のための代替技術である。ビームフォーマは、異なる空間位置から生じる信号を分離するために、空間フィルタリングを実行する。他の方向からの信号は減衰するのに対し、ある方向からの信号は増幅される。したがって、ビームフォーミングは、所望の信号を強調するために、入力信号の指向性を使用する。
【0005】
ブラインド信号源分離とビームフォーミングの両方は、異なる位置に配置された複数のセンサを使用する。各センサは、信号源信号の異なる混合を記録またはキャプチャする。これらの混合は、信号源信号とセンサ(たとえば、マイクロホン)との間の空間的な関係を含む。信号強調を達成するために、この情報が利用される。
【0006】
間隔が密なマイクロホンを有する通信デバイスでは、マイクロホンからキャプチャされた入力信号は、マイクロホン同士が極めて近接しているために、高度に相関することがある。この場合、ブラインド信号源分離を含む従来のノイズ抑制方法は、ノイズから所望の信号をうまく分離することできないことがある。たとえば、デュアルマイクロホンシステムでは、BSSアルゴリズムは、混合入力信号を取り、所望のスピーチ信号と周囲ノイズとの推定値を含む2つの出力を生成することがある。しかしながら、信号分離の後、2つの出力信号のうちのどちらが所望のスピーチ信号であり、どちらが周囲ノイズであるかを判断することができないことがある。BSSアルゴリズムのこの固有の不確定性は、大きなパフォーマンス劣化を生じる。
【0007】
したがって、間隔が密なマイクロホンを有する通信デバイス上でのブラインド信号源分離のパフォーマンスを改善するための方法が必要である。
【発明の概要】
【0008】
高度に相関する信号混合のブラインド信号源分離のための方法が提供される。第1のマイクロホンに関連付けられた第1の入力信号が受信される。第2のマイクロホンに関連付けられた第2の入力信号も受信される。ビームフォーミング技法は、第1および第2の入力信号に指向性を与え、対応する第1および第2の出力信号を取得するために、第1および第2の入力信号に適用されることができる。ブラインド信号源分離(BSS)技法は、第1のBSS信号と第2のBSS信号とを生成するために、第1の出力信号と第2の出力信号とに適用されることができる。第1および第2の入力信号、第1および第2の出力信号、または第1および第2のBSS信号、のうちの少なくとも1つが較正されることができる。
【0009】
ビームフォーミング技法は、第1および第2の入力信号に空間フィルタを適用することによって第1および第2の入力信号に指向性を与えることができる。第1および第2の入力信号に空間フィルタを適用することは、他の方向からのサウンド信号を減衰させながら、第1の方向からのサウンド信号を増幅することができる。第1および第2の入力信号に空間フィルタを適用することは、得られた第1の出力信号中の所望のスピーチ信号を増幅することができ、第2の出力信号中の所望のスピーチ信号を減衰させる。
【0010】
一例では、第1および第2の入力信号のうちの少なくとも1つを較正することは、第2の入力信号に適応フィルタを適用することを備えることができる、ビームフォーミング技法を適用することは、第2の入力信号から第1の入力信号を減算することを含むことができる。ビームフォーミング技法を適用することは、フィルタ処理された第2の入力信号を第1の入力信号に加算することをさらに備えることができる。
【0011】
別の例では、第1および第2の入力信号のうちの少なくとも1つを較正することは、第1の入力信号と第2の入力信号とのエネルギー推定値の比に基づいて較正ファクタを生成することと、第1の入力信号または第2の入力信号のうちの少なくともいずれか1つに較正ファクタを適用することと、をさらに備えることができる。
【0012】
さらに別の例では、第1および第2の入力信号のうちの少なくとも1つを較正することは、第1の入力信号と第2の入力信号との間の相互相関推定値と、第2の入力信号のエネルギー推定値との比に基づいて較正ファクタを生成することと、第2の入力信号にその較正ファクタを適用することとをさらに備えることができる。
【0013】
さらに別の例では、第1および第2の入力信号のうちの少なくとも1つを較正することは、第1の入力信号と第2の入力信号との間の相互相関推定値と、第1の入力信号のエネルギー推定値との比に基づいて較正ファクタを生成することと、第1の入力信号にその較正ファクタを適用することとをさらに備えることができる。
【0014】
さらに別の例では、第1および第2の入力信号のうちの少なくとも1つを較正することは、第1の入力信号と第2の入力信号との間の相互相関推定値と、第2の入力信号のエネルギー推定値との比に基づいて較正ファクタを生成することと、第2の入力信号にその較正ファクタを乗算することと、第1の入力信号をその較正ファクタで除算することと、をさらに備えることができる。
【0015】
一例では、第1および第2の入力信号にビームフォーミング技法を適用することは、変更された第1の信号を取得するために第2の入力信号を第1の入力信号に加算することと、変更された第2の信号を取得するために第2の入力信号から第1の入力信号を減算することと、をさらに備えることができる。第1および第2の入力信号のうちの少なくとも1つを較正することは、(a)変更された第1の信号の第1のノイズフロア推定値を取得すること、(b)変更された第2の信号の第2のノイズフロア推定値を取得すること、(c)第1のノイズフロア推定値と第2のノイズフロア推定値との比に基づいて較正ファクタを生成すること、(d)較正ファクタを変更された第2の信号に適用すること、および/または(e)変更された第1の信号に適応フィルタを適用し、変更された第2の信号からフィルタ処理された変更された第1の信号を減算すること、をさらに備えることができる。
【0016】
高度に相関する信号混合のブラインド信号源分離のための方法はまた、(a)第1および第2の出力信号に基づいて較正ファクタを取得すること、および/または(b)第1および第2の出力信号にブラインド信号源分離技法を適用するより前に、第1および第2の出力信号のうちの少なくとも1つを較正することをさらに備えることができる。
【0017】
高度に相関する信号混合のブラインド信号源分離のための方法はまた、(a)第1および第2の出力信号に基づいて較正ファクタを取得すること、および/または(b)較正ファクタに基づいてブラインド信号源分離技法の動作を変更することをさらに備えることができる。
【0018】
高度に相関する信号混合のブラインド信号源分離のための方法はまた、第1のBSS信号中のノイズを低減するために第1のBSS信号に適応フィルタを適用することをさらに備えることができ、第2のBSS信号は、適応フィルタへの入力として使用される。
【0019】
高度に相関する信号混合のブラインド信号源分離のための方法はまた、(a)振幅ベースの較正または相互相関ベースの較正のうちの少なくとも1つを適用することによって、第1および第2の入力信号のうちの少なくとも1つを較正すること、(b)振幅ベースの較正または相互相関ベースの較正のうちの少なくとも1つを適用することによって、第1および第2の出力信号のうちの少なくとも1つを較正すること、および/または(c)ノイズベースの較正を適用することを含む、第1および第2のBSS信号のうちの少なくとも1つを較正すること、をさらに備えることができる。
【0020】
1つまたは複数の較正モジュールとブラインド信号源分離モジュールとに結合された1つまたは複数のマイクロホンを備える通信デバイスもまた提供される。第1のマイクロホンは、第1の入力信号を取得するように構成されることができる。第2のマイクロホンは、第2の入力信号を取得するように構成されることができる。較正モジュールは、対応する第1および第2の出力信号を取得するために、第1および第2の入力信号に対してビームフォーミングを実行するように構成される。ブラインド信号源分離モジュールは、第1のBSS信号と第2のBSS信号とを生成するために、ブラインド信号源分離(BSS)技法を第1の出力信号と第2の出力信号とに実行するように構成されることができる。少なくとも1つの較正モジュールは、第1および第2の入力信号、第1および第2の出力信号、または第1および第2のBSS信号のうちの少なくとも1つを較正するように構成されることができる。通信デバイスは、また、第1のBSS信号中のノイズを低減するために、第1のBSS信号に適応フィルタを適用するように構成された後処理モジュールをも含むことができ、第2のBSS信号は、適応フィルタへの入力として使用される。
【0021】
ビームフォーミングモジュールは、第1および第2の入力信号に空間フィルタを適用することによってビームフォーミングを実行することができ、第1および第2の入力信号に空間フィルタを適用することは、他の方向からのサウンド信号を減衰させながら、第1の方向からのサウンド信号を増幅する。第1の入力信号と第2の入力信号とに空間フィルタを適用することは、得られた第1の出力信号中の所望のスピーチ信号を増幅することができ、第2の出力信号中の所望のスピーチ信号を減衰させることができる。
【0022】
一例では、第1および第2の入力信号に対してビームフォーミングを実行することにおいて、ビームフォーミングモジュールは、(a)第2の入力信号に適応フィルタを適用し、(b)第2の入力信号から第1の入力信号を減算し、(c)フィルタ処理された第2の入力信号を第1の入力信号に加算する、ようにさらに構成されることができる。
【0023】
一例では、第1および第2の入力信号のうちの少なくとも1つを較正することにおいて、較正モジュールは、(a)第1の入力信号と第2の入力信号との間の相互相関推定値と、第2の入力信号のエネルギー推定値との比に基づいて較正ファクタを生成し、および/または(b)較正ファクタを第2の入力信号に適用する、ようにさらに構成されることができる。
【0024】
別の例では、第1および第2の入力信号のうちの少なくとも1つを較正することにおいて、較正モジュールは、(a)第1の入力信号と第2の入力信号との間の相互相関推定値と、第1の入力信号のエネルギー推定値との比に基づいて較正ファクタを生成し、および/または(b)較正ファクタを第1の入力信号に適用するようにさらに構成されることができる。
【0025】
別の例では、第1および第2の入力信号のうちの少なくとも1つを較正することにおいて、較正モジュールは、(a)第1の入力信号と第2の入力信号との間の相互相関推定値と、第2の入力信号のエネルギー推定値とに基づいて較正ファクタを生成し、(b)第2の入力信号に較正ファクタを乗算し、および/または(c)第1の入力信号を較正ファクタで除算する、ようにさらに構成されることができる。
【0026】
別の例では、第1および第2の入力信号に対してビームフォーミングを実行することにおいて、ビームフォーミングモジュールは、(a)変更された第1の信号を取得するために、第2の入力信号を第1の入力信号に加算し、(b)変更された第2の信号を取得するために、第2の入力信号から第1の入力信号を減算し、(c)変更された第1の信号の第1のノイズフロア推定値を取得し、(d)変更された第2の信号の第2のノイズフロア推定値を取得する、ようにさらに構成されることができ、および/または較正モジュールは、(e)第1のノイズフロア推定値と第2のノイズフロア推定値との比に基づいて較正ファクタを生成し、および/または(f)較正ファクタを変更された第2の信号に適用する、ようにさらに構成されることができる。
【0027】
一例では、少なくとも1つの較正モジュールは、振幅ベースの較正または相互相関ベースの較正のうちの少なくとも1つを、第1および第2の入力信号に適用するように構成された第1の較正モジュールを含むことができる。
【0028】
別の例では、少なくとも1つの較正モジュールは、振幅ベースの較正または相互相関ベースの較正のうちの少なくとも1つを、第1および第2の出力信号に適用するように構成された第2の較正モジュールを含むことができる。
【0029】
別の例では、少なくとも1つの較正モジュールは、ノイズベースの較正を第1および第2のBSS信号に適用するように構成された第3の較正モジュールを含むことができる。
【0030】
したがって、(a)第1のマイクロホンに関連付けられた第1の入力信号と、第2のマイクロホンに関連付けられた第2の入力信号とを受信するための手段、(b)指向性を第1および第2の入力信号に与えて、対応する第1および第2の出力信号を取得するために、第1および第2の入力信号にビームフォーミング技法を適用するための手段、(c)第1のBSS信号と第2のBSS信号とを生成するために、ブラインド信号源分離(BSS)技法を第1の出力信号と第2の出力信号とに適用するための手段、(d)第1および第2の入力信号、第1および第2の出力信号、または第1および第2のBSS信号のうちの少なくとも1つを較正するための手段、(e)第1のBSS信号中のノイズを低減するために第1のBSS信号に適応フィルタを適用するための手段であって、第2のBSS信号は、適応フィルタへの入力として使用される、第1のBSS信号に適応フィルタを適用するための手段、(f)第2の入力信号に適応フィルタを適用するための手段、(g)第2の入力信号から第1の入力信号を減算するための手段、(h)フィルタ処理された第2の入力信号を第1の入力信号に加算するための手段、(i)第1および第2の出力信号に基づいて較正ファクタを取得するための手段、(j)第1および第2の出力信号にブラインド信号源分離技法を適用するより前に、第1および第2の出力信号のうちの少なくとも1つを較正するための手段、(k)第1および第2の出力信号に基づいて較正ファクタを取得するための手段、および/または(l)較正ファクタに基づいてブラインド信号源分離技法の動作を修正するための手段、を備える通信デバイスが提供される。
【0031】
2つ以上の信号のブラインド信号源分離を強調するための回路であって、(a)第1のマイクロホンに関連付けられた第1の入力信号と第2のマイクロホンに関連付けられた第2の入力信号とを受信し、(b)指向性を第1および第2の入力信号に与え、対応する第1および第2の出力信号を取得するために、第1および第2の入力信号にビームフォーミング技法を適用し、(c)第1のBSS信号と第2のBSS信号とを生成するために、ブラインド信号源分離(BSS)技法を第1の出力信号と第2の出力信号とに適用し、および/または(d)第1および第2の入力信号、第1および第2の出力信号、または第1および第2のBSS信号のうちの少なくとも1つを較正するように適合される、回路が提供される。ビームフォーミング技法は、第1の入力信号と第2の入力信号とに空間フィルタを適用し、空間フィルタは、他の方向からのサウンド信号を減衰させながら、第1の方向からのサウンド信号を増幅する。一例では、回路は集積回路である。
【0032】
2つ以上の信号のブラインド信号源分離を強調するための命令を備えるコンピュータ可読媒体がまた提供され、その命令は、プロセッサによって実行されるときに、(a)第1のマイクロホンに関連付けられた第1の入力信号と第2のマイクロホンに関連付けられた第2の入力信号とを取得すること、(b)指向性を第1および第2の入力信号に与え、対応する第1および第2の出力信号を取得するために、第1および第2の入力信号にビームフォーミング技法を適用すること、(c)第1のBSS信号と第2のBSS信号とを生成するために、ブラインド信号源分離(BSS)技法を前処理された第1の出力信号と前処理された第2の出力信号とに適用すること、および/または(d)第1および第2の入力信号、第1および第2の出力信号、または第1および第2のBSS信号のうちの少なくとも1つを較正することをプロセッサに行わせることができる。
【0033】
本態様の特徴、特性、および利点は、全体を通じて同様の参照符号が同様のものを指す図面とともに、以下に記載する詳細な説明を読めばより明らかになるだろう。
【図面の簡単な説明】
【0034】
【図1】図1は、信号強調を実行するように構成されたモバイル通信デバイスの例を示す図である。
【図2】図2は、間隔が密なマイクロホンのために信号強調を実行するように構成されたモバイル通信デバイスのコンポーネントおよび機能を示すブロック図である。
【図3】図3は、一例による、連続ビームフォーマおよびブラインド信号源分離段の一例のブロック図である。
【図4】図4は、空間ビームフォーミングを実行するように構成されたビームフォーミングモジュールの例のブロック図である。
【図5】図5は、2つ以上のマイクロホンからの入力信号を使用する較正およびビームフォーミングの第1の例を示すブロック図である。
【図6】図6は、2つのマイクロホン信号に基づいてビームフォーミングを実装する前に、2つのマイクロホン信号を較正するために適用される較正ファクタを取得するための第1の方法を示す流れ図である。
【図7】図7は、2つのマイクロホン信号に基づいてビームフォーミングを実装する前に、2つのマイクロホン信号を較正するために適用される較正ファクタを取得するための第2の方法を示す流れ図である。
【図8】図8は、2つ以上のマイクロホンからの入力信号を使用する較正およびビームフォーミングの第2の例を示すブロック図である。
【図9】図9は、2つ以上のマイクロホンからの入力信号を使用する較正およびビームフォーミングの第3の例を示すブロック図である。
【図10】図10は、2つ以上のマイクロホンからの入力信号を使用する較正およびビームフォーミングの第4の例を示すブロック図である。
【図11】図11は、複数の混合入力信号から信号源信号を復元する畳み込みブラインド信号源分離の動作を示すブロック図である。
【図12】図12は、ビームフォーミング前処理段の後であるが、ブラインド信号源分離段の前に信号がどのように較正されるかの第1の例を示すブロック図である。
【図13】図13は、ブラインド信号源分離より前に信号較正を実装する代替方式を示すブロック図である。
【図14】図14は、所望のスピーチ基準信号からノイズを低減するために使用される後処理モジュールの動作の例を示すブロック図である。
【図15】図15は、一例によるブラインド信号源分離を強調する方法を示す流れ図である。
【発明を実施するための形態】
【0035】
以下の説明では、構成の十分な理解が得られるように具体的な詳細が与えられる。ただし、その構成は、これらの具体的な詳細なしに実施できることを、当業者なら理解されよう。たとえば、構成を不必要な詳細で不明瞭にしないために、回路をブロック図で示すことがある。他の場合、構成を不明瞭にしないために、よく知られている回路、構造および技法を詳細に示すことがある。
【0036】
また、構成は、フローチャート、流れ図、構造図、またはブロック図として示されるプロセスとして説明されることがあることに留意されたい。フローチャートは、動作を逐次プロセスとして説明することがあるが、動作の多くは並行してまたは同時に実行されることができる。さらに、動作の順序は、並べ替えられることができる。プロセスは、その動作が完了されると終了される。プロセスは、方法、関数、プロシージャ、サブルーチン、サブプログラムなどに対応することができる。プロセスが関数に対応する場合、その終了は、呼出し側関数またはメイン関数への関数の復帰に対応する。
【0037】
1つまたは複数の例および/または構成では、説明された機能は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの組合せで実装されることができる。ソフトウェアで実装される場合、機能は、1つまたは複数の命令またはコードとしてコンピュータ可読媒体上に記憶されるか、あるいはコンピュータ可読媒体を介して送信されることができる。コンピュータ可読媒体は、コンピュータ記憶媒体と、ある場所から別の場所へのコンピュータプログラムの転送を可能にするいかなる媒体をも含む通信媒体との両方を含む。記憶媒体は、汎用または専用コンピュータによってアクセスされることができる任意の利用可能な媒体とすることができる。限定ではなく例として、そのようなコンピュータ可読媒体は、RAM、ROM、EEPROM、CD−ROM、あるいは他の光ディスクストレージ、磁気ディスクストレージまたは他の磁気ストレージデバイス、もしくは命令またはデータ構造の形の所望のプログラムコード手段を搬送または記憶するために使用されることができ、汎用または専用コンピュータあるいは汎用または専用プロセッサによってアクセスされることができる任意の他の媒体を備えることができる。さらに、いかなる接続も、正しくはコンピュータ可読媒体と呼ばれる。たとえば、ソフトウェアが、同軸ケーブル、光ファイバケーブル、ツイストペア、デジタル加入者回線(DSL)、または赤外線、無線、およびマイクロ波などのワイヤレス技術を使用して、ウェブサイト、サーバ、または他のリモート信号源から送信される場合、同軸ケーブル、光ファイバケーブル、ツイストペア、DSL、または赤外線、無線、およびマイクロ波などのワイヤレス技術は、媒体の定義に含まれる。本明細書では、ディスク(disk)およびディスク(disc)は、コンパクトディスク(disc)(CD)、レーザディスク(disc)、光ディスク(disc)、デジタル多用途ディスク(disc)(DVD)、フロッピー(登録商標)ディスク(disk)およびブルーレイディスク(disc)を含み、この場合、ディスク(disk)は、通常、データを磁気的に再生し、ディスク(disc)はデータをレーザで光学的に再生する。上記の組合せもコンピュータ可読媒体の範囲内に含められる。
【0038】
さらに、記憶媒体は、読取り専用メモリ(ROM)、ランダムアクセスメモリ(RAM)、磁気ディスク記憶媒体、光記憶媒体、フラッシュメモリデバイス、および/または情報を記憶するための他の機械可読媒体を含む、データを記憶するための1つまたは複数のデバイスを表すことができる。
【0039】
さらに、ハードウェア、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、および/またはそれらの任意の組合せによって様々な構成が実装されることができる。ソフトウェア、ファームウェア、ミドルウェア、またはマイクロコードで実装された場合、必要なタスクを実行するためのプログラムコードまたはコードセグメントは、記憶媒体または(1つまたは複数の)他の記憶装置などのコンピュータ可読媒体に記憶されることができる。プロセッサは、必要なタスクを実行することができる。コードセグメントは、プロシージャ、関数、サブプログラム、プログラム、ルーチン、サブルーチン、モジュール、ソフトウェアパッケージ、クラス、または命令、データ構造もしくはプログラムステートメントの任意の組合せを表すことができる。コードセグメントは、情報、データ、引数、パラメータ、またはメモリ内容をパスおよび/または受信することによって、別のコードセグメントまたはハードウェア回路に結合されることができる。情報、引数、パラメータ、データなどは、メモリ共有、メッセージパッシング、トークンパッシング、ネットワーク送信などを含む任意の適切な手段を介してパス、転送、または送信されることができる。
【0040】
1つの特徴は、ブラインド信号源分離を実行する前に入力信号を事前調整する前処理段を設け、それによってブラインド信号源分離アルゴリズムのパフォーマンスを改善する。ブラインド信号源分離に関連付けられた不確定性問題を回避するために、まず、マイクロホン信号を事前調整するために、較正およびビームフォーミング段が使用される。次いで、所望のスピーチ信号と周囲ノイズとを分離するために、ビームフォーマ出力信号に対してブラインド信号源分離が実行される。この特徴は、少なくとも2つのマイクロホンが使用され、(少なくとも2つのマイクロホン信号からの)ただ1つの信号が、強調されるべき所望される信号であると仮定する。たとえば、所望の信号は、通信デバイスを使用している人から発生するスピーチ信号とすることができる。
【0041】
一例では、それぞれ所望のスピーチ信号および周囲ノイズの混合物を含むと仮定される2つのマイクロホン信号が通信デバイス上でキャプチャされることができる。まず、マイクロホン信号を事前調整するために、較正およびビームフォーミング段が使用される。事前調整された信号の1つまたは複数は、さらなる処理の前および/または後に、再び較正されることができる。たとえば、まず事前調整された信号が較正されることができ、次いで、ブラインド信号源分離アルゴリズムが元の信号を再構成するために使用される。ブラインド信号源分離アルゴリズムは、信号分離パフォーマンスをさらに改善するために後処理モジュールを使用しても使用しなくてもよい。
【0042】
いくつかの例は、説明のために「スピーチ信号」という用語を使用することがあるが、様々な特徴は、ボイス、ボイス、ミュージックなどを含むすべてのタイプの「サウンド信号」にも当てはまることは明らかである。
【0043】
1つの態様は、マイクロホン信号記録が高度に相関され、1つの信号源信号が所望の信号であるブラインド信号源分離パフォーマンスを改善することを提供する。システムの全体的なパフォーマンスを改善するために、スペクトル減算技法などの非線形処理方法が、後処理の後に採用されることができる。非線形処理はさらに、ノイズおよび他の望ましくない信号源信号から所望の信号を区別するのに役立つことができる。
【0044】
図1は、信号強調を実行するように構成されたモバイルデバイスの例を示す。モバイルデバイス102は、1つまたは複数の信号源からオーディオ信号をキャプチャするために配置された少なくとも2つのマイクロホン104および106を含む、携帯電話、セルラー電話、携帯情報端末、デジタルオーディオレコーダー、通信デバイスなどとすることができる。マイクロホン104および106は、通信デバイス102中の様々な位置に配置されることができる。たとえば、マイクロホン104および106は、所望のスピーチ信号源(たとえば、ユーザ)からのオーディオ信号をキャプチャするように、モバイルデバイス102の同じ側に互いにかなり近接して配置されることができる。2つのマイクロホン間の距離は、たとえば、0.5センチメートルから10センチメートルまで変動することがある。この例は、2つのマイクロホン構成を示しているが、他の実装形態は、異なる位置にある追加のマイクロホンを含むことができる。
【0045】
スピーチ通信では、所望のスピーチ信号は、街頭ノイズ、バブルノイズ、自動車ノイズなどを含む周囲ノイズでしばしば乱される。そのようなノイズは、所望のスピーチの了解度を低減するだけでなく、スピーチを聴取者にとって不快なものにする。したがって、スピーチ信号を通信の他の当事者に送信する前に、周囲ノイズを低減することが望ましい。したがって、モバイルデバイス102は、キャプチャされたサウンド信号の品質を強調するために、信号処理を実行するように構成または適合されることができる。
【0046】
ブラインド信号源分離(BSS)は、周囲ノイズを低減するために使用されることができる。BSSは、所望のスピーチを1つの元の信号源として扱い、周囲ノイズを別の信号源として扱う。分離された信号を互いから独立させることによって、周囲ノイズから所望のスピーチを分離すること、すなわち、スピーチ信号中の周囲ノイズを低減し、周囲ノイズ信号中の所望のスピーチを低減することができる。一般に、所望のスピーチは、独立した信号源である。しかし、ノイズは、いくつかの方向から来ることができる。したがって、周囲ノイズ信号のスピーチ低減は、よく行われことができる。ただし、スピーチ信号のノイズ低減は、音響環境に依存することがあり、周囲ノイズ信号のスピーチ低減よりも難しいことがある。すなわち、周囲ノイズの分散性質のために、ブラインド信号源分離の目的でそれを単一の信号源として表すことが困難になる。
【0047】
2つのマイクロホン104および106を近くに配置した結果として、2つのマイクロホン104および106によってキャプチャされたオーディオ信号は高度に相関し、信号差は非常に小さくなることがある。したがって、従来のブラインド信号源分離処理は、所望のオーディオ信号を強調することに成功しないことがある。したがって、モバイルデバイス102は、たとえば、ブラインド信号源分離段の前段に較正およびビームフォーミング段を実装することによって、周囲ノイズから所望のスピーチを分離するように構成または適合されることができる。
【0048】
図2は、間隔が密なマイクロホンのために信号強調を実行するように構成されたモバイルデバイスのコンポーネントおよび機能を示すブロック図である。モバイルデバイス202は、随意の前処理(較正)段208に通信可能に結合された少なくとも2つの(単方向または全方向)マイクロホン204および206と、後続のビームフォーミング段211と、後続の別の随意の中間処理(較正)段213と、後続のブラインド信号源分離段210と、後続の随意の後処理(たとえば、較正)段215と、を含むことができる。少なくとも2つのマイクロホン204および206は、1つまたは複数の音源216、218および220から、混合音響信号S1212およびS2214をキャプチャすることができる。たとえば、音響信号S1212およびS2214は、音源216、218および220からの2つ以上のソースサウンド信号so1とso2とsoNとの混合とすることができる。音源216、218および220は、1つまたは複数のユーザ、バックグラウンドまたは周囲ノイズなどを表すことができる。キャプチャされた入力信号S’1およびS’2は、サンプリングされたサウンド信号s1(t)およびs2(t)を提供するために、アナログデジタル変換器207および209によってサンプリングされることができる。
【0049】
音響信号S1212およびS2214は、所望のサウンド信号と不要なサウンド信号とを含むことがある。「サウンド信号」という用語は、限定はしないが、オーディオ信号、スピーチ信号、ノイズ信号、および/またはマイクロホンによって音響的に送信およびキャプチャされることができる他のタイプの信号を含む。
【0050】
前処理(較正)段208、ビームフォーミング段211および/または中間処理(較正)段213は、ブラインド信号源分離に関連する不確定性問題を回避するために、キャプチャされたサンプリングされた信号s1(t)とs2(t)とを事前調整するように構成または適合されることができる。すなわち、ブラインド信号源分離アルゴリズムは、所望のスピーチ信号と周囲ノイズとを分離するために使用されることができるが、これらのアルゴリズムは、信号分離の後、どの出力信号が所望のスピーチ信号であり、どの出力信号が周囲ノイズであるかを判断することができない。これは、すべてブラインド信号源分離アルゴリズムの固有の不確定性による。ただし、いくつかの仮定の下で、一部のブラインド信号源分離アルゴリズムは、そのような不確定性を回避することが可能であることがある。たとえば、所望のスピーチが1つの入力チャネル中で他のチャネル中よりもはるかに強い場合、ブラインド信号源分離の結果が確定する可能性がある。しかし、信号S’1およびS’2が、間隔が密なマイクロホンを使用してキャプチャされた場合、そのような仮定は有効ではない。したがって、ブラインド信号源分離アルゴリズムが受信信号S’1およびS’2(または、デジタル化サウンド信号s1(t)およびs2(t))に直接適用された場合、不確定性問題が持続する可能性がある。その結果、信号S’1およびS’2は、所望の方向からの信号受信を強調するために、2つ以上の信号源サウンド信号so1、so2およびsoNの指向性を利用する前処理(たとえば、較正段208および/または213および/またはビームフォーミング段211)にかけられることがある。
【0051】
ビームフォーミング段211は、受信したサウンド信号s1(t)およびs2(t)の指向性を利用することによって、有用なサウンド信号を区別するように構成されることができる。ビームフォーミング段211は、少なくとも2つ以上のマイクロホン212および214によってキャプチャされた信号を線形結合することによって、空間フィルタ処理を実行することができる。空間フィルタ処理は、所望の方向からのサウンド信号の受信を強調し、他の方向から来る干渉信号を抑制する。たとえば、2つのマイクロホンシステムでは、ビームフォーミング段211は、第1の出力x1(t)および第2の出力x2(t)を生成する。第1の出力x1(t)では、所望のスピーチが空間フィルタ処理によって強調される。第2の出力x2(t)では、所望のスピーチが抑制されることができ、周囲ノイズ信号が強調されることができる。
【0052】
たとえば、ユーザが第1の音源218である場合、元のソース信号so2が、所望のソースサウンド信号(たとえば、所望のスピーチ信号)である。したがって、第1の出力x1(t)では、ビームフォーミング段211は、他の音源216および220からの信号so1およびsoNを抑制しながら、第1の音源218からの受信を強調するようにビームフォーミングを実行することができる。第2の出力x2(t)では、較正段208および/または213および/またはビームフォーミング段211は、所望のスピーチ信号を抑制し、周囲ノイズ信号を強調するように空間ノッチフィルタ処理(spatial notch filtering)を実行することができる。
【0053】
出力信号x1(t)およびx2(t)は、所望のスピーチ信号と周囲ノイズとを分離するために、ブラインド信号源分離段210を通過されることができる。独立成分分析(Independent Component Analysis:ICA)としても知られているブラインド信号源分離(BSS)は、これらの信号の複数の混合に基づいてソース信号を復元するために使用されることができる。信号分離プロセス中に、ソースサウンド信号so1とso2とsoNとの混合である限られた数の信号x1(t)、x2(t)のみが利用可能である。混合プロセスに関する従来の情報は、利用可能ではない。ソースサウンド信号の直接的な測定値は、利用可能ではない。一部または全部のソース信号so1、so2およびsoNの演繹的な統計情報が利用可能である場合がある。たとえば、ソース信号の1つは、ガウス分布されることができ、別のソース信号は、一様に分布されることができる。
【0054】
ブラインド信号源分離段210は、ノイズが低減された第1のBSS信号
【数1】
【0055】
およびスピーチが低減された第2のBSS信号s<2(t)を与えることができる。その結果、第1のBSS信号s<1(t)は、所望のスピーチ信号を搬送することができる。第1のBSS信号s<1(t)は、送信機222によってその後送信される224とすることができる。
【0056】
図3は、一例による、連続ビームフォーマおよびブラインド信号源分離段のブロック図である。較正およびビームフォーミングモジュール302は、2つ以上の入力信号s1(t)、s2(t)およびsn(t)を事前調整し、次いで、ブラインド信号源分離モジュール304への入力として使用される、対応する出力信号x1(t)、x2(t)およびxn(t)を与えるように構成されることができる。2つ以上の入力信号s1(t)、s2(t)およびsn(t)は、互い相関されるか、または依存されることができる。ビームフォーミングを介した信号強調は、2つ以上の入力信号s1(t)、s2(t)およびsn(t)が、独立ランダムプロセスとしてモデル化されることを必要としないことができる。入力信号s1(t)、s2(t)およびsn(t)は、サンプリングされた離散時間信号とすることができる。
【0057】
ビームフォーミング段原理
ビームフォーミングでは、入力信号si(t)は、出力信号xi(t)を生成するために、空間と時間の両方において線形フィルタ処理されることができる。即ち、
【数2】
【0058】
式中、k−1は、n個のマイクロホンチャネル入力の各々での遅延タップの数である。所望のソース信号がssource(t)(たとえば、図2中の第1の音源218からのソース信号so2)によって表される場合、ビームフォーマ重みwi(p)は、ビームフォーマ出力xi(t)が、所望のソース信号ssource(t)の推定値s<source(t)を与えるように選択されることができる。この現象は、一般に所望のソース信号ssource(t)の方向でのビームの形成と呼ばれる。
【0059】
ビームフォーマは、概して、固定のビームフォーマおよび適応型ビームフォーマの2つのタイプに分類されることができる。固定のビームフォーマは、複数のマイクロホンから取得された空間時間サンプルを組み合わせるために固定のフィルタ重みを採用するデータ独立型ビームフォーマである。適応型ビームフォーマは、ビームフォーマのフィルタ重みを導出するために、入力信号の統計知識を採用するデータ従属型ビームフォーマである。
【0060】
図4は、空間ビームフォーミングを実行するように構成されたビームフォーミングモジュールの一例のブロック図である。空間のみのビームフォーミングは、空間時間ビームフォーミング方法のサブセット(すなわち、固定のビームフォーマ)である。ビームフォーミングモジュール402は、複数の入力信号s1(t),s2(t),... sn(t)を受信し、指向強調された1つまたは複数の出力信号
【数3】
【0061】
を与えるように構成されることができる。トランスポーザ404は、複数の入力信号s1(t),s2(t),... sn(t)を受信し、信号ベクトルs>(t)=[s1(t),s2(t),... sn(t)]Tを取得するための転置演算を実行するものであり、式中、上付き文字Tは転置演算を示す。
【0062】
次いで、信号ベクトルs>(t)は、関連する信号を強調することか、または不要な信号を抑制することのいずれかを行うように、空間重みベクトルによってフィルタ処理されることができる。空間重みベクトルは、他の方向からの信号を抑制しながら、特定の方向(たとえば、重みによって規定されたビームの方向)からキャプチャされた信号を強調する。
【0063】
たとえば、空間ノイズフィルタ406は、信号ベクトルs>(t)を受信し、
x>(t)=w>Ts>(t) (式2)
となるような第1のビームフォーマ出力x>(t)を生成するために、n×1の第1の空間重みベクトルw>T=[w1,w2,... wn]Tを適用することによってそれをフィルタ処理することができる。このビームフォーマは、所望の(サウンドまたはスピーチ)信号の信号強調を行うために、入力信号s1(t),s2(t),... sn(t)の空間情報を利用することができる。
【0064】
別の例では、ビームフォーミングモジュール402は、第2のビームフォーマ出力Z>(t)から所望の信号を抑制する空間ノッチフィルタ408を含むことができる。この場合、空間ノッチフィルタ408は、
v>Tw>T=0 (式3)
となるように、第1の空間重みベクトルw>Tと直交する、第2のn×1空間重みベクトルv>T=[v1,v2,..., vn]Tを使用することによって、所望の方向から来る信号を抑制する。所望の信号が最小限に抑えられた、第2のビームフォーマ出力z>(t)を生成するために、空間ノッチフィルタ408が入力信号ベクトルs>(t)に適用される。
【0065】
z>(t)=z>Ts>(t) (式4)
第2のビームフォーマ出力z>(t)は、キャプチャされた入力信号中のバックグラウンドノイズの推定値を与えることができる。このようにして、第2のビームフォーマ出力z>(t)は、第1のビームフォーマ出力x>(t)に対して直交方向からのものとすることができる。
【0066】
ビームフォーミングモジュール402によって提供される空間弁別機能は、伝搬する信号の波長に対して使用される2つ以上のマイクロホンの間隔に依存することができる。2つ以上のマイクロホン間の相対的な距離が増加するにつれて、ビームフォーミングモジュール402の指向性/空間弁別は一般に改善する。したがって、間隔が密なマイクロホンについて、ビームフォーミングモジュール402の指向性はより不十分であることがあり、信号強調または抑制を改善するために、さらに時間的な後処理が実行されることができる。ただし、ビームフォーミングモジュール402のそのようなパフォーマンスの限界にもかかわらず、後続のブラインド信号源分離段のパフォーマンスを改善することは、それでも出力信号x>(t)中とz>(t)中とで空間弁別を十分に行うことができる。図4のビームフォーミングモジュール402中の出力信号x>(t)およびz>(t)は、図3のビームフォーミングモジュール302または図2のビームフォーミング段211からの出力信号x1(t)およびx2(t)とすることができる。
【0067】
ビームフォーミングモジュール302は、入力信号に対して様々な追加の前処理動作を実装することができる。いくつかの例では、2つのマイクロホンによってキャプチャされた信号間のサウンドレベル(たとえば、電力レベル、エネルギーレベル)にかなりの差があることがある。サウンドレベルのそのような差は、ビームフォーミングを実行することを困難にすることがある。したがって、1つの態様は、ビームフォーミングを実行することの一部として入力信号を較正することを提供することができる。入力信号のそのような較正は、ビームフォーミング段の前および/または後に実行されることができる(たとえば、図2、較正段208および213)。様々な実装形態では、(1つまたは複数の)前ブラインド信号源分離較正段は、振幅ベースおよび/または相互相関ベースの較正とすることができる。すなわち、振幅ベースの較正では、スピーチまたはサウンド入力信号の振幅は、互いと比較することによって較正される。相互相関ベースの較正では、スピーチまたはサウンド信号の相互相関は、互いと比較することによって較正される。
【0068】
較正およびビームフォーミング−例1
図5は、2つ以上のマイクロホンからの入力信号を使用する較正およびビームフォーミングの第1の例を示すブロック図である。この実装形態では、第2の入力信号s2(t)は、ビームフォーミングがビームフォーミングモジュール504によって実行される前に、較正モジュール502によって較正されることができる。較正プロセスは、s’2(t)=c1(t)・s2(t)として公式化されることができる。較正ファクタc1(t)は、s’2(t)中の所望のスピーチのサウンドレベルが第1の入力信号s1(t)のサウンドレベルに近接するように、第2の入力s2(t)をスケーリングすることができる。
【0069】
較正ファクタc1(t)を取得することにおいて、図5の2つの入力信号s1(t)とs2(t)とを較正するために、様々な方法が使用されることができる。図6および図7は、較正ファクタc1(t)を取得することに使用されることができる2つの方法を示している。
【0070】
図6は、2つのマイクロホン信号に基づいてビームフォーミングを実装する前に、2つのマイクロホン信号を較正するために適用されることができる較正ファクタを取得するための第1の方法を示す流れ図である。較正ファクタc1(t)は、第1の入力信号s1(t)と第2の入力信号s2(t)との短期スピーチエネルギー推定値からそれぞれ、取得されることができる。602で、第1の複数エネルギー期間または推定値Ps1(t)(1...k)は、第1の入力信号s1(t)のブロック用に取得されることができ、ここで、各ブロックは、第1の入力信号s1(t)の複数のサンプルを含む。同様に、604で、第2の複数エネルギー期間または推定値Ps2(t)(1...k)は、第2の入力信号s2(t)のブロック用に取得されることができ、ここで、各ブロックは、第2の入力信号s2(t)の複数のサンプルを含むことができる。たとえば、以下の式を使用して、エネルギー推定値Ps1(t)およびPs2(t)が信号サンプルのブロックから計算されることができる。即ち、
【数4】
【0071】
第1の最大エネルギー推定値Qs1(t)は、606で、第1の複数のエネルギー期間または推定値Ps1(t)(1...k)を、たとえば、50ブロックまたは100ブロックのエネルギー期間にわたって探索することによって取得されることができる。同様に、第2の最大エネルギー推定値Qs2(t)は、608で、第2の複数のエネルギー期間または推定値Ps2(t)(1...k)を探索することによって取得されることができる。いくつかのブロックにわたってこれらの最大エネルギー推定値を計算することは、スピーチアクティビティ検出器を実装することなく、所望のスピーチのエネルギーを計算する、より単純な方法とすることができる。一例では、以下の式を使用して、第1の最大エネルギー推定値Qs1(t)が計算されることができる。即ち、
【数5】
【0072】
式中、tmaxは、最大エネルギー推定値Qs1(t)で識別される信号ブロックに対応する。第2の最大エネルギー推定値Qs2(t)は、同様に計算されることができる。あるいは、第2の最大エネルギー推定値Qs2(t)は、tmax信号ブロックにおいて計算された第2のマイクロホン信号のエネルギー推定値として、Qs2(t)=Ps2(tmax)で計算されることもできる。第1および第2の最大エネルギー推定値Qs1(t)およびQs2(t)は、較正ファクタc1(t)を計算する前に、610で、時間で平均化(平滑化)されることもできる。たとえば、指数平均化は、次のように実行されることができる。即ち、
【数6】
【0073】
較正ファクタc1(t)は、612で、第1および第2の最大エネルギー推定値Qs1(t)およびQs2(t)に基づいて取得されることができる。一例では、以下の式を使用して較正ファクタが取得されることができる。即ち、
【数7】
【0074】
較正ファクタc1(t)は、614で、較正推定値中の任意の過渡分をフィルタ除去するために、時間でさらに平滑化されることができる。次いで、較正ファクタc1(t)は、616で、第1および第2の入力信号s1(t)およびs2(t)を使用するビームフォーミングを実行する前に、第2の入力信号s2(t)に適用されることができる。あるいは、較正ファクタc1(t)の逆数が計算されて時間で平滑化され、次いで、616で、第1および第2の入力信号s1(t)およびs2(t)を使用するビームフォーミングを実行する前に、第1の入力信号s1(t)に適用されることができる。
【0075】
図7は、2つのマイクロホン信号に基づいてビームフォーミングを実装する前に、2つのマイクロホン信号を較正するために適用される較正ファクタを取得するための第2の方法を示す流れ図である。この第2の方法では、短期エネルギー推定値Ps1(t)およびPs2(t)の代わりに、2つの入力信号s1(t)とs2(t)との間の相互相関が使用されることができる。2つのマイクロホンが互いに近接して配置された場合、2つの入力信号中の所望のスピーチ(サウンド)信号は、互いと高度に相関することが予想されることができる。したがって、第1の入力信号s1(t)と第2の入力信号s2(t)との間の相互相関推定値Ps12(t)は、第2のマイクロホン信号s2(t)中のサウンドレベルを較正するために取得されることができる。たとえば、702で、第1の入力信号s1(t)について第1の複数のブロックが取得されることができるもので、ここで、各ブロックは、第1の入力信号s1(t)の複数のサンプルを含む。同様に、704で、第2の入力信号s2(t)について第2の複数のブロックが取得されることができ、ここで、各ブロックは、第2の入力信号s2(t)の複数のサンプルを含む。706で、第1の入力信号s1(t)と第2の入力信号s2(t)との間の複数の相互相関推定値Ps12(t)(1...k)は、第1および第2の複数のブロックのうちの相互相関している対応するブロックによって取得されることができる。たとえば、以下の式を使用して、相互相関推定値Ps12(t)が計算されることができる。即ち、
【数8】
【0076】
708で、第1の入力信号s1(t)と第2の入力信号s2(t)との間の最大相互相関推定値Qs12(t)は、複数の相互相関推定値Ps12(t)(1...k)を探索することによって取得されることができる。たとえば、以下を使用して、最大相互相関推定値Qs12(t)が取得されることができる。即ち、
【数9】
【0077】
第2の最大エネルギー推定値Qs2(t)は、712で、式(6)および式(7)を使用して、最大の第2のマイクロホンエネルギー推定値として計算されることができる。あるいは、第2の最大エネルギー推定値は、tmax信号ブロックにおいて計算された第2のマイクロホン信号のエネルギー推定値として、Qs2(t)=Ps2(tmax)で計算されることもできる。710で、最大相互相関推定値Qs12(t)および最大エネルギー推定値Qs2(t)は、たとえば、以下の式を使用して、指数平均化を実行することによって平滑化されることができる。即ち、
【数10】
【0078】
較正ファクタc1(t)は、714で、たとえば、以下の式を使用して、最大相互相関推定値Qs12(t)と第2の最大エネルギー推定値Q~s2(t)とに基づいて取得される。即ち、
【数11】
【0079】
その結果、較正ファクタc1(t)は、第1の入力信号s1(t)と第2の入力信号s2(t)との間の相互相関推定値と、第2の入力信号s2(t)のエネルギー推定値と、の間の比に基づいて生成されることができる。次いで、較正ファクタc1(t)は、較正された第2の入力信号を第1の入力信号s1(t)に加算されることが次にできる較正された第2の入力信号s’2(t)を取得するために、第2の入力信号s2(t)に適用される。
【0080】
再び図5を参照すると、較正の後の得られた第1および第2の出力信号x1(t)およびx2(t)は、
【数12】
【0081】
となるように、ビームフォーミングモジュール504によって加算または減算されることができる。第1の出力信号x1(t)は、所望の音源に向かってビームを形成する固定の空間ビームフォーマの出力と考えられることができる。第2の出力信号x2(t)は、所望の音源方向でヌルを形成することによって所望のスピーチ信号を抑制する固定のノッチビームフォーマの出力と考えられることができる。
【0082】
別の例では、較正ファクタc1(t)は、第1の入力信号s1(t)と第2の入力信号s2(t)との間の相互相関推定値と、第1の入力信号s1(t)のエネルギー推定値と、の比に基づいて生成されることができる。次いで、較正ファクタc1(t)は、第1の入力信号s1(t)に適用される。次いで、較正された第1の入力信号は、第2の入力信号s2(t)から減算されることができる。
【0083】
較正およびビームフォーミング−例2
図8は、2つ以上のマイクロホンからの入力信号を使用する較正およびビームフォーミングの第2の例を示すブロック図である。この実装形態では、(図5におけるような)第2の入力信号s2(t)をスケーリングするために較正ファクタを使用する代わりに、較正ファクタc1(t)は、ビームフォーミングの前に、入力信号s1(t)とs2(t)の両方を調整するために使用されることができる。この実装形態の場合の較正ファクタc1(t)は、たとえば、図6および図7で説明されたのと同じ手順を使用して、較正モジュール802によって取得されることができる。較正ファクタc1(t)が取得されると、ビームフォーミングモジュール804は、
【数13】
【0084】
となるように、出力信号x1(t)およびx2(t)を生成することができるものであり、式中、第1の出力信号x1(t)は、所望の音源に向かってビームを形成する固定の空間ビームフォーマの出力と考えられることができる。第2の出力信号x2(t)は、所望の音源方向でヌルを形成することによって所望のスピーチ信号を抑制する固定のノッチビームフォーマの出力と考えられることができる。
【0085】
一例では、較正ファクタc1(t)は、第1の入力信号と第2の入力信号との間の相互相関と、第2の入力信号s2(t)のエネルギー推定値と、に基づかれることができる。第2の入力信号s2(t)は、較正ファクタc1(t)で乗算され、第1の入力信号s1(t)に加算されることができる。第1の入力信号s1(t)は、較正ファクタc1(t)で除算され、第1の入力信号s1(t)から減算されることができる。
【0086】
較正およびビームフォーミング−例3
図9は、2つ以上のマイクロホンからの入力信号を使用する較正およびビームフォーミングの第3の例を示すブロック図である。この実装形態は、適応フィルタ902を含むように、図5および図8に示す較正手順を一般化する。第2のマイクロホン信号s2(t)は、適応フィルタ902の入力信号として使用されることができ、第1のマイクロホン信号s1(t)は、基準信号として使用されることができる。適応フィルタ902は、重みwt=[wt(0)wt(1)...wt(N―1)]Tを含むことができるものであり、式中、Nは、適応フィルタ902の長さである。適応フィルタ処理プロセスは、
【数14】
【0087】
のように表されることができる。適応フィルタ902は、様々なタイプの適応フィルタ処理アルゴリズムを使用して適合されることができる。たとえば、適応フィルタ902は、次のように最小平均二乗(Least-Mean-Square:LMS)タイプアルゴリズムを使用して適合されることができる。
【0088】
wi=wi−1+2μx2(t)s2(t) (式23)
式中、μはステップサイズであり、
【数15】
【0089】
は、式24に示されるような第2の入力信号ベクトルである。即ち、
【数16】
【0090】
適応フィルタ902は、適応型ビームフォーマとして作動することができ、第2のマイクロホン入力信号s2(t)中の所望のスピーチを抑制することができる。適応フィルタ長が1となるように選択された場合、この方法は、2つのマイクロホン信号間の相互相関が第2のマイクロホン信号を較正するために使用されることができる図7で説明された較正手法と等価になる。
【0091】
ビームフォーミングモジュール904は、第1および第2の出力信号x1(t)およびx2(t)を取得するために、第1のマイクロホン信号s1(t)とフィルタ処理された第2のマイクロホン信号s’2(t)とを処理する。第2の出力信号x2(t)は、所望の音源(スピーチソース)方向でヌルを形成することによって所望のスピーチ信号を抑制する固定のノッチビームフォーマの出力と考えられることができる。第1の出力信号x1(t)は、所望の音源信号のビームフォーミングされた出力を取得するために、以下のように、フィルタ処理された第2のマイクロホン信号s’2(t)を第1のマイクロホン信号s1(t)に加算することによって取得されることができる。即ち、
x1(t)=s1(t)+s’2(t) (式25)
第1の出力信号x1(t)は、x1(t)におけるスピーチレベルをs1(t)におけるスピーチレベルと同じに保持するために、0.5倍にスケーリングされることができる。したがって、第1の出力信号x1(t)は、所望のスピーチ(サウンド)信号と周囲ノイズの両方を含み、第2の出力信号x2(t)は、大部分は周囲ノイズと所望のスピーチ(サウンド)信号のいくつかとを含む。
【0092】
較正およびビームフォーミング−例4
図10は、2つ以上のマイクロホンからの入力信号を使用する較正およびビームフォーミングの第4の例を示すブロック図である。この実装形態では、較正はビームフォーミングの前に実行されない。代わりに、最初に、ビームフォーミングが、
【数17】
【0093】
のように、2つの入力信号s1(t)およびs2(t)を組み合わせるビームフォーミングモジュール1002によって実行される。ビームフォーミングの後、ビームフォーマの第2の出力信号x’2(t)におけるノイズレベルは、第1の出力信号x1(t)におけるノイズレベルよりもはるかに低くなることがある。したがって、較正モジュール1004は、ビームフォーマの第2の出力信号x’2(t)におけるノイズレベルをスケーリングするために使用されることができる。較正モジュール1004は、ビームフォーマ出力信号x1(t)およびx’2(t)のノイズフロア推定値から較正ファクタc1(t)を取得することができる。出力信号x1(t)およびx’2(t)の短期エネルギー推定値はそれぞれ、Px1(t)およびPx’2(t)によって示されることができ、対応するノイズフロア推定値は、Nx1(t)およびNx’2(t)によって示されることができる。ノイズフロア推定値Nx1(t)およびNx’2(t)は、短期エネルギー推定値Px1(t)およびNx’2(t)の最小値を、入力信号サンプルのいくつかの連続するブロック、すなわち、50ブロックまたは100ブロックにわたって見つけることによって取得されることができる。たとえば、ノイズフロア推定値Nx1(t)およびNx’2(t)はそれぞれ、式27および式28を使用して計算されることができる。即ち、
【数18】
【0094】
ノイズフロア推定値Nx1(t)およびNx’2(t)は、不連続性を平滑化するために、時間で平均化されることができ、較正ファクタc1(t)は、
【数19】
【0095】
のように、平滑化されたノイズフロア推定値の比として計算されることができる。式中、Nx’1(t)およびN’x’2(t)は、平滑化されたノイズフロア推定値x1(t)およびx’2である。ビームフォーミングされた第2の出力信号x’2(t)は、
x”2(t)=c1(t)x’2(t) (式30)
となるように、最終のノイズ基準出力信号x”2(t)を取得するために、較正ファクタc1(t)によってスケーリングされる。
【0096】
較正の後、適応フィルタ1006が適用されることができる。適応フィルタ1006は、適応フィルタ902(図9)に関して説明されるように実装されることができる。第1の出力信号x1(t)は、適応フィルタ1006への入力信号として使用されることができ、較正された出力信号x”2(t)は、基準信号として使用されることができる。適応フィルタ1006は、較正されたビームフォーマ出力信号x”2(t)中の所望のスピーチ信号を抑制することができる。したがって、第1の出力信号x1(t)は、所望のスピーチと周囲ノイズの両方を含むことができ、第2の出力信号x2(t)は、大部分は周囲ノイズといくつかの所望のスピーチとを含むことができる。その結果、2つの出力信号x1(t)およびx2(t)は、すなわち、それらが高度に相関しないというBSSの不確定性を回避するための上述の仮定を満たすことができる。
【0097】
図5〜図10に示す様々な例では、(1つまたは複数の)較正段は、スピーチまたはサウンド符号上で振幅ベースおよび/または相互相関ベースの較正を実装することができる。
【0098】
ブラインド信号源分離段
再び図3を参照すると、ビームフォーミングモジュール302からの出力信号x1(t)、x2(t)およびxn(t)は、ブラインド信号源分離モジュール304に渡されることができる。ブラインド信号源分離モジュール304は、ビームフォーマ出力信号x1(t)、x2(t)およびxn(t)を処理することができる。信号x1(t)、x2(t)およびxn(t)は、ソース信号の混合とすることができる。ブラインド信号源分離モジュール304は入力混合を分離し、ソース信号の推定値y1(t)、y2(t)およびyn(t)を生成する。たとえば、わずか1つのソース信号が所望の信号とすることができる二重マイクロホンノイズ低減の場合、ブラインド信号源分離モジュール304は、所望のスピーチ信号(たとえば、図2の第1の音源信号so2)と周囲ノイズ(たとえば、図2のノイズso1およびsoN)とを無相関化する(decorrelate)ことができる。
【0099】
ブラインド信号源分離−原理
ブラインド信号源分離または無相関化(decorrelation)では、入力信号は、独立ランダムプロセスとして扱われる。信号をブラインド分離するのに使用される仮定は、すべてのランダムプロセスが互いに統計的に独立である、すなわち、すべてのランダムプロセスS1、S2およびSmの同時確率分布Pは、すべて個々のランダムプロセスの積であるということである。この仮定は、
【数20】
【0100】
のように公式化されることができるものであり、式中、
【数21】
【0101】
は、すべてのランダムプロセスS1,...,Smの同時分布(joint distribution)であり、
【数22】
【0102】
は、j番目のランダムプロセスSjの分布である。
【0103】
一般に、ブラインド信号源分離は、2つのカテゴリ、瞬時BSSおよび畳み込みBSSに分類されることがある。瞬時BSSは、瞬時の行列混合としてモデル化されることができる混合入力信号s(t)を指し、
x(t)=As(t) (式32)
のように公式化されるものであり、式中、s(t)は、m×1ベクトルであり、x(t)は、n×1ベクトルであり、Aはn×mのスカラー行列である。分離プロセスでは、m×nスカラー行列Bは、s<(t)が任意の置換および任意のスケーリングまでs(t)に似るように、信号s<(t)=Bx(t)=BAs(t)を再構成するために、計算され、使用される。すなわち、行列BAは、PDに分解されることができるものであり、ここで、行列Pは置換行列であり、行列Dは対角行列である。置換行列は、同じ次元の単位行列を置換することによって導出される行列である。対角行列は、その対角線上に0でないエントリのみを有する行列である。対角行列Dが単位行列でなければならないわけでないことに留意されたい。すべてのm個の音源が互いに独立している場合、行列Dの対角線上に0エントリがあってはならないべきである。一般に、n≧m、すなわち、マイクロホンの数nが音源の数m以上であることが、完全な信号分離のために望ましい。
【0104】
実際問題として、瞬時の混合を使用してモデル化されることができる課題はほとんどない。信号は、典型的に、マイクロホンまたはオーディオセンサによってキャプチャされる前に、非理想的なチャネルを通って進む。したがって、畳み込みBSSは、入力信号をより良くモデル化するために使用されることができる。
【0105】
図11は、複数の混合入力信号からソース信号を復元する畳み込みブラインド信号源分離の動作を示すブロック図である。ソース信号s1(t)1102およびs2(t)1104は、それらが混合されるチャネルを通過することができる。混合信号は、入力信号s’1(t)およびs’2(t)としてマイクロホンによってキャプチャされ、信号x1(t)およびx2(t)としてブラインド信号源分離段1108を通過するより前に、事前調整(たとえば、ビームフォーミング)されることができる前処理段1106を通過されることができる。
【0106】
入力信号s’1(t)およびs’2(t)は、元の信号源信号s1(t)1102およびs2(t)1104と、音源から1つまたは複数のマイクロホンへのチャネル伝達関数と、入力の混合とに基づいてモデル化されることができる。たとえば、混合入力信号s’(t)が、
【数23】
【0107】
のようにモデル化されることができる畳み込みBSSが使用されることがではるものであり、式中、sj(t)は、j番目の音源発の信号源信号であり、s’i(t)は、i番目のマイクロホンによってキャプチャされた入力信号であり、hij(t)は、j番目の音源とi番目のマイクロホンとの間の伝達関数であり、シンボル
【数24】
【0108】
は畳み込み操作を示す。一方、畳み込みBSSの場合、n≧m、すなわち、マイクロホンの数nが音源の数m以上である場合、完全な分離が達成されることができる。
【0109】
図11では、伝達関数h11(t)およびh12(t)は、第1の信号源から第1および第2のマイクロホンへのチャネル伝達関数を表す。同様に、伝達関数h21(t)およびh22(t)は、第2の信号源から第1および第2のマイクロホンへのチャネル伝達関数を表す。信号は、ブラインド信号源分離段1108に渡すより前に、前処理段1106(ビームフォーミング)を通過する。次いで、(第1および第2のマイクロホンによってキャプチャされるような)混合入力信号s’1(t)およびs’2(t)は、信号x1(t)およびx2(t)を取得するために、ビームフォーミング前処理段1106を通過する。
【0110】
次いで、ブラインド信号源分離は、元のソース信号sj(t)に対応する推定値s<j(t)を分離または抽出するために、混合信号x1(t)に適用されることができる。これを達成するために、フィルタのセットWji(z)は、信号混合を逆転させるために、ブラインド信号源分離段1108において使用されることができる。便宜のために、ブラインド信号源分離は、Z変換領域で表される。この例で、X1(z)はx1(t)のZ領域バージョンであり、X2(z)はx2(t)のZ領域バージョンである。
【0111】
信号X1(z)およびX2(z)は、
【数25】
【0112】
となるように、(時間領域でs(t)に等価である)元のソース信号S(z)の推定値S<(z)を取得するために、フィルタWji(z)に従って変更される。信号推定値S<(z)は、任意の置換および任意の畳み込みまで元の信号S(z)に近似することができる。混合伝達関数hij(t)がZ領域で表される場合、全体的なシステムの伝達関数は、
W(z)H(z)=PD(z) (式35)
のように公式化することができるものであり、式中、Pは置換行列であり、D(z)は対角伝達関数行列である。D(z)の対角線上の要素は、(瞬時BSSで表される)スカラーではなく伝達関数である。
【0113】
ブラインド信号源分離段−無相関化
再び図3を参照すると、元の入力信号s1(t)およびs2(t)が高度に相関することでもあるので、第2の出力x2(t)の信号レベルは、ビームフォーミングモジュール302の後では低くなることができる。これは、ブラインド信号源分離モジュール304の収束レートを低減することがある。ブラインド信号源分離モジュール304の収束レートを最大にするために、第2の較正は、ブラインド信号源分離の前に使用されることができる。図12は、ビームフォーミング前処理段の後であるが、ブラインド信号源分離段1204の前に信号がどのように較正されることができるかの第1の例を示すブロック図である。信号x1(t)およびx2(t)を較正モジュール1202への入力として与えられることができる。この例で、信号x2(t)は、
x~2(t)=c2(t)・x2(t) (式36)
のように、スカラーc2(t)によってスケーリングされる。
【0114】
スカラーc2(t)は、信号x1(t)およびx2(t)に基づいて判断されることができる。たとえば、較正ファクタは、図10および式27、式28および式29に示されるようなx1(t)およびx2(t)のノイズフロア推定値を使用して計算されることができる。
【0115】
較正の後、x1(t)における所望のスピーチ信号は、x~2(t)における所望のスピーチ信号よりはるかに強い。そして、ブラインド信号源分離アルゴリズムが使用されたとき、不確定性を回避することが可能である。実際問題として、ブラインド信号源分離アルゴリズムの別の一般的な問題である信号スケーリングを回避することができるブラインド信号源分離アルゴリズムを使用することが望ましい。
【0116】
図13は、ブラインド信号源分離より前に信号較正を実装する代替方式を示すブロック図である。図8に示された較正プロセスと同様に、較正モジュール1302は、信号x2(t)をスケーリングするためにそれを使用する代わりに、ブラインド信号源分離モジュール1304の適合(たとえば、アルゴリズム、重み、ファクタなど)を変化、構成、または変更するために、第2のスケーリングファクタc2(t)を生成する。
【0117】
ブラインド信号源分離−後処理
再び図3を参照すると、ブラインド信号源分離モジュール304によって出力される1つまたは複数のソース信号推定値y1(t)、y2(t)およびyn(t)は、出力信号s<1(t),s<2(t)およびs<n(t)を与える後処理モジュール308によってさらに処理されることができる。後処理モジュール308は、所望のスピーチ信号推定値の信号対雑音比(SNR)をさらに改善するために追加されることができる。いくつかの場合では、事前調整較正およびビームフォーミングモジュール302が周囲ノイズの良好な推定値を生成した場合、ブラインド信号源分離モジュール304はバイパスされ、後処理モジュール308単独で、所望のスピーチ信号の推定値を生成することができる。同様に、後処理モジュール308は、ブラインド信号源分離モジュール304が所望のスピーチ信号の良好な推定値を生成した場合、バイパスされることができる。
【0118】
信号分離プロセスの後、信号y1(t)およびy2(t)が与えられる。信号y1(t)は、主に所望の信号といくぶん減衰した周囲ノイズとを含むことができる。信号y1(t)は、スピーチ基準信号と呼ばれることがある。周囲ノイズの低減は、ノイズの環境および特性に応じて異なる。信号y2(t)は、主に周囲ノイズを含むことができ、そこでは、所望の信号は低減されている。それはまた、ノイズ基準信号とも呼ばれる。
【0119】
較正およびビームフォーミングモジュール302およびブラインド信号源分離モジュール304の様々な実装形態に従って、ノイズ基準信号中の所望のスピーチ信号は、大部分は除去された。したがって、後処理モジュール308は、スピーチ基準信号からノイズを除去することに集中することができる。
【0120】
図14は、所望のスピーチ基準信号からノイズを低減するために使用される後処理モジュールの動作の例を示すブロック図である。非因果的適応フィルタ1402は、スピーチ基準信号y1(t)中のノイズをさらに低減するために使用されることができる。ノイズ基準信号y2(t)は、適応フィルタ1402への入力として使用されることができる。遅延信号y1(t)は、適応フィルタ1402への基準として使用されることができる。適応フィルタP(z)1402は、最小平均二乗(Least Means Square:LMS)タイプ適応フィルタまたは任意の他の適応フィルタを使用して適合させられることができる。その結果、後処理モジュールは、低減されたノイズとともに所望のスピーチ基準信号を含む出力信号s<1(t)を与えることができることがある。
【0121】
より一般的な意味で、後処理モジュール308は、図2の後処理段215に示すように、出力信号y1(t)およびy2(t)上でノイズ較正を実行することができる。
【0122】
例示的な方法
図15は、一例によるブラインド信号源分離を強調する方法を示す流れ図である。1502で、第1のマイクロホンに関連付けられた第1の入力信号および第2のマイクロホンに関連付けられた第2の入力信号が受信されるか、または取得されることができる。1504で、第1および第2の入力信号は、指向性を第1および第2の入力信号に与え、対応する第1および第2の出力信号を取得するために、第1および第2の入力信号を較正して、ビームフォーミング技法を適用することによって、前処理されることができる。すなわち、このビームフォーミング技法は、ビームフォーミング技法の中でも、図4、図5、図6、図7、図8、図9および/または図10に示された技法を含むことができる。たとえば、2つのマイクロホンシステムにおいて、ビームフォーミング技法は、所望の方向からのサウンド信号をビームフォーマの第1の出力信号中で増幅し、所望の方向からのサウンド信号をビームフォーマの第2の出力信号中で抑制するように、第1および第2の出力信号を生成する。
【0123】
一例では、ビームフォーミング技法は、(たとえば、図9に示されるように)第2の入力信号に適応フィルタを適用すること、第2の入力信号から第1の入力信号を減算すること、および/またはフィルタ処理された第2の入力信号を第1の入力信号に加算すること、を含むことができる。
【0124】
別の例では、ビームフォーミング技法は、(たとえば図5および図6に示されるように)第1の入力信号と第2の入力信号とのエネルギー推定値の比に基づいて較正ファクタを生成することと、較正ファクタを第1の入力信号または第2の入力信号のいずれか1つに適用することと、を含むことができる。
【0125】
代替的に、別の例では、ビームフォーミング技法は、(たとえば図5、図7および図8に示されるように)第1の入力信号と第2の入力信号との間の相互相関推定値と、第2の入力信号のエネルギー推定値との比に基づいて較正ファクタを生成することと、較正ファクタを第1の入力信号または第2の入力信号のうちの少なくともいずれか1つに適用することと、を含むことができる。
【0126】
さらに別の例では、ビームフォーミング技法は、(a)変更された第1の信号を取得するために、第2の入力信号を第1の入力信号に加算すること、(b)変更された第2の信号を取得するために、第2の入力信号から第1の入力信号を減算すること、(c)変更された第1の信号の第1のノイズフロア推定値を取得すること、(d)変更された第2の信号の第2のノイズフロア推定値を取得すること、(e)第1のノイズフロア推定値と第2のノイズフロア推定値との比に基づいて較正ファクタを生成すること、(f)較正ファクタを変更された第2の信号に適用すること、および/または(g)対応する第1および第2の出力信号を取得するために、(たとえば図10に示されるように)変更された第1の信号に適応フィルタを適用し、変更された第2の信号から、フィルタ処理された変更された第1の信号を減算すること、を含むことができる。
【0127】
次いで、1506で、ブラインド信号源分離(BSS)技法は、第1のBSS信号と第2のBSS信号とを生成するために、前処理された第1の出力信号と前処理された第2の出力信号とに適用されることができる。一例では、前較正は、ブラインド信号源分離技法を適用するより前に、出力信号の1つまたは複数上で、(a)第1および第2の出力信号に基づいて較正ファクタを取得することと、(b)(たとえば図12に示されるように)第1および第2の出力信号にブラインド信号源分離技法を適用するより前に、第1および第2の出力信号のうちの少なくとも1つを較正することとによって、実行されることができる。別の例では、ブラインド信号源分離技法を適用するより前に実行される前較正は、(a)第1および第2の出力信号に基づいて較正ファクタを取得することと、(b)(たとえば図13に示されるように)較正ファクタに基づいてブラインド信号源分離技法の動作を変更することと、を含む。
【0128】
1508で、第1および第2の入力信号、第1および第2の出力信号、または第1および第2のBSS信号のうちの少なくとも1つは、随意に較正されることができる。たとえば、第1の較正(たとえば、図2の前処理段較正208)は、振幅ベースの較正または相互相関ベースの較正のいずれかとして、第1および第2の入力信号のうちの少なくとも1つに適用されることができる。さらに、第2の較正(たとえば、図2の中間処理段較正213)は、振幅ベースの較正または相互相関ベースの較正のいずれかとして、ビームフォーミング段からの第1および第2の出力信号のうちの少なくとも1つに適用されることができる。
【0129】
さらに、第3の較正(たとえば、図2の後処理段較正215)は、ノイズベースの較正としてブラインド信号源分離段からの第1および第2のBSS信号のうちの少なくとも1つに適用されることができる。たとえば、1508で、適応フィルタは、第1のBSS信号中のノイズを低減するために第1のBSS信号に(後処理段較正中に)適用されることができ、ここで、第2のBSS信号は、適応フィルタへの入力として使用される。後処理段較正の一例では、適応フィルタは、(たとえば図14に示されるように)第1のBSS信号中のノイズを低減するために第1のBSS信号に適用され、ここで、第2のBSS信号は、適応フィルタへの入力として使用される。
【0130】
さらに別の構成によれば、モバイルデバイス中の回路は、第1のマイクロホンに関連付けられた第1の入力信号を受信するように適合されることができる。同じ回路、異なる回路、あるいは同じまたは異なる回路の第2の部分は、第2のマイクロホンに関連付けられた第2の入力信号を受信するように適合されることができる。さらに、同じ回路、異なる回路、あるいは同じまたは異なる回路の第3の部分は、指向性を第1および第2の入力信号に与えて、対応する第1および第2の出力信号を取得するために、第1および第2の入力信号にビームフォーミング技法を適用するように適合されることができる。第1および第2の入力信号を取得するように適合された回路の部分は、第1および第2の入力信号にビームフォーミングを適用する(1つまたは複数の)回路の部分に直接または間接的に結合されることができ、または、同じ回路とすることができる。同じまたは異なる回路の第4の部分は、第1のBSS信号および第2のBSS信号を生成するために、ブラインド信号源分離(BSS)技法を第1の出力信号と第2の出力信号とに適用するように適合されることができる。随意に、同じまたは異なる回路の第5の部分は、第1および第2の入力信号、第1および第2の出力信号、または第1および第2のBSS信号のうちの少なくとも1つを較正するように適合されることができる。ビームフォーミング技法は、第1の入力信号と第2の入力信号とに異なる指向性を適用することができ、異なる指向性は、他の方向からの(たとえば、直交方向または反対の方向からの)サウンド信号を減衰させながら、第1の方向からのサウンド信号を増幅する。当業者は、一般に、本開示で説明される処理の大部分は、同様の形態で実装されることができることを認識されよう。(1つまたは複数の)回路または回路部分のいずれも、1つまたは複数のプロセッサをもつ集積回路の一部として、単独で、または組合せで実装されることができる。回路の1つまたは複数は、集積回路、アドバンスRISCマシン(Advance RISC Machine:ARM)プロセッサ、デジタル信号プロセッサ(DSP)、汎用プロセッサ上などに実装されることができる。
【0131】
図1、図2、図3、図4、図5、図6、図7、図8、図9、図10、図11、図12、図13、図14および/または図15に示されたコンポーネント、ステップ、および/または機能のうちの1つまたは複数は、単一のコンポーネント、ステップ、または機能に再構成され、および/または組み合わされることができ、あるいは、複数のコンポーネント、ステップ、または機能で実施されることができる。追加の要素、コンポーネント、ステップ、および/または機能が追加されることもできる。図1、図2、図3、図4、図5、図6、図7、図8、図9、図10、図11、図12、図13および/または図14に示された装置、デバイス、および/またはコンポーネントは、図6、図7および/または図15に記載された方法、特徴、またはステップの1つまたは複数を実行するように構成されることができる。本明細書に記載された新規のアルゴリズムは、ソフトウェアおよび/または組込みハードウェアで効率的に実施されることができる。
【0132】
当業者は、さらに、本明細書で開示された構成に関連して説明された様々な例示的な論理ブロック、モジュール、回路、およびアルゴリズムステップは、電子ハードウェア、コンピュータソフトウェア、または両方の組み合わせとして実装されることができることを諒解されよう。ハードウェアとソフトウェアのこの互換性を明確に示すために、様々な例示的なコンポーネント、ブロック、モジュール、回路、およびステップは、上記では概して、それらの機能に関して説明された。そのような機能がハードウェアとして実装されるか、ソフトウェアとして実装されるかは、特定の適用例および全体的なシステムに課される設計制約に依存する。
【0133】
本明細書で説明された様々な特徴は、様々なシステムで実装されることができる。たとえば、ビームフォーミング段およびブラインド信号源分離段は、単一の回路またはモジュール中に、別々の回路またはモジュール上で実装され、1つまたは複数のプロセッサによって実行され、機械可読またはコンピュータ可読媒体中に組み込まれたコンピュータ可読命令によって実行され、および/またはハンドヘルドデバイス、モバイルコンピュータおよび/または移動電話中で実施されることができる。
【0134】
上記の構成は例にすぎず、特許請求の範囲を限定するものと解釈されるべきではないことに留意されたい。構成についての説明は、例示的なものであり、特許請求の範囲の範囲を限定するものではない。したがって、本教示は、他のタイプの装置、ならびに多くの代替形態、修正形態、および変更形態に容易に適用されることができることが当業者には明らかであろう。
【技術分野】
【0001】
少なくとも1つの態様は、信号処理に関し、より詳細には、ブラインド信号源分離(blind source separation)(BSS)技法とともに使用される処理技法に関する。
【背景技術】
【0002】
いくつかのモバイル通信デバイスは、1つまたは複数の信号源からキャプチャされたサウンド信号および/またはオーディオ信号の品質を改善しようとして複数のマイクロホンを採用することができる。これらのオーディオ信号は、バックグラウンドノイズ、妨害、干渉、漏話および他の不要な信号でしばしば乱される。したがって、所望のオーディオ信号を強調するために、そのような通信デバイスは、一般に、複数のマイクロホンによってキャプチャされたオーディオ信号を処理するために、高度信号処理方法を使用する。このプロセスは、他の無関係な信号を抑制しながら、所望のオーディオ信号において改善されたサウンド/ボイス品質、低減されたバックグラウンドノイズなどを提供する信号強調としばしば呼ばれる。スピーチ通信では、所望の信号は通常スピーチ信号であり、信号強調はスピーチ強調と呼ばれる。
【0003】
ブラインド信号源分離(BSS)は信号強調のために使用されることができる。ブラインド信号源分離は、信号源信号の複数の独立した信号混合を使用して、独立した信号源信号を復元するために使用される技術である。各センサは異なる位置に配置され、各センサは、信号源信号の混合である信号を記録する。BSSアルゴリズムは、両方のセンサによって記録された共通情報の空間ダイバーシチを明示する信号差を利用することによって、信号を分離するために使用されることができる。スピーチ通信処理では、異なるセンサは、記録されているスピーチの信号源に対して異なる位置に配置されたマイクロホンを備えることができる。
【0004】
ビームフォーミングは、信号強調のための代替技術である。ビームフォーマは、異なる空間位置から生じる信号を分離するために、空間フィルタリングを実行する。他の方向からの信号は減衰するのに対し、ある方向からの信号は増幅される。したがって、ビームフォーミングは、所望の信号を強調するために、入力信号の指向性を使用する。
【0005】
ブラインド信号源分離とビームフォーミングの両方は、異なる位置に配置された複数のセンサを使用する。各センサは、信号源信号の異なる混合を記録またはキャプチャする。これらの混合は、信号源信号とセンサ(たとえば、マイクロホン)との間の空間的な関係を含む。信号強調を達成するために、この情報が利用される。
【0006】
間隔が密なマイクロホンを有する通信デバイスでは、マイクロホンからキャプチャされた入力信号は、マイクロホン同士が極めて近接しているために、高度に相関することがある。この場合、ブラインド信号源分離を含む従来のノイズ抑制方法は、ノイズから所望の信号をうまく分離することできないことがある。たとえば、デュアルマイクロホンシステムでは、BSSアルゴリズムは、混合入力信号を取り、所望のスピーチ信号と周囲ノイズとの推定値を含む2つの出力を生成することがある。しかしながら、信号分離の後、2つの出力信号のうちのどちらが所望のスピーチ信号であり、どちらが周囲ノイズであるかを判断することができないことがある。BSSアルゴリズムのこの固有の不確定性は、大きなパフォーマンス劣化を生じる。
【0007】
したがって、間隔が密なマイクロホンを有する通信デバイス上でのブラインド信号源分離のパフォーマンスを改善するための方法が必要である。
【発明の概要】
【0008】
高度に相関する信号混合のブラインド信号源分離のための方法が提供される。第1のマイクロホンに関連付けられた第1の入力信号が受信される。第2のマイクロホンに関連付けられた第2の入力信号も受信される。ビームフォーミング技法は、第1および第2の入力信号に指向性を与え、対応する第1および第2の出力信号を取得するために、第1および第2の入力信号に適用されることができる。ブラインド信号源分離(BSS)技法は、第1のBSS信号と第2のBSS信号とを生成するために、第1の出力信号と第2の出力信号とに適用されることができる。第1および第2の入力信号、第1および第2の出力信号、または第1および第2のBSS信号、のうちの少なくとも1つが較正されることができる。
【0009】
ビームフォーミング技法は、第1および第2の入力信号に空間フィルタを適用することによって第1および第2の入力信号に指向性を与えることができる。第1および第2の入力信号に空間フィルタを適用することは、他の方向からのサウンド信号を減衰させながら、第1の方向からのサウンド信号を増幅することができる。第1および第2の入力信号に空間フィルタを適用することは、得られた第1の出力信号中の所望のスピーチ信号を増幅することができ、第2の出力信号中の所望のスピーチ信号を減衰させる。
【0010】
一例では、第1および第2の入力信号のうちの少なくとも1つを較正することは、第2の入力信号に適応フィルタを適用することを備えることができる、ビームフォーミング技法を適用することは、第2の入力信号から第1の入力信号を減算することを含むことができる。ビームフォーミング技法を適用することは、フィルタ処理された第2の入力信号を第1の入力信号に加算することをさらに備えることができる。
【0011】
別の例では、第1および第2の入力信号のうちの少なくとも1つを較正することは、第1の入力信号と第2の入力信号とのエネルギー推定値の比に基づいて較正ファクタを生成することと、第1の入力信号または第2の入力信号のうちの少なくともいずれか1つに較正ファクタを適用することと、をさらに備えることができる。
【0012】
さらに別の例では、第1および第2の入力信号のうちの少なくとも1つを較正することは、第1の入力信号と第2の入力信号との間の相互相関推定値と、第2の入力信号のエネルギー推定値との比に基づいて較正ファクタを生成することと、第2の入力信号にその較正ファクタを適用することとをさらに備えることができる。
【0013】
さらに別の例では、第1および第2の入力信号のうちの少なくとも1つを較正することは、第1の入力信号と第2の入力信号との間の相互相関推定値と、第1の入力信号のエネルギー推定値との比に基づいて較正ファクタを生成することと、第1の入力信号にその較正ファクタを適用することとをさらに備えることができる。
【0014】
さらに別の例では、第1および第2の入力信号のうちの少なくとも1つを較正することは、第1の入力信号と第2の入力信号との間の相互相関推定値と、第2の入力信号のエネルギー推定値との比に基づいて較正ファクタを生成することと、第2の入力信号にその較正ファクタを乗算することと、第1の入力信号をその較正ファクタで除算することと、をさらに備えることができる。
【0015】
一例では、第1および第2の入力信号にビームフォーミング技法を適用することは、変更された第1の信号を取得するために第2の入力信号を第1の入力信号に加算することと、変更された第2の信号を取得するために第2の入力信号から第1の入力信号を減算することと、をさらに備えることができる。第1および第2の入力信号のうちの少なくとも1つを較正することは、(a)変更された第1の信号の第1のノイズフロア推定値を取得すること、(b)変更された第2の信号の第2のノイズフロア推定値を取得すること、(c)第1のノイズフロア推定値と第2のノイズフロア推定値との比に基づいて較正ファクタを生成すること、(d)較正ファクタを変更された第2の信号に適用すること、および/または(e)変更された第1の信号に適応フィルタを適用し、変更された第2の信号からフィルタ処理された変更された第1の信号を減算すること、をさらに備えることができる。
【0016】
高度に相関する信号混合のブラインド信号源分離のための方法はまた、(a)第1および第2の出力信号に基づいて較正ファクタを取得すること、および/または(b)第1および第2の出力信号にブラインド信号源分離技法を適用するより前に、第1および第2の出力信号のうちの少なくとも1つを較正することをさらに備えることができる。
【0017】
高度に相関する信号混合のブラインド信号源分離のための方法はまた、(a)第1および第2の出力信号に基づいて較正ファクタを取得すること、および/または(b)較正ファクタに基づいてブラインド信号源分離技法の動作を変更することをさらに備えることができる。
【0018】
高度に相関する信号混合のブラインド信号源分離のための方法はまた、第1のBSS信号中のノイズを低減するために第1のBSS信号に適応フィルタを適用することをさらに備えることができ、第2のBSS信号は、適応フィルタへの入力として使用される。
【0019】
高度に相関する信号混合のブラインド信号源分離のための方法はまた、(a)振幅ベースの較正または相互相関ベースの較正のうちの少なくとも1つを適用することによって、第1および第2の入力信号のうちの少なくとも1つを較正すること、(b)振幅ベースの較正または相互相関ベースの較正のうちの少なくとも1つを適用することによって、第1および第2の出力信号のうちの少なくとも1つを較正すること、および/または(c)ノイズベースの較正を適用することを含む、第1および第2のBSS信号のうちの少なくとも1つを較正すること、をさらに備えることができる。
【0020】
1つまたは複数の較正モジュールとブラインド信号源分離モジュールとに結合された1つまたは複数のマイクロホンを備える通信デバイスもまた提供される。第1のマイクロホンは、第1の入力信号を取得するように構成されることができる。第2のマイクロホンは、第2の入力信号を取得するように構成されることができる。較正モジュールは、対応する第1および第2の出力信号を取得するために、第1および第2の入力信号に対してビームフォーミングを実行するように構成される。ブラインド信号源分離モジュールは、第1のBSS信号と第2のBSS信号とを生成するために、ブラインド信号源分離(BSS)技法を第1の出力信号と第2の出力信号とに実行するように構成されることができる。少なくとも1つの較正モジュールは、第1および第2の入力信号、第1および第2の出力信号、または第1および第2のBSS信号のうちの少なくとも1つを較正するように構成されることができる。通信デバイスは、また、第1のBSS信号中のノイズを低減するために、第1のBSS信号に適応フィルタを適用するように構成された後処理モジュールをも含むことができ、第2のBSS信号は、適応フィルタへの入力として使用される。
【0021】
ビームフォーミングモジュールは、第1および第2の入力信号に空間フィルタを適用することによってビームフォーミングを実行することができ、第1および第2の入力信号に空間フィルタを適用することは、他の方向からのサウンド信号を減衰させながら、第1の方向からのサウンド信号を増幅する。第1の入力信号と第2の入力信号とに空間フィルタを適用することは、得られた第1の出力信号中の所望のスピーチ信号を増幅することができ、第2の出力信号中の所望のスピーチ信号を減衰させることができる。
【0022】
一例では、第1および第2の入力信号に対してビームフォーミングを実行することにおいて、ビームフォーミングモジュールは、(a)第2の入力信号に適応フィルタを適用し、(b)第2の入力信号から第1の入力信号を減算し、(c)フィルタ処理された第2の入力信号を第1の入力信号に加算する、ようにさらに構成されることができる。
【0023】
一例では、第1および第2の入力信号のうちの少なくとも1つを較正することにおいて、較正モジュールは、(a)第1の入力信号と第2の入力信号との間の相互相関推定値と、第2の入力信号のエネルギー推定値との比に基づいて較正ファクタを生成し、および/または(b)較正ファクタを第2の入力信号に適用する、ようにさらに構成されることができる。
【0024】
別の例では、第1および第2の入力信号のうちの少なくとも1つを較正することにおいて、較正モジュールは、(a)第1の入力信号と第2の入力信号との間の相互相関推定値と、第1の入力信号のエネルギー推定値との比に基づいて較正ファクタを生成し、および/または(b)較正ファクタを第1の入力信号に適用するようにさらに構成されることができる。
【0025】
別の例では、第1および第2の入力信号のうちの少なくとも1つを較正することにおいて、較正モジュールは、(a)第1の入力信号と第2の入力信号との間の相互相関推定値と、第2の入力信号のエネルギー推定値とに基づいて較正ファクタを生成し、(b)第2の入力信号に較正ファクタを乗算し、および/または(c)第1の入力信号を較正ファクタで除算する、ようにさらに構成されることができる。
【0026】
別の例では、第1および第2の入力信号に対してビームフォーミングを実行することにおいて、ビームフォーミングモジュールは、(a)変更された第1の信号を取得するために、第2の入力信号を第1の入力信号に加算し、(b)変更された第2の信号を取得するために、第2の入力信号から第1の入力信号を減算し、(c)変更された第1の信号の第1のノイズフロア推定値を取得し、(d)変更された第2の信号の第2のノイズフロア推定値を取得する、ようにさらに構成されることができ、および/または較正モジュールは、(e)第1のノイズフロア推定値と第2のノイズフロア推定値との比に基づいて較正ファクタを生成し、および/または(f)較正ファクタを変更された第2の信号に適用する、ようにさらに構成されることができる。
【0027】
一例では、少なくとも1つの較正モジュールは、振幅ベースの較正または相互相関ベースの較正のうちの少なくとも1つを、第1および第2の入力信号に適用するように構成された第1の較正モジュールを含むことができる。
【0028】
別の例では、少なくとも1つの較正モジュールは、振幅ベースの較正または相互相関ベースの較正のうちの少なくとも1つを、第1および第2の出力信号に適用するように構成された第2の較正モジュールを含むことができる。
【0029】
別の例では、少なくとも1つの較正モジュールは、ノイズベースの較正を第1および第2のBSS信号に適用するように構成された第3の較正モジュールを含むことができる。
【0030】
したがって、(a)第1のマイクロホンに関連付けられた第1の入力信号と、第2のマイクロホンに関連付けられた第2の入力信号とを受信するための手段、(b)指向性を第1および第2の入力信号に与えて、対応する第1および第2の出力信号を取得するために、第1および第2の入力信号にビームフォーミング技法を適用するための手段、(c)第1のBSS信号と第2のBSS信号とを生成するために、ブラインド信号源分離(BSS)技法を第1の出力信号と第2の出力信号とに適用するための手段、(d)第1および第2の入力信号、第1および第2の出力信号、または第1および第2のBSS信号のうちの少なくとも1つを較正するための手段、(e)第1のBSS信号中のノイズを低減するために第1のBSS信号に適応フィルタを適用するための手段であって、第2のBSS信号は、適応フィルタへの入力として使用される、第1のBSS信号に適応フィルタを適用するための手段、(f)第2の入力信号に適応フィルタを適用するための手段、(g)第2の入力信号から第1の入力信号を減算するための手段、(h)フィルタ処理された第2の入力信号を第1の入力信号に加算するための手段、(i)第1および第2の出力信号に基づいて較正ファクタを取得するための手段、(j)第1および第2の出力信号にブラインド信号源分離技法を適用するより前に、第1および第2の出力信号のうちの少なくとも1つを較正するための手段、(k)第1および第2の出力信号に基づいて較正ファクタを取得するための手段、および/または(l)較正ファクタに基づいてブラインド信号源分離技法の動作を修正するための手段、を備える通信デバイスが提供される。
【0031】
2つ以上の信号のブラインド信号源分離を強調するための回路であって、(a)第1のマイクロホンに関連付けられた第1の入力信号と第2のマイクロホンに関連付けられた第2の入力信号とを受信し、(b)指向性を第1および第2の入力信号に与え、対応する第1および第2の出力信号を取得するために、第1および第2の入力信号にビームフォーミング技法を適用し、(c)第1のBSS信号と第2のBSS信号とを生成するために、ブラインド信号源分離(BSS)技法を第1の出力信号と第2の出力信号とに適用し、および/または(d)第1および第2の入力信号、第1および第2の出力信号、または第1および第2のBSS信号のうちの少なくとも1つを較正するように適合される、回路が提供される。ビームフォーミング技法は、第1の入力信号と第2の入力信号とに空間フィルタを適用し、空間フィルタは、他の方向からのサウンド信号を減衰させながら、第1の方向からのサウンド信号を増幅する。一例では、回路は集積回路である。
【0032】
2つ以上の信号のブラインド信号源分離を強調するための命令を備えるコンピュータ可読媒体がまた提供され、その命令は、プロセッサによって実行されるときに、(a)第1のマイクロホンに関連付けられた第1の入力信号と第2のマイクロホンに関連付けられた第2の入力信号とを取得すること、(b)指向性を第1および第2の入力信号に与え、対応する第1および第2の出力信号を取得するために、第1および第2の入力信号にビームフォーミング技法を適用すること、(c)第1のBSS信号と第2のBSS信号とを生成するために、ブラインド信号源分離(BSS)技法を前処理された第1の出力信号と前処理された第2の出力信号とに適用すること、および/または(d)第1および第2の入力信号、第1および第2の出力信号、または第1および第2のBSS信号のうちの少なくとも1つを較正することをプロセッサに行わせることができる。
【0033】
本態様の特徴、特性、および利点は、全体を通じて同様の参照符号が同様のものを指す図面とともに、以下に記載する詳細な説明を読めばより明らかになるだろう。
【図面の簡単な説明】
【0034】
【図1】図1は、信号強調を実行するように構成されたモバイル通信デバイスの例を示す図である。
【図2】図2は、間隔が密なマイクロホンのために信号強調を実行するように構成されたモバイル通信デバイスのコンポーネントおよび機能を示すブロック図である。
【図3】図3は、一例による、連続ビームフォーマおよびブラインド信号源分離段の一例のブロック図である。
【図4】図4は、空間ビームフォーミングを実行するように構成されたビームフォーミングモジュールの例のブロック図である。
【図5】図5は、2つ以上のマイクロホンからの入力信号を使用する較正およびビームフォーミングの第1の例を示すブロック図である。
【図6】図6は、2つのマイクロホン信号に基づいてビームフォーミングを実装する前に、2つのマイクロホン信号を較正するために適用される較正ファクタを取得するための第1の方法を示す流れ図である。
【図7】図7は、2つのマイクロホン信号に基づいてビームフォーミングを実装する前に、2つのマイクロホン信号を較正するために適用される較正ファクタを取得するための第2の方法を示す流れ図である。
【図8】図8は、2つ以上のマイクロホンからの入力信号を使用する較正およびビームフォーミングの第2の例を示すブロック図である。
【図9】図9は、2つ以上のマイクロホンからの入力信号を使用する較正およびビームフォーミングの第3の例を示すブロック図である。
【図10】図10は、2つ以上のマイクロホンからの入力信号を使用する較正およびビームフォーミングの第4の例を示すブロック図である。
【図11】図11は、複数の混合入力信号から信号源信号を復元する畳み込みブラインド信号源分離の動作を示すブロック図である。
【図12】図12は、ビームフォーミング前処理段の後であるが、ブラインド信号源分離段の前に信号がどのように較正されるかの第1の例を示すブロック図である。
【図13】図13は、ブラインド信号源分離より前に信号較正を実装する代替方式を示すブロック図である。
【図14】図14は、所望のスピーチ基準信号からノイズを低減するために使用される後処理モジュールの動作の例を示すブロック図である。
【図15】図15は、一例によるブラインド信号源分離を強調する方法を示す流れ図である。
【発明を実施するための形態】
【0035】
以下の説明では、構成の十分な理解が得られるように具体的な詳細が与えられる。ただし、その構成は、これらの具体的な詳細なしに実施できることを、当業者なら理解されよう。たとえば、構成を不必要な詳細で不明瞭にしないために、回路をブロック図で示すことがある。他の場合、構成を不明瞭にしないために、よく知られている回路、構造および技法を詳細に示すことがある。
【0036】
また、構成は、フローチャート、流れ図、構造図、またはブロック図として示されるプロセスとして説明されることがあることに留意されたい。フローチャートは、動作を逐次プロセスとして説明することがあるが、動作の多くは並行してまたは同時に実行されることができる。さらに、動作の順序は、並べ替えられることができる。プロセスは、その動作が完了されると終了される。プロセスは、方法、関数、プロシージャ、サブルーチン、サブプログラムなどに対応することができる。プロセスが関数に対応する場合、その終了は、呼出し側関数またはメイン関数への関数の復帰に対応する。
【0037】
1つまたは複数の例および/または構成では、説明された機能は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの組合せで実装されることができる。ソフトウェアで実装される場合、機能は、1つまたは複数の命令またはコードとしてコンピュータ可読媒体上に記憶されるか、あるいはコンピュータ可読媒体を介して送信されることができる。コンピュータ可読媒体は、コンピュータ記憶媒体と、ある場所から別の場所へのコンピュータプログラムの転送を可能にするいかなる媒体をも含む通信媒体との両方を含む。記憶媒体は、汎用または専用コンピュータによってアクセスされることができる任意の利用可能な媒体とすることができる。限定ではなく例として、そのようなコンピュータ可読媒体は、RAM、ROM、EEPROM、CD−ROM、あるいは他の光ディスクストレージ、磁気ディスクストレージまたは他の磁気ストレージデバイス、もしくは命令またはデータ構造の形の所望のプログラムコード手段を搬送または記憶するために使用されることができ、汎用または専用コンピュータあるいは汎用または専用プロセッサによってアクセスされることができる任意の他の媒体を備えることができる。さらに、いかなる接続も、正しくはコンピュータ可読媒体と呼ばれる。たとえば、ソフトウェアが、同軸ケーブル、光ファイバケーブル、ツイストペア、デジタル加入者回線(DSL)、または赤外線、無線、およびマイクロ波などのワイヤレス技術を使用して、ウェブサイト、サーバ、または他のリモート信号源から送信される場合、同軸ケーブル、光ファイバケーブル、ツイストペア、DSL、または赤外線、無線、およびマイクロ波などのワイヤレス技術は、媒体の定義に含まれる。本明細書では、ディスク(disk)およびディスク(disc)は、コンパクトディスク(disc)(CD)、レーザディスク(disc)、光ディスク(disc)、デジタル多用途ディスク(disc)(DVD)、フロッピー(登録商標)ディスク(disk)およびブルーレイディスク(disc)を含み、この場合、ディスク(disk)は、通常、データを磁気的に再生し、ディスク(disc)はデータをレーザで光学的に再生する。上記の組合せもコンピュータ可読媒体の範囲内に含められる。
【0038】
さらに、記憶媒体は、読取り専用メモリ(ROM)、ランダムアクセスメモリ(RAM)、磁気ディスク記憶媒体、光記憶媒体、フラッシュメモリデバイス、および/または情報を記憶するための他の機械可読媒体を含む、データを記憶するための1つまたは複数のデバイスを表すことができる。
【0039】
さらに、ハードウェア、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、および/またはそれらの任意の組合せによって様々な構成が実装されることができる。ソフトウェア、ファームウェア、ミドルウェア、またはマイクロコードで実装された場合、必要なタスクを実行するためのプログラムコードまたはコードセグメントは、記憶媒体または(1つまたは複数の)他の記憶装置などのコンピュータ可読媒体に記憶されることができる。プロセッサは、必要なタスクを実行することができる。コードセグメントは、プロシージャ、関数、サブプログラム、プログラム、ルーチン、サブルーチン、モジュール、ソフトウェアパッケージ、クラス、または命令、データ構造もしくはプログラムステートメントの任意の組合せを表すことができる。コードセグメントは、情報、データ、引数、パラメータ、またはメモリ内容をパスおよび/または受信することによって、別のコードセグメントまたはハードウェア回路に結合されることができる。情報、引数、パラメータ、データなどは、メモリ共有、メッセージパッシング、トークンパッシング、ネットワーク送信などを含む任意の適切な手段を介してパス、転送、または送信されることができる。
【0040】
1つの特徴は、ブラインド信号源分離を実行する前に入力信号を事前調整する前処理段を設け、それによってブラインド信号源分離アルゴリズムのパフォーマンスを改善する。ブラインド信号源分離に関連付けられた不確定性問題を回避するために、まず、マイクロホン信号を事前調整するために、較正およびビームフォーミング段が使用される。次いで、所望のスピーチ信号と周囲ノイズとを分離するために、ビームフォーマ出力信号に対してブラインド信号源分離が実行される。この特徴は、少なくとも2つのマイクロホンが使用され、(少なくとも2つのマイクロホン信号からの)ただ1つの信号が、強調されるべき所望される信号であると仮定する。たとえば、所望の信号は、通信デバイスを使用している人から発生するスピーチ信号とすることができる。
【0041】
一例では、それぞれ所望のスピーチ信号および周囲ノイズの混合物を含むと仮定される2つのマイクロホン信号が通信デバイス上でキャプチャされることができる。まず、マイクロホン信号を事前調整するために、較正およびビームフォーミング段が使用される。事前調整された信号の1つまたは複数は、さらなる処理の前および/または後に、再び較正されることができる。たとえば、まず事前調整された信号が較正されることができ、次いで、ブラインド信号源分離アルゴリズムが元の信号を再構成するために使用される。ブラインド信号源分離アルゴリズムは、信号分離パフォーマンスをさらに改善するために後処理モジュールを使用しても使用しなくてもよい。
【0042】
いくつかの例は、説明のために「スピーチ信号」という用語を使用することがあるが、様々な特徴は、ボイス、ボイス、ミュージックなどを含むすべてのタイプの「サウンド信号」にも当てはまることは明らかである。
【0043】
1つの態様は、マイクロホン信号記録が高度に相関され、1つの信号源信号が所望の信号であるブラインド信号源分離パフォーマンスを改善することを提供する。システムの全体的なパフォーマンスを改善するために、スペクトル減算技法などの非線形処理方法が、後処理の後に採用されることができる。非線形処理はさらに、ノイズおよび他の望ましくない信号源信号から所望の信号を区別するのに役立つことができる。
【0044】
図1は、信号強調を実行するように構成されたモバイルデバイスの例を示す。モバイルデバイス102は、1つまたは複数の信号源からオーディオ信号をキャプチャするために配置された少なくとも2つのマイクロホン104および106を含む、携帯電話、セルラー電話、携帯情報端末、デジタルオーディオレコーダー、通信デバイスなどとすることができる。マイクロホン104および106は、通信デバイス102中の様々な位置に配置されることができる。たとえば、マイクロホン104および106は、所望のスピーチ信号源(たとえば、ユーザ)からのオーディオ信号をキャプチャするように、モバイルデバイス102の同じ側に互いにかなり近接して配置されることができる。2つのマイクロホン間の距離は、たとえば、0.5センチメートルから10センチメートルまで変動することがある。この例は、2つのマイクロホン構成を示しているが、他の実装形態は、異なる位置にある追加のマイクロホンを含むことができる。
【0045】
スピーチ通信では、所望のスピーチ信号は、街頭ノイズ、バブルノイズ、自動車ノイズなどを含む周囲ノイズでしばしば乱される。そのようなノイズは、所望のスピーチの了解度を低減するだけでなく、スピーチを聴取者にとって不快なものにする。したがって、スピーチ信号を通信の他の当事者に送信する前に、周囲ノイズを低減することが望ましい。したがって、モバイルデバイス102は、キャプチャされたサウンド信号の品質を強調するために、信号処理を実行するように構成または適合されることができる。
【0046】
ブラインド信号源分離(BSS)は、周囲ノイズを低減するために使用されることができる。BSSは、所望のスピーチを1つの元の信号源として扱い、周囲ノイズを別の信号源として扱う。分離された信号を互いから独立させることによって、周囲ノイズから所望のスピーチを分離すること、すなわち、スピーチ信号中の周囲ノイズを低減し、周囲ノイズ信号中の所望のスピーチを低減することができる。一般に、所望のスピーチは、独立した信号源である。しかし、ノイズは、いくつかの方向から来ることができる。したがって、周囲ノイズ信号のスピーチ低減は、よく行われことができる。ただし、スピーチ信号のノイズ低減は、音響環境に依存することがあり、周囲ノイズ信号のスピーチ低減よりも難しいことがある。すなわち、周囲ノイズの分散性質のために、ブラインド信号源分離の目的でそれを単一の信号源として表すことが困難になる。
【0047】
2つのマイクロホン104および106を近くに配置した結果として、2つのマイクロホン104および106によってキャプチャされたオーディオ信号は高度に相関し、信号差は非常に小さくなることがある。したがって、従来のブラインド信号源分離処理は、所望のオーディオ信号を強調することに成功しないことがある。したがって、モバイルデバイス102は、たとえば、ブラインド信号源分離段の前段に較正およびビームフォーミング段を実装することによって、周囲ノイズから所望のスピーチを分離するように構成または適合されることができる。
【0048】
図2は、間隔が密なマイクロホンのために信号強調を実行するように構成されたモバイルデバイスのコンポーネントおよび機能を示すブロック図である。モバイルデバイス202は、随意の前処理(較正)段208に通信可能に結合された少なくとも2つの(単方向または全方向)マイクロホン204および206と、後続のビームフォーミング段211と、後続の別の随意の中間処理(較正)段213と、後続のブラインド信号源分離段210と、後続の随意の後処理(たとえば、較正)段215と、を含むことができる。少なくとも2つのマイクロホン204および206は、1つまたは複数の音源216、218および220から、混合音響信号S1212およびS2214をキャプチャすることができる。たとえば、音響信号S1212およびS2214は、音源216、218および220からの2つ以上のソースサウンド信号so1とso2とsoNとの混合とすることができる。音源216、218および220は、1つまたは複数のユーザ、バックグラウンドまたは周囲ノイズなどを表すことができる。キャプチャされた入力信号S’1およびS’2は、サンプリングされたサウンド信号s1(t)およびs2(t)を提供するために、アナログデジタル変換器207および209によってサンプリングされることができる。
【0049】
音響信号S1212およびS2214は、所望のサウンド信号と不要なサウンド信号とを含むことがある。「サウンド信号」という用語は、限定はしないが、オーディオ信号、スピーチ信号、ノイズ信号、および/またはマイクロホンによって音響的に送信およびキャプチャされることができる他のタイプの信号を含む。
【0050】
前処理(較正)段208、ビームフォーミング段211および/または中間処理(較正)段213は、ブラインド信号源分離に関連する不確定性問題を回避するために、キャプチャされたサンプリングされた信号s1(t)とs2(t)とを事前調整するように構成または適合されることができる。すなわち、ブラインド信号源分離アルゴリズムは、所望のスピーチ信号と周囲ノイズとを分離するために使用されることができるが、これらのアルゴリズムは、信号分離の後、どの出力信号が所望のスピーチ信号であり、どの出力信号が周囲ノイズであるかを判断することができない。これは、すべてブラインド信号源分離アルゴリズムの固有の不確定性による。ただし、いくつかの仮定の下で、一部のブラインド信号源分離アルゴリズムは、そのような不確定性を回避することが可能であることがある。たとえば、所望のスピーチが1つの入力チャネル中で他のチャネル中よりもはるかに強い場合、ブラインド信号源分離の結果が確定する可能性がある。しかし、信号S’1およびS’2が、間隔が密なマイクロホンを使用してキャプチャされた場合、そのような仮定は有効ではない。したがって、ブラインド信号源分離アルゴリズムが受信信号S’1およびS’2(または、デジタル化サウンド信号s1(t)およびs2(t))に直接適用された場合、不確定性問題が持続する可能性がある。その結果、信号S’1およびS’2は、所望の方向からの信号受信を強調するために、2つ以上の信号源サウンド信号so1、so2およびsoNの指向性を利用する前処理(たとえば、較正段208および/または213および/またはビームフォーミング段211)にかけられることがある。
【0051】
ビームフォーミング段211は、受信したサウンド信号s1(t)およびs2(t)の指向性を利用することによって、有用なサウンド信号を区別するように構成されることができる。ビームフォーミング段211は、少なくとも2つ以上のマイクロホン212および214によってキャプチャされた信号を線形結合することによって、空間フィルタ処理を実行することができる。空間フィルタ処理は、所望の方向からのサウンド信号の受信を強調し、他の方向から来る干渉信号を抑制する。たとえば、2つのマイクロホンシステムでは、ビームフォーミング段211は、第1の出力x1(t)および第2の出力x2(t)を生成する。第1の出力x1(t)では、所望のスピーチが空間フィルタ処理によって強調される。第2の出力x2(t)では、所望のスピーチが抑制されることができ、周囲ノイズ信号が強調されることができる。
【0052】
たとえば、ユーザが第1の音源218である場合、元のソース信号so2が、所望のソースサウンド信号(たとえば、所望のスピーチ信号)である。したがって、第1の出力x1(t)では、ビームフォーミング段211は、他の音源216および220からの信号so1およびsoNを抑制しながら、第1の音源218からの受信を強調するようにビームフォーミングを実行することができる。第2の出力x2(t)では、較正段208および/または213および/またはビームフォーミング段211は、所望のスピーチ信号を抑制し、周囲ノイズ信号を強調するように空間ノッチフィルタ処理(spatial notch filtering)を実行することができる。
【0053】
出力信号x1(t)およびx2(t)は、所望のスピーチ信号と周囲ノイズとを分離するために、ブラインド信号源分離段210を通過されることができる。独立成分分析(Independent Component Analysis:ICA)としても知られているブラインド信号源分離(BSS)は、これらの信号の複数の混合に基づいてソース信号を復元するために使用されることができる。信号分離プロセス中に、ソースサウンド信号so1とso2とsoNとの混合である限られた数の信号x1(t)、x2(t)のみが利用可能である。混合プロセスに関する従来の情報は、利用可能ではない。ソースサウンド信号の直接的な測定値は、利用可能ではない。一部または全部のソース信号so1、so2およびsoNの演繹的な統計情報が利用可能である場合がある。たとえば、ソース信号の1つは、ガウス分布されることができ、別のソース信号は、一様に分布されることができる。
【0054】
ブラインド信号源分離段210は、ノイズが低減された第1のBSS信号
【数1】
【0055】
およびスピーチが低減された第2のBSS信号s<2(t)を与えることができる。その結果、第1のBSS信号s<1(t)は、所望のスピーチ信号を搬送することができる。第1のBSS信号s<1(t)は、送信機222によってその後送信される224とすることができる。
【0056】
図3は、一例による、連続ビームフォーマおよびブラインド信号源分離段のブロック図である。較正およびビームフォーミングモジュール302は、2つ以上の入力信号s1(t)、s2(t)およびsn(t)を事前調整し、次いで、ブラインド信号源分離モジュール304への入力として使用される、対応する出力信号x1(t)、x2(t)およびxn(t)を与えるように構成されることができる。2つ以上の入力信号s1(t)、s2(t)およびsn(t)は、互い相関されるか、または依存されることができる。ビームフォーミングを介した信号強調は、2つ以上の入力信号s1(t)、s2(t)およびsn(t)が、独立ランダムプロセスとしてモデル化されることを必要としないことができる。入力信号s1(t)、s2(t)およびsn(t)は、サンプリングされた離散時間信号とすることができる。
【0057】
ビームフォーミング段原理
ビームフォーミングでは、入力信号si(t)は、出力信号xi(t)を生成するために、空間と時間の両方において線形フィルタ処理されることができる。即ち、
【数2】
【0058】
式中、k−1は、n個のマイクロホンチャネル入力の各々での遅延タップの数である。所望のソース信号がssource(t)(たとえば、図2中の第1の音源218からのソース信号so2)によって表される場合、ビームフォーマ重みwi(p)は、ビームフォーマ出力xi(t)が、所望のソース信号ssource(t)の推定値s<source(t)を与えるように選択されることができる。この現象は、一般に所望のソース信号ssource(t)の方向でのビームの形成と呼ばれる。
【0059】
ビームフォーマは、概して、固定のビームフォーマおよび適応型ビームフォーマの2つのタイプに分類されることができる。固定のビームフォーマは、複数のマイクロホンから取得された空間時間サンプルを組み合わせるために固定のフィルタ重みを採用するデータ独立型ビームフォーマである。適応型ビームフォーマは、ビームフォーマのフィルタ重みを導出するために、入力信号の統計知識を採用するデータ従属型ビームフォーマである。
【0060】
図4は、空間ビームフォーミングを実行するように構成されたビームフォーミングモジュールの一例のブロック図である。空間のみのビームフォーミングは、空間時間ビームフォーミング方法のサブセット(すなわち、固定のビームフォーマ)である。ビームフォーミングモジュール402は、複数の入力信号s1(t),s2(t),... sn(t)を受信し、指向強調された1つまたは複数の出力信号
【数3】
【0061】
を与えるように構成されることができる。トランスポーザ404は、複数の入力信号s1(t),s2(t),... sn(t)を受信し、信号ベクトルs>(t)=[s1(t),s2(t),... sn(t)]Tを取得するための転置演算を実行するものであり、式中、上付き文字Tは転置演算を示す。
【0062】
次いで、信号ベクトルs>(t)は、関連する信号を強調することか、または不要な信号を抑制することのいずれかを行うように、空間重みベクトルによってフィルタ処理されることができる。空間重みベクトルは、他の方向からの信号を抑制しながら、特定の方向(たとえば、重みによって規定されたビームの方向)からキャプチャされた信号を強調する。
【0063】
たとえば、空間ノイズフィルタ406は、信号ベクトルs>(t)を受信し、
x>(t)=w>Ts>(t) (式2)
となるような第1のビームフォーマ出力x>(t)を生成するために、n×1の第1の空間重みベクトルw>T=[w1,w2,... wn]Tを適用することによってそれをフィルタ処理することができる。このビームフォーマは、所望の(サウンドまたはスピーチ)信号の信号強調を行うために、入力信号s1(t),s2(t),... sn(t)の空間情報を利用することができる。
【0064】
別の例では、ビームフォーミングモジュール402は、第2のビームフォーマ出力Z>(t)から所望の信号を抑制する空間ノッチフィルタ408を含むことができる。この場合、空間ノッチフィルタ408は、
v>Tw>T=0 (式3)
となるように、第1の空間重みベクトルw>Tと直交する、第2のn×1空間重みベクトルv>T=[v1,v2,..., vn]Tを使用することによって、所望の方向から来る信号を抑制する。所望の信号が最小限に抑えられた、第2のビームフォーマ出力z>(t)を生成するために、空間ノッチフィルタ408が入力信号ベクトルs>(t)に適用される。
【0065】
z>(t)=z>Ts>(t) (式4)
第2のビームフォーマ出力z>(t)は、キャプチャされた入力信号中のバックグラウンドノイズの推定値を与えることができる。このようにして、第2のビームフォーマ出力z>(t)は、第1のビームフォーマ出力x>(t)に対して直交方向からのものとすることができる。
【0066】
ビームフォーミングモジュール402によって提供される空間弁別機能は、伝搬する信号の波長に対して使用される2つ以上のマイクロホンの間隔に依存することができる。2つ以上のマイクロホン間の相対的な距離が増加するにつれて、ビームフォーミングモジュール402の指向性/空間弁別は一般に改善する。したがって、間隔が密なマイクロホンについて、ビームフォーミングモジュール402の指向性はより不十分であることがあり、信号強調または抑制を改善するために、さらに時間的な後処理が実行されることができる。ただし、ビームフォーミングモジュール402のそのようなパフォーマンスの限界にもかかわらず、後続のブラインド信号源分離段のパフォーマンスを改善することは、それでも出力信号x>(t)中とz>(t)中とで空間弁別を十分に行うことができる。図4のビームフォーミングモジュール402中の出力信号x>(t)およびz>(t)は、図3のビームフォーミングモジュール302または図2のビームフォーミング段211からの出力信号x1(t)およびx2(t)とすることができる。
【0067】
ビームフォーミングモジュール302は、入力信号に対して様々な追加の前処理動作を実装することができる。いくつかの例では、2つのマイクロホンによってキャプチャされた信号間のサウンドレベル(たとえば、電力レベル、エネルギーレベル)にかなりの差があることがある。サウンドレベルのそのような差は、ビームフォーミングを実行することを困難にすることがある。したがって、1つの態様は、ビームフォーミングを実行することの一部として入力信号を較正することを提供することができる。入力信号のそのような較正は、ビームフォーミング段の前および/または後に実行されることができる(たとえば、図2、較正段208および213)。様々な実装形態では、(1つまたは複数の)前ブラインド信号源分離較正段は、振幅ベースおよび/または相互相関ベースの較正とすることができる。すなわち、振幅ベースの較正では、スピーチまたはサウンド入力信号の振幅は、互いと比較することによって較正される。相互相関ベースの較正では、スピーチまたはサウンド信号の相互相関は、互いと比較することによって較正される。
【0068】
較正およびビームフォーミング−例1
図5は、2つ以上のマイクロホンからの入力信号を使用する較正およびビームフォーミングの第1の例を示すブロック図である。この実装形態では、第2の入力信号s2(t)は、ビームフォーミングがビームフォーミングモジュール504によって実行される前に、較正モジュール502によって較正されることができる。較正プロセスは、s’2(t)=c1(t)・s2(t)として公式化されることができる。較正ファクタc1(t)は、s’2(t)中の所望のスピーチのサウンドレベルが第1の入力信号s1(t)のサウンドレベルに近接するように、第2の入力s2(t)をスケーリングすることができる。
【0069】
較正ファクタc1(t)を取得することにおいて、図5の2つの入力信号s1(t)とs2(t)とを較正するために、様々な方法が使用されることができる。図6および図7は、較正ファクタc1(t)を取得することに使用されることができる2つの方法を示している。
【0070】
図6は、2つのマイクロホン信号に基づいてビームフォーミングを実装する前に、2つのマイクロホン信号を較正するために適用されることができる較正ファクタを取得するための第1の方法を示す流れ図である。較正ファクタc1(t)は、第1の入力信号s1(t)と第2の入力信号s2(t)との短期スピーチエネルギー推定値からそれぞれ、取得されることができる。602で、第1の複数エネルギー期間または推定値Ps1(t)(1...k)は、第1の入力信号s1(t)のブロック用に取得されることができ、ここで、各ブロックは、第1の入力信号s1(t)の複数のサンプルを含む。同様に、604で、第2の複数エネルギー期間または推定値Ps2(t)(1...k)は、第2の入力信号s2(t)のブロック用に取得されることができ、ここで、各ブロックは、第2の入力信号s2(t)の複数のサンプルを含むことができる。たとえば、以下の式を使用して、エネルギー推定値Ps1(t)およびPs2(t)が信号サンプルのブロックから計算されることができる。即ち、
【数4】
【0071】
第1の最大エネルギー推定値Qs1(t)は、606で、第1の複数のエネルギー期間または推定値Ps1(t)(1...k)を、たとえば、50ブロックまたは100ブロックのエネルギー期間にわたって探索することによって取得されることができる。同様に、第2の最大エネルギー推定値Qs2(t)は、608で、第2の複数のエネルギー期間または推定値Ps2(t)(1...k)を探索することによって取得されることができる。いくつかのブロックにわたってこれらの最大エネルギー推定値を計算することは、スピーチアクティビティ検出器を実装することなく、所望のスピーチのエネルギーを計算する、より単純な方法とすることができる。一例では、以下の式を使用して、第1の最大エネルギー推定値Qs1(t)が計算されることができる。即ち、
【数5】
【0072】
式中、tmaxは、最大エネルギー推定値Qs1(t)で識別される信号ブロックに対応する。第2の最大エネルギー推定値Qs2(t)は、同様に計算されることができる。あるいは、第2の最大エネルギー推定値Qs2(t)は、tmax信号ブロックにおいて計算された第2のマイクロホン信号のエネルギー推定値として、Qs2(t)=Ps2(tmax)で計算されることもできる。第1および第2の最大エネルギー推定値Qs1(t)およびQs2(t)は、較正ファクタc1(t)を計算する前に、610で、時間で平均化(平滑化)されることもできる。たとえば、指数平均化は、次のように実行されることができる。即ち、
【数6】
【0073】
較正ファクタc1(t)は、612で、第1および第2の最大エネルギー推定値Qs1(t)およびQs2(t)に基づいて取得されることができる。一例では、以下の式を使用して較正ファクタが取得されることができる。即ち、
【数7】
【0074】
較正ファクタc1(t)は、614で、較正推定値中の任意の過渡分をフィルタ除去するために、時間でさらに平滑化されることができる。次いで、較正ファクタc1(t)は、616で、第1および第2の入力信号s1(t)およびs2(t)を使用するビームフォーミングを実行する前に、第2の入力信号s2(t)に適用されることができる。あるいは、較正ファクタc1(t)の逆数が計算されて時間で平滑化され、次いで、616で、第1および第2の入力信号s1(t)およびs2(t)を使用するビームフォーミングを実行する前に、第1の入力信号s1(t)に適用されることができる。
【0075】
図7は、2つのマイクロホン信号に基づいてビームフォーミングを実装する前に、2つのマイクロホン信号を較正するために適用される較正ファクタを取得するための第2の方法を示す流れ図である。この第2の方法では、短期エネルギー推定値Ps1(t)およびPs2(t)の代わりに、2つの入力信号s1(t)とs2(t)との間の相互相関が使用されることができる。2つのマイクロホンが互いに近接して配置された場合、2つの入力信号中の所望のスピーチ(サウンド)信号は、互いと高度に相関することが予想されることができる。したがって、第1の入力信号s1(t)と第2の入力信号s2(t)との間の相互相関推定値Ps12(t)は、第2のマイクロホン信号s2(t)中のサウンドレベルを較正するために取得されることができる。たとえば、702で、第1の入力信号s1(t)について第1の複数のブロックが取得されることができるもので、ここで、各ブロックは、第1の入力信号s1(t)の複数のサンプルを含む。同様に、704で、第2の入力信号s2(t)について第2の複数のブロックが取得されることができ、ここで、各ブロックは、第2の入力信号s2(t)の複数のサンプルを含む。706で、第1の入力信号s1(t)と第2の入力信号s2(t)との間の複数の相互相関推定値Ps12(t)(1...k)は、第1および第2の複数のブロックのうちの相互相関している対応するブロックによって取得されることができる。たとえば、以下の式を使用して、相互相関推定値Ps12(t)が計算されることができる。即ち、
【数8】
【0076】
708で、第1の入力信号s1(t)と第2の入力信号s2(t)との間の最大相互相関推定値Qs12(t)は、複数の相互相関推定値Ps12(t)(1...k)を探索することによって取得されることができる。たとえば、以下を使用して、最大相互相関推定値Qs12(t)が取得されることができる。即ち、
【数9】
【0077】
第2の最大エネルギー推定値Qs2(t)は、712で、式(6)および式(7)を使用して、最大の第2のマイクロホンエネルギー推定値として計算されることができる。あるいは、第2の最大エネルギー推定値は、tmax信号ブロックにおいて計算された第2のマイクロホン信号のエネルギー推定値として、Qs2(t)=Ps2(tmax)で計算されることもできる。710で、最大相互相関推定値Qs12(t)および最大エネルギー推定値Qs2(t)は、たとえば、以下の式を使用して、指数平均化を実行することによって平滑化されることができる。即ち、
【数10】
【0078】
較正ファクタc1(t)は、714で、たとえば、以下の式を使用して、最大相互相関推定値Qs12(t)と第2の最大エネルギー推定値Q~s2(t)とに基づいて取得される。即ち、
【数11】
【0079】
その結果、較正ファクタc1(t)は、第1の入力信号s1(t)と第2の入力信号s2(t)との間の相互相関推定値と、第2の入力信号s2(t)のエネルギー推定値と、の間の比に基づいて生成されることができる。次いで、較正ファクタc1(t)は、較正された第2の入力信号を第1の入力信号s1(t)に加算されることが次にできる較正された第2の入力信号s’2(t)を取得するために、第2の入力信号s2(t)に適用される。
【0080】
再び図5を参照すると、較正の後の得られた第1および第2の出力信号x1(t)およびx2(t)は、
【数12】
【0081】
となるように、ビームフォーミングモジュール504によって加算または減算されることができる。第1の出力信号x1(t)は、所望の音源に向かってビームを形成する固定の空間ビームフォーマの出力と考えられることができる。第2の出力信号x2(t)は、所望の音源方向でヌルを形成することによって所望のスピーチ信号を抑制する固定のノッチビームフォーマの出力と考えられることができる。
【0082】
別の例では、較正ファクタc1(t)は、第1の入力信号s1(t)と第2の入力信号s2(t)との間の相互相関推定値と、第1の入力信号s1(t)のエネルギー推定値と、の比に基づいて生成されることができる。次いで、較正ファクタc1(t)は、第1の入力信号s1(t)に適用される。次いで、較正された第1の入力信号は、第2の入力信号s2(t)から減算されることができる。
【0083】
較正およびビームフォーミング−例2
図8は、2つ以上のマイクロホンからの入力信号を使用する較正およびビームフォーミングの第2の例を示すブロック図である。この実装形態では、(図5におけるような)第2の入力信号s2(t)をスケーリングするために較正ファクタを使用する代わりに、較正ファクタc1(t)は、ビームフォーミングの前に、入力信号s1(t)とs2(t)の両方を調整するために使用されることができる。この実装形態の場合の較正ファクタc1(t)は、たとえば、図6および図7で説明されたのと同じ手順を使用して、較正モジュール802によって取得されることができる。較正ファクタc1(t)が取得されると、ビームフォーミングモジュール804は、
【数13】
【0084】
となるように、出力信号x1(t)およびx2(t)を生成することができるものであり、式中、第1の出力信号x1(t)は、所望の音源に向かってビームを形成する固定の空間ビームフォーマの出力と考えられることができる。第2の出力信号x2(t)は、所望の音源方向でヌルを形成することによって所望のスピーチ信号を抑制する固定のノッチビームフォーマの出力と考えられることができる。
【0085】
一例では、較正ファクタc1(t)は、第1の入力信号と第2の入力信号との間の相互相関と、第2の入力信号s2(t)のエネルギー推定値と、に基づかれることができる。第2の入力信号s2(t)は、較正ファクタc1(t)で乗算され、第1の入力信号s1(t)に加算されることができる。第1の入力信号s1(t)は、較正ファクタc1(t)で除算され、第1の入力信号s1(t)から減算されることができる。
【0086】
較正およびビームフォーミング−例3
図9は、2つ以上のマイクロホンからの入力信号を使用する較正およびビームフォーミングの第3の例を示すブロック図である。この実装形態は、適応フィルタ902を含むように、図5および図8に示す較正手順を一般化する。第2のマイクロホン信号s2(t)は、適応フィルタ902の入力信号として使用されることができ、第1のマイクロホン信号s1(t)は、基準信号として使用されることができる。適応フィルタ902は、重みwt=[wt(0)wt(1)...wt(N―1)]Tを含むことができるものであり、式中、Nは、適応フィルタ902の長さである。適応フィルタ処理プロセスは、
【数14】
【0087】
のように表されることができる。適応フィルタ902は、様々なタイプの適応フィルタ処理アルゴリズムを使用して適合されることができる。たとえば、適応フィルタ902は、次のように最小平均二乗(Least-Mean-Square:LMS)タイプアルゴリズムを使用して適合されることができる。
【0088】
wi=wi−1+2μx2(t)s2(t) (式23)
式中、μはステップサイズであり、
【数15】
【0089】
は、式24に示されるような第2の入力信号ベクトルである。即ち、
【数16】
【0090】
適応フィルタ902は、適応型ビームフォーマとして作動することができ、第2のマイクロホン入力信号s2(t)中の所望のスピーチを抑制することができる。適応フィルタ長が1となるように選択された場合、この方法は、2つのマイクロホン信号間の相互相関が第2のマイクロホン信号を較正するために使用されることができる図7で説明された較正手法と等価になる。
【0091】
ビームフォーミングモジュール904は、第1および第2の出力信号x1(t)およびx2(t)を取得するために、第1のマイクロホン信号s1(t)とフィルタ処理された第2のマイクロホン信号s’2(t)とを処理する。第2の出力信号x2(t)は、所望の音源(スピーチソース)方向でヌルを形成することによって所望のスピーチ信号を抑制する固定のノッチビームフォーマの出力と考えられることができる。第1の出力信号x1(t)は、所望の音源信号のビームフォーミングされた出力を取得するために、以下のように、フィルタ処理された第2のマイクロホン信号s’2(t)を第1のマイクロホン信号s1(t)に加算することによって取得されることができる。即ち、
x1(t)=s1(t)+s’2(t) (式25)
第1の出力信号x1(t)は、x1(t)におけるスピーチレベルをs1(t)におけるスピーチレベルと同じに保持するために、0.5倍にスケーリングされることができる。したがって、第1の出力信号x1(t)は、所望のスピーチ(サウンド)信号と周囲ノイズの両方を含み、第2の出力信号x2(t)は、大部分は周囲ノイズと所望のスピーチ(サウンド)信号のいくつかとを含む。
【0092】
較正およびビームフォーミング−例4
図10は、2つ以上のマイクロホンからの入力信号を使用する較正およびビームフォーミングの第4の例を示すブロック図である。この実装形態では、較正はビームフォーミングの前に実行されない。代わりに、最初に、ビームフォーミングが、
【数17】
【0093】
のように、2つの入力信号s1(t)およびs2(t)を組み合わせるビームフォーミングモジュール1002によって実行される。ビームフォーミングの後、ビームフォーマの第2の出力信号x’2(t)におけるノイズレベルは、第1の出力信号x1(t)におけるノイズレベルよりもはるかに低くなることがある。したがって、較正モジュール1004は、ビームフォーマの第2の出力信号x’2(t)におけるノイズレベルをスケーリングするために使用されることができる。較正モジュール1004は、ビームフォーマ出力信号x1(t)およびx’2(t)のノイズフロア推定値から較正ファクタc1(t)を取得することができる。出力信号x1(t)およびx’2(t)の短期エネルギー推定値はそれぞれ、Px1(t)およびPx’2(t)によって示されることができ、対応するノイズフロア推定値は、Nx1(t)およびNx’2(t)によって示されることができる。ノイズフロア推定値Nx1(t)およびNx’2(t)は、短期エネルギー推定値Px1(t)およびNx’2(t)の最小値を、入力信号サンプルのいくつかの連続するブロック、すなわち、50ブロックまたは100ブロックにわたって見つけることによって取得されることができる。たとえば、ノイズフロア推定値Nx1(t)およびNx’2(t)はそれぞれ、式27および式28を使用して計算されることができる。即ち、
【数18】
【0094】
ノイズフロア推定値Nx1(t)およびNx’2(t)は、不連続性を平滑化するために、時間で平均化されることができ、較正ファクタc1(t)は、
【数19】
【0095】
のように、平滑化されたノイズフロア推定値の比として計算されることができる。式中、Nx’1(t)およびN’x’2(t)は、平滑化されたノイズフロア推定値x1(t)およびx’2である。ビームフォーミングされた第2の出力信号x’2(t)は、
x”2(t)=c1(t)x’2(t) (式30)
となるように、最終のノイズ基準出力信号x”2(t)を取得するために、較正ファクタc1(t)によってスケーリングされる。
【0096】
較正の後、適応フィルタ1006が適用されることができる。適応フィルタ1006は、適応フィルタ902(図9)に関して説明されるように実装されることができる。第1の出力信号x1(t)は、適応フィルタ1006への入力信号として使用されることができ、較正された出力信号x”2(t)は、基準信号として使用されることができる。適応フィルタ1006は、較正されたビームフォーマ出力信号x”2(t)中の所望のスピーチ信号を抑制することができる。したがって、第1の出力信号x1(t)は、所望のスピーチと周囲ノイズの両方を含むことができ、第2の出力信号x2(t)は、大部分は周囲ノイズといくつかの所望のスピーチとを含むことができる。その結果、2つの出力信号x1(t)およびx2(t)は、すなわち、それらが高度に相関しないというBSSの不確定性を回避するための上述の仮定を満たすことができる。
【0097】
図5〜図10に示す様々な例では、(1つまたは複数の)較正段は、スピーチまたはサウンド符号上で振幅ベースおよび/または相互相関ベースの較正を実装することができる。
【0098】
ブラインド信号源分離段
再び図3を参照すると、ビームフォーミングモジュール302からの出力信号x1(t)、x2(t)およびxn(t)は、ブラインド信号源分離モジュール304に渡されることができる。ブラインド信号源分離モジュール304は、ビームフォーマ出力信号x1(t)、x2(t)およびxn(t)を処理することができる。信号x1(t)、x2(t)およびxn(t)は、ソース信号の混合とすることができる。ブラインド信号源分離モジュール304は入力混合を分離し、ソース信号の推定値y1(t)、y2(t)およびyn(t)を生成する。たとえば、わずか1つのソース信号が所望の信号とすることができる二重マイクロホンノイズ低減の場合、ブラインド信号源分離モジュール304は、所望のスピーチ信号(たとえば、図2の第1の音源信号so2)と周囲ノイズ(たとえば、図2のノイズso1およびsoN)とを無相関化する(decorrelate)ことができる。
【0099】
ブラインド信号源分離−原理
ブラインド信号源分離または無相関化(decorrelation)では、入力信号は、独立ランダムプロセスとして扱われる。信号をブラインド分離するのに使用される仮定は、すべてのランダムプロセスが互いに統計的に独立である、すなわち、すべてのランダムプロセスS1、S2およびSmの同時確率分布Pは、すべて個々のランダムプロセスの積であるということである。この仮定は、
【数20】
【0100】
のように公式化されることができるものであり、式中、
【数21】
【0101】
は、すべてのランダムプロセスS1,...,Smの同時分布(joint distribution)であり、
【数22】
【0102】
は、j番目のランダムプロセスSjの分布である。
【0103】
一般に、ブラインド信号源分離は、2つのカテゴリ、瞬時BSSおよび畳み込みBSSに分類されることがある。瞬時BSSは、瞬時の行列混合としてモデル化されることができる混合入力信号s(t)を指し、
x(t)=As(t) (式32)
のように公式化されるものであり、式中、s(t)は、m×1ベクトルであり、x(t)は、n×1ベクトルであり、Aはn×mのスカラー行列である。分離プロセスでは、m×nスカラー行列Bは、s<(t)が任意の置換および任意のスケーリングまでs(t)に似るように、信号s<(t)=Bx(t)=BAs(t)を再構成するために、計算され、使用される。すなわち、行列BAは、PDに分解されることができるものであり、ここで、行列Pは置換行列であり、行列Dは対角行列である。置換行列は、同じ次元の単位行列を置換することによって導出される行列である。対角行列は、その対角線上に0でないエントリのみを有する行列である。対角行列Dが単位行列でなければならないわけでないことに留意されたい。すべてのm個の音源が互いに独立している場合、行列Dの対角線上に0エントリがあってはならないべきである。一般に、n≧m、すなわち、マイクロホンの数nが音源の数m以上であることが、完全な信号分離のために望ましい。
【0104】
実際問題として、瞬時の混合を使用してモデル化されることができる課題はほとんどない。信号は、典型的に、マイクロホンまたはオーディオセンサによってキャプチャされる前に、非理想的なチャネルを通って進む。したがって、畳み込みBSSは、入力信号をより良くモデル化するために使用されることができる。
【0105】
図11は、複数の混合入力信号からソース信号を復元する畳み込みブラインド信号源分離の動作を示すブロック図である。ソース信号s1(t)1102およびs2(t)1104は、それらが混合されるチャネルを通過することができる。混合信号は、入力信号s’1(t)およびs’2(t)としてマイクロホンによってキャプチャされ、信号x1(t)およびx2(t)としてブラインド信号源分離段1108を通過するより前に、事前調整(たとえば、ビームフォーミング)されることができる前処理段1106を通過されることができる。
【0106】
入力信号s’1(t)およびs’2(t)は、元の信号源信号s1(t)1102およびs2(t)1104と、音源から1つまたは複数のマイクロホンへのチャネル伝達関数と、入力の混合とに基づいてモデル化されることができる。たとえば、混合入力信号s’(t)が、
【数23】
【0107】
のようにモデル化されることができる畳み込みBSSが使用されることがではるものであり、式中、sj(t)は、j番目の音源発の信号源信号であり、s’i(t)は、i番目のマイクロホンによってキャプチャされた入力信号であり、hij(t)は、j番目の音源とi番目のマイクロホンとの間の伝達関数であり、シンボル
【数24】
【0108】
は畳み込み操作を示す。一方、畳み込みBSSの場合、n≧m、すなわち、マイクロホンの数nが音源の数m以上である場合、完全な分離が達成されることができる。
【0109】
図11では、伝達関数h11(t)およびh12(t)は、第1の信号源から第1および第2のマイクロホンへのチャネル伝達関数を表す。同様に、伝達関数h21(t)およびh22(t)は、第2の信号源から第1および第2のマイクロホンへのチャネル伝達関数を表す。信号は、ブラインド信号源分離段1108に渡すより前に、前処理段1106(ビームフォーミング)を通過する。次いで、(第1および第2のマイクロホンによってキャプチャされるような)混合入力信号s’1(t)およびs’2(t)は、信号x1(t)およびx2(t)を取得するために、ビームフォーミング前処理段1106を通過する。
【0110】
次いで、ブラインド信号源分離は、元のソース信号sj(t)に対応する推定値s<j(t)を分離または抽出するために、混合信号x1(t)に適用されることができる。これを達成するために、フィルタのセットWji(z)は、信号混合を逆転させるために、ブラインド信号源分離段1108において使用されることができる。便宜のために、ブラインド信号源分離は、Z変換領域で表される。この例で、X1(z)はx1(t)のZ領域バージョンであり、X2(z)はx2(t)のZ領域バージョンである。
【0111】
信号X1(z)およびX2(z)は、
【数25】
【0112】
となるように、(時間領域でs(t)に等価である)元のソース信号S(z)の推定値S<(z)を取得するために、フィルタWji(z)に従って変更される。信号推定値S<(z)は、任意の置換および任意の畳み込みまで元の信号S(z)に近似することができる。混合伝達関数hij(t)がZ領域で表される場合、全体的なシステムの伝達関数は、
W(z)H(z)=PD(z) (式35)
のように公式化することができるものであり、式中、Pは置換行列であり、D(z)は対角伝達関数行列である。D(z)の対角線上の要素は、(瞬時BSSで表される)スカラーではなく伝達関数である。
【0113】
ブラインド信号源分離段−無相関化
再び図3を参照すると、元の入力信号s1(t)およびs2(t)が高度に相関することでもあるので、第2の出力x2(t)の信号レベルは、ビームフォーミングモジュール302の後では低くなることができる。これは、ブラインド信号源分離モジュール304の収束レートを低減することがある。ブラインド信号源分離モジュール304の収束レートを最大にするために、第2の較正は、ブラインド信号源分離の前に使用されることができる。図12は、ビームフォーミング前処理段の後であるが、ブラインド信号源分離段1204の前に信号がどのように較正されることができるかの第1の例を示すブロック図である。信号x1(t)およびx2(t)を較正モジュール1202への入力として与えられることができる。この例で、信号x2(t)は、
x~2(t)=c2(t)・x2(t) (式36)
のように、スカラーc2(t)によってスケーリングされる。
【0114】
スカラーc2(t)は、信号x1(t)およびx2(t)に基づいて判断されることができる。たとえば、較正ファクタは、図10および式27、式28および式29に示されるようなx1(t)およびx2(t)のノイズフロア推定値を使用して計算されることができる。
【0115】
較正の後、x1(t)における所望のスピーチ信号は、x~2(t)における所望のスピーチ信号よりはるかに強い。そして、ブラインド信号源分離アルゴリズムが使用されたとき、不確定性を回避することが可能である。実際問題として、ブラインド信号源分離アルゴリズムの別の一般的な問題である信号スケーリングを回避することができるブラインド信号源分離アルゴリズムを使用することが望ましい。
【0116】
図13は、ブラインド信号源分離より前に信号較正を実装する代替方式を示すブロック図である。図8に示された較正プロセスと同様に、較正モジュール1302は、信号x2(t)をスケーリングするためにそれを使用する代わりに、ブラインド信号源分離モジュール1304の適合(たとえば、アルゴリズム、重み、ファクタなど)を変化、構成、または変更するために、第2のスケーリングファクタc2(t)を生成する。
【0117】
ブラインド信号源分離−後処理
再び図3を参照すると、ブラインド信号源分離モジュール304によって出力される1つまたは複数のソース信号推定値y1(t)、y2(t)およびyn(t)は、出力信号s<1(t),s<2(t)およびs<n(t)を与える後処理モジュール308によってさらに処理されることができる。後処理モジュール308は、所望のスピーチ信号推定値の信号対雑音比(SNR)をさらに改善するために追加されることができる。いくつかの場合では、事前調整較正およびビームフォーミングモジュール302が周囲ノイズの良好な推定値を生成した場合、ブラインド信号源分離モジュール304はバイパスされ、後処理モジュール308単独で、所望のスピーチ信号の推定値を生成することができる。同様に、後処理モジュール308は、ブラインド信号源分離モジュール304が所望のスピーチ信号の良好な推定値を生成した場合、バイパスされることができる。
【0118】
信号分離プロセスの後、信号y1(t)およびy2(t)が与えられる。信号y1(t)は、主に所望の信号といくぶん減衰した周囲ノイズとを含むことができる。信号y1(t)は、スピーチ基準信号と呼ばれることがある。周囲ノイズの低減は、ノイズの環境および特性に応じて異なる。信号y2(t)は、主に周囲ノイズを含むことができ、そこでは、所望の信号は低減されている。それはまた、ノイズ基準信号とも呼ばれる。
【0119】
較正およびビームフォーミングモジュール302およびブラインド信号源分離モジュール304の様々な実装形態に従って、ノイズ基準信号中の所望のスピーチ信号は、大部分は除去された。したがって、後処理モジュール308は、スピーチ基準信号からノイズを除去することに集中することができる。
【0120】
図14は、所望のスピーチ基準信号からノイズを低減するために使用される後処理モジュールの動作の例を示すブロック図である。非因果的適応フィルタ1402は、スピーチ基準信号y1(t)中のノイズをさらに低減するために使用されることができる。ノイズ基準信号y2(t)は、適応フィルタ1402への入力として使用されることができる。遅延信号y1(t)は、適応フィルタ1402への基準として使用されることができる。適応フィルタP(z)1402は、最小平均二乗(Least Means Square:LMS)タイプ適応フィルタまたは任意の他の適応フィルタを使用して適合させられることができる。その結果、後処理モジュールは、低減されたノイズとともに所望のスピーチ基準信号を含む出力信号s<1(t)を与えることができることがある。
【0121】
より一般的な意味で、後処理モジュール308は、図2の後処理段215に示すように、出力信号y1(t)およびy2(t)上でノイズ較正を実行することができる。
【0122】
例示的な方法
図15は、一例によるブラインド信号源分離を強調する方法を示す流れ図である。1502で、第1のマイクロホンに関連付けられた第1の入力信号および第2のマイクロホンに関連付けられた第2の入力信号が受信されるか、または取得されることができる。1504で、第1および第2の入力信号は、指向性を第1および第2の入力信号に与え、対応する第1および第2の出力信号を取得するために、第1および第2の入力信号を較正して、ビームフォーミング技法を適用することによって、前処理されることができる。すなわち、このビームフォーミング技法は、ビームフォーミング技法の中でも、図4、図5、図6、図7、図8、図9および/または図10に示された技法を含むことができる。たとえば、2つのマイクロホンシステムにおいて、ビームフォーミング技法は、所望の方向からのサウンド信号をビームフォーマの第1の出力信号中で増幅し、所望の方向からのサウンド信号をビームフォーマの第2の出力信号中で抑制するように、第1および第2の出力信号を生成する。
【0123】
一例では、ビームフォーミング技法は、(たとえば、図9に示されるように)第2の入力信号に適応フィルタを適用すること、第2の入力信号から第1の入力信号を減算すること、および/またはフィルタ処理された第2の入力信号を第1の入力信号に加算すること、を含むことができる。
【0124】
別の例では、ビームフォーミング技法は、(たとえば図5および図6に示されるように)第1の入力信号と第2の入力信号とのエネルギー推定値の比に基づいて較正ファクタを生成することと、較正ファクタを第1の入力信号または第2の入力信号のいずれか1つに適用することと、を含むことができる。
【0125】
代替的に、別の例では、ビームフォーミング技法は、(たとえば図5、図7および図8に示されるように)第1の入力信号と第2の入力信号との間の相互相関推定値と、第2の入力信号のエネルギー推定値との比に基づいて較正ファクタを生成することと、較正ファクタを第1の入力信号または第2の入力信号のうちの少なくともいずれか1つに適用することと、を含むことができる。
【0126】
さらに別の例では、ビームフォーミング技法は、(a)変更された第1の信号を取得するために、第2の入力信号を第1の入力信号に加算すること、(b)変更された第2の信号を取得するために、第2の入力信号から第1の入力信号を減算すること、(c)変更された第1の信号の第1のノイズフロア推定値を取得すること、(d)変更された第2の信号の第2のノイズフロア推定値を取得すること、(e)第1のノイズフロア推定値と第2のノイズフロア推定値との比に基づいて較正ファクタを生成すること、(f)較正ファクタを変更された第2の信号に適用すること、および/または(g)対応する第1および第2の出力信号を取得するために、(たとえば図10に示されるように)変更された第1の信号に適応フィルタを適用し、変更された第2の信号から、フィルタ処理された変更された第1の信号を減算すること、を含むことができる。
【0127】
次いで、1506で、ブラインド信号源分離(BSS)技法は、第1のBSS信号と第2のBSS信号とを生成するために、前処理された第1の出力信号と前処理された第2の出力信号とに適用されることができる。一例では、前較正は、ブラインド信号源分離技法を適用するより前に、出力信号の1つまたは複数上で、(a)第1および第2の出力信号に基づいて較正ファクタを取得することと、(b)(たとえば図12に示されるように)第1および第2の出力信号にブラインド信号源分離技法を適用するより前に、第1および第2の出力信号のうちの少なくとも1つを較正することとによって、実行されることができる。別の例では、ブラインド信号源分離技法を適用するより前に実行される前較正は、(a)第1および第2の出力信号に基づいて較正ファクタを取得することと、(b)(たとえば図13に示されるように)較正ファクタに基づいてブラインド信号源分離技法の動作を変更することと、を含む。
【0128】
1508で、第1および第2の入力信号、第1および第2の出力信号、または第1および第2のBSS信号のうちの少なくとも1つは、随意に較正されることができる。たとえば、第1の較正(たとえば、図2の前処理段較正208)は、振幅ベースの較正または相互相関ベースの較正のいずれかとして、第1および第2の入力信号のうちの少なくとも1つに適用されることができる。さらに、第2の較正(たとえば、図2の中間処理段較正213)は、振幅ベースの較正または相互相関ベースの較正のいずれかとして、ビームフォーミング段からの第1および第2の出力信号のうちの少なくとも1つに適用されることができる。
【0129】
さらに、第3の較正(たとえば、図2の後処理段較正215)は、ノイズベースの較正としてブラインド信号源分離段からの第1および第2のBSS信号のうちの少なくとも1つに適用されることができる。たとえば、1508で、適応フィルタは、第1のBSS信号中のノイズを低減するために第1のBSS信号に(後処理段較正中に)適用されることができ、ここで、第2のBSS信号は、適応フィルタへの入力として使用される。後処理段較正の一例では、適応フィルタは、(たとえば図14に示されるように)第1のBSS信号中のノイズを低減するために第1のBSS信号に適用され、ここで、第2のBSS信号は、適応フィルタへの入力として使用される。
【0130】
さらに別の構成によれば、モバイルデバイス中の回路は、第1のマイクロホンに関連付けられた第1の入力信号を受信するように適合されることができる。同じ回路、異なる回路、あるいは同じまたは異なる回路の第2の部分は、第2のマイクロホンに関連付けられた第2の入力信号を受信するように適合されることができる。さらに、同じ回路、異なる回路、あるいは同じまたは異なる回路の第3の部分は、指向性を第1および第2の入力信号に与えて、対応する第1および第2の出力信号を取得するために、第1および第2の入力信号にビームフォーミング技法を適用するように適合されることができる。第1および第2の入力信号を取得するように適合された回路の部分は、第1および第2の入力信号にビームフォーミングを適用する(1つまたは複数の)回路の部分に直接または間接的に結合されることができ、または、同じ回路とすることができる。同じまたは異なる回路の第4の部分は、第1のBSS信号および第2のBSS信号を生成するために、ブラインド信号源分離(BSS)技法を第1の出力信号と第2の出力信号とに適用するように適合されることができる。随意に、同じまたは異なる回路の第5の部分は、第1および第2の入力信号、第1および第2の出力信号、または第1および第2のBSS信号のうちの少なくとも1つを較正するように適合されることができる。ビームフォーミング技法は、第1の入力信号と第2の入力信号とに異なる指向性を適用することができ、異なる指向性は、他の方向からの(たとえば、直交方向または反対の方向からの)サウンド信号を減衰させながら、第1の方向からのサウンド信号を増幅する。当業者は、一般に、本開示で説明される処理の大部分は、同様の形態で実装されることができることを認識されよう。(1つまたは複数の)回路または回路部分のいずれも、1つまたは複数のプロセッサをもつ集積回路の一部として、単独で、または組合せで実装されることができる。回路の1つまたは複数は、集積回路、アドバンスRISCマシン(Advance RISC Machine:ARM)プロセッサ、デジタル信号プロセッサ(DSP)、汎用プロセッサ上などに実装されることができる。
【0131】
図1、図2、図3、図4、図5、図6、図7、図8、図9、図10、図11、図12、図13、図14および/または図15に示されたコンポーネント、ステップ、および/または機能のうちの1つまたは複数は、単一のコンポーネント、ステップ、または機能に再構成され、および/または組み合わされることができ、あるいは、複数のコンポーネント、ステップ、または機能で実施されることができる。追加の要素、コンポーネント、ステップ、および/または機能が追加されることもできる。図1、図2、図3、図4、図5、図6、図7、図8、図9、図10、図11、図12、図13および/または図14に示された装置、デバイス、および/またはコンポーネントは、図6、図7および/または図15に記載された方法、特徴、またはステップの1つまたは複数を実行するように構成されることができる。本明細書に記載された新規のアルゴリズムは、ソフトウェアおよび/または組込みハードウェアで効率的に実施されることができる。
【0132】
当業者は、さらに、本明細書で開示された構成に関連して説明された様々な例示的な論理ブロック、モジュール、回路、およびアルゴリズムステップは、電子ハードウェア、コンピュータソフトウェア、または両方の組み合わせとして実装されることができることを諒解されよう。ハードウェアとソフトウェアのこの互換性を明確に示すために、様々な例示的なコンポーネント、ブロック、モジュール、回路、およびステップは、上記では概して、それらの機能に関して説明された。そのような機能がハードウェアとして実装されるか、ソフトウェアとして実装されるかは、特定の適用例および全体的なシステムに課される設計制約に依存する。
【0133】
本明細書で説明された様々な特徴は、様々なシステムで実装されることができる。たとえば、ビームフォーミング段およびブラインド信号源分離段は、単一の回路またはモジュール中に、別々の回路またはモジュール上で実装され、1つまたは複数のプロセッサによって実行され、機械可読またはコンピュータ可読媒体中に組み込まれたコンピュータ可読命令によって実行され、および/またはハンドヘルドデバイス、モバイルコンピュータおよび/または移動電話中で実施されることができる。
【0134】
上記の構成は例にすぎず、特許請求の範囲を限定するものと解釈されるべきではないことに留意されたい。構成についての説明は、例示的なものであり、特許請求の範囲の範囲を限定するものではない。したがって、本教示は、他のタイプの装置、ならびに多くの代替形態、修正形態、および変更形態に容易に適用されることができることが当業者には明らかであろう。
【特許請求の範囲】
【請求項1】
第1のマイクロホンに関連付けられた第1の入力信号と、第2のマイクロホンに関連付けられた第2の入力信号とを受信することと、
前記第1および第2の入力信号に指向性を与え、対応する第1および第2の出力信号を取得するために、前記第1および第2の入力信号にビームフォーミング技法を適用することと、
第1のブラインド信号源分離(BSS)信号と第2のBSS信号とを生成するために、前記第1の出力信号と第2の出力信号とにBSS技法を適用することと、
前記第1および第2の入力信号、前記第1および第2の出力信号、または前記第1および第2のBSS信号、のうちの少なくとも1つを較正することと、
を備える方法。
【請求項2】
前記ビームフォーミング技法は、前記第1および第2の入力信号に空間フィルタを適用することによって、前記第1および第2の入力信号に指向性を与える、請求項1に記載の方法。
【請求項3】
前記第1および第2の入力信号に空間フィルタを適用することは、他の方向からのサウンド信号を減衰させながら、第1の方向からのサウンド信号を増幅する、請求項2に記載の方法。
【請求項4】
前記第1および第2の入力信号に空間フィルタを適用することは、前記得られた第1の出力信号中の所望のスピーチ信号を増幅し、前記第2の出力信号中の前記所望のスピーチ信号を減衰させる、請求項2に記載の方法。
【請求項5】
前記第1および第2の入力信号のうちの少なくとも1つを較正することは、前記第2の入力信号に適応フィルタを適用することを備え、前記ビームフォーミング技法を適用することは、前記第2の入力信号から前記第1の入力信号を減算することを含む、請求項1に記載の方法。
【請求項6】
前記ビームフォーミング技法を適用することは、前記フィルタ処理された第2の入力信号を前記第1の入力信号に加算することをさらに備える、請求項5に記載の方法。
【請求項7】
前記第1および第2の入力信号のうちの少なくとも1つを較正することは、
前記第1の入力信号と前記第2の入力信号とのエネルギー推定値の比に基づいて較正ファクタを生成することと、
前記較正ファクタを前記第1の入力信号または前記第2の入力信号のうちの少なくともいずれか1つに適用することと、
をさらに備える、請求項1に記載の方法。
【請求項8】
前記第1および第2の入力信号のうちの少なくとも1つを較正することは、
前記第1の入力信号と前記第2の入力信号との間の相互相関推定値と、前記第2の入力信号のエネルギー推定値と、の比に基づいて、較正ファクタを生成することと、
前記較正ファクタを前記第2の入力信号に適用することと、
をさらに備える、請求項1に記載の方法。
【請求項9】
前記第1および第2の入力信号のうちの少なくとも1つを較正することは、
前記第1の入力信号と前記第2の入力信号との間の相互相関推定値と、前記第1の入力信号のエネルギー推定値と、の比に基づいて、較正ファクタを生成することと、
前記較正ファクタを前記第1の入力信号に適用することと、
をさらに備える、請求項1に記載の方法。
【請求項10】
前記第1および第2の入力信号のうちの少なくとも1つを較正することは、
前記第1の入力信号と前記第2の入力信号との間の相互相関と、前記第2の入力信号のエネルギー推定値と、に基づいて、較正ファクタを生成することと、
前記第2の入力信号に前記較正ファクタを乗算することと、
前記第1の入力信号を前記較正ファクタで除算することと、
をさらに備える、請求項1に記載の方法。
【請求項11】
前記第1および第2の入力信号に前記ビームフォーミング技法を適用することは、
変更された第1の信号を取得するために、前記第2の入力信号を前記第1の入力信号に加算することと、
変更された第2の信号を取得するために、前記第2の入力信号から前記第1の入力信号を減算することと、
をさらに備える、請求項1に記載の方法。
【請求項12】
前記第1および第2の入力信号のうちの少なくとも1つを較正することは、
前記変更された第1の信号の第1のノイズフロア推定値を取得することと、
前記変更された第2の信号の第2のノイズフロア推定値を取得することと、
前記第1のノイズフロア推定値と前記第2のノイズフロア推定値との比に基づいて較正ファクタを生成することと、
前記較正ファクタを前記変更された第2の信号に適用することと、
をさらに備える、請求項11に記載の方法。
【請求項13】
前記変更された第1の信号に適応フィルタを適用し、前記変更された第2の信号から前記フィルタ処理された変更された第1の信号を減算すること、
をさらに備える、請求項12に記載の方法。
【請求項14】
前記第1および第2の出力信号に基づいて較正ファクタを取得することと、
前記第1および第2の出力信号に前記ブラインド信号源分離技法を適用するより前に、前記第1および第2の出力信号のうちの少なくとも1つを較正することと、
をさらに備える、請求項1に記載の方法。
【請求項15】
前記第1および第2の出力信号に基づいて較正ファクタを取得することと、
前記較正ファクタに基づいて前記ブラインド信号源分離技法の前記動作を変更することと、
をさらに備える、請求項1に記載の方法。
【請求項16】
前記第1のBSS信号中のノイズを低減するために、前記第1のBSS信号に適応フィルタを適用することをさらに備え、ここで、前記第2のBSS信号は前記適応フィルタへの入力として使用される、
請求項1に記載の方法。
【請求項17】
前記第1および第2の入力信号のうちの少なくとも1つを較正することは、振幅ベースの較正または相互相関ベースの較正のうちの少なくとも1つを適用することを含む、請求項1に記載の方法。
【請求項18】
前記第1および第2の出力信号のうちの少なくとも1つを較正することは、振幅ベースの較正または相互相関ベースの較正のうちの少なくとも1つを適用することを含む、請求項1に記載の方法。
【請求項19】
前記第1および第2のBSS信号のうちの少なくとも1つを較正することは、ノイズベースの較正を適用することを含む、請求項1に記載の方法。
【請求項20】
第1の入力信号を取得するように構成された第1のマイクロホンと、
第2の入力信号を取得するように構成された第2のマイクロホンと、
対応する第1および第2の出力信号を取得するために、前記第1および第2の入力信号に対してビームフォーミングを実行するように構成された較正モジュールと、
第1のブラインド信号源分離(BSS)信号と第2のBSS信号とを生成するために、前記第1の出力信号と前記第2の出力信号とにBSS技法を実行するように構成されたブラインド信号源分離モジュールと、
前記第1および第2の入力信号、前記第1および第2の出力信号、または前記第1および第2のBSS信号、のうちの少なくとも1つを較正するように構成された少なくとも1つの較正モジュールと、
を備える通信デバイス。
【請求項21】
前記ビームフォーミングモジュールは、前記第1および第2の入力信号に空間フィルタを適用することによってビームフォーミングを実行するものであって、ここで、前記第1および第2の入力信号に空間フィルタを適用することは、他の方向からのサウンド信号を減衰させながら、第1の方向からのサウンド信号を増幅する、請求項20に記載の通信デバイス。
【請求項22】
前記第1の入力信号と前記第2の入力信号とに空間フィルタを適用することは、前記第1の出力信号中の所望のスピーチ信号を増幅し、前記第2の出力信号中の前記所望のスピーチ信号を減衰させる、請求項21に記載の通信デバイス。
【請求項23】
前記第1および第2の入力信号に対してビームフォーミングを実行することであって、前記ビームフォーミングモジュールは、
前記第2の入力信号に適応フィルタを適用し、
前記第2の入力信号から前記第1の入力信号を減算し、
前記フィルタ処理された第2の入力信号を前記第1の入力信号に加算する
ようにさらに構成される、請求項20に記載の通信デバイス。
【請求項24】
前記第1および第2の入力信号のうちの少なくとも1つを較正することであって、前記較正モジュールは、
前記第1の入力信号と前記第2の入力信号との間の相互相関推定値と、前記第2の入力信号のエネルギー推定値と、の比に基づいて、較正ファクタを生成し、
前記較正ファクタを前記第2の入力信号に適用する、
ようにさらに構成される、請求項20に記載の通信デバイス。
【請求項25】
前記第1および第2の入力信号のうちの少なくとも1つを較正することであって、前記較正モジュールは、
前記第1の入力信号と前記第2の入力信号との間の相互相関推定値と、前記第1の入力信号のエネルギー推定値と、の比に基づいて、較正ファクタを生成し、
前記較正ファクタを前記第1の入力信号に適用する、
ようにさらに構成される、請求項20に記載の通信デバイス。
【請求項26】
前記第1および第2の入力信号のうちの少なくとも1つを較正することであって、前記較正モジュールは、
第1の入力信号と第2の入力信号との間の相互相関と、前記第2の入力信号のエネルギー推定値と、に基づいて、較正ファクタを生成し、
前記第2の入力信号に前記較正ファクタを乗算し、
前記第1の入力信号を前記較正ファクタで除算する、
ようにさらに構成される、請求項20に記載の通信デバイス。
【請求項27】
前記第1および第2の入力信号に対してビームフォーミングを実行することであって、前記ビームフォーミングモジュールは、
変更された第1の信号を取得するために、前記第2の入力信号を前記第1の入力信号に加算し、
変更された第2の信号を取得するために、前記第2の入力信号から前記第1の入力信号を減算し、
前記変更された第1の信号の第1のノイズフロア推定値を取得し、
前記変更された第2の信号の第2のノイズフロア推定値を取得する、
ようにさらに構成され、
前記較正モジュールは、
前記第1のノイズフロア推定値と前記第2のノイズフロア推定値との比に基づいて較正ファクタを生成し、
前記較正ファクタを前記変更された第2の信号に適用する、
ようにさらに構成される、請求項20に記載の通信デバイス。
【請求項28】
前記第1のBSS信号中のノイズを低減するために、前記第1のBSS信号に適応フィルタを適用するように構成された後処理モジュールをさらに備え、ここで、前記第2のBSS信号は前記適応フィルタへの入力として使用される、
請求項20に記載の通信デバイス。
【請求項29】
前記少なくとも1つの較正モジュールは、振幅ベースの較正または相互相関ベースの較正のうちの少なくとも1つを、前記第1および第2の入力信号に適用するように構成された第1の較正モジュールを含む、請求項20に記載の通信デバイス。
【請求項30】
前記少なくとも1つの較正モジュールは、振幅ベースの較正または相互相関ベースの較正のうちの少なくとも1つを、前記第1および第2の出力信号に適用するように構成された第2の較正モジュールを含む、請求項20に記載の通信デバイス。
【請求項31】
前記少なくとも1つの較正モジュールは、ノイズベースの較正を前記第1および第2のBSS信号に適用するように構成された第3の較正モジュールを含む、請求項20に記載の通信デバイス。
【請求項32】
第1のマイクロホンに関連付けられた第1の入力信号と、第2のマイクロホンに関連付けられた第2の入力信号と、を受信するための手段と、
前記第1および第2の入力信号に指向性を与え、対応する第1および第2の出力信号を取得するために、前記第1および第2の入力信号にビームフォーミング技法を適用するための手段と、
第1のブラインド信号源分離(BSS)信号と第2のBSS信号とを生成するために、前記第1の出力信号と第2の出力信号とにBSS技法を適用するための手段と、
前記第1および第2の入力信号、前記第1および第2の出力信号、または前記第1および第2のBSS信号、のうちの少なくとも1つを較正するための手段と、
を備える通信デバイス。
【請求項33】
前記第1のBSS信号中のノイズを低減するために、前記第1のBSS信号に適応フィルタを適用するための手段をさらに備え、ここで、前記第2のBSS信号は前記適応フィルタへの入力として使用される、
請求項32に記載の通信デバイス。
【請求項34】
前記第2の入力信号に適応フィルタを適用するための手段と、
前記第2の入力信号から前記第1の入力信号を減算するための手段と、
前記フィルタ処理された第2の入力信号を前記第1の入力信号に加算するための手段と、
をさらに備える、請求項32に記載の通信デバイス。
【請求項35】
前記第1および第2の出力信号に基づいて較正ファクタを取得するための手段と、
前記第1および第2の出力信号にブラインド信号源分離技法を適用するより前に、前記第1および第2の出力信号のうちの少なくとも1つを較正するための手段と、
をさらに備える、請求項32に記載の通信デバイス。
【請求項36】
前記第1および第2の出力信号に基づいて較正ファクタを取得するための手段と、
前記較正ファクタに基づいて前記ブラインド信号源分離技法の前記動作を変更するための手段と、
をさらに備える、請求項32に記載の通信デバイス。
【請求項37】
2つ以上の信号のブラインド信号源分離を強調するための回路であって、前記回路が、
第1のマイクロホンに関連付けられた第1の入力信号と、第2のマイクロホンに関連付けられた第2の入力信号と、を受信し、
前記第1および第2の入力信号に指向性を与え、対応する第1および第2の出力信号を取得するために、前記第1および第2の入力信号にビームフォーミング技法を適用し、
第1のブラインド信号源分離(BSS)信号と第2のBSS信号とを生成するために、前記第1の出力信号と前記第2の出力信号とにBSS技法を適用し、
前記第1および第2の入力信号、前記第1および第2の出力信号、または前記第1および第2のBSS信号、のうちの少なくとも1つを較正する、
ように適合された回路。
【請求項38】
前記ビームフォーミング技法は、前記第1の入力信号と前記第2の入力信号とに空間フィルタ処理を適用し、前記空間フィルタは、他の方向からのサウンド信号を減衰させながら、第1の方向からのサウンド信号を増幅する、請求項37に記載の回路。
【請求項39】
前記回路は、集積回路である、請求項37に記載の回路。
【請求項40】
2つ以上の信号のブラインド信号源分離を強調するための命令を備えるコンピュータ可読媒体であって、プロセッサによって実行されるときに、
第1のマイクロホンに関連付けられた第1の入力信号と、第2のマイクロホンに関連付けられた第2の入力信号と、を取得することと、
前記第1および第2の入力信号に指向性を与え、対応する第1および第2の出力信号を取得するために、前記第1および第2の入力信号にビームフォーミング技法を適用することと、
第1のブラインド信号源分離(BSS)信号と第2のBSS信号とを生成するために、前記前処理された第1の信号と前処理された第2の信号とにBSS技法を適用することと、
前記第1および第2の入力信号、前記第1および第2の出力信号、または前記第1および第2のBSS信号、のうちの少なくとも1つを較正することと、
を前記プロセッサに行わせるコンピュータ可読媒体。
【請求項1】
第1のマイクロホンに関連付けられた第1の入力信号と、第2のマイクロホンに関連付けられた第2の入力信号とを受信することと、
前記第1および第2の入力信号に指向性を与え、対応する第1および第2の出力信号を取得するために、前記第1および第2の入力信号にビームフォーミング技法を適用することと、
第1のブラインド信号源分離(BSS)信号と第2のBSS信号とを生成するために、前記第1の出力信号と第2の出力信号とにBSS技法を適用することと、
前記第1および第2の入力信号、前記第1および第2の出力信号、または前記第1および第2のBSS信号、のうちの少なくとも1つを較正することと、
を備える方法。
【請求項2】
前記ビームフォーミング技法は、前記第1および第2の入力信号に空間フィルタを適用することによって、前記第1および第2の入力信号に指向性を与える、請求項1に記載の方法。
【請求項3】
前記第1および第2の入力信号に空間フィルタを適用することは、他の方向からのサウンド信号を減衰させながら、第1の方向からのサウンド信号を増幅する、請求項2に記載の方法。
【請求項4】
前記第1および第2の入力信号に空間フィルタを適用することは、前記得られた第1の出力信号中の所望のスピーチ信号を増幅し、前記第2の出力信号中の前記所望のスピーチ信号を減衰させる、請求項2に記載の方法。
【請求項5】
前記第1および第2の入力信号のうちの少なくとも1つを較正することは、前記第2の入力信号に適応フィルタを適用することを備え、前記ビームフォーミング技法を適用することは、前記第2の入力信号から前記第1の入力信号を減算することを含む、請求項1に記載の方法。
【請求項6】
前記ビームフォーミング技法を適用することは、前記フィルタ処理された第2の入力信号を前記第1の入力信号に加算することをさらに備える、請求項5に記載の方法。
【請求項7】
前記第1および第2の入力信号のうちの少なくとも1つを較正することは、
前記第1の入力信号と前記第2の入力信号とのエネルギー推定値の比に基づいて較正ファクタを生成することと、
前記較正ファクタを前記第1の入力信号または前記第2の入力信号のうちの少なくともいずれか1つに適用することと、
をさらに備える、請求項1に記載の方法。
【請求項8】
前記第1および第2の入力信号のうちの少なくとも1つを較正することは、
前記第1の入力信号と前記第2の入力信号との間の相互相関推定値と、前記第2の入力信号のエネルギー推定値と、の比に基づいて、較正ファクタを生成することと、
前記較正ファクタを前記第2の入力信号に適用することと、
をさらに備える、請求項1に記載の方法。
【請求項9】
前記第1および第2の入力信号のうちの少なくとも1つを較正することは、
前記第1の入力信号と前記第2の入力信号との間の相互相関推定値と、前記第1の入力信号のエネルギー推定値と、の比に基づいて、較正ファクタを生成することと、
前記較正ファクタを前記第1の入力信号に適用することと、
をさらに備える、請求項1に記載の方法。
【請求項10】
前記第1および第2の入力信号のうちの少なくとも1つを較正することは、
前記第1の入力信号と前記第2の入力信号との間の相互相関と、前記第2の入力信号のエネルギー推定値と、に基づいて、較正ファクタを生成することと、
前記第2の入力信号に前記較正ファクタを乗算することと、
前記第1の入力信号を前記較正ファクタで除算することと、
をさらに備える、請求項1に記載の方法。
【請求項11】
前記第1および第2の入力信号に前記ビームフォーミング技法を適用することは、
変更された第1の信号を取得するために、前記第2の入力信号を前記第1の入力信号に加算することと、
変更された第2の信号を取得するために、前記第2の入力信号から前記第1の入力信号を減算することと、
をさらに備える、請求項1に記載の方法。
【請求項12】
前記第1および第2の入力信号のうちの少なくとも1つを較正することは、
前記変更された第1の信号の第1のノイズフロア推定値を取得することと、
前記変更された第2の信号の第2のノイズフロア推定値を取得することと、
前記第1のノイズフロア推定値と前記第2のノイズフロア推定値との比に基づいて較正ファクタを生成することと、
前記較正ファクタを前記変更された第2の信号に適用することと、
をさらに備える、請求項11に記載の方法。
【請求項13】
前記変更された第1の信号に適応フィルタを適用し、前記変更された第2の信号から前記フィルタ処理された変更された第1の信号を減算すること、
をさらに備える、請求項12に記載の方法。
【請求項14】
前記第1および第2の出力信号に基づいて較正ファクタを取得することと、
前記第1および第2の出力信号に前記ブラインド信号源分離技法を適用するより前に、前記第1および第2の出力信号のうちの少なくとも1つを較正することと、
をさらに備える、請求項1に記載の方法。
【請求項15】
前記第1および第2の出力信号に基づいて較正ファクタを取得することと、
前記較正ファクタに基づいて前記ブラインド信号源分離技法の前記動作を変更することと、
をさらに備える、請求項1に記載の方法。
【請求項16】
前記第1のBSS信号中のノイズを低減するために、前記第1のBSS信号に適応フィルタを適用することをさらに備え、ここで、前記第2のBSS信号は前記適応フィルタへの入力として使用される、
請求項1に記載の方法。
【請求項17】
前記第1および第2の入力信号のうちの少なくとも1つを較正することは、振幅ベースの較正または相互相関ベースの較正のうちの少なくとも1つを適用することを含む、請求項1に記載の方法。
【請求項18】
前記第1および第2の出力信号のうちの少なくとも1つを較正することは、振幅ベースの較正または相互相関ベースの較正のうちの少なくとも1つを適用することを含む、請求項1に記載の方法。
【請求項19】
前記第1および第2のBSS信号のうちの少なくとも1つを較正することは、ノイズベースの較正を適用することを含む、請求項1に記載の方法。
【請求項20】
第1の入力信号を取得するように構成された第1のマイクロホンと、
第2の入力信号を取得するように構成された第2のマイクロホンと、
対応する第1および第2の出力信号を取得するために、前記第1および第2の入力信号に対してビームフォーミングを実行するように構成された較正モジュールと、
第1のブラインド信号源分離(BSS)信号と第2のBSS信号とを生成するために、前記第1の出力信号と前記第2の出力信号とにBSS技法を実行するように構成されたブラインド信号源分離モジュールと、
前記第1および第2の入力信号、前記第1および第2の出力信号、または前記第1および第2のBSS信号、のうちの少なくとも1つを較正するように構成された少なくとも1つの較正モジュールと、
を備える通信デバイス。
【請求項21】
前記ビームフォーミングモジュールは、前記第1および第2の入力信号に空間フィルタを適用することによってビームフォーミングを実行するものであって、ここで、前記第1および第2の入力信号に空間フィルタを適用することは、他の方向からのサウンド信号を減衰させながら、第1の方向からのサウンド信号を増幅する、請求項20に記載の通信デバイス。
【請求項22】
前記第1の入力信号と前記第2の入力信号とに空間フィルタを適用することは、前記第1の出力信号中の所望のスピーチ信号を増幅し、前記第2の出力信号中の前記所望のスピーチ信号を減衰させる、請求項21に記載の通信デバイス。
【請求項23】
前記第1および第2の入力信号に対してビームフォーミングを実行することであって、前記ビームフォーミングモジュールは、
前記第2の入力信号に適応フィルタを適用し、
前記第2の入力信号から前記第1の入力信号を減算し、
前記フィルタ処理された第2の入力信号を前記第1の入力信号に加算する
ようにさらに構成される、請求項20に記載の通信デバイス。
【請求項24】
前記第1および第2の入力信号のうちの少なくとも1つを較正することであって、前記較正モジュールは、
前記第1の入力信号と前記第2の入力信号との間の相互相関推定値と、前記第2の入力信号のエネルギー推定値と、の比に基づいて、較正ファクタを生成し、
前記較正ファクタを前記第2の入力信号に適用する、
ようにさらに構成される、請求項20に記載の通信デバイス。
【請求項25】
前記第1および第2の入力信号のうちの少なくとも1つを較正することであって、前記較正モジュールは、
前記第1の入力信号と前記第2の入力信号との間の相互相関推定値と、前記第1の入力信号のエネルギー推定値と、の比に基づいて、較正ファクタを生成し、
前記較正ファクタを前記第1の入力信号に適用する、
ようにさらに構成される、請求項20に記載の通信デバイス。
【請求項26】
前記第1および第2の入力信号のうちの少なくとも1つを較正することであって、前記較正モジュールは、
第1の入力信号と第2の入力信号との間の相互相関と、前記第2の入力信号のエネルギー推定値と、に基づいて、較正ファクタを生成し、
前記第2の入力信号に前記較正ファクタを乗算し、
前記第1の入力信号を前記較正ファクタで除算する、
ようにさらに構成される、請求項20に記載の通信デバイス。
【請求項27】
前記第1および第2の入力信号に対してビームフォーミングを実行することであって、前記ビームフォーミングモジュールは、
変更された第1の信号を取得するために、前記第2の入力信号を前記第1の入力信号に加算し、
変更された第2の信号を取得するために、前記第2の入力信号から前記第1の入力信号を減算し、
前記変更された第1の信号の第1のノイズフロア推定値を取得し、
前記変更された第2の信号の第2のノイズフロア推定値を取得する、
ようにさらに構成され、
前記較正モジュールは、
前記第1のノイズフロア推定値と前記第2のノイズフロア推定値との比に基づいて較正ファクタを生成し、
前記較正ファクタを前記変更された第2の信号に適用する、
ようにさらに構成される、請求項20に記載の通信デバイス。
【請求項28】
前記第1のBSS信号中のノイズを低減するために、前記第1のBSS信号に適応フィルタを適用するように構成された後処理モジュールをさらに備え、ここで、前記第2のBSS信号は前記適応フィルタへの入力として使用される、
請求項20に記載の通信デバイス。
【請求項29】
前記少なくとも1つの較正モジュールは、振幅ベースの較正または相互相関ベースの較正のうちの少なくとも1つを、前記第1および第2の入力信号に適用するように構成された第1の較正モジュールを含む、請求項20に記載の通信デバイス。
【請求項30】
前記少なくとも1つの較正モジュールは、振幅ベースの較正または相互相関ベースの較正のうちの少なくとも1つを、前記第1および第2の出力信号に適用するように構成された第2の較正モジュールを含む、請求項20に記載の通信デバイス。
【請求項31】
前記少なくとも1つの較正モジュールは、ノイズベースの較正を前記第1および第2のBSS信号に適用するように構成された第3の較正モジュールを含む、請求項20に記載の通信デバイス。
【請求項32】
第1のマイクロホンに関連付けられた第1の入力信号と、第2のマイクロホンに関連付けられた第2の入力信号と、を受信するための手段と、
前記第1および第2の入力信号に指向性を与え、対応する第1および第2の出力信号を取得するために、前記第1および第2の入力信号にビームフォーミング技法を適用するための手段と、
第1のブラインド信号源分離(BSS)信号と第2のBSS信号とを生成するために、前記第1の出力信号と第2の出力信号とにBSS技法を適用するための手段と、
前記第1および第2の入力信号、前記第1および第2の出力信号、または前記第1および第2のBSS信号、のうちの少なくとも1つを較正するための手段と、
を備える通信デバイス。
【請求項33】
前記第1のBSS信号中のノイズを低減するために、前記第1のBSS信号に適応フィルタを適用するための手段をさらに備え、ここで、前記第2のBSS信号は前記適応フィルタへの入力として使用される、
請求項32に記載の通信デバイス。
【請求項34】
前記第2の入力信号に適応フィルタを適用するための手段と、
前記第2の入力信号から前記第1の入力信号を減算するための手段と、
前記フィルタ処理された第2の入力信号を前記第1の入力信号に加算するための手段と、
をさらに備える、請求項32に記載の通信デバイス。
【請求項35】
前記第1および第2の出力信号に基づいて較正ファクタを取得するための手段と、
前記第1および第2の出力信号にブラインド信号源分離技法を適用するより前に、前記第1および第2の出力信号のうちの少なくとも1つを較正するための手段と、
をさらに備える、請求項32に記載の通信デバイス。
【請求項36】
前記第1および第2の出力信号に基づいて較正ファクタを取得するための手段と、
前記較正ファクタに基づいて前記ブラインド信号源分離技法の前記動作を変更するための手段と、
をさらに備える、請求項32に記載の通信デバイス。
【請求項37】
2つ以上の信号のブラインド信号源分離を強調するための回路であって、前記回路が、
第1のマイクロホンに関連付けられた第1の入力信号と、第2のマイクロホンに関連付けられた第2の入力信号と、を受信し、
前記第1および第2の入力信号に指向性を与え、対応する第1および第2の出力信号を取得するために、前記第1および第2の入力信号にビームフォーミング技法を適用し、
第1のブラインド信号源分離(BSS)信号と第2のBSS信号とを生成するために、前記第1の出力信号と前記第2の出力信号とにBSS技法を適用し、
前記第1および第2の入力信号、前記第1および第2の出力信号、または前記第1および第2のBSS信号、のうちの少なくとも1つを較正する、
ように適合された回路。
【請求項38】
前記ビームフォーミング技法は、前記第1の入力信号と前記第2の入力信号とに空間フィルタ処理を適用し、前記空間フィルタは、他の方向からのサウンド信号を減衰させながら、第1の方向からのサウンド信号を増幅する、請求項37に記載の回路。
【請求項39】
前記回路は、集積回路である、請求項37に記載の回路。
【請求項40】
2つ以上の信号のブラインド信号源分離を強調するための命令を備えるコンピュータ可読媒体であって、プロセッサによって実行されるときに、
第1のマイクロホンに関連付けられた第1の入力信号と、第2のマイクロホンに関連付けられた第2の入力信号と、を取得することと、
前記第1および第2の入力信号に指向性を与え、対応する第1および第2の出力信号を取得するために、前記第1および第2の入力信号にビームフォーミング技法を適用することと、
第1のブラインド信号源分離(BSS)信号と第2のBSS信号とを生成するために、前記前処理された第1の信号と前処理された第2の信号とにBSS技法を適用することと、
前記第1および第2の入力信号、前記第1および第2の出力信号、または前記第1および第2のBSS信号、のうちの少なくとも1つを較正することと、
を前記プロセッサに行わせるコンピュータ可読媒体。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【公開番号】特開2013−70395(P2013−70395A)
【公開日】平成25年4月18日(2013.4.18)
【国際特許分類】
【外国語出願】
【出願番号】特願2012−245596(P2012−245596)
【出願日】平成24年11月7日(2012.11.7)
【分割の表示】特願2010−545157(P2010−545157)の分割
【原出願日】平成21年1月29日(2009.1.29)
【出願人】(595020643)クゥアルコム・インコーポレイテッド (7,166)
【氏名又は名称原語表記】QUALCOMM INCORPORATED
【Fターム(参考)】
【公開日】平成25年4月18日(2013.4.18)
【国際特許分類】
【出願番号】特願2012−245596(P2012−245596)
【出願日】平成24年11月7日(2012.11.7)
【分割の表示】特願2010−545157(P2010−545157)の分割
【原出願日】平成21年1月29日(2009.1.29)
【出願人】(595020643)クゥアルコム・インコーポレイテッド (7,166)
【氏名又は名称原語表記】QUALCOMM INCORPORATED
【Fターム(参考)】
[ Back to top ]