説明

音響ビーム形成装置及び方法

音響ビーム形成装置は、2つの音声入力からビーム形成信号を生成するビーム形成プロセッサを有する。更新プロセッサは、更新基準が満たされる場合、ビーム形成プロセッサのビーム形成フィルタを更新する。適応的フィルタは、これらの信号の1つから信号をフィルタリングし、フィルタ信号と他の音声入力からの信号との間の差分信号が生成される。適応化プロセッサは、差分信号を最小化する適応的フィルタを調整する。基準プロセッサは、(おそらく正規化された)差分信号に応答して更新基準を変更する。具体的には、更新基準は、差分信号がビーム形成プロセッサのビームの外部の強力な信号を示す場合、取得パフォーマンスを向上させるため緩和されるかもしれない。


【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音響ビーム形成装置及び方法に関し、特に限定されるものではないが、音声ソースのためのビーム形成に関する。
【背景技術】
【0002】
音声信号から電気信号への変換は、今日多くのアプリケーションにおいて、また様々な目的のため使用されている重要なプロセスである。例えば、音声信号からサンプリング及びデジタル化された信号への変換は、多数の通信サービス及びアプリケーションのための基礎となっている。例えば、従来の固定電話システム、携帯通信システム又はパケットベースネットワーク(インターネットなど)などの通信システムによりサポートされている音声通信は、大部分の国々において通信サービスの提供の不可欠な部分になっている。
【0003】
高品質の通信サービスを実現するため、高い信号対雑音比による所望の信号の変換が実現されることが重要である。しかしながら、より多数の通信端末は、困難な環境及び状態において使用される。例えば、モバイル通信の普及が進むことは、電話での会話をノイズがあり、急速に変動する環境において行うことを増大させてきた。典型例として、モバイル音声通話は、車両環境におけるハンズフリー操作を使用することによって、頻繁に行われるかもしれない。
【0004】
このような環境では、バックグラウンドノイズでなく所望の音声信号の高品質の変換信号の生成は困難な作業となることは明らかである。提案されたアプローチは、複数のマイクロフォンを使用し、所望の音源に対して音響ビーム形成を生成するため、複数の信号を処理するというものである。このようなビーム形成は、他のソース及び方向からのバックグラウンドノイズを低減しながら所望の信号を増幅するため、所望の信号対雑音比を効果的に増大させるかもしれない。
【0005】
音響ビーム形成のための各種方法及びアルゴリズムが提案されてきた。しかしながら、これらのアルゴリズムが直面する問題は、所望の音源のみがトラッキングされることを保証しながら、音源の正確なトラッキングを提供する方法である。
【0006】
具体的には、音源がマイクロフォンに対して移動するとき、音響ビーム形成アルゴリズムは最適なパフォーマンスを保証するため、このような移動に追従する必要がある。しかしながら、干渉するノイズソースがある可能性があるため、ビーム形成フィルタの適応化は所望の音源のみに従うことが重要であり、ビーム形成アルゴリズムが強力なノイズソースを拾うリスクを低下させることが望ましい。この問題は、所望の音源がサイレントであるときでさえ、ビーム形成アルゴリズムが干渉ソースでなく所望の音源に追従する必要があるため、人による発話など非連続な音源についてはさらにより困難となる。
【0007】
上記問題に対する1つのアプローチは、アップデートを小さくゆっくりとした変動に制限し、大きく急激な変動をなくすことである。具体的には、ビーム形成アルゴリズムは、大きなインビーム(in−beam)信号がある場合に限って、ビーム形成特性が更新されることを可能にする基準を有するかもしれない。これにより、ビーム外の何れの音源もノイズソースであると仮定されるため、インビーム信号が存在しない場合に限って更新が回避されるかもしれない。しかしながら、このようなアプローチは、多くの問題点を有し、具体的には、ビーム形成アルゴリズムが所望のソースの大きい又は急激な移動を追跡し、及び/又は新たな音源にロックオンする機能を制限する。さらに、インビーム音声を確実に検出するロウバストな検出装置の設計は困難であり、適応的な音響ビーム形成装置の実際的なアプリケーションについて大きな障害となる傾向がある。
【0008】
このため、改良された音響ビーム形成システムが効果的であり、特に、取得パフォーマンスとトラッキングパフォーマンスとの間のトレードオフの向上、ビーム形成の精度の向上、所望の音源に対する大きく及び/又は急激な変動に対する適応化の向上、取得パフォーマンスの向上、インビーム検出の向上、実現の容易化、トラッキングパフォーマンスの向上及び/又はビーム形成パフォーマンスの向上を可能にするシステムが効果的である。
【発明の開示】
【発明が解決しようとする課題】
【0009】
従って、本発明は、好ましくは、上述した問題点の1以上を単独で又は何れかの組み合わせにより軽減又は解消しようとするものである。
【課題を解決するための手段】
【0010】
本発明の第1の特徴によると、第1音声入力から第1入力信号を生成する手段と、第2音声入力から第2入力信号を生成する手段と、合成されたビーム形成信号を生成するため、前記第1及び第2入力信号をフィルタリングするためのビーム形成フィルタを有するビーム形成手段と、更新基準が満たされる場合、前記ビーム形成フィルタを更新する更新手段と、第1フィルタ信号を生成するため、前記第1入力信号をフィルタリングする適応的フィルタと、前記第2入力信号と前記第1フィルタ信号との差分信号を生成する手段と、前記差分信号を最小化するため、前記適応的フィルタを適応化する手段と、正規化された前記差分信号に応答して、前記更新基準を変更する変更手段とを有する音響ビーム形成装置が提供される。
【0011】
本発明は、音響ビーム形成を向上させるかもしれない。特に、本発明は、新たな音源及び/又は実質的に及び/又は突然に変更された位置を有する音源への適応化を向上させるかもしれない。本発明は、効率的なトラッキング及び取得パフォーマンスが実現可能なビーム形成アルゴリズムを可能にするかもしれない。効率的な及び/又は低いコンプレクシティの実現形態が実現可能である。
【0012】
合成されたビーム形成信号は、具体的には音声信号に対応するかもしれない。ビーム形成手段は、第1入力信号をフィルタリングする第1適応的フィルタと、第2入力信号をフィルタリングする第2適応的フィルタと、結果として得られるフィルタ信号を合成(合計など)することによって、合成されたビーム形成信号を生成する合成手段とを有するようにしてもよい。差分信号は、おそらく正規化された差分信号であるかもしれない。
【0013】
本発明の任意的特徴によると、前記ビーム形成手段は、前記合成されたビーム形成信号に対して、前記第1入力信号と前記第2入力信号の少なくとも1つについてノイズリファレンス信号を生成するよう構成される。
【0014】
これは、装置の動作を制御するための追加的情報とパフォーマンスの向上を可能にするかもしれない。ノイズリファレンス信号は、例えば、第1及び/又は第2入力信号から所望の信号に対応するコンポーネントを減算することによって生成されるかもしれない。例えば、ノイズリファレンス信号は、時間インバースフィルタリングがビーム形成手段のフィルタリングに対応する時間インバースフィルタリングされた合成されたビーム形成信号に対応する信号と、第1入力信号及び/又は第2入力信号との間の差分の表示であるかもしれない。
【0015】
本発明の任意的特徴によると、前記更新基準は、前記ビーム形成信号のパワー指標が前記ノイズリファレンス信号に応答して決定された閾値より高いという基準を有する。
【0016】
これは、ビーム形成信号の更新の効率的かつ実際的な制御を可能にし、変更手段により効果的かつ実際的に変更可能な更新基準を提供する。
【0017】
本発明の任意的特徴によると、前記変更手段は、前記差分信号に応答して前記閾値を変更するよう構成される。
【0018】
これは、ビーム形成信号の更新の効率的かつ実際的な制御を可能にし、変更手段により効果的かつ実際的に変更可能な更新基準を提供する。変更手段は、具体的には、差分信号の振幅が低下するとき、更新基準を緩和するため閾値を変更するかもしれない。例えば、この閾値は、差分信号が所与の値以下となる場合に低減されるかもしれない。
【0019】
本発明の任意的特徴によると、前記更新基準は、前記第1入力信号のパワー指標が前記第2入力信号に応答して決定された閾値より高いという基準を有する。
【0020】
これは、ビーム形成処理を向上させ、特に適応化パフォーマンスの向上を可能にするかもしれない。
【0021】
本発明の任意的特徴によると、前記変更手段は、前記差分信号に応答して前記閾値を変更するよう構成される。
【0022】
これは、ビーム形成信号の更新の効率的かつ実際的な制御を可能にし、変更手段により効果的かつ実際的に変更可能な更新基準を提供する。変更手段は、具体的には、差分信号の振幅を低減するため閾値を低減するかもしれない。例えば、当該閾値は、差分信号が所与の値以下となる場合に低減されるかもしれない。
【0023】
本発明の任意的特徴によると、前記変更手段は、前記差分信号が閾値以下である場合、前記更新基準を緩和するよう構成される。
【0024】
これは、ビーム形成装置のパフォーマンスの向上を可能にし、新たな又は大きく移動した音源の取得の向上を可能にするかもしれない。更新基準は、ビーム形成手段を更新するため、多数のパラメータの組み合わせを可能にすることによって緩和される。
【0025】
本発明の任意的特徴によると、前記閾値は、前記合成されたビーム形成信号に対して、前記第1入力信号と前記第2入力信号の少なくとも1つのノイズリファレンス信号に応答して決定される。
【0026】
これは、ビーム形成装置のパフォーマンスの向上を可能にし、具体的には、取得パフォーマンスとトラッキングパフォーマンスとの間のトレードオフを良好かつ動的に変動させることを可能にするかもしれない。
【0027】
本発明の任意的特徴によると、前記閾値は、前記第1入力信号に応答して決定される。
【0028】
これは、ビーム形成装置のパフォーマンスの向上を可能にし、具体的には、取得パフォーマンスとトラッキングパフォーマンスとの間のトレードオフを良好かつ動的に変動させることを可能にするかもしれない。
【0029】
本発明の任意的特徴によると、本装置は、前記合成されたビーム形成信号の信頼性の表示を決定する手段をさらに有し、前記変更手段は、前記信頼性の表示に応答して前記更新基準を変更するよう構成される。
【0030】
これは、向上したよりフレキシブルな処理を可能にするかもしれない。例えば、本装置は、トラッキングモードと取得モードにより動作可能であり、信頼性の表示に応答してこれらのモード間の切替をする手段を有するかもしれない。変更手段は、トラッキングモードでなく取得モードにより更新基準を変更するよう構成されるかもしれない。信頼性の表示は、ビーム形成が所望の音源を有する音響ビームを生成する確率を示すかもしれない。
【0031】
本発明の任意的特徴によると、前記変更手段は、前記信頼性の表示が閾値以下である場合に限って、前記更新基準を変更するよう構成される。
【0032】
これは、ビーム形成装置のパフォーマンスの向上を可能にし、具体的には、取得パフォーマンスとトラッキングパフォーマンスとの間のトレードオフを良好かつ動的に変動させることを可能にするかもしれない。
【0033】
本発明の第2の特徴によると、第1音声入力から第1入力信号を生成する手段と、第2音声入力から第2入力信号を生成する手段と、合成されたビーム形成信号を生成するため、前記第1及び第2入力信号をフィルタリングするためのビーム形成フィルタを有するビーム形成手段と、更新基準が満たされる場合、前記ビーム形成フィルタを更新する更新手段と、第1フィルタ信号を生成するため、前記第1入力信号をフィルタリングする適応的フィルタと、前記第2入力信号と前記第1フィルタ信号との差分信号を生成する手段と、前記差分信号を最小化するため、前記適応的フィルタを適応化する手段と、前記差分信号に応答して、前記更新基準を変更する変更手段とを有する通信システムのための通信ユニットが提供される。
【0034】
本発明の第3の特徴によると、第1音声入力から第1入力信号を生成するステップと、第2音声入力から第2入力信号を生成するステップと、合成されたビーム形成信号を生成するため、ビーム形成フィルタが前記第1及び第2入力信号をフィルタリングするステップと、更新基準が満たされる場合、前記ビーム形成フィルタを更新するステップと、第1フィルタ信号を生成するため、適応的フィルタが前記第1入力信号をフィルタリングするステップと、前記第2入力信号と前記第1フィルタ信号との差分信号を生成するステップと、前記差分信号を最小化するため、前記適応的フィルタを適応化するステップと、前記差分信号に応答して、前記更新基準を変更するステップとを有する方法が提供される。
【0035】
本発明の上記及び他の側面、特徴及び効果は、以降に記載される実施例を参照して明らかとなるであろう。
【発明を実施するための最良の形態】
【0036】
以下の説明は、携帯通信システムの通信ユニット(Global System for Mobile communications(GSM)システムの携帯電話など)のための音声信号に適用可能な本発明の実施例に着目する。しかしながら、本発明はこのアプリケーションに限定されるものでなく、例えば、ハンズフリーヘッドセットなどを含む他の多数のデバイス及び装置に適用可能であるということは理解されるであろう。
【0037】
図1は、本発明のいくつかの実施例による音響ビーム形成装置を示す。
【0038】
本装置は、第1入力要素101と第2入力要素103とを有する。具体例では、各入力要素101、103は、マイクロフォンを有すると共に、デジタル値のビットストリーム形式により第1及び第2信号を生成するため、信号をサンプリング及びデジタル化する機能を有する。
【0039】
第1及び第2入力要素は、合成されたビーム形成信号zを生成するよう構成されるビーム形成プロセッサ105に接続される。具体的には、ビーム形成プロセッサ105は、第1及び/又は第2入力信号をフィルタリングし、これらを合成して所望の音源に対する音響ビームに対応する合成信号を生成するビーム形成フィルタを有する。
【0040】
その後、ビーム形成信号zは、個別のアプリケーションについて要求されるように処理されるかもしれない。携帯通信ユニットの具体例については、ビーム形成信号zは音声符号化と無線インタフェースを介した基地局への移行の伝送のための音声エンコーダに供給されてもよく、あるいは音声エンコーダに供給される前に、さらなるノイズリダクションのため、スペクトルポストプロセッサにより処理されてもよい。
【0041】
所望の音源が移動するに従って、ビーム形成プロセッサ105のフィルタリングは、結果として得られる音響ビームが所望の音源に追従するように適応化される。このため、ビーム形成装置は、ビーム形成プロセッサ105に接続される更新プロセッサ107を有する。
【0042】
更新プロセッサ107は、ビーム形成プロセッサ105のフィルタリングを更新するための何れか適切なアルゴリズムを利用し、具体的には、ビーム形成装置やエコーキャンセレーションなどの類似するアプリケーションなどから、当業者に周知な標準的な適応的フィルタリング最適化技術を利用してもよい。
【0043】
更新プロセッサ107は、更新基準を評価する基準プロセッサ109に接続される。更新基準が満たされる場合、基準プロセッサ109は、更新プロセッサ107がビーム形成プロセッサ105を更新可能であることを示す制御信号を更新プロセッサ107に対して生成する。しかしながら、更新基準が満たされていない場合、基準プロセッサ109は、更新プロセッサ107がビーム形成プロセッサ105を更新しないことを示す制御信号を更新プロセッサ107に対して生成する。
【0044】
更新基準は、典型的には、ビーム形成プロセッサ105を更新するため使用される現在の信号が実際に所望される信号である確率の評価であるかもしれない。具体的には、更新プロセッサ107は、インビーム信号に応答してビーム形成プロセッサ105を更新するかもしれない。(すなわち、メインビームにおける信号が実際に所望される信号であると仮定する。)従って、基準プロセッサ109は、ビーム形成プロセッサ105がアクティブな音源を現在トラッキングしているか示す基準を評価するかもしれない。
【0045】
基準プロセッサ109は、効果的には、ビーム形成プロセッサ105が音響ビームの外部にある所望されない(潜在的な強力な)音源について更新されることを回避するかもしれない。これにより、信頼性が向上し、メインソースからの音声のポーズ中などに、所望されない音源にビームが誤って指向される確率が低下するかもしれない。しかしながら、このアプローチはまた、ビーム形成装置がメインビームの外部の音源に対する新たなビームを形成する機能を低下させるかもしれない。このため、ビーム形成装置は新たな音源に対する取得パフォーマンスを低下させるだけでなく、これが突然音響ビームの外部に移動した場合、既存の音源を失うかもしれない。
【0046】
図1のビーム形成装置は、この問題を軽減する機能を有する。
【0047】
ビーム形成装置は、第2入力要素103に接続される適応的フィルタ111を有する。適応的フィルタ111はさらに差分プロセッサ113に接続され、差分プロセッサ113はさらに第1入力要素111に接続される。従って、差分プロセッサ113は、第1マイクロフォンの信号と共に、第2入力信号のフィルタリング信号を受信する。差分プロセッサ113は、具体的には、これらの信号の間の直接的な差分として差分信号を生成するが、いくつかの実施例では、入力信号は差分信号の決定前にさらに処理(フィルタリングなど)されてもよいということは理解されるであろう。
【0048】
差分プロセッサ113は、差分信号を最小化するため適応的フィルタを適応させるよう構成される適応化プロセッサ115に接続される。このため、適応化プロセッサ115は、フィルタリングされた出力と他のマイクロフォンからの入力信号との間の差分が最小化されるように、適応的フィルタ111を調整する。このようにして、適応的フィルタは、主要な音源から2つのマイクロフォンへの音響チャネルにおける差分を補償するよう適応化されるかもしれない。実際、理想的なケースでは、単一の音源について、適応的フィルタ111は、差分信号が実質的にゼロとなるように適応化されるかもしれない。さらに、他の音源、特にノイズ及び干渉ソースが、増大するパワーの干渉信号を生じさせるかもしれない。
【0049】
従って、おそらく正規化された差分信号は、マイクロフォンが強力な音源から信号を現在抽出しているかの表示を提供する。典型的には、このような状況は、スピーカーなどがマイクロフォンの近くに配置されている場合に起こりうる。例えば、ビーム形成装置が携帯電話の一部となっている場合、おそらく正規化された差分信号は、ユーザが近い距離からマイクロフォンに現在発話しているか、又は現在の音声が主としてバックグラウンドノイズであるかの良好な表示となるかもしれない。
【0050】
図1の例では、差分プロセッサ113は、基準プロセッサ109に接続され、差分信号を基準プロセッサ109に供給する。基準プロセッサ109は、差分信号に応答して更新基準を変更するよう構成される。
【0051】
具体的には、基準プロセッサ109は、差分信号が強力な近接する音源が存在していることを示すゼロに大変近い場合に、更新基準を緩和するよう構成されてもよい。
【0052】
例えば、通常動作中、基準プロセッサ109は差分信号を無視し、ビーム形成プロセッサ105が更新可能であるか決定するための所定の基準を利用してもよい。しかしながら、ユーザが装置に対して急速に位置を変更したためなど(例えば、携帯電話のユーザが携帯電話を一方の耳から他方に切り替えるなど)、現在の音声信号を失った場合、基準プロセッサ109は、差分信号に応答して更新基準が制御される取得モードに入るかもしれない。
【0053】
差分信号が十分低い場合、基準プロセッサ109は、ビーム形成プロセッサ105の更新が実行されるように更新プロセッサ107を制御し、差分信号が十分低くない場合、基準プロセッサ109はこのような更新を回避するかもしれない。
【0054】
このため、固定された更新基準を単に使用するのでなく、差分信号に応答して更新基準を変更することによって、効率的なトラッキングを維持しながら、取得パフォーマンスを向上させることが可能となる。
【0055】
具体例として、ビーム形成プロセッサ105により生成される合成されたビーム形成信号が、相対的に長い期間に低い振幅を有してきた場合、これは、例えば、音源が当該期間においてサイレントであったため、又は音源が現在メインビームの外部となるように、音源がマイクロフォンに対して移動したためであるかもしれない。
【0056】
この場合、基準プロセッサ109は、差分信号が十分高い場合、これによりsふような音源がマイクロフォンで受信されない場合、更新を回避するかもしれない。この状況は、発話者が単に長時間サイレントで有り続けた場合の確率が高いとき、このアプローチは、ビームが同じ位置に留まることを可能にし、これにより、ユーザが再び発話を開始するとき、信号が効果的にキャプチャされることを可能にする。
【0057】
しかしながら、差分信号が十分高い場合、このため、主要な音源があるが、メインビームの外部であることを示す場合、基準プロセッサ09は、ビーム形成プロセッサ105の更新を可能にするかもしれない。この状況は、発話者がマイクロフォンに対して移動した可能性が高いため、このアプローチは、ビームが新たな位置に移動することを可能にするかもしれない。
【0058】
以下において、具体的なビーム形成アルゴリズムを使用した一例となる実施例のより詳細な説明が記載される。特に、Noise Viodアルゴリズムとして知られるビーム形成アルゴリズムを使用した実施例が記載される。
【0059】
図2は、本発明のいくつかの実施例による音響ビーム形成手段を有する携帯電話の一例を示す。
【0060】
図2の携帯電話は、2つのマイクロフォン201、203を有する。マイクロフォン201、203は、第1入力信号u1と第2入力信号u2を生成するため、マイクロフォン201、203からの信号をサンプリング及びデジタル化する第1アナログ・デジタルコンバータ205と第2アナログ・デジタルコンバータ207に接続される。Noise Voidアルゴリズムは、ビーム形成装置209とポストプロセッサ211により実現される。ビーム形成装置209は、欧州特許EP0954850−B“Audio Processing arrangement with multiple sources”などに記載されるようなFiltered−Sum Beamformer(FSB)である。ポストプロセッサ211は、PCT特許出願WO0358607“Audio Enhancement system having a spectral power dependent processor”に記載されるようなDynamic Non−stationary Noise Suppressor(DNNS)である。
【0061】
より詳細には、FSB209は、フィルタf1及びf2によりマイクロフォン信号u1及びu2をフィルタリングし、これらフィルタリングされた信号が、FSB出力zに合計される。
【0062】
周波数ドメインでは、FSB z(ω,l)の出力は、
【0063】
【数1】

となる。ただし、F及びFはビーム形成フィルタの周波数レスポンスであり、lはFFTブロックを示す。
【0064】
フィルタのウェートが、
【0065】
【数2】

となるように制限されている間、出力z(ω,l)が最大化されるように、フィルタは更新される。
【0066】
フィルタは、具体的には、音響信号のフィルタリングの分野において適応的フィルタについて周知なように更新されるかもしれない。
【0067】
ビーム形成信号に加えて、FSB209はまた、ビーム形成信号の補完となる2つのリファレンス信号を生成する。具体的には、これらのリファレンスは、所望される音声を最小化しようとするものであり、このため、マイクロフォン201、203により抽出された所望される音源以外の音声信号コンポーネントの有無を示すため、ノイズリファレンス信号とみなされるかもしれない。
【0068】
リファレンス信号は、
【0069】
【数3】

として計算されるかもしれない。ただし、Δ(ω)はフィルタにおける遅延を補償するため、N個のサンプルの遅延となる。具体例では、第2ノイズリファレンス信号のみが使用される。この信号は、
【0070】
【数4】

として表現され、これは、
【0071】
【数5】

として書き換え可能である。
【0072】
ノイズリファレンス信号x及びxが、所望されるソースからのものでない第1及び第2マイクロフォン201、203により抽出された音源の大きさを示すことは理解されるであろう。
【0073】
例えば、1つの所望の音源のみが存在し、マイクロフォン信号u及びuにより表されると仮定する。この場合、u及びuは同一ソースから生じたものであるが、当該1つのソースからマイクロフォン201、203への異なる音響チャネルから到来したかもしれない。当該処理及びビーム形成は、音声信号からの信号に直接対応する合成信号zが受信されるように、フィルタf及びfが異なる音響チャネルを補償するように実行される。
【0074】
合成信号zをフィルタfの時間インバースフィルタFによりフィルタリングすることによって、この理想的ケースでは、第1マイクロフォン201により生成されたものと実質的に同一の信号が生成される。すなわち、fは、音源から第1マイクロフォン201への音響チャネルの時間インバースフィルタのレスポンスを有するよう適応化され、これにより、fの時間インバースフィルタは、音源から第1マイクロフォン201への音響チャネルの転送機能に本来的に対応する。zが音源からのオリジナルの音声信号に対応するとき、時間インバースフィルタFの出力は、理想的ケースでは、uに等しくなり、xはゼロとなる。
【0075】
しかしながら、他の音源について、時間インバースフィルタFは、それらが到来してきた音響チャネルに対応せず、このため、xに信号コンポーネントを提供する。さらに実際には、fは、チャネル推定の不正確さにより(フィルタの理想的でない適応化)、又は実現形態の不正確さにより、音響チャネルレスポンスに正確には一致せず、この乖離がまたリファレンス信号xに信号コンポーネントをもたらす。
【0076】
上記原理はxにも同様に適用され、このため、xとxは、合成されたビーム形成信号zに存在するノイズを示すノイズリファレンス信号となることは理解されるであろう。
【0077】
上述されるようなシステムでは、受信した音響信号が主として所望されるソースからの音声であるとき、フィルタのみを更新することが望ましい。これは、トラッキングパフォーマンスを向上させ、所望されない音源への新たなビームの形成による誤ったロックのリスクを低減する。このため、所望される音声の存在を検出できる検出装置が、記載される携帯電話に対して所望される。残念なことに、ロウバストな検出装置の設計は容易でなく、これは、実際の製品における適応的ビーム形成装置の適用に対する大きな障害となっている。
【0078】
本例では、携帯電話は、所望の発話者が発話しているときにFSB209の更新を制限する機能を有する。所望される発話者の検出はまたインビーム検出と呼ばれ、それは、所望される発話者がビーム形成装置の(メイン)ビームにあるか検出する。これにより、ポストプロセッサ211は更新基準を評価し、FSB209は、当該基準が満たされるときに限って更新される。
【0079】
具体例では、インビーム検出は、FSB209の出力zがリファレンス信号xと比較されることにより、ポストプロセッサ211において実行される。具体的には、更新基準は、ビーム形成信号のパワー指標がノイズリファレンス信号に応答して決定された閾値より高いという基準を有する。より詳細には、ポストプロセッサ211は、P>Wbthresholdx2(ただし、Pは合成されたビーム形成信号zにおけるパワーであり、Px2はノイズリファレンス信号xのパワーであり、Wbthresholdは固定されたパラメータである。)となることを要求する。Wbthresholdは、具体的なアプリケーションと要求されるパフォーマンスに依存するが、その値は典型的には、2〜3の範囲に設定されるかもしれない。
【0080】
さらに、更新基準は、第1入力信号のパワー指標が第2入力信号に応答して決定された閾値より高いという基準を有する。この評価は、マイクロフォン201、203により抽出される信号のパワーの直接的な考慮に対応するかもしれない。
【0081】
例えば、ハンドセットアプリケーション又はヘッドセットアプリケーションについては、典型的には、第1マイクロフォンは第2マイクロフォンより所望される発話者の口にはるかに接近していることが仮定される。所望される発話者が発話しているとき、第1マイクロフォンの信号のパワーは第2マイクロフォンの信号のパワーより大きくなる。このため、さらなる考慮はマイクロフォンのパワーを含み、特にインビーム検出について、Pu1>Mbthresholdとなることが要求される。(ただし、Pu1は第1マイクロフォン201の信号のパワーであり、Pu2は第2マイクロフォン203の信号のパワーであり、Mbthresholdは固定されたパラメータである。)Mbthresholdの好ましい値は、具体的なアプリケーションと要求されるパフォーマンスに依存するが、それらの値は、典型的には、2〜10の範囲内で設定されるかもしれない。
【0082】
もちろん、更新基準は具体的なアプリケーションに依存するかもしれない。例えば、ヘッドセット又はハンドセットのアプリケーションについては、FSB209が更新される前に、両方の要求が満たされる必要がある。しかしながら、ハンズフリーアプリケーションについては、インビーム検出要求が満たされていれば十分であるかもしれない。
【0083】
しかしながら、検出装置が所望される音源がメインビームにあることを示す状況にFSB209の更新を制限することは、トラッキングパフォーマンスを向上させ、誤ったロックの変更を低減するが、それはまた、上述されたようないくつかの問題点を有する。具体的には、所望される発話者が当該発話者がいるとビーム形成装置が予想するのとは異なる位置にいる場合、ビーム形成装置は適応化されないかもしれない。スタートアップ時に、例えば、ビーム形成装置は所望される発話者の予想される位置の方向に形成されるビームに対応するフィルタにより初期化される。しかしながら、所望される発話者が他の位置にいる場合、ビーム形成装置はこの位置に適応化されないかもしれない。また、所望される発話者が通話中に電話を動かす場合など(これにより、携帯電話に関して自分の位置が変動する)、インビーム検出装置及び/又はパワー検出装置は、音源が実際には所望の音源であることを検出せず、このため、FBS209は更新されず、この新たな位置に適応化されない。
【0084】
図2の例では、これらの問題点はさらなる機能を含めることによって解決される。具体的には、明帯電話は、減算器215と第1アナログ・デジタルコンバータ205に接続される適応的フィルタ213を有する。減算器215はさらに、第2アナログ・デジタルコンバータ207に接続される。
【0085】
周波数ドメイン記法を使用すると、減算器215の出力信号は、
【0086】
【数6】

により与えられる差分信号を生成する。ただし、H(ω,l)は適応的フィルタ213の周波数ドメイン変換関数を表す。
【0087】
適応的フィルタ213は、uとuとの間の相関を最小化するよう適応化され、特に差分信号rを最小化するよう適応化される。
【0088】
差分信号は、近接する音源があるか否かの良好な表示となると考えられるかもしれない。例えば、1つの音源しかない理想的なケースでは、マイクロフォン201、203において受信される信号は、音源と各マイクロフォン201、203との間の音響チャネル間の差分の関数としてのみ異なっている。この差分は、適応的フィルタ213によって補償可能であり、実質的にゼロに等しい差分信号rが導かれる。しかしながら、主要な音源がない場合、各マイクロフォンからの信号は相殺できず、大きな振幅の差分信号rが生じることとなる。
【0089】
典型的には、近接する音源が実際に所望される音源であると仮定されるかもしれず、このため、差分信号rは、所望される音源が存在するか否かの別の表示を提供するかもしれない。さらに、この表示は、FSB209のトラッキングパフォーマンスとは独立する物であり、ポストプロセッサ209により実現されるような更新基準を受けない。
【0090】
図3は、説明される信号を生成するためのトポロジーの一例のブロック図を示す。
【0091】
図2のシステムでは、減算器215は、差分信号を受け付ける変更プロセッサ217に接続される。変更プロセッサ217は、ポストプロセッサ211の検出アルゴリズムにより用いられる閾値を決定するよう構成される。具体的には、変更プロセッサ217は、FSB209が更新されるべきか決定するのに使用される閾値を決定するのに使用されるWbthresholdとMbthresholdの各値を決定する。
【0092】
本例では、変更プロセッサ217は、差分信号に応答してWbthresholdとMbthresholdの各値を変更し、このため、インビーム検出とマイクロフォンパワー検出のための各閾値が変更されることとなる。
【0093】
具体的には、変更プロセッサ217は、第2ノイズリファレンス信号Px2のパワーに対する差分信号Pのパワーを考慮する。例えば、
【0094】
【数7】

の値が決定されるかもしれない。
【0095】
いくつかの実施例では、P又はPx2は、これらの値の比較前に補償されてもよいということは理解されるであろう。例えば、rとxの式を比較すると、u(ω,l)が、
【0096】
【数8】

のファクタと乗算されることが送信可能である。このファクタを訂正するため、Pは、
【0097】
【数9】

と変更されるかもしれない。
【0098】
これは正確な近似ではないが、実際上望ましいパフォーマンスを提供することがわかっている。
【0099】
pcdはFSB207のビーム形成パフォーマンスと適応的フィルタキャンセレーションの相対的なノイズレベルの表示となることは理解されるであろう。このため、Ppcdの低い値に対して、適応的フィルタはマイクロフォン201、203の間の信号を効果的にキャンセルすることが可能であり、FSB209はこれを実行することはできない。これは、FSB209の音響ビームの外部にある強力な音声信号を示す。
【0100】
図2の例では、変更プロセッサ217は、このようなケースでは、ポストプロセッサ211の更新基準を緩和するかもしれず、これにより、取得パフォーマンスの向上が可能となる。基準の緩和は、ビーム形成装置の少なくとも1つのパラメータの組み合わせが、緩和が更新を可能にするまでは更新を可能にしないような基準の変更と考えられるかもしれない。このため、ビーム内に信号が存在しないため、FSB209が通常は更新されない状況では、差分信号の独立した表示が近接する音源が実際に存在することを示す場合、更新基準は緩和されるかもしれない。これは、FSB209がこの音源をキャプチャすることを可能にするかもしれない。
【0101】
他の有用な指標は、適応的フィルタにおけるキャンセル量である。それの適切な指標は、Ppcdzとして示され、
【0102】
【数10】

として決定される。Ppcdzは、差分信号のパワーの正規化された指標とみなされ、Ppcdzの値が低くなるほど、キャンセレーションは良好となり、近接する音源の存在の表示はより強力となることは理解されるであろう。
【0103】
本例では、変更プロセッサ217は双方のパラメータを評価する。具体的には、PpcdとPpcdzの双方が十分に小さい場合、WbthresholdとWbthresholdの各値は減少する。これらの値が十分小さい場合、インビーム及びマイクロフォンパワー検出装置の要求が満たされ、これにより更新基準が満たされ、FSB209が更新され、強力な音源に適応化される。FSB209が更新された後、WbthresholdとWbthresholdの各値が再び増加されるかもしれない。FSB209が収束すると、ビームは所望される発話者に向けられ、ビーム形成装置が他の音源の影響を受けないように、更新基準が名目値にのどされる。これにより、トラッキングパフォーマンスと取得パフォーマンスとの間のトレードオフにおける一時的な変動が、自動的に実現されるかもしれない。
【0104】
変更プロセッサ217の具体的な動作例が、以下のプログラムシーケンス(C言語を使用して)により与えられる。
【0105】
【数11】

更新基準の変更はビーム形成が信頼性が低いと考えられる状況に限定可能であるということは理解されるであろう。例えば、合成されたリファレンス信号のパワーに対するノイズリファレンス信号xのパワーは、ビーム形成信号の信頼性の表示と考えられるかもしれない。この値が低くなるほど、ビーム形成信号の信頼性は向上する。
【0106】
シンプルな実施例では、この信頼性の表示は所定の閾値と比較される。信頼性の表示が閾値以下である場合、ビーム形成装置は、所望されるソースが効果的にトラッキングされるトラッキング状態にあるとみなされ、更新基準は名目値に維持されるかもしれない。
【0107】
しかしながら、信頼性の表示が閾値(又は検出におけるヒステリシスを招く第2閾値)を上回る場合、ビーム形成装置は、信号を消失したとみなされ、更新基準が所望のソースを検出する変更を向上させるよう緩和される取得状態にあるかもしれない。
【0108】
図4は、本発明のいくつかの実施例による音響ビーム形成方法を示す。
【0109】
本方法は、ステップ401において開始され、第1音声入力から第1入力信号が生成され、ある時間間隔により第2音声入力から第2入力信号が生成される。
【0110】
ステップ403がステップ403に続き、ビーム形成フィルタが、合成されたビーム形成信号を生成するため、第1入力信号と第2入力信号とをフィルタリングする。
【0111】
ステップ405がステップ403に続き、適応的フィルタが、第1フィルタ信号を生成するため、第1入力信号をフィルタリングする。
【0112】
ステップ407がステップ405に続き、第2入力信号と第1フィルタ信号との間の細分信号が生成される。
【0113】
ステップ409がステップ407に続き、適応的フィルタが差分信号を最小化するよう適応化される。
【0114】
ステップ411がステップ409に続き、差分信号に応答して、更新基準が変更される。
【0115】
ステップ413がステップ411に続き、更新基準が評価され、更新基準が満たされている場合、ビーム形成フィルタが更新される。
【0116】
ステップ413の後、本方法は、次の時間間隔の処理のためステップ401に戻る。
【0117】
簡単化のため、上記記載は異なる機能ユニット及びプロセッサを参照して本発明の実施例を説明したことは理解されるであろう。しかしながら、各種機能ユニット又はプロセッサの間の機能の何れか適切な分散が、本発明から逸脱することなく利用可能であるということは明らかであろう。例えば、個別のプロセッサ又はコントローラにより実行されるよう示される機能は、同一のプロセッサ又はコントローラにより実行可能である。このため、具体的な機能ユニットの参照は、厳密に論理的又は物理的構造又は構成を示すのではなく、記載された機能を提供するための適切な手段を参照するものとしてみなされるべきである。
【0118】
本発明は、ハードウェア、ソフトウェア又はこれらの何れかの組み合わせを含む何れか適切な形式により実現可能である。本発明は、任意的には、1以上のデータプロセッサ及び/又はデジタル信号プロセッサ上で実行されるコンピュータソフトウェアとして少なくとも部分的に実現可能である。本発明の実施例の要素及びコンポーネントは、何れか適切な方法により物理的、機能的及び論理的に実現されてもよい。実際、当該機能は単一のユニット、複数のユニット又は他の機能ユニットの一部として実現されるかもしれない。また、本発明は、単一のユニットにより実現されてもよく、又は異なるユニット及びプロセッサ間に物理的及び機能的に分散されてもよい。
【0119】
本発明がいくつかの実施例に関して説明されたが、ここに与えられた特定の形式に限定されることを意図したものでない。本発明の範囲は、添付した請求項によってのみ制限される。さらに、特定の実施例に関してある特徴が説明されているように見えるかもしれないが、当業者は、記載された実施例の各種特徴が本発明により組み合わせ可能であるということを認識するであろう。請求項において、“有する”という用語は他の要素又はステップの存在を排除するものでない。
【0120】
さらに、個別に列記されるが、複数の手段、要素又は方法ステップは、単一のユニット又はプロセッサなどにより実現されるかもしれない。さらに、各特徴が異なる請求項に含まれるかもしれないが、これらはおそらく、効果的に組み合わせ可能であり、異なる請求項に含まれることは、各特徴の組み合わせが実現可能及び/又は効果的でないことを意味するものでない。また、ある請求項のカテゴリにある特徴を含めることは、当該カテゴリへの限定を意味するものでなく、当該特徴が必要に応じて他のクレームカテゴリに等しく適用可能であることを示している。さらに、請求項における各特徴の順序は、これらの特徴が機能しなければならない具体的な順序を意味するものでなく、特に方法クレームの角ステップの順序は、これらのステップがその順序により実行される必要があることを意味するものでない。各ステップは何れか適切な順序により実行可能である。さらに、単数形の表現は複数を排除するものでない。このため、“ある”、“第1の”、“第2の”などの表現は、複数を排除するものでない。請求項における参照記号は、簡単化した例として単に与えられているものであり、請求項の範囲を限定するものと解釈されるべきでない。
【図面の簡単な説明】
【0121】
【図1】図1は、本発明のいくつかの実施例による音響ビーム形成装置を示す。
【図2】図2は、本発明のいくつかの実施例による音響ビーム形成手段を有する携帯電話の一例を示す。
【図3】図3は、本発明のいくつかの実施例による音響ビーム形成装置において使用される信号を生成するためのトポロジーの一例のブロック図を示す。
【図4】図4は、本発明のいくつかの実施例による音響ビーム形成方法を示す。

【特許請求の範囲】
【請求項1】
第1音声入力から第1入力信号を生成する手段と、
第2音声入力から第2入力信号を生成する手段と、
合成されたビーム形成信号を生成するため、前記第1及び第2入力信号をフィルタリングするためのビーム形成フィルタを有するビーム形成手段と、
更新基準が満たされる場合、前記ビーム形成フィルタを更新する更新手段と、
第1フィルタ信号を生成するため、前記第1入力信号をフィルタリングする適応的フィルタと、
前記第2入力信号と前記第1フィルタ信号との差分信号を生成する手段と、
前記差分信号を最小化するため、前記適応的フィルタを適応化する手段と、
前記差分信号に応答して、前記更新基準を変更する変更手段と、
を有する音響ビーム形成装置。
【請求項2】
前記ビーム形成手段は、前記合成されたビーム形成信号に対して、前記第1入力信号と前記第2入力信号の少なくとも1つについてノイズリファレンス信号を生成するよう構成される、請求項1記載の装置。
【請求項3】
前記更新基準は、前記ビーム形成信号のパワー指標が前記ノイズリファレンス信号に応答して決定された閾値より高いという基準を有する、請求項2記載の装置。
【請求項4】
前記変更手段は、前記差分信号に応答して前記閾値を変更するよう構成される、請求項3記載の装置。
【請求項5】
前記更新基準は、前記第1入力信号のパワー指標が前記第2入力信号に応答して決定された閾値より高いという基準を有する、請求項1記載の装置。
【請求項6】
前記変更手段は、前記差分信号に応答して前記閾値を変更するよう構成される、請求項5記載の装置。
【請求項7】
前記変更手段は、前記差分信号が閾値以下である場合、前記更新基準を緩和するよう構成される、請求項1記載の装置。
【請求項8】
前記閾値は、前記合成されたビーム形成信号に対して、前記第1入力信号と前記第2入力信号の少なくとも1つのノイズリファレンス信号に応答して決定される、請求項7記載の装置。
【請求項9】
前記閾値は、前記第1入力信号に応答して決定される、請求項7記載の装置。
【請求項10】
前記合成されたビーム形成信号の信頼性の表示を決定する手段をさらに有し、
前記変更手段は、前記信頼性の表示に応答して前記更新基準を変更するよう構成される、請求項1記載の装置。
【請求項11】
前記変更手段は、前記信頼性の表示が閾値以下である場合に限って、前記更新基準を変更するよう構成される、請求項10記載の装置。
【請求項12】
第1音声入力から第1入力信号を生成する手段と、
第2音声入力から第2入力信号を生成する手段と、
合成されたビーム形成信号を生成するため、前記第1及び第2入力信号をフィルタリングするためのビーム形成フィルタを有するビーム形成手段と、
更新基準が満たされる場合、前記ビーム形成フィルタを更新する更新手段と、
第1フィルタ信号を生成するため、前記第1入力信号をフィルタリングする適応的フィルタと、
前記第2入力信号と前記第1フィルタ信号との差分信号を生成する手段と、
前記差分信号を最小化するため、前記適応的フィルタを適応化する手段と、
前記差分信号に応答して、前記更新基準を変更する変更手段と、
を有する通信システムのための通信ユニット。
【請求項13】
第1音声入力から第1入力信号を生成するステップと、
第2音声入力から第2入力信号を生成するステップと、
合成されたビーム形成信号を生成するため、ビーム形成フィルタが前記第1及び第2入力信号をフィルタリングするステップと、
更新基準が満たされる場合、前記ビーム形成フィルタを更新するステップと、
第1フィルタ信号を生成するため、適応的フィルタが前記第1入力信号をフィルタリングするステップと、
前記第2入力信号と前記第1フィルタ信号との差分信号を生成するステップと、
前記差分信号を最小化するため、前記適応的フィルタを適応化するステップと、
前記差分信号に応答して、前記更新基準を変更するステップと、
を有する方法。
【請求項14】
請求項13記載の方法を実行するためのコンピュータプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate


【公表番号】特表2009−500938(P2009−500938A)
【公表日】平成21年1月8日(2009.1.8)
【国際特許分類】
【出願番号】特願2008−520036(P2008−520036)
【出願日】平成18年7月3日(2006.7.3)
【国際出願番号】PCT/IB2006/052225
【国際公開番号】WO2007/004188
【国際公開日】平成19年1月11日(2007.1.11)
【出願人】(590000248)コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ (12,071)
【Fターム(参考)】