説明

移動体オーディオデバイスのための自動的な音量およびダイナミックレンジの調整

【課題】移動体オーディオデバイスのためのノイズのキャンセルと自動的な音量調整に関する方法、装置を提供する。
【解決手段】移動体オーディオデバイスは、オーディオダイナミックレンジ制御ADRC125と自動音量制御AVC126を実行して、オーディオの小音量パッセージが聴き取りやすくなるように、移動体オーディオデバイスのスピーカーから出力されるサウンド127の音量を増加させる。この小音量パッセージは、他のより大音量のパッセージを過剰に増幅させることなく、また、クリッピングによるかなりの歪みをもたらすことなく増幅される。マルチ−マイクロフォンアクティブノイズキャンセルMMANC133機能を使用して移動体オーディオデバイスのマイクロフォン上でピックアップされたオーディオ情報から背景ノイズを除去する。

【発明の詳細な説明】
【分野】
【0001】
開示する実施形態は、移動体オーディオデバイスのためのノイズのキャンセルと自動的な音量調整に関連する。
【背景】
【0002】
図1(従来技術)は、スピーチ情報からノイズとエコーを取り除く、アクティブなノイズキャンセルシステムの図である。スピーチ基準マイクロフォンとして呼ばれる、第1のマイクロフォンMIC1は、所望のスピーチ源の近くに配置される。このMIC1は、セルラ電話機のユーザからの音響スピーチ情報をピックアップし、これを電子的スピーチ信号1へと変換する。このスピーチ信号1は、背景ノイズ混じりの信号である。ノイズ基準マイクロフォンとして呼ばれる、第2のマイクロフォンMIC2は、ノイズ源の近くに、または、スピーチ源から遠く離れた場所に配置される。このMIC2は、音響ノイズをピックアップし、これを電子的ノイズ基準信号2へと変換する。ノイズ基準信号2は、スピーチ信号に比較して、比較的、所望のスピーチ情報をなくしたものであるとして仮定される。分離回路3は、ノイズ基準信号を使用して、ノイズをキャンセルして、到来信号を、スピーチ信号4とノイズ信号5へと分離する。スピーチ信号4は、比較的ノイズをなくしたものである。エコーキャンセルは、適応フィルタを用いて、エコーパスをミミックすることを含む。キャンセラ6および7は、マイクロフォンMIC1およびMIC2による信号出力から発生されたエコー信号を抽出する。さまざまな技術分野において実践されている数多くのこのようなアクティブノイズキャンセル技術および回路がある。
【0003】
移動体通信デバイス(例えば、セルラ電話機)は、一般的に小さい物理的寸法を持っている。このような小さい寸法は、アクティブノイズキャンセルシステムの複数のマイクロフォンの間の距離を制限する。結果として、ノイズ基準信号は、一般的に、所望のスピーチ情報をなくしたものではなく、ノイズキャンセル性能は制限されている。単純なアクティブノイズフィルタリング技術は、ノイズのいくらかのものをキャンセルされないままにする一方で、所望のスピーチ信号のいくらかのものをキャンセルしてしまいがちである。
【0004】
ブラインド信号分離(BSS)として知られている、より洗練されたノイズ削減技術は、デジタル補聴器において使用されてきた。このようなBSSシステムでは、ノイズキャンセルシステムの2つのマイクロフォンは、補聴器ユーザの両耳中に位置している。したがって、2つのマイクロフォンのいずれのものも、ノイズをピックアップするために主として使用されることができない。両方のマイクロフォンが、スピーチとともにキャンセルすべきノイズをピックアップする。時間的な反ハビアン学習アルゴリズムを使用して、ノイズとスピーチ情報を分離する。さらなる情報に関しては、M. Girolami氏による、“ノイズキャンセルと信号分離のための対称適応最大尤度推定”、Electronics Letters, 33(17): 1437−1438 (1997)と、K. Torkkola氏による、“情報最大化に基づいたコンボルブド源のブラインド分離”信号処理のニューラルネットワークのためのIEEE ワークショップ、京都、日本、1996年とを参照のこと。BSSシステムの性能は、一般的に、インパルス応答の対称性と、マイクロフォンの適切な配置とに依拠しているので、追加的な信号処理が適用されてもよい。
【0005】
図2(従来技術)は、いくつかのセルラ電話機で用いられるシステムの図である。セルラ電話機を使用しているときに、セルラ電話機ユーザは、他の比較的大音量のパッセージとともに、より小音量のパッセージを持つオーディオを傾聴しているかもしれない。ユーザが騒がしい環境中でオーディオを傾聴している場合、ユーザがより小音量のパッセージを聴き取ることは、背景ノイズのために妨げられるかもしれない。スピーカーに供給されている全体の電気的信号が、単純に増幅される場合、より小音量のパッセージを、ユーザが聴き取ることができるように、より小音量のパッセージが増幅されることになるが、ここで、より大音量のパッセージは、クリッピングの発生するポイントまで増幅されることになるかもしれない。このようなクリッピングは、スピーカーから出力されるサウンドに、望ましくない歪みをもたらすだろう。大音量のサウンドは、ユーザの耳を損傷させるかもしれない。このような望ましくないクリッピングと歪みを避けるために、信号8の振幅が、時間ドメイン中で追跡される。信号がより弱い場合、信号がより大きい利得値で増幅されるように、他方、信号がより強い場合、信号がより小さい利得値で増幅されるように、信号は、入力振幅の関数である利得によって増幅される。全体の信号のダイナミックレンジは、このように圧縮される。このプロセスは、“圧縮”または“オーディオダイナミックレンジ制御”(ADRC)として呼んでもよく、ADRCブロック10で発生する。
【0006】
自動音量制御(AVC)11として知られているプロセスが、ADRCブロック10の出力に適用される。背景ノイズのレベルが、マイクロフォン12および関連回路13によって検出される。低い背景ノイズの状況下では、圧縮された信号9は、AVCブロック11によって増幅される必要がなく、大きく増幅されずにスピーカーに対して供給される。しかしながら、高い背景ノイズの状況下では、圧縮された信号9は、AVCブロック11によってかなり増幅される。ADRCブロック10によって実行される圧縮のために、オーディオの高振幅部分のクリッピングは減少され、または、なくされる。上記の図2の記述は、簡潔なものである。より詳細な説明は、米国特許第6,766,176号を参照のこと。
【発明の概要】
【0007】
移動体オーディオデバイス(例えば、セルラ電話機のような移動体通信デバイス)は、オーディオダイナミックレンジ制御(ADRC)を実行して、オーディオ信号のダイナミックレンジを制限する。自動音量制御(AVC)は、次に、利得を適用して、ADRCからの信号出力の大きさを増大させる。この増幅は、クリッピングによるかなりの歪みをもたらすことなく発生する。結果としての圧縮されたオーディオ信号を使用して、移動体オーディオデバイスのスピーカーを駆動する。圧縮されたオーディオ信号は、実際には、一般的に従来技術におけるような、デジタルアナログコンバータのような介在回路を通して、間接的にスピーカーを駆動する。
【0008】
移動体オーディオデバイスはまた、マルチ−マイクロフォンアクティブノイズキャンセル(MMANC)も実行する。1つの例では、MMANCを使用して、移動体オーディオデバイスのマイクロフォン上でピックアップされた、非ノイズオーディオ情報(例えば、スピーチ情報)から、背景ノイズを除去する。非ノイズ情報(例えば、スピーチ情報)は、移動体オーディオデバイスから送信のために無線インターフェースに進められる。アクティブノイズキャンセル動作を実行する際に、MMANCプロセスは、中間信号としてノイズ基準信号を発生させる。
【0009】
その中で移動体オーディオデバイスが動作していてもよい環境は、比較的一定の特性を有する変動のないノイズを含んでいてもよく、および/または、より急速に変化する変動のあるノイズも含んでいてもよい。例えば、移動体オーディオデバイスのユーザが、込み合った部屋にいる場合、背景の会話は、このような変動のあるノイズをもたらすかもしれない。例えば、ユーザが混雑した大通りを歩いている場合、大通りを通過している車両は、このような変動のあるノイズをもたらすかもしれない。MMANCプロセスの1つの例では、MMANCプロセスによって発生されたノイズ基準信号は、比較的高速に調整されて、このような変動のあるノイズの存在または不在を表す。到来するマイクロフォンオーディオサンプルがMMANCプロセスへと受信されるおよそのレートで、ノイズ基準信号を調節する。アクティブノイズキャンセルプロセスは、移動体オーディオデバイスのユーザが話しており、ユーザのスピーチが、マイクロフォンによってピックアップされている時であっても、ノイズ基準信号がノイズの存在または不在を正しく表すことができるようなものである。
【0010】
1つの有利な観点では、MMANCプロセスにおいて発生された中間信号であるノイズ基準信号を使用して、ADRCとAVCプロセスを制御する。1つの例では、ノイズ基準信号をスケールおよびフィルタして、制御信号を発生させる。制御信号は、ADRCのAVC部分とAVCプロセスが使用して、利得を決定するための基準であり、この利得を、AVC部分がADRC部分の出力に対して適用する。適用される利得は、制御信号の関数である。
【0011】
移動体オーディオデバイスは、例えば、(MP3プレーヤーのような)デジタルオーディオプレーヤー、デジタルメディアプレーヤー(例えば、画像およびビデオ再生能力を持つiPOD)、デジタルカメラ、パーソナルデジタルアシスタント(PDA)、ラップトップコンピュータのようなパーソナルコンピューター、または、(セルラ電話機のような)移動体通信デバイス、あるいは、オーディオを再生できる、他の類似したデバイスであってもよい。移動体オーディオデバイスは、マイクロフォン上でピックアップされたオーディオ情報を取り込み、記憶し、および/または送信する能力を含んでいてもよく、または、含んでいなくてもよい。
【0012】
さらなる方法および構造を、以下の詳細な説明において説明する。この発明の概要は、発明を規定することを意図していない。発明は、特許請求の範囲によって、規定される。
【図面の簡単な説明】
【0013】
【図1】図1(従来技術)は、マルチマイクロフォンアクティブノイズキャンセルシステムの図である。
【図2】図2(従来技術)は、オーディオダイナミックレンジ制御(ADRC)と自動音量制御(AVC)とを含むいくつかのセルラ電話機において用いられるシステムの図である。
【図3】図3は、1つの新規な観点にしたがった移動体オーディオデバイス100の1つの特定のタイプの高レベルブロック図である。
【図4】図4は、図3のMSM集積回路101において実行される機能を図示する機能ブロック図である。
【図5】図5は、図4の音量制御とスピーカー補償機能ブロック122の1つの例のブロック図である。
【図6】図6は、図5のADRC機能ブロック125の動作を図示するグラフである。
【図7】図7は、図5のADRC機能ブロック125のより詳細な機能ブロック図である。
【図8】図8は、1つの新規な観点にしたがった方法のフローチャートである。
【詳細な説明】
【0014】
図3は、1つの新規な観点にしたがった移動体オーディオデバイス100の1つの特定の例のブロック図である。この例における移動体オーディオデバイス100は、移動体通信デバイスであり、より詳細には、セルラ電話機である。移動体オーディオデバイス100は、(ここで、“移動局モデム”またはMSMとして呼ばれる)デジタルベースバンド集積回路101、第1の無線周波数(RF)トランシーバ集積回路102、第2のRF集積回路103、第1のアンテナ104、第2のアンテナ105、およびRF集積回路に対してアンテナを結合する、他の個別のコンポーネントを含む。さらに、移動体オーディオデバイス100は、キーパッド106、ディスプレイ107、スピーカー108、および、第1のマイクロフォン109と第2のマイクロフォン110のような他のコンポーネントを含む。
【0015】
アンテナ105から移動体オーディオデバイス100に受信された電話会話情報の一般的なパスは、第1のRF集積回路102を通過し、パス111を通って、MSM101の受信アナログデジタルコンバータ(RX ADC)112へと通過する。情報が、スピーカー108上で聴き取られるべきスピーチ情報である場合、モデムブロック113、プロセッサ114のようなデジタル回路によって、スピーチコード化されたデジタル値のストリームへと情報が処理される。スピーチコード化デジタル値のストリームは、オーディオブロック115中の適切なボコーダによってデコードされ、アナログ信号へとコンバートされ、次にアナログ信号はスピーカー108を駆動するのに出力される。電話会話のスピーチが、移動体オーディオデバイス100のマイクロフォンによってピックアップされて、電話会話の別の参加者に対して、アンテナ105を通して送信されることになる場合、情報のパスはマイクロフォン109と110から、オーディオブロック115へと拡張される。情報はデジタルの形式へと変換され、オーディオブロック115中の適切なボコーダが、情報をコード化されたデジタル値のストリームへとエンコードする。プロセッサ114とモデムブロック113による処理の後、送信デジタルアナログコンバータ(TX DAC)116は、アナログ形式の情報をパス117経由で第2のRF集積回路103へと出力する。情報は、第2のRF集積回路103を通って、個別の電力増幅器および他の回路を通り、送信のためにアンテナ105に送られる。
【0016】
図4は、図3のMSM集積回路101において実行される機能を図示する機能ブロック図である。図3のオーディオブロック115中で、2つのアナログデジタルコンバータ(ADC)118および119が提供される。ADC118は、第1のマイクロフォン109から受け取られたアナログ信号をデジタル化し、他方、ADC119は、第2のマイクロフォン110から受け取られたアナログ信号をデジタル化する。デジタルアナログコンバータ(DAC)120は、図3のオーディオブロック115中で提供される。DAC120によるアナログ信号出力は、図示したようにスピーカー108を駆動する。図4の図は、4つの主要メカニズムまたは機能ブロックを図示する。すなわち、1)バックエンド信号処理ブロック121、2)音量制御とスピーカー補償機能ブロック122、3)マルチマイクロフォンアクティブノイズキャンセル(MMANC)機能ブロック123、および、4)信号調整機能ブロック124である。機能ブロック122は、“スピーカー利得制御ユニット”としても呼ばれてもよい。ブロック122および120を通したスピーカー108に対するオーディオ信号パスは、“フォワードリンク”として呼ばれることもある。マイクロフォン109および110からの、ブロック118、119、および123を通したオーディオ信号パスは、“受信リンク”として呼ばれることもある。メカニズムまたは機能ブロック121、122、123、および124は、ソフトウェア、ファームウェア、専用ハードウェア、またはこれらの組み合わせで実現してもよい。1つの例では、図4の機能ブロック121、122、および123は、集積回路101中の1つ以上のプロセッサ上で実行される1組のプロセッサ実行可能命令として実現される。1組のプロセッサ実行可能命令は、集積回路101中の1つ以上の関係するプロセッサ読み取り可能媒体(例えば、ROMまたは他の半導体メモリ)中に記憶されている。
【0017】
図4の音量制御とスピーカー補償機能ブロック122は、オーディオダイナミックレンジ制御(ADRC)と、自動音量制御(AVC)機能を実行する。したがって、ブロック122は、ADRC機能ブロック125とともに、AVC機能ブロック126も含む。
【0018】
図5は、音量制御とスピーカー補償機能ブロック122の1つの特定の例をより詳細に示す。矢印127は、図4のバックエンドおよび信号処理機能ブロック121から図4の音量制御とスピーカー補償機能ブロック122へと送られたデジタルパルスコード変調(PCM)オーディオ情報値のストリームを現す。矢印128は、図4の音量制御とスピーカー補償機能ブロック122から図4のDAC120に送られる圧縮されたデジタルオーディオ情報値のストリームを表す。図5に図示したように、音量制御とスピーカー補償機能ブロック122は、出力フィルタ129、固定利得論理130、ADRC(“圧縮器”として呼ばれることもある)125、AVC126、およびユーザ音量設定論理131を含む。
【0019】
ADRCとAVC:
移動体オーディオデバイス100は、変動のないノイズと変動のあるノイズを含む、高レベルの背景ノイズを有する環境において使用可能である。移動体オーディオデバイス100のユーザが、スピーカー108から出力される音をリスニングしている状況を考慮する。デジタルオーディオ情報値127のストリーム中の対応するパッセージの値が、比較的小さい振幅を有するため、サウンドの第1のパッセージは、比較的小音量であるかもしれない。デジタルオーディオ情報値のストリーム127中の対応するパッセージの値が、比較的大きい振幅を有するため、サウンドの第2のパッセージは、比較的大音量であるかもしれない。(用語“パッセージ”は、ここで、オーディオの時間スライス、またはオーディオ情報値のストリームのその対応する部分を表し、ここで、パッセージのうちの1つが、時間において、他のものの前に発生するように、時間的ドメインでパッセージが選ばれる。)ダイナミックレンジ制御が実行されない場合、および、ストリーム127の両方のパッセージが、単にアナログ形式に変換されて、スピーカー108を駆動するのに使用される場合、ユーザは、高い背景ノイズによって、オーディオの対応する小音量のパッセージを聴き取るのが困難になるかもしれない。他方、より低振幅のパッセージがより容易に聴き取ることができるように、両方のパッセージが同一の利得値によって増幅される場合、比較的より高い振幅のパッセージは、クリッピングが発生するほど多く増幅されてしまうかもしれない。スピーカー108から出力されるときにサウンドに歪みをもたらすので、このようなクリッピングは、一般的に、望ましくない。
【0020】
図4の音量制御とスピーカー補償機能ブロック122の異なる実施形態において使用可能な、ADRCおよびAVC機能の複数の異なる変形がある。第1の特定の例にしたがうと、ストリーム127のデジタル値はフィルタされ、固定利得によって増分される。ADRC125は、ストリームがブロック125へと受け取られると、ストリームの振幅レベルを追跡する。ADRC125は、到来するストリームの(複数のデジタル値を通して決定される)振幅の関数である利得値によってストリームのデジタル値を増分させる。
【0021】
図6は、ADRC125の動作を図示する。現在の例では、到来している振幅が第1の予め定められたしきい値T1を下回るとして決定される場合、ゼロの利得が適用される。これは、“ノイズゲート”として呼ばれることもある。このような状況では、スピーカー108が何のサウンドも出力しないことが好ましい。しかしながら、到来している振幅が、第1の予め定められたしきい値T1と第2の予め定められたしきい値T2との間にある場合、図6のグラフ中の上向きに伸長している黒線に沿って、しきい値T1から右へと動作ポイントが移動するように、増加しつつある利得が適用される。このADRC125の動作の領域を、“強調”として呼ぶこともある。到来する振幅が、第2の予め定められたしきい値T2と、第3のしきい値T3との間にある場合、一定の利得が適用される。この一定の利得が、図6の傾斜した破線の斜面により示される。到来する信号の振幅が、第3の予め定められたしきい値T3を上回る場合、黒線に沿って、しきい値T3から右へと動作ポイントが移動するように、減少しつつある利得が適用される。このADRC125の動作の領域を、“圧縮”として呼ぶこともある。到来する信号の振幅が、第4のしきい値T4を上回る場合、出力は、最大値に“制限”される。したがって、T3を下回る到来している信号の低振幅パッセージは、T3を上回る到来している信号の高振幅部分より高い利得値で増幅される。信号127の全体のオーディオ情報ダイナミックレンジは、ADRC125によって、“圧縮”されると言える。結果の利得調整されたコンポーネント値は、圧縮されたデジタルオーディオ情報値のストリーム132の構成要素となる。
【0022】
自動音量制御(AVC)126は、ストリーム132に対して利得を適用し、これによって音量制御されたデジタル値のストリーム134を発生させる。ADRC125が、オーディオストリームのダイナミックレンジに予め制限されている結果として、AVC機能ブロック126が、利得によってストリーム中の値を増幅するとき、オーディオのより小音量のパッセージを、より容易にスピーカー108からユーザによって聞き取ることができ、また、より大音量のパッセージは、実質的なクリッピングが発生するほどまで多くは増幅されない。クリッピングによるサウンド中の歪みは、減少され、または、防止される。
【0023】
機能ブロック122の1つの例では、ストリーム127は、複数の周波数帯域に分離される。それぞれの周波数帯域は、個別のADRCおよびAVC処理を経る。圧縮動作のさまざまなパラメータ(適用される利得値と、予め定められた振幅しきい値)は、異なる周波数帯域に対して異なるように設定することができる。1つの制御信号133があるというよりは、信号調整ブロック124が、それぞれの周波数帯域に対する制御信号を発生させる。ある帯域に対する制御信号が、その帯域のAVC処理に対する基準として使用される。それぞれの帯域のADRCとAVC処理のあと、すべての帯域のAVC処理の出力ストリームが結合されて、圧縮されたデジタルオーディオ情報の単一のストリーム128を形成する。このストリーム128は、ユーザ音量設定論理を通過して、アナログ形式に変換され、スピーカーに供給される。比較的低周波数である、強いベースドラムキックビートを持つ音楽もある。このベースドラムキックビートのエネルギーをそれ自身の周波数帯域へと分離させることによって、音楽のうちの他のコンポーネントよりもより少なく、ベースドラムキックビートコンポーネントを増幅させるように、この周波数帯域に対して、利得としきい値を適用することができる。
【0024】
図4のADRCおよびAVC機能ブロックの第2の特定の例は、米国特許第6,766,176号で述べられており、特に、米国特許第6,766,176号の図8の上部分の説明において述べられている。図5は、この第2の特定の例における音量制御とスピーカー補償機能ブロック122のより詳細な図である。米国特許第6,766,176号に説明されているように、出力フィルタ129は、固定利得論理130に対してデジタル値を提供し、これは、代わりに、固定利得Gによってデジタル値を増幅させ、これによって、増幅されたデジタルサンプル値を発生させる。増幅されたデジタルサンプル値が、ADRC機能ブロック125へ提供される。ADRC機能ブロック125は、圧縮を実行し、圧縮されたデジタルオーディオ情報値のストリーム132を発生させる。AVC126は、定期的に更新された背景ノイズ推定(BNE)制御信号133を受信する。AVC126は、(ADRC125から受け取られるCthereshから取得されるような、また、ブロック131から受け取られた、現在の音量レベル信号から取得されるような)利用可能なヘッドルームの評価と、BNE制御信号133とに基づいて、利得値によってストリーム132中のデジタル値を増大させる。AVC126は、音量制御されたデジタル値のストリーム134を出力し、このストリーム134は、ユーザ音量設定論理131に供給される。移動体オーディオデバイス100のユーザは、AVC126が、それ以降にスピーカー音量が、ユーザ所望のスピーカー音量レベルをターゲット音量として持つように、ユーザ音量設定論理131を使用して、スピーカー音量レベルを手動で設定してもよい。したがって、ユーザ音量設定論理131は、デジタル化されたスピーチサンプルのストリーム128を、適切な音量レベルで、DAC120に提供する。DAC120は、代わりに、ストリーム128を、スピーカー108を駆動するのに使用されるアナログ信号に変換する。
【0025】
図7は、図5のADRC機能ブロック125のより詳細な機能ブロック図である。より詳細については、米国特許第6,766,176号を参照せよ。デジタル値サンプル、x[n]は、固定利得論理130による増幅後に、フィルタ300(フィルタ300は、オプション的なものであり、ある実施形態では、省略されてもよい)と、遅延エレメント301に提供される。遅延エレメント301は、FIFOとして実現されてもよいが、予測的に出力信号レベルを制御するように働き、これによって、送信の前にピークをアタックする。フィルタ300は、バンドパスフィルタであってもよい。RMS計算機302は、サンプルのRMS(二乗平均)レベルを決定する。1つの実施形態におけるRMS計算機302は、デジタル値サンプルのストリームに適用される、一次ローパスフィルタである。該当する最も小さい周波数コンポーネントが、所定の平滑化フィルタに対する一定のRMS出力を達成できるように、フィルタの時間定数が選ばれる。RMSレベル値が、対数計算論理303に供給され、対数計算論理303は、RMSレベル値のベース2対数を計算し、計算されたベース2対数値を0.5で乗算し、これによって、デシベル(dB)の単位で出力信号を発生させる。dB信号は、加算器/減算器304に供給され、これは、dB信号から圧縮しきい値Cthreshを減算する。結果としてのdB信号が、圧縮器論理305に提供され、これは、信号上に圧縮機能を実行する。結果としての信号が、乗算器306に提供され、乗算器306は、(否定)圧縮スロープ値Cslopeを減衰させることによって、信号を乗算する。RMSレベルが値Cthreshを上回るように上昇する場合、数式:Cslope=1−1/Rにしたがって、dBの割合として、圧縮率Rを特定する値Cslopeに基づいて、(適切なアタックおよびリリース時間を有する)信号に圧縮が適用される。圧縮率Rは、すべての圧縮が実際に発生するRMSレベルとして規定されてもよい。特定の信号パスに対する、圧縮しきい値Cthreshと、圧縮スロープ値Cslopeは、正規化のために、所望の平均dBm0発話者レベルにしたがって、選ばれるべきである。マルチプレクサ306は、逆対数計算論理307に対して、出力dB信号を提供し、逆対数計算論理307は、2の値を、dB信号値(dBでのG)の指数べきに累乗することによって、dB信号の逆ベース2対数を計算する。逆対数計算論理307は、出力信号f[n]を発生させる。信号f[n]は、アタック/リリース時間適用論理308に提供され、アタック/リリース時間適用論理308は、以下の数式(1)にしたがって、信号g[n]を発生させる。
【数1】

【0026】
ここで、値kは、平滑化係数である。
【0027】
アタック/リリース時間適用論理308は、1次平滑化関数を適用して、出力信号に対して適用するための平滑化利得カーブを提供する(値kは、アタックまたはリリースが適用されているか否かに依拠して変更される)。アタック時間は、1ミリ秒に設定されて、入力サンプル中のピークをすばやく、正確にアタックする。リリース時間を100と200ミリ秒の間に設定して、すばやい利得のゆらぎが、圧縮の品質に影響を及ぼさないようにしてもよい。平滑化された信号g[n]が、第2の乗算器309に提供されてもよい。遅延エレメント301は、時間Dでデジタルサンプル値x[n]を遅延させ、遅延デジタルサンプル値x[n−D]を発生させる。遅延デジタルサンプル値x[n−D]は、第2の乗算器309に提供される。第2の乗算器309は、遅延サンプルx[n−D]を、平滑化関数g[n]によって乗算し、これによって、圧縮されたデジタルオーディオ情報値のストリーム132を発生させる。
【0028】
MMANC:
図3の移動体オーディオデバイス100で使用するのに適している、マルチマイクロフォンアクティブノイズキャンセル(MMANC)を実行する複数の異なる方法がある。図4は1つの特定の例を図示する。図4において、MMANC機能ブロック123は、2つのマイクロフォン109と110から信号を受け取って、エコーキャンセルと信号拡張を実行して、ノイズ基準信号135とスピーチ基準信号136とを発生させる。引き続いての処理は、背景ノイズのほとんどない、ノイズキャンセルされたマイクロフォン信号137を発生させる。信号137は、デジタル値のストリームである。信号137は、バックエンド信号処理機能ブロック121に対して供給される。機能ブロック121中の適切なボコーダは、デジタル値をスピーチコード化された値の対応するストリームへとスピーチエンコードする。図のモデム113とプロセッサ114による処理の後、スピーチコード化された値138のストリームは、TX DAC116によってアナログ信号へと変換される。アナログ信号はパス117を通してRF集積回路103に対して通信され、アンテナ105から送信される。
【0029】
図4のMMANC機能ブロック123の特定の例では、マイクロフォン109からのアナログ出力信号は、アナログデジタルコンバータ118によって、結果としてのデジタル化スピーチサンプル値のストリーム139へとデジタル化される。同様に、マイクロフォン110からのアナログ出力信号は、アナログデジタルコンバータ119によって、デジタル化スピーチサンプル値のストリーム140へとデジタル化される。エコーキャンセラー1機能ブロック141と、エコーキャンセラー2機能ブロック142とは、ストリーム139および140中のエコーをミミックする信号を発生させる適応デジタルフィルタである。減算器143は、統合したエコー信号をストリーム139から減算する。結果としてのデジタル値のエコーキャンセルされたストリーム139Aは、ブラインド信号分離(BSS)信号拡張機能ブロック145に供給される。同様に、減算器144は、統合したエコー信号をストリーム140から減算する。結果としてのデジタル値のエコーキャンセルされたストリーム140Aは、ブラインド信号分離(BSS)信号拡張機能ブロック145に供給される。ブラインド信号分離動作は、独立コンポーネント解析(ICA)として技術的に呼ばれることもあり、時間的反ハビアン学習アルゴリズムを使用して、ノイズ基準信号135と、スピーチ基準情報136とを発生させる。さらなる情報に関しては、M. Girolami氏による、“ノイズキャンセルと信号分離のための対称適応最大尤度推定”、Electronics Letters, 33(17): 1437−1438、1997年と、K. Torkkola氏による、“情報最大化に基づいたコンボルブド源のブラインド分離”信号処理のニューラルネットワークのためのIEEE ワークショップ、京都、日本、1996年とを参照のこと。
【0030】
非線形処理機能ブロック146は、周波数ドメイン中で、スピーチ基準情報136と、ノイズ基準信号135とを最初にブレークアップして、それぞれの基準信号の(異なる帯域の)複数の異なるスペクトルコンポーネントを取得する。それぞれの帯域に対して、可変利得が計算される。1つの例では、可変利得は、数式(S−N)/Sによって与えられ、ここで、Sは、帯域中のスピーチ基準信号136の大きさであり、ここで、Nは、帯域中のノイズ基準信号135の大きさである。スピーチ基準信号136帯域は、何らかのノイズを確実に含んでいる。スピーチ基準信号のそれぞれの帯域中のこのノイズをさらに減少させるために、可変利得が適用される。可変利得が、スピーチ基準信号のそれぞれの個別の帯域に適応された後に、結果としての帯域は、単一の時間ドメイン信号147に結合し戻される。
【0031】
スピーチ基準信号136は、一般的に、スピーチ情報を有する期間を含み、他の関連するポーズ(例えば、センテンス中の単語の間の非スピーチポーズ)の期間も含む。音声活動検出(VAD)判定信号148は、信号136中にスピーチがあるか否か、または、信号136中にポーズがあるか否かを示す。VAD判定信号148は、連続的なデジタル値のフレームにわたって集められた情報に基づいている。1つの例では、フレームは、エコーキャンセルされた信号の80個のデジタル値であり、VAD信号148は、単一のビット値である。VAD判定は、各フレームに1回更新される。後処理機能ブロック149は、VAD判定信号148を使用する。VAD判定信号が、スピーチのあることを示す場合、後処理機能ブロック149は第1の利得値(例えば、1の利得)を適応し、他方、VAD判定信号が、ポーズのあることを示す場合、後処理機能ブロック149は第2の利得値(例えば、0.5の利得)を適用する。後処理機能ブロック149からの出力としての結果としての信号は、ノイズキャンセルされたマイクロフォン信号137である。
【0032】
図3の特定の例において、移動体オーディオデバイス100は、セルラ電話機である。マイクロフォン109と110上でピックアップされた非ノイズオーディオ情報は、したがって、“スピーチ”情報として呼ばれる。図4中の信号136は、したがって、“スピーチ基準信号”として呼ばれる。しかしながら、移動体オーディオデバイス100が、セルラ電話機である必要はないことが理解されることになる。例えば、移動体オーディオデバイス100が、MP3プレーヤーのようなデジタルオーディオプレーヤーである場合、MMANC123によって発生された中間信号136は、より一般的には、“オーディオ基準信号”として呼ばれる。デジタルオーディオプレーヤーのケースでは、デジタルオーディオプレーヤーは記録と保存の目的で、オーディオ情報を取り込みしないので、MMANC123は、ノイズキャンセルされたマイクロフォン信号137を出力しなくてもよい。
【0033】
ADRCとAVCの制御:
1つの新規な観点にしたがうと、図4の自動音量制御(AVC)126によって適用される利得は、MMANC機能ブロック123によって中間信号として発生された、ノイズ基準信号135の関数である。多くのセルラ電話機が、かなり洗練されたマルチマイクロフォンアクティブノイズキャンセル技術を用いることが理解されるだろう。これらの技術を適用すると、マイクロフォンがピックアップした信号を、スピーチ基準情報と、ノイズ基準信号とに分離することになる。図2の従来の回路における回路13によって検出されたような背景ノイズのレベルを使用して、AVC機能の利得を制御するというよりは、マルチマイクロフォンアクティブノイズキャンセル機能を使用して、AVC機能の利得を制御する。図4の特定の例では、信号調整機能ブロック124は、ノイズ基準信号135を受け取って、ノイズ基準信号135上にスケーリングとデジタルフィルタリングを実行して、制御信号133を発生させる。制御信号133は、MMANC機能ブロック123によって検出された、背景ノイズの存在と大きさを示す。制御信号133は、マイクロフォン109と110上で検出された、変化しつつある変動ノイズにすばやく適応する。図4の例では、到来するオーディオサンプルが、信号拡張ブロック145中に受け取られる最大レートで、制御信号133は変更される。制御信号133は、例えば、到来するオーディオサンプル139Aと140Aのハーフレートで変化してもよい。
【0034】
図8は、図3の移動体オーディオデバイス100によって実行される新規な方法のフローチャートである。オーディオ信号(デジタル値サンプルのストリーム)が、マイクロフォン109と110から受け取られ(ステップ200)、マルチマイクロフォンアクティブノイズキャンセル(MMANC)を実行し、これによって、スピーチ基準信号136と、ノイズ基準信号135とノイズキャンセルされたマイクロフォン信号137とを発生させる。機能ブロック121中の適切なボコーダによって、ノイズキャンセルされたマイクロフォン信号をスピーチコード化し(ステップ202)、結果がTX DAC116によってアナログ信号へと変換される。この結果としてのアナログ信号がパス117を通して、移動体オーディオデバイス100からのワイヤレスRF送信のために無線インターフェース(例えば、CDMA無線インターフェース、WCDMA無線インターフェース、または、GSM(登録商標)無線インターフェース)に供給される。ステップ200−202は、例えば、セルラ電話機に用いられている、従来のMMANC回路によって実行されるステップであってもよい。
【0035】
無線インターフェースから第2のアナログ信号を受け取り(ステップ203)、第2のアナログ信号を、RX ADC112によってデジタル形式に変換し、これを、ブロック121中のボコーダによって、デジタルオーディオ情報値のストリーム127へとデコードする。ストリーム127にADRCを実行し(ステップ204)、これによって、圧縮されたデジタルオーディオ情報値のストリーム132を発生させる。ストリーム132上でAVCを実行する(ステップ205)。1つの新規な観点では、AVC動作に適用される利得は、ノイズ基準信号135の関数である。信号調整機能ブロック124は、ノイズ基準信号135を処理し、これによって、制御信号133を発生させる。制御信号133を使用して、AVC機能ブロック126を制御する。AVC機能ブロック126の出力は、ユーザ音量設定論理131によるオプション的な音量調整であってもよく(図5参照のこと)、DAC120によって、アナログ形式に変換され、図4のスピーカー108を駆動するのに使用される。AVC機能ブロック126の出力は、従来技術におけるもののように、介在回路を通して間接的にスピーカー108を駆動してもよい。
【0036】
説明の目的で、ある特定の実施形態を上で説明したが、本発明はこれらに制限されていない。したがって、特許請求の範囲に述べられる本発明の範囲を逸脱することなく、上で説明した特定の実施形態のさまざまな変形、適応、および組み合わせを実行することができる。

【特許請求の範囲】
【請求項1】
(a)マルチマイクロフォンアクティブノイズキャンセル(MMANC)を実施して、これによって、オーディオ基準信号と、ノイズ基準信号とを発生させることと、
(b)デジタルオーディオ情報値のストリームにオーディオダイナミックレンジ制御(ADRC)を実施して、これによって、圧縮されたデジタルオーディオ情報値のストリームを発生させることと、
(c)前記圧縮されたデジタルオーディオ情報値のストリームに自動音量制御(AVC)を実施することと
を含み、前記AVCの利得は前記ノイズ基準信号の関数である方法。
【請求項2】
前記(a)のMMANC、前記(b)のADRC、および、前記(c)のAVCは、プロセッサ上での命令の実行によって実施される動作であり、前記プロセッサは、移動体オーディオデバイスの一部である、請求項1記載の方法。
【請求項3】
前記方法はセルラ電話機によって行われ、前記(a)のMMANCはまた、ノイズキャンセルされたマイクロフォン信号の発生をもたらし、前記ノイズキャンセルされたマイクロフォン信号は、デジタル値のストリームであり、
前記方法は、
前記ノイズキャンセルされたマイクロフォン信号上に、ボコーダエンコーディング機能を実施することをさらに含む、請求項1記載の方法。
【請求項4】
前記(c)のAVCは、音量制御されたデジタル値のストリームを発生させ、
前記方法は、
前記音量制御されたデジタル値のストリームを、アナログ信号に変換することと、
前記アナログ信号を使用して、スピーカーを駆動することと
をさらに含む、請求項1記載の方法。
【請求項5】
前記(b)のADRCは、前記デジタルオーディオ情報値のストリームに対して利得を適用することを含み、前記利得は、前記デジタルオーディオ情報値のストリームの振幅の関数である、請求項1記載の方法。
【請求項6】
前記関数は、ノイズゲート部分、強調部分、一定利得部分、圧縮部分、およびリミッタ部分を含む、請求項5記載の方法。
【請求項7】
前記ステップ(a)、(b)、および(c)は、セルラ電話機上で実施され、オーディオ基準信号は、スピーチ基準信号である、請求項1記載の方法。
【請求項8】
前記ステップ(a)、(b)、および(c)は、デジタルオーディオプレーヤー上で実施される、請求項1記載の方法。
【請求項9】
前記(a)のノイズ基準信号を、制御値に変換することをさらに含み、前記制御値は、少なくとも部分的に、前記(c)のAVCの利得を決定する、請求項1記載の方法。
【請求項10】
前記(c)のAVCの前記利得は、1)前記ノイズ基準信号と、2)利用可能なヘッドルームの量との両方の関数である、請求項1記載の方法。
【請求項11】
第1のマイクロフォン信号と第2のマイクロフォン信号を受け取り、ノイズ基準信号を出力する、マルチマイクロフォンアクティブノイズキャンセル(MMANC)メカニズムと、
デジタルオーディオ情報値の第1のストリームを受け取って、デジタルオーディオ情報値の第2のストリームを出力する、オーディオダイナミックレンジ制御(ADRC)メカニズムと、
前記デジタルオーディオ情報値の第2のストリームを、利得によって増幅する、自動音量制御(AVC)メカニズムと
を具備し、
前記利得は、前記ノイズ基準信号の関数として調整される、集積回路。
【請求項12】
前記MMANCメカニズムは、ブラインド信号分離(BSS)を実施し、前記ノイズ基準信号と、スピーチ基準信号との両方を発生させ、前記スピーチ基準信号は、比較的ノイズをなくしたものであり、前記ノイズ基準信号は、比較的スピーチをなくしたものである、請求項11記載の集積回路。
【請求項13】
前記デジタルオーディオ情報値の第2のストリームに対する、前記デジタルオーディオ情報値の第1のストリームの関係は、関数によって記述され、前記関数は、ノイズゲート部分、強調部分、一定利得部分、圧縮部分、およびリミッタ部分を含む、請求項11記載の集積回路。
【請求項14】
前記ADRCメカニズムは、第1の組の命令と、プロセッサとの組み合わせであり、前記プロセッサによる前記第1の組の命令の実行は、前記デジタルオーディオ情報値の第2のストリームを発生させる、請求項11記載の集積回路。
【請求項15】
前記AVCメカニズムは、第2の組の命令と、プロセッサとの組み合わせであり、前記プロセッサによる前記第2の組の命令の実行は、前記デジタルオーディオ情報値の第2のストリームを、前記利得によって増幅させる、請求項14記載の集積回路。
【請求項16】
前記第1のマイクロフォン信号は、前記MMANCメカニズム上で、第1のレートで受け取られるデジタル値のストリームであり、前記MMANCメカニズムによる出力である前記ノイズ基準信号は、前記第1のレートに近似している第2のレートで前記MMANCによって調整される、請求項11記載の集積回路。
【請求項17】
ノイズ基準信号の関数として、利得を制御する手段と、
デジタルオーディオ情報値のストリームを発生させる、オーディオダイナミックレンジ制御メカニズムと
を具備し、
前記ノイズ基準信号は、マルチマイクロフォンアクティブノイズキャンセルを使用して発生され、前記デジタルオーディオ情報値のストリームに対して、利得が適用される装置。
【請求項18】
前記オーディオダイナミックレンジ制御メカニズムは、プロセッサと、プロセッサ読み取り可能メモリ中に記憶されている1組の命令との組み合わせであり、前記プロセッサによる前記1組の命令の実行は、前記デジタルオーディオ情報値のストリームを発生させる、請求項17記載の装置。
【請求項19】
前記マルチマイクロフォンアクティブノイズキャンセルを実施する手段をさらに具備し、これによって、前記ノイズ基準信号を発生させる、請求項17記載の装置。
【請求項20】
ブラインド信号分離(BSS)を実施する手段をさらに具備し、これによって、前記ノイズ基準信号を発生させる、請求項17記載の装置。
【請求項21】
前記装置は、移動体デバイス中に配置されている単一の集積回路であり、移動体デバイスは、デジタルメディアプレーヤー、デジタルオーディオプレーヤー、MP3プレーヤー、パーソナルデジタルアシスタント、ラップトップコンピュータ、ポータブルコンピュータ、移動体通信デバイス、およびセルラ電話機からなるグループから選ばれる、請求項17記載の装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2013−59064(P2013−59064A)
【公開日】平成25年3月28日(2013.3.28)
【国際特許分類】
【外国語出願】
【出願番号】特願2012−232135(P2012−232135)
【出願日】平成24年10月19日(2012.10.19)
【分割の表示】特願2010−506583(P2010−506583)の分割
【原出願日】平成20年4月30日(2008.4.30)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.WCDMA
【出願人】(595020643)クゥアルコム・インコーポレイテッド (7,166)
【氏名又は名称原語表記】QUALCOMM INCORPORATED
【Fターム(参考)】