説明

オーディオ信号ゲイン制御装置及び方法

オーディオ信号を処理し信号増幅器(24)を制御するオーディオ・コンプレッサ(20)であって、時間フレーム(28)内の入力信号を分析して、その信号が雑音であるかオーディオデータであるかを判定する信号分析部(27,29)を備え、オーディオ・コンプレッサは、その分析結果に基づき信号増幅器のゲインを設定する。分析部は、その信号が雑音であるかオーディオデータであるかを判定する処理において入力信号の自己相関を演算する自己相関部(27)を有するとよい。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、オーディオ信号のゲインを制御する方法及び、オーディオ信号のゲインを制御するオーディオ圧縮装置に関する。より具体的には、本発明は、オーディオ信号の内容を分析してその中の雑音の存在を評価し、その分析結果に応じてゲインを制御する技術に関する。
【背景技術】
【0002】
携帯電話業界では、高度な通信端末を生産する技術の開発ともに、サービス品質と伝送能力の両方に関して多大な開発が行われてきた。わずか20乃至30年の間に、通信システムはアナログからデジタルに進み、同時に通信端末の大きさはブリーフケースサイズから今日のポケットサイズにまでなった。さらに今日では、携帯電話はますます小さくなり、一般的にはそのサイズはエンドユーザには重要な要素であると考えられている。エレクトロニクスの発展によって端末の部品の小型化が可能となり、同時に、端末はより高度な機能とサービスを実行できるようになってきた。また、新しい伝送技術の発展は、リアルタイムビデオのような更に高度なデータを無線通信端末に伝送する可能性を与えている。
【0003】
今日、携帯電話と考えることができるものと、携帯型ポケット・サイズ・コンピュータと呼べるものとの間に明確な線を引くことは、殆んど不可能である。しかしながら、無線通信用として構成された携帯型電子デバイスは、それが例えばパーム・コンピュータの形態をとっていても、携帯電話として動作する基本的要件を満たすべきであると、少なくとも考えなければならない。
【0004】
一般的には、音声のようなオーディオデータ通信用に構成された通信デバイスに伴う問題点、特には携帯電話に伴う問題点は、音質が常には最適ではないかも知れないということである。無線通信コネクションにおいては、幾つかの理由によって、例えば音声信号の明瞭度やラウドネスが低下する可能性がある。一つは、通信セッションの遠端の通話相手が単に、その音声レベルが強い声の人よりも低いことを意味するソフト・トーカー(soft-talker)である場合である。また、音声レベルが低いのは、遠端側の携帯電話と通信ネットワークとの間のソフト・アップリンク(soft uplink)によるか、又はネットワーク内における減衰に起因している可能性もある。いずれの場合にも、オーディオ信号のオーディオデータの振幅が、中程度の又は大きい振幅のオーディオ信号よりも、アイドル状態又は背景雑音レベルに近くなってしまうことになる。
【0005】
この問題に対する現状技術における一つの解決策は、いわゆるオーディオ・コンプレッサ(audio compressor)を採用することである。オーディオ・コンプレッサは、入力信号のダイナミック・レンジを低減又は圧縮する役目を果たしてレベルを一定に保ち、その結果、背景音(それが雑音や例えば付随する楽音であっても)よりも明瞭に聴こえるようにできるダイナミック・プロセッサである。典型的には、理想的なコンプレッサは、それが動作しない時には歪みや雑音を殆んど生成することがなく、聴取者の耳に心地よいオーディオレベルに制御する。一般的には、オーディオ・コンプレッサは、特殊なタイプのエキスパンダ(expander)であるノイズゲートと一緒に使用される。エキスパンダはダイナミック・プロセッサの一形式であり、低レベル信号は減衰させるが、より大きい部分は減衰させないか又は増幅するように、信号のダイナミック・レンジを増加させる働きをする。この意味で、エキスパンダの振る舞いはコンプレッサのそれと反対である。エキスパンダにおけるノイズゲートは、入力信号を、強く減衰させる、あるいは完全に抑圧するという極限に持っていき、単なる無音状態にする。
【0006】
図1は、現状技術に基づくコンプレッサとノイズゲートを組み合わせた機能及び、出力オーディオ信号に増幅するために入力オーディオ信号に適用するゲインをいかに制御するかを示す図である。破線1は単位ゲインを示し、太線2はコンプレッサで制御されるゲインの設定を示す。図示の如く、入力信号の非常に低いレベル3では、ノイズゲート機能が働いて出力信号が抑圧される。典型的には、これは人の話し声がなく、単に背景雑音のみが存在する場合に起こる。低レベル4では、低いゲインを設定し、背景雑音を過剰に増幅することを避けている。中レベル範囲5では、高いゲインを適用し、高いレベルでは増幅後のデジタル・クリッピングを避けるようにゲインを設定する。
【発明の開示】
【発明が解決しようとする課題】
【0007】
オーディオ・コンプレッサに関連する問題点は、低レベル入力オーディオ信号に関する。増幅を増加させると、雑音が過大となるばかりか、不愉快な音質で、かつ不必要なほど明瞭すぎるようなオーディオデータが再生されかねない。さらに、オーディオデータ、典型的には音声、の音量レベルが非常に低い場合には、時々そのレベルがノイズゲート・レベル以下に落ちてカットオフされてしまい、その結果、聞きづらく理解が困難な途切れ途切れの音が再生されてしまう場合がある。このため、多くの場合においては、ノイズゲート機能をオフしなければならない。しかしこの場合には、アイドル状態の出力信号に高いレベルのノイズが混入することになる。
【0008】
それ故、オーディオ信号のオーディオ・コンプレッションと可変ゲイン制御の分野において改善の必要性があり、これが本発明の全体的な目的である。特に、弱いオーディオ信号、すなわち低レベルのオーディオ信号に対するゲイン制御に関し、その現状における欠陥を克服することが目的である。
【課題を解決するための手段】
【0009】
本発明の第1の側面によれば、オーディオ信号のゲインを制御する方法であって、
オーディオ信号を受信する受信ステップと、
前記信号が雑音であるかオーディオデータであるかを判定するために時間フレームにおける前記信号を分析する分析ステップと、
前記分析の結果に基づいてゲインを設定するゲイン設定ステップと、
前記ゲインで前記信号を増幅する増幅ステップと、
を有することを特徴とする方法によって、上記目的が達成される。
【0010】
一実施形態において、前記分析ステップは、前記信号の自己相関を計算する計算ステップを含む。
【0011】
一実施形態において、前記分析ステップは、
前記信号の自己相関の特性を雑音信号の判断基準と比較する比較ステップと、
前記比較の結果に基づいて前記信号が雑音であるかオーディオデータであるかを判定する判定ステップと、
を含む。
【0012】
一実施形態において、前記方法は、前記信号が雑音であると判定されたときは第1のゲインレベルを設定し、前記信号がオーディオデータであると判定されたときは第1のゲインレベルより高い第2のゲインレベルを設定するゲインレベル設定ステップを含む。
【0013】
一実施形態において、前記方法は、前記信号がオーディオデータであると判定されたときに前記信号に対するノイズゲート機能をアクティブにするように制御する制御ステップを含む。
【0014】
一実施形態において、前記方法は、
受信した前記信号の振幅レベルの測定を行う測定ステップと、
前記振幅レベルが基準レベルに対して相対的に低いと判定される場合に、前記分析ステップ、前記設定ステップ、前記増幅ステップを実行する。
【0015】
一実施形態において、前記オーディオデータは音声である。
【0016】
一実施形態において、前記受信ステップ及び前記分析ステップは、通信端末のオーディオ・コンプレッサによって実行される。
【0017】
一実施形態において、前記オーディオ信号を前記通信端末のダウンリンクで受信される。
【0018】
一実施形態において、前記方法は、増幅された前記信号に基づいて制御されるスピーカを介して音を出力する出力ステップを含む。
【0019】
本発明の第2の側面によれば、オーディオ信号を処理し信号増幅器を制御するオーディオ・コンプレッサであって、時間フレームにおける入力信号を分析して該信号が雑音であるかオーディオデータであるかを判定する信号分析部を含み、前記分析の結果に基づいて前記信号増幅器のゲインを設定するように構成されたオーディオ・コンプレッサによって、上記目的が達成される。
【0020】
一実施形態において、前記信号分析部は、前記入力信号が雑音であるかオーディオデータであるかを判定する処理において前記入力信号の自己相関を計算する自己相関部を含む。
【0021】
一実施形態において、前記信号分析部は、前記入力信号の自己相関の特性を雑音信号の判断基準と比較し、その比較の結果に基づいて前記信号が雑音であるかオーディオデータであるかを判定する比較部を含む。
【0022】
一実施形態において、前記信号が雑音であると判定されたときは第1のゲインレベルを設定し、前記信号がオーディオデータであると判定されたときは第1のゲインレベルより高い第2のゲインレベルを設定するゲイン制御部が設けられる。
【0023】
一実施形態においいて、前記信号がオーディオデータであると判定されたときにアクティブになるように制御される、前記信号に対するノイズゲート部が設けられる。
【0024】
一実施形態において、受信した前記信号の振幅レベルの測定を行う信号レベル検出部を備え、前記信号分析部は、前記振幅レベルが基準レベルに対して相対的に低いと判定される場合に、前記入力信号の分析を行うようにトリガされる。
【0025】
一実施形態において、オーディオデータは音声である。
【0026】
一実施形態において、前記各部は通信端末の信号プロセッサによって実現される。
【0027】
一実施形態において、前記通信端末は、前記オーディオ信号をダウンリンクで受信する信号受信手段を備える。
【0028】
一実施形態において、前記オーディオ・コンプレッサは、信号増幅器に基づいて制御されるスピーカを介した音の出力を制御するように接続される。
【発明を実施するための最良の形態】
【0029】
本発明は、オーディオ・コンプレッションの分野におけるオーディオ信号のゲイン制御に関する。典型的には本発明は、携帯電話のような携帯型無線通信デバイスに適用可能であるが、これに限定されるものではない。すなわち、本発明は、オーディオ信号入力、オーディオ増幅器及びオーディオ信号出力を備えるオーディオ信号処理デバイスに適用することができる。したがって本発明は、例えば据置型電話機にも適用可能である。また、本明細書及び添付の特許請求の範囲において、内包される特徴、要素及びステップを示すために「有する/備える(comprising/comprises)」の用語を使用する場合、表現又は説明した以上の他の特徴、要素又はステップの存在を排除するものと解釈すべきではないことを強調しておく。
【0030】
以下で説明する実施形態は、携帯電話での適用に関するもので、オーディオ信号により再生される音をスピーカから出力する前に、リモートの相手からダウンリンクで受信した入力オーディオ信号を処理するものである。すなわち、本発明を、通信デバイスの受信側において適用したケースを示す。詳細な説明は省略するが、本発明の一側面をなす別の実施形態では、オーディオ処理及びゲイン制御が通信接続の送信端において適用される。すなわち、通信信号に符号化して受信相手に送信する前に、マイクロフォンでピックアップしたオーディオを本発明に即して処理する。もっとも、このような実施形態は、通信相手間で送信をしている間又は送信の後で起こる音質の問題を克服することは不可能であろう。しかしながら、これら2つの実施形態の組み合せも一つの代替案である。
【0031】
図2は、本発明によるオーディオ・コンプレッサ20の一実施形態の基本要素を示すブロック図である。図は、本発明の特定の回路によるソリューションの例を意図したものではないことに留意すべきである。むしろ、オーディオ・コンプレッサの要素は、典型的には、関連するデータ・メモリ手段を備えるデジタル信号プロセッサ(DSP)のような信号プロセッサ内で実行されるコンピュータ・プログラムによって実現される。携帯電話の形態の通信端末の一部を構成するものとして、図2を参照して、本発明について説明する。オーディオ・コンプレッサ20にはオーディオ信号入力21、信号レベル検出部22、ゲイン制御部23、増幅器24及びオーディオ信号出力25を含む。携帯電話のようなオーディオ受信デバイスに実装するため、直接あるいは増幅器や信号処理手段を通して、そのどちらかでスピーカ32又はスピーカ出力にオーディオ圧縮デバイス20の信号出力25を接続する。信号レベル検出部22は、信号振幅を測定又は評価することにより、入力21を通して受信したオーディオ信号の振幅レベルを算出し、次に、ゲイン制御部23により、ゲインを、図1に示す包絡線により決定されるゲインに設定する。次いで、増幅器24にそのゲインを適用し、その設定されたゲインでオーディオ信号を増幅し、その増幅された信号を信号出力25に出力する。
【0032】
ただし、信号レベル検出部22は更に、算出した入力信号の振幅レベルを基準レベルと比較する手段を含む。基準レベルは、メモリ26から読み出される固定値のレベルで、例えば、アイドル状態における雑音レベル又は単に低レベル信号を表すような値にするとよい。代わりに、例えば信号にオーディオデータがない時に、オーディオ信号中の背景雑音を測定してもよい。電話セッションにおける会話を表すオーディオ信号では、ある時間の間、信号中で維持される最低振幅レベルは雑音レベルを表すと評価することにより、話し相手の音がない時に概略の背景雑音を測定することができる。雑音レベルを適当な間連続的に評価又は測定し、これをメモリ26にストアするとよい。信号レベル検出部は、算出したオーディオ信号の振幅レベルと基準レベルとを比較して、オーディオ信号が基準レベルに対して相対的に低いかどうかを判定する。基準レベルが雑音又は背景信号であるならば、相対的に低いということは、オーディオ信号は基準レベルよりは高いが、例えば基準レベルを十分に超えてはいないということをまだ意味しているかも知れない。基準レベルが低レベル信号を表す閾値レベルならば、閾値を超えていないオーディオ信号は、通常は低レベル信号であると判断できる。
【0033】
信号レベル検出部によりオーディオ信号が相対的に低いと判定された場合、その信号に対するゲインはその後、ゲイン制御部23により、算出した信号レベルで決まるレベルに設定される。他方、信号レベルが相対的に低いと判定された場合には、信号分析部が動作して入力信号を分析し、選択したオーディオ信号の一部が雑音を表すか又は、オーディオデータ、すなわち会話を典型的に表すデータを表すかを判定する。もちろん、低いレベル信号は、高いレベル信号のように雑音と顕著な差はない。それ故、その信号が雑音かオーディオデータかを判定するため、オーディオ信号の特性の時間領域処理を実行する。通信端末までの通信系統において生起する雑音に対しては、時間領域の振る舞いは一般的にはランダムである一方、会話を表すオーディオデータは明確である。実施形態では、オーディオ信号の特性を特定するために自己相関部27を使用する。自己相関は、信号形状すなわち波形が自身の遅延バージョンにどれだけ近似しているかの尺度を示す時間領域関数である。自己相関の最大値は1である。正弦波のような周期的信号は、時間遅延0において1、波形の2分の1周期の時間遅延において0、そして、1周期の時間遅延において1となる自己相関を持ち、言い換えれば、それ自身が正弦波形そのものである。しかしながら、ランダム雑音は、0遅延で1の自己相関をもつが、他の全ての遅延では本質的に0である。好適な実施形態では、自己相関部27は、例えば1msと100msの間、一般的には5msと50msの間で、例えばおよそ5msの、事前に決めた時間フレーム内で、受信したオーディオ信号の自己相関を計算するように構成される。新しい自己相関は、前の時間フレーム直後の時間フレーム内又は、その間にある時間遅延がある後続の時間フレーム内で実行する。クロック28は、時間フレームの開始及び継続長、後続の自己相関の間の周期とを制御するクロック信号を供給することができる。
【0034】
さらに、信号分析部は比較器29を含み、この比較器は、自己相関部27によって得られた入力信号の自己相関特性と、雑音信号を表すある形式の基準とを比較するように動作する。この分析の内容には、自己相関における零交差数を計算すること、及び、その数と雑音と決定した信号を表す零交差の所定数とを比較することを含むとよい。雑音を表す信号に対する零交差数を表すデータのような基準は、比較器29がアクセスするための閾値として、基準メモリ30にストアされる。信号分析部27、29が、その設定に基づき、分析した時間フレームではそのオーディオ信号は雑音であることを示した場合、低い第1レベルのゲインに設定するようゲイン制御部23をトリガする。他方、信号分析部27,29が、その設定に基づき、オーディオ信号が例えば会話のようなオーディオデータを含むとことを示した場合、第1レベルのゲインより高い第2レベルのゲインに設定するようゲイン制御部23をトリガする。したがって、単にオーディオ信号の振幅に依存するだけでなく、オーディオ信号の特性にも依存して、ゲインを設定する。このことは、特にノイズ・フロアに近い低レベル信号でゲインを微調整できることを意味する。図1を参照して、ある時間フレーム内で分析したオーディオ信号が雑音と判定されたか、オーディオデータと判定されたかどうかに基づきゲインを調整することは、ゲイン制御部23のために設定するオーディオ・コンプレッサの低レベル領域4の勾配を調整することによって実現することができる。例えば、領域4の下端を左に移動させれば、とりわけ領域4の低レベル端で、ゲインを増加させることになる。もう一つの方法は、例えば最低レベルに対しては単位増幅により近いところから開始し、次にある分岐点まで比較的小さい傾斜で増加し、続いて、信号レベルが領域4の上端に到達すると図1に示す傾斜をとるというように、領域4の設定を非線形に調整することである。しかし、別の設定を選択してもよい。
【0035】
別の実施形態においては、信号分析部27,29は、信号がオーディオデータを表すと判定された場合、ノイズゲート機能がアクティブになるようにノイズゲート部31を制御する構成を備える。これにより、従来ではノイズゲート機能がしばしば切断されるほどの低レベルの信号に対しても、通話中に知覚されるアイドル状態における雑音レベルを減少させることができる。
【0036】
本提案の解決策によれば、オーディオ信号レベルがノイズ・フロアに近いというような扱いにくい場合を自動的に処理することで、より良い柔軟性がオーディオ・コンプレッサに与えられる。また、本提案の解決策によれば、雑音の存在をその振幅ではなくその特性によって判定するので、ノイズ・フロアの正確なレベルについて、より少ない知識ですむ。特に利点のある低レベルオーディオ信号に使用する場合について、信号分析部27、29の説明をここで行った。ただし、信号分析部が信号レベル検出部22に依存する必要のない場合においては、低レベル信号だけでなく全てのオーディオ信号に適用するよう自己相関を設定してもよいことは言うまでもない。
【0037】
以上、本発明の原理、好適な実施形態及び動作モードについて説明した。ただし、上述の実施形態は事例的なものであって限定的に解すべきものでなく、また、添付の特許請求の範囲で定義される本発明の範囲から逸脱することなく、当業者によってこれらの実施形態を変更することが可能であることを理解すべきである。
【図面の簡単な説明】
【0038】
【図1】従来技術のオーディオ・コンプレッサ設定を説明する図である。
【図2】本発明の一実施形態によるオーディオ・コンプレッサの構成を示すブロック図である。

【特許請求の範囲】
【請求項1】
オーディオ信号のゲインを制御する方法であって、
オーディオ信号を受信する受信ステップ(21)と、
前記信号が雑音であるかオーディオデータであるかを判定するために時間フレームにおける前記信号を分析する分析ステップ(27,29)と、
前記分析の結果に基づいてゲインを設定するゲイン設定ステップ(23)と、
前記ゲインで前記信号を増幅する増幅ステップ(24)と、
を有することを特徴とする方法。
【請求項2】
前記分析ステップは、前記信号の自己相関を計算する計算ステップ(27)を含むことを特徴とする請求項1に記載の方法。
【請求項3】
前記分析ステップは、
前記信号の自己相関の特性を雑音信号の判断基準(30)と比較する比較ステップ(29)と、
前記比較の結果に基づいて前記信号が雑音であるかオーディオデータであるかを判定する判定ステップと、
を含むことを特徴とする請求項2に記載の方法。
【請求項4】
前記信号が雑音であると判定されたときは第1のゲインレベルを設定し、前記信号がオーディオデータであると判定されたときは前記第1のゲインレベルよりも高い第2のゲインレベルを設定するゲインレベル設定ステップを有することを特徴とする請求項1乃至3のいずれか1項に記載の方法。
【請求項5】
前記信号がオーディオデータであると判定されたときに前記信号に対するノイズゲート機能(31)をアクティブにするように制御する制御ステップを含むことを特徴とする請求項1乃至4のいずれか1項に記載の方法。
【請求項6】
受信した前記信号の振幅レベルの測定を行う測定ステップ(22)と、
前記振幅レベルが基準レベル(26)に対して相対的に低いと判定される場合に、前記分析、設定、増幅の各ステップを実行するステップと、
を有することを特徴とする請求項1乃至5のいずれか1項に記載の方法。
【請求項7】
前記オーディオデータは音声であることを特徴とする請求項1乃至6のいずれか1項に記載の方法。
【請求項8】
前記受信ステップ及び前記分析ステップは、通信端末のオーディオ・コンプレッサ(20)によって実行されることを特徴とする請求項1乃至7のいずれか1項に記載の方法。
【請求項9】
前記オーディオ信号は前記通信端末のダウンリンクで受信されることを特徴とする請求項8に記載の方法。
【請求項10】
増幅された前記信号(25)に基づいて制御されるスピーカ(32)を介して音を出力する出力ステップを含むことを特徴とする請求項1乃至9のいずれか1項に記載の方法。
【請求項11】
オーディオ信号を処理し信号増幅器(24)を制御するオーディオ・コンプレッサ(20)であって、
時間フレーム(28)における入力信号を分析して該信号が雑音であるかオーディオデータであるかを判定する信号分析部(27,29)を備え、
前記オーディオ・コンプレッサは、前記分析の結果に基づいて前記信号増幅器のゲインを設定することを特徴とするオーディオ・コンプレッサ。
【請求項12】
前記信号分析部は、前記入力信号が雑音であるかオーディオデータであるかを判定する処理において前記入力信号の自己相関を計算する自己相関部(27)を含むことを特徴とする請求項11に記載のオーディオ・コンプレッサ。
【請求項13】
前記信号分析部は、前記入力信号の自己相関の特性を雑音信号の判断基準(30)と比較し、その比較の結果に基づいて前記信号が雑音であるかオーディオデータであるかを判定する比較部(29)を含むことを特徴とする請求項12に記載のオーディオ・コンプレッサ。
【請求項14】
前記信号が雑音であると判定されたときは第1のゲインレベルを設定し、前記信号がオーディオデータであると判定されたときは前記第1のゲインレベルよりも高い第2のゲインレベルを設定するゲイン制御部(23)を備えることを特徴とする請求項11乃至13のいずれか1項に記載のオーディオ・コンプレッサ。
【請求項15】
前記信号がオーディオデータであると判定されたときにアクティブになるように制御される、前記信号に対するノイズゲート部(31)を備えることを特徴とする請求項11乃至14のいずれか1項に記載のオーディオ・コンプレッサ。
【請求項16】
受信した前記信号の振幅レベルの測定を行う信号レベル検出部(22)を備え、
前記信号分析部は、前記振幅レベルが基準レベル(26)に対して相対的に低いと判定される場合に、前記入力信号の分析を行うようにトリガされることを特徴とする請求項10乃至13のいずれか1項に記載のオーディオ・コンプレッサ。
【請求項17】
前記オーディオデータは音声であることを特徴とする請求項10乃至14のいずれか1項に記載のオーディオ・コンプレッサ。
【請求項18】
前記各部は通信端末の信号プロセッサによって実現されることを特徴とする請求項10乃至15のいずれか1項に記載のオーディオ・コンプレッサ。
【請求項19】
前記通信端末は、前記オーディオ信号をダウンリンクで受信する信号受信手段を備えることを特徴とする請求項17に記載のオーディオ・コンプレッサ。
【請求項20】
前記信号増幅器に基づいて制御されるスピーカ(32)を介した音の出力を制御するように接続されることを特徴とする請求項10乃至15のいずれか1項に記載のオーディオ・コンプレッサ。

【図1】
image rotate

【図2】
image rotate


【公表番号】特表2008−543194(P2008−543194A)
【公表日】平成20年11月27日(2008.11.27)
【国際特許分類】
【出願番号】特願2008−514085(P2008−514085)
【出願日】平成18年5月30日(2006.5.30)
【国際出願番号】PCT/EP2006/062701
【国際公開番号】WO2006/128856
【国際公開日】平成18年12月7日(2006.12.7)
【出願人】(502087507)ソニー エリクソン モバイル コミュニケーションズ, エービー (823)
【Fターム(参考)】