アクティブノイズ制御システム
【課題】FxLMSアルゴリズムに必要とされる第2経路の伝達関数を決定するために使用される、自動車内の人間の乗客に聞き取られない(従って、邪魔にならない)テスト信号を可能にする方法およびシステムを提供する。
【解決手段】ノイズ源によって放出された、聴取場所における望ましくないノイズ信号のアクディブ制御のためのシステムであって、望ましくないノイズは、第1経路伝達関数を有する第1経路を経由して聴取場所に伝播され、システムは、望ましくないノイズ信号を減少または消去する消去信号を放出するラウドスピーカであって、消去信号は、第2経路を経由してラウドスピーカから聴取場所に伝播される、ラウドスピーカと、エラー信号を介して達成される減少のレベルを決定する、聴取場所におけるエラーマイクロフォン(E)と、消去信号を生成する第1適応フィルタと、基準信号を生成する基準ジェネレータとを備えている。
【解決手段】ノイズ源によって放出された、聴取場所における望ましくないノイズ信号のアクディブ制御のためのシステムであって、望ましくないノイズは、第1経路伝達関数を有する第1経路を経由して聴取場所に伝播され、システムは、望ましくないノイズ信号を減少または消去する消去信号を放出するラウドスピーカであって、消去信号は、第2経路を経由してラウドスピーカから聴取場所に伝播される、ラウドスピーカと、エラー信号を介して達成される減少のレベルを決定する、聴取場所におけるエラーマイクロフォン(E)と、消去信号を生成する第1適応フィルタと、基準信号を生成する基準ジェネレータとを備えている。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、特に自動車およびヘッドフォンの用途のための、アクティブモータ音チューニング(MST)を含むアクティブノイズ制御(ANC)に関する。
【背景技術】
【0002】
ノイズは、概して、レシーバの情報内容に寄与せず、むしろ有用な信号の音質に干渉するように知覚される音を指すために使用される用語である。ノイズの発達の過程は、一般的に3つの範囲に分割され得る。これらは、ノイズの生成、ノイズの伝搬(放出)およびノイズの知覚である。ノイズを成功裏に減少させる試みは、例えば、ノイズ信号の伝搬の減衰および続く抑制によって、まず、ノイズ源自体に狙いが定められているということが理解され得る。しかしながら、ノイズ信号の放出は、多くの場合において、所望のレベルにまでは減少され得ない。そのような場合において、補償信号を重ねることによって望ましくない音を取り除く構想が適用される。
【0003】
発せられたノイズを消去または減少させる公知の方法およびシステム(ANCシステムおよび方法)、または、例えば、MSTシステムおよび方法を介した、望ましくない干渉信号を消去または減少させる公知の方法およびシステムは、消去信号波を生成して望ましくない信号に重ねることによって望ましくないノイズを抑制するものであり、該消去信号波の振幅および周波数の値は、ノイズ信号の振幅および周波数の値とほぼ同じであるが、位相は望ましくない信号に対して180度移動されている。理想的な状況においては、この方法は、望ましくないノイズを完全に消滅させる。ノイズ信号の騒音レベルに関するこの狙いを定められた減少の効果は、多くの場合に、破壊的干渉と呼ばれる。
【0004】
用語「ノイズ」は、この場合、外部の音響的な音波−例えば、周辺のノイズまたは自動車の乗客エリアにおいて知覚される動作音など−と、例えば、自動車の乗客エリアまたは運転による機械的な振動によって起こされた音響的な音波との両方を呼ぶ。音が望ましくない場合には、それらはまたノイズと呼ばれる。音楽または話が、自動車の乗客空間のような、音声信号にさらされたエリアにおける電子音響システムを介して中継されるときはいつでも、信号の音声知覚は、概して、背景ノイズによって弱められる。背景ノイズは、風、エンジン、タイヤ、ファンおよび自動車における他のユニットの影響によってもたらされ得、従って、速度、路面状況および自動車の動作状態によって変化する。
【0005】
所謂後部座席エンターテイメントが、現代の自動において段々と人気になっている。これは、高品質の音声信号の再生を提供する結果として、より多くの考慮、言い換えると、経験されるノイズ信号におけるさらなる減少を必要とするシステムによって供給される。通常、ヘッドフォン媒体を介した、個人に向けた音声信号の集中のオプションが同様に必要とされる。従って、公知のシステムおよび方法は、自動車の乗客エリアにおける音の領域に対する用途と、ヘッドフォンを介した伝播との両方に及ぶ。
【0006】
特に、例えば、エンジンまたは排気システムから発せられる構成要素のような望ましくないノイズによる、自動車に存在する音響効果が考慮されなければならない。エンジンによって生成されるノイズ信号は、概して、エンジンの回転速度に直接的に関連する振幅および周波数の値を有する多数の正弦波の構成要素を含む。これらの周波数の構成要素は、(毎秒の回転による)基本周波数の偶数および奇数の調和周波数の両方、ならびに半オーダの乗算または分周波を含む。
【0007】
低いが一定のノイズレベルは、常に積極的に評価されるわけではないことを、綿密な調査が示した。その代わりに、許容可能なエンジンノイズは、厳格な要求を満たさなければならない。調和音声シーケンスが特に好まれる。今日の非常に高度な機械的エンジン設計でさえ、不快な音が常に排除され得るわけではないので、積極的な方法で、エンジンノイズをアクティブに制御する方法が利用される。この種の方法は、モーター音チューニング(MST)と呼ばれる。これらのシステムにおいて音の性質をモデリングするために、例えば、音響学的消去信号のための、エンジンの吸気ダクトに配置されているラウドスピーカなどによって、源におけるノイズの消去のために望ましくない音声構成要素を使用する手順が利用される。
【0008】
ノイズの減少または音のモデリングのためのアクディブノイズ制御の方法およびシステムは、最新のデジタル信号処理および適応フィルタ手順が利用されるので、最近ますます人気となっている。一般的な用途において、入力センサ−例えば、マイクロフォン−は、源によって生成された望ましくないノイズを表す信号を導き出すために使用される。この信号は、次に、適応フィルタの入力に供給され、フィルタの特性によって出力信号に作り変えられ、該出力信号は、例えば、音響ラウドスピーカまたは電気機械的振動ジェネレータのような消去アクチュエータを制御するために使用される。ラウドスピーカ、または振動ジェネレータは、源から導き出された望ましくないノイズ信号または振動に重ね合わされる消去波または振動を生成する。望ましくないノイズへのノイズ制御音波の重ね合わせからもたらされる観察された残りのノイズレベルは、エラーセンサによって測定され、該エラーセンサは、対応するエラーフィードバック信号を生成する。このフィードバック信号は、観察されたノイズまたは残りのノイズの信号の全レベルを適応するように最小化するために、適応フィルタのパラメータおよび特性の修正のために使用される基準となる。フィードバック信号は、この応答性の信号に対するデジタル信号処理において使用される用語である。
【0009】
デジタル信号処理において通常使用される公知のアルゴリズムは、エラーフィードバック信号の最小化のためのよく知られた最小自乗平均(LMS)アルゴリズムの拡張:所謂フィルタリングされたxLMSアルゴリズム(FxLMS、非特許文献1を参照)である。このアルゴリズムを実装するために、音響伝達関数のモデルが、アクティブノイズ制御アクチュエータ−本明細書において提示された例においては、ラウドスピーカ−と、エラーセンサ、この場合にはマイクロフォンとの間で必要とされる。アクティブノイズ制御アクチュエータとエラーセンサとの間の伝達経路はまた、第2またはエラー経路として公知であり、伝達関数を決定するための対応する手順は、システム同定として公知である。さらに、追加的な広帯域補助信号−例えば、ホワイトノイズが、FxLMSアルゴリズムに対する第2経路の関連する伝達関数を決定する最新の方法を使用して、アクティブノイズ制御アクチュエータからエラーセンサに伝達される。第2経路の伝達関数のフィルタ係数は、ANCシステムを開始して一定に維持するときか、または時間で変化する伝達状況に、フィルタ係数が適応するように調節されるときかのいずれかのときに定義される。
【先行技術文献】
【非特許文献】
【0010】
【非特許文献1】WINDOW、B.、STEARNS、S.D.(1985):「Adaptive Signal Processing」 Prentice−Hall Inc.、Englewood Cliffs、NJ、USA.ISBN 0−13−004029−0
【発明の概要】
【発明が解決しようとする課題】
【0011】
このアプローチの不利な点は、特定された広帯域補助信号が、一般的な周囲の状況に従って、自動車の中の乗客に聞き取ることができ得るということである。信号は邪魔であると知覚され得る。特に、この種の追加的な補助信号は、高価な自動車における後部座席エンターテイメントに対する内部の音響効果および音声信号の伝播の質に置かれる高い要求(=可能な限り少ないノイズ)を満足しない。
【課題を解決するための手段】
【0012】
FxLMSアルゴリズムに必要とされる第2経路の伝達関数を決定するために使用される、自動車内の人間の乗客に聞き取られない(従って、邪魔にならない)テスト信号を可能にする方法およびシステムを提供することが、一般的なニーズである。
【0013】
例えば、本発明は、以下を提供する。
【0014】
(項目1)
ノイズ源によって放出された、聴取場所における望ましくないノイズ信号のアクディブ制御のためのシステムであって、該望ましくないノイズは、第1経路伝達関数を有する第1経路を経由して該聴取場所に伝播され、該システムは、
該望ましくないノイズ信号を減少または消去する消去信号を放出するラウドスピーカであって、該消去信号は、第2経路を経由して該ラウドスピーカから該聴取場所に伝播される、ラウドスピーカと、
エラー信号を介して達成される減少のレベルを決定する、該聴取場所におけるエラーマイクロフォン(E)と、
該望ましくないノイズ信号を表す信号と該エラーマイクロフォンからの該エラー信号とを使用して、該第1経路伝達関数に適応された伝達関数を有する該望ましくないノイズ信号を表す該信号をフィルタリングすることによって、該消去信号を生成する第1適応フィルタと、
該第1適応フィルタからの該消去信号と共に、該ラウドスピーカに供給される基準信号を生成する基準ジェネレータであって、該聴取場所において存在する該望ましくないノイズ信号および/または望まれた信号によって、該聴取場所における人間の聴取者に対してマスキングされるような振幅および/または周波数を、該基準信号が有する、基準ジェネレータと
を備えているシステム。
【0015】
(項目2)
上記基準信号の振幅および/または周波数は、音響心理学的マスキングモデルユニットによって決定され、該音響心理学的マスキングモデルユニットは、上記エラーマイクロフォンからの上記エラー信号に関する人間の聴覚におけるマスキングをモデリングする、項目1に記載のシステム。
【0016】
(項目3)
上記音響心理学的マスキングモデルユニットは、時間的マスキングをモデリングする、項目2に記載のシステム。
【0017】
(項目4)
上記音響心理学的マスキングモデルユニットは、スペクトルマスキングをモデリングする、項目2または項目3に記載のシステム。
【0018】
(項目5)
上記音響心理学的マスキングモデルユニットは、周波数領域において動作される、項目2、項目3または項目4に記載のシステム。
【0019】
(項目6)
上記第1適応フィルタは、最小自乗平均(LMS)アルゴリズムに従って適応する、項目1〜項目5に記載のシステム。
【0020】
(項目7)
上記第1フィルタは、フィルタリングされたX最小自乗平均(フィルタリングされたx−LMS)アルゴリズムに従って適応する、項目7または項目8に記載のシステム。
【0021】
(項目8)
上記第2経路の上記伝達関数をモデリングする伝達関数を有する第2適応フィルタをさらに備えており、該第2適応フィルタは、上記第1適応フィルタの適応のために使用される上記望ましくないノイズ信号を表す上記信号をフィルタリングするために、該第1適応フィルタに接続されている、項目7に記載のシステム。
【0022】
(項目9)
上記第2適応フィルタは、上記最小自乗平均(LMS)アルゴリズムに従って適応する、項目8に記載のシステム。
【0023】
(項目10)
上記第1適応フィルタに供給される上記望ましくないノイズ信号を表す上記信号は、上記エラー信号と該第1適応フィルタによって出力される上記信号とから導き出され、上記第2経路の上記伝達関数をモデリングする伝達関数を有する第3適応フィルタによってフィルタリングされる、項目1〜項目9のうちの1項に記載のシステム。
【0024】
(項目11)
上記第1適応フィルタに供給される上記望ましくないノイズ信号を表す上記信号は、上記第2経路の上記伝達関数をモデリングする伝達関数を有する第4適応フィルタによってフィルタリングされた上記基準信号からさらに導き出される、項目10に記載のシステム。
【0025】
(項目12)
上記第4フィルタは周波数領域において動作され、該第4フィルタは、上流に接続された時間周波数変換器と下流に接続された周波数時間変換器とを有する、項目11に記載のシステム。
【0026】
(項目13)
上記第1適応フィルタに供給される上記望ましくないノイズ信号を表す上記信号は、非音響センサから導き出され、該非音響センサはセンサ信号を提供し、該望ましくないノイズ源の近くに配置されている、項目1〜項目12のうちの1項に記載のシステム。
【0027】
(項目14)
上記センサ信号からの基本信号を計算するために、上記非音響センサの下流に接続された基本計算ユニットと、該基本信号からの上記望ましくないノイズ信号を表す上記信号を生成するために、該基本計算ユニットの下流に接続された信号ジェネレータとをさらに備えている、項目13に記載のシステム。
【0028】
(項目15)
上記第1適応フィルタに供給される上記エラー信号をフィルタリングする、フィルタ係数を有する帯域通過フィルタをさらに備え、該フィルタ係数は、上記基本計算ユニットの下流に接続された係数計算ユニットによって制御される、項目14に記載のシステム。
【0029】
(項目16)
上記基準信号は、望まれた信号源によって提供される望まれた信号を含む、項目1〜項目15のうちの1項に記載のシステム。
【0030】
(項目17)
上記第1適応フィルタによって出力された上記信号は、重み付けファクターを乗算された2つの部分信号に分割され、該部分信号のうちの1つは、上記ラウドスピーカに供給され、もう1つは、上記第2経路をモデリングする第5適応フィルタに供給され、該第5適応フィルタの出力信号は、上記エラー信号に加算される、項目1〜項目16のうちの1項に記載のシステム。
【0031】
(項目18)
上記重みの合計は1である、項目17に記載のシステム。
【0032】
(項目19)
上記第1経路をモデリングする第6適応フィルタをさらに備え、該第6適応フィルタは、上記ラウドスピーカに供給される出力信号を提供し、該出力信号と上記基準信号との合計を供給される、項目1〜項目18のうちの1項に記載のシステム。
【0033】
(項目20)
ノイズ源によって放出された、聴取場所における望ましくないノイズ信号のアクディブ制御のための方法であって、該望ましくないノイズは、第1経路の伝達関数を有する第1経路を経由して聴取場所に伝播される、該方法は、
該望ましくないノイズ信号を減少または消去する消去信号を放出するステップであって、該消去信号は、第2経路を経由して該ラウドスピーカから該聴取場所に伝播される、ステップと、
該聴取場所において達成される減少のレベルをエラー信号を介して決定するステップと、
該望ましくないノイズ信号を表す信号と該エラー信号とを使用して、該第1経路の伝達関数に適応された伝達関数を有する該望ましくないノイズ信号を表す該信号をフィルタリングすることによって、該消去信号を生成する第1の適応フィルタリングをするステップと、
該第1の適応フィルタリングをするステップからの該消去信号と共に、該ラウドスピーカに供給される基準信号を生成するステップであって、該基準信号が、該聴取場所において存在する該望ましくないノイズ信号および/または望ましい信号によって、該聴取場所における人間の聴取者に対してマスキングされるような振幅および/または周波数を、該基準信号が有する、ステップと
を包含する、方法。
【0034】
(項目21)
上記基準信号の振幅および/または周波数は、音響心理学的マスキングモデリングするステップによって決定され、該音響心理学的マスキングモデリングをするステップは、上記エラー信号に関する人間の聴覚におけるマスキングをモデリングする、項目20に記載の方法。
【0035】
(項目22)
上記音響心理学的マスキングモデリングをするステップは、時間的マスキングをモデリングする、項目21に記載の方法。
【0036】
(項目23)
上記音響心理学的マスキングモデリングをするステップは、スペクトルマスキングをモデリングする、項目20または項目21に記載の方法。
【0037】
(項目24)
上記音響心理学的マスキングモデリングをするステップは、周波数領域において実行される、項目21、項目22または項目23に記載の方法。
【0038】
(項目25)
上記第1の適応フィルタリングをするステップは、最小自乗平均(LMS)アルゴリズムに従って適応する、項目20〜項目24に記載の方法。
【0039】
(項目26)
上記第1ステップは、フィルタリングされたX最小自乗平均(フィルタリングされたx−LMS)アルゴリズムに従って適応する、項目25に記載の方法。
【0040】
(項目27)
上記第2経路の上記伝達関数をモデリングする伝達関数を使用する第2の適応フィルタリングするステップをさらに包含し、該第2適応フィルタは、上記第1適応フィルタの適応のために使用される上記望ましくないノイズ信号を表す上記信号をフィルタリングするために、該第1適応フィルタに接続されている、項目26に記載のシステム。
【0041】
(項目28)
上記第2適応フィルタは、上記最小自乗平均(LMS)アルゴリズムに従って適応する、項目27に記載の方法。
【0042】
(項目29)
上記第1の適応フィルタリングをするステップにおいて使用される上記望ましくないノイズ信号を表す上記信号は、上記エラー信号と該第1の適応フィルタリングをするステップによって出力される上記信号とから導き出され、上記第2経路の上記伝達関数をモデリングする伝達関数を有する第3の適応フィルタリングをするステップにおいてフィルタリングされる、項目20〜項目28のうちの1項に記載の方法。
【0043】
(項目30)
上記第1の適応フィルタリングをするステップにおいて使用される上記望ましくないノイズ信号を表す上記信号は、上記第2経路の上記伝達関数をモデリングする伝達関数を有する第4の適応フィルタリングをするステップにおいてフィルタリングされる上記基準信号からさらに導き出される、項目29に記載の方法。
【0044】
(項目31)
上記第4のフィルタリングをするステップは周波数領域において実行され、該第4のフィルタリングをするステップは、該第4のフィルタリングをするステップに先立つ時間周波数変換ステップと該第4のフィルタリングをするステップに続く周波数時間変換ステップとを含む、項目30に記載の方法。
【0045】
(項目32)
上記第1の適応フィルタリングをするステップにおいて使用される上記望ましくないノイズ信号を表す上記信号は、非音響センサから導き出され、該非音響センサはセンサ信号を提供し、該望ましくないノイズ源の近くに配置されている、項目20〜項目31のうちの1項に記載の方法。
【0046】
(項目33)
上記センサ信号からの基本信号を計算する基本計算ステップと、該基本信号からの上記望ましくないノイズ信号を表す上記信号を生成する信号生成ステップとをさらに備えている、項目32に記載の方法。
【0047】
(項目34)
上記第1の適応フィルタリングをするステップにおいて使用される上記エラー信号をフィルタリングするフィルタ係数を使用する帯域通過フィルタリングをするステップをさらに備え、該フィルタ係数は、上記基本信号を使用する係数計算ステップによって制御される、項目33に記載の方法。
【0048】
(項目35)
上記基準信号は、望ましい信号源によって提供される望ましい信号を含む、項目20〜項目34のうちの1項に記載の方法。
【0049】
(項目36)
上記第1の適応フィルタリングをするステップによって出力された上記信号は、重み付けファクターを用いて乗算された2つの部分信号に分割され、該部分信号のうちの1つは、上記ラウドスピーカに供給され、もう1つは、上記第2経路をモデリングする第5の適応フィルタリングをするステップによって使用され、該第5の適応フィルタリングをするステップの出力信号は、上記エラー信号に加算される、項目20〜項目35のうちの1項に記載の方法。
【0050】
(項目37)
上記重みの合計は1である、項目36に記載のシステム。
【0051】
(項目38)
上記第1経路をモデリングする第6の適応フィルタリングをするステップをさらに備え、該第6の適応フィルタリングをするステップは、上記ラウドスピーカに供給される出力信号を提供し、該出力信号と上記基準信号との合計を入力される、項目20〜項目37のうちの1項に記載のシステム。
【0052】
ユーザが追加的な人工的なノイズ源によって邪魔されたと感じないように、リアルタイムで時間変化する第2経路に適応するために、聴取場所において存在する望ましくないノイズ信号および/または望ましい信号によって、基準信号が、聴取場所における人間の聴取者にとってマスキングされるような振幅および/または周波数を有する基準信号を使用するノイズ源によって放出される、聴取場所における望ましくないノイズ信号のアクティブ制御が開示される。
【0053】
(摘要)
ノイズ源によって放出された、聴取場所における望ましくないノイズ信号のアクディブ制御のためのシステムであって、該望ましくないノイズは、第1経路伝達関数を有する第1経路を経由して該聴取場所に伝播され、該システムは、該望ましくないノイズ信号を減少または消去する消去信号を放出するラウドスピーカであって、該消去信号は、第2経路を経由して該ラウドスピーカから該聴取場所に伝播される、ラウドスピーカと、エラー信号を介して達成される減少のレベルを決定する、該聴取場所におけるエラーマイクロフォン(E)と、該望ましくないノイズ信号を表す信号と該エラーマイクロフォンからの該エラー信号とを使用して、該第1経路および第2経路の伝達関数の商(W(z)=P(z)/S(z))に適応された伝達関数を有する該望ましくないノイズ信号を表す該信号をフィルタリングすることによって、該消去信号を生成する第1適応フィルタと、該第1適応フィルタからの該消去信号と共に、該ラウドスピーカに供給される基準信号を生成する基準ジェネレータであって、該聴取場所において存在する該望ましくないノイズ信号および/または望まれた信号によって、該聴取場所における人間の聴取者のために、基準信号がマスキングされるような振幅および/または周波数を、該基準信号が有する、基準ジェネレータとを備えているシステムが提供される。
【0054】
ノイズ源によって放出された、聴取場所における望ましくないノイズ信号のアクディブ制御のための方法であって、該望ましくないノイズは、第1経路伝達関数を有する第1経路を経由して聴取場所に伝播される、方法は、該望ましくないノイズ信号を減少または消去する消去信号を放出するステップであって、該消去信号は、第2経路を経由して該ラウドスピーカから該聴取場所に伝播される、ステップと、該聴取場所において達成される減少のレベルをエラー信号を介して決定するステップと、該望ましくないノイズ信号を表す信号と該エラー信号とを使用して、該第1経路および第2経路の伝達関数の商(W(z)=P(z)/S(z))に適応された伝達関数を有する該望ましくないノイズ信号を表す該信号をフィルタリングすることによって、該消去信号を生成する第1の適応フィルタリングをするステップと、該第1の適応フィルタリングをするステップからの該消去信号と共に、該ラウドスピーカに供給される基準信号を生成するステップであって、該基準信号が、該聴取場所において存在する該望ましくないノイズ信号および/または望ましい信号によって、該聴取場所における人間の聴取者に対してマスキングされるような振幅および/または周波数を、該基準信号が有する、ステップとを包含する。
【図面の簡単な説明】
【0055】
【図1】図1は、本発明に従ったシステムの構成図である。
【図2】図2は、正弦曲線状のトーンのレベルと広帯域のノイズ信号のレベルとの関数として音量を例示している図である。
【図3】図3は、ホワイトノイズによるトーンのマスキングを例示している図である。
【図4】図4は、周波数領域におけるマスキング効果を例示している図である。
【図5】図5は、250Hz、1kHzおよび4kHzの中心周波数における臨界周波数の狭い帯域のノイズに対するマスキングされた閾値を例示している図である。
【図6】図6は、正弦曲線状のトーンによるマスキング効果を例示している図である。
【図7】図7は、同時に起こるプレマスキングとポストマスキングを例示している図である。
【図8】図8は、トーンの知覚とテストトーンパルスの持続期間との関係を例示している図である。
【図9】図9は、マスキングされた閾値とテストトーンパルスの反復率との関係を例示している図である。
【図10】図10は、ポストマスキング効果を概略的に例示している図である。
【図11】図11は、マスカーの持続期間に関連するポストマスキング効果を例示している図である。
【図12】図12は、複合的なトーンによる同時マスキングを例示している図である。
【図13】図13は、音響心理学的なシステム同定のための例示的なシステムを示している構成図である。
【図14】図14は、音響心理学的なシステム同定のための別の例示的なシステムを示している構成図である。
【図15】図15は、音響心理学的なシステム同定のためのさらに別の例示的なシステムを示している構成図である。
【図16】図16は、線形関数を評価するマスキングモデルを実装するプロセスの流れ図である。
【図17】図17は、対数関数を評価するマスキングモデルを実装するプロセスの流れ図である。
【発明を実施するための形態】
【0056】
本発明は、以下の図面と記述とを参照してさらに理解され得る。図面における構成要素は、必ずしも寸法を合わせておらず、その代わりに、本発明の原理を例示することに重点が置かれている。さらに、図面においては、同じ参照番号は対応する部分を指す。
【0057】
(詳細な記述)
減少されるべき望ましくないノイズに相関する信号が、アクティブノイズ制御アクチュエータ(この場合、ラウドスピーカ)を駆動するために使用される場合には、フィードフォーワード制御システムが通常適用される。逆に、システムの応答が測定され、ループバックされる場合には、フィードバック処理が通常適用される。フィードフォーワードシステムは、一般的には、特に、ノイズの広帯域減少の能力によって、フィードバックシステムよりもノイズを抑制または減少することにおいて際立った有効性を呈する。なぜならば、フィードフォーワードシステムは、ノイズがノイズ信号の発達を評価することによってノイズを発することに対する反作用を開始することによってノイズが防止されることを可能にする。フィードバックシステムは、作用し始める前に、まず、ノイズの影響が明らかになることを待つ。センサがノイズの影響を決定するまで、アクティブノイズ制御は生じない。フィードバックシステムの利点は、ANCシステムの制御のために使用され得るノイズに相関する信号がない場合であっても、フィードバックシステムはまた、効果的に動作し得るということである。例えば、これはヘッドフォンのためのANCシステムの使用に適用され、ヘッドフォンのためのANCシステムの使用においては、ノイズの性質が前もっては知られていない空間においてヘッドフォンが身に付けられる。フィードフォーワードシステムとフィードバックシステムとの組み合わせがまた、ノイズの最大レベルの減少を達成するために可能である実際の用途において使用される。この種のシステムは、以下ではハイブリッドシステムと呼ばれる。
【0058】
減少されるノイズが、一般的に、周囲の状況の変化によって、音レベルおよびスペクトル構成に関して時間変化を被りやすいので、アクティブノイズ制御に対するフィードフォーワードシステムの実際の用途は、一般的に、事実上適応性がある。自動車に関してここで考えられる例において、周囲の状況におけるこのような変化は、異なる運転速度(風のノイズ、回転するタイヤのノイズ)、エンジンの様々な負荷状態、開いた窓などによるものであり得る。
【0059】
未知のシステムの所望のインパルス応答または伝達関数が、再帰的方法における適応フィルタを使用して適切に概算され得るということは公知である。適応フィルタは、デジタル信号プロセッサにおけるアルゴリズムによって実装されるデジタルフィルタを意味するように用いられており、該デジタル信号プロセッサは、適用可能なアルゴリズムに従って、フィルタ係数を入力信号に適応させる。この場合における未知のシステムは、伝達関数が決定されなければならない線形のひずみシステムであることが想定される。この伝達関数を見つけるために、適応システムが未知のシステムに並列して接続される。
【0060】
所謂フィルタリングされたxLMS(FxLMS)アルゴリズムまたはその変形が、このような場合において、非常に多くの場合に使用される。フィルタリングされたxLMSアルゴリズムの構造が図1に示されており、図1は、フィルタリングされたxLMS(FxLMS)アルゴリズムを利用する一般的なデジタルANCシステムの構成図を例示する。簡略化のために、このようなシステムを実際に実現するために必要とされる他の構成要素、例えば、増幅器およびアナログデジタル変換器またはデジタルアナログ変換器は、ここでは示されていない。
【0061】
図1のシステムは、ノイズ源QSと、エラーマイクロフォンEと、伝達関数P(z)を有する、ノイズ源SからエラーマイクロフォンEへの音の伝達の第1経路Pとを備えている。図1のシステムはまた、伝達関数W(z)を有する適応フィルタWと、ノイズ制御音波を生成するラウドスピーカLSと、伝達関数S(z)を有する、ラウドスピーカLSからエラーマイクロフォンEへの音の伝達を記述する第2経路Sとを含む。図1のシステムにさらに含まれるものは、フィルタS^であり、フィルタS^の伝達関数S^(z)は、システム同定法を使用して、S(z)から評価される。フィルタS^は、フィルタWのフィルタ係数の適応調整のための最小自乗平均アルゴリズムのための機能ブロックLMSの下流に接続される。LMSアルゴリズムは、公知の最小自乗平均の問題の解に関する概算のためのアルゴリズムである。アルゴリズムは再帰的に働く−すなわち、各新たなデータセットと共に、アルゴリズムが再実行され、解が更新される。LMSアルゴリズムは、低い程度の複合性と、関連する演算力の必要性と、計算能力の条件と、少ないメモリの必要性とを供給する。
【0062】
フィルタリングされたxLMSアルゴリズムはまた、例えば、デジタル信号プロセッサにおいて、比較的小さい演算力を用いて実装され得るという利点を有する。2つのテスト信号が、FxLMSアルゴリズムの実装のための入力パラメータとして必要とされる:例えば、システムに影響する外部のノイズと直接的に相関される基準信号x(n)、および例えば、伝達関数P(z)を有する第1経路Pに沿ったノイズx(n)によって誘発される信号d(n)と、エラーセンサの位置における、ラウドスピーカLSと伝達関数S(z)を有する第2経路Sとを通る作動信号y(n)から取得される信号y’(n)との重ね合わせから構成されるエラー信号e(n)。作動信号y(n)は、伝達関数W(z)を有するフィルタを用いたノイズ信号x(n)のフィルタリングから導き出される。名称「フィルタリングされたxLMS」のアルゴリズムは、特に、ラウドスピーカLSからエラーセンサE(例えば、マイクロフォン)への第1経路Pにおいて生じる、広帯域のエラー信号x(n)とエラー信号e(n)との間の非相関性に対して補償するために、エラー信号e(n)と直接的に組み合わされたノイズx(n)ではなく、むしろフィルタS^の伝達関数S^(z)を用いてフィルタリングされる信号x’(n)が、LMS制御の適応のために使用されるという事実に基づいている。
【0063】
IIR(無限インパルス応答)フィルタまたはFIR(有限インパルス応答)フィルタは、伝達関数W(z)およびS^(z)のためのフィルタとして使用される。FIRフィルタは有限インパルス応答を有し、アナログ信号のサンプリング周波数によって通常決定される別々の時間段階において働く。n番目の順番のFIRフィルタは、微分式
【0064】
【数1】
によって定義され、ここに、y(n)は、時間nにおける出力値であり、x(n)に対する最後のNでサンプリングされた入力値x(n−N)の合計から計算され、該y(n)に対して、合計は、フィルタ係数biを用いて重み付けられる。所望の伝達関数は、フィルタ係数bi(i=0、1・・・N)の特定によって実現される。
【0065】
FIRフィルタとは異なり、既に演算された出力値は、無限インパルス応答を有するIIRフィルタ(再帰的フィルタ)に対する分析に含まれる。演算された値は、無限の回数の後には、非常に小さくなり得るので、演算は、有限数のサンプル値nの後に、実際に中断され得る。IIRフィルタに対する計算スキームは、
【0066】
【数2】
となり、ここに、y(n)は回数nにおける出力値であり、フィルタ係数aiを用いて重み付けられた出力値y(n)の合計に加えられる、フィルタ係数biを用いて重み付けられたサンプリングされた入力値x(n)の合計から計算される。所望の伝達関数は、やはり、フィルタ係数aiおよびbiの特定によって実現される。
【0067】
FIRフィルタとは対照的に、IIRフィルタは、ここでは不安定であり得るが、実装に対する同じ程度の消費時間に対してより幅広い選択性を有し得る。実際の用途において、必要性および関連する演算の考慮の下で、相対条件を最も満足するフィルタが選ばれる。
【0068】
図1に示されているような、フィルタリングされたxLMSアルゴリズムの単純な設計の不利な点は、第2経路のシステム同定の質が、音声特性−例えば、ノイズレベル、帯域幅および実際のノイズ信号x(n)のスペクトル分布に依存するということである。
【0069】
これは、実用的な観点において、第2経路のシステム同定が狭い帯域においてのみ行なわれるという影響と、ノイズx(n)の決定の場所に依存して、ノイズx(n)には含まれない、所望のノイズ消去の場所における付加的なノイズ構成要素は、フィルタリングされたxLMSアルゴリズムによって考慮されないという影響とを有する。因果関係条件に適合させるために、結果としての音波伝播時間がラウドスピーカLSに対するノイズ制御信号を演算するために必要とされる期間に少なくとも対応するように、ノイズ信号x(n)を決定するための場所は位置を決められる。実際に、ノイズ信号x(n)とは関係のない基準信号は、概して、システム同定のために使用される。この基準信号は、適切な位置において、フィルタリングされたxLMSアルゴリズムに加えられる。これは、図1の基準信号z(n)によって概略的に例示されており、該基準信号z(n)は、ラウドスピーカLSの前に、ノイズ制御y(n)に対する作動信号に対して加えられ、第2経路Sのシステム同定のために使用される。この場合において、エラーマイクロフォンEにおける信号y’(n)は、第2経路Sの伝達関数S(n)を使用して、ノイズ制御y(n)と基準信号z(n)とに対する作動信号の合計の伝達から取得される。システム同定−すなわち、第2経路Sの伝達関数S(z)の決定は、可能な最大の帯域幅を有する信号を用いて行われるということが、ここでは望ましい。上に記述されたように、このアプローチの不利な点は、この特定された基準信号z(n)が、一般的な周囲の状況に依存して、自動車内の乗客にとって邪魔であると知覚され得るということである。
【0070】
第2経路Sのシステム同定に対する要求された基準信号z(n)は、自動車の内側またはヘッドフォンにおける適用可能なノイズレベルおよびタイミングの特徴とスペクトル特性とを考慮に入れて、車両の乗客が聞き取ることのできないような方法で生成されるべきであるということを、本発明は求める。これを達成するために、物理変数はもはや、全く使用されない。その代わりに、人間の耳に関する音響心理学的特性が考慮に入れられる。
【0071】
音響心理学は、音波が人間の耳に遭遇したときに生じる音声知覚を扱う。人間の可聴知覚、内耳における周波数グループの作成、人間の内耳における信号の処理、および時間および周波数の領域における同時的かつ一時的マスキング効果に基づいて、どの音響信号、またはどの音響信号の異なる組み合わせが、ノイズの存在において通常の聴覚を有する人間にとって可聴であるかと、不可聴であるかを示すように、モデルが生成され得る。テストトーンが(マスカー(masker)としても知られる)ノイズの存在においてやっと聞き取られ得る閾値は、マスキングされた閾値と呼ばれる。対照的に、最小の可聴閾値は、テストトーンが完全に静寂した環境においてやっと聞き取られ得る閾値を記述するために使用される用語である。最小の可聴閾値とマスキングされた閾値との間のエリアは、マスキングエリアとして公知である。
【0072】
以下で記述される方法は、音響心理学的マスキング効果を使用しており、該音響心理学的マスキング効果は、アクティブノイズ制御方法、特に、基準信号z(n)の生成に対する基礎となり、該基準信号z(n)は、乗客エリアの現在の状況に依存して、本発明によって意図されているように自動車の内部における乗客にとって聞き取ることができない。音響心理学的マスキングモデルは、基準信号z(n)を生成するために使用される。このように、第2経路Sのシステム同定は、本発明によって主張されているように適応性があるように行われ、ノイズ信号に関する変化に対してリアルタイムで調節される。自動車におけるノイズ信号は、本発明に従って、マスキング、すなわち、基準信号z(n)の不可聴性をもたらし、スペクトル構成とタイミング特徴との両方に関して、アクティブ変化を被るので、音響心理学的モデルは、音のレベルのマスキングと、スペクトル構成と、タイミングとの依存性を考慮する。
【0073】
音響心理学的マスキングのモデリングに対する基礎は、人間の耳、特に内耳の基本特性である。内耳は、所謂錐体骨の中に配置されており、非圧縮性のリンパ液で満たされている。内耳は、約2 1/2回の巻きを有する巻貝(蝸牛)のように形作られている。蝸牛は、平行な管も備えており、上側および下側の管は、基底板によって分離されている。コルチ器官は、基底板の上にあり、人間の耳の感覚細胞を含む。基底板が音波によって振動するように作られている場合には、神経インパルスが生成される−すなわち、節が生じないか、または波腹が生じる。これは、聴覚にとって重大な影響−所謂基底板における周波数/位置の変換をもたらし、該所謂基底板における周波数/位置の変換を用いて、音響心理学的マスキング効果と人間の耳の正確な周波数選択性とが説明され得る。
【0074】
人間の耳は、限定された周波数帯域の中で共に生じる様々な音波をグループ分けする。これらの周波数帯域は、臨界周波数グループまたは臨界帯域幅(CB)として公知である。CBの基礎は、音波から生じる音響心理学的聴覚印象に関して、人間の耳が特定の周波数帯域における音を通常の可聴印象として編集するということである。周波数グループの中で生じる音の活動は、異なる周波数グループにおいて生じる音波とは異なり、互いに影響する。例えば、1つの周波数グループの中の、同じレベルを有する2つのトーンが、それらが異なる周波数グループにあった場合よりも静かであると知覚される。
【0075】
次に、エネルギーが同じであり、マスカーが、中心周波数がテストトーンの周波数である周波数帯域にあるときには、テストトーンはマスカーの中で聞き取ることができるので、周波数グループの求められる帯域幅が決定され得る。低周波数の場合において、周波数グループは、100Hzの帯域幅を有する。500Hzを上回る周波数に関しては、周波数グループは、対応する周波数グループの中心周波数の約20%の帯域幅を有する。
【0076】
全ての臨界周波数グループが、全可聴領域にわたって並行して配置される場合には、聴覚指向の非線形の周波数尺度が取得され、該周波数尺度は、音質として公知であり、単位「バーク」を有する。周波数グループが各位置において正確に1バークの同じ幅を有するように、バークは周波数軸の歪曲された尺度を表す。周波数と音質との間の非線形の関係は、基底板における周波数/位置の変換に根差す。音質関数は、マスキングされた閾値と音量との調査に基づいて、Zwickerによって表および方程式の形式で定義された(Zwicker,E.;Fastl、H. Psychoacostics−Facts
and Models、第2版、Springer−Verlag、Berlin/Heidelberg/New York、1999年を参照されたい)。0kHzから16kHzの可聴周波数範囲において、正確に24の周波数グループは一列に配置され得、その結果、関連する音質範囲は、0バークから24バークとなる。
【0077】
さらに、用語音量および音強度は、同量の印象を指すが、単位だけが異なる。音量および音強度は、人間の耳の周波数依存の知覚を考慮する。音響心理学的な観点の「音量」は、特定のレベル、特定のスペクトル構成、および特定の持続期間を有する、どのくらいの大きさの音が主観的に知覚されるかを示す。音が2倍の大きいと知覚された場合には、音量が2倍大きくなり、このことは、知覚された音量を参照して、様々な音波が互いに比較されることを可能にする。音量を評価および測定するための単位は、ソーンである。1ソーンは、40ホーンの音量レベルを有するトーンの知覚された音量として定義され、すなわち、40dBの音圧レベルを有する、1kHzの周波数におけるシヌス(sinus)トーンと同じ音量を有するとして知覚される音の知覚された音量として定義される。
【0078】
中程度のサイズの高い強度の値の場合において、10ホーンの強度の増加が、音量における2倍の増加をもたらす。低い音の強度に関しては、強度におけるわずかな増加が、知覚された音量を2倍の大きさにする。人間によって知覚される音量は、音の音圧レベルと周波数スペクトルとタイミングの特徴とに依存しており、マスキング効果をモデリングするためにも使用される。例えば、DIN 45631およびISO 532 Bに従って、音量を測定するための規格化された測定方法がまた存在する。
【0079】
図2は、音レベルに関する、すなわち、時間的効果が、知覚された音量に影響しない信号に関する、1kHzの周波数を有する定常シヌストーンの音量N1kHzと定常一様な励起ノイズの音量NGARとの例を示す。各周波数帯域において同じ音の強度を有し、従って同じ励起を有するノイズとして、一様な励起ノイズ(GAR)は定義される。図2は、音圧レベルに対する対数目盛において、ソーンで音量を示す。低音圧レベルに関して、すなわち、最小可聴閾値に近づくときに、トーンの知覚された音量Nは劇的に低下する。高音圧レベルに関して、音量Nと音圧レベルとの間に関係が存在する−この関係は、図に示された等式で定義される。「I」は、発せられたトーンの音強度を1m2毎のワット数で表し、ここに、I0は1m2毎に10−12ワットの基準の音強度を指し、中心周波数において、概ね最小可聴閾値に対応する(以下を参照されたい)。音量Nは、複合的なノイズ信号によるマスキングを決定する有用な手段であり、従ってスペクトルが複合的な時間依存の音波を介した音響心理学的マスキングのモデルにとって必要な条件であることが、次の性質から明らかになる。
【0080】
周波数の関数としてトーンを概ね知覚することができるのに必要とされる音圧レベル1が測定された場合に、所謂最小可聴閾値が取得される。音圧レベルが最小可聴閾値を下回る音響信号は、ノイズ信号が同時に存在しなかったとしても、人間の耳に知覚され得ない。
【0081】
所謂マスキングされた閾値が、ノイズ信号の存在におけるテスト音に対する知覚の閾値として定義される。テスト音がこの音響心理学的な閾値を下回る場合に、テスト音は完全にマスキングされる。これは、マスキングの音響心理学的な領域の中の全ての情報が知覚され得ない−すなわち、不可聴情報が任意の音声信号に加えられ、ノイズ信号にさえも加えられ得るということを意味する。マスキングされた閾値と最小可聴閾値との間のエリアは、所謂マスキングエリアであり、該マスキングエリアにおいては、挿入された信号は人間の耳に知覚され得ない。この局面は本発明によって利用され、基準信号z(n)がレシーバ(ここに示されている場合において、エラーマイクロフォンE)によって検出され、次のプロセスのために分析され得るが、人間の耳には聞き取ることができないように、付加的な信号構成要素(ここに示されている場合において、第2経路Pのシステム同定に対する基準信号z(n))、第1信号(ここに示されている場合において、ノイズ信号x(n))、またはノイズ信号x(n)および適用可能である場合には音楽信号を備えている全体信号を加える。
【0082】
マスキング効果が全種類の人間の聴覚に対して測定され得る様々な調査が行われている。多くの他の音響心理学的印象とは異なり、個人間の差はあまりなく、無視され得、音によるマスキングの一般的な音響心理学的モデルが生成され得るということを意味する。マスキングの音響心理学的局面は、この音響的に伝達された基準信号z(n)が、現在存在するノイズレベル、そのスペクトル構成およびタイミング特質に関わらず、不可聴になるように、音声特徴にリアルタイムで基準信号z(n)を適応させるように、本発明において利用される。ノイズレベルは、周辺のノイズ、干渉、音楽、またはこれらの組み合わせから形成され得る。
【0083】
ここで、区別が、マスキングの2つの主要な形式の間で行われ、そのそれぞれが、マスキングされた閾値の様々な性質をもたらす。これらは、周波数領域における同時マスキングと、時間軸に沿ったマスカーのタイミング効果による時間領域におけるマスキングである。さらに、これら2つのマスキングタイプの組み合わせが、周辺のノイズまたは全般的なノイズのような信号において見つけられる。
【0084】
同時マスキングは、マスキング音と有用な信号とが、同時に生じることを意味する。頻繁にシヌス形状にされるテスト信号がやっと聞き取ることができるように、マスカーの形状、帯域幅、振幅および/または周波数が変化する場合には、マスキングされた閾値が、可聴領域の全帯域幅−すなわち、主に、20Hzと20kHzとの間の周波数にわたる同時マスキングのために決定され得る。この周波数領域はまた、概して、自動車における後部座席娯楽システムにおいて使用される音声装置の利用可能な帯域幅を表し、従って、第2経路Pのシステム同定のための基準信号z(n)に対する有用な周波数領域も表す。
【0085】
図3は、ホワイトノイズによる正弦曲線状のテストトーンのマスキングを示す。音強度1WNを有するホワイトノイズによってのみマスキングされたテストトーンの音強度が、その周波数との関係で表示されており、ここで最小可聴閾値は点線で表示されている。ホワイトノイズによってマスキングするためのシヌストーンの最小可聴閾値は、以下のように取得される:500Hz未満では、シヌストーンの最小可聴閾値は、ホワイトノイズの音強度よりも17dB上回る。500Hzを上回ると、最小可聴閾値は、周波数が2倍になることに対応して、10毎に約10dBまたは1オクターブ毎に約3dB増加する。最小可聴閾値の周波数依存性は、様々な中心周波数における人間の耳の様々な臨界帯域幅(CB)から導き出される。
【0086】
周波数グループにおいて生じる音強度は、知覚された音声印象に編集されるので、より大きな全体的強度が、レベルが周波数とは関係のないホワイトノイズに対するより高い周波数におけるより広い周波数グループにおいて取得される。音量はまた、(すなわち、知覚された音量)に対応するように生じ、増加されたマスキングされた閾値をもたらす。これは、(例えば、マスカーの音圧レベルのような)純粋に物理的な観点は、マスキングの音響心理学的効果のモデリング−すなわち、音圧レベルおよび強度のような観点からマスキングされた閾値を導き出すことは不適切であるということを意味する。その代わりに、音量Nのような音響心理学的な観点が本発明と共に使用される。マスキング音のスペクトル分布およびタイミング特徴が主要な役割を演じ、このことは以下の図面から明らかである。
【0087】
マスキングされた閾値が、シヌストーンのような狭い帯域のマスカー、狭い帯域のノイズまたは臨界帯域幅のノイズに対して決定される場合には、結果としてのスペクトルのマスキングされた閾値は、マスカー自体がスペクトル構成要素を有していないエリアにおいてさえも、最小可聴閾値よりも高い。臨界帯域幅のノイズは、この場合、狭い帯域のノイズとして使用され、該狭い帯域のノイズのレベルは、LCBとして示される。
【0088】
図4は、1kHzの中心周波数fcを有する臨界帯域のノイズによるマスカーとして測定されたシヌストーンのマスキングされた閾値、およびレベルLTを有するテストトーンの周波数fTに関する様々な音圧レベルのマスキングされた閾値を示す。最小可聴閾値は、図3において点線によって表示されている。マスカーのレベルがまた20dBだけ上昇する場合には、マスキングされたピーク値が20dBだけ上昇するということと、従って、マスキングされたピーク値は、マスキングされた臨界帯域幅のノイズのレベルLCBと共に直線状に変化する。測定されたマスキングされた閾値の下側の縁−すなわち、中心周波数fcよりも低い低周波数の方向に向けたマスキングは、マスキングされた閾値のレベルLCBとは関係のない約−100dB/オクターブの勾配を有する。この大きな勾配は、40dBを下回るマスカーのレベルLCBに対するマスキングされた閾値の上側の縁に到達されるだけである。マスカーのレベルLCBに関する増加と共に、マスキングされた閾値の上側の縁は段々と平坦になり、勾配は100dBのLCBに対して約−25dB/オクターブになる。これは、マスカーの中心周波数fcと比較してより高い周波数の方向におけるマスキングは、マスキング音が存在する周波数領域をはるかに超えて伸びるということを意味する。聴覚は、狭い帯域の臨界帯域幅のノイズに対する1kHz以外の中心周波数に対して同様に応答する。マスキングされた閾値の上側の縁と下側の縁との勾配は、図5に見られるように、マスカーの中心周波数に実質的に関係がない。
【0089】
図5は、60dBのレベルLCBと250Hz、1kHz、および4kHzの3つの異なる中心周波数とを有する、狭い帯域における臨界帯域幅のノイズからのマスカーに対するマスキングされた閾値を示している。250Hzの中心周波数を有するマスカーに対する下側の縁に対する勾配の明らかにより平坦な流れは、最小可聴閾値によるものであり、該最小可聴閾値は、より高いレベルにおいてでさえも、この低い周波数において適用される。示されたもののような効果は、マスキングのための音響心理学的モデルの実装において同様に含まれる。最小可聴閾値はやはり、図5において点線によって表示されている。
【0090】
シヌス形状のテストトーンが、1kHzの周波数を有する別のシヌストーンによってマスキングされる場合には、図6に示されているようなマスキングされた閾値が、テストトーンの周波数とマスカーLMのレベルとに従って取得される。先に既に記述したように、マスカーのレベルに関する上側の縁の扇形の開きが明確に見られ得るが、マスキングされた閾値の下側の縁は、周波数とレベルに実質的に関係ない。上側の勾配は、マスカーのレベルに関して約−100dB/オクターブ〜−25dB/オクターブになり、下側の勾配に対して約−100dB/オクターブになるように測定される。約12dBの差がマスキングトーンのレベルLMとマスキングされた閾値Lrの最大値との間に存在する。この差は、マスカーとしての臨界帯域幅のノイズを用いて取得される値よりも非常に大きい。なぜならば、マスカーの2つのシヌストーンの強度、およびテストトーンの強度は、ノイズの使用およびテストトーンとしてのシヌストーンとは異なり、同じ周波数において共に加えられる。結果として、トーンは、すなわち、テストトーンとしての低いレベルに対して、ずっとより早く知覚される。さらに、同時に2つのシヌストーンを発するときに、(うなりのような)他の効果が生じ、同様に、増加された知覚または減少されたマスキングをもたらす。
【0091】
記述された同時マスキングと共に、マスキングの別の音響心理学的効果は、所謂時間的マスキングである。2つの異なる種類の時間的マスキングが区別される:プレマスキングは、マスカーのレベルに関する急激な上昇の前にマスキング効果が既に生じる状況を指す。ポストマスキングは、マスキングされた閾値が、マスカーのレベルの急速な下落の後の期間において、最小可聴閾値にすぐには降下しないときに生じる効果を表す。図7は、プレマスキングとポストマスキングとの両方を概略的に示しており、トーンインパルスのマスキング効果と関連して以下でさらに詳細に述べられる。
【0092】
時間的なプレマスキングとポストマスキングとの効果を決定するために、短い持続期間のテストトーンインパルスが、マスキング効果の対応する時間的分解を取得するために使用されなければならない。ここでは、最小可聴閾値とマスキングされた閾値との両方が、テストトーンの持続期間に依存している。2つの異なる効果がこれに関して知られている。これらは、テストインパルスの持続期間に関する音量印象の依存性(図8を参照)と、短いトーンインパルスの反復率と音量印象との間の関係(図9を参照)とを指す。
【0093】
20−msのインパルスの音圧レベルが、同一の音量印象を取得するために、200−msのインパルスの音圧レベルと比較して、10dBだけ増加されなければならない。200ms以上のインパルスの持続期間においては、トーンインパルスの音量は、持続期間に関係がない。人間の耳にとって、約200msを上回る持続期間を有する処理は、定常なプロセスを表すということは公知である。音が約200msよりも短い場合には、音のタイミング特性の音響心理学的に証明可能な効果が存在する。
【0094】
図8は、持続期間におけるテストトーンインパルスの知覚の依存性を示す。点線は、持続期間に関して、200Hz、1kHzおよび4kHzの周波数fT-に対するテストト
ーンインパルスの最小可聴閾値TQを示しており、最小可聴閾値は、200msを下回るテストトーンの持続期間の間、10毎に約10dB上昇する。この性質は、テストトーンの周波数とは関係なく、テストトーンの異なる周波数fTに対する線の絶対的な位置は、これらの異なる周波数における異なる最小可聴閾値を反映する。
【0095】
実線は、40dBおよび60dBのレベルLUMNを有する一様なマスキングノイズ(UMN)によって、テストトーンをマスキングするためのマスキングされた閾値を表す。一様なマスキングノイズが、全可聴領域を通して−すなわち、0バーク〜24バークの全周波数グループに対して、一定のマスキングされた閾値を有するように、一様なマスキングノイズは定義される。言い換えると、マスキングされた閾値の表示された特徴は、テストトーンの周波数fTに関係がない。最小可聴閾値TQと丁度同じように、マスキングされた閾値はまた、200msを下回るテストトーンの持続期間の間、10毎に約10dB上昇する。
【0096】
図9は、3kHzの周波数と3msの持続期間とを有するテストトーンインパルスの反復率に関するマスキングされた閾値の依存性を示す。一様なマスキングノイズはやはりマスカーである:マスカーは、長方形の形状に変調される−すなわち、マスカーは、定期的にオンとオフを切り換える。一様なマスキングノイズの調査された変調周波数は、5Hz、20Hzおよび100Hzである。テストトーンは、一様なマスキングノイズの変調周波数と同一な次の周波数を用いて発せられる。試験の間、テストトーンインパルスのタイミングが、変調されたノイズの時間関連のマスキングされた閾値を取得するように対応して変更される。
【0097】
図9は、マスカーの持続期間TMに対して標準化された横座標に沿った、テストトーンインパルスの時間における変動を示す。縦座標は、計算されたマスキングされた閾値におけるテストトーンインパルスのレベルを示す。点線は、変調されていないマスカー(すなわち、他の点では同一な特性を有する継続的に存在するマスカー)に対するテストトーンインパルスのマスキングされた閾値を基準点として表す。
【0098】
プレマスキングの勾配と比較すると、図9におけるポストマスキングのより平坦な勾配が明らかに見られる。長方形形状の変調されたマスカーを作動した後に、マスキングされた閾値は短い期間超過される。この効果はオーバーシュートとして公知である。マスカーの停止における変調された一様なマスキングノイズに対するマスキングされた閾値のレベルにおける最大下落ΔLは、一様なマスキングノイズの変調周波数における増加に応答した定常一様なマスキングノイズに対するマスキングされた閾値と比較して期待されたように減少される−言い換えると、テストトーンインパルスのマスキングされた閾値が、最小可聴閾値によって特定される最小値に対する存続期間の間、段々と低下し得る。
【0099】
マスカーが完全にオンに切り換えられる前に、マスカーが既にテストトーンインパルスをマスキングすることを図9はまた例示する。この効果は、先に既に述べたように、プレマスキングとして公知であり、大きな(すなわち、高い音圧レベルを有する)トーンとノイズが、静かなトーンよりも素早く聴覚によって処理され得るという事実に基づいている。プレマスキング効果は、ポストマスキングの効果よりも全く優れていないので、多くの場合に、対応するアルゴリズムを簡略化するために、音響心理学的なモデルにおける使用においては省かれる。マスカーの接続を断った後、可聴閾値は最小可聴閾値にすぐには低下せず、むしろ約200msの期間の後に最小可聴閾値に到達する。効果は、内耳の基底板における一時的な波のゆっくりとした安定によって説明され得る。
【0100】
これに加えて、マスカーの帯域幅はまた、ポストマスキングの持続期間に直接的な影響を有する。各個々の周波数グループと関連するマスカーの特定の構成要素が、図10および図11に示されているように、ポストマスキングをもたらす。
【0101】
図10は、500msの持続期間を有するホワイトノイズから成る長方形形状のマスカーの終了後の、時間tVにおいて存在するテストトーンとして、20μsの持続期間を有するガウスインパルスのマスキングされた閾値のレベル特性LTを示し、ホワイトノイズの音圧レベルLWRは、3つのレベル40dB、60dBおよび80dBを帯びている。ホワイトノイズを備えているマスカーのポストマスキングは、スペクトル効果を用いることなく測定され得る。なぜならば、人間の耳の知覚可能な周波数領域に関して20μsの短い持続期間を有するガウス形状のテストトーンはまた、ホワイトノイズの広帯域のスペクトル分布と似た広帯域のスペクトル分布を示す。図10における実線の曲線は、測定によって決定された事後処理の特徴を例示する。次に、曲線は、マスカーのレベルLWRとは関係なく、200ms後に、テストトーンの最小可聴閾値に対する値(この場合において使用される短いテストトーンに対して約40dB)に到達する。図10は、10msの時定数を有するポストマスキングの指数の低下に対応する曲線を点線によって示す。この種の単純な概算だけが、大きいレベルのマスカーに対して有効であり、この種の単純な概算は、最小可聴閾値の周辺におけるポストマスキングの特徴を決して反映しないということが見られ得る。
【0102】
ポストマスキングとマスカーの持続期間との間にも関係がある。図11における点線は、60dBのレベルLUMNと5msの持続期間TMとを有する一様なマスキングノイズを備えている長方形形状の変調されたマスカーの停止後、5msの持続期間と2kHzの周波数fTとを有するガウス形状のテストトーンインパルスのマスキングされた閾値を遅延時間tdの関数として示す。実線は、200msの持続期間TMを有し、テストトーンインパルスと一様なマスキングノイズと他の点では同一であるパラメータを有するマスカーに対するマスキングされた閾値を示す。
【0103】
200msの持続期間TMを有するマスカーに対する測定されたポストマスキングは、200msよりも長い持続期間TMを有するが、他の点では同一であるパラメータを有する全てのマスカーに対しても見つけられるポストマスキングと調和する。より短い持続期間であるが、他の点では同一であるパラメータ(スペクトル構成およびレベルなど)を有するマスカーの場合において、マスカーの5msの持続期間TMに対するマスキングされた閾値の特徴から明らかであるように、ポストマスキングの効果は減少される。音響心理学的モデリングのような、アルゴリズムおよび方法における音響心理学的マスキング効果を使用するために、グループ分けされた、複合的なまたは重ね合わされた個々のマスカーに対して、結果としてのどのマスキングが取得されるかということがまた考慮される。異なるマスカーが同時に生じた場合には、同時マスキングが存在する。ごくわずかな現実の音が、シヌストーンのような純粋な音と比較可能である。概して、楽器から発せられたトーン、および自動車におけるエンジンのような回転体から生じる音は、多数の倍音を有する。部分的なトーンのレベルの構成に依存して、結果としてのマスキングされた閾値は大きく変化し得る。
【0104】
図12は、複合的な音に対する同時マスキングを示す。シヌス形状のテストトーン同時マスキングに対するマスキングされた閾値は、励起の周波数とレベルとに関して、200−Hzのシヌストーンの10個の倍音によって表される。全ての倍音が同じ音圧レベルを有するが、全倍音の位相位置は統計学的に分布される。図12は、部分的なトーンの全レベルが40dBまたは60dBのいずれかである2つの場合に対する、結果としてのマスキングされた閾値を示す。基準トーンと第1の4個の倍音とが、それぞれ別個の周波数グループに位置を決められる。これは、マスキングされた閾値の最大値に対する、これらの複合的な音の構成要素のマスキング部分の追加的な重ね合わせはないということを意味する。
【0105】
しかしながら、上側の縁と下側の縁との重ね合わせ、および−その最深点において、やはり最小可聴閾値よりも非常に高い−マスキング効果の追加からもたらされる下降とが明らかに見られ得る。対照的に、上側の倍音のほとんどが、人間の聴覚の臨界帯域幅の範囲内にある。個々のマスキングされた閾値の強固で追加的な重ね合わせが、この臨界帯域幅において行われる。この結果として、同時マスカーの追加は、マスカーの強度を加算することによっては計算され得ないが、その代わりに、個々の特定の音量値が、マスキングの音響心理学的モデルを定義するために、加算されなければならない。
【0106】
時間可変信号の音声信号スペクトルから励起分布を取得するために、より狭い帯域のノイズによってマスキングするためのシヌストーンのマスキングされた閾値の公知の特徴が、分析の基準として使用される。ここで、(臨界帯域幅の範囲内の)中心の励起と(臨界帯域幅の外側の)縁の励起との間で、区別が行われる。この例としては、シヌストーンの音響心理学的な中心の励起、または物理的な音の強度に調和する臨界帯域幅よりも小さい帯域幅を有する狭い帯域のノイズの音響心理学的な中心の励起である。また、信号は、音声スペクトルによってマスキングされる臨界帯域幅の間で対応するように分布される。このように、音響心理学的な励起の分布は、受信された時間可変音の物理的強度のスペクトルから取得される。音響心理学的な励起の分布は、規定の音量と呼ばれる。複合的な音声信号の場合における結果としての全体的な音量は、トーンの尺度に沿った可聴領域−すなわち、0バークから24バークの範囲における全音響心理学的な励起の規定の音量に対する積分であることが分かり、対応する時間関係も示す。この全音量に基づいて、次に、マスキングされた閾値が、音量とマスキングとの間の既知の関係に基づいて作り出され、関連する臨界帯域幅の範囲内の音の終了後、時間効果の考慮の下、マスキングされた閾値は、約200msで最小可聴閾値に下落する(図10、ポストマスキングをまた参照)。
【0107】
このように、音響心理学的マスキングモデルは、上記の全マスキング効果の考慮の下、実装される。どのマスキング効果が、背景ノイズのようなノイズの音圧レベル、スペクトル構成およびタイミングの特徴によってもたらされるかと、所望のテスト信号が、上記のような種類の環境において聴取者によって知覚され得ないように、第2経路Sのシステム同定のために適応するようにかつリアルタイムで所望のテスト信号を操作するために、これらの効果がどのように利用され得るかとが、上記の図面および記述から理解され得る。
【0108】
図13〜図15は、以下で、本発明を用いた音響心理学的マスキングモデルの用途、特に、第2経路Sの音響心理学的なシステム同定に対する3つの例を例示する。図13における信号の流れ図は、ヘッドフォンと組み合わせたノイズ制御のためのANCシステムにおける使用のための音響心理学的マスキングモデル(PMM)の利用のための、本発明に従った最初の回路を例示する。予期されるノイズ信号に相関する適切な基準信号は、この用途に対しては利用可能ではなく、従って、先に記述されたようなフィードバックANCシステムが使用される。フィードフォーワードANCシステムは、予期されるノイズ信号と相関する基準信号x(n)の存在を必要とし、この基準信号の受信に対するセンサが常に、エラーマイクロフォンEよりもノイズ信号源に近くなるように(図1を参照)、因果関係条件が満足されることを必要とする。この因果関係条件は、特に、未知の空間における運動の自由を有するヘッドフォンに対しては満足されない。
【0109】
図13において示されているような本発明に従ったシステムの例は、ノイズ信号(例えば、定期的なノイズ信号)を生成する源QSと、エラーマイクロフォンEと、ノイズ源QSからエラーマイクロフォンEへの音の伝播のための伝達関数P(z)を有する第1経路Pとを有する。図13のシステムはまた、伝達関数W(z)を有する適応フィルタWと、消去音波を生成するために適応フィルタWの上流に接続されたラウドスピーカLSと、ラウドスピーカLSからエラーマイクロフォンEへの音の伝播のための伝達関数S(z)を有する第2経路Sとを備えている。
【0110】
図13のシステムはまた、伝達関数S^(z)を有する第1フィルタS^1と、伝達関数S^(z)を有する第2フィルタS^2と、伝達関数S^(z)を有する第3フィルタS^3とを備え、これらは、S.Mitra、J.S.Kaiser、Handbook
For Digital Signal Processing、Wiley and
Sons 1993年、ページ1085〜1092によって記述されたようなシステム同定方法を使用してS(z)から見積もられ、加えて、最小自乗平均アルゴリズムを使用したフィルタWのフィルタ係数の適用のための第1制御ブロックLMS1と、最小自乗平均アルゴリズムを使用した第1フィルタS^1、第2フィルタS^2および第3フィルタS^3のフィルタ係数の適用のための第2制御ブロックLMS2も備えている。フィルタS^1およびフィルタS^2の同一の伝達関数S^(z)は、それぞれの場合において、リアルタイムで実行される第2経路Sの適応のシステム同定の間に決定されたフィルタS^3のフィルタ係数を単にコピーすることによって取得される。
【0111】
図13のシステムはまた、時間領域から周波数領域への信号の高速フーリエ変換のための第1ユニットFFT1および第2ユニットFFT2と、周波数領域から時間領域への信号の逆高速フーリエ変換のための第1ユニットIFFT1および第2ユニットIFFT2とを備えている。さらに、音響心理学的マスキングモデルユニットPMMと、巡回的なたたみ込みの積を避けるための抑制ユニットCと、フィルタFと、ホワイトノイズ源NGと、音楽信号源MSとを備えている。
【0112】
エラーマイクロフォンEにおけるエラー信号e(n)は、一方では、伝達関数P(z)を有する第1経路Pを介して伝播される、ノイズ源QSからのノイズ信号x(n)からもたらされる信号d(n)で構成されており、もう一方では、ラウドスピーカLSに供給され、それから伝達関数S(z)を有する第2経路Sを介してエラーマイクロフォンEに伝達される消去信号y_sum(n)からもたらされる信号y’(n)で構成されている。参照信号z(n)は、フィルタFを介してホワイトノイズ源NGによって提供された信号FilteredWhiteNoise(n)に音楽源MSからの信号Music(n)を加算することによって取得される。基準信号z(n)は、フィルタWの出力信号y(n)に加算され、両方の該信号の合計が信号y_sum(n)を形成する。
【0113】
基準信号z(n)はまた、高速フーリエ変換ユニットFFT2に供給され、信号z(ω)に変換され、該信号z(ω)は、伝達関数S^(z)を有する適応フィルタS^3を介したフィルタリングと、ユニットIFFT1を介した次の逆高速フーリエ変換との後に、エラー信号e(n)から減算され、信号e’(n)を生じさせる。高速フーリエ変換ユニットFFT1は、信号e’(n)を信号E’(ω)に転換し、該信号E’(ω)は、フィルタS^1、フィルタS^2およびフィルタS^3のフィルタ係数の適応制御のためのユニットLMS2に、信号Z(ω)と共に供給されており、該フィルタは、最小自乗平均アルゴリズムを使用する。信号E’(ω)はまた、音響心理学的マスキングモデルユニットPMMに対する入力信号として使用され、該音響心理学的マスキングモデルユニットPMMは、エラーマイクロフォンの場所(すなわち、ヘッドフォンの場所)における、ノイズを介した現在のマスキングの考慮の下、信号GAIN(ω)を生成し、該信号GAIN(ω)は、基準信号z(n)を決定するために使用される。そうするために、信号GAIN(ω)は、逆高速フーリエ変換のためのユニットIFFT2によって時間信号GAIN(n)に転換され、巡回的なたたみ込みの積を避けるための抑制ユニットCによって設定され、フィルタFの係数は、信号Gain(n)によって制御され、該信号Gain(n)は、新たなフィルタ係数の組に対応する。FilteredWhiteNoise(n)信号は、(基準信号が現在のノイズ信号の可聴閾値を下回って設定されているので不可聴である)第2経路Pのシステム同定のための不可聴基準信号に調和する。
【0114】
基準信号z(n)はまた、有用な信号Music(n)を含み得るが、しかしながら、該信号Music(n)は、本システムの関数にとって不可欠なものではない。信号e’(n)は、信号x^(n)を取得するために、フィルタS^2の伝達関数S(z)を介して信号y(n)から導き出される信号y’(n)に加えられる。信号x^(n)は、適応フィルタWに対する入力信号を表し、伝達関数S(z)を有するフィルタS^1によって処理した後に、フィルタWのフィルタ係数の適応制御のために最小自乗平均アルゴリズムを使用するユニットLMS1に信号e’(n)と共に供給される信号x’^(n)としても使用される。
【0115】
図14は、音響心理学的マスキングモデルユニットPMMを使用した自動車の内部におけるノイズ制御を有するANC/MSTシステムを示す。図13に示されたようなヘッドフォンの用途とは対照的に、この用途は、予期されるノイズ信号と相関する基準信号fn(n)を有し、フィードフォーワードANC/MSTシステムが利用される。基準信号fn(n)は、非音響センサを介して、例えば、ノイズ源の場所に配置される圧電性トランスデューサまたは電気音響トランスデューサ、ホール素子、rmpメータによって生成される。図14に示されている回路は、空間特性(例えば、自動車の内側)が知られている環境において使用されるので、基準信号fn(n)に対するセンサが常に、エラーマイクロフォンEよりもノイズ信号源に近くなければならない、フィードフォーワードシステムに必要とされる因果関係条件は、これらの構成要素の適切な配置によって確実に満足され得る。
【0116】
図14のシステムは、図13のシステムを含み、さらに、時間領域から周波数領域への信号の高速フーリエ変換のための第3ユニットFFT3と、第1計算回路CALC1と、第2計算回路CALC2とを含む。図14のシステムはまた、図13のシステムに加えて、適応帯域通過フィルタBPと、上で既に述べたように、非音響センサNASとを特徴とする。
【0117】
図14のシステムにおいて、エラーマイクロフォンEにおけるエラー信号e(n)は、図13のシステムにおけるのと同様に、信号d(n)とy_sum(n)とから構成される。基準信号z(n)は、音楽源MSからの信号Music(n)と信号FilteredWhiteNoise(n)とから構成される。基準信号z(n)は、1−βで重みをつけられたフィルタWの出力信号y(n)に加算され、信号y_sum(n)を生じる。信号z(n)は再び高速フーリエ変換ユニットFFT2を経由して供給されて、信号z(ω)を取得し、適応フィルタS^3を介したフィルタリングと、ユニットIFFT1を介した次の逆高速フーリエ変換との後に、該信号z(ω)はエラー信号e(n)から減算され、図13との違いを比較すると、信号e’’(n)を生じさせる。信号e’’(n)は高速フーリエ変換ユニットFFT1によって信号E’’(ω)に転換される。信号E’’(ω)は、音響心理学的マスキングモデルユニットPMMに対する入力信号として使用され、該音響心理学的マスキングモデルユニットPMMは、エラーマイクロフォンの場所における、ノイズを介した現在のマスキングの考慮の下、信号GAIN(ω)を生成し、該信号GAIN(ω)は、基準信号z(n)を決定するために使用される。そうするために、周波数領域における信号GAIN(ω)は、逆高速フーリエ変換のためのユニットIFFT2によって時間領域における信号Gain(n)に変換され、源NGから生成された信号WhiteNoise(n)が、フィルタFを使用して信号FilteredWhiteNoise(n)に転換されるように、強制ユニットCによって強制され、該フィルタFに新たなフィルタ係数の組Gain(n)がロードされる。FilteredWhiteNoise(n)信号は、(信号が現在のノイズ信号の可聴閾値を下回っているので不可聴である)第2経路Pのシステム同定のための不可聴基準信号に調和する。さらに、基準信号z(n)はまた、有用な信号Music(n)を含み得、該信号Music(n)は、本システムの関数にとって不可欠なものではない。信号e^(n)は、信号e’’(n)から減算され、該信号e’’(n)は、入力においてβ・y(n)を供給されたフィルタS^2によって出力される。信号e’(n)は、高速フーリエ変換ユニットFFT3によって信号E’(ω)に変換され、z(ω)と共に、フィルタS^1、フィルタS^2およびフィルタS^3のフィルタ係数の適応制御のためのユニットLMS2において使用される。
【0118】
非音響センサNASは、音響ノイズ信号x(n)と相関する電気信号を生成し、該電気信号は計算回路CALC1に供給され、該計算回路CALC1から、信号fn(n)が取得される。次に、信号ジェネレータSGは、xc(n)〜x(n)であるところのノイズ信号に対応するフィルタWに対して入力信号xc(n)を生成する。計算ユニットCALC2は、適応帯域通過フィルタBPに対するフィルタ係数K(n)を決定する。伝達関数S^(z)を有するフィルタS^1を使用して、信号xc(n)は、信号x’(n)に転換され、次に、最小自乗平均アルゴリズムを使用したフィルタWのフィルタ係数の適応制御のための回路LMS1の制御のために、帯域通過フィルタBPを介してフィルタリングされた信号e’(n)と共に使用される。
【0119】
図15のシステムは、音響心理学的マスキングモデルユニットPMMを使用した、自動車の内部におけるノイズの制御のためのANC/MSTシステムである。図14に示されたフィードフォーワードシステムに加えて、図15のシステムはまたフィードバックシステムを含み、フィードフォーワードシステムとフィードバックシステムとの両方の特定の利点を組み合わせたハイブリッドANC/MSTシステムを生成する。特に、フィードバック経路は、自動車の内部におけるノイズ信号を首尾よく減少させ得、該ノイズ信号は、外部から乱反射的かつランダムに引き起こされ、かつ、既知のノイズ源QSにおいて決定された基準信号x(n)とは相関しない。
【0120】
図14の伝達係数W(z)を有するフィルタWは、図15のシステムにおいては、伝達関数WFF(z)を有する同等のフィルタW1に置き換えられており、該フィルタW1は、図14に示されたシステムと同等であるフィードフォーワードシステムの一部分である。さらに、図15のシステムは、フィードバック経路に対する伝達関数WFB(z)を有する第2フィルタW2と、最小自乗平均を使用したフィルタW2のフィルタ係数の適応制御のための第3ユニットLMS3とを含む。図15のシステムはさらに、伝達関数S^(n)を有する第4フィルタS^4と、伝達関数S^(n)を有する第5フィルタS^5とを含み、それらは、システム同定方法を使用して、第2経路Sの伝達関数S(z)から評価される。
【0121】
図14のシステムのように、ノイズ源QSから生成され、かつ、伝達関数P(z)を有する第1経路Pにおいてノイズx(n)からフィルタリングされた信号x(n)と、ラウドスピーカLSと第2経路Sとの伝達関数によってフィルタリングされた消去信号y_sum(n)とから、エラーマイクロフォンEにおけるエラー信号e(n)は構成されている。基準信号z(n)は、音楽源MSからの信号Music(n)と、フィルタFによって音響心理学的マスキングモデルを用いて評価された、ホワイトノイズ源NGからの信号FilteredWhiteNoise(n)との合計から導き出される。基準信号z(n)は、1−βで重みを付けられたフィルタW1の出力信号y(n)と、伝達関数WFB(z)を有するフィルタW2の出力信号yFB(n)とに加算され、信号y_sum(n)を生じさせる。
【0122】
信号z(n)はまた、高速フーリエ変換ユニットFFT2を経由して信号Z(ω)に変換され、伝達関数S(z)を有する適応フィルタS^3を介したフィルタリングと、ユニットIFFT1を介した次の逆高速フーリエ変換との後に、該信号z(n)はエラー信号e(n)から減算され、図13のシステムとの違いを比較すると、信号e’’(n)を生じさせる。時間領域における信号e’’(n)は、高速フーリエ変換ユニットFFT1によって、周波数領域における信号E’’(ω)に転換される。信号E’’(ω)は、音響心理学的マスキングモデルユニットPMMに対する入力信号として使用され、該音響心理学的マスキングモデルユニットPMMは、エラーマイクロフォンEの場所におけるノイズを介した現在のマスキングの考慮の下、信号GAIN(ω)を生成し、該信号GAIN(ω)は、フィルタFを介して基準信号z(n)を決定するために使用される。そうするために、信号GAIN(ω)は、逆高速フーリエ変換のためのユニットIFFT2によって時間信号Gain(n)に転換され、源NGから生成された信号WhiteNoise(n)が、フィルタFを使用して信号FilteredWhiteNoise(n)に転換されるように、強制ユニットCによって強制され、該フィルタFには新たなフィルタ係数の組Gain(n)がロードされている。
【0123】
FilteredWhiteNoise(n)信号は、(信号が現在のノイズ信号の可聴閾値を下回っているので不可聴である)第2経路Pのシステム同定のための不可聴基準信号に調和する。さらに、基準信号z(n)はまた、有用な信号Music(n)を含み得、該信号Music(n)は、本システムの関数にとって不可欠なものではない。信号e^(n)は、フィルタS^2の伝達関数S^(z)を用いてβ*y(n)から生成された信号e’’(n)から減算され、信号e’(n)を取得する。この信号e’(n)は、高速フーリエ変換ユニットFFT3によって信号E’(ω)に転換され、z(ω)と共に、最小自乗平均アルゴリズムを使用したフィルタS^1、フィルタS^2、フィルタS^3フィルタS^4およびフィルタS^5のフィルタ係数の適応制御のためのユニットLMS2において使用される。
【0124】
非音響センサNASは再び、ノイズ信号と相関する電気信号を生成し、該電気信号を用いて信号fn(n)が計算ユニットCALC1から取得される。信号ジェネレータSGは、ノイズ信号に対応するフィルタWに対する入力信号x(n)を生成する。計算ユニットCALC2は、適応帯域通過フィルタBPに対するフィルタ係数K(n)を決定する。伝達関数S^(z)を有するフィルタS^1を使用して、信号x(n)は信号x’(n)に転換され、次に、最小自乗平均アルゴリズムを使用してフィルタWのフィルタ係数の適応制御のためのユニットLMS1の制御のために、帯域通過フィルタBPを介してフィルタリングされた信号e’(n)と共に使用される。信号e’(n)は、フィルタS^5の伝達関数S(z)を用いてフィルタリングされたyFB(n)から導き出され、信号xFB(n)を取得する。信号xFB(n)は、適応フィルタW2に対する入力信号を表し、伝達関数S(z)を有するフィルタS^4を介した信号x’FB(n)への転換後に、信号e’(n)と共に、最小自乗平均アルゴリズムを使用して伝達関数wFB(z)を有するフィルタW2のフィルタ係数の適応制御のための回路LMS3にアクセスするためにも使用される。
【0125】
図13〜図15の音響心理学的マスキングモデルユニットPMMによって実行される音響心理学的マスク生成プロセスは、人間の聴覚のマスキング効果をシミュレートする音響心理学的モデルの実装を提供する。使用されるマスキングモデルは、例えば、ISO MPEG1規格に記述されるような所謂Johnston ModelまたはMPEGモデルに基づき得る。図16および図17に示される例示的な実装はMPEGモデルを使用する。本明細書において記述される音響心理学的マスクモデリング処理は、単一のプロセッサ、またはこのような処理を走らせることで公知のその他任意のユニットにおいて実装され得る。
【0126】
図16および図17に示されているような音響心理学的マスクモデリング処理は、ステップ204において、512のサンプル時間領域の入力音声データフレーム110にハン窓を掛けることから開始する。効果的にハン窓を掛けることは、滑らかな傾斜を提供するためにハン窓を使用して、前のサンプルと次のサンプルとの間に512のサンプルを中心に集める。これは、時間領域の音声データ110が1024点の高速フーリエ変換(FFT)を使用して周波数領域に転換されたときに、ステップ206においてまた生成される上昇縁のアーティファクトを減少させる。ステップ208において、それぞれの周波数サブバンドに対する512のエネルギー値のアレイは、次に、
【0127】
【数3】
に従って、1024FFTの出力値の対称的なアレイから生成され、ここに、X(n)=XR(n)+iXI(n)は、n番目のスペクトル線のFFT出力である。
【0128】
以下において、値またはエンティティが、対数関数を評価することの結果として生成される場合には、値またはエンティティは、対数として記述されるか、または対数の領域にあるとして記述される。対数の値またはエンティティが、逆動作によって累乗されるときには、対数の値またはエンティティは、線形として記述されるか、または線形の領域にあるとして記述される。
【0129】
図16に示されるプロセスにおいて、線形のエネルギー値E(n)は、次に、P(n)=10log10E(n)に従って、ステップ210において対数のパワースペクトル密度(PSD)の値P(n)に転換され、線形のエネルギー値E(n)はもう使用されない。PSD値は、ステップ212において96dBに正規化される。ステップ210およびステップ212は、図17のマスク生成プロセス300からは省略される。
【0130】
両方のプロセスにおける次のステップは、各サブバンドに対する音圧レベル(SPL)の値を生成することである。図16のプロセスにおいて、SPL値Lsb(n)が、ステップ214において、
【0131】
【数4】
に従って、各サブバンドに対して生成され、ここに、scfmax(n)は、1152のサンプルを備えているMPEG1 L2の音声フレームの中のサブバンドnの3つのスケールファクターの最大値であり、X(k)は、指数kのPSD値であり、kに関する合計は、サブバンドnの範囲内にkの値が限定される。「−10dB」の項がピークレベルとRMSレベルとの間の差を補正する。
【0132】
図17のマスクモデリングプロセス300において、Lsb(n)は、ステップ302において、
【0133】
【数5】
に従って計算され、ここに、X(k)は指数kの線形のエネルギーの値である。「96dB」の項は、Lsb(n)を正規化するために使用される。これは、累乗を避けることによって、図16のプロセス200に改良を加えるということが明らかである。さらに、SPL値を生成する効率が、2次のテーラー展開式によって対数を概算することによって、明らかに改善される。特に、Iptとして対数の独立変数を表すので、
Ipt=(I−x)2m、0.5<1−x≦1
となるように、Iptは、最初に、xを決定することによって正規化される。
【0134】
2次のテーラー展開式を使用して
【0135】
【数6】
であり、対数は、
【0136】
【数7】
として概算され得る。
【0137】
従って、対数は4つの乗算と2つの加算とによって概算され、演算効率における顕著な改善を提供する。
【0138】
次のステップは、マスキングに対する周波数構成要素を同定することである。マスキング構成要素のトーンがマスキングの閾値に影響するので、トーンおよび非トーン(ノイズ)のマスキング構成要素が別々に決定される。
【0139】
第1に、局所的な最大値が同定される。
X(k)>X(k−1)およびX(k)≧X(k+1)
である場合には、スペクトル線X(k)は局所的な最大値とみなされる。
【0140】
図16のプロセス200において、このように同定された局所的な最大値X(k)は、X(k)−X(k+j)≧7dB
である場合には、ステップ216において、対数のトーンマスキング構成要素として選択され、ここに、jはkによって変化する検索領域である。X(k)がトーン構成要素であると分かった場合には、その値は、
Xtonal(k)=10log10(10X(k−1)/10+10X(k)/10+10X(k+1)/10)
によって置き換えられる。
【0141】
調査された周波数領域の範囲内の全スペクトル線は、次に、−∞dBに設定される。
【0142】
図17のマスクモデリングプロセス300において、局所的な最大値X(k)は、
X(k)・10−0.7≧X(k+j)
である場合には、ステップ304において、線形のトーンマスキング構成要素として選択される。
【0143】
X(k)がトーン構成要素であると分かった場合には、その値は、
Xtonal(k)=X(k−1)+X(k)+(k+1)
によって置き換えられる。
【0144】
調査された周波数領域の範囲内の全スペクトル線は、次に、0に設定される。
【0145】
いずれかのプロセスにおける次のステップは、臨界サブバンドの帯域幅の範囲内の非トーンマスキング構成要素の強度を同定および決定することである。所与の周波数に対して、人間の耳の基底板の同じ部分を活動させるその周波数周辺の周波数の最小帯域が、臨界帯域と呼ばれる。臨界帯域幅は、同時に起こるトーンに対する耳の分解力を表す。サブバンドの帯域幅は、特定の臨界帯域の中心周波数によって変化する。MPEG−1規格において記述されたように、26の臨界帯域が48kHzのサンプリング速度に対して使用される。非トーン(ノイズ)構成要素は、トーン構成要素が上記のように取り除かれた後に残っているスペクトル線から同定される。
【0146】
図16のプロセス200のステップ218において、各臨界帯域の範囲内の残りのスペクトル線の対数パワーが、線形のエネルギー値に転換されて合計され、それから対数パワー値に再転換され、臨界帯域に対応する新たな非トーン構成要素Xnoise(k)のSPLを提供する。数字kは、臨界帯域の幾何学的平均に最も近いスペクトル線の指数である。
【0147】
図17のマスクモデリングプロセス300において、各臨界帯域の範囲内の残りのスペクトル線のエネルギーは、ステップ306において加算され、サブバンドnにおけるkに対して、臨界帯域に対応する新たな非トーン構成要素Xnoise(k)
【0148】
【数8】
を提供する。加算演算のみが使用され、指数または対数の評価は必要とされず、効率において明らかな改良を提供する。
【0149】
次のステップは、トーンおよび非トーンのマスキング構成要素を10分の1にすることである。10分の1化は、包括的なマスキングの閾値を生成するために使用されるマスキング構成要素の数を削減するために使用される手順である。
【0150】
図16のプロセス200において、対数構成要素Xtonal(k)と非トーン構成要素Xnoise(k)とは、ステップ220において、それぞれ
Xtonal(k)-≧LTq(k)またはXnoise(k)≧LTq(k)
である場合にのみ、マスキング閾値を生成することに関する次の使用のために選択され、ここに、LTq(k)は、指数kの周波数における閾値の絶対値(またはクワイエットにおける閾値)であり、対数領域におけるクワイエットにおける閾値の値は、MPEG−1規格で提供される。
【0151】
10分の1化は、0.5バークを下回る距離の範囲内にある2つ以上のトーン構成要素において実行され、バークスケールは、上記のように、耳の周波数分解がほぼ一定である周波数スケールである(E.Zwicker、Subdivision of the Audible Frequency Range into Critical Bands、J.Acoustical Society of America、vol.33、p.248、1961年2月をまた参照)。最高パワーを有するトーン構成要素が維持され、より小さい構成要素が選択されたトーン構成要素のリストから取り除かれる。この動作に対して、臨界帯域領域におけるスライディングウインドウが0.5バークの幅で使用される。
【0152】
図17のマスクモデリングプロセス300において、線形の構成要素が、ステップ308において、
Xtonal(k)-≧LTqE(k)またはXnoise(k)≧LTqE(k)
である場合にのみ選択され、ここに、LTqE(k)は、
【0153】
【数9】
に従って、対数領域の閾値の絶対値の表LTq(k)から事前生成される線形領域の閾値の絶対値の表から取られ、ここに、「−96」の項は非正規化を表す。
【0154】
非正規化の後に、線形のエネルギー領域におけるスペクトルデータは、ステップ310において対数パワー領域に転換される。従来技術の処理のステップ206とは対照的に、対数の評価は、上記の効率的な2次概算方法を使用して実行される。この転換は、ステップ212における96dBの基準レベルに対する正規化が後に続く。
【0155】
マスキング構成要素を選択して10分の1化すると、次のステップは、個々のマスキング閾値を生成することである。kとインデックスを付された最初の512のスペクトルデータ値の中で、iとインデックスを付されたサブセットだけが次に使用され、包括的なマスキング閾値を生成し、本ステップは、ISO MPEG1に記述されているようなサブサンプリングによってそのサブセットを決定する。
【0156】
サブサンプリングされた周波数領域における線nの数は、サンプリング速度に依存する。48kHzのサンプリング速度に対しては、n=126となる。あらゆるトーンおよび非トーンの構成要素が、最初(すなわち、サブサンプリングする前)のスペクトルデータにおける対応するスペクトル線の周波数の最も近くに対応する指数iを割り当てられる。
【0157】
トーンおよび非トーンの両方の構成要素の個々のマスキング閾値、LTtonalおよびLTnoiseは、次に、以下の式を与えられる:
LTtonal[z(j),z(i)]=Xtonal[z(j)]+avtonal[z(j)]+vf[z(j),z(i)]dB
LTnoise[z(j),z(i)]=Xnoise[z(j)]+avnoise[z(j)]=vf[z(j),z(i)]dB
ここに、iは、スペクトル線に対応する指数であり、該指数において、マスキング閾値が生成され、jは、マスキング構成要素の指数である;z(i)は、i番目のスペクトル線のバークスケールの値であり、z(j)は、j番目の線のバークスケールの値である;形式X[z(j)]の項は、(トーンおよび非トーンの)マスキング構成要素のSPLである。マスキング指数と呼ばれる項avは、
avtonal=[−1.525−0.275・z(j)−4.5]dB
avnoise=[−1.525−0.275・z(j)−0.5]dB
によって与えられ、vfは、マスキング構成要素のマスキング関数であり、バークスケールにおける距離dz、dz=z(i)−z(i)に従って、異なる上側および下側の傾きを備えている。
【0158】
図16のプロセス200において、個々のマスキング閾値は、ステップ222において、
−3バーク≦dz<−1バークに対して、vf=17・(dz+1)−0.4・X[z(j)]−6dB
−1バーク≦dz<0バークに対して、vf={0.4・X[z(j)]+6}・dz dB
0バーク≦dz<1バークに対して、vf=−17・dz dB
1バーク≦dz<8バークに対して、vf=−17・dz+0.15・X[z(j)]v(dz−1)dB
によって与えられるマスキング関数vfを使用して計算され、ここに、X[z(j)]は、指数jを有するマスキング構成要素のSPLである。dz<−3バークまたはdz>8バークである場合には、マスキング閾値は生成されない。
【0159】
マスキング関数vfの評価は、このステップの最も演算に集中した部分である。マスキング関数は2つのタイプに分類され得る:下方マスキング(dz<0のとき)と上方マスキング(dz≧0のとき)であり、下方マスキングは上方マスキングよりもかなり重要ではない。結果として、上方マスキングのみが、図17のマスク生成プロセス300において使用される。1バーク≦dz<8バークに対するマスキング関数における第2項が、一般的に、第1項、−17・dzのほぼ10分の1であるということを、さらなる分析が示す。結果として、第2項は捨てられ得る。
【0160】
従って、図17のマスク生成プロセス300は、ステップ312において、以下のようなマスキング関数vfに対する単一の式を使用して、個々のマスキング閾値を生成する:vf=−17・dz、0≦dz<8
マスキング指数avは、図16のプロセス200において使用されたマスキング指数avから修正されない。なぜならば、それは個々のマスキング閾値LTに非常に寄与し、かつ、演算に労力を要しないからである。個々のマスキング閾値が生成された後に、包括的なマスキング閾値が生成される。
【0161】
図16のプロセス200において、i番目の周波数サンプルにおける包括的なマスキング閾値LTg(i)は、ステップ224において、
【0162】
【数10】
に従って、個々のマスキング閾値とクワイエットにおける閾値とに対応するパワーを合計することによって生成され、ここに、mは、トーンマスキング構成要素の全数であり、nは、非トーンマスキング構成要素の全数である。クワイエットにおける閾値LTqは、チャンネル毎に96kbps以上のビットレートに対して、−12dBだけ相殺される。このステップは、評価される指数および対数の数によって演算に労力を要しなくなるということが明らかである。
【0163】
図17のマスク生成プロセス300において、これらの評価は避けられ、より小さい項は使用されない。i番目の周波数サンプルにおける包括的なマスキング閾値LTg(i)は、ステップ314において、以下のように、個々のマスキング閾値とクワイエットにおける閾値とに対応するパワーを比較することによって生成される:
【0164】
【数11】
最大のトーンマスキング構成要素LTtonalと最大の非トーンマスキング構成要素LTnoiseとが同定される。次に、それらはLTqx(i)と比較される。これら3つの値の最大値が、i番目の周波数サンプルにおける包括的なマスキング閾値として選択される。これは割り当てに対する機会における演算の労力を減少させる。上記のように、クワイエットにおける閾値LTqは、チャンネル毎に96kbps以上のビットレートに対して、−12dBだけ相殺される。
【0165】
最後に、信号対マスク比の値が、両方のプロセスのステップ226において計算される。最初に、サブバンドnにおける最小マスキングレベルLTmin(n)は、以下の式によって決定される:
LTmin(n)=Min[LTg(i)]dB;サブバンドnにおいてfまたはf(i)
ここに、f(i)は、サブバンドnの範囲内のi番目の周波数線である。最小マスキング閾値LTmin(n)は、あらゆるサブバンドに対して決定される。あらゆるサブバンドnに対する信号対マスク比は、次に、対応するSPL値からそのサブバンドの最小マスキング閾値を減算することによって生成される:
SMsb=Lsb(n)−LTmin(n)
マスクモデルは、各サブバンドnに対する信号対マスク比のデータSMRsb(n)を量子化器に送信し、該量子化器はそれを使用して、MPEG−1規格に記述されているような、利用可能なデータのビットを最も効果的に割り当て、スペクトルデータを量子化する方法を決定する。
【0166】
上記の例における有用な効果は、自動車の乗客エリアにおける現在得られるノイズレベルとそのスペクトル属性との考慮から導き出され、該考慮のために、第2経路の伝達関数の決定のためのテスト信号が、乗客に聞こえないように選択される。存在するノイズレベルは、望ましくない邪魔な信号、例えば、風の外乱、車輪の回転音、および音響学的にモデリングされたエンジンノイズのような望まれないノイズ、ならびに一部の場合において、同時中継される音楽信号を含む。使用は、関連する音響心理学的必要条件が満足された場合に、不可聴情報が任意の所与の音声信号に加えられ得る効果で構成される。ここで提示された事例は、特に、マスキングの音響心理学的効果に及ぶ。
【0167】
さらなる利点が、音響心理学的マスキング方法が現在のノイズレベルに適応するように応答し、かつ、同時の(音楽のような)音声信号が、所望のマスキング効果を獲得するためには必ずしも必要ない局面から導き出され得る。
【0168】
本発明を実現する様々な例が開示されてきたが、本発明の精神と範囲を逸脱することなく、本発明の利点の一部を達成する様々な変更および改変が行われ得るということが当業者には明らかである。同じ関数を実行する他の構成要素が適切に置換され得るということが当業者には明らかである。本発明の概念に対するこのような改変は、添付の特許請求の範囲によって包含されることが意図されている。
【技術分野】
【0001】
本発明は、特に自動車およびヘッドフォンの用途のための、アクティブモータ音チューニング(MST)を含むアクティブノイズ制御(ANC)に関する。
【背景技術】
【0002】
ノイズは、概して、レシーバの情報内容に寄与せず、むしろ有用な信号の音質に干渉するように知覚される音を指すために使用される用語である。ノイズの発達の過程は、一般的に3つの範囲に分割され得る。これらは、ノイズの生成、ノイズの伝搬(放出)およびノイズの知覚である。ノイズを成功裏に減少させる試みは、例えば、ノイズ信号の伝搬の減衰および続く抑制によって、まず、ノイズ源自体に狙いが定められているということが理解され得る。しかしながら、ノイズ信号の放出は、多くの場合において、所望のレベルにまでは減少され得ない。そのような場合において、補償信号を重ねることによって望ましくない音を取り除く構想が適用される。
【0003】
発せられたノイズを消去または減少させる公知の方法およびシステム(ANCシステムおよび方法)、または、例えば、MSTシステムおよび方法を介した、望ましくない干渉信号を消去または減少させる公知の方法およびシステムは、消去信号波を生成して望ましくない信号に重ねることによって望ましくないノイズを抑制するものであり、該消去信号波の振幅および周波数の値は、ノイズ信号の振幅および周波数の値とほぼ同じであるが、位相は望ましくない信号に対して180度移動されている。理想的な状況においては、この方法は、望ましくないノイズを完全に消滅させる。ノイズ信号の騒音レベルに関するこの狙いを定められた減少の効果は、多くの場合に、破壊的干渉と呼ばれる。
【0004】
用語「ノイズ」は、この場合、外部の音響的な音波−例えば、周辺のノイズまたは自動車の乗客エリアにおいて知覚される動作音など−と、例えば、自動車の乗客エリアまたは運転による機械的な振動によって起こされた音響的な音波との両方を呼ぶ。音が望ましくない場合には、それらはまたノイズと呼ばれる。音楽または話が、自動車の乗客空間のような、音声信号にさらされたエリアにおける電子音響システムを介して中継されるときはいつでも、信号の音声知覚は、概して、背景ノイズによって弱められる。背景ノイズは、風、エンジン、タイヤ、ファンおよび自動車における他のユニットの影響によってもたらされ得、従って、速度、路面状況および自動車の動作状態によって変化する。
【0005】
所謂後部座席エンターテイメントが、現代の自動において段々と人気になっている。これは、高品質の音声信号の再生を提供する結果として、より多くの考慮、言い換えると、経験されるノイズ信号におけるさらなる減少を必要とするシステムによって供給される。通常、ヘッドフォン媒体を介した、個人に向けた音声信号の集中のオプションが同様に必要とされる。従って、公知のシステムおよび方法は、自動車の乗客エリアにおける音の領域に対する用途と、ヘッドフォンを介した伝播との両方に及ぶ。
【0006】
特に、例えば、エンジンまたは排気システムから発せられる構成要素のような望ましくないノイズによる、自動車に存在する音響効果が考慮されなければならない。エンジンによって生成されるノイズ信号は、概して、エンジンの回転速度に直接的に関連する振幅および周波数の値を有する多数の正弦波の構成要素を含む。これらの周波数の構成要素は、(毎秒の回転による)基本周波数の偶数および奇数の調和周波数の両方、ならびに半オーダの乗算または分周波を含む。
【0007】
低いが一定のノイズレベルは、常に積極的に評価されるわけではないことを、綿密な調査が示した。その代わりに、許容可能なエンジンノイズは、厳格な要求を満たさなければならない。調和音声シーケンスが特に好まれる。今日の非常に高度な機械的エンジン設計でさえ、不快な音が常に排除され得るわけではないので、積極的な方法で、エンジンノイズをアクティブに制御する方法が利用される。この種の方法は、モーター音チューニング(MST)と呼ばれる。これらのシステムにおいて音の性質をモデリングするために、例えば、音響学的消去信号のための、エンジンの吸気ダクトに配置されているラウドスピーカなどによって、源におけるノイズの消去のために望ましくない音声構成要素を使用する手順が利用される。
【0008】
ノイズの減少または音のモデリングのためのアクディブノイズ制御の方法およびシステムは、最新のデジタル信号処理および適応フィルタ手順が利用されるので、最近ますます人気となっている。一般的な用途において、入力センサ−例えば、マイクロフォン−は、源によって生成された望ましくないノイズを表す信号を導き出すために使用される。この信号は、次に、適応フィルタの入力に供給され、フィルタの特性によって出力信号に作り変えられ、該出力信号は、例えば、音響ラウドスピーカまたは電気機械的振動ジェネレータのような消去アクチュエータを制御するために使用される。ラウドスピーカ、または振動ジェネレータは、源から導き出された望ましくないノイズ信号または振動に重ね合わされる消去波または振動を生成する。望ましくないノイズへのノイズ制御音波の重ね合わせからもたらされる観察された残りのノイズレベルは、エラーセンサによって測定され、該エラーセンサは、対応するエラーフィードバック信号を生成する。このフィードバック信号は、観察されたノイズまたは残りのノイズの信号の全レベルを適応するように最小化するために、適応フィルタのパラメータおよび特性の修正のために使用される基準となる。フィードバック信号は、この応答性の信号に対するデジタル信号処理において使用される用語である。
【0009】
デジタル信号処理において通常使用される公知のアルゴリズムは、エラーフィードバック信号の最小化のためのよく知られた最小自乗平均(LMS)アルゴリズムの拡張:所謂フィルタリングされたxLMSアルゴリズム(FxLMS、非特許文献1を参照)である。このアルゴリズムを実装するために、音響伝達関数のモデルが、アクティブノイズ制御アクチュエータ−本明細書において提示された例においては、ラウドスピーカ−と、エラーセンサ、この場合にはマイクロフォンとの間で必要とされる。アクティブノイズ制御アクチュエータとエラーセンサとの間の伝達経路はまた、第2またはエラー経路として公知であり、伝達関数を決定するための対応する手順は、システム同定として公知である。さらに、追加的な広帯域補助信号−例えば、ホワイトノイズが、FxLMSアルゴリズムに対する第2経路の関連する伝達関数を決定する最新の方法を使用して、アクティブノイズ制御アクチュエータからエラーセンサに伝達される。第2経路の伝達関数のフィルタ係数は、ANCシステムを開始して一定に維持するときか、または時間で変化する伝達状況に、フィルタ係数が適応するように調節されるときかのいずれかのときに定義される。
【先行技術文献】
【非特許文献】
【0010】
【非特許文献1】WINDOW、B.、STEARNS、S.D.(1985):「Adaptive Signal Processing」 Prentice−Hall Inc.、Englewood Cliffs、NJ、USA.ISBN 0−13−004029−0
【発明の概要】
【発明が解決しようとする課題】
【0011】
このアプローチの不利な点は、特定された広帯域補助信号が、一般的な周囲の状況に従って、自動車の中の乗客に聞き取ることができ得るということである。信号は邪魔であると知覚され得る。特に、この種の追加的な補助信号は、高価な自動車における後部座席エンターテイメントに対する内部の音響効果および音声信号の伝播の質に置かれる高い要求(=可能な限り少ないノイズ)を満足しない。
【課題を解決するための手段】
【0012】
FxLMSアルゴリズムに必要とされる第2経路の伝達関数を決定するために使用される、自動車内の人間の乗客に聞き取られない(従って、邪魔にならない)テスト信号を可能にする方法およびシステムを提供することが、一般的なニーズである。
【0013】
例えば、本発明は、以下を提供する。
【0014】
(項目1)
ノイズ源によって放出された、聴取場所における望ましくないノイズ信号のアクディブ制御のためのシステムであって、該望ましくないノイズは、第1経路伝達関数を有する第1経路を経由して該聴取場所に伝播され、該システムは、
該望ましくないノイズ信号を減少または消去する消去信号を放出するラウドスピーカであって、該消去信号は、第2経路を経由して該ラウドスピーカから該聴取場所に伝播される、ラウドスピーカと、
エラー信号を介して達成される減少のレベルを決定する、該聴取場所におけるエラーマイクロフォン(E)と、
該望ましくないノイズ信号を表す信号と該エラーマイクロフォンからの該エラー信号とを使用して、該第1経路伝達関数に適応された伝達関数を有する該望ましくないノイズ信号を表す該信号をフィルタリングすることによって、該消去信号を生成する第1適応フィルタと、
該第1適応フィルタからの該消去信号と共に、該ラウドスピーカに供給される基準信号を生成する基準ジェネレータであって、該聴取場所において存在する該望ましくないノイズ信号および/または望まれた信号によって、該聴取場所における人間の聴取者に対してマスキングされるような振幅および/または周波数を、該基準信号が有する、基準ジェネレータと
を備えているシステム。
【0015】
(項目2)
上記基準信号の振幅および/または周波数は、音響心理学的マスキングモデルユニットによって決定され、該音響心理学的マスキングモデルユニットは、上記エラーマイクロフォンからの上記エラー信号に関する人間の聴覚におけるマスキングをモデリングする、項目1に記載のシステム。
【0016】
(項目3)
上記音響心理学的マスキングモデルユニットは、時間的マスキングをモデリングする、項目2に記載のシステム。
【0017】
(項目4)
上記音響心理学的マスキングモデルユニットは、スペクトルマスキングをモデリングする、項目2または項目3に記載のシステム。
【0018】
(項目5)
上記音響心理学的マスキングモデルユニットは、周波数領域において動作される、項目2、項目3または項目4に記載のシステム。
【0019】
(項目6)
上記第1適応フィルタは、最小自乗平均(LMS)アルゴリズムに従って適応する、項目1〜項目5に記載のシステム。
【0020】
(項目7)
上記第1フィルタは、フィルタリングされたX最小自乗平均(フィルタリングされたx−LMS)アルゴリズムに従って適応する、項目7または項目8に記載のシステム。
【0021】
(項目8)
上記第2経路の上記伝達関数をモデリングする伝達関数を有する第2適応フィルタをさらに備えており、該第2適応フィルタは、上記第1適応フィルタの適応のために使用される上記望ましくないノイズ信号を表す上記信号をフィルタリングするために、該第1適応フィルタに接続されている、項目7に記載のシステム。
【0022】
(項目9)
上記第2適応フィルタは、上記最小自乗平均(LMS)アルゴリズムに従って適応する、項目8に記載のシステム。
【0023】
(項目10)
上記第1適応フィルタに供給される上記望ましくないノイズ信号を表す上記信号は、上記エラー信号と該第1適応フィルタによって出力される上記信号とから導き出され、上記第2経路の上記伝達関数をモデリングする伝達関数を有する第3適応フィルタによってフィルタリングされる、項目1〜項目9のうちの1項に記載のシステム。
【0024】
(項目11)
上記第1適応フィルタに供給される上記望ましくないノイズ信号を表す上記信号は、上記第2経路の上記伝達関数をモデリングする伝達関数を有する第4適応フィルタによってフィルタリングされた上記基準信号からさらに導き出される、項目10に記載のシステム。
【0025】
(項目12)
上記第4フィルタは周波数領域において動作され、該第4フィルタは、上流に接続された時間周波数変換器と下流に接続された周波数時間変換器とを有する、項目11に記載のシステム。
【0026】
(項目13)
上記第1適応フィルタに供給される上記望ましくないノイズ信号を表す上記信号は、非音響センサから導き出され、該非音響センサはセンサ信号を提供し、該望ましくないノイズ源の近くに配置されている、項目1〜項目12のうちの1項に記載のシステム。
【0027】
(項目14)
上記センサ信号からの基本信号を計算するために、上記非音響センサの下流に接続された基本計算ユニットと、該基本信号からの上記望ましくないノイズ信号を表す上記信号を生成するために、該基本計算ユニットの下流に接続された信号ジェネレータとをさらに備えている、項目13に記載のシステム。
【0028】
(項目15)
上記第1適応フィルタに供給される上記エラー信号をフィルタリングする、フィルタ係数を有する帯域通過フィルタをさらに備え、該フィルタ係数は、上記基本計算ユニットの下流に接続された係数計算ユニットによって制御される、項目14に記載のシステム。
【0029】
(項目16)
上記基準信号は、望まれた信号源によって提供される望まれた信号を含む、項目1〜項目15のうちの1項に記載のシステム。
【0030】
(項目17)
上記第1適応フィルタによって出力された上記信号は、重み付けファクターを乗算された2つの部分信号に分割され、該部分信号のうちの1つは、上記ラウドスピーカに供給され、もう1つは、上記第2経路をモデリングする第5適応フィルタに供給され、該第5適応フィルタの出力信号は、上記エラー信号に加算される、項目1〜項目16のうちの1項に記載のシステム。
【0031】
(項目18)
上記重みの合計は1である、項目17に記載のシステム。
【0032】
(項目19)
上記第1経路をモデリングする第6適応フィルタをさらに備え、該第6適応フィルタは、上記ラウドスピーカに供給される出力信号を提供し、該出力信号と上記基準信号との合計を供給される、項目1〜項目18のうちの1項に記載のシステム。
【0033】
(項目20)
ノイズ源によって放出された、聴取場所における望ましくないノイズ信号のアクディブ制御のための方法であって、該望ましくないノイズは、第1経路の伝達関数を有する第1経路を経由して聴取場所に伝播される、該方法は、
該望ましくないノイズ信号を減少または消去する消去信号を放出するステップであって、該消去信号は、第2経路を経由して該ラウドスピーカから該聴取場所に伝播される、ステップと、
該聴取場所において達成される減少のレベルをエラー信号を介して決定するステップと、
該望ましくないノイズ信号を表す信号と該エラー信号とを使用して、該第1経路の伝達関数に適応された伝達関数を有する該望ましくないノイズ信号を表す該信号をフィルタリングすることによって、該消去信号を生成する第1の適応フィルタリングをするステップと、
該第1の適応フィルタリングをするステップからの該消去信号と共に、該ラウドスピーカに供給される基準信号を生成するステップであって、該基準信号が、該聴取場所において存在する該望ましくないノイズ信号および/または望ましい信号によって、該聴取場所における人間の聴取者に対してマスキングされるような振幅および/または周波数を、該基準信号が有する、ステップと
を包含する、方法。
【0034】
(項目21)
上記基準信号の振幅および/または周波数は、音響心理学的マスキングモデリングするステップによって決定され、該音響心理学的マスキングモデリングをするステップは、上記エラー信号に関する人間の聴覚におけるマスキングをモデリングする、項目20に記載の方法。
【0035】
(項目22)
上記音響心理学的マスキングモデリングをするステップは、時間的マスキングをモデリングする、項目21に記載の方法。
【0036】
(項目23)
上記音響心理学的マスキングモデリングをするステップは、スペクトルマスキングをモデリングする、項目20または項目21に記載の方法。
【0037】
(項目24)
上記音響心理学的マスキングモデリングをするステップは、周波数領域において実行される、項目21、項目22または項目23に記載の方法。
【0038】
(項目25)
上記第1の適応フィルタリングをするステップは、最小自乗平均(LMS)アルゴリズムに従って適応する、項目20〜項目24に記載の方法。
【0039】
(項目26)
上記第1ステップは、フィルタリングされたX最小自乗平均(フィルタリングされたx−LMS)アルゴリズムに従って適応する、項目25に記載の方法。
【0040】
(項目27)
上記第2経路の上記伝達関数をモデリングする伝達関数を使用する第2の適応フィルタリングするステップをさらに包含し、該第2適応フィルタは、上記第1適応フィルタの適応のために使用される上記望ましくないノイズ信号を表す上記信号をフィルタリングするために、該第1適応フィルタに接続されている、項目26に記載のシステム。
【0041】
(項目28)
上記第2適応フィルタは、上記最小自乗平均(LMS)アルゴリズムに従って適応する、項目27に記載の方法。
【0042】
(項目29)
上記第1の適応フィルタリングをするステップにおいて使用される上記望ましくないノイズ信号を表す上記信号は、上記エラー信号と該第1の適応フィルタリングをするステップによって出力される上記信号とから導き出され、上記第2経路の上記伝達関数をモデリングする伝達関数を有する第3の適応フィルタリングをするステップにおいてフィルタリングされる、項目20〜項目28のうちの1項に記載の方法。
【0043】
(項目30)
上記第1の適応フィルタリングをするステップにおいて使用される上記望ましくないノイズ信号を表す上記信号は、上記第2経路の上記伝達関数をモデリングする伝達関数を有する第4の適応フィルタリングをするステップにおいてフィルタリングされる上記基準信号からさらに導き出される、項目29に記載の方法。
【0044】
(項目31)
上記第4のフィルタリングをするステップは周波数領域において実行され、該第4のフィルタリングをするステップは、該第4のフィルタリングをするステップに先立つ時間周波数変換ステップと該第4のフィルタリングをするステップに続く周波数時間変換ステップとを含む、項目30に記載の方法。
【0045】
(項目32)
上記第1の適応フィルタリングをするステップにおいて使用される上記望ましくないノイズ信号を表す上記信号は、非音響センサから導き出され、該非音響センサはセンサ信号を提供し、該望ましくないノイズ源の近くに配置されている、項目20〜項目31のうちの1項に記載の方法。
【0046】
(項目33)
上記センサ信号からの基本信号を計算する基本計算ステップと、該基本信号からの上記望ましくないノイズ信号を表す上記信号を生成する信号生成ステップとをさらに備えている、項目32に記載の方法。
【0047】
(項目34)
上記第1の適応フィルタリングをするステップにおいて使用される上記エラー信号をフィルタリングするフィルタ係数を使用する帯域通過フィルタリングをするステップをさらに備え、該フィルタ係数は、上記基本信号を使用する係数計算ステップによって制御される、項目33に記載の方法。
【0048】
(項目35)
上記基準信号は、望ましい信号源によって提供される望ましい信号を含む、項目20〜項目34のうちの1項に記載の方法。
【0049】
(項目36)
上記第1の適応フィルタリングをするステップによって出力された上記信号は、重み付けファクターを用いて乗算された2つの部分信号に分割され、該部分信号のうちの1つは、上記ラウドスピーカに供給され、もう1つは、上記第2経路をモデリングする第5の適応フィルタリングをするステップによって使用され、該第5の適応フィルタリングをするステップの出力信号は、上記エラー信号に加算される、項目20〜項目35のうちの1項に記載の方法。
【0050】
(項目37)
上記重みの合計は1である、項目36に記載のシステム。
【0051】
(項目38)
上記第1経路をモデリングする第6の適応フィルタリングをするステップをさらに備え、該第6の適応フィルタリングをするステップは、上記ラウドスピーカに供給される出力信号を提供し、該出力信号と上記基準信号との合計を入力される、項目20〜項目37のうちの1項に記載のシステム。
【0052】
ユーザが追加的な人工的なノイズ源によって邪魔されたと感じないように、リアルタイムで時間変化する第2経路に適応するために、聴取場所において存在する望ましくないノイズ信号および/または望ましい信号によって、基準信号が、聴取場所における人間の聴取者にとってマスキングされるような振幅および/または周波数を有する基準信号を使用するノイズ源によって放出される、聴取場所における望ましくないノイズ信号のアクティブ制御が開示される。
【0053】
(摘要)
ノイズ源によって放出された、聴取場所における望ましくないノイズ信号のアクディブ制御のためのシステムであって、該望ましくないノイズは、第1経路伝達関数を有する第1経路を経由して該聴取場所に伝播され、該システムは、該望ましくないノイズ信号を減少または消去する消去信号を放出するラウドスピーカであって、該消去信号は、第2経路を経由して該ラウドスピーカから該聴取場所に伝播される、ラウドスピーカと、エラー信号を介して達成される減少のレベルを決定する、該聴取場所におけるエラーマイクロフォン(E)と、該望ましくないノイズ信号を表す信号と該エラーマイクロフォンからの該エラー信号とを使用して、該第1経路および第2経路の伝達関数の商(W(z)=P(z)/S(z))に適応された伝達関数を有する該望ましくないノイズ信号を表す該信号をフィルタリングすることによって、該消去信号を生成する第1適応フィルタと、該第1適応フィルタからの該消去信号と共に、該ラウドスピーカに供給される基準信号を生成する基準ジェネレータであって、該聴取場所において存在する該望ましくないノイズ信号および/または望まれた信号によって、該聴取場所における人間の聴取者のために、基準信号がマスキングされるような振幅および/または周波数を、該基準信号が有する、基準ジェネレータとを備えているシステムが提供される。
【0054】
ノイズ源によって放出された、聴取場所における望ましくないノイズ信号のアクディブ制御のための方法であって、該望ましくないノイズは、第1経路伝達関数を有する第1経路を経由して聴取場所に伝播される、方法は、該望ましくないノイズ信号を減少または消去する消去信号を放出するステップであって、該消去信号は、第2経路を経由して該ラウドスピーカから該聴取場所に伝播される、ステップと、該聴取場所において達成される減少のレベルをエラー信号を介して決定するステップと、該望ましくないノイズ信号を表す信号と該エラー信号とを使用して、該第1経路および第2経路の伝達関数の商(W(z)=P(z)/S(z))に適応された伝達関数を有する該望ましくないノイズ信号を表す該信号をフィルタリングすることによって、該消去信号を生成する第1の適応フィルタリングをするステップと、該第1の適応フィルタリングをするステップからの該消去信号と共に、該ラウドスピーカに供給される基準信号を生成するステップであって、該基準信号が、該聴取場所において存在する該望ましくないノイズ信号および/または望ましい信号によって、該聴取場所における人間の聴取者に対してマスキングされるような振幅および/または周波数を、該基準信号が有する、ステップとを包含する。
【図面の簡単な説明】
【0055】
【図1】図1は、本発明に従ったシステムの構成図である。
【図2】図2は、正弦曲線状のトーンのレベルと広帯域のノイズ信号のレベルとの関数として音量を例示している図である。
【図3】図3は、ホワイトノイズによるトーンのマスキングを例示している図である。
【図4】図4は、周波数領域におけるマスキング効果を例示している図である。
【図5】図5は、250Hz、1kHzおよび4kHzの中心周波数における臨界周波数の狭い帯域のノイズに対するマスキングされた閾値を例示している図である。
【図6】図6は、正弦曲線状のトーンによるマスキング効果を例示している図である。
【図7】図7は、同時に起こるプレマスキングとポストマスキングを例示している図である。
【図8】図8は、トーンの知覚とテストトーンパルスの持続期間との関係を例示している図である。
【図9】図9は、マスキングされた閾値とテストトーンパルスの反復率との関係を例示している図である。
【図10】図10は、ポストマスキング効果を概略的に例示している図である。
【図11】図11は、マスカーの持続期間に関連するポストマスキング効果を例示している図である。
【図12】図12は、複合的なトーンによる同時マスキングを例示している図である。
【図13】図13は、音響心理学的なシステム同定のための例示的なシステムを示している構成図である。
【図14】図14は、音響心理学的なシステム同定のための別の例示的なシステムを示している構成図である。
【図15】図15は、音響心理学的なシステム同定のためのさらに別の例示的なシステムを示している構成図である。
【図16】図16は、線形関数を評価するマスキングモデルを実装するプロセスの流れ図である。
【図17】図17は、対数関数を評価するマスキングモデルを実装するプロセスの流れ図である。
【発明を実施するための形態】
【0056】
本発明は、以下の図面と記述とを参照してさらに理解され得る。図面における構成要素は、必ずしも寸法を合わせておらず、その代わりに、本発明の原理を例示することに重点が置かれている。さらに、図面においては、同じ参照番号は対応する部分を指す。
【0057】
(詳細な記述)
減少されるべき望ましくないノイズに相関する信号が、アクティブノイズ制御アクチュエータ(この場合、ラウドスピーカ)を駆動するために使用される場合には、フィードフォーワード制御システムが通常適用される。逆に、システムの応答が測定され、ループバックされる場合には、フィードバック処理が通常適用される。フィードフォーワードシステムは、一般的には、特に、ノイズの広帯域減少の能力によって、フィードバックシステムよりもノイズを抑制または減少することにおいて際立った有効性を呈する。なぜならば、フィードフォーワードシステムは、ノイズがノイズ信号の発達を評価することによってノイズを発することに対する反作用を開始することによってノイズが防止されることを可能にする。フィードバックシステムは、作用し始める前に、まず、ノイズの影響が明らかになることを待つ。センサがノイズの影響を決定するまで、アクティブノイズ制御は生じない。フィードバックシステムの利点は、ANCシステムの制御のために使用され得るノイズに相関する信号がない場合であっても、フィードバックシステムはまた、効果的に動作し得るということである。例えば、これはヘッドフォンのためのANCシステムの使用に適用され、ヘッドフォンのためのANCシステムの使用においては、ノイズの性質が前もっては知られていない空間においてヘッドフォンが身に付けられる。フィードフォーワードシステムとフィードバックシステムとの組み合わせがまた、ノイズの最大レベルの減少を達成するために可能である実際の用途において使用される。この種のシステムは、以下ではハイブリッドシステムと呼ばれる。
【0058】
減少されるノイズが、一般的に、周囲の状況の変化によって、音レベルおよびスペクトル構成に関して時間変化を被りやすいので、アクティブノイズ制御に対するフィードフォーワードシステムの実際の用途は、一般的に、事実上適応性がある。自動車に関してここで考えられる例において、周囲の状況におけるこのような変化は、異なる運転速度(風のノイズ、回転するタイヤのノイズ)、エンジンの様々な負荷状態、開いた窓などによるものであり得る。
【0059】
未知のシステムの所望のインパルス応答または伝達関数が、再帰的方法における適応フィルタを使用して適切に概算され得るということは公知である。適応フィルタは、デジタル信号プロセッサにおけるアルゴリズムによって実装されるデジタルフィルタを意味するように用いられており、該デジタル信号プロセッサは、適用可能なアルゴリズムに従って、フィルタ係数を入力信号に適応させる。この場合における未知のシステムは、伝達関数が決定されなければならない線形のひずみシステムであることが想定される。この伝達関数を見つけるために、適応システムが未知のシステムに並列して接続される。
【0060】
所謂フィルタリングされたxLMS(FxLMS)アルゴリズムまたはその変形が、このような場合において、非常に多くの場合に使用される。フィルタリングされたxLMSアルゴリズムの構造が図1に示されており、図1は、フィルタリングされたxLMS(FxLMS)アルゴリズムを利用する一般的なデジタルANCシステムの構成図を例示する。簡略化のために、このようなシステムを実際に実現するために必要とされる他の構成要素、例えば、増幅器およびアナログデジタル変換器またはデジタルアナログ変換器は、ここでは示されていない。
【0061】
図1のシステムは、ノイズ源QSと、エラーマイクロフォンEと、伝達関数P(z)を有する、ノイズ源SからエラーマイクロフォンEへの音の伝達の第1経路Pとを備えている。図1のシステムはまた、伝達関数W(z)を有する適応フィルタWと、ノイズ制御音波を生成するラウドスピーカLSと、伝達関数S(z)を有する、ラウドスピーカLSからエラーマイクロフォンEへの音の伝達を記述する第2経路Sとを含む。図1のシステムにさらに含まれるものは、フィルタS^であり、フィルタS^の伝達関数S^(z)は、システム同定法を使用して、S(z)から評価される。フィルタS^は、フィルタWのフィルタ係数の適応調整のための最小自乗平均アルゴリズムのための機能ブロックLMSの下流に接続される。LMSアルゴリズムは、公知の最小自乗平均の問題の解に関する概算のためのアルゴリズムである。アルゴリズムは再帰的に働く−すなわち、各新たなデータセットと共に、アルゴリズムが再実行され、解が更新される。LMSアルゴリズムは、低い程度の複合性と、関連する演算力の必要性と、計算能力の条件と、少ないメモリの必要性とを供給する。
【0062】
フィルタリングされたxLMSアルゴリズムはまた、例えば、デジタル信号プロセッサにおいて、比較的小さい演算力を用いて実装され得るという利点を有する。2つのテスト信号が、FxLMSアルゴリズムの実装のための入力パラメータとして必要とされる:例えば、システムに影響する外部のノイズと直接的に相関される基準信号x(n)、および例えば、伝達関数P(z)を有する第1経路Pに沿ったノイズx(n)によって誘発される信号d(n)と、エラーセンサの位置における、ラウドスピーカLSと伝達関数S(z)を有する第2経路Sとを通る作動信号y(n)から取得される信号y’(n)との重ね合わせから構成されるエラー信号e(n)。作動信号y(n)は、伝達関数W(z)を有するフィルタを用いたノイズ信号x(n)のフィルタリングから導き出される。名称「フィルタリングされたxLMS」のアルゴリズムは、特に、ラウドスピーカLSからエラーセンサE(例えば、マイクロフォン)への第1経路Pにおいて生じる、広帯域のエラー信号x(n)とエラー信号e(n)との間の非相関性に対して補償するために、エラー信号e(n)と直接的に組み合わされたノイズx(n)ではなく、むしろフィルタS^の伝達関数S^(z)を用いてフィルタリングされる信号x’(n)が、LMS制御の適応のために使用されるという事実に基づいている。
【0063】
IIR(無限インパルス応答)フィルタまたはFIR(有限インパルス応答)フィルタは、伝達関数W(z)およびS^(z)のためのフィルタとして使用される。FIRフィルタは有限インパルス応答を有し、アナログ信号のサンプリング周波数によって通常決定される別々の時間段階において働く。n番目の順番のFIRフィルタは、微分式
【0064】
【数1】
によって定義され、ここに、y(n)は、時間nにおける出力値であり、x(n)に対する最後のNでサンプリングされた入力値x(n−N)の合計から計算され、該y(n)に対して、合計は、フィルタ係数biを用いて重み付けられる。所望の伝達関数は、フィルタ係数bi(i=0、1・・・N)の特定によって実現される。
【0065】
FIRフィルタとは異なり、既に演算された出力値は、無限インパルス応答を有するIIRフィルタ(再帰的フィルタ)に対する分析に含まれる。演算された値は、無限の回数の後には、非常に小さくなり得るので、演算は、有限数のサンプル値nの後に、実際に中断され得る。IIRフィルタに対する計算スキームは、
【0066】
【数2】
となり、ここに、y(n)は回数nにおける出力値であり、フィルタ係数aiを用いて重み付けられた出力値y(n)の合計に加えられる、フィルタ係数biを用いて重み付けられたサンプリングされた入力値x(n)の合計から計算される。所望の伝達関数は、やはり、フィルタ係数aiおよびbiの特定によって実現される。
【0067】
FIRフィルタとは対照的に、IIRフィルタは、ここでは不安定であり得るが、実装に対する同じ程度の消費時間に対してより幅広い選択性を有し得る。実際の用途において、必要性および関連する演算の考慮の下で、相対条件を最も満足するフィルタが選ばれる。
【0068】
図1に示されているような、フィルタリングされたxLMSアルゴリズムの単純な設計の不利な点は、第2経路のシステム同定の質が、音声特性−例えば、ノイズレベル、帯域幅および実際のノイズ信号x(n)のスペクトル分布に依存するということである。
【0069】
これは、実用的な観点において、第2経路のシステム同定が狭い帯域においてのみ行なわれるという影響と、ノイズx(n)の決定の場所に依存して、ノイズx(n)には含まれない、所望のノイズ消去の場所における付加的なノイズ構成要素は、フィルタリングされたxLMSアルゴリズムによって考慮されないという影響とを有する。因果関係条件に適合させるために、結果としての音波伝播時間がラウドスピーカLSに対するノイズ制御信号を演算するために必要とされる期間に少なくとも対応するように、ノイズ信号x(n)を決定するための場所は位置を決められる。実際に、ノイズ信号x(n)とは関係のない基準信号は、概して、システム同定のために使用される。この基準信号は、適切な位置において、フィルタリングされたxLMSアルゴリズムに加えられる。これは、図1の基準信号z(n)によって概略的に例示されており、該基準信号z(n)は、ラウドスピーカLSの前に、ノイズ制御y(n)に対する作動信号に対して加えられ、第2経路Sのシステム同定のために使用される。この場合において、エラーマイクロフォンEにおける信号y’(n)は、第2経路Sの伝達関数S(n)を使用して、ノイズ制御y(n)と基準信号z(n)とに対する作動信号の合計の伝達から取得される。システム同定−すなわち、第2経路Sの伝達関数S(z)の決定は、可能な最大の帯域幅を有する信号を用いて行われるということが、ここでは望ましい。上に記述されたように、このアプローチの不利な点は、この特定された基準信号z(n)が、一般的な周囲の状況に依存して、自動車内の乗客にとって邪魔であると知覚され得るということである。
【0070】
第2経路Sのシステム同定に対する要求された基準信号z(n)は、自動車の内側またはヘッドフォンにおける適用可能なノイズレベルおよびタイミングの特徴とスペクトル特性とを考慮に入れて、車両の乗客が聞き取ることのできないような方法で生成されるべきであるということを、本発明は求める。これを達成するために、物理変数はもはや、全く使用されない。その代わりに、人間の耳に関する音響心理学的特性が考慮に入れられる。
【0071】
音響心理学は、音波が人間の耳に遭遇したときに生じる音声知覚を扱う。人間の可聴知覚、内耳における周波数グループの作成、人間の内耳における信号の処理、および時間および周波数の領域における同時的かつ一時的マスキング効果に基づいて、どの音響信号、またはどの音響信号の異なる組み合わせが、ノイズの存在において通常の聴覚を有する人間にとって可聴であるかと、不可聴であるかを示すように、モデルが生成され得る。テストトーンが(マスカー(masker)としても知られる)ノイズの存在においてやっと聞き取られ得る閾値は、マスキングされた閾値と呼ばれる。対照的に、最小の可聴閾値は、テストトーンが完全に静寂した環境においてやっと聞き取られ得る閾値を記述するために使用される用語である。最小の可聴閾値とマスキングされた閾値との間のエリアは、マスキングエリアとして公知である。
【0072】
以下で記述される方法は、音響心理学的マスキング効果を使用しており、該音響心理学的マスキング効果は、アクティブノイズ制御方法、特に、基準信号z(n)の生成に対する基礎となり、該基準信号z(n)は、乗客エリアの現在の状況に依存して、本発明によって意図されているように自動車の内部における乗客にとって聞き取ることができない。音響心理学的マスキングモデルは、基準信号z(n)を生成するために使用される。このように、第2経路Sのシステム同定は、本発明によって主張されているように適応性があるように行われ、ノイズ信号に関する変化に対してリアルタイムで調節される。自動車におけるノイズ信号は、本発明に従って、マスキング、すなわち、基準信号z(n)の不可聴性をもたらし、スペクトル構成とタイミング特徴との両方に関して、アクティブ変化を被るので、音響心理学的モデルは、音のレベルのマスキングと、スペクトル構成と、タイミングとの依存性を考慮する。
【0073】
音響心理学的マスキングのモデリングに対する基礎は、人間の耳、特に内耳の基本特性である。内耳は、所謂錐体骨の中に配置されており、非圧縮性のリンパ液で満たされている。内耳は、約2 1/2回の巻きを有する巻貝(蝸牛)のように形作られている。蝸牛は、平行な管も備えており、上側および下側の管は、基底板によって分離されている。コルチ器官は、基底板の上にあり、人間の耳の感覚細胞を含む。基底板が音波によって振動するように作られている場合には、神経インパルスが生成される−すなわち、節が生じないか、または波腹が生じる。これは、聴覚にとって重大な影響−所謂基底板における周波数/位置の変換をもたらし、該所謂基底板における周波数/位置の変換を用いて、音響心理学的マスキング効果と人間の耳の正確な周波数選択性とが説明され得る。
【0074】
人間の耳は、限定された周波数帯域の中で共に生じる様々な音波をグループ分けする。これらの周波数帯域は、臨界周波数グループまたは臨界帯域幅(CB)として公知である。CBの基礎は、音波から生じる音響心理学的聴覚印象に関して、人間の耳が特定の周波数帯域における音を通常の可聴印象として編集するということである。周波数グループの中で生じる音の活動は、異なる周波数グループにおいて生じる音波とは異なり、互いに影響する。例えば、1つの周波数グループの中の、同じレベルを有する2つのトーンが、それらが異なる周波数グループにあった場合よりも静かであると知覚される。
【0075】
次に、エネルギーが同じであり、マスカーが、中心周波数がテストトーンの周波数である周波数帯域にあるときには、テストトーンはマスカーの中で聞き取ることができるので、周波数グループの求められる帯域幅が決定され得る。低周波数の場合において、周波数グループは、100Hzの帯域幅を有する。500Hzを上回る周波数に関しては、周波数グループは、対応する周波数グループの中心周波数の約20%の帯域幅を有する。
【0076】
全ての臨界周波数グループが、全可聴領域にわたって並行して配置される場合には、聴覚指向の非線形の周波数尺度が取得され、該周波数尺度は、音質として公知であり、単位「バーク」を有する。周波数グループが各位置において正確に1バークの同じ幅を有するように、バークは周波数軸の歪曲された尺度を表す。周波数と音質との間の非線形の関係は、基底板における周波数/位置の変換に根差す。音質関数は、マスキングされた閾値と音量との調査に基づいて、Zwickerによって表および方程式の形式で定義された(Zwicker,E.;Fastl、H. Psychoacostics−Facts
and Models、第2版、Springer−Verlag、Berlin/Heidelberg/New York、1999年を参照されたい)。0kHzから16kHzの可聴周波数範囲において、正確に24の周波数グループは一列に配置され得、その結果、関連する音質範囲は、0バークから24バークとなる。
【0077】
さらに、用語音量および音強度は、同量の印象を指すが、単位だけが異なる。音量および音強度は、人間の耳の周波数依存の知覚を考慮する。音響心理学的な観点の「音量」は、特定のレベル、特定のスペクトル構成、および特定の持続期間を有する、どのくらいの大きさの音が主観的に知覚されるかを示す。音が2倍の大きいと知覚された場合には、音量が2倍大きくなり、このことは、知覚された音量を参照して、様々な音波が互いに比較されることを可能にする。音量を評価および測定するための単位は、ソーンである。1ソーンは、40ホーンの音量レベルを有するトーンの知覚された音量として定義され、すなわち、40dBの音圧レベルを有する、1kHzの周波数におけるシヌス(sinus)トーンと同じ音量を有するとして知覚される音の知覚された音量として定義される。
【0078】
中程度のサイズの高い強度の値の場合において、10ホーンの強度の増加が、音量における2倍の増加をもたらす。低い音の強度に関しては、強度におけるわずかな増加が、知覚された音量を2倍の大きさにする。人間によって知覚される音量は、音の音圧レベルと周波数スペクトルとタイミングの特徴とに依存しており、マスキング効果をモデリングするためにも使用される。例えば、DIN 45631およびISO 532 Bに従って、音量を測定するための規格化された測定方法がまた存在する。
【0079】
図2は、音レベルに関する、すなわち、時間的効果が、知覚された音量に影響しない信号に関する、1kHzの周波数を有する定常シヌストーンの音量N1kHzと定常一様な励起ノイズの音量NGARとの例を示す。各周波数帯域において同じ音の強度を有し、従って同じ励起を有するノイズとして、一様な励起ノイズ(GAR)は定義される。図2は、音圧レベルに対する対数目盛において、ソーンで音量を示す。低音圧レベルに関して、すなわち、最小可聴閾値に近づくときに、トーンの知覚された音量Nは劇的に低下する。高音圧レベルに関して、音量Nと音圧レベルとの間に関係が存在する−この関係は、図に示された等式で定義される。「I」は、発せられたトーンの音強度を1m2毎のワット数で表し、ここに、I0は1m2毎に10−12ワットの基準の音強度を指し、中心周波数において、概ね最小可聴閾値に対応する(以下を参照されたい)。音量Nは、複合的なノイズ信号によるマスキングを決定する有用な手段であり、従ってスペクトルが複合的な時間依存の音波を介した音響心理学的マスキングのモデルにとって必要な条件であることが、次の性質から明らかになる。
【0080】
周波数の関数としてトーンを概ね知覚することができるのに必要とされる音圧レベル1が測定された場合に、所謂最小可聴閾値が取得される。音圧レベルが最小可聴閾値を下回る音響信号は、ノイズ信号が同時に存在しなかったとしても、人間の耳に知覚され得ない。
【0081】
所謂マスキングされた閾値が、ノイズ信号の存在におけるテスト音に対する知覚の閾値として定義される。テスト音がこの音響心理学的な閾値を下回る場合に、テスト音は完全にマスキングされる。これは、マスキングの音響心理学的な領域の中の全ての情報が知覚され得ない−すなわち、不可聴情報が任意の音声信号に加えられ、ノイズ信号にさえも加えられ得るということを意味する。マスキングされた閾値と最小可聴閾値との間のエリアは、所謂マスキングエリアであり、該マスキングエリアにおいては、挿入された信号は人間の耳に知覚され得ない。この局面は本発明によって利用され、基準信号z(n)がレシーバ(ここに示されている場合において、エラーマイクロフォンE)によって検出され、次のプロセスのために分析され得るが、人間の耳には聞き取ることができないように、付加的な信号構成要素(ここに示されている場合において、第2経路Pのシステム同定に対する基準信号z(n))、第1信号(ここに示されている場合において、ノイズ信号x(n))、またはノイズ信号x(n)および適用可能である場合には音楽信号を備えている全体信号を加える。
【0082】
マスキング効果が全種類の人間の聴覚に対して測定され得る様々な調査が行われている。多くの他の音響心理学的印象とは異なり、個人間の差はあまりなく、無視され得、音によるマスキングの一般的な音響心理学的モデルが生成され得るということを意味する。マスキングの音響心理学的局面は、この音響的に伝達された基準信号z(n)が、現在存在するノイズレベル、そのスペクトル構成およびタイミング特質に関わらず、不可聴になるように、音声特徴にリアルタイムで基準信号z(n)を適応させるように、本発明において利用される。ノイズレベルは、周辺のノイズ、干渉、音楽、またはこれらの組み合わせから形成され得る。
【0083】
ここで、区別が、マスキングの2つの主要な形式の間で行われ、そのそれぞれが、マスキングされた閾値の様々な性質をもたらす。これらは、周波数領域における同時マスキングと、時間軸に沿ったマスカーのタイミング効果による時間領域におけるマスキングである。さらに、これら2つのマスキングタイプの組み合わせが、周辺のノイズまたは全般的なノイズのような信号において見つけられる。
【0084】
同時マスキングは、マスキング音と有用な信号とが、同時に生じることを意味する。頻繁にシヌス形状にされるテスト信号がやっと聞き取ることができるように、マスカーの形状、帯域幅、振幅および/または周波数が変化する場合には、マスキングされた閾値が、可聴領域の全帯域幅−すなわち、主に、20Hzと20kHzとの間の周波数にわたる同時マスキングのために決定され得る。この周波数領域はまた、概して、自動車における後部座席娯楽システムにおいて使用される音声装置の利用可能な帯域幅を表し、従って、第2経路Pのシステム同定のための基準信号z(n)に対する有用な周波数領域も表す。
【0085】
図3は、ホワイトノイズによる正弦曲線状のテストトーンのマスキングを示す。音強度1WNを有するホワイトノイズによってのみマスキングされたテストトーンの音強度が、その周波数との関係で表示されており、ここで最小可聴閾値は点線で表示されている。ホワイトノイズによってマスキングするためのシヌストーンの最小可聴閾値は、以下のように取得される:500Hz未満では、シヌストーンの最小可聴閾値は、ホワイトノイズの音強度よりも17dB上回る。500Hzを上回ると、最小可聴閾値は、周波数が2倍になることに対応して、10毎に約10dBまたは1オクターブ毎に約3dB増加する。最小可聴閾値の周波数依存性は、様々な中心周波数における人間の耳の様々な臨界帯域幅(CB)から導き出される。
【0086】
周波数グループにおいて生じる音強度は、知覚された音声印象に編集されるので、より大きな全体的強度が、レベルが周波数とは関係のないホワイトノイズに対するより高い周波数におけるより広い周波数グループにおいて取得される。音量はまた、(すなわち、知覚された音量)に対応するように生じ、増加されたマスキングされた閾値をもたらす。これは、(例えば、マスカーの音圧レベルのような)純粋に物理的な観点は、マスキングの音響心理学的効果のモデリング−すなわち、音圧レベルおよび強度のような観点からマスキングされた閾値を導き出すことは不適切であるということを意味する。その代わりに、音量Nのような音響心理学的な観点が本発明と共に使用される。マスキング音のスペクトル分布およびタイミング特徴が主要な役割を演じ、このことは以下の図面から明らかである。
【0087】
マスキングされた閾値が、シヌストーンのような狭い帯域のマスカー、狭い帯域のノイズまたは臨界帯域幅のノイズに対して決定される場合には、結果としてのスペクトルのマスキングされた閾値は、マスカー自体がスペクトル構成要素を有していないエリアにおいてさえも、最小可聴閾値よりも高い。臨界帯域幅のノイズは、この場合、狭い帯域のノイズとして使用され、該狭い帯域のノイズのレベルは、LCBとして示される。
【0088】
図4は、1kHzの中心周波数fcを有する臨界帯域のノイズによるマスカーとして測定されたシヌストーンのマスキングされた閾値、およびレベルLTを有するテストトーンの周波数fTに関する様々な音圧レベルのマスキングされた閾値を示す。最小可聴閾値は、図3において点線によって表示されている。マスカーのレベルがまた20dBだけ上昇する場合には、マスキングされたピーク値が20dBだけ上昇するということと、従って、マスキングされたピーク値は、マスキングされた臨界帯域幅のノイズのレベルLCBと共に直線状に変化する。測定されたマスキングされた閾値の下側の縁−すなわち、中心周波数fcよりも低い低周波数の方向に向けたマスキングは、マスキングされた閾値のレベルLCBとは関係のない約−100dB/オクターブの勾配を有する。この大きな勾配は、40dBを下回るマスカーのレベルLCBに対するマスキングされた閾値の上側の縁に到達されるだけである。マスカーのレベルLCBに関する増加と共に、マスキングされた閾値の上側の縁は段々と平坦になり、勾配は100dBのLCBに対して約−25dB/オクターブになる。これは、マスカーの中心周波数fcと比較してより高い周波数の方向におけるマスキングは、マスキング音が存在する周波数領域をはるかに超えて伸びるということを意味する。聴覚は、狭い帯域の臨界帯域幅のノイズに対する1kHz以外の中心周波数に対して同様に応答する。マスキングされた閾値の上側の縁と下側の縁との勾配は、図5に見られるように、マスカーの中心周波数に実質的に関係がない。
【0089】
図5は、60dBのレベルLCBと250Hz、1kHz、および4kHzの3つの異なる中心周波数とを有する、狭い帯域における臨界帯域幅のノイズからのマスカーに対するマスキングされた閾値を示している。250Hzの中心周波数を有するマスカーに対する下側の縁に対する勾配の明らかにより平坦な流れは、最小可聴閾値によるものであり、該最小可聴閾値は、より高いレベルにおいてでさえも、この低い周波数において適用される。示されたもののような効果は、マスキングのための音響心理学的モデルの実装において同様に含まれる。最小可聴閾値はやはり、図5において点線によって表示されている。
【0090】
シヌス形状のテストトーンが、1kHzの周波数を有する別のシヌストーンによってマスキングされる場合には、図6に示されているようなマスキングされた閾値が、テストトーンの周波数とマスカーLMのレベルとに従って取得される。先に既に記述したように、マスカーのレベルに関する上側の縁の扇形の開きが明確に見られ得るが、マスキングされた閾値の下側の縁は、周波数とレベルに実質的に関係ない。上側の勾配は、マスカーのレベルに関して約−100dB/オクターブ〜−25dB/オクターブになり、下側の勾配に対して約−100dB/オクターブになるように測定される。約12dBの差がマスキングトーンのレベルLMとマスキングされた閾値Lrの最大値との間に存在する。この差は、マスカーとしての臨界帯域幅のノイズを用いて取得される値よりも非常に大きい。なぜならば、マスカーの2つのシヌストーンの強度、およびテストトーンの強度は、ノイズの使用およびテストトーンとしてのシヌストーンとは異なり、同じ周波数において共に加えられる。結果として、トーンは、すなわち、テストトーンとしての低いレベルに対して、ずっとより早く知覚される。さらに、同時に2つのシヌストーンを発するときに、(うなりのような)他の効果が生じ、同様に、増加された知覚または減少されたマスキングをもたらす。
【0091】
記述された同時マスキングと共に、マスキングの別の音響心理学的効果は、所謂時間的マスキングである。2つの異なる種類の時間的マスキングが区別される:プレマスキングは、マスカーのレベルに関する急激な上昇の前にマスキング効果が既に生じる状況を指す。ポストマスキングは、マスキングされた閾値が、マスカーのレベルの急速な下落の後の期間において、最小可聴閾値にすぐには降下しないときに生じる効果を表す。図7は、プレマスキングとポストマスキングとの両方を概略的に示しており、トーンインパルスのマスキング効果と関連して以下でさらに詳細に述べられる。
【0092】
時間的なプレマスキングとポストマスキングとの効果を決定するために、短い持続期間のテストトーンインパルスが、マスキング効果の対応する時間的分解を取得するために使用されなければならない。ここでは、最小可聴閾値とマスキングされた閾値との両方が、テストトーンの持続期間に依存している。2つの異なる効果がこれに関して知られている。これらは、テストインパルスの持続期間に関する音量印象の依存性(図8を参照)と、短いトーンインパルスの反復率と音量印象との間の関係(図9を参照)とを指す。
【0093】
20−msのインパルスの音圧レベルが、同一の音量印象を取得するために、200−msのインパルスの音圧レベルと比較して、10dBだけ増加されなければならない。200ms以上のインパルスの持続期間においては、トーンインパルスの音量は、持続期間に関係がない。人間の耳にとって、約200msを上回る持続期間を有する処理は、定常なプロセスを表すということは公知である。音が約200msよりも短い場合には、音のタイミング特性の音響心理学的に証明可能な効果が存在する。
【0094】
図8は、持続期間におけるテストトーンインパルスの知覚の依存性を示す。点線は、持続期間に関して、200Hz、1kHzおよび4kHzの周波数fT-に対するテストト
ーンインパルスの最小可聴閾値TQを示しており、最小可聴閾値は、200msを下回るテストトーンの持続期間の間、10毎に約10dB上昇する。この性質は、テストトーンの周波数とは関係なく、テストトーンの異なる周波数fTに対する線の絶対的な位置は、これらの異なる周波数における異なる最小可聴閾値を反映する。
【0095】
実線は、40dBおよび60dBのレベルLUMNを有する一様なマスキングノイズ(UMN)によって、テストトーンをマスキングするためのマスキングされた閾値を表す。一様なマスキングノイズが、全可聴領域を通して−すなわち、0バーク〜24バークの全周波数グループに対して、一定のマスキングされた閾値を有するように、一様なマスキングノイズは定義される。言い換えると、マスキングされた閾値の表示された特徴は、テストトーンの周波数fTに関係がない。最小可聴閾値TQと丁度同じように、マスキングされた閾値はまた、200msを下回るテストトーンの持続期間の間、10毎に約10dB上昇する。
【0096】
図9は、3kHzの周波数と3msの持続期間とを有するテストトーンインパルスの反復率に関するマスキングされた閾値の依存性を示す。一様なマスキングノイズはやはりマスカーである:マスカーは、長方形の形状に変調される−すなわち、マスカーは、定期的にオンとオフを切り換える。一様なマスキングノイズの調査された変調周波数は、5Hz、20Hzおよび100Hzである。テストトーンは、一様なマスキングノイズの変調周波数と同一な次の周波数を用いて発せられる。試験の間、テストトーンインパルスのタイミングが、変調されたノイズの時間関連のマスキングされた閾値を取得するように対応して変更される。
【0097】
図9は、マスカーの持続期間TMに対して標準化された横座標に沿った、テストトーンインパルスの時間における変動を示す。縦座標は、計算されたマスキングされた閾値におけるテストトーンインパルスのレベルを示す。点線は、変調されていないマスカー(すなわち、他の点では同一な特性を有する継続的に存在するマスカー)に対するテストトーンインパルスのマスキングされた閾値を基準点として表す。
【0098】
プレマスキングの勾配と比較すると、図9におけるポストマスキングのより平坦な勾配が明らかに見られる。長方形形状の変調されたマスカーを作動した後に、マスキングされた閾値は短い期間超過される。この効果はオーバーシュートとして公知である。マスカーの停止における変調された一様なマスキングノイズに対するマスキングされた閾値のレベルにおける最大下落ΔLは、一様なマスキングノイズの変調周波数における増加に応答した定常一様なマスキングノイズに対するマスキングされた閾値と比較して期待されたように減少される−言い換えると、テストトーンインパルスのマスキングされた閾値が、最小可聴閾値によって特定される最小値に対する存続期間の間、段々と低下し得る。
【0099】
マスカーが完全にオンに切り換えられる前に、マスカーが既にテストトーンインパルスをマスキングすることを図9はまた例示する。この効果は、先に既に述べたように、プレマスキングとして公知であり、大きな(すなわち、高い音圧レベルを有する)トーンとノイズが、静かなトーンよりも素早く聴覚によって処理され得るという事実に基づいている。プレマスキング効果は、ポストマスキングの効果よりも全く優れていないので、多くの場合に、対応するアルゴリズムを簡略化するために、音響心理学的なモデルにおける使用においては省かれる。マスカーの接続を断った後、可聴閾値は最小可聴閾値にすぐには低下せず、むしろ約200msの期間の後に最小可聴閾値に到達する。効果は、内耳の基底板における一時的な波のゆっくりとした安定によって説明され得る。
【0100】
これに加えて、マスカーの帯域幅はまた、ポストマスキングの持続期間に直接的な影響を有する。各個々の周波数グループと関連するマスカーの特定の構成要素が、図10および図11に示されているように、ポストマスキングをもたらす。
【0101】
図10は、500msの持続期間を有するホワイトノイズから成る長方形形状のマスカーの終了後の、時間tVにおいて存在するテストトーンとして、20μsの持続期間を有するガウスインパルスのマスキングされた閾値のレベル特性LTを示し、ホワイトノイズの音圧レベルLWRは、3つのレベル40dB、60dBおよび80dBを帯びている。ホワイトノイズを備えているマスカーのポストマスキングは、スペクトル効果を用いることなく測定され得る。なぜならば、人間の耳の知覚可能な周波数領域に関して20μsの短い持続期間を有するガウス形状のテストトーンはまた、ホワイトノイズの広帯域のスペクトル分布と似た広帯域のスペクトル分布を示す。図10における実線の曲線は、測定によって決定された事後処理の特徴を例示する。次に、曲線は、マスカーのレベルLWRとは関係なく、200ms後に、テストトーンの最小可聴閾値に対する値(この場合において使用される短いテストトーンに対して約40dB)に到達する。図10は、10msの時定数を有するポストマスキングの指数の低下に対応する曲線を点線によって示す。この種の単純な概算だけが、大きいレベルのマスカーに対して有効であり、この種の単純な概算は、最小可聴閾値の周辺におけるポストマスキングの特徴を決して反映しないということが見られ得る。
【0102】
ポストマスキングとマスカーの持続期間との間にも関係がある。図11における点線は、60dBのレベルLUMNと5msの持続期間TMとを有する一様なマスキングノイズを備えている長方形形状の変調されたマスカーの停止後、5msの持続期間と2kHzの周波数fTとを有するガウス形状のテストトーンインパルスのマスキングされた閾値を遅延時間tdの関数として示す。実線は、200msの持続期間TMを有し、テストトーンインパルスと一様なマスキングノイズと他の点では同一であるパラメータを有するマスカーに対するマスキングされた閾値を示す。
【0103】
200msの持続期間TMを有するマスカーに対する測定されたポストマスキングは、200msよりも長い持続期間TMを有するが、他の点では同一であるパラメータを有する全てのマスカーに対しても見つけられるポストマスキングと調和する。より短い持続期間であるが、他の点では同一であるパラメータ(スペクトル構成およびレベルなど)を有するマスカーの場合において、マスカーの5msの持続期間TMに対するマスキングされた閾値の特徴から明らかであるように、ポストマスキングの効果は減少される。音響心理学的モデリングのような、アルゴリズムおよび方法における音響心理学的マスキング効果を使用するために、グループ分けされた、複合的なまたは重ね合わされた個々のマスカーに対して、結果としてのどのマスキングが取得されるかということがまた考慮される。異なるマスカーが同時に生じた場合には、同時マスキングが存在する。ごくわずかな現実の音が、シヌストーンのような純粋な音と比較可能である。概して、楽器から発せられたトーン、および自動車におけるエンジンのような回転体から生じる音は、多数の倍音を有する。部分的なトーンのレベルの構成に依存して、結果としてのマスキングされた閾値は大きく変化し得る。
【0104】
図12は、複合的な音に対する同時マスキングを示す。シヌス形状のテストトーン同時マスキングに対するマスキングされた閾値は、励起の周波数とレベルとに関して、200−Hzのシヌストーンの10個の倍音によって表される。全ての倍音が同じ音圧レベルを有するが、全倍音の位相位置は統計学的に分布される。図12は、部分的なトーンの全レベルが40dBまたは60dBのいずれかである2つの場合に対する、結果としてのマスキングされた閾値を示す。基準トーンと第1の4個の倍音とが、それぞれ別個の周波数グループに位置を決められる。これは、マスキングされた閾値の最大値に対する、これらの複合的な音の構成要素のマスキング部分の追加的な重ね合わせはないということを意味する。
【0105】
しかしながら、上側の縁と下側の縁との重ね合わせ、および−その最深点において、やはり最小可聴閾値よりも非常に高い−マスキング効果の追加からもたらされる下降とが明らかに見られ得る。対照的に、上側の倍音のほとんどが、人間の聴覚の臨界帯域幅の範囲内にある。個々のマスキングされた閾値の強固で追加的な重ね合わせが、この臨界帯域幅において行われる。この結果として、同時マスカーの追加は、マスカーの強度を加算することによっては計算され得ないが、その代わりに、個々の特定の音量値が、マスキングの音響心理学的モデルを定義するために、加算されなければならない。
【0106】
時間可変信号の音声信号スペクトルから励起分布を取得するために、より狭い帯域のノイズによってマスキングするためのシヌストーンのマスキングされた閾値の公知の特徴が、分析の基準として使用される。ここで、(臨界帯域幅の範囲内の)中心の励起と(臨界帯域幅の外側の)縁の励起との間で、区別が行われる。この例としては、シヌストーンの音響心理学的な中心の励起、または物理的な音の強度に調和する臨界帯域幅よりも小さい帯域幅を有する狭い帯域のノイズの音響心理学的な中心の励起である。また、信号は、音声スペクトルによってマスキングされる臨界帯域幅の間で対応するように分布される。このように、音響心理学的な励起の分布は、受信された時間可変音の物理的強度のスペクトルから取得される。音響心理学的な励起の分布は、規定の音量と呼ばれる。複合的な音声信号の場合における結果としての全体的な音量は、トーンの尺度に沿った可聴領域−すなわち、0バークから24バークの範囲における全音響心理学的な励起の規定の音量に対する積分であることが分かり、対応する時間関係も示す。この全音量に基づいて、次に、マスキングされた閾値が、音量とマスキングとの間の既知の関係に基づいて作り出され、関連する臨界帯域幅の範囲内の音の終了後、時間効果の考慮の下、マスキングされた閾値は、約200msで最小可聴閾値に下落する(図10、ポストマスキングをまた参照)。
【0107】
このように、音響心理学的マスキングモデルは、上記の全マスキング効果の考慮の下、実装される。どのマスキング効果が、背景ノイズのようなノイズの音圧レベル、スペクトル構成およびタイミングの特徴によってもたらされるかと、所望のテスト信号が、上記のような種類の環境において聴取者によって知覚され得ないように、第2経路Sのシステム同定のために適応するようにかつリアルタイムで所望のテスト信号を操作するために、これらの効果がどのように利用され得るかとが、上記の図面および記述から理解され得る。
【0108】
図13〜図15は、以下で、本発明を用いた音響心理学的マスキングモデルの用途、特に、第2経路Sの音響心理学的なシステム同定に対する3つの例を例示する。図13における信号の流れ図は、ヘッドフォンと組み合わせたノイズ制御のためのANCシステムにおける使用のための音響心理学的マスキングモデル(PMM)の利用のための、本発明に従った最初の回路を例示する。予期されるノイズ信号に相関する適切な基準信号は、この用途に対しては利用可能ではなく、従って、先に記述されたようなフィードバックANCシステムが使用される。フィードフォーワードANCシステムは、予期されるノイズ信号と相関する基準信号x(n)の存在を必要とし、この基準信号の受信に対するセンサが常に、エラーマイクロフォンEよりもノイズ信号源に近くなるように(図1を参照)、因果関係条件が満足されることを必要とする。この因果関係条件は、特に、未知の空間における運動の自由を有するヘッドフォンに対しては満足されない。
【0109】
図13において示されているような本発明に従ったシステムの例は、ノイズ信号(例えば、定期的なノイズ信号)を生成する源QSと、エラーマイクロフォンEと、ノイズ源QSからエラーマイクロフォンEへの音の伝播のための伝達関数P(z)を有する第1経路Pとを有する。図13のシステムはまた、伝達関数W(z)を有する適応フィルタWと、消去音波を生成するために適応フィルタWの上流に接続されたラウドスピーカLSと、ラウドスピーカLSからエラーマイクロフォンEへの音の伝播のための伝達関数S(z)を有する第2経路Sとを備えている。
【0110】
図13のシステムはまた、伝達関数S^(z)を有する第1フィルタS^1と、伝達関数S^(z)を有する第2フィルタS^2と、伝達関数S^(z)を有する第3フィルタS^3とを備え、これらは、S.Mitra、J.S.Kaiser、Handbook
For Digital Signal Processing、Wiley and
Sons 1993年、ページ1085〜1092によって記述されたようなシステム同定方法を使用してS(z)から見積もられ、加えて、最小自乗平均アルゴリズムを使用したフィルタWのフィルタ係数の適用のための第1制御ブロックLMS1と、最小自乗平均アルゴリズムを使用した第1フィルタS^1、第2フィルタS^2および第3フィルタS^3のフィルタ係数の適用のための第2制御ブロックLMS2も備えている。フィルタS^1およびフィルタS^2の同一の伝達関数S^(z)は、それぞれの場合において、リアルタイムで実行される第2経路Sの適応のシステム同定の間に決定されたフィルタS^3のフィルタ係数を単にコピーすることによって取得される。
【0111】
図13のシステムはまた、時間領域から周波数領域への信号の高速フーリエ変換のための第1ユニットFFT1および第2ユニットFFT2と、周波数領域から時間領域への信号の逆高速フーリエ変換のための第1ユニットIFFT1および第2ユニットIFFT2とを備えている。さらに、音響心理学的マスキングモデルユニットPMMと、巡回的なたたみ込みの積を避けるための抑制ユニットCと、フィルタFと、ホワイトノイズ源NGと、音楽信号源MSとを備えている。
【0112】
エラーマイクロフォンEにおけるエラー信号e(n)は、一方では、伝達関数P(z)を有する第1経路Pを介して伝播される、ノイズ源QSからのノイズ信号x(n)からもたらされる信号d(n)で構成されており、もう一方では、ラウドスピーカLSに供給され、それから伝達関数S(z)を有する第2経路Sを介してエラーマイクロフォンEに伝達される消去信号y_sum(n)からもたらされる信号y’(n)で構成されている。参照信号z(n)は、フィルタFを介してホワイトノイズ源NGによって提供された信号FilteredWhiteNoise(n)に音楽源MSからの信号Music(n)を加算することによって取得される。基準信号z(n)は、フィルタWの出力信号y(n)に加算され、両方の該信号の合計が信号y_sum(n)を形成する。
【0113】
基準信号z(n)はまた、高速フーリエ変換ユニットFFT2に供給され、信号z(ω)に変換され、該信号z(ω)は、伝達関数S^(z)を有する適応フィルタS^3を介したフィルタリングと、ユニットIFFT1を介した次の逆高速フーリエ変換との後に、エラー信号e(n)から減算され、信号e’(n)を生じさせる。高速フーリエ変換ユニットFFT1は、信号e’(n)を信号E’(ω)に転換し、該信号E’(ω)は、フィルタS^1、フィルタS^2およびフィルタS^3のフィルタ係数の適応制御のためのユニットLMS2に、信号Z(ω)と共に供給されており、該フィルタは、最小自乗平均アルゴリズムを使用する。信号E’(ω)はまた、音響心理学的マスキングモデルユニットPMMに対する入力信号として使用され、該音響心理学的マスキングモデルユニットPMMは、エラーマイクロフォンの場所(すなわち、ヘッドフォンの場所)における、ノイズを介した現在のマスキングの考慮の下、信号GAIN(ω)を生成し、該信号GAIN(ω)は、基準信号z(n)を決定するために使用される。そうするために、信号GAIN(ω)は、逆高速フーリエ変換のためのユニットIFFT2によって時間信号GAIN(n)に転換され、巡回的なたたみ込みの積を避けるための抑制ユニットCによって設定され、フィルタFの係数は、信号Gain(n)によって制御され、該信号Gain(n)は、新たなフィルタ係数の組に対応する。FilteredWhiteNoise(n)信号は、(基準信号が現在のノイズ信号の可聴閾値を下回って設定されているので不可聴である)第2経路Pのシステム同定のための不可聴基準信号に調和する。
【0114】
基準信号z(n)はまた、有用な信号Music(n)を含み得るが、しかしながら、該信号Music(n)は、本システムの関数にとって不可欠なものではない。信号e’(n)は、信号x^(n)を取得するために、フィルタS^2の伝達関数S(z)を介して信号y(n)から導き出される信号y’(n)に加えられる。信号x^(n)は、適応フィルタWに対する入力信号を表し、伝達関数S(z)を有するフィルタS^1によって処理した後に、フィルタWのフィルタ係数の適応制御のために最小自乗平均アルゴリズムを使用するユニットLMS1に信号e’(n)と共に供給される信号x’^(n)としても使用される。
【0115】
図14は、音響心理学的マスキングモデルユニットPMMを使用した自動車の内部におけるノイズ制御を有するANC/MSTシステムを示す。図13に示されたようなヘッドフォンの用途とは対照的に、この用途は、予期されるノイズ信号と相関する基準信号fn(n)を有し、フィードフォーワードANC/MSTシステムが利用される。基準信号fn(n)は、非音響センサを介して、例えば、ノイズ源の場所に配置される圧電性トランスデューサまたは電気音響トランスデューサ、ホール素子、rmpメータによって生成される。図14に示されている回路は、空間特性(例えば、自動車の内側)が知られている環境において使用されるので、基準信号fn(n)に対するセンサが常に、エラーマイクロフォンEよりもノイズ信号源に近くなければならない、フィードフォーワードシステムに必要とされる因果関係条件は、これらの構成要素の適切な配置によって確実に満足され得る。
【0116】
図14のシステムは、図13のシステムを含み、さらに、時間領域から周波数領域への信号の高速フーリエ変換のための第3ユニットFFT3と、第1計算回路CALC1と、第2計算回路CALC2とを含む。図14のシステムはまた、図13のシステムに加えて、適応帯域通過フィルタBPと、上で既に述べたように、非音響センサNASとを特徴とする。
【0117】
図14のシステムにおいて、エラーマイクロフォンEにおけるエラー信号e(n)は、図13のシステムにおけるのと同様に、信号d(n)とy_sum(n)とから構成される。基準信号z(n)は、音楽源MSからの信号Music(n)と信号FilteredWhiteNoise(n)とから構成される。基準信号z(n)は、1−βで重みをつけられたフィルタWの出力信号y(n)に加算され、信号y_sum(n)を生じる。信号z(n)は再び高速フーリエ変換ユニットFFT2を経由して供給されて、信号z(ω)を取得し、適応フィルタS^3を介したフィルタリングと、ユニットIFFT1を介した次の逆高速フーリエ変換との後に、該信号z(ω)はエラー信号e(n)から減算され、図13との違いを比較すると、信号e’’(n)を生じさせる。信号e’’(n)は高速フーリエ変換ユニットFFT1によって信号E’’(ω)に転換される。信号E’’(ω)は、音響心理学的マスキングモデルユニットPMMに対する入力信号として使用され、該音響心理学的マスキングモデルユニットPMMは、エラーマイクロフォンの場所における、ノイズを介した現在のマスキングの考慮の下、信号GAIN(ω)を生成し、該信号GAIN(ω)は、基準信号z(n)を決定するために使用される。そうするために、周波数領域における信号GAIN(ω)は、逆高速フーリエ変換のためのユニットIFFT2によって時間領域における信号Gain(n)に変換され、源NGから生成された信号WhiteNoise(n)が、フィルタFを使用して信号FilteredWhiteNoise(n)に転換されるように、強制ユニットCによって強制され、該フィルタFに新たなフィルタ係数の組Gain(n)がロードされる。FilteredWhiteNoise(n)信号は、(信号が現在のノイズ信号の可聴閾値を下回っているので不可聴である)第2経路Pのシステム同定のための不可聴基準信号に調和する。さらに、基準信号z(n)はまた、有用な信号Music(n)を含み得、該信号Music(n)は、本システムの関数にとって不可欠なものではない。信号e^(n)は、信号e’’(n)から減算され、該信号e’’(n)は、入力においてβ・y(n)を供給されたフィルタS^2によって出力される。信号e’(n)は、高速フーリエ変換ユニットFFT3によって信号E’(ω)に変換され、z(ω)と共に、フィルタS^1、フィルタS^2およびフィルタS^3のフィルタ係数の適応制御のためのユニットLMS2において使用される。
【0118】
非音響センサNASは、音響ノイズ信号x(n)と相関する電気信号を生成し、該電気信号は計算回路CALC1に供給され、該計算回路CALC1から、信号fn(n)が取得される。次に、信号ジェネレータSGは、xc(n)〜x(n)であるところのノイズ信号に対応するフィルタWに対して入力信号xc(n)を生成する。計算ユニットCALC2は、適応帯域通過フィルタBPに対するフィルタ係数K(n)を決定する。伝達関数S^(z)を有するフィルタS^1を使用して、信号xc(n)は、信号x’(n)に転換され、次に、最小自乗平均アルゴリズムを使用したフィルタWのフィルタ係数の適応制御のための回路LMS1の制御のために、帯域通過フィルタBPを介してフィルタリングされた信号e’(n)と共に使用される。
【0119】
図15のシステムは、音響心理学的マスキングモデルユニットPMMを使用した、自動車の内部におけるノイズの制御のためのANC/MSTシステムである。図14に示されたフィードフォーワードシステムに加えて、図15のシステムはまたフィードバックシステムを含み、フィードフォーワードシステムとフィードバックシステムとの両方の特定の利点を組み合わせたハイブリッドANC/MSTシステムを生成する。特に、フィードバック経路は、自動車の内部におけるノイズ信号を首尾よく減少させ得、該ノイズ信号は、外部から乱反射的かつランダムに引き起こされ、かつ、既知のノイズ源QSにおいて決定された基準信号x(n)とは相関しない。
【0120】
図14の伝達係数W(z)を有するフィルタWは、図15のシステムにおいては、伝達関数WFF(z)を有する同等のフィルタW1に置き換えられており、該フィルタW1は、図14に示されたシステムと同等であるフィードフォーワードシステムの一部分である。さらに、図15のシステムは、フィードバック経路に対する伝達関数WFB(z)を有する第2フィルタW2と、最小自乗平均を使用したフィルタW2のフィルタ係数の適応制御のための第3ユニットLMS3とを含む。図15のシステムはさらに、伝達関数S^(n)を有する第4フィルタS^4と、伝達関数S^(n)を有する第5フィルタS^5とを含み、それらは、システム同定方法を使用して、第2経路Sの伝達関数S(z)から評価される。
【0121】
図14のシステムのように、ノイズ源QSから生成され、かつ、伝達関数P(z)を有する第1経路Pにおいてノイズx(n)からフィルタリングされた信号x(n)と、ラウドスピーカLSと第2経路Sとの伝達関数によってフィルタリングされた消去信号y_sum(n)とから、エラーマイクロフォンEにおけるエラー信号e(n)は構成されている。基準信号z(n)は、音楽源MSからの信号Music(n)と、フィルタFによって音響心理学的マスキングモデルを用いて評価された、ホワイトノイズ源NGからの信号FilteredWhiteNoise(n)との合計から導き出される。基準信号z(n)は、1−βで重みを付けられたフィルタW1の出力信号y(n)と、伝達関数WFB(z)を有するフィルタW2の出力信号yFB(n)とに加算され、信号y_sum(n)を生じさせる。
【0122】
信号z(n)はまた、高速フーリエ変換ユニットFFT2を経由して信号Z(ω)に変換され、伝達関数S(z)を有する適応フィルタS^3を介したフィルタリングと、ユニットIFFT1を介した次の逆高速フーリエ変換との後に、該信号z(n)はエラー信号e(n)から減算され、図13のシステムとの違いを比較すると、信号e’’(n)を生じさせる。時間領域における信号e’’(n)は、高速フーリエ変換ユニットFFT1によって、周波数領域における信号E’’(ω)に転換される。信号E’’(ω)は、音響心理学的マスキングモデルユニットPMMに対する入力信号として使用され、該音響心理学的マスキングモデルユニットPMMは、エラーマイクロフォンEの場所におけるノイズを介した現在のマスキングの考慮の下、信号GAIN(ω)を生成し、該信号GAIN(ω)は、フィルタFを介して基準信号z(n)を決定するために使用される。そうするために、信号GAIN(ω)は、逆高速フーリエ変換のためのユニットIFFT2によって時間信号Gain(n)に転換され、源NGから生成された信号WhiteNoise(n)が、フィルタFを使用して信号FilteredWhiteNoise(n)に転換されるように、強制ユニットCによって強制され、該フィルタFには新たなフィルタ係数の組Gain(n)がロードされている。
【0123】
FilteredWhiteNoise(n)信号は、(信号が現在のノイズ信号の可聴閾値を下回っているので不可聴である)第2経路Pのシステム同定のための不可聴基準信号に調和する。さらに、基準信号z(n)はまた、有用な信号Music(n)を含み得、該信号Music(n)は、本システムの関数にとって不可欠なものではない。信号e^(n)は、フィルタS^2の伝達関数S^(z)を用いてβ*y(n)から生成された信号e’’(n)から減算され、信号e’(n)を取得する。この信号e’(n)は、高速フーリエ変換ユニットFFT3によって信号E’(ω)に転換され、z(ω)と共に、最小自乗平均アルゴリズムを使用したフィルタS^1、フィルタS^2、フィルタS^3フィルタS^4およびフィルタS^5のフィルタ係数の適応制御のためのユニットLMS2において使用される。
【0124】
非音響センサNASは再び、ノイズ信号と相関する電気信号を生成し、該電気信号を用いて信号fn(n)が計算ユニットCALC1から取得される。信号ジェネレータSGは、ノイズ信号に対応するフィルタWに対する入力信号x(n)を生成する。計算ユニットCALC2は、適応帯域通過フィルタBPに対するフィルタ係数K(n)を決定する。伝達関数S^(z)を有するフィルタS^1を使用して、信号x(n)は信号x’(n)に転換され、次に、最小自乗平均アルゴリズムを使用してフィルタWのフィルタ係数の適応制御のためのユニットLMS1の制御のために、帯域通過フィルタBPを介してフィルタリングされた信号e’(n)と共に使用される。信号e’(n)は、フィルタS^5の伝達関数S(z)を用いてフィルタリングされたyFB(n)から導き出され、信号xFB(n)を取得する。信号xFB(n)は、適応フィルタW2に対する入力信号を表し、伝達関数S(z)を有するフィルタS^4を介した信号x’FB(n)への転換後に、信号e’(n)と共に、最小自乗平均アルゴリズムを使用して伝達関数wFB(z)を有するフィルタW2のフィルタ係数の適応制御のための回路LMS3にアクセスするためにも使用される。
【0125】
図13〜図15の音響心理学的マスキングモデルユニットPMMによって実行される音響心理学的マスク生成プロセスは、人間の聴覚のマスキング効果をシミュレートする音響心理学的モデルの実装を提供する。使用されるマスキングモデルは、例えば、ISO MPEG1規格に記述されるような所謂Johnston ModelまたはMPEGモデルに基づき得る。図16および図17に示される例示的な実装はMPEGモデルを使用する。本明細書において記述される音響心理学的マスクモデリング処理は、単一のプロセッサ、またはこのような処理を走らせることで公知のその他任意のユニットにおいて実装され得る。
【0126】
図16および図17に示されているような音響心理学的マスクモデリング処理は、ステップ204において、512のサンプル時間領域の入力音声データフレーム110にハン窓を掛けることから開始する。効果的にハン窓を掛けることは、滑らかな傾斜を提供するためにハン窓を使用して、前のサンプルと次のサンプルとの間に512のサンプルを中心に集める。これは、時間領域の音声データ110が1024点の高速フーリエ変換(FFT)を使用して周波数領域に転換されたときに、ステップ206においてまた生成される上昇縁のアーティファクトを減少させる。ステップ208において、それぞれの周波数サブバンドに対する512のエネルギー値のアレイは、次に、
【0127】
【数3】
に従って、1024FFTの出力値の対称的なアレイから生成され、ここに、X(n)=XR(n)+iXI(n)は、n番目のスペクトル線のFFT出力である。
【0128】
以下において、値またはエンティティが、対数関数を評価することの結果として生成される場合には、値またはエンティティは、対数として記述されるか、または対数の領域にあるとして記述される。対数の値またはエンティティが、逆動作によって累乗されるときには、対数の値またはエンティティは、線形として記述されるか、または線形の領域にあるとして記述される。
【0129】
図16に示されるプロセスにおいて、線形のエネルギー値E(n)は、次に、P(n)=10log10E(n)に従って、ステップ210において対数のパワースペクトル密度(PSD)の値P(n)に転換され、線形のエネルギー値E(n)はもう使用されない。PSD値は、ステップ212において96dBに正規化される。ステップ210およびステップ212は、図17のマスク生成プロセス300からは省略される。
【0130】
両方のプロセスにおける次のステップは、各サブバンドに対する音圧レベル(SPL)の値を生成することである。図16のプロセスにおいて、SPL値Lsb(n)が、ステップ214において、
【0131】
【数4】
に従って、各サブバンドに対して生成され、ここに、scfmax(n)は、1152のサンプルを備えているMPEG1 L2の音声フレームの中のサブバンドnの3つのスケールファクターの最大値であり、X(k)は、指数kのPSD値であり、kに関する合計は、サブバンドnの範囲内にkの値が限定される。「−10dB」の項がピークレベルとRMSレベルとの間の差を補正する。
【0132】
図17のマスクモデリングプロセス300において、Lsb(n)は、ステップ302において、
【0133】
【数5】
に従って計算され、ここに、X(k)は指数kの線形のエネルギーの値である。「96dB」の項は、Lsb(n)を正規化するために使用される。これは、累乗を避けることによって、図16のプロセス200に改良を加えるということが明らかである。さらに、SPL値を生成する効率が、2次のテーラー展開式によって対数を概算することによって、明らかに改善される。特に、Iptとして対数の独立変数を表すので、
Ipt=(I−x)2m、0.5<1−x≦1
となるように、Iptは、最初に、xを決定することによって正規化される。
【0134】
2次のテーラー展開式を使用して
【0135】
【数6】
であり、対数は、
【0136】
【数7】
として概算され得る。
【0137】
従って、対数は4つの乗算と2つの加算とによって概算され、演算効率における顕著な改善を提供する。
【0138】
次のステップは、マスキングに対する周波数構成要素を同定することである。マスキング構成要素のトーンがマスキングの閾値に影響するので、トーンおよび非トーン(ノイズ)のマスキング構成要素が別々に決定される。
【0139】
第1に、局所的な最大値が同定される。
X(k)>X(k−1)およびX(k)≧X(k+1)
である場合には、スペクトル線X(k)は局所的な最大値とみなされる。
【0140】
図16のプロセス200において、このように同定された局所的な最大値X(k)は、X(k)−X(k+j)≧7dB
である場合には、ステップ216において、対数のトーンマスキング構成要素として選択され、ここに、jはkによって変化する検索領域である。X(k)がトーン構成要素であると分かった場合には、その値は、
Xtonal(k)=10log10(10X(k−1)/10+10X(k)/10+10X(k+1)/10)
によって置き換えられる。
【0141】
調査された周波数領域の範囲内の全スペクトル線は、次に、−∞dBに設定される。
【0142】
図17のマスクモデリングプロセス300において、局所的な最大値X(k)は、
X(k)・10−0.7≧X(k+j)
である場合には、ステップ304において、線形のトーンマスキング構成要素として選択される。
【0143】
X(k)がトーン構成要素であると分かった場合には、その値は、
Xtonal(k)=X(k−1)+X(k)+(k+1)
によって置き換えられる。
【0144】
調査された周波数領域の範囲内の全スペクトル線は、次に、0に設定される。
【0145】
いずれかのプロセスにおける次のステップは、臨界サブバンドの帯域幅の範囲内の非トーンマスキング構成要素の強度を同定および決定することである。所与の周波数に対して、人間の耳の基底板の同じ部分を活動させるその周波数周辺の周波数の最小帯域が、臨界帯域と呼ばれる。臨界帯域幅は、同時に起こるトーンに対する耳の分解力を表す。サブバンドの帯域幅は、特定の臨界帯域の中心周波数によって変化する。MPEG−1規格において記述されたように、26の臨界帯域が48kHzのサンプリング速度に対して使用される。非トーン(ノイズ)構成要素は、トーン構成要素が上記のように取り除かれた後に残っているスペクトル線から同定される。
【0146】
図16のプロセス200のステップ218において、各臨界帯域の範囲内の残りのスペクトル線の対数パワーが、線形のエネルギー値に転換されて合計され、それから対数パワー値に再転換され、臨界帯域に対応する新たな非トーン構成要素Xnoise(k)のSPLを提供する。数字kは、臨界帯域の幾何学的平均に最も近いスペクトル線の指数である。
【0147】
図17のマスクモデリングプロセス300において、各臨界帯域の範囲内の残りのスペクトル線のエネルギーは、ステップ306において加算され、サブバンドnにおけるkに対して、臨界帯域に対応する新たな非トーン構成要素Xnoise(k)
【0148】
【数8】
を提供する。加算演算のみが使用され、指数または対数の評価は必要とされず、効率において明らかな改良を提供する。
【0149】
次のステップは、トーンおよび非トーンのマスキング構成要素を10分の1にすることである。10分の1化は、包括的なマスキングの閾値を生成するために使用されるマスキング構成要素の数を削減するために使用される手順である。
【0150】
図16のプロセス200において、対数構成要素Xtonal(k)と非トーン構成要素Xnoise(k)とは、ステップ220において、それぞれ
Xtonal(k)-≧LTq(k)またはXnoise(k)≧LTq(k)
である場合にのみ、マスキング閾値を生成することに関する次の使用のために選択され、ここに、LTq(k)は、指数kの周波数における閾値の絶対値(またはクワイエットにおける閾値)であり、対数領域におけるクワイエットにおける閾値の値は、MPEG−1規格で提供される。
【0151】
10分の1化は、0.5バークを下回る距離の範囲内にある2つ以上のトーン構成要素において実行され、バークスケールは、上記のように、耳の周波数分解がほぼ一定である周波数スケールである(E.Zwicker、Subdivision of the Audible Frequency Range into Critical Bands、J.Acoustical Society of America、vol.33、p.248、1961年2月をまた参照)。最高パワーを有するトーン構成要素が維持され、より小さい構成要素が選択されたトーン構成要素のリストから取り除かれる。この動作に対して、臨界帯域領域におけるスライディングウインドウが0.5バークの幅で使用される。
【0152】
図17のマスクモデリングプロセス300において、線形の構成要素が、ステップ308において、
Xtonal(k)-≧LTqE(k)またはXnoise(k)≧LTqE(k)
である場合にのみ選択され、ここに、LTqE(k)は、
【0153】
【数9】
に従って、対数領域の閾値の絶対値の表LTq(k)から事前生成される線形領域の閾値の絶対値の表から取られ、ここに、「−96」の項は非正規化を表す。
【0154】
非正規化の後に、線形のエネルギー領域におけるスペクトルデータは、ステップ310において対数パワー領域に転換される。従来技術の処理のステップ206とは対照的に、対数の評価は、上記の効率的な2次概算方法を使用して実行される。この転換は、ステップ212における96dBの基準レベルに対する正規化が後に続く。
【0155】
マスキング構成要素を選択して10分の1化すると、次のステップは、個々のマスキング閾値を生成することである。kとインデックスを付された最初の512のスペクトルデータ値の中で、iとインデックスを付されたサブセットだけが次に使用され、包括的なマスキング閾値を生成し、本ステップは、ISO MPEG1に記述されているようなサブサンプリングによってそのサブセットを決定する。
【0156】
サブサンプリングされた周波数領域における線nの数は、サンプリング速度に依存する。48kHzのサンプリング速度に対しては、n=126となる。あらゆるトーンおよび非トーンの構成要素が、最初(すなわち、サブサンプリングする前)のスペクトルデータにおける対応するスペクトル線の周波数の最も近くに対応する指数iを割り当てられる。
【0157】
トーンおよび非トーンの両方の構成要素の個々のマスキング閾値、LTtonalおよびLTnoiseは、次に、以下の式を与えられる:
LTtonal[z(j),z(i)]=Xtonal[z(j)]+avtonal[z(j)]+vf[z(j),z(i)]dB
LTnoise[z(j),z(i)]=Xnoise[z(j)]+avnoise[z(j)]=vf[z(j),z(i)]dB
ここに、iは、スペクトル線に対応する指数であり、該指数において、マスキング閾値が生成され、jは、マスキング構成要素の指数である;z(i)は、i番目のスペクトル線のバークスケールの値であり、z(j)は、j番目の線のバークスケールの値である;形式X[z(j)]の項は、(トーンおよび非トーンの)マスキング構成要素のSPLである。マスキング指数と呼ばれる項avは、
avtonal=[−1.525−0.275・z(j)−4.5]dB
avnoise=[−1.525−0.275・z(j)−0.5]dB
によって与えられ、vfは、マスキング構成要素のマスキング関数であり、バークスケールにおける距離dz、dz=z(i)−z(i)に従って、異なる上側および下側の傾きを備えている。
【0158】
図16のプロセス200において、個々のマスキング閾値は、ステップ222において、
−3バーク≦dz<−1バークに対して、vf=17・(dz+1)−0.4・X[z(j)]−6dB
−1バーク≦dz<0バークに対して、vf={0.4・X[z(j)]+6}・dz dB
0バーク≦dz<1バークに対して、vf=−17・dz dB
1バーク≦dz<8バークに対して、vf=−17・dz+0.15・X[z(j)]v(dz−1)dB
によって与えられるマスキング関数vfを使用して計算され、ここに、X[z(j)]は、指数jを有するマスキング構成要素のSPLである。dz<−3バークまたはdz>8バークである場合には、マスキング閾値は生成されない。
【0159】
マスキング関数vfの評価は、このステップの最も演算に集中した部分である。マスキング関数は2つのタイプに分類され得る:下方マスキング(dz<0のとき)と上方マスキング(dz≧0のとき)であり、下方マスキングは上方マスキングよりもかなり重要ではない。結果として、上方マスキングのみが、図17のマスク生成プロセス300において使用される。1バーク≦dz<8バークに対するマスキング関数における第2項が、一般的に、第1項、−17・dzのほぼ10分の1であるということを、さらなる分析が示す。結果として、第2項は捨てられ得る。
【0160】
従って、図17のマスク生成プロセス300は、ステップ312において、以下のようなマスキング関数vfに対する単一の式を使用して、個々のマスキング閾値を生成する:vf=−17・dz、0≦dz<8
マスキング指数avは、図16のプロセス200において使用されたマスキング指数avから修正されない。なぜならば、それは個々のマスキング閾値LTに非常に寄与し、かつ、演算に労力を要しないからである。個々のマスキング閾値が生成された後に、包括的なマスキング閾値が生成される。
【0161】
図16のプロセス200において、i番目の周波数サンプルにおける包括的なマスキング閾値LTg(i)は、ステップ224において、
【0162】
【数10】
に従って、個々のマスキング閾値とクワイエットにおける閾値とに対応するパワーを合計することによって生成され、ここに、mは、トーンマスキング構成要素の全数であり、nは、非トーンマスキング構成要素の全数である。クワイエットにおける閾値LTqは、チャンネル毎に96kbps以上のビットレートに対して、−12dBだけ相殺される。このステップは、評価される指数および対数の数によって演算に労力を要しなくなるということが明らかである。
【0163】
図17のマスク生成プロセス300において、これらの評価は避けられ、より小さい項は使用されない。i番目の周波数サンプルにおける包括的なマスキング閾値LTg(i)は、ステップ314において、以下のように、個々のマスキング閾値とクワイエットにおける閾値とに対応するパワーを比較することによって生成される:
【0164】
【数11】
最大のトーンマスキング構成要素LTtonalと最大の非トーンマスキング構成要素LTnoiseとが同定される。次に、それらはLTqx(i)と比較される。これら3つの値の最大値が、i番目の周波数サンプルにおける包括的なマスキング閾値として選択される。これは割り当てに対する機会における演算の労力を減少させる。上記のように、クワイエットにおける閾値LTqは、チャンネル毎に96kbps以上のビットレートに対して、−12dBだけ相殺される。
【0165】
最後に、信号対マスク比の値が、両方のプロセスのステップ226において計算される。最初に、サブバンドnにおける最小マスキングレベルLTmin(n)は、以下の式によって決定される:
LTmin(n)=Min[LTg(i)]dB;サブバンドnにおいてfまたはf(i)
ここに、f(i)は、サブバンドnの範囲内のi番目の周波数線である。最小マスキング閾値LTmin(n)は、あらゆるサブバンドに対して決定される。あらゆるサブバンドnに対する信号対マスク比は、次に、対応するSPL値からそのサブバンドの最小マスキング閾値を減算することによって生成される:
SMsb=Lsb(n)−LTmin(n)
マスクモデルは、各サブバンドnに対する信号対マスク比のデータSMRsb(n)を量子化器に送信し、該量子化器はそれを使用して、MPEG−1規格に記述されているような、利用可能なデータのビットを最も効果的に割り当て、スペクトルデータを量子化する方法を決定する。
【0166】
上記の例における有用な効果は、自動車の乗客エリアにおける現在得られるノイズレベルとそのスペクトル属性との考慮から導き出され、該考慮のために、第2経路の伝達関数の決定のためのテスト信号が、乗客に聞こえないように選択される。存在するノイズレベルは、望ましくない邪魔な信号、例えば、風の外乱、車輪の回転音、および音響学的にモデリングされたエンジンノイズのような望まれないノイズ、ならびに一部の場合において、同時中継される音楽信号を含む。使用は、関連する音響心理学的必要条件が満足された場合に、不可聴情報が任意の所与の音声信号に加えられ得る効果で構成される。ここで提示された事例は、特に、マスキングの音響心理学的効果に及ぶ。
【0167】
さらなる利点が、音響心理学的マスキング方法が現在のノイズレベルに適応するように応答し、かつ、同時の(音楽のような)音声信号が、所望のマスキング効果を獲得するためには必ずしも必要ない局面から導き出され得る。
【0168】
本発明を実現する様々な例が開示されてきたが、本発明の精神と範囲を逸脱することなく、本発明の利点の一部を達成する様々な変更および改変が行われ得るということが当業者には明らかである。同じ関数を実行する他の構成要素が適切に置換され得るということが当業者には明らかである。本発明の概念に対するこのような改変は、添付の特許請求の範囲によって包含されることが意図されている。
【特許請求の範囲】
【請求項1】
本願明細書に記載された発明。
【請求項1】
本願明細書に記載された発明。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【公開番号】特開2012−230412(P2012−230412A)
【公開日】平成24年11月22日(2012.11.22)
【国際特許分類】
【外国語出願】
【出願番号】特願2012−158559(P2012−158559)
【出願日】平成24年7月17日(2012.7.17)
【分割の表示】特願2008−3045(P2008−3045)の分割
【原出願日】平成20年1月10日(2008.1.10)
【出願人】(504147933)ハーマン ベッカー オートモーティブ システムズ ゲーエムベーハー (165)
【Fターム(参考)】
【公開日】平成24年11月22日(2012.11.22)
【国際特許分類】
【出願番号】特願2012−158559(P2012−158559)
【出願日】平成24年7月17日(2012.7.17)
【分割の表示】特願2008−3045(P2008−3045)の分割
【原出願日】平成20年1月10日(2008.1.10)
【出願人】(504147933)ハーマン ベッカー オートモーティブ システムズ ゲーエムベーハー (165)
【Fターム(参考)】
[ Back to top ]