説明

オーディオ信号におけるラウドネスレベルの自動補正

【課題】異なる信号レベル範囲を有する少なくとも2つの異なるトラックを含むオーディオ出力信号の利得を適応させる方法およびシステムを提供すること。
【解決手段】上記方法は、人間の聴覚の精神音響モデルに基づいてオーディオ入力信号の知覚されたラウドネスを動的に決定するステップと、利得決定ユニット(35)によって出力された該オーディオ出力信号の利得を動的に決定するステップであって、該利得決定ユニット(35)は、該知覚されたラウドネスを受信し、該決定された利得で該オーディオ出力信号を出力し、該利得は、信号レベルの所定の範囲またはラウドネス範囲をカバーする該オーディオ出力信号の該少なくとも2つのトラックが出力されるように決定される、ステップとを包含する。

【発明の詳細な説明】
【技術分野】
【0001】
(技術分野)
本発明は、異なる信号レベル範囲を有する少なくとも2つの異なるトラックを含むオーディオ出力信号の利得を適応させる方法およびそのためのシステムに関する。
【背景技術】
【0002】
(背景)
当該技術において、音楽および/または話を含むオーディオ信号の多くの異なる供給源が公知である。音楽信号は、CD、DVDまたは任意の他の記憶媒体に格納され得る。特にMPEGなどの新しい圧縮方式の発達と共に、異なるジャンルおよびアーティストを有するオーディオ信号は、記憶媒体に格納され、ユーザに対して再生されるプレイリストに結合され得る。特に車両環境において、乗員によって知覚されるオーディオ信号は、オーディオ信号自体と、路面タイヤノイズと、空気力学ノイズと、エンジンノイズとを含む。異なる音響源の異なるオーディオ信号はしばしば、異なる信号出力および動力学圧縮レベルを有する。しばしば、オーディオ出力信号の異なるトラックは、異なるラウドネスレベルを有するユーザによって知覚される異なる信号レベル範囲を有する。特に車両環境において、受信されたオーディオ信号はユーザに知覚可能であるべきであり、このことはオーディオ信号が車両に存在するノイズを超えなければならないことを意味する。同時に全オーディオ信号レベルは、聴覚損傷が引き起こされ得るかまたは知覚がユーザにとって痛みを伴うような特定のレベルを超えるべきではない。
【発明の概要】
【発明が解決しようとする課題】
【0003】
(概要)
従って、特にノイズの多い環境においてオーディオ信号のラウドネスレベルのダイナミック自動補正を可能にするニーズが存在する。また、例えば夜間のホームシアターなど、映画音または音楽を聴くことが特定のラウドネスを超えるべきではない環境において、ラウドネスレベルのダイナミック自動補正が必要とされる。
【課題を解決するための手段】
【0004】
このニーズは、独立請求項の特徴によって満たされる。従属請求項において本発明の好ましい実施形態が説明される。
【0005】
本発明の第1の局面に従って、異なる信号レベル範囲を有する少なくとも2つの異なるトラックを含むオーディオ出力信号の利得を適応させる方法が提供される。方法は、人間の聴覚の精神音響モデルに基づいてオーディオ入力信号の知覚されたラウドネスを動的に決定するステップを包含する。さらに、決定されたラウドネスを受信し、オーディオ出力信号を出力する利得決定ユニットによって出力されるオーディオ出力信号の利得は、動的に決定され、ここで、利得は、上記のオーディオ出力信号の少なくとも2つのトラックが信号レベルの所定の範囲内で出力されるように決定される。異なるトラックが所定の範囲内で出力されるように出力信号レベルを自動的に適応させることによって、異なるトラックに対する1つの等価ラウドネスが得られ得る。さらに、ユーザによる音量調整はもはや必要ない。特に、高信号圧力レベルSPLを有するトラックまたはオーディオ信号の音量の減少は回避されると共に、比較的低い信号圧力レベルを有するオーディオ信号の場合、音量の増加となる。従って、オーディオ信号のダイナミック構造を保存しながら、すべての異なるオーディオ信号源の等価ラウドネスを有することが可能である。異なるトラックは、同じオーディオ信号における再生のために提供され得るかまたは異なる信号源または記憶媒体から生じ得る。
【0006】
ラウドネスは、上記の精神音響モデルのみを用いるかまたはオーディオ入力信号の信号統計学と組み合せて決定され得る。
【0007】
好ましい実施形態に従って、方法は、上記少なくとも2つの異なるトラック間にまたはノイズが主要なオーディオ入力信号であるトラック内に一時停止を決定するステップを包含する。ノイズを有するそのような一時停止が検出されると、ノイズの増幅を回避するために、決定された一時停止において利得は減少させられる。本発明の一実施形態において、オーディオ入力信号が両耳の局在性(localization)モデルに基づいてオーディオ入力信号を聴く聴取者によって知覚されるように、オーディオ入力信号の空間知覚のシミュレーションを用いて入力信号が局在化され得るか否かを決定することによって、ノイズは、オーディオ入力信号において検出される。人間の聴覚の上記の精神音響モデルを用いて音響入力信号を局在化する(localize)ことが可能な場合、オーディオ入力信号は、ノイズであるとはみなされない。しかしながら、オーディオ入力信号が局在化され得ない場合、オーディオ入力信号は主としてノイズを含んでいるとみなされる。その結果、ノイズを含むオーディオ信号のみのラウドネスの増加を回避することが可能である。一時停止が例えば10ms〜100ms、好ましくは約50msの所定の期間にわたり検出された場合、利得は一時停止に対して減少させられる。従って、非常に短期間音楽信号が含まれないトラック中に利得を低下させることを回避するために、一時停止が例えば50msを超えて検出された場合のみ、利得が低下させられる。しかしながら、オーディオ入力信号がより多くの情報を含み、入力信号レベルが非常に低い場合、利得は、従って、オーディオ出力信号が信号レベルの所定の範囲をカバーするように利得を増加させることによって適応させられる。従って、高すぎるオーディオ入力レベルを有するオーディオ入力信号は、信号レベルの所定の範囲がカバーされるように、利得を制御することによって低下させられ、入力オーディオレベルが低くすぎる場合、利得は、信号レベルの同じ範囲をカバーするために増加させられる。局在性モデルは、入力信号の局在性に基づいて、一時停止検出のために用いられ得る。局在性モデルはさらに、ラウドネスを推定するために用いられ得る。
【0008】
通常、オーディオ信号は、試料ごとの処理と比較して、処理時間を節約するためにブロックで処理される。本発明の一実施形態に従って、各ブロックの利得は時定数を用いて決定され、この時定数は、一信号ブロックから次の信号ブロックへのラウドネスの変化を記述する。この実施形態において、上昇時定数は、2つの連続ブロック間で上昇信号ラウドネスを記述するために用いられ、下降時定数は、2つの連続ブロック間で下降ラウドネスを記述するために用いられる。ブロックは、デジタルオーディオ入力信号の1つまたはいくつかの信号試料を含む。好ましくは、時定数は、下降時定数がラウドネス減少を可能にするよりも上昇時定数がより速いラウドネス増加を可能にするように構成される。速いラウドネスの増加は、信号一時停止後の新トラックの始めに必要であり、ここで、一ブロックから他のブロックにラウドネスを突然増加させることが必要である。2つのブロック間のできる限り低いラウドネスの減少は、オーディオ信号に最初に含まれる増加したラウドネスのダイナミックを維持することを可能にする。
【0009】
好ましくは、時定数は、適応時定数であり、ここで、適応時定数は、トラックの始めにおいてトラック中のより後のとき、より速く変化することを可能にするように適応される。このことは、トラックの始めにおいてラウドネスの速い適応を可能にし、それにもかかわらず、例えば音楽トラックなどオーディオ信号に含まれるダイナミックを維持することを助ける。特にクラシック音楽に含まれる音楽トラックにおいて、信号に最初に含まれるような信号レベルのダイナミックは、維持される。
【0010】
好ましくは、2つのトラック間に一時停止が検出されると、適応時定数はリセットされる。オーディオ信号源の一部のユーザは、適応ラウドネスに対して利得を適応させることなく、最初のオーディオ信号のダイナミックレンジを維持したいと考えることは可能である。この目的のために、利得決定ユニットによって決定される決定利得の量がユーザによって適応され得るように、利得決定ユニットによって決定される利得をさらに制御することが可能である。実施例として、自動的かつ動的に適応される利得が100%用いられることを示すことが可能であり得る。しかしながら、利得決定ユニットによって決定される決定利得がオーディオ出力信号レベルに対して全く考慮されないように、利得適応を制御することも可能である。
【0011】
さらに、オーディオ入力信号は、オーディオ入力信号が出力される前に遅延され得、遅延は、適応利得を決定するために必要である時間に対応する。この遅延は、一定であり得るか、または適応利得の計算によって変化し得る。
【0012】
本発明はさらに、上記に説明されるように、利得を適応させるシステム関し、システムは、人間の聴覚の精神音響の両耳のモデルに基づいて、そして最終的には音楽入力信号の信号統計学またはこれらの両方の組み合わせに基づいてオーディオ入力信号のラウドネスを動的に決定するラウドネス決定ユニットを備えている。利得決定ユニットは、決定ラウドネスを受信するシステムに備え付けられ、利得決定ユニットは、適応利得を有する音楽出力信号を出力し、ここで、利得決定ユニットは、オーディオ出力信号の少なくとも2つのトラックが信号レベルの所定の範囲をカバーするようにそのオーディオ出力信号の少なくとも2つのトラックが出力されるように、音楽出力信号の利得を動的に決定する。
【0013】
オーディオ分析ユニットは、入力信号を局在化する可能性を分析するかまたは信号統計学を用いることによって、上記のように一時停止を決定する。音楽分析ユニットは、入力信号の空間適応のシミュレーションを用いて、オーディオ入力信号を局在化するように試みる。聴取者によって知覚されるような音楽入力信号の空間知覚を用いる局在化の仕方の一実施形態は、EP1522868に説明される。局在性のさらなる詳細に関して、この文書に対する参照がなされる。さらなる詳細はまた、Audio Engineering Society Convention Paper 5864、115th Convention、October 2003におけるWolfgang Hessらによる「Acoustical Evaluation of Virtual Rooms by Means of Binaural Activity Patterns」に見出され得る。信号源の局在性に関して、Journal of Acoustic Society of America、December 1986、p.1608−1622、Vol.80(6)におけるW.Lindemann「Extension of a Binaural Cross−Correlation Model by Contralateral Inhibition.I.Simulation of Lateralization for Stationary Signals」に参照がさらになされる。
【0014】
オーディオ分析ユニットは、上記に説明されるように適応時定数を決定し、一時停止が検出されると適応時定数をリセットする。オーディオ信号の異なるトラックは、上記の一時停止検出を用いて異なるトラックの内容を認識することによって分離され得る。システムは、利得制御ユニットを備え得、利得制御ユニットは、決定利得が出力信号の出力信号レベルに対して用いられる量がどのくらいかを決定するように利得を制御するように構成される。この利得制御ユニットはユーザインタフェースによって制御され、ユーザインタフェースはオーディオ出力信号の信号レベルを制御するために決定利得が用いられる程度をユーザが選択することを可能にする。
【0015】
さらに、遅延要素が存在し得、遅延要素は、オーディオ入力信号が制御利得と共に出力される前にその遅延時間をオーディオ入力信号に導入する。遅延要素は、適応利得を決定するのに必要である遅延時間に対応する遅延を導入する。
【0016】
例えば、本発明は以下の項目を提供する。
(項目1)
異なる信号レベル範囲を有する少なくとも2つの異なるトラックを含むオーディオ出力信号の利得を適応させる方法であって、該方法は、
人間の聴覚の精神音響モデルに基づいてオーディオ入力信号の知覚されたラウドネスを動的に決定するステップと、
利得決定ユニット(35)によって出力された該オーディオ出力信号の利得を動的に決定するステップであって、該利得決定ユニット(35)は、該知覚されたラウドネスを受信し、該決定された利得で該オーディオ出力信号を出力し、該利得は、信号レベルの所定の範囲またはラウドネス範囲をカバーする該オーディオ出力信号の該少なくとも2つのトラックが出力されるように決定される、ステップと
を包含する、方法。
(項目2)
上記少なくとも2つの異なるトラック間またはノイズがオーディオ入力信号の主要な部分であるトラック内で一時停止を決定するステップをさらに包含し、上記利得は該決定された一時停止において減少させられ、両耳の局在性モデルに基づいて該オーディオ入力信号を聴く聴取者によって知覚されるように、該オーディオ入力信号の空間知覚のシミュレーションを用いて該入力信号が局在化され得るか否かを決定することによって、該ノイズが該オーディオ入力信号において検出される、上記項目のいずれかに記載の方法。
(項目3)
上記知覚されたラウドネスは、上記オーディオ入力信号の信号統計学に基づいてさらに決定される、上記項目のいずれかに記載の方法。
(項目4)
上記オーディオ入力および出力信号の各々は、音楽信号の連続ブロックを含み、各ブロックのラウドネスは、時定数を用いて決定され、該時定数は、一つのブロックから次のブロックへのラウドネスの変化を記述する、上記項目のいずれかに記載の方法。
(項目5)
上昇時定数は2つの連続ブロック間の上昇ラウドネスを記述するために用いられ、下降時定数は2つの連続ブロック間の下降ラウドネスを記述するために用いられ、上記時定数は、ラウドネスの減少を該下降時定数が可能にするよりも速いラウドネス増加を該上昇時定数が可能にするように該時定数が構成される、上記項目のいずれかに記載の方法。
(項目6)
上記時定数は、適応時定数であり、該適応時定数は、トラックの始めにおいて該時定数が該トラック中のより後のときより速く変化することを可能にするように適応させられる、上記項目のいずれかに記載の方法。
(項目7)
上記適応時定数は、2つのトラック間において一時停止が検出されるとリセットされ、該一時停止は、両耳の局在性モデルを単独または信号統計学モデルとの組み合わせを用いて上記オーディオ入力信号が局在化され得るか否かを決定することによって検出される、上記項目のいずれかに記載の方法。
(項目8)
上記利得決定ユニット(35)によって決定される上記利得を制御するステップをさらに包含し、該利得は、該決定された利得のどの量が上記オーディオ出力信号のオーディオ出力信号レベルを決定するかを決定するように該利得決定ユニットによって決定される、上記項目のいずれかに記載の方法。
(項目9)
上記オーディオ入力信号が出力される前に該オーディオ入力信号に遅延時間を含めるステップをさらに包含し、該遅延時間は、上記オーディオ出力信号に対する利得を決定するのに必要である時間に対応する、上記項目のいずれかに記載の方法。
(項目10)
異なる信号レベル範囲を有する少なくとも2つの異なるトラックを含むオーディオ出力信号の利得を適応させるシステムであって、該システムは、オーディオ入力信号を受信し、適応した利得で該オーディオ出力信号を出力し、該システムは、
人間の聴覚の精神音響モデルに基づいて該オーディオ入力信号のラウドネスを動的に決定するラウドネス決定ユニット(31)と、
該決定したラウドネスを受信し、適応した利得で該オーディオ出力信号を出力する利得決定ユニット(35)であって、該利得決定ユニット(35)は、信号レベルの所定の範囲をカバーする該オーディオ出力信号の該少なくとも2つのトラックが出力されるように、該オーディオ出力信号の利得を動的に決定する、利得決定ユニット(35)と
を備えている、システム。
(項目11)
一時停止検出ユニット(33)をさらに備え、該一時停止検出ユニット(33)は、上記オーディオ入力信号を聴く聴取者によって知覚されるような該オーディオ入力信号の空間知覚のシミュレーションを用いて該オーディオ入力信号が局在化され得るかどうかを決定することによって、上記少なくとも2つの異なるトラック間またはノイズがオーディオ入力信号の主要部分であるトラック内で一時停止を決定し、上記利得決定ユニット(35)は該決定された一時停止における利得を減少させる、上記項目のいずれかに記載のシステム。
(項目12)
上記オーディオ入力および出力信号の各々のトラックは、オーディオ信号の連続ブロック(25)を含み、時定数発生ユニット(32)は、該オーディオ入力信号の該連続ブロックに対する時定数(26)を決定し、該時定数(26)は、一つのブロックから次のブロックへのラウドネスの変化を記述し、上記利得決定ユニット(35)は、該時定数に基づいて該オーディオ出力信号の利得を決定する、上記項目のいずれかに記載のシステム。
(項目13)
上記時定数発生ユニット(32)は、2つの連続ブロック間の上昇ラウドネスを記述する上昇時定数と、2つの連続ブロック間の下降ラウドネスを記述する下降時定数とを用い、該時定数発生ユニットは、該下降時定数が利得減少を可能にするよりも該上昇時定数がより速い利得増加を可能にするように、該時定数を決定する、上記項目のいずれかに記載のシステム。
(項目14)
上記時定数発生ユニット(32)は、上記時定数が適応時定数であり、該適応時定数が、トラックの始めにおいて該トラック中のより後のとき、より速くブロックごとに変化し得るように、該時定数を決定する、上記項目のいずれかに記載のシステム。
(項目15)
上記時定数発生ユニット(32)は、該時定数発生ユニット(32)が2つのトラック間で一時停止を検出すると、上記時定数をリセットする、上記項目のいずれかに記載のシステム。
(項目16)
利得制御ユニット(41)をさらに備え、該利得制御ユニット(41)は、決定される利得が上記オーディオ出力信号のオーディオ出力信号レベルに影響を及ぼす量がどのくらいかを該利得制御ユニットが決定するように、該利得決定ユニットによって決定される利得を制御するように構成される、上記項目のいずれかに記載のシステム。
(項目17)
遅延要素(42)をさらに備え、該遅延要素(42)は、上記オーディオ入力信号が出力信号として出力される前に該オーディオ入力信号の中に遅延時間を導入し、該遅延要素は、該オーディオ出力信号に対する利得を決定するために必要である時間に対応する遅延時間を導入する、上記項目のいずれかに記載のシステム。
【0017】
(摘要)
(オーディオ信号のラウドネスレベルの自動補正)
本発明は、異なる信号レベル範囲を有する少なくとも2つの異なるトラックを含むオーディオ出力信号の利得を適応させる方法に関し、方法は、
−人間の聴覚の精神音響モデルに基づいてオーディオ入力信号の知覚されたラウドネスを動的に決定するステップと、
−利得決定ユニット(35)によって出力されたオーディオ出力信号の利得を動的に決定するステップであって、利得決定ユニット(35)は、知覚されたラウドネスを受信し、決定された利得を有するオーディオ出力信号を出力し、ここで、利得は、信号レベルの所定の範囲またはラウドネス範囲をカバーするオーディオ出力信号の上記少なくとも2つのトラックが出力されるように決定される、ステップとを包含する。
【0018】
本発明は、添付の図面を参照してさらに詳細に説明される。
【図面の簡単な説明】
【0019】
【図1】図1は、ノイズ成分およびオーディオ成分を含む車両内音響の成分を概略的に示す。
【図2】図2は、ラウドネスを滑らかにするための異なる時定数、すなわちラウドネスを増加させる高速反応およびラウドネスレベルを減少させる際の遅延反応である時定数を含む、オーディオ入力信号および利得適応のない場合の推定されるラウドネスの例を示す。
【図3】図3は、オーディオ入力信号のダイナミックレベル調整を示し、オーディオ入力信号は自動ラウドネス調整に対して調整され、全信号内容が既知である場合、理想的に補正されるべきであるので、−12平均ラウドネス線が示される。
【図4】図4は、オーディオ出力信号の利得を適応させるために用いられるシステムを概略的に示す。
【図5】図5は、オーディオ入力信号のラウドネスを決定するために用いられるオーディオ分析ユニットのより詳細な図を示す。
【図6】図6は、オーディオ信号に時定数を導入して、一ブロックから別のブロックへの利得変化を表すことを概略的に示す。
【図7】図7は、自動ラウドネス適応なしのオーディオ入力レベルと、自動ラウドネス適応を有するオーディオ入力信号レベルとを示す。
【図8】図8は、自動ラウドネス適応の前および後のオーディオ入力信号の別の例を示す。
【発明を実施するための形態】
【0020】
(詳細な説明)
図1から見られ得るように、用いられる車両によって異なる周囲ノイズが車両の占有者によって知覚される。車両音響信号は、ノイズ成分10と、オーディオ信号成分20とを含む。ノイズ信号成分10は、路面タイヤノイズ、空気力学ノイズ、またはエンジンノイズの原因により得る。図1の右の部分において、車両速度による異なる車両に対するノイズが示される。曲線11は、ロードスター(Roadster)またはスポーツカーによって引き起こされるようなノイズを説明し、一方、曲線12はSUVの速度依存ノイズを示す。見られ得るように、ノイズは、60〜85dBのSPL(信号圧力レベル)の値を有し得る。聴覚痛(hearing pain)閾値は約120dB SPLであるので、オーディオ信号成分の範囲は20〜40dB SPLである。
【0021】
図2の上方部分において、オーディオ入力信号の信号レベルがフルスケールで示され、0dBフルスケール(0dBFS)がデジタルドメインにおける最大限の信号レベルに割り当てられることを意味し、dBフルスケールは、フルスケールに対するデシベルを意味する。図2の上方部分から見られ得るように、信号レベルおよび従ってユーザによって知覚される信号に対応するラウドネスレベルは、かなり変化する。図2の下方部分において、対応するラウドネスは、信号入力レベルから推定された。ラウドネス推定に対する1つの可能性は、Recommendation ITU−RBS.1770−1(「Algorithms to Measure Audio Program Loudness and to a Peak Audio Level」)に説明されている。本出願において、ラウドネスは、両耳の局在性(binaural localization)モデルによって推定され得る。図2に示されるような音響信号が車両内においてユーザに演奏される場合、オーディオ信号のいくつかの部分は不快なラウドネスで知覚され得、一方、オーディオ信号の他の部分は、低すぎてユーザによって正しく知覚されないと考えられ得る。図3において、図2の信号の理想的に調整されたレベルが示される。実施例として、範囲21における信号試料はより低い信号レベルに適応されるべきであり、一方、範囲22における信号はユーザによる良好な知覚のためにより高い信号レベルに適応されるべきである。同様に、範囲23における信号は、強く減少させられた信号レベルで出力されるべきである。実施例として、図2に示される異なる試料は、記憶媒体(例えば、ハードディスク)などの単一の信号源において提供されるオーディオ信号の種々のトラックから起こり得る。別の実施形態において、音楽の異なるトラック/楽曲は異なるオーディオ信号源から起こり得、例えば、第1のトラックはCD/DVDにおいて提供され、一方、演奏されるもう一方のトラックは、音楽信号がMP3などの圧縮形式で格納され得るハードディスクにおいて提供される。2つのトラックはまた、両方とも、圧縮形式または非圧縮形式でハードディスクに格納され得る。
【0022】
図3の下方部分において、上方部分における理想的に調整されたレベルの対応する推定されるラウドネスが示される。図2の下方部分が図3の下方部分と比較される場合、図3に示されるようなラウドネス評価は、図2に示されるようなラウドネス評価より好まれることが推論され得る。図3のラウドネス評価は、図2のラウドネス評価より良好に知覚され得る。滑らかな比較的一定のラウドネスは、ここで到達され、視覚化される。
【0023】
図4において、ラウドネスが図3の実施形態において概略的に示されるように適応され得るシステムが示される。示されるシステムは、オーディオ信号分析ユニット30を備え、オーディオ信号分析ユニット30において、娯楽オーディオ信号などのオーディオ入力信号のラウドネスは、人間の聴覚の精神音響局在性モデルを用いて、そして信号静力学を用いて決定される。オーディオ入力信号19は、利得制御ユニット41と遅延要素42とを備えている信号コントローラ40に入力される。利得制御ユニットによって決定される利得はユーザインタフェース50を用いて制御され、ここで、オーディオ出力信号がスピーカ60を介して後処理段に出力されるかまたはオーディオ出力信号が後処理段に供給される前に、利得決定ユニットによって決定される利得がオーディオ出力信号19に用いられるかどうかまたはどの程度までオーディオ出力信号19に用いられるかということが決定され得る。娯楽オーディオ信号またはオーディオ入力信号は、2.0、5.1または7.1のオーディオ信号またはオーディオ信号分析ユニットおよび信号コントローラ40にオーディオ信号18として入力される別の形式であり得る。
【0024】
信号分析ユニット30において、ラウドネスが人間の聴覚の精神音響モデルに基づいてそして信号統計学に基づいて決定されることが記号により示される。精神音響モデルは、音のラウドネス、局在性を推定し、ノイズが例えば一時停止中または2つのトラックの間でオーディオ入力信号に主要因として存在するかどうかを決定するために用いられる。信号統計学は、ラウドネスを決定するかまたは推定し、ノイズを有する一時停止がオーディオ信号に存在するかどうかを決定するための第2の基礎である。実施例として、娯楽オーディオ信号の信号強度が決定され得る。以下にさらに詳細に説明されるように、精神音響モデルのみに基づきまたは統計信号モデルとの組み合わせで、ラウドネス適応は、適応時定数を動的に決定することによって決定される。
【0025】
図5において、オーディオ信号分析ユニット30のより詳細な図が示される。オーディオ信号分析ユニットは、受信されたオーディオ入力信号のラウドネスを推定するラウドネス決定ユニット31を備えている。ラウドネス決定ユニット31は、当該分野において公知の方法、とりわけITU−R BS 1770−1に説明されるような方法を用いてラウドネスを決定し得る。ラウドネス決定ユニットはさらに、人間の聴覚の両耳のモデルを用い得、ラウドネスを決定し得、ユーザがオーディオ入力信号18を聞くとき該オーディオ入力信号18がユーザによって局在化され得るかどうかそしてユーザによって局在化され得る場所を決定し得る。この両耳のモデルは、オーディオ入力信号の空間知覚をシミュレートし、オーディオ入力信号が主としてノイズまたは音楽もしくは話などの任意の他の入力信号を含むかどうかを決定することを可能にする。オーディオ入力信号の局在性は、本出願において前述された文書、主として、W.Lindemannの文書または上記のAudio Engineering Society Convention Paper 5864における欧州特許第1522868号にさらに詳細に説明される。この局在性技術は、他の音響信号からノイズを区別することを可能にし、オーディオ入力信号においてノイズのみが検出された場合、このノイズが利得の増加と共に出力されることを回避するのを助ける。この局在性技術はまた、一時停止が検出されたとき適応時定数をリセットすることを可能にする。ラウドネス決定ユニットは、人間の聴覚の精神音響モデルを用いてオーディオ入力信号のラウドネスを推定する。
【0026】
さらに、オーディオ入力信号のラウドネスを推定し、信号一時停止を検出するために、ラウドネス決定ユニット31は、さらに統計学的信号処理を用い得る。オーディオ入力信号の統計学的分析において、オーディオ入力信号の異なる試料の実際の信号レベルが決定される。実施例として、入力信号のいくつかの連続試料の信号レベルがガウス分布に従う場合、処理された試料がノイズを含み、他のオーディオ信号を含まないことが推論され得る。
【0027】
オーディオ信号分析ユニットは、次いで、オーディオ入力信号の中に導入される時定数を計算するラウドネス推定の結果を用いる。図5において、時定数の計算は、時定数発生器32によって記号化される。
【0028】
オーディオ信号分析ユニット30は、オーディオ出力信号17の利得を適応させる利得決定ユニット35をさらに備えている。ラウドネス決定ユニット31は、dBラウドネス等価(dBLEQ)を放出することによって、音楽入力信号の特定の部分、例えばいくつかの試料を含むブロックに対しラウドネスを提供する。利得決定ユニットは、オーディオ信号を出力するときに満たされるべき所定の信号レベル、例えば図7および図8における図の下方部分において示されるように−12dB、または任意の他の信号レベル閾値を有する。利得決定ユニットにおいて、決定されたラウドネスは、利得を計算するために、得られるべき平均信号レベルから引かれる。実施例として、決定されたラウドネスが−5dBに対応し、目標が−12dBフルスケールである場合、利得は、それに従って、約−12dBの平均信号レベルを有するために利得を減少させることによって適応されなければならない。
【0029】
図6において、オーディオ入力信号の異なる試料25が、時定数26によって分離されて示される。時定数26は、ラウドネスが1つの試料から次の試料に適応される仕方を示す。時定数は、上昇時定数または下降時定数であり得る。上昇時定数は、信号利得が1つの試料から次の試料に増加させられる仕方を示し、一方、下降時定数は、利得が1つの試料から次の試料への利得減少を示す。時定数26は、上昇時定数が下降時定数よりはるかに速い速度で適応され得るように決定される。実施例として、信号一時停止が2つのトラックの間または1つのトラック内に決定される場合、オーディオ信号レベルは、ノイズの増幅を回避するために増加させられるべきではない。新トラックが開始した場合、高い信号レベルが非常に低い信号レベルの直後に起こり得る。ラウドネス推定の上昇時定数は、新トラックの始めに信号レベルが激しく増加させられるのを回避するために、それに従って適応させられなければならない。オーディオ信号レベルの減少の場合、下降時定数は、増加と比較して信号レベルのより遅い減少を可能にするだけである。さらに、時定数は、トラックが長ければ長いほど時定数の反応が遅いことを意味する適応時定数である。これは、時定数を増加させ、減少させることに対して有効であり得る。滑らかにされたラウドネス推定はまた、人間がラウドネスを知覚するような方法でラウドネス推定を保証する。ピークおよびディップは、人間の聴覚系によってすべて滑らかにされる。時定数がオーディオトラックの時間の増加と共に遅くなるように変化するという事実は、オーディオ信号のダイナミックスを維持することを助ける。しかしながら、音楽信号の長いランタイムに到達したときも、増加するラウドネスのより短い反応時間は、信号増加を早める適切な反応を保証する。
【0030】
図6の下方部分において、利得増加および利得減少は、時間の経過に従って音楽信号に対して示される。音楽試料の第1のブロック61に対して第1の利得は、示されるように決定される。続く信号ブロック62に対して増加した利得が決定され、その後わずかに減少した利得を有する信号ブロック63が続く。時定数を用いるラウドネス適応に基づいて、各ブロックに対する利得、すなわち各ブロックに対する目標利得が決定される。ブロックnに対する目標利得は、次いでその前のブロックn−1の目標利得から開始する線形のランプにおいて達成される。
【0031】
1つのトラックにおける一時停止または2つトラック間の一時停止が決定された場合、時定数はリセットされ得る。信号分析ユニット30において実行される一時停止検出またはトラック検出は、一時停止検出ユニット33およびトラック検出ユニット34によって記号化される。図5の実施形態において、ラウドネス決定ユニット31、時定数発生器32、一時停止検出ユニット33およびトラック検出ユニット34、ならびに利得決定ユニット35は、別個のユニットとして示される。しかしながら、異なるユニットがより少ないユニットに組み入れられ得ることおよび複数のユニットがいくつかのユニットまたは1つのユニットにさえ組み合わされ得ることは当業者とって明らかのはずである。さらに信号分析ユニットは、ハードウェア要素もしくはソフトウェアまたはハードウェアとソフトウェアとの組み合わせによって設計され得る。
【0032】
以下にさらに説明されるように、信号分析ユニットの信号出力17は、オーディオ入力信号の利得を制御する利得制御ユニット41に入力される。信号制御ユニット40は、信号分析ユニットにおいて利得を決定するために必要であるオーディオ入力信号18の中に遅延を導入する遅延要素をさらに含む。遅延要素は、信号分析ユニット30によって処理された信号がオーディオ信号に対応する正しい時定数(正しい時定数はオーディオ信号に対して決定された)を用いて実際に制御されることを確実にするように助ける。
【0033】
利得制御ユニット41は、利得決定ユニット35によって決定される利得が実際に信号出力レベルに影響を及ぼす量がどのくらいかを決定することを助ける。この目的のためにユーザインタフェース50が備え付けられ、ユーザインタフェース50においてユーザは、出力のためにオーディオ信号分析ユニット30による利得補正が用いられるパーセンテージを示し得る。信号17に存在するように利得の100%が出力される場合、利得決定ユニットによって決定される値は、引き継がれる。しかしながら、ユーザが利得適応を望まない場合、例えば、一曲の音楽においてラウドネスの進化を維持することを望む場合もまた起こり得る。この例において、ユーザは、利得制御ユニット41における適応を0%に設定し得、このことは、ユニット30において決定されるような補正が出力のために用いられないことを意味する。利得制御ユニットにおける利得補正の音量は、例えば、0%〜100%の係数を設定することによって決定され得る。0%の係数が設定される場合、利得は、時定数の影響なく決定される。
【0034】
図7において、自動ラウドネス適応が示される。図7の上方部分において、ラウドネス推定の前のオーディオ入力信号18が示される。オーディオ入力信号2つのチャネルからわかり得るように、入力信号は異なる入力レベル範囲をカバーする。最大入力レベルは、0dBフルスケールであり得る。図7の下方部分において、ラウドネス推定および利得適応後のオーディオ出力信号19が示される。図7の下方部分からわかり得るように、平均信号レベルは−12dBフルスケールに設定される。同時にオーディオ信号のダイナミック構造は保存される。
【0035】
図8において、入力レベルが−20dBフルスケールの最大入力レベルを有する別の実施例が示される。図8の下方部分において、ラウドネス推定および利得適応後のオーディオ出力信号19が示される。再び、ダイナミック構造は保存され、平均信号レベルは再び−12dBフルスケールである。図7および図8の上方部分に示される入力信号がユーザに出力されると、ユーザは、不快なほど高い信号レベルを回避し、信号レベルが聞くのに低く過ぎるオーディオ信号の部分に対する信号を増加させるために、しばしば音量を調整しなければならない。
【0036】
システムは、出力の前にラウドネスを推定し、自動的かつ動的に利得を調整するので、本出願によって、ユーザによる頻繁な音量調整はもはや必要ない。
【符号の説明】
【0037】
10 ノイズ成分
11 曲線
12 曲線
18 オーディオ入力信号
19 オーディオ出力信号
20 オーディオ信号成分
30 オーディオ信号分析ユニット
31 ラウドネス決定ユニット
40 信号制御器
41 利得制御ユニット
42 遅延要素
50 ユーザインタフェース

【特許請求の範囲】
【請求項1】
異なる信号レベル範囲を有する少なくとも2つの異なるトラックを含むオーディオ出力信号の利得を適応させる方法であって、該方法は、
人間の聴覚の精神音響モデルに基づいてオーディオ入力信号の知覚されたラウドネスを動的に決定するステップと、
利得決定ユニット(35)によって出力された該オーディオ出力信号の利得を動的に決定するステップであって、該利得決定ユニット(35)は、該知覚されたラウドネスを受信し、該決定された利得で該オーディオ出力信号を出力し、該利得は、信号レベルの所定の範囲またはラウドネス範囲をカバーする該オーディオ出力信号の該少なくとも2つのトラックが出力されるように決定される、ステップと
を包含する、方法。
【請求項2】
前記少なくとも2つの異なるトラック間またはノイズがオーディオ入力信号の主要な部分であるトラック内で一時停止を決定するステップをさらに包含し、前記利得は該決定された一時停止において減少させられ、両耳の局在性モデルに基づいて該オーディオ入力信号を聴く聴取者によって知覚されるように、該オーディオ入力信号の空間知覚のシミュレーションを用いて該入力信号が局在化され得るか否かを決定することによって、該ノイズが該オーディオ入力信号において検出される、請求項1に記載の方法。
【請求項3】
前記知覚されたラウドネスは、前記オーディオ入力信号の信号統計学に基づいてさらに決定される、請求項1または2に記載の方法。
【請求項4】
前記オーディオ入力および出力信号の各々は、音楽信号の連続ブロックを含み、各ブロックのラウドネスは、時定数を用いて決定され、該時定数は、一つのブロックから次のブロックへのラウドネスの変化を記述する、請求項1〜3のいずれかに記載の方法。
【請求項5】
上昇時定数は2つの連続ブロック間の上昇ラウドネスを記述するために用いられ、下降時定数は2つの連続ブロック間の下降ラウドネスを記述するために用いられ、前記時定数は、ラウドネスの減少を該下降時定数が可能にするよりも速いラウドネス増加を該上昇時定数が可能にするように該時定数が構成される、請求項4に記載の方法。
【請求項6】
前記時定数は、適応時定数であり、該適応時定数は、トラックの始めにおいて該時定数が該トラック中のより後のときより速く変化することを可能にするように適応させられる、請求項4または5に記載の方法。
【請求項7】
前記適応時定数は、2つのトラック間において一時停止が検出されるとリセットされ、該一時停止は、両耳の局在性モデルを単独または信号統計学モデルとの組み合わせを用いて前記オーディオ入力信号が局在化され得るか否かを決定することによって検出される、請求項6に記載の方法。
【請求項8】
前記利得決定ユニット(35)によって決定される前記利得を制御するステップをさらに包含し、該利得は、該決定された利得のどの量が前記オーディオ出力信号のオーディオ出力信号レベルを決定するかを決定するように該利得決定ユニットによって決定される、請求項1〜7のいずれかに記載の方法。
【請求項9】
前記オーディオ入力信号が出力される前に該オーディオ入力信号に遅延時間を含めるステップをさらに包含し、該遅延時間は、前記オーディオ出力信号に対する利得を決定するのに必要である時間に対応する、請求項1〜8に記載の方法。
【請求項10】
異なる信号レベル範囲を有する少なくとも2つの異なるトラックを含むオーディオ出力信号の利得を適応させるシステムであって、該システムは、オーディオ入力信号を受信し、適応した利得で該オーディオ出力信号を出力し、該システムは、
人間の聴覚の精神音響モデルに基づいて該オーディオ入力信号のラウドネスを動的に決定するラウドネス決定ユニット(31)と、
該決定したラウドネスを受信し、適応した利得で該オーディオ出力信号を出力する利得決定ユニット(35)であって、該利得決定ユニット(35)は、信号レベルの所定の範囲をカバーする該オーディオ出力信号の該少なくとも2つのトラックが出力されるように、該オーディオ出力信号の利得を動的に決定する、利得決定ユニット(35)と
を備えている、システム。
【請求項11】
一時停止検出ユニット(33)をさらに備え、該一時停止検出ユニット(33)は、前記オーディオ入力信号を聴く聴取者によって知覚されるような該オーディオ入力信号の空間知覚のシミュレーションを用いて該オーディオ入力信号が局在化され得るかどうかを決定することによって、前記少なくとも2つの異なるトラック間またはノイズがオーディオ入力信号の主要部分であるトラック内で一時停止を決定し、前記利得決定ユニット(35)は該決定された一時停止における利得を減少させる、請求項10に記載のシステム。
【請求項12】
前記オーディオ入力および出力信号の各々のトラックは、オーディオ信号の連続ブロック(25)を含み、時定数発生ユニット(32)は、該オーディオ入力信号の該連続ブロックに対する時定数(26)を決定し、該時定数(26)は、一つのブロックから次のブロックへのラウドネスの変化を記述し、前記利得決定ユニット(35)は、該時定数に基づいて該オーディオ出力信号の利得を決定する、請求項10または11に記載のシステム。
【請求項13】
前記時定数発生ユニット(32)は、2つの連続ブロック間の上昇ラウドネスを記述する上昇時定数と、2つの連続ブロック間の下降ラウドネスを記述する下降時定数とを用い、該時定数発生ユニットは、該下降時定数が利得減少を可能にするよりも該上昇時定数がより速い利得増加を可能にするように、該時定数を決定する、請求項12に記載のシステム。
【請求項14】
前記時定数発生ユニット(32)は、前記時定数が適応時定数であり、該適応時定数が、トラックの始めにおいて該トラック中のより後のとき、より速くブロックごとに変化し得るように、該時定数を決定する、請求項12または13に記載のシステム。
【請求項15】
前記時定数発生ユニット(32)は、該時定数発生ユニット(32)が2つのトラック間で一時停止を検出すると、前記時定数をリセットする、請求項12〜14に記載のシステム。
【請求項16】
利得制御ユニット(41)をさらに備え、該利得制御ユニット(41)は、決定される利得が前記オーディオ出力信号のオーディオ出力信号レベルに影響を及ぼす量がどのくらいかを該利得制御ユニットが決定するように、該利得決定ユニットによって決定される利得を制御するように構成される、請求項11〜15のいずれかに記載のシステム。
【請求項17】
遅延要素(42)をさらに備え、該遅延要素(42)は、前記オーディオ入力信号が出力信号として出力される前に該オーディオ入力信号の中に遅延時間を導入し、該遅延要素は、該オーディオ出力信号に対する利得を決定するために必要である時間に対応する遅延時間を導入する、請求項11〜16のいずれかに記載のシステム。

【図1】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図2】
image rotate

【図3】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2011−193442(P2011−193442A)
【公開日】平成23年9月29日(2011.9.29)
【国際特許分類】
【出願番号】特願2011−14516(P2011−14516)
【出願日】平成23年1月26日(2011.1.26)
【出願人】(504147933)ハーマン ベッカー オートモーティブ システムズ ゲーエムベーハー (165)
【Fターム(参考)】