説明

オーディオ信号のラウドネスレベルの自動補正

【課題】異なる運転状況にある乗り物において、オーディオ信号のラウドネスレベルのダイナミックな自動補正をすること。
【解決手段】人間聴覚の心理音響モデルに基づいて、オーディオ入力信号の知覚されたラウドネスをダイナミックに決定する。知覚されたラウドネスを受け取り、オーディオ出力信号を出力するゲイン決定ユニットによって出力されたオーディオ出力信号のゲインは、ダイナミックに決定される。オーディオ出力信号が出力されるスペース内の周囲ノイズを推定する。ゲイン決定ユニットによってオーディオ出力が影響される程度は、推定された周囲ノイズに基づいて決定される。

【発明の詳細な説明】
【技術分野】
【0001】
(技術分野)
本発明は、異なる信号レベル範囲を有する少なくとも2つの異なるトラックを含むオーディオ出力信号のゲインを適合するための方法と、そのためのシステムとに関する。
【背景技術】
【0002】
(背景)
この分野において、音楽および/またはスピーチを含むオーディオ信号の多数の異なるソースが知られる。音楽の信号は、CD、DVDまたは他の格納媒体に格納され得る。具体的には、MPEGのような新しい圧縮仕組みの発展とともに、異なるジャンルおよびアーティストのオーディオ信号は、格納媒体に格納され、ユーザーに最後まで演奏されるべきプレイリストに組み合わされ得る。具体的には、乗り物の環境において、乗客によって知覚されるオーディオ信号は、オーディオ信号自身と、ロードタイヤのノイズ、空気力学のノイズおよびエンジンのノイズとを含む。異なるオーディオソースの異なるオーディオ信号は、しばしば、異なる信号およびダイナミックスの圧縮レベルを有する。しばしば、オーディオ出力信号の異なるトラックは、ユーザーによって異なるラウドネスレベルとともに知覚される異なる信号レベルの範囲を有する。具体的には、乗り物の環境において、受け取られたオーディオ信号は、ユーザーに対して知覚可能であるべき、それは、そのオーディオ信号が乗り物内に現れるノイズを超えなければならないことを意味する。同時に、全部のオーディオ信号のレベルは、聴覚のダメージが生成され得、またはユーザーにとって知覚が苦痛である一定のレベルを超えてならない。
【0003】
さらに、乗り物の環境において、周囲ノイズは、乗り物の速度に強く依存する。
【発明の概要】
【発明が解決しようとする課題】
【0004】
(要約)
従って、異なる運転する状況での乗り物において、オーディオ信号のラウドネスレベルのダイナミックな自動補正をさせるためのニーズが存在する。
【課題を解決するための手段】
【0005】
このニーズは独立請求項の特徴によって満たされる。従属請求項において、本発明の好ましい実施形態が記述される。
【0006】
本発明の第1の局面によると、異なる信号レベルの範囲を有する少なくとも2つの異なるトラックを含むオーディオ出力信号のゲインを適合するための方法は提供される。方法は、人間聴覚の心理音響モデルに基づいて、オーディオ入力信号の知覚されたラウドネスをダイナミックに決定するステップを含む。さらに、決定されたラウドネスを受け取り、オーディオ出力信号を出力するゲイン決定ユニットによって出力されたオーディオ出力信号のゲインは、ダイナミックに決定され、ゲインは、オーディオ出力信号の前記少なくとも2つのトラックが信号レベルの所定の範囲内に出力されるように決定される。さらに、オーディオ出力信号が出力されるスペース内の周囲ノイズが推定され、ゲイン決定ユニットによって決定されたゲインがオーディオ出力信号に影響する程度を決定する。次に、ゲイン決定ユニットによってオーディオ出力が影響される程度は、推定された周囲ノイズに基づいて決定される。推定された周囲ノイズが非常に低い場合、例えば乗り物が停止または非常に遅い速度で走るとき、ゲイン決定ユニットによるゲイン適合はまったく必要がない。しかし、信号レベルが、ユーザーによって知覚可能な十分の高さであるべき、ただし高すぎにならないために、より速い乗り物の速度で、ダイナミックに決定されたゲイン適合はより役に立て得る。異なるトラックが所定の範囲内に出力されるように出力信号レベルを自動的に適合することによって、異なるトラックの1つの当量ラウドネスは得られ得る。さらに、ユーザーによるボリュームの調整は、もはや必要がない。具体的には、高い信号圧力レベルSPLを有するトラックまたはオーディオ信号のボリュームの減少も、比較できる低い信号圧力レベルを有するオーディオ信号の場合のボリュームの増大も避けられる。このように、全部の異なるオーディオ信号ソースの当量ラウドネスを有し、同時にオーディオ信号のダイナミックな構造を保つことは可能である。
【0007】
ラウドネスは、前記心理音響モデルだけまたはオーディオ入力信号の信号統計との組み合わせを用いて決定され得る。
【0008】
周囲ノイズを推定するための1つの可能性は、オーディオ出力信号が出力される乗り物の乗り物の速度を決定することであり、決定された乗り物の速度から周囲ノイズを導くことである。この実施形態において、マイクロフォンを介する周囲ノイズの正確な測定は必要がなく、周囲ノイズは、乗り物の速度から導かれ得る。しかし、代わりに、マイクロフォンが周囲ノイズを推定するようにも使われ得ることは理解されるべきである。マイクロフォン信号は、次に、周囲ノイズを推定するように、単独にまたは乗り物の速度との組み合わせで使われ得る。
【0009】
1つの実施形態において、推定された周囲ノイズが所定の閾値より低い場合、オーディオ出力信号が、ゲイン決定ユニットによって少しも影響され得ないことは可能である。例えば乗り物の速度によって決定されるような周囲ノイズが低いとき、ゲイン決定ユニットによるゲインの適合が必要ない場合もあり、オーディオ出力信号は、オーディオソースによって提供されるような信号レベルの範囲を用いて出力され得る。さらに、ダイナミックに決定されたゲインが、周囲ノイズの増大とともに、すなわち、乗り物の速度の増大とともにオーディオ出力信号に影響する程度を増大することは可能である。これは、乗り物の速度が高いほど、ゲイン決定ユニットが出力信号の信号レベルまたはラウドネスの範囲により大いに影響することを意味する。
【0010】
より好ましい実施形態によると、方法は、前記少なくとも2つの異なるトラックの間のポーズ、またはノイズが支配的なオーディオ入力信号であるトラック内のポーズを決定するステップを含む。このようなノイズを有するポーズが検出されるとき、ゲインは、ノイズの増幅を避けるために、決定されたポーズ内に減少される。本発明の1つの実施形態において、オーディオ入力信号がオーディオ入力信号を聞くリスナーによって知覚されるとき、ノイズは、入力信号がオーディオ入力信号の空間の知覚のシミュレーションを用いて局在化され得るかどうかを決定することにより、バイノーラル方式局在化モデルに基づいて、オーディオ入力信号内に検出される。前記人間聴覚の心理音響モデルを用いてオーディオ入力信号を局在化することが可能である場合、次に、オーディオ入力信号は、ノイズと考えられない。しかし、オーディオ入力信号が局在化され得ない場合、次に、オーディオ入力信号は、主にノイズを含むことと考えられる。そのゆえに、ノイズのみを含むオーディオ信号のラウドネスの増大を避けることは可能である。好ましくは、ポーズが所定の時間期間、例えば10〜100ミリ秒の間、好ましくは約50ミリ秒を超えて検出される場合、ゲインはポーズのために減少される。このように、音楽信号がない非常に短い期間が含まれるトラックの間のゲインを下げることを避けるために、ポーズが、例えば50ミリ秒より長い時間で検出される場合のみ、ゲインは下げられる。しかしオーディオ入力信号がもっと情報を含み、入力信号レベルが非常に低い場合、次に、ゲインは、オーディオ出力信号が信号レベルの所定の範囲にわたるようにゲインを増大することによって、それに応じて適合されるべきである。このように、高すぎるオーディオ入力レベルを有するオーディオ入力信号は、信号レベルの所定の範囲が覆われるようにゲインをコントロールすることによって低下される。局在化モデルは、入力信号の局在化能力に基づいて、ポーズの検出のために使われ得る。局在化モデルは、ラウドネスを推定するようにさらに使われ得る。
【0011】
普通は、オーディオ信号は、サンプルバイサンプルの処理と比較して処理時間を節約するようにブロック内に処理される。本発明の1つの実施形態によると、各ブロックのゲインは、時間定数を用いて決定され、この時間定数が、1つの単一ブロックから次のブロックへのラウドネスの変化を記述する。この実施形態において、立上り時間定数は、2つの連続したブロックの間の立上り信号ラウドネスを記述するように使われ、立下り時間定数は、2つの連続したブロックの間の立下りラウドネスを記述するように使われる。ブロックは、1つまたはいくつかのデジタルオーディオ入力信号のサンプルを含む。好ましくは、時間定数は、立上り時間定数が、ラウドネスの減少をさせる立下り時間定数より速いラウドネスの増大をさせるように構成される。速いラウドネスの増大は、単一ポーズの後に新しいトラックの始まりで必要であり、そこで、1つのブロックから他のブロックへのラウドネスを突然増大することは必要である。2つのブロックの間のより低い可能なラウドネスの減少は、オーディオ信号にオリジナルに含まれる増大されたラウドネスのダイナミックスを維持することを可能にする。
【0012】
好ましくは、時間定数は、適応時間定数であり、適応時間定数は、時間定数が、トラックの始まりに、後でのトラックの間より速く変えさせられるように適合される。これは、トラックの始まりにラウドネスの速い適合をさせ、それでも、オーディオ信号内に、例えば音楽トラック内に含まれるダイナミックスを維持するように助ける。具体的には、クラシックの音楽を含む音楽トラックにおいて、信号内にオリジナルに含まれるような信号レベルのダイナミックスは維持すべきである。
【0013】
好ましくは、2つのトラックの間のポーズが検出されるとき、適応時間定数はリセットされる。何人かのオーディオ信号ソースのユーザーが、適合されたラウドネスためのゲインを適合することなしに、オリジナルなオーディオ信号のダイナミックな範囲を維持したいことは可能である。
【0014】
さらに、オーディオ入力信号が出力される前に、オーディオ入力信号は遅延され得、遅延が、適合されたゲインを決定するのに必要とされる時間に対応する。この遅延は、一定であり得、または適合されたゲインの計算とともに変わり得る。
【0015】
本発明はさらに、人間聴覚の心理音響バイノーラル方式モデルに基づいて、およびひいては音楽入力信号の信号統計または2つの組み合わせに基づいて、オーディオ入力信号のラウドネスをダイナミックに決定するラウドネス決定ユニットを含む前述されたようなゲインを適合するシステムに関する。ゲイン決定ユニットは、決定されたラウドネスを受け取るシステム内に提供され、ゲイン決定ユニットは、適合されたゲインを有する音楽出力信号を出力し、ゲイン決定ユニットは、オーディオ出力信号の前記少なくとも2つのトラックが、それらが信号レベルの所定の範囲にわたるように出力されるように、音楽出力信号のゲインをダイナミックに決定する。
【0016】
システムは、オーディオ出力信号が出力されるスペース内の周囲ノイズを推定するように構成される周囲ノイズ推定ユニットをさらに含む。さらに、ゲインコントロールユニットは提供され、ゲイン決定ユニットによって決定されたゲインがオーディオ出力信号に影響する程度を決定するように構成され、ゲインコントロールユニットは、推定された周囲ノイズに基づいて、ゲイン決定ユニットによってオーディオ出力信号が影響される程度を決定する。前文の本発明の方法に関連して議論されたように、周囲ノイズ推定器は、周囲ノイズを推定するために、乗り物の速度を使い得る。周囲ノイズが所定の閾値より低い場合、ゲインコントロールユニットは、ゲイン決定ユニットの影響をきかなくし得る。
【0017】
オーディオ解析ユニットは、前述されたように、入力信号を局在化するための可能性を解析することによって、または信号統計を使うことよって、ポーズを決定する。音楽解析ユニットは、入力信号の空間の適合のシミュレーションを用いて、オーディオ入力信号を局在化しようとする。リスナーによって知覚されるような音楽入力信号の空間の知覚を用いる局在化の1つの実施形態は、EP1522868A1に記述される。局在化のさらなる詳細に関する参考文献は、本明細書に加えられる。さらなる詳細は、Wolfgang Hessら、「Acoustical Evaluation of Virtual Rooms by Means of Binaural Activity Patterns」、Audio Engineering Society Convention Paper 5864、第115回大会、(2003年10月)、にも見つけられ得る。信号ソースの局在化に関する参考文献は、W. Lindemann、「Extension of a Binaural Cross−Correlation Model by Contralateral Inhibition. I. Simulation of Lateralization for Stationary Signals」、Journal of Acoustic Society of America、(1986年12月)、1608−1622頁、80巻(6号)、にさらに加えられる。
【0018】
オーディオ解析ユニットは、前述されたように適応時間定数を決定し、ポーズが検出されるときに適応時間定数をリセットする。オーディオ信号の異なるトラックは、前述されたポーズ検出を用いて異なるトラックの内容を認知することによって分けられ得る。
【0019】
さらに、遅延ユニットは、存在し得、オーディオ出力信号がコントロールされたゲインを用いて出力される前に、オーディオ出力信号にその遅延時間を導入する。遅延要素は、適合されたゲインを決定するのに必要される遅延時間に対応する遅延を導入する。
【0020】
上記課題を解決するために、本発明は、例えば、以下を提供する。
(項目1) 異なる信号レベルの範囲を有する少なくとも2つの異なるトラックを含むオーディオ出力信号のゲインを適合するための方法であって、該方法は、
人間聴覚の心理音響モデルに基づいて、オーディオ入力信号の知覚されたラウドネスをダイナミックに決定するステップと、
該知覚されたラウドネスを受け取るゲイン決定ユニット(35)によって出力された該オーディオ出力信号のゲインをダイナミックに決定するステップであって、該ゲイン決定ユニット(35)が、該決定されたゲインを有する該オーディオ出力信号を出力し、該ゲインが、該オーディオ出力信号の該少なくとも2つのトラックが信号レベルの所定の範囲またはラウドネスの範囲にわたって出力されるように決定される、ステップと、
該オーディオ出力信号が出力されるスペース内の周囲ノイズを推定するステップと、
該ゲイン決定ユニットによって決定されたゲインが該オーディオ出力信号に影響する程度を決定するステップであって、該ゲイン決定ユニットによってオーディオ出力が影響される程度が、該推定された周囲ノイズに基づいて決定される、ステップと
を含む、方法。
(項目2) 上記推定された周囲ノイズが所定の閾値より低い場合、上記オーディオ出力信号は、上記ゲイン決定ユニットによって決定されたゲインに影響されない、上記項目のいずれかに記載の方法。
(項目3) 上記周囲ノイズは、乗り物の速度を決定することによって推定され、該周囲ノイズが、該乗り物の速度から導かれる、上記項目のいずれかに記載の方法。
(項目4) 上記ダイナミックに決定されたゲインが上記オーディオ出力信号に影響する程度は、上記推定された周囲ノイズの増大とともに増大する、上記項目のいずれかに記載の方法。
(項目5) 上記オーディオ入力信号および出力信号の各トラックは、音楽信号の連続したブロックを含み、各該ブロックのラウドネスは、時間定数を用いて決定され、該時間定数が、1つのブロックから次のブロックまでのラウドネスの変化を記述する、上記項目のいずれかに記載の方法。
(項目6) 立上り時間定数は、2つの連続したブロックの間の立上りラウドネスを記述するために使われ、立下り時間定数は、2つの連続したブロックの間の立下りラウドネスを記述するように使われ、上記時間定数は、該立上り時間定数が、ラウドネスの減少をさせる該立下り時間定数より速いラウドネスの増大をさせるように構成される、上記項目のいずれかに記載の方法。
(項目7) 上記時間定数は、適応時間定数であり、該適応時間定数は、該時間定数が、上記トラックの開始時に、後のトラックの間よりも速く変化することを許可されるように適合される、上記項目のいずれかに記載の方法。
(項目8) 上記適応時間定数は、上記2つのトラックの間にポーズが検出されるとき、リセットされ、該ポーズは、上記オーディオ入力信号が、バイノーラル方式局在化モデル単独で、または信号統計モデルとの組み合わせを用いて、局在化され得るかどうかを決定することによって検出される、上記項目のいずれかに記載の方法。
(項目9) 上記オーディオ入力信号が出力される前に、該オーディオ入力信号内に遅延時間を含むステップをさらに含み、該遅延時間は、上記オーディオ出力信号のためのゲインを決定するのに必要とされる時間に対応する、上記項目のいずれかに記載の方法。
(項目10) 異なる信号レベルの範囲を有する少なくとも2つの異なるトラックを含むオーディオ出力信号のゲインを適合するシステムであって、該システムが、オーディオ入力信号を受け取り、該適合されたゲインを有する該オーディオ出力信号を出力し、該システムは、
人間聴覚の心理音響モデルに基づいて、該オーディオ入力信号のラウドネスをダイナミックに決定する、ラウドネス決定ユニット(31)と、
決定されたラウドネスを受け取り、該適合されたゲインを有する該オーディオ出力信号を出力するゲイン決定ユニット(35)であって、該オーディオ出力信号の該少なくとも2つのトラックが信号レベルの所定の範囲にわたって出力されるように、該オーディオ出力信号のゲインをダイナミックに決定する、ゲイン決定ユニット(35)と、
該オーディオ出力信号が出力されるスペース内の周囲ノイズを推定するように構成される、周囲ノイズ推定ユニット(50)と、
該ゲイン決定ユニットによって決定されたゲインが該オーディオ出力信号に影響する程度を決定するように構成されるゲインコントロールユニット(41)であって、推定された周囲ノイズに基づいて、該ゲイン決定ユニットによってオーディオ出力信号が影響される程度を決定する、ゲインコントロールユニットと
を含む、システム。
(項目11) 上記オーディオ入力信号が、該オーディオ入力信号を聞くリスナーによって知覚されるようなオーディオ入力信号の空間の知覚のシミュレーションを用いて局在化され得るかどうかを決定することにより、上記少なくとも2つの異なるトラックの間またはノイズが該オーディオ入力信号の支配的な部分であるトラック内のポーズを決定するポーズ検出ユニット(33)をさらに含み、上記ゲイン決定ユニット(35)が、決定されたポーズ内のゲインを減少する、上記項目のいずれかに記載のシステム。
(項目12) 上記オーディオ入力および出力信号の各トラックは、音響信号の連続したブロック(25)を含み、時間定数生成ユニット(32)は、該オーディオ入力信号の該連続したブロックのための時間定数(26)を決定し、該時間定数(26)が、1つの該ブロックから次の該ブロックまでのラウドネスの変化を記述し、上記ゲイン決定ユニット(35)は、該時間定数に基づいて上記オーディオ出力信号のゲインを決定する、上記項目のいずれかに記載のシステム。
(項目13) 上記時間定数生成ユニット(32)は、2つの連続したブロックの間の立上りラウドネスを記述するための立上り時間定数と、2つの連続したブロックの間の立下りラウドネスを記述するための立下り時間定数とを使い、該時間定数生成ユニットは、該立上り時間定数が、ゲインの減少をさせる該立下り時間定数より速いゲインの増大をさせるように、時間定数を決定する、上記項目のいずれかに記載のシステム。
(項目14) 上記時間定数生成ユニット(32)は、上記時間定数が、適応時間定数であり、上記トラックの開始時に、後のトラックの間よりも速くブロックからブロックまでの間で変化し得るように、該時間定数を決定する、上記項目のいずれかに記載のシステム。
(項目15) 上記時間定数生成ユニット(32)は、該ユニットが上記2つのトラックの間のポーズを検出するとき、上記時間定数をリセットする、上記項目のいずれかに記載のシステム。
(項目16) 上記オーディオ入力信号が、出力信号として出力される前に、該オーディオ入力信号に遅延時間を導入する遅延要素(42)をさらに含み、該遅延要素は、上記オーディオ出力信号のためのゲインを決定するのに必要とされる時間に対応する該遅延時間を導入する、上記項目のいずれかに記載のシステム。
(項目17) 上記ゲインコントロールユニットは、上記推定されたノイズが所定の閾値より低いとき、上記オーディオ出力信号上に上記ゲイン決定ユニット(35)の影響を除去するように構成される、上記項目のいずれかに記載のシステム。
【0021】
(摘要)
本発明は、異なる信号レベルの範囲を有する少なくとも2つの異なるトラックを含むオーディオ出力信号のゲインを適合するための方法に関し、方法は、
人間聴覚の心理音響モデルに基づいて、オーディオ入力信号の知覚されたラウドネスをダイナミックに決定するステップと、
知覚されたラウドネスを受け取るゲイン決定ユニット(35)によって出力されたオーディオ出力信号のゲインをダイナミックに決定するステップであって、ゲイン決定ユニット(35)が、決定されたゲインを有するオーディオ出力信号を出力し、ゲインが、オーディオ出力信号の少なくとも2つのトラックが信号レベルの所定の範囲またはラウドネスの範囲にわたって出力されるように決定される、ステップと、
オーディオ出力信号が出力されるスペース内の周囲ノイズを推定するステップと、
ゲイン決定ユニットによって決定されたゲインがオーディオ出力信号に影響する程度を決定するステップであって、ゲイン決定ユニットによってオーディオ出力が影響される程度が、推定された周囲ノイズに基づいて決定される、ステップと
を含む。
【図面の簡単な説明】
【0022】
(図面の簡単な記述)
本発明は、添付の図面を参照するとともにもっと詳細に記述される。
【図1】図1は、ノイズおよびオーディオの成分を含む乗り物内の音の成分を概要的に示す。
【図2】図2は、オーディオ入力信号と、ゲイン適合なしに、ラウドネスを平らにするための異なる時間定数、例えばラウドネスを増大するための速い反応およびラウドネスレベルを減少することでの遅れた反応を含む推定されたラウドネスとの例を示す。
【図3】図3は、フル信号の内容が知られるとき、自動ラウドネス調整のために調整されるべきような理想的に補正されたオーディオ入力信号のダイナミックなレベル調整を示し、−12の平均ラウドネスラインが示される。
【図4】図4は、オーディオ出力信号のゲインを適合するのに使われるシステムを概要的に示す。
【図5】図5は、オーディオ入力信号のラウドネスを決定するのに使われるオーディオ解析ユニットのより詳細な図を示す。
【図6】図6は、ゲインが1つのブロックからもう1つのブロックへ変わることを示すオーディオ信号に時間定数の導入を概要的に示す。
【図7】図7は、自動ラウドネス適合がないおよびあるオーディオ出力信号レベルを示す。
【図8】図8は、自動ラウドネス適合の前および後のオーディオ入力信号のもう1つの例を示す。
【発明を実施するための形態】
【0023】
(詳細な記述)
図1から理解され得るように、使用された乗り物に依存して、異なる周囲ノイズは、乗り物に乗っている者によって知覚される。乗り物の音の信号は、ノイズ成分10と、オーディオ信号成分20とを含む。ノイズ信号成分10は、ロードタイヤのノイズ、空気力学のノイズまたはエンジンのノイズのためであり得る。図1の右の部分において、異なる乗り物のノイズの乗り物の速度依存が示される。曲線11は、ロードスターまたはスポーツ車内に生成されるようなノイズを記述し、一方、曲線12は、SUVの速度依存のノイズを示す。理解され得るように、ノイズは、60と85dB SPL(単一圧力レベル)の間の値を有し得る。聴覚の苦痛の閾値が約120dB SPLであるとして、オーディオ信号成分の範囲は、20−40dB SPL内にある。
【0024】
図2の上側部分において、オーディオ入力信号の信号レベルはフルスケールで示され、それは、0dBフルスケール(0dBFS)が、デジタル領域内に最大可能な単一レベルに割り当てられることを意味し、dBフルスケールがフルスケールに対するデシベルを意味する。図2の上側部分から理解され得るように、信号レベルがかなり変わり、それによってユーザーに知覚されるような信号に対応するラウドネスレベルもかなり変わる。図2の低い方の部分において、対応するラウドネスは、信号入力レベルから推定された。ラウドネス推定の1つの可能性は、提案書ITU−RBS.1770−1(「Algorithms to Measure Audio Program Loudness and to a Peak Audio Level」)に記述される。本出願において、ラウドネスは、バイノーラル方式局在化モデルによって推定され得る。図2に示されるような音の信号が乗り物内のユーザーに対して最後まで演奏される場合、オーディオ信号のいくつかの部分は不愉快なラウドネスで知覚され得、一方、オーディオ信号の他の部分が低すぎてユーザーによって正しく知覚されないことは考えられ得る。図3において、図2の信号の理想的に調整されたレベルが示される。例に言えば、範囲21の信号サンプルは、より低い信号レベルに適合されるべきであり、一方、範囲22の信号は、ユーザーによる優れた知覚のためにより高い信号レベルに適合されるべきである。同様に、範囲23の信号は、強く減少された信号レベルを用いて出力されるべきである。
【0025】
図3の低い方の部分において、上側部分の理想的に調整されたレベルの対応する推定されたラウドネスが示される。図2の低い方の部分が図3の低い方の部分と比較されると、図2に示されるようなラウドネス推定に対して、図3に示されるようなラウドネス推定が好ましいであることが導かれ得る。図3のラウドネス推定は、図2のラウドネス推定よりよく知覚され得る。平らにされ、相対的に一定のラウドネスは達成され、ここで視覚化される。
【0026】
図4において、図3の実施形態に概要的に示されるように、ラウドネスが適合され得るのに用いるシステムが示される。示されるシステムは、オーディオ信号解析ユニット30を含み、オーディオ信号解析ユニット内にエンターテイメントオーディオ信号のようなオーディオ入力信号のラウドネスが、人間聴覚の心理音響的局在化モデルを用いて、および信号統計を用いて決定される。オーディオ入力信号19は、ゲインコントロールユニット41および遅延要素42を含む信号コントローラ40内に入力される。ゲインコントロールユニットによって決定されるゲインは、ユーザーインターフェース50を用いてコントロールされ、そこで、オーディオ出力信号が、拡声器60を介して出力され、または後処理のステージに与えられる前に、オーディオ出力信号19に使われるゲイン決定ユニットによって決定されたゲインを与えるかどうかが決定され得る。エンターテイメントおよびオーディオ入力信号は、2.0、5.1または7.1オーディオ信号または他の形式であり得、オーディオ信号18としてオーディオ信号解析ユニットおよび信号コントローラ40に入力される。
【0027】
信号解析ユニット30において、人間聴覚の心理音響モデルに基づいて、および信号統計に基づいて、ラウドネスが決定されることは記号的に示される。心理音響モデルは、ラウドネス、音の局在化を推定し、例えば、ポーズの間または2つのトラックの間に、ノイズが支配的な因子としてオーディオ入力信号内に現れるかどうかを決定するように使われる。信号統計は、ラウドネスを決定または推定するための、およびノイズとともにポーズがオーディオ信号内に現れるかどうかを決定するための第2の基準である。例に言えば、エンターテイメントオーディオ信号の信号強度は決定され得る。心理音響モデルだけまたは統計的信号モデルとの組み合わせに基づいて、ラウドネス適合は、後でもっと詳細に記述されるように適応時間定数をダイナミックに決定することによって決定される。
【0028】
図5において、オーディオ信号解析ユニット30のより詳細な図が示される。オーディオ信号解析ユニットは、受信されたオーディオ入力信号のラウドネスを推定するラウドネス決定ユニット31を含む。ラウドネス決定ユニット31は、特にITU−R BS 1770−1に記述されるように、当技術分野で周知の方法を用いてラウドネスを決定し得る。ラウドネス決定ユニットは、ラウドネスを決定するための、および、オーディオ入力信号18が、ユーザーが前記オーディオ入力信号を聞くとき、ユーザーによって局在化され得るかどうかおよびどこかを決定するための人間聴覚のバイノーラル方式モデルをさらに使い得る。バイノーラル方式モデルは、オーディオ入力信号の空間の知覚をシミュレーションし、オーディオ入力信号が主にノイズまたは、音楽またはスピーチのような他の入力信号を含むかどうかを決定させる。オーディオ入力信号の局在化は、本出願より早く記載された文献、主にEP1522868A1に、W.Lindemannの文献に、前述されたAudio Engineering Society Convention Paper 5864により詳細に記述される。局在化技術は、他の信号からノイズを識別することを可能にし、ノイズのみがオーディオ入力信号内に検出された場合、このノイズが増大されたゲインを用いて出力されることを避けるように助ける。局在化技術は、ポーズが検出されたとき、適応時間定数をリセットすることも可能にする。ラウドネス決定ユニットは、人間聴覚の心理音響モデルを用いて、オーディオ入力信号のラウドネスを推定する。
【0029】
さらに、ラウドネス決定ユニット31は、オーディオ入力信号のラウドネスを推定し、または信号ポーズを検出するために、統計信号プロセスをさらに使い得る。オーディオ入力信号の統計解析において、オーディオ入力信号の異なるサンプルの実際の信号レベルが決定される。例に言えば、入力信号のいくつかの連続したサンプルの信号レベルがガウス分布に従えれば、処理されたサンプルが他のオーディオ信号なしに、ノイズを含むことは導かれ得る。
【0030】
次に、オーディオ信号解析ユニットは、オーディオ入力信号に導入される計算する時間定数のためのラウドネス推定の結果を使う。図5において、時間定数の計算は、時間定数生成器32によって記号化される。
【0031】
オーディオ信号解析ユニット30は、オーディオ出力信号17のゲインを適合するゲイン決定ユニット35をさらに含む。ラウドネス決定ユニット31は、音楽入力信号の特定部分、例えばいくつかのサンプルを含むブロックのラウドネスを、dBラウドネス当量(dBLEQ)を発することによって提供する。ゲイン決定ユニットは、オーディオ信号、例えば、図7と8における低い方の部分の図に示されるような−12dBまたは他の信号レベル閾値を出力するときに合わされるべき所定の信号レベルを有する。ゲイン決定ユニットにおいて、決定されたラウドネスは、ゲインを計算するために、得られるべき平均信号レベルから引き取られる。例に言えば、決定されたラウドネスが−5dBに対応する場合、およびターゲットが−12dBフルスケールである場合、ゲインは、約−12dBの平均信号レベルを有するために、それに応じて、ゲインを減少することによって適合されなければならない。
【0032】
図6において、オーディオ入力信号の異なるサンプル25が示され、時間定数26によって分けられる。時間定数26は、ラウドネスがどうやって1つのサンプルから次のサンプルへ適合されるべきかを示す。時間定数は、立上り時間定数または立下り時間定数であり得る。立上り時間定数は、信号ゲインがどうやって1つのサンプルから次のサンプルへ増大されるかを示し、その一方で、立下り時間定数は、1つのサンプルから次のサンプルへのゲイン減少を示す。時間定数26は、立上り時間定数が、立下り時間定数よりずっと速く適合され得るように決定される。例に言えば、信号ポーズが2つのトラックの間または1つトラック内に決定される場合、オーディオ信号レベルは、ノイズの増幅を避けるために、増大されてならない。新しいトラックが始まるとき、高い信号レベルは、非常に低い信号レベル後に直接に生じ得る。新トラックの始まりでの信号レベルが大いに増大されることを避けるために、ラウドネス推定の立上り時間定数は、それに応じて適合されなければならない。オーディオ信号レベルの減少の場合における立下り時間定数は、信号レベルの増大と比較されて、より遅い信号レベルの減少のみを可能にする。さらに、時間定数は適応時間定数であり、それは、トラックが長いほど、より遅い時間定数が反応することを意味する。これは、時間定数を増大および減少するのに妥当であり得る。平らにされたラウドネス推定も、人間がラウドネスを感知するようなの方法でラウドネス推定を保証する。ピークおよびディップは、人間聴覚システムによって平らにされる。実は、時間定数がオーディオトラックの増大時間とともにより遅く変わることは、オーディオ信号のダイナミックスを維持するように助ける。しかし、また、音楽信号の長い実行時間が達されるとき、増大するラウドネスのより短い反応時間は、速い信号の増大に適切な反応を保証する。
【0033】
図6の低い方の部分において、時間にわたる音楽信号のためのゲインの増大およびゲインの減少が示される。音楽サンプルの第1のブロック61のための第1のゲインは、示されるように決定される。次の信号ブロック62のための増大されたゲインは決定され、わずかに減少されたゲインを有する信号ブロック63によって続かされる。時間定数を用いるラウドネス適合に基づいて、各ブロックのためのゲイン、例えば各ブロックのためのターゲットゲインが決定される。次に、ブロックnのためのターゲットゲインは、先のブロックn−1のターゲットゲインから始まる線形のラップで達成される。
【0034】
1つのトラックまたは2つのトラックの間のポーズが決定される場合、時間定数はリセットされ得る。信号解析ユニット30内に実行されるポーズの検出またはトラックの検出は、ポーズ検出ユニット33およびトラック検出ユニット34によって記号化される。図5の実施形態において、ラウドネス決定ユニット31、時間定数生成器32、ポーズとトラック検出ユニット33と34、およびゲイン決定ユニット35は、別個のユニットとして示される。しかし、当業者よって、異なるユニットがより少数のユニットに組み込まれ得ることと、ユニットがいくつかのユニットまたはなお1つのユニットに組み合わされ得ることとは、明らかである。さらに、信号解析ユニットは、ハードウェア要素によって、またはソフトウァアによって、またはハードウェアとソフトウァアとの組み合わせによってデザインされ得る。
【0035】
図4に戻って参照すると、信号解析ユニットの信号出力17は、後でさらに説明されるようなオーディオ入力信号のゲインをコントロールするゲインコントロールユニット41に入力される。信号コントロールユニット40は、信号解析ユニット内のゲインの決定のために必要とされるオーディオ入力信号18に遅延を導入する遅延要素をさらに含む。遅延要素は、信号解析ユニット30によって処理された信号が、その信号が決定されたために、オーディオ信号を対応する正しい時間定数を用いて実際にコントロールされることを保証するように助ける。
【0036】
ゲインコントロールユニット41は、ゲイン決定ユニット35によって決定されたゲインが、実際に信号出力レベルに影響する量を決定するように助ける。この終わりに対して、ノイズ推定器50が提供され、乗り物のキャビン内の周囲ノイズを推定する。図1で理解され得るように、乗り物の速度は、乗り物のキャビン内のノイズに強く影響する。乗り物が非常に遅い速度で移動し、または停止である場合、ゲイン決定ユニットによって決定されるようなゲイン適合は、検討される必要がない場合もある。音楽出力信号がゲイン決定ユニットによって少しでも影響されない場合、それは、ユニット30内に決定されるような補正が出力のために使われないことを意味し、次に、ゲインコントロールユニットは、出力信号がユニット30内に実行された計算によって、影響された因子を0%にセットし得る。ノイズ推定器50は、乗り物の速度を受信し得、乗り物の速度とノイズとの間の関係が提供されるテーブル51をアクセスし得る。このテーブルは、乗り物のメーカーによってセットされた所定のテーブルであり得る。普通は、ドライバーは、テーブル51内に与えられた値を適合することができない。しかし、テーブル51内に与えられた値は、例えば音のセッティングが調整され得るのに用いるソフトウェアツールによって変えられ得る。乗り物の速度が速いとき、周囲ノイズは、図1に示されるような80dB(A)でもあり得る。この例において、次に、105dB(A)の閾値が超えられてならない場合、25dB(A)だけが残る。80dB(A)の周囲ノイズを用いて、オーディオ出力信号のラウドネスは、前述されたようなゲイン決定ユニットによってダイナミックに決定され得る。ゲイン決定ユニットは、周囲ノイズに基づいて、0%と100%との間の因子を決定し得、この割合が、前述されたようにラウドネスが適合されるべき量を記述する。示される実施形態において、乗り物の速度だけは、周囲ノイズを決定するための変数である。しかし、他の因子は、単独にまたは、マイクロフォン(示されていない)によって決定されるような周囲ノイズのような乗り物の速度との組み合わせで使われ得る。
【0037】
図7において、自動ラウドネス適合の第1の例が示される。図7の上側部分において、ラウドネス推定前のオーディオ入力信号18が示される。オーディオ入力信号の2つのチャンネルから理解され得るように、オーディオ入力信号は、異なる入力レベルの範囲にわたる。最大入力レベルは、0dBフルスケールであり得る。図7の低い方の部分において、ラウドネス推定およびゲイン適合後のオーディオ出力信号19が示される。図7の低い方の部分から理解され得るように、平均信号レベルは、−12dBフルスケールにセットされる。同時に、オーディオ信号のダイナミックな構造が保たれる。
【0038】
図8において、入力レベルが−20dBフルスケールの最大入力レベルを有するもう1つの例が示される。図8の低い方の部分において、ラウドネス推定およびゲイン適合後のオーディオ出力信号19が示される。再び、ダイナミックな構造が保たれ、平均信号レベルは再び、−12dBフルスケールである。図7と8の上側部分に示されるオーディオ入力信号がユーザーに出力された場合、ユーザーは、不愉快の高さである信号レベルを避けるために、および聞くのに信号レベルが低すぎであるオーディオ信号の部分の信号を増大するために、ボリュームを頻繁に調整しなければならない。
【0039】
本出願を用いて、システムがラウドネスを推定し、出力の前に自動かつダイナミックにゲインを調整するゆえに、このユーザーによる頻繁なボリューム調整は、もはや必要がない。
【符号の説明】
【0040】
17 オーディオ出力信号
30 信号解析ユニット
35 ゲイン決定ユニット
40 信号コントローラ
41 ゲインコントロールユニット
42 遅延要素
50 ノイズ推定器
60 拡声器

【特許請求の範囲】
【請求項1】
異なる信号レベルの範囲を有する少なくとも2つの異なるトラックを含むオーディオ出力信号のゲインを適合するための方法であって、該方法は、
人間聴覚の心理音響モデルに基づいて、オーディオ入力信号の知覚されたラウドネスをダイナミックに決定するステップと、
該知覚されたラウドネスを受け取るゲイン決定ユニット(35)によって出力された該オーディオ出力信号のゲインをダイナミックに決定するステップであって、該ゲイン決定ユニット(35)が、該決定されたゲインを有する該オーディオ出力信号を出力し、該ゲインが、該オーディオ出力信号の該少なくとも2つのトラックが信号レベルの所定の範囲またはラウドネスの範囲にわたって出力されるように決定される、ステップと、
該オーディオ出力信号が出力されるスペース内の周囲ノイズを推定するステップと、
該ゲイン決定ユニットによって決定されたゲインが該オーディオ出力信号に影響する程度を決定するステップであって、該ゲイン決定ユニットによってオーディオ出力が影響される程度が、該推定された周囲ノイズに基づいて決定される、ステップと
を含む、方法。
【請求項2】
前記推定された周囲ノイズが所定の閾値より低い場合、前記オーディオ出力信号は、前記ゲイン決定ユニットによって決定されたゲインに影響されない、請求項1に記載の方法。
【請求項3】
前記周囲ノイズは、乗り物の速度を決定することによって推定され、該周囲ノイズが、該乗り物の速度から導かれる、請求項1または2に記載の方法。
【請求項4】
前記ダイナミックに決定されたゲインが前記オーディオ出力信号に影響する程度は、前記推定された周囲ノイズの増大とともに増大する、請求項1〜3のいずれか1項に記載の方法。
【請求項5】
前記オーディオ入力信号および出力信号の各トラックは、音楽信号の連続したブロックを含み、各該ブロックのラウドネスは、時間定数を用いて決定され、該時間定数が、1つのブロックから次のブロックまでのラウドネスの変化を記述する、請求項1〜4のいずれか1項に記載の方法。
【請求項6】
立上り時間定数は、2つの連続したブロックの間の立上りラウドネスを記述するために使われ、立下り時間定数は、2つの連続したブロックの間の立下りラウドネスを記述するように使われ、前記時間定数は、該立上り時間定数が、ラウドネスの減少をさせる該立下り時間定数より速いラウドネスの増大をさせるように構成される、請求項5に記載の方法。
【請求項7】
前記時間定数は、適応時間定数であり、該適応時間定数は、該時間定数が、前記トラックの開始時に、後のトラックの間よりも速く変化することを許可されるように適合される、請求項5または6に記載の方法。
【請求項8】
前記適応時間定数は、前記2つのトラックの間にポーズが検出されるとき、リセットされ、該ポーズは、前記オーディオ入力信号が、バイノーラル方式局在化モデル単独で、または信号統計モデルとの組み合わせを用いて、局在化され得るかどうかを決定することによって検出される、請求項7に記載の方法。
【請求項9】
前記オーディオ入力信号が出力される前に、該オーディオ入力信号内に遅延時間を含むステップをさらに含み、該遅延時間は、前記オーディオ出力信号のためのゲインを決定するのに必要とされる時間に対応する、請求項1〜8のいずれか1項に記載の方法。
【請求項10】
異なる信号レベルの範囲を有する少なくとも2つの異なるトラックを含むオーディオ出力信号のゲインを適合するシステムであって、該システムが、オーディオ入力信号を受け取り、該適合されたゲインを有する該オーディオ出力信号を出力し、該システムは、
人間聴覚の心理音響モデルに基づいて、該オーディオ入力信号のラウドネスをダイナミックに決定する、ラウドネス決定ユニット(31)と、
決定されたラウドネスを受け取り、該適合されたゲインを有する該オーディオ出力信号を出力するゲイン決定ユニット(35)であって、該オーディオ出力信号の該少なくとも2つのトラックが信号レベルの所定の範囲にわたって出力されるように、該オーディオ出力信号のゲインをダイナミックに決定する、ゲイン決定ユニット(35)と、
該オーディオ出力信号が出力されるスペース内の周囲ノイズを推定するように構成される、周囲ノイズ推定ユニット(50)と、
該ゲイン決定ユニットによって決定されたゲインが該オーディオ出力信号に影響する程度を決定するように構成されるゲインコントロールユニット(41)であって、推定された周囲ノイズに基づいて、該ゲイン決定ユニットによってオーディオ出力信号が影響される程度を決定する、ゲインコントロールユニットと
を含む、システム。
【請求項11】
前記オーディオ入力信号が、該オーディオ入力信号を聞くリスナーによって知覚されるようなオーディオ入力信号の空間の知覚のシミュレーションを用いて局在化され得るかどうかを決定することにより、前記少なくとも2つの異なるトラックの間またはノイズが該オーディオ入力信号の支配的な部分であるトラック内のポーズを決定するポーズ検出ユニット(33)をさらに含み、前記ゲイン決定ユニット(35)が、決定されたポーズ内のゲインを減少する、請求項10に記載のシステム。
【請求項12】
前記オーディオ入力および出力信号の各トラックは、音響信号の連続したブロック(25)を含み、時間定数生成ユニット(32)は、該オーディオ入力信号の該連続したブロックのための時間定数(26)を決定し、該時間定数(26)が、1つの該ブロックから次の該ブロックまでのラウドネスの変化を記述し、前記ゲイン決定ユニット(35)は、該時間定数に基づいて前記オーディオ出力信号のゲインを決定する、請求項10または11に記載のシステム。
【請求項13】
前記時間定数生成ユニット(32)は、2つの連続したブロックの間の立上りラウドネスを記述するための立上り時間定数と、2つの連続したブロックの間の立下りラウドネスを記述するための立下り時間定数とを使い、該時間定数生成ユニットは、該立上り時間定数が、ゲインの減少をさせる該立下り時間定数より速いゲインの増大をさせるように、時間定数を決定する、請求項12に記載のシステム。
【請求項14】
前記時間定数生成ユニット(32)は、前記時間定数が、適応時間定数であり、前記トラックの開始時に、後のトラックの間よりも速くブロックからブロックまでの間で変化し得るように、該時間定数を決定する、請求項12または13に記載のシステム。
【請求項15】
前記時間定数生成ユニット(32)は、該ユニットが前記2つのトラックの間のポーズを検出するとき、前記時間定数をリセットする、請求項12〜14のいずれか1項に記載のシステム。
【請求項16】
前記オーディオ入力信号が、出力信号として出力される前に、該オーディオ入力信号に遅延時間を導入する遅延要素(42)をさらに含み、該遅延要素は、前記オーディオ出力信号のためのゲインを決定するのに必要とされる時間に対応する該遅延時間を導入する、請求項11〜15のいずれか1項に記載のシステム。
【請求項17】
前記ゲインコントロールユニットは、前記推定されたノイズが所定の閾値より低いとき、前記オーディオ出力信号上に前記ゲイン決定ユニット(35)の影響を除去するように構成される、請求項10〜16のいずれか1項に記載のシステム。

【図1】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図2】
image rotate

【図3】
image rotate

【図7】
image rotate

【図8】
image rotate