説明

ダイナミックレンジ拡張装置

【課題】ダイナミックレンジが圧縮されたオーディオ信号に対して、オーディオ信号がフルスケールであってもなくても、メリハリ感と臨場感とを発現させて音質の向上を図る。
【解決手段】信号の最大値状態により第1包絡線を検出する第1包絡線検出手段21〜23と、第1包絡線の振幅平均値を算出する平均値算出手段25と、第1包絡線の振幅最大値Ymaxを算出する最大値算出手段26と、振幅平均値と振幅最大値とにより検出ゲインを決定する検出ゲイン決定手段27と、検出ゲインを下限値として第2包絡線を検出する第2包絡線検出手段とを有し、検出ゲイン決定手段27は、振幅最大値に対する振幅平均値の比が第1閾値より小さい場合に検出ゲインを0に決定し、比の値が第1閾値以上かつ第2閾値以下である場合に、10logYmax2より低減させた値を検出ゲインに決定し、比の値が第2閾値より大きい場合に低減された第2閾値の値を検出ゲインに決定する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ダイナミックレンジ拡張装置に関し、より詳細には、ダイナミックレンジを圧縮して平坦化したオーディオ信号をスピーカなどから出力する場合に、出力音のメリハリ感と臨場感とを発現させることができ、音質を向上させることが可能なダイナミックレンジ拡張装置に関する。
【背景技術】
【0002】
一般に、コンサートホールや録音用スタジオにおいて演奏される楽器やボーカル等の音量レベルの範囲は非常に大きい。このため、音量レベルの範囲が非常に大きい楽器やボーカルの音を収録機器で録音する場合には、収録機器のダイナミックレンジを超えるような過大な音が収録機器に対して入力されるおそれがあった。
【0003】
ここで、ダイナミックレンジとは、識別可能な信号の最小値と最大値の比率を意味している。例えば、CDのように分解能が16bitに規定される場合は、ダイナミックレンジが96dBとなり、DVDのように分解能が24bitに規定される場合には、ダイナミックレンジが144dBとなる。
【0004】
ダイナミックレンジを超えた音を収録機器に収録すると、収録音に大きな歪が発生し、音質劣化の原因となってしまう。このような問題を解決する手段として、一般にコンプレッサやリミッタが適用されている(例えば、非特許文献1,非特許文献2参照)。
【0005】
図16(a)は、コンプレッサに対する入力信号の信号レベルと出力信号の出力レベルとの関係を示した入出力動作例を示し、図16(b)は、リミッタに対する入力信号の信号レベルと出力信号の出力レベルとの関係を示した入出力動作例を示している。
【0006】
コンプレッサは、可変式ゲインアンプとして機能するものである。コンプレッサは、図16(a)に示すように、入力信号の信号レベルに対する出力信号の信号レベルの増加割合を、予め設定されるスレッシホールドのレベルを超える前に比べて、スレッシホールドのレベルを超えた後の方が低くなるようにして、出力信号の信号レベルを抑制する役割を有している。すなわち、コンプレッサは、オーディオ信号を常時モニタし、設定されたスレッシホールドのレベルよりも音が大きくならないように自動的にゲインをコントロールするものである。
【0007】
一方で、リミッタは、高い圧縮レシオを持ったコンプレッサとして機能するものである。リミッタは、入力信号の信号レベルがスレッシホールドのレベルを大きく超えても出力レベルを一定に保つ役割を有している。
【0008】
コンプレッサとリミッタは、いずれも自動的にゲイン(信号レベル)が高い部分を抑圧し、所定のダイナミックレンジ内に収める役割を有している。しかしながら、コンプレッサは、スレッシホールドのレベルを超えた入力信号レベルの増加量をゆるやかに抑える(減少させる)ものであり、リミッタは設定したスレッシホールドのレベルを超えた信号をカットするものである点で、大きく相違する。
【0009】
図17は、CDに記録されたオーディオ信号の信号波形の一例を示した図である。上述したように、CDではダイナミックレンジが96dBとなり、ダイナミックレンジが96dBに収まらないオーディオ信号の信号レベルは抑制されることになる。図17の破線Cで囲んだ部分は、信号レベルが高くなっている箇所に該当し、オーディオ信号のレンジ内における振幅の最大値が、コンプレッサおよびリミッタにより±1に正規化された(クリップされた)箇所に該当する。図17の最小分解能は、1/(2(16−1))、つまり、3.05×10−5となっている。
【0010】
特に、図17の破線Aおよび破線Bで示される部分は、CDに記録されるオーディオ信号の振幅が±1に抑制されて振幅形状が矩形形状となっている。このため、フルスケールの信号は、矩形形状部分において振幅が±1に制限され、音源のダイナミックレンジが圧縮される。
【先行技術文献】
【非特許文献】
【0011】
【非特許文献1】岩宮眞一郎著、「図解入門よくわかる最新音響の基本と応用」、秀和システム、2011年3月、p. 242−243
【非特許文献2】「最強コンプレッサーマニュアル」、p.5-8、[online]、株式会社サウンドハウス、[平成23年8月10日検索]、<URL:http://www.soundhouse.co.jp/download/sonota/comp.pdf>
【発明の概要】
【発明が解決しようとする課題】
【0012】
ところで、このようなダイナミックレンジが圧縮されたCD音源を、ボリューム設定で音量を増大した後にスピーカから再生(出力)し、または、CD音源を増幅するパワーアンプ等を介してスピーカから再生(出力)する場合が多く存在する。このようにボリューム設定やパワーアンプ等による出力音の音量増大が行われると、CDに記録された状態において、既に信号出力が抑制されて平坦化されているため(ダイナミックレンジが圧縮されて、クリップされているため)、音のメリハリ感が大きく低減され、また、臨場感も低下してしまうという問題があった。
【0013】
また、図17の破線Aおよび破線Bで囲んだ部分のように、オーディオ信号の振幅が±1でクリップされた場合には、信号波形が矩形状になるため、不要な高調波が発生し易くなり、音質の劣化が発生するという問題があった。このため、ダイナミックレンジが圧縮されて平坦化されたオーディオ信号の出力音に対して、ダイナミックレンジを拡張することに対する要望が高まっている。
【0014】
一方で、ダイナミックレンジの圧縮が行われていない場合において、ダイナミックレンジの拡張が行われてしまうと、音質の劣化を招いてしまうおそれがあるという問題がある。
【0015】
さらに、インターネットラジオのような音声配信サービスでは、信号がフルスケールに満たない場合(スピーカなどの出力レンジに余裕がある場合)であっても、ダイナミックレンジの圧縮が行われてしまっている場合もあり得る。同楽曲でありながら、フルスケールに満たない場合の信号とフルスケールである場合の信号に対し、ダイナミックレンジの拡張処理を行った結果、振幅スケールの違いから、補完された信号の変動形状が異なることがないよう配慮すべきである。
【0016】
本発明は、上記課題に鑑みてなされたものであり、ダイナミックレンジが圧縮されて平坦化されたオーディオ信号の出力音に対して、当該オーディオ信号がフルスケールに満たない信号であっても、フルスケールを満たす信号であっても、メリハリ感と臨場感とを発現させ、音質を向上させることが可能なダイナミックレンジ拡張装置を提供することを課題とする。
【課題を解決するための手段】
【0017】
上記課題を解決するために、本発明に係るダイナミックレンジ拡張装置は、音源から出力されるオーディオ信号の最大値変化状態に基づいて第1包絡線の検出を行う第1包絡線検出手段と、該第1包絡線検出手段により検出された前記第1包絡線における所定時間の平均的な振幅の値を振幅平均値Ymeanとして算出する平均値算出手段と、前記第1包絡線検出手段により検出された前記第1包絡線の前記所定時間における振幅の最大値を振幅最大値Ymaxとして算出する最大値算出手段と、前記平均値算出手段により算出された振幅平均値Ymeanと前記最大値算出手段により算出された振幅最大値Ymaxと基づいて、検出ゲインを決定する検出ゲイン決定手段と、該検出ゲイン決定手段により決定された前記検出ゲインを下限値として、前記音源から出力されるオーディオ信号の最大値変化状態を求めて第2包絡線の検出を行う第2包絡線検出手段と、該第2包絡線検出手段により検出された前記第2包絡線をデシベル変換するデシベル変換手段と、該デシベル変換手段によりデシベル変換された前記第2包絡線を微分処理することにより、前記第2包絡線の変化量を示す変化量信号を生成する微分手段と、前記微分手段により生成された変化量信号に−1を乗算することにより信号の反転を行う反転手段と、該反転手段により反転された前記変化量信号をリニアな信号に変換することにより検出信号を生成するリニア変換手段と、前記オーディオ信号に前記検出信号を乗算した信号を、前記オーディオ信号から減算することにより補完信号を生成する補完信号生成手段と、該補完信号生成手段により生成された補完信号を、前記オーディオ信号に加算する加算手段とを備え、前記検出ゲイン決定手段は、前記振幅最大値Ymaxに対する前記振幅平均値Ymeanの比の値が、0.5より小さい値に設定される第1閾値よりも小さい場合に、前記検出ゲインを0[dB]に決定し、前記比の値が前記第1閾値である場合に、前記検出ゲインを10logYmax[dB]に決定し、前記比の値が前記第1閾値以上であって、かつ、0.5より大きい値に設定される第2閾値以下である場合に、前記比の値が前記第1閾値から前記第2閾値まで増加するのに反比例させるようにして、前記10logYmax[dB]より低減させた値を前記検出ゲインに決定し、前記比の値が前記第2閾値より大きい場合に、低減された前記検出ゲインにおける前記第2閾値の値を前記検出ゲインに決定することを特徴とする。
【0018】
本発明に係るダイナミックレンジ拡張装置は、第2包絡線検出手段においてオーディオ信号の最大値変化状態に基づいて第2包絡線の検出を行い、微分手段により第2包絡線の変化量を示す変化量信号の生成を行う。
【0019】
このため、第2包絡線における最大値変化が大きい場合には、変化量信号の変化量が大きくなり、第2包絡線における最大値変化が小さい場合には、変化量信号の変化量が小さくなる。反転手段で第2包絡線の変化量が示された変化量信号の反転を行った後にオーディオ信号に乗算し、乗算処理された信号を、オーディオ信号から減算することにより、圧縮されて平坦化されたオーディオ信号のダイナミックレンジを拡張するための補完信号を生成することができる。
【0020】
従って、加算手段において補完信号生成手段により生成された補完信号を、オーディオ信号に加算することにより、ダイナミックレンジが圧縮されて平坦化された箇所のダイナミックレンジを拡張することができ、出力されるオーディオ信号のメリハリ感と臨場感とを発現させることが可能となる。
【0021】
さらに、本発明に係るダイナミックレンジ拡張装置では、検出ゲイン決定手段により決定された検出ゲインを下限値として、オーディオ信号の最大値変化状態に基づいて第2包絡線が求められている。つまり、ダイナミックレンジの拡張処理に用いられる第2包絡線検出の下限値が、検出ゲインに基づいて決定される。
【0022】
ここで、振幅最大値Ymaxに対する振幅平均値Ymeanの比の値が、0.5より小さい値に設定される第1閾値よりも小さい場合に、検出ゲインは0に決定される。つまり、振幅最大値Ymaxに対する振幅平均値Ymeanの比の値が比較的小さい(0.5より小さい)場合には、第2包絡線検出の下限値が0[dB]に決定されることになる。
【0023】
一般に、オーディオ信号において振幅最大値Ymaxに対する振幅平均値Ymeanの比の値が小さい場合には、ダイナミックレンジの圧縮が行われているおそれが低い。このため、振幅最大値Ymaxに対する振幅平均値Ymeanの比の値が比較的小さい(0.5より小さい)場合に、検出ゲイン決定手段が、第2包絡線検出の下限値(検出ゲイン)を0[dB]に決定することにより、第2包絡線が過大に検出されて不必要な補完信号がオーディオ信号に加算され、オーディオ信号の音質が低減されてしまうことを抑制することが可能となる。
【0024】
一方で、振幅最大値Ymaxに対する振幅平均値Ymeanの比の値が、第1閾値以上であって、かつ、0.5より大きい値に設定される第2閾値よりも小さい場合に、比の値が第1閾値から第2閾値まで増加するのに反比例させるようにして、10logYmax[dB]より低減された値が検出ゲインとして決定される。
【0025】
一般に、オーディオ信号において振幅最大値Ymaxに対する振幅平均値Ymeanの比の値が大きい場合には、ダイナミックレンジの圧縮が行われているおそれが高い。このため、振幅最大値Ymaxに対する振幅平均値Ymeanの比の値が第1閾値から第2閾値まで増加するに従って、第1閾値に対応する10logYmax[dB]より低減させた値を第2包絡線検出の下限値に決定することにより、ダイナミックレンジの圧縮が行われたオーディオ信号に適切な補完信号を加算することができ、オーディオ信号の音質向上を図ることが可能となる。
【0026】
さらに、振幅最大値Ymaxに対する振幅平均値Ymeanの比の値が第2閾値より大きい場合には、比の値に反比例して低減された第2閾値における検出ゲインを、第2包絡線検出の下限値(検出ゲイン)に決定することにより、第2包絡線における最大値変化が過大に検出されてしまって、オーディオ信号に不適切な補完信号が加算されてしまうことを防止することができる。
【0027】
また、本発明に係るダイナミックレンジ拡張装置では、振幅最大値Ymaxに対する振幅平均値Ymeanの比の値に基づいてダイナミックレンジの圧縮の程度を判断するため、ダイナミックレンジの圧縮が行われたオーディオ信号がフルスケールである場合であっても、フルスケールに満たない場合であっても、その出力レベルに左右されることなくダイナミックレンジの拡張処理を行うことができる。このため、フルスケールに満たないオーディオ信号であって、ダイナミックレンジの圧縮が行われている信号に対し、ダイナミックレンジの拡張処理が行われない可能性を排除することができる。
【0028】
また、上述したダイナミックレンジ拡張装置において、前記検出ゲイン決定手段は、前記比の値が前記第1閾値以上であって、かつ、前記第2閾値以下である場合に、前記比の値が前記第1閾値から前記第2閾値まで増加するのに反比例させるようにして、前記検出ゲインを、前記10logYmax[dB]から−30+10logYmax[dB]まで低減させ、前記比の値が前記第2閾値より大きい場合に、前記検出ゲインを−30+10logYmax[dB]に決定するものであってもよい。
【0029】
CDやDVD等においてダイナミックレンジが圧縮された状態で記録されるオーディオ信号では、第2包絡線検出の検出範囲を−30[dB]〜0[dB]に設定した上でダイナミックレンジを拡張することにより、効果的な音質向上を図ることが好ましい。
【0030】
このため、振幅最大値Ymaxに対する振幅平均値Ymeanの比の値が第1閾値以上であって、かつ、第2閾値以下である場合には、比の値が前記第1閾値から第2閾値まで増加するのに反比例させるようにして、検出ゲインを、10logYmax[dB]から−30+10logYmax[dB]まで低減させ、比の値が第2閾値より大きい場合には、検出ゲインを−30+10logYmax[dB]に決定することにより、CDやDVD等に記録されるオーディオ信号に適したダイナミックレンジの拡張処理を行うことが可能となる。
【0031】
また、上述したダイナミックレンジ拡張装置は、前記補完信号生成手段により生成された補完信号のゲインを増幅又は減衰することによりゲイン調節を行うゲイン調節手段を有し、前記加算手段は、前記ゲイン調節手段によりゲイン調節された前記補完信号を、前記オーディオ信号に加算するものであってもよい。
【0032】
補完信号は、包絡線における最大値変化に基づいて生成されるため、ダイナミックレンジが圧縮されて平坦化された箇所におけるゲイン(振幅)を拡張することが可能である。しかしながら、拡張すべきダイナミックレンジのゲインは、ダイナミックレンジが圧縮されて平坦化されたオーディオ信号ごとに異なり、そのまま補完信号をオーディオ信号に加算しても、十分なダイナミックレンジの補完(拡張)を行えなかったり、ダイナミックレンジの補完(拡張)量が多すぎたりして、かえって音質の低下を招いてしまうおそれもある。
【0033】
このため、オーディオ信号の圧縮状態などに応じて、ゲイン調節手段で予め補完信号のゲインを増幅又は減衰しておくことにより、加算手段で補完信号が加算されたオーディオ信号のダイナミックレンジを、適切に拡張することが可能となる。
【0034】
また、上述したダイナミックレンジ拡張装置において、前記微分手段は、ハイパスフィルタを用いて前記オーディオ信号のフィルタリング処理を行うことによって微分処理を行い、該フィルタリング処理により求められる前記変化量の変化時間は、前記ハイパスフィルタにおける正規化カットオフ周波数の設定値を変更することにより調整されるものであってもよい。
【0035】
上述したように、微分手段における微分処理は、オーディオ信号に対して、ハイパスフィルタを用いたフィルタリング処理を行うことによって実現される。また、このハイパスフィルタの正規化カットオフ周波数の設定値を変更することにより、フィルタリング処理により求められる変化量の変化時間を調整することが可能となる。
【0036】
例えば、ダイナミックレンジが圧縮されて振幅が平坦化される状態は、コンプレッサやリミッタにおける設定により異なり、また、CDとDVDとではダイナミックレンジの圧縮状態が異なったものとなる。従って、オーディオ信号におけるダイナミックレンジの圧縮状態に応じて正規化カットオフ周波数を調整することにより、ダイナミックレンジの圧縮状態に適したダイナミックレンジの拡張時間の調整を行うことが可能となる。
【発明の効果】
【0037】
本発明に係るダイナミックレンジ拡張装置は、検出ゲイン決定手段により決定された検出ゲインを下限値として、オーディオ信号の最大値変化状態に基づいて第2包絡線が求められている。つまり、ダイナミックレンジの拡張処理に用いられる第2包絡線検出の下限値が、検出ゲインに基づいて決定される。
【0038】
ここで、振幅最大値Ymaxに対する振幅平均値Ymeanの比の値が、0.5より小さい値に設定される第1閾値よりも小さい場合に、検出ゲインは0に決定される。つまり、振幅最大値Ymaxに対する振幅平均値Ymeanの比の値が比較的小さい(0.5より小さい)場合には、第2包絡線検出の下限値が0[dB]に決定されることになる。
【0039】
一般に、オーディオ信号において振幅最大値Ymaxに対する振幅平均値Ymeanの比の値が小さい場合には、ダイナミックレンジの圧縮が行われているおそれが低い。このため、振幅最大値Ymaxに対する振幅平均値Ymeanの比の値が比較的小さい(0.5より小さい)場合に、検出ゲイン決定手段が、第2包絡線検出の下限値(検出ゲイン)を0[dB]に決定することにより、第2包絡線が過大に検出されて不必要な補完信号がオーディオ信号に加算され、オーディオ信号の音質が低減されてしまうことを抑制することが可能となる。
【0040】
一方で、振幅最大値Ymaxに対する振幅平均値Ymeanの比の値が、第1閾値以上であって、かつ、0.5より大きい値に設定される第2閾値よりも小さい場合に、比の値が第1閾値から第2閾値まで増加するのに反比例させるようにして、10logYmax[dB]より低減された値が検出ゲインとして決定される。
【0041】
一般に、オーディオ信号において振幅最大値Ymaxに対する振幅平均値Ymeanの比の値が大きい場合には、ダイナミックレンジの圧縮が行われているおそれが高い。このため、振幅最大値Ymaxに対する振幅平均値Ymeanの比の値が第1閾値から第2閾値まで増加するに従って、第1閾値に対応する10logYmax[dB]より低減させた値を第2包絡線検出の下限値に決定することにより、ダイナミックレンジの圧縮が行われたオーディオ信号に適切な補完信号を加算することができ、オーディオ信号の音質向上を図ることが可能となる。
【0042】
さらに、振幅最大値Ymaxに対する振幅平均値Ymeanの比の値が第2閾値より大きい場合には、比の値に反比例して低減された第2閾値における検出ゲインを、第2包絡線検出の下限値(検出ゲイン)に決定することにより、第2包絡線における最大値変化が過大に検出されてしまって、オーディオ信号に不適切な補完信号が加算されてしまうことを防止することができる。
【0043】
また、本発明に係るダイナミックレンジ拡張装置では、振幅最大値Ymaxに対する振幅平均値Ymeanの比の値に基づいてダイナミックレンジの圧縮の程度を判断するため、ダイナミックレンジの圧縮が行われたオーディオ信号がフルスケールである場合であってもフルスケールに満たない場合であっても、その出力レベルに左右されることなくダイナミックレンジの拡張処理を行うことができる。このため、フルスケールに満たないオーディオ信号であって、ダイナミックレンジの圧縮が行われていない信号などに対して、不要なダイナミックレンジの拡張処理が行われてしまうことを抑制することが可能となる。
【図面の簡単な説明】
【0044】
【図1】実施の形態に係るダイナミックレンジ拡張装置の概略構成を示したブロック図である。
【図2】実施の形態に係る楽曲分析部の概略構成を示したブロック図である。
【図3】包絡線検出の下限値f(Ymean,Ymax)と、包絡線の振幅最大値に対する振幅平均値の比(Ymean/Ymax)との関係を示したグラフである。
【図4】(a)は、リミッタ処理によりダイナミックレンジの圧縮が行われる前のオーディオ信号の振幅変化を示した図であり、(b)は、リミッタ処理によりダイナミックレンジの圧縮が行われた後のオーディオ信号の振幅変化を示した図である。
【図5】ダイナミックレンジが大きく圧縮されて多数のクリップが発生するオーディオ信号が、実施の形態に係るダイナミックレンジ拡張装置に入力された場合におけるグラフを示し、(a)は、3秒間のオーディオ信号の振幅変化を示し、(b)は、第1スムージング部によって算出された包絡線と、平均値ホールド部において算出される包絡線の振幅平均値と、第2最大値ホールド部において算出される包絡線の振幅最大値の変化を示し、(c)は、包絡線の振幅最大値に対する振幅平均値の比(Ymean/Ymax)の値を示したグラフである。
【図6】ダイナミックレンジが図5に比べて小さく圧縮されてクリップが散見されるオーディオ信号が、実施の形態に係るダイナミックレンジ拡張装置に入力された場合におけるグラフであって、図5(a)〜(b)に対応するグラフである。
【図7】ダイナミックレンジの圧縮が行われていないオーディオ信号が、実施の形態に係るダイナミックレンジ拡張装置に入力された場合におけるグラフであって、図5(a)〜(b)に対応するグラフである。
【図8】実施の形態に係る第1変動検出部の概略構成を示したブロック図である。
【図9】実施の形態に係る第1重み付け部の概略構成を示したブロック図である。
【図10】実施の形態に係るダイナミックレンジ拡張装置の動作例を説明するために設定された各機能部の動作パラメータを示した表である。
【図11】(a)は、実施の形態に係るダイナミックレンジ拡張装置に、ダイナミックレンジが圧縮されて振幅が平坦化されたオーディオ信号が入力される場合の振幅変化状態を示した図であり、(b)は、実施の形態に係る第1変動検出部および第2変動検出部の第2最大値検出部において、検出の下限値を−30[dB]に固定した場合におけるダイナミックレンジ拡張装置の出力信号の振幅変化状態を示した図であり、(c)は、実施の形態に係る第2最大値検出部における検出の下限値を−30+10logYmax[dB]として変動させた場合におけるダイナミックレンジ拡張装置の出力信号の振幅変化状態を示した図である。
【図12】(a)は、実施の形態に係るダイナミックレンジ拡張装置に、ダイナミックレンジが圧縮されていないオーディオ信号が入力される場合の振幅変化状態を示した図であり、(b)は、第2最大値検出部における検出の下限値を−30[dB]に固定した場合における出力信号の振幅変化状態を示した図であり、(c)は、検出の下限値を−30+10logYmax[dB]として変動させた場合における出力信号の振幅変化状態を示した図である。
【図13】(a)は、図11(a)に示すダイナミックレンジが圧縮されたオーディオ信号がダイナミックレンジ拡張装置に入力されて図11(c)に示す信号が出力される場合において、第1スムージング部より算出された入力信号の包絡線と、平均値ホールド部で求められた振幅平均値と、第2最大値ホールド部で求められた振幅最大値との変化状態と、振幅最大値に対する振幅平均値の比(Ymean/Ymax)の値の状態変化と、包絡線検出の下限値の変動状態とを、入力されるオーディオ信号の楽曲先頭から30秒間検出した結果を示した図であり、(b)は、図12(a)に示すダイナミックレンジが圧縮されていないオーディオ信号がダイナミックレンジ拡張装置に入力されて図12(c)の信号が出力される場合における(a)と同様の変動状態を、30秒間検出した結果を示している。
【図14】(a)は、ダイナミックレンジが圧縮されて振幅が平坦化されたフルスケールのオーディオ信号の振幅変動状態を示した図であり、(b)は、ダイナミックレンジが圧縮されて振幅が平坦化されたフルスケールに満たないオーディオ信号の振幅変動状態を示した図であり、(c)は、(a)に示されるオーディオ信号のダイナミックレンジが実施の形態に係るダイナミックレンジ拡張装置で拡張されたオーディオ信号の振幅変動状態を示した図であり、(d)は、(b)に示されるオーディオ信号のダイナミックレンジがダイナミックレンジ拡張装置で拡張されたオーディオ信号の振幅変動状態を示した図である。
【図15】(a)は、図14(a)に示すダイナミックレンジが圧縮されたフルスケールのオーディオ信号がダイナミックレンジ拡張装置に入力されて、図14(c)の信号が出力される場合において、第1スムージング部より算出された入力信号の包絡線と、平均値ホールド部で求められた振幅平均値と、第2最大値ホールド部で求められた振幅最大値との変化状態と、振幅最大値に対する振幅平均値の比(Ymean/Ymax)の値の状態変化と、包絡線検出の下限値の変動状態とを、入力されるオーディオ信号の楽曲先頭から30秒間検出した結果を示し、(b)は、図14(b)に示すダイナミックレンジが圧縮されたフルスケールに満たないオーディオ信号がダイナミックレンジ拡張装置に入力されて図14(d)の信号が出力される場合における(a)と同様の変動状態を、30秒間検出した結果を示している。
【図16】(a)は、コンプレッサに対する入力信号の信号レベルと出力信号の出力レベルとの関係を示した入出力動作例を示し、(b)は、リミッタに対する入力信号の信号レベルと出力信号の出力レベルとの関係を示した入出力動作例を示した図である。
【図17】CDに記録されたオーディオ信号の信号波形の一例を示した図である。
【発明を実施するための形態】
【0045】
以下、本発明に係るダイナミックレンジ拡張装置の一例について、図面を示して詳細について説明する。
【0046】
[ダイナミックレンジ拡張装置]
図1は、本実施の形態に係るダイナミックレンジ拡張装置1の概略構成を示したブロック図である。ダイナミックレンジ拡張装置1は、ダイナミックレンジの圧縮により平坦化された状態となったオーディオ信号のゲイン(信号レベル)を拡張する(補完する)役割を有している。
【0047】
ダイナミックレンジ拡張装置1は、LPF部(ローパスフィルタ部)10と、HPF部(ハイパスフィルタ部)11と、第1変動検出部12と、第2変動検出部13と、第1重み付け部14と、第2重み付け部15と、合成部(加算手段)16と、楽曲分析部17とを有している。
【0048】
ダイナミックレンジ拡張装置1には、ダイナミックレンジの圧縮されたオーディオ信号(例えば、CDなどへの記録に伴ってダイナミックレンジが圧縮されたオーディオ信号)が入力される。入力されたオーディオ信号は、図1に示すように、ダイナミックレンジ拡張装置1のLPF部10と、HPF部11と、合成部16と、楽曲分析部17に対してそれぞれ出力される。
【0049】
[楽曲分析部]
楽曲分析部17は、入力されるオーディオ信号(ダイナミックレンジの圧縮が行われたオーディオ信号)より包絡線(第1包絡線)の検出を行い、検出された包絡線に基づいて、第1変動検出部12および第2変動検出部13に対する包絡線(第2包絡線)の検出の下限値(検出ゲイン)を動的に決定(設定)する役割を有している。
【0050】
楽曲分析部17は、図2に示すように、第1最大値検出部(第1包絡線検出手段)21と、第1最大値ホールド部(第1包絡線検出手段)22と、第1スムージング部(第1包絡線検出手段)23と、モノラル変換部24と、平均値ホールド部(平均値算出手段)25と、第2最大値ホールド部(最大値算出手段)26と、検出ゲイン算出部(検出ゲイン決定手段)27とを有している。
【0051】
第1最大値検出部21は、入力されたLチャネルおよびRチャネルのそれぞれのオーディオ信号の振幅を絶対値化した後に、所定の時間(mサンプル)内の最大値を検出して、それぞれのチャネル毎に出力する役割を有している。従って、第1最大値検出部21において所定の時間(mサンプル)ごとに最大値が更新されて、第1最大値ホールド部22に出力される。ただし、第2最大値検出部31(図8参照)に対する入力信号として、所定の周波数でサンプリングされたデータが用いられている。
【0052】
第1最大値ホールド部22は、第1最大値検出部21において所定の時間(mサンプル)ごとに更新されるそれぞれのチャネルの最大値を受信した場合において、受信した最新の最大値だけでなく、その最大値を含む過去n回分の最大値(n個の最大値)の中で、最も大きな値を示す最大値の値を、それぞれのチャネル毎に求める。そして、第1最大値ホールド部22は、求められた各チャネルの最大値を、所定の時間(mサンプル)ごとに、第1スムージング部23へ出力する。
【0053】
つまり、第1最大値ホールド部22は、第1最大値検出部21から所定の時間(mサンプル)ごとに所定の時間(mサンプル)の内で最も大きな値の最大値を取得し、さらに、取得した最大値を含む過去n回分の最大値の中で最も値の大きな最大値(つまり、n×mサンプルの間における最も値の高い最大値)を検出して、所定の時間(mサンプル)ごとに、第1スムージング部23へ出力する。なお、第1最大値ホールド部22から第1スムージング部23へと出力されるn×mサンプルの中で最も高い値の最大値は、所定の時間(mサンプル)だけ値がホールド(保持)された状態で出力される。
【0054】
第1スムージング部23は、第1最大値ホールド部22より取得した各チャネルの最大値の信号を積分処理することにより、最大値の変動を滑らかにする(スムージング処理する)役割を有している。このようにして第1最大値ホールド部22より取得した信号を滑らかにすることにより、オーディオ信号に対する包絡線(第1包絡線)の信号検出をチャネル毎(LチャネルおよびRチャネル)に行う。この包絡線(第1包絡線)の検出信号は、リニアな信号特性(振幅でゲインが示される特性)を有している。このようにして検出された包絡線(第1包絡線)の検出信号を第1の包絡線信号という。
【0055】
モノラル変換部24は、第1スムージング部23において求められたLチャネルおよびRチャネルの第1の包絡線信号の平均を算出する役割を有している。算出された平均の包絡線信号は、平均値ホールド部25と第2最大値ホールド部26とのそれぞれに出力される。
【0056】
平均値ホールド部25は、モノラル変換部24より取得した第1の包絡線信号の平均値(振幅平均値)を、オーディオ信号の入力が行われている間(オーディオ信号が特定の楽曲である場合には、その楽曲が終了するまでの間:所定時間)算出してホールド(保持・維持)する役割を有している。つまり、オーディオ信号が入力されて間もない時間においては、入力から間もない時間が経過するまでの振幅の平均値が算出されてホールドされ、その後、入力からしばらく時間が経過した場合には、入力からしばらく時間が経過するまでの振幅の平均値が算出されてホールドされることになる。
【0057】
また、第2最大値ホールド部26は、モノラル変換部24より取得した第1の包絡線信号の最大値(振幅最大値)を、入力されたオーディオ信号の入力が行われている間(オーディオ信号が特定の楽曲である場合には、その楽曲が終了するまでの間:所定時間)算出してホールドする役割を有している。従って、オーディオ信号が入力されて間もない時間においては、入力から間もない時間が経過するまでの振幅の最大値が算出されてホールドされ、その後、入力からしばらく時間が経過した場合には、入力からしばらく時間が経過するまでの振幅の最大値が算出されてホールドされることになる。
【0058】
平均値ホールド部25において算出された包絡線(第1包絡線)の振幅平均値と、第2最大値ホールド部26において算出された包絡線(第1包絡線)の振幅最大値は、それぞれ検出ゲイン算出部27へ出力される。
【0059】
検出ゲイン算出部27は、平均値ホールド部25で算出された包絡線(第1包絡線)の振幅平均値と、第2最大値ホールド部26で算出された包絡線(第1包絡線)の振幅最大値とを用いて、第1変動検出部12および第2変動検出部13における包絡線検出(第2包絡線の検出)の下限値[dB]を動的に算出する(決定する)役割を有している。
【0060】
平均値ホールド部25で算出された包絡線(第1包絡線)の振幅平均値をYmeanとし、第2最大値ホールド部26で算出された包絡線(第1包絡線)の振幅最大値をYmaxとすると、包絡線検出(第2包絡線の検出)の下限値[dB]を示すf(Ymean,Ymax)は、
【数1】

・・・・式1
で求められる。
【0061】
mean/Ymaxが0.45(第1閾値)より小さい値である場合には、包絡線検出(第2包絡線の検出)の下限値f(Ymean,Ymax)が0[dB]に決定され、Ymean/Ymaxが0.60(第2閾値)より大きい値である場合には、包絡線検出(第2包絡線の検出)の下限値f(Ymean,Ymax)が、−30+10logYmax[dB]に決定され、Ymean/Ymaxが0.45以上で0.60以下である場合には、包絡線検出(第2包絡線の検出)の下限値f(Ymean,Ymax)が、−200・Ymean/Ymax+90+10logYmax[dB]に決定される。なお、10logYmaxには、包絡線(第1包絡線)の振幅の最大値をデシベル値に変換するための変換式(変換関係)を示している。
【0062】
図3は、上述した式1に基づいて、包絡線検出(第2包絡線の検出)の下限値f(Ymean,Ymax)と、包絡線(第1包絡線)の振幅最大値に対する振幅平均値の比(Ymean/Ymax)との関係を示したグラフである。図3に示すように比の値(Ymean/Ymax)が0.45より小さい場合には、包絡線検出(第2包絡線の検出)の下限値f(Ymean,Ymax)が0[dB]に維持(決定・設定)されるが、比の値(Ymean/Ymax)が0.45になると、包絡線検出(第2包絡線の検出)の下限値f(Ymean,Ymax)が10logYmaxの値(−200・Ymean/Ymax+90+10logYmaxにおいてYmean/Ymaxに0.45を代入した値)[dB]となる。その後、比の値(Ymean/Ymax)が0.45から0.60まで増加するのに反比例して、包絡線検出(第2包絡線の検出)の下限値f(Ymean,Ymax)が減少し、比の値(Ymean/Ymax)が0.60以上になった場合には、包絡線検出の下限値f(Ymean,Ymax)が−30+10logYmaxの値(−200・Ymean/Ymax+90+10logYmaxにおいてYmean/Ymaxに0.60を代入した値)[dB]に維持(決定・設定)される。
【0063】
このように、比の値(Ymean/Ymax)の0.45と0.60とが閾値(第1閾値:0.45、第2閾値:0.60)となり、比の値(Ymean/Ymax)が0.00〜0.45の間では、包絡線検出(第2包絡線の検出)の下限値f(Ymean,Ymax)が0[dB]に維持(決定・設定)され、比の値(Ymean/Ymax)が0.45〜0.60の間では、包絡線検出(第2包絡線の検出)の下限値f(Ymean,Ymax)が比の値(Ymean/Ymax)に反比例して低減され、比の値(Ymean/Ymax)が0.60以上になる場合には、包絡線検出(第2包絡線の検出)の下限値f(Ymean,Ymax)が−30+10logYmax[dB]に維持される。
【0064】
図4(a)は、リミッタ処理によりダイナミックレンジの圧縮が行われる前のオーディオ信号の振幅変化を示した図であり、(b)は、リミッタ処理によりダイナミックレンジの圧縮が行われた後のオーディオ信号の振幅変化を示した図である。
【0065】
図4(a)に示すように、ダイナミックレンジの圧縮が行われる前のオーディオ信号では、振幅の振れ幅が大きいため、振幅最大値と振幅平均値との差が大きくなる。しかしながら、図4(b)に示すように、リミッタ処理によりダイナミックレンジの圧縮が行われた後のオーディオ信号では、振幅最大値がリミッタ処理により制限されてクリップが発生するため、振幅最大値が低く抑えられる。
【0066】
また、振幅最大値が抑えられることから、振幅平均値が相対的に高い値を示すことなり、振幅最大値と振幅平均値との差が小さくなる。このため、ダイナミックレンジの圧縮が行われる前のオーディオ信号とダイナミックレンジの圧縮が行われた後のオーディオ信号とで、振幅最大値に対する振幅平均値の比の値(第1包絡線の振幅最大値に対する振幅平均値の比(Ymean/Ymax)の値に対応する)とを比べると、ダイナミックレンジの圧縮が行われる前の方が比の値が小さく、ダイナミックレンジの圧縮が行われた後の方が比の値が大きくなる傾向が生ずる。
【0067】
従って、振幅最大値に対する振幅平均値の比の値が大きい場合には、ダイナミックレンジの圧縮が行われているおそれの高いオーディオ信号であると判断することができる。比の値が小さい場合には、ダイナミックレンジの圧縮が行われているおそれの低いオーディオ信号であると判断することができる。
【0068】
図5は、ダイナミックレンジが大きく圧縮されて多数のクリップが発生するオーディオ信号が楽曲分析部17に入力された場合におけるグラフである。図6は、ダイナミックレンジが図5に比べて小さく圧縮されているがクリップが散見されるオーディオ信号が楽曲分析部17に入力された場合におけるグラフである。図7は、ダイナミックレンジの圧縮が行われていないオーディオ信号が楽曲分析部17に入力された場合におけるグラフである。
【0069】
具体的に、図5〜図7において(a)は、オーディオ信号の3秒間の振幅変化を示したグラフである。(b)は、第1スムージング部23によって算出された包絡線と、平均値ホールド部25において算出される包絡線(第1包絡線)の振幅平均値と、第2最大値ホールド部26において算出される包絡線(第1包絡線)の振幅最大値の変化を示したグラフである。(c)は、包絡線(第1包絡線)の振幅最大値に対する振幅平均値の比(Ymean/Ymax)の値を示したグラフである。
【0070】
図5(a)に示されるオーディオ信号はダイナミックレンジの圧縮が大きいため、ほぼ連続的に振幅が±1に制限(維持)された状態となっており、連続的にクリップが発生している。このため、図5(b)に示すように、包絡線(第1包絡線)の振幅値と振幅最大値とがほぼ1の値(振幅)を維持し、また、振幅平均値も振幅最大値に近い値を示している。従って、図5(c)に示すように、包絡線(第1包絡線)の振幅最大値に対する振幅平均値の比(Ymean/Ymax)の値(比率)は、0.9程度の高い値を示している。
【0071】
一方で、図6(a)に示されるオーディオ信号はダイナミックレンジの圧縮が小さいため、一部分の振幅だけが±1に制限(維持)された状態となっており、クリップが散見される状態である。このため、図6(b)に示すように、包絡線(第1包絡線)の振幅値が、クリップの発生していない箇所において変動した状態となっている。従って、図6(c)に示すように、包絡線(第1包絡線)の振幅最大値に対する振幅平均値の比(Ymean/Ymax)の値(比率)は、図5(c)に比べて低減されて、0.7程度の値を示している。
【0072】
また、図7(a)に示されるオーディオ信号はダイナミックレンジの圧縮が行われていないため、振幅の最大値が±1の範囲に制限されており、クリップが全く発生していない。このため、図7(b)に示すように、包絡線(第1包絡線)の振幅値が図5(b)、図6(b)に比べて大きく変動した状態を保っており、振幅平均値も、図5(b)、図6(b)に比べて低い値となっている。従って、図7(c)に示すように、包絡線(第1包絡線)の振幅最大値に対する振幅平均値の比(Ymean/Ymax)の値(比率)は、図5(c)、図6(c)に比べて低減されて、0.3程度の値を示している。
【0073】
図5〜図7に示したように、ダイナミックレンジの圧縮が大きい程、振幅最大値に対する振幅平均値の比の値が大きな値を示し、ダイナミックレンジの圧縮が小さくなるに従って、振幅最大値に対する振幅平均値の比の値が低減し、ダイナミックレンジの圧縮が行われていない場合には、振幅最大値に対する振幅平均値の比の値が低くなる。
【0074】
このため、楽曲分析部17では、比(Ymean/Ymax)の値に応じて、包絡線検出(第2包絡線の検出)の下限値を一定の範囲内で(上述した式1においては、0〜−30+10logYmax[dB]の範囲内で)で低減変動させる。例えば、比(Ymean/Ymax)の値が高くて、ダイナミックレンジの圧縮が行われているおそれが高い場合には、ダイナミックレンジの拡張を行う包絡線(第2包絡線)の下限値を低い値に設定(決定)し、クリップが生じ得るオーディオ信号のダイナミックレンジが効果的に拡張されるようにする。
【0075】
一方で、比(Ymean/Ymax)の値が低くて、ダイナミックレンジの圧縮が行われていないおそれが高い場合には、ダイナミックレンジの拡張を行う包絡線(第2包絡線)の下限値を高い値に設定(決定)することによって、クリップが生じていないオーディオ信号のダイナミックレンジが過剰に拡張されてしまうことを防止する。
【0076】
その後、楽曲分析部17の検出ゲイン算出部27において算出された包絡線検出(第2包絡線の検出)の下限値f(Ymean,Ymax)の値は、第1変動検出部12および第2変動検出部13のそれぞれの第2最大値検出部31(図8参照)へと、リアルタイム(連続的)に出力される。
【0077】
[LPF部およびHPF部]
LPF部10は、入力されたオーディオ信号(ダイナミックレンジの圧縮が行われたオーディオ信号)に対して、ローパスフィルタリング処理を行うことにより、入力されたオーディオ信号の低域成分を抽出する役割を有している。一方で、HPF部11は、入力されたオーディオ信号に対して、ハイパスフィルタリング処理を行うことにより、入力されたオーディオ信号の高域成分を抽出する役割を有している。
【0078】
[第1変動検出部および第2変動検出部]
第1変動検出部12は、LPF部10より入力された低域のオーディオ信号の包絡線を求め、求められた包絡線(第2包絡線)が小さい信号から大きい信号に変化する量を検出信号として検出して、第1重み付け部14へと出力する役割を有している。また、第2変動検出部13も同様に、HPF部11より入力された高域のオーディオ信号の包絡線(第2包絡線)を求め、求められた包絡線(第2包絡線)が小さい信号から大きい信号に変化する量を検出信号として検出して、第2重み付け部15へと出力する役割を有している。
【0079】
図8は、第1変動検出部12の概略構成を示したブロック図である。第1変動検出部12は、図8に示すように、第2最大値検出部(第2包絡線検出手段)31と、第3最大値ホールド部(第2包絡線検出手段)32と、第2スムージング部(第2包絡線検出手段)33と、デシベル変換部(デシベル変換手段)34と、微分部(微分手段)35と、反転部(反転手段)36と、レベル制限部37と、リニア変換部(リニア変換手段)38とを有している。
【0080】
第2最大値検出部31は、LPF部10によって低域成分が抽出されたオーディオ信号の振幅を絶対値化した後に、所定の時間(mサンプル)内の最大値を検出して出力する役割を有している。第2最大値検出部31は、第1最大値検出部21と同様の処理を行う。従って、第2最大値検出部31においても、第1最大値検出部21と同様に、所定の時間(mサンプル)ごとに最大値が更新されて、第3最大値ホールド部32に出力される。ただし、第2最大値検出部31に対する入力信号として、所定の周波数でサンプリングされたデータが用いられている。
【0081】
なお、第2最大値検出部31または第3最大値ホールド部32においては、最大値検出における検出範囲が予め設定されており、設定された検出範囲以下(所定値以下)の信号レベルの検出は行なわれない。ここで、第2最大値検出部31には、楽曲分析部17の検出ゲイン算出部27より包絡線検出(第2包絡線の検出)の下限値(検出ゲイン)がリアルタイムに入力される。第2最大値検出部31は、検出ゲイン算出部27より取得した包絡線検出(第2包絡線の検出)の下限値に基づいて、設定された検出範囲の下限値をリアルタイムに(動的に)変動させて最大値の検出を行う。
【0082】
第3最大値ホールド部32は、第2最大値検出部31において所定の時間(mサンプル)ごとに更新される最大値を受信した場合において、受信した最新の最大値だけでなく、その最大値を含む過去n回分の最大値(n個の最大値)の中で、最も大きな値を示す最大値の値を求める。そして、第3最大値ホールド部32は、求められた最大値を所定の時間(mサンプル)ごとに、第2スムージング部33へ出力する。
【0083】
ここで、第3最大値ホールド部32も第1最大値ホールド部22と同様の処理を行う。このため、第3最大値ホールド部32も、第1最大値ホールド部22と同様に、第2最大値検出部31から所定の時間(mサンプル)ごとに所定の時間(mサンプル)の内で最も大きな値の最大値を取得し、さらに、取得した最大値を含む過去n回分の最大値の中で最も値の大きな最大値(つまり、n×mサンプルの間における最も値の高い最大値)を検出して、所定の時間(mサンプル)ごとに、第2スムージング部33へ出力する。なお、第3最大値ホールド部32から第2スムージング部33へと出力されるn×mサンプルの中で最も高い値の最大値は、所定の時間(mサンプル)だけ値がホールド(保持)された状態で出力される。
【0084】
第2スムージング部33は、第3最大値ホールド部32より取得した最大値の信号を積分処理することにより、最大値の変動を滑らかにする(スムージング処理する)役割を有している。第2スムージング部33も、第1スムージング部23と同様の処理を行う。第2スムージング部33が、第3最大値ホールド部32より取得した信号を滑らかにすることにより、低域のオーディオ信号に対する包絡線(第2包絡線)の信号検出を行うことが可能となる。
【0085】
デシベル変換部34は、第2スムージング部33においてスムージング処理することにより求められた包絡線信号(第2包絡線:この第2包絡線信号は、リニアな信号特性(振幅でゲインが示される特性)を有している)を、デシベルの包絡線信号(ゲインがデシベル単位で示される信号特性の包絡線信号)へと変換する役割を有している。デシベル変換部34によりデシベルの包絡線信号へと変換された信号は、微分部35へ出力される。
【0086】
微分部35は、デシベル変換部34より取得したデシベルの包絡線信号(第2包絡線信号)を微分することにより、変化量検出を行う役割を有している。微分部35によって、包絡線信号(第2包絡線信号)に対して微分処理がなされた信号は、ゲイン(デシベル値)の変化量が大きい場合に高い値を示すことになり、変化量が小さい場合には低い値を示すことになる。微分部35によって微分処理された信号は反転部36へと出力される。
【0087】
なお、微分部35における微分処理は、LPF部10で低域成分の抽出が行われたオーディオ信号に対して、ハイパスフィルタを用いたフィルタリング処理を行うことによって実現される。また、このハイパスフィルタにおける正規化カットオフ周波数の設定値を変更することによりフィルタリング処理により求められる変化量の変化時間を調整することが可能となっている。
【0088】
例えば、ダイナミックレンジが圧縮されて振幅が平坦化される状態は、コンプレッサやリミッタにおける設定により異なり、また、CDとDVDとでは、既に説明したように、ダイナミックレンジの圧縮状態が異なったものとなる。従って、オーディオ信号におけるダイナミックレンジの圧縮状態に応じて正規化カットオフ周波数を調整することにより、ダイナミックレンジの圧縮状態に適したダイナミックレンジの拡張時間の調整を行うことが可能となる。
【0089】
反転部36は、微分部35より取得された信号(変化量信号)に−1を乗算することにより信号の反転を行う役割を有している。さらに、レベル制限部37は、反転部36において反転された信号のマイナス側の変化量を制限し、プラス側の変化量のみを検出して、リニア変換部38へ出力する。リニア変換部38は、レベル制限部37においてプラス側の変化量のみ検出された信号を、リニアな信号に変換して検出信号として第1重み付け部14へと出力する。
【0090】
このように、第1変動検出部12では、LPF部10によって抽出された低域のオーディオ信号の包絡線(第2包絡線)に基づいて、小さい信号から大きい信号に変化する量を検出信号(低域用検出信号)として検出することができ、検出された検出信号は、大きく変化するほど検出量が大きくなる。
【0091】
また、第2変動検出部13も、図8に示す第1変動検出部12と同様の機能部を備えている。第2変動検出部13においては、HPF部11によって抽出された高域のオーディオ信号の包絡線(第2包絡線)に基づいて、小さい信号から大きい信号に変化する量を検出信号(高域用検出信号)として検出することができ、検出された検出信号は、大きく変化するほど検出量が大きくなる。第2変動検出部13における機能部の構成およびその役割は、図2に示す第1変動検出部12と同じものであるため、説明を省略する。
【0092】
なお、第2変動検出部13の第2最大値検出部31に対しても、楽曲分析部17の検出ゲイン算出部27より包絡線検出の下限値(検出ゲイン)がリアルタイムに入力される。このため、第2変動検出部13の第2最大値検出部31も、検出ゲイン算出部27より取得した包絡線検出の下限値(検出ゲイン)に基づいて、設定された検出範囲の下限値をリアルタイムに(動的に)変動させて最大値の検出を行う。
【0093】
[第1重み付け部および第2重み付け部]
図9は、第1重み付け部14の概略構成を示したブロック図である。第1重み付け部14は、図9に示すように、乗算部(補完信号生成手段)41、減算部(補完信号生成手段)42およびゲイン部(ゲイン調節手段)43を有している。
【0094】
乗算部41は、LPF部10より入力される低域のオーディオ信号と、第1変動検出部12より入力される低域用検出信号との乗算処理を行う役割を有している。乗算部41の乗算処理により、低域のオーディオ信号において、小さい信号から大きい信号に変化する箇所の信号レベルが検出信号の検出量に対応して増幅されることになる。
【0095】
減算部42は、LPF部10より入力される低域のオーディオ信号から、乗算部41によって検出量に対応する増幅処理が行われた低域のオーディオ信号を減算する役割を有している。このように、減算部42で減算処理を行うことにより、低域のオーディオ信号において、小さい信号から大きい信号に変化する箇所における増幅前のオーディオ信号と増幅後のオーディオ信号との信号レベル差を重み付け量として求めることが可能となる。このようにして求められた重み付け量に関する信号(低域用重み付け信号:ゲイン調節手段によりゲイン調節される前の低域補完信号)は、減算部42からゲイン部43へ出力される。
【0096】
ゲイン部43は、低域用重み付け信号に対してゲインの増幅および減衰を行うことにより重み付け量の調節を行い、低域用の補完信号(低域補完信号)を生成する役割を有している。生成された低域用の補完信号は、合成部16へ出力される。
【0097】
低域用重み付け信号は、包絡線信号における最大値変化に基づいて生成されるため、ダイナミックレンジが圧縮されて平坦化された箇所におけるゲイン(振幅)を拡張することが可能である。しかしながら、拡張すべきダイナミックレンジのゲインは、ダイナミックレンジが圧縮されて平坦化されたオーディオ信号ごとに異なり、そのまま低域用重み付け信号をオーディオ信号に加算しても、十分なダイナミックレンジの補完(拡張)を行えなかったり、ダイナミックレンジの補完(拡張)量が多すぎたりして、かえって音質の低下を招いてしまうおそれもある。
【0098】
このため、オーディオ信号の圧縮状態などに応じて、ゲイン部43で予め低域用重み付け信号にゲインの増幅および減衰を行って、重み付け量の調節をした補完信号を生成することにより、次述する合成部16においてオーディオ信号に補完信号が加算された信号のダイナミックレンジを適切に拡張し、調整することが可能となる。
【0099】
このように、第1重み付け部14では、減算部42で、LPF部10より入力された低域のオーディオ信号から、検出量に対応する増幅処理が行われた低域のオーディオ信号を減算することにより、低域のオーディオ信号における重み付け量を求めるとともに、ゲイン部43で、求められた重み付け量の調整を行うことにより低域補完信号を生成する。
【0100】
また、第2重み付け部15も、図9に示す第1重み付け部14と同様の機能部を備えている。第2重み付け部15では、減算部で、HPF部11より入力された高域のオーディオ信号から、検出量に対応する増幅処理が行われた高域のオーディオ信号を減算することにより、高域のオーディオ信号における重み付け量を求めるとともに、求められた重み付け量の調整を行うことにより高域補完信号を生成する。第2重み付け部15における機能部の構成およびその役割は、図9に示す第1重み付け部14と同じものであるため、説明を省略する。
【0101】
[合成部]
合成部16は、ダイナミックレンジ拡張装置1に入力されたオーディオ信号(ダイナミックレンジの圧縮により平坦化された状態となったオーディオ信号)に対して、第1重み付け部14において求められた低域補完信号と、第2重み付け部15において求められた高域補完信号とを加算する処理を行う役割を有している。このように加算処理を行うことによって、ダイナミックレンジの圧縮により平坦化された音源のオーディオ信号に対して、信号の包絡線(第2包絡線)の変化量に応じてゲイン補完がなされた低域成分・高域成分のオーディオ信号が加えられるため、ダイナミックレンジを拡張することができ、聴感上でメリハリ感や臨場感、音質を向上させることができる。
【0102】
なお、本実施の形態に係るダイナミックレンジ拡張装置1では、中域成分に対するダイナミックレンジの拡張処理は行っていない。中域成分は、一般的に、聴覚の感度が高く、ボーカル等の音声成分も多く含まれるため、中域成分におけるダイナミックレンジの拡張を行うと、聴感上の変動感を聴取者に与えてしまうおそれがあるからである。ただし、本実施の形態に係るダイナミックレンジ拡張装置1は、低域成分と高域成分とに対してのみダイナミックレンジの拡張処理を行う場合を一例として示しただけであり、中域成分についてもダイナミックレンジの拡張処理を行う構成とすることも可能である。さらに、低域成分のみ、中域成分のみ、高域成分のみ、低域成分と中域成分のみ、高域成分と中域成分のみなど、様々な組み合わせによってダイナミックレンジの拡張処理を行うことも可能である。
【0103】
[動作例説明]
次に、上述したダイナミックレンジ拡張装置1の動作例について説明する。図10は、ダイナミックレンジ拡張装置1における動作例を説明するために設定した各機能部の動作パラメータを示した表である。ダイナミックレンジ拡張装置1には、CDに記録されるオーディオ信号が入力されるものとする。
【0104】
図10に示すように、LPF部10およびHPF部11には、2次のバタワースフィルタが用いられており、LPF部10のカットオフ周波数は200Hz、HPF部11のカットオフ周波数は4kHzに設定されている。また、第1変動検出部12、第2変動検出部13および楽曲分析部17に入力されるオーディオ信号は、CDに記録されるオーディオ信号であることから、サンプリング周波数が44.1kHzの音源によるものとなる。このようなオーディオ信号に対して、第1変動検出部12、第2変動検出部13および楽曲分析部17の最大値検出の間隔は、64サンプルに設定される。
【0105】
さらに、第1変動検出部12および第2変動検出部13の第2最大値検出部31による最大値検出の検出範囲は、−30+10logYmax[dB]〜0[dB]の間で動的に変動される設定になっている。この検出範囲の下限値は、検出ゲイン算出部27によって設定された包絡線検出(第2包絡線検出)の下限値(検出ゲイン)により決定される。ただし、最大値検出における検出範囲は−30+10logYmax[dB]〜0[dB]の間であるため、−30+10logYmax[dB]以下となるオーディオ信号に関しては、−30+10logYmax[dB]として出力される。従って、−30+10logYmax[dB]以下のオーディオ信号については、低域補完信号および高域補完信号の生成は行われない。また、楽曲分析部17の第1最大値検出部21における最大値検出のサンプリング周波数、最大値検出の間隔は、第2最大値検出部31と同様である。
【0106】
また、サンプリング周波数が44.1kHzのオーディオ信号において、最大値検出の間隔が64サンプルに設定されると、第1〜第3最大値ホールド部22、26、32によりホールド処理されるオーディオ信号のサンプリング周波数は、689Hz(44,110Hz÷64サンプル)となる。
【0107】
さらに、楽曲分析部17の第1スムージング部23、および第1変動検出部12および第2変動検出部13の第2スムージング部33には、1次のバタワース・ローパスフィルタが用いられ、微分部35には、1次のバタワース・ハイパスフィルタが用いられている。なお、楽曲分析部17の第1スムージング部23、および、第1変動検出部12および第2変動検出部13における第2スムージング部33の正規化カットオフ周波数は、689Hzを1.0とした場合に0.1に該当する周波数(68.9Hz)が設定されている。
【0108】
また、第1変動検出部12における微分部35の正規化カットオフ周波数は、689Hzを1.0とした場合に0.0171に該当する周波数が設定され、第2変動検出部13における微分部の正規化カットオフ周波数は、689Hzを1.0とした場合に0.0051に該当する周波数が設定されている。
【0109】
微分部35におけるハイパスフィルタのカットオフ周波数を調整することにより、低域用検出信号および高域用検出信号における応答時間を制御することが可能となっている。例えば、カットオフ周波数を高くするほど検出信号の応答時間(検出信号における検出量の変動時間(反映時間))が長くなり、ダイナミックレンジの拡張における低域補完信号および高域補完信号の生成時間(補完信号により増大されるオーディオ信号の増大反映時間)を長くすることができる。
【0110】
また、第1重み付け部14のゲイン部43では、重み付け量の調整を行うために、入力される低域用重み付け信号に対して6dBのゲイン増幅量が設定されている。また、第2重み付け部15のゲイン部においては、入力される高域用重み付け信号に対して0dBのゲイン増幅量が設定されており、実質的に増減を行わない設定となっている。
【0111】
図11〜図15は、図10に示すように各機能部のパラメータを設定した場合における動作例を示した図である。
【0112】
図11(a)は、ダイナミックレンジ拡張装置1に、ダイナミックレンジが圧縮されて振幅が平坦化されたオーディオ信号が入力される場合の振幅変化状態を示した図である。一方で、図11(b)は、第1変動検出部12および第2変動検出部13の第2最大値検出部31において、検出の下限値を−30[dB]に固定した場合におけるダイナミックレンジ拡張装置1の出力信号の振幅変化状態を示している。図11(c)は、第2最大値検出部31における検出の下限値を−30+10logYmax[dB]として変動させた場合におけるダイナミックレンジ拡張装置1の出力信号の振幅変化状態を示している。
【0113】
図11(a)では、オーディオ信号が平坦化されているのに対して、(b)(c)は、ダイナミックレンジの拡張が行われて平坦化された振幅部分(クリップ)がなくなり、違和感のないオーディオ出力を得ることが可能となっている。このように、本実施の形態に係るダイナミックレンジ拡張装置1では、低域補完信号および高域補完信号が、低域のオーディオ信号の包絡線(第2包絡線)および高域のオーディオ信号の包絡線(第2包絡線)をそれぞれ微分することにより生成されるため、ダイナミックレンジが圧縮されたオーディオ信号の信号波形が矩形状に近づき変化量が大きくなるほど、生成される低域補完信号および高域補完信号のレベルが大きくなる。このため、ダイナミックレンジの圧縮が大きい部分ほど(平坦化された部分ほど)、信号補完が積極的に行われて平坦部分が低減されて、圧縮の度合い応じた補完信号がオーディオ信号に合成されることになる。従って、いかなるダイナミックレンジの圧縮状態においても、ダイナミックレンジの圧縮処理が行われる前の状態の源音に、ダイナミックレンジを近づけることが可能となる。
【0114】
また、ダイナミックレンジ拡張装置1におけるダイナミックレンジの拡張処理は、包絡線に基づいて求められる低域補完信号および高域補完信号により行われるため、ダイナミックレンジが圧縮されたオーディオ信号のボリューム設定の大小に係わらず効果的に行うことが可能となる。従って、パワーアンプやスピーカに十分な再生能力がある場合には、CDやDVDのような記録媒体におけるダイナミックレンジの制限によって、ダイナミックレンジが圧縮されたオーディオ信号を、ボリューム設定の音量を増大した後にスピーカから再生(出力)し、または、パワーアンプ等を介してスピーカから再生(出力)しても、出力信号のダイナミックレンジが拡張されているため、出力音のメリハリ感と臨場感を体感することが可能となり、不要な高調波の発生を抑制することが可能となる。
【0115】
なお、図11(b)(c)のどちらのオーディオ信号も、同様にダイナミックレンジの拡張が行われており、出力される音に高調波などが発生していない。
【0116】
一方で、図12(a)は、ダイナミックレンジ拡張装置1に、ダイナミックレンジが圧縮されていないオーディオ信号が入力される場合の振幅変化状態を示した図である。図12(b)は、第2最大値検出部31における包絡線(第2包絡線)の検出の下限値を−30[dB]に固定した場合における出力信号の振幅変化状態を示し、(c)は、検出の下限値を−30+10logYmax[dB]として変動させた場合における出力信号の振幅変化状態を示している。
【0117】
図12(a)では、オーディオ信号のダイナミックレンジの圧縮が行われていないため、信号は平坦化されていない。このようなオーディオ信号に対して、検出の下限値を−30[dB]に固定した状態でダイナミックレンジの拡張処理を行ってしまうと、図12(b)に示すように、本来拡張を行う必要のないダイナミックレンジが拡張されてしまい、音質の低減を招いてしまうおそれがある。
【0118】
一方で、検出の下限値を−30+10logYmax[dB]として変動させた状態でダイナミックレンジの拡張処理を行うと、図12(c)に示すように、ダイナミックレンジが不要に拡張されてしまうことを抑制し、音質の低下を抑制することが可能となる。これは、楽曲分析部17において、振幅最大値に対する振幅平均値の比(Ymean/Ymax)の値に応じて、包絡線検出の下限値が変動されるためである。
【0119】
具体的に、比(Ymean/Ymax)の値が高くて、ダイナミックレンジの圧縮が行われているおそれが高い場合には、ダイナミックレンジの拡張を行うための包絡線(第2包絡線)の下限値を積極的に低い値に設定(決定)して、クリップが生じ得るオーディオ信号のダイナミックレンジが効果的に拡張されるように制御し、比(Ymean/Ymax)の値が低くて、ダイナミックレンジの圧縮が行われていないおそれが高い場合には、楽曲分析部17において、ダイナミックレンジの拡張を行うための包絡線(第2包絡線)の下限値を積極的に高い値に設定(決定)することによって、クリップが生じていないオーディオ信号のダイナミックレンジが過剰に拡張されてしまうことを防止する。
【0120】
従って、振幅最大値に対する振幅平均値の比(Ymean/Ymax)の値に応じて、包絡線検出(第2包絡線検出)の下限値を変動させることにより、ダイナミックレンジの圧縮が行われていないオーディオ信号のダイナミックレンジが、不要に拡張されてしまうことを効果的に抑制することが可能となる。
【0121】
図13は、楽曲分析部17において設定される包絡線検出の下限値の変動状態を説明するための図である。図13(a)は、図11(a)に示す圧縮されたオーディオ信号がダイナミックレンジ拡張装置1に入力されて図11(c)の信号が出力される場合において、第1スムージング部23より算出された入力信号の包絡線(第1包絡線)と、平均値ホールド部25で求められた振幅平均値と、第2最大値ホールド部26で求められた振幅最大値との変化状態((a)の上段グラフ参照)と、振幅最大値に対する振幅平均値の比(Ymean/Ymax)の値の状態変化((a)の中段グラフ参照)と、包絡線検出(第2包絡線の検出)の下限値の変動状態((a)の下段グラフ参照)とを、入力されるオーディオ信号の楽曲先頭から30秒間検出した結果を示している。また、図13(b)は、図12(a)に示す圧縮されていないオーディオ信号がダイナミックレンジ拡張装置1に入力されて図12(c)の信号が出力される場合における同様の変動状態((b)の上・中・下段グラフ参照)を、30秒間検出した結果を示している。
【0122】
図13(a)の中段グラフにおいて、振幅最大値に対する振幅平均値の比(Ymean/Ymax)の値が0.45(20秒経過後)を上回るに従って、図13(a)の下段グラフにおいて、包絡線検出の下限値が低減される状態が示されている。この比(Ymean/Ymax)の値に対する包絡線検出の下限値の変動は、図3に示したグラフおよび式1に対応するものである。一方で、図13(b)の中段グラフにおいては、振幅平均値の比(Ymean/Ymax)の値が0.45を下回っているため、図13(b)の下段グラフには、包絡線検出の下限値は示されていない。
【0123】
図14(a)は、ダイナミックレンジが圧縮されて振幅が平坦化されたフルスケールのオーディオ信号の振幅変動状態を示し、(b)は、ダイナミックレンジが圧縮されて振幅が平坦化されたフルスケールに満たない(フルスケール未満)のオーディオ信号の振幅変動状態を示している。また、図14(c)は、(a)に示されるフルスケールのオーディオ信号のダイナミックレンジをダイナミックレンジ拡張装置1において拡張したオーディオ信号の振幅変動状態を示し、図14(d)は、(b)に示されるフルスケール未満のオーディオ信号のダイナミックレンジをダイナミックレンジ拡張装置1において拡張したオーディオ信号の振幅変動状態を示している。
【0124】
具体的に、図14(a)は、CDに収録されたフルスケールのオーディオ信号の振幅変動状態を示している。図14(b)は、フルスケールに満たない信号であって、(a)のオーディオ信号の振幅に1/100(百分の一)を乗算した信号を示している。このため、図14(a)のオーディオ信号では、平坦化された振幅の制限値が±1となっているのに対して、図14(b)のオーディオ信号では、平坦化された振幅の制限値が±0.01となって、図14(a)に示す振幅の百分の一のスケールとなっている。なお、図14(a)のオーディオ信号も、図14(b)のオーディオ信号も、振幅のスケールは異なるが、振幅の変化状態は共通しており、制限される振幅(振幅±1又は振幅±0.01)に基づいて一部の箇所が平坦化された状態となっている。
【0125】
また、図15(a)は、図13(a)と同様に、図14(a)に示す圧縮されたフルスケールのオーディオ信号がダイナミックレンジ拡張装置1に入力されて図14(c)の信号が出力される場合において、第1スムージング部23より算出された入力信号の包絡線と、平均値ホールド部25で求められた振幅平均値と、第2最大値ホールド部26で求められた振幅最大値との変化状態((a)の上段グラフ参照)と、振幅最大値に対する振幅平均値の比(Ymean/Ymax)の値の状態変化((a)の中段グラフ参照)と、包絡線検出の下限値の変動状態((a)の下段グラフ参照)とを、入力されるオーディオ信号の楽曲先頭から30秒間検出した結果を示している。また、図15(b)は、図14(b)に示す圧縮されたフルスケール未満のオーディオ信号がダイナミックレンジ拡張装置1に入力されて、図14(d)の信号が出力される場合における同様の変動状態((b)の上・中・下段グラフ参照)を、30秒間検出した結果を示している。
【0126】
本実施の形態に係るダイナミックレンジ拡張装置1に、図14(a)に示す圧縮されたフルスケールのオーディオ信号が入力されると、図14(c)に示すように、ダイナミックレンジの拡張が行われて、±1に平坦化されていた振幅が±1以上に補正され、ダイナミックレンジの拡張が行われる。このとき、図15(a)の中段グラフにおいて、振幅最大値に対する振幅平均値の比(Ymean/Ymax)の値が0.45を上回る(20秒以降になる)と、図15(a)の下段グラフに示すように、包絡線検出の下限値が低減された状態となる。この比(Ymean/Ymax)の値に対する包絡線検出の下限値の変動は、図3に示したグラフおよび式1に対応するものであるが、図15(a)において入力されるオーディオ信号の振幅最大値は、図14(a)・図15(a)上段に示すように1であるため、比の値(Ymean/Ymax)が0.45を上回る場合には、包絡線検出の下限値f(Ymean,Ymax)が−10[dB]程度の値(−200・Ymean/Ymax+90+10logYmaxにおいて、Ymean/Ymaxに0.45を代入し、Ymaxに1を代入した値)に低減(変動)されることになる。
【0127】
一方で、本実施の形態に係るダイナミックレンジ拡張装置1に、図14(b)に示す圧縮されたフルスケール未満のオーディオ信号が入力されると、図14(d)に示すように、ダイナミックレンジの拡張が行われて、±0.01に平坦化されていた振幅が±0.01以上に補正され、ダイナミックレンジの拡張が行われる。このとき、図15(b)の中段グラフにおいて、振幅最大値に対する振幅平均値の比(Ymean/Ymax)の値が0.45を上回る場合には、図15(b)の下段グラフに示すように、包絡線検出の下限値が一気に−40[dB]まで低減された後に緩やかに低減される傾向を示す。この比(Ymean/Ymax)の値に対する包絡線検出の下限値の変動は、図3に示したグラフおよび式1に対応するものであるが、図15(b)において入力されるオーディオ信号の振幅最大値は、図14(b)、図15(b)の上段の振幅最大値に示すように0.01であるため、比の値(Ymean/Ymax)が0.45の場合には、包絡線検出の下限値f(Ymean,Ymax)が−40[dB]程度の値(−200・Ymean/Ymax+90+10logYmaxにおいて、Ymean/Ymaxに0.45を代入し、Ymaxに0.01を代入した値)に低減(変動)されることになる。
【0128】
このように、本実施の形態に係るダイナミックレンジ拡張装置1では、包絡線検出(第2包絡線検出)の下限値が振幅最大値に応じて(logYmaxの値に応じて)変動されるため、入力されるオーディオ信号がフルスケールに満たない場合であって制限される振幅の値が低い場合であっても、入力されるオーディオ信号がフルスケールであって制限される振幅の値が高い場合であっても、その制限される振幅値(振幅最大値)に応じて適切にダイナミックレンジの拡張処理が行われることになる。
【0129】
このため、フルスケールに満たないオーディオ信号であって、ダイナミックレンジの圧縮が行われている信号に対し、ダイナミックレンジの拡張処理が行われない可能性を排除することができる。
【0130】
以上、本発明に係るダイナミックレンジ拡張装置について、実施の形態において一例を示して説明を行ったが、本発明に係るダイナミックレンジ拡張装置は、上述した実施の形態に示す例には限定されない。当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
【0131】
例えば、本実施の形態に係るダイナミックレンジ拡張装置1では、入力されたオーディオ信号を、LPF部10とHPF部11とでそれぞれ低域成分および高域成分を抽出してダイナミックレンジの拡張を行う場合について説明を行ったが、ダイナミックレンジの拡張は必ずしも低域成分と高域成分とに分割する場合には限定されない。高域成分と低域成分との2つに分割するだけでなく3つ以上の帯域に分割してそれぞれダイナミックレンジの拡張を行う構成とするものであってもよく、また、全く帯域分割することなくダイナミックレンジの拡張を行う構成とするものであってもよい。
【符号の説明】
【0132】
1 …ダイナミックレンジ拡張装置
10 …LPF部
11 …HPF部
12 …第1変動検出部
13 …第2変動検出部
14 …第1重み付け部
15 …第2重み付け部
16 …合成部(加算手段)
17 …楽曲分析部
21 …第1最大値検出部(第1包絡線検出手段)
22 …第1最大値ホールド部(第1包絡線検出手段)
23 …第1スムージング部(第1包絡線検出手段)
24 …モノラル変換部
25 …平均値ホールド部(平均値算出手段)
26 …第2最大値ホールド部(最大値算出手段)
27 …検出ゲイン算出部(検出ゲイン決定手段)
31 …第2最大値検出部(第2包絡線検出手段)
32 …第3最大値ホールド部(第2包絡線検出手段)
33 …第2スムージング部(第2包絡線検出手段)
34 …デシベル変換部(デシベル変換手段)
35 …微分部(微分手段)
36 …反転部(反転手段)
37 …レベル制限部
38 …リニア変換部(リニア変換手段)
41 …乗算部(補完信号生成手段)
42 …減算部(補完信号生成手段)
43 …ゲイン部(ゲイン調節手段)

【特許請求の範囲】
【請求項1】
音源から出力されるオーディオ信号の最大値変化状態に基づいて第1包絡線の検出を行う第1包絡線検出手段と、
該第1包絡線検出手段により検出された前記第1包絡線における所定時間の平均的な振幅の値を振幅平均値Ymeanとして算出する平均値算出手段と、
前記第1包絡線検出手段により検出された前記第1包絡線の前記所定時間における振幅の最大値を振幅最大値Ymaxとして算出する最大値算出手段と、
前記平均値算出手段により算出された振幅平均値Ymeanと前記最大値算出手段により算出された振幅最大値Ymaxと基づいて、検出ゲインを決定する検出ゲイン決定手段と、
該検出ゲイン決定手段により決定された前記検出ゲインを下限値として、前記音源から出力されるオーディオ信号の最大値変化状態を求めて第2包絡線の検出を行う第2包絡線検出手段と、
該第2包絡線検出手段により検出された前記第2包絡線をデシベル変換するデシベル変換手段と、
該デシベル変換手段によりデシベル変換された前記第2包絡線を微分処理することにより、前記第2包絡線の変化量を示す変化量信号を生成する微分手段と、
前記微分手段により生成された変化量信号に−1を乗算することにより信号の反転を行う反転手段と、
該反転手段により反転された前記変化量信号をリニアな信号に変換することにより検出信号を生成するリニア変換手段と、
前記オーディオ信号に前記検出信号を乗算した信号を、前記オーディオ信号から減算することにより補完信号を生成する補完信号生成手段と、
該補完信号生成手段により生成された補完信号を、前記オーディオ信号に加算する加算手段と
を備え、
前記検出ゲイン決定手段は、
前記振幅最大値Ymaxに対する前記振幅平均値Ymeanの比の値が、0.5より小さい値に設定される第1閾値よりも小さい場合に、前記検出ゲインを0[dB]に決定し、
前記比の値が前記第1閾値である場合に、前記検出ゲインを10logYmax[dB]に決定し、
前記比の値が前記第1閾値以上であって、かつ、0.5より大きい値に設定される第2閾値以下である場合に、前記比の値が前記第1閾値から前記第2閾値まで増加するのに反比例させるようにして、前記10logYmax[dB]より低減させた値を前記検出ゲインに決定し、
前記比の値が前記第2閾値より大きい場合に、低減された前記検出ゲインにおける前記第2閾値の値を前記検出ゲインに決定する
ことを特徴とするダイナミックレンジ拡張装置。
【請求項2】
前記検出ゲイン決定手段は、
前記比の値が前記第1閾値以上であって、かつ、前記第2閾値以下である場合に、前記比の値が前記第1閾値から前記第2閾値まで増加するのに反比例させるようにして、前記検出ゲインを、前記10logYmax[dB]から−30+10logYmax[dB]まで低減させ、
前記比の値が前記第2閾値より大きい場合に、前記検出ゲインを−30+10logYmax[dB]に決定する
ことを特徴とする請求項1に記載のダイナミックレンジ拡張装置。
【請求項3】
前記補完信号生成手段により生成された補完信号のゲインを増幅又は減衰することによりゲイン調節を行うゲイン調節手段を有し、
前記加算手段は、前記ゲイン調節手段によりゲイン調節された前記補完信号を、前記オーディオ信号に加算すること
を特徴とする請求項1または請求項2に記載のダイナミックレンジ拡張装置。
【請求項4】
前記微分手段は、ハイパスフィルタを用いて前記オーディオ信号のフィルタリング処理を行うことによって微分処理を行い、
該フィルタリング処理により求められる前記変化量の変化時間は、前記ハイパスフィルタにおける正規化カットオフ周波数の設定値を変更することにより調整されること
を特徴とする請求項1乃至請求項3のいずれか1項に記載のダイナミックレンジ拡張装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate


【公開番号】特開2013−98832(P2013−98832A)
【公開日】平成25年5月20日(2013.5.20)
【国際特許分類】
【出願番号】特願2011−241092(P2011−241092)
【出願日】平成23年11月2日(2011.11.2)
【出願人】(000001487)クラリオン株式会社 (1,722)
【Fターム(参考)】