説明

音響信号処理装置および方法、並びに、プログラム

【課題】音響信号のダイナミックレンジを適切に回復する。
【解決手段】拡張区間検出装置112は、AGC111によりレベル補正された補正入力信号の定位分布のセンターへの集中度を示すセンター定位度を検出し、センター定位度に基づいて、入力信号のダイナミックレンジを拡張する拡張区間を検出する。ダイナミックレンジ拡張器115は、拡張区間において補正入力信号のダイナミックレンジを拡張する。本発明は、例えば、音楽プレーヤに適用できる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音響信号処理装置および方法、並びに、プログラムに関し、特に、音響信号のダイナミックレンジの拡張を行う場合に用いて好適な音響信号処理装置および方法、並びに、プログラムに関する。
【背景技術】
【0002】
インターネットなどのネットワークを介して音響信号を伝送する場合、伝送路の能力や規格等により、伝送可能な音響信号のピーク値(以下、最大伝送レベルと称する)が制限される。そして、ピーク値が最大伝送レベル以下になるように音響信号を減衰した場合、ダイナミックレンジが広い音響信号ほど信号レベルの平均値(以下、平均レベルと称する)が低くなり、音量感が損なわれる。
【0003】
そこで、音量感を増すために、音響信号を増幅し、いったん平均レベルを引き上げた後、最大伝送レベルを超える成分をリミッタ回路等でカットまたは減衰してから、音響信号を伝送する場合がある。この処理の具体例について、図1を参照して説明する。
【0004】
図1の各グラフは、音響信号の波形を模式的に示しており、横軸が時間を示し、縦軸が信号レベルを示している。また、図1A乃至図1Cの点線は、最大伝送レベルを示している。
【0005】
図1Aは、オリジナルの音響信号の波形の例を示している。また、図1Bは、音量感を増すために図1Aの音響信号を増幅し、平均レベルを引き上げた後の音響信号の波形の例を示している。さらに、図1Cは、図1Bの音響信号に対してリミッタ処理を行い、最大伝送レベルを超える部分をカットした音響信号の波形の例を示している。そして、図1Cの音響信号が、ネットワークを介して伝送される。
【0006】
図1Cの音響信号は、図1Aの音響信号と比較して、平均レベルが高くなっているが、信号レベルの変動が小さくなっている。従って、オリジナルの音響信号と比べて音量感が増す一方、オリジナルの音響信号が有していたダイナミックレンジが失われ、平坦でメリハリのない音になってしまう。
【0007】
一方、従来、音響信号のダイナミックレンジを拡張する技術として、エキスパンダが広く知られている(例えば、特許文献1参照)。エキスパンダは、音響信号のレベルに応じて、増幅用のゲインを変えることにより、音響信号のダイナミックレンジを拡張するものである。また、拡張特性をユーザが調整できるようにしたエキスパンダも存在する。
【先行技術文献】
【特許文献】
【0008】
【特許文献1】特開2001−230647号公報
【発明の概要】
【発明が解決しようとする課題】
【0009】
図2は、従来のエキスパンダの入出力特性の一例を示し、入力信号のレベル(横軸)に対する出力信号のレベル(縦軸)の比率を示している。
【0010】
この入出力特性を有するエキスパンダを用いると、小さな音をより小さく、大きな音をより大きくすることができる。その結果、ダイナミックレンジが拡張され、メリハリのある音を得ることができる。
【0011】
ここで、図3を参照して、図2の入出力特性を有するエキスパンダにより、図1Cの音響信号のダイナミックレンジを拡張する場合について考える。なお、図3の各グラフは、図1と同様に、音響信号の波形を模式的に示している。
【0012】
通常、ダイナミックレンジを拡張することにより音響信号のピーク値が高くなりすぎないように、エキスパンダに入力する前に、音響信号の平均レベルが所定の値まで下げられる。例えば、図1Cの音響信号は、平均レベルが高いため、エキスパンダに入力する前に、図3Aに示されるように、平均レベルが所定の値まで下げられる。
【0013】
図3Bは、図3Aの音響信号に対して、図2の入出力特性を有するエキスパンダによりダイナミックレンジの拡張を行った後の音響信号の波形の例を示している。このように、いったんダイナミックレンジが失われた音響信号に対しては、エキスパンダによりダイナミックレンジの拡張を行っても、本来のダイナミックレンジを回復することができない。
【0014】
本発明は、このような状況を鑑みてなされたものであり、音響信号のダイナミックレンジを適切に回復できるようにするものである。
【課題を解決するための手段】
【0015】
本発明の一側面の音響信号処理装置は、音響信号の定位分布のセンターへの集中度を示すセンター定位度を検出するセンター定位度検出手段と、前記センター定位度に基づいて、前記音響信号のダイナミックレンジを拡張する拡張区間を検出する拡張区間検出手段と、前記拡張区間において前記音響信号のダイナミックレンジを拡張する拡張手段とを備える。
【0016】
前記拡張区間検出手段には、前記音響信号の定位分布のセンターへの遷移度を示すセンター遷移度が所定の閾値以上となる区間を前記拡張区間として検出させることができる。
【0017】
前記センター遷移度は、前記センター定位度の微分値とすることができる。
【0018】
前記拡張区間検出手段には、前記センター定位度が所定の閾値以上となる区間を前記拡張区間として検出させることができる。
【0019】
前記音響信号のレベルを示す入力信号レベルを検出する入力信号レベル検出手段と、前記音響信号のダイナミックレンジを拡張するレベルを示し、前記拡張区間とは異なる区間において所定の最小値となり、前記拡張区間において所定の最大値以下の範囲内で推移する拡張信号レベルを設定する拡張信号レベル設定手段とをさらに設け、前記拡張手段には、前記拡張信号レベルが前記入力信号レベルを超える区間において、前記音響信号のダイナミックレンジを拡張させることができる。
【0020】
前記入力信号レベルと前記拡張信号レベルとを比較し、いずれか大きい方を出力する比較手段と、前記比較手段の出力値および前記入力信号レベルに基づいて拡張ゲインを算出する拡張ゲイン算出手段とをさらに設け、前記拡張手段には、前記拡張ゲインに基づいて前記音響信号を増幅することにより、前記音響信号のダイナミックレンジを拡張させることができる。
【0021】
前記音響信号のレベルを一定にする補正を行う補正手段をさらに設け、前記センター定位度検出手段には、補正された前記音響信号のセンター定位度を検出させ、前記拡張手段には、補正された前記音響信号のダイナミックレンジを拡張させることができる。
【0022】
本発明の一側面の音響信号処理方法は、音響信号のダイナミックレンジを拡張する音響信号処理装置が、音響信号の定位分布のセンターへの集中度を示すセンター定位度を検出し、前記センター定位度に基づいて、前記音響信号のダイナミックレンジを拡張する拡張区間を検出し、前記拡張区間において前記音響信号のダイナミックレンジを拡張するステップを含む。
【0023】
本発明の一側面のプログラムは、音響信号の定位分布のセンターへの集中度を示すセンター定位度を検出し、前記センター定位度に基づいて、前記音響信号のダイナミックレンジを拡張する拡張区間を検出し、前記拡張区間において前記音響信号のダイナミックレンジを拡張するステップを含む処理をコンピュータに実行させる。
【0024】
本発明の一側面においては、音響信号の定位分布のセンターへの集中度を示すセンター定位度が検出され、前記センター定位度に基づいて、前記音響信号のダイナミックレンジを拡張する拡張区間が検出され、前記拡張区間において前記音響信号のダイナミックレンジが拡張される。
【発明の効果】
【0025】
本発明の一側面によれば、音響信号のダイナミックレンジを適切に回復させることができる。
【図面の簡単な説明】
【0026】
【図1】伝送前に音響信号に対して行う処理の例を説明するための図である。
【図2】エキスパンダの入出力特性の一例を示すグラフである。
【図3】エキスパンダにより音響信号のダイナミックレンジを拡張する処理を説明するための図である。
【図4】本発明を適用した音響信号処理装置の第1の実施の形態を示すブロック図である。
【図5】拡張区間検出装置の機能の構成例を示すブロック図である。
【図6】ダイナミックレンジ拡張処理の第1の実施の形態を説明するためのフローチャートである。
【図7】ダイナミックレンジ拡張処理の第1の実施の形態を説明するための信号波形図である。
【図8】拡張位置検出処理の詳細を説明するためのフローチャートである。
【図9】拡張位置検出処理の詳細を説明するための信号波形図である。
【図10】音響信号処理装置の第1の実施の形態によるダイナミックレンジ拡大処理の結果の一例を示す信号波形図である。
【図11】本発明を適用した音響信号処理装置の第2の実施の形態を示すブロック図である。
【図12】ダイナミックレンジ拡張処理の第2の実施の形態を説明するためのフローチャートである。
【図13】ダイナミックレンジ拡張処理の第2の実施の形態を説明するための信号波形図である。
【図14】ダイナミックレンジ拡張処理の第2の実施の形態を説明するための信号波形図である。
【図15】コンピュータの構成例を示すブロック図である。
【発明を実施するための形態】
【0027】
以下、本発明を実施するための形態(以下、実施の形態という)について説明する。なお、説明は以下の順序で行う。
1.第1の実施の形態(基本的な実施の形態)
2.第2の実施の形態(ダイナミックレンジの過剰な拡張を抑制するようにした例)
3.変形例
【0028】
<1.第1の実施の形態>
[音響信号処理装置の構成例]
図1は、本発明を適用した音響信号処理装置の第1の実施の形態を示すブロック図である。
【0029】
図1の音響信号処理装置101は、例えば、左右2チャンネル(Lch、Rch)のステレオの音響信号が入力され、入力された音響信号(以下、入力信号と称する)のダイナミックレンジを拡張して、出力する装置である。音響信号処理装置101は、AGC(Auto Gain Control)111、拡張区間検出装置112、拡張信号レベル設定器113、拡張ゲイン算出器114、および、ダイナミックレンジ拡張器115を含むように構成される。
【0030】
AGC111は、入力信号のレベルが一定になるようにレベル補正を行う。AGC111は、レベル補正した入力信号(以下、補正入力信号と称する)を拡張区間検出装置112およびダイナミックレンジ拡張器115に供給する。
【0031】
拡張区間検出装置112は、補正入力信号に基づいて、入力信号のダイナミックレンジを拡張する拡張区間を検出する。拡張区間検出装置112は、検出した拡張区間を示す拡張区間検出信号を拡張信号レベル設定器113に供給する。
【0032】
拡張信号レベル設定器113は、拡張区間検出信号に基づいて、入力信号のダイナミックレンジを拡張するレベルを示す拡張信号レベルを設定する。拡張信号レベル設定器113は、設定した拡張信号レベルを示す拡張信号レベル信号を拡張ゲイン算出器114に供給する。
【0033】
拡張ゲイン算出器114は、拡張信号レベル信号に基づいて、入力信号のダイナミックレンジを拡張するための拡張ゲインを算出する。拡張ゲイン算出器114は、算出した拡張ゲインを示す拡張ゲイン信号をダイナミックレンジ拡張器115に供給する。
【0034】
ダイナミックレンジ拡張器115は、拡張ゲイン信号に基づいて、補正入力信号を増幅することにより、補正入力信号のダイナミックレンジを拡張する。ダイナミックレンジ拡張器115は、その結果得られた音響信号(以下、出力信号と称する)を後段に出力する。
【0035】
[拡張区間検出装置の構成例]
図5は、図4の拡張区間検出装置112の構成例を示すブロック図である。拡張区間検出装置112は、センター定位度検出器131、センター遷移度検出器132、および、スレッショルド判定器133を含むように構成される。
【0036】
センター定位度検出器131は、AGC111から供給される補正入力信号の定位分布のセンターへの集中度を示すセンター定位度を検出する。センター定位度検出器131は、検出したセンター定位度を示すセンター定位度検出信号をセンター遷移度検出器132に供給する。
【0037】
センター遷移度検出器132は、センター定位度検出信号に基づいて、補正入力信号の定位分布のセンターへの遷移度を検出する。センター遷移度検出器132は、検出したセンター遷移度を示すセンター遷移度検出信号をスレッショルド判定器133に供給する。
【0038】
スレッショルド判定器133は、センター遷移度検出信号を所定の閾値と比較することにより、拡張区間を検出する。スレッショルド判定器133は、検出した拡張区間を示す拡張区間検出信号を拡張信号レベル設定器113に供給する。
【0039】
[ダイナミックレンジ拡張処理]
次に、図6のフローチャートおよび図7の信号波形図を参照して、音響信号処理装置101により実行されるダイナミックレンジ拡張処理について説明する。なお、この処理は、例えば、入力信号が音響信号処理装置101に入力されたとき開始される。
【0040】
なお、図7の各グラフは、ダイナミックレンジ拡張処理で処理される各種の信号の波形を模式的に示しており、横軸は時間を示し、縦軸は信号レベルを示している。また、図7A乃至図7Cおよび図7Eの点線は、許容される音響信号のピーク値(以下、最大許容ピークレベルと称する)を示している。
【0041】
また、以下、図7Aに示される入力信号が音響信号処理装置101に入力された場合の処理を、具体例として説明する。なお、図7Aの入力信号は、図1Cの音響信号と同じ信号である。
【0042】
ステップS1において、AGC111は、レベル補正を行う。具体的には、AGC111は、入力信号の各チャンネルの平均レベルが所定の基準レベルになるように、入力信号のレベルを補正する。これにより、例えば、図7Aの入力信号が、図7Bに示されるように補正される。AGC111は、レベル補正した入力信号(補正入力信号)を、拡張区間検出装置112のセンター定位度検出器131およびダイナミックレンジ拡張器115に供給する。
【0043】
なお、AGC111がレベル補正する手法は、特定の手法に限定されるものではなく、任意の手法を採用することができる。
【0044】
ステップS2において、拡張区間検出装置112は、拡張区間検出処理を実行する。ここで、図8のフローチャートおよび図9の信号波形図を参照して、拡張区間検出処理の詳細について説明する。
【0045】
なお、図9の各グラフは、拡張区間検出処理で処理される各種の信号の波形を模式的に示しており、横軸は時間を示し、縦軸は信号レベルを示している。
【0046】
ステップS21において、センター定位度検出器131は、センター定位度を検出する。具体的には、センター定位度検出器131は、左右の両チャンネルの補正入力信号に基づいて、補正入力信号の定位分布を算出する。さらに、センター定位度検出器131は、算出した定位分布に基づいて、補正入力信号の定位分布がどの程度センターに集中しているかを示すセンター定位度を検出する。そして、センター定位度検出器131は、検出したセンター定位度を示すセンター定位度検出信号をセンター遷移度検出器132に供給する。
【0047】
図9Aは、センター定位度検出信号の波形の例を示している。
【0048】
なお、音響信号の定位分布およびセンター定位度の検出には、例えば、特開2008−28693号公報に開示されている手法等、任意の手法を採用することができる。
【0049】
ステップS22において、センター遷移度検出器132は、センター遷移度を検出する。具体的には、センター遷移度検出器132は、センター定位度検出信号を微分することにより、入力補正信号の定位分布がどの程度センターに遷移しているかを示すセンター遷移度検出信号を生成する。そして、センター遷移度検出器132は、生成したセンター遷移度検出信号をスレッショルド判定器133に供給する。
【0050】
図9Bは、図9Aのセンター定位度検出信号を微分することにより得られるセンター遷移度検出信号の波形の例を示している。
【0051】
ステップS23において、スレッショルド判定器133は、拡張区間を検出する。具体的には、スレッショルド判定器133は、センター遷移度検出信号を所定の閾値と比較する。そして、スレッショルド判定器133は、センター遷移度検出信号が閾値以上となる区間をHレベル(ハイレベル)とし、閾値未満となる区間をLレベル(ローレベル)とする拡張区間検出信号を生成する。このセンター遷移度検出信号が閾値以上となり、拡張区間検出信号がHレベルとなる区間が、拡張区間とされる。そして、スレッショルド判定器133は、生成した拡張区間検出信号を拡張信号レベル設定器113に供給する。
【0052】
図9Cは、図9Bのセンター遷移度検出信号を点線の水平線で示される閾値と比較した結果得られる拡張区間検出信号の波形の例を示している。
【0053】
一般的に、音楽等のステレオの音響信号の再生音は、空間内で左右に広がり、そのうちリズム楽器やボーカル等が、センター付近に集中し、定位する。従って、音響信号の定位分布は、通常左右に広がっているが、ボーカルのフレーズの先頭や、リズム楽器のアタック音など、強いアタックが現れる瞬間に急速にセンターに集中する。
【0054】
また、音響信号の定位分布は、リミッタ処理などにより音響信号の振幅を補正しても、その影響をあまり受けずに、ほぼ変わらずに保持される。すなわち、音響信号の定位分布は、音響信号の振幅の補正を行う前と後で、ほとんど変化しない。
【0055】
従って、センター遷移度が閾値以上となる区間を検出することにより、音響信号の定位分布がセンターに急速に遷移する区間、すなわち、強いアタックが出現する瞬間を含む区間を拡張区間として検出することができる。
【0056】
その後、拡張区間検出処理は終了する。
【0057】
図6に戻り、ステップS3において、拡張信号レベル設定器113は、拡張信号レベルを設定する。具体的には、拡張信号レベル設定器113は、拡張区間検出信号がHレベルとなる拡張区間で、所定の最大値(以下、拡張信号ピークレベルと称する)以下の範囲内で上昇し、Lレベルとなる区間で、所定の最小値(以下、拡張信号最小レベルと称する)となる拡張信号レベル信号を生成する。例えば、拡張信号ピークレベルは最大許容ピークレベルに設定され、拡張信号最小レベルは0に設定される。
【0058】
図7Cは、図7Bの補正入力信号および図9Cの拡張区間検出信号に基づいて生成される拡張信号レベル信号の波形の例を示している。図7Cの拡張信号レベル信号では、信号レベルが上昇する傾きと下降する傾きの絶対値が等しく、かつ、両方の傾きがそれぞれ全ての拡張区間において等しくなるように設定されている。従って、図7Cの拡張信号レベル信号は、各拡張区間において、拡張信号ピークレベルを頂点とする左右対称の山形の波形になっているが、拡張区間がさらに長くなると、拡張信号ピークレベルを維持する期間が長くなり、等脚台形の波形となる。一方、拡張区間がさらに短くなると、ピーク値が拡張信号ピークレベルに達しなくなる。
【0059】
そして、拡張信号レベル設定器113は、生成した拡張信号レベル信号を拡張ゲイン算出器114に供給する。
【0060】
ステップS4において、拡張ゲイン算出器114は、拡張ゲインを算出する。具体的には、拡張ゲイン算出器114は、拡張信号ピークレベルが所定の最大値(例えば、2.0)になり、拡張信号最小レベルが1.0になるように、拡張信号レベル信号の値を変換する。これにより、拡張ゲイン信号が生成される。
【0061】
図7Dは、図7Cの拡張信号レベル信号に基づいて生成される拡張ゲイン信号の波形の例を示している。このように、拡張ゲイン信号の値(拡張ゲイン)は、拡張区間において1.0を超え、拡張区間と異なる区間において1.0となる。
【0062】
そして、拡張ゲイン算出器114は、生成した拡張ゲイン信号をダイナミックレンジ拡張器115に供給する。
【0063】
ステップS5において、ダイナミックレンジ拡張器115は、ダイナミックレンジを拡張する。具体的には、ダイナミックレンジ拡張器115は、拡張ゲイン信号により示される拡張ゲインを用いて入力補正信号を増幅することにより、ダイナミックレンジを拡張する。
【0064】
これにより、拡張ゲインが1.0を超える拡張区間において、入力補正信号のダイナミックレンジが拡張される。そして、上述したように、拡張区間は、強いアタックが出現する瞬間を含むため、オリジナルの音響信号において、強いアタックが出現し、信号レベルが高くなる瞬間のダイナミックレンジを拡張することができる。従って、例えば、図1Aのオリジナル音響信号を増幅し、リミッタ処理することにより、図7Aの入力信号において失われていたダイナミックレンジを、図7Eに示されるように適切に回復することができる。その結果、本来のメリハリのある音を再現することができる。
【0065】
そして、ダイナミックレンジ拡張器115は、ダイナミックレンジを拡張した音響信号(出力信号)を後段に出力する。
【0066】
その後、ダイナミックレンジ拡張処理は終了する。
【0067】
<2.第2の実施の形態>
ところで、音響信号処理装置101では、センター遷移度が閾値以上となる拡張区間において無条件に音響信号が増幅されるため、ダイナミックレンジが広い入力信号に対して、ダイナミックレンジの拡張が過剰に行われる場合がある。この件の具体例について、図10を参照して説明する。
【0068】
なお、図10の各グラフの横軸は時間を示し、縦軸は信号レベルを示し、点線は最大許容ピークレベルを示している。また、図10Aは、音響信号処理装置101に入力される入力信号の波形の例を示し、図1Aの音響信号と同じ信号である。図10Bは、音響信号処理装置101により図10Aの入力信号のダイナミックレンジを拡張した結果得られる出力信号の波形の例を示している。このように、入力信号のダイナミックレンジが広く、ピーク値が最大許容ピークレベルに近い場合、ダイナミックレンジ拡張後の出力信号のピーク値が、最大許容ピークレベルを超えてしまうおそれがある。
【0069】
本発明の第2の実施の形態は、このようにダイナミックレンジの過剰な拡張を抑制できるようにするものである。
【0070】
[音響信号処理装置の構成例]
図11は、本発明を適用した音響信号処理装置の第2の実施の形態を示すブロック図である。なお、図中、図4と共通する部分には同じ符号を付してあり、処理が同じ部分について、その説明は繰り返しになるので適宜省略する。
【0071】
図11の音響信号処理装置201は、図4の音響信号処理装置101と比較して、信号レベル検出器211および比較器212が追加され、拡張ゲイン算出器114の代わりに拡張ゲイン算出器213が設けられている点で異なる。また、音響信号処理装置201は、音響信号処理装置101と比較して、AGC111、拡張区間検出装置112、拡張信号レベル設定器113、および、ダイナミックレンジ拡張器115が設けられている点で共通する。
【0072】
信号レベル検出器211は、AGC111から供給される補正入力信号のレベルを検出し、検出結果を示す入力信号レベル信号を比較器212および拡張ゲイン算出器213に供給する。
【0073】
比較器212は、入力信号レベル信号と、拡張信号レベル設定器113から供給される拡張信号レベル信号とを比較し、比較結果を示す比較器出力信号を拡張ゲイン算出器213に供給する。
【0074】
拡張ゲイン算出器213は、入力信号レベル信号および比較器出力信号に基づいて、拡張ゲインを算出する。拡張ゲイン算出器213は、算出した拡張ゲインを示す拡張ゲイン信号をダイナミックレンジ拡張器115に供給する。
【0075】
[ダイナミックレンジ拡張処理]
次に、図12のフローチャート、並びに、図13および図14の信号波形図を参照して、音響信号処理装置201により実行されるダイナミックレンジ拡張処理について説明する。なお、この処理は、例えは、入力信号が音響信号処理装置201に入力されたとき開始される。
【0076】
なお、図13および図14の各グラフは、ダイナミックレンジ拡張処理で処理される各種の信号の波形を模式的に示しており、横軸は時間を示し、縦軸は信号レベルを示している。また、図13A乃至図13E、図13G、図14A乃至図14E、および、図14Gの点線は、最大許容ピークレベルを示している。
【0077】
また、以下、音響信号処理装置201に図13Aの入力信号が入力された場合の処理と、図14Aの入力信号が入力された場合の処理を適宜比較しながら説明する。なお、図13Aの入力信号は、図1Cの音響信号と同じ信号であり、リミッタ処理等によりダイナミックレンジが失われた音響信号である。一方、図14Aの入力信号は、図1Aの音響信号と同じ信号であり、ダイナミックレンジが失われていない音響信号である。
【0078】
ステップS51において、図5のステップS1と同様の処理により、入力信号のレベル補正が行われる。
【0079】
図13Bは、図13Aの入力信号に対してレベル補正を行った補正入力信号の波形を示しており、図7Bの補正入力信号と同じ信号である。
【0080】
一方、図14Bは、図14Aの入力信号に対してレベル補正を行った補正入力信号の波形の例を示している。なお、この例では、説明を分かりやすくするために、図14Aの入力信号の平均レベルが基準レベルと等しく、図14Aの入力信号と図14Bの補正入力信号が等しくなる例を示している。
【0081】
ステップS52において、信号レベル検出器211は、入力信号レベルを検出する。例えば、信号レベル検出器211は、補正入力信号の左右のチャンネルの加算平均レベルを入力信号レベルとして検出する。入力信号レベル検出器211は、検出した入力信号レベルを示す入力信号レベル信号を比較器212および拡張ゲイン算出器213に供給する。
【0082】
図13Cは、図13Bの補正入力信号に対する入力信号レベル信号の波形の例を示している。この入力信号レベル信号は、図13Bの補正入力信号と同様に、ダイナミックレンジが狭い波形となる。
【0083】
一方、図14Cは、図14Bの補正入力信号に対する入力信号レベル信号の波形の例を示している。この入力信号レベル信号は、図14Bの補正入力信号と同様に、ダイナミックレンジが広い波形となる。
【0084】
ステップS53において、図6のステップS2の処理と同様に、拡張区間検出処理が実行される。そして、その結果得られた拡張区間検出信号が、拡張区間検出装置112から拡張信号レベル設定器113に供給される。
【0085】
上述したように、音響信号の定位分布は、リミッタ処理等によりほとんど変化しない。従って、図13Bおよび図14Bの補正入力信号に対して、ほぼ同じ区間が拡張区間として検出され、ほぼ同じ波形の拡張区間検出信号が生成される。なお、以下、図13Bおよび図14Bの両方の補正入力信号に対して、上述した図9Cの信号と同じ拡張区間検出信号が生成されたものとする。
【0086】
ステップS54において、図6のステップS3の処理と同様に、拡張信号レベルが設定され、その結果得られた拡張信号レベル信号が、拡張信号レベル設定器113から比較器212に供給される。
【0087】
図13Dは、図13Bの補正入力信号に対する拡張信号レベル信号の例を示し、図14Dは、図14Bの補正入力信号に対する拡張信号レベル信号の波形の例を示している。なお、図13Dおよび図14Dの拡張信号レベル信号は、図7Cの拡張信号レベル信号と同じ信号である。
【0088】
ステップS55において、比較器212は、入力信号レベルと拡張信号レベルを比較する。具体的には、比較器212は、入力信号レベル信号により示される入力信号レベルと、拡張信号レベル信号により示される拡張信号レベルを比較し、いずれか大きい方を選択して出力する。これにより、各時点において入力信号レベルと拡張信号レベルのうち大きい方を示す比較器出力信号が生成され、比較器212から比較ゲイン算出器213に供給される。
【0089】
図13Eは、図13Cの入力信号レベル信号と図13Dの拡張信号レベル信号とを比較した結果得られる比較器出力信号の波形の例を示している。この場合、図13Aの入力信号のダイナミックレンジが失われた区間とほぼ一致する各拡張区間の中央付近において、拡張信号レベルが入力信号レベルを超えるため、拡張信号レベルが選択される。一方、その他の区間では、拡張信号レベルが入力信号レベルを超えないため、入力信号レベルが選択される。
【0090】
一方、図14Eは、図14Cの入力信号レベル信号と図14Dの拡張信号レベル信号とを比較した結果得られる比較器出力信号の波形の例を示している。この場合、拡張区間においても、拡張信号レベルが入力信号レベル信号を超えないため、入力信号レベルが選択される。また、その他の区間でも、拡張信号レベルが入力信号レベルを超えないため、入力信号レベルが選択される。従って、図14Eの比較器出力信号は、図14Cの入力信号レベル信号と同じ信号となる。
【0091】
ステップS56において、拡張ゲイン算出器213は、拡張ゲインを算出する。具体的には、拡張ゲイン算出器213は、比較器出力信号の値÷入力信号レベル信号の値(入力信号レベル)を拡張ゲインとして算出する。そして、拡張ゲイン算出器213は、算出した拡張ゲインを示す拡張ゲイン信号を生成し、ダイナミックレンジ拡張器115に供給する。
【0092】
図13Fは、図13Cの入力信号レベル信号と図13Eの比較器出力信号から得られる拡張ゲイン信号の波形の例を示している。この場合、拡張ゲインは、図13Eの拡張信号レベル信号が図13Cの入力信号レベル信号を超える区間で1.0より大きくなり、それ以外の区間で1.0になる。
【0093】
一方、図14Fは、図14Cの入力信号レベル信号と図14Eの比較器出力信号から得られる拡張ゲイン信号の波形の例を示している。この場合、拡張ゲインは、図14Eの拡張信号レベル信号が図14Cの入力信号レベル信号を超える区間がないため、常に1.0になる。
【0094】
ステップS57において、図6のステップS5と同様の処理により、拡張ゲイン信号により示される拡張ゲインに基づいて補正入力信号が増幅され、ダイナミックレンジが拡張される。そして、ダイナミックレンジを拡張した音響信号(出力信号)がダイナミックレンジ拡張器115から後段に出力される。
【0095】
図13Gは、図13Bの補正入力信号を、図13Fの拡張ゲイン信号に基づいて増幅し、ダイナミックレンジを拡張した音響信号(出力信号)の波形の例を示している。この場合、拡張ゲイン信号の値が1.0を超える区間において、補正入力信号のダイナミックレンジが拡張される。このように、ダイナミックレンジが狭い入力信号に対しては、ダイナミックレンジが失われた区間の信号を増幅し、オリジナルの音響信号が有していたダイナミックレンジを適切に回復させることができる。
【0096】
一方、図14Gは、図14Bの補正入力信号を、図14Fの拡張ゲイン信号に基づいて増幅し、ダイナミックレンジを拡張した音響信号(出力信号)の波形の例を示している。この場合、拡張ゲイン信号の値が1.0で一定であるため、図14Bの補正入力信号がそのまま出力される。このように、ダイナミックレンジが広い音響信号に対しては、ダイナミックレンジの過剰な拡張が抑制され、音響信号の歪みの発生等を防止することができる。
【0097】
その後、ダイナミックレンジ拡張処理は終了する。
【0098】
<2.変形例>
以下、本発明の実施の形態の変形例について説明する。
【0099】
[変形例1]
以上の説明では、レベル補正した後の補正入力信号に基づいて拡張区間の検出を行ったが、上述したように音響信号の定位分布は、レベル補正の影響をほとんど受けないため、レベル補正する前の入力信号に基づいて拡張区間の検出を行うようにしてもよい。
【0100】
[変形例2]
また、以上の説明では、センター遷移度に基づいて、拡張区間を検出するようにしたが、センター定位度に基づいて、拡張区間を検出するようにしてもよい。例えば、センター定位度が所定の閾値以上となる区間を拡張区間として検出するようにしてもよい。これにより、入力信号の定位分布がセンターに集中している区間、例えば、ボーカルやリズム楽器の音量が大きい区間のダイナミックレンジを拡張することができる。また、センター定位度とセンター遷移度の両方を用いて拡張区間を検出するようにしてもよい。
【0101】
[変形例3]
また、拡張信号レベル信号のピーク値や、拡張信号レベル信号が増加または減少するときの傾きを、例えば、拡張区間の長さや、補正入力信号のレベル等に基づいて可変とするようにしてもよい。また、図7Cでは、拡張信号レベル信号の上昇時と下降時の傾きが左右対称(すなわち、傾きの絶対値が等しく、正負の符号が逆)となる例を示しているが、必ずしも左右対称にする必要はない。例えば、拡張信号レベルの立ち上がりを早くし、その後、徐々に減衰するようにしてもよい。
【0102】
[変形例4]
さらに、入力前に平均レベルが揃えられてから入力信号が入力される場合、AGC111を削除し、レベル補正処理を省略することが可能である。
【0103】
[変形例5]
また、マルチチャンネルの入力信号に対してダイナミックレンジ拡張処理を行う場合、例えば、左、右、中央のフロント側の3チャンネルの音響信号に対してダウンミックスを行い、生成された音響信号に基づいて拡張区間の検出を行うようにすればよい。そして、検出された拡張区間に基づいて、フロント側の3チャンネルの音響信号についてのみダイナミックレンジの拡張を行うようにすればよい。
【0104】
なお、本発明は、例えば、音響信号の再生または録音を行う装置や、音響信号の補正を行う装置に適用できる。
【0105】
また、本明細書において、音響信号とは、人の声や動物の鳴き声等の音声のみからなる音声信号を含むものである。
【0106】
[コンピュータの構成例]
上述した一連の処理は、ハードウエアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどが含まれる。
【0107】
図15は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。
【0108】
コンピュータにおいて、CPU(Central Processing Unit)301,ROM(Read Only Memory)302,RAM(Random Access Memory)303は、バス304により相互に接続されている。
【0109】
バス304には、さらに、入出力インタフェース305が接続されている。入出力インタフェース305には、入力部306、出力部307、記憶部308、通信部309、及びドライブ310が接続されている。
【0110】
入力部306は、キーボード、マウス、マイクロフォンなどよりなる。出力部307は、ディスプレイ、スピーカなどよりなる。記憶部308は、ハードディスクや不揮発性のメモリなどよりなる。通信部309は、ネットワークインタフェースなどよりなる。ドライブ310は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのリムーバブルメディア311を駆動する。
【0111】
以上のように構成されるコンピュータでは、CPU301が、例えば、記憶部308に記憶されているプログラムを、入出力インタフェース305及びバス304を介して、RAM303にロードして実行することにより、上述した一連の処理が行われる。
【0112】
コンピュータ(CPU301)が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア311に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。
【0113】
コンピュータでは、プログラムは、リムーバブルメディア311をドライブ310に装着することにより、入出力インタフェース305を介して、記憶部308にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部309で受信し、記憶部308にインストールすることができる。その他、プログラムは、ROM302や記憶部308に、あらかじめインストールしておくことができる。
【0114】
なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
【0115】
また、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。
【符号の説明】
【0116】
101 音響信号処理装置, 111 AGC, 112 拡張区間検出装置, 113 拡張信号レベル設定器, 114 拡張ゲイン算出器, 115 ダイナミックレンジ拡張器, 131 センター定位度検出器, 132 センター遷移度検出器, 133 スレッショルド判定器, 201 音響信号処理装置, 211 信号レベル検出器, 212 比較器, 213 拡張ゲイン算出器

【特許請求の範囲】
【請求項1】
音響信号の定位分布のセンターへの集中度を示すセンター定位度を検出するセンター定位度検出手段と、
前記センター定位度に基づいて、前記音響信号のダイナミックレンジを拡張する拡張区間を検出する拡張区間検出手段と、
前記拡張区間において前記音響信号のダイナミックレンジを拡張する拡張手段と
を備える音響信号処理装置。
【請求項2】
前記拡張区間検出手段は、前記音響信号の定位分布のセンターへの遷移度を示すセンター遷移度が所定の閾値以上となる区間を前記拡張区間として検出する
請求項1に記載の音響信号処理装置。
【請求項3】
前記センター遷移度は、前記センター定位度の微分値である
請求項2に記載の音響信号処理装置。
【請求項4】
前記拡張区間検出手段は、前記センター定位度が所定の閾値以上となる区間を前記拡張区間として検出する
請求項1に記載の音響信号処理装置。
【請求項5】
前記音響信号のレベルを示す入力信号レベルを検出する入力信号レベル検出手段と、
前記音響信号のダイナミックレンジを拡張するレベルを示し、前記拡張区間とは異なる区間において所定の最小値となり、前記拡張区間において所定の最大値以下の範囲内で推移する拡張信号レベルを設定する拡張信号レベル設定手段と
をさらに備え、
前記拡張手段は、前記拡張信号レベルが前記入力信号レベルを超える区間において、前記音響信号のダイナミックレンジを拡張する
請求項1に記載の音響信号処理装置。
【請求項6】
前記入力信号レベルと前記拡張信号レベルとを比較し、いずれか大きい方を出力する比較手段と、
前記比較手段の出力値および前記入力信号レベルに基づいて拡張ゲインを算出する拡張ゲイン算出手段と
をさらに備え、
前記拡張手段は、前記拡張ゲインに基づいて前記音響信号を増幅することにより、前記音響信号のダイナミックレンジを拡張する
請求項5に記載の音響信号処理装置。
【請求項7】
前記音響信号のレベルを一定にする補正を行う補正手段を
さらに備え、
前記センター定位度検出手段は、補正された前記音響信号のセンター定位度を検出し、
前記拡張手段は、補正された前記音響信号のダイナミックレンジを拡張する
請求項1に記載の音響信号処理装置。
【請求項8】
音響信号のダイナミックレンジを拡張する音響信号処理装置が、
前記音響信号の定位分布のセンターへの集中度を示すセンター定位度を検出し、
前記センター定位度に基づいて、前記音響信号のダイナミックレンジを拡張する拡張区間を検出し、
前記拡張区間において前記音響信号のダイナミックレンジを拡張する
ステップを含む音響信号処理方法。
【請求項9】
音響信号の定位分布のセンターへの集中度を示すセンター定位度を検出し、
前記センター定位度に基づいて、前記音響信号のダイナミックレンジを拡張する拡張区間を検出し、
前記拡張区間において前記音響信号のダイナミックレンジを拡張する
ステップを含む処理をコンピュータに実行させるためのプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate


【公開番号】特開2012−129839(P2012−129839A)
【公開日】平成24年7月5日(2012.7.5)
【国際特許分類】
【出願番号】特願2010−280164(P2010−280164)
【出願日】平成22年12月16日(2010.12.16)
【出願人】(000002185)ソニー株式会社 (34,172)
【Fターム(参考)】