説明

オーディオ装置及びオーディオ処理方法

【目的】フルセグ放送及びワンセグ放送受信時の音声レベルを同等にすることにより、フルセグ放送及びワンセグ放送受信を切り換えても違和感が生じないようにする「オーディオ装置及びオーディオ処理方法」を提供することである。
【構成】無相関化処理によりステレオ信号からサラウンド信号及びセンター信号を生成するオーディオシステムにおいて、符号化オーディオ信号よりステレオ信号を復号して出力すると共に符号化情報を抽出し、ステレオ信号L.Rのそれぞれに対して低相関なサラウンド信号を発生すると共に、該ステレオ信号L.Rに高相関な信号をセンター信号として生成し、符号化情報(ビットレート、フルセグ/ワンセグ受信の別など)に基づいてセンター信号のレベルを制御し、フルセグ/ワンセグ受信時における音声レベルが等しくなるように制御する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は無相関化処理によりステレオ信号からサラウンド信号及びセンター信号を生成するオーディオ装置及びオーディオ処理方法に関わり、特に、音声符号化レートが変化しても受聴者が違和感を受けないオーディオ装置及びオーディオ処理方法に関する。
【背景技術】
【0002】
・地上波テレビ放送
日本国内では、地上波テレビ放送のディジタル化が進められており、2011年には全国で地上波ディジタル放送が実施され、アナログ波を停波する予定となっている。かかる地上波ディジタル放送では、図18に示すように伝送方式として、高い周波数利用効率と伝送品質が得られるOFDM(Orthogonal Frequency Division Multiplexing:直交波周波数分割多重)方式が採用され、帯域幅6MHzの1つの放送チャンネル(物理チャンネル)を14個のセグメントに分割し、そのうちガードバンドを除いた13個のセグメントを複数のセグメント群(階層)のグループに分けて、各グループ単位で情報符号化方式や変調方式等の異なる番組(プログラム)を同時に放送することを可能にしている。
【0003】
すなわち、地上波ディジタル放送では、1つのチャンネルを13のセグメントに分割して放送しており、13セグメントは最大3個の階層で構成されている。階層は、受信可能なC/N比(Carrier to Noise ratio:搬送波電力対雑音電力比)の大きさにより、強階層、中階層、弱階層と呼ばれている。強階層は最も低いC/N比において受信可能な階層、中階層は中間のC/N比において受信可能な階層、弱階層は最も良好なC/N比において受信可能な階層である。実際には、地上波ディジタル放送において中階層は運用される予定がないため、強階層と弱階層のみが放送される。13セグメントのうち12セグメントが弱階層の高いC/N比において受信可能な番組(フルセグあるいは12セグ番組)の放送に使用し、1セグメント(図18の白セグメント)が強階層の低いC/N比において受信可能な番組(ワンセグあるいは1セグ番組)の放送に使用する。地上波ディジタル放送(地デジ放送という)では、セグメント単位で異なる変調方式を設定でき、複数の番組を同一帯域内で異なるビットレートや誤り耐性で伝送することが可能となる。
【0004】
このため、移動受信機はC/N比に応じてフルセグ番組あるいはワンセグ番組を切り換えて受信する。すなわち、移動受信機における地デジ放送受信の特徴は、フルセグ放送とワンセグ放送の受信の切り換わりが発生することにある。自動車は移動体であるため、車載の地デジ放送受信機は受信状況が変化すると、その状況(C/N比)に応じてフルセグ放送、ワンセグ放送の受信を選択する。
フルセグ放送とワンセグ放送の違いは文字通り、地デジ放送フォーマットにおける13セグメントのうちの割り当て数の違いであり、映像・音声・その他情報の割当量が大幅に異なる。図19は地デジ放送の音声符号化レート(ビットレートとも言う)をまとめたものであり、この図から判るように、フルセグ放送とワンセグ放送によって、サンプリング周波数と音声符号化レートが大きく異なる。
音声符号化レートが小さい程、狭い帯域で送信可能であり、一方、音声符号化レートが大きくなる程、広い帯域が必要になる。図20は、フルセグ放送とワンセグ放送の音声情報量の違いを説明するための地デジ放送音声スペクトル図であり、Aはワンセグ、Bはフルセグの音声スペクトルである。ワンセグ放送は狭い帯域で良く、およそ10kHz以下の帯域で情報を持っていれば十分である。換言すれば、ワンセグ放送では圧縮により多くの音声情報が失われていることになる。
ワンセグ受信に際して失われた帯域を補う技術として帯域拡張技術SBR(Spectral Band Replication)が適用可能であり、HE-AACとして規格化されている。図21はSBRを適用した場合のワンセグ放送の音声スペクトルを示すもので、フルセグの音声スペクトルと同等の特性を示している。また、失われた帯域を補う技術として、別に倍音強調、帯域拡張技術も各社より発表されている。これら補完技術はユーザ側にもわかりやすい訴求なため、よく研究されている。
【0005】
ところで、圧縮音声では帯域の大小の外に他の視点をも考慮する必要がある。それは音声の相関性である。MP3(MPEG-1)やAAC(MPEG-2/-4)のオーディオ符号化方式として、ジョイントステレオ符号化方式、ステレオ符号化方式がある。このうちジョイントステレオ符号化方式は、ステレオ信号L,R間の相関性を重視した圧縮法方法であり、ステレオ信号L,R間の高い相関成分と低い相関成分(L/Rそれぞれにある)を符号化し、相関の低い成分をさらに間引き、高圧縮率を図る方式で、低い音声符号化レート、例えばワングセグ放送に最適な圧縮方式である。しかし、かかる音声圧縮により音の拡がり感が失われる。音声圧縮により失った音の拡がり感を再現させたいといったニーズに応えることが出来るのが、適応信号処理による無相関化処理技術(特許文献1)である。この技術によれば、復号化された圧縮音声より高い相関成分と低い相関成分を再分離することができ、音の拡がり感を再現できる。
【0006】
・無相関化処理
図22は上記無相関化処理を実現する無相関化処理部の構成図であり、圧縮符号化されたオーディオ信号より復号されたステレオ信号L,Rを入力されて、ステレオ信号L,Rのそれぞれに対して低相関なサラウンド信号SL,SRを適応信号処理により発生する第1、第2の適応信号処理部110,120、ステレオ信号L,Rに高相関な信号をセンター信号Cとして生成するセンター信号生成部130を備えている。
第1の適応信号処理部110は、ステレオ信号R(=XR(n))に含まれるステレオ信号L(=XL(n))と相関の高い高相関信号成分Cを抽出し、該ステレオ信号L(=XL(n))から該高相関信号成分CLを減算して第1のサラウンド信号SLを出力する。第2の適応信号処理部120は、ステレオ信号L(=XL(n))に含まれるステレオ信号R(=XL(n))と相関の高い高相関信号成分CRを抽出し、該ステレオ信号R(=XR(n))から該高相関信号成分Cを減算して第2のサラウンド信号SLを出力する。センター信号生成部130において、加算器131は高相関信号成分Cと高相関信号成分Cを加算し、乗算器132は加算結果に0.5を乗算してセンター信号C(=0.5×(CL+CR))を出力する。
【0007】
第1の適応信号処理部110は、ステレオ信号R(=XR(n))に含まれる、ステレオ信号L(=XL(n))と相関の高い高相関信号成分CLを抽出して出力するタップ長2mの適応フィルタ(ADF:Adaptive Filter)112、LMS適応信号処理により、適応フィルタ112の2m個の係数を求めて該適応フィルタに設定するLMS演算部114、適応フィルタの段数の半分mに応じた遅延時間(モデリング遅延)が設定され、ステレオ信号Lを該設定時間分、遅延する遅延回路116、遅延回路から出力するステレオ信号L(=dL(n))より適応フィルタから出力する高相関信号成分CLを減算してサラウンド信号SLを発生する演算部118を備えている。なお。適応フィルタ112は例えばFIRディジタルフィルタで構成される。
第2の適応信号処理部120は、ステレオ信号L(=X(n))に含まれる、ステレオ信号R(=XR(n))と相関の高い高相関信号成分CRを抽出して出力するタップ長2mの適応フィルタ122、LMS適応信号処理により、適応フィルタ122の2m個の係数を求めて該適応フィルタに設定するLMS演算部124、適応フィルタの段数の半分mに応じた遅延時間(モデリング遅延)が設定され、ステレオ信号R信号を該設定時間分、遅延する遅延回路126、遅延回路126から出力するステレオ信号R(=dR(n))より適応フィルタから出力する高相関信号成分CRを減算してサラウンド信号SRを発生する演算部128を備えている。
【0008】
LMS演算部114、124は1サンプル毎(例えばサンプリング周波数44.1KHzであれば、1/44100(sec)毎)に、それぞれ(1a),(1b)式の係数更新式
【数1】

の演算を行なって適応フィルタ112,122の2m個の係数を更新する。(1a)、(1b)式において、(n)は1サンプリング前の信号、(n+1)は現サンプリング時の信号を示す。(1a)式において、WL(n)、WL(n+1)は適応フィルタ112の係数、μはステップサイズパラメータ、eL(n)は誤差信号(サラウンド信号SL)、XL(n) はステレオ信号Lである。(1b)式において、WR(n)、WR(n+1)は適応フィルタ122の係数、μはステップサイズパラメータ、eR(n)は誤差信号(サラウンド信号SR)、XR(n) はステレオ信号Rである。
又、高相関成分信号CL、C R、Cは次式によって表わされる。
【数2】

ただし、Tは転置を示す。
【0009】
以上により作成されたステレオ信号L(=dL(n)),R(=dR(n))、2つのサラウンド信号SL,SR、センター信号Cはそれぞれ、図23に示す車室内前方の左右のフロントスピーカSPFL、SPFR、車室内後方の左右のリアスピーカSPRL、SPRR、前方中央のセンタースピーカSPCにそれぞれ入力される。
図22の無相関化処理によりサラウンド信号SL,SRを生成すれば、低相関のサラウンド信号を安定して取り出せることができ、再生音場において拡がり感を大きくできる利点がある。
【特許文献1】特許3682032号
【発明の開示】
【発明が解決しようとする課題】
【0010】
図22の無相関化処理部に入力するステレオ信号が、フルセグ放送とワンセグ放送の間で切り換わった場合を想定する。
フルセグの符号化オーディオ信号は図19からもわかるようにワンセグの符号化オーディオ信号よりも高い音声符号化レートであり、デコード後のフルセグのステレオ信号には拡がりのある低い相関成分がワンセグに比べて多く含まれている反面、ワンセグに比べて高い相関成分が少ないことが予測される。すなわち、フルセグのステレオ信号には拡がりのある低い相関成分が比較的多く残る結果、逆に高い相関成分が少なくなる。一方、ワンセグの符号化オーディオ信号は音声符号化レートが低いため、音声の圧縮率を高める必要があり、相関の低い成分を削減する傾向にあり、反面、デコード後のワンセグのステレオ信号には高い相関成分は多くなる。
従って、無相関化処理部において、フルセグのステレオ信号に無相関化処理を施すと、低い相関成分が良好に取り出されるが、高い相関成分がワンセグに比べれば低出力になる。反対にワンセグの音声信号に無相関化処理を施すと高い相関成分が良好に取り出されるが、低い相関成分がフルセグに比べれば低出力になる。
高い相関成分はセンター信号Cとなってフロント中央のスピーカに入力するため、高い相関成分の大小は音の定位に影響を与え、音声レベルにも差を与える。このため、高相関成分が少ないフルセグ受信時の音声レベルは、高相関成分が多いワンセグ受信時の音声レベルより低くなり、フルセグ放送、ワンセグ放送の受信切換が生じると音声レベルが変化して受聴者に違和感を与える問題が生じる。特に、受信状況の変化は都市部で頻繁に発生し、ユーザは運転中に音声を聴くことが中心になるため、音質、音量の変化がユーザにとって気になり、ユーザにストレスを与える。
【0011】
本発明の目的は、フルセグ放送及びワンセグ放送の受信時の音声レベルを同等にすることにより、フルセグ放送及びワンセグ放送の受信を切り換えても違和感が生じないようにすることである。
本発明の目的は、圧縮音声の符号化レートが変化しても受信時の音声レベルを同等にすることにより、フルセグ放送及びワンセグ放送の受信切換が発生して圧縮音声の符号化レートが変化しても違和感が生じないようにすることである。
本発明の目的は、圧縮音声がモノラル、ステレオ、サラウンドであっても受信時の音声レベルを同等にすることにより、モノラル、ステレオ、サラウンド放送の受信切換時に違和感が生じないようにすることである。
本発明の目的は、センター信号のレベルを制御することにより、あるいは、適応信号アルゴリズムにより無相関処理を行う場合はステップサイズパラメータ値、あるいは適応フィルタのタップ長を制御することにより、音声レベルを同等にすることである。
【課題を解決するための手段】
【0012】
本発明は、無相関化処理によりステレオ信号からサラウンド信号及びセンター信号を生成するオーディオ装置において、音声符号化レート等が変化しても受聴者に違和感を与えないオーディオ装置及びオーディオ処理方法である。
・オーディオ装置
本発明のオーディオ装置は、符号化オーディオ信号よりステレオ信号L,Rを復号して出力すると共に符号化情報を抽出する復号部、前記ステレオ信号L,Rのそれぞれに対して低相関なサラウンド信号を発生すると共に、該ステレオ信号L,Rに高相関な信号をセンター信号として生成する無相関化処理部、前記符号化情報に基づいて前記センター信号のレベルを制御するレベル制御部を備えている。
【0013】
前記レベル制御部は、以下の(1)〜(4)により前記センター信号のレベルを制御する。すなわち、前記レベル制御部は、
(1)前記符号化オーディオ信号の符号化レートに基づいて前記センター信号のレベルを制御する、
(2)前記符号化オーディオ信号がワンセグオーディオ信号であるかフルセグオーディオ信号であるかに基づいて前記センター信号のレベルを制御する、
(3)前記符号化オーディオ信号がワンセグオーディオ信号であるかフルセグオーディオ信号であるか、並びに、該符号化オーディオ信号の符号化レートを考慮して前記センター信号のレベルを制御する、
(4)前記符号化オーディオ信号がモノラルであるかステレオであるかサラウンドであるかに基づいて前記センター信号のレベルを制御する。
また、前記レベル制御部は、ゲインを制御することにより、あるいは、適応信号アルゴリズムにより無相関処理を行う場合はステップサイズパラメータ値、あるいは適応フィルタのタップ長を制御することにより、前記センター信号のレベルを制御する。
【0014】
・オーディオ処理方法
本発明のオーディオ処理方法は、符号化オーディオ信号よりステレオ信号L,Rを復号して出力すると共に符号化情報を抽出するステップ、前記ステレオ信号L,Rのそれぞれに対して低相関なサラウンド信号を発生すると共に、該ステレオ信号L,Rに高相関な信号をセンター信号として生成するステップ、前記符号化情報に基づいて前記センター信号のレベルを制御するステップ、前記ステレオ信号L,R、2つのサラウンド信号、センター信号をそれぞれ対応するスピーカに入力するステップを備えている。
前記レベル制御ステップにおいて、上記の(1)〜(4)により前記センター信号のレベルを制御する。
また、ゲインを制御することにより、あるいは、適応信号アルゴリズムにより無相関処理を行う場合はステップサイズパラメータ値、あるいは適応フィルタのタップ長を制御することにより、前記センター信号のレベルを制御する。
【発明の効果】
【0015】
本発明によれば、フルセグ放送及びワンセグ放送の受信時の音声レベルを同等にするようにしたから、フルセグ放送及びワンセグ放送の受信を切り換えても違和感が生じないようにできる。
本発明によれば、圧縮音声の符号化レートが変化しても受信時の音声レベルを同等にするようにしたから、フルセグ放送及びワンセグ放送の受信切換が発生して圧縮音声の符号化レートが変化しても違和感が生じないようにできる。
本発明によれば、圧縮音声がモノラル、ステレオ、サラウンドであっても受信時の音声レベルを同等にしたから、モノラル、ステレオ、サラウンド放送の受信切換時に違和感が生じないようにできる。
本発明によれば、センター信号のレベルを制御することにより、あるいは、適応信号アルゴリズムにより無相関処理を行う場合はステップサイズパラメータ値、あるいは適応フィルタのタップ長を制御することにより、各種受信状態における受信音声レベルを同等にして違和感をなくすことが出来る。
【発明を実施するための最良の形態】
【0016】
(A)オーディオシステムの構成
図1は本発明のオーディオシステムの構成図である。地上波ディジタル放送受信機1はユーザにより選局された放送電波を受信し、OFDM復調してオーディオデータストリームADをオーディオ装置2に入力する。オーディオ装置2の地上波ディジタルデコーダ20は、受信状況(例えばデータ誤り率等)に応じてフルセグオーディオデータあるいはワンセグオーディオデータの一方を選択し、選択したオーディオデータをステレオ信号L.Rにデコードして無相関化処理部30に入力する。また、デコーダ20は入力信号より各種符号化情報Hを分離して後述するコントローラ70に入力する。符号化情報には、デコードするオーディオデータの音声符号化レート、放送番組のジャンル情報、放送形態(モノラル、ステレオ、サラウンドの別)、受信状態(フルセグ、ワンセグ受信の別)を等が含まれている。
【0017】
無相関化処理部30は、入力されたステレオ信号L.Rに基づいて無相関化処理を行う。このため、地デジデコーダ20は、選択したフルセグオーディオデータあるいはワンセグオーディオデータをデコードしてステレオ信号L,Rを発生する必要があり、5.1chサラウンド放送を受信した場合には、デコーダ20は5.1chサラウンド信号を2chステレオ信号にダウンミックスして無相関化処理部30に入力する。図2はダウンミックスの処理フロー図であり、MPL1〜MPL6は乗算器、ADD1〜ADD4は加算器であり、乗算値Att1〜Att3の初期値は一定値0.707(-3dB) である。なお、低周波信号LFEはダウンミックスしない(−INF=0.000)。
無相関化処理部30は、図22に示した構成とほぼ同一の構成を備え、ステレオ信号L,Rの無相関化処理を行い、無相関化された低相関成分のサラウンド信号SL,SR、高相関成分のセンター信号C及びステレオ信号L,Rをそれぞれ出力する。サラウンド信号処理部30が、図22に示した構成と異なる点は、適応フィルタのタップ長や適応信号処理アルゴリズムにおけるステップサイズパラメータμの値をコントローラ70からの指示により変更できるようになっている点である。
ゲイン制御部40はコントローラからの指示によりゲインを可変してセンター信号Cのレベルを制御する。オーディオ信号処理部50は、入力されるステレオ信号L,R、サラウンド信号SL,SR、センター信号Cに周知の音質制御処理、例えば、イコライジング処理、タイムコレクション処理、クロスオーバ処理などの音質制御処理を施し、各信号を対応するアンプを介して図示しないスピーカ(図23参照)に入力する。実施例では、無相関化処理部30とゲイン制御部40とオーディオ信号処理部50はDSP(ディジタルシグナルプロセッサ)60により実現される。
【0018】
マイコン構成のコントローラ70は、符号化情報Hに基づき、制御信号S1(ステップサイズパラメータまたはタップ長),S2(ゲイン)、S3(音質)をそれぞれ無相関化処理部30、ゲイン制御部40、オーディオ信号処理部50に入力する。
図3に示すように、フルセグの符号化オーディオデータは符号化レートが高いため、デコード処理により得られるステレオ信号には、拡がりのある低い相関成分が比較的多く残るが、半面、高い相関成分が少なくなる。一方、ワンセグの符号化オーディオデータは符号化レートが低いため、デコード処理により得られるステレオ信号には、低い相関成分が少なくなるが、高い相関成分が多くなる。高い相関成分はセンター信号Cとなってフロント中央のスピーカに入力するため、高い相関成分の大小は音の定位に影響を与え、音声レベルにも差を与え、高相関成分が少ないフルセグ受信時の音声レベルは、高相関成分が多いワンセグ受信時の音声レベルより低くなる
【0019】
コントローラ70は、フルセグ受信か、ワンセグ受信かに応じてセンター信号Cのレベルを制御してフルセグ受信時とワンセグ受信時における音声レベルが等しくなるように制御する。センター信号Cのレベルを制御するには、(1)センター信号Cが入力するゲイン制御部40のゲインを制御信号S2により制御する方法、(2)無相関化処理部30の適応フィルタのタップ長や適応信号処理アルゴリズムにおけるステップサイズパラメータμの値を制御信号S1により制御する方法がある。
後述するように、センター信号のレベルは、デコードするオーディオデータがフルセグのオーディオデータであるか否かにより、あるいは、符号化レートにより、あるいは、符号化オーディオ信号がモノラルであるかステレオであるかサラウンドであるかに等により変化する。そこで、センター信号Cのレベルを制御するには以下の実施態様が考えられる。
【0020】
1)第1の実施態様
デコードするオーディオデータがフルセグのオーディオデータであるか、ワンセグのオーディオデータかに基づいて、コントローラ70が、ゲイン、ステップサイズパラメータ、タップ長の少なくとも1つを制御してセンター信号Cのレベルを制御する。
2)第2の実施態様
オーディオデータの符号化レートに基づいて、コントローラ70が、ゲイン、ステップサイズパラメータ、タップ長の少なくとも1つを制御して高相関成分信号であるセンター信号Cのレベルを制御する。
3)第3の実施態様
符号化オーディオ信号がワンセグオーディオ信号であるかフルセグオーディオ信号であるか、並びに、該符号化オーディオ信号の符号化レートの両方を考慮して、コントローラ70が、ゲイン、ステップサイズパラメータ、タップ長の少なくとも1つを制御して高相関成分信号であるセンター信号Cのレベルを制御する。
4)第4の実施態様
符号化オーディオ信号がモノラルであるかステレオであるかサラウンドであるかに基づいて、コントローラ70が、ゲイン、ステップサイズパラメータ、タップ長の少なくとも1つを制御して高相関成分信号であるセンター信号Cのレベルを制御する。
【0021】
(B)フルセグ、ワンセグと高相関成分の関係
図4はフルセグのステレオ信号L,R間の相互相関係数分布Bとワンセグのステレオ信号L,R間の相互相関係数分布Aの説明図である。2つの番組が図示する期間内において切り換わっており、前半は相互相関係数が1付近で推移している。具体的に言うと前半は気象情報の番組であるため、フルセグ、ワンセグともにモノラルのため、ステレオ信号L,R間の相関は1付近となる。しかし、この番組が終わった時点で相互相関係数が下がり、フルセグでは5.1chサラウンド放送が、ワンセグではステレオ放送が開始する。
5.1chサラウンド放送の場合、各チャンネル間の相関が低い音作りに設定されているため、図2に従ってダウンミックスしてもこの傾向はあらわれ、ワンセグに比べてわずかに相互相関係数が低くなる傾向を示す。このとき、図1の無相関化処理部30において無相関化処理を施すと、図5に示すように高相関成分の出力に差が生じ、ワンセグステレオ信号の高相関成分Aの方がフルセグステレオ信号の高相関成分Bのレベルより高くなる。特に、音声の帯域200〜1kHzは音声における相関が最も高い帯域であるため、このレベル差が定位に影響する。つまり、ワンセグ放送受信からフルセグ放送受信に変化したとき、音声レベルが低いと感じ、逆の場合には高いと感じる。
同様に別の番組で、ワンセグステレオ放送の相互相関係数Aとフルセグステレオ放送の相互相関係数Bとの比較を図6に示す。わずかではあるが、ワンセグの方が、相関が高いと読み取ることができる。
【0022】
図4〜図6を考察すると、ワンセグオーディオデータ再生時にセンター信号Cのレベルを小さくし、フルセグオーディオデータ再生時にセンター信号Cのレベルを大きくすれば、フルセグ受信時とワンセグ受信時における音声レベルを略等しくできる。例えば、図7(A)に示すようにワンセグオーディオデータ再生時、センター信号Cが入力されるゲイン制御部40のゲインを小さくし、フルセグオーディオデータ再生時、該ゲイン制御部40のゲインを大きくする。
また、符号化レートが異なるとステレオ信号L,Rの高相関成分にレベル差が生じる。そこで、更にフルセグ再生時におけるセンター信号Cのレベルを符号化レートに基づいて制御する。このようにすれば、フルセグ受信時とワンセグ受信時における音声レベル差を更に小さくすることができる。図7(B)は、
1)ワンセグオーディオデータ再生時(符号化レートは低速、中速)、ゲイン制御部40のゲインを小さな値(−3dB)にし、
フルセグオーディオデータ再生時には、
2)符号化レートが中速であれば、ゲイン制御部40のゲインを標準値(0dB)にし、
3)符号化レートが高速であれば、ゲイン制御部40のゲインを大きな値(+3dB)にする。図7(C)は、図7(B)に従ってゲインを制御する場合の具体的な制御例であり、フルセグ再生時におけるゲインを、符号化レートに基づいて3段階に制御する。
なお、オーディオデータの符号化レートのみに基づいてセンター信号Cのレベルを制御することもできる。例えば、符号化レートが中速時にセンター信号Cのレベルを変えず、低速時にセンター信号Cのレベルを下げ、高速時にセンター信号Cのレベルを上げれば、それぞれのビットレート時における再生音声レベルを略同等にできる。
【0023】
符号化オーディオデータがモノラルデータであれば、図4よりステレオ信号L,Rの相互相関は1になるため高相関成分は最大になる。また、符号化オーディオデータが標準ステレオデータであれば、モノラルデータの場合より高相関成分レベルは下がるが、符号化レートが大きい高音質ステレオデータや5.1chサラウンドデータの場合に比べて高相関成分レベルが大きくなる。そこで、図7(D)に示すように、符号化オーディオデータがモノラルデータであるか、標準ステレオデータであるか、高音質ステレオデータや5.1chサラウンドデータであるかによりゲイン制御部40のゲインを制御する。
【0024】
(C)実施例
(a)第1実施例
図8は、ゲインによりセンター信号Cのレベルを制御する第1実施例の構成図であり、図1と同一部分には同一符号を付している。又、無相関化処理部60は図22とほぼ同等の構成を備え、同一部分には同一符号を付している。
コントローラ70は、図7(A)〜(D)のいずれかにより、すなわち、デコードするオーディオデータがフルセグのオーディオデータであるか否かにより、あるいは、符号化レートにより、あるいは、符号化オーディオ信号がモノラルであるかステレオであるかサラウンドであるかに、レベル制御部40のゲインを決定し、ゲイン制御部40に設定する。これにより、レベル制御部40は設定されたゲインでセンター信号Cを増幅して出力する。
【0025】
図9は図7(C)に従ってゲイン制御部40のゲインを制御してセンター信号レベルを増大した場合の本発明の効果説明図であり、Aはワンセグステレオ信号の高相関成分のレベル、Bはフルセグ5.1chサラウンドデータをダウンミックスして得られるステレオ信号の高相関成分のレベル、Cはゲインを+6dBにしたときの、フルセグ5.1chサラウンドデータから得られるステレオ信号の高相関成分のレベル特性である。図9よりゲインを+6dBにしたときのレベル特性はワンセグステレオ信号の高相関成分のレベル特性とほぼ一致し、結果的にワンセグとフルセグの音声レベルをほぼ同等にすることができる。
具体的なゲイン制御は、モノラル放送の場合にはゲインを制御せず、高品質ステレオ放送やサラウンド放送の場合にゲインを+6dBにしてセンター信号レベルをアップする。すなわち、図7(C)より明らかなように、ワンセグとフルセグ(5.1ch)とでは相対的に6dBの差があり、ワンセグにおけるゲインを制御せずそのままの値とすれば、フルセグ(5.1ch)におけるゲインを+6dBする。また、フルセグ標準ステレオ信号の場合は、ゲインをワンセグとフルセグ(5.1ch)の差+6dBの中間+3dBにしてセンター信号レベルをアップする。
【0026】
(b)第2実施例
図10はゲインとステップサイズパラメータμを調整することによりセンター信号Cのレベルを制御する第2実施例の構成図であり、図1と同一部分には同一符号を付している。又、無相関化処理部60は図22とほぼ同等の構成を備え、同一部分には同一符号を付している。
無相関化処理部60が算出する高相関成分はモノラル→ステレオ→サラウンドの順に低くなる。高相関成分はセンター信号Cとなるため、そのレベルが低い程、音声が聞き取りにくくなる。ところで、無相関化処理部60の適応信号処理部110,120における適応速度を上げたほうが高相関成分の抽出がしやすくなる。そこで、適応アルゴリズムにおけるステップサイズパラメータμを大きくして適応速度を上げると高相関成分の抽出速度が上昇する。このため、第2実施例では、高相関成分が低くなるほど、ステップサイズパラメータμを大きくして適応速度を上げ、かつゲインを制御する。このようにすれば、第1実施例のゲインのみを制御する場合に比べてより効果的に音声レベルの制御が可能になる。
以上より、ステップサイズパラメータμをモノラル→ステレオ→サラウンドと変化するに従って大きくなるように制御し、同時に第1実施例の図7(C)のゲイン制御と同じようにゲインを制御する。図11はワンセグ/フルセグと符号化レートの組み合わせにより、どのようにゲインとステップサイズパラメータμを決定するかを示す説明図である。
この図11の例では、1)ワンセグ再生時(モノラル、ステレオ)にはμ=0.0001、ゲイン=−3dBとし、それぞれを最小にする。又、フルセグ再生時には、符号化レートあるいは、モノラル/標準ステレオ/高音質ステレオ(5.1chサラウンド)に応じてステップサイズパラメータμ及びゲインを決定する。すなわち、2)フルセグ再生時であって、符号化オーディオデータがモノラル(低速)の場合には、μ=0.0001、ゲイン=−3dBにし、3)フルセグ再生時であって、符号化オーディオデータが標準ステレオデータ(中速)の場合には、μ=0.0003、ゲイン=0dBにし、4)フルセグ再生時であって、高音質ステレオデータあるいは5.1chサラウンドデータ(高速)の場合には、μ=0.0008、ゲイン=+3dBとし最大にする。
【0027】
コントローラ70は、図11にしたがってレベル制御部40のゲインと適応アルゴリズムのステップサイズパラメータμを決定し、それぞれをゲイン制御部40と第1、第2の応信号処理部114,124のLMS演算部114,124に設定する。これにより、LMS演算部114,124は設定されたステップサイズパラメータμに基づいて適応信号処理を行い、又、レベル制御部40は設定されたゲインでセンター信号Cを増幅して出力する。
【0028】
図12は第2実施例の効果説明図であり、(A)はステップサイズパラメータμのみ制御してセンター信号レベルをアップした例、(B)は図11に従ってステップサイズパラメータμとゲインの両方を制御してセンター信号レベルをアップした例である。
図12の(A)において、Aはμ=0.0003のときのワンセグステレオ信号の高相関成分のレベル、Bはμ=0.0003のときのフルセグ5.1chサラウンドデータをダウンミックスして得られるステレオ信号の高相関成分のレベル、Cはμ=0.001としたときのフルセグ5.1chサラウンドデータをダウンミックスして得られるステレオ信号の高相関成分のレベルである。ステップサイズパラメータμをのみ制御したときの高相関成分のレベルアップ量は小さく、μを0.0003から0.001と大きくしてもレベル特性をワンセグステレオ信号の高相関成分のレベル特性Aに出来ない。そこで、図12(B)に示すようにμを0.0003から0.001と大きくし、かつ、ゲインを+4.5dBにする。このように、μを大きくすると共に、ゲインをアップすることによりフルセグ5.1chサラウンドデータをダウンミックスして得られるステレオ信号の高相関成分のレベル特性は、ワンセグステレオ信号の高相関成分のレベル特性と同等になる。この結果、ワンセグ再生時とフルセグ再生時の音声レベルを同じにでき、ワンセグ/フルセグ切換時における違和感をなくすることきできる。
【0029】
以上の第2実施例では、ワンセグ/フルセグと符号化レートの組み合わせによりステップサイズパラメータμ及びゲインを制御する場合であるが、ワンセグ受信/フルセグ受信の別のみにより、あるいは、符号化レートのみにより、あるいは、符号化オーディオデータがモノラル/標準ステレオ/高音質ステレオデータまたは5.1chサラウンドデータであるかによりステップサイズパラメータμ及びゲインを制御することができる。
【0030】
(c)第3実施例
図13はゲインと適応フィルタのタップ長を調整することによりセンター信号Cのレベルを制御する第3実施例の構成図であり、図1と同一部分には同一符号を付している。又、無相関化処理部60は図22とほぼ同等の構成を備え、同一部分には同一符号を付している。
第2実施例で説明したように、無相関化処理部60の適応信号処理部110,120における適応速度を上げたほうが高相関成分の抽出がしやすくなる。そこで、適応フィルタ112,122のタップ長を長くして適応速度を上げると高相関成分の抽出速度が上昇する。このため、第3実施例では、高相関成分が低くなるほど、タップ長を長くして適応速度を上げ、かつゲインを制御する。このようにすれば、第1実施例のゲインのみを制御する場合に比べてより効果的に音声レベルの制御が可能になる。
以上より、タップ長をモノラル→ステレオ→サラウンドと変化するに従って長くなるように制御し、同時に第1実施例の図7(C)のゲイン制御と同じようにゲインを制御する。図14はワンセグ/フルセグと符号化レートの組み合わせにより、どのようにゲインとタップ長を決定するかを示す説明図である。
この図14の例では、1)ワンセグ再生時(モノラル、ステレオ)にはタップ長=8、ゲイン=−3dBとし、それぞれを最小にする。又、フルセグ再生時には、符号化レートあるいは、モノラル/標準ステレオ/高音質ステレオまたは5.1chサラウンドに応じてタップ長及びゲインを決定する。すなわち、2)フルセグ再生時であって、符号化オーディオデータがモノラル(低速)の場合には、タップ長=8、ゲイン=−3dBにし、3)フルセグ再生時であって、符号化オーディオデータが標準ステレオデータ(中速)の場合には、タップ長=16、ゲイン=0dBにし、4)フルセグ再生時であって、高音質ステレオデータあるいは5.1chサラウンドデータ(高速)の場合には、タップ長=32、ゲイン=+3dBと最大にする。
【0031】
コントローラ70は、図14にしたがってレベル制御部40のゲインと適応フィルタ112,122のタップ長を決定し、それぞれをゲイン制御部40と適応フィルタ112,122に設定する。これにより、適応信号処理部110,120のLMS演算部114,124は設定されたタップ長の適応信号処理を行い、又、レベル制御部40は設定されたゲインでセンター信号Cを増幅して出力する。
タップ長を長くすると共に、ゲインをアップすることによりフルセグ5.1chサラウンドデータをダウンミックスして得られるステレオ信号の高相関成分のレベル特性をワンセグステレオ信号の高相関成分のレベル特性と同等にすることができる。この結果、ワンセグ再生時とフルセグ再生時の音声レベルを同じにでき、ワンセグ/フルセグ切換時における違和感をなくすることきできる。
以上の第3実施例ではゲインとタップ長の両方を調整する場合であるが、ゲインとステップサイズパラメータとタップ長の全てを調整してセンター信号Cのレベルを制御することができる。図15はかかる変形例の構成図であり、図1、図22と同一部分には同一符号を付している。
又、以上の第2実施例では、ワンセグ/フルセグと符号化レートの組み合わせによりタップ長及びゲインを制御する場合であるが、ワンセグ受信/フルセグ受信の別のみにより、あるいは、符号化レートのみにより、あるいは、符号化オーディオデータがモノラル/標準ステレオ/高音質ステレオデータまたは5.1chサラウンドデータであるかによりタップ長を制御することができる。
【0032】
(d)第4実施例
図16はセンター信号とステレオL,R信号のレベルを調整することにより音声レベルを同等とすると共に前方定位感を向上する第4実施例の構成図であり、図1,図22と同一部分には同一符号を付している。異なる点は、ステレオL,R信号のレベルを調整するゲイン制御部41,42を設け、コントローラ70がこれらゲイン制御部のゲインg1を制御するようにしている点である。
図17は、ワンセグ/フルセグと符号化レートの組み合わせにより、どのように各ゲイン制御部40〜42のゲインg1,g2を決定するかを示す説明図である。ステレオL,R信号のレベルを小さくすると前方定位感が向上する。そこで、図17に示すようにレベル制御部41,42のゲインg1を制御し、同時に、レベル制御部40のゲインg2を第1実施例と同様に制御する。すなわち、図17の例では、1)ワンセグ再生時(モノラル、ステレオ)にはg1=0dB、g2=−3dBとする。又、フルセグ再生時には、符号化レートあるいは、モノラル/標準ステレオ/高音質ステレオまたは5.1chサラウンドに応じてゲインg1,g2を決定する。すなわち、2)フルセグ再生時であって、符号化オーディオデータがモノラル(低速)の場合には、g1=0dB、g2=−3dBとする。また、3)フルセグ再生時であって、符号化オーディオデータが標準ステレオデータ(中速)の場合には、g1=−3dB、g2=0dBとし、4)フルセグ再生時であって、高音質ステレオデータや5.1chサラウンドデータ(高速)の場合には、g1=-6dB、g2=+3dBとする。
【0033】
コントローラ70は、図17にしたがって各ゲイン制御部40〜42のゲインg1,g2を決定し、それぞれをゲイン制御部40〜42に設定する。
第4実施例によれば、第1実施例と同様にセンター信号のゲインを制御するため、ワンセグ再生時、フルセグ再生時の音声レベルを同一にでき、ワンセグ/フルセグ切換時における違和感を無くすことが出来る。また、第4実施例によれば、フルセグ再生時において音声符号化レートに基づいてステレオL,R信号のゲインを制御してそのレベルを下げるようにしているため、前方定位感を向上することが出来る。
以上の第4実施例では、ワンセグ/フルセグと符号化レートの組み合わせによりステレオL,R信号のゲイン及びセンター信号のゲインを制御する場合であるが、ワンセグ受信/フルセグ受信の別のみにより、あるいは、符号化レートのみにより、あるいは、符号化オーディオデータがモノラル/標準ステレオ/高音質ステレオデータまたは5.1chサラウンドデータ、であるかにより各ゲインを制御することができる。
【図面の簡単な説明】
【0034】
【図1】本発明のオーディオシステムの構成図である。
【図2】ダウンミックスの処理フロー図である。
【図3】フルセグ、ワンセグの符号化オーディオデータにおける低相関成分、高相関成分の多、少の説明図である。
【図4】フルセグ、ワンセグステレオ信号L,R間の相互相関係数分布である。
【図5】フルセグ、ワンセグステレオ信号における高相関成分のレベル説明図である。
【図6】別の番組のフルセグ、ワンセグステレオ信号における高相関成分のレベル明図である。
【図7】センター信号のゲイン制御説明図表である。
【図8】ゲインによりセンター信号Cのレベルを制御する第1実施例の構成図である。
【図9】第1実施例の効果説明図である。
【図10】第2実施例の構成図である。
【図11】第2実施例におけるゲインおよびステップサイズパラメータ制御の説明図表である。
【図12】第2実施例の本発明の効果説明図である。
【図13】第3実施例の構成図である。
【図14】第3実施例におけるゲインとタップ長制御の説明図表である。
【図15】変形例の構成図である。
【図16】第4実施例の構成図である。
【図17】第4実施例における各ゲイン制御の説明図表である。
【図18】フルセグ、ワンセグの帯域説明図である。
【図19】地デジ放送の音声符号化レート説明図表である。
【図20】フルセグ放送とワンセグ放送の音声情報量の違いを説明するための地デジ放送音声スペクトル図である。
【図21】SBRを適用した場合のワンセグ放送の音声スペクトル図である。
【図22】無相関化処理を実現する無相関化処理部の構成図である。
【図23】車室内のスピーカ配置図である。
【符号の説明】
【0035】
1 地上波ディジタル放送受信機
2 オーディオ装置
20 地上波ディジタルデコーダ
30 無相関化処理部
40 ゲイン制御部
50 オーディオ信号処理部
70 コントローラ

【特許請求の範囲】
【請求項1】
無相関化処理によりステレオ信号からサラウンド信号及びセンター信号を生成するオーディオ装置において、
符号化オーディオ信号よりステレオ信号を復号して出力すると共に符号化情報を抽出する復号部、
前記ステレオ信号L,Rのそれぞれに対して低相関なサラウンド信号を発生すると共に、該ステレオ信号L,Rに高相関な信号をセンター信号として生成する無相関化処理部、
前記符号化情報に基づいて前記センター信号のレベルを制御するレベル制御部、
を備えたことを特徴とするオーディオ装置。
【請求項2】
前記レベル制御部は前記符号化オーディオ信号の符号化レートに基づいて前記センター信号のレベルを制御する、
ことを特徴とする請求項1記載のオーディオ装置。
【請求項3】
前記レベル制御部は前記符号化オーディオ信号がワンセグオーディオ信号であるかフルセグオーディオ信号であるかに基づいて前記センター信号のレベルを制御する、
ことを特徴とする請求項1記載のオーディオ装置。
【請求項4】
前記レベル制御部は前記符号化オーディオ信号がワンセグオーディオ信号であるかフルセグオーディオ信号であるか、並びに、該符号化オーディオ信号の符号化レートを考慮して前記センター信号のレベルを制御する、
ことを特徴とする請求項1記載のオーディオ装置。
【請求項5】
前記レベル制御部は前記符号化オーディオ信号がモノラルであるかステレオであるかサラウンドであるかに基づいて前記センター信号のレベルを制御する、
ことを特徴とする請求項1記載のオーディオ装置。
【請求項6】
前記レベル制御部からの制御信号に基づいてゲインを可変して前記センター信号のレベルを制御するゲイン可変部、
を備えたことを特徴とする請求項1乃至5記載のオーディオ装置。
【請求項7】
前記無相関化処理部において適応信号処理により前記サラウンド信号とセンター信号を発生する場合、前記レベル制御部からの制御信号に基づいて適応信号アルゴリズムのステップサイズパラメータを可変して該センター信号のレベルを可変する手段、
を備えたことを特徴とする請求項1乃至5記載のオーディオ装置。
【請求項8】
前記無相関化処理部において適応信号処理により前記サラウンド信号とセンター信号を発生する場合、前記レベル制御部からの制御信号に基づいて適応信号処理部を構成する適応フィルタのタップ長を可変して該センター信号のレベルを可変する手段、
を備えたことを特徴とする請求項1乃至5記載のオーディオ装置。
【請求項9】
前記レベル制御部からの制御信号に基づいて、ゲインを可変して前記オーディオ信号処理部から出力される前記センター信号のレベルおよび前記ステレオ信号のレベルをそれぞれ制御する複数のゲイン可変部、
を備えたことを特徴とする請求項1乃至5記載のオーディオ装置。
【請求項10】
前記無相関化処理部は、
一方のステレオ信号Rから、他方のステレオ信号Lと相関の高い高相関信号成分Cを抽出し、該他方のステレオ信号Lより該高相関信号Cを減算して第1のサラウンド信号SLを出力する第1の適応信号処理部と、
前記他方のステレオ信号Lから、前記一方のステレオ信号Rと相関の高い高相関信号成分Cを抽出し、該一方のステレオ信号Rより該高相関信号Cを減算して第2のサラウンド信号SRを出力する第2の適応信号処理部と、
前記高相関信号Cと高相関信号Cを合成して前記センター信号を出力する合成部、
を備え、前記レベル制御部は、前記第1、第2の適応信号処理部の適応信号アルゴリズムに使用するステップサイズパラメータを可変して該センター信号のレベルを可変する、
ことを特徴とする請求項1記載のオーディオ装置。
【請求項11】
前記レベル制御部は、前記ステップサイズパラメータと共に前記センター信号のレベルを制御することを特徴とする請求項10記載のオーディオ装置。
【請求項12】
前記無相関化処理部は、
一方のステレオ信号Rから、他方のステレオ信号Lと相関の高い高相関信号成分Cを抽出し、該他方のステレオ信号Lより該高相関信号Cを減算して第1のサラウンド信号SLを出力する第1の適応信号処理部と、
前記他方のステレオ信号Lから、前記一方のステレオ信号Rと相関の高い高相関信号成分Cを抽出し、該一方のステレオ信号Rより該高相関信号Cを減算して第2のサラウンド信号SRを出力する第2の適応信号処理部と、
前記高相関信号Cと高相関信号Cを合成して前記センター信号を出力する合成部、
を備え、前記レベル制御部は、前記第1、第2の適応信号処理部を構成する適応フィルのタップ長を制御して該センター信号のレベルを可変する、
ことを特徴とする請求項1記載のオーディオ装置。
【請求項13】
前記レベル制御部は、前記タップ長と共に前記センター信号のレベルを制御することを特徴とする請求項12記載のオーディオ装置。
【請求項14】
無相関化処理によりステレオ信号からサラウンド信号及びセンター信号を生成するオーディオ処理方法において、
符号化オーディオ信号よりステレオ信号L,Rを復号して出力すると共に符号化情報を抽出するステップ、
前記ステレオ信号L,Rのそれぞれに対して低相関なサラウンド信号を発生すると共に、該ステレオ信号L,Rに高相関な信号をセンター信号として生成するステップ、
前記符号化情報に基づいて前記センター信号のレベルを制御するステップ、
前記ステレオ信号L,R、2つのサラウンド信号、センター信号をそれぞれ対応するスピーカに入力するステップ
を備えたことを特徴とするオーディオ処理方法。
【請求項15】
前記符号化オーディオ信号の符号化レートに基づいて前記センター信号のレベルを制御する、
ことを特徴とする請求項14記載のオーディオ処理方法。
【請求項16】
前記符号化オーディオ信号がワンセグオーディオ信号であるかフルセグオーディオ信号であるかに基づいて前記センター信号のレベルを制御する、
ことを特徴とする請求項14記載のオーディオ処理方法。
【請求項17】
前記符号化オーディオ信号がワンセグオーディオ信号であるかフルセグオーディオ信号であるか、並びに、該符号化オーディオ信号の符号化レートを考慮して前記センター信号のレベルを制御する、
ことを特徴とする請求項14記載のオーディオ処理方法。
【請求項18】
前記符号化オーディオ信号がモノラルであるかステレオであるかサラウンドであるかに基づいて前記センター信号のレベルを制御する、
ことを特徴とする請求項14記載のオーディオ処理方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate


【公開番号】特開2010−103768(P2010−103768A)
【公開日】平成22年5月6日(2010.5.6)
【国際特許分類】
【出願番号】特願2008−273379(P2008−273379)
【出願日】平成20年10月23日(2008.10.23)
【出願人】(000101732)アルパイン株式会社 (2,424)
【Fターム(参考)】