説明

マルチチャンネル音響復号化装置及び方法

【課題】現行MPEGサラウンド技術は、演算負荷の重い処理を用いている。低演算量処理を実現するための方法の1つに、上記技術で用いられたフィルタバンクを実数となるよう変換する方法がある。しかし、実数処理は音質の深刻な劣化を招くエリアジングの原因となる。
【解決手段】本発明は、サブバンドに対してより「ブリックウォール」のような周波数応答を提供するために、ローパワーSBRの分析QMFフィルタバンクに対して、MPEGサラウンドの分析ナイキストフィルタバンク及び合成QMFフィルタバンクに対してと同様に、ロングプロトタイプフィルタを用いることを提案する。これにより、エリアジングアーチファクトは削減される。MPEGサラウンド内において、ゲイン等化技術は処理される信号に施された調整を抑制するために適用できる。これにより、音質におけるエリアジングの影響をさらに低減する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ローパワーSBR技術と効率的に組み合わせることによって、MPEGサラウンド技術(非特許文献1参照)におけるローパワー処理を行う装置を提供する。本発明は、以下に制限はされないが、特に、放送等の低ビットレートの応用において有用である。この技術は、またメモリの必要容量を減らすため、チップサイズをより小さくすることができる。他の関連する応用として、本発明は、ホームシアターシステム、車載音響システム及び電子ゲームシステムに適用可能である。
【背景技術】
【0002】
図1は、ステレオ信号の組に対するMPEGサラウンドの基本的原理を説明する図である。符号化処理において、音響信号はフレームごとに処理される。左右のチャンネルであるL及びRは、M=(L+R)/2Mを生成するために、(100)においてダウンミックスされる。L、R及びMは、バイノーラルキューの組を生成するために、バイノーラルキュー検出モジュール(102)によって処理される。一方、L及びRのスペクトル表現の平均をとることによって、スペクトル変換後に、MをL及びRから生成することができる。バイノーラルキューは、スペクトルバンドごとに、L、R及びMの表現を比較することによって算出される。音響符号化装置(104)は、M信号を符号化して、圧縮されたビットストリームを生成する。この音響符号化装置の例としては、MP3やAACがある。バイノーラルキューは、完全な符号列を形成するために、(106)において、量子化され、圧縮されたMに多重化される。
【0003】
バイノーラルキューは、チャンネル間レベル/強度差(IID)及びチャンネル間コヒーレンス/相関性(ICC)である。ICCキューが二つの信号間(この場合、左右のチャンネル)の類似性を測るのに対し、IIDキューは相対的な信号強度を測る。一般に、レベル/強度キューは、音のバランス/定位を制御するが、コヒーレンス/相関性キューは音の幅/拡散性を制御する。これらは共に聴き手が聴覚的情景を頭の中で構成するのを助ける空間パラメータである。最新の先行技術方法において、音響スペクトルは、通常複数の「パラメータバンド」からなるグループに区分されており、バイノーラルキューの組はそれぞれのパラメータバンドにおいて算出される。先行技術において、「バイノーラルキュー」と「空間パラメータ」という用語はしばしば互換性をもって用いられる。
【0004】
復号化処理において、逆多重化装置(108)は、バイノーラルキュー情報から、Mのビットストリームを分離する。Mのビットストリームは、ダウンミックス信号Mを復元するために、音響復号化装置(110)によって復号化される。ダウンミックス信号と逆量子化バイノーラルキューは、ダウンミックス信号からステレオ信号を復元するために、マルチチャンネル合成モジュール(112)によって処理される。これらダウンミックス信号から元の2つの信号を復元する処理は、後で説明する「チャンネル分離技術」を伴う。
【0005】
上記の例は、符号化装置においてどのように二つの信号を1つのダウンミックス信号と空間パラメータの組で表すことができ、空間パラメータとダウンミックス信号を処理することによって、復号化装置においてどのようにダウンミックス信号を2つの信号に分離することができるのかを説明するにすぎない。その技術は、音響の2より多いチャンネル(例えば、5.1の音源からの6つのチャンネル)を、符号化処理時に1つもしくは2つのダウンミックスチャンネルに圧縮することもでき、復号化処理において復元することができる。図2における6チャンネルの例を参照すると、ここで重要となるのは、マルチステージの方法において、毎回、チャンネル分離モジュール(200〜204)において1つの中間ダウンミックス信号を2つの中間ダウンミックス信号に分離する、同一の分離処理を施すことである。上記処理は単一信号を取得するまで再帰的に繰り返される。Lf、Rf、Ls、Rs、C、及びLFEは、それぞれ左前、右前、左横、右横、中央、及び低周波数を示す。
【0006】
音響信号の処理を開始するために、MPEGサラウンドは、2組のフィルタバンクで、時間領域信号をハイブリッド時間/周波数表現に変換する。図3は、MPEGサラウンドのフィルタバンクを示す図である。分析QMFフィルタバンク(300)は、時間領域ダウンミックス信号を64のサブバンドに変換する。それぞれのサブバンドは、小さなスペクトル領域の時間領域信号の断片を示している。しかしながら、低周波数領域において周波数分解能は十分ではないため、第2ステージ分析ナイキストフィルタバンク(301)が低周波数サブバンドをさらにハイブリッドサブバンドに分解するために用いられる。全てのサブバンド及びハイブリッドサブバンドは、マルチチャンネル信号を復元する、コアMPEGサラウンド復号化装置(303)への入力となる。マルチチャンネル信号は、対応する合成ナイキストフィルタバンク(304)及び対応する合成QMFフィルタバンク(305)を用いて、時間領域信号に変換される。全てのフィルタバンクは複素動作をとる。
【0007】
SBR復号化装置から、ダウンミックス信号を取得することは可能である。SBRは、非常に低いビットレートで符号化された音響信号の高域特性を高める帯域幅拡張技術である。図4は、SBR決定器のフィルタバンクを示す図である。MPEGサラウンドとは異なり、SBRは代わりにQMFフィルタバンクの組を用いる。分析QMFフィルタバンク(400)は、時間領域ダウンミックス信号を32のサブバンドに変換する。それぞれのサブバンドは、小さなスペクトル領域の時間領域信号の断片を示している。サブバンドは、SBR復号化装置(401)によって処理され、ここで「上位」(もしくは高周波数の)32のサブバンドは合成される。SBR復号化装置は64のサブバンドを出力し、それらは合成QMFフィルタバンク(402)によって拡張ダウンミックス信号に変換される。
【0008】
SBR復号化装置からの出力は64のQMFサブバンドから構成されており、これはMPEGサラウンド復号化装置の分析ナイキストフィルタバンクへの入力と同一であることから、効率的な実施を実現するために、図5に示されるように2つの技術を組み合わせることが可能である。SBR復号化装置(501)と分析ナイキストフィルタバンク(502)の間では、2つのフィルタバンクがバイパスされる。
【0009】
本発明の目的は、SBRとMPEGサラウンドの組み合わせにおける演算量をより低減することである。
【非特許文献1】J. Herre, et al, "The Reference Model Architecture for MPEG Spatial Audio Coding", May 28-31, 2005, Audio Engineering Society 118th Convention, Paper No. 6447.
【非特許文献2】ISO/IEC 14496-3: 2001: AMD1: 2003 (E), "Bandwidth Extension", pp. 79-92.
【発明の開示】
【発明が解決しようとする課題】
【0010】
図5に示されるシステムの演算量を、全ての処理を実数値に変換することによってさらに激減させることが可能である。図6は、新しいシステムを示す図である。ここで、全てのフィルタバンク(600)、(602)、(604)及び(605)は、実数フィルタバンクを用いる。残念なことに、本変換は、必ずエイリアジング現象を引き起こしてしまう。
【0011】
フィルタバンクは、フィルタバンクによって出力されたそれぞれのサブバンドがスペクトルの狭い領域における信号を表すように、信号を分割するように構成されている。フィルタバンクによって用いられたプロトタイプフィルタは、実際、重複する周波数応答をする傾向にあるので、エリアジングが起こる。フィルタバンクは、信号スペクトル全体にわたり、信号が調整されない場合、もしくは同量の調整が全てのサブバンドに対して行われる場合に、合成フィルタバンクにおいて、周辺サブバンドに流れ出すエリアジング成分は削除されるように設計される。
【0012】
しかしながら、信号が調整される場合は、複素フィルタバンクは、その「オーバーサンプリング」特性を通して冗長性を持ち込むことによって、エリアジングの問題を軽減する。残念なことに、演算及びメモリ負荷を軽減するためにフィルタバンクが実数に変換された場合、信号は「オーバーサンプル」から「クリティカルサンプル」に変化する。言い換えれば、信号帯域が独立して調整される場合に、エリアジングの影響ははっきりと聴くことができるようになる。実際、エリアジングの影響は、信号スペクトルの「トーナリティ」領域周辺において特によく聴くことができる。
【0013】
実数のSBRは既に存在し、自身のアンチエリアジングツールを備えており、ローパワーSBR(601)として知られている。実数MPEGサラウンド復号化装置(603)もまた、ハイブリッドサブバンド信号に対して調整をおこない、エリアジング成分の影響を軽減するために、アンチエリアジングツールが必要である。
【課題を解決するための手段】
【0014】
本発明は、全ての処理を実数に変換し、サブバンドの周波数応答を改良するための2組のフィルタバンクに対する、ロングプロトタイプフィルタを提案する。これによって、エリアジング成分は削減される。残存するエリアジング成分については、実数MPEGサラウンド復号化装置内で実行される信号調整を抑制するために、等化ツールを用いることができる。
【0015】
本発明は、分析QMFフィルタバンク、コアSBR復号化手段、及び合成QMFフィルタバンクを備えるSBR復号化装置と、分析QMFフィルタバンク、分析ナイキストフィルタバンク、コアMPEGサラウンド復号化手段、合成ナイキストフィルタバンク、及び合成QMFフィルタバンクを備えるMPEGサラウンド復号化装置を効率的に接続するための方法であって、
(a)前記SBR復号化装置から前記合成QMFフィルタバンクを取り除き、
(b)前記MPEGサラウンド復号化装置から前記分析QMFフィルタバンクを取り除き、
(c)複合システムを形成するために、前記SBR復号化装置の前記SBR復号化手段の出力を、前記MPEGサラウンド復号化装置の前記分析ナイキストフィルタバンクの入力に接続し、
(d)前記複合システムの前記SBR復号化手段を、ローパワーSBR復号化手段に置き替え、
(e)前記複合システムの全ての処理を実数となるように変換し、
(f)ロングプロトタイプフィルタを用いるために、前記組み合わせたシステムの前記分析QMFフィルタバンク、前記分析ナイキストフィルタバンク、及び前記合成QMFフィルタバンクをアップグレードし、
(g)前記実数コアMPEGサラウンド復号化手段に、その信号調整データを抑制するために等化手段を追加することを特徴とする。
【0016】
本発明の実施の形態の1つにおいて、SBR仕様書において開示されているフィルタバンク処理方法との互換性を維持するために、実数QMFフィルタには128の倍数に等しい長さをもったニュープロトタイプフィルタを用いている。
【0017】
なお、本発明は上記に記載の方法としてだけではなく、(i)装置、(ii)プログラム、及び(iii)そのようなプログラムが記憶される記憶媒体として実現することができる。
【発明の効果】
【0018】
本発明は、符号列のシンタックスを変形することなく、MPEGサラウンドとローパワーSBRを組み合わせることによって、処理の演算量を低減する。ローパワーSBRとの下位互換性は重要である。なぜなら、それは業界において急速に普及しているバンド幅拡張技術であるからである。音質の軽微な劣化は、特に低ビットレート応用に対して、本発明が提案する処理及びチップサイズの大幅な削減とのトレードオフである。
【発明を実施するための最良の形態】
【0019】
以下に示す実施の形態は、単に様々な進歩性の原理を説明しているにすぎない。ここに記載される詳細の変形は、当業者にとっては明らかであると理解される。よって、本発明は、特許請求項の範囲においてのみ限定されるのであって、以下の具体的、説明的な詳細に限定されるものではないとする。
【0020】
本発明の実施の形態1として、図6に示されるように、複合MPEGサラウンドとSBRシステムの全ての処理は実数となるように変換される。実数SBRは、ローパワーSBR(601)に置き換えられる。この処理は、処理負荷を本質的に二分する。QMFフィルタバンク(600)及び(605)を実数となるように変化させる処理もまた、変調関数における回転ファクタの変化を伴う。この処理の詳細はローパワーSBRに関する仕様書[3]に十分に述べられており、本開示の範囲外である。
【0021】
図7は、ロングプロトタイプフィルタを使用するために、3つの実数フィルタバンク(600)、(602)及び(605)をアップグレードさせることによって、エリアジングの問題を軽減するように、図6の実数システムをどのようにさらに拡張することができるかを示す図である。アップグレードされたフィルタバンクは、(700)、(702)及び(705)である。
【0022】
より長いプロトタイプフィルタを用いることにより、理想の「ブリックウォール」応答に近い周波数応答を実現することができる。そのようなフィルタは、連続するサブバンドの周波数応答間の重複領域を軽減することができる。よって、生成されるエリアジング成分の量を削減する。さらに、残存するエリアジング成分も、スペクトル的にメイン成分近くに設定されるため、人間の耳がもつ音響心理によってより効果的にマスクされる。図8は、これを説明する図である。[3]に開示された処理方法との互換性を維持するために、ニュープロトタイプフィルタの長さを128の倍数にすることが必要不可欠である。
【0023】
本発明はまた、実数MPEGサラウンド復号化装置(703)に等化手段(706)を追加してもよい。等化手段は、スペクトル方向にサブバンド信号のトーナル領域になされた調整を軽減し、よってエリアジングサウンドをより小さくする。
【図面の簡単な説明】
【0024】
【図1】空間音響符号化の原理を示す図である。
【図2】2より多いダウンミックス信号を個々の信号に分離するマルチチャンネル分離を示す図である。
【図3】MPEGサラウンド復号化装置を示す図である。
【図4】SBR復号化装置を示す図である。
【図5】1つの合成QMFフィルタバンクと1つの分析QMFフィルタバンクをバイパスすることによって、SBR及びMPEGサラウンドを組み合わせる方法を示す図である。
【図6】全てのフィルタバンクと同様に、SBRに代わってローパワーSBRが用いられる低演算量モード、及びMPEGサラウンドが実数モードで作動するようにすることを示す図である。
【図7】エリアジングアーチファクトを抑制するために、等化ツールが実数MPEGサラウンドに追加されると同様に、低プロトタイプフィルタがフィルタバンクに用いられることを示す図である。
【図8】ロング及びショートのプロトタイプフィルタの周波数応答の比較を示す図である。

【特許請求の範囲】
【請求項1】
分析QMFフィルタバンク、コアSBR復号化手段、及び合成QMFフィルタバンクを備えるSBR復号化装置と、分析QMFフィルタバンク、分析ナイキストフィルタバンク、コアMPEGサラウンド復号化手段、合成ナイキストフィルタバンク、及び合成QMFフィルタバンクを備えるMPEGサラウンド復号化装置を効率的に接続するための方法であって、
(a)前記SBR復号化装置から前記合成QMFフィルタバンクを取り除き、
(b)前記MPEGサラウンド復号化装置から前記分析QMFフィルタバンクを取り除き、
(c)複合システムを形成するために、前記SBR復号化装置の前記SBR復号化手段の出力を、前記MPEGサラウンド復号化装置の前記分析ナイキストフィルタバンクの入力に接続し、
(d)前記複合システムの前記SBR復号化手段を、ローパワーSBR復号化手段に置き替え、
(e)前記複合システムの全ての処理を実数となるように変換し、
(f)ロングプロトタイプフィルタを用いるために、前記複合システムの前記分析QMFフィルタバンク、前記分析ナイキストフィルタバンク、及び前記合成QMFフィルタバンクをアップグレードし、
(g)前記実数コアMPEGサラウンド復号化手段に、その信号調整データを抑制するために等化手段を追加する
ことを特徴とする。
【請求項2】
前記実数QMFフィルタは、SBR仕様書に開示されているフィルタバンク処理方法との互換性を維持するために、128の倍数に等しい長さのニュープロトタイプフィルタを用いる
ことを特徴とする請求項1記載の方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2007−110565(P2007−110565A)
【公開日】平成19年4月26日(2007.4.26)
【国際特許分類】
【外国語出願】
【出願番号】特願2005−300939(P2005−300939)
【出願日】平成17年10月14日(2005.10.14)
【出願人】(000005821)松下電器産業株式会社 (73,050)
【Fターム(参考)】