説明

マルチチャネル・オーディオ信号の符号化方法及び該装置、その復号化方法及び該装置

マルチチャネル・オーディオ信号の符号化/復号化方法及び該装置が開示され、該マルチチャネル・オーディオ信号の符号化時に、ダウンミックスされたオーディオ信号、ダウンミックスされたオーディオ信号をマルチチャネル・オーディオ信号に復元するための第1付加情報及びレジデュアル信号の特性を示す第2付加情報を多重化し、復号化時は、第2付加情報を利用し、所定の位相差を有する復元されたマルチチャネル・オーディオ信号を結合して各チャネルのオーディオ信号を補正することによって、復元されたオーディオ信号の音質を向上させる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、マルチチャネル・オーディオ信号の符号化及び復号化に係り、さらに詳細には、符号化されたマルチチャネル・オーディオ信号の復元時に、各チャネルの音質を向上させることができるレジデュアル信号を所定のパラメータ情報として符号化し、これをマルチチャネル・オーディオ信号の復号化時に利用するマルチチャネル・オーディオ信号の符号化/復号化方法及び該装置に関する。
【背景技術】
【0002】
一般的に、マルチチャネル・オーディオを符号化する方法には、ウェーブフォーム(waveform)オーディオ・コーディングと、パラメトリック(parametric)・オーディオ・コーディングとがある。ウェーブフォーム符号化には、MPEG(moving picture experts group)−2MC(multi-channel)オーディオ・コーディング、AAC(advanced audio coding)MCオーディオ・コーディング及びBSAC(bit-sliced arithmetic coding)/AVS(audio videio)MCオーディオ・コーディングなどがある。
【0003】
パラメトリック・オーディオ・コーディングでは、オーディオ信号を周波数ドメインで、周波数、振幅のような成分に分解し、かような周波数、振幅に係わる情報をパラメータ化してオーディオ信号を符号化する。例えば、パラメトリック・オーディオ・コーディングを利用して、ステレオオーディオ信号を符号化する場合、左チャネルオーディオと右チャネルオーディオとをダウンミックスしてモノオーディオを生成し、生成されたモノオーディオを符号化する。そして、複数の周波数バンドそれぞれに対してチャネル間強度差(IID:interchannel intensity difference)、チャネル間相関度(ID:interchannel correlation)、全位相差(OPD:overall phase difference)及びチャネル間位相差(IPD:interchannel phase difference)のようなパラメータを符号化する。ここで、チャネル間強度差(IID)に係わるパラメータ、及びチャネル間相関度(ID)に係わるパラメータは、ステレオオーディオ信号の復号化時に、左チャネルオーディオと右チャネルオーディオとの強度を決定するための情報として利用され、全位相差(OPD)に係わるパラメータ及びチャネル間位相差(IPD)に係わるパラメータは、ステレオオーディオ信号の復号化時に、左チャネルオーディオと右チャネルオーディオとの位相を決定するための情報として利用される。
【0004】
かようなパラメトリック・オーディオ・コーディング方式などでは、符号化された後で復元されたオーディオ信号と入力オーディオ信号との間に差が発生する。一般的に、符号化された後で復元されたオーディオ信号と、入力オーディオ信号との差値をレジデュアル(residual)信号と定義する。かようなレジデュアル信号は、一種の符号化エラーを示す。オーディオ信号の復元時に、各チャネルの音質を向上させるためには、かようなレジデュアル信号を符号化し、符号化されたレジデュアル信号を復元時に利用する必要がある。
【発明の概要】
【発明が解決しようとする課題】
【0005】
本発明は、パラメトリック・オーディオ・コーディングで、オーディオ信号の音質を向上させるためには、レジデュアル信号情報を効率的に符号化する必要がある。
【課題を解決するための手段】
【0006】
本発明の一側面は、マルチチャネル・オーディオ信号の符号化時に復元されたマルチチャネル・オーディオ信号と、入力マルチチャネル・オーディオ信号とのの差値であるレジデュアル信号が最小になるように、レジデュアル信号情報を効率的に伝送するマルチチャネル・オーディオ信号の符号化方法及び該装置を提供することである。本発明の他の側面は、符号化されたレジデュアル信号情報をマルチチャネル・オーディオ信号の復号化時に利用することによって、各チャネルの音質を向上させるマルチチャネル・オーディオ信号の復号化方法及び該装置を提供することである。
【発明の効果】
【0007】
本発明によれば、符号化時に最小限のレジデュアル信号情報を効率的に符号化し、復号化時にレジデュアル信号を利用し、マルチチャネル・オーディオ信号の各チャネルの音質を向上させることができる。
【図面の簡単な説明】
【0008】
【図1】本発明の一実施形態によるマルチチャネル・オーディオ信号の符号化装置の構成を示したブロック図である。
【図2】図1のマルチチャネル符号化部の一実施形態を示したブロック図である。
【図3A】本発明の一実施形態によって、第1チャネル入力オーディオ及び第2チャネル入力オーディオの強度に係わる情報を生成する方法を説明するための参照図である。
【図3B】本発明の他の実施形態によって、第1チャネル入力オーディオ及び第2チャネル入力オーディオの強度に係わる情報を生成する方法を説明するための参照図である。
【図4】図1のレジデュアル信号生成部の一実施形態を示したブロック図である。
【図5】図4の復元部の一実施形態を示したブロック図である。
【図6】本発明の一実施形態によるマルチチャネル・オーディオ信号の符号化方法を示したフローチャートである。
【図7】本発明の一実施形態によるマルチチャネル・オーディオ信号の復号化装置を示したブロック図である。
【図8】互いに90°の位相差を有するオーディオ信号を示したグラフである。
【図9】本発明の一実施形態によるマルチチャネル・オーディオ信号の復号化方法を示したフローチャートである。
【発明を実施するための形態】
【0009】
本発明が解決しようとする技術的課題は、マルチチャネル・オーディオ信号の符号化時に復元されたマルチチャネル・オーディオ信号と、入力マルチチャネル・オーディオ信号との差値であるレジデュアル信号が最小になるように、レジデュアル信号情報を効率的に伝送するマルチチャネル・オーディオ信号の符号化方法及び該装置を提供することである。また、本発明が解決しようとする技術的課題は、符号化されたレジデュアル信号情報をマルチチャネル・オーディオ信号の復号化時に利用することによって、各チャネルの音質を向上させるマルチチャネル・オーディオ信号の復号化方法及び該装置を提供することである。
【0010】
本発明の一実施形態によるマルチチャネル・オーディオ信号の符号化方法は、入力マルチチャネル・オーディオ信号に対するパラメトリック符号化を行い、ダウンミックスされたオーディオ信号を生成する段階と、前記ダウンミックスされたオーディオ信号を前記マルチチャネル・オーディオ信号に復元するための第1付加情報を生成する段階と、前記ダウンミックスされたオーディオ信号及び前記第1付加情報を利用して復元されたマルチチャネル・オーディオ信号と、前記入力マルチチャネル・オーディオ信号との差値であるレジデュアル信号を生成する段階と、前記レジデュアル信号の特性を示す第2付加情報を生成する段階と、前記ダウンミックスされたオーディオ信号、前記第1付加情報及び前記第2付加情報を多重化する段階と、を含むことを特徴とする。
【0011】
本発明の一実施形態によるマルチチャネル・オーディオ信号の符号化装置は、入力マルチチャネル・オーディオ信号に対する符号化を行い、ダウンミックスされたオーディオ信号及び前記ダウンミックスされたオーディオ信号を前記マルチチャネル・オーディオ信号に復元するための第1付加情報を生成するマルチチャネル符号化部;前記ダウンミックスされたオーディオ信号及び前記第1付加情報を利用して復元されたマルチチャネル・オーディオ信号と、前記入力マルチチャネル・オーディオ信号との差値であるレジデュアル信号を生成するレジデュアル信号生成部;前記レジデュアル信号の特性を示す第2付加情報を生成するレジデュアル信号符号化部;及び前記ダウンミックスされたオーディオ信号、前記第1付加情報及び前記第2付加情報を多重化する多重化部;を含むことを特徴とする。
【0012】
本発明の一実施形態によるマルチチャネル・オーディオ信号の復号化方法は、符号化されたオーディオデータからダウンミックスされたオーディオ信号、前記ダウンミックスされたオーディオ信号をマルチチャネル・オーディオ信号に復元するための第1付加情報、及び符号化時に入力マルチチャネル・オーディオ信号と、符号化された後で復元されたマルチチャネル・オーディオ信号との差値であるレジデュアル信号の特性を示す第2付加情報を抽出する段階と、前記ダウンミックスされたオーディオ信号及び前記第1付加情報を利用し、第1マルチチャネル・オーディオ信号を復元する段階と、前記復元された第1マルチチャネル・オーディオ信号と所定の位相差を有する第2マルチチャネル・オーディオ信号を生成する段階と、前記第2付加情報を利用し、前記第1マルチチャネル・オーディオ信号と、前記第2マルチチャネル・オーディオ信号とを結合して最終復元オーディオ信号を生成する段階と、を含むことを特徴とする。
【0013】
本発明の一実施形態によるマルチチャネル・オーディオ信号の復号化装置は、符号化されたオーディオデータからダウンミックスされたオーディオ信号、前記ダウンミックスされたオーディオ信号をマルチチャネル・オーディオ信号に復元するための第1付加情報、及び符号化時に入力マルチチャネル・オーディオ信号と、符号化された後で復元されたマルチチャネル・オーディオ信号との差値であるレジデュアル信号の特性を示す第2付加情報を抽出する逆多重化部;前記ダウンミックスされたオーディオ信号及び前記第1付加情報を利用し、第1マルチチャネル・オーディオ信号を復元するマルチチャネル復号化部;前記復元された第1マルチチャネル・オーディオ信号と所定の位相差を有する第2マルチチャネル・オーディオ信号を生成する位相変移部;及び前記第2付加情報を利用し、前記第1マルチチャネル・オーディオ信号と、前記第2マルチチャネル・オーディオ信号とを結合して最終復元オーディオ信号を生成する結合部を;含むことを特徴とする。
【0014】
以下、添付された図面を参照しつつ、本発明の望ましい実施形態について具体的に説明する。
【0015】
図1は、本発明の一実施形態によるマルチチャネル・オーディオ信号の符号化装置の構成を示したブロック図である。図1を参照するに、本発明の一実施形態によるマルチチャネル・オーディオ信号の符号化装置100は、マルチチャネル符号化部110、レジデュアル信号生成部120、レジデュアル信号符号化部130及び多重化部140を含む。入力マルチチャネル・オーディオ信号ChないしChがデジタル信号ではない場合には、n個の入力マルチチャネル・オーディオ信号に対してサンプリング及び量子化を行ってデジタル信号に変換するA/D(analog-digital)変換器(図示せず)がさらに含まれてもよい。
【0016】
マルチチャネル符号化部110は、n個(nは、正の整数)の入力マルチチャネル・オーディオ信号に対するパラメトリック符号化を行い、ダウンミックスされたオーディオ信号、及びダウンミックスされたオーディオ信号をさらにマルチチャネル・オーディオ信号に復元するための第1付加情報を生成する。さらに具体的には、マルチチャネル符号化部110は、n個の入力マルチチャネル・オーディオ信号を、nより少数のチャネルを有するオーディオ信号にダウンミックスし、ダウンミックスされたオーディオ信号をさらにn個のマルチチャネルに復元するために必要な第1付加情報を生成する。例えば、入力信号として、5.1チャネルのオーディオ信号、すなわちレフト(L)、サラウンドレフト(Ls)、センター(C)、サブウーファ(Sw)、ライト(R)、サラウンドライト(Rs)の6個のマルチチャネルの信号が、マルチチャネル符号化部110に入力される場合を仮定すれば、マルチチャネル符号化部110は、5.1チャネルのオーディオ信号をL及びRの2チャネルのステレオ信号にダウンミックスし、2チャネルのステレオ信号を符号化してオーディオビットストリームを生成する一方、2チャネルのステレオ信号をさらに5.1チャネルのオーディオ信号に復元するための第1付加情報を生成する。第1付加情報は、ダウンミックスされる信号の強度(intensity)を決定するための情報、及びダウンミックスされる信号間の位相差に係わる情報を含んでもよい。以下、マルチチャネル符号化部110で行われるダウンミックス過程、及び第1付加情報を生成する過程について具体的に説明する。
【0017】
図2は、図1のマルチチャネル符号化部110の一実施形態を示したブロック図である。図2を参照するに、本発明の一実施形態によるマルチチャネル符号化部110は、複数個のダウンミックス部111ないし118及びステレオ信号符号化部119を含む。
【0018】
マルチチャネル符号化部110は、n個の入力マルチチャネル・オーディオ信号Ch1ないしChnを受信し、受信されたn個の入力マルチチャネル・オーディオ信号を、2個のチャネル単位で加算し、ダウンミックスされた出力信号を生成し、ダウンミックスされた出力信号を2個ずつまとめてさらにダウンミックスする過程を反復することによって、ダウンミックスされたオーディオ信号を出力する。例えば、ダウンミックス部111は、第1チャネルの入力オーディオ信号Ch及び第2チャネルの入力オーディオ信号Chを加算し、ダウンミックスされた出力信号BMを生成する。同様に、ダウンミックス部112は、第3チャネルの入力オーディオ信号Ch及び第4チャネルの入力オーディオ信号Chを加算し、ダウンミックスされた出力信号BMを生成する。2個のダウンミックス部111,112で出力される2個のダウンミックスされた出力信号BM,BMは、さらにダウンミックス部113を介してダウンミックスされ、ダウンミックスされた出力信号TMが出力される。かようなダウンミックス過程は、図2に図示されたように、L及びRの2チャネルのステレオ信号が発生するまで反復されたり、L及びRのステレオ信号をさらにダウンミックスしたモノ信号が出力されるまで反復されてもよい。
【0019】
ステレオ信号符号化部119は、ダウンミックス部111ないし118を介してダウンミックスされたステレオ信号を符号化し、オーディオ・ビットストリームを生成する。ステレオ信号符号化部119としては、MP3またはAAC(advanced audio codec)のような一般的なオーディオコーデックが利用されてもよい。
【0020】
ダウンミックス部111ないし118は、2個の入力されたオーディオ信号を加算するとき、2個のオーディオ信号のうち1つのオーディオ信号の位相を、他の信号の位相と同一に設定した後、加算を行うことができる。例えば、第1チャネルの入力オーディオ信号Chと、第2チャネルの入力オーディオ信号Chとを加算するとき、ダウンミックス部111は、第2チャネルの入力オーディオ信号Chの位相を、第1チャネルの入力オーディオ信号Chと同一に設定した後、位相が調節された第2チャネルの入力オーディオ信号Chと、第1チャネルの入力オーディオ信号Chとを加算することによって、ダウンミックスを行うことができる。これに係わる具体的な内容は後述する。
【0021】
一方、ダウンミックス部111ないし118は、2個のオーディオ信号をダウンミックスして1つの出力信号を生成するとき、1つの出力信号をさらに2個のオーディオ信号に復元するために必要な第1付加情報を生成しなければならない。前述のように、第1付加情報は、ダウンミックスされる信号の強度(intensity)を決定するための情報、及びダウンミックスされる信号間の位相差に係わる情報を含んでもよい。もしダウンミックス部111ないし118として、従来技術のように、ステレオオーディオ信号をモノオーディオ信号にダウンミックスする装置を利用する場合、1つの出力信号に対して、チャネル間強度差(IID:interchannel intensity difference)、チャネル間相関度(ID:interchannel correlation)、全位相差(OPD:overall phase difference)及びチャネル間位相差(IPD:interchannel phase difference)のようなパラメータを符号化する必要がある。この場合、チャネル間強度差(IID)に係わるパラメータ及びチャネル間相関度(ID)に係わるパラメータは、ダウンミックスされた出力信号からダウンミックスされる以前の2個の入力オーディオ信号の強度を決定するための情報として利用され、全位相差(OPD)に係わるパラメータ及びチャネル間位相差(IPD)に係わるパラメータは、ダウンミックスされた出力信号からダウンミックスされる以前の2個の入力オーディオ信号の位相を決定するための情報として利用される。
【0022】
特に、本発明の一実施形態によるダウンミックス部111ないし118は、後述するように、所定のベクトル空間内で2個の入力オーディオ信号と、ダウンミックスされた信号との関係を利用し、ダウンミックスされる以前の2個の入力オーディオ信号の強度及び位相を決定するための情報を含む第1付加情報を生成する。
【0023】
以下、図3A及び図3Bを参照しつつ、第1付加情報を生成する方法について詳細に説明する。説明の便宜のために、マルチチャネル符号化部110に含まれた複数個のダウンミックス部において、第1チャネル入力オーディオCh及び第2チャネル入力オーディオChを入力されるダウンミックス部111でダウンミックスされた出力信号BMを生成するとき、第1付加情報を生成する方式を中心に説明する。ダウンミックス部111で生成される第1付加情報生成過程は、マルチチャネル符号化部110に含まれた他のダウンミックス部にも同一に適用可能である。以下では、第1チャネル入力オーディオCh及び第2チャネル入力オーディオChの強度を決定するための情報を生成する場合と、第1チャネル入力オーディオCh及び第2チャネル入力オーディオChの位相を決定するための情報を生成する場合とに分けて説明する。
【0024】
(1)強度を決定するための情報
パラメトリック・オーディオ・コーディングでは、それぞれのチャネルオーディオを周波数ドメインに変換し、周波数ドメインで、チャネルオーディオそれぞれの強度及び位相に係わる情報を符号化する。オーディオ信号を高速フーリエ変換(Fast Fourier Transform)すれば、オーディオ信号は、周波数ドメインで、離散(discrete)された値によって表現される。すなわち、オーディオ信号は、複数の正弦波の和でもって表現される。パラメトリック・オーディオ・コーディングでは、オーディオ信号が周波数ドメインに変換されれば、周波数ドメインを複数のサブバンドに分割し、それぞれのサブバンドでの第1チャネル入力オーディオChと、第2チャネル入力オーディオChとの強度を決定するための情報、及び第1チャネル入力オーディオChと、第2チャネル入力オーディオChとの位相を決定するための情報を符号化する。このとき、サブバンドkでの強度及び位相に係わる付加情報を符号化した後、同様に、サブバンドk+1での強度及び位相に係わる付加情報を符号化する。パラメトリック・オーディオ・コーディングでは、かような方式で、全体周波数バンドを複数のサブバンドに分割し、それぞれのサブバンドに対してステレオオーディオ付加情報を符号化する。
【0025】
以下では、N個チャネルの入力オーディオを有したステレオオーディオの符号化、復号化と関連して、所定の周波数バンド、すなわち、サブバンドkで、第1チャネル入力オーディオCh及び第2チャネル入力オーディオChに係わる付加情報を符号化する場合を例に挙げて説明する。
【0026】
従来技術によるパラメトリック・オーディオ・コーディングで、ステレオオーディオに係わる付加情報を符号化するときには、サブバンドkで、第1チャネル入力オーディオChと、第2チャネル入力オーディオChとの強度を決定する情報として、チャネル間強度差(IID)及びチャネル間相関度(IC)に係わる情報を符号化することは、前述した通りである。このときサブバンドkで、第1チャネル入力オーディオChの強度及び第2チャネル入力オーディオChの強度をそれぞれ計算し、第1チャネル入力オーディオChの強度と、第2チャネル入力オーディオChの強度との比率をチャネル間強度差(IID)に係わる情報として符号化する。しかし、2チャネルオーディオの強度間の比率だけでは、復号化側で、第1チャネル入力オーディオChの強度及び第2チャネル入力オーディオChの強度を決定することができないので、付加情報として、チャネル間相関度(IC)に係わる情報も共に符号化してビットストリームに挿入する。
【0027】
本発明の一実施形態によるマルチチャネル・オーディオ信号の符号化方法は、サブバンドkで、第1チャネル入力オーディオCh1と、第2チャネル入力オーディオCh2との強度を決定するための情報として符号化される付加情報の個数を最小化するために、サブバンドkで、第1チャネル入力オーディオChの強度に係わるベクトル、及び第2チャネル入力オーディオChの強度に係わるベクトルを利用する。ここで、第1チャネル入力オーディオChを周波数ドメインに変換した周波数スペクトルで、周波数f1,f2,…,fnでの強度の平均値がサブバンドkでの第1チャネル入力オーディオChの強度であり、後述するベクトル
【0028】
【数1】

の大きさである。
【0029】
同様に、第2チャネル入力オーディオCh2を周波数ドメインに変換した周波数スペクトルの周波数f1,f2,…,fnでの強度の平均値がサブバンドkでの第2チャネル入力オーディオChの強度であり、後述するベクトル
【0030】
【数2】

の大きさである。図3A及び図3Bを参照しつつ詳細に説明する。
【0031】
図3Aは、本発明の一実施形態によって、第1チャネル入力オーディオ及び第2チャネル入力オーディオの強度に係わる情報を生成する方法について説明するための参照図である。図3Aを参照するに、本発明の一実施形態によるダウンミックス部111は、サブバンドkで、第1チャネル入力オーディオChの強度に係わるベクトルである
【0032】
【数3】

と、第2チャネル入力オーディオChの強度に係わるベクトルである
【0033】
【数4】

とが所定の角度をなすように、二次元ベクトル空間を生成する。もし第1チャネル入力オーディオChと、第2チャネル入力オーディオChとが左側オーディオ及び右側オーディオであるならば、ステレオオーディオの聴取者が、左側音源方向と右側音源方向とが60°の角度をなす位置で、ステレオオーディオを聴取することを仮定し、ステレオオーディオを符号化することが一般的であるので、二次元ベクトル空間で、
【0034】
【数5】

との間の角度(θ)を60°に設定することができる。しかし、本実施形態で、第1チャネル入力オーディオChと第2チャネル入力オーディオChは、左側オーディオ及び右側オーディオではないので、
【0035】
【数6】

は、任意の角度(θ)を有するのである。
【0036】
図3Aでは、
【0037】
【数7】

とが加算されて生成された出力信号BMの強度に係わるベクトルである
【0038】
【数8】

が図示されている。このとき、前述のように、もし第1チャネル入力オーディオChと、第2チャネル入力オーディオChとがそれぞれ左側オーディオと、右側オーディオとに対応するならば、左側音源方向と右側音源方向とが60°の角度をなす位置で、ステレオオーディオを聴取する聴取者は、
【0039】
【数9】

の方向にBM1ベクトル
【0040】
【数10】

の大きさに該当する強度のモノオーディオを聴取する。
【0041】
本発明の一実施形態によるダウンミックス部111は、サブバンドkで、第1チャネル入力オーディオChと、第2チャネル入力オーディオChとの強度を決定するための情報として、チャネル間強度差(IID)に係わる情報と、チャネル間相関度(IC)に係わる情報との代わりに、
【0042】
【数11】

との間の角度(θ)、または
【0043】
【数12】

との間の角度(θ)に係わる情報を生成する。
【0044】
また、ダウンミックス部111は、
【0045】
【数13】

との間の角度(θ)、または
【0046】
【数14】

との間の角度(θ)を生成する代わりに、cosθまたはcosθのように、コサイン値を生成することもできる。これは、角度に係わる情報を符号化するとき、量子化過程で発生する損失を最小化するためであり、コサイン(cosine)またはサイン(sine)などの三角関数値を利用して角度情報を生成することが望ましい。
【0047】
図3Bは、本発明の他の実施形態によって、第1チャネル入力オーディオ及び第2チャネル入力オーディオの強度に係わる情報を生成する方法について説明するための参照図である。
【0048】
図3Bは、図3Aでのベクトル角度を正規化する過程を図示した図である。
【0049】
図3Aと同じように
【0050】
【数15】


との間の角度(θ)が90°ではない場合には、θを90°に正規化することができ、このとき、θまたはθも正規化される。
【0051】
図3Bで、
【0052】
【数16】

との間の角度(θ)に係わる情報を正規化、すなわち、θを90°に正規化すれば、これに対応してθも正規化され、θ=(θx90)/θが計算される。ダウンミックス部111は、正規化されていないθまたは正規化されたθを第1チャネル入力オーディオChの強度及び第2チャネル入力オーディオChの強度を決定するための情報として生成することができる。また、ダウンミックス部111は、θまたはθの代わりに、cosθまたはcosθを、第1チャネル入力オーディオChの強度及び第2チャネル入力オーディオChの強度を決定するための情報として生成することができる。
【0053】
(2)位相を決定するための情報
従来技術によるパラメトリック・オーディオ・コーディングでは、サブバンドkで、第1チャネル入力オーディオChと、第2チャネル入力オーディオChとの位相を決定するための情報として、全位相差(OPD)及びチャネル間位相差(IPD)に係わる情報を符号化したということは前述した。
【0054】
すなわち、従来にはサブバンドkで、第1チャネル入力オーディオChと、第2チャネル入力オーディオChとを加算して生成された第1最初モノオーディオBMと、サブバンドkで、第1チャネル入力オーディオChとの位相差を計算して全位相差に係わる情報を生成して符号化し、サブバンドkで、第1チャネル入力オーディオChと、第2チャネル入力オーディオChとの位相差を計算してチャネル間位相差に係わる情報を生成して符号化した。位相差は、サブバンドに含まれた周波数f1,f2,…,fnでの位相差をそれぞれ計算した後、計算された位相差の平均を計算することによって求めることができる。
【0055】
本発明の一実施形態によれば、ダウンミックス部111は、第1チャネル入力オーディオChと、第2チャネル入力オーディオChとの位相を決定するための情報として、サブバンドkで、第1チャネル入力オーディオChと、第2チャネル入力オーディオChとの位相差に係わる情報だけを生成する。
【0056】
本発明の一実施形態では、ダウンミックス部が、第1チャネル入力オーディオChの位相と同一になるように、第2チャネル入力オーディオChの位相を調節し、位相調節された第2チャネル入力オーディオChを生成し、その位相調節された第2チャネル入力オーディオChを第1チャネル入力オーディオChと加算するために、第1チャネル入力オーディオChと第2チャネル入力オーディオChとの位相差に係わる情報だけもってしても、第1チャネル入力オーディオCh及び第2チャネル入力オーディオChそれぞれの位相を計算することができる。
【0057】
サブバンドkのオーディオを例に挙げて説明すれば、周波数f1,f2,…,fnで、第2チャネル入力オーディオChの位相を周波数f,f2,…,fnで、第1チャネル入力オーディオChの位相と同一になるようにそれぞれ調節する。周波数f1で第1チャネル入力オーディオChの位相を調節する場合を例に挙げて説明すれば、周波数fで、第1チャネル入力オーディオChが、|Ch|ei(2πf1t+θ1)と表示され、第2チャネル入力オーディオChが、|Ch|ei(2πf1t+θ2)と表示されれば、周波数f1で位相調節された第2チャネル入力オーディオCh2’は、次の数式|Ch|ei(2πf1t+θ1)の通りである。ここで、θは、周波数f1で、第1チャネル入力オーディオChの位相であり、θは、周波数f1で、第2チャネル入力オーディオChの位相を示す。かような位相調節は、サブバンドkの他の周波数、すなわち、f2,f3,…,fnで、第2チャネル入力オーディオChに対して反復して、サブバンドkで位相調節された第2チャネル入力オーディオChを生成する。
【0058】
サブバンドkで位相調節された第2チャネル入力オーディオChは、第1チャネル入力オーディオChの位相と同一であるので、第1チャネル入力オーディオChと、第2チャネル入力オーディオChとの位相差だけ符号化すれば、出力信号BMを復号化する側で、第2チャネル入力オーディオChの位相を求めることができる。また、第1チャネル入力オーディオChの位相と、ダウンミックス部で生成された出力信号BMとの位相は、同一であるので、別途に、第1チャネル入力オーディオChの位相に係わる情報を符号化する必要がない。
【0059】
従って、第1チャネル入力オーディオChと、第2チャネル入力オーディオChとの位相差に係わる情報だけを符号化すれば、復号化する側では、その符号化された情報を利用し、第1チャネル入力オーディオCh及び第2チャネル入力オーディオChの位相を計算することができる。
【0060】
一方、前述のサブバンドkでのチャネルオーディオの強度ベクトルを利用し、第1チャネル入力オーディオChと、第2チャネル入力オーディオChとの強度を決定するための情報を符号化する方法と、位相調節を利用し、サブバンドkで第1チャネル入力オーディオChと、第2チャネル入力オーディオChとの位相を決定するための情報と、を符号化する方法は、それぞれ独立して利用されもし、組み合わせて利用されもする。換言すれば、第1チャネル入力オーディオChと、第2チャネル入力オーディオChとの強度を決定するための情報は、本発明によって、ベクトルを利用して符号化し、第1チャネル入力オーディオChと、第2チャネル入力オーディオChとの位相を決定するための情報は、従来技術のように、全位相差(OPD)及びチャネル間位相差(IPD)を符号化することができる。反対に、第1チャネル入力オーディオChと、第2チャネル入力オーディオChとの強度を決定するための情報は、従来技術によって、チャネル間強度差(IID)及びチャネル間相関度(IC)を利用して符号化し、第1チャネル入力オーディオChと、第2チャネル入力オーディオChとの位相を決定するための情報だけ、本発明のように、位相調節を利用して符号化することもできる。
【0061】
前述のような第1付加情報を生成する過程は、図2に図示されたダウンミックス部から出力されるダウンミックスされたオーディオ信号から、2個の入力オーディオ信号を復元するための第1付加情報を生成するときにも、同一に適用される。
【0062】
一方、マルチチャネル符号化部110は、前述の実施形態に限定されるものではなく、マルチチャネルのオーディオ信号に対する符号化を行い、ダウンミックスされたオーディオ信号を出力し、ダウンミックスされたオーディオ信号をさらにマルチチャネル・オーディオ信号に復元するための付加情報を生成する他のパラメトリック符号化装置を利用することができる。
【0063】
再び図1を参照するに、マルチチャネル符号化部110で生成されたダウンミックスされたオーディオ信号及び第1付加情報は、レジデュアル信号生成部120に入力される。
【0064】
レジデュアル信号生成部120は、ダウンミックスされたオーディオ信号及び第1付加情報を利用し、マルチチャネル・オーディオ信号を復元し、入力マルチチャネル・オーディオ信号と、復元されたマルチチャネル・オーディオ信号との差値であるレジデュアル信号を生成する。
【0065】
図4は、図1のレジデュアル信号生成部120の一実施形態を示したブロック図である。図4を参照するに、レジデュアル信号生成部120は、復元部410及び減算部420を含む。
【0066】
復元部410は、マルチチャネル符号化部110から出力されるダウンミックスされたオーディオ信号及び第1付加情報を利用し、マルチチャネル・オーディオ信号を復元する。具体的には、復元部410は、第1付加情報を利用し、ダウンミックスされたオーディオ信号それぞれから2個のアップミックスされた出力信号を生成し、アップミックスされた出力信号それぞれをさらにアップミックスする過程を反復することによって、マルチチャネル・オーディオ信号を復元する。
【0067】
減算部420は、復元されたマルチチャネル・オーディオ信号と入力オーディオ信号とのの差値を計算し、チャネル別レジデュアル信号Res 1ないしRes nを生成する。
【0068】
図5は、図4の復元部410の一実施形態を示したブロック図である。図5を参照するに、復元部510は、第1付加情報に基づいて、ダウンミックスされた1つのオーディオ信号から2個のオーディオ信号を復元し、復元された2個のオーディオ信号それぞれを、さらに該当第1付加情報を利用して2個のオーディオ信号に復元する過程を反復することによって、入力マルチチャネルと同一個数のn個の復元されたマルチチャネル・オーディオ信号を生成する。復元部510の各アップミックス部511ないし517は、第1付加情報を利用して1つのダウンミックスされたオーディオ信号をアップミックスし、2個のアップミックスされた信号を出力し、かようなアップミックス過程は、入力マルチチャネルと同一個数のマルチチャネル・オーディオ信号が復元されるまで反復される。
【0069】
具体的に、アップミックス部511ないし517の動作について説明する。ただし、説明の便宜のために、図5に図示されたアップミックス部のうち、ダウンミックスされたオーディオ信号TRに対するアップミックスを行い、第1チャネル入力オーディオCh及び第2チャネル入力オーディオChを出力するアップミックス部514の動作を中心に説明する。アップミックス部514の動作過程は、図5に図示された他のアップミックス部にも同一に適用可能である。
【0070】
図3Aを再び参照するに、アップミックス部514は、サブバンドkで、第1チャネル入力オーディオChと、第2チャネル入力オーディオChとの強度を決定するための情報として、ダウンミックスされたオーディオ信号TRの強度に係わるベクトルである
【0071】
【数17】

が、第1チャネル入力オーディオChの強度に係わるベクトルである
【0072】
【数18】

または第2チャネル入力オーディオChの強度に係わるベクトルである
【0073】
【数19】

となす角度に係わる情報を利用する。望ましくは、
【0074】
【数20】

との間の角度のコサイン値、または
【0075】
【数21】

との間の角度のコサイン値に係わる情報を利用することができる。
【0076】
図3Bの例では、
【0077】
【数22】

との間の角度(θ)が60°であると仮定すれば、第1チャネル入力オーディオChの強度、すなわち
【0078】
【数23】

の大きさは、|Ch|=|BM|*sinθm/cos(π/12)によって計算される。ここで、|BM|は、ダウンミックスされたオーディオ信号TRの強度、すなわち、
【0079】
【数24】

の大きさであり、
【0080】
【数25】

との間の角度は、15°である。同様に、
【0081】
【数26】

との間の角度(θ)が60°であると仮定すれば、第2チャネル入力オーディオChの強度、すなわち、
【0082】
【数27】

の大きさは、|Ch|=|BM|*cosθm/cos(π/12)によって計算可能されるということは当業者に自明である。ただし、ここでは、
【0083】
【数28】

とCh2’との間の角度が15°である場合を例に挙げた。
【0084】
また、アップミックス部514は、サブバンドkで、第1チャネル入力オーディオChと、第2チャネル入力オーディオChとの位相を決定するための情報として、第1チャネル入力オーディオChと、第2チャネル入力オーディオChとの位相差に係わる情報を利用することができる。ダウンミックスされたオーディオ信号TRを符号化するとき、第1チャネル入力オーディオChの位相と同一になるように、第2チャネル入力オーディオChの位相をすでに調節した場合には、アップミックス部514が、第1チャネル入力オーディオChと、第2チャネル入力オーディオChとの位相差に係わる情報だけを利用し、第1チャネル入力オーディオChの位相及び第2チャネル入力オーディオChの位相を計算することができる。
【0085】
一方、前述のサブバンドkで、第1チャネル入力オーディオChと、第2チャネル入力オーディオChとの強度を決定するための情報をベクトルを利用して復号化する方法と、サブバンドkで、第1チャネル入力オーディオCh1と、第2チャネル入力オーディオCh2との位相を決定するための情報を、位相調節を利用して復号化する方法は、それぞれ独立して利用されもし、あるいは組み合わせて共に利用されもする。
【0086】
再び図1を参照するに、レジデュアル信号生成部120で復元されたマルチチャネル・オーディオ信号と、入力マルチチャネル・オーディオ信号との差値であるレジデュアル信号が生成されれば、レジデュアル信号符号化部130は、レジデュアル信号の特性を示す第2付加情報を生成する。第2付加情報は、復号化側でダウンミックスされたオーディオ信号及び第1付加情報を利用して復元されたマルチチャネル・オーディオ信号が、入力オーディオ信号の特性と最大限同一になるように復元されたマルチチャネル・オーディオ信号を補正する一種の向上階層情報に該当する。後述するように、第2付加情報は、復号化側で復元されたマルチチャネル・オーディオ信号を補正するのに利用される。
【0087】
多重化部140は、マルチチャネル符号化部110から出力されるダウンミックスされたオーディオ信号及び第1付加情報と、レジデュアル信号符号化部130で出力される第2付加情報とを多重化し、多重化されたオーディオ・ビットストリームを生成する。
【0088】
以下、レジデュアル信号符号化部130で第2付加情報を生成する過程について具体的に説明する。
【0089】
第2付加情報は、入力マルチチャネル・オーディオ信号の2個の互いに異なるチャネル間の相関度を示すチャネル間相関度パラメータ(ICC)を含む。具体的には、入力マルチチャネルの個数をN個(Nは正の整数)、入力マルチチャネルのうち、i番目(i=1からN−1までの整数)チャネルと、i+1番目チャネルとのチャネル間相関度パラメータをΦi,i+1,kは、サンプル・インデックス、x(k)は、任意のkでサンプリングされたiチャネルの入力オーディオ信号値、dは、所定の整数値を有する遅延値、lは、サンプリング区間の長さとするとき、レジデュアル信号符号化部130は、i番目のチャネルと、i+1番目のチャネルとの相関度パラメータΦi,i+1を次の式(1)のように計算する。
【0090】
【数29】

例えば、入力オーディオ信号が、5.1チャネルのオーディオ信号であり、レフト(L)、サラウンドレフト(Ls)、センター(C)、サブウーファ(Sw)、ライト(R)、サラウンドライト(Rs)の順序で、チャネルインデックスiが1から6までの値を有するならば、レジデュアル信号符号化部130は、Φ1,2、Φ2,3、Φ3,4、Φ4,5、Φ5,6及びΦ1,6のうち少なくとも1つのチャネル間相関度パラメータを計算する。後述するように、かようなチャネル間相関度パラメータ(ICC)は、復号化側で復元された第1マルチチャネル・オーディオ信号、及び第1マルチチャネル・オーディオ信号と所定の位相差を有する第2マルチチャネル・オーディオ信号を結合し、最終復元オーディオ信号を生成するとき、第1マルチチャネル・オーディオ信号及び第2マルチチャネル・オーディオ信号の結合比率である加重値を決定するのに利用される。
【0091】
前述のチャネル間相関度パラメータ(ICC)以外に、レジデュアル信号符号化部130は、入力中央チャネルのオーディオ信号と、復元された中央チャネルオーディオ信号とのエネルギー比率を示す中央チャネル補正パラメータ、及び全チャネルで、入力マルチチャネル・オーディオ信号と、復元されたマルチチャネル・オーディオ信号とのエネルギー比率を示す全チャネル補正パラメータをさらに生成することができる。
【0092】
具体的には、kは、サンプル・インデックス、x(k)は、任意のkでサンプリングされたセンターチャネルの入力オーディオ信号値、x’(k)は、任意のkでサンプリングされたセンターチャネルの復元されたオーディオ信号値、l(lは整数)は、サンプリング区間の長さとするとき、レジデュアル信号符号化部130は、次の式(2)のように、中央チャネル補正パラメータ(κ)を生成する。
【0093】
【数30】

式(2)に記載されたように、中央チャネル補正パラメータ(κ)は、入力中央チャネルオーディオ信号と、復元された中央チャネルオーディオ信号とのエネルギー比率を示すものであり、後述するように、復号化側で復元された中央チャネルのオーディオ信号を補正するのに利用される。このように、別途に中央チャネルのオーディオ信号を補正するための中央チャネル補正パラメータ(κ)を生成する理由は、パラメトリック・オーディオ・コーディング時に、中央チャネルの信号が劣化される傾向があるために、かような中央チャネルの劣化現象を補償するためである。
【0094】
また、入力マルチチャネルの個数をN個(Nは正の整数)、kは、サンプル・インデックス、x(k)は、任意のkでサンプリングされたiチャネルの入力オーディオ信号値、x’(k)は、任意のkでサンプリングされたiチャネルの復元されたオーディオ信号値、l(lは整数)は、サンプリング区間の長さとするとき、レジデュアル信号符号化部130は、次の式(3)のように、全チャネル補正パラメータ(δ)を生成する。
【0095】
【数31】

式(3)に記載されたように、全チャネル補正パラメータ(δ)は、全チャネルでの入力オーディオ信号と、復元された全チャネルオーディオ信号とのエネルギー比率を示すものであり、後述するように、復号化側で復元された全チャネルのオーディオ信号を補正するのに利用される。
【0096】
図6は、本発明の一実施形態によるマルチチャネル・オーディオ信号の符号化方法を示したフローチャートである。図6を参照するに、段階610で、入力マルチチャネル・オーディオ信号に対するパラメトリック符号化を行い、ダウンミックスされたオーディオ信号、及びダウンミックスされたオーディオ信号をマルチチャネル・オーディオ信号に復元するための第1付加情報を生成する。前述のように、マルチチャネル符号化部110は、入力マルチチャネル・オーディオ信号をステレオ信号またはモノ信号にダウンミックスし、ダウンミックスされたオーディオ信号をさらにマルチチャネル・オーディオ信号に復元するための第1付加情報を生成する。第1付加情報は、ダウンミックスされる信号の強度(intensity)を決定するための情報、及びダウンミックスされる信号間の位相差に係わる情報を含んでもよい。
【0097】
段階620で、ダウンミックスされたオーディオ信号及び第1付加情報を利用して復元されたマルチチャネル・オーディオ信号と、入力マルチチャネル・オーディオ信号との差値であるレジデュアル信号を生成する。復元されたマルチチャネル・オーディオ信号を生成する過程は、図5を参照して述べたように、ダウンミックスされたオーディオ信号それぞれをアップミックスし、2個のアップミックスされた出力信号を生成し、さらに出力信号それぞれをアップミックスする過程を反復することによって行われる。
【0098】
段階630で、レジデュアル信号の特性を示す第2付加情報を生成する。第2付加情報は、復号化側で復号化されたマルチチャネル・オーディオ信号を補正するのに利用され、少なくとも入力マルチチャネル・オーディオ信号の2個の互いに異なるチャネル間の相関度を示すチャネル間相関度(ICC)パラメータを含まねばならない。さらに、第2付加情報としては、入力中央チャネルのオーディオ信号と、復元された中央チャネルオーディオ信号とのエネルギー比率を示す中央チャネル補正パラメータ、及び全チャネルでの入力マルチチャネル・オーディオ信号と、復元されたマルチチャネル・オーディオ信号とのエネルギー比率を示す全チャネル補正パラメータがさらに含まれてもよい。
【0099】
段階640で、ダウンミックスされたオーディオ信号、前記第1付加情報及び前記第2付加情報を多重化する。
【0100】
図7は、本発明の一実施形態によるマルチチャネル・オーディオ信号の復号化装置を示したブロック図である。図7を参照するに、本発明の一実施形態によるマルチチャネル・オーディオ信号の復号化装置700は、逆多重化部710、マルチャネル復号化部720、位相変位部730及び結合部740を含む。
【0101】
逆多重化部710は、符号化されたオーディオ・ビットストリームをパージングし、オーディオ・ビットストリームから、ダウンミックスされたオーディオ信号、ダウンミックスされたオーディオ信号をマルチチャネル・オーディオ信号に復元するための第1付加情報、及びレジデュアル信号の特性を示す第2付加情報を抽出する。
【0102】
マルチチャネル復号化部720は、第1付加情報に基づいてダウンミックスされたオーディオ信号から、第1マルチチャネル・オーディオ信号を復元する。前述の図5の復元部510と同一に、マルチチャネル復号化部720は、第1付加情報を利用し、ダウンミックスされたオーディオ信号それぞれから2個のアップミックスされた出力信号を生成し、アップミックスされた出力信号それぞれを、さらにアップミックスする過程を反復することによって、マルチチャネル・オーディオ信号を復元する。このように復元されたマルチチャネル・オーディオ信号を、第1マルチチャネル・オーディオ信号と定義する。
【0103】
位相変位部730は、第1マルチチャネル・オーディオ信号と所定の位相差を有する第2マルチチャネル・オーディオ信号を生成する。すなわち、位相変位部730は、第1マルチチャネル・オーディオ信号のうち、nチャネルのオーディオ信号をtn、第2マルチチャネル・オーディオ信号のうち、nチャネルのオーディオ信号をtn’、所定の位相差をθdとするとき、tn’=tn*exp(i*θd)の関係が成立するように位相変位された第2マルチチャネル・オーディオ信号を生成する。例えば、図8に図示されたv信号及びv信号のように、第1マルチチャネル・オーディオ信号と第2マルチチャネル・オーディオ信号は、90°の位相差を有することが望ましい。
【0104】
このように、第1マルチチャネル・オーディオ信号と所定の位相差を有する第2マルチチャネル・オーディオ信号を生成する理由は、第1マルチチャネル・オーディオ信号と、第2マルチチャネル・オーディオ信号とを結合することによって、マルチチャネル・オーディオ信号を符号化するときに発生した位相損失を補償するためである。前述の本発明の一実施形態によるマルチチャネル・オーディオ信号の符号化装置によれば、マルチチャネル・オーディオ信号をダウンミックスするとき、2個の入力オーディオ信号間をダウンミックスした後、さらにアップミックスを介して2個の入力オーディオ信号を復元しても、2個の入力オーディオ信号間に存在した位相差は、平均化されて損失される。たとえ第1付加情報として、2個の入力オーディオ信号間の位相差に係わる情報を伝送しても、かような第1付加情報を介して復元された信号は、本来のオーディオ信号に存在した位相情報とは差が発生し、かような差は、復号化されたマルチチャネル・オーディオ信号の音質向上に阻害となる。
【0105】
結合部740は、第2付加情報を利用し、第1マルチチャネル・オーディオ信号と、第2マルチチャネル・オーディオ信号とを結合し、最終復元オーディオ信号を生成する。具体的には、結合部740は、各チャネル別に、第1マルチチャネル・オーディオ信号及び第2マルチチャネル・オーディオ信号それぞれに、所定の加重値を乗じた後で加算し、各チャネル別結合オーディオ信号を生成する。例えば、nチャネルの第1マルチチャネル・オーディオ信号tnに乗じられる加重値をα、nチャネルの第2マルチチャネル・オーディオ信号tn’に乗じられる加重値をβとすれば、nチャネルの結合オーディオ信号uは、次の数式u=αt+βt’のように表現されてもよい。
【0106】
結合部740は、第2付加情報に含まれた入力マルチチャネル・オーディオ信号の2個の互いに異なるチャネル間の相関度を示すチャネル間相関度パラメータ(ICC)、及び2個の互いに異なるチャネル間の結合オーディオ信号間の相関度の関係を利用して加重値を計算する。入力マルチチャネルの個数をN個(Nは正の整数)、入力マルチチャネルのうち、i番目(i=1からN−1までの整数)チャネルと、i+1番目のチャネルとのチャネル間相関度パラメータをΦi,i+1、kは、サンプル・インデックス、x(k)は、任意のkでサンプリングされたiチャネルの入力オーディオ信号値、dは、所定の整数値を有する遅延値、lは、サンプリング区間の長さとするとき、次の式(4)を満足する加重値α及びβを計算する。
【0107】
【数32】

式(4)を介して、加重値α及びβが決定されれば、結合部740は、u=αt+βt’を介して計算されるnチャネルの結合オーディオ信号を、nチャネルの最終復元オーディオ信号として決定する。結合部740は、あらゆるマルチチャネルに対して、前述の過程を反復して、最終復元オーディオ信号を生成する。
【0108】
前述のように、チャネル間相関度パラメータ(ICC)を利用して最終復元オーディオ信号が生成された後、結合部740は、さらに第2付加情報に備わった入力中央チャネルのオーディオ信号と、復元された中央チャネルオーディオ信号とのエネルギー比率を示す中央チャネル補正パラメータ、及び全チャネルで、入力マルチチャネル・オーディオ信号と、復元されたマルチチャネル・オーディオ信号とのエネルギー比率を示す全チャネル補正パラメータを利用し、最終復元オーディオ信号を補正することができる。
【0109】
具体的には、結合部740は、全チャネル補正パラメータを利用し、最終復元オーディオ信号の全チャネルのオーディオ信号を補正する。例えば、結合部740は、nチャネルの最終復元オーディオ信号uと全チャネル補正パラメータ(δ)とを乗じ、nチャネルの最終復元オーディオ信号uを補正する。かような過程は、あらゆるチャネルに対して行われる。また、結合部740は、中央チャネルの最終復元オーディオ信号に、全チャネル補正パラメータ(δ)及び中央チャネル補正パラメータ(κ)を乗じることによって、パラメトリック符号化時に劣化されやすい中央チャネルのオーディオ信号を補正することができる。
【0110】
前述のように、本発明の一実施形態によるマルチチャネル・オーディオ信号の復号化装置は、チャネル間相関度を利用し、位相差を有する第1マルチチャネル・オーディオ信号と、第2マルチチャネル・オーディオ信号とを結合する一方、全チャネル補正パラメータ(δ)及び中央チャネル補正パラメータ(κ)を利用し、あらゆるチャネルの復元オーディオ信号及び中央チャネルのオーディオ信号を補正することによって、復元されたマルチチャネル・オーディオ信号の音質を向上させることができる。
【0111】
図9は、本発明の一実施形態によるマルチチャネル・オーディオ信号の復号化方法を示したフローチャートである。図9を参照するに、段階910で、符号化されたオーディオデータからダウンミックスされたオーディオ信号、ダウンミックスされたオーディオ信号をマルチチャネル・オーディオ信号に復元するための第1付加情報、及び符号化時に入力マルチチャネル・オーディオ信号と、符号化された後で復元されたマルチチャネル・オーディオ信号との差値であるレジデュアル信号の特性を示す第2付加情報を抽出する。
【0112】
段階920で、ダウンミックスされたオーディオ信号及び第1付加情報を利用し、第1マルチチャネル・オーディオ信号を復元する。前述のように、第1マルチチャネル・オーディオ信号は、第1付加情報を利用し、ダウンミックスされたオーディオ信号それぞれから2個のアップミックスされた出力信号を生成し、アップミックスされた出力信号それぞれをさらにアップミックスする過程を反復することによって生成される。
【0113】
段階930で、復元された第1マルチチャネル・オーディオ信号と所定の位相差を有する第2マルチチャネル・オーディオ信号を生成する。所定の位相差は、90°であることが望ましい。
【0114】
段階940で、第2付加情報を利用し、第1マルチチャネル・オーディオ信号と、第2マルチチャネル・オーディオ信号とを結合することによって、最終復元オーディオ信号を生成する。具体的には、結合部740は、第2付加情報に含まれた入力マルチチャネル・オーディオ信号の2個の互いに異なるチャネル間の相関度を示すチャネル間相関度パラメータ(ICC)、及び2個の互いに異なるチャネル間の結合オーディオ信号間の相関度の関係を利用し、第1マルチチャネル・オーディオ信号及び第2マルチチャネル・オーディオ信号に乗じられる加重値を計算する。そして、結合部740は、計算された加重値を利用し、第1マルチチャネル・オーディオ信号と、第2マルチチャネル・オーディオ信号との加重和を計算することによって、最終復元オーディオ信号を生成する。付加的には、結合部740は、全チャネル補正パラメータ(δ)及び中央チャネル補正パラメータ(κ)を利用し、あらゆるチャネルの復元オーディオ信号及び中央チャネルのオーディオ信号を補正することによって、復元されたマルチチャネル・オーディオ信号の音質を向上させることができる。
【0115】
一方、前述の本発明の実施形態によるマルチチャネル・オーディオ信号の符号化及び復号化方法は、コンピュータで実行可能であるプログラムに作成可能であり、コンピュータで読み取り可能な記録媒体を利用し、前記プログラムを動作させる汎用デジタルコンピュータで具現されてもよい。前記コンピュータで読み取り可能な記録媒体は、マグネチック記録媒体(例えば、ROM(read-only memory)、フロッピー(登録商標)ディスク、ハードディスクなど)、光学的判読媒体(例えば、CD−ROM、DVD(digital versatile disc)など)のような記録媒体を含む。
【0116】
以上、本発明についてその望ましい実施形態を中心に述べた。本発明が属する技術分野で当業者であるならば、本発明が本発明の本質的な特性から外れない範囲で変形された形態で具現可能であるということを理解することができるであろう。従って、開示された実施形態は、限定的な観点ではなくして、説明的な観点から考慮されねばならない。本発明の範囲は、前述の説明ではなくして、特許請求の範囲に示されており、それと同等な範囲内にあるあらゆる差異点は、本発明に含まれたものであると解釈されねばならない。

【特許請求の範囲】
【請求項1】
マルチチャネル・オーディオ信号の復号化方法において、
符号化されたオーディオデータからダウンミックスされたオーディオ信号、前記ダウンミックスされたオーディオ信号をマルチチャネル・オーディオ信号に復元するための第1付加情報、及び符号化時に入力マルチチャネル・オーディオ信号と、符号化された後で復元されたマルチチャネル・オーディオ信号との差値であるレジデュアル信号の特性を示す第2付加情報を抽出する段階と、
前記ダウンミックスされたオーディオ信号及び前記第1付加情報を利用し、第1マルチチャネル・オーディオ信号を復元する段階と、
前記復元された第1マルチチャネル・オーディオ信号と所定の位相差を有する第2マルチチャネル・オーディオ信号を生成する段階と、
前記第2付加情報を利用し、前記第1マルチチャネル・オーディオ信号と、前記第2マルチチャネル・オーディオ信号とを結合して最終復元オーディオ信号を生成する段階と、を含むことを特徴とするマルチチャネル・オーディオ信号の復号化方法。
【請求項2】
前記第1マルチチャネル・オーディオ信号を復元する段階は、
前記第1付加情報を利用し、前記ダウンミックスされたオーディオ信号それぞれから2個のアップミックスされた出力信号を生成し、前記アップミックスされた出力信号それぞれをさらにアップミックスする過程を反復することによって、前記第1マルチチャネル・オーディオ信号を復元する段階を含むことを特徴とする請求項1に記載のマルチチャネル・オーディオ信号復号化方法。
【請求項3】
前記第1付加情報は、
前記2個のアップミックスされた出力信号のうち、第1信号の強度に対する第1ベクトル及び第2信号の強度に対する第2ベクトルが所定の角度をなすように、ベクトル空間を生成し、前記ベクトル空間で、前記第1ベクトルと前記第2ベクトルとを加算して第3ベクトルを生成したとき、前記ダウンミックスされたオーディオ信号の強度に対応する前記第3ベクトルの大きさに係わる情報、及び前記ベクトル空間で、前記第1ベクトルまたは第2ベクトルのうち一つと、前記第3ベクトルとのの角度に係わる情報を含み、
前記復元する段階は、
前記ダウンミックスされたオーディオ信号の強度に対応する前記第3ベクトルの大きさに係わる情報、及び前記角度に係わる情報を利用し、前記1つのダウンミックスされたオーディオ信号から、前記第1ベクトル及び前記第2ベクトルに対応する前記2個のアップミックスされた出力信号を生成することを特徴とする請求項2に記載のマルチチャネル・オーディオ信号復号化方法。
【請求項4】
前記第1マルチチャネル・オーディオ信号と、前記第2マルチチャネル・オーディオ信号は、90°の位相差を有することを特徴とする請求項1に記載のマルチチャネル・オーディオ信号復号化方法。
【請求項5】
前記第2付加情報は、
前記入力マルチチャネル・オーディオ信号の2個の互いに異なるチャネル間の相関度を示すチャネル間相関度(ICC)を含み、
前記最終復元オーディオ信号を生成する段階は、
各チャネル別に、前記第1マルチチャネル・オーディオ信号及び前記第2マルチチャネル・オーディオ信号それぞれに所定の加重値を乗じた後で加算し、各チャネル別結合オーディオ信号を生成する段階と、
前記チャネル間相関度パラメータ、及び2個の互いに異なるチャネル間の前記結合オーディオ信号間の相関度の関係を利用して前記加重値を計算する段階と、
前記計算された加重値を利用し、前記第1マルチチャネル・オーディオ信号と、前記第2マルチチャネル・オーディオ信号の加重和を計算し、前記最終復元オーディオ信号を生成する段階と、を含むことを特徴とする請求項1に記載のマルチチャネル・オーディオ信号復号化方法。
【請求項6】
前記入力マルチチャネルの個数をN個(Nは正の整数)、前記入力マルチチャネルのうち、i番目(i=1ついてN−1までの整数)チャネルと、i+1番目のチャネルとのチャネル間相関度パラメータをΦi,i+1、kは、サンプル・インデックス、x(k)は、任意のkでサンプリングされたiチャネルの入力オーディオ信号値、dは、所定の整数値を有する遅延値、lは、サンプリング区間の長さ、tはnチャネルでの前記第1マルチチャネル・オーディオ信号、t’は、nチャネルでの前記第2マルチチャネル・オーディオ信号、αは、前記第1マルチチャネル・オーディオ信号に乗じられる加重値、βは、前記第2マルチチャネル・オーディオ信号に乗じられる加重値とするとき、
前記nチャネルでの前記結合オーディオ信号uは、u=αt+βt’であり、前記加重値α及びβは、次の数式:
【数32】

を利用して決定されることを特徴とする請求項5に記載のマルチチャネル・オーディオ信号の復号化方法。
【請求項7】
前記第2付加情報は、
前記入力中央チャネルのオーディオ信号と、復元された中央チャネルオーディオ信号とのエネルギー比率を示す中央チャネル補正パラメータ、及び全チャネルで、前記入力マルチチャネル・オーディオ信号と、前記復元されたマルチチャネル・オーディオ信号とのネルギー比率を示す全チャネル補正パラメータをさらに含み、
前記最終復元オーディオ信号を生成する段階は、
前記全チャネル補正パラメータを利用し、前記最終復元オーディオ信号の全チャネルの値を補正する段階と、
前記中央チャネル補正パラメータを利用し、前記全チャネル補正された最終復元オーディオ信号のうち、中央チャネルの信号をさらに補正する段階と、をさらに含むことを特徴とする請求項5に記載のマルチチャネル・オーディオ信号復号化方法。
【請求項8】
kは、サンプル・インデックス、x(k)は、任意のkでサンプリングされたセンターチャネルの入力オーディオ信号値、x’(k)は、任意のkでサンプリングされたセンターチャネルの復元されたオーディオ信号値、l(lは整数)は、サンプリング区間の長さとするとき、
前記中央チャネル補正パラメータ(κ)は、次の数式:
【数33】

を介して定義される値を有することを特徴とする請求項7に記載のマルチチャネル・オーディオ信号復号化方法。
【請求項9】
前記入力マルチチャネルの個数をN個(Nは正の整数)、kは、サンプル・インデックス、x(k)は、任意のkでサンプリングされたiチャネルの入力オーディオ信号値、x’(k)は、任意のkでサンプリングされたiチャネルの復元されたオーディオ信号値、l(lは整数)は、サンプリング区間の長さとするとき、
前記全チャネル補正パラメータ(δ)は、次の数式:
【数34】

を介して計算された値を有することを特徴とする請求項7に記載のマルチチャネル・オーディオ信号復号化方法。
【請求項10】
マルチチャネル・オーディオ信号の復号化装置において、
符号化されたオーディオデータからダウンミックスされたオーディオ信号、前記ダウンミックスされたオーディオ信号をマルチチャネル・オーディオ信号に復元するための第1付加情報、及び符号化時に入力マルチチャネル・オーディオ信号と、符号化された後で復元されたマルチチャネル・オーディオ信号との差値であるレジデュアル信号の特性を示す第2付加情報を抽出する逆多重化部と、
前記ダウンミックスされたオーディオ信号及び前記第1付加情報を利用し、第1マルチチャネル・オーディオ信号を復元するマルチチャネル復号化部と、
前記復元された第1マルチチャネル・オーディオ信号と所定の位相差を有する第2マルチチャネル・オーディオ信号を生成する位相変移部と、
前記第2付加情報を利用し、前記第1マルチチャネル・オーディオ信号と、前記第2マルチチャネル・オーディオ信号とを結合して最終復元オーディオ信号を生成する結合部と、を含むことを特徴とするマルチチャネル・オーディオ信号の復号化装置。
【請求項11】
前記マルチチャネル復号化部は、
前記第1付加情報を利用し、前記ダウンミックスされたオーディオ信号それぞれから2個のアップミックスされた出力信号を生成し、前記アップミックスされた出力信号それぞれをまたアップミックスする過程を反復することによって、前記第1マルチチャネル・オーディオ信号を復元することを特徴とする請求項10に記載のマルチチャネル・オーディオ信号復号化装置。
【請求項12】
前記第1付加情報は、
前記2個のアップミックスされた出力信号のうち第1信号の強度に係わる第1ベクトル、及び第2信号の強度に係わる第2ベクトルが、所定の角度をなすようにベクトル空間を生成し、前記ベクトル空間で、前記第1ベクトルと前記第2ベクトルとを加算して第3ベクトルを生成したとき、前記ダウンミックスされたオーディオ信号の強度に対応する前記第3ベクトルの大きさに係わる情報、及び前記ベクトル空間で、前記第1ベクトルまたは第2ベクトルのうち一つと、前記第3ベクトルとの間の角度に係わる情報を含み、
前記マルチチャネル復号化部は、
前記ダウンミックスされたオーディオ信号の強度に対応する前記第3ベクトルの大きさに係わる情報、及び前記角度に係わる情報を利用し、前記1つのダウンミックスされたオーディオ信号から、前記第1ベクトル及び前記第2ベクトルに対応する前記2個のアップミックスされた出力信号を生成することを特徴とする請求項11に記載のマルチチャネル・オーディオ信号復号化装置。
【請求項13】
前記第2付加情報は、
前記入力マルチチャネル・オーディオ信号の2個の互いに異なるチャネル間の相関度を示すチャネル間相関度(ICC)パラメータを含み、
前記結合部は、
各チャネル別に、前記第1マルチチャネル・オーディオ信号及び前記第2マルチチャネル・オーディオ信号それぞれに所定の加重値を乗じた後で加算し、各チャネル別結合オーディオ信号を生成し、前記チャネル間相関度パラメータ、及び2個の互いに異なるチャネル間の前記結合オーディオ信号間の相関度の関係を利用して前記加重値を計算して、前記計算された加重値を利用し、前記第1マルチチャネル・オーディオ信号と、前記第2マルチチャネル・オーディオ信号との加重和を計算し、前記最終復元オーディオ信号を生成することを特徴とする請求項11に記載のマルチチャネル・オーディオ信号復号化装置。
【請求項14】
マルチチャネル・オーディオ信号の符号化方法において、
入力マルチチャネル・オーディオ信号に対するパラメトリック符号化を行い、ダウンミックスされたオーディオ信号及び前記ダウンミックスされたオーディオ信号を、前記マルチチャネル・オーディオ信号に復元するための第1付加情報を生成する段階と、
前記ダウンミックスされたオーディオ信号及び前記第1付加情報を利用して復元されたマルチチャネル・オーディオ信号と、前記入力マルチチャネル・オーディオ信号との差値であるレジデュアル信号を生成する段階と、
前記レジデュアル信号の特性を示す第2付加情報を生成する段階と、
前記ダウンミックスされたオーディオ信号、前記第1付加情報及び前記第2付加情報を多重化する段階と、を含むことを特徴とするマルチチャネル・オーディオ信号符号化方法。
【請求項15】
マルチチャネル・オーディオ信号の符号化装置において、
入力マルチチャネル・オーディオ信号に対する符号化を行い、ダウンミックスされたオーディオ信号及び前記ダウンミックスされたオーディオ信号を、前記マルチチャネル・オーディオ信号に復元するための第1付加情報を生成するマルチチャネル符号化部と、
前記ダウンミックスされたオーディオ信号及び前記第1付加情報を利用して復元されたマルチチャネル・オーディオ信号と、前記入力マルチチャネル・オーディオ信号との差値であるレジデュアル信号を生成するレジデュアル信号生成部と、
前記レジデュアル信号の特性を示す第2付加情報を生成するレジデュアル信号符号化部と、
前記ダウンミックスされたオーディオ信号、前記第1付加情報及び前記第2付加情報を多重化する多重化部と、を含むことを特徴とするマルチチャネル・オーディオ信号符号化装置。

【図1】
image rotate

【図2】
image rotate

【図3(a)】
image rotate

【図3(b)】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公表番号】特表2013−502608(P2013−502608A)
【公表日】平成25年1月24日(2013.1.24)
【国際特許分類】
【出願番号】特願2012−525482(P2012−525482)
【出願日】平成22年8月18日(2010.8.18)
【国際出願番号】PCT/KR2010/005449
【国際公開番号】WO2011/021845
【国際公開日】平成23年2月24日(2011.2.24)
【出願人】(503447036)サムスン エレクトロニクス カンパニー リミテッド (2,221)