説明

信号処理方法及び装置、エンコーディング及びデコーディング方法並びにそのための装置

【課題】転送効率が高いデータ圧縮・復元装置を提供する。
【解決手段】データコーディング及びエントロピコーディングは相互連関性をもって行われ、グルーピングは、コーディング効率を増大させるのに用いられる。インデックス情報とデータを獲得する段階と、インデックス情報をエントロピデコーディングする段階とを含む。エントロピデコーディングされたインデックス情報に該当するエントロピテーブルを識別する段階と、エントロピテーブルを用いてデータをエントロピデコーディングする段階とを含む。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、信号処理方法及び装置に関するものである。詳細には、信号の圧縮及び信号の復元のためのコーディング方法並びにそのための装置に関する。
【背景技術】
【0002】
従来より信号圧縮と復元に関する多くの技術が紹介されてきており、これらの技術の適用対象は、一般的に、オーディオとビデオを含めた様々なデータとなる。また、信号圧縮や復元技術は、圧縮率をより高めながらも、画質や音質をより良くする方向に発展して行っている。なお、多様な通信環境への適応のために転送効率を上げようと大いに努力してきた。
【発明の概要】
【発明が解決しようとする課題】
【0003】
しかしながら、転送効率を更に效果的に高めることができる余地がある。したがって、信号に対する新しい処理方案の開発によって、複雑な通信環境下でも信号の転送効率を最大にできる具体的な研究が望まれている。
【0004】
本発明は上記の問題点を解決するためのもので、その目的は、信号の転送効率を最適化する信号処理方法及び装置を提供することにある。
【0005】
また、本発明の他の目的は、効率的なデータコーディング方法とそのための装置を提供することにある。
【0006】
本発明のさらに他の目的は、オーディオの復元に用いられる制御データの転送効率を極大化させることができるエンコーディング及びデコーディング方法とそのための装置を提供することにある。
【0007】
本発明のさらに他の目的は、前記エンコーディングされたデータを含む媒体を提供することにある。
【0008】
本発明のさらに他の目的は、前記エンコーディングされたデータを效率的に転送するためのデータ構造を提供することにある。
【0009】
本発明のさらに他の目的は、前記デコーディング装置を含むシステムを提供することにある。
【課題を解決するための手段】
【0010】
上記の目的を達成するための、本発明の信号処理方法は、インデックス情報とデータを獲得する段階と、前記インデックス情報をエントロピデコーディングする段階と、前記エントロピデコーディングされたインデックス情報に該当するエントロピテーブルを識別する段階と、を含む。また、前記エントロピテーブルを用いて前記データをエントロピデコーディングする段階を含む。
【0011】
前記インデックス情報は、確率的な利用頻度特性を持つインデックスに関する情報であり、インデックス専用エントロピテーブルを用いて前記インデックス情報をエントロピデコーディングする。
【0012】
上記の目的を達成するための、本発明の信号処理装置は、インデックス情報とデータを獲得する情報及びデータ獲得部と、前記インデックス情報をエントロピデコーディングするインデックスデコーディング部と、前記エントロピデコーディングされたインデックス情報に該当するエントロピテーブルを識別するテーブル識別部と、を含む。また、前記エントロピテーブルを用いてデータをエントロピデコーディングするデータデコーディング部をさらに含む。
【0013】
上記の目的を達成するための、本発明の他の信号処理方法は、エントロピテーブルを用いてデータをエントロピエンコーディングする段階と、前記エントロピテーブルを識別するインデックス情報を生成する段階と、前記インデックス情報をエントロピエンコーディングする段階と、を含む。前記エントロピエンコーディングされたインデックス情報を送る段階をさらに含む。
【0014】
上記の目的を達成するための、本発明の他の信号処理装置は、エントロピテーブルを用いてデータをエントロピエンコーディングするデータエンコーディング部と、前記エントロピテーブルを識別するインデックス情報を生成する情報生成部と、前記インデックス情報をエントロピエンコーディングするインデックスエンコーディング部と、を含む。また、前記エントロピエンコーディングされたインデックス情報を送る情報出力部をさらに含む。
【発明の効果】
【0015】
本発明による信号処理方法及び装置によれば、効率的なデータコーディング及びエントロピコーディングが可能になり、その結果、転送効率の高いデータ圧縮復元が可能になる。
【図面の簡単な説明】
【0016】
【図1】本発明によるシステムを示す図である。
【図2】本発明によるシステムを示す図である。
【図3】本発明のPBCコーディング方式を説明するための図である。
【図4】本発明のPBCコーディング方式を説明するための図である。
【図5】本発明によるDIFFコーディングの種類を説明するための図である。
【図6】DIFFコーディング方式が適用される例を示す図である。
【図7】DIFFコーディング方式が適用される例を示す図である。
【図8】DIFFコーディング方式が適用される例を示す図である。
【図9】本発明による少なくとも3つのコーディング方式のうちいずれか一つを選択する関係を示す図である。
【図10】従来方式による少なくとも3つのコーディング方式のうちいずれか一つを選択する関係を示す図である。
【図11】本発明による前記データコーディング方式選択を示すフローチャートである。
【図12】本発明による前記データコーディング方式選択を示すフローチャートである。
【図13】本発明による内部グルーピングを説明するための図である。
【図14】本発明による外部グルーピングを説明するための図である。
【図15】本発明の混合グルーピングを説明するための図である。
【図16】本発明の混合グルーピングの他の実施例を説明するための図である。
【図17】本発明の混合グルーピングの他の実施例を説明するための図である。
【図18】本発明による1D及び2Dエントロピテーブルを例示する図である。
【図19】本発明による2Dエントロピコーディングの2つの方法を例示する図である。
【図20】本発明によるPBCコーディング結果に対するエントロピコーディング方法を示す図である。
【図21】本発明によるDIFFコーディング結果に対するエントロピコーディング方法を示す図である。
【図22】本発明によるエントロピテーブル選択方法を説明するための図である。
【図23】本発明が適用されるデータ構造を階層的に示す図である。
【図24】本発明の一実施例によるオーディオ圧縮及び復元のための装置構成を示す図である。
【図25】本発明の一実施例による空間情報エンコーディング部分の詳細構成を示すブロック図である。
【図26】本発明の一実施例による空間情報デコーディング部分の詳細構成を示すブロック図である。
【発明を実施するための形態】
【0017】
以下、添付図面を参照しつつ、本発明の実施例の構成とその作用について説明する。ただし、図面に図示され且つそれに基づいて説明される本発明の構成と作用は、少なくとも一つの実施例として説明されるもので、これによって上記した本発明の技術的思想とその核心構成及び作用が制限されることはない。
【0018】
なお、本発明で使われる用語は、可能なかぎり現在広く使われている一般的な用語を選択したが、特定の場合は、出願人が任意に選定した用語にて説明する。その場合には、該当の部分の詳細説明においてその意味を明確に記載しておくので、本発明の説明で使われた用語の名称だけで単純解釈されてはいけなく、その該当の用語の意味まで把握して本発明を解釈しなければならないということは明らかである。
【0019】
本発明において「コーディング(coding)」という用語は、エンコーディング過程及びデコーディング過程を含む。ただし、特定のコーディング過程は、エンコーディング過程またはデコーディング過程のいずれか一過程にのみ適用できることは自明であり、これは、該当の説明部分で区分して説明される。この「コーディング」は、「コーデック(codec)」とも呼ばれる。
【0020】
[本発明の全体概要]
本発明では、信号をコーディングする段階が、データコーディング(data coding)とエントロピコーディング(entropy coding)とに区分して説明される。ただし、このデータコーディングとエントロピコーディングは相互連関性を持ち、これについては詳細に後述する。また、本発明においては、効率的なデータコーディング及びエントロピコーディングを行うためにデータをグルーピング(grouping)する様々な方法について説明される。後述するグルーピング方法は、特定データコーディング及びエントロピコーディング方式にかかわらず独立的に有効な技術的思想を持つ。また、本発明によるデータコーディングとエントロピコーディングを適用した具体的な例として、空間情報を持つオーディオコーディング(例えば、“ISO/IEC 23003、MPEG Surround”)方法を取り上げて説明する。
【0021】
図1及び図2は、本発明によるシステムを示す図である。図1はエンコーディング装置1を、図2はデコーディング装置2をそれぞれ示す。
【0022】
エンコーディング装置1は、データグルーピング部10、第1データエンコーディング部20、第2データエンコーディング部31、第3データエンコーディング部32、エントロピエンコーディング部40及びビットストリーム多重化部50のうち、少なくとも一つを含んで構成される。
【0023】
なお、第2データエンコーディング部31及び第3データエンコーディング部32は、一つのデータエンコーディング部30として統合しても良い。例えば、第2データエンコーディング部31及び第3データエンコーディング部32によってエンコーディングされたデータは、エントロピエンコーディング部40によって可変長符号化が行われるという面で似ている。以下、上記の各構成要素について詳細に説明する。
【0024】
データグルーピング部10は、入力信号を一定単位にまとめ、データ処理の効率を図る。例えば、データグルーピング部10は、データの種類によってデータを区分し、区分されたデータは、データエンコーディング部20,31,32のいずれか一つでエンコーディングされる。また、データグルーピング部10は、データ処理の効率のためにデータの一部を少なくとも一つのグループに区分し、区分された各グループ別データは、データエンコーディング部20,31,32のいずれか一つでエンコーディングされる。このデータグルーピング部10の動作を含む本発明のグルーピング方法については、図13〜図17を参照しつつより詳細に後述する。
【0025】
データエンコーディング部20,31,32はそれぞれ、入力データを該当のエンコーディング方式によって符号化する。このため、各データエンコーディング部20,31,32は少なくともPCM(パルス符号変調)方式と差分符号化方式を含む。具体的には、例えば、第1データエンコーディング部20はPCM方式を、第2データエンコーディング部31はパイロット(pilot)基準値を用いる第1差分符号化方式を適用することができ、第3データエンコーディング部32は隣接データとの差分を用いる第2差分符号化方式を適用することができる。
【0026】
以下、説明の便宜上、第1差分符号化方式を「パイロットコーディング(PBC)」と称し、第2差分符号化方式を「差分符号化(DIFF)」と称する。このデータエンコーディング部20,31,32の動作を、図3〜図8を参照しつつ詳細に後述する。
【0027】
また、エントロピエンコーディング部40は、エントロピテーブル41を参照してデータの統計的特性によって可変長符号化を行う。このエントロピエンコーディング部40の動作を、図18〜図22を参照して詳細に後述する。
【0028】
また、ビットストリーム多重化部50は、コーディングされたデータを転送規格に合わせて配列及び/または変換し、ビットストリーム形態として転送する。ただし、本発明を用いた特定システムにおいてビットストリーム多重化部50が使われない場合には、ビットストリーム多重化部50無しでシステムを構成できることは自明である。
【0029】
デコーディング装置2は、前述したエンコーディング装置1に対応して構成される。例えば、ビットストリーム逆多重化部60は、入力ビットストリームを受信し、受信したビットストリーム内に含まれた様々な情報を、既に定められたフォーマットによって解析して分類する。エントロピデコーディング部70は、エントロピテーブル71を用いてエントロピエンコーディング以前のデータに復元する。ここで、エントロピテーブル71は、エンコーディング装置1内のエントロピテーブル41と同じテーブルで構成されることは自明である。
【0030】
また、第1データデコーディング部80、第2データデコーディング部91及び第3データデコーディング部92は、前述の第1データエンコーディング部20、第2データエンコーディング部31及び第3データエンコーディング部32にそれぞれ対応するデコーディング過程を行う。したがって、第2データデコーディング部91及び第3データデコーディング部92が差分復号化を行う場合では、重複するデコーディング過程を統合して一つのデコーディング過程内で共に処理しても良い。また、データ復元部95は、データデコーディング80,91,92によってデコーディングされたデータを、データエンコーディングされる以前の元のデータに復元する。ただし、使用例によっては、元のデータを変換または修正した他のデータに復元することも可能である。
【0031】
本発明は、データコーディングを効率的に行うために少なくとも2つのコーディング方式を混用し、コーディング方式相互間の関連性を用いて効率的なコーディング方式を提供することを目的とする。また、本発明は、データコーディングを效率的に行うために様々な方式のデータグルーピング方式を提供することを目的とする。また、本発明は、上述した本発明の特徴を含むデータ構造を提供することを目的とする。
【0032】
なお、本発明の技術的思想を様々なシステムに適用するに当たり、前述した図1及び図2に示された構成要素の他にも、様々な付加的構成が必要となることは自明である。例えば、データの量子化を行ったり、制御部による上記過程の制御が必要な場合がありうる。
【0033】
[データコーディング]
以下、本発明のデータコーディング方式として適用可能なPCM(パルス符号化変調)方式、PBC(パイロットコーディング)及びDIFF(差分符号化)方式について詳細に説明する。これらのデータコーディング方式の効率的選択及び相互関連性についても続いて説明される。
【0034】
1.PCM(パルス符号化変調)
PCMは、アナログ信号をデジタル信号に変換するコーディング方式であり、アナログ信号を定められた一定の間隔で標本化し、その結果を量子化する。PCMは、コーディング効率の面では不利であるが、後述するPBCコーディング方式やDIFFコーディング方式に適合しないデータには有効に利用可能である。本発明において、PCMは、データコーディング時に、後述するPBC方式及びDIFF方式と共に用いられる。これについては、図9〜図12を参照しつつ後述する。
【0035】
2.PBC(パイロットコーディング)
2−1.PBC概念
PBCは、区分されたデータグループ内で特定基準を定め、この定められた基準とコーディング対象となるデータ間の関係を用いるコーディング方式である。したがって、PBCを適用するために基準となる値を、「基準値」、「パイロット」、「パイロット基準値」または「パイロット値」に定義可能であるが、以下では、説明の便宜のために「パイロット基準値」とする。また、パイロット基準値とグループ内データ間の差の値を「差分値」または「パイロット差分値」と定義することができる。
【0036】
また、PBCが適用される単位であるデータグループは、上記のデータグルーピング部10によって特定のグルーピング方式が適用された最終のグループのことを意味する。前述したように、データグルーピングは、様々な方法で可能であり、これについての詳細説明は後述する。本発明では、以下、上記のようにグルーピングされて特定の意味を持つデータを「パラメータ」と定義して説明するが、これは説明の便宜のためのもので、他の用語に取り替えても良いことは自明である。
【0037】
すなわち、本発明によるPBC過程は、少なくとも次の2段階を含んで構成される。まず、第一に、複数個のパラメータに対応するパイロット基準値を選定する。パイロット基準値は、PBCの対象になるパラメータを参照して定める。例えば、パイロット基準値は、PBCの対象になるパラメータの平均値、対象になるパラメータの平均の近似値、対象になるパラメータのうち、中間水準に該当する中間値、及び、対象になるパラメータのうち、最も頻繁に使われた値から選定された一つの値に設定されることができる。また、パイロット基準値は、既に定められたデフォルト値に選定されても良い。また、パイロット基準値は、既に定められたテーブル内で選択によって決定することも可能である。
【0038】
また、本発明は、前述した様々なパイロット基準値選定方法のうち少なくとも2つの方法によって選ばれたパイロット基準値を、一時的なパイロット基準値に設定し、それぞれの場合に対してコーディング効率を計算した後、最もコーディング効率の良い場合に該当する臨時パイロット基準値を、最終パイロット基準値に選定しても良い。
【0039】
上記の平均の近似値は、平均がPの時、Ceil[P]またはFloor[P]である。ここで、Ceil[x]は、xを越えない最大整数であり、Floor[x]は、xを越える最小整数である。しかし、PBCの対象になるパラメータを参照せず、任意の固定されたデフォルト値に選定しても良い。また、他の例として、前述したように、パイロットとして選定可能な様々な値を任意に複数個選定した後、それらの各値に対してコーディングを行い、以降、最も良いコーディング効率を示す値を、最適のパイロットと選定することができる。第二に、当該選定されたパイロットとグループ内のパラメータとの差分値を求める。例えば、PBCの対象になるパラメータ値からパイロット基準値を減算して差分値を算出する。これを、図3及び図4を参照しつつ説明すると、下記の通りである。
【0040】
図3及び図4は、本発明のPBCコーディング方式を説明するための図である。例えば、一つのグループ内に複数のパラメータ(例えば、10個)が存在し、それぞれのパラメータは、次のようなパラメータ値x[n]={11,12,9,12,10,8,12,9,10,9}を持つと仮定する。このグループ内のパラメータをエンコーディングするためにPBC方式が選択されたとすれば、まず、パイロット基準値を選定しなければならない。図4によれば、本例のパイロット基準値は、「10」に選定されたことがわかる。パイロット基準値は、前述したように、パイロット基準値を選定する様々な方法によって選定可能である。以下、PBCによる差分値は、下記の数式1で算出される。
【0041】
[式1]
d[n]=x[n]-P、n=0,1,…,9
【0042】
ここで、Pはパイロット基準値(=10)を表し、x[n]は、データコーディングの対象パラメータを表す。上記の数学式1によるPBCの結果は、d[n]={1,2,−1,2,0,−2,2,−1,0,−1}となる。すなわち、PBCコーディングの結果は、選定されたパイロット基準値及び計算されたd[n]を有し、これらの値は、後述するエントロピエンコーディングの対象となる。なお、PBCは、対象パラメータ値の偏差が全体的に小さい時により効果的となる。
【0043】
2−2.PBCオブジェクト
PBCコーディングの対象はいずれか一つに特定されない。様々な信号のデジタルデータをPBCでコーディングすることが可能であり、例えば、後述するオーディオコーディングでも適用することが可能である。本発明では、特に、オーディオデータと一緒に処理される付加的な制御データをPBCコーディングの対象として詳細に説明する。
【0044】
この制御データは、オーディオのダウンミックスされた信号に付加的に転送され、その制御データは、オーディオを復元するのに使われる。この制御データを、以下では「空間情報又は空間パラメータ」と定義する。この空間情報は、チャンネルレベル差(以下、「CLD」という。)、チャンネル間コヒーレンス(以下、「ICC」という。)及びチャンネル予測係数(以下、「CPC」という。)などの様々な空間パラメータを含む。
【0045】
さらに具体的には、CLDは、相互に異なる2チャンネル間のエネルギー差を表すパラメータである。例えば、CLDは、−15から+15までの範囲の値を持つ。また、ICCは、相互に異なる2チャンネル間の相関関係を表すパラメータである。例えば、ICCは、0から7までの範囲の値を持つ。また、CPCは、2チャンネルから3チャンネルを生成する時に用いられる予測係数を表すパラメータである。例えば、CPCは、−20から30までの範囲の値を持つ。
【0046】
また、PBCコーディングの対象として、信号の利得を調節するために使われる利得値、例えば、「ADG(Arbitary Downmix gain)」も含まれることができる。また、ダウンミックスされるオーディオ信号の任意のチャンネル変換ボックスに適用されるATD(Arbitary Tree Data)もPBCコーディングの対象になる。特に、ADGは、前述したCLD、ICC、CPCとは区分されるパラメータである。すなわち、ADGは、オーディオ信号のチャンネルから抽出されるCLD、ICC、CPCのような空間情報とは違い、オーディオの利得を調節するためのパラメータに該当する。ただし、使用例において、ADG及びATDを、オーディオコーディングの効率を上げるために前述したCLDと同様に処理することができる。
【0047】
PBCコーディングの他の対象として、部分パラメータを考慮することができる。本発明でいう「部分パラメータ」とは、パラメータの一部のことを意味する。例えば、特定パラメータがn個のビットで表現されると仮定する時、n個のビットを少なくとも2部分に区分し、これらをそれぞれ第1部分パラメータ及び第2部分パラメータと定義することができる。この場合、PBCコーディングを行おうとする場合には、例えば、第1部分パラメータ値とパイロット基準値との差分値を求めることが可能である。ただし、差分値算出において除外された第2部分パラメータを、別の値として転送しなければならない。
【0048】
より具体的に説明すると、例えば、パラメータ値を表すnビットであれば、そのうち、最下位1ビット(LSB)を第2部分パラメータと定義し、残りの上位(n-1)ビットで構成されたパラメータ値を、第1部分パラメータと定義することができる。この場合、PBCは、第1部分パラメータのみを対象にして行うことができる。これは、上位(n−1)ビットからなる第1部分パラメータ値間に偏差が少ないためにコーディング効率が良くなるからである。差分値算出時に除外された第2部分パラメータは別途転送し、デコーディング部での最終パラメータの復元時には、別途転送された第2部分パラメータを考慮すればいい。ただし、第2部分パラメータを別途転送せず、既に定められた方式によって第2部分パラメータを獲得しても良い。
【0049】
このような部分パラメータの特性を用いたPBCコーディングは、対象パラメータの特性によって限定的に利用される。例えば、前述したように、第1部分パラメータ値間に偏差が少なくなければならない。もし偏差が大きいと、部分パラメータを利用する必要がなく、むしろコーディング効率をより悪くする。実験的な結果によれば、前述した空間情報のうち、CPCパラメータが部分パラメータPBC方式のアプリケーションに適している。ただし、CPCパラメータであるとしても、粗量子化方式を適用する場合には好ましくない。これは、粗量子化方式の場合には、第1部分パラメータ値間に偏差が増加するためである。部分パラメータを用いたデータコーディングは、PBCの他に、後述するDIFF方式にも同様に適用可能である。
【0050】
次に、上記のようにCPCパラメータに部分パラメータ概念を適用する場合、これを復元する信号処理方法及び装置について説明する。例えば、部分パラメータを用いた本発明の信号処理方法は、第1部分パラメータに対応する基準値と該基準値に対応する差分値を用いて、第1部分パラメータを獲得する段階と、この第1部分パラメータ及び第2部分パラメータを用いて、パラメータを決定する段階と、を含む。また、基準値は、パイロット基準値及び差分基準値のいずれか一つである。また、第1部分パラメータは、パラメータの一部のビットであり、第2部分パラメータは、パラメータの残りのビットである。第2部分パラメータは、パラメータの最下位ビットとなる。
【0051】
また、この信号処理方法は、当該決定されたパラメータを用いてオーディオ信号を復元する段階をさらに含む。このパラメータは、CLD、ICC、CPC及びADGのうち少なくとも一つを含む空間情報である。また、パラメータがCPCであり、このパラメータの量子化スケールが粗くない時、第2部分パラメータが獲得される。また、第1部分パラメータを2倍とし、これを第2部分パラメータに加えて最終パラメータを決定する。
【0052】
また、部分パラメータを用いた本発明の信号処理装置は、第1部分パラメータに対応する基準値とこの基準値に対応する差分値を用いて、第1部分パラメータを獲得する第1パラメータ獲得部と、この第1部分パラメータ及び第2部分パラメータを用いて、パラメータを決定するパラメータ決定部と、を含む。また、この信号処理装置は、第2部分パラメータを受信して獲得する第2パラメータ獲得部をさらに備える。第1パラメータ獲得部、パラメータ決定部及び第2パラメータ獲得部は、前述したデータデコーディング部91または92内に含まれる。
【0053】
また、部分パラメータを用いた本発明の信号処理方法は、パラメータを第1部分パラメータと第2部分パラメータとに分割する段階と、第1部分パラメータに対応する基準値とこの第1部分パラメータを用いて差分値を生成する段階と、を含む。また、この信号処理方法は、当該差分値と第2部分パラメータを転送する段階をさらに含む。
【0054】
また、部分パラメータを用いた本発明の信号処理装置は、パラメータを第1部分パラメータと第2部分パラメータとに分割するパラメータ分割部と、第1部分パラメータに対応する基準値と第1部分パラメータを用いて差分値を生成する値生成部と、を備える。また、この信号処理装置は、当該差分値と第2部分パラメータを転送するパラメータ出力部をさらに備える。パラメータ分割部、差分値生成部は、前述したデータエンコーディング部31または32内に含まれる。
【0055】
2−3.PBC条件
本発明のPBCコーディングは、別のパイロット基準値を選定し、これをビットストリーム上に含めねばならないという面から、後述するDIFFコーディング方式に比べて転送効率が低くなる可能性がある。したがって、本発明では、PBCコーディングを行うための最小条件を提供しようとする。実験的に、グループ内のデータコーディングの対象になるデータ個数が少なくとも3つである場合に、PBCコーディングを適用することが可能である。これは、データコーディングの効率性を考慮した結果であり、もしグループ内に2個のデータのみが存在する場合では、PBCよりはDIFFコーディングやPCMコーディングがより効率的であるというのを意味する。
【0056】
また、3つ以上のデータに対するPBCコーディングが可能であるが、データの個数が少なくとも5個である場合には、PBCを適用することが好ましい。換言すると、PBCコーディングが最も效率的に適用可能な場合は、グループ内のデータコーディングの対象になるデータの個数が少なくとも5個で、5個以上のデータ値間の偏差が少ない場合に該当する。このようなPBCコーディングを行うのに適合した最小限のデータの個数は、システム及びコーディング環境によって決定される。
【0057】
また、データコーディングの対象になるデータは、データバンド別に与えられる。これは、後述するグルーピング過程を通じても説明される。したがって、例えば、後述するMPEGオーディオサラウンドコーディングでは、PBCコーディングの適用のためにはデータバンドが少なくとも5個になることを提案している。
【0058】
以下、上記PBCを行う条件を用いた本発明の信号処理方法及び装置を説明する。
【0059】
本発明の信号処理方法は、パイロット基準値に対応するデータの個数を獲得し、データバンドの個数があらかじめ設定された条件を満たす場合、当該パイロット基準値とパイロット基準値に対応するパイロット差分値を獲得する。その後、得られたパイロット基準値及びパイロット差分値を用いて、データを獲得する。特に、データの含まれたデータバンドの個数を用いて、当該データの個数を獲得する。
【0060】
また、本発明の他の信号処理方法は、データの個数を用いて、複数個のデータコーディング方式のうち一つを決定し、決定されたデータコーディング方式によってデータをデコーディングする。前記複数個のデータコーディング方式は、少なくともパイロットコーディング方式を含む。また、データの個数があらかじめ設定された条件を満たす場合、データコーディング方式がパイロットコーディング方式と決定される。
【0061】
また、データをデコーディングする過程は、複数個のデータに対応するパイロット基準値とこのパイロット基準値に対応するパイロット差分値を獲得し、獲得したパイロット基準値及びパイロット差分値を用いて、当該データを獲得する過程を含む。
【0062】
また、この信号処理方法において、データはパラメータであり、このパラメータを用いてオーディオ信号を復元する。また、この信号処理方法は、パラメータの個数に対応する識別情報を受信し、この受信した識別情報を用いてパラメータの個数を生成する。また、データの個数を考慮しながら、複数個のデータコーディング方式を表す識別情報を階層的に抽出する。
【0063】
また、前記識別情報を抽出する過程は、第1データコーディング方式を表示する第1識別情報を抽出し、前記第1識別情報及び前記データの個数を用いて、第2データコーディング方式を表示する第2識別情報を抽出する。ここで、第1識別情報は、DIFFコーディング方式か否かを表し、第2識別情報は、パイロットコーディング方式か、PCMグルーピング方式かを表す。
【0064】
また、本発明のさらに他の信号処理方法は、複数個のデータの個数があらかじめ設定された条件を満たす場合、該複数個のデータに対応するパイロット基準値と当該データを用いてパイロット差分値を生成し、以降、生成されたパイロット差分値を転送する。特に、この信号処理方法は、パイロット基準値を転送する。
【0065】
また、本発明のさらに他の信号処理方法は、複数個のデータの個数によって、データコーディング方式を決定し、決定されたデータコーディング方式によってデータをエンコーディングする。この場合、複数個のデータコーディング方式はパイロットコーディング方式を少なくとも含む。また、データの個数があらかじめ設定された条件を満たす場合、データコーディング方式がパイロットコーディング方式と決定される。
【0066】
また、本発明の信号処理装置は、パイロット基準値に対応するデータの個数を獲得する個数獲得部と、データの個数があらかじめ設定された条件を満たす場合、パイロット基準値とこのパイロット基準値に対応するパイロット差分値を獲得する値獲得部と、当該パイロット基準値及びパイロット差分値を用いて、データを獲得するデータ獲得部と、を含む。これらの個数獲得部、値獲得部及びデータ獲得部は、前述したデータデコーディング部91または92内に含まれる。
【0067】
また、本発明の他の信号処理装置は、複数個のデータコーディング方式のうちいずれか一つを、複数個のデータの個数によって決定する方式決定部と、当該決定されたデータコーディング方式によってデータをデコーディングするデコーディング部と、を含む。また、複数個のデータコーディング方式は、パイロットコーディング方式を少なくとも含む。
【0068】
また、本発明のさらに他の信号処理装置は、複数個のデータの個数があらかじめ設定された条件を満たす場合、複数個のデータに対応するパイロット基準値と当該データを用いてパイロット差分値を生成する値生成部と、当該生成されたパイロット差分値を転送する出力部と、を含む。値生成部は、前述したデータエンコーディング部31または32内に含まれる。
【0069】
また、本発明のさらに他の信号処理装置は、複数個のデータの個数によって、データコーディング方式を決定する方式決定部と、当該決定されたデータコーディング方式によって当該データをエンコーディングするエンコーディング部と、を含む。この複数個のデータコーディング方式は、パイロットコーディング方式を少なくとも含む。
【0070】
2−4.PBC信号処理方法
以下、本発明による、PBCコーディング特徴を用いた信号処理方法及び装置について説明する。
【0071】
本発明の信号処理方法は、まず、複数個のデータに対応するパイロット基準値と該パイロット基準値に対応するパイロット差分値を獲得する。次いで、前記パイロット基準値及び前記パイロット差分値を用いて、当該データを獲得する。また、前記パイロット差分値及びパイロット基準値のうち少なくとも一つをデコーディングする過程をさらに含むことができる。また、前記PBC適用データはパラメータであり、前記獲得されたパラメータを用いてオーディオ信号を復元する過程をさらに含むことができる。
【0072】
また、本発明の信号処理装置は、複数個のデータに対応するパイロット基準値と前記パイロット基準値に対応するパイロット差分値を獲得する値獲得部と、前記パイロット基準値及び前記パイロット差分値を用いて、前記データを獲得するデータ獲得部と、を含む。前記値獲得部及びデータ獲得部は、前述したデータデコーディング部91または92内に含まれる。
【0073】
本発明の他の信号処理方法は、複数個のデータに対応するパイロット基準値と前記データを用いてパイロット差分値を生成し、前記生成されたパイロット差分値を出力する過程を含む。
【0074】
また、本発明の信号処理装置は、複数個のデータに対応するパイロット基準値と前記データを用いてパイロット差分値を生成する値生成部と、前記生成されたパイロット差分値を出力する出力部と、を含む。
【0075】
本発明のさらに他の信号処理方法は、複数個の利得に対応するパイロット基準値と前記パイロット基準値に対応するパイロット差分値を獲得し、前記パイロット基準値及びパイロット差分値を用いて、前記利得を獲得する過程を含む。また、前記パイロット差分値及びパイロット基準値のうち少なくとも一つをデコーディングする過程をさらに含むことができる。また、前記獲得された利得を用いてオーディオ信号を復元する過程をさらに含むことができる。
【0076】
この場合、前記パイロット基準値は、前記複数個の利得の平均または平均近似値であるか、前記複数個の利得の中間値であるか、前記複数個の利得の最頻値であるか、デフォルトで設定された値であるか、または、テーブルから抽出した一つの値であれば良い。また、前記複数個の利得のそれぞれを臨時の前記パイロット基準値を複数個の利得のそれぞれに設定した後、最も高い符号化効率を示す利得を、最終的な前記パイロット基準値として選定する段階をさらに含むことができる。
【0077】
また、本発明の他の信号処理装置は、複数個の利得に対応するパイロット基準値と前記パイロット基準値に対応するパイロット差分値を獲得する値獲得部と、前記パイロット基準値及び前記パイロット差分値を用いて、前記利得を獲得する利得獲得部と、を含む。
【0078】
また、本発明のさらに他の信号処理方法は、複数個の利得に対応するパイロット基準値と前記利得を用いてパイロット差分値を生成し、前記生成されたパイロット差分値を出力する過程を含む。
【0079】
また、本発明のさらに他の信号処理装置は、複数個の利得に対応するパイロット基準値と前記利得を用いてパイロット差分値を生成する値算出部と、前記生成されたパイロット差分値を出力する出力部と、を含む。
【0080】
3.DIFF(差分符号化)
DIFFコーディングは、区分されたデータグループ内に存在するデータ同士間の関係を用いるコーディング方式である(これを「差分符号化」ともいう。)。ここで、DIFFが適用される単位としてのデータグループは、前述したデータグルーピング部10を通じて特定のグルーピング方式が適用された最終のグループを意味する。本発明では、上記のようにグルーピングされて特定の意味を持つデータを「パラメータ」と定義して説明し、これは、前述のPBCと同様である。特に、DIFFコーディング方式は、同一グループ内に存在するパラメータ、特に、隣接したパラメータ間の差分値を用いるコーディング方式である。以下、DIFFコーディング方式の種類及び詳細適用例について、図5〜図8を参照しつつ詳細に説明する。
【0081】
3−1.DIFFの種類
図5は、本発明によるDIFFコーディングの種類を説明するための図である。DIFFコーディングは、隣接したパラメータとの差分値を求める方向によって区分される。例えば、DIFFコーディングの種類は、周波数軸で差分値を求めるDIFF(以下、「DIFF_FREQ」または「DF」という。)と、時間軸で差分値を求めるDIFF(以下、「DIFF_TIME」または「DT」という。)とに区分される。図5によれば、グループ1は、周波数軸で差分値を算出するDIFF(DF)を示し、グループ2及びグループ3は、時間軸で差分値を算出するDIFF(DT)を示す。
【0082】
図5からわかるように、時間軸で差分値を算出するDIFF(DT)は、差分値を求める時間軸の方向によって再び区分される。例えば、グループ2に適用されたDIFF(DT)は、現在の時間のパラメータ値と以前の時間のパラメータ値(例えば、グループ1)との差分値を求める方式である。これを後方の時間DIFF(DT)(以下、「DT−BACKWARD」という。)という。また、例えば、グループ3に適用されたDIFF(DT)は、現在の時間のパラメータ値と以降の時間のパラメータ値(例えば、グループ4)との差分値を求める方式である。これを、前方の時間DIFF(DT)(以下、「DT−FORWARD」という。)という。
【0083】
したがって、図5に示すように、グループ1はDIFF(DF)コーディング方式、グループ2はDIFF(DT−BACKWARD)コーディング方式、グループ3はDIFF(DT−BACKWARD)コーディング方式であることがわかる。ただし、グループ4は、まだコーディング方式が決定されていない場合である。
【0084】
また、本発明では、周波数軸でのDIFFを、一つのコーディング方式(例えば、DIFF(DF))のみと定義したが、システム及びコーディング規格によって「DIFF(DF−TOP)」または「DIFF(DF−BOTTOM)」に区別して定義しても良い。
【0085】
3−2.DIFF適用例
図6〜図8は、DIFFコーディング方式による適用例を示す図である。図6は、説明の便宜上、図5におけるグループ1とグループ2を取り上げている。すなわち、グループ1は、DIFF(DF)コーディング方式であり、例えば、パラメータ値はx[n]={11,12,9,12,10,8,12,9,10,9}の場合である。グループ2は、DIFF(DF−BACKWARD)コーディング方式であり、例えば、パラメータ値はy[n]={10,13,8,11,10,7,14,8,10,8}の場合である。
【0086】
図7は、グループ1の差分値を算出した結果を示す図である。このグループ1は、DIFF(DF)コーディング方式でコーディングされたので、下記の数学式2によって差分値が算出される。数式2は、周波数軸で以前のパラメータとの差分値を求める式を意味する。
【0087】
[式2]
d[0]=x[0]、
d[n]=x[n]-x[n-1]、n=1,2,…,9
【0088】
すなわち、上記の数学式2によるグループ2のDIFF(DF)結果は、d[n]={11,1,−3,3,−2,−2,4,−3,1,−1}となる。
【0089】
図8は、グループ2の差分値を算出した結果を示す図である。このグループ2は、DIFF(DT−BACKWARD)コーディング方式でコーディングされたので、下記の数学式3によって差分値が算出される。数式3は、時間軸で以前パラメータとの差分値を求める式を意味する。
【0090】
[式3]
d[n]=y[n]-x[n]、n=0,1,…,9
【0091】
すなわち、上記数式3によるグループ2のDIFF(DT−BACKWARD)結果は、d[n]={−1,1,−1,−1,0,−1,2,−1,0,−1}となる。
【0092】
4.データコーディング方式の選択
本発明は、様々なデータコーディング方式を混用してデータを圧縮したり復元したりすることに特徴がある。したがって、特定グループをコーディングするに当たり、少なくとも3つのデータコーディング方式のうちいずれか一方式を選択することが必要である。また、選択されたコーディング方式に関する識別情報は、ビットストリームを介してデコーディング部に伝達されなければならない。
【0093】
以下、本発明によるデータコーディング方式の選択と、これを用いたコーディング方法及び装置について説明する。
【0094】
本発明の信号処理方法は、データコーディング識別情報を獲得する段階と、このデータコーディング識別情報が表示するデータコーディング方式によって、データをデータデコーディングする段階と、を含む。また、このデータコーディング方式は、少なくともPBCコーディング方式を含み、このPBCコーディング方式は、複数個のデータに対応するパイロット基準値とパイロット差分値を用いて前記データをデコーディングし、前記パイロット差分値は、前記データと前記パイロット基準値を用いて生成される。
【0095】
また、データコーディング方式は、DIFFコーディング方式をさらに含む。ここで、DIFFコーディング方式は、DIFF−DF方式及びDIFF−DT方式のいずれかであり、DIFF−DT方式は、前方タイムDIFF−DT(FORWARD)方式及び後方タイムDIFF−DT(BACKWARD)方式のいずれか一つである。
【0096】
また、この信号処理方法は、エントロピコーディング識別情報を獲得する段階と、該エントロピコーディング識別情報が表示するエントロピコーディング方式を用いて、前記データをエントロピデコーディングする段階と、をさらに含む。また、前記データデコーディング段階は、前記エントロピデコーディングされたデータを前記データコーディング方式によってデータデコーディングする。また、この信号処理方法は、データをパラメータとして用いて、オーディオ信号をデコーディングする段階をさらに含む。
【0097】
また、本発明の信号処理装置は、データコーディング識別情報を獲得する識別情報獲得部と、このデータコーディング識別情報が表示するデータコーディング方式によって、データをデータデコーディングするデコーディング部と、を含む。また、前記データコーディング方式は、少なくともPBCコーディング方式を含み、このPBCコーディング方式は、複数個のデータに対応するパイロット基準値とパイロット差分値を用いて前記データをデコーディングし、前記パイロット差分値は、前記データと前記パイロット基準値を用いて生成される。
【0098】
また、本発明の他の信号処理方法は、データコーディング方式によってデータをデータエンコーディングする段階と、データコーディング方式を表示するデータコーディング識別情報を生成して転送する段階と、を含む。また、このデータコーディング方式は、PBCコーディング方式を少なくとも含み、このPBCコーディング方式は、複数個のデータに対応するパイロット基準値とパイロット差分値を用いて前記データをエンコーディングし、前記パイロット差分値は、前記データ及び前記パイロット基準値を用いて生成される。
【0099】
また、本発明の他の信号処理装置は、データコーディング方式によってデータをデータエンコーディングするエンコーディング部と、データコーディング方式を表示するデータコーディング識別情報を生成して転送する出力部と、を含む。また、このデータコーディング方式は少なくともPBCコーディング方式を含み、このPBCコーディング方式は、複数個のデータに対応するパイロット基準値とパイロット差分値を用いて前記データをエンコーディングし、前記パイロット差分値は、前記データ及び前記パイロット基準値を用いて生成される。
【0100】
以下、本発明によるデータコーディング方式の選択方法及びコーディング選択識別情報を最適の転送効率の下で転送する方法について説明する。
【0101】
4−1.使用頻度を考慮したデータコーディング識別方法
図9は、本発明による少なくとも3つのコーディング方式のうちいずれか一つを選択する関係を示す図である。例えば、第1、第2及び第3データエンコーディング部53,52,51が存在し、このうち、第1データエンコーディング部53の使用頻度が最も低く、かつ、第3データエンコーディング部51の使用頻度が最も高いと仮定する。説明の便宜上、使用頻度は、全体‘100’を基準に、第1データエンコーディング部53が‘10’、第2データエンコーディング部52が‘30’、そして第3データエンコーディング部51が‘60’であると仮定する。すなわち、これを具体的に説明すると、100個のデータグループに対して、PCM方式を10回、PBC方式を30回、DIFF方式を60回適用したと考えることができる。
【0102】
このような仮定において、3つのコーディング方式を識別するための識別情報に必要なビット数を計算すると、次の通りになる。例えば、図9によれば、まず、1ビットの第1識別情報を使用するので、全体で100グループの各コーディング方式を区分するためには、第1識別情報として100ビットが使われる。この100ビットを通じて使用頻度の高い第3データエンコーディング部51を識別したので、残り1ビットの第2情報は、40ビットだけで第1データエンコーディング部53と第2データエンコーディング部52を区別することが可能になる。
【0103】
したがって、100個のデータグループに対して各グループ別コーディングタイプ選択のための識別情報は、「第1識別情報(100ビット)+第2識別情報(40ビット)」と合計140ビットが必要とされる。
【0104】
図10は、従来方式による少なくとも3つのコーディング方式のうちいずれか一つを選択する関係を示す図である。説明の便宜上、図9と同様に、使用頻度は、全体‘100’を基準に、第1データエンコーディング部53が‘10’、第2データエンコーディング部52が‘30’、そして第3データエンコーディング部51が‘60’であると仮定する。図10によって3つのコーディング方式を識別するための識別情報に必要なビット数を計算してみると、次の通りになる。図10によれば、まず、1ビットの第1識別情報を使用するので、全体で100グループの各コーディング方式を区分するためには、第1識別情報として100ビットが使われる。この100ビットを通じて使用頻度の低い第1データエンコーディング部53がまず識別される。したがって、残り1ビットの第2識別情報は、第2データエンコーディング部52と第3データエンコーディング部53とを区別するために合計90ビットがさらに必要となる。したがって、100個のデータグループに対してグループ別コーディングタイプ選択のための識別情報は、「第1識別情報(100ビット)+第2識別情報(90ビット)」と合計190ビットが必要となる。
【0105】
前述した図9による場合と図10による場合とを比較すると、図9のようなデータコーディング選択識別情報を構成することが、転送効率の面においてより有利であることがわかる。すなわち、本発明は、3つ以上のデータコーディング方式が存在する場合、使用頻度数が類似する2つのコーディング方式を、同じ識別情報によって区分せず、相互に異なる識別情報を用いることに特徴がある。例えば、図10のように、第1データエンコーディング部51と第2データエンコーディング部52を同一識別情報で分類する場合には、データ転送ビットが増えて転送効率が低くなってしまう。また、本発明は、3つ以上のデータコーディング方式が存在する場合、最も使用頻度の高いデータコーディング方式が第1識別情報によって区分されるようにすることに特徴がある。その結果、第2識別情報によって使用頻度の低い残り2個のコーディング方式が区別される。
【0106】
図11及び図12は、本発明によるデータコーディング方式選択に対するフローチャートをそれぞれ示す。例えば、図11は、「DIFF」コーディングを最も使用頻度の高いデータコーディングと仮定した場合であり、図12は、「PBC」コーディングを最も使用頻度の高いデータコーディングと仮定した場合である。
【0107】
したがって、図11を参照すると、まず、使用頻度の最も低いPCMコーディングか否かを確認する(S10)。この確認は、前述したように、第1識別情報によって行われる。この確認の結果、PCMコーディングであれば、PBCコーディングか否かを確認する(S20)。これは第2識別情報によって行われる。もし、DIFFコーディングの使用頻度が、全体で100回のうち60回であれば、同一の100個のデータグループに対して、各グループ別コーディングタイプ選択のための識別情報は「第1識別情報(100ビット)+第2識別情報(40ビット)」となり、合計140ビットが必要となることがわかる。
【0108】
また、図12を参照すると、まず、図11と同様に、使用頻度の最も低いPCMコーディングか否かを確認する(S30)。この確認は、前述したように、第1識別情報によって行われる。この確認の結果、PCMコーディングであれば、DIFFコーディングか否かを確認する(S40)。これは、第2識別情報によって行われる。もし、PBCコーディングの使用頻度が、全体で100回のうち80回であれば、同一の100個のデータグループに対して、各グループ別コーディングタイプ選択のための識別情報は「第1識別情報(100ビット)+第2識別情報(20ビット)」となり、合計120ビットが必要となることがわかる。
【0109】
以下、本発明による複数のデータコーディング方法を識別する方法と、これを用いた信号処理方法及び装置について説明する。
【0110】
本発明の信号処理方法は、複数個のデータコーディング方式を表す識別情報を階層的に抽出し、この識別情報に対応するデータコーディング方式によってデータをデコーディングする。この場合、複数個のデータコーディング方式に含まれるPBCコーディング方式及びDIFFコーディング方式を表す識別情報は、相互に異なる階層から抽出される。また、前記デコーディングする段階は、前記データコーディング方式によって、複数個のデータに対応する基準値と前記データを用いて生成された差分値を用いて、前記データを獲得する。前記基準値は、パイロット基準値または差分基準値になることができる。
【0111】
また、本発明の他の信号処理方法は、3つ以上のデータコーディング方式を表す識別情報を階層的に抽出するが、ここで、前記識別情報の使用頻度数の高い2個のコーディング方式を表す識別情報は、相互に異なる階層から抽出される。
【0112】
また、本発明のさらに他の信号処理方法は、データコーディング方式を表す識別情報の使用頻度数によって、前記識別情報を階層的に抽出し、前記識別情報に対応するデータコーディング方式によって前記データをデコーディングする過程を含む。前記識別情報は、第1識別情報と第2識別情報を階層的に抽出し、前記第1識別情報は、第1データコーディング方式か否かを表し、前記第2識別情報は、第2データコーディング方式か否かを表す。前記第1識別情報はDIFFコーディング方式か否かを表し、前記第2識別情報はパイロットコーディング方式か、または、PCMグルーピング方式かを表す。また、前記第1データコーディング方式を、PCMコーディング方式とすることができる。また、前記第2データコーディング方式を、PBCコーディング方式またはDIFFコーディング方式とすることができる。また、この信号処理方法において、前記データはパラメータであり、このパラメータを用いてオーディオ信号を復元する過程をさらに含む。
【0113】
また、本発明の信号処理装置は、複数個のデータコーディング方式を区分付ける識別情報を階層的に抽出する識別子抽出部(例えば、図13の710)と、前記識別情報に対応するデータコーディング方式によって前記データをデコーディングするデコーディング部と、を含む。
【0114】
また、本発明の他の信号処理方法は、データコーディング方式によってデータをエンコーディングし、前記データのエンコーディングに用いられる頻度数が相互に異なるデータコーディング方式を区分付ける識別情報を階層的に生成する過程を含む。前記識別情報は、PCMコーディング方式とPBCコーディング方式を区分付ける。具体的に、前記識別情報は、PCMコーディング方式とDIFFコーディング方式を区分付ける。
【0115】
また、本発明の他の信号処理装置は、データコーディング方式によってデータをエンコーディングするエンコーディング部と、前記データのエンコーディングに用いられる頻度数が相互に異なるデータコーディング方式を区分付ける識別情報を階層的に生成する識別情報生成部(例えば、図11の400)と、を含む。
【0116】
4−2.データコーディング間の関連性
本発明のPCM、PBC及びDIFFは、相互独立的及び/または非独立的な関連性を持つ。例えば、データコーディングの対象になる各グループ別に、上記3つの方式のうちいずれか一つを自由に選択することが可能である。したがって、全体のデータコーディングは、上記3方式のコーディングを組み合わせて使用した結果となる。ただし、上記3つのコーディング方式の使用頻度を考慮し、最上の使用頻度を持つDIFFコーディング方式と残り2つのコーディング方式(例えば、PCMとPBC)のうちいずれか一方式が先ず選択される。その後、PCMとPBCのうちいずれか一方式が次に選択される。ただし、これは、前述したように、識別情報の転送効率を考慮したもので、実質的なコーディング方式の類似性に起因するものではない。
【0117】
コーディング方式の類似性の観点において、PBCとDIFFは、差分値を算出する面で似ている。したがって、PBCとDIFFのコーディング処理過程は、多くの部分が重複する。特に、デコーディング時に差分値から元のパラメータを復元する過程は、「デルタデコーディング(delta decoding)」と定義し、同じ過程内で処理されるように設計可能である。
【0118】
また、PBCまたはDIFFとしてコーディングを行う過程で、範囲を外れるパラメータが存在してもよい。このような場合、該当のパラメータは別のPCMでコーディングして転送する必要がある。
【0119】
[グルーピング]
1.グルーピングの概念
本発明は、コーディングの効率性のために一定のデータをまとめて処理するグルーピングを提案する。特に、PBCコーディングの場合、グループ単位にパイロット基準値を選定するので、PBCコーディングが行われる以前の段階としてグルーピング過程が完了しなければならない。また、グルーピングは、DIFFコーディングでも同様に適用される。また、本発明のグルーピングのうち一部の方式は、エントロピコーディングでも適用可能であり、これについての詳細は、該当の説明部分で後述される。
【0120】
本発明のグルーピングの種類を、グルーピング実行方法を基準に、「外部グルーピング(external grouping)」と「内部グルーピング(internal grouping)」とに区別することができる。
【0121】
また、本発明のグルーピングの種類は、グルーピングの対象を基準に、「ドメイングルーピング(domain grouping)」、「データグルーピング(data grouping)」及び「チャンネルグルーピング(channel grouping)」に区別することができる。
【0122】
また、本発明のグルーピングの種類を、グルーピング実行順序を基準に、「1次グルーピング」、「2次グルーピング」、「3次グルーピング」などに区別することができる。
【0123】
また、グルーピング実行回数を基準に、「単一グルーピング(single grouping)」と「混合グルーピング(multiple grouping)」とに区別することができる。
【0124】
ただし、上記のグルーピングの区分は、本発明を概念的に伝達するために便宜上区分したもので、その使用用語に必ずしも限定されることはない。また、本発明のグルーピングは、上記の様々なグルーピング方式が重複適用されたり、組合的に使われたりして完成する。以下、本発明のグルーピングを、内部グルーピングと外部グルーピングとに区別して説明し、続いて様々なグルーピングが混合して存在する混合グルーピングについて説明する。なお、ドメイングルーピングとデータグルーピングの概念についても説明する。
【0125】
2.内部グルーピング
内部グルーピングとは、グルーピングの実行が内的に行われることを意味する。一般的に、内部グルーピングが行われると、既存のグループを内的に再グルーピングして新しいグループを生成し、または、分割されたグループを生成する。
【0126】
図13は、本発明による内部グルーピングを説明するための図である。図13を参照すると、例えば、本発明の内部グルーピングを周波数ドメイン単位(以下、「バンド(band)」という。)で行った場合である。したがって、一部の内部グルーピング方式は、一種のドメイングルーピングに該当することができる。
【0127】
サンプリングデータが特定のフィルター、例えば、QMF(Quadrature Mirror Filter)を通過すると、複数のサブバンドが生成される。このサブバンド状態で1次周波数グルーピングを行い、1次グループバンドを生成する。これをパラメータバンドともいう。この1次周波数グルーピングは、サブバンドを不均一にまとめてパラメータバンドを生成することができる。したがって、パラメータバンドの大きさは非均等的に構成することができる。ただし、コーディングの目的によっては、パラメータバンドを均等的にすることも可能である。また、前記サブバンドを生成する過程も、グルーピングと分類することができる。
【0128】
前記生成されたパラメータバンドに対して2次周波数グルーピングを行い、2次グループバンドを生成する。これをデータバンドともいう。この2次周波数グルーピングは、パラメータバンドを均一な個数で統合してデータバンドを生成できる。
【0129】
前記グルーピングの後に、コーディングの目的に応じて、1次グループバンドであるパラメータバンド単位でコーディングを行ったり、2次グループバンドであるデータバンド単位でコーディングを行ったりすることができる。
【0130】
例えば、前述したPBCコーディングを適用する時、グルーピングされたパラメータバンドを一グループとしてパイロット基準値(一種のグループ基準値となる)を選定しても良く、グルーピングされたデータバンドを一グループとしてパイロット基準値を選定しても良い。この選定されたパイロット基準値を用いてPBCを行うことになり、以降の詳細なPBC動作は、前述した通りである。
【0131】
また、例えば、前述したDIFFコーディングを適用する時、グルーピングされたパラメータバンドを一グループとしてグループ基準値を決定し、差分値を算出する。また、グルーピングされたデータバンドを一グループとしてグループ基準値を決定し、差分値を算出することも可能である。以降の詳細DIFF動作は、前述した通りである。
【0132】
実際のコーディング時に、前記1次周波数グルーピング及び/または2次周波数グルーピングを適用した場合は、それに該当する情報を転送する必要がある。これについては、図23を参照しつつ後述する。
【0133】
3.外部グルーピング
外部グルーピングとは、グルーピングが外的に行われる場合のことを意味する。一般的に、外部グルーピングが行われると、既存のグループを外的に再グルーピングして新しいグループを生成したり、または、拡張されたグループを生成する。
【0134】
図14は、本発明による外部グルーピングを説明するための図である。図14を参照すると、例えば、本発明の外部グルーピングは、時間ドメイン単位(以下、「タイムスロット(time slot)」)で行われる。したがって、一部の外部グルーピング方式は、一種のドメイングルーピングに該当することができる。
【0135】
サンプリングデータを含むフレームに対して1次時間グルーピングを行い、1次グループタイムスロットを生成する。図14では、8個のタイムスロットが生成された場合を例示している。この1次時間グルーピングは、フレームを均等な大きさのタイムスロットに分割するという意味も有する。
【0136】
前記生成された1次時間グルーピングによって生成されたタイムスロットのうち、少なくとも一つのタイムスロットを選択する。図14では、例えば、タイムスロット1、4、5、8が選択された場合が示されている。この選択過程において、コーディング方法によっては、全てのタイムスロットを選択することも可能である。また、選択されたタイムスロット1、4、5、8は、タイムスロット1、2、3、4に再配列される。ただし、コーディングの目的によっては、前記選択されたタイムスロット1、4、5、8の一部のみを再配列することも可能である。この場合、再配列から抜けるタイムスロットは、最終グループ形成では除外されるので、前述したPBCコーディングやDIFFコーディング適用対象からも除外される。
【0137】
前記選択されたタイムスロットに対して2次時間グルーピングを行い、最終時間軸上で一緒に処理されるグループを形成する。例えば、タイムスロット1、2及びタイムスロット3、4を一つのグループと形成でき、この場合を、それぞれタイムスロットペア(pair)という。また、タイムスロット1、2、3を一つのグループと形成でき、この場合をタイムスロットトリプル(triple)という。また、他のタイムスロットとグループを形成しない単独のタイムスロットも存在することができる。
【0138】
実際のコーディングの時に前記1次時間グルーピング及び2次時間グルーピングを適用した場合には、それに該当する情報を転送する必要がある。これについては、図23を参照しつつ後述する。
【0139】
4.混合グルーピング
混合グルーピングとは、前述した内部グルーピング、外部グルーピング及びその他様々なグルーピングを混合して最終グループを生成するグルーピング方式のことをいう。前述したように、本発明の個別のグルーピング方式は、相互に重複して適用可能または組み合せて適用が可能であり、これは、様々なコーディング方式の効率を上げるための方案として活用される。
【0140】
4−1.内部グルーピングと外部グルーピングとの混合
図15は、本発明の混合グルーピングを説明するための図である。特に、図15は、内部グルーピングと外部グルーピングとを混合した場合を示す。
【0141】
すなわち、周波数ドメインで内部グルーピングが完了して最終グループバンド64が生成され、タイムドメインで外部グルーピングが完了して最終タイムスロット61,62,63が生成された場合を示している。
【0142】
以下、グルーピングの完了した一つの個別のタイムスロットを、データセットと呼ぶ。図15でデータセットは、参照符号61a,61b,62a,62b,63が該当する。特に、2個のデータセット(61aと61b及び62aと62b)は、外部グルーピングによってそれぞれ対をなすことができる。このデータセットの対を、「データペア」という。
【0143】
混合グルーピングが完了した後、PBCコーディングまたはDIFFコーディング適用が行われる。例えば、PBCコーディングを行う場合では、前記最終完了したデータペア61,62またはデータペアを形成しない単一データセット63毎に1つずつのパイロット基準値P1,P2,P3を選定する。選定されたパイロット基準値を用いてPBCコーディングを行うことは、前述した通りである。
【0144】
また、例えば、DIFFコーディングを行う場合では、データセット61a,61b,62a,62b,63毎にDIFFコーディングタイプが決定される。前述したように、各データセット毎にDIFF方向を決定すべきであり、これは、「DIFF−DF」及び「DIFF−DT」のうちのいずれか一つと決定される。前記決定されたDIFFコーディング方式によってDIFFコーディングが行われる過程は、前述した通りである。
【0145】
混合グルーピングにおいて外部グルーピングが行われてデータペアを形成するためには、データペアを形成する各データセットに対して均等な内部グルーピングが行わなければならない。例えば、データペアを形成するデータセット61aと61bは、同じデータバンド数を持つ。また、データペアを形成するデータセット62aと62bは、同じデータバンド数を持つ。ただし、相互に異なるデータペア内に属するデータセット、例えば、61aと62aはデータバンド数が異なっても問題がない。これは、それぞれのデータペア別に異なる内部グルーピングが適用されることができるということを意味する。
【0146】
また、データペアを形成する場合に、1次グルーピングは内部グルーピングで行うことができ、2次グルーピングは外部グルーピングで行うことができる。例えば、2次グルーピング後のデータバンド数は、1次グルーピング後のデータバンド数と倍数関係にある。これは、前述したように、データペアを形成するデータセットはいずれも同じデータバンド数を持つためである。
【0147】
4−2.内部グルーピングと内部グルーピングとの混合
図16及び図17は、本発明の混合グルーピングの他の実施例を説明するための図である。特に、図16及び図17は、内部グルーピングと内部グルーピングとの混合に重点をおいて示す。したがって、図16及び図17において、外部グルーピングを行い又は行うことができるということは自明である。
【0148】
例えば、図16は、前述した2次周波数グルーピングが完了してデータバンドが生成された場合に対して、再び内部グルーピングを行った場合を示す。すなわち、2次周波数グループを通じて生成されたデータバンドは、低周波帯域と高周波帯域とに区別される。特定のコーディングの場合、低周波帯域と高周波帯域を分離して利用する必要がある。特に、このように低周波帯域と高周波帯域を分離して利用する場合を、「デュアルモード(Dual Mode)」ともいう。
【0149】
したがって、デュアルモードの場合、最終生成された低周波帯域と高周波帯域をそれぞれ一グループとし、データコーディングを行う。例えば、低周波帯域及び高周波帯域のそれぞれに対してパイロット基準値(P1,P2)を生成し、該当の周波数帯域内でPBCコーディングを行う。
【0150】
このデュアルモードは、チャンネル毎の特性に応じて適用することが可能であり、したがって、これを「チャンネルグルーピング」ともいう。また、データタイプによって別々に適用することも可能である。
【0151】
例えば、図17は、前述した2次周波数グルーピングが完了してデータバンドが生成された場合に対して、再び内部グルーピングを行った場合を示す。すなわち、2次周波数グループを通じて生成されたデータバンドは、低周波帯域と高周波帯域とに区分される。特定のコーディングの場合、低周波帯域だけを利用し、高周波帯域を廃棄する必要もある。特に、このように低周波帯域のみをグルーピングして活用する場合を、「低周波チャンネル(LFE)モード」ともいう。
【0152】
したがって、低周波チャンネル(LFE)モードでは、最終生成された低周波帯域を一グループとしてデータコーディングを行う。例えば、低周波帯域に対してパイロット基準値(P1)を生成し、該当の低周波数帯域内でPBCコーディングを行うこととなる。ただし、選択された低周波帯域を再び内部グルーピングして新しいデータバンドを生成することも可能である。これは、低周波帯域をより稠密にグルーピングして表現するためである。
【0153】
この低周波チャンネル(LFE)モードは、低周波チャンネル特性に応じて適用されるもので、よって、これを「チャンネルグルーピング」ともいう。
【0154】
5.ドメイングルーピングとデータグルーピング
グルーピングの対象を基準に、ドメイングルーピングとデータグルーピングとに区分できる。ドメイングルーピングとは、特定ドメイン(例えば、周波数ドメインまたはタイムドメイン)上で各ドメインの単位をグルーピングする方式のことを意味する。ドメイングルーピングは、前述した内部グルーピング及び/または外部グルーピングを通じて行われることができる。
【0155】
また、データグルーピングとは、データ自体をグルーピングする方式のことを意味する。データグルーピングも、前述した内部グルーピング及び/または外部グルーピングを通じて行うことができる。
【0156】
また、データグルーピングのうちの特殊な場合として、特に後述するエントロピコーディングで活用できるようにグルーピングすることができる。例えば、データグルーピングは、図15に示すように最終完了したグルーピング状態で、実際データをエントロピコーディングするために使われる。すなわち、データを周波数方向または時間方向のうちいずれか一方向に隣接した2個のデータをまとめて処理する方式である。ただし、上記のようにデータグルーピングを行った場合なら、実際最終グループ内の一部データのみを再グルーピングしたことであるから、データグルーピングされたグループ(例えば、2個のデータ)に限ってはPBCコーディングやDIFFコーディングを適用しない。前記データグルーピングに対応するエントロピコーディング方式は後述される。
【0157】
6.グルーピングを用いた信号処理方法
6−1.少なくとも内部グルーピングを用いた信号処理方法
以下、前述した本発明のグルーピング方式を用いた信号処理方法及び装置について説明する。
【0158】
本発明の信号処理方法は、第1グルーピング及びこの第1グルーピングに対する内部グルーピングを通じて一つのグループに含まれる複数個のデータに対応するグループ基準値とこのグループ基準値に対応する差分値を獲得し、前記グループ基準値及び前記差分値を用いて、前記データを獲得する過程を含む。また、本発明は、前記第1グルーピングによってグルーピングされた前記データの個数は、前記内部グルーピングによってグルーピングされた前記データの個数よりも大きいことを特徴とする。ここで、グループ基準値は、パイロット基準値または差分基準値でありうる。
【0159】
また、本発明は、前記グループ基準値及び前記差分値のうち少なくとも一つをデコーディングする過程をさらに含む。ここで、前記パイロット基準値は、前記グループ別に定められる。
【0160】
また、前記内部グルーピングによる内部グループに含まれる前記データの個数は、あらかじめ設定される。ここで、前記内部グループに含まれるデータの個数は、相互に異なる。
【0161】
前記第1グルーピング及び前記内部グルーピングは、周波数ドメイン上の前記データに対して行われる。この周波数ドメインは、ハイブリッドドメイン、パラメータバンドドメイン、データバンドドメインまたはチャンネルドメインのうちいずれか一つになりうる。
【0162】
また、本発明は、前記第1グルーピングによる第1グループは、前記内部グルーピングによる内部グループを複数個含むことを特徴とする。
【0163】
また、本発明の周波数ドメインは、周波数バンドで区分され、この周波数バンドは、内部グルーピングによってサブバンドとなり、サブバンドは再び内部グルーピングによってパラメータバンドとなり、パラメータバンドは再び内部グルーピングによってデータバンドとなる。ここで、パラメータバンドの個数は、最大28個に制限することができる。また、パラメータバンドの個数を、2個、5個または10個のうちいずれか一つにまとめて一つのデータバンドにグルーピングする。
【0164】
また、本発明の信号処理装置は、第1グルーピング及びこの第1グルーピングに対する内部グルーピングを通じて一つのグループに含まれる複数個のデータに対応するグループ基準値とこのグループ基準値に対応する差分値を獲得する値獲得部と、前記グループ基準値及び前記差分値を用いて、前記データを獲得するデータ獲得部と、を含む。
【0165】
また、本発明の他の信号処理方法は、第1グルーピング及びこの第1グルーピングに対する内部グルーピングを通じて一つのグループに含まれる複数個のデータに対応するグループ基準値と前記データを用いて差分値を生成し、前記生成された差分値を転送する過程を含む。
【0166】
また、本発明の他の信号処理装置は、第1グルーピング及びこの第1グルーピングに対する内部グルーピングを通じて一つのグループに含まれる複数個のデータに対応するグループ基準値と前記データを用いて差分値を生成する値生成部と、前記生成された差分値を転送する出力部と、を含む。
【0167】
6−2.混合グルーピングを用いた信号処理方法
以下、前述した本発明のグルーピング方式を用いた信号処理方法及び装置について説明する。
【0168】
本発明の信号処理方法は、グルーピングを通じて一つのグループに含まれる複数個のデータに対応するグループ基準値とこのグループ基準値に対応する差分値を獲得し、前記グループ基準値及び前記差分値を用いて、前記データを獲得する過程を含む。前記グループ基準値は、パイロット基準値及び差分基準値のうち一つでありうる。また、前記グルーピングは、外部グルーピング及び内部グルーピングのいずれか一つでありうる。また、前記グルーピングは、ドメイングルーピング及びデータグルーピングのいずれか一つでありうる。
【0169】
前記データグルーピングは、ドメイングループ上で行われる。また、前記ドメイングルーピングに含まれる時間ドメインは、タイムスロットドメイン、パラメータセットドメイン及びデータセットドメインのうち少なくとも一つを含む。
【0170】
また、前記ドメイングルーピングに含まれる周波数ドメインは、サンプルドメイン、サブバンドドメイン、ハイブリッドドメイン、パラメータバンドドメイン、データバンドドメイン及びチャンネルドメインのうち少なくとも一つでありうる。前記グループに含まれた前記複数個のデータから一つの前記差分基準値が設定される。グルーピング回数、グルーピング範囲及びグルーピングの有無のうち少なくとも一つが決定される。
【0171】
また、本発明の信号処理装置は、グルーピングを通じて一つのグループに含まれる複数個のデータに対応するグループ基準値とこのグループ基準値に対応する差分値を獲得する値獲得部と、前記グループ基準値及び前記差分値を用いて、前記データを獲得するデータ獲得部と、を含む。
【0172】
また、本発明の他の信号処理方法は、グルーピングを通じて一つのグループに含まれる複数個のデータに対応するグループ基準値と前記データを用いて差分値を生成し、前記生成された差分値を転送する過程を含む。
【0173】
また、本発明の他の信号処理装置は、グルーピングを通じて一つのグループに含まれる複数個のデータに対応するグループ基準値と前記データを用いて差分値を生成する値生成部と、前記生成された差分値を転送する出力部と、を含む。
【0174】
また、本発明のさらに他の信号処理方法は、第1グルーピング及び第2グルーピングを含むグルーピングを通じて一つのグループに含まれる複数個のデータに対応するグループ基準値とこのグループ基準値に対応する1次差分値を獲得し、前記グループ基準値及び前記第1差分値を用いて、前記データを獲得する過程を含む。ここで、前記グループ基準値は、パイロット基準値または差分基準値でありうる。
【0175】
また、前記グループ基準値及び前記第1差分値のうち少なくとも一つをデコーディングする過程をさらに含む。また、前記第1パイロット基準値はグループ別に定められる。
【0176】
また、本発明は、前記複数個の第1パイロット基準値に対応する第2パイロット基準値とこの第2パイロット基準値に対応する第2差分値を獲得し、前記第2パイロット基準値と前記第2差分値を用いて前記第1パイロット基準値を獲得する過程をさらに含む。ここで、第2グルーピングは、前記第1グルーピングに対する外部グルーピングまたは内部グルーピングでありうる。
【0177】
また、前記グルーピングは、時間ドメイン及び周波数ドメインのうち少なくとも一つのドメイン上のデータに対して行われる。特に、前記グルーピングは、時間ドメイン及び周波数ドメインのうち少なくとも一つをグルーピングするドメイングルーピングである。
【0178】
また、前記時間ドメインは、タイムスロットドメイン、パラメータセットドメインまたはデータセットドメインでありうる。また、前記周波数ドメインは、サンプルドメイン、サブバンドドメイン、ハイブリッドドメイン、パラメータバンドドメイン、データバンドドメインまたはチャンネルドメインでありうる。前記グルーピングされるデータは、インデックスまたはパラメータである。
【0179】
また、前記第1グルーピングを通じた一つのグループに含まれる前記インデックスが表すエントロピテーブルを用いて、前記第1差分値をエントロピデコーディングするが、この場合、前記データは、前記グループ基準値及び前記エントロピデコーディングされた第1差分値を用いて獲得される。
【0180】
また、前記第1グルーピングを通した一つのグループに含まれる前記インデックスが表すエントロピテーブルを用いて、前記第1差分値と前記グループ基準値をエントロピデコーディングするものの、前記データは前記エントロピデコーディングされたグループ基準値及び第1差分値を用いて獲得される。
【0181】
また、本発明のさらに他の信号処理装置は、第1グルーピング及び第2グルーピングを含むグルーピングを通じて一つのグループに含まれる複数個のデータに対応するグループ基準値とこのグループ基準値に対応する差分値を獲得する値獲得部と、前記グループ基準値及び前記差分値を用いて、前記データを獲得するデータ獲得部と、を含む。
【0182】
また、本発明のさら他の信号処理方法は、第1グルーピング及び第2グルーピングを含むグルーピングを通じて一つのグループに含まれる複数個のデータに対応するグループ基準値と前記データを用いて差分値を生成し、前記生成された差分値を転送する過程を含む。
【0183】
また、本発明のさらに他の信号処理装置は、第1グルーピング及び第2グルーピングを含むグルーピングを通じて一つのグループに含まれる複数個のデータに対応するグループ基準値とこのデータを用いて差分値を生成する値生成部と、前記生成された差分値を転送する出力部と、を含む。
【0184】
また、本発明のさらに他の信号処理方法は、第1グルーピング及び前記第1グルーピングに対する外部グルーピングを通じて一つのグループに含まれる複数個のデータに対応するグループ基準値とこのグループ基準値に対応する差分値を獲得し、前記グループ基準値及び前記差分値を用いて、前記データを獲得する過程を含む。また、前記第1グルーピングによってグルーピングされた前記データの個数である第1データの個数は、前記外部グルーピングによってグルーピングされた前記データの個数である第2データの個数よりも少ないことを特徴とする。また、前記第1データの個数と前記第2データの個数は、互いに倍数関係を持つことを特徴とする。
【0185】
また、前記グループ基準値は、パイロット基準値または差分基準値でありうる。また、本発明は、前記グループ基準値及び前記差分値のうち少なくとも一つをデコーディングする過程をさらに含む。また、前記パイロット基準値は、グループ別に定められることを特徴とする。
【0186】
前記グルーピングは、時間ドメイン及び周波数ドメインのうち少なくとも一つのドメイン上のデータに対して行われる。前記時間ドメインは、タイムスロットドメイン、パラメータセットドメイン及びデータセットドメインのうちいずれか一つである。また、前記周波数ドメインは、サンプルドメイン、サブバンドドメイン、ハイブリッドドメイン、パラメータバンドドメイン、データバンドドメイン及びチャンネルドメインのうちいずれか一つである。
【0187】
また、本発明は、前記獲得されたデータをパラメータとして用いてオーディオ信号を復元する過程をさらに含む。また、前記外部グルーピングは、ペアをなすパラメータを含むことができる。
【0188】
また、本発明のさらに他の信号処理装置は、第1グルーピング及び前記第1グルーピングに対する外部グルーピングを通じて一つのグループに含まれる複数個のデータに対応するグループ基準値とこのグループ基準値に対応する差分値を獲得する値獲得部と、前記グループ基準値及び前記差分値を用いて、前記データを獲得するデータ獲得部と、を含む。
【0189】
また、本発明のさらに他の信号処理方法は、第1グルーピング及びこの第1グルーピングに対する外部グルーピングを通じて一つのグループに含まれる複数個のデータに対応するグループ基準値と前記データを用いて差分値を生成し、前記生成された差分値を転送する過程を含む。
【0190】
また、本発明のさらに他の信号処理装置は、第1グルーピング及び前記第1グルーピングに対する外部グルーピングを通じて一つのグループに含まれる複数個のデータに対応するグループ基準値とこのデータを用いて差分値を生成する値生成部と、前記生成された差分値を転送する出力部と、を含む。
【0191】
6−3.少なくともデータグルーピングを用いた信号処理方法
以下、前述した本発明のグルーピング方式を用いた信号処理方法及び装置について説明する。
【0192】
本発明の信号処理方法は、データグルーピング及び前記データグルーピングに対する内部グルーピングを通じて一つのグループに含まれる複数個のデータに対応する一つのグループ基準値とこのグループ基準値に対応する差分値を獲得し、前記グループ基準値及び前記差分値を用いて前記データを獲得する過程を含む。前記内部グルーピングに含まれた前記データの個数は、前記データグルーピングに含まれた前記データの個数よりも少ない。前記データは、パラメータに対応する。
【0193】
前記データグルーピングされる前記複数個のデータ全体に対して前記内部グルーピングが行われる。ここで、前記内部グルーピングを、パラメータの帯域別に行うことができる。また、前記データグルーピングされる前記複数個のデータの一部に対して前記内部グルーピングを行うことができる。また、前記データグルーピングされる前記複数個のデータのチャンネル別に前記内部グルーピングを行うことができる。
【0194】
また、前記グループ基準値は、パイロット基準値または差分基準値でありうる。また、本発明は、前記グループ基準値及び前記差分値のうち少なくとも一つをデコーディングする過程をさらに含むことができる。ここで、前記パイロット基準値は、グループ別に定められる。
【0195】
また、前記データグルーピング及び前記内部グルーピングは、周波数ドメイン上のデータに対して行われる。
【0196】
また、前記周波数ドメインは、サンプルドメイン、サブバンドドメイン、ハイブリッドドメイン、パラメータバンドドメイン、データバンドドメイン及びチャンネルドメインのうちいずれか一つになることができる。また、前記データを獲得する時、前記データグルーピング及び前記内部グルーピングのうち少なくとも一つに対するグルーピング情報が用いられる。
【0197】
また、前記グルーピング情報は、各グループの位置、各グループの個数、グループ基準値のグループ別適用の有無、グループ基準値の個数、グループ基準値のコーデック方式及びグループ基準値の獲得の有無のうち少なくとも一つを含む。
【0198】
また、本発明の信号処理装置は、データグルーピング及びこのデータグルーピングに対する内部グルーピングを通じて一つのグループに含まれる複数個のデータに対応する一つのグループ基準値と前記グループ基準値に対応する差分値を獲得する値獲得部と、前記グループ基準値及び前記差分値を用いて前記データを獲得するデータ獲得部と、を含む。
【0199】
また、本発明の他の信号処理方法は、データグルーピング及びこのデータグルーピングに対する内部グルーピングを通じて一つのグループに含まれる複数個のデータに対応するグループ基準値と前記データを用いて差分値を生成する段階と、前記生成された差分値を転送する段階と、をさらに含む。
【0200】
また、本発明の他の信号処理装置は、データグルーピング及び前記データグルーピングに対する内部グルーピングを通じて一つのグループに含まれる複数個のデータに対応するグループ基準値と前記データを用いて差分値を生成する値生成部と、前記生成された差分値を転送する出力部と、を含む。
【0201】
[エントロピコーディング]
1.エントロピコーディング概念
本発明のエントロピコーディングは、前述したデータコーディングの結果を可変長符号化する過程のことを意味する。一般に、エントロピコーディングは、特定データの発生確率を統計的方式で処理する。例えば、確率的に発生頻度の高いデータに対しては少ないビットを割り当て、確率的に発生頻度の低いデータには多いビットを割り当てることによって、全体的に転送効率を上げる役割を果たす。ただし、本発明は、上記の一般的なエントロピコーディングとは違い、前述したPBCコーディング及びDIFFコーディングと関連した効率的なエントロピコーディング方法を提案しようとする。
【0202】
1−1.エントロピテーブル
エントロピコーディングのためには、既に定められたエントロピテーブルが必要となる。エントロピテーブルは、コードブックとも定義され、エンコーディング部とデコーディング部が同じテーブルを用いる。本発明は、様々な種類のデータコーディング結果を效率的に処理するために、エントロピコーディング方法及び特有のエントロピテーブルを提案する。以下、これについて詳細に説明する。
【0203】
1−2.エントロピコーディング種類(1D/2D)
本発明のエントロピコーディングは、2種類に大別される。その一つは、エントロピテーブルを通じて一つのインデックス(index 1)を導出する過程であり、もう一つは、エントロピテーブルを通じて2個の連続したインデックス(index 1、index 2)を導出する過程である。以下、前者を1次元(以下、「1D(one−Dimensional)」)エントロピコーディングといい、後者を2次元(以下、「2D(two−Dimensional)」)エントロピコーディングという。
【0204】
図18は、本発明による1D及び2Dエントロピテーブルの例示図である。基本的に、本発明のエントロピテーブルは、「インデックス」フィールド、「長さ」フィールド及びコードワードフィールドで構成される。例えば、前述したデータコーディングによって特定データ(例えば、パイロット基準値、差分値など)が算出されると、該当のデータ(これは、「インデックス」に該当する。)は、エントロピテーブルを通じて指定されたコードワードを持つようになり、コードワードは、ビットストリーム化されてデコーディング部に転送される。このコードワードを受信したエントロピデコーディング部は、該当のデータが使われたエントロピテーブルを決定し、決定されたテーブル内で該当のコードワード及びコードワードを構成するビット長を用いてインデックス値を導出する。例えば、本発明では、コードワードを16進法で表示した。
【0205】
1Dまたは2Dエントロピコーディングによって導出されるインデックス値は、負(−)または正(+)の符号が省略されている。したがって、1Dまたは2Dエントロピコーディングの後に符号を割り当てなければならない。本発明では、前記符号を割り当てる方法を、1Dと2Dの場合に異にして適用する。例えば、1Dエントロピコーディングの場合は、該当のインデックスが‘0’でないと、別の1ビットの符号ビット(例えば、「bsSign」)を割り当てて転送する。2Dエントロピコーディングの場合は、2個のインデックスが連続して抽出されるので、前記抽出された2個のインデックス間の関連性をプログラム化し、符号ビットの割当するか否かを決定する。このプログラムは、抽出された2個のインデックスの和の値及び差分値と対応するエントロピテーブル内の最大絶対値(lav)を用いる。これにより、2Dの場合に、単に全てのインデックス毎に符号ビットを割り当てることに比べて転送ビット数を減らすことが可能になる。
【0206】
1Dエントロピテーブルは、インデックスが一つずつ導出されるので、全てのデータコーディング結果に利用可能である。一方、2Dエントロピテーブルは、インデックスが一度に2個ずつ導出されるので、特定の場合には使用が制約されることができる。例えば、前述したグルーピング過程を通じたデータコーディングがペアでないと、2Dエントロピテーブルのうち一部は使用が制限される。また、PBCコーディングの結果として算出されたパイロット基準値に対しても、2Dエントロピテーブルの使用が制限される。すなわち、前述したように、本発明のエントロピコーディングは、データコーディングの結果と関連して最も効率的なエントロピコーディング方式を用いることに特徴がある。以下、これについて詳細に説明する。
【0207】
1−3.2D方法(時間ペアリング/周波数ペアリング)
図19は、本発明による2Dエントロピコーディングの2つの方法の例示図である。2Dエントロピコーディングは、隣接する2個のインデックスを導出する過程であるから、前記連続した2個のインデックスの方向によって区分される。例えば、2個のインデックスが周波数方向に隣接した場合を、「2D−周波数ペアリング(以下、2D−FP)」という。また、2個のインデックスがタイム方向に隣接した場合を、「2D−時間ペアリング(以下、2D−TP)」という。
【0208】
図19に示すように、「2D−FP」及び「2D−TP」は、それぞれ別のインデックステーブルを構成することが可能である。エンコーダは、データコーディングされた結果によって最も効率的なエントロピコーディング方式を決定すべきである。以下、データコーディングに関連したエントロピコーディングの効率的な決定方法について説明する。
【0209】
1−4.エントロピコーディング信号処理方法
以下、本発明によるエントロピコーディングを用いた信号処理方法を説明する。
【0210】
本発明の信号処理方法は、まず、複数個のデータに対応する基準値とこの基準値に対応する差分値を獲得する。その後、前記差分値をエントロピデコーディングし、前記基準値及び前記エントロピデコーディングされた差分値を用いて、前記データを獲得する。なお、本発明は、前記基準値をエントロピデコーディングする過程をさらに含み、前記エントロピデコーディングされた基準値及び前記エントロピデコーディングされた差分値を用いて前記データを獲得する過程をさらに含むことができる。
【0211】
また、エントロピコーディング識別情報を獲得する過程をさらに含むことができ、前記エントロピデコーディングは、前記エントロピコーディング識別情報が表すエントロピコーディング方式によって行われる。ここで、エントロピコーディング方式は、1Dコーディング方式と多次元(例えば、2D)コーディング方式のうちの一つであり、多次元コーディング方式は、周波数ペア(FP)コーディング方式と時間ペア(TP)コーディング方式のうちの一つである。なお、前記基準値は、パイロット基準値及び差分基準値のうち一つになることができる。また、前記信号処理方法は、前記データをパラメータとして用いてオーディオ信号を復元する過程をさらに含むことができる。
【0212】
また、本発明の信号処理装置は、複数個のデータに対応する基準値とこの基準値に対応する差分値を獲得する値獲得部と、前記差分値をエントロピデコーディングするエントロピデコーディング部と、前記基準値及び前記エントロピデコーディングされた差分値を用いて、前記データを獲得するデータ獲得部と、を含む。前記値獲得部は、前述したビットストリーム逆多重化部60内に含まれ、前記データ獲得部は、前述したデータデコーディング部91または92内に含まれる。
【0213】
また、本発明の信号処理方法は、複数個のデータに対応する基準値と前記データを用いて差分値を生成する。その後、前記生成された差分値をエントロピエンコーディングと、前記エントロピエンコーディングされた差分値を出力する。前記信号処理方法は、前記基準値をエントロピエンコーディングし、前記エントロピエンコーディングされた基準値は転送される。また、前記エントロピエンコーディングに用いられたエントロピコーディング方式を生成する過程をさらに含み、前記生成されたエントロピコーディング方式は転送される。
【0214】
また、本発明の信号処理装置は、複数個のデータに対応する基準値と前記データを用いて差分値を生成する値生成部と、前記生成された差分値をエントロピエンコーディングするエントロピエンコーディング部と、前記エントロピエンコーディングされた差分値を転送する出力部と、を含む。前記値生成部は、前述したデータエンコーディング部31または32内に含まれ、前記出力部は、前述したビットストリーム多重化部50内に含まれる。
【0215】
また、本発明の他の信号処理方法は、複数個のデータコーディング方式に対応するデータを獲得し、データコーディング方式に固有なエントロピテーブル識別子を用いて、前記データに含まれたパイロット基準値及びパイロット差分値のうち少なくとも一つに対するエントロピテーブルを決定する。その後、前記エントロピテーブルを用いて、パイロット基準値及びパイロット差分値のうち少なくとも一つをエントロピデコーディングする。前記エントロピテーブル識別子は、パイロットコーディング方式、周波数差分コーディング方式及びタイム差分コーディング方式のうち一つに固有であることを特徴とする。また、前記エントロピテーブル識別子は、前記パイロット基準値及びパイロット差分値にそれぞれ固有であることを特徴とする。
【0216】
前記エントロピテーブルは、前記エントロピテーブル識別子に固有であり、パイロットテーブル、周波数差分テーブル及びタイム差分テーブルのうち一つになることができる。また、前記エントロピテーブルは、前記エントロピテーブル識別子に固有でたく、周波数差分テーブル及びタイム差分テーブルのうち一つを共に使用しても良い。
【0217】
また、前記パイロット基準値に対応するエントロピテーブルは、周波数差分テーブルを使用することができる。この場合、前記パイロット基準値は、前記一次元エントロピコーディング方式によってエントロピデコーディングされる。
【0218】
前記エントロピコーディング方式は、1Dエントロピコーディング方式及び2Dエントロピコーディング方式を含む。特に、2Dエントロピコーディング方式は、周波数ペア(2D−FP)コーディング方式及び時間ペア(2D−TP)コーディング方式を含む。また、本発明は、前記データをパラメータとして用いてオーディオ信号を復元することができる。
【0219】
また、本発明の他の信号処理装置は、複数個のデータに対応するパイロット基準値とこのパイロット基準値に対応するパイロット差分値を獲得する値獲得部と、前記パイロット差分値をエントロピデコーディングするエントロピデコーディング部と、を含む。また、前記パイロット基準値及び前記エントロピデコーディングされたパイロット差分値を用いて、前記データを獲得するデータ獲得部を含む。
【0220】
また、本発明のさらに他の信号処理方法は、複数個のデータに対応するパイロット基準値と前記データを用いてパイロット差分値を生成し、前記生成されたパイロット差分値をエントロピエンコーディングする。その後、前記エントロピエンコーディングされたパイロット差分値を転送する。また、前記エントロピエンコーディングに用いられるテーブルは、パイロット専用テーブルでありうる。この方法は、前記パイロット基準値をエントロピエンコーディングする過程をさらに含み、前記エントロピエンコーディングされたパイロット基準値は転送される。
【0221】
また、この方法、前記エントロピエンコーディングに用いられたエントロピコーディング方式を生成する過程をさらに含み、前記生成されたエントロピコーディング方式は転送される。
【0222】
また、本発明のさらに他の信号処理装置は、複数個のデータに対応するパイロット基準値と前記データを用いてパイロット差分値を生成する値生成部と、前記生成されたパイロット差分値をエントロピエンコーディングするエントロピエンコーディング部と、前記エントロピエンコーディングされたパイロット差分値を転送する出力部と、を含む。
【0223】
2.データコーディングとの関係
前述したように、本発明は、3つのデータコーディング方式を説明した。この中で、PCM方式によるデータは、エントロピコーディングを行わない。以下、PBCコーディングとエントロピコーディングとの関係及びDIFFコーディングとエントロピコーディングとの関係をそれぞれ説明する。
【0224】
2−1.PBCコーディングとエントロピコーディング
図20は、本発明によるPBCコーディング結果に対するエントロピコーディング方法を示す。前述したように、PBCコーディングを行った後には、一つのパイロット基準値と複数の差分値が算出され、前記パイロット基準値と差分値はいずれもエントロピコーディングの対象となる。
【0225】
例えば、前述したグルーピング方法によって、PBCコーディングが適用されるグループが決定されるので、図20では説明の便宜上、時間軸上でペアである場合とノンペアである場合を取り上げた。以下、PBCコーディング実行後のエントロピコーディングについて説明する。
【0226】
まず、PBCコーディングがノンペアで行われた場合83について説明する。エントロピコーディングの対象となる一つのパイロット基準値は、1Dエントロピコーディングを行い、残りの差分値は1Dエントロピコーディングまたは2D−FPエントロピコーディングが可能である。すなわち、ノンペアの場合、時間軸上に一つのデータセットに対する一つのグループのみが存在するので、2D−TPエントロピコーディングを行うことができなくなる。また、2D−FPを行う場合でも、2個ずつインデックスを導出した後、ペアを形成できない最後のバンド81a内のパラメータ値は、1Dエントロピコーディングを行わなければならない。前記各データ別エントロピコーディング方式が決定されると、該当のエントロピテーブルを用いてコードワードを生成する。
【0227】
ここで、本発明は、例えば、前記パイロット基準値が一つのグループに対して一つのみ生成される場合であるから、1Dエントロピコーディングを行わねばならない。ただし、本発明を適用した他の使用例で、一つのグループ内に2個以上のパイロット基準値を生成した場合では、連続したパイロット基準値に対して2Dエントロピコーディングを行うことも可能である。
【0228】
次に、PBCコーディングがペアで行われた場合84について説明する。エントロピコーディングの対象となる一つのパイロット基準値は、1Dエントロピコーディングを行い、残りの差分値は1Dエントロピコーディング、2D−FPエントロピコーディングまたは2D−TPエントロピコーディングのいずれを行っても良い。すなわち、ペアの場合、時間軸上に隣接した2つのデータセットに対する一つのグループが存在するので、2D−TPエントロピコーディングも可能になる。また、2D−FPを行う場合においても、2個ずつインデックスを導出した後、ペアを形成できない最後のバンド81b,81c内のパラメータ値は、1Dエントロピコーディングを行わなければならない。ただし、図20から確認できるように、2D−TPエントロピコーディングを適用する場合では、上記のようなペアを形成できない最後のバンドは存在しない。
【0229】
2−2.DIFFコーディングとエントロピコーディング
図21は、本発明によるDIFFコーディング結果に対するエントロピコーディング方法を示す図である。前述したように、DIFFコーディングを行った後には一つの基準値と複数の差分値が算出され、前記基準値と差分値はいずれもエントロピコーディングの対象となる。ただし、DIFF−DTの場合は、基準値が存在しなくても良い。
【0230】
例えば、前述したグルーピング方法によって、DIFFコーディングが適用されるグループが決定されるので、図21では、説明の便宜上、時間軸上にペアである場合とノンペアである場合を取り上げた。また、図21は、データコーディングの単位となるデータセットを、DIFFコーディング方向によって時間軸方向のDIFF−DTと、周波数軸方向のDIFF−DFとに区分した場合を示す。以下、DIFFコーディングを行った後のエントロピコーディングについて説明する。
【0231】
まず、DIFFコーディングがノンペアで行われた場合について説明する。すなわち、ノンペアの場合、時間軸上に一つのデータセットが存在し、このデータセットは、DIFFコーディング方向によって、DIFF−DFまたはDIFF−DTとなることができる。
【0232】
例えば、ノンペアの一つのデータセットが、DIFF−DFである場合(85)、基準値は、第1バンド82a(これを「First band」という。)内のパラメータ値となる。この基準値は1Dエントロピコーディングを行い、残りの差分値は1Dエントロピコーディングまたは2D−FPエントロピコーディングを行うことが可能である。すなわち、ノンペアで且つDIFF−DFである場合、時間軸上に一つのデータセットに対する一つのグループのみが存在するので、2D−TPエントロピコーディングを行うことができなくなる。また、2D−FPを行う場合でも、2個ずつインデックスを導出した後、ペアを形成できない最後のバンド83a内のパラメータ値は、1Dエントロピコーディングを行わなければならない。前記各データ別エントロピコーディング方式が決定されると、対応するエントロピテーブルを用いてコードワードを生成する。
【0233】
また、例えばノンペアの一つのデータセットがDIFF−DTである場合(86)、基準値は、該当のデータセット内に存在しないので、「First band」処理は行わない。したがって、全ての差分値は1Dエントロピコーディングまたは2D−FPエントロピコーディングを行うことができる。ここで、ノンペアで且つDIFF−DTである場合に、差分値を求めるためのデータセットは、データペアを構成しない隣接したデータセットまたは他のオーディオフレーム内のデータセットでありうる。すなわち、ノンペアで且つDIFF−DTである場合(86)、時間軸上に一つのデータセットに対する一つのグループのみが存在するので、2D−TPエントロピコーディングを行うことができなくなる。また、2D−FPを行う場合でも、2個ずつインデックスを導出した後、ペアを形成できない最後のバンド内のパラメータ値は、1Dエントロピコーディングを行わなければならない。ただし、図21では、単に、ペアを形成できない最後のバンドが存在しない場合を取り上げている。前記各データ別エントロピコーディング方式が決定されると、対応するエントロピテーブルを用いてコードワードを生成する。
【0234】
次に、DIFFコーディングがペアで行われた場合について説明する。すなわち、データコーディングがペアの場合、時間軸上に2個のデータセットが一つのグループを構成し、前記グループ内の各データセットは、DIFFコーディング方向によって、DIFF−DFまたはDIFF−DTとなることができる。したがって、ペアをなす2個のデータセットがいすれもDIFF−DFである場合(87)と、ペアをなす2個のデータセットがいずれもDIFF−DTである場合(89)と、ペアをなす2個のデータセットが相互に異なるコーディング方向を持つ場合(88)(例えば、DIFF−DF/DTまたはDIFF−DT/DF)とに区別できる。
【0235】
例えば、ペアの2個のデータセットがいずれもDIFF−DFである場合(87)(すなわち、DIFF−DF/DF)、基本的に、各データセットは前述したノンペアであり且つデータセットがDIFF−DFの場合に適用可能な全てのエントロピコーディング方式を行うことができる。例えば、該当のデータセット内のそれぞれの基準値は、「First band」82b,82c内のパラメータ値となり、この基準値には1Dエントロピコーディングが行われる。残りの差分値は、1Dエントロピコーディングまたは2D−FPエントロピコーディングを行うことができる。また、対応するデータセット内で2D−FPを行う場合でも、2個ずつインデックスを導出した後、ペアを形成できない最後のバンド83b,83c内のパラメータ値は、1Dエントロピコーディングを行わなければならない。また、2個のデータセットがペアであるので、2D−TPエントロピコーディングも行うことができる。この場合、対応するデータセット内の「First band」82b,82cを除外した次のバンドから最後のバンドまで順次に2D−TPエントロピコーディングを行う。2D−TPエントロピコーディングを行うと、ペアを形成できない最後のバンドは生成されない。前記各データ別エントロピコーディング方式が決定されると、対応するエントロピテーブルを用いてコードワードを生成する。
【0236】
また、例えば、ペアの2個のデータセットがいずれもDIFF−DTである場合(89)(すなわち、DIFF−DT/DT)、例えば、基準値は、該当のデータセット内に存在しないので、「First band」処理は行わない。また、それぞれのデータセット内の全ての差分値は、1Dエントロピコーディングまたは2D−FPエントロピコーディングが行うことができる。該当のデータセット内で2D−FPを行う場合でも、2個ずつインデックスを導出した後、ペアを形成できない最後のバンド内のパラメータ値は1Dエントロピコーディングを行わなければならない。ただし、図21では、単に、ペアを形成できない最後のバンドが存在しない場合を取り上げている。また、2個のデータセットがペアであるから、2D−TPエントロピコーディングも行うことができる。この場合、対応するデータセット内の最初のバンドから最後のバンドまで順次に2D−TPエントロピコーディングを行う。2D−TPエントロピコーディングを行うと、ペアを形成できない最後のバンドは生成されない。前記各データ別エントロピコーディング方式が決定されると、対応するエントロピテーブルを用いてコードワードを生成する。
【0237】
また、例えば、ペアの2個のデータセットが相互に異なるコーディング方向を持つ場合(88)(すなわち、DIFF−DF/DTまたはDIFF−DT/DF)が存在可能である。図21では、DIFF−DF/DTである場合を取り上げている。この場合、それぞれのデータセットは、基本的に、対応するコーディングタイプによって適用可能な全てのエントロピコーディング方式を行うことができる。
【0238】
例えば、ペアを構成する2個のデータセットのうち、DIFF−DFであるデータセットは、対応するデータセット(DIFF−DF)内の基準値で「First band」82d内のパラメータ値を1Dエントロピコーディングする。残りの差分値には、1Dエントロピコーディングまたは2D−FPエントロピコーディングを行うことができる。また、該当のデータセット(DIFF−DF)内で2D−FPを行う場合でも、2個ずつインデックスを導出した後、ペアを形成できない最後のバンド83d内のパラメータ値には1Dエントロピコーディングを行わなければならない。
【0239】
また、例えば、ペアを構成する2個のデータセットのうち、DIFF−DTであるデータセットは、基準値が存在しないので、「First band」処理は行わない。該当のデータセット(DIFF−DT)内の全ての差分値は、1Dエントロピコーディングまたは2D−FPエントロピコーディングを行うことができる。該当のデータセット(DIFF−DT)内で2D−FPを行う場合でも、2個ずつインデックスを導出した後、ペアを形成できない最後のバンド内のパラメータ値は1Dエントロピコーディングを行わなければならない。ただし、図21では、単に、ペアを形成できない最後のバンドが存在しない場合を取り上げている。
【0240】
また、ペアの2個のデータセットが相互に異なるコーディング方向を持つ場合(DIFF−DF/DTまたはDIFF−DT/DF)であるので、2D−TPエントロピコーディングも行うことができる。この場合、前記「First band」82dを含む第1バンドを除外した、次のバンドから最後のバンドまで順次に2D−TPエントロピコーディングを行う。2D−TPエントロピコーディングを行うと、ペアを形成できない最後のバンドは生成されない。前記各データ別エントロピコーディング方式が決定されると、該当のエントロピテーブルを用いてコードワードを生成する。
【0241】
2−3.エントロピコーディングとグルーピング
前述したように、2D−FPまたは2D−TPエントロピコーディングの場合、一つのコードワードを用いて2個のインデックスを抽出する。したがって、これは、前記エントロピコーディングにグルーピング方式が行われたことを意味する。これを「時間グルーピング」及び「周波数グルーピング」と呼ぶことができる。
【0242】
例えば、エンコーディング部は、データコーディング段階で抽出された2個のインデックスを、周波数方向または時間方向にグルーピングする。その後、エンコーディング部は、前記グルーピングされた2個のインデックスを表現する一つのコードワードをエントロピテーブルを用いて選定し、これをビットストリームに含めて転送する。デコーディング部は、前記ビットストリーム内に含まれた2個のインデックスをグルーピングした一つのコードワードを受信し、適用されたエントロピテーブルを確認し、2個のインデックス値を抽出する。
【0243】
2−4.データコーディングとエントロピコーディングとの関係による信号処理方法
以下、前述したPBCコーディングとエントロピコーディングとの関係及びDIFFコーディングとエントロピコーディングとの関係による本発明の信号処理方法の特徴について説明する。
【0244】
本発明の信号処理方法は、差分情報を獲得し、時間グルーピング及び周波数グルーピングを含むエントロピコーディング方式によって、前記差分情報をエントロピデコーディングする。また、パイロット差分、時間差分及び周波数差分を含むデータコーディング方式によって、前記差分情報をデータデコーディングする。データコーディングとエントロピコーディングの具体的な関連性は、前述した内容と同様である。
【0245】
また、本発明の他の信号処理方法は、デジタル信号を獲得し、前記デジタル信号をエントロピコーディング方式によってエントロピデコーディングする。また、少なくともパイロットコーディング方式を含めた複数個のデータコーディング方式のうちの一つによって、前記エントロピデコーディングされたデジタル信号をデータデコーディングする。この場合、前記データコーディング方式によって前記エントロピコーディング方式を定めることができる。
【0246】
また、本発明の他の信号処理装置は、デジタル信号を獲得する信号獲得部と、前記デジタル信号をエントロピコーディング方式によってエントロピデコーディングするエントロピデコーディング部と、少なくともパイロットコーディング方式を含む複数個のデータコーディング方式のうちの一つによって、前記エントロピデコーディングされたデジタル信号をデータデコーディングするデータデコーディング部と、を含む。
【0247】
また、本発明のさらに他の信号処理方法は、デジタル信号をデータコーディング方式によってデータエンコーディングし、前記データエンコーディングされたデジタル信号をエントロピコーディング方式によってエントロピエンコーディングする。また、前記エントロピエンコーディングされたデジタル信号を転送する。同様に、前記データコーディング方式によって前記エントロピコーディング方式を定めることができる。
【0248】
また、本発明のさらに他の信号処理装置は、デジタル信号をデータコーディング方式によってデータエンコーディングするデータエンコーディング部と、前記データエンコーディングされたデジタル信号をエントロピコーディング方式によってエントロピエンコーディングするエントロピエンコーディング部と、を含む。さらに、前記エントロピエンコーディングされたデジタル信号を転送する出力部を含むことができる。
【0249】
3.エントロピテーブルの選択
エントロピコーディングのためのエントロピテーブルは、データコーディング方式及びエントロピの対象となるデータ種類によって自動で決定される。例えば、データの種類がCLDパラメータであり、エントロピコーディングの対象がパイロット基準値である場合、エントロピコーディングは、「hcodPilot_CLD」とテーブル名が付いた1Dエントロピテーブルを用いる。
【0250】
また、データの種類がCPCパラメータであり、データコーディングはDIFF−DFであり、エントロピコーディングの対象が第1バンド(first band)値である場合、エントロピコーディングは、「hcodFirstband_CPC」とテーブル名が付いた1Dエントロピテーブルを用いる。
【0251】
また、データの種類がICCパラメータであり、データコーディング方式がPBCであり、エントロピコーディングが2D−TPで行われる場合、エントロピコーディングは「hcod2D_ICC_PC_TP_LL」とテーブル名が付いた2D−PC/TPエントロピテーブルを用いる。この場合、2Dエントロピテーブル名内の「LL」は、テーブル内の最大絶対値(以下、「LAV(Largest Absolute Vaule)」)を意味する。この最大絶対値(LAV)については後述する。
【0252】
また、データの種類がICCパラメータであり、データコーディング方式がDIFF−DFであり、エントロピコーディングが2D−FPで行われる場合、エントロピコーディングは、「hcod2D_ICC_DF_FP_LL」とテーブル名の付いた2D−FPエントロピテーブルを用いる。
【0253】
すなわち、複数のエントロピテーブルのうちいずれのテーブルを用いてエントロピコーディングを行うかは、非常に重要な問題である。また、各エントロピの対象となる各データの特性に合うエントロピテーブルを独立して構成することが好ましい。しかし、類似な属性を持つデータに対するエントロピテーブルは混用しても良い。その代表例として、データタイプが「ADG」または「ATD」である場合、前述したCLD用エントロピテーブルを適用することができる。また、PBCコーディングのパイロット基準値には、前述した「First band」用エントロピテーブルを適用することができる。以下、最大絶対値(LAV)を用いたエントロピテーブルの選択方法について詳細に説明する。
【0254】
3−1.エントロピテーブルの最大絶対値(LAV)
図22は、本発明によるエントロピテーブル選択方法を説明するための図である。図22の(a)は、複数個(n個)のエントロピテーブルを示し、図22の(b)は、前記エントロピテーブルを選択するためのテーブルを示す。
【0255】
前述したように、エントロピテーブルは、データコーディング及びデータの種類によって複数個存在する。例えば、これらのエントロピテーブルは、データの種類が「xxx」の場合に適用可能なエントロピテーブル(例えば、テーブル1〜4)、データの種類が「yyy」の場合に適用可能なエントロピテーブル(例えば、テーブル5〜8)、PBC専用エントロピテーブル(例えば、テーブルk〜k+1)、後述するエスケープ(escape)用エントロピテーブル(例えば、テーブルn−2〜n−1)、及び、後述する最大絶対値インデックス(LAV Index)用エントロピテーブル(例えば、テーブルn)を含むことができる。
【0256】
特に、前記データの種類別エントロピテーブルは、対応するデータで発生可能な全てのインデックスにコードワードを与えてテーブルを構成することが好ましい。しかし、このようにエントロピテーブルを構成する場合、テーブルの容量が大きすぎになるだけでなく、不必要なまたはほとんど発生しないインデックスも管理せねばならないという不便さがある。特に、このような問題点は、2Dエントロピテーブルの場合に、発生の場合の数が多すぎるので、より不便を招く。これを解決するために前述の最大絶対値(LAV)を用いる。
【0257】
例えば、特定のデータ種類(例えば、CLD)に対してインデックス値の範囲を“−X〜+X(X=15)”と仮定すれば、この範囲内で確率的に発生頻度が高い最大絶対値(LAV)を少なくとも一つ以上選定し、これを別途テーブルとして構成できる。より具体的には、例えば、上記の場合でCLD用エントロピテーブルを構成するにおいて、“LAV=3”のテーブル、“LAV=5”のテーブル、“LAV=7”のテーブル、“LAV=9”のテーブルをそれぞれ備えることができる。例えば、図22の(a)でテーブル1(91a)がCLD用“LAV=3”のテーブルを意味し、テーブル2(91b)はCLD用“LAV=5”のテーブルを意味し、テーブル3(91c)はCLD用“LAV=7”のテーブルを意味し、テーブル4(91d)はCLD用“LAV=9”のテーブルを意味することと設定可能である。前記LAVテーブル内でLAV範囲を外れるインデックスは、エスケープ用エントロピテーブル(例えば、テーブルn−2〜n−1)によって処理される。例えば、CLD用“LAV=7”のテーブル(91c)を使用してコーディングする際に、最大値「7」を外れるインデックス(例えば、「8,9,…,15」)が発生すると、該当のインデックスは、エスケープ用エントロピテーブル(例えば、テーブルn−2〜n−1)によって別途処理される。
【0258】
同様に、他のデータの種類(例えば、ICC、CPCなど)にも前記CLD用テーブルと同じ方式でLAVテーブルを設定可能である。ただし、各データ別LAVはお互いに相異値を持つこととなり、これはデータの種類別範囲が相互に異なるためである。具体的には、例えば、ICC用エントロピテーブルを構成するにおいて、“LAV=1”のテーブル、“LAV=3”のテーブル、“LAV=5”のテーブル、“LAV=7”のテーブルをそれぞれ備えることができる。また、CPC用エントロピテーブルを構成するにおいて、“LAV=3”のテーブル、“LAV=6”のテーブル、“LAV=9”のテーブル、“LAV=12”のテーブルをそれぞれ備えることができる。
【0259】
3−2.最大絶対値インデックス(LAV Index)用エントロピテーブル
本発明は、LAVを用いてエントロピテーブルを選択するために、最大絶対値インデックス(LAV Index)を用いる。すなわち、図22の(b)を参照すると、データタイプ別LAV値は、再びLAVインデックス(LAV Index)によって区別される。すなわち、最後に使われるエントロピテーブルを選択するためには、まず、対応するデータタイプ別「LAV Index」を確認し、その後、「LAV Index」に該当する「LAV」を確認しなければならない。前記最後に確認された「LAV」値は、前述したエントロピテーブル名の構成において「LL」に該当する。例えば、データ種類がCLDパラメータであり、データコーディング方式がDIFF−DFであり、エントロピコーディングが2D−FPで行われ、「LAV=3」である場合、エントロピコーディングは、「hcod2D_CLD_DF_FP_03」とテーブル名の付いたエントロピテーブルを用いることになる。
【0260】
前記データタイプ別「LAV Index」の確認において、本発明は、「LAV Index」用エントロピテーブルを別途使用することに特徴がある。これは、「LAV Index」自体をエントロピコーディングの対象として処理するということを意味する。例えば、図22の(a)でテーブルnが「LAV Index」用エントロピテーブル91eとして使われる。これは、表1で示される。
【0261】
【表1】

【0262】
これは、前記「LAV Index」値自体も統計的に使用頻度が互いに異なるというのを意味する。例えば、“LAV Index=0”が最も使用頻度数が高いので、これに1ビットを割り当てる。次に使用頻度の高い“LAV Index=1”には2ビットを割り当てる。最後に使用頻度の低い“LAV Index=2、3”にはそれぞれ3ビットを割り当てる。
【0263】
したがって、上記のように「LAV Index」用エントロピテーブル91eを使用しない場合は、4つの「LAV Index」を区分するために、LAVエントロピテーブルを用いる度に「2ビット」の識別情報を転送しなければならない。しかし、本発明の「LAV Index」用エントロピテーブル91eを用いると、例えば、発生頻度が60%以上である“LAV Index=0”の場合に対して「1ビット」コードワードのみを転送すればいいので、以前方式に比べて転送効率がより高められる。
【0264】
ここで、前記キップ1の「LAV Index」用エントロピテーブル91eは、4つの「LAV Index」に対して適用した場合であるが、「LAV Index」がそれよりも多い場合には、より転送効率が上げられることは自明である。
【0265】
3−3.エントロピテーブル選択を用いた信号処理方法
以下、前述したエントロピテーブル選択を用いた信号処理方法及び装置について説明する。
【0266】
本発明の信号処理方法は、インデックス情報を獲得し、前記インデックス情報をエントロピデコーディングし、前記エントロピデコーディングされたインデックス情報に該当するコンテンツを識別する過程を含む。前記インデックス情報は、確率的な利用頻度特性を持つインデックスに関する情報である。また、前述したように、インデックス専用エントロピテーブル91eを用いて前記インデックス情報をエントロピデコーディングする。前記コンテンツは、データの種類別に分類され、データのデコーディングに用いられる。また、前記コンテンツは、グルーピング情報になることができ、前記グルーピング情報は、複数個のデータのグルーピングに関する情報である。また、前記エントロピテーブルのインデックスは、前記エントロピテーブルに含まれたインデックスのうち最大絶対値(LAV)であることを特徴とする。また、前記エントロピテーブルは、前記パラメータを2次元エントロピデコーディングする時に用いられる。
【0267】
また、本発明の信号処理装置は、インデックス情報を獲得する情報獲得部と、前記インデックス情報をエントロピデコーディングするデコーディング部と、前記エントロピデコーディングされたインデックス情報に該当するコンテンツを識別する識別部と、を含む。
【0268】
また、本発明の他の信号処理方法は、コンテンツを識別するインデックス情報を生成し、前記インデックス情報をエントロピエンコーディングする。その後、前記エントロピエンコーディングされたインデックス情報を転送する。
【0269】
また、本発明の他の信号処理装置は、コンテンツを識別するインデックス情報を生成する情報生成部と、前記インデックス情報をエントロピエンコーディングするエンコーディング部と、前記エントロピエンコーディングされたインデックス情報を送る情報出力部と、を含む。
【0270】
また、本発明のさらに他の信号処理方法は、差分値とインデックス情報を獲得し、前記インデックス情報をエントロピデコーディングし、前記エントロピデコーディングされたインデックス情報に該当するエントロピテーブルを識別し、前記識別されたエントロピテーブルを用いて、前記差分値をエントロピデコーディングする過程を含む。その後、複数個のデータに対応する基準値と前記デコーディングされた差分値を用いて前記データを獲得する。前記基準値は、パイロット基準値または差分基準値でありうる。また、インデックス専用エントロピテーブルを用いて前記インデックス情報をエントロピデコーディングし、前記エントロピテーブルは、前記データの種類別に分類される。
【0271】
また、前記データはパラメータであり、上記方法は、前記パラメータを用いてオーディオ信号を復元する過程をさらに含む。また、前記差分値をエントロピデコーディングする場合、前記エントロピテーブルを用いて前記差分値を2次元エントロピデコーディングする。また、上記方法は、前記基準値を獲得し、前記基準値専用エントロピテーブルを用いて前記基準値をエントロピデコーディングする過程をさらに含むことができる。
【0272】
また、本発明のさらに他の信号処理装置は、差分値とインデックス情報を獲得する入力部と、前記インデックス情報をエントロピデコーディングするインデックスデコーディング部と、前記エントロピデコーディングされたインデックス情報に該当するエントロピテーブルを識別するテーブル識別部と、前記エントロピテーブルを用いて、前記差分値をエントロピデコーディングするデータデコーディング部と、を含む。また、複数個のデータに対応する基準値と前記デコーディングされた差分値を用いて前記データを獲得するデータ獲得部をさらに含む。
【0273】
また、本発明のさらに他の信号処理方法は、複数個のデータに対応する基準値と前記データを用いて差分値を生成し、エントロピテーブルを用いて差分値をエントロピエンコーディングし、前記エントロピテーブルを識別するインデックス情報を生成する過程を含む。また、前記インデックス情報をエントロピエンコーディングする過程及び前記エントロピエンコーディングされたインデックス情報と前記差分値を送る過程をさらに含む。
【0274】
本発明のさらに他の信号処理装置は、複数個のデータに対応する基準値と前記データを用いて差分値を生成する値生成部と、エントロピテーブルを用いて差分値をエントロピエンコーディングする値エンコーディング部と、前記エントロピテーブルを識別するインデックス情報を生成する情報生成部と、前記インデックス情報をエントロピエンコーディングするインデックスエンコーディング部と、を含む。この装置は、前記エントロピエンコーディングされたインデックス情報と前記差分値を送る情報出力部をさらに含む。
【0275】
[データ構造]
以下、前述した本発明のデータコーディング、グルーピング及びエントロピコーディングに関連した様々な情報を含むデータ構造について説明する。図23は、本発明が適用されるデータ構造を階層的に示す。
【0276】
本発明のデータ構造は、ヘッダ100と複数のフレーム101,102とを含む。ヘッダ100内には、下位フレーム101,102に共通して適用される構成情報が含まれる。構成情報は、前述したグルーピングに用いられるグルーピング情報を含む。このグルーピング情報は、例えば、第1タイムグルーピング情報100a、第1周波数グルーピング情報100b及びチャンネルグルーピング情報100cを含む。ここで、前記ヘッダ内の構成情報を「メイン構成情報」という。また、フレーム内に記録される情報部分を「ペイロード」という。
【0277】
より具体的に、本発明のデータ構造をオーディオ空間情報に適用した場合を取り上げて説明する。例えば、ヘッダ100内の第1タイムグルーピング情報100aは、“bsFrameLength”フィールドとなり、これは、フレーム内タイムスロットの個数を指定する情報である。また、第1周波数グルーピング情報100bは、“bsFreqRes”フィールドとなり、これは、フレーム内パラメータバンド数を指定する情報である。また、チャンネルグルーピング情報100cは、“OttmodeLFE−bsOttBands”フィールド及び“bsTttDualmode−bsTttBandsLow”フィールドを意味する。この“OttmodeLFE−bsOttBands”フィールドは、LFEチャンネルに適用されるパラメータバンド数を指定する情報であり、“bsTttDualmode−bsTttBandsLow”フィールドは、低周波帯域及び高周波帯域の両方を持つデュアルモード内の低周波帯域のパラメータバンド数を指定する情報である。ただし、“bsTttDualmode−bsTttBandsLow”フィールドは、チャンネルグルーピング情報ではなく周波数グルーピング情報として分類されることができる。
【0278】
また、それぞれのフレームは、フレーム内の全てのグループに共通して適用されるフレーム情報(Frame Info)101aと複数のグループ101b,101cを含む。フレーム情報101aは、時間選択情報103a、第2時間グルーピング情報103b及び第2周波数グルーピング情報103cを含む。ここで、フレーム情報101aは、各フレーム別に適用される「サブ構成情報」ともいう。
【0279】
より具体的に、本発明のデータ構造をオーディオ空間情報に適用した場合を取り上げて説明すると、次の通りである。例えば、フレーム情報101a内の時間選択情報103aは、“bsNumParamset”フィールド、“bsParamslot”フィールド及び“bsDataMode”フィールドを含む。“bsNumParamset”フィールドは、全体フレーム内に存在するパラメータセット(parameter set)の個数を指定する情報である。また、“bsParamslot”フィールドは、パラメータセットが存在するタイムスロットの位置を指定する情報である。
【0280】
また、“bsDataMode”フィールドは、前記各パラメータセットのエンコーディング及びデコーディング処理方法を指定する情報である。例えば、特定パラメータセットの“bsDataMode=0”(例えば、「デフォルトモード」)である場合、デコーディング部は、該当のパラメータセットをデフォルト値に取り替える。また、特定パラメータセットの“bsDataMode=1”(例えば、「先モード」)である場合、デコーディング部は、先パラメータセットのデコーディング値を保持する。また、特定パラメータセットの“bsDataMode=2”(例えば、「補間モード」)である場合、デコーディング部は、パラメータセット間の補間を通じて対応するパラメータセットを算出する。最後に、特定パラメータセットの“bsDataMode=3”(例えば、「読取モード」)である場合、対応するパラメータセットに対するコーディングデータが転送されるということを意味する。したがって、フレーム内の複数のグループ101b,101cは、“bsDataMode=3”(例えば、「読取モード」)である場合に転送されるデータで構成されるグループである。したがって、デコーディング部は、“bsDataMode=3”である場合、後述する各グループ内のコーディングタイプ情報を参照してデータをデコーディングする。
【0281】
次いで、前記“bsDataMode”フィールドを用いた本発明の信号処理方法及び装置について具体的に説明する。
【0282】
前記“bsDataMode”フィールドを用いた本発明の信号処理方法は、モード情報を獲得する段階と、前記モード情報が表すデータの属性によって、複数個のデータに対応するパイロット基準値と前記パイロット基準値に対応するパイロット差分値を獲得する段階と、前記パイロット基準値と前記パイロット差分値を用いて前記データを獲得する段階と、を含む。また、この信号処理方法で、前記データはパラメータであり、前記パラメータを用いてオーディオ信号を復元する段階をさらに含む。また、前記モード情報が読取モードを表す場合、パイロット差分値を獲得する。前記モード情報は、デフォルトモード、先モード、補間モードのうち少なくとも一つをさらに含む。また、この信号処理方法は、前記パイロット差分値をグループバンド別に獲得する。また、この信号処理方法は、前記読取モードの個数を識別するための第1変数(例えば、「dataset」)及びこの第1変数に基づいて、パイロット差分値を獲得するための第2変数(例えば、「setidx」)を用いる。
【0283】
また、“bsDataMode”フィールドを用いた本発明の信号処理装置は、モード情報を獲得する情報獲得部と、前記モード情報が表すデータの属性によって、複数個のデータに対応するパイロット基準値と前記パイロット基準値に対応するパイロット差分値を獲得する値獲得部と、前記パイロット基準値と前記パイロット差分値を用いて前記データを獲得するデータ獲得部と、を含む。前記値獲得部、パラメータ決定部及びデータ獲得部は、前述したデータデコーディング部91または92内に備えられる。
【0284】
また、“bsDataMode”フィールドを用いた本発明の他の信号処理方法は、データの属性を表すモード情報を生成する段階と、前記データの属性によって複数個のデータに対応するパイロット基準値と前記データを用いてパイロット差分値を生成する段階と、前記生成された差分値を転送する段階と、を含む。この信号処理方法は、前記生成された差分値をエンコーディングする段階をさらに含む。
【0285】
“bsDataMode”フィールドを用いた本発明の他の信号処理装置は、データの属性を表すモード情報を生成する情報生成部と、前記データの属性によって複数個のデータに対応するパイロット基準値と前記データを用いてパイロット差分値を生成する値生成部と、前記生成された差分値を転送する出力部と、を含む。前記値生成部は、前述したデータエンコーディング部31または32内に備えられる。
【0286】
また、フレーム情報101a内の第2タイムグルーピング情報103bは、“bsDatapair”フィールドを含む。この“bsDatapair”フィールドは、“bsDataMode=3”によって指定されたデータセット間のペアの有無を指定する情報である。すなわち、“bsDatapair”フィールドによって2つのデータセットが1つのグループにグルーピングされる。
【0287】
また、フレーム情報101a内の第2周波数グルーピング情報103cは、“bsFreqResStride”フィールドを含む。この“bsFreqResStride”フィールドは、前述した第1周波数グルーピング情報100bとして“bsFreqRes”フィールドによって1次グルーピングされたパラメータバンドを2次グルーピングする情報である。すなわち、“bsFreqResStride”フィールドによって指定された幅(stride)ずつパラメータバンドをまとめてデータバンドを生成する。これらのデータバンド別にパラメータ値が与えられる。
【0288】
また、それぞれのグループ101b,101cは、データコーディングタイプ情報104a、エントロピコーディングタイプ情報104b、コードワード104c及び付加データ104dを含む。
【0289】
より具体的に、本発明のデータ構造をオーディオ空間情報に適用した場合を取り上げて説明すると、次の通りである。例えば、各グループ101b,101c内のデータコーディングタイプ情報104aは、“bsPCMCoding”フィールド、“bsPilotCoding”フィールド、“bsDiffType”フィールド及び“bdDiffTimeDirection”フィールドを含む。“bsPCMCoding”フィールドは、対応するグループのデータコーディングがPCM方式かまたはDIFF方式かを識別する情報である。また、“bsPCMCoding”フィールドがPCM方式を指定する場合に限って、“bsPilotCoding”フィールドによってPBC方式か否かが指定される。また、“bsDiffType”フィールドは、DIFF方式が適用される場合にコーディング方向を指定する情報であり、「DF:DIFF−FREQ」及び「DT:DIFF−TIME」のうちのいずれか一つを指定する。また、“bdDiffTimeDirection”フィールドは、“bsDiffType”フィールドが「DT」の場合に、時間軸上のコーディング方向が「FORWARD」か、或いは、「BACKWARD」かを指定する情報である。
【0290】
また、各グループ101b,101c内のエントロピコーディングタイプ情報104bは、“bsCodingScheme”フィールド及び“bsPairing”フィールドを含む。“bsCodingScheme”フィールドは、エントロピコーディングが、1Dか或いは2Dかを指定する情報である。また、“bsPairing”フィールドは、“bsCodingScheme”フィールドが「2D」を指定する場合に、2個のインデックスを抽出する方向が周波数方向なのか(FP;周波数ペアリング)、時間方向なのか(TP;時間ペアリング)を指定する情報である。
【0291】
また、各グループ101b,101c内のコードワード104cは、“bsCodeW”フィールドを含み、この“bsCodeW”フィールドは、エントロピコーディングのために適用されたテーブル上のコードワードを指定する。したがって、前述した大部分のデータは、エントロピコーディングの対象となり、この場合、“bsCodeW”フィールドによって転送される。例えば、エントロピコーディングの対象となるPBCコーディングのパイロット基準値、「LAV Index」値も全て“bsCodeW”フィールドによって転送される。
【0292】
また、各グループ101b,101c内の付加データ104dは、“bsLsb”フィールド及び“bsSign”フィールドを含む。特に、付加データ104dは、“bsLsb”フィールド及び“bsSign”フィールドの他にも、エントロピコーディングされて“bsCodeW”フィールドによって転送されないその他全てのデータを含む。“bsLsb”フィールドは、前述した部分パラメータに適用されるフィールドで、データタイプが「CPC」であり、かつ、粗量子化でない場合に限って転送される付加情報である。また、“bsSign”フィールドは、1Dエントロピコーディングが適用された場合に抽出されたインデックスの符号を指定する情報である。また、付加データ104dには、PCM方式で転送されるデータが含まれる。
【0293】
以下、本発明による信号処理用データ構造の特徴について説明する。本発明の信号処理用データ構造は、フレーム別にパイロットコーディング情報を少なくとも含むデータコーディング情報及びエントロピコーディング情報のうちの少なくとも一つを有するペイロード部分と、このペイロード部分に関するメイン構成情報を有するヘッダ部分と、を含む。
【0294】
また、メイン構成情報は、全体フレームに関する時間情報を持つ第1時間情報部分と、全体フレームに関する周波数情報を持つ第1周波数情報部分と、を含む。また、このメイン構成情報は、複数個のデータを含む任意のグループを内部グルーピングする情報をフレーム別に有する第1内部グルーピング情報部分をさらに含む。
【0295】
また、前記フレームは、グループ別に前記データコーディング情報及び前記エントロピコーディング情報のうち少なくとも一つを有する第1データ部分と、この第1データ部分に関するサブ構成情報を有するフレーム情報部分と、を含む。ここで、サブ構成情報は、全体グループに関する時間情報を有する第2時間情報部分を含む。また、サブ構成情報は、複数個のデータを含む任意のグループに関する外部グルーピングの情報をグループ別に有する外部グルーピング情報部分をさらに含む。また、サブ構成情報は、複数個のデータを含む任意のグループを内部グルーピングする情報をグループ別に有する第2内部グルーピング情報部分をさらに含む。
【0296】
また、前記グループは、データコーディング方式に関する情報を有するデータコーディング情報と、エントロピコーディング方式に関する情報を有するエントロピコーディング情報と、複数個のデータに対応する基準値及びこの基準値と前記データを用いて生成された差分値を有する第2データ部分と、を含む。
【0297】
[オーディオコーディング(MPEG SURROUND)への適用]
以下、前述した本発明の概念及び特徴を統合して適用した一例について説明する。
【0298】
図24は、本発明の一実施例によるオーディオ圧縮及び復元のための装置構成を示す図である。図24を参照すると、全体装置構成は、オーディオ圧縮のための部分105〜400とオーディオ復元のための部分500〜800とを含む。
【0299】
圧縮のための部分105〜400は、ダウンミキシング部105、コアコーディング部200、空間情報コーディング部300及び多重化部400を含む。ダウンミキシング部105は、チャンネルダウンミキシング部110と空間情報生成部120とを含んで構成される。
【0300】
ダウンミキシング部105において、チャンネルダウンミキシング部110の入力は、N個のマルチチャンネル(X1,X2,…,XN)のオーディオ信号と、そのオーディオ信号である。チャンネルダウンミキシング部110は、定められたダウンミックス方式を用いて上記した入力のチャンネル個数よりも少ない個数のチャンネルにダウンミックスされた信号を出力する。ダウンミキシング部105の出力を、1つまたは2つのチャンネルにダウンミックスし、別のダウンミックス命令に応じて特定個数のチャンネルにダウンミックスし、または、システム実現上あらかじめ設定された特定個数のチャンネルにダウンミックスすることができる。
【0301】
コアコーディング部200は、チャンネルダウンミキシング部110の出力、すなわち、ダウンミックスされたオーディオ信号に対してコアコーディングを行う。コアコーディングは、離散変換方式のような様々な変換方式を用いて入力を圧縮する。
【0302】
空間情報生成部120は、マルチチャンネルのオーディオ信号から空間情報を抽出する。そして、抽出した空間情報を、空間情報コーディング部300に送信する。
【0303】
空間情報コーディング部300は、入力された空間情報に対するデータコーディングとエントロピコーディングを行う。空間情報コーディング部300は、データコーディングとして前述のPCM、PBC及びDIFFのうちの少なくとも一つを行い、場合によっては、エントロピコーディングをさらに行う。この空間情報コーディング部300でどんなデータコーディング方式を使用したかによって、空間情報デコーディング部700でのデコーディング方式を決定することができる。この空間情報コーディング部300の詳細は、図25を参照して後述する。
【0304】
コアコーディング部200の出力と空間情報コーディング部300の出力は、多重化部400に入力される。多重化部400は、前記2つの入力を多重化したビットストリームを、オーディオ復元のための部分500〜800に転送する。
【0305】
オーディオ復元のための部分500〜800は、逆多重化部500、コアデコーディング部600、空間情報デコーディング部700及びマルチチャンネル生成部800を含む。
【0306】
逆多重化部500は、受信したビットストリームをオーディオ部分と空間情報部分とに逆多重化する。ここで、オーディオ部分は、圧縮されたオーディオ信号であり、空間情報部分は、圧縮された空間情報である。
【0307】
コアデコーディング部600は、逆多重化部500から、圧縮されたオーディオ信号を受信する。コアデコーディング部600は、圧縮されたオーディオ信号に対するデコーディングを行い、ダウンミックスされたオーディオ信号を生成する。
【0308】
空間情報デコーディング部700は、逆多重化部500から、圧縮された空間情報を受信する。空間情報デコーディング部700は、圧縮された空間情報に対するデコーディングを行い、空間情報を生成する。
【0309】
この時、受信したビットストリームから、前述した図23のデータ構造内に含まれた様々なグルーピング情報及びコーディング情報を表す識別情報を抽出し、この識別情報によって少なくとも一つのデコーディング方式のうち特定デコーディング方式が選択される。この選択されたデコーディング方式で空間情報をデコーディングし、空間情報を生成する。この時、空間情報デコーディング部700におけるデコーディング方式を、空間情報コーディング部300でどんなデータコーディング方式を使用したかによって決定することができる。この空間情報デコーディング部700についての詳細は、図26を参照して後述する。
【0310】
マルチチャンネル生成部800は、コアデコーディング部600の出力を受信し、また、空間情報デコーディング部700の出力を受信する。マルチチャンネル生成部800は、前記2つの出力からN個のマルチチャンネル(y1,y2,…,yN)のオーディオ信号を生成する。
【0311】
一方、前記オーディオ圧縮のための部分100〜400は、空間情報コーディング部300でどんなデータコーディング方式を使用したかを表す識別情報を、オーディオ復元のための部分500〜800に提供する。上記の場合に備えて、オーディオ復元のための部分500〜800は、前記識別情報をパースするための手段を含む。したがって、空間情報デコーディング部700はオーディオ圧縮のための部分105〜400から提供された識別情報を参照してデコーディング方式を決定する。好ましくは、前記コーディング方式を表す識別情報をパースするための手段は、空間情報デコーディング部700に備えられる。
【0312】
図25は、本発明の一実施例による空間情報コーディング部分の詳細構成を示すブロック図である。図25における説明では、前記空間情報を空間パラメータと称する。
【0313】
図25を参照すると、本発明のコーディング部分は、PCMコーディング部310、DIFF部320及びハフマンコーディング部330で構成される。ハフマンコーディング部330は、前述したエントロピコーディングを行う一実施例に該当する。
【0314】
PCMコーディング部310は、グループPCMコーディング部311とPBC部312とを含んで構成される。グループPCMコーディング部311は、空間パラメータをPCMコーディングする。場合によって、グループPCMコーディング部311は、空間パラメータをグループ単位にPCMコーディングすることができる。PBC部312は、空間パラメータに前述のPBCコーディングを行う。
【0315】
DIFF部320は、空間パラメータに前述のDIFFコーディングを行う。特に、本発明では、空間パラメータのコーディングのために、グループPCMコーディング部311、PBC部312及びDIFF部320のうちのいずれか一つが選択的に動作する。その制御手段は、別に図示しない。
【0316】
PBC部312が行うPBCについては上に詳細に説明したので、その説明は省略する。PBCの他の例において、空間パラメータに対して1回のPBCを行い、その最初のPBCの結果に対して以降N(N>1)回さらにPBCを行うことができる。すなわち、1次PBCを行った結果であるパイロット基準値や差分値に対して少なくとも1回さらにPBCを行う。場合によっては、2次PBCからはパイロット基準値は除外し、差分値に対してのみPBCを行うことが好ましい。
【0317】
DIFF部320は、空間パラメータに対してDIFF_FREQを行うDIFF_FREQコーディング部321と、空間パラメータに対してDIFF_TIMEを行うDIFF_TIMEコーディング部322,323を含む。DIFF部320において、DIFF_FREQコーディング部321とDIFF_TIMEコーディング部322、323のうちの選択された一つが、入力される空間パラメータに対する処理を行う。
【0318】
ここで、DIFF_TIMEコーディング部322,323は、空間パラメータに対してDIFF_TIME_FORWARDを行うDIFF_TIME_FORWARD部322と、空間パラメータに対してDIFF_TIME_BACKWARDを行うDIFF_TIME_BACKWARD部323とに区別される。
【0319】
DIFF_TIMEコーディング部322,323において、DIFF_TIME_FORWARD部322とDIFF_TIME_BACKWARD323のうちの選択された一つが、入力される空間パラメータに対するデータコーディング処理を行う。DIFF部320の内部構成要素321,322,323がそれぞれ行う具体的なDIFFコーディングについては既に詳細に説明したので、その説明は省略する。
【0320】
ハフマンコーディング部330は、PBC部312の出力とDIFF部320の出力のうち少なくとも一つに対してハフマンコーディングを行う。
【0321】
ハフマンコーディング部330は、コーディング及び転送対象となるデータを一つずつ処理する1次元ハフマンコーディング部(以下、「HUFF_1D部」という。)331と、コーディング及び転送対象となるデータを2個ずつまとめて処理する2次元ハフマンコーディング部(以下、「HUFF_2D部」という。)332,333と、を含む。ハフマンコーディング部330において、HUFF_1D部331とHUFF_2D部332,333のうちの選択された一つが、入力に対するハフマンコーディング処理を行う。
【0322】
ここで、HUFF_2D部332,333は、周波数を基準にしてまとめられた1データ対に対してハフマンコーディングを行う周波数ペア2次元ハフマンコーディング部(以下、「HUFF_2D_FREQ_PAIR部」という。)332とタイムに基準してまとめられた1データ対に対してハフマンコーディングを行う時間ペア2次元ハフマンコーディング部(以下、「HUFF_2D_TIME_PAIR部」という。)333とに区別される。
【0323】
HUFF_2D部332,333において、HUFF_2D_FREQ_PAIR部332とHUFF_2D_TIME_PAIR部333のうちの選択された一つが、入力に対するハフマンコーディング処理を行う。ハフマンコーディング部330の内部構成要素331,332,333がそれぞれ行うハフマンコーディングについては既に詳細に説明したので、その説明は省略する。
【0324】
その後、ハフマンコーディング部330の出力は、グループPCMコーディング部311の出力と多重化されて送信される。
【0325】
本発明による空間情報のコーディング部分を、データコーディング及びエントロピコーディングで生成された多様な識別情報を転送ビットストリームに挿入させる。そして、転送ビットストリームは、図26の空間情報デコーディング部分に転送される。
【0326】
図26は、本発明の一実施例による空間情報デコーディング部分の詳細構成を示すブロック図である。図26を参照すると、空間情報デコーディング部分は、空間情報を含む転送ビットストリームを受信し、該転送ビットストリームをデコーディングして空間情報を生成する。
【0327】
空間情報デコーディング部分700は、識別情報抽出部710、PCMデコーディング部720、ハフマンデコーディング部730、ディファレンシャルデコーディング部740を含む。
【0328】
空間情報デコーディング部分において、識別情報パーシング部710は、転送ビットストリームから様々な識別情報を抽出してパースする。これは、図23の説明部分で言及した様々な情報を抽出するということを意味する。空間情報デコーディング部分は、識別情報パーシング部710の出力から、空間パラメータに対してどんなグルーピング及びどんなコーディング方式が使われたかがわかり、その該当するグルーピング及びコーディング方式に対応するデコーディング方式を決定する。このような識別情報パーシング部710の役割は、前述の逆多重化部500で行っても良い。
【0329】
PCMデコーディング部720は、グループPCMデコーディング部721と、パイロットベースデコーディング部722と、を含む。
【0330】
グループPCMデコーディング部721は、転送ビットストリームに対してPCMデコーディングを行い、空間パラメータを生成する。場合によって、グループPCMデコーディング部721は、転送ビットストリームをデコーディングし、グループ単位の空間パラメータを生成する。
【0331】
パイロットベースデコーディング部722は、ハフマンデコーディング部730の出力に対してパイロットベースデコーディングを行い、空間パラメータ値を生成する。これは、ハフマンデコーディング部730の出力にパイロット基準値が含まれた場合である。別の例で、パイロットベースデコーディング部722は、転送ビットストリームからパイロット基準値を直接抽出するためのパイロット抽出部(図示せず)を備えても良い。これにより、パイロット抽出部で抽出したパイロット基準値とハフマンデコーディング部730の出力である差分値を用いて空間パラメータ値を生成する。
【0332】
ハフマンデコーディング部730は、転送ビットストリームに対してハフマンデコーディングを行う。ハフマンデコーディング部730は、転送ビットストリームに対して1次元ハフマンデコーディングを行い、1つずつのデータ値を出力する1次元ハフマンデコーディング部(以下、「HUFF_1D decoding部」という。)731と、転送ビットストリームに対して2次元ハフマンデコーディングを行い、1対ずつのデータ値を出力する2次元ハフマンデコーディング部(以下、「HUFF_2D decoding部」という。)732,733と、を含む。
【0333】
識別情報パース部710は、転送ビットストリームから、ハフマンコーディング方式がHUFF_1DかまたはHUFF_2Dかを表す識別情報(例えば、“bsCodingScheme”)を抽出しそれをパースし、用いられたハフマンコーディング方式を把握する。これにより、それぞれの場合に対応するHUFF_1D decodingとHUFF_2D decodingのうちの一つをハフマンデコーディング方式として決定する。
【0334】
HUFF_1D decoding部731がHUFF_1D decodingを行い、HUFF_2D decoding部732、733がHUFF_2D decodingを行う。識別情報パース部710は、転送ビットストリームから、ハフマンコーディング方式がHUFF_2Dである場合に、そのHUFF_2D方式がHUFF_2D_FREQ_PAIRか、または、HUFF_2D_TIME_PAIRかを表す識別情報(例えば、“bsPairing”)をさらに抽出し、それをパースする。これにより、1対をなす2データを、周波数を基準してまとめるか、あるいは、時間を基準してまとめるかを把握する。これにより、それぞれの場合に対応する周波数ペア2次元ハフマンデコーディング(以下、「HUFF_2D_FREQ_PAIR decoding」という。)と時間ペア2次元ハフマンデコーディング(以下、「HUFF_2D_TIME_PAIR decoding」という。)のうちの一つを、ハフマンデコーディング方式と決定する。
【0335】
HUFF_2D decoding部732,733において、HUFF_2D_FREQ_PAIRデコーディング部732がHUFF_2D_FREQ_PAIRデコーディングを行い、HUFF_2D_TIME_PAIRデコーディング部733がHUFF_2D_TIME_PAIRデコーディングを行う。
【0336】
ハフマンデコーディング部730の出力は、識別情報パース部710の出力に基づくパイロットベースデコーディング部722やディファレンシャルデコーディング部740に伝達される。ディファレンシャルデコーディング部740は、ハフマンデコーディング部730の出力に対してディファレンシャルデコーディングを行い、空間パラメータ値を生成する。
【0337】
識別情報パーシング部710は、転送ビットストリームから、DIFF方式がDIFF_FREQかまたはDIFF_TIMEかを表す識別情報(例えば、“bsDiffType”)を抽出しそれをパースし、用いられたDIFF方式を把握する。これにより、それぞれの場合に対応するDIFF_FREQデコーディングとDIFF_TIMEデコーディングのうちの一つを、ディファレンシャルデコーディング方式と決定する。DIFF_FREQデコーディング部741がDIFF_FREQデコーディングを行い、DIFF_TIMEデコーディング部742,743がDIFF_TIMEデコーディングを行う。
【0338】
識別情報パーシング部710は、転送ビットストリームから、DIFF方式がDIFF_TIMEである場合に、そのDIFF_TIMEがDIFF_TIME_FORWARDかまたはDIFF_TIME_BACKWARDかを表す識別情報(例えば、“bsDiffTimdDirection”)をさらに抽出し、それをパースする。
【0339】
これにより、ハフマンデコーディング部730の出力が、現在のデータと以前のデータとの間の差分値なのか、現在のデータと以後のデータとの間の差分値なのかを把握する。これにより、それぞれの場合に対応するDIFF_TIME_FORWARDデコーディングとDIFF_TIME_BACKWARDデコーディングのうち一つを、DIFF_TIME方式と決定する。
【0340】
DIFF_TIMEデコーディング部742,743において、DIFF_TIME_FORWARDデコーディング部742がDIFF_TIME_FORWARDデコーディングを行い、DIFF_TIME_BACKWARDデコーディング部743がDIFF_TIME_BACKWARDデコーディングを行う。
【0341】
上記の空間情報デコーディング部分において識別情報パーシング部710の出力に基づいてハフマンデコーディング方式とデータデコーディング方式を決定する手順は、下記のようになる。
【0342】
一例として、識別情報パース部710は、空間パラメータのコーディングにPCMとDIFFのうちのいずれかの方式が用いられたかを表す第1識別情報(例えば、“bsPCMCoding”)を読む。この第1識別情報がPCMを表した値であれば、再び、識別情報パーシング部710は、空間パラメータのコーディングにPCMとPBCのうちのいずれかの方式が用いられたかを表す第2識別情報(例えば、“bsPilotCoding”)を読む。第2識別情報がPBCを表した値であれば、空間情報デコーディング部分は、PBCに対応するデコーディングを行う。第2識別情報がPCMを表した値であれば、空間情報デコーディング部分は、PCMに対応するデコーディングを行う。一方、第1識別情報がDIFFを表した値であれば、空間情報デコーディング部分は、DIFFに対応するデコーディング処理を行う。
【産業上の利用可能性】
【0343】
以上開示した本発明の好適な実施例は、本発明を例示するためのもので、添付の特許請求の範囲に開示された本発明の技術的思想とその技術的範囲内で、様々な他の実施例へと改良、変更、代替または付加などが可能であるということは、当業者にとっては自明である。例えば、本発明によるグルーピング、データコーディング及びエントロピコーディングを適用した様々な応用分野及び製品に適用することが可能である。また、本発明による少なくとも一特徴を適用したデータを保存する媒体(medium)を提供することが可能である。
【符号の説明】
【0344】
1 エンコーディング装置
2 デコーディング装置
10 データグルーピング部
20 第1データエンコーディング部
30 データエンコーディング部
31 第2データエンコーディング部
32 第3データエンコーディング部
40 エントロピエンコーディング部
41 エントロピテーブル
50 ビットストリーム多重化部
51 第3データエンコーディング部
52 第2データエンコーディング部
53 第1データエンコーディング部
60 ビットストリーム逆多重化部
70 エントロピデコーディング部
71 エントロピテーブル
80 第1データデコーディング部
91 第2データデコーディング部
91e インデックス専用エントロピテーブル
92 第3データデコーディング部
95 データ復元部
105 ダウンミキシング部
110 チャンネルダウンミキシング部
120 空間情報生成部
200 コアコーディング部
300 空間情報コーディング部
310 PCMコーディング部
320 DIFF部
330 ハフマンコーディング部
400 多重化部
500 逆多重化部
600 コアデコーディング部
700 空間情報デコーディング部
710 識別情報抽出部
720 PCMデコーディング部
721 グループPCMデコーディング部
722 パイロットベースデコーディング部
730 ハフマンデコーディング部
731 1次元ハフマンデコーディング部
732 周波数ペア2次元ハフマンデコーディング部
733 時間ペア2次元ハフマンデコーディング部
740 ディファレンシャルデコーディング部
741 DIFF_FREQデコーディング部
742 DIFF_TIME_FORWARDデコーディング部
743 DIFF_TIME_BACKWARDデコーディング部
800 マルチチャンネル生成部

【特許請求の範囲】
【請求項1】
インデックス情報とデータを獲得する段階と、
前記インデックス情報をエントロピデコーディングする段階と、
前記エントロピデコーディングされたインデックス情報に該当するエントロピテーブルを識別する段階と、
前記エントロピテーブルを用いて前記データをエントロピデコーディングする段階と、
を有することを特徴とする信号処理方法。
【請求項2】
前記データはパラメータであり、前記パラメータを用いてオーディオ信号を復元する段階をさらに有する、請求項1に記載の信号処理方法。
【請求項3】
前記インデックス情報は、確率的な利用頻度特性を持つインデックスに関する情報である、請求項1に記載の信号処理方法。
【請求項4】
インデックス専用エントロピテーブルを用いて前記インデックス情報をエントロピデコーディングする、請求項1に記載の信号処理方法。
【請求項5】
前記エントロピテーブルは前記データの種類別に分類される、請求項1に記載の信号処理方法。
【請求項6】
前記データはパラメータであり、前記パラメータを用いてオーディオ信号を復元する段階をさらに有する、請求項1に記載の信号処理方法。
【請求項7】
前記データをエントロピデコーディングする段階は、前記エントロピテーブルを用いて前記データを2次元エントロピデコーディングする、請求項1に記載の信号処理方法。
【請求項8】
前記インデックス情報は、最も高い確率のインデックスのみを持つ、請求項2に記載の信号処理方法。
【請求項9】
前記インデックス情報はデータコーディング方式及びエントロピコーディング方式の組合によって異なるインデックスを持つ、請求項1に記載の信号処理方法。
【請求項10】
インデックス情報とデータを獲得する情報及びデータ獲得部と、
前記インデックス情報をエントロピデコーディングするインデックスデコーディング部と、
前記エントロピデコーディングされたインデックス情報に該当するエントロピテーブルを識別するテーブル識別部と、
前記エントロピテーブルを用いてデータをエントロピデコーディングするデータデコーディング部と、
を有することを特徴とする信号処理装置。
【請求項11】
エントロピテーブルを用いてデータをエントロピエンコーディングする段階と、
前記エントロピテーブルを識別するインデックス情報を生成する段階と、
前記インデックス情報をエントロピエンコーディングする段階と、
前記エントロピエンコーディングされたインデックス情報を送る段階と、
を有することを特徴とする信号処理方法。
【請求項12】
エントロピテーブルを用いてデータをエントロピエンコーディングするデータエンコーディング部と、
前記エントロピテーブルを識別するインデックス情報を生成する情報生成部と、
前記インデックス情報をエントロピエンコーディングするインデックスエンコーディング部と、
前記エントロピエンコーディングされたインデックス情報を送る情報出力部と、
を有することを特徴とする信号処理装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate

【図24】
image rotate

【図25】
image rotate

【図26】
image rotate


【公開番号】特開2012−23738(P2012−23738A)
【公開日】平成24年2月2日(2012.2.2)
【国際特許分類】
【出願番号】特願2011−167446(P2011−167446)
【出願日】平成23年7月29日(2011.7.29)
【分割の表示】特願2008−534460(P2008−534460)の分割
【原出願日】平成18年10月9日(2006.10.9)
【出願人】(502032105)エルジー エレクトロニクス インコーポレイティド (2,269)
【Fターム(参考)】