説明

音声符号化方法及び音声復号化方法

【課題】 マルチチャネルを圧縮又は非圧縮で選択的に伝送したり、再生側のダ
ウンミクスを選択的に許可又は禁止しても再生側が正常に再生可能にする
【解決手段】 ATSIはオーディオパケット内のマルチチャネルデータが圧縮
されているか否かを示す第1の識別子と、マルチチャネルデータをステレオ2チ
ャネルにダウンミクスすることを許可するか又は禁止するかを示す第2の識別子
を含む。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、マルチチャネル音声信号の音声符号化方法及び音声復号化方法に関する。
【背景技術】
【0002】
音声信号を可変長で圧縮する方法として、本発明者は先の出願(特願平9−2
89159号)において1チャネルの原デジタル音声信号に対して、特性が異な
る複数の予測器により時間領域における過去の信号から現在の信号の複数の線形
予測値を算出し、原デジタル音声信号と、この複数の線形予測値から予測器毎の
予測残差を算出し、予測残差の最小値を選択する予測符号化方法を提案している

【0003】
なお、上記方法では原デジタル音声信号がサンプリング周波数=96kHz、
量子化ビット数=20ビット程度の場合にある程度の圧縮効果を得ることができ
るが、近年のDVDオーディオディスクではこの2倍のサンプリング周波数(=
192kHz)が使用され、また、量子化ビット数も24ビットが使用される傾
向がある。また、マルチチャネルにおけるサンプリング周波数と量子化ビット数
はチャネル毎に異なることもある。
【発明の開示】
【発明が解決しようとする課題】
【0004】
ところで、マルチチャネルの音声信号を伝送する場合、著作権者がオーディオ
ソースに依っては圧縮を希望するものとそうでないものがあり、また、ユーザが
マルチチャネルをステレオ2チャネルにダウンミクスして再生することを望まな
いものとそうでないものとの2通りがある。したがって、このように圧縮又は非
圧縮で選択的に伝送する2通りと、再生側のダウンミクスを選択的に許可、禁止
する2通りの合計4通りで伝送した場合には、再生側でこれを識別して選択的に
再生する必要がある。
【0005】
そこで本発明は、再生側のダウンミクスを選択的に許可又は禁止しても再生側が正常に再生することができる音声符号化方法及び音声復号化方法を提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明は上記目的を達成するために、以下の1)及び2)の手段より成る。
すなわち、
1)マルチチャネルの音声信号を、そのままのチャネル又は互いに相関あるチャネル毎に、入力される音声信号に応答して先頭サンプル値を所定時間のフレーム単位で得ると共に、時間領域の過去の信号から予測される現在の信号の複数の予測値の中でその予測残差が最小となるような線形予測方法を、前記フレームを更に分割したサブフレーム単位に選択して圧縮するステップと、
前記圧縮されたデータ量に応じて、復号側の入力バッファ内の圧縮データを読み出すタイミングを示すデコーディング・タイム・スタンプ情報を生成するステップと、
ヘッダ情報とユーザデータとを有して、このユーザデータ内に前記デコーディング・タイム・スタンプ情報を含むパケットヘッダと、
前記ステップにより選択された先頭サンプル値と、サブフレーム毎の予測残差と線形予測方法とを含む圧縮データが格納されるオーディオパケットと、
前記オーディオパケット内のデータが前記圧縮方法により圧縮されていることを示す第1の識別子と、前記オーディオパケット内に格納されているマルチチャネルデータをステレオ2チャネルにダウンミクスすることを許可するか又は禁止するかを示す第2の識別子が配置された管理情報とを、
有するデータ構造にフォーマット化するステップと、
からなる音声符号化方法。
2)請求項1記載の音声符号化方法によりフォーマット化されたデータ構造のデータを復号する音声復号化方法であって、
前記データをオーディオパケットと管理情報に分離するステップと、
前記管理情報から第1の識別子と第2の識別子を抽出するステップと、
前記オーディオパケット内のユーザデータをパケットヘッダとサブフレーム単位の圧縮データとに分離するステップと、
前記分離された圧縮データを前記サーチ情報に基づいてサーチして入力バッファに蓄積するステップと、
前記入力バッファ内に蓄積された圧縮データを前記パケットヘッダ内のデコーディング・タイム・スタンプ情報に基づいて読み出すステップと、
抽出された第2の識別子がダウンミクスすることを許可する場合に前記読み出された圧縮データを前記抽出された第1の識別子に基づいて伸長してマルチチャネルとステレオ2チャネルの少なくともいずれかで取り出し、前記第2の識別子がダウンミクスすることを禁止する場合には前記読み出された圧縮データを前記第1の識別子に基づいて伸長してマルチチャネルのみで取り出すステップと、
からなる音声復号化方法。
【発明の効果】
【0007】
以上説明したように本発明によれば、例えば、マルチチャネルデータが圧縮されているか否かを示す識別子と、マルチチャネルデータをステレオ2チャネルにダウンミクスすることを許可するか又は禁止するかを示す識別子をともにフォーマット化して符号化するので、正常に復号化して再生することができる。
【発明を実施するための最良の形態】
【0008】
以下、図面を参照して本発明の実施の形態を説明する。図1〜図4は本発明が
適用されるマルチチャネル伝送形態を実現する音声符号化装置の処理を示す説明
図である。
【0009】
ここで、マルチチャネル方式としては、例えば次の4つの方式が知られている

(1)4チャネル方式 ドルビーサラウンド方式のように、前方L、C、R
の3チャネル+後方Sの1チャネルの合計4チャネル
(2)5チャネル方式 ドルビーAC−3方式のSWチャネルなしのように
、前方L、C、Rの3チャネル+後方SL、SRの2チャネルの合計5チャネル
(3)6チャネル方式 DTS(Digital Theater System)方式や、ドルビ
ーAC−3方式のように6チャネル(L、C、R、SW(Lfe)、SL、SR

(4)8チャネル方式 SDDS(Sony Dynamic Digital Sound)方式のよ
うに、前方L、LC、C、RC、R、SWの6チャネル+後方SL、SRの2チ
ャネルの合計8チャネル
【0010】
図1は第1の例の伝送形態として、マルチチャネルを圧縮するとともに再生側
のダウンミクスを禁止する場合を示している。符号化側の6チャネル(ch)ミク
ス&マトリクス回路1’は、マルチチャネル信号の一例としてフロントレフト(
Lf)、センタ(C)、フロントライト(Rf)、サラウンドレフト(Ls)、
サラウンドライト(Rs)及びLfe(Low Frequency Effect)の6chのPCM
データを次式(1−1)により6ch「1」〜「6」分の相関信号に変換し、符号
化部2’に出力する。
「1」=Lf+Rf−C
「2」=Lf−Rf−C
「3」=C−(Ls+Rs)/2
「4」=Ls+Rs
「5」=Ls−Rs
「6」=Lfe−a×C
ただし、0≦a≦1 …(1−1)
このような6チャネル(ch)ミクス&マトリクス回路1’による相関式と符
号化部2’の符号化方式は選択手段7’で選択される。以下説明する図2、図3
、図4、図5及び図6でも同様であるので、これらの図では選択手段7’を略す
ことにする。
【0011】
第1と第2の符号化部2’−1、2’−2を有する符号化部2’は図7に詳し
く示すようにこの6ch「1」〜「6」のPCMデータを予測符号化し、予測符号
化データを図8に示すようなビットストリームで記録媒体5や通信媒体6を介し
て復号側に伝送する。復号側では第1と第2の復号化部3’−1、3’−2を有
する復号化部3’により、図14に詳しく示すように6ch「1」〜「6」の予測
符号化データをPCMデータに復号し、次いでミクス&マトリクス回路4’によ
り式(1−1)に基づいて元の6ch(Lf、C、Rf、Ls、Rs、Lfe)の
みを復元する。
【0012】
図2は第2の例の伝送形態として、マルチチャネルを圧縮するとともに再生側
のダウンミクスを許可する場合を示している。符号化側の6chミクス&マトリク
ス回路1’は、元の6ch(Lf、C、Rf、Ls、Rs、Lfe)と係数mij(
i=1,2,j=1,2〜6)により次式(2)のようにステレオ2chデータ(
L、R)を生成(ダウンミクス)する。
L=m11・Lf+m12・Rf+m13・C
+m14・Ls+m15・Rs+m16・Lfe
R=m21・Lf+m22・Rf+m23・C
+m24・Ls+m25・Rs+m26・Lfe …(2)
【0013】
そして、式(2)と次式(1−2)により次のような第1グループの2チャネ
ル分の相関信号「1」、「2」と第2グループの4チャネル分の相関信号「3」
〜「6」に変換し、それぞれ第1符号化部2’−1、第2符号化部2’−2に出
力する。
「1」=L+R
「2」=L−R
「3」〜「6」は式(1−1)と同じ …(1−2)
【0014】
第1、第2符号化部2’−1、2’−2はそれぞれ第1グループチャネル「1
」、「2」と第2グループチャネル「3」〜「6」のPCMデータを予測符号化
し、各チャネルの予測符号化データを記録媒体5や通信媒体6を介して復号側に
伝送する。復号側では第1、第2復号化部3’−1、3’−2により、それぞれ
第1グループチャネル「1」、「2」と第2グループチャネル「3」〜「6」の
予測符号化データをPCMデータに復号し、次いでミクス&マトリクス回路4’
により式(1−2)、(2)に基づいて元の6ch(Lf、C、Rf、Ls、Rs
、Lfe)を復元するとともに、第1グループチャネル「1」、「2」を加算、
減算することによりそれぞれステレオ2chデータ(L、R)を生成する。
【0015】
図3は第3の例の伝送形態として、マルチチャネルを圧縮しないで伝送すると
ともに再生側のダウンミクスを禁止する場合を示している。この場合には、非圧
縮であるので、符号化側では相関信号も生成することなく元の6ch(Lf、C、
Rf、Ls、Rs、Lfe)のPCMデータをそのまま伝送し(ただし、フォー
マット化する)、復号化側ではデフォーマット化した後、元の6ch(Lf、C、
Rf、Ls、Rs、Lfe)のみを復元する。
【0016】
図4は第4の例の伝送形態として、マルチチャネルを圧縮しないで伝送すると
ともに再生側のダウンミクスを許可する場合を示している。この場合にも、非圧
縮であるので、符号化側では圧縮率を高めるための相関信号も生成することなく
元の6ch(Lf、C、Rf、Ls、Rs、Lfe)のPCMデータをそのまま伝
送する(ただし、フォーマット化する)。復号化側ではデフォーマット化した後
、元の6ch(Lf、C、Rf、Ls、Rs、Lfe)を復元するとともに、式(
2)によりステレオ2chデータ(L、R)を生成(ダウンミクス)する。
【0017】
図5は図1においてマルチチャネルを圧縮するとともに再生側のダウンミクス
を禁止する場合の変形例を示している。この場合には、符号化側では次式(1−
3)により6ch(1)〜(6)分の相関信号に変換し、符号化部2’はこれを予
測符号化する。そして、復号化側では式(1−2)により元の6ch(Lf、C、
Rf、Ls、Rs、Lfe)のみを復元する。
「1」=Lf−C
「2」=Rf−C
「3」〜「6」は式(1−1)と同じ …(1−3)
このように再生側のダウンミクスを禁止する場合は、これに対応して式(2)の
ダウンミクス係数を符号化に加えないとともに、符号化側で式(2)によりステ
レオ2chデータ(L、R)を生成(ダウンミクス)することが禁じられる。
【0018】
図6は図2においてマルチチャネルを圧縮するとともに再生側のダウンミクス
を許可する場合の変形例を示している。この場合には、符号化側では式(2)に
よりステレオ2chデータ(L、R)を生成(ダウンミクス)し、次いで次式(1
−4)により次のような第1グループの2チャネル「1」、「2」と第2グルー
プの4チャネル分の相関信号「3」〜「6」に変換し、第1、第2符号化部2’
−1、2’−2はこの各グループチャネルを予測符号化する。そして、復号化側
では式(1−4)、(2)により元の6ch(Lf、C、Rf、Ls、Rs、Lf
e)を復元するとともにステレオ2chデータ(L、R)をそのまま出力する。
「1」=L
「2」=R
「3」〜「6」は式(1−1)と同じ …(1−4)
【0019】
図7を参照して符号化部2’−1、2’−2について詳しく説明する。各ch「1
」〜「6」のPCMデータは1フレーム毎に1フレームバッファ10に格納され
る。そして、1フレームの各ch「1」〜「6」のサンプルデータがそれぞれ予測
回路13D1、13D2、15D1〜15D4に印加されるとともに、各ch「1
」〜「6」の各フレームの先頭サンプルデータがフォーマット化回路19に印加
される。予測回路13D1、13D2、15D1〜15D4はそれぞれ、各ch「
1」〜「6」のPCMデータに対して、特性が異なる複数の予測器(不図示)に
より時間領域における過去の信号から現在の信号の複数の線形予測値を算出し、
次いで原PCMデータと、この複数の線形予測値から予測器毎の予測残差を算出
する。続くバッファ・選択器14D1、14D2、16D1〜16D4はそれぞ
れ、予測回路13D1、13D2、15D1〜15D4により算出された各予測
残差を一時記憶して、選択信号/DTS(デコーディング・タイム・スタンプ)
生成器17により指定されたサブフレーム毎に予測残差の最小値を選択する。
【0020】
選択信号/DTS生成器17は予測残差のビット数フラグをパッキング回路1
8とフォーマット化回路19に対して印加し、また、予測残差が最小の予測器を
示す予測器選択フラグと、相関係数aと、復号化側が入力バッファ22a(図1
4)からストリームデータを取り出す時間を示すDTSをフォーマット化回路1
9に対して印加する。パッキング回路18はバッファ・選択器14D1、14D
2、16D1〜16D4により選択された6ch分の予測残差を、選択信号/DT
S生成器17により指定されたビット数フラグに基づいて指定ビット数でパッキ
ングする。またPTS生成器17cは、復号化側が出力バッファ110(図14
)からPCMデータを取り出す時間を示すPTS(プレゼンテーション・タイム
・スタンプ)を生成してフォーマット化回路19に出力する。フォーマット化回
路19にはまた、圧縮/非圧縮などを示す符号化モードと、ダウンミクス許可/
禁止を示す識別子が印加される。
【0021】
続くフォーマット化回路19は図8〜図13に示すようなユーザデータにフォ
ーマット化する。図8に示すユーザデータ(サブパケット)は、前方グループに
関する2ch「1」、「2」の予測符号化データを含む可変レートビットストリー
ム(サブストリーム)BS0と、他のグループに関する4ch「3」〜「6」の予
測符号化データを含む可変レートビットストリーム(サブストリーム)BS1と
、サブストリームBS0、BS1の前に設けられたビットストリームヘッダ(リ
スタートヘッダ)により構成されている。
【0022】
また、サブストリームBS0、BS1の1フレーム分は
・フレームヘッダと、
・各ch「1」〜「6」の1フレームの先頭サンプルデータと、
・各ch「1」〜「6」のサブフレーム毎の予測器選択フラグと、
・各ch「1」〜「6」のサブフレーム毎のビット数フラグと、
・各ch「1」〜「6」の予測残差データ列(可変ビット数)と、
・ch「6」の係数aとが、
多重化されている。このような予測符号化によれば、原信号が例えばサンプリ
ング周波数=96kHz、量子化ビット数=24ビット、6チャネルの場合、7
1%の圧縮率を実現することができる。
【0023】
図7に示す符号化部2’−1、2’−2により予測符号化された可変レートビ
ットストリームデータを、記録媒体の一例としてDVDオーディオディスクに記
録する場合には、図9に示すオーディオ(A)パックにパッキングされる。この
パックは2034バイトのユーザデータ(Aパケット、Vパケット)に対して4
バイトのパックスタート情報と、6バイトのSCR(System Clock Reference:
システム時刻基準参照値)情報と、3バイトのMux レート(rate)情報と1バイ
トのスタッフィングの合計14バイトのパックヘッダが付加されて構成されてい
る(1パック=合計2048バイト)。この場合、タイムスタンプであるSCR
情報を、先頭パックでは「1」として同一タイトル内で連続とすることにより同
一タイトル内のAパックの時間を管理することができる。
【0024】
圧縮PCMのAパケットは図10に詳しく示すように、19又は14バイトの
パケットヘッダと、圧縮PCMのプライベートヘッダと、図11に示すフォーマ
ットの1ないし2011バイトのオーディオデータ(圧縮PCM)により構成さ
れている。そして、DTSとPTSは図5のパケットヘッダ内に(具体的にはパ
ケットヘッダの10〜14バイト目にPTSが、15〜19バイト目にDTSが
)セットされる。圧縮PCMのプライベートヘッダは、
・1バイトのサブストリームIDと、
・2バイトのUPC/EAN−ISRC(Universal Product Code/European Ar
ticle Number-International Standard Recording Code)番号、及びUPC/E
AN−ISRCデータと、
・1バイトのプライベートヘッダ長と、
・2バイトの第1アクセスユニットポインタと、
・8バイトのオーディオデータ情報(ADI)と、
・0〜7バイトのスタッフィングバイトとに、
より構成されている。
【0025】
また、ADI内に1秒後のアクセスユニットをサーチするための前方アクセス
ユニット・サーチポインタと、1秒前のアクセスユニットをサーチするための後
方アクセスユニット・サーチポインタがともに1バイトでセットされる。具体的
にはADIの7バイト目に前方アクセスユニット・サーチポインタが、8バイト
目に後方アクセスユニット・サーチポインタがセットされる。
【0026】
図10に示す圧縮PCM(PPCMともいう)のオーディオパケットにおける
オーディオデータエリアは、図11に示すようにサブパケットと複数のPPCM
アクセスユニットにより構成され、PPCMアクセスユニットはPPCMシンク
情報とサブパケットにより構成されている。最初のPPCMアクセスユニット内
のサブパケットは、ディレクトリと、サブストリーム「0」と、CRCと、サブ
ストリーム「1」と、CRCとエクストラ情報により構成され、サブストリーム
「0」、「1」はPPCMブロックのみにより構成されている。2番目以降のP
PCMアクセスユニット内のサブパケットは、ディレクトリを除いてサブストリ
ーム「0」と、CRCと、サブストリーム「1」と、CRCとエクストラ情報に
より構成され、サブストリーム「0」、「1」はリスタートヘッダとPPCMブ
ロックにより構成されている。
【0027】
PPCMシンク情報(以下、同期情報ともいう)は次の情報を含む。
・1パケット当たりのサンプル数:サンプリング周波数fsに応じて40、80
又は160が選択される。
・データレート:VBRの場合には「0」(サブパケット内のデータが圧縮デー
タであることを示す識別子)
・サンプリング周波数fs及び量子化ビット数Qb
・チャネル割り当て情報
【0028】
フォーマット化回路19はまた、図8〜図11に示すオーディオパックを管理
するために図12、図13に示すような管理情報を含むATSI(オーディオ・
タイトル・セット・インフォーメーション)をフォーマット化する。図12はA
OTT−AOB−ATR(オーディオオンリタイトル・オーディオオブジェクト
セット・アトリビュート)を示し、このAOTT−AOB−ATR(b127〜
b0)は、MSB側から順に
・8ビット(b127〜b120)のオーディオ符号化モードと、
・8ビット(b119〜b112)の保留領域と、
・4ビット(b111〜b108)のチャネルグループ「1」の量子化ビット数
Q1と、
・4ビット(b107〜b104)のチャネルグループ「2」の量子化ビット数
Q2と、
・4ビット(b103〜b100)のチャネルグループ「1」のサンプリング周
波数fs1と、
・4ビット(b99〜b96)のチャネルグループ「2」のサンプリング周波数
fs2と、
・3ビット(b95〜b93)のマルチチャネル構造のタイプと、
・5ビット(b92〜b88)のチャネル割り当てと、
・8ビット×11(b87〜b0)の保留領域により構成されている。
【0029】
上記データを以下に詳しく示す。
(1)オーディオ符号化モード(b127〜b120)
00000000b:リニアPCMモード
00000001b:圧縮PCMモード
その他 :その他の符号化モード用に保留
【0030】
(2)チャネルグループ1の量子化ビット数Q1(b111〜b108)
0000b:16ビット
0001b:20ビット
0010b:24ビット
その他 :保留
(3)チャネルグループ2の量子化ビット数Q2(b107〜b104)
・チャネルグループ1の量子化ビット数Q1が「0000b」の場合には「0
000b」
・チャネルグループ1の量子化ビット数Q1が「0001b」の場合には「0
000b」又は「0001b」
・チャネルグループ1の量子化ビット数Q1が「0010b」の場合には「0
000b」、「0001b」又は「0010b」
ただし、0000b:16ビット
0001b:20ビット
0010b:24ビット
その他 :保留
【0031】
(4)チャネルグループ1のサンプリング周波数fs1(b103〜b100)
0000b:48kHz
0001b:96kHz
0010b:192kHz
1000b:44.1kHz
1001b:88.2kHz
1010b:176.4kHz
その他 :保留
【0032】
(5)チャネルグループ2のサンプリング周波数fs2(b99〜b96)
・チャネルグループ1のサンプリング周波数fs1が「0000b」の場合に
は「0000b」
・チャネルグループ1のサンプリング周波数fs1が「0001b」の場合に
は「0000b」又は「0001b」
・チャネルグループ1のサンプリング周波数fs1が「0010b」の場合に
は「0000b」、「0001b」又は「0010b」
・チャネルグループ1のサンプリング周波数fs1が「1000b」の場合に
は「1000b」
・チャネルグループ1のサンプリング周波数fs1が「1001b」の場合に
は「1000b」又は「1001b」
・チャネルグループ1のサンプリング周波数fs1が「1010b」の場合に
は「1000b」、「1001b」又は「1010b」
【0033】
(6)マルチチャネル構造のタイプ(b95〜b93)
000b:タイプ1
その他 :保留
(7)チャネル割り当て(b92〜b88)
1チャネル(モノラル)から6チャネルまでのグループ「1」、「2」のチャ
ネル割り当て情報
【0034】
図13はATS−PG−CNT(オーディオタイトルセット・プログラム・コ
ンテンツ)を示し、これは先頭から順に
・1ビット(b31)の、前回と今回のPGの関係(R/A)と、
・1ビット(b30)のSTC不連続性フラグ(STC−F)と、
・3ビット(b29〜b27)のアトリビュート数(ATRN)と、
・3ビット(b26〜b24)のチャネルグループ(ChGr)「2」のビット
シフトデータと、
・2ビット(b23、b22)の保留領域と、
・1ビット(b21)のダウンミックスモード(D−M)と、
・1ビット(b20)のダウンミックス係数の有効性(図示※)と、
・4ビット(b19〜b16)のダウンミックス係数テーブル番号(DM−CO
EFTN)と、
・各々が1ビット、合計16ビット(b15〜b0)のRTIフラグF15〜F
0により構成されている。
そして、ビット(b21)のダウンミクスモード(D−M)が「1」の場合に
「ダウンミクス禁止」、「0」の場合に「ダウンミクス許可」を表す。
【0035】
次に図14を参照して復号化部3’(3’−1、3’−2)について説明する
。なお、この復号化部3’(3’−1、3’−2)とミクス&マトリクス回路4
’は、ハードウエアの他にコンピュータプログラムよっても実現することができ
る。上記フォーマットの可変レートビットストリームデータBS0、BS1は、
デフォーマット化回路21により分離される。そして、各ch「1」〜「6」の
1フレームの先頭サンプルデータと予測器選択フラグはそれぞれ予測回路24D
1、24D2、23D1〜23D4に印加され、各ch「1」〜「6」のビット
数フラグはアンパッキング回路22に印加される。また、SCRと、DTSと予
測残差データ列は入力バッファ22aに印加され、PTSは出力バッファ110
に印加される。また、圧縮/非圧縮などを示す符号化モードと、ダウンミクス許
可/禁止を示す識別子は制御部100に印加され、サンプリング周波数fs及び
量子化ビット数QbはD/A変換器102に印加される。ここで、予測回路24
D1、24D2、23D1〜23D4内の複数の予測器(不図示)はそれぞれ、
符号化側の予測回路13D1、13D2、15D1〜15D4内の複数の予測器
と同一の特性であり、予測器選択フラグにより同一特性のものが選択される。
【0036】
デフォーマット化回路21により分離されたストリームデータ(予測残差デー
タ列)は、図15に示すようにSCRによりアクセスユニット毎に入力バッファ
22aに取り込まれて蓄積される。ここで、1つのアクセスユニットのデータ量
は、例えばfs=96kHzの場合には(1/96kHz)秒分であるが、図1
6、図17(a)に詳しく示すように可変長である。そして、入力バッファ22
aに蓄積されたストリームデータはDTSに基づいてFIFOで読み出されてア
ンパッキング回路22に印加される。
【0037】
アンパッキング回路22は各ch「1」〜「6」の予測残差データ列をビット
数フラグ毎に基づいて分離してそれぞれ予測回路24D1、24D2、23D1
〜23D4に出力する。予測回路24D1、24D2、23D1〜23D4では
それぞれ、アンパッキング回路22からの各ch「1」〜「6」の今回の予測残
差データと、内部の複数の予測器の内、予測器選択フラグにより選択された各1
つにより予測された前回の予測値が加算されて今回の予測値が算出され、次いで
1フレームの先頭サンプルデータを基準として各サンプルのPCMデータが算出
されて出力バッファ110に蓄積される。出力バッファ110に蓄積されたPC
MデータはPTSに基づいて読み出されて出力され、したがって、図17(a)
に示す可変長のアクセスユニットが伸長されて、図17(b)に示す一定長のプ
レゼンテーションユニットが出力される。
【0038】
また、PPCMシンク情報内のサンプリング周波数fs及び量子化ビット数Q
bに基づいて、PCMデータがD/A変換器102によりアナログ信号に変換さ
れる。ここで、操作部101を介してサーチ再生が指示された場合には、制御部
100により図5に示す前方アクセスユニット・サーチポインタ(1秒先)と後
方アクセスユニット・サーチポインタ(1秒前)に基づいてアクセスユニットを
再生する。このサーチポインタとしては、1秒先、1秒前の代わりに2秒先、2
秒前のものでよい。
【0039】
符号化部2’(2’−1、2’−2)により予測符号化された可変レートビッ
トストリームデータをネットワークを介して伝送する場合には、符号化側では図
18に示すように伝送用にパケット化し(ステップS41)、次いでパケットヘ
ッダを付与し(ステップS42)、次いでこのパケットをネットワーク上に送り
出す(ステップS43)。
【0040】
復号側では図19(A)に示すようにヘッダを除去し(ステップS51)、次
いでデータを復元し(ステップS52)、次いでこのデータをメモリに格納して
復号を待つ(ステップS53)。そして、復号を行う場合には図19(B)に示
すように、デフォーマット化を行い(ステップS61)、次いで入力バッファ2
2aの入出力制御を行い(ステップS62)、次いでアンパッキングを行う(ス
テップS63)。なお、このとき、サーチ再生指示がある場合にはサーチポイン
タをデコードする。次いで予測器をフラグに基づいて選択してデコードを行い(
ステップS64)、次いで出力バッファ110の入出力制御を行い(ステップS
65)、次いで元のマルチチャネルを復元し(ステップS66)、次いでこれを
出力し(ステップS67)、以下、これを繰り返す。
【0041】
次に図20、図21を参照して第2の実施形態について説明する。上記の実施
形態では、1グループの相関性の信号「1」〜「6」を予測符号化するように構
成されているが、この第4の実施形態では複数グループの相関性のある信号を生
成して予測符号化し、圧縮率が最も高いグループの予測符号化データを選択する
ように構成されている。このため図20に示す符号化部では、第1〜第nの相関
回路1−1〜1−nが設けられ、このn個の相関回路1−1〜1−nは例えば6
ch(Lf、C、Rf、Ls、Rs、Lfe)のPCMデータを、相関性が異なる
n種類の6ch信号「1」〜「6」に変換する。
【0042】
例えば第1の相関回路1−1は以下のように変換し、
(1)=Lf
(2)=C−(Ls+Rs)/2
(3)=Rf−Lf
(4)=Ls−a×Lfe
(5)=Rs−b×Rf
(6)=Lfe
また、第nの相関回路1−nは以下のように変換する。
(1)=Lf+Rf
(2)=C−Lf
(3)=Rf−Lf
(4)=Ls−Lf
(5)=Rs−Lf
(6)=Lfe−C
【0043】
また、相関回路1−1〜1−n毎に予測回路15とバッファ・選択器16が設
けられ、グループ毎の予測残差の最小値のデータ量に基づいて圧縮率が最も高い
グループが相関選択信号生成器17bにより選択される。このとき、フォーマッ
ト化回路19はその選択フラグ(相関回路選択フラグ、その相関回路の相関係数
a、b)を追加して多重化する。
【0044】
また、図21に示す復号化側では、符号化側の相関回路1−1〜1−nに対し
てn個の相関回路4−1〜4−n(又は係数a、bが変更可能な1つの相関回路
4)が設けられる。なお、図20に示すnグループの予測回路が同一の構成であ
る場合、復号装置では図21に示すようにnグループ分の予測回路を設ける必要
はなく、1つのグループ分の予測回路でよい。そして、符号化装置から伝送され
た選択フラグに基づいて相関回路4−1〜4−nの1つを選択、又は係数a、b
を設定して元の6ch(Lf、C、Rf、Ls、Rs、Lfe)を復元し、また、
式(2)によりマルチチャネルをダウンミクスしてステレオ2chデータ(L、R
)を生成する。
【0045】
また、上記の第1の実施形態では、1種類の相関性の信号「1」〜「6」を予
測符号化するように構成されているが、この信号「1」〜「6」のグループと原
信号(Lf、C、Rf、Ls、Rs、Lfe)のグループを予測符号化し、圧縮
率が高い方のグループを選択するようにしてもよい。
本発明によれば、特許請求の範囲に記載した発明の他に、次のような発明が提
供される。
マルチチャネルの音声信号が圧縮されたデータ又は圧縮されないデータを選択
的にオーディオパケットに配置するフォーマット化手段と、
前記オーディオパケット内のマルチチャネルデータが圧縮されているか否か、
あるいは、前記オーディオパケット内のマルチチャネルデータをステレオ2チャ
ネルにダウンミクスすることを許可するか又は禁止するかによってあらかじめダ
ウンミクスして符号化するか否か、あるいはダウンミクス係数を符号化するか否
かを選択する手段とを、
有する音声符号化装置。
【図面の簡単な説明】
【0046】
【図1】本発明が適用されるマルチチャネルの伝送形態の第1の例を示す説明図である。
【図2】本発明が適用されるマルチチャネルの伝送形態の第2の例を示す説明図である。
【図3】本発明が適用されるマルチチャネルの伝送形態の第3の例を示す説明図である。
【図4】本発明が適用されるマルチチャネルの伝送形態の第4の例を示す説明図である。
【図5】図1の変形例を示す説明図である。
【図6】図2の変形例を示す説明図である。
【図7】図1の符号化部を詳しく示すブロック図である。
【図8】図1、図7の符号化部により符号化されたビットストリームを示す説明図である。
【図9】DVDのパックのフォーマットを示す説明図である。
【図10】DVDのオーディオパックのフォーマットを示す説明図である。
【図11】図10のオーディオデータエリアのフォーマットを詳しく示す説明図である。
【図12】DVDオーディオのAOTT−AOB−ATR(オーディオオンリタイトル・オーディオオブジェクトセット・アトリビュート)を示す説明図である。
【図13】DVDオーディオのATS−PG−CNT(オーディオタイトルセット・プログラム・コンテンツ)を示す説明図である。
【図14】図1の復号化部を詳しく示すブロック図である。
【図15】図14の入力バッファの書き込み/読み出しタイミングを示すタイミングチャートである。
【図16】アクセスユニット毎の圧縮データ量を示す説明図である。
【図17】アクセスユニットとプレゼンテーションユニットを示す説明図である。
【図18】音声伝送方法を示すフローチャートである。
【図19】音声伝送方法を示すフローチャートである。
【図20】第2の実施形態の音声符号化装置を示すブロック図である。
【図21】第2の実施形態の音声復号装置を示すブロック図である。
【符号の説明】
【0047】
1’ 6chミクス&マトリクス回路
13D1,13D2,15D1〜15D4 予測回路(バッファ・選択器14
D1,14D2,16D1〜16D4と共に圧縮手段を構成する。)
14D1,14D2,16D1〜16D4 バッファ・選択器
17 選択信号/DTS生成器
17c PTS生成器
19 フォーマット化回路
21 デフォーマット化回路(分離手段)
22 アンパッキング回路
22a 入力バッファ
24D1,24D2,23D1〜23D4 予測回路(伸長手段)
100 制御部(再生手段)
102 D/A変換器
110 出力バッファ

【特許請求の範囲】
【請求項1】
マルチチャネルの音声信号を、そのままのチャネル又は互いに相関あるチャネル毎に、入力される音声信号に応答して先頭サンプル値を所定時間のフレーム単位で得ると共に、時間領域の過去の信号から予測される現在の信号の複数の予測値の中でその予測残差が最小となるような線形予測方法を、前記フレームを更に分割したサブフレーム単位に選択して圧縮するステップと、
前記圧縮されたデータ量に応じて、復号側の入力バッファ内の圧縮データを読み出すタイミングを示すデコーディング・タイム・スタンプ情報を生成するステップと、
ヘッダ情報とユーザデータとを有して、このユーザデータ内に前記デコーディング・タイム・スタンプ情報を含むパケットヘッダと、
前記ステップにより選択された先頭サンプル値と、サブフレーム毎の予測残差と線形予測方法とを含む圧縮データが格納されるオーディオパケットと、
前記オーディオパケット内のデータが前記圧縮方法により圧縮されていることを示す第1の識別子と、前記オーディオパケット内に格納されているマルチチャネルデータをステレオ2チャネルにダウンミクスすることを許可するか又は禁止するかを示す第2の識別子が配置された管理情報とを、
有するデータ構造にフォーマット化するステップと、
からなる音声符号化方法。
【請求項2】
請求項1記載の音声符号化方法によりフォーマット化されたデータ構造のデータを復号する音声復号化方法であって、
前記データをオーディオパケットと管理情報に分離するステップと、
前記管理情報から第1の識別子と第2の識別子を抽出するステップと、
前記オーディオパケット内のユーザデータをパケットヘッダとサブフレーム単位の圧縮データとに分離するステップと、
前記分離された圧縮データを前記サーチ情報に基づいてサーチして入力バッファに蓄積するステップと、
前記入力バッファ内に蓄積された圧縮データを前記パケットヘッダ内のデコーディング・タイム・スタンプ情報に基づいて読み出すステップと、
抽出された第2の識別子がダウンミクスすることを許可する場合に前記読み出された圧縮データを前記抽出された第1の識別子に基づいて伸長してマルチチャネルとステレオ2チャネルの少なくともいずれかで取り出し、前記第2の識別子がダウンミクスすることを禁止する場合には前記読み出された圧縮データを前記第1の識別子に基づいて伸長してマルチチャネルのみで取り出すステップと、
からなる音声復号化方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate


【公開番号】特開2007−11381(P2007−11381A)
【公開日】平成19年1月18日(2007.1.18)
【国際特許分類】
【出願番号】特願2006−187733(P2006−187733)
【出願日】平成18年7月7日(2006.7.7)
【分割の表示】特願2006−184164(P2006−184164)の分割
【原出願日】平成10年11月16日(1998.11.16)
【出願人】(000004329)日本ビクター株式会社 (3,896)
【Fターム(参考)】