音声符号化方法及び音声復号化方法

【課題】マルチチャネルを圧縮又は非圧縮で選択的に伝送したり、再生側のダ
ウンミクスを選択的に許可又は禁止しても再生側が正常に再生可能にする
【解決手段】ＡＴＳＩはオーディオパケット内のマルチチャネルデータが圧縮
されているか否かを示す第１の識別子と、マルチチャネルデータをステレオ２チ
ャネルにダウンミクスすることを許可するか又は禁止するかを示す第２の識別子
を含む。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、マルチチャネル音声信号の音声符号化方法及び音声復号化方法に関する。
【背景技術】
【０００２】
音声信号を可変長で圧縮する方法として、本発明者は先の出願（特願平９−２
８９１５９号）において１チャネルの原デジタル音声信号に対して、特性が異な
る複数の予測器により時間領域における過去の信号から現在の信号の複数の線形
予測値を算出し、原デジタル音声信号と、この複数の線形予測値から予測器毎の
予測残差を算出し、予測残差の最小値を選択する予測符号化方法を提案している
。
【０００３】
なお、上記方法では原デジタル音声信号がサンプリング周波数＝９６ｋＨｚ、
量子化ビット数＝２０ビット程度の場合にある程度の圧縮効果を得ることができ
るが、近年のＤＶＤオーディオディスクではこの２倍のサンプリング周波数（＝
１９２ｋＨｚ）が使用され、また、量子化ビット数も２４ビットが使用される傾
向がある。また、マルチチャネルにおけるサンプリング周波数と量子化ビット数
はチャネル毎に異なることもある。
【発明の開示】
【発明が解決しようとする課題】
【０００４】
ところで、マルチチャネルの音声信号を伝送する場合、著作権者がオーディオ
ソースに依っては圧縮を希望するものとそうでないものがあり、また、ユーザが
マルチチャネルをステレオ２チャネルにダウンミクスして再生することを望まな
いものとそうでないものとの２通りがある。したがって、このように圧縮又は非
圧縮で選択的に伝送する２通りと、再生側のダウンミクスを選択的に許可、禁止
する２通りの合計４通りで伝送した場合には、再生側でこれを識別して選択的に
再生する必要がある。
【０００５】
そこで本発明は、再生側のダウンミクスを選択的に許可又は禁止しても再生側が正常に再生することができる音声符号化方法及び音声復号化方法を提供することを目的とする。
【課題を解決するための手段】
【０００６】
本発明は上記目的を達成するために、以下の１）及び２）の手段より成る。
すなわち、
１）マルチチャネルの音声信号を、そのままのチャネル又は互いに相関あるチャネル毎に、入力される音声信号に応答して先頭サンプル値を所定時間のフレーム単位で得ると共に、時間領域の過去の信号から予測される現在の信号の複数の予測値の中でその予測残差が最小となるような線形予測方法を、前記フレームを更に分割したサブフレーム単位に選択して圧縮するステップと、
前記圧縮されたデータ量に応じて、復号側の入力バッファ内の圧縮データを読み出すタイミングを示すデコーディング・タイム・スタンプ情報を生成するステップと、
ヘッダ情報とユーザデータとを有して、このユーザデータ内に前記デコーディング・タイム・スタンプ情報を含むパケットヘッダと、
前記ステップにより選択された先頭サンプル値と、サブフレーム毎の予測残差と線形予測方法とを含む圧縮データが格納されるオーディオパケットと、
前記オーディオパケット内のデータが前記圧縮方法により圧縮されていることを示す第１の識別子と、前記オーディオパケット内に格納されているマルチチャネルデータをステレオ２チャネルにダウンミクスすることを許可するか又は禁止するかを示す第２の識別子が配置された管理情報とを、
有するデータ構造にフォーマット化するステップと、
からなる音声符号化方法。
２）請求項１記載の音声符号化方法によりフォーマット化されたデータ構造のデータを復号する音声復号化方法であって、
前記データをオーディオパケットと管理情報に分離するステップと、
前記管理情報から第１の識別子と第２の識別子を抽出するステップと、
前記オーディオパケット内のユーザデータをパケットヘッダとサブフレーム単位の圧縮データとに分離するステップと、
前記分離された圧縮データを前記サーチ情報に基づいてサーチして入力バッファに蓄積するステップと、
前記入力バッファ内に蓄積された圧縮データを前記パケットヘッダ内のデコーディング・タイム・スタンプ情報に基づいて読み出すステップと、
抽出された第２の識別子がダウンミクスすることを許可する場合に前記読み出された圧縮データを前記抽出された第１の識別子に基づいて伸長してマルチチャネルとステレオ２チャネルの少なくともいずれかで取り出し、前記第２の識別子がダウンミクスすることを禁止する場合には前記読み出された圧縮データを前記第１の識別子に基づいて伸長してマルチチャネルのみで取り出すステップと、
からなる音声復号化方法。
【発明の効果】
【０００７】
以上説明したように本発明によれば、例えば、マルチチャネルデータが圧縮されているか否かを示す識別子と、マルチチャネルデータをステレオ２チャネルにダウンミクスすることを許可するか又は禁止するかを示す識別子をともにフォーマット化して符号化するので、正常に復号化して再生することができる。
【発明を実施するための最良の形態】
【０００８】
以下、図面を参照して本発明の実施の形態を説明する。図１〜図４は本発明が
適用されるマルチチャネル伝送形態を実現する音声符号化装置の処理を示す説明
図である。
【０００９】
ここで、マルチチャネル方式としては、例えば次の４つの方式が知られている
。
（１）４チャネル方式ドルビーサラウンド方式のように、前方Ｌ、Ｃ、Ｒ
の３チャネル＋後方Ｓの１チャネルの合計４チャネル
（２）５チャネル方式ドルビーＡＣ−３方式のＳＷチャネルなしのように
、前方Ｌ、Ｃ、Ｒの３チャネル＋後方ＳＬ、ＳＲの２チャネルの合計５チャネル
（３）６チャネル方式ＤＴＳ（Digital Theater System）方式や、ドルビ
ーＡＣ−３方式のように６チャネル（Ｌ、Ｃ、Ｒ、ＳＷ（Ｌｆｅ）、ＳＬ、ＳＲ
）
（４）８チャネル方式ＳＤＤＳ（Sony Dynamic Digital Sound）方式のよ
うに、前方Ｌ、ＬＣ、Ｃ、ＲＣ、Ｒ、ＳＷの６チャネル＋後方ＳＬ、ＳＲの２チ
ャネルの合計８チャネル
【００１０】
図１は第１の例の伝送形態として、マルチチャネルを圧縮するとともに再生側
のダウンミクスを禁止する場合を示している。符号化側の６チャネル（ch）ミク
ス＆マトリクス回路１’は、マルチチャネル信号の一例としてフロントレフト（
Ｌｆ）、センタ（Ｃ）、フロントライト（Ｒｆ）、サラウンドレフト（Ｌｓ）、
サラウンドライト（Ｒｓ）及びＬｆｅ（Low Frequency Effect）の６chのＰＣＭ
データを次式（１−１）により６ch「１」〜「６」分の相関信号に変換し、符号
化部２’に出力する。
「１」＝Ｌｆ＋Ｒｆ−Ｃ
「２」＝Ｌｆ−Ｒｆ−Ｃ
「３」＝Ｃ−（Ｌｓ＋Ｒｓ）／２
「４」＝Ｌｓ＋Ｒｓ
「５」＝Ｌｓ−Ｒｓ
「６」＝Ｌｆｅ−ａ×Ｃ
ただし、０≦ａ≦１ …（１−１）
このような６チャネル（ｃｈ）ミクス＆マトリクス回路１’による相関式と符
号化部２’の符号化方式は選択手段７’で選択される。以下説明する図２、図３
、図４、図５及び図６でも同様であるので、これらの図では選択手段７’を略す
ことにする。
【００１１】
第１と第２の符号化部２’−１、２’−２を有する符号化部２’は図７に詳し
く示すようにこの６ch「１」〜「６」のＰＣＭデータを予測符号化し、予測符号
化データを図８に示すようなビットストリームで記録媒体５や通信媒体６を介し
て復号側に伝送する。復号側では第１と第２の復号化部３’−１、３’−２を有
する復号化部３’により、図１４に詳しく示すように６ch「１」〜「６」の予測
符号化データをＰＣＭデータに復号し、次いでミクス＆マトリクス回路４’によ
り式（１−１）に基づいて元の６ch（Ｌｆ、Ｃ、Ｒｆ、Ｌｓ、Ｒｓ、Ｌｆｅ）の
みを復元する。
【００１２】
図２は第２の例の伝送形態として、マルチチャネルを圧縮するとともに再生側
のダウンミクスを許可する場合を示している。符号化側の６chミクス＆マトリク
ス回路１’は、元の６ch（Ｌｆ、Ｃ、Ｒｆ、Ｌｓ、Ｒｓ、Ｌｆｅ）と係数ｍij（
ｉ＝１，２，ｊ＝１，２〜６）により次式（２）のようにステレオ２chデータ（
Ｌ、Ｒ）を生成（ダウンミクス）する。
Ｌ＝ｍ11・Ｌｆ＋ｍ12・Ｒｆ＋ｍ13・Ｃ
＋ｍ14・Ｌｓ＋ｍ15・Ｒｓ＋ｍ16・Ｌｆｅ
Ｒ＝ｍ21・Ｌｆ＋ｍ22・Ｒｆ＋ｍ23・Ｃ
＋ｍ24・Ｌｓ＋ｍ25・Ｒｓ＋ｍ26・Ｌｆｅ …（２）
【００１３】
そして、式（２）と次式（１−２）により次のような第１グループの２チャネ
ル分の相関信号「１」、「２」と第２グループの４チャネル分の相関信号「３」
〜「６」に変換し、それぞれ第１符号化部２’−１、第２符号化部２’−２に出
力する。
「１」＝Ｌ＋Ｒ
「２」＝Ｌ−Ｒ
「３」〜「６」は式（１−１）と同じ …（１−２）
【００１４】
第１、第２符号化部２’−１、２’−２はそれぞれ第１グループチャネル「１
」、「２」と第２グループチャネル「３」〜「６」のＰＣＭデータを予測符号化
し、各チャネルの予測符号化データを記録媒体５や通信媒体６を介して復号側に
伝送する。復号側では第１、第２復号化部３’−１、３’−２により、それぞれ
第１グループチャネル「１」、「２」と第２グループチャネル「３」〜「６」の
予測符号化データをＰＣＭデータに復号し、次いでミクス＆マトリクス回路４’
により式（１−２）、（２）に基づいて元の６ch（Ｌｆ、Ｃ、Ｒｆ、Ｌｓ、Ｒｓ
、Ｌｆｅ）を復元するとともに、第１グループチャネル「１」、「２」を加算、
減算することによりそれぞれステレオ２chデータ（Ｌ、Ｒ）を生成する。
【００１５】
図３は第３の例の伝送形態として、マルチチャネルを圧縮しないで伝送すると
ともに再生側のダウンミクスを禁止する場合を示している。この場合には、非圧
縮であるので、符号化側では相関信号も生成することなく元の６ch（Ｌｆ、Ｃ、
Ｒｆ、Ｌｓ、Ｒｓ、Ｌｆｅ）のＰＣＭデータをそのまま伝送し（ただし、フォー
マット化する）、復号化側ではデフォーマット化した後、元の６ch（Ｌｆ、Ｃ、
Ｒｆ、Ｌｓ、Ｒｓ、Ｌｆｅ）のみを復元する。
【００１６】
図４は第４の例の伝送形態として、マルチチャネルを圧縮しないで伝送すると
ともに再生側のダウンミクスを許可する場合を示している。この場合にも、非圧
縮であるので、符号化側では圧縮率を高めるための相関信号も生成することなく
元の６ch（Ｌｆ、Ｃ、Ｒｆ、Ｌｓ、Ｒｓ、Ｌｆｅ）のＰＣＭデータをそのまま伝
送する（ただし、フォーマット化する）。復号化側ではデフォーマット化した後
、元の６ch（Ｌｆ、Ｃ、Ｒｆ、Ｌｓ、Ｒｓ、Ｌｆｅ）を復元するとともに、式（
２）によりステレオ２chデータ（Ｌ、Ｒ）を生成（ダウンミクス）する。
【００１７】
図５は図１においてマルチチャネルを圧縮するとともに再生側のダウンミクス
を禁止する場合の変形例を示している。この場合には、符号化側では次式（１−
３）により６ch（１）〜（６）分の相関信号に変換し、符号化部２’はこれを予
測符号化する。そして、復号化側では式（１−２）により元の６ch（Ｌｆ、Ｃ、
Ｒｆ、Ｌｓ、Ｒｓ、Ｌｆｅ）のみを復元する。
「１」＝Ｌｆ−Ｃ
「２」＝Ｒｆ−Ｃ
「３」〜「６」は式（１−１）と同じ …（１−３）
このように再生側のダウンミクスを禁止する場合は、これに対応して式（２）の
ダウンミクス係数を符号化に加えないとともに、符号化側で式（２）によりステ
レオ２ｃｈデータ（Ｌ、Ｒ）を生成（ダウンミクス）することが禁じられる。
【００１８】
図６は図２においてマルチチャネルを圧縮するとともに再生側のダウンミクス
を許可する場合の変形例を示している。この場合には、符号化側では式（２）に
よりステレオ２chデータ（Ｌ、Ｒ）を生成（ダウンミクス）し、次いで次式（１
−４）により次のような第１グループの２チャネル「１」、「２」と第２グルー
プの４チャネル分の相関信号「３」〜「６」に変換し、第１、第２符号化部２’
−１、２’−２はこの各グループチャネルを予測符号化する。そして、復号化側
では式（１−４）、（２）により元の６ch（Ｌｆ、Ｃ、Ｒｆ、Ｌｓ、Ｒｓ、Ｌｆ
ｅ）を復元するとともにステレオ２chデータ（Ｌ、Ｒ）をそのまま出力する。
「１」＝Ｌ
「２」＝Ｒ
「３」〜「６」は式（１−１）と同じ …（１−４）
【００１９】
図７を参照して符号化部２’−１、２’−２について詳しく説明する。各ch「１
」〜「６」のＰＣＭデータは１フレーム毎に１フレームバッファ１０に格納され
る。そして、１フレームの各ch「１」〜「６」のサンプルデータがそれぞれ予測
回路１３Ｄ１、１３Ｄ２、１５Ｄ１〜１５Ｄ４に印加されるとともに、各ch「１
」〜「６」の各フレームの先頭サンプルデータがフォーマット化回路１９に印加
される。予測回路１３Ｄ１、１３Ｄ２、１５Ｄ１〜１５Ｄ４はそれぞれ、各ch「
１」〜「６」のＰＣＭデータに対して、特性が異なる複数の予測器（不図示）に
より時間領域における過去の信号から現在の信号の複数の線形予測値を算出し、
次いで原ＰＣＭデータと、この複数の線形予測値から予測器毎の予測残差を算出
する。続くバッファ・選択器１４Ｄ１、１４Ｄ２、１６Ｄ１〜１６Ｄ４はそれぞ
れ、予測回路１３Ｄ１、１３Ｄ２、１５Ｄ１〜１５Ｄ４により算出された各予測
残差を一時記憶して、選択信号／ＤＴＳ（デコーディング・タイム・スタンプ）
生成器１７により指定されたサブフレーム毎に予測残差の最小値を選択する。
【００２０】
選択信号／ＤＴＳ生成器１７は予測残差のビット数フラグをパッキング回路１
８とフォーマット化回路１９に対して印加し、また、予測残差が最小の予測器を
示す予測器選択フラグと、相関係数ａと、復号化側が入力バッファ２２ａ（図１
４）からストリームデータを取り出す時間を示すＤＴＳをフォーマット化回路１
９に対して印加する。パッキング回路１８はバッファ・選択器１４Ｄ１、１４Ｄ
２、１６Ｄ１〜１６Ｄ４により選択された６ch分の予測残差を、選択信号／ＤＴ
Ｓ生成器１７により指定されたビット数フラグに基づいて指定ビット数でパッキ
ングする。またＰＴＳ生成器１７ｃは、復号化側が出力バッファ１１０（図１４
）からＰＣＭデータを取り出す時間を示すＰＴＳ（プレゼンテーション・タイム
・スタンプ）を生成してフォーマット化回路１９に出力する。フォーマット化回
路１９にはまた、圧縮／非圧縮などを示す符号化モードと、ダウンミクス許可／
禁止を示す識別子が印加される。
【００２１】
続くフォーマット化回路１９は図８〜図１３に示すようなユーザデータにフォ
ーマット化する。図８に示すユーザデータ（サブパケット）は、前方グループに
関する２ch「１」、「２」の予測符号化データを含む可変レートビットストリー
ム（サブストリーム）ＢＳ０と、他のグループに関する４ch「３」〜「６」の予
測符号化データを含む可変レートビットストリーム（サブストリーム）ＢＳ１と
、サブストリームＢＳ０、ＢＳ１の前に設けられたビットストリームヘッダ（リ
スタートヘッダ）により構成されている。
【００２２】
また、サブストリームＢＳ０、ＢＳ１の１フレーム分は
・フレームヘッダと、
・各ch「１」〜「６」の１フレームの先頭サンプルデータと、
・各ch「１」〜「６」のサブフレーム毎の予測器選択フラグと、
・各ch「１」〜「６」のサブフレーム毎のビット数フラグと、
・各ch「１」〜「６」の予測残差データ列（可変ビット数）と、
・ch「６」の係数ａとが、
多重化されている。このような予測符号化によれば、原信号が例えばサンプリ
ング周波数＝９６ｋＨｚ、量子化ビット数＝２４ビット、６チャネルの場合、７
１％の圧縮率を実現することができる。
【００２３】
図７に示す符号化部２’−１、２’−２により予測符号化された可変レートビ
ットストリームデータを、記録媒体の一例としてＤＶＤオーディオディスクに記
録する場合には、図９に示すオーディオ（Ａ）パックにパッキングされる。この
パックは２０３４バイトのユーザデータ（Ａパケット、Ｖパケット）に対して４
バイトのパックスタート情報と、６バイトのＳＣＲ（System Clock Reference：
システム時刻基準参照値）情報と、３バイトのMux レート（rate）情報と１バイ
トのスタッフィングの合計１４バイトのパックヘッダが付加されて構成されてい
る（１パック＝合計２０４８バイト）。この場合、タイムスタンプであるＳＣＲ
情報を、先頭パックでは「１」として同一タイトル内で連続とすることにより同
一タイトル内のＡパックの時間を管理することができる。
【００２４】
圧縮ＰＣＭのＡパケットは図１０に詳しく示すように、１９又は１４バイトの
パケットヘッダと、圧縮ＰＣＭのプライベートヘッダと、図１１に示すフォーマ
ットの１ないし２０１１バイトのオーディオデータ（圧縮ＰＣＭ）により構成さ
れている。そして、ＤＴＳとＰＴＳは図５のパケットヘッダ内に（具体的にはパ
ケットヘッダの１０〜１４バイト目にＰＴＳが、１５〜１９バイト目にＤＴＳが
）セットされる。圧縮ＰＣＭのプライベートヘッダは、
・１バイトのサブストリームＩＤと、
・２バイトのＵＰＣ／ＥＡＮ−ＩＳＲＣ（Universal Product Code/European Ar
ticle Number-International Standard Recording Code）番号、及びＵＰＣ／Ｅ
ＡＮ−ＩＳＲＣデータと、
・１バイトのプライベートヘッダ長と、
・２バイトの第１アクセスユニットポインタと、
・８バイトのオーディオデータ情報（ＡＤＩ）と、
・０〜７バイトのスタッフィングバイトとに、
より構成されている。
【００２５】
また、ＡＤＩ内に１秒後のアクセスユニットをサーチするための前方アクセス
ユニット・サーチポインタと、１秒前のアクセスユニットをサーチするための後
方アクセスユニット・サーチポインタがともに１バイトでセットされる。具体的
にはＡＤＩの７バイト目に前方アクセスユニット・サーチポインタが、８バイト
目に後方アクセスユニット・サーチポインタがセットされる。
【００２６】
図１０に示す圧縮ＰＣＭ（ＰＰＣＭともいう）のオーディオパケットにおける
オーディオデータエリアは、図１１に示すようにサブパケットと複数のＰＰＣＭ
アクセスユニットにより構成され、ＰＰＣＭアクセスユニットはＰＰＣＭシンク
情報とサブパケットにより構成されている。最初のＰＰＣＭアクセスユニット内
のサブパケットは、ディレクトリと、サブストリーム「０」と、ＣＲＣと、サブ
ストリーム「１」と、ＣＲＣとエクストラ情報により構成され、サブストリーム
「０」、「１」はＰＰＣＭブロックのみにより構成されている。２番目以降のＰ
ＰＣＭアクセスユニット内のサブパケットは、ディレクトリを除いてサブストリ
ーム「０」と、ＣＲＣと、サブストリーム「１」と、ＣＲＣとエクストラ情報に
より構成され、サブストリーム「０」、「１」はリスタートヘッダとＰＰＣＭブ
ロックにより構成されている。
【００２７】
ＰＰＣＭシンク情報（以下、同期情報ともいう）は次の情報を含む。
・１パケット当たりのサンプル数：サンプリング周波数ｆｓに応じて４０、８０
又は１６０が選択される。
・データレート：ＶＢＲの場合には「０」（サブパケット内のデータが圧縮デー
タであることを示す識別子）
・サンプリング周波数ｆｓ及び量子化ビット数Ｑｂ
・チャネル割り当て情報
【００２８】
フォーマット化回路１９はまた、図８〜図１１に示すオーディオパックを管理
するために図１２、図１３に示すような管理情報を含むＡＴＳＩ（オーディオ・
タイトル・セット・インフォーメーション）をフォーマット化する。図１２はＡ
ＯＴＴ−ＡＯＢ−ＡＴＲ（オーディオオンリタイトル・オーディオオブジェクト
セット・アトリビュート）を示し、このＡＯＴＴ−ＡＯＢ−ＡＴＲ（ｂ１２７〜
ｂ０）は、ＭＳＢ側から順に
・８ビット（ｂ１２７〜ｂ１２０）のオーディオ符号化モードと、
・８ビット（ｂ１１９〜ｂ１１２）の保留領域と、
・４ビット（ｂ１１１〜ｂ１０８）のチャネルグループ「１」の量子化ビット数
Ｑ１と、
・４ビット（ｂ１０７〜ｂ１０４）のチャネルグループ「２」の量子化ビット数
Ｑ２と、
・４ビット（ｂ１０３〜ｂ１００）のチャネルグループ「１」のサンプリング周
波数ｆｓ１と、
・４ビット（ｂ９９〜ｂ９６）のチャネルグループ「２」のサンプリング周波数
ｆｓ２と、
・３ビット（ｂ９５〜ｂ９３）のマルチチャネル構造のタイプと、
・５ビット（ｂ９２〜ｂ８８）のチャネル割り当てと、
・８ビット×１１（ｂ８７〜ｂ０）の保留領域により構成されている。
【００２９】
上記データを以下に詳しく示す。
（１）オーディオ符号化モード（ｂ１２７〜ｂ１２０）
００００００００ｂ：リニアＰＣＭモード
０００００００１ｂ：圧縮ＰＣＭモード
その他：その他の符号化モード用に保留
【００３０】
（２）チャネルグループ１の量子化ビット数Ｑ１（ｂ１１１〜ｂ１０８）
００００ｂ：１６ビット
０００１ｂ：２０ビット
００１０ｂ：２４ビット
その他：保留
（３）チャネルグループ２の量子化ビット数Ｑ２（ｂ１０７〜ｂ１０４）
・チャネルグループ１の量子化ビット数Ｑ１が「００００ｂ」の場合には「０
０００ｂ」
・チャネルグループ１の量子化ビット数Ｑ１が「０００１ｂ」の場合には「０
０００ｂ」又は「０００１ｂ」
・チャネルグループ１の量子化ビット数Ｑ１が「００１０ｂ」の場合には「０
０００ｂ」、「０００１ｂ」又は「００１０ｂ」
ただし、００００ｂ：１６ビット
０００１ｂ：２０ビット
００１０ｂ：２４ビット
その他：保留
【００３１】
（４）チャネルグループ１のサンプリング周波数ｆｓ１（ｂ１０３〜ｂ１００）
００００ｂ：４８ｋＨｚ
０００１ｂ：９６ｋＨｚ
００１０ｂ：１９２ｋＨｚ
１０００ｂ：４４．１ｋＨｚ
１００１ｂ：８８．２ｋＨｚ
１０１０ｂ：１７６．４ｋＨｚ
その他：保留
【００３２】
（５）チャネルグループ２のサンプリング周波数ｆｓ２（ｂ９９〜ｂ９６）
・チャネルグループ１のサンプリング周波数ｆｓ１が「００００ｂ」の場合に
は「００００ｂ」
・チャネルグループ１のサンプリング周波数ｆｓ１が「０００１ｂ」の場合に
は「００００ｂ」又は「０００１ｂ」
・チャネルグループ１のサンプリング周波数ｆｓ１が「００１０ｂ」の場合に
は「００００ｂ」、「０００１ｂ」又は「００１０ｂ」
・チャネルグループ１のサンプリング周波数ｆｓ１が「１０００ｂ」の場合に
は「１０００ｂ」
・チャネルグループ１のサンプリング周波数ｆｓ１が「１００１ｂ」の場合に
は「１０００ｂ」又は「１００１ｂ」
・チャネルグループ１のサンプリング周波数ｆｓ１が「１０１０ｂ」の場合に
は「１０００ｂ」、「１００１ｂ」又は「１０１０ｂ」
【００３３】
（６）マルチチャネル構造のタイプ（ｂ９５〜ｂ９３）
０００ｂ：タイプ１
その他：保留
（７）チャネル割り当て（ｂ９２〜ｂ８８）
１チャネル（モノラル）から６チャネルまでのグループ「１」、「２」のチャ
ネル割り当て情報
【００３４】
図１３はＡＴＳ−ＰＧ−ＣＮＴ（オーディオタイトルセット・プログラム・コ
ンテンツ）を示し、これは先頭から順に
・１ビット（ｂ３１）の、前回と今回のＰＧの関係（Ｒ／Ａ）と、
・１ビット（ｂ３０）のＳＴＣ不連続性フラグ（ＳＴＣ−Ｆ）と、
・３ビット（ｂ２９〜ｂ２７）のアトリビュート数（ＡＴＲＮ）と、
・３ビット（ｂ２６〜ｂ２４）のチャネルグループ（ＣｈＧｒ）「２」のビット
シフトデータと、
・２ビット（ｂ２３、ｂ２２）の保留領域と、
・１ビット（ｂ２１）のダウンミックスモード（Ｄ−Ｍ）と、
・１ビット（ｂ２０）のダウンミックス係数の有効性（図示※）と、
・４ビット（ｂ１９〜ｂ１６）のダウンミックス係数テーブル番号（ＤＭ−ＣＯ
ＥＦＴＮ）と、
・各々が１ビット、合計１６ビット（ｂ１５〜ｂ０）のＲＴＩフラグＦ１５〜Ｆ
０により構成されている。
そして、ビット（ｂ２１）のダウンミクスモード（Ｄ−Ｍ）が「１」の場合に
「ダウンミクス禁止」、「０」の場合に「ダウンミクス許可」を表す。
【００３５】
次に図１４を参照して復号化部３’（３’−１、３’−２）について説明する
。なお、この復号化部３’（３’−１、３’−２）とミクス＆マトリクス回路４
’は、ハードウエアの他にコンピュータプログラムよっても実現することができ
る。上記フォーマットの可変レートビットストリームデータＢＳ０、ＢＳ１は、
デフォーマット化回路２１により分離される。そして、各ｃｈ「１」〜「６」の
１フレームの先頭サンプルデータと予測器選択フラグはそれぞれ予測回路２４Ｄ
１、２４Ｄ２、２３Ｄ１〜２３Ｄ４に印加され、各ｃｈ「１」〜「６」のビット
数フラグはアンパッキング回路２２に印加される。また、ＳＣＲと、ＤＴＳと予
測残差データ列は入力バッファ２２ａに印加され、ＰＴＳは出力バッファ１１０
に印加される。また、圧縮／非圧縮などを示す符号化モードと、ダウンミクス許
可／禁止を示す識別子は制御部１００に印加され、サンプリング周波数ｆｓ及び
量子化ビット数ＱｂはＤ／Ａ変換器１０２に印加される。ここで、予測回路２４
Ｄ１、２４Ｄ２、２３Ｄ１〜２３Ｄ４内の複数の予測器（不図示）はそれぞれ、
符号化側の予測回路１３Ｄ１、１３Ｄ２、１５Ｄ１〜１５Ｄ４内の複数の予測器
と同一の特性であり、予測器選択フラグにより同一特性のものが選択される。
【００３６】
デフォーマット化回路２１により分離されたストリームデータ（予測残差デー
タ列）は、図１５に示すようにＳＣＲによりアクセスユニット毎に入力バッファ
２２ａに取り込まれて蓄積される。ここで、１つのアクセスユニットのデータ量
は、例えばｆｓ＝９６ｋＨｚの場合には（１／９６ｋＨｚ）秒分であるが、図１
６、図１７（ａ）に詳しく示すように可変長である。そして、入力バッファ２２
ａに蓄積されたストリームデータはＤＴＳに基づいてＦＩＦＯで読み出されてア
ンパッキング回路２２に印加される。
【００３７】
アンパッキング回路２２は各ｃｈ「１」〜「６」の予測残差データ列をビット
数フラグ毎に基づいて分離してそれぞれ予測回路２４Ｄ１、２４Ｄ２、２３Ｄ１
〜２３Ｄ４に出力する。予測回路２４Ｄ１、２４Ｄ２、２３Ｄ１〜２３Ｄ４では
それぞれ、アンパッキング回路２２からの各ｃｈ「１」〜「６」の今回の予測残
差データと、内部の複数の予測器の内、予測器選択フラグにより選択された各１
つにより予測された前回の予測値が加算されて今回の予測値が算出され、次いで
１フレームの先頭サンプルデータを基準として各サンプルのＰＣＭデータが算出
されて出力バッファ１１０に蓄積される。出力バッファ１１０に蓄積されたＰＣ
ＭデータはＰＴＳに基づいて読み出されて出力され、したがって、図１７（ａ）
に示す可変長のアクセスユニットが伸長されて、図１７（ｂ）に示す一定長のプ
レゼンテーションユニットが出力される。
【００３８】
また、ＰＰＣＭシンク情報内のサンプリング周波数ｆｓ及び量子化ビット数Ｑ
ｂに基づいて、ＰＣＭデータがＤ／Ａ変換器１０２によりアナログ信号に変換さ
れる。ここで、操作部１０１を介してサーチ再生が指示された場合には、制御部
１００により図５に示す前方アクセスユニット・サーチポインタ（１秒先）と後
方アクセスユニット・サーチポインタ（１秒前）に基づいてアクセスユニットを
再生する。このサーチポインタとしては、１秒先、１秒前の代わりに２秒先、２
秒前のものでよい。
【００３９】
符号化部２’（２’−１、２’−２）により予測符号化された可変レートビッ
トストリームデータをネットワークを介して伝送する場合には、符号化側では図
１８に示すように伝送用にパケット化し（ステップＳ４１）、次いでパケットヘ
ッダを付与し（ステップＳ４２）、次いでこのパケットをネットワーク上に送り
出す（ステップＳ４３）。
【００４０】
復号側では図１９（Ａ）に示すようにヘッダを除去し（ステップＳ５１）、次
いでデータを復元し（ステップＳ５２）、次いでこのデータをメモリに格納して
復号を待つ（ステップＳ５３）。そして、復号を行う場合には図１９（Ｂ）に示
すように、デフォーマット化を行い（ステップＳ６１）、次いで入力バッファ２
２ａの入出力制御を行い（ステップＳ６２）、次いでアンパッキングを行う（ス
テップＳ６３）。なお、このとき、サーチ再生指示がある場合にはサーチポイン
タをデコードする。次いで予測器をフラグに基づいて選択してデコードを行い（
ステップＳ６４）、次いで出力バッファ１１０の入出力制御を行い（ステップＳ
６５）、次いで元のマルチチャネルを復元し（ステップＳ６６）、次いでこれを
出力し（ステップＳ６７）、以下、これを繰り返す。
【００４１】
次に図２０、図２１を参照して第２の実施形態について説明する。上記の実施
形態では、１グループの相関性の信号「１」〜「６」を予測符号化するように構
成されているが、この第４の実施形態では複数グループの相関性のある信号を生
成して予測符号化し、圧縮率が最も高いグループの予測符号化データを選択する
ように構成されている。このため図２０に示す符号化部では、第１〜第ｎの相関
回路１−１〜１−ｎが設けられ、このｎ個の相関回路１−１〜１−ｎは例えば６
ch（Ｌｆ、Ｃ、Ｒｆ、Ｌｓ、Ｒｓ、Ｌｆｅ）のＰＣＭデータを、相関性が異なる
ｎ種類の６ch信号「１」〜「６」に変換する。
【００４２】
例えば第１の相関回路１−１は以下のように変換し、
（１）＝Ｌｆ
（２）＝Ｃ−（Ｌｓ＋Ｒｓ）／２
（３）＝Ｒｆ−Ｌｆ
（４）＝Ｌｓ−ａ×Ｌｆｅ
（５）＝Ｒｓ−ｂ×Ｒｆ
（６）＝Ｌｆｅ
また、第ｎの相関回路１−ｎは以下のように変換する。
（１）＝Ｌｆ＋Ｒｆ
（２）＝Ｃ−Ｌｆ
（３）＝Ｒｆ−Ｌｆ
（４）＝Ｌｓ−Ｌｆ
（５）＝Ｒｓ−Ｌｆ
（６）＝Ｌｆｅ−Ｃ
【００４３】
また、相関回路１−１〜１−ｎ毎に予測回路１５とバッファ・選択器１６が設
けられ、グループ毎の予測残差の最小値のデータ量に基づいて圧縮率が最も高い
グループが相関選択信号生成器１７ｂにより選択される。このとき、フォーマッ
ト化回路１９はその選択フラグ（相関回路選択フラグ、その相関回路の相関係数
ａ、ｂ）を追加して多重化する。
【００４４】
また、図２１に示す復号化側では、符号化側の相関回路１−１〜１−ｎに対し
てｎ個の相関回路４−１〜４−ｎ（又は係数ａ、ｂが変更可能な１つの相関回路
４）が設けられる。なお、図２０に示すｎグループの予測回路が同一の構成であ
る場合、復号装置では図２１に示すようにｎグループ分の予測回路を設ける必要
はなく、１つのグループ分の予測回路でよい。そして、符号化装置から伝送され
た選択フラグに基づいて相関回路４−１〜４−ｎの１つを選択、又は係数ａ、ｂ
を設定して元の６ch（Ｌｆ、Ｃ、Ｒｆ、Ｌｓ、Ｒｓ、Ｌｆｅ）を復元し、また、
式（２）によりマルチチャネルをダウンミクスしてステレオ２chデータ（Ｌ、Ｒ
）を生成する。
【００４５】
また、上記の第１の実施形態では、１種類の相関性の信号「１」〜「６」を予
測符号化するように構成されているが、この信号「１」〜「６」のグループと原
信号（Ｌｆ、Ｃ、Ｒｆ、Ｌｓ、Ｒｓ、Ｌｆｅ）のグループを予測符号化し、圧縮
率が高い方のグループを選択するようにしてもよい。
本発明によれば、特許請求の範囲に記載した発明の他に、次のような発明が提
供される。
マルチチャネルの音声信号が圧縮されたデータ又は圧縮されないデータを選択
的にオーディオパケットに配置するフォーマット化手段と、
前記オーディオパケット内のマルチチャネルデータが圧縮されているか否か、
あるいは、前記オーディオパケット内のマルチチャネルデータをステレオ２チャ
ネルにダウンミクスすることを許可するか又は禁止するかによってあらかじめダ
ウンミクスして符号化するか否か、あるいはダウンミクス係数を符号化するか否
かを選択する手段とを、
有する音声符号化装置。
【図面の簡単な説明】
【００４６】
【図１】本発明が適用されるマルチチャネルの伝送形態の第１の例を示す説明図である。
【図２】本発明が適用されるマルチチャネルの伝送形態の第２の例を示す説明図である。
【図３】本発明が適用されるマルチチャネルの伝送形態の第３の例を示す説明図である。
【図４】本発明が適用されるマルチチャネルの伝送形態の第４の例を示す説明図である。
【図５】図１の変形例を示す説明図である。
【図６】図２の変形例を示す説明図である。
【図７】図１の符号化部を詳しく示すブロック図である。
【図８】図１、図７の符号化部により符号化されたビットストリームを示す説明図である。
【図９】ＤＶＤのパックのフォーマットを示す説明図である。
【図１０】ＤＶＤのオーディオパックのフォーマットを示す説明図である。
【図１１】図１０のオーディオデータエリアのフォーマットを詳しく示す説明図である。
【図１２】ＤＶＤオーディオのＡＯＴＴ−ＡＯＢ−ＡＴＲ（オーディオオンリタイトル・オーディオオブジェクトセット・アトリビュート）を示す説明図である。
【図１３】ＤＶＤオーディオのＡＴＳ−ＰＧ−ＣＮＴ（オーディオタイトルセット・プログラム・コンテンツ）を示す説明図である。
【図１４】図１の復号化部を詳しく示すブロック図である。
【図１５】図１４の入力バッファの書き込み／読み出しタイミングを示すタイミングチャートである。
【図１６】アクセスユニット毎の圧縮データ量を示す説明図である。
【図１７】アクセスユニットとプレゼンテーションユニットを示す説明図である。
【図１８】音声伝送方法を示すフローチャートである。
【図１９】音声伝送方法を示すフローチャートである。
【図２０】第２の実施形態の音声符号化装置を示すブロック図である。
【図２１】第２の実施形態の音声復号装置を示すブロック図である。
【符号の説明】
【００４７】
１’ ６chミクス＆マトリクス回路
１３Ｄ１，１３Ｄ２，１５Ｄ１〜１５Ｄ４予測回路（バッファ・選択器１４
Ｄ１，１４Ｄ２，１６Ｄ１〜１６Ｄ４と共に圧縮手段を構成する。）
１４Ｄ１，１４Ｄ２，１６Ｄ１〜１６Ｄ４バッファ・選択器
１７選択信号／ＤＴＳ生成器
１７ｃＰＴＳ生成器
１９フォーマット化回路
２１デフォーマット化回路（分離手段）
２２アンパッキング回路
２２ａ入力バッファ
２４Ｄ１，２４Ｄ２，２３Ｄ１〜２３Ｄ４予測回路（伸長手段）
１００制御部（再生手段）
１０２Ｄ／Ａ変換器
１１０出力バッファ

【特許請求の範囲】
【請求項１】
マルチチャネルの音声信号を、そのままのチャネル又は互いに相関あるチャネル毎に、入力される音声信号に応答して先頭サンプル値を所定時間のフレーム単位で得ると共に、時間領域の過去の信号から予測される現在の信号の複数の予測値の中でその予測残差が最小となるような線形予測方法を、前記フレームを更に分割したサブフレーム単位に選択して圧縮するステップと、
前記圧縮されたデータ量に応じて、復号側の入力バッファ内の圧縮データを読み出すタイミングを示すデコーディング・タイム・スタンプ情報を生成するステップと、
ヘッダ情報とユーザデータとを有して、このユーザデータ内に前記デコーディング・タイム・スタンプ情報を含むパケットヘッダと、
前記ステップにより選択された先頭サンプル値と、サブフレーム毎の予測残差と線形予測方法とを含む圧縮データが格納されるオーディオパケットと、
前記オーディオパケット内のデータが前記圧縮方法により圧縮されていることを示す第１の識別子と、前記オーディオパケット内に格納されているマルチチャネルデータをステレオ２チャネルにダウンミクスすることを許可するか又は禁止するかを示す第２の識別子が配置された管理情報とを、
有するデータ構造にフォーマット化するステップと、
からなる音声符号化方法。
【請求項２】
請求項１記載の音声符号化方法によりフォーマット化されたデータ構造のデータを復号する音声復号化方法であって、
前記データをオーディオパケットと管理情報に分離するステップと、
前記管理情報から第１の識別子と第２の識別子を抽出するステップと、
前記オーディオパケット内のユーザデータをパケットヘッダとサブフレーム単位の圧縮データとに分離するステップと、
前記分離された圧縮データを前記サーチ情報に基づいてサーチして入力バッファに蓄積するステップと、
前記入力バッファ内に蓄積された圧縮データを前記パケットヘッダ内のデコーディング・タイム・スタンプ情報に基づいて読み出すステップと、
抽出された第２の識別子がダウンミクスすることを許可する場合に前記読み出された圧縮データを前記抽出された第１の識別子に基づいて伸長してマルチチャネルとステレオ２チャネルの少なくともいずれかで取り出し、前記第２の識別子がダウンミクスすることを禁止する場合には前記読み出された圧縮データを前記第１の識別子に基づいて伸長してマルチチャネルのみで取り出すステップと、
からなる音声復号化方法。

【図１】

【図２】

【図３】

【図４】

【図５】

【図６】

【図７】

【図８】

【図９】

【図１０】

【図１１】

【図１２】

【図１３】

【図１４】

【図１５】

【図１６】

【図１７】

【図１８】

【図１９】

【図２０】

【図２１】

【公開番号】特開２００７−１１３８１（Ｐ２００７−１１３８１Ａ）
【公開日】平成１９年１月１８日（２００７．１．１８）
【国際特許分類】

【出願番号】特願２００６−１８７７３３（Ｐ２００６−１８７７３３）
【出願日】平成１８年７月７日（２００６．７．７）
【分割の表示】特願２００６−１８４１６４（Ｐ２００６−１８４１６４）の分割
【原出願日】平成１０年１１月１６日（１９９８．１１．１６）
【出願人】（０００００４３２９）日本ビクター株式会社 (3,896)
【Ｆターム（参考）】

[ Back to top ]

音声符号化方法及び音声復号化方法

メニュー

スポンサーリンク

次の公報 »

« 前の公報

音声符号化方法及び音声復号化方法

メニュー

スポンサー リンク

次の公報 »

« 前の公報

スポンサーリンク