音声符号化方法及び音声復号方法
【課題】 マルチチャネルの音声信号を予測符号化し、圧縮率を改善した音声データを伝送する。
【解決手段】 加算回路1aはステレオ2チャネル信号L、Rの和信号(L+R)を算出し、減算回路1bは差信号(L−R)を算出する。差分演算回路11D1、11D2により今回と前回の差分Δ(L+R)、Δ(L−R)を算出し、予測符号化回路(15D1、15D2、16D1、16D2)により差分Δ(L+R)、Δ(L−R)の複数の予測値を算し、複数の予測値と差分Δ(L+R)、Δ(L−R)の各予測残差を算出し、最小の予測残差を選択する等して予測符号化データをパケットし、その後、所定の通信回線を通じて伝送する。
【解決手段】 加算回路1aはステレオ2チャネル信号L、Rの和信号(L+R)を算出し、減算回路1bは差信号(L−R)を算出する。差分演算回路11D1、11D2により今回と前回の差分Δ(L+R)、Δ(L−R)を算出し、予測符号化回路(15D1、15D2、16D1、16D2)により差分Δ(L+R)、Δ(L−R)の複数の予測値を算し、複数の予測値と差分Δ(L+R)、Δ(L−R)の各予測残差を算出し、最小の予測残差を選択する等して予測符号化データをパケットし、その後、所定の通信回線を通じて伝送する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声信号を予測符号化して圧縮するための音声符号化方法及び音声復号方法に関する。
【背景技術】
【0002】
音声信号を予測符号化する方法として、本発明者は先の出願(特願平9−289159号)において1チャネル(チャンネル)の原デジタル音声信号に対して、特性が異なる複数の予測器により時間領域における過去の信号から現在の信号の複数の線形予測値を算出し、原デジタル音声信号と、この複数の線形予測値から予測器毎の予測残差を算出し、この複数の予測残差の最小値を選択する方法を提案している。
【発明の開示】
【発明が解決しようとする課題】
【0003】
しかしながら、上記方法では原デジタル音声信号がサンプリング周波数=96kHz、量子化ビット数=20ビット程度の場合に、ある程度の圧縮効果を得ることができるが、近年のDVDオーディオディスクではこの2倍のサンプリング周波数(=192kHz)が使用され、また、量子化ビット数も24ビットが使用される傾向があるので、圧縮率を改善する必要がある。また、近年のDVDオーディオディスクでは、マルチチャネルが利用され、チャネル数が最大6となるので圧縮率を改善する必要がある。
【0004】
そこで本発明は、音声信号を予測符号化する場合に圧縮率を改善することができる音声符号化方法及び音声復号方法を提供することを目的とする。
【課題を解決するための手段】
【0005】
本発明は上記目的を達成するために、以下の1)及び2)手段よりなる。
すなわち、
【0006】
1)3以上のマルチチャネルの音声信号中の少なくとも選択された第1及び第2の2つのチャネルの音声信号をマトリクス演算して互いに相関ある2つの相関チャネルに変換するステップと、
前記ステップにより変換された2つの相関チャネルを含む音声信号を、チャネル毎に、入力される音声信号に応答して先頭サンプル値を所定時間のフレーム単位で得ると共に、特性が異なる複数の線形予測方法により時間領域の過去から現在の信号の線形予測値がそれぞれ予測され、その予測される線形予測値と前記音声信号とから得られる予測残差が最小となるような線形予測方法を、前記フレームを更に分割したサブフレーム単位に選択して予測符号化するステップと、
ヘッダ情報と、圧縮PCMプライベートヘッダ及び圧縮PCMアクセスユニットを含むユーザデータと、を含んだデータ構造にすると共に、前記ステップにより選択された各チャネルの線形予測方法と予測残差と所定の先頭サンプル値を含む予測符号化データを、前記圧縮PCMアクセスユニット内に配置されるサブパケット内のストリーム部に格納し、さらに前記圧縮PCMアクセスユニット内に少なくとも前記音声信号のサンプリング周波数を含む同期情報部を格納すると共に前記サブパケット内のストリーム部にフレーム毎にリスタートヘッダを設け、さらに、前記音声信号のUPC/EAN番号及びISRCデータを前記圧縮PCMプライベートヘッダ内に格納するステップと、
からなる音声符号化方法。
2)請求項1記載の音声符号化方法により符号化されたデータから元の音声信号を復号する音声復号方法であって、
前記格納された各チャネルの予測符号化データを抽出するステップと、
前記抽出された各チャネルの予測符号化データから予測値を算出するステップと、
前記算出された予測値から元の音声信号を復元するステップと、
からなる音声復号方法。
【発明の効果】
【0007】
以上説明したように本発明によれば、従来以上に圧縮率を改善した音声の符号化ができると共に、不都合なく音声信号を復号できる。
【発明を実施するための最良の形態】
【0008】
以下、図面を参照して本発明の実施の形態を説明する。図1は本発明が適用される音声符号化装置とそれに対応した音声復号装置の第1の実施形態を示すブロック図、図2は図1のエンコーダを詳しく示すブロック図、図3は図2のマルチプレクサにより多重化される1フレームのフォーマットを示す説明図、図4はDVDのパックのフォーマットを示す説明図、図5はDVDのオーディオパックのフォーマットを示す説明図、図6は図1のデコーダを詳しく示すブロック図である。
【0009】
図1に示すチャネル相関回路Aは加算回路1aと減算回路1bを有する。加算回路1aは各チャネル(以下、ch)が例えばサンプリング周波数=192kHz、量子化ビット数=24ビットのステレオ2ch信号L、Rの和信号(L+R)を算出して和ch用1chロスレス・エンコーダ2D1に出力し、減算回路1bは差信号(L−R)を算出して差ch用1chロスレス・エンコーダ2D2に出力する。エンコーダ2D1、2D2は図2に詳しく示すように、それぞれ和信号(L+R)、差信号(L−R)の差分Δ(L+R)、Δ(L−R)を予測符号化して記録媒体や通信媒体を介して伝送する。
【0010】
そして、復号側では、図6に詳しく示すようにデコーダ3D1、3D2がそれぞれ各chの予測符号化データを和信号(L+R)、差信号(L−R)に復号し、次いでチャネル相関回路Bがこの和信号(L+R)、差信号(L−R)をステレオ2ch信号L、Rに復元する。
【0011】
図2を参照してエンコーダ2D1、2D2について詳しく説明する。和信号(L+R)と差信号(L−R)は1フレーム毎に1フレームバッファ10に格納される。そして、1フレームの各サンプル値(L+R)、(L−R)がそれぞれ差分演算回路11D1、11D2に印加され、今回と前回の差分Δ(L+R)、Δ(L−R)、すなわち差分PCM(DPCM)データが算出される。また、各フレームの先頭サンプル値(L+R)、(L−R)がマルチプレクサ19に印加される。
【0012】
差分演算回路11D1により算出された差分Δ(L+R)は、予測係数が異なる複数の予測器12a−1〜12a−nと減算器13a−1〜13a−nに印加される。そして、予測器12a−1〜12a−nではそれぞれ各予測係数に基づいて差分Δ(L+R)の各予測値が算出され、減算器13a−1〜13b−nではそれぞれこの各予測値と差分Δ(L+R)の各予測残差が算出される。バッファ・選択器16D1はこの複数の予測残差を一時記憶して、選択信号生成器17により指定されたサブフレーム毎に最小の予測残差を選択し、パッキング回路18に出力する。なお、このサブフレームはフレームの数十分の1程度のサンプル長であり、一例として1フレームを80サブフレームとする。ここで、予測器12a−1〜12a−nと減算器13a−1〜13a−nは和信号chの予測回路15D1を構成し、また、この予測回路15D1とバッファ・選択器16D1は和信号chの予測符号化回路を構成している。
【0013】
同様に、差分演算回路11D2により算出された差分Δ(L−R)は、予測係数が異なる複数の予測器12b−1〜12b−nと減算器13b−1〜13b−nに印加される。そして、予測器12b−1〜12b−nではそれぞれ各予測係数に基づいて差分Δ(L−R)の各予測値が算出され、減算器13b−1〜13b−nではそれぞれこの各予測値と差分Δ(L−R)の各予測残差が算出される。バッファ・選択器16D2はこの複数の予測残差を一時記憶して、選択信号生成器17により指定されたサブフレーム毎に最小の予測残差を選択し、パッキング回路18に出力する。予測器12b−1〜12b−nと減算器13b−1〜13b−nは差信号chの予測回路15D2を構成し、また、この予測回路15D2とバッファ・選択器16D2は差信号chの予測符号化回路を構成している。
【0014】
選択信号生成器17は予測残差のビット数フラグ(5ビット)をパッキング回路18とマルチプレクサ19に対して印加し、また、予測残差が最小の予測器を示す予測器選択フラグ(その数nが2〜9個として3ビット)をマルチプレクサ19に対して印加する。パッキング回路18はバッファ・選択器16D1、16D2により選択された2ch分の予測残差を、選択信号生成器17により指定されたビット数フラグに基づいて指定ビット数でパッキングする。
【0015】
続くマルチプレクサ19は図3に示すように1フレーム分に対して
・フレームヘッダ(40ビット)と、
・和信号ch(L+R)の1フレームの先頭サンプル値(25ビット)と、
・差信号ch(L−R)の1フレームの先頭サンプル値(25ビット)と、
・和信号ch(L+R)のサブフレーム毎の予測器選択フラグ(3ビット×80)と、
・差信号ch(L−R)のサブフレーム毎の予測器選択フラグ(3ビット×80)と、
・和信号ch(L+R)のサブフレーム毎のビット数フラグ(5ビット×80)と、
・差信号ch(L−R)のサブフレーム毎のビット数フラグ(5ビット×80)と、
・和信号ch(L+R)の予測残差データ列(可変ビット数)と、
・差信号ch(L−R)の予測残差データ列(可変ビット数)とを
アクセスユニットとして多重化し、可変レートビットストリームとして出力する。上記予測残差データ列はサブパケットを構成する。このような予測符号化によれば、原信号が例えばサンプリング周波数=192kHz、量子化ビット数=24ビット、2チャネルの場合、59%の圧縮率を実現することができる。
【0016】
また、この可変レートビットストリームデータをDVDオーディオディスクに記録する場合には、図4に示す圧縮PCMのオーディオ(A)パックにパッキングされる。このパックは2034バイトのユーザデータ(Aパケット、Vパケット)に対して4バイトのパックスタート情報と、6バイトのSCR(System Clock Reference:システム時刻基準参照値)情報と、3バイトのMux レート(rate)情報と1バイトのスタッフィングの合計14バイトのパックヘッダが付加されて構成されている(1パック=合計2048バイト)。この場合、タイムスタンプであるSCR情報を、ACBユニット内の先頭パックでは「1」として同一タイトル内で連続とすることにより同一タイトル内のAパックの時間を管理することができる。
【0017】
圧縮PCMのAパケットは図5に詳しく示すように、17、9又は14バイトのパケットヘッダと、プライベートヘッダと、図3に示すフォーマットの1ないし2015バイトのオーディオ圧縮PCMデータにより構成されている。圧縮PCMのプライベートヘッダは、
・1バイトのサブストリームIDと、
・2バイトのUPC/EAN−ISRC(Universal Product Code/European Article Number-International Standard Recording Code)番号、及びUPC/EAN−ISRCデータと、
・1バイトのプライベートヘッダ長と、
・2バイトの第1アクセスユニットポインタと、
・4バイトのオーディオデータ情報(ADI)と、
・0〜7バイトのスタッフィングバイトとに、
より構成されている。
このように圧縮PCMのAパケットのADIは、4バイトに選定され、通常の非圧縮のPCMのAパケットのADIよりも4バイトだけ短くされている。したがってオーディオデータは4バイト分増加させることができる。
【0018】
次に図6を参照してデコーダ3D1、3D2について説明する。図3に示したフォーマットの可変レートビットストリームデータは、デマルチプレクサ21によりフレームヘッダに基づいて分離される。そして、和信号ch(L+R)及び差信号ch(L−R)の1フレームの先頭サンプル値はそれぞれ累積演算回路25a、25bに印加され、和信号ch(L+R)及び差信号ch(L−R)の予測器選択フラグはそれぞれ予測器(24a−1〜24a−n)、(24b−1〜24b−n)の各選択信号として印加され、和信号ch(L+R)及び差信号ch(L−R)のビット数フラグと予測残差データ列はアンパッキング回路22に印加される。ここで、予測器(24a−1〜24a−n)、(24b−1〜24b−n)はそれぞれ、符号化側の予測器(12a−1〜12a−n)、(12b−1〜12b−n)と同一の特性であり、予測器選択フラグにより同一特性のも
のが選択される。
【0019】
アンパッキング回路22は和信号ch(L+R)及び差信号ch(L−R)の予測残差データ列をビット数フラグ毎に基づいて分離してそれぞれ加算回路23a、23bに出力する。加算回路23a、23bではそれぞれ、アンパッキング回路22からの和信号ch(L+R)及び差信号ch(L−R)の今回の予測残差データと、予測器(24a−1〜24a−n)、(24b−1〜24b−n)の内、予測器選択フラグにより選択された各1つにより予測された前回の予測値が加算されて今回の予測値が算出される。この今回の予測値は、図2に示す差分回路11a、11bによりそれぞれ算出された差分Δ(L+R)、Δ(L−R)すなわちDPCMデータであり、予測器(24a−1〜24a−n)、(24b−1〜24b−n)と累積演算回路25a、25bに印加される。
【0020】
累積演算回路25a、25bはそれぞれ、1フレームの先頭サンプル値に対して差分Δ(L+R)、Δ(L−R)をサンプル毎に累積加算して和信号ch(L+R)、差信号ch(L−R)の各PCMデータを出力する。この和信号(L+R)、差信号(L−R)は図1に示すように加算回路4aにより2L信号が算出されるとともに、減算回路4bにより2R信号が算出される。そして、2L信号と2R信号がそれぞれ割り算器5a、5bにより1/2に割り算され、元のステレオ2チャネル信号L、Rが復元される。
【0021】
次に図7、図8を参照して第2の実施形態について説明する。上記の実施形態では、和信号(L+R)、差信号(L−R)の各差分Δ(L+R)、Δ(L−R)、すなわちDPCMデータのみを予測符号化するように構成されているが、この第2の実施形態では和信号(L+R)、差信号(L−R)すなわちPCMデータ、又はその各差分Δ(L+R)、Δ(L−R)すなわちDPCMデータを選択的に予測符号化するように構成されている。
【0022】
このため図7に示す符号化装置では、図2に示す構成に対して和信号(L+R)、差信号(L−R)をそれぞれ予測符号化するための予測回路15A、15Sとバッファ・選択器16A、16Sが追加されている。また、選択信号生成器17はバッファ・選択器16A、16Sによりそれぞれ選択された和信号(L+R)、差信号(L−R)と、バッファ・選択器16D1、16D2によりそれぞれ選択された差分Δ(L+R)、Δ(L−R)の各予測残差の最小値に基づいて、
PCMデータとDPCMデータのどちらが圧縮率が高いか否かを判断し、高い方のデータを選択する。このとき、そのPCM/DPCMの選択フラグ(予測回路選択フラグ)を追加して多重化する。
【0023】
ここで、図7に示す和信号(L+R)の予測回路15Aと差分Δ(L+R)の予測回路15D1が同一の構成であり、また、差信号(L−R)の予測回路15Sと差分Δ(L−R)の予測回路15D2が同一の構成である場合、復号装置では図8に示すようにPCMデータとDPCMデータの両方の予測回路を設ける必要はなく、1つのデータ分の予測回路でよい。そして、符号化装置から伝送された予測回路選択フラグに基づいてセレクタ26a、26bにより、DPCMデータの場合には累積演算回路25a、25bの出力を選択し、PCMデータの場合には加算回路23a、23bの出力を選択する。
【0024】
第3の実施形態では図9に示すように、原信号L、R(PCMデータ)と、和信号(L+R)、差信号(L−R)(PCMデータ)と、その各差分Δ(L+R)、Δ(L−R)(DPCMデータ)の3グループの1つを選択的に予測符号化するように構成されている。
【0025】
このため図9に示す符号化装置では、図7に示す構成に対して原信号L、Rをそれぞれ予測符号化するための予測回路15L、15Rとバッファ・選択器16L、16Rが追加されている。また、選択信号生成器17はバッファ・選択器16L、16Rにより選択された原信号L、Rと、バッファ・選択器16A、16Sにより選択された和信号(L+R)、差信号(L−R)と、バッファ・選択器16D1、16D2により選択された各差分Δ(L+R)、Δ(L−R)の各予測残差の最小値に基づいて圧縮率が高いグループのデータを選択する。このとき、その選択フラグ(予測回路選択フラグ)を追加して多重化する。
【0026】
また、図9に示す3グループの予測回路が同一の構成である場合、復号装置では図10に示すように3グループ分の予測回路を設ける必要はなく、1つのグループ分の予測回路でよい。そして、符号化装置から伝送された予測回路選択フラグに基づいて、DPCMデータの場合には累積演算回路25a、25bの出力を選択し、PCMデータの場合には加算回路23a、23bの出力を選択してチャネル相関回路Bにより原信号L、Rを復元する。そして、更にセレクタ27a、27bにより原信号L、Rのグループの場合には加算回路23a、23bの出力を選択し、他の場合にはチャネル相関回路Bの出力を選択する
【0027】
また、符号化側により予測符号化された可変レートビットストリームデータをネットワークを介して伝送する場合には、符号化側では図11に示すように伝送用にパケット化し(ステップS41)、次いでパケットヘッダを付与し(ステップS42)、次いでこのパケットをネットワーク上に送り出す(ステップS43)。復号側では図12に示すようにヘッダを除去し(ステップS51)、次いでデータを復元し(ステップS52)、次いでこのデータをメモリに格納して復号を待つ(ステップS53)。
【0028】
上記第1の実施の形態は2チャネルの場合について説明したが、2以上のマルチチャネルの場合の第2の実施の形態について以下説明する。図13は、本発明の第2の実施の形態を示すブロック図である。図13は、図1の2チャネル用の構成に対して後方の2チャネルSL、SRを加えた4チャネル用として構成され、よって入力側にはチャネル相関回路Aに加えて、同様な構成のチャネル相関回路A2が設けられている。また、出力側にもチャネル相関回路Bに加えて、同様な構成のチャネル相関回路B2が設けられている。また、ロスレス・エンコーダ2Dとロスレス・デコーダ3Dはマルチチャネル対応型として構成されている。なお、チャネル相関回路A、A2、B、B2は、それぞれLとR、SLとSRを組み合わせの対象としている。なお、ロスレス・エンコーダ2Dとロスレス・デコーダ3Dにおける一連の動作である、差分の算出、予測値の算出、最小予測残差の選択、最小予測残差を用いた予測値の算出などは、第1の実施の形態と同様に行われる。
【0029】
次に、第2の実施の形態の変形例としての第3の実施の形態について、そのブロック図を示す図14に沿って説明する。図14は、図13の4チャネル用の構成に対して更にセンタチャネルC及び低音効果チャネルLFEを加えた合計6チャネル用として構成されている。ただし、センタチャネルC、後方の2チャネルSL、SR、及び低周波音効果チャネルLFEはLとRのように相関をとることなく、直接ロスレス・エンコーダ2Dに入力され、また直接ロスレス・デコーダ3Dから出力される。
【0030】
次に、第2の実施の形態及び第3の実施の形態の変形例としての第4の実施の形態について、そのブロック図を示す図15に沿って説明する。図15に示すチャネル相関回路A−1は加算回路1aと減算回路1bを有する。加算回路1aはステレオ2ch信号L、Rの和信号(L+R)を算出し、この和信号(L+R)を割り算器5aにより1/2に割り算してから、ロスレス・エンコーダ2Dに出力し、減算回路1bは差信号(L−R)を算出し、この差信号(L−R)を割り算器5bにより1/2に割り算してから、ロスレス・エンコーダ2Dに出力する。
ロスレス・エンコーダ2Dは、1/2(L+R)と1/2(L−R)を用いてこれらを多重化して多重化信号250を作る。多重化信号250はロスレス・デコーダ3Dによりデコードされて、元の1/2(L+R)と1/2(L−R)が得られ、これらが、チャネル相関回路B−1を構成する加算回路4aと減算回路4bにそれぞれ与えられ、出力信号としてステレオ2chのL信号とR信号が得られる。なお、ロスレス・エンコーダ2Dとロスレス・デコーダ3Dにおける一連の動作である、差分の算出、予測値の算出、最小予測残差の選択、最小予測残差を用いた予測値の算出などは、第1の実施の形態と同様に行われる。第4の実施の形態からわかるように、第2、第3の実施の形態におけるチャネル相関回路A、A2はL+R及びL−Rを演算するものに限らず、1/2(L+R)、1/2(
L−R)を演算するものに置き換えることができる。この場合、ロスレス・デコーダ3D側のチャネル相関回路B−1では1/2の演算は不要である。
【0031】
なお、先に図3で説明したフォーマットは1例であって、本発明における信号処理において記録あるいは伝送される信号のフォーマットは、これに限られるものでない。マルチチャネルの場合は、図13に対応してL、R信号に加えて、後方2チャネルSL、SRも和信号(SL+SR)と差信号(SL−SR)の形で収納される(図16のa)。また、同様に図14に対応してL、R信号は和信号と差信号の形で収納され、これに加えて、センターチャネルC、後方2チャネルSL、SR、低周波効果チャネルLFEは、そのまま、すなわち和信号や差信号の形をとることなく収納される(図16のb)。
【0032】
図17は、図16に示すようなマルチチャネルの信号を図4のAパックのユーザデータのパケットとするときのフォーマットを示す図である。ビットストリームBS0には、和信号(L+R)と差信号(L−R)が収納され、また他のビットストリームBS1には、図16のaに対応する場合は、和信号(SL+SR)と差信号の(SL−SR)が、一方図16のbに対応する場合は、センターチャネルC、後方2チャネルSL、SR、低周波効果チャネルLFEが、そのまま収納される。
【0033】
図5に示す圧縮PCM(PPCM)のオーディオ(A)パケットの図3と異なる態様を図18に示す。この異なる態様では、圧縮PCM(PPCM)のオーディオ(A)パケットにおけるオーディオデータエリアは、図18に示すように複数のPPCMアクセスユニットにより構成され、PPCMアクセスユニットはPPCMシンク情報とサブパケットにより構成されている。最初のPPCMアクセスユニット内のサブパケットは、ディレクトリと、ビットストリームBS0と、CRCと、ビットストリームBS1と、CRCとエクストラ情報により構成され、ビットストリームBS0,BS1はPPCMブロックのみにより構成されている。2番目以降のPPCMアクセスユニット内のサブパケットは、ディレクトリを除いてビットストリームBS0と、CRCと、ビットストリームBS1、CRCとエクストラ情報により構成され、フレーム先頭のビットストリームBS0及びBS1はリスタートヘッダとPPCMブロックにより構成されている。フレーム先頭のPPCMブロックにフレーム先頭サンプル値を配する。
【0034】
PPCMシンク情報(以下、同期情報ともいう)は次の情報を含む。
・1パケット当たりのサンプル数:サンプリング周波数fsに応じて40、80又は60が選択される。
・データレート:VBRの場合には「0」(サブパケット内のデータが圧縮データであることを示す識別子)
・サンプリング周波数fs及び量子化ビット数Qb
・チャネル割り当て情報
ここで、リスタートヘッダはフレーム毎にチャネル相関回路Aが加算回路と減算回路で構成されることを明記した情報を有している。これらのオーディオデータは図13と図14においてデマルチプレクサ21以下の構成からなるロスレス・デコーダ3D(図8)により元のマルチチャネルオーディオ信号に復号される。図18に示したフォーマットの可変レートビットストリームデータは、図1のチャネル相関回路を用いたか、図15のチャネル相関回路を用いたかを、例えばPPCMアクセスユニットのリスタートヘッダに格納した識別子(図示せず)で識別するようにしているので、いずれであってもデコーダは確実にデコードできる。なお、フレーム毎のロスレス圧縮を例に説明したが、固定の長さに限らず区間は可変の長さであってもよい。
【図面の簡単な説明】
【0035】
【図1】本発明が適用される音声符号化装置とそれに対応した音声復号装置の第1の実施形態を示すブロック図である。
【図2】図1のエンコーダを詳しく示すブロック図である。
【図3】図2のマルチプレクサにより多重化される1フレームのフォーマットを示す説明図である。
【図4】DVDのパックのフォーマットを示す説明図である。
【図5】DVDのオーディオパックのフォーマットを示す説明図である。
【図6】図1のデコーダを詳しく示すブロック図である。
【図7】第2の実施形態のエンコーダを示すブロック図である。
【図8】第2の実施形態のデコーダを示すブロック図である。
【図9】第3の実施形態のエンコーダを示すブロック図である。
【図10】第3の実施形態のデコーダを示すブロック図である。
【図11】音声伝送方法を示すフローチャートである。
【図12】音声伝送方法を示すフローチャートである。
【図13】本発明が適用される音声符号化装置とそれに対応した音声復号装置の第2の実施形態を示すブロック図である。
【図14】本発明が適用される音声符号化装置とそれに対応した音声復号装置の第3の実施形態を示すブロック図である。
【図15】本発明が適用される音声符号化装置とそれに対応した音声復号装置の第4の実施形態を示すブロック図である。
【図16】本発明における信号処理において記録あるいは伝送されるマルチチャネル信号のフォーマットの例を示す図である。
【図17】マルチチャネルの信号を図4のAパックのユーザデータのパケットとするときのフォーマットを示す図である。
【図18】図5に示す圧縮PCM(PPCM)のオーディオ(A)パケットの図3と異なる態様を示すフォーマット説明図である。
【符号の説明】
【0036】
1a、4a 加算回路(加算手段)
1b、4b 減算回路(減算手段)
5a、5b 割り算器
11D1 差分演算回路(第1の差分演算手段)
11D2 差分演算回路(第2の差分演算手段)
12a−1〜12a−n 予測器(減算器13a−1〜13a−n、バッファ
・選択器16D1と共に第1の予測符号化手段を構成する。)
12b−1〜12b−n 予測器(減算器13b−1〜13b−n、バッファ
・選択器16D2と共に第2の予測符号化手段を構成する。)
13a−1〜13a−n,13b−1〜13b−n 減算器
16D1,16D2,16A,16S,16L,16R バッファ・選択器
15A 予測回路(バッファ・選択器16Aと共に第3の予測符号化手段を構
成する。)
15S 予測回路(バッファ・選択器16Sと共に第4の予測符号化手段を構
成する。)
15L 予測回路(バッファ・選択器16Lと共に第5の予測符号化手段を構
成する。)
15R 予測回路
路(バッファ・選択器16Rと共に第6の予測符号化手段を構成する。)
【技術分野】
【0001】
本発明は、音声信号を予測符号化して圧縮するための音声符号化方法及び音声復号方法に関する。
【背景技術】
【0002】
音声信号を予測符号化する方法として、本発明者は先の出願(特願平9−289159号)において1チャネル(チャンネル)の原デジタル音声信号に対して、特性が異なる複数の予測器により時間領域における過去の信号から現在の信号の複数の線形予測値を算出し、原デジタル音声信号と、この複数の線形予測値から予測器毎の予測残差を算出し、この複数の予測残差の最小値を選択する方法を提案している。
【発明の開示】
【発明が解決しようとする課題】
【0003】
しかしながら、上記方法では原デジタル音声信号がサンプリング周波数=96kHz、量子化ビット数=20ビット程度の場合に、ある程度の圧縮効果を得ることができるが、近年のDVDオーディオディスクではこの2倍のサンプリング周波数(=192kHz)が使用され、また、量子化ビット数も24ビットが使用される傾向があるので、圧縮率を改善する必要がある。また、近年のDVDオーディオディスクでは、マルチチャネルが利用され、チャネル数が最大6となるので圧縮率を改善する必要がある。
【0004】
そこで本発明は、音声信号を予測符号化する場合に圧縮率を改善することができる音声符号化方法及び音声復号方法を提供することを目的とする。
【課題を解決するための手段】
【0005】
本発明は上記目的を達成するために、以下の1)及び2)手段よりなる。
すなわち、
【0006】
1)3以上のマルチチャネルの音声信号中の少なくとも選択された第1及び第2の2つのチャネルの音声信号をマトリクス演算して互いに相関ある2つの相関チャネルに変換するステップと、
前記ステップにより変換された2つの相関チャネルを含む音声信号を、チャネル毎に、入力される音声信号に応答して先頭サンプル値を所定時間のフレーム単位で得ると共に、特性が異なる複数の線形予測方法により時間領域の過去から現在の信号の線形予測値がそれぞれ予測され、その予測される線形予測値と前記音声信号とから得られる予測残差が最小となるような線形予測方法を、前記フレームを更に分割したサブフレーム単位に選択して予測符号化するステップと、
ヘッダ情報と、圧縮PCMプライベートヘッダ及び圧縮PCMアクセスユニットを含むユーザデータと、を含んだデータ構造にすると共に、前記ステップにより選択された各チャネルの線形予測方法と予測残差と所定の先頭サンプル値を含む予測符号化データを、前記圧縮PCMアクセスユニット内に配置されるサブパケット内のストリーム部に格納し、さらに前記圧縮PCMアクセスユニット内に少なくとも前記音声信号のサンプリング周波数を含む同期情報部を格納すると共に前記サブパケット内のストリーム部にフレーム毎にリスタートヘッダを設け、さらに、前記音声信号のUPC/EAN番号及びISRCデータを前記圧縮PCMプライベートヘッダ内に格納するステップと、
からなる音声符号化方法。
2)請求項1記載の音声符号化方法により符号化されたデータから元の音声信号を復号する音声復号方法であって、
前記格納された各チャネルの予測符号化データを抽出するステップと、
前記抽出された各チャネルの予測符号化データから予測値を算出するステップと、
前記算出された予測値から元の音声信号を復元するステップと、
からなる音声復号方法。
【発明の効果】
【0007】
以上説明したように本発明によれば、従来以上に圧縮率を改善した音声の符号化ができると共に、不都合なく音声信号を復号できる。
【発明を実施するための最良の形態】
【0008】
以下、図面を参照して本発明の実施の形態を説明する。図1は本発明が適用される音声符号化装置とそれに対応した音声復号装置の第1の実施形態を示すブロック図、図2は図1のエンコーダを詳しく示すブロック図、図3は図2のマルチプレクサにより多重化される1フレームのフォーマットを示す説明図、図4はDVDのパックのフォーマットを示す説明図、図5はDVDのオーディオパックのフォーマットを示す説明図、図6は図1のデコーダを詳しく示すブロック図である。
【0009】
図1に示すチャネル相関回路Aは加算回路1aと減算回路1bを有する。加算回路1aは各チャネル(以下、ch)が例えばサンプリング周波数=192kHz、量子化ビット数=24ビットのステレオ2ch信号L、Rの和信号(L+R)を算出して和ch用1chロスレス・エンコーダ2D1に出力し、減算回路1bは差信号(L−R)を算出して差ch用1chロスレス・エンコーダ2D2に出力する。エンコーダ2D1、2D2は図2に詳しく示すように、それぞれ和信号(L+R)、差信号(L−R)の差分Δ(L+R)、Δ(L−R)を予測符号化して記録媒体や通信媒体を介して伝送する。
【0010】
そして、復号側では、図6に詳しく示すようにデコーダ3D1、3D2がそれぞれ各chの予測符号化データを和信号(L+R)、差信号(L−R)に復号し、次いでチャネル相関回路Bがこの和信号(L+R)、差信号(L−R)をステレオ2ch信号L、Rに復元する。
【0011】
図2を参照してエンコーダ2D1、2D2について詳しく説明する。和信号(L+R)と差信号(L−R)は1フレーム毎に1フレームバッファ10に格納される。そして、1フレームの各サンプル値(L+R)、(L−R)がそれぞれ差分演算回路11D1、11D2に印加され、今回と前回の差分Δ(L+R)、Δ(L−R)、すなわち差分PCM(DPCM)データが算出される。また、各フレームの先頭サンプル値(L+R)、(L−R)がマルチプレクサ19に印加される。
【0012】
差分演算回路11D1により算出された差分Δ(L+R)は、予測係数が異なる複数の予測器12a−1〜12a−nと減算器13a−1〜13a−nに印加される。そして、予測器12a−1〜12a−nではそれぞれ各予測係数に基づいて差分Δ(L+R)の各予測値が算出され、減算器13a−1〜13b−nではそれぞれこの各予測値と差分Δ(L+R)の各予測残差が算出される。バッファ・選択器16D1はこの複数の予測残差を一時記憶して、選択信号生成器17により指定されたサブフレーム毎に最小の予測残差を選択し、パッキング回路18に出力する。なお、このサブフレームはフレームの数十分の1程度のサンプル長であり、一例として1フレームを80サブフレームとする。ここで、予測器12a−1〜12a−nと減算器13a−1〜13a−nは和信号chの予測回路15D1を構成し、また、この予測回路15D1とバッファ・選択器16D1は和信号chの予測符号化回路を構成している。
【0013】
同様に、差分演算回路11D2により算出された差分Δ(L−R)は、予測係数が異なる複数の予測器12b−1〜12b−nと減算器13b−1〜13b−nに印加される。そして、予測器12b−1〜12b−nではそれぞれ各予測係数に基づいて差分Δ(L−R)の各予測値が算出され、減算器13b−1〜13b−nではそれぞれこの各予測値と差分Δ(L−R)の各予測残差が算出される。バッファ・選択器16D2はこの複数の予測残差を一時記憶して、選択信号生成器17により指定されたサブフレーム毎に最小の予測残差を選択し、パッキング回路18に出力する。予測器12b−1〜12b−nと減算器13b−1〜13b−nは差信号chの予測回路15D2を構成し、また、この予測回路15D2とバッファ・選択器16D2は差信号chの予測符号化回路を構成している。
【0014】
選択信号生成器17は予測残差のビット数フラグ(5ビット)をパッキング回路18とマルチプレクサ19に対して印加し、また、予測残差が最小の予測器を示す予測器選択フラグ(その数nが2〜9個として3ビット)をマルチプレクサ19に対して印加する。パッキング回路18はバッファ・選択器16D1、16D2により選択された2ch分の予測残差を、選択信号生成器17により指定されたビット数フラグに基づいて指定ビット数でパッキングする。
【0015】
続くマルチプレクサ19は図3に示すように1フレーム分に対して
・フレームヘッダ(40ビット)と、
・和信号ch(L+R)の1フレームの先頭サンプル値(25ビット)と、
・差信号ch(L−R)の1フレームの先頭サンプル値(25ビット)と、
・和信号ch(L+R)のサブフレーム毎の予測器選択フラグ(3ビット×80)と、
・差信号ch(L−R)のサブフレーム毎の予測器選択フラグ(3ビット×80)と、
・和信号ch(L+R)のサブフレーム毎のビット数フラグ(5ビット×80)と、
・差信号ch(L−R)のサブフレーム毎のビット数フラグ(5ビット×80)と、
・和信号ch(L+R)の予測残差データ列(可変ビット数)と、
・差信号ch(L−R)の予測残差データ列(可変ビット数)とを
アクセスユニットとして多重化し、可変レートビットストリームとして出力する。上記予測残差データ列はサブパケットを構成する。このような予測符号化によれば、原信号が例えばサンプリング周波数=192kHz、量子化ビット数=24ビット、2チャネルの場合、59%の圧縮率を実現することができる。
【0016】
また、この可変レートビットストリームデータをDVDオーディオディスクに記録する場合には、図4に示す圧縮PCMのオーディオ(A)パックにパッキングされる。このパックは2034バイトのユーザデータ(Aパケット、Vパケット)に対して4バイトのパックスタート情報と、6バイトのSCR(System Clock Reference:システム時刻基準参照値)情報と、3バイトのMux レート(rate)情報と1バイトのスタッフィングの合計14バイトのパックヘッダが付加されて構成されている(1パック=合計2048バイト)。この場合、タイムスタンプであるSCR情報を、ACBユニット内の先頭パックでは「1」として同一タイトル内で連続とすることにより同一タイトル内のAパックの時間を管理することができる。
【0017】
圧縮PCMのAパケットは図5に詳しく示すように、17、9又は14バイトのパケットヘッダと、プライベートヘッダと、図3に示すフォーマットの1ないし2015バイトのオーディオ圧縮PCMデータにより構成されている。圧縮PCMのプライベートヘッダは、
・1バイトのサブストリームIDと、
・2バイトのUPC/EAN−ISRC(Universal Product Code/European Article Number-International Standard Recording Code)番号、及びUPC/EAN−ISRCデータと、
・1バイトのプライベートヘッダ長と、
・2バイトの第1アクセスユニットポインタと、
・4バイトのオーディオデータ情報(ADI)と、
・0〜7バイトのスタッフィングバイトとに、
より構成されている。
このように圧縮PCMのAパケットのADIは、4バイトに選定され、通常の非圧縮のPCMのAパケットのADIよりも4バイトだけ短くされている。したがってオーディオデータは4バイト分増加させることができる。
【0018】
次に図6を参照してデコーダ3D1、3D2について説明する。図3に示したフォーマットの可変レートビットストリームデータは、デマルチプレクサ21によりフレームヘッダに基づいて分離される。そして、和信号ch(L+R)及び差信号ch(L−R)の1フレームの先頭サンプル値はそれぞれ累積演算回路25a、25bに印加され、和信号ch(L+R)及び差信号ch(L−R)の予測器選択フラグはそれぞれ予測器(24a−1〜24a−n)、(24b−1〜24b−n)の各選択信号として印加され、和信号ch(L+R)及び差信号ch(L−R)のビット数フラグと予測残差データ列はアンパッキング回路22に印加される。ここで、予測器(24a−1〜24a−n)、(24b−1〜24b−n)はそれぞれ、符号化側の予測器(12a−1〜12a−n)、(12b−1〜12b−n)と同一の特性であり、予測器選択フラグにより同一特性のも
のが選択される。
【0019】
アンパッキング回路22は和信号ch(L+R)及び差信号ch(L−R)の予測残差データ列をビット数フラグ毎に基づいて分離してそれぞれ加算回路23a、23bに出力する。加算回路23a、23bではそれぞれ、アンパッキング回路22からの和信号ch(L+R)及び差信号ch(L−R)の今回の予測残差データと、予測器(24a−1〜24a−n)、(24b−1〜24b−n)の内、予測器選択フラグにより選択された各1つにより予測された前回の予測値が加算されて今回の予測値が算出される。この今回の予測値は、図2に示す差分回路11a、11bによりそれぞれ算出された差分Δ(L+R)、Δ(L−R)すなわちDPCMデータであり、予測器(24a−1〜24a−n)、(24b−1〜24b−n)と累積演算回路25a、25bに印加される。
【0020】
累積演算回路25a、25bはそれぞれ、1フレームの先頭サンプル値に対して差分Δ(L+R)、Δ(L−R)をサンプル毎に累積加算して和信号ch(L+R)、差信号ch(L−R)の各PCMデータを出力する。この和信号(L+R)、差信号(L−R)は図1に示すように加算回路4aにより2L信号が算出されるとともに、減算回路4bにより2R信号が算出される。そして、2L信号と2R信号がそれぞれ割り算器5a、5bにより1/2に割り算され、元のステレオ2チャネル信号L、Rが復元される。
【0021】
次に図7、図8を参照して第2の実施形態について説明する。上記の実施形態では、和信号(L+R)、差信号(L−R)の各差分Δ(L+R)、Δ(L−R)、すなわちDPCMデータのみを予測符号化するように構成されているが、この第2の実施形態では和信号(L+R)、差信号(L−R)すなわちPCMデータ、又はその各差分Δ(L+R)、Δ(L−R)すなわちDPCMデータを選択的に予測符号化するように構成されている。
【0022】
このため図7に示す符号化装置では、図2に示す構成に対して和信号(L+R)、差信号(L−R)をそれぞれ予測符号化するための予測回路15A、15Sとバッファ・選択器16A、16Sが追加されている。また、選択信号生成器17はバッファ・選択器16A、16Sによりそれぞれ選択された和信号(L+R)、差信号(L−R)と、バッファ・選択器16D1、16D2によりそれぞれ選択された差分Δ(L+R)、Δ(L−R)の各予測残差の最小値に基づいて、
PCMデータとDPCMデータのどちらが圧縮率が高いか否かを判断し、高い方のデータを選択する。このとき、そのPCM/DPCMの選択フラグ(予測回路選択フラグ)を追加して多重化する。
【0023】
ここで、図7に示す和信号(L+R)の予測回路15Aと差分Δ(L+R)の予測回路15D1が同一の構成であり、また、差信号(L−R)の予測回路15Sと差分Δ(L−R)の予測回路15D2が同一の構成である場合、復号装置では図8に示すようにPCMデータとDPCMデータの両方の予測回路を設ける必要はなく、1つのデータ分の予測回路でよい。そして、符号化装置から伝送された予測回路選択フラグに基づいてセレクタ26a、26bにより、DPCMデータの場合には累積演算回路25a、25bの出力を選択し、PCMデータの場合には加算回路23a、23bの出力を選択する。
【0024】
第3の実施形態では図9に示すように、原信号L、R(PCMデータ)と、和信号(L+R)、差信号(L−R)(PCMデータ)と、その各差分Δ(L+R)、Δ(L−R)(DPCMデータ)の3グループの1つを選択的に予測符号化するように構成されている。
【0025】
このため図9に示す符号化装置では、図7に示す構成に対して原信号L、Rをそれぞれ予測符号化するための予測回路15L、15Rとバッファ・選択器16L、16Rが追加されている。また、選択信号生成器17はバッファ・選択器16L、16Rにより選択された原信号L、Rと、バッファ・選択器16A、16Sにより選択された和信号(L+R)、差信号(L−R)と、バッファ・選択器16D1、16D2により選択された各差分Δ(L+R)、Δ(L−R)の各予測残差の最小値に基づいて圧縮率が高いグループのデータを選択する。このとき、その選択フラグ(予測回路選択フラグ)を追加して多重化する。
【0026】
また、図9に示す3グループの予測回路が同一の構成である場合、復号装置では図10に示すように3グループ分の予測回路を設ける必要はなく、1つのグループ分の予測回路でよい。そして、符号化装置から伝送された予測回路選択フラグに基づいて、DPCMデータの場合には累積演算回路25a、25bの出力を選択し、PCMデータの場合には加算回路23a、23bの出力を選択してチャネル相関回路Bにより原信号L、Rを復元する。そして、更にセレクタ27a、27bにより原信号L、Rのグループの場合には加算回路23a、23bの出力を選択し、他の場合にはチャネル相関回路Bの出力を選択する
【0027】
また、符号化側により予測符号化された可変レートビットストリームデータをネットワークを介して伝送する場合には、符号化側では図11に示すように伝送用にパケット化し(ステップS41)、次いでパケットヘッダを付与し(ステップS42)、次いでこのパケットをネットワーク上に送り出す(ステップS43)。復号側では図12に示すようにヘッダを除去し(ステップS51)、次いでデータを復元し(ステップS52)、次いでこのデータをメモリに格納して復号を待つ(ステップS53)。
【0028】
上記第1の実施の形態は2チャネルの場合について説明したが、2以上のマルチチャネルの場合の第2の実施の形態について以下説明する。図13は、本発明の第2の実施の形態を示すブロック図である。図13は、図1の2チャネル用の構成に対して後方の2チャネルSL、SRを加えた4チャネル用として構成され、よって入力側にはチャネル相関回路Aに加えて、同様な構成のチャネル相関回路A2が設けられている。また、出力側にもチャネル相関回路Bに加えて、同様な構成のチャネル相関回路B2が設けられている。また、ロスレス・エンコーダ2Dとロスレス・デコーダ3Dはマルチチャネル対応型として構成されている。なお、チャネル相関回路A、A2、B、B2は、それぞれLとR、SLとSRを組み合わせの対象としている。なお、ロスレス・エンコーダ2Dとロスレス・デコーダ3Dにおける一連の動作である、差分の算出、予測値の算出、最小予測残差の選択、最小予測残差を用いた予測値の算出などは、第1の実施の形態と同様に行われる。
【0029】
次に、第2の実施の形態の変形例としての第3の実施の形態について、そのブロック図を示す図14に沿って説明する。図14は、図13の4チャネル用の構成に対して更にセンタチャネルC及び低音効果チャネルLFEを加えた合計6チャネル用として構成されている。ただし、センタチャネルC、後方の2チャネルSL、SR、及び低周波音効果チャネルLFEはLとRのように相関をとることなく、直接ロスレス・エンコーダ2Dに入力され、また直接ロスレス・デコーダ3Dから出力される。
【0030】
次に、第2の実施の形態及び第3の実施の形態の変形例としての第4の実施の形態について、そのブロック図を示す図15に沿って説明する。図15に示すチャネル相関回路A−1は加算回路1aと減算回路1bを有する。加算回路1aはステレオ2ch信号L、Rの和信号(L+R)を算出し、この和信号(L+R)を割り算器5aにより1/2に割り算してから、ロスレス・エンコーダ2Dに出力し、減算回路1bは差信号(L−R)を算出し、この差信号(L−R)を割り算器5bにより1/2に割り算してから、ロスレス・エンコーダ2Dに出力する。
ロスレス・エンコーダ2Dは、1/2(L+R)と1/2(L−R)を用いてこれらを多重化して多重化信号250を作る。多重化信号250はロスレス・デコーダ3Dによりデコードされて、元の1/2(L+R)と1/2(L−R)が得られ、これらが、チャネル相関回路B−1を構成する加算回路4aと減算回路4bにそれぞれ与えられ、出力信号としてステレオ2chのL信号とR信号が得られる。なお、ロスレス・エンコーダ2Dとロスレス・デコーダ3Dにおける一連の動作である、差分の算出、予測値の算出、最小予測残差の選択、最小予測残差を用いた予測値の算出などは、第1の実施の形態と同様に行われる。第4の実施の形態からわかるように、第2、第3の実施の形態におけるチャネル相関回路A、A2はL+R及びL−Rを演算するものに限らず、1/2(L+R)、1/2(
L−R)を演算するものに置き換えることができる。この場合、ロスレス・デコーダ3D側のチャネル相関回路B−1では1/2の演算は不要である。
【0031】
なお、先に図3で説明したフォーマットは1例であって、本発明における信号処理において記録あるいは伝送される信号のフォーマットは、これに限られるものでない。マルチチャネルの場合は、図13に対応してL、R信号に加えて、後方2チャネルSL、SRも和信号(SL+SR)と差信号(SL−SR)の形で収納される(図16のa)。また、同様に図14に対応してL、R信号は和信号と差信号の形で収納され、これに加えて、センターチャネルC、後方2チャネルSL、SR、低周波効果チャネルLFEは、そのまま、すなわち和信号や差信号の形をとることなく収納される(図16のb)。
【0032】
図17は、図16に示すようなマルチチャネルの信号を図4のAパックのユーザデータのパケットとするときのフォーマットを示す図である。ビットストリームBS0には、和信号(L+R)と差信号(L−R)が収納され、また他のビットストリームBS1には、図16のaに対応する場合は、和信号(SL+SR)と差信号の(SL−SR)が、一方図16のbに対応する場合は、センターチャネルC、後方2チャネルSL、SR、低周波効果チャネルLFEが、そのまま収納される。
【0033】
図5に示す圧縮PCM(PPCM)のオーディオ(A)パケットの図3と異なる態様を図18に示す。この異なる態様では、圧縮PCM(PPCM)のオーディオ(A)パケットにおけるオーディオデータエリアは、図18に示すように複数のPPCMアクセスユニットにより構成され、PPCMアクセスユニットはPPCMシンク情報とサブパケットにより構成されている。最初のPPCMアクセスユニット内のサブパケットは、ディレクトリと、ビットストリームBS0と、CRCと、ビットストリームBS1と、CRCとエクストラ情報により構成され、ビットストリームBS0,BS1はPPCMブロックのみにより構成されている。2番目以降のPPCMアクセスユニット内のサブパケットは、ディレクトリを除いてビットストリームBS0と、CRCと、ビットストリームBS1、CRCとエクストラ情報により構成され、フレーム先頭のビットストリームBS0及びBS1はリスタートヘッダとPPCMブロックにより構成されている。フレーム先頭のPPCMブロックにフレーム先頭サンプル値を配する。
【0034】
PPCMシンク情報(以下、同期情報ともいう)は次の情報を含む。
・1パケット当たりのサンプル数:サンプリング周波数fsに応じて40、80又は60が選択される。
・データレート:VBRの場合には「0」(サブパケット内のデータが圧縮データであることを示す識別子)
・サンプリング周波数fs及び量子化ビット数Qb
・チャネル割り当て情報
ここで、リスタートヘッダはフレーム毎にチャネル相関回路Aが加算回路と減算回路で構成されることを明記した情報を有している。これらのオーディオデータは図13と図14においてデマルチプレクサ21以下の構成からなるロスレス・デコーダ3D(図8)により元のマルチチャネルオーディオ信号に復号される。図18に示したフォーマットの可変レートビットストリームデータは、図1のチャネル相関回路を用いたか、図15のチャネル相関回路を用いたかを、例えばPPCMアクセスユニットのリスタートヘッダに格納した識別子(図示せず)で識別するようにしているので、いずれであってもデコーダは確実にデコードできる。なお、フレーム毎のロスレス圧縮を例に説明したが、固定の長さに限らず区間は可変の長さであってもよい。
【図面の簡単な説明】
【0035】
【図1】本発明が適用される音声符号化装置とそれに対応した音声復号装置の第1の実施形態を示すブロック図である。
【図2】図1のエンコーダを詳しく示すブロック図である。
【図3】図2のマルチプレクサにより多重化される1フレームのフォーマットを示す説明図である。
【図4】DVDのパックのフォーマットを示す説明図である。
【図5】DVDのオーディオパックのフォーマットを示す説明図である。
【図6】図1のデコーダを詳しく示すブロック図である。
【図7】第2の実施形態のエンコーダを示すブロック図である。
【図8】第2の実施形態のデコーダを示すブロック図である。
【図9】第3の実施形態のエンコーダを示すブロック図である。
【図10】第3の実施形態のデコーダを示すブロック図である。
【図11】音声伝送方法を示すフローチャートである。
【図12】音声伝送方法を示すフローチャートである。
【図13】本発明が適用される音声符号化装置とそれに対応した音声復号装置の第2の実施形態を示すブロック図である。
【図14】本発明が適用される音声符号化装置とそれに対応した音声復号装置の第3の実施形態を示すブロック図である。
【図15】本発明が適用される音声符号化装置とそれに対応した音声復号装置の第4の実施形態を示すブロック図である。
【図16】本発明における信号処理において記録あるいは伝送されるマルチチャネル信号のフォーマットの例を示す図である。
【図17】マルチチャネルの信号を図4のAパックのユーザデータのパケットとするときのフォーマットを示す図である。
【図18】図5に示す圧縮PCM(PPCM)のオーディオ(A)パケットの図3と異なる態様を示すフォーマット説明図である。
【符号の説明】
【0036】
1a、4a 加算回路(加算手段)
1b、4b 減算回路(減算手段)
5a、5b 割り算器
11D1 差分演算回路(第1の差分演算手段)
11D2 差分演算回路(第2の差分演算手段)
12a−1〜12a−n 予測器(減算器13a−1〜13a−n、バッファ
・選択器16D1と共に第1の予測符号化手段を構成する。)
12b−1〜12b−n 予測器(減算器13b−1〜13b−n、バッファ
・選択器16D2と共に第2の予測符号化手段を構成する。)
13a−1〜13a−n,13b−1〜13b−n 減算器
16D1,16D2,16A,16S,16L,16R バッファ・選択器
15A 予測回路(バッファ・選択器16Aと共に第3の予測符号化手段を構
成する。)
15S 予測回路(バッファ・選択器16Sと共に第4の予測符号化手段を構
成する。)
15L 予測回路(バッファ・選択器16Lと共に第5の予測符号化手段を構
成する。)
15R 予測回路
路(バッファ・選択器16Rと共に第6の予測符号化手段を構成する。)
【特許請求の範囲】
【請求項1】
3以上のマルチチャネルの音声信号中の少なくとも選択された第1及び第2の2つのチャネルの音声信号をマトリクス演算して互いに相関ある2つの相関チャネルに変換するステップと、
前記ステップにより変換された2つの相関チャネルを含む音声信号を、チャネル毎に、入力される音声信号に応答して先頭サンプル値を所定時間のフレーム単位で得ると共に、特性が異なる複数の線形予測方法により時間領域の過去から現在の信号の線形予測値がそれぞれ予測され、その予測される線形予測値と前記音声信号とから得られる予測残差が最小となるような線形予測方法を、前記フレームを更に分割したサブフレーム単位に選択して予測符号化するステップと、
ヘッダ情報と、圧縮PCMプライベートヘッダ及び圧縮PCMアクセスユニットを含むユーザデータと、を含んだデータ構造にすると共に、前記ステップにより選択された各チャネルの線形予測方法と予測残差と所定の先頭サンプル値を含む予測符号化データを、前記圧縮PCMアクセスユニット内に配置されるサブパケット内のストリーム部に格納し、さらに前記圧縮PCMアクセスユニット内に少なくとも前記音声信号のサンプリング周波数を含む同期情報部を格納すると共に前記サブパケット内のストリーム部にフレーム毎にリスタートヘッダを設け、さらに、前記音声信号のUPC/EAN番号及びISRCデータを前記圧縮PCMプライベートヘッダ内に格納するステップと、
からなる音声符号化方法。
【請求項2】
請求項1記載の音声符号化方法により符号化されたデータから元の音声信号を復号する音声復号方法であって、
前記格納された各チャネルの予測符号化データを抽出するステップと、
前記抽出された各チャネルの予測符号化データから予測値を算出するステップと、
前記算出された予測値から元の音声信号を復元するステップと、
からなる音声復号方法。
【請求項1】
3以上のマルチチャネルの音声信号中の少なくとも選択された第1及び第2の2つのチャネルの音声信号をマトリクス演算して互いに相関ある2つの相関チャネルに変換するステップと、
前記ステップにより変換された2つの相関チャネルを含む音声信号を、チャネル毎に、入力される音声信号に応答して先頭サンプル値を所定時間のフレーム単位で得ると共に、特性が異なる複数の線形予測方法により時間領域の過去から現在の信号の線形予測値がそれぞれ予測され、その予測される線形予測値と前記音声信号とから得られる予測残差が最小となるような線形予測方法を、前記フレームを更に分割したサブフレーム単位に選択して予測符号化するステップと、
ヘッダ情報と、圧縮PCMプライベートヘッダ及び圧縮PCMアクセスユニットを含むユーザデータと、を含んだデータ構造にすると共に、前記ステップにより選択された各チャネルの線形予測方法と予測残差と所定の先頭サンプル値を含む予測符号化データを、前記圧縮PCMアクセスユニット内に配置されるサブパケット内のストリーム部に格納し、さらに前記圧縮PCMアクセスユニット内に少なくとも前記音声信号のサンプリング周波数を含む同期情報部を格納すると共に前記サブパケット内のストリーム部にフレーム毎にリスタートヘッダを設け、さらに、前記音声信号のUPC/EAN番号及びISRCデータを前記圧縮PCMプライベートヘッダ内に格納するステップと、
からなる音声符号化方法。
【請求項2】
請求項1記載の音声符号化方法により符号化されたデータから元の音声信号を復号する音声復号方法であって、
前記格納された各チャネルの予測符号化データを抽出するステップと、
前記抽出された各チャネルの予測符号化データから予測値を算出するステップと、
前記算出された予測値から元の音声信号を復元するステップと、
からなる音声復号方法。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【公開番号】特開2006−178479(P2006−178479A)
【公開日】平成18年7月6日(2006.7.6)
【国際特許分類】
【出願番号】特願2005−374867(P2005−374867)
【出願日】平成17年12月27日(2005.12.27)
【分割の表示】特願2004−243781(P2004−243781)の分割
【原出願日】平成11年10月13日(1999.10.13)
【出願人】(000004329)日本ビクター株式会社 (3,896)
【Fターム(参考)】
【公開日】平成18年7月6日(2006.7.6)
【国際特許分類】
【出願日】平成17年12月27日(2005.12.27)
【分割の表示】特願2004−243781(P2004−243781)の分割
【原出願日】平成11年10月13日(1999.10.13)
【出願人】(000004329)日本ビクター株式会社 (3,896)
【Fターム(参考)】
[ Back to top ]