説明

ステレオオーディオ信号符号化方法及び装置

【課題】 インテンシティステレオ符号化で、非インテンシティステレオ処理とインテンシティステレオ処理の境界でスペクトルが急激に変化することにより、歪み成分が発生し、音質が劣化することがあるという課題があった。
【解決手段】 ステレオオーディオ信号を周波数スペクトルに変換する時間/周波数変換部110、111と、インテンシティステレオ符号化を用いて高能率符号化するためのインテンシティ信号生成部120、切換部130、量子化及び符号化部150とを備えたステレオオーディオ信号符号化装置であって、非インテンシティステレオ処理とインテンシティステレオ処理の境界近傍の非インテンシティステレオ処理周波数スペクトルを非インテンシティステレオ処理周波数スペクトルとインテンシティステレオ処理周波数スペクトルとで補間した周波数スペクトルで置き換えるインテンシティ境界スペクトル補間部140を備える。

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ステレオオーディオ信号をインテンシティステレオ符号化を用いて高能率符号化する方法及び装置に関する。
【0002】
【従来の技術】近年、低いビットレート、例えば64kbps、におけるステレオオーディオ信号の高能率符号化方式として、インテンシティステレオ符号化を利用した方式が広く用いられている。インテンシティステレオを利用した方式としては、MPEG−1オーディオ及びMPEG−2オーディオ、MPEG−2のAAC(Advanced Audio Coding)が挙げられる。
【0003】従来、インテンシティステレオ符号化を用いたステレオオーディオ信号符号化方法として、例えば、MPEG−2 AACの規格書(ISO/IEC 13818-7, Information technology - Generic coding of moving pictures and associated audio information - Part 7: Advanced Audio Coding (AAC))に記載されたものが知られている。
【0004】図9に従来のインテンシティ符号化を用いたステレオオーディオ信号符号化装置のブロック図を示す。図9において、910と911は時間/周波数変換部、920はインテンシティ信号生成部、930は非インテンシティ/インテンシティステレオ処理の切換情報に応じて左右のチャンネルの周波数スペクトルを切り換える切換部、940は量子化及び符号化部である。以上のように構成されたステレオオーディオ信号符号化装置について、その動作を以下に述べる。
【0005】入力された左チャンネルの時間軸のオーディオ信号(左時間信号)は、時間/周波数変換部910において、図10に示すように直交変換されて周波数軸のスペクトル(左スペクトル)に変換され、変換されたスペクトルはバンド単位でグループ化される。直交変換としては、主としてMDCT(Modified Discrete Cosine Transform:変形離散コサイン変換)やFFT(Fast Fourier Transform:高速フーリエ変換)が用いられる。また、一つのバンド当たりのスペクトル本数は均一でなく、周波数が高くなるにつれて一つのバンド当たりのスペクトル本数が増加する場合が多い。
【0006】同様に、入力された右チャンネルの時間軸のオーディオ信号(右時間信号)は、時間/周波数変換部911において、図10に示すように直交変換されて周波数軸のスペクトル(右スペクトル)に変換され、変換されたスペクトルはバンド単位でグループ化される。
【0007】次にインテンシティ信号生成部920において、上記左スペクトルと右スペクトルを入力としてインテンシティステレオ符号化に必要な信号を生成する。
【0008】最初にインテンシティステレオ符号化の方式について説明する。図11にインテンシティステレオ符号化の方式説明図を示す。インテンシティステレオとは、所定の周波数(通常3kHzから6kHz)以上では、聴覚的には、スペクトルの微細構造よりもスペクトルのエンベロープ(概形)の方が重要であること、また左右のチャンネルの信号レベルの差により音源の方向を感じることを利用して、前記所定の周波数以上では、左右のチャンネルの周波数スペクトルの和信号(MPEG−2のAACでは、正確には前記和信号を左チャンネルの信号レベルに合わせるように補正した周波数スペクトル)と左右のチャンネルの信号レベルの比を符号化することにより、符号化効率を改善するものである。インテンシティステレオ符号化では、伝送が必要な周波数スペクトル情報は一つのチャンネルのみでよいので高い符号化効率を実現できるが、スペクトルの微細構造が再現できないことにより、音質劣化を生じることがある。
【0009】MPEG−2のAACでは、インテンシティステレオ符号化を表す情報として、バンド毎に、非インテンシティステレオ処理かインテンシティステレオ処理かを表す非インテンシティ/インテンシティステレオ処理の切換情報、左チャンネルのインテンシティステレオ処理時のスペクトルを表す左インテンシティスペクトル、左チャンネルのスペクトルと右チャンネルのスペクトルの位相関係が同相か逆相かを表す位相情報、左インテンシティスペクトルから右チャンネルのインテンシティステレオ処理時のスペクトルを表す右インテンシティスペクトルを求めるための左チャンネルに対する右チャンネルの信号レベルの比を表す方向性情報とを用いている。
【0010】図12は、前記従来のオーディオ信号符号化方法におけるインテンシティ符号化処理のステップを示すフローチャートである。
【0011】ステップ1201でインテンシティステレオ処理を行うバンドとインテンシティステレオ処理を行わないバンドを決定する。ここでは、周波数が6kHz以上のバンドをインテンシティステレオ処理を行うバンドに決定する。すなわち、周波数6kHz以上のインテンシティステレオスタートバンドBsからインテンシティステレオエンドバンドBeまでをインテンシティステレオ処理を行うバンドに決定する。
【0012】次にステップ1202で、インテンシティステレオ処理を行うバンド毎に、左チャンネル、右チャンネル、左右のチャンネルの和信号のエネルギー、それぞれ、EL(B)、ER(B)、EL+R(B)を算出する。ここでBはバンド番号である。
【0013】ステップ1203で、バンド毎の位相情報をすべて同相に設定する。ここでは、位相情報は、同相の場合に1、逆相の場合に−1の値をとるものとする。
【0014】ステップ1204では、バンド毎に方向性情報を算出する。方向性情報は、左右のチャンネルのエネルギーの比の平方根、すなわち、SQRT(EL(B)/ER(B))で算出する。ここで、SQRT(X)はXの平方根を表す関数である。
【0015】次にステップ1205で、バンド毎に左チャンネルのインテンシティステレオ処理のスペクトルを表す左インテンシティスペクトルを(数1)で算出する。
【0016】
【数1】


【0017】(数1)で、Lspec(i)とRspec(i)は、それぞれ左と右のチャンネルのスペクトル番号iのスペクトルを、また、is(B)はバンドBの最初のスペクトル番号を表す。
【0018】インテンシティ信号生成部920では、上記ステップ1201からステップ1205までの処理を行い、インテンシティステレオ処理に必要な非インテンシティ/インテンシティステレオ処理の切換情報、左インテンシティスペクトル、位相情報、方向性情報とを生成し、出力する。
【0019】次に図12のステップ1206では、左チャンネルのスペクトルを左インテンシティスペクトルで、また、右チャンネルのスペクトルを零スペクトルに置き換える。
【0020】上記スペクトルの置換処理は図9の切換部930で行う。切換部930では非インテンシティ/インテンシティステレオ処理の切換情報に応じて、非インテンシティステレオ処理時には、図9の各スイッチを上側に接続して左スペクトルと右スペクトルを出力し、インテンシティステレオ処理時にはスイッチを下側に接続して左インテンシティスペクトルと零スペクトルとを出力する。なお、この零スペクトルは符号化データとしては伝送されない。
【0021】図13に以上のようにして求めた左右のチャンネルのスペクトルの概念を示す。
【0022】図9の量子化及び符号化部940では、切換部930の出力である2つのスペクトルに対して、聴覚モデルに基づいてスペクトルのマスキングレベル、すなわち許容量子化ノイズレベルを算出し、算出された許容量子化ノイズレベルに基づいてスペクトルの量子化を行い、ハフマン符号化等の符号化処理を行い、高能率符号化データを出力する。
【0023】図14に、上記インテンシティステレオ符号化を用いた高能率符号化データを復号化するステレオオーディオ信号復号化装置のブロック図を示す。図14において、1410は復号化及び逆量子化部、1420は右インテンシティスペクトル再生部、1430は非インテンシティ/インテンシティステレオ処理の切換情報に応じて右チャンネルの非インテンシティステレオ処理のスペクトルとインテンシティステレオ処理のスペクトル(右インテンシティスペクトル)を切り換える切換部、1440と1441は周波数/時間変換部である。以上のように構成されたステレオオーディオ信号復号化装置について、その動作を以下に述べる。
【0024】ステレオオーディオ信号復号化装置に入力された符号化データは、復号化及び逆量子化部1410で復号化と逆量子化される。右インテンシティスペクトル再生部1420では、復号化及び逆量子化部1410からの左インテンシティスペクトルと位相情報と方向性情報とを用いて右インテンシティスペクトルを再生する。
【0025】図15は、右インテンシティスペクトル再生部1420の構成を示すブロック図である。同図に示すように、右インテンシティスペクトルは、左インテンシティスペクトルに、位相情報が同相の場合「1」を、また、逆相の場合「−1」を掛け、次に方向性情報SQRT(EL(B)/ER(B))で割ることにより再生される。
【0026】切換部1430では、復号化及び逆量子化部1410からの非インテンシティ/インテンシティステレオ処理の切換情報に応じて、右チャンネルのスペクトルとして、非インテンシティステレオ処理時にはスイッチを上側に接続して復号化及び逆量子下部からの右チャンネルのスペクトルをそのまま出力し、インテンシティステレオ処理時には、スイッチを下側に接続して右インテンシティスペクトル再生部1420からの右インテンシティスペクトルを出力する。
【0027】周波数/時間変換部1440では、入力された左チャンネルの周波数軸のスペクトル(左スペクトル)を逆直交変換することにより、左チャンネルの時間軸のオーディオ信号(左時間信号)に変換し、出力する。同様に周波数/時間変換部1441では、入力された右チャンネルの周波数軸のスペクトル(右スペクトル)を逆直交変換することにより、右チャンネルの時間軸のオーディオ信号(右時間信号)に変換し、出力する。
【0028】
【発明が解決しようとする課題】しかしながら、上記従来のステレオオーディオ信号符号化方法及び装置では、非インテンシティステレオ処理のバンドとインテンシティステレオ処理のバンド境界でスペクトルが急激に変化することにより、歪み成分が発生し、特にトーン性の高い信号が前記境界付近にあると、音質が劣化することがあるという課題があった。
【0029】また、インテンシティステレオ符号化の左右のチャンネルが同相か、逆相かを表す位相情報が時間フレーム毎に頻繁に変化する、あるいは周波数バンド毎に頻繁に変化すると、歪み成分が発生し、音質が劣化するという課題があった。
【0030】本発明は上記問題点を解決するもので、インテンシティステレオ符号化を用いたステレオオーディオ信号符号化方法及び装置であって、非インテンシティステレオ処理のバンドとインテンシティステレオ処理のバンドの境界のスペクトルを滑らかに接続することにより、歪み成分の発生を低減し、従来よりも音質を向上したステレオオーディオ信号符号化方法及び装置を提供することを目的とする。
【0031】また、インテンシティステレオ符号化の位相情報を以前の時間フレーム位相情報、あるいは以前の時間フレームの左右のチャンネル間の相関関係を考慮して設定することにより、位相情報の頻繁な変化を抑え、歪み成分の発生を低減し、従来よりも音質の向上したステレオオーディオ信号符号化方法及び装置を提供することを目的とする。
【0032】また、インテンシティステレオ符号化の位相情報を隣接する周波数バンドの位相情報、あるいは隣接する周波数バンドの左右のチャンネル間の相関関係を考慮して設定することにより、位相情報の頻繁な変化を抑え、歪み成分の発生を低減し、従来よりも音質の向上したステレオオーディオ信号符号化方法及び装置を提供することを目的とする。
【0033】
【課題を解決するための手段】この課題を解決するために、本発明のステレオオーディオ信号符号化方法は、ステレオオーディオ信号を周波数スペクトルに変換し、インテンシティステレオ符号化を用いて高能率符号化する方法であって、非インテンシティステレオ処理とインテンシティステレオ処理の境界近傍の非インテンシティステレオ処理周波数スペクトルを非インテンシティステレオ処理周波数スペクトルとインテンシティステレオ処理周波数スペクトルとで補間した周波数スペクトルで置き換えるステップを備えたものである。
【0034】また、本発明のステレオオーディオ信号符号化方法は、ステレオオーディオ信号をフレーム毎に周波数スペクトルに変換し、インテンシティステレオ符号化を用いて高能率符号化する方法であって、フレーム毎に前記ステレオオーディオ信号の周波数スペクトル間の相関関係を決定するステップと、現在のフレームと以前のフレームの前記相関関係に応じて、インテンシティステレオ復号化時のステレオオーディオ信号の周波数スペクトルの位相関係を表す位相情報を設定するステップとを備えたものである。
【0035】また、本発明のステレオオーディオ信号符号化方法は、ステレオオーディオ信号を周波数スペクトルに変換し、前記周波数スペクトルをバンド単位でグループ化し、インテンシティステレオ符号化を用いて高能率符号化する方法であって、バンド毎に前記ステレオオーディオ信号の周波数スペクトル間の相関関係を決定するステップと、現在のバンドと隣接するバンドの前記相関関係に応じて、インテンシティステレオ復号化時のステレオオーディオ信号の周波数スペクトルの位相関係を表す位相情報を設定するステップとを備えたものである。
【0036】本発明のステレオオーディオ信号符号化装置は、ステレオオーディオ信号を周波数スペクトルに変換する手段と、インテンシティステレオ符号化を用いて高能率符号化する手段とを備えた装置であって、非インテンシティステレオ処理とインテンシティステレオ処理の境界近傍の非インテンシティステレオ処理周波数スペクトルを非インテンシティステレオ処理周波数スペクトルとインテンシティステレオ処理周波数スペクトルとで補間した周波数スペクトルで置き換える手段を備えたものである。
【0037】また、本発明のステレオオーディオ信号符号化装置は、ステレオオーディオ信号をフレーム毎に周波数スペクトルに変換する手段と、インテンシティステレオ符号化を用いて高能率符号化する手段とを備えた装置であって、フレーム毎に前記ステレオオーディオ信号の周波数スペクトル間の相関関係を決定する手段と、現在のフレームと以前のフレームの前記相関関係に応じて、インテンシティステレオ復号化時のステレオオーディオ信号の周波数スペクトルの位相関係を表す位相情報を設定する手段とを備えたものである。
【0038】また、本発明のステレオオーディオ信号符号化装置は、ステレオオーディオ信号を周波数スペクトルに変換し、前記周波数スペクトルをバンド単位でグループ化する手段と、インテンシティステレオ符号化を用いて高能率符号化する手段を備えた装置であって、バンド毎に前記ステレオオーディオ信号の周波数スペクトル間の相関関係を決定する手段と、現在のバンドと隣接するバンドの前記相関関係に応じて、インテンシティステレオ復号化時のステレオオーディオ信号の周波数スペクトルの位相関係を表す位相情報を設定する手段とを備えたものである。
【0039】
【発明の実施の形態】以下、本発明の実施の形態について、図面を用いて説明する。
【0040】(実施の形態1)図1は、本発明の実施の形態によるステレオオーディオ信号符号化装置の構成を示すブロック図である。
【0041】図1において、110と111は時間/周波数変換部、120はインテンシティ信号生成部、130は非インテンシティ/インテンシティステレオ処理の切換情報に応じて左右のチャンネルの周波数スペクトルを切り換える切換部、140はインテンシティステレオ処理の境界近傍のスペクトルを補間するインテンシティ境界スペクトル補間部、150は量子化及び符号化部である。以上のように構成されたステレオオーディオ信号符号化装置について、その動作を以下に述べる。
【0042】入力された左チャンネルの時間軸のオーディオ信号(左時間信号)は、時間/周波数変換部110において、MDCT(変形離散コサイン変換)されて周波数軸のスペクトル(左スペクトル)に変換され、変換されたスペクトルはバンド単位でグループ化される。本実施の形態では、バンド当たりのスペクトル本数は均一でなく、周波数が高くなるにつれて一つのバンド当たりのスペクトル本数は増加する。
【0043】同様に、入力された右チャンネルの時間軸のオーディオ信号(右時間信号)は、時間/周波数変換部111において、MDCTされて周波数軸のスペクトル(右スペクトル)に変換され、変換されたスペクトルはバンド単位でグループ化される。
【0044】次に、インテンシティ信号生成部120では、上記左チャンネルの周波数スペクトルと右チャンネルの周波数スペクトルを入力として、バンド毎に、非インテンシティステレオ処理か、インテンシティステレオ処理かを表す切換情報、左チャンネルのインテンシティステレオ処理のスペクトルを表す左インテンシティスペクトル、左チャンネルと右チャンネルの位相関係が同相か逆相かを表す位相情報、左チャンネルに対する右チャンネルの信号レベルの比を表す方向性情報とを生成、出力する。
【0045】図2は、インテンシティステレオ信号生成部120の構成を示すブロック図である。図2において、210は左チャンネルのインテンシティ処理のスペクトルを算出する左インテンシティスペクトル算出部、220は位相情報を算出する位相情報算出部、230は左右のチャンネルと左右のチャンネルの和信号と差信号、及び左チャネルの周波数スペクトル(左スペクトル)と右チャンネルの周波数スペクトル(右スペクトル)の相関係数を算出するエネルギー及び相関係数算出部、240は方向性情報算出部である。以上のように構成されたインテンシティ信号生成部120について、その動作を以下に述べる。
【0046】図3はインテンシティステレオ信号生成部120と切換部130の処理ステップを示すフローチャートである。同図で、ステップ301から306までがインテンシティステレオ信号生成部120の処理を表し、ステップ307が切換部130の処理を表す。
【0047】最初にステップ301でインテンシティステレオ処理を行うバンドとインテンシティステレオ処理を行わないバンドを決定する。本実施の形態では、周波数が6kHz以上のバンドをインテンシティステレオ処理を行うバンドに決定する。すなわち、周波数6kHz以上のスタートバンドBsからエンドバンドBeまでをインテンシティステレオ処理を行うバンドに決定し、これに対応した非インテンシティ/インテンシティステレオ処理の切換情報を出力する。
【0048】次にステップ302で、バンド毎に、バンドBの左チャンネル、右チャンネル、左右のチャンネルの和信号と差信号のエネルギー、それぞれ、E(B)L、E(B)R、E(B)L+R、E(B)L-Rを(数2)により算出する。以下では、E(B)L、E(B)R、E(B)L+R、E(B)L-Rを合わせたものをエネルギー情報と呼ぶ。
【0049】
【数2】


【0050】(数2)で、Lspec(i)とRspec(i)は、それぞれ左と右のチャンネルのスペクトル番号iのスペクトルを、またis(B)はバンドBの最初のスペクトル番号を表す。
【0051】次にステップ304では、バンド毎に、バンドBの相互相関係数C(B)を(数3)で算出する。
【0052】
【数3】


【0053】次に、正規化相互相関係数Cn(B)を、Cn(B)=C(B)/SQRT(E(B)LE(B)R)で算出する。
【0054】エネルギー及び相関係数算出部230では、ステップ301からステップ303までの処理を行い、位相情報算出部220に正規化相互相関係数を出力し、左インテンシティスペクトル算出部210と方向性情報算出部240にバンド毎のエネルギー情報を出力し、非インテンシティ/インテンシティステレオ処理の切換情報を切換部130、インテンシティ境界スペクトル補間部140と量子化及び符号化部150に出力する。
【0055】次にステップ304で位相情報を算出する。図4に位相情報算出ステップ304の詳細フローチャートを示す。位相情報の算出は、インテンシティステレオ処理のバンド毎に行う。ステップ401でバンドBをインテンシティステレオ処理のスタートバンドBsに設定する。次にステップ402で正規化相互相関係数Cn(B)が零以上か否かの判定を行う。正規化相互相関係数が零以上の時には、ステップ403に行き、位相情報を同相に設定する。また、正規化相互相関係数が負の時にはステップ404に行き、位相情報を逆相に設定する。次にステップ405でバンド番号Bを1増加する。ステップ406でバンド番号BがエンドバンドBeを越えているか否かを判定し、越えていないときには、ステップ402から405までの処理を繰り返して各バンドの位相情報を設定する。また、BがBeを越えているときには処理を終了する。
【0056】位相情報算出部220でステップ304の上記位相情報算出処理を行う。
【0057】次にステップ305では、方向性情報を算出する。方向性情報は、バンド毎に左チャンネルのエネルギーに対する右チャネルのエネルギーの比の平方根、すなわち、SQRT(EL(B)/ER(B))で算出する。方向性情報算出部240では、以上のようにして方向性情報を算出し、出力する。
【0058】次にステップ306で左チャンネルのインテンシティステレオ処理の周波数スペクトル(左インテンシティスペクトル)を、ステップ304で算出した位相情報を用いて、左右のチャンネルの和信号(位相情報が同相の場合)、あるいは差信号(位相情報が逆相の場合)のエネルギーが元の左チャンネルのエネルギーと同一になるように前記和信号、あるいは差信号を補正して、各バンド毎に算出する。すなわち、位相情報が同相の場合には、左インテンシティスペクトルを(数4)で算出する。
【0059】
【数4】


【0060】また、位相情報が逆相の場合には、左インテンシティスペクトルを(数5)で算出する。
【0061】
【数5】


【0062】左インテンシティスペクトル算出部210では、左チャンネルの周波数スペクトル(左スペクトル)と右チャンネルの周波数スペクトル(右スペクトル)とエネルギー及び相関係数算出部230からのエネルギー情報を入力として、ステップ306の左インテンシティスペクトルの算出を行い、左インテンシティスペクトルを出力する。
【0063】以上がインテンシティ信号生成部120の動作である。
【0064】次にステップ307では、インテンシティステレオ処理のバンドに対して、左チャンネルの周波数スペクトルを左インテンシティスペクトルで、また、右チャンネルのスペクトルを零スペクトルに置き換える。
【0065】切換部130でステップ307のスペクトルの置換処理を行う。すなわち、切換部130では、インテンシティ信号生成部120からのバンド毎の非インテンシティ/インテンシティステレオ処理の切換情報にしたがって、非インテンシティステレオ処理時には各スイッチを図1の上側に接続し、インテンシティステレオ処理時にはスイッチを下側に接続する。これにより、非インテンシティ/インテンシティステレオ処理に応じて、左チャンネルに関しては、左スペクトル/左インテンシティスペクトルを、また、右チャンネルに関しては、右スペクトル/零スペクトルをそれぞれ切り換えて、図13に示すようなスペクトルを生成し、出力する。
【0066】インテンシティ境界スペクトル補間部140では、切換部130からのスペクトルを入力として、非インテンシティステレオ処理とインテンシティステレオ処理の境界近傍バンドの非インテンシティステレオ処理周波数スペクトルを非インテンシティステレオ処理周波数スペクトルとインテンシティステレオ処理周波数スペクトルで補間したスペクトルで置き換える。すなわち、図13のバンド(Bs−1)の非インテンシティステレオ処理の周波数スペクトルを補間した周波数スペクトルで置き換える。バンド(Bs−1)の左右のチャンネルのインテンシティステレオ処理周波数スペクトルLIspec(i)、RIspec(i)は、バンドBの位相情報を用いて次のようにして求める。
【0067】すなわち、バンドBの位相情報が同相の場合には、(数6)で算出する。
【0068】
【数6】


【0069】また、位相情報が逆相の場合には、(数7)で算出する。
【0070】
【数7】


【0071】次に、置き換える左右のチャンネルの補間スペクトルL’spec(i)、R’spec(i)(ただし、is(Bs−1)≦i≦is(Bs)−1)を(数8)で算出する。
【0072】
【数8】


【0073】以上のようにして算出した補間スペクトルL’spec(i)とR’spec(i)でバンド(Bs−1)の非インテンシティステレオ処理周波数スペクトルLspec(i)、Rspec(i)をそれぞれ置き換える。
【0074】量子化及び符号化部130では、以上のようにして算出した周波数スペクトルを用いて、聴覚モデルに基づいてスペクトルのマスキングレベル、すなわち許容量子化ノイズレベルを算出し、算出された許容量子化ノイズレベルを基づいてスペクトルの量子化を行い、ハフマン符号化等の符号化処理を行い、高能率符号化データを出力する。
【0075】以上のように本実施の形態では、インテンシティ境界スペクトル補間処理を設けることにより、非インテンシティステレオ処理とインテンシティステレオ処理の境界近傍のスペクトルを滑らかに接続することができ、従来のインテンシティステレオ符号化におけるインテンシティステレオ処理周波数スペクトルと非インテンシティステレオ処理周波数スペクトルの急激な切り換えによる歪み成分の発生を低減することができる。
【0076】(実施の形態2)本発明の実施の形態2によるステレオオーディオ信号符号化装置の構成及びインテンシティ信号生成部の構成は、実施の形態1と同一で、それぞれ、図1及び図2で示される。実施の形態1と実施の形態2の相違点は、位相情報算出部220の処理内容にあるので、以下、実施の形態2における位相情報算出部220の処理内容について説明し、それ以外の動作については説明を省略する。
【0077】図5に実施の形態2における位相情報算出処理ステップのフローチャートを示す。位相情報の算出はインテンシティステレオ処理のバンド毎に行う。ステップ501でバンドBをインテンシティステレオ処理のスタートバンドBsに設定する。次にステップ502で正規化相互相関係数Cn(B)が所定の閾値TH(B)以上であるか否かの判定を行う。本実施の形態では、閾値TH(B)の初期値は、零に設定する。正規化相互相関係数が前記閾値以上の時には、ステップ503に行き、位相情報を同相に設定するとともにTH(B)の値を所定の負の値−OFFS(ただし、0≦OFFS≦1)に設定する。また、正規化相互相関関数が前記閾値より小さい時にはステップ504に行き、位相情報を逆相に設定するとともにTH(B)の値を所定の値OFFSに設定する。次にステップ505でバンド番号Bを1増加する。ステップ506でバンド番号BがエンドバンドBeを越えていないかを判定し、越えていないときには、ステップ502から505までの処理を繰り返して各バンドの位相情報を設定する。BがBeを越えているときには処理を終了する。
【0078】以上のように実施の形態2では、位相情報の判定条件にヒステリシスをもたせ、前のフレームの位相情報が同相であると、同相に入りやすくし、また前のフレームの逆相であると逆相に入りやすくすることにより、時間フレーム毎の位相情報の頻繁な変化を抑え、インテンシティステレオ符号化の時間フレーム毎の位相情報の頻繁な切り換えによる音質劣化を低減することができる。
【0079】(実施の形態3)本発明の実施の形態3によるステレオオーディオ信号符号化装置の構成及びインテンシティ信号生成部の構成は、実施の形態1と同一で、それぞれ、図1及び図2で示される。実施の形態1と実施の形態3の相違点は、位相情報算出部220の処理内容にあるので、以下実施の形態3における位相情報算出部220の処理内容について説明し、それ以外の動作については説明を省略する。
【0080】図6に実施の形態3における位相情報算出処理ステップのフローチャートを示す。位相情報の算出は、インテンシティステレオ処理のバンド毎に行う。ステップ601でバンドBをインテンシティステレオ処理のスタートバンドBsに設定する。次にステップ602で現在のフレームの正規化相互相関係数Cn(B)と前のフレームの正規化相互相関係数Cnprev(B)から、CC(B)=kCn(B)+(1-k)Cnprev(B)により、重み付け正規化相互相関係数CC(B)を算出する。ここでCnprev(B)の初期値は零に設定する。また、ここで、k(ただし、0≦k≦1)は重み付け係数で、例えば、k=0.75の値に設定する。
【0081】次にステップ603で重み付け正規化相互相関係数が零以上か否かの判定を行う。重み付け正規化相互相関係数が零以上の時には、ステップ604に行き、位相情報を同相に設定する。また、重み付け正規化相互相関係数が負の時にはステップ605に行き、位相情報を逆相に設定する。
【0082】ステップ606では、次のフレームの処理に備えて、前のフレームの正規化相互相関係数Cnprev(B)を現在のフレームの正規化相互相関係数Cn(B)で置き換える。
【0083】次にステップ607でバンド番号Bを1増加する。ステップ608でバンド番号BがエンドバンドBeを越えていないかを判定し、越えていないときには、ステップ602から607までの処理を繰り返して各バンドの位相情報を設定する。BがBeを越えているときには処理を終了する。
【0084】以上のように実施の形態3では、位相情報の判定を重み付け正規化相互相関係数を用いて行うことにより、前のフレームの正規化相互相関係数を考慮して現在のフレームの位相情報を設定することができ、前のフレームの正規化相互相関係数が正もしくは零であると、同相に入りやすく、また、前のフレームの正規化相互相関係数が負であると逆相に入りやすくなり、時間フレーム毎の位相情報の頻繁な変化を抑え、インテンシティステレオ符号化の位相情報の時間フレーム毎の頻繁な切り換えによる音質劣化を低減することができる。
【0085】なお、以上の説明では、一つ前のフレームの正規化相互相関係数のみを考慮した例を示したが、それ以前のフレームの正規化相互相関係数を考慮してもよい。
【0086】また、以上の説明では、重み付け正規化相互相関係数の算出にFIRフィルタを用いた例を示したが、IIRフィルタを用いてもよい。
【0087】(実施の形態4)本発明の実施の形態4によるステレオオーディオ信号符号化装置の構成及びインテンシティ信号生成部の構成は、実施の形態1と同一で、それぞれ、図1及び図2で示される。実施の形態1と実施の形態4の相違点は、位相情報算出部220の処理内容にあるので、以下実施の形態4における位相情報算出部220の処理内容について説明し、それ以外の動作については説明を省略する。
【0088】図7に実施の形態4における位相情報算出処理ステップのフローチャートを示す。位相情報の算出は、インテンシティステレオ処理のバンド毎に行う。ステップ701でバンドBをインテンシティステレオ処理のスタートバンドBsに設定する。次にステップ702で正規化相互相関係数Cn(B)が所定の閾値TH(B)以上であるか否かの判定を行う。本実施の形態では、閾値TH(B)の初期値は、零に設定する。正規化相互相関係数が前記閾値以上の時には、ステップ703に行き、位相情報を同相に設定するとともに隣のバンドの閾値TH(B+1)の値を所定の負の値−OFFS(ただし、0≦OFFS≦1)に設定する。また、正規化相互相関係数が前記閾値より小さい時にはステップ704に行き、位相情報を逆相に設定するとともにTH(B+1)の値をOFFSに設定する。次にステップ705でバンド番号Bを1増加する。ステップ706でバンド番号BがエンドバンドBeを越えていないかを判定し、越えていないときには、ステップ702から705までの処理を繰り返して各バンドの位相情報を設定する。バンド番号BがエンドバンドBeを越えているときには処理を終了する。
【0089】以上のように実施の形態4では、位相情報の判定条件にヒステリシスをもたせ、隣のバンドの位相情報が同相であると、同相に入りやすくし、また隣のバンドの位相情報が逆相であると逆相に入りやすくすることにより、周波数バンド毎の位相情報の頻繁な変化を抑え、インテンシティステレオ符号化の位相情報の周波数バンド毎の頻繁な切り換えによる音質劣化を低減することができる。
【0090】なお、以上の説明では、一つ下のバンドの位相情報の影響を考慮する例を示したが、一つ上のバンドの位相情報の影響を考慮するようにしてもよい。
【0091】(実施の形態5)本発明の実施の形態5によるステレオオーディオ信号符号化装置の構成及びインテンシティステレオ信号生成部の構成は、実施の形態1と同一で、それぞれ、図1及び図2で示される。実施の形態1と実施の形態5の相違点は、位相情報算出部220の処理内容にあるので、以下実施の形態5における位相情報算出部220の処理内容について説明し、それ以外の動作については説明を省略する。
【0092】図8に実施の形態5における位相情報算出処理ステップのフローチャートを示す。位相情報の算出は、インテンシティステレオ処理のバンド毎に行う。ステップ801でバンドBをインテンシティステレオ処理のスタートバンドBsに設定する。次にステップ802で現在のバンドの正規化相互相関係数Cn(B)と一つ下と上のバンド正規化相互相関係数Cn(B−1)とCn(B+1)から、CC(B)=k1(B)Cn(B-1)+k2(B)Cn(B)+k3(b)Cn(B+1)により、重み付け正規化相互相関係数CC(B)を算出する。ただし、k1(B)+k2(B)+k3(B)=1とする。
【0093】ここで、k1(B)、k2(B)、k3(B)は重み付け係数で、正もしくは零の値をとる。本実施の形態では、例えば、B=Bsに対しては、k1(Bs)=0、k2(Bs)=0.875、k3(Bs)=0.125、Bs<B<BeのBに対しては、k1(B)=0125、k2(B)=0.75、k3(Bs)=0.125、B=Beに対しては、k1(Be)=0.125、k2(Bs)=0.875、k3(Be)=0の値に設定する。
【0094】次にステップ803で重み付け正規化相互相関係数が零以上か否かの判定を行う。重み付け正規化相互相関係数が零以上の時には、ステップ804に行き、バンドBの位相情報を同相に設定する。また、重み付け正規化相関関数が負の時にはステップ805に行き、位相情報を逆相に設定する。
【0095】次にステップ806でバンド番号Bを1増加する。ステップ807でバンド番号BがエンドバンドBeを越えていないかを判定し、越えていないときには、ステップ802から806までの処理を繰り返して各バンドの位相情報を設定する。BがBeを越えているときには処理を終了する。
【0096】以上のように実施の形態5では、位相情報の判定を重み付け正規化相互相関係数を用いて行うことにより、隣接するバンドの正規化相互相関係数を考慮して現在のバンドの位相情報を設定するので、隣接するバンドの正規化相互相関係数が正であると、同相に入りやすく、また、隣接するバンドの正規化相互相関係数が負であると逆相に入りやすくなり、周波数バンド毎の位相情報の頻繁な変化を抑え、インテンシティステレオ符号化の位相情報の周波数バンド毎の頻繁な切り換えによる音質劣化を低減することができる。
【0097】
【発明の効果】以上のように本発明によれば、非インテンシティステレオ処理とインテンシティステレオ処理の境界近傍のスペクトルを補間により、滑らかに接続することができ、非インテンシティステレオ処理のスペクトルとインテンシティステレオ処理のスペクトルの急激な切り換えによる歪み成分の発生を低減することができる。
【0098】また、インテンシティステレオ符号化の位相情報を、以前の時間フレームの位相情報、あるいは以前の時間フレームの左右のチャンネル間の相関関係に応じて設定することにより、位相情報の時間フレーム毎の頻繁な切り換えによる音質劣化を低減することができる。
【0099】また、インテンシティステレオ符号化の位相情報を、隣接する周波数バンドの位相情報、あるいは隣接する周波数バンドの左右のチャンネル間の相関関係に応じて設定することにより、位相情報の周波数バンド毎の頻繁な切り換えによる音質劣化を低減することができる。
【0100】以上にように本発明によれば、インテンシティステレオ符号化の音質劣化を低減したステレオオーディオ信号符号化方法及び装置を実現することができる。
【図面の簡単な説明】
【図1】本発明の実施の形態1によるステレオオーディオ信号符号化装置の構成を示すブロック図
【図2】同ステレオオーディオ信号符号化装置におけるインテンシティ信号生成部の構成を示すブロック図
【図3】本発明の実施の形態1によるステレオオーディオ信号符号化方法におけるインテンシティ符号化処理のステップを示すフローチャート
【図4】同ステレオオーディオ信号符号化方法における位相情報算出処理ステップを示すフローチャート
【図5】本発明の実施の形態2のステレオオーディオ信号符号化方法における位相情報算出処理ステップを示すフローチャート
【図6】同実施の形態3のステレオオーディオ信号符号化方法における位相情報算出処理ステップを示すフローチャート
【図7】同実施の形態4のステレオオーディオ信号符号化方法における位相情報算出処理ステップを示すフローチャート
【図8】同実施の形態5のステレオオーディオ信号符号化方法における位相情報算出処理ステップを示すフローチャート
【図9】従来のステレオオーディオ信号符号化装置の構成を示すブロック図
【図10】同従来例における動作を説明するための時間/周波数変換説明図
【図11】同従来例における動作を説明するためのインテンシティステレオ符号化の方式説明図
【図12】同従来例のステレオオーディオ信号符号化方法におけるインテンシティ符号化処理ステップを示すフローチャート
【図13】同従来例における動作を説明するための非インテンシティ/インテンシティステレオ処理スペクトル説明図
【図14】従来のステレオオーディオ信号復号化装置の全体構成を示すブロック図
【図15】同従来例のステレオオーディオ信号復号化装置における右インテンシティスペクトル再生部の構成を示すブロック図
【符号の説明】
110,111 時間/周波数変換部
120 インテンシティ信号生成部
130 切換部
140 インテンシティ境界スペクトル補間部
150 量子化及び符号化部
210 左インテンシティスペクトル算出部
220 位相情報算出部
230 エネルギー及び相関係数算出部
240 方向性情報算出部

【特許請求の範囲】
【請求項1】 ステレオオーディオ信号を周波数スペクトルに変換し、インテンシティステレオ符号化を用いて高能率符号化する方法であって、非インテンシティステレオ処理とインテンシティステレオ処理の境界近傍の非インテンシティステレオ処理周波数スペクトルを非インテンシティステレオ処理周波数スペクトルとインテンシティステレオ処理周波数スペクトルとで補間した周波数スペクトルで置き換えるステップを備えたことを特徴とするステレオオーディオ信号符号化方法。
【請求項2】 ステレオオーディオ信号をフレーム毎に周波数スペクトルに変換し、インテンシティステレオ符号化を用いて高能率符号化する方法であって、フレーム毎に前記ステレオオーディオ信号の周波数スペクトル間の相関関係を決定するステップと、現在のフレームと以前のフレームの前記相関関係に応じて、インテンシティステレオ復号化時のステレオオーディオ信号の周波数スペクトルの位相関係を表す位相情報を設定するステップとを備えたことを特徴とするステレオオーディオ信号符号化方法。
【請求項3】 ステレオオーディオ信号を周波数スペクトルに変換し、前記周波数スペクトルをバンド単位でグループ化し、インテンシティステレオ符号化を用いて高能率符号化する方法であって、バンド毎に前記ステレオオーディオ信号の周波数スペクトル間の相関関係を決定するステップと、現在のバンドと隣接するバンドの前記相関関係に応じて、インテンシティステレオ復号化時のステレオオーディオ信号の周波数スペクトルの位相関係を表す位相情報を設定するステップとを備えたことを特徴とするステレオオーディオ信号符号化方法。
【請求項4】 前記相関関係は、相互相関係数に基づくものであることを特徴とする請求項2または3記載のステレオオーディオ信号符号化方法。
【請求項5】 ステレオオーディオ信号を周波数スペクトルに変換する手段と、インテンシティステレオ符号化を用いて高能率符号化する手段とを備えた装置であって、非インテンシティステレオ処理とインテンシティステレオ処理の境界近傍の非インテンシティステレオ処理周波数スペクトルを非インテンシティステレオ処理周波数スペクトルとインテンシティステレオ処理周波数スペクトルとで補間した周波数スペクトルで置き換える手段を備えたことを特徴とするステレオオーディオ信号符号化装置。
【請求項6】 ステレオオーディオ信号をフレーム毎に周波数スペクトルに変換する手段と、インテンシティステレオ符号化を用いて高能率符号化する手段とを備えた装置であって、フレーム毎に前記ステレオオーディオ信号の周波数スペクトル間の相関関係を決定する手段と、現在のフレームと以前のフレームの前記相関関係に応じて、インテンシティステレオ復号化時のステレオオーディオ信号の周波数スペクトルの位相関係を表す位相情報を設定する手段とを備えたことを特徴とするステレオオーディオ信号符号化装置。
【請求項7】 ステレオオーディオ信号を周波数スペクトルに変換し、前記周波数スペクトルをバンド単位でグループ化する手段と、インテンシティステレオ符号化を用いて高能率符号化する手段とを備えた装置であって、バンド毎に前記ステレオオーディオ信号の周波数スペクトル間の相関関係を決定する手段と、現在のバンドと隣接するバンドの前記相関関係に応じて、インテンシティステレオ復号化時のステレオオーディオ信号の周波数スペクトルの位相関係を表す位相情報を設定する手段とを備えたことを特徴とするステレオオーディオ信号符号化装置。
【請求項8】 前記相関関係は、相互相関係数に基づくものであることを特徴とする請求項6または7記載のステレオオーディオ信号符号化装置。

【図1】
image rotate


【図2】
image rotate


【図3】
image rotate


【図15】
image rotate


【図4】
image rotate


【図9】
image rotate


【図5】
image rotate


【図10】
image rotate


【図6】
image rotate


【図14】
image rotate


【図7】
image rotate


【図11】
image rotate


【図8】
image rotate


【図13】
image rotate


【図12】
image rotate


【公開番号】特開2002−311994(P2002−311994A)
【公開日】平成14年10月25日(2002.10.25)
【国際特許分類】
【出願番号】特願2001−119266(P2001−119266)
【出願日】平成13年4月18日(2001.4.18)
【出願人】(000005821)松下電器産業株式会社 (73,050)
【Fターム(参考)】