説明

デジタルオーディオ信号の符号化

入力オーディオ信号(S(z))を中間帰還信号と組み合わせ、修正された入力信号を形成する組み合わせモジュールと、修正された入力信号のレートを拡張可能な量子化モジュール(91)と、を含み、所定のレートの量子化指数の2進数フレームを生成する入力オーディオ信号の符号化器に関する。符号化器は、再生信号(SPCM(z))を予め決定するために所定のレートよりも低いレートの指数に対応する2進数フレームの量子化指数の一部の逆量子化モジュール(93)と、少なくとも一連の量子化モジュールおよび逆量子化モジュールに由来する量子化雑音(QPCM(z))を決定するモジュール(94)と、再生信号からの量子化雑音のフィルタ処理関数の決定モジュール(111)と、中間帰還信号を得るためにフィルタ処理関数を量子化雑音に適用するように構成されたフィルタ処理モジュール(33)と、を含む。また、符号化方法および復号化方法に関する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は音データの処理に関する。
この処理は、特に、オーディオ周波数信号(音声、音楽など)のようなデジタル信号の伝送および/または記憶に適合する。
本発明は、より詳細には、パルス符号変調(PCM)のような波形符号化に関する。
【背景技術】
【0002】
図1を参照して、ITU-T勧告G.711によって規定されているようなPCM符号化/復号化の一般原理を説明する。
【0003】
PCM符号化器13は、入力として入力信号S(z)を受信する量子化モジュールQPCM10を含む。量子化モジュール10の出力において量子化指数(quantization index)IPCMは伝送チャネル11を介して復号化器14に伝送される。
【0004】
PCM復号化器14は、恐らくIPCM中に2進数誤差を受けて伝送チャネルから入ってくる指数I'PCMを入力として受信し、逆量子化モジュールQ-1PCM12によって逆量子化を実行し、符号化信号
【0005】
【数1】

【0006】
を得る。
【0007】
ITU-T勧告G.711(以下、G.711)によって標準化されたようなPCM符号化は、広い信号ダイナミックレンジに対してほぼ一定である信号対雑音比を生成する対数曲線によって、([300〜3400Hz]の最小帯域幅で規定され、8kHzでサンプリングされる)信号の振幅を圧縮する。原信号の領域での量子化の刻みは信号の振幅に比例する。
【0008】
圧縮された信号は8ビット(256レベル)に量子化される。公衆交換電話網(PSTN)では、これらの8ビットは8kHzの周波数で伝送され、64キロビット/秒のビットレートをもたらす。
【0009】
G.711標準の量子化信号フレームは8ビットに符号化された量子化指数からなる。したがって、逆量子化がテーブルを用いて実行される場合、それは、単に、256の可能な復号化値のうちの1つを指し示す指数からなる。
【0010】
G.711標準のA-law(ヨーロッパ)またはG.711標準のμ-law(北アメリカおよび日本)では、8ビットは、図1に15で示されるように以下の方法で分配される。
【0011】
1つの符号ビットS、セグメントを示す3ビット、およびセグメント中の位置を示す4ビット。
【0012】
符号化器の量子化の過程は、原信号と復号化信号との間の差からなる量子化雑音を生じる。
【発明の概要】
【発明が解決しようとする課題】
【0013】
多数(256)の量子化レベルのために、量子化雑音は図2の20に示されるように比較的平坦なスペクトルを有する。広いダイナミックレンジ(約40dB)を有する信号(ここでは音声信号ブロック)のスペクトルが図2に22で示されている。低いエネルギーの領域では、雑音が信号に非常に近く、したがって、必ずしもマスクされないことが理解される。したがって、それはこれらの領域(2300Hzから3500Hz)において聞こえるようになることがある。
【0014】
適応予測音声符号化器の場合には、この雑音をマスクし、できる限りそれを聞こえなくするために量子化雑音整形技法が使用されてきた。同時に存在する周波数をマスクするという人間の耳の性質のために、信号がより多くのエネルギーを有する領域にはより多くの量子化雑音を導入することが可能である。雑音整形は、低いエネルギーの領域の量子化雑音レベルを低減して量子化雑音をより高いエネルギーの領域に再分配することによって、量子化雑音のスペクトル分布を改善する。
【0015】
そのような技法は、例えば、J.Makhoul、M.Berouti、“Adaptive noise spectral shaping and entropy coding in predictive coding of speech”、IEEE Trans. ASSP、27-3巻、1979年6月に説明されている。
【0016】
その文献は、再生信号を考慮に入れる線形フィルタの使用について説明している。量子化雑音整形フィルタは線形予測符号化(LPC)合成フィルタに由来する。したがって、この種類の符号化器の出力で得られるフレームはフィルタの線形予測係数指数、利得正規化係数指数、および、量子化指数を含む。
【0017】
さらに、上述の参考文献では、雑音整形フィルタは線形予測係数指数から再現される合成フィルタから計算される。したがって、雑音整形フィルタは線形予測係数の符号化雑音の影響を受けることになる。さらに、引用した参考文献では、整形フィルタの伝達関数は、分子にのみ、2つのカスケード式線形予測によって計算された係数を有する。2つのカスケード式線形予測は各々誤りの分担に寄与し、その結果によれば、引用した参考文献に明確に示されているように、雑音整形は高々2に等しいいくつかの係数にのみ効果的である。
【0018】
MakhoulおよびBeroutiによる論文により、量子化雑音整形は、逆量子化モジュールおよび短期予測フィルタからなる合成モデルによって特徴づけられる適応予測システムにおいて可能となることが分かる。合成フィルタは適切な整形を得るために符号化機構で使用される。
【0019】
したがって、この技法は、PCM符号化器(特にG.711符号化器)のように合成フィルタを有していない非予測符号化器には適さない。整形を含む量子化は(MakhoulおよびBeroutiによる論文に説明されているように)、線形予測(または励振)の残余の領域で、すなわち原信号が予測フィルタA(z)によってフィルタ処理された後に実行される。したがって、フィルタA(z)の係数は復号化器に送られ、逆量子化の後に合成フィルタ処理1/A(z)が実行されなければならない。さらに、雑音整形は送られた関数A(z)から導き出された2次減少関数(second order reduced function)B(z)によって実行される。
【0020】
前述の見解は、J.H.Chen、“Novel codec structures for noise feedback coding of speech」”、Proc. Of ICASSP、2006年、I-681〜I-684頁による論文に当てはまり、その論文は、長期整形フィルタによって長期予測変量および量子化雑音整形を組み込むことによるMakhoulおよびBeroutiによる論文に基づく。さらに、ベクトル量子化がChenらによる論文で達成される。
【課題を解決するための手段】
【0021】
本発明は、先行技術における欠点のない解決策を提供する。
【0022】
このために、本発明は入力オーディオ信号を符号化する方法を提案しており、前記入力オーディオ信号は中間帰還信号と組み合わされて修正された入力信号を形成し、この方法は、所定のビットレートの量子化指数の2進数フレームを生成する、前記修正された入力信号を量子化するビットレートを拡張可能(scalable)なステップを含み、この方法は、
- 再生信号を決定するために、所定のビットレートよりも低いビットレートの指数に対応する2進数フレームの量子化指数のうちのいくつかを逆量子化するステップと、
- 少なくとも一連の量子化するステップおよび逆量子化するステップによって生成された量子化雑音を決定するステップと、
- 前記再生信号から量子化雑音フィルタ関数を決定するステップと、
- 前記中間帰還信号を得るために前記フィルタ関数を前記量子化雑音に適用するステップと、
をさらに含む。
【0023】
したがって、本発明の方法は、既存のG.711 PCM復号化器によって復号化することができる量子化指数のフレームを生成する。本発明の方法は、既存の復号化器との相互運用性を維持しながら量子化雑音を考慮に入れることによってこのようにして得られたフレームのオーディオ品質を改善する。
【0024】
したがって、量子化雑音は適切なフィルタ関数を決定することによって整形される。
【0025】
2進数フレームは信号の各サンプルを個別に表す量子化スカラー指数のみからなり、線形予測係数を伝送する必要はない。
【0026】
したがって、この整形は復号化器への係数の伝送を必要とせず、合成フィルタを備えていないPCM符号化器によって実行することができる。
【0027】
例えば、本発明は、インタリーブ符号の符号化器の場合、好ましくはG.711 PCM量子化モジュールによって、最小ビットレート(コアビットレート)量子化のみ量子化雑音を整形する。したがって、復号化するときに割り当てられたビットレートに応じて、コアビットレートの逆量子化によって信号の一部だけを復号化することが可能であり、さらに、量子化雑音整形によって得られた信号品質改善から利益を得ることができる。
【0028】
特定の一実施形態では、ビットレートを拡張可能な量子化のステップは、ITU-T標準G.711のA-lawまたはμ-lawと相互運用性を有するPCM符号化型のコア符号化に対応する少なくともコアビットレートの量子化指数を供給する。
【0029】
本発明の一実施形態では、フィルタ関数は2つの線形予測フィルタの構成によって決定され、その係数は再生信号から決定される。
【0030】
これにより、符号化器と同じ方法でフィルタ計算を再生信号に適用することによって復号化器側に改善を導入することが可能になる。その場合、フィルタの計算のために追加情報を伝送する必要はない。
【0031】
本発明の別の実施形態では、フィルタ関数は2つの線形予測フィルタの構成によって決定され、その係数は入力信号から決定される。
【0032】
したがって、量子化雑音のフィルタ関数を計算するために考慮に入れられる係数は、信号をモデル化する符号化(したがって、劣化する)合成フィルタに依存しないが、入力信号に直接依存する。したがって、雑音整形はより適切となる。
【0033】
特定の一実施形態では、前記中間帰還信号は量子化雑音の予測およびフィルタ処理された量子化雑音の予測から計算され、フィルタ処理された量子化雑音は中間信号と量子化雑音とを加算することによって得られる。
【0034】
特定の一実施形態では、量子化雑音のフィルタ関数は自己回帰移動平均(ARMA)フィルタである。
【0035】
この重み付け関数は、分子の係数の数が2に限定されることなしに分子の係数および分母の係数をもつフィルタの形態であるので、雑音整形が改善される。
【0036】
本発明の一実施形態では、量子化雑音の重み付け関数は入力信号の周期性の特性から計算される。
【0037】
入力信号の周期特性を考慮の入れた重み付け関数により、雑音がより大きい、例えば信号の高調波間の位置の雑音に追加の変調を与えることができる。
【0038】
本発明は、特に、量子化指数フレームがITU-TのG.711のA-lawまたはμ-lawに従う場合に適する。
【0039】
ビット獲得の実施形態では、所定のビットレートの拡張可能な量子化のステップはITU-TのG.711のA-lawまたはμ-lawと相互運用性を有するPCMスカラー量子化であり、所定のビットレートよりも低いビットレートの指数の逆量子化のステップは、再生信号を決定するために2進数フレームの8−Kビットに適用され、Kビットデータを挿入するステップがさらに実行される。
【0040】
本発明は、修正された入力信号を形成するために入力オーディオ信号を中間帰還信号に組み合わせる組み合わせモジュールと、所定のビットレートの量子化指数の2進数フレームを生成するために前記修正された入力信号を量子化するビットレートを拡張可能な量子化モジュールと、を含む入力オーディオ信号の符号化器に関する。この符号化器は、
- 再生信号を決定するために、所定のビットレートよりも低いビットレートの指数に対応する2進数フレームの量子化指数のうちのいくつかを逆量子化するためのモジュールと、
- 少なくとも一連の量子化および逆量子化によって生成された量子化雑音(QPCM(Z))を決定するためのモジュールと、
- 前記再生信号から量子化雑音のフィルタ関数を決定するためのモジュールと、
- 前記中間帰還信号を得るために前記フィルタ関数を前記量子化雑音に適用するためのモジュールと、
をさらに含む。
【0041】
インタリーブ符号化器の場合、より低いビットレートの逆量子化モジュールは、好ましくは、ITU-T標準G.711 PCM型である。
【0042】
本発明は、さらに、オーディオ信号の拡張可能な復号化の方法に関し、この方法は、
- 再生信号を形成するために第1のビットレートすなわちコアビットレートの量子化指数を復号化する第1の逆量子化のステップと、
- より高いビットレートの再生信号を形成するために、復号化するときに受信したビットレートに応じて実行される、コアビットレートよりも高い第2のビットレートの量子化指数を復号化する第2の逆量子化のステップと、
を含む。
【0043】
この方法は、
- 前記コアビットレートの再生信号と前記より高いビットレートの再生信号との間の差信号を得るステップと、
- 再生コアビットレート信号から修正フィルタ関数を決定するステップと、
- 修正項を得るために前記差信号に前記修正フィルタ関数を適用するステップと、
- 前記修正項と再生信号のうちの1つとを組み合わせることによってより高いビットレートで修正再生信号を合成するステップと、
をさらに含む。
【0044】
したがって、復号化するときに割り当てられたビットレートに応じて、コアビットレートの逆量子化によって信号の一部だけを復号化することが可能であり、さらに、量子化雑音整形による信号品質の改善から利益を得ることができる。
【0045】
一実施形態では、前記修正項は前記コアビットレートの再生信号に適用される。
【0046】
別の実施形態では、前記修正項は前記より高いコアビットレートの再生信号に適用される。
【0047】
本発明は、
- 再生信号を形成するために第1のビットレートすなわちコアビットレートの量子化指数を復号化する第1の逆量子化のモジュールと、
- より高いビットレートの再生信号を形成するために、復号化するときに受信したビットレートに応じて実行される、コアビットレートよりも高い第2のビットレートの量子化指数を復号化する第2の逆量子化のモジュールと
を含むオーディオ信号の復号化器に関する。
【0048】
復号化器は、
- 前記コアビットレートの再生信号と前記より高いビットレートの再生信号との間の差信号を得るモジュールと、
- 再生コアビットレート信号から修正フィルタ関数を決定するモジュールと、
- 修正項を得るために前記差信号に前記修正フィルタ関数を適用することが可能なフィルタモジュールと、
- 前記修正項と前記再生信号のうちの1つとを組み合わせることが可能な、より高いビットレートで修正再生信号を合成するモジュールと
をさらに含む。
【0049】
最後に、本発明は、符号化器または復号化器のメモリに、および/または、符号化器または復号化器の読み取り器と協働するように構成されたメモリ媒体に記憶されるコンピュータプログラムであって、前記コンピュータプログラムが符号化器または復号化器のプロセッサによって実行される場合、請求項1から5のいずれか一項に記載の符号化方法、および/または、請求項6から8のいずれか一項に記載の復号化方法のステップを実行するための命令コードを含むコンピュータプログラムに関する。
【0050】
本発明の他の特徴および利点は、単に限定しない例として与えられる、添付図面に関する以下の説明を読むことによって、より明らかになるであろう。
【図面の簡単な説明】
【0051】
【図1】従来技術のG.711 PCM符号化/復号化システムを示す図である。
【図2】本発明を実装していない符号化器に存在する量子化雑音のスペクトルに関する信号ブロックのスペクトルを示す図である。
【図2b】本発明の符号化器に存在する量子化雑音のスペクトルに関する信号ブロックのスペクトルを示す図である。
【図3】本発明の符号化器および適切な復号化器の一般的なブロック概略図である。
【図4】本発明の符号化器および適切な復号化器の第1の実施形態のブロック概略図である。
【図5】本発明の符号化器および適切な復号化器の第2の実施形態のブロック概略図である。
【図6】本発明の量子化雑音整形フィルタのための第1の計算の形態のステップを示す流れ図である。
【図7】本発明の量子化雑音整形フィルタのための第2の計算の形態のステップを示す流れ図である。
【図8】本発明の量子化雑音整形フィルタのための第3の計算の形態のステップを示す流れ図である。
【図9】インタリーブ構成の量子化モジュールを有する本発明の符号化器および適切な復号化器のブロック概略図である。
【図10】インタリーブ構成の量子化モジュールを有する本発明の符号化器および適切な復号化器の変形のブロック概略図である。
【図11】本発明の符号化器および適切な復号化器のもう1つの実施形態のブロック概略図である。
【図12】ビット獲得の場合の本発明の符号化器および適切な復号化器のもう1つの実施形態のブロック概略図である。
【発明を実施するための形態】
【0052】
次に、図3を参照して、本発明の符号化器30を説明する。対応する復号化器14は図1を参照して説明したような標準的な復号化器であり、それは逆量子化モジュール12を含み、それは好ましい実施形態ではPCM逆量子化モジュールである。
【0053】
符号化器30は量子化モジュール31を含み、それは好ましい実施形態ではPCM量子化モジュールである。符号化器30は、好ましくはPCM型の逆量子化モジュール32をさらに含む。
【0054】
本発明によれば、帰還ループは量子化雑音整形モジュール33を含む。このために、量子化雑音を得るのに、このモジュールは量子化モジュールの入力信号と、逆量子化モジュールから入ってくる信号
【0055】
【数2】

【0056】
との両方を入力として受け取る。このモジュールは量子化雑音に適用されるべき重み付け関数を決定する。量子化雑音を整形するためのフィルタ係数または他のパラメータは伝送されないことに留意されたい。
【0057】
この重み付け関数は、入力信号と無関係に一定かつ一度限り固定とすることが可能である。
【0058】
任意選択で、それは、符号化されるべき入力信号および/または逆量子化モジュールの出力信号を入力として受信する適応モジュール34によって適応させることができる。この適応モジュールによって実行される計算は線形予測型である。それらは、図6、図7、図8を参照して詳細に説明される。
【0059】
次に、重み付け量子化雑音は35で入力信号と組み合わされる。組み合わされた信号は量子化モジュール31の入力に供給され、量子化モジュール31は、伝送チャネル11に、図1を参照して定義されたようなG.711型フレーム、すなわち、8ビット(符号、セグメント番号、およびセグメント内の位置)の量子化指数のフレームを送出する。
【0060】
図3は符号化器によって実行される本発明の方法の主要ステップも示す。
【0061】
したがって、符号化器は本発明の方法を実行し、それは、
- 量子化指数の2進数フレームを構成する量子化指数を得るために中間帰還信号と組み合わされた入力信号のサンプルをスカラー量子化するステップと、
- 逆スカラー量子化によって量子化指数から再生信号を決定するステップと、
- 一連の量子化のステップおよび逆量子化のステップによって生成された量子化雑音を決定するステップと、
- 量子化雑音重み付け関数を決定するステップと、
- 重み付け量子化雑音に対応する前記中間帰還信号を得るために前記重み付け関数を量子化雑音に適用するステップと、
を含む。
【0062】
符号化器のメモリに、および/または、符号化器の読取器と協働するように構成されたメモリ媒体に記憶されるコンピュータプログラムは、前記コンピュータプログラムが符号化器のプロセッサによって実行されるとき本発明の方法のステップを実行するための命令コードを含む。
【0063】
したがって、標準的な復号化器14は受け取った信号I'PCMを修正なしで復号化することができ、さらに、符号化器30で実行された雑音整形によって得られた品質の改善から利益を得ることができる。
【0064】
別の可能な応用では、符号化によって生成されたデータなどの他のデータを伝送するために、符号化器と復号化器との間の伝送において、1つまたは複数のビットを考慮に入れないことまたは1つまたは複数のビットを使用しないことが可能である。この場合、符号化品質を改善する本発明は、より少数のビットを使用して、標準的なG.711 PCM符号化器によって現在得られる品質と等価な信号品質を生じる。
【0065】
量子化モジュールのビットレートが拡張可能である別の可能な応用では、9、10、またはそれを超えるビットまでPCM量子化を拡張し、2進数フレームとして符号化器の出力において符号ビットおよびセグメント番号を保存し、対応するフレーム構造をもつセグメントに追加の位置を加えることが可能である。各セグメントの位置の数が2倍になる場合、追加のビットが伝送のために必要である。さらに、この場合、本発明は、復号化器によって復号化されるオプションの改善ビットの数にかかわらず符号化の品質を改善する。
【0066】
次に、図4を参照して、本発明の第1の実施形態を説明する。
【0067】
ここで説明する符号化器40は図3を参照して説明したのと同じモジュール31、32、34、および、35を含む。復号化器14は図1を参照して説明したような標準的な復号化器である。
【0068】
次に、量子化雑音整形モジュール33の動作を詳細に説明する。
【0069】
最初に、量子化モジュール31の入力と逆量子化モジュール32の出力との間の差を確定することによって、41で量子化雑音QPCM(Z)が得られる。
【0070】
以後、時間サンプルnまたはz変換という表現は、どちらか一方がより有用かどうかに従って交換可能に使用される。例えば、s(n)はz変換S(z)の時間サンプルを表す。
【0071】
2つのフィルタ(Ag1P(z)フィルタ42およびAg2P(z)フィルタ44)の配置は、量子化雑音重み付け関数を作り出す。
【0072】
この構成は以下のように機能する。
【0073】
サンプルの第1の部分和は、
【0074】
【数3】

【0075】
の形式であるフィルタAg1P(z)42によって実行され、フィルタ42の出力で、
【0076】
【数4】

【0077】
を生成し、ここで、qPCM(n)は量子化雑音である。
【0078】
信号(-sg1P(n))と、44で第2のフィルタAg2P(z)によって得られた信号のsg2P(n)とに量子化雑音qPCM(n)を加えることによって、フィルタ処理された量子化雑音qfPCM(n)が43で得られる。
【0079】
この第2のフィルタAg2P(z)は、
【0080】
【数5】

【0081】
によって与えられ、したがって、qfPCM(n)は、
qfPCM(n) = qPCM(n) + sg2P(n) - sg1P(n)
となり、ここで、sg2P(n)は、
【0082】
【数6】

【0083】
によって与えられる。
【0084】
フィルタAg1P(z)およびAg2P(z)の係数は、線形予測法を使用して適応モジュール34によって計算される。これらの計算は、図6、図7、図8を参照して以下で詳細に説明される。
【0085】
次に、中間帰還信号を構成する、45で実行される信号間の差sg1P(n)-sg2P(n)が35で入力信号から差し引かれ、量子化モジュール31の入力信号が生成される。
【0086】
次に、信号は量子化され、時間nの量子化雑音は量子化モジュールの入力と逆量子化モジュールの出力との間の差から得られる。
【0087】
符号化されるべき信号および量子化雑音の関数として再構成される信号の式は、
【0088】
【数7】

【0089】
によって与えられる。量子化雑音はほとんど白色雑音であるので、知覚可能な符号化雑音のスペクトルは自己回帰移動平均(ARMA)フィルタのフィルタ
【0090】
【数8】

【0091】
(または
【0092】
【数9】

【0093】
)特性によって整形されることになる。
【0094】
以下で説明されるように、分子および分母は、多くの場合、係数g1およびg2を、
【0095】
【数10】

【0096】
のように割り当てることによって、フィルタ
【0097】
【数11】

【0098】
から計算される。
【0099】
分子の値および分母の値を含むこの種類の重み付け関数は、分母の値を通して信号のピークを、および、分子の値を通して減衰の値を考慮に入れ、それにより、最適量子化雑音整形を実行するという利点を有する。g1およびg2の値は、
1 > g2 > g1 > 0
である。
【0100】
広いダイナミックレンジをもつ入力信号のための雑音モデリングを改良するために、図4の概略図はカスケード型ARMAフィルタに一般化できることに留意されたい。
【0101】
次に、図5を参照して第2の実施形態を説明する。符号化器50は図3および図4を参照して説明したのと同じモジュール31、32、34を含む。同様に、復号化器14は、図3および図4を参照して説明したものと同様である。
【0102】
次に、雑音整形モジュール33を詳細に説明する。
【0103】
このフィルタは、図4を参照して説明した同じ装置41、43、45、および、フィルタ42、44を含む。他のフィルタPP1(z)およびPP2(z)である51および56が設けられる。
【0104】
音声信号および高忠実度オーディオ信号の場合には、信号の周期性を示す信号の微細構造に基づいた整形が信号の高調波間の知覚される量子化雑音を低減する。この改善は、例えば200Hzを超える比較的高い基本周波数またはピッチをもつ信号の場合に特に顕著である。
【0105】
定義されたスペクトル構造に応じた整形フィルタ51は、
P1(z)=1-PP1(z) (6)
によって与えられ、
ここで、PP1(z)は、
【0106】
【数12】

【0107】
によって与えられる部分フィルタであり、ここで、Pitchは信号の1周期のサンプルの数であり、2MP+1は部分フィルタの係数の数であり、
【0108】
【数13】

【0109】
はフィルタの係数である。
【0110】
分母の関数としての整形フィルタ56は、
P2(z) = 1 - PP2(z)
によって与えられ、ここで、PP2(z)は、
【0111】
【数14】

【0112】
によって与えられる部分フィルタである。
【0113】
フィルタ42および44と共にフィルタ51および56の装置52、54、55、および53は、復号化信号
【0114】
【数15】

【0115】
を、符号化されるべき信号および整形フィルタの関数として
【0116】
【数16】

【0117】
によって与える。
【0118】
フィルタ1-PP1(z)は、複素共役の単位円内に2MP個の零を有し、その結果、変数zが単位円のまわりを動くと、1-PP1(z)の周波数応答は、信号の周期性に対応するスペクトルの微細構造のMP個の極大の特性を有する。
【0119】
部分予測器PP1(z)およびPP2(z)は線形予測技法を使用して入力信号から計算される。
【0120】
図2bは図2と同じ音声信号ブロックのスペクトルを示すが、図2とは対照的に、量子化雑音は図5の本発明の変形を適用することによって整形されている。雑音がフォルマントおよび高調波の両方を追跡することが見て分かり、それは常に信号のレベルより下であり、それにより、雑音が聞き取れなくなることが分かる。
【0121】
次に、図6を参照して、図4および図5のフィルタ42および44などの整形フィルタのための第1の線形予測計算の形態を説明する。
【0122】
この第1の実施形態は、図3、図4、図5を参照して説明した適応モジュール34によって実行されるアルゴリズムの形態で説明される。
【0123】
ステップE60において、モジュール34は、PCM量子化が信号ブロックごとに実行される場合には現在のブロックに対応する入力信号ブロック、または、PCM量子化がサンプルごとに実行される場合には前のブロックからの信号を受け取る。
【0124】
次に、信号ブロックはステップE61でハニング(Hanning)ウィンドウによって重み付けされる。例えばカイザー(Kaiser)ウィンドウなどの他のウィンドウが可能である。
【0125】
次に、K+1相関係数が、ステップE62で、
【0126】
【数17】

【0127】
から計算される。
【0128】
信号のエンベロープをモデル化する自己回帰(AR)フィルタの係数が、ステップE63で、レビンソン-ダービン(Levinson-Durbin)アルゴリズムによって与えられる。
【0129】
したがって、ステップE64で、Ag(z)フィルタ、すなわち、入力信号のエンベロープをモデル化する伝達関数
【0130】
【数18】

【0131】
をもつフィルタが得られる。
【0132】
この計算が本発明の符号化器Ag1フィルタ42およびAg2フィルタ44の両方に使用されると、したがって、ステップE65で、
【0133】
【数19】

【0134】
によって与えられる整形フィルタが得られる。
【0135】
次に、図7を参照して、第2のフィルタ計算の形態が説明される。
【0136】
ステップE70において、PCM量子化が信号ブロックごとに実行される場合には現在のブロックに対応する信号ブロック、または、PCM量子化がサンプルごとに実行される場合には前のブロックからの信号が入力として取得される。
【0137】
次に、信号ブロックはステップE71で重み付けウィンドウによって重み付けされ、その後、マスキング曲線がステップE72で計算される。この曲線は、聞き取れないという点から許容できる最大雑音レベルを示す。効率的な計算の一例が、Y.Mahieux、J.P.Petit、“High quality audio transform coding at 64 kbit/s”、IEEE Trans. on Com.、42-11巻、1994年11月におけるオーディオ符号化で与えられている。
【0138】
マスキング曲線の係数は電力スペクトル密度を表す。この密度は自己回帰フィルタ
【0139】
【数20】

【0140】
によって近似される。このために、典型的な相関係数を得るのに、ステップE73で、マスキング曲線M(z)の逆フーリエ変換が最初に実行される。
【0141】
マスキング曲線をモデル化するARフィルタの係数はステップE74のレビンソン-ダービンアルゴリズムによって与えられ、ステップE75で自己回帰整形フィルタ
【0142】
【数21】

【0143】
が与えられる。
【0144】
この場合、ARMAマスキングフィルタは、マスキング曲線をモデル化する自己回帰フィルタ(分子はない)に変形される。この手法は利点となり得るが、それは、PCM符号化器が、さらに、より狭い帯域[0〜4kHz]で音楽(例えば通話保留状態での音楽)を符号化することができ、この場合、マスキング曲線を使用する方が的確であるからである。
【0145】
したがって、この計算の形態は図4のAg2フィルタに適用することができ、Ag1フィルタは0に設定される。
【0146】
次に、図8を参照して、使用される第3のフィルタ計算の形態が説明される。ステップE80において、PCM量子化が信号ブロックごとに実行される場合には現在のブロックに対応する信号ブロック、または、PCM量子化がサンプルごとに実行される場合には前のブロックからの信号が入力として取得される。
【0147】
次に、信号ブロックはステップE81で重み付けウィンドウによって重み付けされ、その後、マスキング曲線は、図7で示されたのと同様にステップE82で計算される。マスキング曲線の係数は、この場合、調整された平均フィルタAg(z)によって近似される電力スペクトル密度を表す。このために、マスキング曲線の逆数が、M(z)の低い値に起因する振幅を制限するように考慮してステップE83で得られ、ステップE84で、
【0148】
【数22】

【0149】
の逆フーリエ変換が典型的な相関係数を与える。
【0150】
マスキング曲線の逆数をモデル化するARフィルタの係数はステップE85でレビンソン-ダービンアルゴリズム
【0151】
【数23】

【0152】
によって生成される。
【0153】
このようにして定義された1-Ag(z)の調整された平均フィルタは分母に係数を有さず、マスキング曲線をモデル化するMAフィルタとなることになる。
【0154】
したがって、この計算の形態は図4のAg1フィルタに適用することができ、Ag2フィルタは0に設定される。
【0155】
第4の整形フィルタ計算の形態が可能である。それは、ブロックに信号を記憶することを必要とせず、したがって、最小遅延の符号化システムを与えるという利点を有する。この形態では、ARMA整形フィルタの係数を勾配アルゴリズムによってサンプルごとに適応させる。例えば、図6で説明されたように入力信号s(n)をモデル化するARMAフィルタの係数が最初に計算される。
【0156】
誤差信号は、信号s(n)の関数として、
【0157】
【数24】

【0158】
によって与えられる。
【0159】
ARMAフィルタ係数適応アルゴリズムはe2(n)の勾配を取ることによって導き出される。
a(k,n)=αDa(k,n-1)+βDe(n)s(n-k) k=1,...,KD (14)
b(k,n)=αNb(k,n-1)+βNe(n)e(n-k) k=1,...,KN (15)
【0160】
信号s(n)をモデル化する係数から、整形フィルタは、s(n)をモデル化するARMAフィルタに重み付けg1およびg2を適用することによって計算され、
【0161】
【数25】

【0162】
が得られる。
【0163】
次に、図9を参照して、本発明の符号化器のもう1つの実施形態を説明する。
【0164】
この実施形態では、2進数フレームとして符号化器の出力において符号ビットおよびセグメント番号を保持し、対応するフレーム構造116とともに図9に示されるように、セグメントに追加の位置を加えることによって、8ビットPCM量子化モジュールは、9、10、またはそれを超えるビットのPCM量子化モジュールに拡張される。各セグメントの位置の数が2倍になる場合、追加のビットが伝送に必要である。
【0165】
図9は、図3、図4、または、図5の実施形態で説明したような雑音整形モジュール33が適応モジュール34とともに使用されるインタリーブPCM量子化の例を示す。
【0166】
インタリーブPCM量子化モジュールQE91は量子化雑音整形帰還ループ内にある。それは、インタリーブ量子化モジュールQEの出力においてEビットのより高いビットレートの符号IEを生成する。量子化雑音は、例えばG.711 PCM量子化モジュールに対応する8個のコアビットのPCM逆量子化モジュール93の出力において整形される。これは、モジュール92によりF個の最下位改善ビットを除去することによって、IEから得られた指数IPCMが供給されなければならない、すなわち、Fは
E=8+F
となるものである。
【0167】
8コアビットのこの逆量子化モジュールは、8ビットの最小コアビットレートを有するコア逆量子化モジュールと呼ぶことができる。
【0168】
本発明のモジュール33によって与えられる量子化雑音重み付け関数は、このコア逆量子化モジュールから入ってくる量子化雑音に適用される。
【0169】
復号化器では、受け取った量子化指数フレームI'Eが逆量子化モジュールQE-1101によって復号化され、より高いビットレートの復号化信号
【0170】
【数26】

【0171】
が生成される。
【0172】
E-1ビットのビットレートでの演算がシグナリングされる場合(復号化器におけるSd、すなわちビットレートシグナリングの場合)、I'Eの最下位改善ビットはマスクされ、それによりE-1ビットの指数I'E-1が与えられる。この演算はステップ102で演算部S1によってシグナリングされる。
【0173】
E-1ビットの出力
【0174】
【数27】

【0175】
は、指数I'E-1が供給される逆量子化モジュールQE-1-1103の出力において得られ、同様にSFまで続けられるが、ここで、E-8改善ビットはステップ104の演算SFによって除去されて、指数I'PCMを生成し、それは8ビットPCM逆量子化モジュールの出力
【0176】
【数28】

【0177】
を生成する。伝送のいかなる点でも8PCMビットだけが保持される場合、得られる指数は標準的なPCM復号化器によって復号化することができる。
【0178】
したがって、量子化雑音整形が有効であることはz変換によって示すことができる。信号
【0179】
【数29】

【0180】
の式は、
【0181】
【数30】

【0182】
であり、ここで、図4の整形の構成が採用される場合、Mask(z)は、
【0183】
【数31】

【0184】
によって与えられる。
【0185】
高ビットレート信号
【0186】
【数32】

【0187】
は、
【0188】
【数33】

【0189】
によって与えられることになり、ここで、QF(z)は、
QF(z) = QPCM(z) - QE(z) (20)
のように、量子化モジュールQPCMの出力信号と量子化モジュールQEの出力信号との間の差に等しい。
【0190】
次に、図10を参照して、図9を参照して説明した実施形態への改良である変形を説明する。
【0191】
図9の構成では、式19は、信号
【0192】
【数34】

【0193】
は、非インタリーブで最適な量子化モジュールに関連する寄生項(parasitic term)ParE(z)の
ParE(z) = [1-Mask(z)]QF(z) (21)
を含むことを示している。
【0194】
低PCMビットレートでは、最適構成が該当し、式17に寄生項が存在しないことに留意されたい。
【0195】
復号化器において寄生項を再構成することができるためには、モジュール111が再構成信号のうちの1つに基づいてフィルタを適応させることが必要である。
【0196】
【数35】

【0197】
は常に存在しているので、整形フィルタを適応させるためにその信号を選ぶことが自然である。
【0198】
図9の符号化器と図10の符号化器との間の唯一の差は、符号化器110では整形フィルタが、信号
【0199】
【数36】

【0200】
に基づいてフィルタ111に適応され、この信号がすべての場合に存在するということである。
【0201】
整形フィルタは、さらに、復号化器において、信号
【0202】
【数37】

【0203】
に基づいてモジュール108によって適応され、この信号はすべてのビットレート構成において利用可能である。伝送誤りがないときは、フィルタの適応は符号化器および復号化器において正確に同じになることになる。
【0204】
復号化器のインタリーブ部分は、図9で説明された復号化器から、
【0205】
【数38】

【0206】

【0207】
【数39】

【0208】
との間の差が供給されるCork(z)フィルタの出力から得られた修正項を使用して逆量子化モジュールの出力を変更することによって得られ、kは関係する量子化モジュールのビットの数であり、
【0209】
【数40】

【0210】
は逆量子化モジュールkの出力である。したがって、修正項は、CorE(z)用のステップ106、CorE-1(z)用のステップ107などで復号化器に導入される。
【0211】
修正フィルタは、
Cork(z) = [1 - Mask(z)][QPCM(z) - Qk(z)] (22)
によって与えられる。
【0212】
次に、図11を参照して、インタリーブ構成の符号化器の本発明のもう1つの実施形態を説明する。
【0213】
この場合、雑音整形は高ビットレート量子化で実行される。この図において、符号化器120のインタリーブ量子化モジュールQE121は量子化雑音整形帰還ループ内にある。それは、Eビットのより高いビットレートのインタリーブ量子化モジュールQEの出力において符号IEを生成する。量子化雑音は、指数IEが供給される、9、10、またはそれを超えるビットの逆量子化モジュールQE-1122の出力に基づいて整形される。
【0214】
復号化器において、受け取った指数I'Eは逆量子化モジュール(テーブル)QE-1101によって復号化され、より高いビットレートの復号化信号
【0215】
【数41】

【0216】
を生成する。
【0217】
E-1ビットのビットレートでの演算がシグナリングされる場合(復号化器におけるSd、すなわちビットレートシグナリングの場合)、I'Eの最下位改善ビットはステップ102の演算S1によってマスクされ、それによりE-1ビットの指数I'E-1が生成される。
【0218】
E-1ビットの出力
【0219】
【数42】

【0220】
は、指数I'E-1が供給される逆量子化モジュールQE-1-1103の出力において得られ、同様にSFまで続けられるが、ここで、E-8ビットは除去されて、指数I'PCMを与え、それは逆8ビットPCM量子化モジュールの出力
【0221】
【数43】

【0222】
を生成する。
【0223】
z変換を使用して、信号
【0224】
【数44】

【0225】
は、
【0226】
【数45】

【0227】
によって与えられることを示すことができる。
【0228】
PCM量子化モジュールの出力信号は、
【0229】
【数46】

【0230】
によって与えられることになり、ここで、QF(z)は、逆量子化モジュール
【0231】
【数47】

【0232】
の出力と逆PCM量子化モジュール
【0233】
【数48】

【0234】
との間の送信器における差である。
【0235】
この場合、PCM量子化モジュールの出力において、IEの最下位ビットが除去されてしまっており、したがって、この項を除去することはできないので、項QF(z)は一般に分からない。したがって、逆PCM量子化構成で生成された雑音は、雑音成分QF(z)(実際には白色雑音)と整形された雑音成分[1 - Bp(z)]QE(z)との和によって部分的に整形されることになる。
【0236】
明らかに、量子化雑音は、コアビットレートとより高いビットレートとの間の中間のビットレートについて同様に整形することができる。
【0237】
図12は、ビット獲得を備えたインタリーブPCM量子化の例を与える。図3、図4、または、図5の実施形態で説明されたような雑音整形モジュール33が適応モジュール34と共に保持される。
【0238】
インタリーブPCM量子化モジュールQPCM91は量子化雑音整形帰還ループ内にある。それは、インタリーブ量子化モジュールQPCMの出力においてビットレート8ビットの符号IPCMを生成する。G.711 PCM符号は当然インタリーブ符号である。セグメントに関する1、2、または3の位置のビットを「獲得する」ことが可能である。したがって、これらのビットを使用して補助情報、例えば4kHzから6kHz以上の追加帯域を符号化するための品質改善ビットを伝送することができる。したがって、IPCMのK=1、2、または、3のK個の最下位ビットは、データビットと取り替えられて指数I8を与えることになる。量子化雑音は、K個の最下位ビットをマスクすることによってIPCMから得られた指数IPCM-Kによって供給される8−Kビットの逆PCM量子化モジュールQPCM-K93の出力に基づいて形成される。
【0239】
再度、この8−Kビット逆量子化モジュールは、8−Kビットの最小コアビットレートを有するコア逆量子化モジュールと呼ぶことができる。
【0240】
本発明のモジュール33によって与えられる量子化雑音重み付け関数は、このコア逆量子化モジュールからの量子化雑音に適用される。
【0241】
その代わりに、ビット獲得は符号化器の外側のモジュール92で実行することができる。次に、量子化雑音はG.711 QPCM出力のために整形される。
【0242】
復号化器において、復号化器が標準的なPCM復号化器である場合、量子化指数I'8の受信したフレームは逆量子化モジュール
【0243】
【数49】

【0244】
101によって復号化され、復号化信号
【0245】
【数50】

【0246】
が与えられる。指数I'8は標準的なPCM復号化器によって意識されずに復号化される。最下位ビットは、もしあれば、付加的な符号化雑音に反映される(データに使用されたビットごとに6dBが失われる)が、品質は本発明の雑音整形のおかげで許容可能なままであり、初期のシステムとの上位互換性が維持される。
【0247】
さらに、新しい復号化器が利用可能であり、ビットレート情報Svがネットワークによって伝送されて来ている場合、データビットは、例えば広帯域品質改善層の使用のために回復することができる。
【0248】
補助的な方法では、指数I'8のk個の最下位ビットをマスクすることができ、その後、PCM復号化を実行し、その効果は雑音をわずかに低減することになる。PCMビット獲得は、どの程度量子化雑音整形が8−Kビット信号の再生の品質を改善するかに比例してよりいっそう利点となる多くの用途を有することに留意されたい。
【符号の説明】
【0249】
10、31 ・・・ 量子化モジュール
11 ・・・ 伝送チャネル
12、32、93、101、103、122 ・・・ 逆量子化モジュール
13、30、40、50、110、120 ・・・ 符号化器
14 ・・・ 復号化器
33 ・・・ 量子化雑音整形モジュール
34 ・・・ 適応モジュール
42、44 ・・・ フィルタ
51、56 ・・・ 整形フィルタ
91 ・・・ インタリーブPCM量子化モジュール
116 ・・・ フレーム構造
121 ・・・ インタリーブ量子化モジュール

【特許請求の範囲】
【請求項1】
入力オーディオ信号を符号化する方法であって、前記入力オーディオ信号は中間帰還信号と組み合わされて修正された入力信号を形成し、前記方法は、所定のビットレートの量子化指数の2進数フレーム(IE)を生成する、前記修正された入力信号を量子化するビットレートを拡張可能なステップ(91)を含み、
再生信号
【数1】

を決定するために、前記所定のビットレートよりも低いビットレートの指数(IPCM)に対応する前記2進数フレームの量子化指数のうちのいくつかを逆量子化する(93)ステップと、
少なくとも一連の前記量子化するステップおよび前記逆量子化するステップによって生成された量子化雑音(QPCM(z))を決定する(94)ステップと、
前記再生信号
【数2】

から量子化雑音のフィルタ関数を決定する(111)ステップと、
前記中間帰還信号を得るために前記フィルタ関数を前記量子化雑音に適用する(33)ステップと、
をさらに含むことを特徴とする方法。
【請求項2】
前記ビットレートを拡張可能な量子化のステップは、ITU-T標準G.711のA-lawまたはμ-lawと相互運用性を有するPCM符号化型のコア符号化に対応する少なくともコアビットレートの量子化指数を供給することを特徴とする請求項1に記載の方法。
【請求項3】
前記中間帰還信号は、前記量子化雑音(QPCM)の予測(42)およびフィルタ処理された量子化雑音(QfPCM)の予測(44)から計算され、
前記フィルタ処理された量子化雑音は、前記中間信号と前記量子化雑音(QPCM)とを加算する(43)ことによって得られることを特徴とする請求項1または2に記載の方法。
【請求項4】
前記量子化雑音のフィルタ関数は、前記入力信号の周期性の特性から計算されることを特徴とする請求項1から3のいずれか一項に記載の方法。
【請求項5】
前記所定のビットレートの拡張可能な量子化のステップは、前記ITU-T標準G.711のA-lawまたはμ-lawと相互運用性を有するPCMスカラー量子化のステップであり、
前記所定のビットレートよりも低いビットレートの指数の逆量子化のステップは、再生信号
【数3】

を決定するために前記2進数フレームの8−Kビットに適用され、Kビットデータを挿入するステップがさらに実行されることを特徴とする請求項1に記載の方法。
【請求項6】
オーディオ信号の拡張可能な復号化の方法であって、
再生信号を形成するために第1のビットレートすなわちコアビットレートの量子化指数を復号化する第1の逆量子化モジュールと、
より高いビットレートの再生信号を形成するために、復号化するときに受信したビットレートに応じて実行される、前記コアビットレートよりも高い第2のビットレートの量子化指数を復号化する第2の逆量子化モジュールと、
を含む方法において、
前記コアビットレートの再生信号と前記より高いビットレートの再生信号との間の差信号を得るモジュールと、
前記再生コアビットレート信号から修正フィルタ関数を決定するモジュールと、
修正項を得るために前記差信号に前記修正フィルタ関数を適用することが可能なフィルタモジュールと、
前記修正項と前記再生信号のうちの1つとを組み合わせることが可能な、より高いビットレートで修正再生信号を合成するモジュールと、
をさらに含むことを特徴とする方法。
【請求項7】
前記修正項が前記コアビットレートの再生信号に適用されることを特徴とする請求項6に記載の方法。
【請求項8】
前記修正項が前記より高いコアビットレートの再生信号に適用されることを特徴とする請求項6に記載の方法。
【請求項9】
符号化するときのビットの挿入に関する情報を受信するステップを含み、
Kビットに関する挿入情報の場合、前記コアビットレートの第1の逆量子化の前に、前記挿入されたKビットをマスクするステップが実行されることを特徴とする請求項6に記載の方法。
【請求項10】
修正された入力信号を形成するために入力オーディオ信号(S(z))を中間帰還信号と組み合わせる組み合わせモジュールと、所定のビットレートの量子化指数の2進数フレームを生成するために前記修正された入力信号を量子化するビットレートを拡張可能な量子化モジュール(91)と、を含む入力オーディオ信号の符号化器であって、
再生信号
【数4】

を決定するために、前記所定のビットレートよりも低いビットレートの指数に対応する2進数フレームの量子化指数のうちのいくつかを逆量子化するモジュール(93)と、
少なくとも一連の前記量子化および前記逆量子化によって生成された量子化雑音(QPCM(z))を決定するモジュール(94)と、
前記再生信号
【数5】

から量子化雑音のフィルタ関数を決定するモジュール(111)と、
前記中間帰還信号を得るために、前記フィルタ関数を前記量子化雑音に適用するモジュール(33)と、
をさらに含むことを特徴とする符号化器。
【請求項11】
再生信号
【数6】

を形成するために第1のビットレートすなわちコアビットレートで量子化指数を復号化する第1の逆量子化モジュール(105)と、
より高いビットレートの再生信号を形成するために、復号化するときに受信したビットレートに応じて実行される、前記コアビットレートよりも高い第2のビットレートで量子化指数を復号化する第2の逆量子化モジュールと、
を含むオーディオ信号の復号化器であって、
前記コアビットレートの再生信号
【数7】

と前記より高いビットレートの再生信号
【数8】

との間の差信号(QF(z))を取得するモジュールと、
前記コアビットレートの再生信号
【数9】

から修正フィルタ関数を決定するモジュール(108)と、
修正項を得るために前記差信号に前記修正フィルタ関数を適用するモジュール(106)と、
前記修正項と前記再生信号
【数10】

のうちの1つとを組み合わせることによって、より高いビットレートで、修正された再生信号を合成するモジュールと、
をさらに含むことを特徴とする復号化器。
【請求項12】
符号化器または復号化器のメモリに、かつ/または、前記符号化器または前記復号化器の読み取り器と協働するように構成された記憶媒体に記憶されるコンピュータプログラムであって、前記コンピュータプログラムが前記符号化器または前記復号化器のプロセッサによって実行されるとき、請求項1から5のいずれか一項に記載の符号化方法、および/または、請求項6から8のいずれか一項に記載の復号化方法のステップを実行するための命令コードを含むコンピュータプログラム。

【図1】
image rotate

image rotate

【図2】
image rotate

image rotate

【図2b】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate


【公表番号】特表2010−532489(P2010−532489A)
【公表日】平成22年10月7日(2010.10.7)
【国際特許分類】
【出願番号】特願2010−511709(P2010−511709)
【出願日】平成20年6月13日(2008.6.13)
【国際出願番号】PCT/FR2008/051059
【国際公開番号】WO2009/004227
【国際公開日】平成21年1月8日(2009.1.8)
【出願人】(591034154)フランス・テレコム (290)
【Fターム(参考)】