説明

オーディオ符号化/復号化で知覚的に重み付けするための装置

隣接する第1及び第2サブバンドに分割された周波数バンドで用いる階層オーディオ符号化装置であって、前記符号化装置は、前記周波数バンドの第1サブバンドで原信号を符号化するためのコア符号化装置(305)と、前記原信号と前記コア符号化装置からの信号とから残余信号(e)を計算するための段階(306)と、前記残余信号(e)を知覚的に重み付けするための装置(307)とを含む。本発明によると、前記知覚重み付け装置は、利得補償を備える前記知覚重み付けフィルタの出力信号と第2サブバンドの信号との間でスペクトルの連続性を実現するよう適合された利得補償を備える知覚重み付けフィルタ(307)を含む。用途は、オーディオ周波数の発話、音楽等の信号をデジタル信号として伝送及び記憶することである。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、所定の周波数バンドでオーディオ信号を符号化/復号化するための知覚重み付け装置に関する。また、本発明は、本発明の符号化/復号化装置を含む階層オーディオ符号化装置及び階層オーディオ復号化装置に関する。
【背景技術】
【0002】
本発明は、オーディオ周波数の発話、音楽等の信号を、デジタル信号として伝送及び記憶することに対する特に有利な用途に向けられる。
【0003】
オーディオ周波数の発話、音楽等の信号をデジタル化及び圧縮するための各種技術がある。最も一般的な方法は
・PCM及びADPCM符号化等の“波形符号化”方法
・符号励振線形予測(CELP)符号化等の“パラメータ解析/合成符号化”方法
・“サブバンド又は変換知覚符号化”方法
【0004】
オーディオ周波数信号を符号化するためのこれら従来技術は、W.B. Kleijn及びK.K. Paliwalによる1995年 Elsevier “Speech coding and Synthesis”に記載されている。
【0005】
これに関連して、本発明は、CELP符号化及び変換符号化技術を組込む予測変換符号化方法に特に向けられる。
【0006】
従来の発話に対する符号化では、符号化装置は、固定ビットレートでビットストリームを生成する。この固定ビットレートによる制約は、“コーデック”と組み合わせて一般に称される符号化装置及び復号化装置の実装及び使用を単純にしている。そのようなシステムの例は、毎秒64キロビット(kbps)のITU-T G.711符号化システム、8kbpsのUIT-T G.729符号化システム、及び12.2kbpsのGSM-EFR符号化システムである。
【0007】
しかし、携帯電話、ボイスオーバIP及びアドホックネットワーク通信等のいくつかの用途では、予め設定される可変ビットレートでビットストリームを生成するのが好ましい。従って、固定ビットレートより柔軟性のある多数のビットレート符号化技術は、以下の点で優れている。
・AMR-NB、AMR-WB、SMV及びVMR-WBシステムで用いるソース及び/又はチャンネル制御マルチモード符号化
・コアビットレートと一つ以上のエンハンスメントレイヤとを含むという意味で階層的なビットレートを生成する“スケーラブル”符号化としても知られる階層符号化
48kbps、56kbps及び64kbpsのG.722システムは、ビットレートスケーラブル符号化の簡単な一例である。MPEG-4CELPコーデックは、ビットレート及びバンド幅がスケーラブルであり、そのようなコーデックの他の例は、B. Kovesi、D. Massaloux、A. Sollaudによる2004年 ICASSPでの文献“A Scalable Speech and Audio Coding Scheme with Continuous Bitrate Flexibility”に記載されている。
・多重記述符号化
【0008】
本発明は、特に階層符号化に関する。
【0009】
階層即ち“スケーラブル”オーディオ符号化の基本概念は、例えばY.Hiwasaki、T.Mori、H.Ohmuro、J.Ikedo、D.Tokumono及びA.Kataokaらによる2004年3月、NTT Technical Review “Scalable Speech Coding Technology for High-Quality Ubiquitous Communications”で説明されている。
【0010】
このタイプの符号化において、ビットストリームは、ベースレイヤ又はコアレイヤと一つ以上のエンハンスメントレイヤとを含む。ベースレイヤは、低い固定ビットレートでコア“コーデック”として知られるコーデックによって生成され、最小レベルの符号化品質をほぼ保証し、復号化装置によって受信される必要があり、従って好ましい品質レベルを維持することができる。
【0011】
エンハンスメントレイヤは、品質を高めるのに使用され、復号化装置によって全て受信されないことがある。階層符号化の主な利点は、ビットレートがビットストリームを単に切断することによって調節できる点である。レイヤの許容数、即ちビットストリームの許容切断数は、符号化の粒度(coding granularity)を定める。符号化の粒度が強い場合、ビットストリームは、少数のレイヤ(2〜4レイヤのオーダ)を含む一方、細かい符号化の粒度は、例えば1kbpsのオーダの増分を提供する。
【0012】
本発明は特に、電話バンドにおけるCELPタイプのコア符号化装置と一つ以上のワイドバンドエンハンスメントレイヤとを用いた、ビットレート及びバンド幅スケーラブル符号化技術に関する。そのようなシステムの例は、8kbps、14.2kbps及び24kbpsの粗い粒度を備える、H. Taddeiらによる1999年 107th Convention AESの文献“A Scalable Three Bitrate (8、14.2及び24kbps) Audio Coder”で与えられ、B. Kovesiらによる前述の文献は、6.4kbps〜32kbpsの細かい粒度に言及している。
【0013】
2004年、ITU-Tは、階層コア符号化装置標準化計画を立ち上げた。このG.729EV符号化装置(EVは“埋め込み可変ビットレート”を表す)は、周知のG.729符号化装置の増設である。G.729EV標準の目的は、会話サービス用に8kbps〜32kbpsのビットレートで狭いバンド(300hertz(Hz)〜3400Hz)から広いバンド(50Hz〜7000Hz)に及ぶバンドを備える信号を生成するG.729コア階層符号化装置を得ることにある。この符号化装置は、G.729レコメンデーションと相互作用することが基本的に可能であり、既存のボイスオーバIP機器に対する互換性を保証する。
【0014】
図1に示す8kbps〜32kbpsの階層オーディオ符号化装置は、上記計画に応えるために提案され、2005年7月26日〜8月5日、GenevaのStudy Period 2005-2008、Q.10/16 ITU-Tによる文献 COM 16、D135(WP 3/16)“France Telecom G.729EV Candidate; High level description and complexity evaluation”に記載されている。この符号化装置は、カスケードCELP符号化とフルバンド線形予測符号化(LPC)によるバンド拡張と予測変換符号化とを備えた3レイヤ符号化を行う。TDAC(時間領域エイリアシング相殺)符号化は、変形離散コサイン変換(MDCT)の下記用途に適用される。予測変換符号化レイヤは、フルバンド知覚重み付けフィルタ
【0015】
【数1】

を用いる。
【0016】
知覚重み付けフィルタリングによって符号化ノイズを形成する概念は、前述のW.B. Kleijnらによる文献で説明される。現に、知覚重み付けフィルタリングは、ノイズ強度が高くかつノイズがより簡単にマスクできる周波数で信号を減衰することにより、符号化ノイズを形成する。
【0017】
狭いバンドのCELP符号化で最も広く使用される知覚重み付けフィルタは形式が
【0018】
【数2】

であり、ここで0≦γ≦γ<1であり
【0019】
【数3】

は、5ミリ秒(ms)〜30msの長さである信号セグメントのLPCスペクトルを示す。従って、CELP符号化の合成による分析は、このタイプのフィルタによって知覚的に重み付けされた信号領域における2次エラーを最小化することになる。
【0020】
しかし、G.729EV標準化に関連して提案されたこの技術は、フルバンド永久重み付けフィルタを用いるという欠点を有する。関連フィルタリングは、計算時間について比較的複雑である。
【発明の開示】
【発明が解決しようとする課題】
【0021】
従って、本発明の要旨によって解決される技術的課題は、リソースの観点からコストのかかる長い計算をもたらすことなく、フルバンド知覚重み付けフィルタリングを提供する所定の周波数バンドで、即ち前記所定の周波数バンドの全体にわたって、特にワイドバンドである0から8000Hzの階層オーディオ符号化装置で、オーディオ信号を符号化/復号化するための知覚重み付け装置を提供することである。
【課題を解決するための手段】
【0022】
上記技術的課題に対する本発明の解決策とは、前記符号化/復号化は、前記所定の周波数バンドにおける複数の隣接サブバンドで実行され、前記装置は、利得補償を備える知覚重み付けフィルタの出力信号と前記サブバンドに隣接するサブバンドの信号との間でスペクトルの連続性を実現するよう適合された利得補償を備える知覚重み付けフィルタを、少なくとも一つのサブバンドで含むことである。
【0023】
故に、本発明の知覚重み付け装置は、符号化/復号化バンドの全体にわたってではなく、一つ以上のサブバンドにわたって必要なフィルタリングを行い、計算の複雑性を抑える。また、知覚重み付けフィルタリングの利得間における一方のサブバンドから他方のサブバンドへの任意の離間は、利得補償によって除去され、全周波数バンドにわたるスペクトルの連続性を保証する。従って、本発明は、知覚重み付けフィルタリングの後に均一なバンドを生成し、たとえそれを構成するサブバンドが、別に処理された観点からであっても、生成する。
【0024】
これに関する特に重要な利点は、フルバンド変換符号化がサブバンドにわたって適用できることであって、サブバンドは、別々にフィルタ処理されるので均一でない場合がある。
【0025】
もちろん、各サブバンドは、知覚重み付けでフィルタ処理できるか、又はできない。故に、スペクトルの連続性は、フィルタ処理された一方のサブバンドとフィルタ処理されない他方のサブバンドとの間、又はフィルタ処理された2つのサブバンド間に提供されうる。
【0026】
一つの実施形態において、利得補償を備える前記知覚重み付けフィルタは、知覚重み付けフィルタ及び利得補償モジュールを含む。
【0027】
もう一つの実施形態において、利得補償を備える前記知覚重み付けフィルタは、利得補償を組込む知覚重み付けフィルタを含む。
【0028】
第1サブバンドの前記知覚重み付けフィルタは、形式が
【0029】
【数4】

でもよく、ここで
【0030】
【数5】

は、線形予測フィルタを示す。この状況において、本発明は、前記利得補償が以下に定義する関数facによって多重化を行うことを教示し、ここで
【0031】
【数6】

は、線形予測フィルタ
【0032】
【数7】

の係数である。
【0033】
【数8】

【0034】
オーダが、係数が
【0035】
【数9】

の線形予測フィルタ
【0036】
【数10】

は、以下のように定義される。
【0037】
【数11】

【0038】
また、本発明は、隣接する第1及び第2サブバンドに周波数バンドを分割するのに用いる階層オーディオ符号化装置に関し、前記符号化装置は
・前記周波数バンドの第1サブバンドで原信号を符号化するためのコア符号化装置と
・前記原信号と前記コア符号化装置からの信号とから残余信号を計算するための段階と
・前記残余信号を知覚的に重み付けするための装置とを含み、
特に、前記知覚重み付け装置は、利得補償を備える前記知覚重み付けフィルタの出力信号と第2サブバンドの信号との間でスペクトルの連続性を実現するよう適合された利得補償を備える知覚重み付けフィルタを含む。
【0039】
この実施形態において、第1サブバンドのみ、知覚重み付けフィルタリングを受け、第2サブバンドは、フィルタ処理されない。
【0040】
また、前記利得補償された知覚重み付けフィルタが第1サブバンドの知覚重み付けフィルタを含む場合、本発明は、第1サブバンドの前記知覚重み付けフィルタが形式
【0041】
【数12】

であることを教示し、ここで
【0042】
【数13】

は、線形予測フィルタを示す。この状況では、第1サブバンドの利得補償は、以下の関数fac1によって多重化を行う。
【0043】
【数14】

ここで、
【0044】
【数15】

は、線形予測フィルタ
【0045】
【数16】

の係数である。
【0046】
有利な点として、第1サブバンドの知覚重み付け装置からの信号と第2サブバンドの原信号とは、各変換分析モジュールに適用され、前記変換分析モジュールは、前記周波数バンドの変換符号化装置に接続される。
【0047】
本発明の階層オーディオ符号化装置の変形として、前記符号化装置はまた、第2サブバンドの原信号を知覚的に重み付けするための知覚重み付け装置を含み、利得補償を備える知覚重み付けフィルタの出力信号と第1サブバンドの知覚重み付け装置の出力信号との間でスペクトルの連続性を実現するよう適合された利得補償を備える知覚重み付けフィルタを含む。
【0048】
故に、これは、知覚重み付けフィルタリングが2つのサブバンドにおいて別に行われる符号化装置である。
【0049】
利得補償を備える前記知覚重み付けフィルタが第2バンドの知覚重み付けフィルタを含む場合、第2サブバンドの前記知覚重み付けフィルタは、形式が
【0050】
【数17】

であり、ここで
【0051】
【数18】

は、線形予測フィルタを示す。この例において、第2サブバンドの前記利得補償は、以下の関数fac2によって多重化を行う。
【0052】
【数19】

ここで
【0053】
【数20】

は、前記線形予測フィルタの係数である。
【0054】
第1サブバンドの知覚重み付け装置からの信号と第2サブバンドの知覚重み付け装置からの信号とは、各変換分析モジュールに有利に適用され、前記変換分析モジュールは、前記周波数バンドの変換符号化装置に接続される。
【0055】
また、本発明は、隣接する第1及び第2サブバンドに周波数バンドを分割するのに用いる階層オーディオ復号化装置に関し、前記復号化装置は
・本発明の符号化装置によって符号化された受信信号を前記周波数バンドの第1サブバンドで復号化するよう適合されたコア復号化装置と
・前記符号化装置の知覚重み付け装置によって第1サブバンドで重み付けされた残余信号を示す信号を逆知覚重み付けするための逆知覚重み付け装置とを具備し、
前記逆知覚重み付け装置は、第1サブバンドの符号化装置の利得補償を備える知覚重み付けフィルタの逆数である利得補償を備える知覚重み付けフィルタを含む。
【0056】
代わりに、本発明では、前記復号化装置は、第2サブバンドの復号化信号に対する逆近く重み付け装置も含み、第2サブバンドの符号化装置の利得補償を備える知覚重み付けフィルタの逆数である利得補償を備える知覚重み付けフィルタを含むことを教示する。
【0057】
この後者の状況において、利得補償を備える前記知覚重み付けフィルタが第2サブバンドの知覚重み付けフィルタを含む場合、利得補償を備える前記逆知覚重み付けフィルタは、第2サブバンドの逆知覚重み付けフィルタを含む。特に、第2サブバンドの前記逆知覚重み付けフィルタは、形式が
【0058】
【数21】

であり、ここで、線形予測フィルタ
【0059】
【数22】

の係数は、バンド拡張モジュールによって供給される。
【0060】
また、本発明は、所定の周波数バンドでオーディオ信号を符号化する知覚重み付け方法に関し、特に前記符号化は、前記周波数バンドである複数の隣接サブバンドで行われ、前記方法は、利得補償を備える前記知覚重み付け段階からの信号と前記サブバンドに隣接するサブバンドの信号との間でスペクトルの連続性を実現するよう適合された利得補償で知覚重み付けする段階を、少なくとも1つのサブバンドで含む。
【0061】
最後に、本発明は、前記信号を符号化するのに用いる知覚重み付け方法により所定の周波数バンドで符号化されたオーディオ信号を復号化するための知覚重み付け方法に関し、特に前記方法は、利得補償を備える前記知覚重み付け段階の逆数である利得補償を備える知覚重み付け段階を、前記サブバンドで含む。
【発明を実施するための最良の形態】
【0062】
図2は、8kbpsから32kbpsまでのビットレートに対するサブバンド階層オーディオ符号化装置を示す。この図は、その符号化方法における各段階を示す。
【0063】
50Hzから7000Hzまでの“ワイド”周波数バンドで、かつ16kHzでサンプル化された入力信号は先ず、直交ミラーフィルタ(QMF)によって2つの隣接サブバンドに分割される。ローバンドとしても知られる0から4000Hzまでの第1サブバンドは、低域通過(L)フィルタリング300とデシメーション301とによって得られ、ハイバンドとしても知られる4000から8000Hzまでの第2サブバンドは、高域通過(H)フィルタリング302とデシメーション303とによって得られる。好ましい実施形態では、Lフィルタ300及びHフィルタ302は、長さが64であり、1980年 ICASSP vol. 5 pp. 291-294 J. Johnstonによる文献“A filter family designed for use in quadrature mirror filter banks”で説明されている。
【0064】
第1サブバンドは、ナローバンドCELPコア符号化装置305による符号化前に、50Hzを下回る成分を除去する高域通過フィルタ304によって前処理される。高域通過フィルタリングは、ワイドバンドが50Hzから7000Hzまでの範囲に及ぶものとして定義される事実を考慮に入れる。この実施形態では、ナローバンドCELP符号化は、図1に示す符号化に相当し、前処理フィルタのない変形されたG.729符号化(“共役構造代数符号励振線形予測(CS-ACELP)を用いて発話を8kbpsで符号化する”1996年3月 ITU-T推奨のG. 729)を第1段階で用いるカスケードCELP符号化と、追加の固定ディクショナリからなる第2段階とで構成される。CELP符号化で発生するエラーに関係する残余信号eは、段階306で計算され、その後知覚重み付けフィルタを含む装置307によって知覚的に重み付けされ、時間領域信号x10を得て、その信号は、変形離散コサイン変換(MDCT)308を用いて分析され、周波数領域の離散スペクトルX10を得る。
【0065】
図3は、知覚重み付け装置307を示し、W1(z)は、それぞれフィルタリング段階501及び502である
【0066】
【数23】


【0067】
【数24】

とを含む、知覚重み付けフィルタ
【0068】
【数25】

を含む。図2に示す通り、線形予測フィルタ
【0069】
【数26】

は、ナローバンドCELP符号化に基づく。知覚重み付け装置307は、利得補償モジュール503も含み、フィルタ501、502から来る知覚重み付け信号を、以下に定義する関数fac1によって多重化する。
【0070】
【数27】

ここで、
【0071】
【数28】

は、フィルタ
【0072】
【数29】

の係数であり、フィルタは以下のように表される。
【0073】
【数30】

【0074】
好ましい実施形態では、係数
【0075】
【数31】

は、5msサブフレーム毎に更新されγ1=0.96及びγ2=0.6である。
【0076】
関数fac1に等しい定義は、ナイキスト周波数(4kHz)におけるフィルタ
【0077】
【数32】

の利得の逆数に相当し、即ちz=−1で以下のようになる。
【0078】
【数33】

【0079】
第2のサブバンド、即ちハイバンドのスペクトルエイリアシング除去装置309は、先ず高域通過フィルタリング302がデシメーション303と組み合わせて生ずるエイリアシングを補償する。その後、このハイバンドは、7000と8000Hzとの間にある原信号の成分を除去する低域通過フィルタ310によって前処理される。MDCT変換装置311はその後、時間領域の結果信号xhiに適用され、周波数領域の離散スペクトルXhiを得る。その後、バンド拡張装置312は、xhi及びXhiに基づく。
【0080】
信号x10及びxhiは、N個のサンプルからなるフレームに分割され、長さL=2のMDCT変換装置は、現在及び将来のフレームを分析する。好ましい実施形態では、x10及びxhiは、8kHz及びN=160(20ms)でサンプル化されたナローバンド信号である。MDCTは、x10及びxhiを変換するので、N=160個の係数を含み、各係数は、4000/160=25Hzの周波数バンドを示す。好ましい実施形態では、MDCT変換装置は、1991年 ICASSP vol. 3 pp. 2209-2212 P. Duhamel、Y. Mahieux、J. P. Petitらにより記述されたアルゴリズム“A fast algorithm for the implementation of filter banks based on time domain aliasing cancellation”で実行される。
【0081】
ローバンド及びハイバンドMDCTスペクトルX10及びXhiは、変換符号化モジュール313で符号化される。
【0082】
符号化モジュール305、312及び313が生成したビットストリームは、多重化され、マルチプレクサ314で階層ビットストリームへと構築される。
【0083】
符号化は、20msフレーム(即ち320個のサンプルからなるブロック)で行われる。符号化ビットレートは、8kbps、12kbps、14kbpsから32kbpsである。
【0084】
関数fac1による利得補償を用いた知覚重み付け段階の利点は、図4を参照して以下に説明される。
【0085】
その図は、全周波数バンドを第1サブバンド、即ち0から4kHzまでのローバンドと、第2サブバンド、即ち4から8kHzまでのハイバンドとに分割することを示す。好ましい実施形態では、MDCT符号化装置313は
・ローバンドのMDCT変換装置に適用する前の知覚重み付けフィルタリングW1(z)及び利得補償
・知覚重み付けフィルタリングがないハイバンドの直接MDCT変換
が行われた、これら2つのサブバンドに適用される。
【0086】
サブバンドにおけるこれら2つの動作は、ローバンドで
【0087】
【数34】

の振幅応答と、ハイバンドで0dBの平坦応答とによってそれぞれ図4において図式的に示される。後者の平坦応答は、MDCT変換を適用する前にハイバンドで適用される処理がないことを示す。関数fac1による利得補償は
【0088】
【数35】

の振幅応答を、4kHzでの連続性を確実にするためにシフトする。この連続性は、2つの離散スペクトルX10及びXhiを単一ベクトルXへ、後で結合的かつ均一的に符号化できる点でとても重要であり、そのベクトルは、フルバンド離散スペクトルを示す。
【0089】
ローバンドとハイバンドとの間の連続性を定める、ここで用いた値0dBは、単なる例示に過ぎない点に留意すべきである。
【0090】
図2、3及び4を参照して説明した符号化装置に関する階層オーディオ復号化装置は、図5に示され、前記符号化装置によって符号化された信号を復号化する段階を示す。
【0091】
各20msフレームを定義するビットは、デマルチプレクサ700で逆多重化される。実際にビットストリームが8kbps、12kbps、14kbps、又は14kbpsと32kbpsとの間で切断されてもよいが、8kbpsから32kbpsへ復号化する過程は、以下に説明される。
【0092】
8kbps及び12kbpsのレイヤのビットストリームは、CELP復号化装置701によって使用され、0から4000Hzまでの第1サブバンド(ナローバンド)で第1の合成を生成する。14kbpsのレイヤに関するビットストリーム部分は、バンド拡張モジュール702によって復号化され、MDCT変換装置703は、4000Hzから7000Hzまでの第2サブバンド(ハイバンド)で得られた信号に適用され、スペクトル
【0093】
【数36】

を生む。MDCT復号化装置704は、14kbpsから32kbpsまでのビットレートに関するビットストリームから、ローバンドの再構築スペクトル
【0094】
【数37】

と、ハイバンドの再構築スペクトル
【0095】
【数38】

とを生成する。これら2つのスペクトルは、ブロック705及び706で逆MDCT変換を適用することによって、時間領域信号
【0096】
【数39】


【0097】
【数40】

とに変換される。信号
【0098】
【数41】

は、逆知覚重み付け装置707によってフィルタリングした後に加算器708によってCELP合成に追加される。その後、結果値は、709で後続的にフィルタ処理される。
【0099】
16kHzでサンプル化されたワイドバンドの出力信号は、オーバーサンプリング(710及び712)、低域通過フィルタリング(711)、高域通過フィルタリング(713)及び合計(714)を適用する、合成QMFフィルタバンクを用いて得られる。
【0100】
利得補償を用いた知覚復号化の段階は、逆知覚重み付け装置707 W1(z)-1によって行われ、その装置は、逆知覚重み付けフィルタ
【0101】
【数42】

と、利得補償モジュールとを含み、関数1/fac1によって前記逆知覚重み付けフィルタから信号を多重化し、その関数は以下のように現される。
【0102】
【数43】

ここで、
【0103】
【数44】

は、ナローバンドのCELP符号化から生ずるフィルタ
【0104】
【数45】

の係数である。符号化装置と同様に、係数
【0105】
【数46】

は、各5msのサブフレームで一定に維持される。
【0106】
図6は、符号化装置に対する図2の実施形態の変形を示す。
【0107】
この図は、分析フィルタバンク900から903、ローバンドの処理であるブロック904から908、ハイバンドの前処理であるブロック909から910、MDCT符号化装置913及びマルチプレクサ915を示す。
【0108】
この変形実施形態と図2の実施形態との間の主な違いは、線形予測(LPC)分析と第2サブバンド(ハイバンド)の量子化との導入である。ハイバンドで量子化されたLPC係数
【0109】
【数47】

は、バンド拡張モジュール911によって供給される。LPCベースのバンド拡張は、本発明の範囲外なのでここで詳細に説明しない。これらLPC係数によって、MDCT変換913の前に装置912による利得補償W2(z)を用いた知覚重み付けフィルタリングを可能にする。従って、この変形実施形態は、ローバンドの差分信号eとハイバンドの信号xhiとの知覚重み付けを意味する一方、上記の実施形態は、ローバンドの作動信号eのみを予め知覚的に重み付けしている。
【0110】
この変形実施形態では、ハイバンドの利得補償W2(z)を用いた知覚重み付け装置912は、ローバンドのフィルタW1(z)と同じ形式をとる。従って、利得補償関数fac2は、
【0111】
【数48】

というタイプのフィルタに対して後続的であり、以下のように定義される。
【0112】
【数49】

ここで、
【0113】
【数50】

は、フィルタ
【0114】
【数51】

の係数であり、そのフィルタは、以下のように表せる。
【0115】
【数52】

ここで、γ´1=0.96 γ´2=0.6
【0116】
この関数は、z=1、即ち周波数が0Hzであるか、又は実際4kHzに相当するハイバンドのDC成分の周波数がQMFフィルタリング前の入力信号の周波数に戻るとき
【0117】
【数53】

に相当する。
【0118】
2つのサブバンドに利得補償を用いた知覚重み付けの利点は、図8を参照して以下に説明され、ローバンド(0から4kHz)とハイバンド(4kHzから8kHz)とに分割されることを示す。ここで、変形実施形態を考慮すると、MDCT符号化装置は
・ローバンドのMDCT前にフィルタリングW1(z)し
・ハイバンドのMDCT前にフィルタリングW2(z)した
これら2つのサブバンドに適用される。
【0119】
これら2つのサブバンド動作はそれぞれ、ローバンドの
【0120】
【数54】

の振幅応答と、ハイバンドの
【0121】
【数55】

の振幅応答とによって示される。
【0122】
各関数fac1及びfac2によるロー及びハイバンドの利得補償は、4kHzにおけるフィルタの応答の連続性を保証する。この連続性により、2つの離散スペクトルX10及びXhiは、単一ベクトルで後続的に符号化されうる。また、ロー及びハイバンド間の連続性を定める、ここで使用される値0dBは、単なる例示である点に留意すべきである。
【0123】
この変形実施形態に相当する階層オーディオ復号化装置は、図7に示される。上記の実施形態の復号化装置と比較して異なる点は、バンド拡張モジュール1002が用いる量子化LPC係数
【0124】
【数56】

の回復、及び信号
【0125】
【数57】

への逆知覚重み付けフィルタ
【0126】
【数58】

の適用だけである。ハイバンドで用いる逆フィルタリング
【0127】
【数59】

は、関数1/fac2による利得補償が後に続く
【0128】
【数60】

のタイプであり、ここでfac2は、上記定義した通りである。
【0129】
本発明は、コンピュータ又は専用装置によって実行する媒体に記憶された一連の命令を含むコンピュータプログラムに及び、特にそれら命令の実行によって、符号化及び/又は復号化する本発明の知覚重み付け方法を実行する。
【0130】
上記コンピュータプログラムは、例えば本発明の知覚重み付け装置にインストールされた、直接実行可能なプログラムである。
【0131】
勿論、本発明は、上記説明した実施形態に限定されない。特に
・パラメータγ1、γ2、γ´1及びγ´2の数値は、上記選択値と異なってもよく;
・補償関数は、
【0132】
【数61】

フィルタリングの前、又は
【0133】
【数62】


【0134】
【数63】

フィルタリングとの間に適用されるか、又は
【0135】
【数64】

若しくは
【0136】
【数65】

フィルタリングに組込まれてもよく;同じことが関数fac2及び対応逆フィルタについて言え
・知覚重み付けフィルタは、形式が
【0137】
【数66】

である必要はなく;
・2つより多いサブバンドは、全周波数バンドで定義されてもよい;点に留意すべきである。
【図面の簡単な説明】
【0138】
【図1】図1は、変換符号化の前におけるフルバンド知覚重み付けフィルタリングを実行する、従来の階層オーディオ符号化装置の図である。
【図2】図2は、本発明の階層オーディオ符号化装置のハイレベル図である。
【図3】図3は、図2の符号化装置の知覚重み付け装置に関する図である。
【図4】図4は、本発明に従い、第1のサブバンドでフィルタ処理されて利得補償された信号の振幅と、第2のサブバンドでフィルタ処理されない信号の振幅とを表すスペクトルを示す。
【図5】図5は、本発明の階層オーディオ復号化装置のハイレベル図である。
【図6】図6は、図2の階層オーディオ符号化装置の変形図である。
【図7】図7は、図5の階層オーディオ復号化装置の変形図である。
【図8】図8は、本発明に従い、第1のサブバンドでフィルタ処理されて利得補償された信号の振幅と、本発明に従い、第2のサブバンドでフィルタ処理されて均一にされた信号の振幅とを表すスペクトルを示す。
【符号の説明】
【0139】
301 高域通過
310 低域通過
313 14〜32kbit/s MDCT符号化装置

【特許請求の範囲】
【請求項1】
所定の周波数バンドでオーディオ信号を符号化/復号化するための知覚重み付け装置であって、
前記符号化/復号化は、前記所定の周波数バンドにおける複数の隣接サブバンドで実行され、
前記装置は、利得補償を備える知覚重み付けフィルタの出力信号と前記サブバンドに隣接するサブバンドの信号との間でスペクトルの連続性を実現するよう適合された利得補償を備える知覚重み付けフィルタ(307)を、少なくとも一つのサブバンドで含むことを特徴とする装置。
【請求項2】
利得補償を備える前記知覚重み付けフィルタ(307)は、知覚重み付けフィルタ(501、502)と利得補償モジュール(503)とを含むことを特徴とする請求項1に記載の装置。
【請求項3】
前記利得補償モジュール(503)は、前記知覚重み付けフィルタ(501、502)の出力に配置されることを特徴とする請求項2に記載の装置。
【請求項4】
前記利得補償モジュールは、前記知覚重み付けフィルタの入力に配置されることを特徴とする請求項2に記載の装置。
【請求項5】
利得補償を備える前記知覚重み付けフィルタは、利得補償を組込む知覚重み付けフィルタを含むことを特徴とする請求項1に記載の装置。
【請求項6】
前記知覚重み付けフィルタは、形式が
【数1】

であり、ここで
【数2】

は、線形予測フィルタを示し、0≦γ≦1及び0≦γ≦1であることを特徴とする請求項2〜5のうち何れか1項に記載の装置。
【請求項7】
前記利得補償は、関数fac
【数3】

によって多重化を行い、ここで
【数4】

は、前記線形予測フィルタ
【数5】

の係数であることを特徴とする請求項6に記載の装置。
【請求項8】
隣接する第1及び第2サブバンドに周波数バンドを分割するのに用いる階層オーディオ符号化装置であって、前記符号化装置は、
・前記周波数バンドの第1サブバンドで原信号を符号化するためのコア符号化装置(305;905)と、
・前記原信号と前記コア符号化装置からの信号とから残余信号(e)を計算するための段階(306;906)と、
・前記残余信号(e)を知覚的に重み付けするための装置とを具備し、
前記知覚重み付け装置は、利得補償を備える知覚重み付けフィルタの出力信号と第2サブバンドの信号との間でスペクトルの連続性を実現するよう適合された利得補償を備える知覚重み付けフィルタ(307;907)を含むことを特徴とする装置。
【請求項9】
利得補償を備える前記知覚重み付けフィルタ(307)は、第1サブバンドの知覚重み付けフィルタ(501、502)を含むことを特徴とする請求項8に記載の符号化装置。
【請求項10】
第1サブバンドの前記知覚重み付けフィルタ(501、502)は、形式が
【数6】

であり、ここで
【数7】

は、線形予測フィルタを示し、0≦γ≦1及び0≦γ≦1であることを特徴とする請求項9に記載の符号化装置。
【請求項11】
第1サブバンドの利得補償は、関数fac1
【数8】

によって多重化を行い、ここで
【数9】

は、前記線形予測フィルタ
【数10】

の係数であることを特徴とする請求項10に記載の符号化装置。
【請求項12】
前記線形予測フィルタの係数は、前記コア符号化装置(305)によって供給されることを特徴とする請求項10又は11に記載の符号化装置。
【請求項13】
第1サブバンドの知覚重み付け装置(307)からの信号と第2サブバンドの原信号とは、各変換分析モジュール(308、311)に適用され、前記変換分析モジュールは、前記周波数バンドの変換符号化装置(313)に接続されることを特徴とする請求項8〜12のうち何れか1項に記載の符号化装置。
【請求項14】
前記符号化装置は、第2サブバンドの原信号を知覚的に重み付けするための知覚重み付け装置をさらに含み、知覚重み付け装置は、利得補償を備える知覚重み付けフィルタ(912)の出力信号と第1サブバンドの知覚重み付け装置(907)の出力信号との間でスペクトルの連続性を実現するよう適合された利得補償を備える知覚重み付けフィルタ(912)を具備することを特徴とする請求項8〜13のうち何れか1項に記載の符号化装置。
【請求項15】
利得補償を備える前記知覚重み付けフィルタ(912)は、第2サブバンドの知覚重み付けフィルタを含むことを特徴とする請求項14に記載の符号化装置。
【請求項16】
第2サブバンドの前記知覚重み付けフィルタは、形式が
【数11】

であり、ここで
【数12】

は、線形予測フィルタを示し、0≦γ´2≦1及び0≦γ´≦1であることを特徴とする請求項15に記載の符号化装置。
【請求項17】
第2サブバンドの前記利得補償は、関数fac2
【数13】

によって多重化を行い、ここで
【数14】

は、前記線形予測フィルタ
【数15】

の係数であることを特徴とする請求項16に記載の符号化装置。
【請求項18】
前記線形予測フィルタの係数は、バンド拡張モジュール(911)によって供給されることを特徴とする請求項16又は17に記載の符号化装置。
【請求項19】
第1サブバンドの知覚重み付け装置(907)からの信号と第2サブバンドの知覚重み付け装置(912)からの信号とは、各変換分析モジュール(908、913)に適用され、前記変換分析モジュールは、前記周波数バンドの変換符号化装置(914)に接続されることを特徴とする請求項14〜18のうち何れか1項に記載の符号化装置。
【請求項20】
前記コア符号化装置(305;905)は、線形予測ベースの符号化装置であることを特徴とする請求項8〜19のうち何れか1項に記載の符号化装置。
【請求項21】
前記コア符号化装置(305;905)は、CELP符号化装置であることを特徴とする請求項20に記載の符号化装置。
【請求項22】
隣接する第1及び第2サブバンドに周波数バンドを分割するのに用いる階層オーディオ復号化装置であって、前記復号化装置は、
・請求項8〜21のうち何れか1項に記載の符号化装置によって符号化された受信信号を前記周波数バンドの第1サブバンドで復号化するよう適合されたコア復号化装置(701;1001)と、
・前記符号化装置の知覚重み付け装置(307;907)によって第1サブバンドで重み付けされた残余信号(e)を示す信号を逆知覚重み付けするための逆知覚重み付け装置とを具備し、
前記逆知覚重み付け装置(707;1008)は、第1サブバンドの符号化装置の利得補償を備える知覚重み付けフィルタ(307)の逆数である利得補償を備える知覚重み付けフィルタを含むことを特徴とする装置。
【請求項23】
前記復号化装置は、第2サブバンドの復号化信号の逆知覚重み付け装置(1007)をさらに含み、逆知覚重み付け装置は、第2サブバンドの符号化装置の利得補償を備える知覚重み付けフィルタの逆数である利得補償を備える知覚重み付けフィルタを具備することを特徴とする請求項22に記載の復号化装置。
【請求項24】
利得補償を備える前記逆知覚重み付けフィルタは、第2サブバンドの逆知覚重み付けフィルタを含むことを特徴とする請求項23に記載の復号化装置。
【請求項25】
第2サブバンドの前記逆知覚重み付けフィルタは、形式が
【数16】

であり、ここで0≦γ´2≦1及び0≦γ´≦1であることを特徴とする請求項24に記載の復号化装置。
【請求項26】
線形予測フィルタ
【数17】

の係数は、バンド拡張モジュール(1002)によって供給されることを特徴とする請求項25に記載の復号化装置。
【請求項27】
所定の周波数バンドでオーディオ信号を符号化する知覚重み付け方法であって、
前記符号化は、前記周波数バンドにおける複数の隣接サブバンドで実行され、
前記方法は、利得補償を備える知覚重み付け段階からの信号と前記サブバンドに隣接するサブバンドの信号との間でスペクトルの連続性を実現するよう適合された利得補償を備える知覚重み付け段階を、少なくとも一つのサブバンドで含むことを特徴とする方法。
【請求項28】
請求項27に記載の方法による所定の周波数バンドで符号化されたオーディオ信号を復号化するための知覚重み付け方法であって、
前記方法は、利得補償を備える知覚重み付け段階の逆数である利得補償を備える知覚重み付け段階を前記サブバンドで含むことを特徴とする方法。
【請求項29】
コンピュータ又は専用装置によって実行する媒体上に記憶された一連の命令を含むコンピュータプログラムであって、
前記命令の実行は、請求項27及び/又は請求項28に記載の知覚重み付け方法を実行することを特徴とするプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公表番号】特表2009−527017(P2009−527017A)
【公表日】平成21年7月23日(2009.7.23)
【国際特許分類】
【出願番号】特願2008−554819(P2008−554819)
【出願日】平成19年2月7日(2007.2.7)
【国際出願番号】PCT/FR2007/050760
【国際公開番号】WO2007/093726
【国際公開日】平成19年8月23日(2007.8.23)
【出願人】(591034154)フランス テレコム (290)
【Fターム(参考)】