説明

オーディオ信号の復号化方法及び装置

【課題】1つ以上の正弦パルスを用いる階層型正弦パルスコーディングによって符号化されたオーディオ信号を復号化するにあたって、平滑化を行う周波数帯域を可変的に設定することにより、復号化にかかる演算量を減らし、合成された信号の品質を高めることができるオーディオ信号の復号化方法及び装置を提供すること。
【解決手段】1つ以上の正弦パルスを用いる階層型正弦パルスコーディングによって符号化されたオーディオ信号を復号化する方法であって、前記符号化されたオーディオ信号を復号化するステップと、前記階層型正弦パルスコーディングの階層構造によって、復号化されたオーディオ信号の平滑化周波数帯域を設定するステップと、前記平滑化周波数帯域を1つ以上のサブ帯域に分けるステップと、前記サブ帯域別に前記復号化されたオーディオ信号を平滑化するステップとを含むことを特徴とする。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、オーディオ信号の復号化方法及び装置に関し、より詳細には、1つ以上の正弦パルス(sinusoidal pulse)を用いる階層型正弦パルスコーディング(Layered Sinusoidal Pulse Coding)によって符号化されたオーディオ信号を復号化する方法及び装置に関する。
【0002】
本発明は、知識経済部のIT成長動力技術開発事業の一環として行った研究から導き出されたものである[課題管理番号:2008-S-011-02、課題名:FMCアコーステック融合コーデック及び制御技術研究(標準化連繋)]。
【背景技術】
【0003】
通信技術の発達にともない、データ伝送のための帯域幅が増加しつつ、高品質通信サービスに対するユーザの要求が次第に増加している。高品質の音声及びオーディオ通信サービスを提供するためには、音声及びオーディオ信号を効果的に圧縮(符号化)し、復元(復号化)することができるコーディング技術が必須である。
【0004】
今までの通信サービスは、狭帯域コーデックが中心として開発されてきたが、VoIPの活性化によって広帯域コーデックに対する関心も高まっている。最近では、1つのコーデックで狭帯域(NarrowBand:NB, 300-3,400Hz)、広帯域(WideBand:WB, 50-7,000Hz)、及び超広帯域(SuperWideBand:SWB, 50-14,000Hz)信号を処理する拡張コーデック技術に対する研究が活発に進められている。ITU-T G.729.1は、代表的な拡張コーデックであり、狭帯域コーデックであるG.729を基盤とする広帯域拡張コーデックである。このコーデックは、8kbit/sでG.729とビットストリームレベルの互換性を提供し、12kbit/sでは、より向上した品質の狭帯域信号を提供する。そして、14kbit/sから32kbit/sでは、2kbit/sのビット率拡張性を有して広帯域信号をコーディングし、ビット率の増加にともない、出力信号の品質も良くなるという特性を有する。
【0005】
このような拡張コーデックでは、帯域幅とビット率拡張性提供のために、一般的に階層型コーディング構造を採択する。階層型コーディング構造では、周波数帯域に応じて互いに異なるコーディング方式を適用することができる。一般的に、上位階層では、音声以外の信号に対する性能を高めるために、周波数領域コーディング方式を適用する。周波数領域変換方式としては、主に、MDCTが用いられ、MDCT係数コーディングには、gain-shape VQ、AVQ、そして、正弦パルスコーディングアルゴリズムなどが用いられる。
【発明の概要】
【発明が解決しようとする課題】
【0006】
本発明は、上記のような従来技術の問題を解決するために提案されたものであって、その目的は、1つ以上の正弦パルスを用いる階層型正弦パルスコーディングによって符号化されたオーディオ信号を復号化するにあたって、平滑化を行う周波数帯域を可変的に設定することにより、復号化にかかる演算量を減らし、合成された信号の品質を高めることができる方法及び装置を提供することにある。
【0007】
本発明の目的は、以上で言及した目的に制限されず、言及されていない本発明の他の目的及び長所は下記の説明によって理解され得るし、本発明の実施形態によってより明らかに理解され得るであろう。また、本発明の目的及び長所は、特許請求の範囲に表した手段及びその組み合わせによって実現され得ることが容易に分かるであろう。
【課題を解決するための手段】
【0008】
そこで、上記の目的を達成するための本発明のオーディオ信号の復号化方法は、1つ以上の正弦パルスを用いる階層型正弦パルスコーディングによって符号化されたオーディオ信号を復号化する方法であって、前記符号化されたオーディオ信号を復号化するステップと、前記階層型正弦パルスコーディングの階層構造によって、復号化されたオーディオ信号の平滑化周波数帯域を設定するステップと、前記平滑化周波数帯域を1つ以上のサブ帯域に分けるステップと、前記サブ帯域別に前記復号化されたオーディオ信号を平滑化するステップとを含むことを特徴とする。
【0009】
また、上記の目的を達成するための本発明のオーディオ信号の復号化装置は、1つ以上の正弦パルスを用いる階層型正弦パルスコーディングによって符号化されたオーディオ信号を復号化する装置であって、前記符号化されたオーディオ信号を復号化する復号化部と、前記階層型正弦パルスコーディングの階層構造によって、復号化されたオーディオ信号の平滑化周波数帯域を設定する平滑化周波数帯域設定部と、前記平滑化周波数帯域を1つ以上のサブ帯域に分け、前記サブ帯域別に前記復号化されたオーディオ信号を平滑化する平滑化部とを備えることを特徴とする。
【発明の効果】
【0010】
本発明によれば、1つ以上の正弦パルスを用いる階層型正弦パルスコーディングによって符号化されたオーディオ信号を復号化するにあたって、平滑化を行う周波数帯域を可変的に設定することにより、復号化にかかる演算量を減らし、合成された信号の品質を高めることができるという長所がある。
【図面の簡単な説明】
【0011】
【図1】従来の狭帯域コーデックとの互換性を提供する超広帯域拡張コーデックの構造を示す図である。
【図2】G.729.1の埋め込み階層型ビットストリーム形式を示す図である。
【図3】本発明の実施形態に係るオーディオ信号復号化装置の構造を示す図である。
【図4】本発明の実施形態に係るオーディオ信号復号化方法を示したフローチャートである。
【図5】7〜14kHzに該当する280個のMDCT係数を符号化するために、2つの階層にわたって正弦パルスコーディングを適用した例を示す図である。
【図6A】本発明によるオーディオ復号化方法を行わなかったときの信号を示す図である。
【図6B】本発明によるオーディオ復号化方法を行ったときの信号を示す図である。
【図7】本発明の他の実施形態に係るオーディオ信号復号化方法を示したフローチャートである。
【発明を実施するための形態】
【0012】
前述した目的、特徴及び長所は、添付された図面を参照して詳細に後述され、これにより、本発明の属する技術分野における通常の知識を有した者が本発明の技術的思想を容易に実施できるであろう。本発明を説明するにあたって、本発明と関連した公知技術に対する具体的な説明が本発明の要旨を不要に濁す可能性があると判断される場合には詳細な説明を省略する。以下、添付された図面を参照して、本発明に係る好ましい実施形態を詳細に説明する。図面において、同じ参照符号は同一または類似した構成要素を指すものとして用いられる。
【0013】
図1は、従来の狭帯域コーデックとの互換性を提供する超広帯域拡張コーデックの構造を示す。一般的に、拡張コーデックは、入力信号を複数個の周波数帯域に分離した後、各周波数帯域の信号を符号化または復号化する構造を有する。図1に示すように、入力された信号は、1次低帯域通過フィルタ102及び1次高帯域通過フィルタ104によってフィルタリングされる。1次低帯域通過フィルタ102は、フィルタリング及びダウンサンプリングを行って、入力信号のうち、低帯域信号A(0〜8kHz)を出力する。そして、1次高帯域通過フィルタ104は、フィルタリング及びダウンサンプリングを行って、入力信号のうち、高帯域信号B(8〜16kHz)を出力する。
【0014】
1次低帯域通過フィルタ102から出力された低帯域信号Aは、2次低帯域通過フィルタ106及び2次高帯域通過フィルタ108に入力される。2次低帯域通過フィルタ106は、フィルタリング及びダウンサンプリングを行って、低−低帯域信号A1(0〜4kHz)を出力し、2次高帯域通過フィルタ108は、フィルタリング及びダウンサンプリングを行って、低−高帯域信号A2(4〜8kHz)を出力する。
【0015】
つまり、狭帯域コーディングモジュール110は、低−低帯域信号A1をコーディングし、広帯域拡張コーディングモジュール112は、低−高帯域信号A2及び低−低帯域信号A1のうち、狭帯域コーディングモジュール110が表現できなかった信号をコーディングする。そして、超広帯域拡張コーディングモジュール114は、高帯域信号B及び低帯域信号Aのうち、狭帯域コーディングモジュール110と広帯域拡張コーディングモジュール112とが表現できなかった信号をコーディングする。したがって、狭帯域コーディングモジュール110の出力信号のみを復号化する場合には、狭帯域信号を合成することができ、3つのモジュールの出力信号を全て復号化する場合には、超広帯域信号を合成することができる。
【0016】
図1のような可変帯域拡張コーデックの代表的な例として、狭帯域コーデックであるG.729を基盤とする階層型構造のITU-T G.729.1を挙げることができる。図2は、G.729.1の埋め込み階層型ビットストリーム形式を示す。G.729.1は、計12個の階層で構成されるが、階層1では、8kbit/sのビット率でG.729とビットストリームレベルとで互換性を提供し、階層2(12kbit/s)では、階層1より良い品質の狭帯域信号を提供する。そして、階層3(14kbit/s)から階層12(32kbit/s)では、広帯域信号をコーディングするが、ビット率を2kbit/s単位に変更することができ、階層(ビット率)の増加にともない、合成された信号の品質も良くなる。
【0017】
このような可変帯域拡張コーデックでは、周波数帯域に応じて同じコーディング方式または異なるコーディング方式を適用することができる。例えば、狭帯域信号は、階層1と2でACELP(Algebraic Code Excited Linear Prediction)方式でコーディングし、階層1と2で表現できなかった狭帯域信号及び低−高帯域信号は、MDCT(Modified Discrete Cosine Transform)領域に変換してコーディングすることができる。また、高帯域信号は、MDCT領域に変換してコーディングすることができる。
【0018】
MDCT領域コーディング方式の場合、時間領域信号にMDCT変換を適用した後、得られたMDCT係数に関する情報をコーディングする。このとき、MDCT係数を複数個のサブ帯域に分けて、各サブ帯域のgainとshapeをコーディングしたり、ACELPまたは正弦パルスコーディング方式などを利用してコーディングしたりする。正弦パルスコーディングでは、合成された信号の品質に影響を与えるMDCT係数の位置、大きさ、及び符号情報をコーディングする。
【0019】
一般的に、可変帯域拡張コーデックでは、複数個のビット率を提供するために、階層構造のコーディング方式を取る。例えば、狭帯域コーデックで処理できなかった信号と高−低帯域信号をコーディングするのに計20kbit/sの信号を用いる場合、一度に20kbit/sを用いるのではなく、各階層当たり2kbit/sの信号を分けて割り当てる。これにより、2kbit/s単位でビット率を制御できるようになる。2kbit/sずつ複数の階層に分けてコーディングする場合、周波数帯域を複数個のサブ帯域に分けた後、一部のサブ帯域を2kbit/sで符号化することができ、全体周波数帯域を2kbit/sで符号化した後、再度誤差信号を求めて、2kbit/sで符号化することもできる。コーデックの構造、計算量、音質などを考慮して適した方式が選択され得る。
【0020】
前述した可変帯域拡張コーデックの例のように、正弦パルスコーディング技法を利用して信号をモデリングするとき、ビット率が制限されているならば、人間の聴覚特性を考慮してサブ帯域別の重要度に応じてビット割当を異にすることができる。このような構造は、ビット率対比音質の側面で非常に効率的であるが、ビットが相対的に少なく割り当てられたサブ帯域で量子化エラーが発生すれば、量子化ステップ差による音質劣化が起こる可能性が大きい。特に、周波数の全帯域で時間軸変化度が少ない信号、例えば、ピアノ、バイオリンなどの楽器信号を正弦パルスコーディングする場合、全帯域にわたったパルスの符号、大きさ、及び位相の時間軸変化度が極めて少なくなければならない。しかし、ビット割当が少なく、量子化ステップが大きい特定サブ帯域で量子化エラーが発生すれば、合成信号全体の音質が劣化され得る。
【0021】
時間軸不連続性のため、合成信号の音質劣化が予測される場合、時間軸平滑化技法または時間軸変化特性を反映したコーディング技法を利用して不連続性を補償し、音質を向上させる。正弦パルスコーディング方式で時間軸変化特性を反映した技法の例として、信号をDamped Sinusoidでモデリングし、Sliding Window ESPRIT(Estimation of Signal Parameter via Rotational Invariance Techniques)技法を利用して時間軸変化特性を推定する方法がある。Damped Sinusoidモデリング技法は、一例の楽器信号が最初音が発生した後、次第に減殺していくという仮定下において、信号を正弦パルスと減殺パラメータとでモデリングする方法である。そして、Sliding Window ESPRIT技法は、隣接した分析フレームとの相関関係に基づいて、減殺パラメータベクトルを推定する方法である。
【0022】
時間軸連続性がある信号のサブ帯域別特性を反映して正弦パルスコーディングをする場合、特に、前述した可変帯域拡張コーデックの例のように、サブ帯域別ビット割当を異にする場合に、従来方式のように、全帯域信号を一括的に平滑化する技法を適用するようになると、場合によって不要なサブ帯域まで平滑化される恐れがあり、結果的に、音質の低下を誘発する可能性がある。特に、サブ帯域別の時間軸変化特性が異なる信号では、このような音質劣化が目立って現れる。前述したDamped Sinusoidモデリング技法のように、時間軸変化特性をサブ帯域別に推定できる技法を利用すれば、従来の平滑化方法が有する短所を解決し、音質の向上を図ることができるが、演算複雑度が大きく増加するという短所がある。
【0023】
本発明は、このような問題点を解決するためのものであって、1つ以上の正弦パルスを用いる階層型正弦パルスコーディングによって符号化されたオーディオ信号を復号化するにあたって、平滑化を行う周波数帯域を可変的に設定することにより、復号化にかかる演算量を減らし、合成された信号の品質を高めることができる方法及び装置に関するものである。
【0024】
低い演算複雑度が求められる場合、演算複雑度が高い従来の時間軸モデリング技法は利用しづらい。また、時間軸連続性を有するオーディオ信号を符号化するとき、従来の全帯域一括平滑化方法を利用すれば、音質が劣化され得る。したがって、本発明は、演算量の増加を最小化しつつ、従来の平滑化方法で発生可能な量子化エラーによる不連続性を防止して、合成信号の品質を高めることを目的とする。
【0025】
本発明のオーディオ復号化方法及び装置は、可変帯域拡張コーデック及び階層型正弦パルスコーディング方法を利用して符号化されたオーディオ信号に適用される。以下で説明する本発明の実施形態は、図1に示された可変帯域拡張コーデックを用いて符号化されたオーディオ信号を復号化する場合を仮定して説明される。このとき、図1のコーデックに入力されるオーディオ信号の高帯域信号は、超広帯域拡張コーディングモジュール114でMDCTによってMDCT係数に変換され、このMDCT係数は、複数個のサブ帯域に分けられた後、gain及びshapeのコーディングによって全体高帯域信号に合成される。そして、合成信号の品質に影響を及ぼすMDCT係数をより正確に表現するために、入力されたオーディオ信号と前述したgain及びshapeを用いて合成された信号との差異を表す差異信号(residual signal)を正弦パルス(sinusoidal pulse)コーディングする。このときに用いられる正弦パルスコーディングは、4kbit/sまたは8kbit/s単位でビット率の調整が可能な階層型構造を有する。
【0026】
前述した可変帯域拡張コーデックのように、サブ帯域別にビット割当を異にする構造の正弦パルスコーディングを用いる場合、本発明は、復号化時、正弦パルス信号の指定された周波数帯域でサブ帯域別に時間軸による平滑化を行うことにより、最大限演算量を減らしながら、合成された信号の品質を高める。本発明によれば、平滑化を行う周波数帯域を階層構造によって可変的に指定することにより、演算量の減少効果を極大化することができる。
【0027】
図3は、本発明の実施形態に係るオーディオ信号復号化装置の構造を示す。まず、図1のような可変帯域拡張コーデック及び階層型正弦パルスコーディングによって符号化されたオーディオ信号は復号化部302に入力される。復号化部302は、入力された符号化されたオーディオ信号を復号化して出力する。
【0028】
復号化部302から出力された復号化されたオーディオ信号は、平滑化周波数帯域設定部304に入力される。平滑化周波数帯域設定部304は、符号化時に用いられた階層型正弦パルスコーディングの階層構造によって、復号化されたオーディオ信号の平滑化が適用される周波数帯域を設定する。
【0029】
このとき、平滑化周波数帯域設定部304は、前述した階層型正弦パルスコーディングにおいて、入力されたオーディオ信号を符号化するとき、サブ帯域別に割り当てられたビット数によって平滑化周波数帯域を可変的に設定することができる。図1のような可変帯域拡張コーデックを用いてオーディオ信号を符号化するとき、それぞれのサブ帯域をみると、ビット割当が線形的に増加するものではなく、コーディング方式によって非線形的にビット割当が増加したり、任意の時点で収束するようになる。したがって、平滑化周波数帯域設定部304は、平滑化が適用される周波数帯域を設定するとき、符号化時のビット割当方式を反映することができる。すなわち、符号化時、ビット割当が十分になされた帯域には平滑化を適用しないことによって信号の時間軸変化をさらによく表現することができる。
【0030】
また、平滑化周波数帯域設定部304は、符号化されたオーディオ信号の静的特性に応じて平滑化周波数帯域を設定することができる。ここで、符号化されたオーディオ信号の静的特性は、当該オーディオ信号の時間軸変化度の大きさを意味する。
【0031】
平滑化周波数帯域設定部304によって平滑化が適用される周波数帯域が決定されれば、平滑化部306は、決定された平滑化周波数帯域を周波数帯域別特性に応じて1つ以上のサブ帯域に分ける。そして、分けられたサブ帯域別に復号化されたオーディオ信号を平滑化する。このとき、オーディオ信号の符号化に用いられた正弦パルスの符号、利得係数及び位置も平滑化され得る。
【0032】
一方、本発明によるオーディオ信号復号化装置は、遅延バッファー308をさらに備えることができる。遅延バッファー308には、時間軸平滑化のために、以前フレームのオーディオ信号が格納される。平滑化部306は、遅延バッファー308に格納された以前フレームのオーディオ信号を参照して現在フレームのオーディオ信号を平滑化することができる。
【0033】
図4は、本発明の実施形態に係るオーディオ信号復号化方法を示したフローチャートである。まず、1つ以上の正弦パルスを用いる階層型正弦パルスコーディングによって符号化されたオーディオ信号を復号化する(S402)。そして、階層型正弦パルスコーディングの階層構造によって、復号化されたオーディオ信号の平滑化周波数帯域を設定する(S404)。
【0034】
このとき、階層型正弦パルスコーディングでオーディオ信号を符号化するとき、サブ帯域別に割り当てられたビット数に応じて平滑化周波数帯域を可変的に設定することができる。また、符号化されたオーディオ信号の静的特性に応じて平滑化周波数帯域を設定することができる。
【0035】
次いで、設定された平滑化周波数帯域を1つ以上のサブ帯域に分け(S406)、復号化されたオーディオ信号をサブ帯域別に平滑化する(S408)。このとき、予め格納された復号化されたオーディオの以前フレームのオーディオ信号を参照して、現在フレームの復号化されたオーディオ信号を平滑化することができる。また、ステップS408において、オーディオ信号の符号化に用いられた正弦パルスの符号、利得係数、及び位置が平滑化され得る。
【0036】
以下では、図1に示された可変帯域拡張コーデックを用いて高帯域(7〜14kHz)信号をMDCT領域に変換し、正弦パルスコーディングを適用した信号を復号化する実施形態によって本発明のオーディオ信号復号化方法について説明する。
【0037】
図5は、7〜14kHzに該当する280個のMDCT係数を符号化するために、2つの階層にわたって正弦パルスコーディングを適用した例題である。図5において、第1の階層では、正弦パルスの個数N及びコーディング帯域を可変的に設定してコーディングし、第2の階層では、固定されたサブ帯域において固定された個数のパルスを用いてコーディングがなされる。
【0038】
図5のような階層型正弦パルスコーディングによって符号化されたオーディオ信号が入力されて復号化された後、本発明では、次のように平滑化周波数帯域が設定され得る。例えば、第1の階層で正弦パルス個数Nが4である場合、図3の平滑化周波数帯域設定部304は、平滑化周波数帯域を64〜280(8.6〜14kHz)に設定し、N=6である場合、平滑化周波数帯域設定部304は、平滑化周波数帯域を96〜280(9.4〜14kHz)に設定することができる。すなわち、本発明では、上位階層へ行くほど、ビットが十分に割り当てられるサブ帯域が存在し、そのような場合、量子化エラーが除去されるであろうという仮定下で、当該帯域に対する平滑化を排除するものである。これにより、平滑化にかかる演算量を減らすことができるという長所がある。
【0039】
平滑化周波数帯域設定部304が前述した例のように平滑化周波数帯域を設定すれば、平滑化部306は、符号化時に用いられたコーディング方法及びオーディオ信号の特性などを考慮して、設定された平滑化周波数帯域を1つ以上のサブ帯域に分ける。その後、平滑化部306は、サブ帯域別に平滑化を行う。このとき、平滑化部306は、遅延バッファー308に格納された以前フレームの信号を参照して平滑化を行うことができる。ここで、信号の平滑化は、符号を含んだ利得係数の平滑化及びパルス位置の平滑化を全て含む。このように、サブ帯域別に時間軸平滑化を行うことにより、各サブ帯域別の時間軸特性を最大限反映することができ、結果的に、復号化されたオーディオ信号の音質を高めることができる。一方、図4のように、32(0.8Hz)の大きさでサブ帯域が分けられて符号化が行われた場合、平滑化部306は、これと同じ大きさで平滑化周波数帯域をサブ帯域に分けることができる。
【0040】
図6は、本発明によるオーディオ復号化方法を行わなかったときと行ったときとの結果を比較するためのグラフである。図6において、横軸は時間を、縦軸は周波数をそれぞれ示す。図6Aは、本発明によるオーディオ復号化方法を行わなかったときの信号を、図6Bは、本発明によるオーディオ復号化方法が適用された信号を各々示す。図6Aの信号は、楕円で表示された部分で量子化エラーのため、時間軸の不連続性が目立って現れる。しかし、図6Bでは、このような部分が多く除去されて、結果的に音質が向上されたということが分かる。
【0041】
前述したような本発明のオーディオ信号復号化方法及び装置によれば、階層型正弦パルスコーディング方式を利用して符号化されたオーディオ信号を復号化するとき、サブ帯域別のコーディング方式及び信号特性を反映して平滑化周波数帯域を先に設定し、設定された平滑化周波数帯域を1つ以上のサブ帯域に分けた後、サブ帯域別に時間軸に対する平滑化が適用される。これにより、従来の全帯域平滑化方式に比べて演算量が少なくなり、結果的に、合成信号の品質を高めることができる。
【0042】
図7は、本発明の他の実施形態に係るオーディオ信号復号化方法を示したフローチャートである。まず、符号化されたオーディオ信号を受信する(S702)。その後、符号化されたオーディオ信号を復号化する(S704)。
【0043】
次いで、符号化時に符号化されたオーディオ信号に割り当てられたビット数に応じて、復号化されたオーディオ信号の平滑化周波数帯域を設定する(S706)。前述したように、本発明では、上位階層へ行くほど、ビットが十分に割り当てられるサブ帯域が存在し、そのような場合、量子化エラーが除去されるであろうという仮定化で、当該帯域に対する平滑化を排除するものである。これにより、平滑化にかかる演算量を減らすことができるという長所がある。
【0044】
最後に、ステップS706において設定された平滑化周波数帯域に対して復号化されたオーディオ信号を平滑化する(S708)。このとき、ステップS708では、設定された平滑化周波数帯域を1つ以上のサブ帯域に分け、このサブ帯域に対して平滑化を行うことができる。前述したように、サブ帯域別に時間軸平滑化を行うことにより、各サブ帯域別の時間軸特性を最大限反映することができ、結果として、復号化されたオーディオ信号の音質を高めることができる。また、ステップS708において平滑化を行うとき、予め格納された復号化されたオーディオの以前フレームのオーディオ信号を参照して、復号化されたオーディオ信号を平滑化することができる。
【0045】
前述した本発明は、本発明の属する技術分野における通常の知識を有した者にとって、本発明の技術的思想を逸脱しない範囲内で様々な置換、変形、及び変更が可能であるため、前述した実施形態及び添付された図面によって限定されるものではない。
【符号の説明】
【0046】
102 1次低帯域通過フィルタ
104 1次高帯域通過フィルタ
106 2次低帯域通過フィルタ
108 2次高帯域通過フィルタ
110 狭帯域コーディングモジュール
112 広帯域拡張コーディングモジュール
114 超広帯域拡張コーディングモジュール
302 復号化部
304 平滑化周波数帯域設定部
306 平滑化部
308 遅延バッファー

【特許請求の範囲】
【請求項1】
1つ以上の正弦パルスを用いる階層型正弦パルスコーディングによって符号化されたオーディオ信号を復号化する方法であって、
前記符号化されたオーディオ信号を復号化するステップと、
前記階層型正弦パルスコーディングの階層構造によって、復号化されたオーディオ信号の平滑化周波数帯域を設定するステップと、
前記平滑化周波数帯域を1つ以上のサブ帯域に分けるステップと、
前記サブ帯域別に前記復号化されたオーディオ信号を平滑化するステップと
を備えたことを特徴とするオーディオ信号の復号化方法。
【請求項2】
前記平滑化周波数帯域設定ステップは、前記階層型正弦パルスコーディングにおいて、前記オーディオ信号を符号化するとき、サブ帯域別に割り当てられたビット数に応じて、前記平滑化周波数帯域を可変的に設定するステップを含むことを特徴とする請求項1に記載のオーディオ信号の復号化方法。
【請求項3】
前記平滑化周波数帯域設定ステップは、前記符号化されたオーディオ信号の静的特性に応じて、前記平滑化周波数帯域を設定するステップを含むことを特徴とする請求項1に記載のオーディオ信号の復号化方法。
【請求項4】
前記復号化されたオーディオ信号を平滑化するステップは、予め格納された前記復号化されたオーディオの以前フレームのオーディオ信号を参照して、前記復号化されたオーディオ信号を平滑化するステップを含むことを特徴とする請求項1に記載のオーディオ信号の復号化方法。
【請求項5】
前記復号化されたオーディオ信号を平滑化するステップは、前記オーディオ信号の符号化に用いられた正弦パルスの符号、利得係数、及び位置を平滑化するステップを含むことを特徴とする請求項1に記載のオーディオ信号の復号化方法。
【請求項6】
1つ以上の正弦パルスを用いる階層型正弦パルスコーディングによって符号化されたオーディオ信号を復号化する装置であって、
前記符号化されたオーディオ信号を復号化する復号化部と、
前記階層型正弦パルスコーディングの階層構造によって、復号化されたオーディオ信号の平滑化周波数帯域を設定する平滑化周波数帯域設定部と、
前記平滑化周波数帯域を1つ以上のサブ帯域に分け、前記サブ帯域別に前記復号化されたオーディオ信号を平滑化する平滑化部と
を備えたことを特徴とするオーディオ信号の復号化装置。
【請求項7】
前記平滑化周波数帯域設定部は、前記階層型正弦パルスコーディングにおいて、前記オーディオ信号を符号化するとき、サブ帯域別に割り当てられたビット数に応じて、前記平滑化周波数帯域を可変的に設定することを特徴とする請求項6に記載のオーディオ信号の復号化装置。
【請求項8】
前記平滑化周波数帯域設定部は、前記符号化されたオーディオ信号の静的特性に応じて、前記平滑化周波数帯域を設定することを特徴とする請求項6に記載のオーディオ信号の復号化装置。
【請求項9】
前記復号化されたオーディオの以前フレームのオーディオ信号を格納する遅延バッファーをさらに備え、
前記平滑化部は、前記遅延バッファーに予め格納された前記復号化されたオーディオの以前フレームのオーディオ信号を参照して、前記復号化されたオーディオ信号を平滑化することを特徴とする請求項6に記載のオーディオ信号の復号化装置。
【請求項10】
前記平滑化部が、前記オーディオ信号の符号化に用いられた正弦パルスの符号、利得係数、及び位置を平滑化することを特徴とする請求項6に記載のオーディオ信号の復号化装置。
【請求項11】
符号化されたオーディオ信号を受信するステップと、
前記符号化されたオーディオ信号を復号化するステップと、
符号化時、前記符号化されたオーディオ信号に割り当てられたビット数に応じて、復号化されたオーディオ信号の平滑化周波数帯域を設定するステップと、
前記平滑化周波数帯域に対して前記復号化されたオーディオ信号を平滑化するステップと
を備えたことを特徴とするオーディオ信号の復号化方法。
【請求項12】
前記復号化されたオーディオ信号を平滑化するステップは、
前記平滑化周波数帯域を1つ以上のサブ帯域に分けるステップと、
前記サブ帯域別に前記復号化されたオーディオ信号を平滑化するステップと
を含むことを特徴とする請求項11に記載のオーディオ信号の復号化方法。
【請求項13】
前記復号化されたオーディオ信号を平滑化するステップは、予め格納された前記復号化されたオーディオの以前フレームのオーディオ信号を参照して、前記復号化されたオーディオ信号を平滑化するステップを含むことを特徴とする請求項11に記載のオーディオ信号の復号化方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図7】
image rotate

【図6A】
image rotate

【図6B】
image rotate


【公開番号】特開2011−150347(P2011−150347A)
【公開日】平成23年8月4日(2011.8.4)
【国際特許分類】
【出願番号】特願2011−11183(P2011−11183)
【出願日】平成23年1月21日(2011.1.21)
【出願人】(596180076)韓國電子通信研究院 (733)
【氏名又は名称原語表記】Electronics and Telecommunications Research Institute
【住所又は居所原語表記】161 Kajong−dong, Yusong−gu, Taejon korea
【Fターム(参考)】