音声符号化装置、音声復号化装置及びこれらの方法

【課題】高性能のスケーラブルコーデックを実現すること。
【解決手段】ＬＰＣ分析部５５１は、入力音声３０１に対してコア復号器３０５から得られる合成ＬＰＣパラメータを用いて効率のよい量子化を行い、復号化ＬＰＣ係数を得る。適応符号帳５５２には、コア復号器３０５から得られる適応符号帳の音源符号が格納される。適応符号帳５５２と確率的符号帳５５３は音源サンプルをゲイン調整部５５４へ送る。ゲイン調整部５５４は、それぞれの音源サンプルにコア復号器３０５から得られるゲインパラメータに基づくアンプを乗じた後加算して音源ベクトルを得、そしてそれをＬＰＣ合成部５５５へ送る。ＬＰＣ合成部５５５は、ゲイン調整部５５４で得られた音源ベクトルに対してＬＰＣパラメータを用いたフィルタリングを行い、合成音を得る。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、音声・楽音信号を符号化して伝送する通信システムに使用される音声符号化装置、音声復号化装置及びこれらの方法に関する。
【背景技術】
【０００２】
近年、第３世代携帯電話の普及によりパーソナル音声通信は新たな時代に入った。また、ＩＰ電話等のパケット通信により音声を送るサービスが拡大し、２０１０年にサービスインが予定されている第４世代携帯電話はａｌｌＩＰのパケット通信で通話が行われることにほぼ決まっている。同サービスは異種網間の通信もシームレスに行えるようにするものであり、様々な伝送容量に対応した音声コーデックが求められている。ＥＴＳＩの標準方式ＡＭＲの様に複数の圧縮レートのコーデックを用意しているものもあるが、伝送中に伝送容量を削減したい場合が頻出する異種網間通信では、トランスコーデックによる音質劣化を受けない音声通信が必要となる。そこで近年、世界中のメーカ、キャリア等の研究機関で階層型符号化（スケーラブルコーデック）が研究開発されており、ＩＴＵ−Ｔ標準化でも課題（ＩＴＵ−ＴＳＧ１６、ＷＰ３、Ｑ．９の「ＥＶ」とＱ．１０の「Ｇ．７２９ＥＶ」）となっている。
【０００３】
階層型符号化とは、まずコア符号器にて符号化を行い、次に拡張符号器にてコア符号器で求められた符号に加えればより音質が良くなる拡張符号を求め、これを段階的に重ねてビットレートを上げていくという符号化である。例えば、３つの符号器（コア符号器４ｋｂｐｓ、第１拡張符号器３ｋｂｐｓ、第２拡張符号器２．５ｋｂｐｓ）があれば、４ｋｂｐｓ、７ｋｂｐｓ、９．５ｋｂｐｓの３種類のビットレートの音声を出力することができる。
【０００４】
階層型符号化では、伝送の途中でビットレートを変えることができ、上記３つの符号器により９．５ｋｂｐｓを伝送している途中でコア符号器の４ｋｂｐｓの符号だけを復号化して音声を出力することもでき、コア符号器と第１拡張符号器の７ｋｂｐｓの符号だけを復号化して音声を出力することもできる。したがって、階層型符号化により、トランスコーデックを介すことなく、異種網間通信を行うことができる。
【０００５】
階層型符号化の基本構成にはマルチステージ型とコンポーネント型があり、符号化歪を各符号器で確定できるマルチステージ型の方がコンポーネント型よりも有効である可能性もあり、将来において主流になる可能性がある。
【０００６】
非特許文献１には、ＩＴＵ−Ｔ標準のＧ．７２９をコア符号器にした２階層のスケーラブルコーデックについてそのアルゴリズムが開示されている。非特許文献１には、コンポーネント型について拡張符号器におけるコア符号器の符号の利用方法について示されている。特にピッチ補助についてはその性能の有効性が示されている。
【非特許文献１】片岡章俊、林伸二「Ｇ．７２９を構成要素として用いるスケーラブル広帯域音声符号化」電子情報通信学会論文誌Ｄ−II Ｖｏｌ．Ｊ８６−Ｄ−II Ｎ０．３ｐｐ．３７９―３８７（２００３年３月）
【発明の開示】
【発明が解決しようとする課題】
【０００７】
しかしながら、従来のマルチステージ型の階層型符号化では、下位レイヤ（コア符号器、下位の拡張符号器）の符号を復号化することによって得られる情報の利用方法が確立されていないため、音質が十分に向上しないという問題がある。
【０００８】
本発明はかかる点に鑑みてなされたものであり、高性能のスケーラブルコーデックを実現することができる音声符号化装置、音声復号化装置及びこれらの方法を提供することを目的とする。
【課題を解決するための手段】
【０００９】
上記課題を解決するために、本発明の音声符号化装置は、入力信号をｎ階層（ｎは２以上の整数）の符号化情報で符号化する符号化装置であって、入力信号を符号化して第１階層の符号化情報を生成する基本レイヤ符号化手段と、第ｉ階層（ｉは１以上ｎ−１以下の整数）の符号化情報を復号化して第ｉ階層の復号化信号を生成する第ｉ階層の復号化手段と、前記入力信号と第１階層の復号化信号との差分である第１階層の差分信号あるいは第（ｉ−１）階層の復号化信号と第ｉ階層の復号化信号との差分である第ｉ階層の差分信号を求める加算手段と、第ｉ階層の差分信号を符号化して第（ｉ＋１）階層の符号化情報を生成する第（ｉ＋１）階層の拡張レイヤ符号化手段と、を具備し、前記第（ｉ＋１）階層の拡張レイヤ符号化手段は、前記第ｉ階層の復号化手段の情報を利用して符号化処理を行う構成を採る。
【００１０】
本発明の音声復号化装置は、入力信号をｎ階層（ｎは２以上の整数）の符号化情報を復号化する復号化装置であって、入力した第１階層の符号化情報を復号化する基本レイヤ復号化手段と、第（ｉ＋1）階層（ｉは１以上ｎ−１以下の整数）の符号化情報を復号化して第（ｉ＋１）階層の復号化信号を生成する第ｉ階層の復号化手段と、各階層の復号化信号を加算する加算手段と、を具備し、前記第（ｉ＋１）階層の復号化手段は、前記第ｉ階層の復号化手段の情報を利用して復号化処理を行う構成を採る。
【００１１】
本発明の音声符号化方法は、入力信号をｎ階層（ｎは２以上の整数）の符号化情報で符号化する符号化方法であって、入力信号を符号化して第１階層の符号化情報を生成する基本レイヤ符号化工程と、第ｉ階層（ｉは１以上ｎ−１以下の整数）の符号化情報を復号化して第ｉ階層の復号化信号を生成する第ｉ階層の復号化工程と、前記入力信号と第１階層の復号化信号との差分である第１階層の差分信号あるいは第（ｉ−１）階層の復号化信号と第ｉ階層の復号化信号との差分である第ｉ階層の差分信号を求める加算工程と、第ｉ階層の差分信号を符号化して第（ｉ＋１）階層の符号化情報を生成する第（ｉ＋１）階層の拡張レイヤ符号化工程と、を具備し、前記第（ｉ＋１）階層の拡張レイヤ符号化工程は、前記第ｉ階層の復号化工程の情報を利用して符号化処理を行う方法を採る。
【００１２】
本発明の音声復号化方法は、入力信号をｎ階層（ｎは２以上の整数）の符号化情報を復号化する復号化方法であって、入力した第１階層の符号化情報を復号化する基本レイヤ復号化工程と、第（ｉ＋1）階層（ｉは１以上ｎ−１以下の整数）の符号化情報を復号化して第（ｉ＋１）階層の復号化信号を生成する第ｉ階層の復号化工程と、各階層の復号化信号を加算する加算工程と、を具備し、前記第（ｉ＋１）階層の復号化工程は、前記第ｉ階層の復号化工程の情報を利用して復号化処理を行う方法を採る。
【発明の効果】
【００１３】
本発明によれば、下位レイヤの符号を復号化して得られる情報を上位の拡張符号器で有効に利用することができ、従来性能が出なかったマルチステージ型の階層型符号化でも、コンポーネント型の階層型符号化でも高い性能を得ることができる。
【発明を実施するための最良の形態】
【００１４】
本発明の骨子は、階層型符号化において、下位レイヤ（コア符号器、下位の拡張符号器）の符号を復号化して得られる情報を上位の拡張レイヤの符号化／復号化に利用することである。
【００１５】
ここで、以下の説明では、コアレイヤや拡張レイヤに用いる各符号器、復号器の符号化形態としてＣＥＬＰを用いる。
【００１６】
以下、符号化／復号化の基本アルゴリズムであるＣＥＬＰについて図１、図２を用いて説明する。
【００１７】
まず、ＣＥＬＰの符号化装置のアルゴリズムについて図１を用いて説明する。図１はＣＥＬＰ方式の符号化装置のブロック図である。
【００１８】
まず、ＬＰＣ分析部１０２において、入力音声１０１に対して自己相関分析、ＬＰＣ分析を行ってＬＰＣ係数を得、ＬＰＣ係数の符号化を行ってＬＰＣ符号を得、ＬＰＣ符号を復号化して復号化ＬＰＣ係数を得る。この符号化は、多くの場合、ＰＡＲＣＯＲ係数やＬＳＰやＩＳＰといった量子化しやすいパラメータに変換した後、過去の復号化パラメータを用いた予測やベクトル量子化を用いて量子化を行うことによりなされる。
【００１９】
次に、適応符号帳１０３と確率的符号帳１０４に格納された音源サンプル（それぞれ、「適応コードベクトル」または「適応音源」、「確率的コードベクトル」または「確率的音源」という）の中で指定されたものを取り出し、ゲイン調整部１０５においてそれぞれの音源サンプルに指定のアンプを乗じた後、加算することにより音源ベクトルを得る。
【００２０】
次に、ＬＰＣ合成部１０６において、ゲイン調整部１０５で得られた音源ベクトルを、ＬＰＣパラメータを用いた全極型フィルタによって合成し、合成音を得る。ただし、実際の符号化においては、ゲイン調整前の２つの音源ベクトル（適応音源、確率的音源）に対して、ＬＰＣ分析部１０２で求められた復号化ＬＰＣ係数によってフィルタリングを行ない２つの合成音を得る。これはより効率的に音源の符号化を行うためである。
【００２１】
次に、比較部１０７において、ＬＰＣ合成部１０６で求められた合成音と入力音声の距離を計算し、２つの符号帳からの出力ベクトルとゲイン調整部１０５で乗じるアンプを制御することによって、距離が最も小さくなる２つの音源の符号の組み合わせを探す。
【００２２】
ただし、実際の符号化においては、ＬＰＣ合成部１０６で得られた２つの合成音と入力音声との関係を分析し２つの合成音の最適値（最適ゲイン）の組み合わせを求め、その最適ゲインによってゲイン調整部１０５でゲイン調整されたそれぞれの合成音を加算することにより総合合成音を求め、その総合合成音と入力音声の距離計算を行なうことが一般的である。そして、適応符号帳１０３と確率的符号帳１０４の全ての音源サンプルに対してゲイン調整部１０５、ＬＰＣ合成部１０６を機能させることによって得られる多くの合成音と入力音声との距離計算を行ない、距離が最も小さくなる音源サンプルのインデクスを求める。これにより効率よく２つの符号帳の音源の符号を探索することができる。
【００２３】
また、この音源探索では、適応符号帳と確率的符号帳を同時に最適化するのは必要な計算量が膨大で事実上不可能であるので、１つずつ符号を決めていくというオープンループ探索を行うのが一般的である。すなわち、適応音源だけの合成音と、入力音声を比較することによって適応符号帳の符号を求め、次にこの適応符号帳からの音源を固定して、確率的符号帳からの音源サンプルを制御し、最適ゲインの組み合わせによって多くの総合合成音を求め、それと入力音声を比較することによって確率的符号帳の符号を決定する。以上の手順により、現存の小型プロセッサ（ＤＳＰ等）での探索を実現することができる。
【００２４】
そして、比較部１０７は２つの符号帳のインデクス（符号）と、さらにそのインデクスに対応する２つの合成音と入力音声をパラメータ符号化部１０８へ送る。
【００２５】
パラメータ符号化部１０８は、２つの合成音と入力音声の相関を用いてゲインの符号化を行ってゲイン符号を得る。そして、ＬＰＣ符号、２つの符号帳の音源サンプルのインデクス（音源の符号）をまとめて伝送路１０９へ送る。また、ゲイン符号と音源の符号に対応する２つの音源サンプルとから音源信号を復号化し、それを適応符号帳１０３に格納する。この際、古い音源サンプルを破棄する。すなわち、適応符号帳１０３の復号化音源データを未来から過去にメモリシフトしメモリから出た古いデータは破棄し、未来の空いた部分に復号化で作成した音源信号を格納する。この処理は適応符号帳の状態更新と呼ばれる。
【００２６】
なお、ＬＰＣ合成部１０６における音源探索時のＬＰＣ合成では、線形予測係数や高域強調フィルタや長期予測係数（入力音声の長期予測分析を行なうことによって得られる係数）を用いた聴感重み付けフィルタを使用するのが一般的である。また、適応符号帳１０３と確率的符号帳１０４の音源探索は、分析区間（フレームと呼ばれる）を更に細かく分けた区間（サブフレームと呼ばれる）で行われることが多い。
【００２７】
ここで、上記説明の中で述べた様に、比較部１０７では、ゲイン調整部１０５から得られた適応符号帳１０３、確率的符号帳１０４の全ての音源について、実現可能な計算量で探索を行うため、２つの音源（適応符号帳１０３と確率的符号帳１０４）をオープンループで探索する。その場合、各ブロック（セクション）の役割が上記説明よりも複雑になる。そこで、処理手順について更に詳細に述べる。
（１）まず、ゲイン調整部１０５は適応符号帳１０３からのみ音源サンプル（適応音源）を次々に送りＬＰＣ合成部１０６を機能させて合成音を求め、比較部１０７へ送り入力音声と比較を行なって最適な適応符号帳１０３の符号を選択する。なお、この時のゲインは符号化歪が最も少なくなる値（最適ゲイン）であることを仮定して探索を行う。
（２）そして、適応符号帳１０３の符号を固定して、適応符号帳１０３からは同じ音源サンプルを、確率的符号帳１０４からは比較部１０７の符号に対応した音源サンプル（確率的音源）を次々に選択し、ＬＰＣ合成部１０６へ伝送する。ＬＰＣ合成部１０６は２つの合成音を求め、比較部１０７で両合成音の和と入力音声の比較を行ない確率的符号帳１０４の符号を決定する。なお、上記と同様に、この時のゲインは符号化歪が最も少なくなる値（最適ゲイン）であると仮定して選択を行う。
【００２８】
なお、上記オープンループ探索では、ゲイン調整部１０５のゲインを調整する機能と加算する機能は使用されない。
【００２９】
このアルゴリズムは、それぞれの符号帳の全ての音源の組み合わせを探索する方法と比較して、符号化性能が若干劣化するが、計算量が大幅に削減され実現可能な範囲になる。
【００３０】
このように、ＣＥＬＰは人間の音声の発声過程（声帯波＝音源、声道＝ＬＰＣ合成フィルタ）のモデルによる符号化であり、基本アルゴリズムとしてＣＥＬＰを用いることにより比較的少ない計算量で良好な音質の音声が得られる。
【００３１】
次に、ＣＥＬＰの復号化装置のアルゴリズムについて図２を用いて説明する。図２はＣＥＬＰ方式の復号化装置のブロック図である。
【００３２】
パラメータ復号化部２０２は、伝送路２０１を介して送られたＬＰＣ符号を復号して合成用ＬＰＣパラメータを得てＬＰＣ合成部２０６に送る。また、パラメータ復号化部２０２は、伝送路２０１を介して送られた２つの音源符号を適応符号帳２０３及び確率符号帳２０４へ送り、出力される音源サンプルを指定する。また、パラメータ復号化部２０２は、伝送路２０１を介して送られたゲイン符号を復号化してゲインパラメータを得てゲイン調整部２０５へ送る。
【００３３】
次に、適応符号帳２０３と確率的符号帳２０４は２つの音源符号により指定された音源サンプルを出力し、ゲイン調整部２０５へ送る。ゲイン調整部２０５はパラメータ復号化部２０２から得たゲインパラメータを２つの音源符号帳から得た音源サンプルに乗じて加算することにより音源ベクトルを求め、ＬＰＣ合成部２０６へ送る。
【００３４】
ＬＰＣ合成部２０６は、音源ベクトルに合成用ＬＰＣパラメータを用いたフィルタリングを行って合成音を求め、これを出力音声２０７とする。なお、この合成の後には、合成用パラメータを用いた極強調、高域強調等を行うポストフィルタを用いることが多い。
【００３５】
以上が基本アルゴリズムＣＥＬＰの説明である。
【００３６】
次に、本発明の実施の形態に係るスケーラブルコーデックの符号化装置／復号化装置の構成について図面を用いて詳細に説明する。
【００３７】
なお、本実施の形態ではマルチステージ型スケーラブルコーデックを例として説明を行う。また、階層数としてはコアと拡張の２層の場合について説明する。
【００３８】
また、スケーラブルコーデックの音質を決める符号化形態として、コアレイヤと拡張レイヤを加えた場合で音声の音響的帯域が異なる周波数スケーラブルを例に説明する。この形態は、コアコーデックのみでは音響的周波数帯域が狭い音声が得られるのに対し、拡張部の符号を加えればより広い周波数帯域の高品質の音声が得られることができるというものである。なお、「周波数スケーラブル」を実現するため入力音声や合成音のサンプリング周波数を変換する周波数調整部を使用する。
【００３９】
以下、本発明の実施の形態に係るスケーラブルコーデックの符号化装置の構成について図３を用いて詳細に説明する。
【００４０】
周波数調整部３０２は、入力音声３０１に対してダウンサンプリングを行い、得られる狭帯域音声信号をコア符号器３０３へ送る。ダウンサンプリングの方法は様々あり、低域透過(Low-pass)フィルタを掛けて間引くという方法が一例として挙げられる。例えば、１６ｋＨｚサンプリングの入力音声を８ｋＨｚサンプリングに変換する場合は、４ｋＨｚ（８ｋＨｚサンプリングのナイキスト周波数）以上の周波数成分が極小さくなるような低域透過フィルタを掛け、その後１つ置きに信号をピックアップして（２つに１つを間引いたことになる）メモリに格納することにより８ｋＨｚサンプリングの信号が得られる。
【００４１】
次に、コア符号器３０３は、狭帯域音声信号を符号化し、得られた符号を伝送路３０４とコア復号器３０５へ送る。
【００４２】
コア復号器３０５は、コア符号器３０３で得られた符号を用いて復号を行い、得られた合成音を周波数調整部３０６へ送る。また、コア復号器３０５は、復号の過程で得られるパラメータを必要に応じて拡張符号器３０７へ送る。
【００４３】
周波数調整部３０６は、コア復号器３０５で得られた合成音に対して入力音声３０１のサンプリングレートにまでアップサンプリングを行い、加算部３０９へ送る。アップサンプリングの方法は様々あり、サンプルの間に０を挿入してサンプル数を増やし、低域透過(Low-pass)フィルタによって周波数成分を調整してから、パワーを調整するという方法が一例として挙げられる。例えば、８ｋＨｚサンプリングを１６ｋＨｚサンプリングにアップサンプリングするという場合は、以下の式（１）の様に、まず、１つ置きに０を挿入して信号Ｙjを得、また１つのサンプル当たりの振幅ｐを求めておく。
【００４４】
【数１】

次に、Ｙiに低域透過フィルタを掛け、８ｋＨｚ以上の周波数成分を極めて小さくする。得られる１６ｋＨｚサンプリングの信号Ｚiに対して、以下の式（２）の様に、Ｚiの１つのサンプル当たりの振幅ｑを求め、式（１）で求めた値に近づけるようにゲインをスムーズに調整し、合成音Ｗiを得る。
【００４５】
【数２】

なお、上記でｇの初期値としては、適当な定数（例えば０）を定めておく。
【００４６】
また、周波数調整部３０２、コア符号器３０３、コア復号器３０５、周波数調整部３０６で使用するフィルタとして位相成分がずれるフィルタを用いた場合、周波数調整部３０６では、位相成分も入力音声３０１と合うように調整する必要がある。この方法についてはそれまでのフィルタの位相成分のずれを予め計算し、その逆特性をＷiに掛けることによって位相を合わせる。位相を合わせることにより、入力音声３０１との純粋な差分信号を求めることができ、拡張符号器３０７で効率の良い符号化を行うことができる。
【００４７】
加算部３０９は、周波数調整部３０６で得られた合成音の符号を反転して入力音声３０１と加算する、すなわち、入力音声３０１から合成音を減ずる。加算部３０９は、この処理で得られた音声信号である差分信号３０８を拡張符号器３０７へ送る。
【００４８】
拡張符号器３０７は、入力音声３０１と差分信号３０８を入力し、コア復号器３０５で得られたパラメータを利用して、差分信号３０８の効率的な符号化を行い、得られた符号を伝送路３０４へ送る。
【００４９】
以上が本実施の形態に関わるスケーラブルコーデックの符号化装置の説明である。
【００５０】
次に、本発明の実施の形態に係るスケーラブルコーデックの復号化装置の構成について図４を用いて詳細に説明する。
【００５１】
コア復号器４０２は、伝送路４０１から復号化に必要な符号を取得し、復号化を行って合成音を得る。コア復号器４０２は、図３の符号化装置のコア復号器３０５と同様の復号化機能を持つ。また、コア復号器４０２は、必要に応じて合成音４０６を出力する。なお、この合成音４０６には、聴感的に聞きやすくなるように調整を行うのが有効である。例として、コア復号部４０２で復号されたパラメータを用いたポストフィルタが挙げられる。また、コア復号器４０２は、必要に応じて合成音を周波数調整部４０３へ送る。また、復号化の過程で得られるパラメータを必要に応じて拡張復号器４０４へ送る。
【００５２】
周波数調整部４０３は、コア復号器４０２から得られた合成音に対してアップサンプリングを行い、アップサンプリング後の合成音を加算部４０５へ送る。なお、周波数調整部４０３の機能は図３の周波数調整部３０６と同様であるので、その説明を省略する。
【００５３】
拡張復号器４０４は、伝送路４０１から取得した符号を復号化して合成音を得る。そして、拡張復号器４０４は、得られた合成音を加算部４０５へ送る。この復号化の際には、コア復号器４０２から復号化の過程で得られるパラメータを利用した復号化を行うことにより、良好な品質の合成音を得ることができる。
【００５４】
加算部４０５は、周波数調整部４０３から得られた合成音と、拡張復号器４０４から得られた合成音を加算して合成音４０７を出力する。なお、この合成音４０７には、聴感的に聞きやすくなるように調整を行うことが有効である。例として、拡張復号部４０４で復号されたパラメータを用いたポストフィルタが挙げられる。
【００５５】
以上の様に図４の復号化装置は合成音４０６と合成音４０７の２つの合成音を出力することができる。合成音４０６はコアレイヤから得られる符号のみ、合成音４０７はコアレイヤと拡張レイヤの符号から得られるより良好な品質の合成音声である。どちらを利用するかは本スケーラブルコーデックを使用するシステムが決めることができる。なお、コアレイヤの合成音４０６のみをシステムで利用するのであれば、符号化装置のコア復号器３０５、周波数調整部３０６、加算部３０９、拡張符号器３０７、復号化装置の周波数調整部４０３、拡張復号器４０４、加算部４０５らは省略することができる。
【００５６】
以上がスケーラブルコーデックの復号化装置の説明である。
【００５７】
次に、本実施の形態の符号化装置／復号化装置において、拡張符号器及び拡張復号器がコア復号器から得られるパラメータを利用する方法について詳細に説明する。
【００５８】
まず、図５を用いて、本実施の形態に係る符号化装置の拡張符号器がコア復号器から得られるパラメータを利用する方法について詳細に説明する。図５は、図３のスケーラブルコーデック符号化装置のコア復号器３０５と拡張符号器３０７の構成を示すブロック図である。
【００５９】
まず、コア復号器３０５の機能について説明する。パラメータ復号化部５０１は、コア符号器３０３から、ＬＰＣ符号、２つの符号帳の音源符号、ゲイン符号を入力する。そして、パラメータ復号化部５０１は、ＬＰＣ符号を復号して合成用ＬＰＣパラメータを得、ＬＰＣ合成部５０５及び拡張符号器３０７内のＬＰＣ分析部５５１へ送る。また、パラメータ復号化部５０１は、２つの音源符号を適応符号帳５０２、確率的符号帳５０３及び拡張符号器３０７内の適応符号帳５５２へ送り、出力される音源サンプルを指定する。また、パラメータ復号化部５０１は、ゲイン符号を復号化してゲインパラメータを得、ゲイン調整部５０４及び拡張符号器３０７内のゲイン調整部５５４へ送る。
【００６０】
適応符号帳５０２と確率的符号帳５０３は２つの音源符号により指定された音源サンプルをゲイン調整部５０４へ送る。ゲイン調整部５０４は、パラメータ復号化部５０１から得たゲインパラメータを２つの音源符号帳から得た音源サンプルに乗じて加算し、この処理によって得られた音源ベクトルをＬＰＣ合成部５０５へ送る。ＬＰＣ合成部５０５は、音源ベクトルに合成用ＬＰＣパラメータを用いたフィルタリングを行って合成音を得、周波数調整部３０６へ送る。なお、この合成の際には、用いられることの多いポストフィルタは用いない。
【００６１】
以上のコア復号器３０５の機能により、拡張符号器３０７には、合成用ＬＰＣパラメータ、適応符号帳の音源符号、ゲインパラメータの３種が送られる。
【００６２】
次に、これら３種のパラメータを受けた拡張符号器３０７の機能を説明する。
【００６３】
ＬＰＣ分析部５５１は、入力音声３０１に対して自己相関分析とＬＰＣ分析を行なうことによりＬＰＣ係数を得、また得られたＬＰＣ係数の符号化を行ってＬＰＣ符号を得、また得られたＬＰＣ符号を復号化して復号化ＬＰＣ係数を得る。なお、ＬＰＣ分析部５５１は、コア復号器３０５から得られる合成ＬＰＣパラメータを用いて効率のよい量子化を行う。
【００６４】
適応符号帳５５２と確率的符号帳５５３は２つの音源符号により指定された音源サンプルをゲイン調整部５５４へ送る。
【００６５】
ゲイン調整部５５４は、それぞれの音源サンプルにコア復号器３０５から得られるゲインパラメータを利用して得られたアンプを乗じた後加算して音源ベクトルを得、そしてそれをＬＰＣ合成部５５５へ送る。
【００６６】
ＬＰＣ合成部５５５は、ゲイン調整部５５４で得られた音源ベクトルに対してＬＰＣパラメータを用いたフィルタリングを行うことにより、合成音を得る。ただし、実際の符号化においては、ゲイン調整前の２つの音源ベクトル（適応音源、確率的音源）に対して、ＬＰＣ分析部５５１で得られた復号化ＬＰＣ係数によってフィルタリングを行ない２つの合成音を得て、比較部５５６に送ることが一般的である。これはより効率的に音源の符号化を行うためである。
【００６７】
比較部５５６は、ＬＰＣ合成部５５５で得られた合成音と差分信号３０８の距離を計算し、２つの符号帳からの音源サンプルとゲイン調整部５５４で乗じるアンプを制御することによって、最も距離が近くなる２つの音源の符号の組み合わせを探す。ただし、実際の符号化においては、ＬＰＣ合成部５５５で得られた２つの合成音と差分信号３０８との関係を分析し２つの合成音の最適値（最適ゲイン）の組み合わせを求め、その最適ゲインによってゲイン調整部５５４でゲインの調整をされたそれぞれの合成音を加算して総合合成音を得、その総合合成音と差分信号３０８の距離計算を行なうことが一般的である。そして、適応符号帳５５２と確率的符号帳５５３の全ての音源サンプルに対してゲイン調整部５５４、ＬＰＣ合成部５５５を機能させることによって得られる多くの合成音と差分信号３０８との距離計算を行ない、得られる距離を比較し、最も小さくなる２つの音源サンプルのインデクスを求める。これにより効率よく２つの符号帳の音源の符号を求めることができる。
【００６８】
また、この音源探索においては、適応符号帳と確率的符号帳を同時に最適化するのが計算量的には通常不可能であり、そのために１つずつ符号を決めていくというオープンループ探索を行うのがより一般的である。すなわち、適応音源だけの合成音と差分信号３０８を比較することによって適応符号帳の符号を得、次に、この適応符号帳からの音源を固定して、確率的符号帳からの音源サンプルを制御し、最適ゲインの組み合わせによって多くの総合合成音を得、これと差分信号３０８を比較することによって確率的符号帳の符号を決定する。以上の様な手順により現実的な計算量で探索が実現できる。
【００６９】
そして、２つの符号帳のインデクス（符号）と、さらにそのインデクスに対応する２つの合成音と差分信号３０８をパラメータ符号化部５５７へ送る。
【００７０】
パラメータ符号化部５５７は、２つの合成音と差分信号３０８の相関を用いて最適なゲインの符号化を行なうことによってゲイン符号を得る。そして、ＬＰＣ符号、２つの符号帳の音源サンプルのインデクス（音源の符号）をまとめて伝送路３０４へ送る。また、ゲイン符号と音源の符号に対応する２つの音源サンプルとから音源信号を復号化し、それを適応符号帳５５２に格納する。この際、古い音源サンプルを破棄する。すなわち、適応符号帳５５２の復号化音源データを未来から過去にメモリシフトし、古いデータは破棄し、未来の空いた部分に復号化で作成した音源信号を格納する。この処理は適応符号帳の状態更新（update）と呼ばれる。
【００７１】
次に、拡張符号器３０７におけるコアレイヤから得られる３つのパラメータ（合成ＬＰＣパラメータ、適応符号帳の音源符号、ゲインパラメータ）の利用についてそれぞれ説明する。
【００７２】
まず、合成ＬＰＣパラメータを用いた量子化方法について以下に詳細に説明する。
【００７３】
ＬＰＣ分析部５５１は、まず、周波数の違いを考慮してコアレイヤの合成ＬＰＣパラメータを変換する。図３の符号化装置の説明で述べた様に、コアレイヤと拡張レイヤの周波数成分は異なっている例としてコアレイヤ８ｋＨｚサンプリング、拡張レイヤ１６ｋＨｚサンプリングとすると、８ｋＨｚサンプリングの音声信号から得られる合成ＬＰＣパラメータを、１６ｋＨｚサンプリングへ変更する必要がある。この方法の一例を以下に示す。
【００７４】
合成ＬＰＣパラメータを線形予測分析におけるαパラメータとする。αパラメータは通常自己相関分析によりレビンソン・ダービン法により求められるが、この漸化式による処理は可逆であり、αパラメータは逆変換により自己相関係数に変換できる。そこで、この自己相関係数上においてアップサンプリングを実現すればよい。
【００７５】
自己相関関数を求める元信号をＸiとすると、自己相関関数Ｖjは以下の式（３）で求められる。
【００７６】
【数３】

上記のＸiを偶数番目のサンプルだとすると、以下の式（４）のように書ける。
【００７７】
【数４】

ここで倍のサンプリングに拡大した場合の自己相関関数をＷjとすると、偶数と奇数の次数で異なり、以下の式（５）の様になる。
【００７８】
【数５】

ここで奇数番目のＸを補間するために多層フィルタＰmを用いると上記２つの式（４）、（５）は以下の式（６）の様に変形でき、多層フィルタは偶数番目のＸの線形和により間の奇数番目の値を補間できる。
【００７９】
【数６】

したがって、元の自己相関関数Ｖjが必要な次数分あれば補間により倍のサンプリングの自己相関関数Ｗjに変換できる。そこで得られたＷjに対して再びレビンソン・ダービン法のアルゴリズムを適用することにより拡張レイヤで使用できるサンプリングレート調整を受けたαパラメータが得られる。
【００８０】
ＬＰＣ分析部５５１は、上記変換で求めたコアレイヤのパラメータ（以下、「コア係数」という）を用いて、入力音声３０１から求めたＬＰＣ係数の量子化を行う。ＬＰＣ係数はＰＡＲＣＯＲやＬＳＰ、ＩＳＰ等量子化しやすいパラメータに変換してベクトル量子化（ＶＱ）等により量子化される。ここでは例として以下の２つの量子化形態について説明する。
（１）コア係数との差を符号化する場合
（２）コア係数を含めて予測ＶＱで符号化する場合
【００８１】
まず、（１）の量子化形態について説明する。
【００８２】
まず量子化対象であるＬＰＣ係数を量子化しやすいパラメータ（以下、「ターゲット係数」という）に変換する。次に、ターゲット係数からコア係数を減ずる。なお、両者ともベクトルであるのでベクトルとしての減算である。そして、得られた差分ベクトルをＶＱ（予測ＶＱ、スプリットＶＱ、多段ＶＱ）により量子化する。この時、単に差分を求めるという方法も有効であるが、ただ差分を求めるのでなく、ベクトルの各要素でその相関に応じた減算を行えば、より精度のよい量子化ができる。一例を以下の式（７）に示す。
【００８３】
【数７】

上記式（７）において、βiは予め統計的に求めたものを格納しておき、それを使用する。なお、βi＝１.０に固定するという方法もあるが、その場合は単なる差分になる。相関度の決定は、予め多くの音声データについてスケーラブルコーデックの符号化装置を動かし、拡張符号器３０７のＬＰＣ分析部５５１に入力される多くのターゲット係数とコア係数の相関分析によってなされる。これは以下の式（８）の誤差パワーＥを最小にするβiを求めることにより実現できる。
【００８４】
【数８】

そして、上記を最小化するβiは、Ｅをβiで片微分した式が全てのｉについて０になるという性質から以下の式（９）によって得られる。
【００８５】
【数９】

よって上記のβiを使用して差分を取ればより精度のよい量子化が実現できる。
【００８６】
次に、（２）の量子化形態について説明する。
【００８７】
予測ＶＱとは上記差分後のＶＱと同様で、過去の複数の復号化パラメータを用いて固定の予測係数で積和を取ったものの差分をＶＱするというものである。この差分ベクトルを以下の式（１０）に示す。
【００８８】
【数１０】

上記の「過去の復号化パラメータ」としては、復号化したベクトルそのものを用いる方法と、ＶＱにおけるセントロイドを用いる方法の２つがある。前者の方が予測能力は高いが、前者の方が誤りの伝播が長期に渡るため、後者の方がビット誤りには強い。
【００８９】
そこで、このＹm,iの中に必ずコア係数を含めるようにすれば、コア係数はその時間のパラメータで相関度も高いので、高い予測能力を得ることができ、上記（１）の量子化形態よりも更に高い精度で量子化ができる。例えばセントロイドを用いる場合、予測次数４の場合で以下の式（１１）の様になる。
【００９０】
【数１１】

また、予測係数δm,iは、（１）の量子化形態のβiと同じく、多くのデータについての誤差パワーを各予測係数で片微分した式の値が０になることから求められる。この場合は、ｍについての連立一次方程式を解くことによって求められる。
【００９１】
以上の様にコアレイヤで得られるコア係数を用いることによって効率のよいＬＰＣパラメータの符号化ができる。
【００９２】
なお、予測ＶＱの形態として予測の積和の中にセントロイドを含める場合もある。方法は式（１１）に括弧書きで示したので、説明は省略する。
【００９３】
更に、ＬＰＣ分析部５５１は、符号化により得られた符号をパラメータ符号化部５５７に送る。また、符号を復号化して得られる拡張符号器用の合成用ＬＰＣパラメータを求め、ＬＰＣ合成部５５５へ送る。
【００９４】
なお、上記ＬＰＣ分析部５５１の説明では分析対象を入力音声３０１としたが、差分信号３０８を用いても、同様の方法によって、パラメータ抽出、符号化が実現できる。アルゴリズムは、入力音声３０１を用いた場合と同様であるので、説明は省略する。
【００９５】
従来のマルチステージ型スケーラブルコーデックではこの差分信号３０８を分析対象としていた。しかし、これは差分信号であり、周波数成分として曖昧になるという欠点がある。上記説明で述べた入力音声３０１は、このコーデックへの最初の入力信号であり、これを分析すれば、よりはっきりとした周波数成分が得られる。したがって、これを符号化することにより、より品質の高い音声情報を伝送することができる。
【００９６】
次に、コアレイヤから得られる適応符号帳の音源符号の利用について説明する。
【００９７】
適応符号帳は過去の音源信号が格納されているものであり、毎サブフレームで更新されているダイナミックな符号帳である。その音源符号は、符号化対象である音声信号の基本周期（次元は時間。サンプル数で表される）にほぼ対応しており、入力音声信号（入力音声３０１や差分信号３０８等）と合成音との長期相関を分析することにより符号化される。また、拡張レイヤでは差分信号３０８を符号化するが、コアレイヤの長期相関は差分信号においても残っているという性質があり、コアレイヤの適応符号帳の音源符号を利用することによってより効率的な符号化が可能になる。使用方法としては、差分を符号化するという形態が挙げられる。詳細を説明する。
【００９８】
コアレイヤの適応符号帳の音源符号が８ビットで符号化されているとする。（「０〜２５５」で実際のラグ（遅延量）「20.0〜147.5」、サンプルを「0.5」刻みで表すとする）まず、差分を取るために、まずサンプリングレートを合わせる。具体的にはコアレイヤが８ｋＨｚで、拡張レイヤが１６ｋＨｚサンプリングだとすると２倍すれば拡張レイヤに合う数値になる。したがって、拡張レイヤでは「40〜295」サンプルという数値に変換して用いる。そして、拡張レイヤの適応符号帳の探索は上記数値の近傍で探索する。例えば、上記数値の前後１６候補（「−７〜＋８」まで）の区間のみを探索すれば、４ビットで効率よく符号化でき、計算量も少なくてすむ。また拡張レイヤの長期相関がコアレイヤのそれと同様であるとすれば十分な性能が得られる。
【００９９】
なお、具体的に例を挙げて述べると、コアレイヤの適応符号帳の音源符号が「２０」だとすれば数値としては「４０」であり、これは拡張レイヤでは「８０」に当たる。したがって、４ビットで「７３〜８８」を探索することになる。これは「０〜１５」の符号に相当し、探索結果が「８５」ならば、「１２」が拡張レイヤの適応符号帳の音源符号になる。
【０１００】
このように、コアレイヤの適応符号帳の音源符号の差分を符号化することにより効率的な符号化が可能になる。
【０１０１】
なお、コアレイヤの適応符号帳の音源符号の利用方法として、拡張レイヤのビット数を更に節約したい場合は、その符号をそのまま使用するという方法も挙げられる。この場合、拡張レイヤでは適応符号帳の音源符号は不要（ビット数は「０」）になる。
【０１０２】
次に、コアレイヤから得られるゲインパラメータの利用方法について詳細に説明する。
【０１０３】
なお、コアレイヤでは、パワーを表す情報として音源サンプルに乗ずるパラメータを符号化する。これは上記パラメータ符号化部５５７で得られる最終的な２つの音源サンプル（適応符号帳５５２からの音源サンプルと確率的符号帳５５３からの音源サンプル）の合成音と差分信号３０８との関係から符号化される。本説明では、一例として２つの音源のゲインをＶＱ（ベクトル量子化）により量子化する場合について説明を行う。
【０１０４】
まず、基本アルゴリズムを説明する。
【０１０５】
ゲインが決まると符号化歪Ｅは以下の式（１２）で表される。
【０１０６】
【数１２】

したがって、ｇａとｇｓのベクトルを（ｇａj、ｇｓj）（ｊはベクトルのインデクス（符号）である）とすると、インデクスｊの符号化歪から差分信号３０８（Ｘj）のパワーを引いたものＥjは次の式（１３）の様に変形できる。したがって、式（１３）のＸＡ、ＸＳ、ＡＡ、ＳＳ、ＡＳを予め計算しておき、（ｇａj、ｇｓj）を代入してＥjを求めていき、これが最小になるｊを求めることによりゲインをＶＱできる。
【０１０７】
【数１３】

以上が２つの音源のゲインをＶＱする方法である。
【０１０８】
更に、音源のゲインを更に効率よく符号化するために、相関の高いパラメータを利用して冗長性を削減するという方法を取ることが一般的である。そのパラメータとして従来用いられてきたのは過去に復号化したゲインパラメータである。音声信号のパワーはごく短時間では穏やかに変化するので、時間的に近い復号化ゲインパラメータとは相関が高い。そこで、差分や予測で効率的に量子化することができる。ＶＱの場合は復号化パラメータ、もしくはセントロイドそのものを用いて、差分や予測を行う。前者の方が量子化精度は高いが、後者の方が伝送誤りに強い。なお、「差分」とは、１つ前に復号化したパラメータの差分を求めてそれを量子化することであり、「予測」とは、幾つか前に復号化したパラメータから予測値を求め、その予測値の差分を求めてそれを量子化することである。
【０１０９】
差分は式（１２）のｇａ、ｇｓの部分に以下の式（１４）が代入される。そして、最適なｊの探索が行われる。
【０１１０】
【数１４】

上記重み係数α、βは統計的に求めておくか、１に固定する。求め方についてはＶＱ符号帳と重み係数の順次最適化による学習が挙げられる。すなわち、以下の手順となる。
（１）重み係数を両方とも０として、多くの最適ゲイン（算出される最もエラーを小さくするゲイン。式（１２）をｇａ、ｇｓで片微分した式が０であるとすることによって得られる２元一次連立方程式を解くことにより求められる）を集めてデータベースを作る。
（２）ＬＢＧアルゴリズム等でＶＱのためのゲインの符号帳を求める。
（３）上記符号帳を用いて符号化を行い、重み係数を求める。これは、式（１４）を式（１２）に代入してα、βで片微分することによって得られる式を０とすることによって得られる連立一次方程式を説くことによって求められる。
（４）（３）の重み係数で、ＶＱと、集めたデータでの重み係数の求め直しを繰り返すことによって重み係数を収束させる。
（５）（４）の重み係数を固定して多くの音声データに対してＶＱを行い、最適ゲインからの差分値を集めてデータベースを作る。
（６）（２）に戻る。
（７）（６）までの処理を数回行うと、符号帳も重み係数も収束するので、収束したら一連の学習処理を打ち切る。
【０１１１】
以上が復号化ゲインパラメータとの差分を利用したＶＱによる符号化アルゴリズムの説明である。
【０１１２】
そして、上記方法にコアレイヤから得られるゲインパラメータを利用すると、代入される式は以下の式（１５）になる。
【０１１３】
【数１５】

ここで重み係数を予め求める方法の一例として、上記で説明したゲインの符号帳と重みα、βの求め方に習って求める方法が挙げられる。手順を以下に示す。
（１）重み係数を４つとも０として、多くの最適ゲイン（算出される最もエラーを小さくするゲイン。式（１２）をｇａ、ｇｓで片微分した式が０であるとすることによって得られる２元一次連立方程式を解くことにより求められる）を集めてデータベースを作る。
（２）ＬＢＧアルゴリズム等でＶＱのためのゲインの符号帳を求める。
（３）上記符号帳を用いて符号化を行い、重み係数を求める。これは、式（１５）を式（１２）に代入してα、β、γ、δで片微分することによって得られる式を０とすることによって得られる連立一次方程式を説くことによって求められる。
（４）（３）の重み係数でＶＱと集めたデータでの重み係数の求め直しを繰り返すことによって重み係数を収束させる。
（５）（４）の重み係数を固定して多くの音声データに対してＶＱを行い、最適ゲインからの差分値を集めてデータベースを作る。
（６）（２）に戻る。
（７）（６）までの処理を数回行うと、符号帳も重み係数も収束するので、収束した場合には一連の学習処理を打ち切る。
【０１１４】
以上が復号化ゲインパラメータとコアレイヤから得られるゲインパラメータとの差分を利用したＶＱによる符号化アルゴリズムの説明である。このアルゴリズムにより時間的に同一時間のパラメータであるコアレイヤのパラメータの相関度の高さを活かして、より精度よくゲイン情報を量子化することができる。例えば、音声の語頭の立ち上がりの部分では、過去のパラメータだけでは予測不可能である。しかし、コアレイヤから得られるゲインパラメータにはその立ち上がりのパワーの上昇が既に反映されており、同パラメータの使用は量子化に有効である。
【０１１５】
なお、「予測（線形予測）」を利用した場合も同様である。この場合はα、βの式が過去の数個の復号化ゲインパラメータの式になるという違いのみである（以下の式（１６））ので、その詳細の説明を省略する。
【０１１６】
【数１６】

このようにパラメータ符号化部５５７（ゲイン調整部５５４）でも、適応符号帳５５２、ＬＰＣ分析部５５１と同様に、コアレイヤから得られるゲインパラメータをゲイン調整部５５４で同様に利用して効率的な量子化ができる。
【０１１７】
なお、上記説明においてはゲインのＶＱ（ベクトル量子化）を例に説明を行ったが、スカラ量子化でも同様の効果が得られることは明らかである。なぜなら、スカラ量子化の場合とは式（１３）〜式（１６）で、適応符号帳の音源サンプルのゲインと、確率的符号帳の音源サンプルのゲインのインデクス（符号）が独立な場合であり、ＶＱとは係数のインデクスだけの違いのみであり上記方法から容易に導けるからである。
【０１１８】
ゲインの符号帳作成の際には、適応符号帳の音源サンプルのゲインと、確率的符号帳の音源サンプルのゲインのダイナミックレンジや次元が異なることを考慮して、ゲインの値を変換して符号化を行うことが多い。例として、確率的符号帳のゲインを対数変換してから統計的処理（ＬＢＧアルゴリズム等）を行う方法が挙げられる。また、平均と分散を求め、それらを利用することによって、２つのパラメータのばらつきを考慮して符号化するという工夫を併用すれば更に精度の高い符号化ができる。
【０１１９】
なお、ＬＰＣ合成部５５５における音源探索時のＬＰＣ合成では、線形予測係数や高域強調フィルタや長期予測係数（入力信号の長期予測分析を行なうことによって得られる）を用いた聴感重み付けフィルタを使用するのが一般的である。
【０１２０】
また、上記比較部５５６はゲイン調整部５５４から得られた適応符号帳５５２、確率的符号帳５５３の全ての音源について比較を行なうが、現実的な計算量で探索を行うため、通常は２つの音源（適応符号帳５５２と確率的符号帳５５３）はより計算量の少ない方法で探索することが一般的である。その場合、図５の機能ブロック図とは若干異なってくる。その手順については、図１を用いたＣＥＬＰの基本アルゴリズム（符号化装置）で説明を行ったのでこれを省略する。
【０１２１】
次に、図６を用いて、本実施の形態に係る復号化装置の拡張復号器がコア復号器から得られるパラメータを利用する方法について詳細に説明する。図６は、図４のスケーラブルコーデック復号化装置のコア復号器４０２と拡張復号器４０４の構成を示すブロック図である。
【０１２２】
まず、コア復号器４０２の機能を説明する。パラメータ復号化部６０１は、伝送路４０１から、ＬＰＣ符号、２つの符号帳の音源符号、ゲイン符号を得る。そして、パラメータ復号化部６０１は、ＬＰＣ符号を復号して合成用ＬＰＣパラメータを得、ＬＰＣ合成部６０５及び拡張復号器４０４内のパラメータ復号化部６５１へ送る。また、パラメータ復号化部６０１は、２つの音源符号を適応符号帳６０２、確率的符号帳６０３へ送り、出力される音源サンプルを指定する。また、パラメータ復号化部６０１は、ゲイン符号を復号してゲインパラメータを得、ゲイン調整部６０４へ送る。
【０１２３】
適応符号帳６０２と確率的符号帳６０３は、２つの音源符号により指定された音源サンプルをゲイン調整部６０４へ送る。ゲイン調整部６０４は、パラメータ復号化部６０１から得たゲインパラメータを２つの音源符号帳から得た音源サンプルに乗じて加算し総合音源を得、ＬＰＣ合成部６０５へ送る。また、ゲイン調整部６０４は、総合音源を適応符号帳６０２に格納する。この際、古い音源サンプルを破棄する。すなわち、適応符号帳６０２の復号化音源データを未来から過去にメモリシフトしメモリに入らない古いデータは破棄し、未来の空いた部分に復号化で作成した音源信号を格納する。この処理は適応符号帳の状態更新と呼ばれる。ＬＰＣ合成部６０５は、パラメータ復号化部６０１から合成用ＬＰＣパラメータを得、総合音源に合成用ＬＰＣパラメータを用いたフィルタリングを行って合成音を得る。合成音は周波数調整部４０３へ送られる。
【０１２４】
なお、音声を聞き易くするために、合成音に、合成用ＬＰＣパラメータ、適応符号帳の音源サンプルのゲイン等を用いたポストフィルタを併用することが有効である。この場合、得られたポストフィルタの出力を合成音４０６として出力する。
【０１２５】
以上のコア復号器４０２の機能により、拡張復号器４０４には、合成ＬＰＣパラメータ、適応符号帳の音源符号、ゲインパラメータの３種が送られる。
【０１２６】
次に、これら３種のパラメータを受けた拡張復号器４０４の機能を説明する。
【０１２７】
パラメータ復号化部６５１は、伝送路４０１から、合成ＬＰＣパラメータ、２つの符号帳の音源符号、ゲイン符号を得る。そして、パラメータ復号化部６５１は、ＬＰＣ符号を復号して合成用ＬＰＣパラメータを得、ＬＰＣ合成部６５５へ送る。また、パラメータ復号化部６５１は、２つの音源符号を適応符号帳６５２及び確率的符号帳６５３へ送り、出力される音源サンプルを指定する。また、パラメータ復号化部６５１はゲイン符号とコアレイヤから得たゲインパラメータから最終的なゲインパラメータを復号化し、ゲイン調整部６５４へ送る。
【０１２８】
適応符号帳６５２と確率的符号帳６５３は、２つの音源インデクスにより指定された音源サンプルを出力し、ゲイン調整部６５４へ送る。ゲイン調整部６５４はパラメータ復号化部６５１から得たゲインパラメータを２つの音源符号帳から得た音源サンプルに乗じて加算し総合音源を得、ＬＰＣ合成部６５５へ送る。また総合音源を適応符号帳６５２に格納する。この際、古い音源サンプルを破棄する。すなわち、適応符号帳６５２の復号化音源データを未来から過去にメモリシフトしメモリに入らない古いデータは破棄し、未来の空いた部分に復号化で作成した総合音源を格納する。この処理は適応符号帳の状態更新と呼ばれる。
【０１２９】
ＬＰＣ合成部６５５は、パラメータ復号化部６５１から最終的に復号化されたＬＰＣパラメータを得、総合音源にＬＰＣパラメータを用いたフィルタリングを行い、合成音を得る。得られた合成音は加算部４０５に送られる。なお、この合成の後には、音声を聞き易くするために同ＬＰＣパラメータを用いたポストフィルタを使用することが一般的である。
【０１３０】
次に、拡張復号器４０４におけるコアレイヤから得られる３つのパラメータ（合成ＬＰＣパラメータ、適応符号帳の音源符号、ゲインパラメータ）の利用についてそれぞれ説明する。
【０１３１】
まず、合成ＬＰＣパラメータを用いたパラメータ復号化部６５１の復号化方法について以下に詳細に説明する。
【０１３２】
パラメータ復号化部６５１は、通常、過去の復号化パラメータを用いた予測等を用いて、まずＰＡＲＣＯＲ係数やＬＳＰやＩＳＰといった量子化しやすいパラメータにＬＰＣ符号を復号化し、その後合成フィルタリングに用いる係数に変換する。また、この復号化にはコアレイヤのＬＰＣ符号も用いる。
【０１３３】
本実施の形態では周波数スケーラブルコーデックを例にしており、まず、周波数の違いを考慮してコアレイヤの合成用ＬＰＣパラメータを変換する。図４を用いた復号機側の説明で述べた様に、コアレイヤと拡張レイヤの周波数成分が異なっている例としてコアレイヤ８ｋＨｚサンプリング、拡張レイヤ１６ｋＨｚサンプリングとすると、８ｋＨｚサンプリングの音声信号から得られる合成ＬＰＣパラメータを、１６ｋＨｚサンプリングへ変更する必要がある。この方法については、符号化装置の説明において、ＬＰＣ分析部５５１の式（３）から式（６）を用いた詳細説明で述べたので、これを省略する。
【０１３４】
そして、パラメータ復号化部６５１は、上記変換で求めたコアレイヤのパラメータ（以下、「コア係数」という）を用いて、ＬＰＣ係数の復号化を行う。ＬＰＣ係数は、ＰＡＲＣＯＲやＬＳＰ等量子化しやすいパラメータの形態で、ベクトル量子化（ＶＱ）等により符号化されており、その符号化に対応した復号化を行う。ここでは例として符号化装置と同様に以下の２つの量子化形態について説明する。
（１）コア係数との差を符号化する場合
（２）コア係数を含めて予測ＶＱで符号化する場合
【０１３５】
まず、（１）の量子化形態では、コア係数にＬＰＣ符号の復号化（ＶＱ、予測ＶＱ、スプリットＶＱ、多段ＶＱで符号化されているものの復号化）で得られる差分ベクトルを加算することにより復号する。この時、単に加算するという方法も有効であるが、ベクトルの各要素でその相関に応じた減算よる量子化を用いた場合にはそれに応じた加算を行う。一例を以下の式（１７）に示す。
【０１３６】
【数１７】

上記式（１７）においてβiは予め統計的に求めたものを格納しておき、それを使用する。この相関度は符号化装置と同じ値である。したがってその求め方もＬＰＣ分析部５５１で説明したものと全く同じであるので、その説明を省略する。
【０１３７】
また、（２）の量子化形態では、過去の複数の復号化パラメータを用いて固定の予測係数で積和を取ったものと復号された差分ベクトルとを加算するというものである。この加算を式（１８）に示す。
【０１３８】
【数１８】

上記の「過去の復号化パラメータ」としては、過去に復号した復号化ベクトルそのものを用いる方法と、ＶＱにおけるセントロイド（この場合、過去に復号された差分ベクトルである）を用いる方法の２つがある。そこで、符号器と同様に、このＹm,iの中に必ずコア係数を含めるようにすれば、コア係数はその時間のパラメータで相関度も高いので、高い予測能力を得ることができ、（１）の量子化形態より更に精度の良いベクトルが復号できる。例えばセントロイドを用いる場合、予測次数４の場合で符号化装置（ＬＰＣ分析部５５１）の説明で用いた式（１１）の様になる。
【０１３９】
このようにコアレイヤで得られるコア係数を用いることによって効率のよいＬＰＣパラメータの復号化ができる。
【０１４０】
次に、コアレイヤから得られる適応符号帳の音源符号の利用方法について説明する。使用方法としては、符号化装置と同様に差分を符号化するという例で説明する。
【０１４１】
適応符号帳の音源符号を復号し、差分の部分を得る。また、コアレイヤから音源符号を得る。そしてその２つを加算することにより適応音源のインデクスを求める。
【０１４２】
例を挙げて説明を加える。コアレイヤの適応符号帳の音源符号が８ビットで符号化されていたとする（「０〜２５５」で「20.0〜147.5」を「0.5」刻みで表すとする）。まず、サンプリングレートを合わせる。具体的にはコアレイヤが８ｋＨｚで、拡張レイヤが１６ｋＨｚサンプリングだとすると２倍すれば拡張レイヤに合う数値「40〜295」になる。そして、拡張レイヤの適応符号帳の音源符号を例えば４ビットとする（１６エントリ「−７〜＋８」）。コアレイヤの適応符号帳の音源符号が「２０」だとすれば数値としては「４０」であり、これは拡張レイヤでは「８０」に当たる。したがって、「１２」が拡張レイヤの適応符号帳の音源符号であれば、「８０＋５＝８５」が最終的に復号化された適応符号帳のインデクスになる。
【０１４３】
このように、コアレイヤの適応符号帳の音源符号を利用することによって復号化がなされる。
【０１４４】
なお、コアレイヤの適応符号帳の音源符号の利用方法として、拡張レイヤのビット数に強い制限がある場合は、その符号をそのまま使用するという方法も挙げられる。この場合、拡張レイヤでは適応符号帳の音源符号は不要になる。
【０１４５】
次に、ゲインパラメータを用いたパラメータ復号化部６５１のゲインの求め方について詳細に説明する。
【０１４６】
符号化装置の説明では、相関の高いパラメータを利用して冗長性を削減するという方法の例として、「差分」と「予測」を挙げて説明を行った。そこで、復号化装置の説明でもこの２つの場合に対応する復号化方法を述べる。
【０１４７】
「差分」による符号化を行った場合の２つのゲインｇａ、ｇｓは以下の式（１９）で求められる。
【０１４８】
【数１９】

上記重み係数は符号器と同じものであり、予め適当な値に固定するか学習によって求めた値が用いられる。学習により求める方法については符号化装置の説明で詳細に説明したので、これを省略する。
【０１４９】
また、「予測（線形予測）」による符号化を行った場合も同様である。この場合は、α、βの式が過去の数個の復号化ゲインパラメータを用いた式になるという違いのみである（以下の式（２０）に示す）ことから、その復号化方法は上記説明から容易に類推できるので、詳細の説明を省略する。
【０１５０】
【数２０】

なお、上記説明においてはゲインのＶＱを例に説明を行ったが、ゲインのスカラ量子化でも同様の処理で復号できる。これは、２つのゲイン符号が独立な場合に相当し、上記説明の係数のインデクスのみの違いであり、復号化方法は上記説明から容易に類推できる。
【０１５１】
以上のように、本実施の形態によれば、下位レイヤの符号を復号化して得られる情報を上位の拡張符号器で有効に利用することができ、従来性能が出なかったマルチステージ型の階層型符号化でも、コンポーネント型の階層型符号化でも高い性能を得ることができる。
【０１５２】
なお、本発明は、マルチステージ型に限らず、コンポーネント型でも下位レイヤの情報を利用できる。それは入力の種類の違いに本発明が影響しないからである。
【０１５３】
また、本発明は、周波数スケーラブルでない場合（周波数に変化が無い場合）でも有効である。同じ周波数であれば、周波数調整部やＬＰＣのサンプリング変換が不要になるだけであり、上記説明からその説明部分を除けば良い。
【０１５４】
また、本発明は、ＣＥＬＰ以外の方式にも適用することができる。例えば、ＡＣＣ、Ｔｗｉｎ−ＶＱ、ＭＰ３などのオーディオコーデックの階層化や、ＭＰＬＰＣ等の音声コーデックの階層化の場合、後者ではパラメータとして同様のものがあるので同じ説明と同様であり、前者でも帯域パワーの符号化には本発明のゲインパラメータの符号化／復号化の説明と同様である。
【０１５５】
また、本発明は、階層数として２層以上のスケーラブルコーデックであれば適用できる。なお、コアレイヤから、ＬＰＣ、適応符号帳の情報、ゲインの情報以外の情報が得られる場合でも本発明は適応できる。例えば、ＳＣの音源ベクトルの情報がコアレイヤから得られた場合は、式（１４）や式（１７）と同様に、コアレイヤの音源に固定係数を乗じて音源候補に加算し、得られる音源を候補として合成し探索、符号化すればよいということは明らかである。
【０１５６】
なお、本実施の形態では、入力信号として音声信号を対象とした場合について説明したが、本発明は、音声信号以外の信号（音楽やノイズ、環境音など）全てに対応できる。
【産業上の利用可能性】
【０１５７】
本発明は、パケット通信システムや移動通信システムの通信装置に用いるのに好適である。
【図面の簡単な説明】
【０１５８】
【図１】ＣＥＬＰの符号化装置のブロック図
【図２】ＣＥＬＰの復号化装置のブロック図
【図３】本発明の一実施の形態に係るスケーラブルコーデックの符号化装置の構成を示すブロック図
【図４】上記実施の形態に係るスケーラブルコーデックの復号化装置の構成を示すブロック図
【図５】上記実施の形態に係るスケーラブルコーデックの符号化装置のコア復号器と拡張符号器の内部構成を示すブロック図
【図６】上記実施の形態に係るスケーラブルコーデックの復号化装置のコア復号器と拡張復号器の内部構成を示すブロック図
【符号の説明】
【０１５９】
３０２、３０６周波数調整部
３０３コア符号器
３０５コア復号器
３０７拡張符号器
３０９加算部
４０２コア復号器
４０３周波数調整部
４０４拡張復号器
４０５加算部
５０１パラメータ復号化部
５０２適応符号帳
５０３確率的符号帳
５０４ゲイン調整部
５０５ＬＰＣ合成部
５５１ＬＰＣ分析部
５５２適応符号帳
５５３確率的符号帳
５５４ゲイン調整部
５５５ＬＰＣ合成部
５５６比較部
５５７パラメータ符号化部
６０１パラメータ復号化部
６０２適応符号帳
６０３確率的符号帳
６０４ゲイン調整部
６０５ＬＰＣ合成部
６５１パラメータ復号化部
６５２適応符号帳
６５３確率的符号帳
６５４ゲイン調整部
６５５ＬＰＣ合成部

【特許請求の範囲】
【請求項１】
入力信号をｎ階層（ｎは２以上の整数）の符号化情報で符号化する符号化装置であって、
入力信号を符号化して第１階層の符号化情報を生成する基本レイヤ符号化手段と、第ｉ階層（ｉは１以上ｎ−１以下の整数）の符号化情報を復号化して第ｉ階層の復号化信号を生成する第ｉ階層の復号化手段と、前記入力信号と第１階層の復号化信号との差分である第１階層の差分信号あるいは第（ｉ−１）階層の復号化信号と第ｉ階層の復号化信号との差分である第ｉ階層の差分信号を求める加算手段と、第ｉ階層の差分信号を符号化して第（ｉ＋１）階層の符号化情報を生成する第（ｉ＋１）階層の拡張レイヤ符号化手段と、を具備し、
前記第（ｉ＋１）階層の拡張レイヤ符号化手段は、前記第ｉ階層の復号化手段の情報を利用して符号化処理を行う音声符号化装置。
【請求項２】
前記第（ｉ＋１）階層の拡張レイヤ符号化手段の少なくとも１つがＣＥＬＰ型であって、前記第ｉ階層の復号化手段のＬＰＣパラメータの情報を利用して量子化を行う請求項１に記載の音声符号化装置。
【請求項３】
前記第（ｉ＋１）階層の拡張レイヤ符号化手段の少なくとも１つがＣＥＬＰ型であって、前記第ｉ階層の復号化手段の適応符号帳の音源符号の情報を利用する請求項１又は請求項２に記載の音声符号化装置。
【請求項４】
前記第（ｉ＋１）階層の拡張レイヤ符号化手段の少なくとも１つがＣＥＬＰ型であって、前記第ｉ階層の復号化手段のゲインパラメータの情報を利用する請求項１から請求項３のいずれかに記載の音声符号化装置。
【請求項５】
前記第（ｉ＋１）階層の拡張レイヤ符号化手段の少なくとも１つがＣＥＬＰ型であって、入力信号を用いてＬＰＣ分析を行う請求項１から請求項４のいずれかに記載の音声符号化装置。
【請求項６】
入力信号をｎ階層（ｎは２以上の整数）の符号化情報を復号化する復号化装置であって、
入力した第１階層の符号化情報を復号化する基本レイヤ復号化手段と、第（ｉ＋1）階層（ｉは１以上ｎ−１以下の整数）の符号化情報を復号化して第（ｉ＋１）階層の復号化信号を生成する第ｉ階層の復号化手段と、各階層の復号化信号を加算する加算手段と、を具備し、
前記第（ｉ＋１）階層の復号化手段は、前記第ｉ階層の復号化手段の情報を利用して復号化処理を行う音声復号化装置。
【請求項７】
前記第（ｉ＋１）階層の復号化手段の少なくとも１つがＣＥＬＰ型であって、前記第ｉ階層の復号化手段のＬＰＣ符号を復号化して合成用ＬＰＣパラメータを得る請求項６に記載の音声復号化装置。
【請求項８】
前記第（ｉ＋１）階層の復号化手段の少なくとも１つがＣＥＬＰ型であって、前記第ｉ階層の復号化手段の適応符号帳の音源符号の情報を利用する請求項６又は請求項７に記載の音声復号化装置。
【請求項９】
前記第（ｉ＋１）階層の復号化手段の少なくとも１つがＣＥＬＰ型であって、前記第ｉ階層の復号化手段のゲインパラメータの情報を利用する請求項６から請求項８のいずれかに記載の音声復号化装置。
【請求項１０】
入力信号をｎ階層（ｎは２以上の整数）の符号化情報で符号化する符号化方法であって、
入力信号を符号化して第１階層の符号化情報を生成する基本レイヤ符号化工程と、第ｉ階層（ｉは１以上ｎ−１以下の整数）の符号化情報を復号化して第ｉ階層の復号化信号を生成する第ｉ階層の復号化工程と、前記入力信号と第１階層の復号化信号との差分である第１階層の差分信号あるいは第（ｉ−１）階層の復号化信号と第ｉ階層の復号化信号との差分である第ｉ階層の差分信号を求める加算工程と、第ｉ階層の差分信号を符号化して第（ｉ＋１）階層の符号化情報を生成する第（ｉ＋１）階層の拡張レイヤ符号化工程と、を具備し、
前記第（ｉ＋１）階層の拡張レイヤ符号化工程は、前記第ｉ階層の復号化工程の情報を利用して符号化処理を行う音声符号化方法。
【請求項１１】
入力信号をｎ階層（ｎは２以上の整数）の符号化情報を復号化する復号化方法であって、
入力した第１階層の符号化情報を復号化する基本レイヤ復号化工程と、第（ｉ＋1）階層（ｉは１以上ｎ−１以下の整数）の符号化情報を復号化して第（ｉ＋１）階層の復号化信号を生成する第ｉ階層の復号化工程と、各階層の復号化信号を加算する加算工程と、を具備し、
前記第（ｉ＋１）階層の復号化工程は、前記第ｉ階層の復号化工程の情報を利用して復号化処理を行う音声復号化方法。

【図１】