説明

音声符号列の変換装置および変換方法

【課題】 少ない演算量による符号列変換ができる。
【解決手段】 入力側のCELP方式の符号列から復号信号を合成する回路に加えて、LP係数復号回路12およびピッチ成分復号回路13それぞれで復号したLP係数とピッチ周期とを、出力側のLP係数符号化回路31およびピッチ成分計算回路40それぞれに直接渡し、出力側の符号列変換に提供する回路を追加している。従って、出力側で上記復号信号に対して行っていたLP分析およびピッチ周期候補の選択を不要にできる。入出力側それぞれで帯域拡張処理が必要な場合には帯域拡張変換およびピッチ周期候補生成の回路を加え、ピッチ成分の計算に替えて符号化の回路を備える。また、LP係数とピッチ周期とにおいて、入力側のフレーム長が出力側に対して、長い場合には補間処理、また短い場合には平均化処理を行うことにより対応できる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、二種類の音声符号化方式間で音声通信を行なう場合に、一方の方式の符号化により得た音声符号列を他方の方式で復号可能な音声符号列に変換する符号列変換装置および符号列変換方法に関し、特に、低歪みかつ低演算量で音声符号列に変換できる音声符号列変換装置および符号列変換方法に関する。
【背景技術】
【0002】
現在、携帯電話等で最も多く使用されている音声符号化方式として、CELP(Code Excited Linear Prediction)方式がある。CELP方式に関して記載する文献としては「Code-Excited Linear Prediction: High Quality Speech at Very Low Bit Rates」(IEEE Proc.ICASSP−85、pp.937−940、1985)(以後、非特許文献1と呼ぶ)がある。
【0003】
CELP方式による符号化装置では、入力音声信号を線形予測(LP)分析して計算したスペクトル包絡特性を表す線形予測(LP)係数とこのLP係数で構成されるLP合成フィルタを駆動する励振信号とに分けて符号化を行なう。LP分析とLP係数の符号化とは、予め定めた長さのフレーム毎に行なう。符号化励振信号の符号化は、このフレームをサブフレームに更に分割したサブフレーム毎に行なう。
【0004】
ここで、励振信号は、入力信号のピッチ周期を表す周期成分とその残りの残差成分とそれらのゲインとにより構成される。入力信号のピッチ周期を表す周期成分は、適応コードブックと呼ばれる過去の励振信号を保持するコードブックに格納された適応コードベクトルで表される。上記残差成分は、音源コードベクトルと呼ばれる複数のパルスからなるマルチパルス信号または予め設計した信号で表す。音源コードベクトルの情報は、音源コードブックに蓄積している。
【0005】
CELP方式による復号装置では、復号した上記ピッチ周期成分と上記残差信号から計算した励振信号とを、復号した上記LP係数で構成する合成フィルタに入力して合成音声信号を得る。
【0006】
異なる二つのCELP方式間で通信する際に、一方の方式の符号化により得た音声符号列を他方の方式で復号可能な音声符号列に変換する従来の変換装置として、一方のCELP方式の復号装置により入力した音声符号列から復号した音声信号を他方のCELP方式で符号化して出力音声符号列を得る変換装置がある。
【0007】
次に、図11を参照して、従来におけるこの種の音声符号列の変換装置について説明する。図11は一方のCELP方式Aの音声符号列を他方であるCELP方式Bの音声符号列に変換する変換装置の一構成例を示すブロック図である。
【0008】
図示される変換装置は、入力端子10、デマルチプレクサ回路11、LP係数復号回路12、ピッチ成分復号回路113、残差成分復号回路14、および音声合成回路15を、CELP方式Aの復号処理のために備える。また、フレーム回路21、サブフレーム回路22、LP分析回路130、LP係数符号化回路31、ピッチ周期候補選択回路132、ピッチ成分符号化回路41、残差成分符号化回路51、励振信号合成回路52、マルチプレクサ回路53、および出力端子50は、CELP方式Bの符号化処理を行なうために設けられる。
【0009】
入力端子10は、CELP方式Aの符号列をCELP方式Aのフレーム毎に入力し、デマルチプレクサ回路11に渡す。デマルチプレクサ回路11は、入力端子10から渡された符号列から各符号を分離する。デマルチプレクサ回路11は、分離した量子化LP係数の符号を分離してLP係数復号回路12に、またピッチ周期の符号をピッチ成分復号回路113に、更に残差成分信号の符号を残差成分復号回路14に、それぞれ渡す。
【0010】
LP係数復号回路12は、デマルチプレクサ回路11から渡された符号を用いてスペクトル特性を表すLP係数を復号し復号した係数を音声合成回路15に渡す。
【0011】
LP係数の符号化および復号方法としては、LP係数を線スペクトル対(LSP)に変化した後にベクトル量子化する方法がある。ベクトル量子化では、符号化器と復号器とで同一の量子化ベクトルテーブルを有し、各ベクトルに付与された符号を伝送する。復号器では、渡された符号に対応するベクトルを出力する。LSPのベクトル量子化法の詳細については「Efficient Vector Quantization of LPC Parameters at 24 Bits/Frame」 (IEEE Proc.ICASSP−91,pp.661−664,1991)(以後、非特許文献2と称する)を参照することができる。
【0012】
ピッチ成分復号回路113は、デマルチプレクサ回路11から渡された符号からピッチ周期Lとピッチゲインgaを復号する。ピッチ周期Lとピッチゲインgaとは各々スカラー量子化されており、各々渡された符号に対応する値を、予め設計した量子化テーブルの中から検索して、復号値とする。また、ピッチ成分復号回路113は、音声合成回路15から渡される励振信号を過去のピッチ周期Lに対するサンプルまで蓄積し、蓄積した励振信号を過去のピッチ周期Lだけ遡って切り出すことにより適応コードベクトルCaを作成する。最後に、ピッチ成分信号Ea(=ga・Ca)を計算し、音声合成回路15に渡す。
【0013】
残差成分復号回路14は、デマルチプレクサ回路11から渡された符号を用いて音源コードベクトルCrと音源ゲインgrを復号し、残差成分信号Er(=gr・Cr)を計算し、音声合成回路15に渡す。音源ゲインgrは、スカラー量子化されており、渡された符号に対応する値を、予め設計した量子化テーブルの中から検索して、復号値とする。音源コードベクトルCrは、渡された符号に対応するベクトルを、予め作成した音源コードブックの中から検索して、復号ベクトルとする。
【0014】
音声合成回路15は、ピッチ成分復号回路113から渡されたピッチ成分信号Eaと残差成分復号回路14から渡された残差成分信号Erとを用いて次の数式1の励振信号ベクトルExを計算し、ピッチ成分復号回路113に渡す。
【0015】
【数1】

【0016】
更に、音声合成回路15は、LP係数復号回路12から渡されるLP係数a(i)により構成され、下記の数式2に示される合成フィルタH(z)で、先に計算した励振信号ベクトルExをフィルタリングしてCELP方式Aの復号信号を求め、この復号信号をフレーム回路21に渡す。
【0017】
【数2】

数式2で「p」はLP係数の次数である。
【0018】
CELP方式では聴感的な音質を向上するために、この復号信号にポストフィルタと呼ばれるスペクトルピークを強調するフィルタを施す。しかし、再度符号化を行なう場合には符号化歪みを増加させるため、このポストフィルタを適用しない。
【0019】
フレーム回路21は、音声合成回路15から渡された復号信号をCELP方式Bのフレーム長で切り出し、LP分析回路130とピッチ周期候補選択回路132とサブフレーム回路22とに渡す。サブフレーム回路22は、フレーム回路21から渡された復号信号をCELP方式Bのサブフレーム長に分割し、ピッチ成分符号化回路41に渡す。
【0020】
LP分析回路130は、フレーム回路21から渡された復号信号をLP分析してLP係数を得る。次に、LP分析回路130は、この得たLP係数をLP係数符号化回路30とピッチ周期候補選択回路132とに渡す。
【0021】
LP係数符号化回路31は、LP分析回路130から渡されたLP係数をベクトル量子化し、その符号をマルチプレクサ回路53に渡す。この量子化法として上記参照文献2を参照することができる。更に、LP係数符号化回路31は、量子化したLP係数をピッチ成分符号化回路41と残差成分符号化回路51とに渡す。
【0022】
ピッチ周期候補選択回路132はフレーム回路21から渡された復号信号を用いてピッチ周期の候補を選択しピッチ成分符号化回路41に渡す。候補選択は、まずLP分析回路130から渡されたLP係数a(i)で構成される次の数式3で示される荷重フィルタW(z)により、フレーム回路21から渡された復号信号をフィルタリングする。数式3において「β」および「γ」は聴覚的な音質改善を行なうための荷重具合を調整する係数であり「0<γ<β≦1」を満たす値をとる。
【0023】
【数3】

【0024】
次に、ピッチ周期候補選択回路132は、この荷重された復号信号の自己相関関数を相関ラグ「20〜147」の範囲で計算し、自己相関が最大となる相関ラグとその近隣の値をピッチ周期の候補とする。
【0025】
ピッチ成分符号化回路41は、サブフレーム毎に、サブフレーム回路22から渡されたサブフレーム長の復号信号ベクトルSdのピッチ周期成分を符号化し、その符号をマルチプレクサ回路53に渡す。ピッチ成分符号化回路41は、まず残差成分符号化回路51から渡された過去に復号された励振信号を時間Lだけ遡ってサブフレーム長で切り出すことにより適応コードベクトルを作成する。次にピッチ成分符号化回路41は、この適応コードベクトルを上記数式2によりフィルタリングし、ピッチ成分だけの復号信号Sa(L)を計算する。更に、ピッチ成分符号化回路41は、上記数式3を用いて復号信号ベクトルSdおよびピッチ周期成分ベクトルSa(L)それぞれを荷重し、荷重復号信号ベクトルSdwと荷重ピッチ周期成分ベクトルSaw(L)とを得る。
【0026】
ピッチ成分符号化回路41は、上述したピッチ周期成分に関する動作を、ピッチ周期候補選択回路132から渡されるピッチ周期の候補それぞれに対して行ない、荷重復号信号ベクトルSdwと荷重ピッチ周期成分ベクトルSaw(L)との二乗距離Daが最小となる最適ピッチ周期Loを決定する。
【0027】
二乗距離Daは、ピッチ周期L毎に計算される最適ピッチゲインga(L)を用いて下記数式4により得られる。また、最適ピッチゲインga(L)は下記数式5により求められる。ここで、以後の説明において、記号‖x‖はベクトルxのノルム、また記号<x,y>はベクトルxとベクトルyとの内積、それぞれを意味するものとする。
【0028】
【数4】

【数5】

【0029】
ピッチ成分符号化回路41は、最後に、最適ピッチ周期Loとこれに対応するピッチゲインga(Lo)とをスカラー量子化して得た符号をマルチプレクサ回路53に渡す。
【0030】
また、ピッチ成分符号化回路41は、荷重ピッチ周期成分ベクトルSaw(Lo)に量子化した最適ピッチゲインgaq(Lo)を積算して得られたベクトルを、荷重復号信号ベクトルSdwから引き算して得た残差信号ベクトルSdw’を残差成分符号化回路51に渡す。更に、ピッチ成分符号化回路41は、最適ピッチ周期Loに対応した適応コードベクトルCa(Lo)に、量子化した最適ピッチゲインgaq(Lo)を積算したピッチ成分励振信号E’aを励振信号合成回路52に渡す。
【0031】
残差成分符号化回路51は、サブフレーム毎に、ピッチ成分符号化回路41から渡された復号信号ベクトルSdの残差成分である残差信号ベクトルSdw’を符号化し、その符号をマルチプレクサ53に渡す。
【0032】
すなわち、残差成分符号化回路51は、まず、予め設計し蓄積した音源コードブックからk番目の音源コードベクトルCr(k)を取り出す。次に、残差成分符号化回路51は、この音源コードベクトルを上記数式2によりフィルタリングし、残差成分だけの復号信号Sr(k)を計算する。更に、残差成分符号化回路51は、上記数式3を用いて復号信号ベクトルSdおよび残差成分ベクトルSr(k)それぞれを荷重し、荷重復号信号ベクトルSdwと荷重残差成分ベクトルSrw(k)とを得る。残差成分符号化回路51は、上述した残差成分に関する動作を、音源コードブックに蓄積されている全ての音源コードベクトルに対して行ない、ピッチ成分符号化回路41から渡された残差信号ベクトルSdw’と荷重残差成分ベクトルSrw(k)との二乗距離Drが最小となる音源コードベクトルの符号koを決定する。
【0033】
二乗距離Drは、各遅延毎に計算する最適音源ゲインgr(k)を用いた下記数式6により得られる。また、最適音源ゲインgr(k)は下記数式7により求められる。
【0034】
【数6】

【数7】

【0035】
最後に、残差成分符号化回路51は、最適音源ゲインgr(ko)をスカラー量子化し、その符号と音源コードベクトルの符号koをマルチプレクサ回路53に渡す。また、残差成分符号化回路51は、選択された音源コードベクトルCr(ko)に量子化した最適音源ゲインgrq(ko)を積算した残差成分励振信号E’rを励振信号合成回路52に渡す。
【0036】
励振信号合成回路52は、ピッチ成分符号化回路41から渡されたピッチ成分励振信号E’aと残差成分符号化回路51から渡された残差成分励振信号E’rとを加算することにより励振信号Ex’を下記数式8により計算してピッチ成分符号化回路41に渡す。
【0037】
【数8】

【0038】
マルチプレクサ回路53は、LP係数符号化回路31とピッチ成分符号化回路41と残差成分符号化回路51とから渡された、各符号化で得た符号を所定の順序で接続して符号列を生成し、出力端子50に渡す。出力端子50は、マルチプレクサ回路53から渡された符号列を出力する。
【先行技術文献】
【非特許文献】
【0039】
【非特許文献1】「Code-Excited Linear Prediction: High Quality Speech at Very Low Bit Rates」IEEE Proc.、1985年、ICASSP−85、pp.937−940
【非特許文献2】「Efficient Vector Quantization of LPC Parameters at 24 Bits/Frame」IEEE Proc.、1991年、ICASSP−91、pp.661−664)
【発明の概要】
【発明が解決しようとする課題】
【0040】
しかしながら、上述した従来の音声符号列の変換装置では、符号変換処理量が多く大形化が避けられないという問題点がある。
【0041】
その理由は、入力側のCELP方式Aで、符号化された符号列がデマルチプレクサ回路から復号回路を経て合成された復号信号がフレーム回路を経て出力側のCELP方式Bで符号化される際に、合成された復号信号を介して全てのパラメータに関する符号列の変換を行うためである。
【0042】
本発明の課題は、このような問題点を解決し、歪みを増大させることなく、低演算量で音声符号列に変換できる音声符号列の変換装置およびその方法を提供することである。
【課題を解決するための手段】
【0043】
上記の課題を解決するために、本発明による音声符号列変換装置は、ピッチ周期を含む第1の符号列を入力側として入力端子から入力し、ピッチ周期を含む第2の符号列に変換して出力側の出力端子から出力するものであって、第1の手段は、第2の符号列のピッチ周期を符号化する時間単位であるサブフレーム毎に、第1の符号列に含まれるピッチ周期を第2の符号列に含まれるピッチ周期とする、第1の符号列側のピッチ成分復号回路と第2の符号列側のピッチ成分計算回路とを備えることを特徴としている。
【0044】
第2の手段は、第2の符号列のピッチ周期を符号化する時間単位であるサブフレーム毎に、第1の符号列の当該サブフレームにおけるピッチ周期とその過去のサブフレームにおけるピッチ周期とから計算するピッチ周期の補間または平均化の回路と、この計算したピッチ周期を、第2の符号列に含まれるピッチ周期とするピッチ成分計算回路とを備えることを特徴としている。
【0045】
第3の手段は、第2の符号列のピッチ周期を符号化する時間単位であるサブフレーム毎に、第1の符号列に含まれるピッチ周期、および少なくともその近傍にある複数のピッチ周期候補を生成するピッチ周期候補生成回路と、生成された候補のうちのいずれか一つを、第2の符号列に含まれるピッチ周期とするピッチ成分符号化回路とを備えることを特徴としている。
【0046】
第4の手段は、第2の符号列のピッチ周期を符号化する時間単位であるサブフレーム毎に、第1の符号列の当該サブフレームのピッチ周期とその過去のサブフレームのピッチ周期とからピッチ周期を計算するピッチ周期の補間または平均化の回路と、この計算したピッチ周期、および少なくともその近傍にある複数のピッチ周期をピッチ周期候補として生成するピッチ周期候補生成回路と、生成された候補のうちのいずれか一つを第2の符号列に含まれるピッチ周期とするピッチ成分符号化回路とを備えることを特徴としている。
【0047】
第5の手段は、上記第3または第4の手段におけるピッチ成分符号化回路は、サブフレーム毎に、第1の符号列から復号される音声信号と第2の符号列から復号される音声信号との距離を最小とするように第2の符号列に含まれるピッチ周期を選択することを特徴としている。
【0048】
第6の手段は、上記第3または第4の手段におおけるピッチ成分符号化回路は、サブフレーム毎に、第1の符号列から復号される励振信号と第2の符号列から復号される励振信号との距離を最小とするように前記第2の符号列に含まれるピッチ周期を選択することを特徴としている。
【0049】
第7の手段は、第2の符号列のスペクトル特性を符号化する時間単位であるフレーム毎に、第1の符号列に含まれるスペクトル特性を第2の符号列に含まれるスペクトル特性とするため、第1の符号列側にLP係数復号回路、第2の符号列側にLP係数符号化回路それぞれを備えることを特徴としている。
【0050】
第8の手段は、第2の符号列のスペクトル特性を符号化する時間単位であるフレーム毎に、第1の符号列の当該フレームのスペクトル特性とその過去のフレームのスペクトル特性とからスペクトル特性を計算するLP係数の補間または平均化の回路と、この計算したスペクトル特性を第2の符号列に含まれるスペクトル特性とするLP係数符号化回路とを備えることを特徴としている。
【0051】
第9の手段は、第2の符号列のフレーム毎に、第1の符号列に含まれるスペクトル特性の帯域拡張強度を変換する帯域拡張変換回路と、変換して得たスペクトル特性を第2の符号列に含まれるスペクトル特性とするLP係数符号化回路とを備えることを特徴としている。
【0052】
また、第10の手段は、第2の符号列のスペクトル特性を符号化する時間単位であるフレーム毎に、第1の符号列の当該フレームのスペクトル特性とその過去のフレームのスペクトル特性とからスペクトル特性を計算するLP係数の補間または平均化の回路と、この計算したスペクトル特性の帯域拡張強度を変換する帯域拡張変換回路と、変換して得たスペクトル特性を、第2の符号列に含まれるスペクトル特性とするLP係数符号化回路を備えることを特徴としている。
【発明の効果】
【0053】
上述したように、本発明は、第1の符号列を第2の符号列に変換する際に、第1の符号列で復号したLP係数を、第2の符号列においてLP分析結果として用いている。この結果、第2の符号列処理において、LP分析処理を省略することができる。また、第1の符号列で復号したピッチ周期またはその近傍などのピッチ周期を、第2の符号列においてピッチ周期候補として用いている。この結果、第2の符号列処理において、ピッチ周期候補の選択処理を省略することができる。
【0054】
すなわち、本発明によれば、入力側のCELP方式の符号列から復号したLP係数とピッチ周期とを直接用いて出力側に用いており、入力した符号列を復号して得た復号信号を介さずに符号変換しているため、従来、入力側の復号信号に対して行っていたLP分析およびピッチ周期候補の選択を不要にできるので、従来方式に比べて少ない演算量による符号列変換が可能になるという効果が得られる。
【図面の簡単な説明】
【0055】
【図1】本発明による実施の第1の形態を示す機能ブロック図である。
【図2】本発明による実施の第2の形態を示す機能ブロック図である。
【図3】本発明による実施の第3の形態を示す機能ブロック図である。
【図4】本発明におけるLP係数の補間処理を説明する図である。
【図5】本発明におけるピッチ周期の補間処理を説明する図である。
【図6】本発明による実施の第4の形態を示す機能ブロック図である。
【図7】本発明による実施の第5の形態を示す機能ブロック図である。
【図8】本発明におけるLP係数の平均化処理を説明する図である。
【図9】本発明におけるピッチ周期の平均化処理を説明する図である。
【図10】本発明による実施の第6の形態を示す機能ブロック図である。
【図11】従来の一例を示す機能ブロック図である。
【発明を実施するための形態】
【0056】
次に、本発明の実施の形態について図面を参照して説明する。
【0057】
図1は本発明における実施の第1の形態を示す機能ブロック図である。この形態はCELP方式AおよびCELP方式Bそれぞれのフレーム長とサブフレーム長とが一致する場合である。
【0058】
図示された音声符号列の変換装置は、入力端子10、デマルチプレクサ回路11、LP係数復号回路12、ピッチ成分復号回路13、残差成分復号回路14、および音声合成回路15を、CELP方式Aの復号処理のために備える。また、フレーム回路21、サブフレーム回路22、LP係数符号化回路31、ピッチ成分計算回路40、残差成分符号化回路51、励振信号合成回路52、マルチプレクサ回路53、および出力端子50は、CELP方式Bの符号化処理を行なうために設けられる。
【0059】
従来の変換装置として参照した図11との相違は、LP分析回路130およびピッチ周期候補選択回路132が削除され、ピッチ成分復号回路113がピッチ成分復号回路13に、またピッチ成分符号化回路41がピッチ成分計算回路40にそれぞれ変更された点にある。
【0060】
この符号列変換装置において、入力端子10は、CELP方式Aの符号列を入力し、デマルチプレクサ回路11に渡す。デマルチプレクサ回路11は、入力端子10から渡された符号列を分離して、量子化LP係数の符号をLP係数復号回路12に渡し、ピッチ成分の符号をピッチ成分復号回路13に渡し、更に、残差成分信号の符号を残差成分復号回路14に渡す。
【0061】
LP係数復号回路12は、デマルチプレクサ回路11から渡された符号を用いてスペクトル特性を表すLP係数を復号し、復号した係数を音声合成回路15とLP係数符号化回路31とに渡す。ピッチ成分復号回路13はデマルチプレクサ回路11から渡された符号からピッチ周期Lとピッチゲインgaとを復号する。ピッチ成分復号回路13は、図11のピッチ成分復号回路113と比べて、ピッチ周期Lをピッチ成分計算回路40に渡す点のみが異なる。また、音声合成回路15から渡される励振信号を過去のピッチ周期Lのサンプルまで蓄積し、蓄積した励振信号を過去にピッチ周期Lだけ遡って切り出すことにより適応コードベクトルCaを作成する。最後に、ピッチ成分信号Ea(=ga・Ca)を計算し、音声合成回路15に渡す。
【0062】
残差成分復号回路14は、デマルチプレクサ11から渡された符号を用いて音源コードベクトルCrと音源ゲインgrを復号して残差成分信号Er(=gr・Cr)を計算し、音声合成回路15に渡す。音声合成回路15は、ピッチ成分復号回路13から渡されたピッチ成分信号Eaと、残差成分復号回路14から渡された残差成分信号Erとを用いて上記数式1の励振信号ベクトルExを計算し、ピッチ成分復号回路13に渡す。更に、音声合成回路15は、この励振信号ベクトルExを、LP係数復号回路15から渡されるLP係数a(i)で構成される上記数式2による合成フィルタH(z)でフィルタリングして復号信号ベクトルSdを得て、フレーム回路21に渡す。
【0063】
フレーム回路21は、音声合成回路15から渡された復号信号をCELP方式Bのフレーム長だけ切り出し、サブフレーム回路22に渡す。サブフレーム回路22は、フレーム回路21から渡された復号信号をCELP方式Bのサブフレーム長に分割し、ピッチ成分計算回路40に渡す。
【0064】
LP係数符号化回路31は、LP係数復号回路12から渡されたLP係数を量子化し、その符号をマルチプレクサ回路53に渡す。更に、LP係数符号化回路31は、量子化したLP係数をピッチ成分計算回路40と残差成分符号化回路51とに渡す。
【0065】
ピッチ成分計算回路40は、励振信号合成回路52から渡された過去に復号された励振信号を時間Lだけ遡ってサブフレーム長で切り出すことにより適応コードベクトルを生成する。次にピッチ成分計算回路40は、この適応コードベクトルを上記数式2によりフィルタリングし、ピッチ成分だけの復号信号Sa(L)を計算する。更にピッチ成分計算回路40は、上記数式3を用いて復号信号ベクトルSdおよびピッチ周期成分ベクトルSa(L)それぞれを荷重し、荷重復号信号ベクトルSdwと荷重ピッチ周期成分ベクトルSaw(L)とを得る。ピッチ成分計算回路40はこれらの値を用いてピッチゲインga(L)を上記数式5で計算する。最後に、ピッチ成分計算回路40は、ピッチ周期Lとピッチゲインga(L)とをスカラー量子化して得た符号をマルチプレクサ回路53に渡す。また、量子化したピッチゲインgaq(L)と適応コードベクトルCaq(L)との積により計算したピッチ成分信号E’aを励振信号合成回路52に渡す。
【0066】
残差成分符号化回路51は、サブフレーム毎に、ピッチ成分計算回路40から渡された復号信号ベクトルSdの残差成分を符号化し、その符号をマルチプレクサ53に渡す。
【0067】
まず、残差成分符号化回路51は、予め設計し蓄積した音源コードブックからk番目の音源コードベクトルCr(k)を取り出す。次に残差成分符号化回路51は、この音源コードベクトルを上記数式2によりフィルタリングし、残差成分だけの復号信号Sr(k)を計算する。更に、残差成分符号化回路51は、上記数式3を用いて復号信号ベクトルSdおよび残差成分ベクトルSr(k)それぞれを荷重して、荷重復号信号ベクトルSdwと荷重残差成分ベクトルSrw(k)とを得る。
【0068】
残差成分符号化回路51は、上述した残差成分に関する動作を、音源コードブックに蓄積されている全ての音源コードベクトルに対して行ない、ピッチ成分計算回路40から渡された残差信号ベクトルSdw’と荷重残差成分ベクトルSrw(k)との二乗距離Drを、上記数式6を用いて計算し、最小とする音源コードベクトルの符号koを決定する。
【0069】
最後に、残差成分符号化回路51は、最適音源ゲインgr(ko)をスカラー量子化し、その符号と音源コードベクトルの符号koをマルチプレクサ回路53に渡す。また、残差成分符号化回路51は、選択された音源コードベクトルCr(ko)に量子化した最適音源ゲインgrq(ko)を積算した残差成分励振信号E’rを励振信号合成回路52に渡す。
【0070】
励振信号合成回路52は、ピッチ成分計算回路40から渡されたピッチ成分励振信号E’aと、残差成分符号化回路51から渡された残差成分励振信号E’rとを加算する上記数式8により励振信号Ex’を計算し、ピッチ成分計算回路40に渡す。
【0071】
マルチプレクサ回路53は、LP係数符号化回路31とピッチ成分計算回路40と残差成分符号化回路51とから渡されたLP係数とピッチ周期とピッチゲインと音源コードブックと音源ゲインの符号とを所定順序に接続して符号列を生成し、出力端子50に渡す。出力端子50は、マルチプレクサ回路53から渡された符号列を出力する。
【0072】
次に、図2を参照して本発明における実施の第2の形態について説明する。
【0073】
この形態はCELP方式AおよびCELP方式Bの間でスペクトルの帯域拡張処理が異なることを補正するための帯域拡張変換処理、およびピッチ周期の候補を生成するピッチ周期候補生成処理を追加するものである。
【0074】
図2が図1と異なる点は、帯域拡張変換回路30およびピッチ周期候補生成回路32が追加され、ピッチ成分計算回路40の代わりに、図11で説明したピッチ成分符号化回路41が用いられていることである。帯域拡張変換回路30はLP係数復号回路12とLP係数符号化回路31との間に位置する。ピッチ周期候補生成回路32は、ピッチ成分復号回路13とピッチ成分符号化回路41との間に位置する。
【0075】
図2で図1と同一の構成要素は、同一の番号符号を付与してその説明を省略する。従って、これらの処理に関連する帯域拡張変換回路30およびピッチ周期候補生成回路32について次に説明する。
【0076】
帯域拡張処理は、スペクトル特性で急峻なピークが生じないようにLP係数a(i)を入力信号の自己相関関数r(i)から計算する際に、指数窓などの窓関数w(i)を自己相関関数r(i)に積算して「w(i)・r(i)」を求める処理である。符号化方式によりこの窓関数w(i)が異なるため、符号列変換ではこれを補正することにより、変換による劣化を低減することができる。また、ピッチ周期候補生成処理は、CELP方式Aで復号されたピッチ周期をそのままCELP方式Bで用いるのではなく、そのピッチ周期とその近隣のピッチ周期の中から選択する処理である。ピッチ周期をそのまま使用する場合に比べてピッチ周期を決定するための演算量が必要であるが、変換による劣化を低減できる。
【0077】
帯域拡張変換回路30は、LP係数復号回路12から渡されたLP係数で構成されるLPフィルタのインパルス応答を計算し、このインパルス応答の自己相関関数にCELP方式Aの帯域拡張係数wa(i)の逆数を積算し、更にCELP方式Bの帯域拡張係数wb(i)を積算する。次に、帯域拡張変換回路30は、レビンソン・ダーバン(Levinson-Durbin)法等により自己相関関数からLP係数を計算し、LP係数符号化回路31に渡す。
【0078】
ピッチ周期候補生成回路32は、ピッチ成分復号回路13から渡されたピッチ周期Lとその近隣のピッチ周期を、ピッチ周期候補として、ピッチ成分符号化回路41に渡す。渡されるピッチ周期には、符号列変換による音質劣化を抑えるために、ピッチ周期Lの整数倍もしくは整数分の1の値、またはその近傍の値をピッチ周期候補として含めることもできる。
【0079】
ピッチ成分符号化回路41は、ピッチ周期候補生成回路32からピッチ周期候補を渡され、従来方式で説明したものと同一の動作を行なう。この際、演算量を削減するために、上記数式2によるフィルタリングと、上記数式3による荷重とを省略するために、各遅延毎に計算する最適ピッチゲインG’a(L)を用いて音声合成回路15で計算された励振信号Exと適応コードベクトルCa(L)との二乗距離D’aが最小となる最適ピッチ周期Loを決定することもできる。
【0080】
二乗距離D’aは下記数式9を、また最適ピッチゲインG’a(L)は下記数式10を、それぞれ用いて求められる。
【0081】
【数9】

【数10】

【0082】
次に、図3を参照して本発明における実施の第3の形態について説明する。
【0083】
この実施の形態は、CELP方式Aのフレーム長Naおよびサブフレーム長NsaそれぞれがCELP方式Bのフレーム長Nbおよびサブフレーム長Nsbのそれぞれより長い場合である。この形態は、上記第2の形態と比べてフレーム長およびサブフレーム長それぞれの差を調整する処理を有することが異なる。
【0084】
図3が図2と異なる点は、これらの処理に関連するLP係数補間回路60とピッチ周期補間回路70とが追加されていることである。LP係数補間回路60はLP係数復号回路12と帯域拡張変換回路30との間に位置する。ピッチ周期補間回路70は、ピッチ成分復号回路13とピッチ周期候補生成回路32との間に位置する。
【0085】
図3で図2と同一の構成要素は同一の番号符号を付与してその説明を省略する。追加されたLP係数補間回路60とピッチ周期補間回路70とについて、次に説明する。
【0086】
ここで説明を具体的にするために、CELP方式Aのフレーム長Naは20msであり、サブフレーム長Nsaは10ms、また、CELP方式Bのフレーム長Nbは10msであり、サブフレーム長Nsbは5msであるものとする。また、LP係数は各フレームの最終サブフレームを中心としてLP分析窓で計算するものとする。
【0087】
LP係数補間回路60は、LP係数復号回路12からフレーム長Naの20ms毎に渡されるLP係数と過去のフレームで渡されたLP係数とから、CELP方式Bで使用するフレーム長Nbの10ms毎のLP係数を計算し、帯域拡張変換回路30に渡す。
【0088】
ここで図4にCELP方式AおよびCELP方式BそれぞれのLP係数の関係を示す。図示されるX印は前述したLP分析窓の中心であり、LP係数を補間する場合の中心とする。フレーム番号をCELP方式Aでは「k」またCELP方式Bでは「t」それぞれにより示している。矢印は、CELP方式AのLP係数がCELP方式BのどのLP係数を計算するために使用されるかを示す。
【0089】
LP係数復号回路12から、CELP方式Aのフレームのスペクトル特性を表すLP係数が20ms毎に渡されるが、CELP方式Bでは10ms毎にLP係数を必要とする。このため、図4に示される矢印のように「i」を「1,2,…,またはp」とするとき、フレーム番号「t−1」および「t」におけるCELP方式BのLP係数ab(t−1,i)およびLP係数ab(t,i)を、CELP方式Aで対応するフレームのLP係数aa(k,i)、および過去にjフレーム分だけ遡ったフレームにおけるLP係数aa(k−j,i)を用いて下記数式11および数式12それぞれに従って計算する。計算に当たっては、補間方法を規定する荷重関数w(j)が用いられる。また、図4に示される例でX印の位置関係を考慮すると、数式11におけるLP係数ab(t−1,i)の場合では「w(0)=5/8,w(1)=3/8」および「M=2」が適用される。また、数式12におけるLP係数ab(t,i)の場合では「w(0)=1」および「M=1」が適用される。
【0090】
【数11】

【数12】

【0091】
ピッチ周期補間回路70は、ピッチ成分復号回路13からサブフレーム長Nasの10ms毎に渡されるピッチ周期と過去のサブフレームで渡されたピッチ周期とから、CELP方式Bで使用するサブフレーム長Nsbの5ms毎のピッチ周期を計算し、ピッチ周期候補生成回路32に渡す。
【0092】
ここで、図5にCELP方式AおよびCELP方式Bそれぞれのピッチ周期の関係を示す。フレーム番号をCELP方式Aでは「k」またCELP方式Bでは「t」それぞれにより示している。矢印は、CELP方式Aのピッチ周期がCELP方式Bのどのピッチ周期を計算するために使用されるかを示す。
【0093】
ピッチ成分復号回路13からは、CELP方式Aのサブフレームのピッチ周期が10ms毎に渡されるが、CELP方式Bでは5ms毎にピッチ周期を必要とするため、図5の矢印が示すように、フレーム番号「t」の第1および第2サブフレームにおけるCELP方式Bのピッチ周期L1b(t)およびピッチ周期L2b(t)を、CELP方式Aで対応するフレームのピッチ周期L1a(k)およびピッチ周期L2a(k)および過去にjフレーム分だけ遡ったフレームにおけるピッチ周期L1a(k−j)およびピッチ周期L2a(k−j)それぞれを用いて下記数式13のピッチ周期Lsb(t)により計算する。計算に当たっては、補間方法を規定する荷重関数u(j)が用いられる。
【0094】
【数13】

【0095】
また、図5に示される例で両CELP方式のサブフレームの位置関係を考慮すると、数式13におけるピッチ周期Lsb(t)がピッチ周期L1b(t)の場合では「u(0)=3/4,u(1)=1/4」および「M=2」が適用される。また、ピッチ周期Lsb(t)がピッチ周期L2b(t)の場合では「u(0)=1」および「M=1」が適用される。
【0096】
次に、図6を参照して本発明における実施の第4の形態について説明する。
【0097】
この形態は上記第3の形態と同様に、CELP方式Aのフレーム長Naおよびサブフレーム長NsaそれぞれがCELP方式Bのフレーム長Nbおよびサブフレーム長Nsbのそれぞれより長い場合である。
【0098】
CELP方式AおよびCELP方式Bの間でスペクトルの帯域拡張処理が異なることを補正するための帯域拡張変換処理、およびピッチ周期の候補を生成するピッチ周期候補生成処理を追加するものである。
【0099】
図6が図1と異なる点は、LP係数補間回路60とピッチ周期補間回路70とが追加されていることであり、図3から帯域拡張変換回路30およびピッチ周期候補生成回路32が削除され、ピッチ成分符号化回路41の代わりに、図1を参照して説明したピッチ成分計算回路40が用いられていることである。従って、LP係数補間回路60はLP係数復号回路12とLP係数符号化回路31との間に位置する。ピッチ周期補間回路70は、ピッチ成分復号回路13とピッチ成分計算回路40との間に位置する。
【0100】
図6で図1と同一の構成要素は、同一の番号符号を付与してその説明を省略する。また、LP係数補間回路60とピッチ周期補間回路70とは図1に追加されているが、上記図3から図5までを参照して説明しているものと機能的に同一である。
【0101】
すなわち、LP係数補間回路60は、LP係数復号回路12から渡されたLP係数を補間して、LP係数符号化回路31に渡す。ピッチ周期補間回路70はピッチ成分復号回路13から渡されるピッチ周期を補間して、ピッチ成分計算回路40渡す。
【0102】
次に、図7を参照して本発明における実施の第5の形態について説明する。
【0103】
この実施の形態は、CELP方式Aのフレーム長Naおよびサブフレーム長NsaそれぞれがCELP方式Bのフレーム長Nbおよびサブフレーム長Nsbのそれぞれより短い場合である。この形態は、上記第2の形態と比べてフレーム長およびサブフレーム長それぞれの差を調整する処理を有することが異なり、また上記第3の形態と比較してその差の調整処理方法が異なっている。
【0104】
すなわち、図7が図3と異なる点は、これらの処理に関連する図3におけるLP係数補間回路60とピッチ周期補間回路70とがLP係数平均化回路61とピッチ周期平均化回路71とにそれぞれ代替えされていることである。従って、LP係数平均化回路61はLP係数復号回路12と帯域拡張変換回路30との間に位置する。ピッチ周期平均化回路71は、ピッチ成分復号回路13とピッチ周期候補生成回路32との間に位置する。
【0105】
図7で図3と同一の構成要素は、同一の番号符号を付与してその説明を省略する。従って、代替えされたLP係数平均化回路61とピッチ周期平均化回路71とについて次に説明する。
【0106】
ここで説明を具体的にするために、CELP方式Aのフレーム長Naは10msであり、サブフレーム長Nsaは5ms、また、CELP方式Bのフレーム長Nbは20msであり、サブフレーム長Nsbは10msであるものとする。また、LP係数は各フレームの最終サブフレームを中心としてLP分析窓で計算するものとする。
【0107】
LP係数平均化回路61は、LP係数復号回路12からフレーム長Naの10ms毎に渡されるLP係数と過去のフレームで渡されたLP係数とから、CELP方式Bで使用するフレーム長Nbの20ms毎のLP係数を計算し、帯域拡張変換回路30に渡す。
【0108】
ここで、図8にCELP方式AおよびCELP方式BそれぞれのLP係数の関係を示す。図示されるX印は前述したLP分析窓の中心であり、LP係数を平均化する場合の中心とする。フレーム番号をCELP方式Aでは「k」またCELP方式Bでは「t」それぞれにより示している。矢印は、CELP方式AのLP係数がCELP方式BのどのLP係数を計算するために使用されるかを示す。
【0109】
LP係数復号回路12からは、CELP方式Aのフレームのスペクトル特性を表すLP係数が10ms毎に渡されるが、CELP方式Bでは20ms毎にLP係数を必要とする。このため、図8に示される矢印のように「i」を「1,2,…,またはp」とするとき、フレーム番号「t」におけるCELP方式BのLP係数ab(t,i)を、CELP方式Aで対応するフレームのLP係数aa(k,i)および過去にjフレーム分だけ遡ったフレームにおけるLP係数aa(k−j,i)を用いて上記数式12に従って計算する。計算に当たっては、平均化方法を規定する荷重関数w(j)が用いられる。また、図8に示される例でX印の位置関係を考慮すると、数式12におけるLP係数ab(t,i)の場合で「w(0)=3/4、w(1)=1/4」および「M=2」が適用される。
【0110】
ピッチ周期平均化回路71は、ピッチ成分復号回路13からサブフレーム長Nasの10ms毎に渡されるピッチ周期と過去のサブフレームで渡されたピッチ周期とから、CELP方式Bで使用するサブフレーム長Nsbの5ms毎のピッチ周期を計算し、ピッチ周期候補生成回路32に渡す。
【0111】
ここで、図9にCELP方式AおよびCELP方式Bそれぞれのピッチ周期の関係を示す。フレーム番号をCELP方式Aでは「k」またCELP方式Bでは「t」それぞれにより示している。矢印は、CELP方式Aのピッチ周期がCELP方式Bのどのピッチ周期を計算するために使用されるかを示す。
【0112】
ピッチ成分復号回路13からは、CELP方式Aのサブフレームのピッチ周期が5ms毎に渡されるが、CELP方式Bでは10ms毎にピッチ周期を必要とする。このため、図9の矢印が示すように、フレーム番号「t」の第1および第2サブフレームにおけるCELP方式Bのピッチ周期L1b(t)およびピッチ周期L2b(t)を、CELP方式Aで対応するフレームのピッチ周期L1a(k)およびピッチ周期L2a(k)および過去にjフレーム分だけ遡ったフレームにおけるピッチ周期L1a(k−j)およびピッチ周期L2a(k−j)それぞれを用いて上記数式13のピッチ周期Lsb(t)により計算する。計算に当たっては、平均化方法を規定する荷重関数u(j)が用いられる。また、図9に示される例で両CELP方式のサブフレームの位置関係を考慮すると、数式13におけるピッチ周期Lsb(t)がピッチ周期L1b(t)の場合では「u(0)=1/2,u(1)=1/2」および「M=2」が適用される。また同様に、ピッチ周期L2b(t)の場合では「u(0)=0,u(1)=0,u(2)=1/2、u(3)=1/2」および「M=4」が適用される。
【0113】
次に、図10を参照して本発明における実施の第6の形態について説明する。
【0114】
この形態は上記第5の形態と同様に、CELP方式Aのフレーム長Naおよびサブフレーム長NsaそれぞれがCELP方式Bのフレーム長Nbおよびサブフレーム長Nsbのそれぞれより短い場合である。この形態は、上記第2の形態と比べてフレーム長およびサブフレーム長それぞれの差を調整する処理を有することが異なり、また上記第5の形態と比較してその差の調整処理方法が異なっている。
【0115】
図10が図1と異なる点は、LP係数平均化回路61とピッチ周期平均化回路71とが追加されていることであり、図7と異なる点は、帯域拡張変換回路30およびピッチ周期候補生成回路32が削除され、ピッチ成分符号化回路41の代わりに図1を参照して説明したピッチ成分計算回路40が用いられていることである。従って、LP係数平均化回路61はLP係数復号回路12とLP係数符号化回路31との間に位置する。ピッチ周期平均化回路71はピッチ成分復号回路13とピッチ成分計算回路40との間に位置する。
【0116】
図10で図1と同一の構成要素は、同一の番号符号を付与してその説明を省略する。また、LP係数平均化回路61とピッチ周期平均化回路71とは図1に追加されているが、上記図7から図9までを参照して説明しているものと機能的に同一である。
【0117】
すなわち、LP係数平均化回路61は、第5の実施例で説明したのと同様に、LP係数復号回路12から渡されたLP係数を平均化して、LP係数符号化回路31に渡す。ピッチ周期平均化回路71は、ピッチ成分復号回路13から渡されるピッチ周期を平均化して、ピッチ成分計算回路40に渡す。
【0118】
以上説明したように本発明によれば、入力側のCELP方式の符号列から復号したLP係数とピッチ周期とを直接用いて出力側に用いており、入力した符号列を復号して得た復号信号を介さずに符号変換しているため、従来、入力側の復号信号に対して行っていたLP分析およびピッチ周期候補の選択を不要にできるので、従来方式に比べて少ない演算量による符号列変換が可能になるという効果が得られる。
【産業上の利用可能性】
【0119】
本発明は、復号したピッチ周期成分と残差信号から計算した励振信号とを復号したLP係数で構成する合成フィルタに入力して合成音声信号を得るCELP方式による復号装置に広く利用することができる。
【符号の説明】
【0120】
10 入力端子
11 デマルチプレクサ回路
12 LP係数復号回路
13 ピッチ成分復号回路
14 残差成分復号回路
15 音声合成回路
21 フレーム回路
22 サブフレーム回路
30 帯域拡張変換回路
31 LP係数符号化回路
32 ピッチ周期候補生成回路
40 ピッチ成分計算回路
41 ピッチ成分符号化回路
50 出力端子
51 残差成分符号化回路
52 励振信号合成回路
53 マルチプレクサ回路
60 LP係数補間回路
61 LP係数平均化回路
70 ピッチ周期補間回路
71 ピッチ周期平均化回路

【特許請求の範囲】
【請求項1】
スペクトル特性を含む第1の符号列を、スペクトル特性を含む第2の符号列に変換する符号列変換装置において、前記第2の符号列のフレーム毎に、前記第1の符号列に含まれるスペクトル特性の帯域拡張強度を変換して得たスペクトル特性を前記第2の符号列に含まれるスペクトル特性とする回路を備えることを特徴とする符号列変換装置。
【請求項2】
スペクトル特性を含む第1の符号列を、スペクトル特性を含む第2の符号列に変換する符号列変換装置において、前記第2の符号列のスペクトル特性を符号化する時間単位であるフレーム毎に、前記第1の符号列の当該フレームのスペクトル特性とその過去のフレームのスペクトル特性とから計算したスペクトル特性の帯域拡張強度を変換して得たスペクトル特性を、前記第2の符号列に含まれるスペクトル特性とする回路を備えることを特徴とする符号列変換装置。
【請求項3】
スペクトル特性を含む第1の符号列を、スペクトル特性を含む第2の符号列に変換する符号列変換方法において、前記第2の符号列のフレーム毎に、前記第1の符号列に含まれるスペクトル特性の帯域拡張強度を変換するステップと、変換した後に符号化したスペクトル特性を前記第2の符号列に含まれるスペクトル特性とするステップとを有することを特徴とする符号列変換方法。
【請求項4】
スペクトル特性を含む第1の符号列を、スペクトル特性を含む第2の符号列に変換する符号列変換方法において、前記第2の符号列のスペクトル特性を符号化する時間単位であるフレーム毎に、前記第1の符号列の当該フレームにおけるスペクトル特性とその過去のフレームにおけるスペクトル特性とからスペクトル特性を計算するステップと、計算したスペクトル特性の帯域拡張強度を変換するステップと、変換したスペクトル特性を前記第2の符号列に含まれるスペクトル特性とするステップとを有することを特徴とする符号列変換方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate


【公開番号】特開2009−104169(P2009−104169A)
【公開日】平成21年5月14日(2009.5.14)
【国際特許分類】
【出願番号】特願2009−11591(P2009−11591)
【出願日】平成21年1月22日(2009.1.22)
【分割の表示】特願2001−26906(P2001−26906)の分割
【原出願日】平成13年2月2日(2001.2.2)
【出願人】(000004237)日本電気株式会社 (19,353)
【Fターム(参考)】