信号圧縮方法及び装置
【課題】本発明は、可聴音(オーディオ、音声)圧縮に関し、信号圧縮方法及び装置に関する。
【解決手段】信号圧縮方法は、入力信号にウィンドウ関数を掛け、ウィンドウ処理された入力信号の、元の自己相関係数を計算し、元の自己相関係数に従って、白色雑音補正率又はラグウィンドウを計算し、元の自己相関係数と、白色雑音補正率と、ラグウィンドウとに従って、修正された自己相関係数を計算し、修正された自己相関係数に従って、線形予測係数を計算し、線形予測係数に従って、符号化されたビットストリームを出力することを含む。本発明による技術的解決法により、特殊な入力信号の不良条件の場合が回避され、修正された自己相関係数が、後続の圧縮のためにより適したものとなり、ロスレス符号器の圧縮効率と、ロッシー符号器の、再構築される発話信号の品質とが向上し、単純な動作のみが含まれるようになる。
【解決手段】信号圧縮方法は、入力信号にウィンドウ関数を掛け、ウィンドウ処理された入力信号の、元の自己相関係数を計算し、元の自己相関係数に従って、白色雑音補正率又はラグウィンドウを計算し、元の自己相関係数と、白色雑音補正率と、ラグウィンドウとに従って、修正された自己相関係数を計算し、修正された自己相関係数に従って、線形予測係数を計算し、線形予測係数に従って、符号化されたビットストリームを出力することを含む。本発明による技術的解決法により、特殊な入力信号の不良条件の場合が回避され、修正された自己相関係数が、後続の圧縮のためにより適したものとなり、ロスレス符号器の圧縮効率と、ロッシー符号器の、再構築される発話信号の品質とが向上し、単純な動作のみが含まれるようになる。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、可聴音(オーディオ、音声)圧縮に関し、特に、信号圧縮方法及び装置に関する。
【背景技術】
【0002】
発話(スピーチ)及び音声(オーディオ)信号を伝送及び記憶するための帯域幅を節約するために、発話及び音声符号化技術が広く適用されている。現在、これらの符号化技術は、主として、ロッシー(lossy)符号化及びロスレス(lossless)符号化技術に分類さ
れる。
【0003】
線形予測(LP)分析は、ロスレス圧縮符号化において、入力信号のダイナミックレンジを減らすため、及び信号の近接標本点(near sample points)の冗長性をなくすために広く適用されているが、帯域幅拡張は、ロスレス符号化において一般的には適用されていない。
【0004】
ロッシー符号化であるG.729では、自己相関係数にラグウィンドウを掛けることによって、帯域幅拡張技術が適用される。LP分析をより安定させることを目的として、レビンソン−ダービンアルゴリズムによってLP係数を計算する前に、60Hzの帯域幅拡張が実行される。従来技術における、LP係数を計算するステップは、以下の通りである。
【0005】
1.入力信号にウィンドウ関数を掛け、自己相関係数を計算する。r(0)、r(1)...r(p)、ここで、pはLPの次数。
【0006】
2.自己相関係数の重み因子winlagを計算する。
winlag(k)=exp[(−1/2)(2πf0k/fs)2]
k=1,...,p
上式で、f0は、f0=60Hzなどの、定数であり、fsは、8000Hzなどの、信号標本化周波数であり、pは、LP分析の次数(10など)である。
【0007】
3:白色雑音補正率が、winlag(0)=1.0001であることを決定する。
【0008】
4.調節された自己相関係数を計算する。
r(0)’=winlag(0)r(0)
r(k)’ =winlag(k)r(k) k=1,...,p
【0009】
5.調節された自己相関係数を使用して、新たなLP係数を、レビンソン−ダービンアルゴリズムを介して計算する。
【0010】
従来技術では、各フレーム信号が同じように処理される。
【0011】
LP分析は、ロスレス圧縮符号化において、入力信号のダイナミックレンジを減らすため、及び信号の近接標本点の冗長性をなくすために広く適用されている。
【発明の概要】
【発明が解決しようとする課題】
【0012】
本発明を実施するプロセスにおいて、発明者は、従来技術における少なくとも以下の欠点を見出した。全ての信号が同じように処理されるため、一部の特殊な入力信号に対して、不良条件の場合が発生する可能性があり、自己相関行列の解決が不安定となり、これは、ロスレス符号器の低い圧縮効率と、ロッシー符号器の、再構築される発話信号の低い品質とをもたらす。
【課題を解決するための手段】
【0013】
本発明の実施形態は、異なる信号が信号特徴に従って異なるように処理され、それにより、特殊な入力信号によって生成される不良条件の場合が回避され、音声圧縮効率と、再構築される発話信号の品質とが向上するような、信号圧縮方法及び装置を提供する。
【0014】
信号圧縮方法は、
入力信号にウィンドウ関数を掛け、
ウィンドウ処理された入力信号の、元の自己相関係数を計算し、
元の自己相関係数に従って、自己相関係数補正率を調節し、
元の自己相関係数と、調節された自己相関係数補正率とに従って、修正された自己相関係数を計算し、
修正された自己相関係数に従って、線形予測係数を計算し、
線形予測係数に従って、入力信号を符号化し、符号化されたビットストリームを出力すること
を含む。
【0015】
別の信号圧縮方法は、
入力信号にウィンドウ関数を掛け、
ウィンドウ処理された入力信号の、元の自己相関係数を計算し、
元の自己相関係数の第1の係数に従って、エネルギーパラメータを計算し、エネルギーパラメータに従って、白色雑音補正率を調節し、
拡張帯域幅に従って、ラグウィンドウを計算し、
元の自己相関係数と、調節された白色雑音補正率と、ラグウィンドウとに従って、修正された自己相関係数を計算し、
修正された自己相関係数に従って、線形予測係数を計算し、
線形予測係数に従って、入力信号に対する線形予測を実行し、残留信号を計算し、残留信号を符号化し、符号化されたビットストリームを出力すること
を含む。
【0016】
信号圧縮装置は、
入力信号にウィンドウ関数を掛けるように構成された、ウィンドウ処理ユニットと、
ウインドウ処理ユニットによって処理された入力信号の、元の自己相関係数を計算するように構成された、元の自己相関係数計算ユニットと、
元の自己相関係数計算ユニットによって計算された元の自己相関係数に従って、自己相関係数補正率を調節し、元の自己相関係数と、調節された自己相関係数補正率とに従って、修正された自己相関係数を計算するように構成された、帯域幅拡張ユニットと、
帯域幅拡張ユニットによって計算された、修正された自己相関係数に従って、線形予測係数を計算するように構成された、線形予測係数計算ユニットと、
線形予測係数計算ユニットによって計算された線形予測係数に従って、入力信号を符号化し、符号化されたビットストリームを出力するように構成された、圧縮ユニットと
を含む。
【発明の効果】
【0017】
本発明の実施形態による技術的解決法では、元の自己相関係数に従って、自己相関補正率が調節され、その結果、調節された自己相関係数補正率は、入力信号の違いを表現することができ、それにより、特殊な入力信号の不良条件の場合が回避され、修正された自己相関係数が、後続の圧縮処理のためにより適したものとなり、ロスレス符号器の圧縮効率と、ロッシー符号器の、再構築される発話信号の品質とが向上し、単純な動作のみが含まれるようになる。
【0018】
添付の図面は、本発明を限定するものではなく、本発明のより良い理解を意図するものであり、本出願の一部を成す。
【図面の簡単な説明】
【0019】
【図1】本発明の第1の実施形態における信号圧縮方法のフローチャートである。
【図2】本発明の第2の実施形態における信号圧縮方法のフローチャートである。
【図3】本発明の第3の実施形態における信号圧縮方法のフローチャートである。
【図4】本発明の第4の実施形態における信号圧縮方法のフローチャートである。
【図5】本発明の第5の実施形態における信号圧縮装置の構成を示す。
【図6】本発明の第6の実施形態における信号圧縮装置の構成を示す。
【図7】本発明の第6の実施形態における信号圧縮装置の、帯域幅拡張ユニットの構成を示す。
【図8】本発明の第7の実施形態における信号圧縮装置の構成を示す。
【図9】本発明の第7の実施形態における信号圧縮装置の、帯域幅拡張ユニットの構成を示す。
【図10】本発明の第6又は第7の実施形態における帯域幅拡張ユニットの、別の構成を示す。
【発明を実施するための形態】
【0020】
本発明の技術的解決策、目的、及び利点を明確にするために、本発明について、添付の図面及び例示的実施形態を参照して以下で詳細に説明する。本発明の例示的実施形態及びその説明は、本発明を限定することではなく、解釈することを意図するものである。
【0021】
本発明の実施形態は、信号圧縮方法及び装置を提供する。本発明の実施形態について、添付の図面を参照して以下で詳細に説明する。
【0022】
第1の実施形態
図1は、本発明の第1の実施形態における信号圧縮方法のフローチャートである。方法は以下のステップを含む。
【0023】
ステップ101:入力信号にウィンドウ関数を掛ける。
【0024】
ステップ102:ウィンドウ処理された入力信号の、元の自己相関係数を計算する。
【0025】
ステップ103:元の自己相関係数に従って、自己相関係数補正率を調節する。
【0026】
ステップ104:元の自己相関係数と、調節された自己相関係数補正率とに従って、修正された自己相関係数を計算する。
【0027】
自己相関係数補正率は、白色雑音補正率とラグウィンドウとを含む。自己相関係数補正率を調節することは、白色雑音補正率とラグウィンドウとを調節すること、又は、白色雑音補正率のみを調節すること、又はラグウィンドウのみを調節することであってもよい。
【0028】
元の自己相関係数に従って、自己相関係数補正率を調節することは、元の自己相関係数に従って、入力信号の特徴パラメータを決定し、特徴パラメータに従って、自己相関係数補正率を調節することであってもよい。特徴パラメータは、エネルギー、周期性パラメータ、ゼロ交差レート、反射係数、又はそれらの任意の組み合わせであってもよく、かつ、元の入力信号から、又は任意のステップで取得された信号から抽出されてもよい。
【0029】
ステップ105:修正された自己相関係数に従って、LP係数を計算する。
【0030】
ステップ106:LP係数に従って、入力信号を符号化し、符号化されたビットストリームを出力する。
【0031】
LP係数に従って、入力信号を符号化することは、LP係数に従って入力信号に対するLP分析を実行し、残留信号を計算し、次に、長期予測(LTP)とエントロピー符号化とを実行し、最後に、残留信号のロスレス符号化されたビットストリームを出力することであってもよく、又は、LP係数と入力信号とを符号励振線形予測(CELP)モデルに入力して、ビットストリームを取得することであってもよい。
【0032】
本発明の別の実施形態では、前処理ステップが含まれてもよい。ステップ101の前に、入力信号は前処理される。ロッシー圧縮のためには、前処理は、入力信号の高周波成分を増加させるための、又は、不必要な低周波干渉成分を除去するための、プリエンファシスフィルタ処理又はハイパスフィルタ処理であってもよい。その後、フィルタ処理された信号は、ステップ101に従ってウィンドウ処理される。ロスレス圧縮のためには、前処理は、入力信号をA則又はμ則からパルス符号変調(PCM)領域にマッピングする、マッピング動作であってもよい。PCM領域内の信号は、LP短期予測のためにより適している。
【0033】
上記の実施形態における技術的解決法を使用すれば、元の自己相関係数は、各フレーム信号の特徴を反映し、そのような特徴に従って、自己相関係数補正率が調節され、その結果、調節された自己相関係数補正率が各フレーム信号の特徴に従って決定される。従って、LP係数は、信号の特徴により正確に適合し、不良条件の場合が回避され、計算される係数はよりロバストであり、計算複雑度は低い。
【0034】
第2の実施形態
図2は、本発明の第2の実施形態における信号圧縮方法のフローチャートである。方法は以下のステップを含む。
【0035】
ステップ201:入力信号にウィンドウ関数を掛ける。ここでのウィンドウは、従来技術においてロッシー符号化に適用されるウィンドウであってもよい。入力信号s(n)にウィンドウ関数win(n)が掛けられて、ウィンドウ処理された入力信号s’(n)が取得される。
s’(n)=win(n)s(n) n=0,...,N−1
ここで、Nはフレーム長
【0036】
ステップ202:ウィンドウ処理された入力信号s’(n)に従って、元の自己相関係数r(k)を、例えば以下の式を介して計算する。
【数1】
k=0,...,p、ここで、pはLPの次数
【0037】
ステップ203:元の自己相関係数に従って、エネルギーパラメータEを計算する。
【0038】
いくつかの実施形態では、元の自己相関係数の第1の係数r(0)に従って、フレーム平均エネルギーが計算されてもよい。
Ener_avg=r(0)/N、ここで、Nはフレーム長
【0039】
他の実施形態では、元の自己相関係数の第1の係数r(0)に従って、フレームエネルギーパラメータが計算されてもよい。
【数2】
上式で、
【数3】
は、端数を切り捨てることを意味し、すなわち、
【数4】
である。
【0040】
ステップ204:エネルギーパラメータに従って、白色雑音補正率を調節する。
【0041】
この実施形態では、エネルギー閾値Ethrが設定されてもよい。エネルギーパラメータEとEthrとの関係に従って、入力信号が区別される。異なる入力信号に対して、異なる調節関数が、白色雑音補正率を調節するために使用される。具体的には、エネルギーパラメータが分布する異なるエネルギー閾値間隔に従って、異なる調節関数が、白色雑音補正率を調節するために使用される。
【数5】
【0042】
いくつかの実施形態では、フレーム信号は、フレーム平均エネルギーEner_avgとエネルギー閾値Ethrとに従って、高エネルギーフレーム信号と低エネルギーフレーム信号とに分類され、次に、それに応じて白色雑音補正率winlag(0)が調節される。
if(Ener_avg>=Ethr)
winlag(0)=H+α*Ener_avg;
else
winlag(0)=L+β*Ener_avg;
【0043】
エネルギー閾値Ethrは、多くの発話コーパスによる、無声発話と有声発話との間を区別することが可能な、定数として決定される。例えば、Ethr=1638であり、これは約32dBである。H、L、α、βは経験的な定数であり、代表的なトレーニングデータを使用することによる、トレーニングを介して取得されてもよく、トレーニングは最終的な符号器性能によって評価される。例えば、H=1.001、L=1.002、α=β=−6×10-7である。
【0044】
他の実施形態では、フレーム信号は、フレームエネルギーパラメータEnerとエネルギー閾値Ethrとに従って、高エネルギーフレーム信号と低エネルギーフレーム信号とに分類され、次に、それに応じて白色雑音補正率winlag(0)が調節される。
if(Ener<Ethr)
winlag(0)=L+β*(Ener+Ethr);
else
winlag(0)=H+α*(Ener+Ethr);
【0045】
エネルギー閾値Ethrは、多くの発話コーパスによる、無声発話と有声発話との間を区別することが可能な、定数として決定される。フレーム長による影響を考慮して、異なるフレーム長に対して異なるエネルギー閾値が設定されてもよく、例えば、
【数6】
である。H、L、α、βは経験的な定数であり、代表的なトレーニングデータを使用することによるトレーニングを介して取得されてもよく、トレーニングは最終的な符号器性能によって評価される。例えば、H=1.0028、L=1.0018、α=β=−2-14
である。
【0046】
ステップ205:拡張帯域幅f0に従って、ラグウィンドウwinlag(k)を計算する。
winlag(k)=exp[(−1/2)(2πf0k/fs)2]
k=1,...,p
上式で、f0は、34Hzなどの、拡張帯域幅であり、fsは、8000Hzなどの、信号標本化周波数であり、pは、LPの次数である。
【0047】
ステップ206:元の自己相関係数r(k)と、調節された白色雑音補正率winlag
(0)と、ラグウィンドウwinlag(k)とに従って、自己相関係数補正率が調節された後の修正された自己相関係数r(0)’...r(k)’を計算する。
r(0)’=winlag(0)r(0)
r(k)’ =winlag(k)r(k) k=1,...,p
【0048】
ステップ207:修正された自己相関係数r(0)’...r(k)’を使用して、LP係数を、レビンソン−ダービンアルゴリズムを介して計算する。
【0049】
ステップ208:LP係数に従って、入力信号を符号化し、符号化されたビットストリームを出力する。LP係数に従って、入力信号に対して圧縮符号化を実行することは、LP分析を介して入力信号の残留信号を計算し、次に、LTPとエントロピー符号化とを実行し、最後に、残留信号のロスレス符号化されたビットストリームを出力することであってもよく、又は、LP係数と入力信号とをCELPモデルに入力して、符号化されたビットストリームを取得することであってもよい。
【0050】
この実施形態における技術的解決法を使用すれば、入力信号の特徴を示すエネルギーパラメータが、元の自己相関係数を介して計算され、エネルギーパラメータに従って、白色雑音補正率が調節され、その結果、調節された自己相関係数補正率が各フレーム信号の特徴に従って決定される。従って、LP係数は、信号の特徴に、より正確に適合し、不良条件の場合が回避され、計算される係数はよりロバストであり、計算複雑度は低い。
【0051】
第3の実施形態
図3は、本発明の第3の実施形態における信号圧縮方法のフローチャートである。該方法は以下のステップを含む。
【0052】
ステップ301:入力信号にウィンドウ関数を掛ける。ここでのウィンドウは、従来技術においてロッシー符号化に適用されるウィンドウであってもよい。入力信号s(n)にウィンドウ関数win(n)が掛けられ、ウィンドウ処理された入力信号s’(n)が取得される。
s’(n)=win(n)s(n) n=0,...,N−1
ここで、Nはフレーム長
【0053】
ステップ302:ウィンドウ処理された入力信号s’(n)に従って、元の自己相関係数r(k)を、例えば以下の式を介して計算する。
【数7】
k=0,...,p、ここで、pはLPの次数
【0054】
ステップ303:白色雑音補正率を、winlag(0)=1.0001であると決定す
る。
【0055】
ステップ304:元の自己相関係数に従って、ウィンドウ処理された入力信号の少なくとも1つの反射係数を計算する。この実施形態では、計算を簡素化するために、第1の反射係数のみが計算されるが、本発明は第1の反射係数のみを計算することに限定されない。反射係数は、レビンソン−ダービン再帰アルゴリズムを介して計算されてもよい。
【数8】
【0056】
この再帰アルゴリズムを介して、ki=−ki’ i=1,...,pが計算され、ここで、k1=r(1)/r(0)である。
【0057】
ステップ305:例えばk1などの、少なくとも1つの反射係数に従って、拡張帯域幅f0を適応的に計算し、調節する。
f0=F+αk1、ここで、Fは60Hzなどの定数であってもよく、αは、代表的なトレーニングデータを使用することによるトレーニングを介して取得されてもよい、調整拡張因子(regulating expansion factor)であり、トレーニングは最終的な符号器性能によって評価される。例えば、α=10である。
【0058】
ステップ306:拡張帯域幅f0に従って、ラグウィンドウを計算する。
winlag(k)=exp[(−1/2)(2πf0k/fs)2]
k=1,...,p
上式で、f0はステップ305で計算された拡張帯域幅であり、fsは8000Hzなどの信号標本化周波数であり、pはLPの次数である。
【0059】
ステップ307:元の自己相関係数r(k)と、白色雑音補正率winlag(0)と、ラグウィンドウwinlag(k)とに従って、自己相関係数補正率が調節された後の修正された自己相関係数r(0)’...r(k)’を計算する。
r(0)’=winlag(0)r(0)
r(k)’ =winlag(k)r(k) k=1,...,p
【0060】
ステップ308:修正された自己相関係数r(0)’...r(k)’を使用して、LP係数を、レビンソン−ダービンアルゴリズムを介して計算する。
【0061】
ステップ309:LP係数に従って入力信号を符号化し、符号化されたビットストリームを出力する。LP係数に従って入力信号を符号化することは、LP係数と入力信号とをCELPモデルに入力して、符号化されたビットストリームを取得することであってもよく、又は、LP分析を介して入力信号の残留信号を計算し、次に、LTPとエントロピー符号化とを実行し、最後に、残留信号のロスレス符号化されたビットストリームを出力することであってもよい。
【0062】
この実施形態における技術的解決法を使用すれば、入力信号の特徴を示す反射係数が、元の自己相関係数を介して計算され、反射係数に従って拡張帯域幅が決定されて、ラグウィンドウが調節され、その結果、調節された自己相関係数補正率が各フレーム信号の特徴に従って決定される。従って、LP係数は、信号の特徴により正確に適合し、不良条件の場合が回避され、計算される係数はよりロバストであり、計算複雑度は低い。
【0063】
第4の実施形態
図4は、本発明の第4の実施形態における信号圧縮方法のフローチャートである。方法は以下のステップを含む。
【0064】
ステップ401:入力信号にウィンドウ関数を掛ける。ここでのウィンドウは、従来技術においてロッシー符号化に適用されるウィンドウであってもよい。入力信号s(n)にウィンドウ関数win(n)が掛けられ、ウィンドウ処理された入力信号s’(n)が取得される。
s’(n)=win(n)s(n) n=0,...,N−1
ここで、Nはフレーム長
【0065】
ステップ402:ウィンドウ処理された入力信号s’(n)に従って、元の自己相関係数r(k)を、例えば以下の式を介して計算する。
【数9】
k=0,...,p、ここで、pはLPの次数
【0066】
ステップ403:元の自己相関係数に従って、エネルギーパラメータを計算する。
【0067】
いくつかの実施形態では、元の自己相関係数の第1の係数r(0)に従って、フレーム平均エネルギーが計算されてもよい。
Ener_avg=r(0)/N、ここで、Nはフレーム長。
【0068】
他の実施形態では、元の自己相関係数の第1の係数r(0)に従って、フレームエネルギーパラメータが計算されてもよい。
【数10】
上式で、
【数11】
は、端数を切り捨てることを意味し、すなわち、
【数12】
である。
【0069】
ステップ404:エネルギーパラメータに従って、白色雑音補正率を調節する。
【0070】
この実施形態では、エネルギー閾値Ethrが設定されてもよい。エネルギーパラメータEとEthrとの関係に従って入力信号が区別される。異なる入力信号に対して、異なる調節関数が、白色雑音補正率を調節するために使用される。具体的には、エネルギーパラメータが分布する異なるエネルギー閾値間隔に従って、異なる調節関数が、白色雑音補正率を調節するために使用される。
【数13】
【0071】
いくつかの実施形態では、フレーム信号は、フレーム平均エネルギーEner_avgとエネルギー閾値Ethrとに従って、高エネルギーフレーム信号と低エネルギーフレーム信号とに分類され、次に、それに応じて白色雑音補正率winlag(0)が調節される。
if(Ener_avg>=Ethr)
winlag(0)=H+α*Ener_avg;
else
winlag(0)=L+β*Ener_avg;
ここで、Ethr、H、L、α、βは、特定の条件に従って取得されてもよい、経験的な定数である。
【0072】
他の実施形態では、フレーム信号は、フレームエネルギーパラメータEnerとエネルギー閾値Ethrとに従って、高エネルギーフレーム信号と低エネルギーフレーム信号とに分類され、次に、それに応じて白色雑音補正率winlag(0)が調節される。
if(Ener<Ethr)
winlag(0)=L+β*(Ener+Ethr);
else
winlag(0)=H+α*(Ener+Ethr);
ここで、Ethr、H、L、α、βは、特定の条件に従って取得されてもよい、経験的な定数である。
【0073】
ステップ405:元の自己相関係数に従って、ウィンドウ処理された入力信号の少なくとも1つの反射係数を計算する。この実施形態では、計算を簡素化するために第1の反射係数のみが計算されるが、本発明は第1の反射係数のみを計算することに限定されない。
k1=r(1)/r(0)
【0074】
ステップ406:例えばk1などの、少なくとも1つの反射係数に従って、拡張帯域幅f0を適応的に計算し調節する。
f0=F+αk1
ここで、Fは、60Hzなどの定数であってもよく、αは、代表的なトレーニングデータを使用することによる、トレーニングを介して取得されてもよい、調整拡張因子であり、トレーニングは最終的な符号器性能によって評価される。例えば、α=10である。
【0075】
ステップ407:拡張帯域幅f0に従って、ラグウィンドウを計算する。
winlag(k)=exp[(−1/2)(2πf0k/fs)2]
k=1,...,p
上式で、f0はステップ406で計算された拡張帯域幅であり、fsは8000Hzなどの信号標本化周波数であり、pはLPの次数である。
【0076】
ステップ408:元の自己相関係数r(k)と、調節された白色雑音補正率winlag(0)と、ラグウィンドウwinlag(k)とに従って、自己相関係数補正率が調節された後の修正された自己相関係数を計算する。
r(0)’=winlag(0)r(0)
r(k)’ =winlag(k)r(k) k=1,...,p
【0077】
ステップ409:修正された自己相関係数r(0)’...r(k)’を使用して、LP係数を、レビンソン−ダービンアルゴリズムを介して計算する。
【0078】
ステップ410:LP係数に従って入力信号を符号化し、符号化されたビットストリームを出力する。LP係数に従って入力信号を符号化することは、LP分析を介して入力信号の残留信号を計算し、次に、LTPとエントロピー符号化とを実行し、最後に、残留信号のロスレス符号化されたビットストリームを出力することであってもよく、又は、LP係数と入力信号とをCELPモデルに入力して、符号化されたビットストリームを取得することであってもよい。
【0079】
この実施形態における技術的解決法を使用すれば、入力信号の特徴を示すエネルギーパラメータと反射係数とが、元の自己相関係数を介して計算され、エネルギーパラメータに従って白色雑音補正率が調節され、反射係数に従って拡張帯域幅が決定されて、ラグウィンドウが調節され、その結果、調節された自己相関係数補正率が各フレーム信号の特徴に従って決定される。従って、LP係数は、信号の特徴により正確に適合し、不良条件の場合が回避され、計算される係数はよりロバストであり、計算複雑度は低い。
【0080】
第5の実施形態
図5は、本発明の第5の実施形態における信号圧縮装置の構成を示す。装置は、
入力信号にウィンドウ関数を掛けるように構成された、ウィンドウ処理ユニット501と、
ウインドウ処理ユニット501によって処理された入力信号の、元の自己相関係数を計算するように構成された、元の自己相関係数計算ユニット502と、
元の自己相関係数計算ユニット502によって計算された元の自己相関係数に従って、自己相関係数補正率を調節し、元の自己相関係数と、調節された自己相関係数補正率とに従って、修正された自己相関係数を計算するように構成された、帯域幅拡張ユニット503と、
帯域幅拡張ユニット503によって計算された、修正された自己相関係数に従って、LP係数を計算するように構成された、線形予測係数計算ユニット504と、
線形予測係数計算ユニット504によって計算されたLP係数に従って、入力信号を符号化し、符号化されたビットストリームを出力するように構成された、圧縮ユニット505とを含む。
【0081】
本発明の別の実施形態では、装置は、入力信号を後続のモジュールによって処理されるのにより適したものとするために、様々なタイプの圧縮用に入力信号を前処理し、前処理された入力信号をウィンドウ処理ユニット501に送信するように構成された、前処理ユニット500を更に含んでもよい。ロッシー圧縮のためには、前処理ユニットは、入力信号の高周波成分を増加させるように、又は、不必要な低周波干渉成分を除去するように構成された、プリエンファシスフィルタ又はハイパスフィルタであってもよい。その後、フィルタ処理された信号は、ウィンドウ処理ユニット501に入力される。ロスレス圧縮のためには、前処理ユニットは、入力信号をA則又はμ則からPCM領域にマッピングするマッピングモジュールであってもよい。PCM領域内の信号は、LP短期予測のためにより適している。
【0082】
上記の実施形態における技術的解決法を使用すれば、元の自己相関係数は、各フレーム信号の特徴を反映し、そのような特徴に従って自己相関係数補正率が調節され、その結果、調節された自己相関係数補正率が各フレーム信号の特徴に従って決定される。従って、LP係数は、信号の特徴により正確に適合し、不良条件の場合が回避され、計算される係数はよりロバストであり、計算複雑度は低い。
【0083】
第6の実施形態
図6は、本発明の第6の実施形態における信号圧縮装置の構成を示す。該装置は、ウィンドウ処理ユニット601と、元の自己相関係数計算ユニット602と、帯域幅拡張ユニット603と、LP係数計算ユニット604と、LP予測ユニット605と、LTP処理ユニット606と、エントロピー符号化ユニット607とを含む。
【0084】
ウィンドウ処理ユニット601は、入力信号にウィンドウ関数を掛けるように構成される。ウィンドウ処理ユニット601は、従来技術においてロッシー符号化に適用されるウィンドウ処理ユニットであってもよい。入力信号s(n)にウィンドウ関数win(n)が掛けられて、ウィンドウ処理された入力信号s’(n)が取得される。
s’(n)=win(n)s(n) n=0,...,N−1
ここで、Nはフレーム長
【0085】
元の自己相関係数計算ユニット602は、ウインドウ処理ユニット601によって処理された入力信号の、元の自己相関係数を、例えば以下の式を介して計算するように構成される。
【数14】
k=0,...,p、ここで、pはLPの次数
【0086】
図7に示すように、帯域幅拡張ユニット603は、エネルギーモジュール701と、白色雑音補正率モジュール702と、ラグウィンドウモジュール703と、修正された自己相関係数計算モジュール704とを含んでもよい。
【0087】
エネルギーモジュール701は、元の自己相関係数に従ってエネルギーパラメータを計算するように構成される。
【0088】
いくつかの実施形態では、エネルギーモジュール701は、元の自己相関係数の第1の係数r(0)に従って、フレーム平均エネルギーを計算してもよい。 Ener_avg=r(0)/N、ここで、Nはフレーム長
【0089】
他の実施形態では、エネルギーモジュール701は、元の自己相関係数の第1の係数r(0)に従って、フレームエネルギーパラメータEnerを計算してもよい。
【数15】
上式で、
【数16】
は、端数を切り捨てることを意味し、すなわち、
【数17】
である。
【0090】
白色雑音補正率モジュール702は、エネルギーモジュール701によって計算されたエネルギーパラメータに従って、白色雑音補正率を調節するように構成される。
【0091】
この実施形態では、エネルギー閾値Ethrが設定されてもよい。エネルギーパラメータEとEthrとの関係に従って入力信号が区別される。異なる入力信号に対して異なる調節関数が、白色雑音補正率を調節するために使用される。具体的には、エネルギーパラメータが分布する異なるエネルギー閾値間隔に従って、異なる調節関数が白色雑音補正率を調節するために使用される。
【数18】
【0092】
いくつかの実施形態では、白色雑音補正率モジュール702は、フレーム平均エネルギーEner_avgとエネルギー閾値Ethrとに従って、フレーム信号を高エネルギーフレーム信号と低エネルギーフレーム信号とに分類し、次に、それに応じて白色雑音補正率winlag(0)を調節してもよい。
if(Ener_avg>=Ethr)
winlag(0)=H+α*Ener_avg;
else
winlag(0)=L+β*Ener_avg;
ここで、Ethr、H、L、α、βは、特定の条件に従って取得されてもよい経験的な定数である。
【0093】
他の実施形態では、白色雑音補正率モジュール702は、フレームエネルギーパラメータEnerとエネルギー閾値Ethrとに従って、フレーム信号を高エネルギーフレーム信号と低エネルギーフレーム信号とに分類し、次に、それに応じて白色雑音補正率winlag(0)を調節してもよい。
if(Ener<Ethr)
winlag(0)=L+β*(Ener+Ethr);
else
winlag(0)=H+α*(Ener+Ethr);
ここで、H、L、α、βは、特定の条件に従って取得されてもよい経験的な定数である。
【0094】
ラグウィンドウモジュール703は、拡張帯域幅f0に従って、ラグウィンドウwinlag(k)を計算するように構成される。
winlag(k)=exp[(−1/2)(2πf0k/fs)2]
k=1,...,p
上式で、f0は34Hzなどの拡張帯域幅であり、fsは8000Hzなどの信号標本化周波数であり、pはLPの次数である。
【0095】
修正された自己相関係数計算モジュール704は、元の自己相関係数r(k)と、調節された白色雑音補正率winlag(0)と、ラグウィンドウwinlag(k)とに従って、自己相関係数補正率が調節された後の修正された自己相関係数を計算するように構成される。
r(0)’=winlag(0)r(0)
r(k)’ =winlag(k)r(k) k=1,...,p’
【0096】
LP係数計算ユニット604は、帯域幅拡張ユニット603によって調節された、修正された自己相関係数r(0)’...r(k)’に従って、LP係数を、レビンソン−ダービンアルゴリズムを介して計算するように構成される。
【0097】
LP予測ユニット605は、LP係数計算ユニット604によって計算されたLP係数に従って、入力信号に対してLP分析を実行して、残留信号を計算するように構成される。
【0098】
LTP処理ユニット606は、LP予測ユニット605によって出力された残留信号に対して、LTPを実行するように構成される。
【0099】
エントロピー符号化ユニット607は、LTP処理ユニット606によって、長期予測の後で出力された信号に対して、エントロピー符号化を実行し、残留信号のロスレス符号化されたビットストリームを出力するように構成される。
【0100】
LP予測ユニット605、LTP処理ユニット606、及びエントロピー符号化ユニット607は、従来技術において適用される機能ユニットであってもよい。
【0101】
この実施形態における技術的解決法を使用すれば、入力信号の特徴を示すエネルギーパラメータが元の自己相関係数を介して計算され、エネルギーパラメータに従って白色雑音補正率が調節され、その結果、調節された自己相関係数補正率が各フレーム信号の特徴に従って決定される。従って、LP係数は、信号の特徴により正確に適合し、不良条件の場合が回避され、計算される係数はよりロバストであり、計算複雑度は低い。
【0102】
第7の実施形態
図8は、本発明の第7の実施形態における信号圧縮装置の構成を示す。該装置は、ウィンドウ処理ユニット801と、元の自己相関係数計算ユニット802と、帯域幅拡張ユニット803と、LP係数計算ユニット804と、CELP符号化ユニット805とを含む。
【0103】
ウィンドウ処理ユニット801は、入力信号にウィンドウ関数を掛けるように構成される。ウィンドウ処理ユニット801は、従来技術においてロッシー符号化に適用されるウィンドウ処理ユニットであってもよい。入力信号s(n)にウィンドウ関数win(n)が掛けられて、ウィンドウ処理された入力信号s’(n)が取得される。
s’(n)=win(n)s(n) n=0,...,N−1
ここで、Nはフレーム長
【0104】
元の自己相関係数計算ユニット802は、ウインドウ処理ユニット801によって処理された入力信号の元の自己相関係数を、例えば以下の式を介して計算するように構成される。
【数19】
k=0,...,p
ここで、pはLPの次数
【0105】
図9に示すように、帯域幅拡張ユニット803は、白色雑音補正率モジュール901と、反射係数計算モジュール902と、拡張帯域幅計算モジュール903と、ラグウィンドウモジュール904と、修正された自己相関係数計算モジュール905とを含んでもよい。
【0106】
白色雑音補正率モジュール901は、白色雑音補正率winlag(0)=1.0001を決定するように構成される。
【0107】
反射係数計算モジュール902は、元の自己相関係数に従って、フレーム信号の少なくとも1つの反射係数を計算するように構成される。この実施形態では、計算を簡素化するために第1の反射係数のみが計算されるが、本発明は第1の反射係数のみを計算することに限定されない。
k1=r(1)/r(0)
【0108】
拡張帯域幅計算モジュール903は、反射係数計算モジュール902によって計算された反射係数k1に従って拡張帯域幅を適応的に計算し、調節するように構成される。
f0=F+αk1
ここで、Fは60Hzであってもよく、αは実験的に決定される経験的因子である。
【0109】
ラグウィンドウモジュール904は、拡張帯域幅計算モジュール903によって出力された拡張帯域幅f0に従って、ラグウィンドウを計算するように構成される。
winlag(k)=exp[(−1/2)(2πf0k/fs)2]
k=1,...,p
上式で、f0は拡張帯域幅計算モジュール903によって計算された拡張帯域幅であり、fsは8000Hzなどの信号標本化周波数であり、pはLPの次数である。
【0110】
修正された自己相関係数計算モジュール905は、元の自己相関係数r(k)と、白色雑音補正率winlag(0)と、ラグウィンドウwinlag(k)とに従って、自己相関係数補正率が調節された後の修正された自己相関係数を計算するように構成される。
r(0)’=winlag(0)r(0)
r(k)’ =winlag(k)r(k) k=1,...,p
【0111】
LP係数計算ユニット804は、帯域幅拡張ユニット803によって調節された、修正された自己相関係数r(0)’...r(k)’に従って、LP係数を、レビンソン−ダービンアルゴリズムを介して計算するように構成される。
【0112】
CELP符号化ユニット805は、LP係数計算ユニット804によって計算されたLP係数と、入力信号とを、CELPモデルに入力して、符号化されたビットストリームを取得するように構成される。
【0113】
図10に示すように、別の実施形態における帯域幅拡張ユニットは、エネルギーモジュール1001と、白色雑音補正率モジュール1002と、反射係数計算モジュール1003と、拡張帯域幅計算モジュール1004と、ラグウィンドウモジュール1005と、修正された自己相関係数計算モジュール1006とを含んでもよい。図10に示す帯域幅拡張ユニットは、第6の実施形態における帯域幅拡張ユニット603、及び第7の実施形態における帯域幅拡張ユニット803の代替であってもよく、帯域幅拡張ユニット603は、第7の実施形態において、帯域幅拡張ユニット803に取って代わるために適用されてもよく、帯域幅拡張ユニット803は、第6の実施形態において、帯域幅拡張ユニット603に取って代わるために適用されてもよい。
【0114】
エネルギーモジュール1001は、元の自己相関係数に従って、エネルギーパラメータを計算するように構成される。
【0115】
いくつかの実施形態では、エネルギーモジュール1001は、元の自己相関係数の第1の係数r(0)に従って、フレーム平均エネルギーを計算してもよい。
Ener_avg=r(0)/N ここで、Nはフレーム長
【0116】
他の実施形態では、エネルギーモジュール1001は、元の自己相関係数の第1の係数r(0)に従って、フレームエネルギーパラメータEnerを計算してもよい。
【数20】
上式で、
【数21】
は、端数を切り捨てることを意味し、すなわち、
【数22】
である。
【0117】
白色雑音補正率モジュール1002は、エネルギーモジュール1001によって計算されたエネルギーパラメータに従って、白色雑音補正率を調節するように構成される。
【0118】
この実施形態では、エネルギー閾値Ethrが設定されてもよい。エネルギーパラメータEとEthrとの関係に従って入力信号が区別される。異なる入力信号に対して、異なる調節関数が白色雑音補正率を調節するために使用される。具体的には、エネルギーパラメータが分布する異なるエネルギー閾値間隔に従って、異なる調節関数が白色雑音補正率を調節するために使用される。
【数23】
【0119】
いくつかの実施形態では、白色雑音補正率モジュール1002は、フレーム平均エネルギーEner_avgとエネルギー閾値Ethrとに従って、フレーム信号を高エネルギーフレーム信号と低エネルギーフレーム信号とに分類し、次に、それに応じて白色雑音補正率winlag(0)を調節してもよい。
if(Ener_avg>=Ethr)
winlag(0)=H+α*Ener_avg;
else
winlag(0)=L+β*Ener_avg;
ここで、Ethr、H、L、α、βは、特定の条件に従って取得されてもよい経験的な定数である。
【0120】
他の実施形態では、白色雑音補正率モジュール1002は、フレームエネルギーパラメータEnerとエネルギー閾値Ethrとに従って、フレーム信号を、高エネルギーフレーム信号と低エネルギーフレーム信号とに分類し、次に、それに応じて白色雑音補正率winlag(0)を調節してもよい。
if(Ener<Ethr)
winlag(0)=L+β*(Ener+Ethr);
else
winlag(0)=H+α*(Ener+Ethr);
ここで、H、L、α、βは、特定の条件に従って取得されてもよい経験的な定数である。
【0121】
反射係数計算モジュール1003は、元の自己相関係数に従って、フレーム信号の少なくとも1つの反射係数を計算するように構成される。この実施形態では、計算を簡素化するために、第1の反射係数のみが計算されるが、本発明は第1の反射係数のみを計算することに限定されない。
k1=r(1)/r(0)
【0122】
拡張帯域幅計算モジュール1004は、反射係数計算モジュール1003によって計算された反射係数k1に従って、拡張帯域幅を適応的に計算し調節するように構成される。
f0=F+αk
ここで、Fは60Hzであってもよく、αは実験的に決定される経験的因子である。
【0123】
ラグウィンドウモジュール1005は、拡張帯域幅計算モジュール1004によって出力された拡張帯域幅f0に従って、ラグウィンドウを計算するように構成される。
winlag(k)=exp[(−1/2)(2πf0k/fs)2]
k=1,...,p
上式で、f0は拡張帯域幅計算モジュール1004によって計算された拡張帯域幅であり、fsは8000Hzなどの信号標本化周波数であり、pはLPの次数である。
【0124】
修正された自己相関係数計算モジュール1006は、元の自己相関係数r(k)と、白色雑音補正率winlag(0)と、ラグウィンドウwinlag(k)とに従って、自己相関係数補正率が調節された後の修正された自己相関係数を計算するように構成される。
r(0)’=winlag(0)r(0)
r(k)’ =winlag(k)r(k) k=1,...,p
【0125】
上記の実施形態における技術的解決法を使用すれば、入力信号の特徴を示すエネルギーパラメータと反射係数とが元の自己相関係数を介して計算され、エネルギーパラメータに従って白色雑音補正率が調節され、反射係数に従って拡張帯域幅が決定されて、ラグウィンドウが調節され、その結果、調節された自己相関係数補正率が各フレーム信号の特徴に従って決定される。従って、LP係数は、信号の特徴により正確に適合し、不良条件の場合が回避され、計算される係数はよりロバストであり、計算複雑度は低い。
【0126】
本発明の実施形態では、LP係数は、レビンソン−ダービンアルゴリズム、共分散法、及び格子法などの多くのアルゴリズムを介して、修正された自己相関係数に従って計算される。上述の実施形態では、レビンソン−ダービンアルゴリズムを例として使用したが、本発明はアルゴリズムを限定しない。
【0127】
本発明の実施形態では、ウィンドウ処理された入力信号の複数の反射係数kiが、元の自己相関係数に従って計算されてもよく、次に、1つ以上の反射係数を介して拡張帯域幅が計算される。この場合、それに応じて拡張帯域幅の計算モードが変化してもよい。すなわち、複数の反射係数が、複数の調整拡張因子と共に使用されて、反射係数と拡張帯域幅との間の新たな式を生成する。本発明の実施形態では、反射係数と拡張帯域幅との間の例示的な式を提供したが、当業者は、創造的な作業なしに、本明細書に記載した実施形態から、反射係数と拡張帯域幅との間の様々な式を導き出すことが可能である。本発明は、反射係数と拡張帯域幅との間の式を限定しない。具体的には、各反射係数に対応する調整拡張因子が、代表的なトレーニングデータを使用することによる、トレーニングを介して取得されてもよく、トレーニングは最終的な符号器性能によって評価され、次に、反射係数と拡張帯域幅との間の様々な式が構築される。
【0128】
上記の実施形態のステップの全て又は一部は、コンピュータプログラムによって命令されるハードウェアによって実施されてもよいということを、当業者は理解できる。プログラムは、コンピュータ読み取り可能な記憶媒体内に記憶されてもよい。実行される場合、プログラムは、上記の実施形態に包含される処理を実行する。記憶媒体は、磁気ディスク、コンパクトディスク、読み取り専用メモリ(ROM)、又はランダムアクセスメモリ(RAM)であってもよい。
【0129】
本発明の実施形態の目的、技術的解決法、及び利点について、上記で詳細に説明した。本発明について、いくつかの例示的実施形態を介して説明してきたが、本発明はそのような実施形態に限定されない。当業者が、本発明の範囲から逸脱することなく、本発明に対して修正及び変形を行うことが可能であることは明白である。本発明は、それらの修正及び変形を、それらが特許請求の範囲又はその均等物によって規定される保護範囲に入るならば、包含することを意図するものである。
【技術分野】
【0001】
本発明は、可聴音(オーディオ、音声)圧縮に関し、特に、信号圧縮方法及び装置に関する。
【背景技術】
【0002】
発話(スピーチ)及び音声(オーディオ)信号を伝送及び記憶するための帯域幅を節約するために、発話及び音声符号化技術が広く適用されている。現在、これらの符号化技術は、主として、ロッシー(lossy)符号化及びロスレス(lossless)符号化技術に分類さ
れる。
【0003】
線形予測(LP)分析は、ロスレス圧縮符号化において、入力信号のダイナミックレンジを減らすため、及び信号の近接標本点(near sample points)の冗長性をなくすために広く適用されているが、帯域幅拡張は、ロスレス符号化において一般的には適用されていない。
【0004】
ロッシー符号化であるG.729では、自己相関係数にラグウィンドウを掛けることによって、帯域幅拡張技術が適用される。LP分析をより安定させることを目的として、レビンソン−ダービンアルゴリズムによってLP係数を計算する前に、60Hzの帯域幅拡張が実行される。従来技術における、LP係数を計算するステップは、以下の通りである。
【0005】
1.入力信号にウィンドウ関数を掛け、自己相関係数を計算する。r(0)、r(1)...r(p)、ここで、pはLPの次数。
【0006】
2.自己相関係数の重み因子winlagを計算する。
winlag(k)=exp[(−1/2)(2πf0k/fs)2]
k=1,...,p
上式で、f0は、f0=60Hzなどの、定数であり、fsは、8000Hzなどの、信号標本化周波数であり、pは、LP分析の次数(10など)である。
【0007】
3:白色雑音補正率が、winlag(0)=1.0001であることを決定する。
【0008】
4.調節された自己相関係数を計算する。
r(0)’=winlag(0)r(0)
r(k)’ =winlag(k)r(k) k=1,...,p
【0009】
5.調節された自己相関係数を使用して、新たなLP係数を、レビンソン−ダービンアルゴリズムを介して計算する。
【0010】
従来技術では、各フレーム信号が同じように処理される。
【0011】
LP分析は、ロスレス圧縮符号化において、入力信号のダイナミックレンジを減らすため、及び信号の近接標本点の冗長性をなくすために広く適用されている。
【発明の概要】
【発明が解決しようとする課題】
【0012】
本発明を実施するプロセスにおいて、発明者は、従来技術における少なくとも以下の欠点を見出した。全ての信号が同じように処理されるため、一部の特殊な入力信号に対して、不良条件の場合が発生する可能性があり、自己相関行列の解決が不安定となり、これは、ロスレス符号器の低い圧縮効率と、ロッシー符号器の、再構築される発話信号の低い品質とをもたらす。
【課題を解決するための手段】
【0013】
本発明の実施形態は、異なる信号が信号特徴に従って異なるように処理され、それにより、特殊な入力信号によって生成される不良条件の場合が回避され、音声圧縮効率と、再構築される発話信号の品質とが向上するような、信号圧縮方法及び装置を提供する。
【0014】
信号圧縮方法は、
入力信号にウィンドウ関数を掛け、
ウィンドウ処理された入力信号の、元の自己相関係数を計算し、
元の自己相関係数に従って、自己相関係数補正率を調節し、
元の自己相関係数と、調節された自己相関係数補正率とに従って、修正された自己相関係数を計算し、
修正された自己相関係数に従って、線形予測係数を計算し、
線形予測係数に従って、入力信号を符号化し、符号化されたビットストリームを出力すること
を含む。
【0015】
別の信号圧縮方法は、
入力信号にウィンドウ関数を掛け、
ウィンドウ処理された入力信号の、元の自己相関係数を計算し、
元の自己相関係数の第1の係数に従って、エネルギーパラメータを計算し、エネルギーパラメータに従って、白色雑音補正率を調節し、
拡張帯域幅に従って、ラグウィンドウを計算し、
元の自己相関係数と、調節された白色雑音補正率と、ラグウィンドウとに従って、修正された自己相関係数を計算し、
修正された自己相関係数に従って、線形予測係数を計算し、
線形予測係数に従って、入力信号に対する線形予測を実行し、残留信号を計算し、残留信号を符号化し、符号化されたビットストリームを出力すること
を含む。
【0016】
信号圧縮装置は、
入力信号にウィンドウ関数を掛けるように構成された、ウィンドウ処理ユニットと、
ウインドウ処理ユニットによって処理された入力信号の、元の自己相関係数を計算するように構成された、元の自己相関係数計算ユニットと、
元の自己相関係数計算ユニットによって計算された元の自己相関係数に従って、自己相関係数補正率を調節し、元の自己相関係数と、調節された自己相関係数補正率とに従って、修正された自己相関係数を計算するように構成された、帯域幅拡張ユニットと、
帯域幅拡張ユニットによって計算された、修正された自己相関係数に従って、線形予測係数を計算するように構成された、線形予測係数計算ユニットと、
線形予測係数計算ユニットによって計算された線形予測係数に従って、入力信号を符号化し、符号化されたビットストリームを出力するように構成された、圧縮ユニットと
を含む。
【発明の効果】
【0017】
本発明の実施形態による技術的解決法では、元の自己相関係数に従って、自己相関補正率が調節され、その結果、調節された自己相関係数補正率は、入力信号の違いを表現することができ、それにより、特殊な入力信号の不良条件の場合が回避され、修正された自己相関係数が、後続の圧縮処理のためにより適したものとなり、ロスレス符号器の圧縮効率と、ロッシー符号器の、再構築される発話信号の品質とが向上し、単純な動作のみが含まれるようになる。
【0018】
添付の図面は、本発明を限定するものではなく、本発明のより良い理解を意図するものであり、本出願の一部を成す。
【図面の簡単な説明】
【0019】
【図1】本発明の第1の実施形態における信号圧縮方法のフローチャートである。
【図2】本発明の第2の実施形態における信号圧縮方法のフローチャートである。
【図3】本発明の第3の実施形態における信号圧縮方法のフローチャートである。
【図4】本発明の第4の実施形態における信号圧縮方法のフローチャートである。
【図5】本発明の第5の実施形態における信号圧縮装置の構成を示す。
【図6】本発明の第6の実施形態における信号圧縮装置の構成を示す。
【図7】本発明の第6の実施形態における信号圧縮装置の、帯域幅拡張ユニットの構成を示す。
【図8】本発明の第7の実施形態における信号圧縮装置の構成を示す。
【図9】本発明の第7の実施形態における信号圧縮装置の、帯域幅拡張ユニットの構成を示す。
【図10】本発明の第6又は第7の実施形態における帯域幅拡張ユニットの、別の構成を示す。
【発明を実施するための形態】
【0020】
本発明の技術的解決策、目的、及び利点を明確にするために、本発明について、添付の図面及び例示的実施形態を参照して以下で詳細に説明する。本発明の例示的実施形態及びその説明は、本発明を限定することではなく、解釈することを意図するものである。
【0021】
本発明の実施形態は、信号圧縮方法及び装置を提供する。本発明の実施形態について、添付の図面を参照して以下で詳細に説明する。
【0022】
第1の実施形態
図1は、本発明の第1の実施形態における信号圧縮方法のフローチャートである。方法は以下のステップを含む。
【0023】
ステップ101:入力信号にウィンドウ関数を掛ける。
【0024】
ステップ102:ウィンドウ処理された入力信号の、元の自己相関係数を計算する。
【0025】
ステップ103:元の自己相関係数に従って、自己相関係数補正率を調節する。
【0026】
ステップ104:元の自己相関係数と、調節された自己相関係数補正率とに従って、修正された自己相関係数を計算する。
【0027】
自己相関係数補正率は、白色雑音補正率とラグウィンドウとを含む。自己相関係数補正率を調節することは、白色雑音補正率とラグウィンドウとを調節すること、又は、白色雑音補正率のみを調節すること、又はラグウィンドウのみを調節することであってもよい。
【0028】
元の自己相関係数に従って、自己相関係数補正率を調節することは、元の自己相関係数に従って、入力信号の特徴パラメータを決定し、特徴パラメータに従って、自己相関係数補正率を調節することであってもよい。特徴パラメータは、エネルギー、周期性パラメータ、ゼロ交差レート、反射係数、又はそれらの任意の組み合わせであってもよく、かつ、元の入力信号から、又は任意のステップで取得された信号から抽出されてもよい。
【0029】
ステップ105:修正された自己相関係数に従って、LP係数を計算する。
【0030】
ステップ106:LP係数に従って、入力信号を符号化し、符号化されたビットストリームを出力する。
【0031】
LP係数に従って、入力信号を符号化することは、LP係数に従って入力信号に対するLP分析を実行し、残留信号を計算し、次に、長期予測(LTP)とエントロピー符号化とを実行し、最後に、残留信号のロスレス符号化されたビットストリームを出力することであってもよく、又は、LP係数と入力信号とを符号励振線形予測(CELP)モデルに入力して、ビットストリームを取得することであってもよい。
【0032】
本発明の別の実施形態では、前処理ステップが含まれてもよい。ステップ101の前に、入力信号は前処理される。ロッシー圧縮のためには、前処理は、入力信号の高周波成分を増加させるための、又は、不必要な低周波干渉成分を除去するための、プリエンファシスフィルタ処理又はハイパスフィルタ処理であってもよい。その後、フィルタ処理された信号は、ステップ101に従ってウィンドウ処理される。ロスレス圧縮のためには、前処理は、入力信号をA則又はμ則からパルス符号変調(PCM)領域にマッピングする、マッピング動作であってもよい。PCM領域内の信号は、LP短期予測のためにより適している。
【0033】
上記の実施形態における技術的解決法を使用すれば、元の自己相関係数は、各フレーム信号の特徴を反映し、そのような特徴に従って、自己相関係数補正率が調節され、その結果、調節された自己相関係数補正率が各フレーム信号の特徴に従って決定される。従って、LP係数は、信号の特徴により正確に適合し、不良条件の場合が回避され、計算される係数はよりロバストであり、計算複雑度は低い。
【0034】
第2の実施形態
図2は、本発明の第2の実施形態における信号圧縮方法のフローチャートである。方法は以下のステップを含む。
【0035】
ステップ201:入力信号にウィンドウ関数を掛ける。ここでのウィンドウは、従来技術においてロッシー符号化に適用されるウィンドウであってもよい。入力信号s(n)にウィンドウ関数win(n)が掛けられて、ウィンドウ処理された入力信号s’(n)が取得される。
s’(n)=win(n)s(n) n=0,...,N−1
ここで、Nはフレーム長
【0036】
ステップ202:ウィンドウ処理された入力信号s’(n)に従って、元の自己相関係数r(k)を、例えば以下の式を介して計算する。
【数1】
k=0,...,p、ここで、pはLPの次数
【0037】
ステップ203:元の自己相関係数に従って、エネルギーパラメータEを計算する。
【0038】
いくつかの実施形態では、元の自己相関係数の第1の係数r(0)に従って、フレーム平均エネルギーが計算されてもよい。
Ener_avg=r(0)/N、ここで、Nはフレーム長
【0039】
他の実施形態では、元の自己相関係数の第1の係数r(0)に従って、フレームエネルギーパラメータが計算されてもよい。
【数2】
上式で、
【数3】
は、端数を切り捨てることを意味し、すなわち、
【数4】
である。
【0040】
ステップ204:エネルギーパラメータに従って、白色雑音補正率を調節する。
【0041】
この実施形態では、エネルギー閾値Ethrが設定されてもよい。エネルギーパラメータEとEthrとの関係に従って、入力信号が区別される。異なる入力信号に対して、異なる調節関数が、白色雑音補正率を調節するために使用される。具体的には、エネルギーパラメータが分布する異なるエネルギー閾値間隔に従って、異なる調節関数が、白色雑音補正率を調節するために使用される。
【数5】
【0042】
いくつかの実施形態では、フレーム信号は、フレーム平均エネルギーEner_avgとエネルギー閾値Ethrとに従って、高エネルギーフレーム信号と低エネルギーフレーム信号とに分類され、次に、それに応じて白色雑音補正率winlag(0)が調節される。
if(Ener_avg>=Ethr)
winlag(0)=H+α*Ener_avg;
else
winlag(0)=L+β*Ener_avg;
【0043】
エネルギー閾値Ethrは、多くの発話コーパスによる、無声発話と有声発話との間を区別することが可能な、定数として決定される。例えば、Ethr=1638であり、これは約32dBである。H、L、α、βは経験的な定数であり、代表的なトレーニングデータを使用することによる、トレーニングを介して取得されてもよく、トレーニングは最終的な符号器性能によって評価される。例えば、H=1.001、L=1.002、α=β=−6×10-7である。
【0044】
他の実施形態では、フレーム信号は、フレームエネルギーパラメータEnerとエネルギー閾値Ethrとに従って、高エネルギーフレーム信号と低エネルギーフレーム信号とに分類され、次に、それに応じて白色雑音補正率winlag(0)が調節される。
if(Ener<Ethr)
winlag(0)=L+β*(Ener+Ethr);
else
winlag(0)=H+α*(Ener+Ethr);
【0045】
エネルギー閾値Ethrは、多くの発話コーパスによる、無声発話と有声発話との間を区別することが可能な、定数として決定される。フレーム長による影響を考慮して、異なるフレーム長に対して異なるエネルギー閾値が設定されてもよく、例えば、
【数6】
である。H、L、α、βは経験的な定数であり、代表的なトレーニングデータを使用することによるトレーニングを介して取得されてもよく、トレーニングは最終的な符号器性能によって評価される。例えば、H=1.0028、L=1.0018、α=β=−2-14
である。
【0046】
ステップ205:拡張帯域幅f0に従って、ラグウィンドウwinlag(k)を計算する。
winlag(k)=exp[(−1/2)(2πf0k/fs)2]
k=1,...,p
上式で、f0は、34Hzなどの、拡張帯域幅であり、fsは、8000Hzなどの、信号標本化周波数であり、pは、LPの次数である。
【0047】
ステップ206:元の自己相関係数r(k)と、調節された白色雑音補正率winlag
(0)と、ラグウィンドウwinlag(k)とに従って、自己相関係数補正率が調節された後の修正された自己相関係数r(0)’...r(k)’を計算する。
r(0)’=winlag(0)r(0)
r(k)’ =winlag(k)r(k) k=1,...,p
【0048】
ステップ207:修正された自己相関係数r(0)’...r(k)’を使用して、LP係数を、レビンソン−ダービンアルゴリズムを介して計算する。
【0049】
ステップ208:LP係数に従って、入力信号を符号化し、符号化されたビットストリームを出力する。LP係数に従って、入力信号に対して圧縮符号化を実行することは、LP分析を介して入力信号の残留信号を計算し、次に、LTPとエントロピー符号化とを実行し、最後に、残留信号のロスレス符号化されたビットストリームを出力することであってもよく、又は、LP係数と入力信号とをCELPモデルに入力して、符号化されたビットストリームを取得することであってもよい。
【0050】
この実施形態における技術的解決法を使用すれば、入力信号の特徴を示すエネルギーパラメータが、元の自己相関係数を介して計算され、エネルギーパラメータに従って、白色雑音補正率が調節され、その結果、調節された自己相関係数補正率が各フレーム信号の特徴に従って決定される。従って、LP係数は、信号の特徴に、より正確に適合し、不良条件の場合が回避され、計算される係数はよりロバストであり、計算複雑度は低い。
【0051】
第3の実施形態
図3は、本発明の第3の実施形態における信号圧縮方法のフローチャートである。該方法は以下のステップを含む。
【0052】
ステップ301:入力信号にウィンドウ関数を掛ける。ここでのウィンドウは、従来技術においてロッシー符号化に適用されるウィンドウであってもよい。入力信号s(n)にウィンドウ関数win(n)が掛けられ、ウィンドウ処理された入力信号s’(n)が取得される。
s’(n)=win(n)s(n) n=0,...,N−1
ここで、Nはフレーム長
【0053】
ステップ302:ウィンドウ処理された入力信号s’(n)に従って、元の自己相関係数r(k)を、例えば以下の式を介して計算する。
【数7】
k=0,...,p、ここで、pはLPの次数
【0054】
ステップ303:白色雑音補正率を、winlag(0)=1.0001であると決定す
る。
【0055】
ステップ304:元の自己相関係数に従って、ウィンドウ処理された入力信号の少なくとも1つの反射係数を計算する。この実施形態では、計算を簡素化するために、第1の反射係数のみが計算されるが、本発明は第1の反射係数のみを計算することに限定されない。反射係数は、レビンソン−ダービン再帰アルゴリズムを介して計算されてもよい。
【数8】
【0056】
この再帰アルゴリズムを介して、ki=−ki’ i=1,...,pが計算され、ここで、k1=r(1)/r(0)である。
【0057】
ステップ305:例えばk1などの、少なくとも1つの反射係数に従って、拡張帯域幅f0を適応的に計算し、調節する。
f0=F+αk1、ここで、Fは60Hzなどの定数であってもよく、αは、代表的なトレーニングデータを使用することによるトレーニングを介して取得されてもよい、調整拡張因子(regulating expansion factor)であり、トレーニングは最終的な符号器性能によって評価される。例えば、α=10である。
【0058】
ステップ306:拡張帯域幅f0に従って、ラグウィンドウを計算する。
winlag(k)=exp[(−1/2)(2πf0k/fs)2]
k=1,...,p
上式で、f0はステップ305で計算された拡張帯域幅であり、fsは8000Hzなどの信号標本化周波数であり、pはLPの次数である。
【0059】
ステップ307:元の自己相関係数r(k)と、白色雑音補正率winlag(0)と、ラグウィンドウwinlag(k)とに従って、自己相関係数補正率が調節された後の修正された自己相関係数r(0)’...r(k)’を計算する。
r(0)’=winlag(0)r(0)
r(k)’ =winlag(k)r(k) k=1,...,p
【0060】
ステップ308:修正された自己相関係数r(0)’...r(k)’を使用して、LP係数を、レビンソン−ダービンアルゴリズムを介して計算する。
【0061】
ステップ309:LP係数に従って入力信号を符号化し、符号化されたビットストリームを出力する。LP係数に従って入力信号を符号化することは、LP係数と入力信号とをCELPモデルに入力して、符号化されたビットストリームを取得することであってもよく、又は、LP分析を介して入力信号の残留信号を計算し、次に、LTPとエントロピー符号化とを実行し、最後に、残留信号のロスレス符号化されたビットストリームを出力することであってもよい。
【0062】
この実施形態における技術的解決法を使用すれば、入力信号の特徴を示す反射係数が、元の自己相関係数を介して計算され、反射係数に従って拡張帯域幅が決定されて、ラグウィンドウが調節され、その結果、調節された自己相関係数補正率が各フレーム信号の特徴に従って決定される。従って、LP係数は、信号の特徴により正確に適合し、不良条件の場合が回避され、計算される係数はよりロバストであり、計算複雑度は低い。
【0063】
第4の実施形態
図4は、本発明の第4の実施形態における信号圧縮方法のフローチャートである。方法は以下のステップを含む。
【0064】
ステップ401:入力信号にウィンドウ関数を掛ける。ここでのウィンドウは、従来技術においてロッシー符号化に適用されるウィンドウであってもよい。入力信号s(n)にウィンドウ関数win(n)が掛けられ、ウィンドウ処理された入力信号s’(n)が取得される。
s’(n)=win(n)s(n) n=0,...,N−1
ここで、Nはフレーム長
【0065】
ステップ402:ウィンドウ処理された入力信号s’(n)に従って、元の自己相関係数r(k)を、例えば以下の式を介して計算する。
【数9】
k=0,...,p、ここで、pはLPの次数
【0066】
ステップ403:元の自己相関係数に従って、エネルギーパラメータを計算する。
【0067】
いくつかの実施形態では、元の自己相関係数の第1の係数r(0)に従って、フレーム平均エネルギーが計算されてもよい。
Ener_avg=r(0)/N、ここで、Nはフレーム長。
【0068】
他の実施形態では、元の自己相関係数の第1の係数r(0)に従って、フレームエネルギーパラメータが計算されてもよい。
【数10】
上式で、
【数11】
は、端数を切り捨てることを意味し、すなわち、
【数12】
である。
【0069】
ステップ404:エネルギーパラメータに従って、白色雑音補正率を調節する。
【0070】
この実施形態では、エネルギー閾値Ethrが設定されてもよい。エネルギーパラメータEとEthrとの関係に従って入力信号が区別される。異なる入力信号に対して、異なる調節関数が、白色雑音補正率を調節するために使用される。具体的には、エネルギーパラメータが分布する異なるエネルギー閾値間隔に従って、異なる調節関数が、白色雑音補正率を調節するために使用される。
【数13】
【0071】
いくつかの実施形態では、フレーム信号は、フレーム平均エネルギーEner_avgとエネルギー閾値Ethrとに従って、高エネルギーフレーム信号と低エネルギーフレーム信号とに分類され、次に、それに応じて白色雑音補正率winlag(0)が調節される。
if(Ener_avg>=Ethr)
winlag(0)=H+α*Ener_avg;
else
winlag(0)=L+β*Ener_avg;
ここで、Ethr、H、L、α、βは、特定の条件に従って取得されてもよい、経験的な定数である。
【0072】
他の実施形態では、フレーム信号は、フレームエネルギーパラメータEnerとエネルギー閾値Ethrとに従って、高エネルギーフレーム信号と低エネルギーフレーム信号とに分類され、次に、それに応じて白色雑音補正率winlag(0)が調節される。
if(Ener<Ethr)
winlag(0)=L+β*(Ener+Ethr);
else
winlag(0)=H+α*(Ener+Ethr);
ここで、Ethr、H、L、α、βは、特定の条件に従って取得されてもよい、経験的な定数である。
【0073】
ステップ405:元の自己相関係数に従って、ウィンドウ処理された入力信号の少なくとも1つの反射係数を計算する。この実施形態では、計算を簡素化するために第1の反射係数のみが計算されるが、本発明は第1の反射係数のみを計算することに限定されない。
k1=r(1)/r(0)
【0074】
ステップ406:例えばk1などの、少なくとも1つの反射係数に従って、拡張帯域幅f0を適応的に計算し調節する。
f0=F+αk1
ここで、Fは、60Hzなどの定数であってもよく、αは、代表的なトレーニングデータを使用することによる、トレーニングを介して取得されてもよい、調整拡張因子であり、トレーニングは最終的な符号器性能によって評価される。例えば、α=10である。
【0075】
ステップ407:拡張帯域幅f0に従って、ラグウィンドウを計算する。
winlag(k)=exp[(−1/2)(2πf0k/fs)2]
k=1,...,p
上式で、f0はステップ406で計算された拡張帯域幅であり、fsは8000Hzなどの信号標本化周波数であり、pはLPの次数である。
【0076】
ステップ408:元の自己相関係数r(k)と、調節された白色雑音補正率winlag(0)と、ラグウィンドウwinlag(k)とに従って、自己相関係数補正率が調節された後の修正された自己相関係数を計算する。
r(0)’=winlag(0)r(0)
r(k)’ =winlag(k)r(k) k=1,...,p
【0077】
ステップ409:修正された自己相関係数r(0)’...r(k)’を使用して、LP係数を、レビンソン−ダービンアルゴリズムを介して計算する。
【0078】
ステップ410:LP係数に従って入力信号を符号化し、符号化されたビットストリームを出力する。LP係数に従って入力信号を符号化することは、LP分析を介して入力信号の残留信号を計算し、次に、LTPとエントロピー符号化とを実行し、最後に、残留信号のロスレス符号化されたビットストリームを出力することであってもよく、又は、LP係数と入力信号とをCELPモデルに入力して、符号化されたビットストリームを取得することであってもよい。
【0079】
この実施形態における技術的解決法を使用すれば、入力信号の特徴を示すエネルギーパラメータと反射係数とが、元の自己相関係数を介して計算され、エネルギーパラメータに従って白色雑音補正率が調節され、反射係数に従って拡張帯域幅が決定されて、ラグウィンドウが調節され、その結果、調節された自己相関係数補正率が各フレーム信号の特徴に従って決定される。従って、LP係数は、信号の特徴により正確に適合し、不良条件の場合が回避され、計算される係数はよりロバストであり、計算複雑度は低い。
【0080】
第5の実施形態
図5は、本発明の第5の実施形態における信号圧縮装置の構成を示す。装置は、
入力信号にウィンドウ関数を掛けるように構成された、ウィンドウ処理ユニット501と、
ウインドウ処理ユニット501によって処理された入力信号の、元の自己相関係数を計算するように構成された、元の自己相関係数計算ユニット502と、
元の自己相関係数計算ユニット502によって計算された元の自己相関係数に従って、自己相関係数補正率を調節し、元の自己相関係数と、調節された自己相関係数補正率とに従って、修正された自己相関係数を計算するように構成された、帯域幅拡張ユニット503と、
帯域幅拡張ユニット503によって計算された、修正された自己相関係数に従って、LP係数を計算するように構成された、線形予測係数計算ユニット504と、
線形予測係数計算ユニット504によって計算されたLP係数に従って、入力信号を符号化し、符号化されたビットストリームを出力するように構成された、圧縮ユニット505とを含む。
【0081】
本発明の別の実施形態では、装置は、入力信号を後続のモジュールによって処理されるのにより適したものとするために、様々なタイプの圧縮用に入力信号を前処理し、前処理された入力信号をウィンドウ処理ユニット501に送信するように構成された、前処理ユニット500を更に含んでもよい。ロッシー圧縮のためには、前処理ユニットは、入力信号の高周波成分を増加させるように、又は、不必要な低周波干渉成分を除去するように構成された、プリエンファシスフィルタ又はハイパスフィルタであってもよい。その後、フィルタ処理された信号は、ウィンドウ処理ユニット501に入力される。ロスレス圧縮のためには、前処理ユニットは、入力信号をA則又はμ則からPCM領域にマッピングするマッピングモジュールであってもよい。PCM領域内の信号は、LP短期予測のためにより適している。
【0082】
上記の実施形態における技術的解決法を使用すれば、元の自己相関係数は、各フレーム信号の特徴を反映し、そのような特徴に従って自己相関係数補正率が調節され、その結果、調節された自己相関係数補正率が各フレーム信号の特徴に従って決定される。従って、LP係数は、信号の特徴により正確に適合し、不良条件の場合が回避され、計算される係数はよりロバストであり、計算複雑度は低い。
【0083】
第6の実施形態
図6は、本発明の第6の実施形態における信号圧縮装置の構成を示す。該装置は、ウィンドウ処理ユニット601と、元の自己相関係数計算ユニット602と、帯域幅拡張ユニット603と、LP係数計算ユニット604と、LP予測ユニット605と、LTP処理ユニット606と、エントロピー符号化ユニット607とを含む。
【0084】
ウィンドウ処理ユニット601は、入力信号にウィンドウ関数を掛けるように構成される。ウィンドウ処理ユニット601は、従来技術においてロッシー符号化に適用されるウィンドウ処理ユニットであってもよい。入力信号s(n)にウィンドウ関数win(n)が掛けられて、ウィンドウ処理された入力信号s’(n)が取得される。
s’(n)=win(n)s(n) n=0,...,N−1
ここで、Nはフレーム長
【0085】
元の自己相関係数計算ユニット602は、ウインドウ処理ユニット601によって処理された入力信号の、元の自己相関係数を、例えば以下の式を介して計算するように構成される。
【数14】
k=0,...,p、ここで、pはLPの次数
【0086】
図7に示すように、帯域幅拡張ユニット603は、エネルギーモジュール701と、白色雑音補正率モジュール702と、ラグウィンドウモジュール703と、修正された自己相関係数計算モジュール704とを含んでもよい。
【0087】
エネルギーモジュール701は、元の自己相関係数に従ってエネルギーパラメータを計算するように構成される。
【0088】
いくつかの実施形態では、エネルギーモジュール701は、元の自己相関係数の第1の係数r(0)に従って、フレーム平均エネルギーを計算してもよい。 Ener_avg=r(0)/N、ここで、Nはフレーム長
【0089】
他の実施形態では、エネルギーモジュール701は、元の自己相関係数の第1の係数r(0)に従って、フレームエネルギーパラメータEnerを計算してもよい。
【数15】
上式で、
【数16】
は、端数を切り捨てることを意味し、すなわち、
【数17】
である。
【0090】
白色雑音補正率モジュール702は、エネルギーモジュール701によって計算されたエネルギーパラメータに従って、白色雑音補正率を調節するように構成される。
【0091】
この実施形態では、エネルギー閾値Ethrが設定されてもよい。エネルギーパラメータEとEthrとの関係に従って入力信号が区別される。異なる入力信号に対して異なる調節関数が、白色雑音補正率を調節するために使用される。具体的には、エネルギーパラメータが分布する異なるエネルギー閾値間隔に従って、異なる調節関数が白色雑音補正率を調節するために使用される。
【数18】
【0092】
いくつかの実施形態では、白色雑音補正率モジュール702は、フレーム平均エネルギーEner_avgとエネルギー閾値Ethrとに従って、フレーム信号を高エネルギーフレーム信号と低エネルギーフレーム信号とに分類し、次に、それに応じて白色雑音補正率winlag(0)を調節してもよい。
if(Ener_avg>=Ethr)
winlag(0)=H+α*Ener_avg;
else
winlag(0)=L+β*Ener_avg;
ここで、Ethr、H、L、α、βは、特定の条件に従って取得されてもよい経験的な定数である。
【0093】
他の実施形態では、白色雑音補正率モジュール702は、フレームエネルギーパラメータEnerとエネルギー閾値Ethrとに従って、フレーム信号を高エネルギーフレーム信号と低エネルギーフレーム信号とに分類し、次に、それに応じて白色雑音補正率winlag(0)を調節してもよい。
if(Ener<Ethr)
winlag(0)=L+β*(Ener+Ethr);
else
winlag(0)=H+α*(Ener+Ethr);
ここで、H、L、α、βは、特定の条件に従って取得されてもよい経験的な定数である。
【0094】
ラグウィンドウモジュール703は、拡張帯域幅f0に従って、ラグウィンドウwinlag(k)を計算するように構成される。
winlag(k)=exp[(−1/2)(2πf0k/fs)2]
k=1,...,p
上式で、f0は34Hzなどの拡張帯域幅であり、fsは8000Hzなどの信号標本化周波数であり、pはLPの次数である。
【0095】
修正された自己相関係数計算モジュール704は、元の自己相関係数r(k)と、調節された白色雑音補正率winlag(0)と、ラグウィンドウwinlag(k)とに従って、自己相関係数補正率が調節された後の修正された自己相関係数を計算するように構成される。
r(0)’=winlag(0)r(0)
r(k)’ =winlag(k)r(k) k=1,...,p’
【0096】
LP係数計算ユニット604は、帯域幅拡張ユニット603によって調節された、修正された自己相関係数r(0)’...r(k)’に従って、LP係数を、レビンソン−ダービンアルゴリズムを介して計算するように構成される。
【0097】
LP予測ユニット605は、LP係数計算ユニット604によって計算されたLP係数に従って、入力信号に対してLP分析を実行して、残留信号を計算するように構成される。
【0098】
LTP処理ユニット606は、LP予測ユニット605によって出力された残留信号に対して、LTPを実行するように構成される。
【0099】
エントロピー符号化ユニット607は、LTP処理ユニット606によって、長期予測の後で出力された信号に対して、エントロピー符号化を実行し、残留信号のロスレス符号化されたビットストリームを出力するように構成される。
【0100】
LP予測ユニット605、LTP処理ユニット606、及びエントロピー符号化ユニット607は、従来技術において適用される機能ユニットであってもよい。
【0101】
この実施形態における技術的解決法を使用すれば、入力信号の特徴を示すエネルギーパラメータが元の自己相関係数を介して計算され、エネルギーパラメータに従って白色雑音補正率が調節され、その結果、調節された自己相関係数補正率が各フレーム信号の特徴に従って決定される。従って、LP係数は、信号の特徴により正確に適合し、不良条件の場合が回避され、計算される係数はよりロバストであり、計算複雑度は低い。
【0102】
第7の実施形態
図8は、本発明の第7の実施形態における信号圧縮装置の構成を示す。該装置は、ウィンドウ処理ユニット801と、元の自己相関係数計算ユニット802と、帯域幅拡張ユニット803と、LP係数計算ユニット804と、CELP符号化ユニット805とを含む。
【0103】
ウィンドウ処理ユニット801は、入力信号にウィンドウ関数を掛けるように構成される。ウィンドウ処理ユニット801は、従来技術においてロッシー符号化に適用されるウィンドウ処理ユニットであってもよい。入力信号s(n)にウィンドウ関数win(n)が掛けられて、ウィンドウ処理された入力信号s’(n)が取得される。
s’(n)=win(n)s(n) n=0,...,N−1
ここで、Nはフレーム長
【0104】
元の自己相関係数計算ユニット802は、ウインドウ処理ユニット801によって処理された入力信号の元の自己相関係数を、例えば以下の式を介して計算するように構成される。
【数19】
k=0,...,p
ここで、pはLPの次数
【0105】
図9に示すように、帯域幅拡張ユニット803は、白色雑音補正率モジュール901と、反射係数計算モジュール902と、拡張帯域幅計算モジュール903と、ラグウィンドウモジュール904と、修正された自己相関係数計算モジュール905とを含んでもよい。
【0106】
白色雑音補正率モジュール901は、白色雑音補正率winlag(0)=1.0001を決定するように構成される。
【0107】
反射係数計算モジュール902は、元の自己相関係数に従って、フレーム信号の少なくとも1つの反射係数を計算するように構成される。この実施形態では、計算を簡素化するために第1の反射係数のみが計算されるが、本発明は第1の反射係数のみを計算することに限定されない。
k1=r(1)/r(0)
【0108】
拡張帯域幅計算モジュール903は、反射係数計算モジュール902によって計算された反射係数k1に従って拡張帯域幅を適応的に計算し、調節するように構成される。
f0=F+αk1
ここで、Fは60Hzであってもよく、αは実験的に決定される経験的因子である。
【0109】
ラグウィンドウモジュール904は、拡張帯域幅計算モジュール903によって出力された拡張帯域幅f0に従って、ラグウィンドウを計算するように構成される。
winlag(k)=exp[(−1/2)(2πf0k/fs)2]
k=1,...,p
上式で、f0は拡張帯域幅計算モジュール903によって計算された拡張帯域幅であり、fsは8000Hzなどの信号標本化周波数であり、pはLPの次数である。
【0110】
修正された自己相関係数計算モジュール905は、元の自己相関係数r(k)と、白色雑音補正率winlag(0)と、ラグウィンドウwinlag(k)とに従って、自己相関係数補正率が調節された後の修正された自己相関係数を計算するように構成される。
r(0)’=winlag(0)r(0)
r(k)’ =winlag(k)r(k) k=1,...,p
【0111】
LP係数計算ユニット804は、帯域幅拡張ユニット803によって調節された、修正された自己相関係数r(0)’...r(k)’に従って、LP係数を、レビンソン−ダービンアルゴリズムを介して計算するように構成される。
【0112】
CELP符号化ユニット805は、LP係数計算ユニット804によって計算されたLP係数と、入力信号とを、CELPモデルに入力して、符号化されたビットストリームを取得するように構成される。
【0113】
図10に示すように、別の実施形態における帯域幅拡張ユニットは、エネルギーモジュール1001と、白色雑音補正率モジュール1002と、反射係数計算モジュール1003と、拡張帯域幅計算モジュール1004と、ラグウィンドウモジュール1005と、修正された自己相関係数計算モジュール1006とを含んでもよい。図10に示す帯域幅拡張ユニットは、第6の実施形態における帯域幅拡張ユニット603、及び第7の実施形態における帯域幅拡張ユニット803の代替であってもよく、帯域幅拡張ユニット603は、第7の実施形態において、帯域幅拡張ユニット803に取って代わるために適用されてもよく、帯域幅拡張ユニット803は、第6の実施形態において、帯域幅拡張ユニット603に取って代わるために適用されてもよい。
【0114】
エネルギーモジュール1001は、元の自己相関係数に従って、エネルギーパラメータを計算するように構成される。
【0115】
いくつかの実施形態では、エネルギーモジュール1001は、元の自己相関係数の第1の係数r(0)に従って、フレーム平均エネルギーを計算してもよい。
Ener_avg=r(0)/N ここで、Nはフレーム長
【0116】
他の実施形態では、エネルギーモジュール1001は、元の自己相関係数の第1の係数r(0)に従って、フレームエネルギーパラメータEnerを計算してもよい。
【数20】
上式で、
【数21】
は、端数を切り捨てることを意味し、すなわち、
【数22】
である。
【0117】
白色雑音補正率モジュール1002は、エネルギーモジュール1001によって計算されたエネルギーパラメータに従って、白色雑音補正率を調節するように構成される。
【0118】
この実施形態では、エネルギー閾値Ethrが設定されてもよい。エネルギーパラメータEとEthrとの関係に従って入力信号が区別される。異なる入力信号に対して、異なる調節関数が白色雑音補正率を調節するために使用される。具体的には、エネルギーパラメータが分布する異なるエネルギー閾値間隔に従って、異なる調節関数が白色雑音補正率を調節するために使用される。
【数23】
【0119】
いくつかの実施形態では、白色雑音補正率モジュール1002は、フレーム平均エネルギーEner_avgとエネルギー閾値Ethrとに従って、フレーム信号を高エネルギーフレーム信号と低エネルギーフレーム信号とに分類し、次に、それに応じて白色雑音補正率winlag(0)を調節してもよい。
if(Ener_avg>=Ethr)
winlag(0)=H+α*Ener_avg;
else
winlag(0)=L+β*Ener_avg;
ここで、Ethr、H、L、α、βは、特定の条件に従って取得されてもよい経験的な定数である。
【0120】
他の実施形態では、白色雑音補正率モジュール1002は、フレームエネルギーパラメータEnerとエネルギー閾値Ethrとに従って、フレーム信号を、高エネルギーフレーム信号と低エネルギーフレーム信号とに分類し、次に、それに応じて白色雑音補正率winlag(0)を調節してもよい。
if(Ener<Ethr)
winlag(0)=L+β*(Ener+Ethr);
else
winlag(0)=H+α*(Ener+Ethr);
ここで、H、L、α、βは、特定の条件に従って取得されてもよい経験的な定数である。
【0121】
反射係数計算モジュール1003は、元の自己相関係数に従って、フレーム信号の少なくとも1つの反射係数を計算するように構成される。この実施形態では、計算を簡素化するために、第1の反射係数のみが計算されるが、本発明は第1の反射係数のみを計算することに限定されない。
k1=r(1)/r(0)
【0122】
拡張帯域幅計算モジュール1004は、反射係数計算モジュール1003によって計算された反射係数k1に従って、拡張帯域幅を適応的に計算し調節するように構成される。
f0=F+αk
ここで、Fは60Hzであってもよく、αは実験的に決定される経験的因子である。
【0123】
ラグウィンドウモジュール1005は、拡張帯域幅計算モジュール1004によって出力された拡張帯域幅f0に従って、ラグウィンドウを計算するように構成される。
winlag(k)=exp[(−1/2)(2πf0k/fs)2]
k=1,...,p
上式で、f0は拡張帯域幅計算モジュール1004によって計算された拡張帯域幅であり、fsは8000Hzなどの信号標本化周波数であり、pはLPの次数である。
【0124】
修正された自己相関係数計算モジュール1006は、元の自己相関係数r(k)と、白色雑音補正率winlag(0)と、ラグウィンドウwinlag(k)とに従って、自己相関係数補正率が調節された後の修正された自己相関係数を計算するように構成される。
r(0)’=winlag(0)r(0)
r(k)’ =winlag(k)r(k) k=1,...,p
【0125】
上記の実施形態における技術的解決法を使用すれば、入力信号の特徴を示すエネルギーパラメータと反射係数とが元の自己相関係数を介して計算され、エネルギーパラメータに従って白色雑音補正率が調節され、反射係数に従って拡張帯域幅が決定されて、ラグウィンドウが調節され、その結果、調節された自己相関係数補正率が各フレーム信号の特徴に従って決定される。従って、LP係数は、信号の特徴により正確に適合し、不良条件の場合が回避され、計算される係数はよりロバストであり、計算複雑度は低い。
【0126】
本発明の実施形態では、LP係数は、レビンソン−ダービンアルゴリズム、共分散法、及び格子法などの多くのアルゴリズムを介して、修正された自己相関係数に従って計算される。上述の実施形態では、レビンソン−ダービンアルゴリズムを例として使用したが、本発明はアルゴリズムを限定しない。
【0127】
本発明の実施形態では、ウィンドウ処理された入力信号の複数の反射係数kiが、元の自己相関係数に従って計算されてもよく、次に、1つ以上の反射係数を介して拡張帯域幅が計算される。この場合、それに応じて拡張帯域幅の計算モードが変化してもよい。すなわち、複数の反射係数が、複数の調整拡張因子と共に使用されて、反射係数と拡張帯域幅との間の新たな式を生成する。本発明の実施形態では、反射係数と拡張帯域幅との間の例示的な式を提供したが、当業者は、創造的な作業なしに、本明細書に記載した実施形態から、反射係数と拡張帯域幅との間の様々な式を導き出すことが可能である。本発明は、反射係数と拡張帯域幅との間の式を限定しない。具体的には、各反射係数に対応する調整拡張因子が、代表的なトレーニングデータを使用することによる、トレーニングを介して取得されてもよく、トレーニングは最終的な符号器性能によって評価され、次に、反射係数と拡張帯域幅との間の様々な式が構築される。
【0128】
上記の実施形態のステップの全て又は一部は、コンピュータプログラムによって命令されるハードウェアによって実施されてもよいということを、当業者は理解できる。プログラムは、コンピュータ読み取り可能な記憶媒体内に記憶されてもよい。実行される場合、プログラムは、上記の実施形態に包含される処理を実行する。記憶媒体は、磁気ディスク、コンパクトディスク、読み取り専用メモリ(ROM)、又はランダムアクセスメモリ(RAM)であってもよい。
【0129】
本発明の実施形態の目的、技術的解決法、及び利点について、上記で詳細に説明した。本発明について、いくつかの例示的実施形態を介して説明してきたが、本発明はそのような実施形態に限定されない。当業者が、本発明の範囲から逸脱することなく、本発明に対して修正及び変形を行うことが可能であることは明白である。本発明は、それらの修正及び変形を、それらが特許請求の範囲又はその均等物によって規定される保護範囲に入るならば、包含することを意図するものである。
【特許請求の範囲】
【請求項1】
入力信号にウィンドウ関数を掛け算し、
ウィンドウ処理された入力信号の元の自己相関係数を計算し、
前記元の自己相関係数に従って自己相関係数補正率を調節し、ここで、前記自己相関係数補正率は、白色雑音補正率とラグウィンドウとを含み、前記元の自己相関係数に従って自己相関係数補正率を調節することは、前記元の自己相関係数に従って前記白色雑音補正率と前記ラグウィンドウの少なくとも一つを調節することを含み、
前記元の自己相関係数と、前記調節された自己相関係数補正率とに従って、修正された自己相関係数を計算し、
前記修正された自己相関係数に従って線形予測係数を計算し、
前記線形予測係数に従って、前記入力信号を符号化し、符号化されたビットストリームを出力すること
を含むことを特徴とする、信号圧縮方法。
【請求項2】
前記元の自己相関係数に従って自己相関係数補正率を調節することは、
前記元の自己相関係数に従ってエネルギーパラメータを計算し、前記エネルギーパラメータに従って白色雑音補正率を調節し、
前記元の自己相関係数に従って前記ウィンドウ処理された入力信号の少なくとも1つの反射係数を計算し、前記少なくとも1つの反射係数に従って拡張帯域幅を調節し、調節された拡張帯域幅に従ってラグウィンドウを計算すること
を含む、請求項1に記載の信号圧縮方法。
【請求項3】
前記元の自己相関係数に従って自己相関係数補正率を調節することは、
前記元の自己相関係数に従ってエネルギーパラメータを計算し、前記エネルギーパラメータに従って白色雑音補正率を調節し、
拡張帯域幅に従ってラグウィンドウを計算すること
を含む、請求項1に記載の信号圧縮方法。
【請求項4】
前記元の自己相関係数に従ってエネルギーパラメータを計算し、前記エネルギーパラメータに従って白色雑音補正率を調節することは、
前記元の自己相関係数の第1の係数r(0)に従って前記エネルギーパラメータを計算し、
前記エネルギーパラメータが分布する異なるエネルギー閾値間隔、すなわち、
【数24】
ここで、winlag(0)は、前記白色雑音補正率、Eは、前記エネルギーパラメータ、及びEthrは前記エネルギー閾値、
に従って、異なる調節関数を使用して前記白色雑音補正率を調節すること
を含む、請求項2又は3に記載の信号圧縮方法。
【請求項5】
前記元の自己相関係数に従ってエネルギーパラメータを計算し、前記エネルギーパラメータに従って白色雑音補正率を調節することは、
前記元の自己相関係数の第1の係数r(0)に従って、式
【数25】
を介して、フレームエネルギーパラメータEnerを計算し、
前記フレームエネルギーパラメータEnerがエネルギー閾値Ethr以上である場合、式Winlag(0)=H+α*(Ener+Ethr)を介して、前記白色雑音補正率Winlag(0)を調節し、前記フレームエネルギーパラメータEnerが前記エネルギー閾値Ethr未満である場合、式Winlag(0)=L+β*(Ener+Ethr)を介して、前記白色雑音補正率Winlag(0)を調節すること
を含み、ここで、H、L、α、βは経験的な定数である、請求項2又は3に記載の信号圧縮方法。
【請求項6】
前記元の自己相関係数に従ってエネルギーパラメータを計算し、前記エネルギーパラメータに従って白色雑音補正率を調節することは、
前記元の自己相関係数の第1の係数r(0)とフレーム長Nとに従って、式Ener_avg=r(0)/Nを介して、フレーム平均エネルギーEner_avgを計算し、
前記フレーム平均エネルギーEner_avgがエネルギー閾値Ethr以上である場合、式Winlag(0)=H+α*Ener_avgを介して、前記白色雑音補正率Winlag(0)を調節し、前記フレーム平均エネルギーEner_avgが前記エネルギー閾値Ethr未満である場合、式Winlag(0)=L+β*Ener_avgを介して、前記白色雑音補正率Winlag(0)を調節すること
を含み、ここで、H、L、α、βは経験的な定数である、請求項2又は3に記載の信号圧縮方法。
【請求項7】
前記元の自己相関係数に従って自己相関係数補正率を調節することは、
前記元の自己相関係数に従って前記ウィンドウ処理された入力信号の少なくとも1つの反射係数を計算し、前記少なくとも1つの反射係数に従って拡張帯域幅を調節し、調節された拡張帯域幅に従ってラグウィンドウを計算すること
を含む、請求項1に記載の信号圧縮方法。
【請求項8】
前記元の自己相関係数に従って前記ウィンドウ処理された入力信号の少なくとも1つの反射係数を計算し、前記少なくとも1つの反射係数に従って拡張帯域幅を調節することは、
式k1=r(1)/r(0)を介して第1の反射係数k1を計算し、ここで、r(0)は前記元の自己相関係数の第1の係数であり、r(1)は前記元の自己相関係数の第2の係数であり、
式f0=F+αk1に従って前記拡張帯域幅f0を計算すること
を含み、ここで、F及びαは経験的な定数である、請求項2又は7に記載の信号圧縮方法。
【請求項9】
前記線形予測係数に従って前記入力信号を符号化し、符号化されたビットストリームを出力することは、
前記線形予測係数に従って前記入力信号に対する線形予測を実行し、残留信号を計算し、前記残留信号を符号化し、前記符号化されたビットストリームを出力すること
を含む、請求項1〜3のいずれか一項に記載の信号圧縮方法。
【請求項10】
入力信号にウィンドウ関数を掛けるように構成された、ウィンドウ処理ユニットと、
前記ウインドウ処理ユニットによって処理された入力信号の元の自己相関係数を計算するように構成された、元の自己相関係数計算ユニットと、
前記元の自己相関係数計算ユニットによって計算された前記元の自己相関係数に従って、自己相関係数補正率を調節し、前記元の自己相関係数と前記調節された自己相関係数補正率とに従って、修正された自己相関係数を計算するように構成された、帯域幅拡張ユニットであって、前記自己相関係数補正率は、白色雑音補正率とラグウィンドウとを含み、前記元の自己相関係数に従って自己相関係数補正率を調節することは、前記元の自己相関係数に従って前記白色雑音補正率と前記ラグウィンドウの少なくとも一つを調節することを含む、帯域幅拡張ユニットと、
前記帯域幅拡張ユニットによって計算された前記修正された自己相関係数に従って、線形予測係数を計算するように構成された、線形予測係数計算ユニットと、
前記線形予測係数計算ユニットによって計算された前記線形予測係数に従って前記入力信号を符号化し、符号化されたビットストリームを出力するように構成された、圧縮ユニットと
を備えることを特徴とする、信号圧縮装置。
【請求項11】
前記帯域幅拡張ユニットは、
前記元の自己相関係数に従ってエネルギーパラメータを計算するように構成された、エネルギーモジュールと、
前記エネルギーモジュールによって計算された前記エネルギーパラメータに従って白色雑音補正率を調節するように構成された、白色雑音補正率モジュールと、
前記元の自己相関係数に従って前記ウィンドウ処理された入力信号の少なくとも1つの反射係数を計算するように構成された、反射係数計算モジュールと、
前記反射係数計算モジュールによって計算された、前記少なくとも1つの反射係数に従って拡張帯域幅を調節するように構成された、拡張帯域幅計算モジュールと、
前記拡張帯域幅計算モジュールによって出力された、調節された拡張帯域幅に従ってラグウィンドウを計算するように構成された、ラグウィンドウモジュールと、
前記元の自己相関係数と、調節された白色雑音補正率と、前記ラグウィンドウとに従って、前記修正された自己相関係数を計算するように構成された、修正された自己相関係数計算モジュールと
を備える、請求項10に記載の信号圧縮装置。
【請求項12】
前記帯域幅拡張ユニットは、
前記元の自己相関係数に従ってエネルギーパラメータを計算するように構成された、エネルギーモジュールと、
前記エネルギーモジュールによって計算された前記エネルギーパラメータに従って白色雑音補正率を調節するように構成された、白色雑音補正率モジュールと、
拡張帯域幅に従ってラグウィンドウを計算するように構成された、ラグウィンドウモジュールと、
前記元の自己相関係数と、調節された白色雑音補正率と、前記ラグウィンドウとに従って前記修正された自己相関係数を計算するように構成された、修正された自己相関係数計算モジュールと
を備える、請求項10に記載の信号圧縮装置。
【請求項13】
前記帯域幅拡張ユニットは、
白色雑音補正率を決定するように構成された白色雑音補正率モジュールと、
前記元の自己相関係数に従って前記ウィンドウ処理された入力信号の少なくとも1つの反射係数を計算するように構成された、反射係数計算モジュールと、
前記反射係数計算モジュールによって計算された前記少なくとも1つの反射係数に従って、拡張帯域幅を調節するように構成された、拡張帯域幅計算モジュールと、
前記拡張帯域幅計算モジュールによって出力された調節された拡張帯域幅に従って、ラグウィンドウを計算するように構成された、ラグウィンドウモジュールと、
前記元の自己相関係数と、前記白色雑音補正率と、前記ラグウィンドウとに従って、前記修正された自己相関係数を計算するように構成された、修正された自己相関係数計算モジュールと
を備える、請求項10に記載の信号圧縮装置。
【請求項14】
前記入力信号を後続のモジュールによって処理されるのにより適したものとするために、様々なタイプの圧縮用に前記入力信号を前処理し、前処理された入力信号を前記ウィンドウ処理ユニットに送信するように構成された、前処理ユニット
を更に備える、請求項10〜13のいずれか一項に記載の信号圧縮装置。
【請求項15】
方法を実行するための、プロセッサによる実行のために、コンピュータ使用可能な命令が記憶された、コンピュータ読み取り可能な媒体であって、前記方法は、
入力信号にウィンドウ関数を掛け、
ウィンドウ処理された入力信号の、元の自己相関係数を計算し、
前記元の自己相関係数に従って、自己相関係数補正率を調節し、
前記元の自己相関係数と、前記調節された自己相関係数補正率とに従って、修正された自己相関係数を計算し、
前記修正された自己相関係数に従って、線形予測係数を計算し、
前記線形予測係数に従って、前記入力信号を符号化し、符号化されたビットストリームを出力すること
を含むことを特徴とする、コンピュータ読み取り可能な媒体。
【請求項16】
入力信号にウィンドウ関数を掛け算し、
ウィンドウ処理された入力信号の元の自己相関係数を計算し、
前記元の自己相関係数の第1の係数に従ってエネルギーパラメータを計算し、当該エネルギーパラメータに従って白色雑音補正率を調節し、
拡張帯域幅に従ってラグウィンドウを計算し、
前記元の自己相関係数と、前記調節された白色雑音補正率と、前記ラグウィンドウと、に従って、修正された自己相関係数を計算し、
前記修正された自己相関係数に従って線形予測係数を計算し、
前記線形予測係数に従って前記入力信号に対する線形予測を実行し、残留信号を計算し、前記残留信号を符号化し、符号化されたビットストリームを出力すること
を含むことを特徴とする、信号圧縮方法。
【請求項17】
前記元の自己相関係数に従ってエネルギーパラメータを計算することは、
前記元の自己相関係数の第1の係数r(0)に従って、式
【数25】
を介して、前記エネルギーパラメータEnerを計算すること
を含む、請求項16に記載の信号圧縮方法。
【請求項18】
前記元の自己相関係数に従ってエネルギーパラメータを計算することは、
前記元の自己相関係数の第1の係数r(0)とフレーム長Nとに従って、式Ener_avg=r(0)/Nを介して、フレーム平均エネルギーEner_avgを計算すること
を含む、請求項16に記載の信号圧縮方法。
【請求項19】
前記エネルギーパラメータに従って白色雑音補正率を調節することは、
前記エネルギーパラメータが分布する異なるエネルギー閾値間隔、すなわち、
【数24】
ここで、winlag(0)は、前記白色雑音補正率、Eは、前記エネルギーパラメータ、及びEthrは前記エネルギー閾値、
に従って、異なる調節関数を使用して前記白色雑音補正率を調節すること
を含む、請求項17又は18に記載の信号圧縮方法。
【請求項20】
前記エネルギーパラメータに従って白色雑音補正率を調節することは、
前記エネルギーパラメータEnerがエネルギー閾値Ethr以上である場合、式Winlag(0)=H+α*(Ener+Ethr)を介して、前記白色雑音補正率Winlag(0)を調節し、前記エネルギーパラメータEnerが前記エネルギー閾値Ethr未満である場合、式Winlag(0)=L+β*(Ener+Ethr)を介して、前記白色雑音補正率Winlag(0)を調節すること
を含み、ここで、H、L、α、βは経験的な定数である、請求項17に記載の信号圧縮方法。
【請求項21】
前記エネルギーパラメータに従って白色雑音補正率を調節することは、
前記元の自己相関係数の第1の係数r(0)とフレーム長Nとに従って、式Ener_avg=r(0)/Nを介して、フレーム平均エネルギーEner_avgを計算し、
前記フレーム平均エネルギーEner_avgがエネルギー閾値Ethr以上である場合、式Winlag(0)=H+α*Ener_avgを介して、前記白色雑音補正率Winlag(0)を調節し、前記フレーム平均エネルギーEner_avgが前記エネルギー閾値Ethr未満である場合、式Winlag(0)=L+β*Ener_avgを介して、前記白色雑音補正率Winlag(0)を調節すること
を含み、ここで、H、L、α、βは経験的な定数である、請求項18に記載の信号圧縮方法。
【請求項1】
入力信号にウィンドウ関数を掛け算し、
ウィンドウ処理された入力信号の元の自己相関係数を計算し、
前記元の自己相関係数に従って自己相関係数補正率を調節し、ここで、前記自己相関係数補正率は、白色雑音補正率とラグウィンドウとを含み、前記元の自己相関係数に従って自己相関係数補正率を調節することは、前記元の自己相関係数に従って前記白色雑音補正率と前記ラグウィンドウの少なくとも一つを調節することを含み、
前記元の自己相関係数と、前記調節された自己相関係数補正率とに従って、修正された自己相関係数を計算し、
前記修正された自己相関係数に従って線形予測係数を計算し、
前記線形予測係数に従って、前記入力信号を符号化し、符号化されたビットストリームを出力すること
を含むことを特徴とする、信号圧縮方法。
【請求項2】
前記元の自己相関係数に従って自己相関係数補正率を調節することは、
前記元の自己相関係数に従ってエネルギーパラメータを計算し、前記エネルギーパラメータに従って白色雑音補正率を調節し、
前記元の自己相関係数に従って前記ウィンドウ処理された入力信号の少なくとも1つの反射係数を計算し、前記少なくとも1つの反射係数に従って拡張帯域幅を調節し、調節された拡張帯域幅に従ってラグウィンドウを計算すること
を含む、請求項1に記載の信号圧縮方法。
【請求項3】
前記元の自己相関係数に従って自己相関係数補正率を調節することは、
前記元の自己相関係数に従ってエネルギーパラメータを計算し、前記エネルギーパラメータに従って白色雑音補正率を調節し、
拡張帯域幅に従ってラグウィンドウを計算すること
を含む、請求項1に記載の信号圧縮方法。
【請求項4】
前記元の自己相関係数に従ってエネルギーパラメータを計算し、前記エネルギーパラメータに従って白色雑音補正率を調節することは、
前記元の自己相関係数の第1の係数r(0)に従って前記エネルギーパラメータを計算し、
前記エネルギーパラメータが分布する異なるエネルギー閾値間隔、すなわち、
【数24】
ここで、winlag(0)は、前記白色雑音補正率、Eは、前記エネルギーパラメータ、及びEthrは前記エネルギー閾値、
に従って、異なる調節関数を使用して前記白色雑音補正率を調節すること
を含む、請求項2又は3に記載の信号圧縮方法。
【請求項5】
前記元の自己相関係数に従ってエネルギーパラメータを計算し、前記エネルギーパラメータに従って白色雑音補正率を調節することは、
前記元の自己相関係数の第1の係数r(0)に従って、式
【数25】
を介して、フレームエネルギーパラメータEnerを計算し、
前記フレームエネルギーパラメータEnerがエネルギー閾値Ethr以上である場合、式Winlag(0)=H+α*(Ener+Ethr)を介して、前記白色雑音補正率Winlag(0)を調節し、前記フレームエネルギーパラメータEnerが前記エネルギー閾値Ethr未満である場合、式Winlag(0)=L+β*(Ener+Ethr)を介して、前記白色雑音補正率Winlag(0)を調節すること
を含み、ここで、H、L、α、βは経験的な定数である、請求項2又は3に記載の信号圧縮方法。
【請求項6】
前記元の自己相関係数に従ってエネルギーパラメータを計算し、前記エネルギーパラメータに従って白色雑音補正率を調節することは、
前記元の自己相関係数の第1の係数r(0)とフレーム長Nとに従って、式Ener_avg=r(0)/Nを介して、フレーム平均エネルギーEner_avgを計算し、
前記フレーム平均エネルギーEner_avgがエネルギー閾値Ethr以上である場合、式Winlag(0)=H+α*Ener_avgを介して、前記白色雑音補正率Winlag(0)を調節し、前記フレーム平均エネルギーEner_avgが前記エネルギー閾値Ethr未満である場合、式Winlag(0)=L+β*Ener_avgを介して、前記白色雑音補正率Winlag(0)を調節すること
を含み、ここで、H、L、α、βは経験的な定数である、請求項2又は3に記載の信号圧縮方法。
【請求項7】
前記元の自己相関係数に従って自己相関係数補正率を調節することは、
前記元の自己相関係数に従って前記ウィンドウ処理された入力信号の少なくとも1つの反射係数を計算し、前記少なくとも1つの反射係数に従って拡張帯域幅を調節し、調節された拡張帯域幅に従ってラグウィンドウを計算すること
を含む、請求項1に記載の信号圧縮方法。
【請求項8】
前記元の自己相関係数に従って前記ウィンドウ処理された入力信号の少なくとも1つの反射係数を計算し、前記少なくとも1つの反射係数に従って拡張帯域幅を調節することは、
式k1=r(1)/r(0)を介して第1の反射係数k1を計算し、ここで、r(0)は前記元の自己相関係数の第1の係数であり、r(1)は前記元の自己相関係数の第2の係数であり、
式f0=F+αk1に従って前記拡張帯域幅f0を計算すること
を含み、ここで、F及びαは経験的な定数である、請求項2又は7に記載の信号圧縮方法。
【請求項9】
前記線形予測係数に従って前記入力信号を符号化し、符号化されたビットストリームを出力することは、
前記線形予測係数に従って前記入力信号に対する線形予測を実行し、残留信号を計算し、前記残留信号を符号化し、前記符号化されたビットストリームを出力すること
を含む、請求項1〜3のいずれか一項に記載の信号圧縮方法。
【請求項10】
入力信号にウィンドウ関数を掛けるように構成された、ウィンドウ処理ユニットと、
前記ウインドウ処理ユニットによって処理された入力信号の元の自己相関係数を計算するように構成された、元の自己相関係数計算ユニットと、
前記元の自己相関係数計算ユニットによって計算された前記元の自己相関係数に従って、自己相関係数補正率を調節し、前記元の自己相関係数と前記調節された自己相関係数補正率とに従って、修正された自己相関係数を計算するように構成された、帯域幅拡張ユニットであって、前記自己相関係数補正率は、白色雑音補正率とラグウィンドウとを含み、前記元の自己相関係数に従って自己相関係数補正率を調節することは、前記元の自己相関係数に従って前記白色雑音補正率と前記ラグウィンドウの少なくとも一つを調節することを含む、帯域幅拡張ユニットと、
前記帯域幅拡張ユニットによって計算された前記修正された自己相関係数に従って、線形予測係数を計算するように構成された、線形予測係数計算ユニットと、
前記線形予測係数計算ユニットによって計算された前記線形予測係数に従って前記入力信号を符号化し、符号化されたビットストリームを出力するように構成された、圧縮ユニットと
を備えることを特徴とする、信号圧縮装置。
【請求項11】
前記帯域幅拡張ユニットは、
前記元の自己相関係数に従ってエネルギーパラメータを計算するように構成された、エネルギーモジュールと、
前記エネルギーモジュールによって計算された前記エネルギーパラメータに従って白色雑音補正率を調節するように構成された、白色雑音補正率モジュールと、
前記元の自己相関係数に従って前記ウィンドウ処理された入力信号の少なくとも1つの反射係数を計算するように構成された、反射係数計算モジュールと、
前記反射係数計算モジュールによって計算された、前記少なくとも1つの反射係数に従って拡張帯域幅を調節するように構成された、拡張帯域幅計算モジュールと、
前記拡張帯域幅計算モジュールによって出力された、調節された拡張帯域幅に従ってラグウィンドウを計算するように構成された、ラグウィンドウモジュールと、
前記元の自己相関係数と、調節された白色雑音補正率と、前記ラグウィンドウとに従って、前記修正された自己相関係数を計算するように構成された、修正された自己相関係数計算モジュールと
を備える、請求項10に記載の信号圧縮装置。
【請求項12】
前記帯域幅拡張ユニットは、
前記元の自己相関係数に従ってエネルギーパラメータを計算するように構成された、エネルギーモジュールと、
前記エネルギーモジュールによって計算された前記エネルギーパラメータに従って白色雑音補正率を調節するように構成された、白色雑音補正率モジュールと、
拡張帯域幅に従ってラグウィンドウを計算するように構成された、ラグウィンドウモジュールと、
前記元の自己相関係数と、調節された白色雑音補正率と、前記ラグウィンドウとに従って前記修正された自己相関係数を計算するように構成された、修正された自己相関係数計算モジュールと
を備える、請求項10に記載の信号圧縮装置。
【請求項13】
前記帯域幅拡張ユニットは、
白色雑音補正率を決定するように構成された白色雑音補正率モジュールと、
前記元の自己相関係数に従って前記ウィンドウ処理された入力信号の少なくとも1つの反射係数を計算するように構成された、反射係数計算モジュールと、
前記反射係数計算モジュールによって計算された前記少なくとも1つの反射係数に従って、拡張帯域幅を調節するように構成された、拡張帯域幅計算モジュールと、
前記拡張帯域幅計算モジュールによって出力された調節された拡張帯域幅に従って、ラグウィンドウを計算するように構成された、ラグウィンドウモジュールと、
前記元の自己相関係数と、前記白色雑音補正率と、前記ラグウィンドウとに従って、前記修正された自己相関係数を計算するように構成された、修正された自己相関係数計算モジュールと
を備える、請求項10に記載の信号圧縮装置。
【請求項14】
前記入力信号を後続のモジュールによって処理されるのにより適したものとするために、様々なタイプの圧縮用に前記入力信号を前処理し、前処理された入力信号を前記ウィンドウ処理ユニットに送信するように構成された、前処理ユニット
を更に備える、請求項10〜13のいずれか一項に記載の信号圧縮装置。
【請求項15】
方法を実行するための、プロセッサによる実行のために、コンピュータ使用可能な命令が記憶された、コンピュータ読み取り可能な媒体であって、前記方法は、
入力信号にウィンドウ関数を掛け、
ウィンドウ処理された入力信号の、元の自己相関係数を計算し、
前記元の自己相関係数に従って、自己相関係数補正率を調節し、
前記元の自己相関係数と、前記調節された自己相関係数補正率とに従って、修正された自己相関係数を計算し、
前記修正された自己相関係数に従って、線形予測係数を計算し、
前記線形予測係数に従って、前記入力信号を符号化し、符号化されたビットストリームを出力すること
を含むことを特徴とする、コンピュータ読み取り可能な媒体。
【請求項16】
入力信号にウィンドウ関数を掛け算し、
ウィンドウ処理された入力信号の元の自己相関係数を計算し、
前記元の自己相関係数の第1の係数に従ってエネルギーパラメータを計算し、当該エネルギーパラメータに従って白色雑音補正率を調節し、
拡張帯域幅に従ってラグウィンドウを計算し、
前記元の自己相関係数と、前記調節された白色雑音補正率と、前記ラグウィンドウと、に従って、修正された自己相関係数を計算し、
前記修正された自己相関係数に従って線形予測係数を計算し、
前記線形予測係数に従って前記入力信号に対する線形予測を実行し、残留信号を計算し、前記残留信号を符号化し、符号化されたビットストリームを出力すること
を含むことを特徴とする、信号圧縮方法。
【請求項17】
前記元の自己相関係数に従ってエネルギーパラメータを計算することは、
前記元の自己相関係数の第1の係数r(0)に従って、式
【数25】
を介して、前記エネルギーパラメータEnerを計算すること
を含む、請求項16に記載の信号圧縮方法。
【請求項18】
前記元の自己相関係数に従ってエネルギーパラメータを計算することは、
前記元の自己相関係数の第1の係数r(0)とフレーム長Nとに従って、式Ener_avg=r(0)/Nを介して、フレーム平均エネルギーEner_avgを計算すること
を含む、請求項16に記載の信号圧縮方法。
【請求項19】
前記エネルギーパラメータに従って白色雑音補正率を調節することは、
前記エネルギーパラメータが分布する異なるエネルギー閾値間隔、すなわち、
【数24】
ここで、winlag(0)は、前記白色雑音補正率、Eは、前記エネルギーパラメータ、及びEthrは前記エネルギー閾値、
に従って、異なる調節関数を使用して前記白色雑音補正率を調節すること
を含む、請求項17又は18に記載の信号圧縮方法。
【請求項20】
前記エネルギーパラメータに従って白色雑音補正率を調節することは、
前記エネルギーパラメータEnerがエネルギー閾値Ethr以上である場合、式Winlag(0)=H+α*(Ener+Ethr)を介して、前記白色雑音補正率Winlag(0)を調節し、前記エネルギーパラメータEnerが前記エネルギー閾値Ethr未満である場合、式Winlag(0)=L+β*(Ener+Ethr)を介して、前記白色雑音補正率Winlag(0)を調節すること
を含み、ここで、H、L、α、βは経験的な定数である、請求項17に記載の信号圧縮方法。
【請求項21】
前記エネルギーパラメータに従って白色雑音補正率を調節することは、
前記元の自己相関係数の第1の係数r(0)とフレーム長Nとに従って、式Ener_avg=r(0)/Nを介して、フレーム平均エネルギーEner_avgを計算し、
前記フレーム平均エネルギーEner_avgがエネルギー閾値Ethr以上である場合、式Winlag(0)=H+α*Ener_avgを介して、前記白色雑音補正率Winlag(0)を調節し、前記フレーム平均エネルギーEner_avgが前記エネルギー閾値Ethr未満である場合、式Winlag(0)=L+β*Ener_avgを介して、前記白色雑音補正率Winlag(0)を調節すること
を含み、ここで、H、L、α、βは経験的な定数である、請求項18に記載の信号圧縮方法。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【公開番号】特開2013−109381(P2013−109381A)
【公開日】平成25年6月6日(2013.6.6)
【国際特許分類】
【出願番号】特願2013−51028(P2013−51028)
【出願日】平成25年3月13日(2013.3.13)
【分割の表示】特願2009−290579(P2009−290579)の分割
【原出願日】平成21年12月22日(2009.12.22)
【出願人】(503433420)華為技術有限公司 (107)
【氏名又は名称原語表記】HUAWEI TECHNOLOGIES CO.,LTD.
【住所又は居所原語表記】Huawei Administration Building, Bantian Longgang District, Shenzhen 518129 P.R. China
【公開日】平成25年6月6日(2013.6.6)
【国際特許分類】
【出願日】平成25年3月13日(2013.3.13)
【分割の表示】特願2009−290579(P2009−290579)の分割
【原出願日】平成21年12月22日(2009.12.22)
【出願人】(503433420)華為技術有限公司 (107)
【氏名又は名称原語表記】HUAWEI TECHNOLOGIES CO.,LTD.
【住所又は居所原語表記】Huawei Administration Building, Bantian Longgang District, Shenzhen 518129 P.R. China
[ Back to top ]