信号圧縮方法及び装置

【課題】本発明は、可聴音（オーディオ、音声）圧縮に関し、信号圧縮方法及び装置に関する。
【解決手段】信号圧縮方法は、入力信号にウィンドウ関数を掛け、ウィンドウ処理された入力信号の、元の自己相関係数を計算し、元の自己相関係数に従って、白色雑音補正率又はラグウィンドウを計算し、元の自己相関係数と、白色雑音補正率と、ラグウィンドウとに従って、修正された自己相関係数を計算し、修正された自己相関係数に従って、線形予測係数を計算し、線形予測係数に従って、符号化されたビットストリームを出力することを含む。本発明による技術的解決法により、特殊な入力信号の不良条件の場合が回避され、修正された自己相関係数が、後続の圧縮のためにより適したものとなり、ロスレス符号器の圧縮効率と、ロッシー符号器の、再構築される発話信号の品質とが向上し、単純な動作のみが含まれるようになる。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、可聴音（オーディオ、音声）圧縮に関し、特に、信号圧縮方法及び装置に関する。
【背景技術】
【０００２】
発話（スピーチ）及び音声（オーディオ）信号を伝送及び記憶するための帯域幅を節約するために、発話及び音声符号化技術が広く適用されている。現在、これらの符号化技術は、主として、ロッシー（lossy）符号化及びロスレス（lossless）符号化技術に分類さ
れる。
【０００３】
線形予測（ＬＰ）分析は、ロスレス圧縮符号化において、入力信号のダイナミックレンジを減らすため、及び信号の近接標本点（ｎｅａｒｓａｍｐｌｅｐｏｉｎｔｓ）の冗長性をなくすために広く適用されているが、帯域幅拡張は、ロスレス符号化において一般的には適用されていない。
【０００４】
ロッシー符号化であるＧ．７２９では、自己相関係数にラグウィンドウを掛けることによって、帯域幅拡張技術が適用される。ＬＰ分析をより安定させることを目的として、レビンソン−ダービンアルゴリズムによってＬＰ係数を計算する前に、６０Ｈｚの帯域幅拡張が実行される。従来技術における、ＬＰ係数を計算するステップは、以下の通りである。
【０００５】
１．入力信号にウィンドウ関数を掛け、自己相関係数を計算する。ｒ（０）、ｒ（１）．．．ｒ（ｐ）、ここで、ｐはＬＰの次数。
【０００６】
２．自己相関係数の重み因子ｗｉｎ_lagを計算する。
ｗｉｎ_lag（ｋ）＝ｅｘｐ［（−１／２）（２πｆ₀ｋ／ｆ_s）²］
ｋ＝１，．．．，ｐ
上式で、ｆ₀は、ｆ₀＝６０Ｈｚなどの、定数であり、ｆ_sは、８０００Ｈｚなどの、信号標本化周波数であり、ｐは、ＬＰ分析の次数（１０など）である。
【０００７】
３：白色雑音補正率が、ｗｉｎ_lag（０）＝１．０００１であることを決定する。
【０００８】
４．調節された自己相関係数を計算する。
ｒ（０）’＝ｗｉｎ_lag（０）ｒ（０）
ｒ（ｋ）’ ＝ｗｉｎ_lag（ｋ）ｒ（ｋ）ｋ＝１，．．．，ｐ
【０００９】
５．調節された自己相関係数を使用して、新たなＬＰ係数を、レビンソン−ダービンアルゴリズムを介して計算する。
【００１０】
従来技術では、各フレーム信号が同じように処理される。
【００１１】
ＬＰ分析は、ロスレス圧縮符号化において、入力信号のダイナミックレンジを減らすため、及び信号の近接標本点の冗長性をなくすために広く適用されている。
【発明の概要】
【発明が解決しようとする課題】
【００１２】
本発明を実施するプロセスにおいて、発明者は、従来技術における少なくとも以下の欠点を見出した。全ての信号が同じように処理されるため、一部の特殊な入力信号に対して、不良条件の場合が発生する可能性があり、自己相関行列の解決が不安定となり、これは、ロスレス符号器の低い圧縮効率と、ロッシー符号器の、再構築される発話信号の低い品質とをもたらす。
【課題を解決するための手段】
【００１３】
本発明の実施形態は、異なる信号が信号特徴に従って異なるように処理され、それにより、特殊な入力信号によって生成される不良条件の場合が回避され、音声圧縮効率と、再構築される発話信号の品質とが向上するような、信号圧縮方法及び装置を提供する。
【００１４】
信号圧縮方法は、
入力信号にウィンドウ関数を掛け、
ウィンドウ処理された入力信号の、元の自己相関係数を計算し、
元の自己相関係数に従って、自己相関係数補正率を調節し、
元の自己相関係数と、調節された自己相関係数補正率とに従って、修正された自己相関係数を計算し、
修正された自己相関係数に従って、線形予測係数を計算し、
線形予測係数に従って、入力信号を符号化し、符号化されたビットストリームを出力すること
を含む。
【００１５】
別の信号圧縮方法は、
入力信号にウィンドウ関数を掛け、
ウィンドウ処理された入力信号の、元の自己相関係数を計算し、
元の自己相関係数の第１の係数に従って、エネルギーパラメータを計算し、エネルギーパラメータに従って、白色雑音補正率を調節し、
拡張帯域幅に従って、ラグウィンドウを計算し、
元の自己相関係数と、調節された白色雑音補正率と、ラグウィンドウとに従って、修正された自己相関係数を計算し、
修正された自己相関係数に従って、線形予測係数を計算し、
線形予測係数に従って、入力信号に対する線形予測を実行し、残留信号を計算し、残留信号を符号化し、符号化されたビットストリームを出力すること
を含む。
【００１６】
信号圧縮装置は、
入力信号にウィンドウ関数を掛けるように構成された、ウィンドウ処理ユニットと、
ウインドウ処理ユニットによって処理された入力信号の、元の自己相関係数を計算するように構成された、元の自己相関係数計算ユニットと、
元の自己相関係数計算ユニットによって計算された元の自己相関係数に従って、自己相関係数補正率を調節し、元の自己相関係数と、調節された自己相関係数補正率とに従って、修正された自己相関係数を計算するように構成された、帯域幅拡張ユニットと、
帯域幅拡張ユニットによって計算された、修正された自己相関係数に従って、線形予測係数を計算するように構成された、線形予測係数計算ユニットと、
線形予測係数計算ユニットによって計算された線形予測係数に従って、入力信号を符号化し、符号化されたビットストリームを出力するように構成された、圧縮ユニットと
を含む。
【発明の効果】
【００１７】
本発明の実施形態による技術的解決法では、元の自己相関係数に従って、自己相関補正率が調節され、その結果、調節された自己相関係数補正率は、入力信号の違いを表現することができ、それにより、特殊な入力信号の不良条件の場合が回避され、修正された自己相関係数が、後続の圧縮処理のためにより適したものとなり、ロスレス符号器の圧縮効率と、ロッシー符号器の、再構築される発話信号の品質とが向上し、単純な動作のみが含まれるようになる。
【００１８】
添付の図面は、本発明を限定するものではなく、本発明のより良い理解を意図するものであり、本出願の一部を成す。
【図面の簡単な説明】
【００１９】
【図１】本発明の第１の実施形態における信号圧縮方法のフローチャートである。
【図２】本発明の第２の実施形態における信号圧縮方法のフローチャートである。
【図３】本発明の第３の実施形態における信号圧縮方法のフローチャートである。
【図４】本発明の第４の実施形態における信号圧縮方法のフローチャートである。
【図５】本発明の第５の実施形態における信号圧縮装置の構成を示す。
【図６】本発明の第６の実施形態における信号圧縮装置の構成を示す。
【図７】本発明の第６の実施形態における信号圧縮装置の、帯域幅拡張ユニットの構成を示す。
【図８】本発明の第７の実施形態における信号圧縮装置の構成を示す。
【図９】本発明の第７の実施形態における信号圧縮装置の、帯域幅拡張ユニットの構成を示す。
【図１０】本発明の第６又は第７の実施形態における帯域幅拡張ユニットの、別の構成を示す。
【発明を実施するための形態】
【００２０】
本発明の技術的解決策、目的、及び利点を明確にするために、本発明について、添付の図面及び例示的実施形態を参照して以下で詳細に説明する。本発明の例示的実施形態及びその説明は、本発明を限定することではなく、解釈することを意図するものである。
【００２１】
本発明の実施形態は、信号圧縮方法及び装置を提供する。本発明の実施形態について、添付の図面を参照して以下で詳細に説明する。
【００２２】
第１の実施形態
図１は、本発明の第１の実施形態における信号圧縮方法のフローチャートである。方法は以下のステップを含む。
【００２３】
ステップ１０１：入力信号にウィンドウ関数を掛ける。
【００２４】
ステップ１０２：ウィンドウ処理された入力信号の、元の自己相関係数を計算する。
【００２５】
ステップ１０３：元の自己相関係数に従って、自己相関係数補正率を調節する。
【００２６】
ステップ１０４：元の自己相関係数と、調節された自己相関係数補正率とに従って、修正された自己相関係数を計算する。
【００２７】
自己相関係数補正率は、白色雑音補正率とラグウィンドウとを含む。自己相関係数補正率を調節することは、白色雑音補正率とラグウィンドウとを調節すること、又は、白色雑音補正率のみを調節すること、又はラグウィンドウのみを調節することであってもよい。
【００２８】
元の自己相関係数に従って、自己相関係数補正率を調節することは、元の自己相関係数に従って、入力信号の特徴パラメータを決定し、特徴パラメータに従って、自己相関係数補正率を調節することであってもよい。特徴パラメータは、エネルギー、周期性パラメータ、ゼロ交差レート、反射係数、又はそれらの任意の組み合わせであってもよく、かつ、元の入力信号から、又は任意のステップで取得された信号から抽出されてもよい。
【００２９】
ステップ１０５：修正された自己相関係数に従って、ＬＰ係数を計算する。
【００３０】
ステップ１０６：ＬＰ係数に従って、入力信号を符号化し、符号化されたビットストリームを出力する。
【００３１】
ＬＰ係数に従って、入力信号を符号化することは、ＬＰ係数に従って入力信号に対するＬＰ分析を実行し、残留信号を計算し、次に、長期予測（ＬＴＰ）とエントロピー符号化とを実行し、最後に、残留信号のロスレス符号化されたビットストリームを出力することであってもよく、又は、ＬＰ係数と入力信号とを符号励振線形予測（ＣＥＬＰ）モデルに入力して、ビットストリームを取得することであってもよい。
【００３２】
本発明の別の実施形態では、前処理ステップが含まれてもよい。ステップ１０１の前に、入力信号は前処理される。ロッシー圧縮のためには、前処理は、入力信号の高周波成分を増加させるための、又は、不必要な低周波干渉成分を除去するための、プリエンファシスフィルタ処理又はハイパスフィルタ処理であってもよい。その後、フィルタ処理された信号は、ステップ１０１に従ってウィンドウ処理される。ロスレス圧縮のためには、前処理は、入力信号をＡ則又はμ則からパルス符号変調（ＰＣＭ）領域にマッピングする、マッピング動作であってもよい。ＰＣＭ領域内の信号は、ＬＰ短期予測のためにより適している。
【００３３】
上記の実施形態における技術的解決法を使用すれば、元の自己相関係数は、各フレーム信号の特徴を反映し、そのような特徴に従って、自己相関係数補正率が調節され、その結果、調節された自己相関係数補正率が各フレーム信号の特徴に従って決定される。従って、ＬＰ係数は、信号の特徴により正確に適合し、不良条件の場合が回避され、計算される係数はよりロバストであり、計算複雑度は低い。
【００３４】
第２の実施形態
図２は、本発明の第２の実施形態における信号圧縮方法のフローチャートである。方法は以下のステップを含む。
【００３５】
ステップ２０１：入力信号にウィンドウ関数を掛ける。ここでのウィンドウは、従来技術においてロッシー符号化に適用されるウィンドウであってもよい。入力信号ｓ（ｎ）にウィンドウ関数ｗｉｎ（ｎ）が掛けられて、ウィンドウ処理された入力信号ｓ’（ｎ）が取得される。
ｓ’（ｎ）＝ｗｉｎ（ｎ）ｓ（ｎ）ｎ＝０，．．．，Ｎ−１
ここで、Ｎはフレーム長
【００３６】
ステップ２０２：ウィンドウ処理された入力信号ｓ’（ｎ）に従って、元の自己相関係数ｒ（ｋ）を、例えば以下の式を介して計算する。
【数１】

ｋ＝０，．．．，ｐ、ここで、ｐはＬＰの次数
【００３７】
ステップ２０３：元の自己相関係数に従って、エネルギーパラメータＥを計算する。
【００３８】
いくつかの実施形態では、元の自己相関係数の第１の係数ｒ（０）に従って、フレーム平均エネルギーが計算されてもよい。
Ｅｎｅｒ＿ａｖｇ＝ｒ（０）／Ｎ、ここで、Ｎはフレーム長
【００３９】
他の実施形態では、元の自己相関係数の第１の係数ｒ（０）に従って、フレームエネルギーパラメータが計算されてもよい。
【数２】

上式で、
【数３】

は、端数を切り捨てることを意味し、すなわち、
【数４】

である。
【００４０】
ステップ２０４：エネルギーパラメータに従って、白色雑音補正率を調節する。
【００４１】
この実施形態では、エネルギー閾値Ｅ_thrが設定されてもよい。エネルギーパラメータＥとＥ_thrとの関係に従って、入力信号が区別される。異なる入力信号に対して、異なる調節関数が、白色雑音補正率を調節するために使用される。具体的には、エネルギーパラメータが分布する異なるエネルギー閾値間隔に従って、異なる調節関数が、白色雑音補正率を調節するために使用される。
【数５】

【００４２】
いくつかの実施形態では、フレーム信号は、フレーム平均エネルギーＥｎｅｒ＿ａｖｇとエネルギー閾値Ｅ_thrとに従って、高エネルギーフレーム信号と低エネルギーフレーム信号とに分類され、次に、それに応じて白色雑音補正率ｗｉｎ_lag（０）が調節される。
ｉｆ（Ｅｎｅｒ＿ａｖｇ＞＝Ｅ_thr）
ｗｉｎ_lag（０）＝Ｈ＋α＊Ｅｎｅｒ＿ａｖｇ；
ｅｌｓｅ
ｗｉｎ_lag（０）＝Ｌ＋β＊Ｅｎｅｒ＿ａｖｇ；
【００４３】
エネルギー閾値Ｅ_thrは、多くの発話コーパスによる、無声発話と有声発話との間を区別することが可能な、定数として決定される。例えば、Ｅ_thr＝１６３８であり、これは約３２ｄＢである。Ｈ、Ｌ、α、βは経験的な定数であり、代表的なトレーニングデータを使用することによる、トレーニングを介して取得されてもよく、トレーニングは最終的な符号器性能によって評価される。例えば、Ｈ＝１．００１、Ｌ＝１．００２、α＝β＝−６×１０^-7である。
【００４４】
他の実施形態では、フレーム信号は、フレームエネルギーパラメータＥｎｅｒとエネルギー閾値Ｅ_thrとに従って、高エネルギーフレーム信号と低エネルギーフレーム信号とに分類され、次に、それに応じて白色雑音補正率ｗｉｎ_lag（０）が調節される。
ｉｆ（Ｅｎｅｒ＜Ｅ_thr）
ｗｉｎ_lag（０）＝Ｌ＋β＊（Ｅｎｅｒ＋Ｅ_thr）；
ｅｌｓｅ
ｗｉｎ_lag（０）＝Ｈ＋α＊（Ｅｎｅｒ＋Ｅ_thr）；
【００４５】
エネルギー閾値Ｅ_thrは、多くの発話コーパスによる、無声発話と有声発話との間を区別することが可能な、定数として決定される。フレーム長による影響を考慮して、異なるフレーム長に対して異なるエネルギー閾値が設定されてもよく、例えば、
【数６】

である。Ｈ、Ｌ、α、βは経験的な定数であり、代表的なトレーニングデータを使用することによるトレーニングを介して取得されてもよく、トレーニングは最終的な符号器性能によって評価される。例えば、Ｈ＝１．００２８、Ｌ＝１．００１８、α＝β＝−２^-14
である。
【００４６】
ステップ２０５：拡張帯域幅ｆ₀に従って、ラグウィンドウｗｉｎ_lag（ｋ）を計算する。
ｗｉｎ_lag（ｋ）＝ｅｘｐ［（−１／２）（２πｆ₀ｋ／ｆ_s）²］
ｋ＝１，．．．，ｐ
上式で、ｆ₀は、３４Ｈｚなどの、拡張帯域幅であり、ｆ_sは、８０００Ｈｚなどの、信号標本化周波数であり、ｐは、ＬＰの次数である。
【００４７】
ステップ２０６：元の自己相関係数ｒ（ｋ）と、調節された白色雑音補正率ｗｉｎ_lag
（０）と、ラグウィンドウｗｉｎ_lag（ｋ）とに従って、自己相関係数補正率が調節された後の修正された自己相関係数ｒ（０）’．．．ｒ（ｋ）’を計算する。
ｒ（０）’＝ｗｉｎ_lag（０）ｒ（０）
ｒ（ｋ）’ ＝ｗｉｎ_lag（ｋ）ｒ（ｋ）ｋ＝１，．．．，ｐ
【００４８】
ステップ２０７：修正された自己相関係数ｒ（０）’．．．ｒ（ｋ）’を使用して、ＬＰ係数を、レビンソン−ダービンアルゴリズムを介して計算する。
【００４９】
ステップ２０８：ＬＰ係数に従って、入力信号を符号化し、符号化されたビットストリームを出力する。ＬＰ係数に従って、入力信号に対して圧縮符号化を実行することは、ＬＰ分析を介して入力信号の残留信号を計算し、次に、ＬＴＰとエントロピー符号化とを実行し、最後に、残留信号のロスレス符号化されたビットストリームを出力することであってもよく、又は、ＬＰ係数と入力信号とをＣＥＬＰモデルに入力して、符号化されたビットストリームを取得することであってもよい。
【００５０】
この実施形態における技術的解決法を使用すれば、入力信号の特徴を示すエネルギーパラメータが、元の自己相関係数を介して計算され、エネルギーパラメータに従って、白色雑音補正率が調節され、その結果、調節された自己相関係数補正率が各フレーム信号の特徴に従って決定される。従って、ＬＰ係数は、信号の特徴に、より正確に適合し、不良条件の場合が回避され、計算される係数はよりロバストであり、計算複雑度は低い。
【００５１】
第３の実施形態
図３は、本発明の第３の実施形態における信号圧縮方法のフローチャートである。該方法は以下のステップを含む。
【００５２】
ステップ３０１：入力信号にウィンドウ関数を掛ける。ここでのウィンドウは、従来技術においてロッシー符号化に適用されるウィンドウであってもよい。入力信号ｓ（ｎ）にウィンドウ関数ｗｉｎ（ｎ）が掛けられ、ウィンドウ処理された入力信号ｓ’（ｎ）が取得される。
ｓ’（ｎ）＝ｗｉｎ（ｎ）ｓ（ｎ）ｎ＝０，．．．，Ｎ−１
ここで、Ｎはフレーム長
【００５３】
ステップ３０２：ウィンドウ処理された入力信号ｓ’（ｎ）に従って、元の自己相関係数ｒ（ｋ）を、例えば以下の式を介して計算する。
【数７】

ｋ＝０，．．．，ｐ、ここで、ｐはＬＰの次数
【００５４】
ステップ３０３：白色雑音補正率を、ｗｉｎ_lag（０）＝１．０００１であると決定す
る。
【００５５】
ステップ３０４：元の自己相関係数に従って、ウィンドウ処理された入力信号の少なくとも１つの反射係数を計算する。この実施形態では、計算を簡素化するために、第１の反射係数のみが計算されるが、本発明は第１の反射係数のみを計算することに限定されない。反射係数は、レビンソン−ダービン再帰アルゴリズムを介して計算されてもよい。
【数８】

【００５６】
この再帰アルゴリズムを介して、ｋ_i＝−ｋ_i’ ｉ＝１，．．．，ｐが計算され、ここで、ｋ₁＝ｒ（１）／ｒ（０）である。
【００５７】
ステップ３０５：例えばｋ₁などの、少なくとも１つの反射係数に従って、拡張帯域幅ｆ₀を適応的に計算し、調節する。
ｆ₀＝Ｆ＋αｋ₁、ここで、Ｆは６０Ｈｚなどの定数であってもよく、αは、代表的なトレーニングデータを使用することによるトレーニングを介して取得されてもよい、調整拡張因子（ｒｅｇｕｌａｔｉｎｇｅｘｐａｎｓｉｏｎｆａｃｔｏｒ）であり、トレーニングは最終的な符号器性能によって評価される。例えば、α＝１０である。
【００５８】
ステップ３０６：拡張帯域幅ｆ₀に従って、ラグウィンドウを計算する。
ｗｉｎ_lag（ｋ）＝ｅｘｐ［（−１／２）（２πｆ₀ｋ／ｆ_s）²］
ｋ＝１，．．．，ｐ
上式で、ｆ₀はステップ３０５で計算された拡張帯域幅であり、ｆ_sは８０００Ｈｚなどの信号標本化周波数であり、ｐはＬＰの次数である。
【００５９】
ステップ３０７：元の自己相関係数ｒ（ｋ）と、白色雑音補正率ｗｉｎ_lag（０）と、ラグウィンドウｗｉｎ_lag（ｋ）とに従って、自己相関係数補正率が調節された後の修正された自己相関係数ｒ（０）’．．．ｒ（ｋ）’を計算する。
ｒ（０）’＝ｗｉｎ_lag（０）ｒ（０）
ｒ（ｋ）’ ＝ｗｉｎ_lag（ｋ）ｒ（ｋ）ｋ＝１，．．．，ｐ
【００６０】
ステップ３０８：修正された自己相関係数ｒ（０）’．．．ｒ（ｋ）’を使用して、ＬＰ係数を、レビンソン−ダービンアルゴリズムを介して計算する。
【００６１】
ステップ３０９：ＬＰ係数に従って入力信号を符号化し、符号化されたビットストリームを出力する。ＬＰ係数に従って入力信号を符号化することは、ＬＰ係数と入力信号とをＣＥＬＰモデルに入力して、符号化されたビットストリームを取得することであってもよく、又は、ＬＰ分析を介して入力信号の残留信号を計算し、次に、ＬＴＰとエントロピー符号化とを実行し、最後に、残留信号のロスレス符号化されたビットストリームを出力することであってもよい。
【００６２】
この実施形態における技術的解決法を使用すれば、入力信号の特徴を示す反射係数が、元の自己相関係数を介して計算され、反射係数に従って拡張帯域幅が決定されて、ラグウィンドウが調節され、その結果、調節された自己相関係数補正率が各フレーム信号の特徴に従って決定される。従って、ＬＰ係数は、信号の特徴により正確に適合し、不良条件の場合が回避され、計算される係数はよりロバストであり、計算複雑度は低い。
【００６３】
第４の実施形態
図４は、本発明の第４の実施形態における信号圧縮方法のフローチャートである。方法は以下のステップを含む。
【００６４】
ステップ４０１：入力信号にウィンドウ関数を掛ける。ここでのウィンドウは、従来技術においてロッシー符号化に適用されるウィンドウであってもよい。入力信号ｓ（ｎ）にウィンドウ関数ｗｉｎ（ｎ）が掛けられ、ウィンドウ処理された入力信号ｓ’（ｎ）が取得される。
ｓ’（ｎ）＝ｗｉｎ（ｎ）ｓ（ｎ）ｎ＝０，．．．，Ｎ−１
ここで、Ｎはフレーム長
【００６５】
ステップ４０２：ウィンドウ処理された入力信号ｓ’（ｎ）に従って、元の自己相関係数ｒ（ｋ）を、例えば以下の式を介して計算する。
【数９】

ｋ＝０，．．．，ｐ、ここで、ｐはＬＰの次数
【００６６】
ステップ４０３：元の自己相関係数に従って、エネルギーパラメータを計算する。
【００６７】
いくつかの実施形態では、元の自己相関係数の第１の係数ｒ（０）に従って、フレーム平均エネルギーが計算されてもよい。
Ｅｎｅｒ＿ａｖｇ＝ｒ（０）／Ｎ、ここで、Ｎはフレーム長。
【００６８】
他の実施形態では、元の自己相関係数の第１の係数ｒ（０）に従って、フレームエネルギーパラメータが計算されてもよい。
【数１０】

上式で、
【数１１】

は、端数を切り捨てることを意味し、すなわち、
【数１２】

である。
【００６９】
ステップ４０４：エネルギーパラメータに従って、白色雑音補正率を調節する。
【００７０】
この実施形態では、エネルギー閾値Ｅ_thrが設定されてもよい。エネルギーパラメータＥとＥ_thrとの関係に従って入力信号が区別される。異なる入力信号に対して、異なる調節関数が、白色雑音補正率を調節するために使用される。具体的には、エネルギーパラメータが分布する異なるエネルギー閾値間隔に従って、異なる調節関数が、白色雑音補正率を調節するために使用される。
【数１３】

【００７１】
いくつかの実施形態では、フレーム信号は、フレーム平均エネルギーＥｎｅｒ＿ａｖｇとエネルギー閾値Ｅ_thrとに従って、高エネルギーフレーム信号と低エネルギーフレーム信号とに分類され、次に、それに応じて白色雑音補正率ｗｉｎ_lag（０）が調節される。
ｉｆ（Ｅｎｅｒ＿ａｖｇ＞＝Ｅ_thr）
ｗｉｎ_lag（０）＝Ｈ＋α＊Ｅｎｅｒ＿ａｖｇ；
ｅｌｓｅ
ｗｉｎ_lag（０）＝Ｌ＋β＊Ｅｎｅｒ＿ａｖｇ；
ここで、Ｅ_thr、Ｈ、Ｌ、α、βは、特定の条件に従って取得されてもよい、経験的な定数である。
【００７２】
他の実施形態では、フレーム信号は、フレームエネルギーパラメータＥｎｅｒとエネルギー閾値Ｅ_thrとに従って、高エネルギーフレーム信号と低エネルギーフレーム信号とに分類され、次に、それに応じて白色雑音補正率ｗｉｎ_lag（０）が調節される。
ｉｆ（Ｅｎｅｒ＜Ｅ_thr）
ｗｉｎ_lag（０）＝Ｌ＋β＊（Ｅｎｅｒ＋Ｅ_thr）；
ｅｌｓｅ
ｗｉｎ_lag（０）＝Ｈ＋α＊（Ｅｎｅｒ＋Ｅ_thr）；
ここで、Ｅ_thr、Ｈ、Ｌ、α、βは、特定の条件に従って取得されてもよい、経験的な定数である。
【００７３】
ステップ４０５：元の自己相関係数に従って、ウィンドウ処理された入力信号の少なくとも１つの反射係数を計算する。この実施形態では、計算を簡素化するために第１の反射係数のみが計算されるが、本発明は第１の反射係数のみを計算することに限定されない。
ｋ₁＝ｒ（１）／ｒ（０）
【００７４】
ステップ４０６：例えばｋ₁などの、少なくとも１つの反射係数に従って、拡張帯域幅ｆ₀を適応的に計算し調節する。
ｆ₀＝Ｆ＋αｋ₁
ここで、Ｆは、６０Ｈｚなどの定数であってもよく、αは、代表的なトレーニングデータを使用することによる、トレーニングを介して取得されてもよい、調整拡張因子であり、トレーニングは最終的な符号器性能によって評価される。例えば、α＝１０である。
【００７５】
ステップ４０７：拡張帯域幅ｆ₀に従って、ラグウィンドウを計算する。
ｗｉｎ_lag（ｋ）＝ｅｘｐ［（−１／２）（２πｆ₀ｋ／ｆ_s）²］
ｋ＝１，．．．，ｐ
上式で、ｆ₀はステップ４０６で計算された拡張帯域幅であり、ｆ_sは８０００Ｈｚなどの信号標本化周波数であり、ｐはＬＰの次数である。
【００７６】
ステップ４０８：元の自己相関係数ｒ（ｋ）と、調節された白色雑音補正率ｗｉｎ_lag（０）と、ラグウィンドウｗｉｎ_lag（ｋ）とに従って、自己相関係数補正率が調節された後の修正された自己相関係数を計算する。
ｒ（０）’＝ｗｉｎ_lag（０）ｒ（０）
ｒ（ｋ）’ ＝ｗｉｎ_lag（ｋ）ｒ（ｋ）ｋ＝１，．．．，ｐ
【００７７】
ステップ４０９：修正された自己相関係数ｒ（０）’．．．ｒ（ｋ）’を使用して、ＬＰ係数を、レビンソン−ダービンアルゴリズムを介して計算する。
【００７８】
ステップ４１０：ＬＰ係数に従って入力信号を符号化し、符号化されたビットストリームを出力する。ＬＰ係数に従って入力信号を符号化することは、ＬＰ分析を介して入力信号の残留信号を計算し、次に、ＬＴＰとエントロピー符号化とを実行し、最後に、残留信号のロスレス符号化されたビットストリームを出力することであってもよく、又は、ＬＰ係数と入力信号とをＣＥＬＰモデルに入力して、符号化されたビットストリームを取得することであってもよい。
【００７９】
この実施形態における技術的解決法を使用すれば、入力信号の特徴を示すエネルギーパラメータと反射係数とが、元の自己相関係数を介して計算され、エネルギーパラメータに従って白色雑音補正率が調節され、反射係数に従って拡張帯域幅が決定されて、ラグウィンドウが調節され、その結果、調節された自己相関係数補正率が各フレーム信号の特徴に従って決定される。従って、ＬＰ係数は、信号の特徴により正確に適合し、不良条件の場合が回避され、計算される係数はよりロバストであり、計算複雑度は低い。
【００８０】
第５の実施形態
図５は、本発明の第５の実施形態における信号圧縮装置の構成を示す。装置は、
入力信号にウィンドウ関数を掛けるように構成された、ウィンドウ処理ユニット５０１と、
ウインドウ処理ユニット５０１によって処理された入力信号の、元の自己相関係数を計算するように構成された、元の自己相関係数計算ユニット５０２と、
元の自己相関係数計算ユニット５０２によって計算された元の自己相関係数に従って、自己相関係数補正率を調節し、元の自己相関係数と、調節された自己相関係数補正率とに従って、修正された自己相関係数を計算するように構成された、帯域幅拡張ユニット５０３と、
帯域幅拡張ユニット５０３によって計算された、修正された自己相関係数に従って、ＬＰ係数を計算するように構成された、線形予測係数計算ユニット５０４と、
線形予測係数計算ユニット５０４によって計算されたＬＰ係数に従って、入力信号を符号化し、符号化されたビットストリームを出力するように構成された、圧縮ユニット５０５とを含む。
【００８１】
本発明の別の実施形態では、装置は、入力信号を後続のモジュールによって処理されるのにより適したものとするために、様々なタイプの圧縮用に入力信号を前処理し、前処理された入力信号をウィンドウ処理ユニット５０１に送信するように構成された、前処理ユニット５００を更に含んでもよい。ロッシー圧縮のためには、前処理ユニットは、入力信号の高周波成分を増加させるように、又は、不必要な低周波干渉成分を除去するように構成された、プリエンファシスフィルタ又はハイパスフィルタであってもよい。その後、フィルタ処理された信号は、ウィンドウ処理ユニット５０１に入力される。ロスレス圧縮のためには、前処理ユニットは、入力信号をＡ則又はμ則からＰＣＭ領域にマッピングするマッピングモジュールであってもよい。ＰＣＭ領域内の信号は、ＬＰ短期予測のためにより適している。
【００８２】
上記の実施形態における技術的解決法を使用すれば、元の自己相関係数は、各フレーム信号の特徴を反映し、そのような特徴に従って自己相関係数補正率が調節され、その結果、調節された自己相関係数補正率が各フレーム信号の特徴に従って決定される。従って、ＬＰ係数は、信号の特徴により正確に適合し、不良条件の場合が回避され、計算される係数はよりロバストであり、計算複雑度は低い。
【００８３】
第６の実施形態
図６は、本発明の第６の実施形態における信号圧縮装置の構成を示す。該装置は、ウィンドウ処理ユニット６０１と、元の自己相関係数計算ユニット６０２と、帯域幅拡張ユニット６０３と、ＬＰ係数計算ユニット６０４と、ＬＰ予測ユニット６０５と、ＬＴＰ処理ユニット６０６と、エントロピー符号化ユニット６０７とを含む。
【００８４】
ウィンドウ処理ユニット６０１は、入力信号にウィンドウ関数を掛けるように構成される。ウィンドウ処理ユニット６０１は、従来技術においてロッシー符号化に適用されるウィンドウ処理ユニットであってもよい。入力信号ｓ（ｎ）にウィンドウ関数ｗｉｎ（ｎ）が掛けられて、ウィンドウ処理された入力信号ｓ’（ｎ）が取得される。
ｓ’（ｎ）＝ｗｉｎ（ｎ）ｓ（ｎ）ｎ＝０，．．．，Ｎ−１
ここで、Ｎはフレーム長
【００８５】
元の自己相関係数計算ユニット６０２は、ウインドウ処理ユニット６０１によって処理された入力信号の、元の自己相関係数を、例えば以下の式を介して計算するように構成される。
【数１４】

ｋ＝０，．．．，ｐ、ここで、ｐはＬＰの次数
【００８６】
図７に示すように、帯域幅拡張ユニット６０３は、エネルギーモジュール７０１と、白色雑音補正率モジュール７０２と、ラグウィンドウモジュール７０３と、修正された自己相関係数計算モジュール７０４とを含んでもよい。
【００８７】
エネルギーモジュール７０１は、元の自己相関係数に従ってエネルギーパラメータを計算するように構成される。
【００８８】
いくつかの実施形態では、エネルギーモジュール７０１は、元の自己相関係数の第１の係数ｒ（０）に従って、フレーム平均エネルギーを計算してもよい。Ｅｎｅｒ＿ａｖｇ＝ｒ（０）／Ｎ、ここで、Ｎはフレーム長
【００８９】
他の実施形態では、エネルギーモジュール７０１は、元の自己相関係数の第１の係数ｒ（０）に従って、フレームエネルギーパラメータＥｎｅｒを計算してもよい。
【数１５】

上式で、
【数１６】

は、端数を切り捨てることを意味し、すなわち、
【数１７】

である。
【００９０】
白色雑音補正率モジュール７０２は、エネルギーモジュール７０１によって計算されたエネルギーパラメータに従って、白色雑音補正率を調節するように構成される。
【００９１】
この実施形態では、エネルギー閾値Ｅ_thrが設定されてもよい。エネルギーパラメータＥとＥ_thrとの関係に従って入力信号が区別される。異なる入力信号に対して異なる調節関数が、白色雑音補正率を調節するために使用される。具体的には、エネルギーパラメータが分布する異なるエネルギー閾値間隔に従って、異なる調節関数が白色雑音補正率を調節するために使用される。
【数１８】

【００９２】
いくつかの実施形態では、白色雑音補正率モジュール７０２は、フレーム平均エネルギーＥｎｅｒ＿ａｖｇとエネルギー閾値Ｅ_thrとに従って、フレーム信号を高エネルギーフレーム信号と低エネルギーフレーム信号とに分類し、次に、それに応じて白色雑音補正率ｗｉｎ_lag（０）を調節してもよい。
ｉｆ（Ｅｎｅｒ＿ａｖｇ＞＝Ｅ_thr）
ｗｉｎ_lag（０）＝Ｈ＋α＊Ｅｎｅｒ＿ａｖｇ；
ｅｌｓｅ
ｗｉｎ_lag（０）＝Ｌ＋β＊Ｅｎｅｒ＿ａｖｇ；
ここで、Ｅ_thr、Ｈ、Ｌ、α、βは、特定の条件に従って取得されてもよい経験的な定数である。
【００９３】
他の実施形態では、白色雑音補正率モジュール７０２は、フレームエネルギーパラメータＥｎｅｒとエネルギー閾値Ｅ_thrとに従って、フレーム信号を高エネルギーフレーム信号と低エネルギーフレーム信号とに分類し、次に、それに応じて白色雑音補正率ｗｉｎ_lag（０）を調節してもよい。
ｉｆ（Ｅｎｅｒ＜Ｅ_thr）
ｗｉｎ_lag（０）＝Ｌ＋β＊（Ｅｎｅｒ＋Ｅ_thr）；
ｅｌｓｅ
ｗｉｎ_lag（０）＝Ｈ＋α＊（Ｅｎｅｒ＋Ｅ_thr）；
ここで、Ｈ、Ｌ、α、βは、特定の条件に従って取得されてもよい経験的な定数である。
【００９４】
ラグウィンドウモジュール７０３は、拡張帯域幅ｆ₀に従って、ラグウィンドウｗｉｎ_lag（ｋ）を計算するように構成される。
ｗｉｎ_lag（ｋ）＝ｅｘｐ［（−１／２）（２πｆ₀ｋ／ｆ_s）²］
ｋ＝１，．．．，ｐ
上式で、ｆ₀は３４Ｈｚなどの拡張帯域幅であり、ｆ_sは８０００Ｈｚなどの信号標本化周波数であり、ｐはＬＰの次数である。
【００９５】
修正された自己相関係数計算モジュール７０４は、元の自己相関係数ｒ（ｋ）と、調節された白色雑音補正率ｗｉｎ_lag（０）と、ラグウィンドウｗｉｎ_lag（ｋ）とに従って、自己相関係数補正率が調節された後の修正された自己相関係数を計算するように構成される。
ｒ（０）’＝ｗｉｎ_lag（０）ｒ（０）
ｒ（ｋ）’ ＝ｗｉｎ_lag（ｋ）ｒ（ｋ）ｋ＝１，．．．，ｐ’
【００９６】
ＬＰ係数計算ユニット６０４は、帯域幅拡張ユニット６０３によって調節された、修正された自己相関係数ｒ（０）’．．．ｒ（ｋ）’に従って、ＬＰ係数を、レビンソン−ダービンアルゴリズムを介して計算するように構成される。
【００９７】
ＬＰ予測ユニット６０５は、ＬＰ係数計算ユニット６０４によって計算されたＬＰ係数に従って、入力信号に対してＬＰ分析を実行して、残留信号を計算するように構成される。
【００９８】
ＬＴＰ処理ユニット６０６は、ＬＰ予測ユニット６０５によって出力された残留信号に対して、ＬＴＰを実行するように構成される。
【００９９】
エントロピー符号化ユニット６０７は、ＬＴＰ処理ユニット６０６によって、長期予測の後で出力された信号に対して、エントロピー符号化を実行し、残留信号のロスレス符号化されたビットストリームを出力するように構成される。
【０１００】
ＬＰ予測ユニット６０５、ＬＴＰ処理ユニット６０６、及びエントロピー符号化ユニット６０７は、従来技術において適用される機能ユニットであってもよい。
【０１０１】
この実施形態における技術的解決法を使用すれば、入力信号の特徴を示すエネルギーパラメータが元の自己相関係数を介して計算され、エネルギーパラメータに従って白色雑音補正率が調節され、その結果、調節された自己相関係数補正率が各フレーム信号の特徴に従って決定される。従って、ＬＰ係数は、信号の特徴により正確に適合し、不良条件の場合が回避され、計算される係数はよりロバストであり、計算複雑度は低い。
【０１０２】
第７の実施形態
図８は、本発明の第７の実施形態における信号圧縮装置の構成を示す。該装置は、ウィンドウ処理ユニット８０１と、元の自己相関係数計算ユニット８０２と、帯域幅拡張ユニット８０３と、ＬＰ係数計算ユニット８０４と、ＣＥＬＰ符号化ユニット８０５とを含む。
【０１０３】
ウィンドウ処理ユニット８０１は、入力信号にウィンドウ関数を掛けるように構成される。ウィンドウ処理ユニット８０１は、従来技術においてロッシー符号化に適用されるウィンドウ処理ユニットであってもよい。入力信号ｓ（ｎ）にウィンドウ関数ｗｉｎ（ｎ）が掛けられて、ウィンドウ処理された入力信号ｓ’（ｎ）が取得される。
ｓ’（ｎ）＝ｗｉｎ（ｎ）ｓ（ｎ）ｎ＝０，．．．，Ｎ−１
ここで、Ｎはフレーム長
【０１０４】
元の自己相関係数計算ユニット８０２は、ウインドウ処理ユニット８０１によって処理された入力信号の元の自己相関係数を、例えば以下の式を介して計算するように構成される。
【数１９】

ｋ＝０，．．．，ｐ
ここで、ｐはＬＰの次数
【０１０５】
図９に示すように、帯域幅拡張ユニット８０３は、白色雑音補正率モジュール９０１と、反射係数計算モジュール９０２と、拡張帯域幅計算モジュール９０３と、ラグウィンドウモジュール９０４と、修正された自己相関係数計算モジュール９０５とを含んでもよい。
【０１０６】
白色雑音補正率モジュール９０１は、白色雑音補正率ｗｉｎ_lag（０）＝１．０００１を決定するように構成される。
【０１０７】
反射係数計算モジュール９０２は、元の自己相関係数に従って、フレーム信号の少なくとも１つの反射係数を計算するように構成される。この実施形態では、計算を簡素化するために第１の反射係数のみが計算されるが、本発明は第１の反射係数のみを計算することに限定されない。
ｋ₁＝ｒ（１）／ｒ（０）
【０１０８】
拡張帯域幅計算モジュール９０３は、反射係数計算モジュール９０２によって計算された反射係数ｋ₁に従って拡張帯域幅を適応的に計算し、調節するように構成される。
ｆ₀＝Ｆ＋αｋ₁
ここで、Ｆは６０Ｈｚであってもよく、αは実験的に決定される経験的因子である。
【０１０９】
ラグウィンドウモジュール９０４は、拡張帯域幅計算モジュール９０３によって出力された拡張帯域幅ｆ₀に従って、ラグウィンドウを計算するように構成される。
ｗｉｎ_lag（ｋ）＝ｅｘｐ［（−１／２）（２πｆ₀ｋ／ｆ_s）²］
ｋ＝１，．．．，ｐ
上式で、ｆ₀は拡張帯域幅計算モジュール９０３によって計算された拡張帯域幅であり、ｆ_sは８０００Ｈｚなどの信号標本化周波数であり、ｐはＬＰの次数である。
【０１１０】
修正された自己相関係数計算モジュール９０５は、元の自己相関係数ｒ（ｋ）と、白色雑音補正率ｗｉｎ_lag（０）と、ラグウィンドウｗｉｎ_lag（ｋ）とに従って、自己相関係数補正率が調節された後の修正された自己相関係数を計算するように構成される。
ｒ（０）’＝ｗｉｎ_lag（０）ｒ（０）
ｒ（ｋ）’ ＝ｗｉｎ_lag（ｋ）ｒ（ｋ）ｋ＝１，．．．，ｐ
【０１１１】
ＬＰ係数計算ユニット８０４は、帯域幅拡張ユニット８０３によって調節された、修正された自己相関係数ｒ（０）’．．．ｒ（ｋ）’に従って、ＬＰ係数を、レビンソン−ダービンアルゴリズムを介して計算するように構成される。
【０１１２】
ＣＥＬＰ符号化ユニット８０５は、ＬＰ係数計算ユニット８０４によって計算されたＬＰ係数と、入力信号とを、ＣＥＬＰモデルに入力して、符号化されたビットストリームを取得するように構成される。
【０１１３】
図１０に示すように、別の実施形態における帯域幅拡張ユニットは、エネルギーモジュール１００１と、白色雑音補正率モジュール１００２と、反射係数計算モジュール１００３と、拡張帯域幅計算モジュール１００４と、ラグウィンドウモジュール１００５と、修正された自己相関係数計算モジュール１００６とを含んでもよい。図１０に示す帯域幅拡張ユニットは、第６の実施形態における帯域幅拡張ユニット６０３、及び第７の実施形態における帯域幅拡張ユニット８０３の代替であってもよく、帯域幅拡張ユニット６０３は、第７の実施形態において、帯域幅拡張ユニット８０３に取って代わるために適用されてもよく、帯域幅拡張ユニット８０３は、第６の実施形態において、帯域幅拡張ユニット６０３に取って代わるために適用されてもよい。
【０１１４】
エネルギーモジュール１００１は、元の自己相関係数に従って、エネルギーパラメータを計算するように構成される。
【０１１５】
いくつかの実施形態では、エネルギーモジュール１００１は、元の自己相関係数の第１の係数ｒ（０）に従って、フレーム平均エネルギーを計算してもよい。
Ｅｎｅｒ＿ａｖｇ＝ｒ（０）／Ｎここで、Ｎはフレーム長
【０１１６】
他の実施形態では、エネルギーモジュール１００１は、元の自己相関係数の第１の係数ｒ（０）に従って、フレームエネルギーパラメータＥｎｅｒを計算してもよい。
【数２０】

上式で、
【数２１】

は、端数を切り捨てることを意味し、すなわち、
【数２２】

である。
【０１１７】
白色雑音補正率モジュール１００２は、エネルギーモジュール１００１によって計算されたエネルギーパラメータに従って、白色雑音補正率を調節するように構成される。
【０１１８】
この実施形態では、エネルギー閾値Ｅ_thrが設定されてもよい。エネルギーパラメータＥとＥ_thrとの関係に従って入力信号が区別される。異なる入力信号に対して、異なる調節関数が白色雑音補正率を調節するために使用される。具体的には、エネルギーパラメータが分布する異なるエネルギー閾値間隔に従って、異なる調節関数が白色雑音補正率を調節するために使用される。
【数２３】

【０１１９】
いくつかの実施形態では、白色雑音補正率モジュール１００２は、フレーム平均エネルギーＥｎｅｒ＿ａｖｇとエネルギー閾値Ｅ_thrとに従って、フレーム信号を高エネルギーフレーム信号と低エネルギーフレーム信号とに分類し、次に、それに応じて白色雑音補正率ｗｉｎ_lag（０）を調節してもよい。
ｉｆ（Ｅｎｅｒ＿ａｖｇ＞＝Ｅ_thr）
ｗｉｎ_lag（０）＝Ｈ＋α＊Ｅｎｅｒ＿ａｖｇ；
ｅｌｓｅ
ｗｉｎ_lag（０）＝Ｌ＋β＊Ｅｎｅｒ＿ａｖｇ；
ここで、Ｅ_thr、Ｈ、Ｌ、α、βは、特定の条件に従って取得されてもよい経験的な定数である。
【０１２０】
他の実施形態では、白色雑音補正率モジュール１００２は、フレームエネルギーパラメータＥｎｅｒとエネルギー閾値Ｅ_thrとに従って、フレーム信号を、高エネルギーフレーム信号と低エネルギーフレーム信号とに分類し、次に、それに応じて白色雑音補正率ｗｉｎ_lag（０）を調節してもよい。
ｉｆ（Ｅｎｅｒ＜Ｅ_thr）
ｗｉｎ_lag（０）＝Ｌ＋β＊（Ｅｎｅｒ＋Ｅ_thr）；
ｅｌｓｅ
ｗｉｎ_lag（０）＝Ｈ＋α＊（Ｅｎｅｒ＋Ｅ_thr）；
ここで、Ｈ、Ｌ、α、βは、特定の条件に従って取得されてもよい経験的な定数である。
【０１２１】
反射係数計算モジュール１００３は、元の自己相関係数に従って、フレーム信号の少なくとも１つの反射係数を計算するように構成される。この実施形態では、計算を簡素化するために、第１の反射係数のみが計算されるが、本発明は第１の反射係数のみを計算することに限定されない。
ｋ₁＝ｒ（１）／ｒ（０）
【０１２２】
拡張帯域幅計算モジュール１００４は、反射係数計算モジュール１００３によって計算された反射係数ｋ₁に従って、拡張帯域幅を適応的に計算し調節するように構成される。
ｆ₀＝Ｆ＋αｋ
ここで、Ｆは６０Ｈｚであってもよく、αは実験的に決定される経験的因子である。
【０１２３】
ラグウィンドウモジュール１００５は、拡張帯域幅計算モジュール１００４によって出力された拡張帯域幅ｆ₀に従って、ラグウィンドウを計算するように構成される。
ｗｉｎ_lag（ｋ）＝ｅｘｐ［（−１／２）（２πｆ₀ｋ／ｆ_s）²］
ｋ＝１，．．．，ｐ
上式で、ｆ₀は拡張帯域幅計算モジュール１００４によって計算された拡張帯域幅であり、ｆ_sは８０００Ｈｚなどの信号標本化周波数であり、ｐはＬＰの次数である。
【０１２４】
修正された自己相関係数計算モジュール１００６は、元の自己相関係数ｒ（ｋ）と、白色雑音補正率ｗｉｎ_lag（０）と、ラグウィンドウｗｉｎ_lag（ｋ）とに従って、自己相関係数補正率が調節された後の修正された自己相関係数を計算するように構成される。
ｒ（０）’＝ｗｉｎ_lag（０）ｒ（０）
ｒ（ｋ）’ ＝ｗｉｎ_lag（ｋ）ｒ（ｋ）ｋ＝１，．．．，ｐ
【０１２５】
上記の実施形態における技術的解決法を使用すれば、入力信号の特徴を示すエネルギーパラメータと反射係数とが元の自己相関係数を介して計算され、エネルギーパラメータに従って白色雑音補正率が調節され、反射係数に従って拡張帯域幅が決定されて、ラグウィンドウが調節され、その結果、調節された自己相関係数補正率が各フレーム信号の特徴に従って決定される。従って、ＬＰ係数は、信号の特徴により正確に適合し、不良条件の場合が回避され、計算される係数はよりロバストであり、計算複雑度は低い。
【０１２６】
本発明の実施形態では、ＬＰ係数は、レビンソン−ダービンアルゴリズム、共分散法、及び格子法などの多くのアルゴリズムを介して、修正された自己相関係数に従って計算される。上述の実施形態では、レビンソン−ダービンアルゴリズムを例として使用したが、本発明はアルゴリズムを限定しない。
【０１２７】
本発明の実施形態では、ウィンドウ処理された入力信号の複数の反射係数ｋ_iが、元の自己相関係数に従って計算されてもよく、次に、１つ以上の反射係数を介して拡張帯域幅が計算される。この場合、それに応じて拡張帯域幅の計算モードが変化してもよい。すなわち、複数の反射係数が、複数の調整拡張因子と共に使用されて、反射係数と拡張帯域幅との間の新たな式を生成する。本発明の実施形態では、反射係数と拡張帯域幅との間の例示的な式を提供したが、当業者は、創造的な作業なしに、本明細書に記載した実施形態から、反射係数と拡張帯域幅との間の様々な式を導き出すことが可能である。本発明は、反射係数と拡張帯域幅との間の式を限定しない。具体的には、各反射係数に対応する調整拡張因子が、代表的なトレーニングデータを使用することによる、トレーニングを介して取得されてもよく、トレーニングは最終的な符号器性能によって評価され、次に、反射係数と拡張帯域幅との間の様々な式が構築される。
【０１２８】
上記の実施形態のステップの全て又は一部は、コンピュータプログラムによって命令されるハードウェアによって実施されてもよいということを、当業者は理解できる。プログラムは、コンピュータ読み取り可能な記憶媒体内に記憶されてもよい。実行される場合、プログラムは、上記の実施形態に包含される処理を実行する。記憶媒体は、磁気ディスク、コンパクトディスク、読み取り専用メモリ（ＲＯＭ）、又はランダムアクセスメモリ（ＲＡＭ）であってもよい。
【０１２９】
本発明の実施形態の目的、技術的解決法、及び利点について、上記で詳細に説明した。本発明について、いくつかの例示的実施形態を介して説明してきたが、本発明はそのような実施形態に限定されない。当業者が、本発明の範囲から逸脱することなく、本発明に対して修正及び変形を行うことが可能であることは明白である。本発明は、それらの修正及び変形を、それらが特許請求の範囲又はその均等物によって規定される保護範囲に入るならば、包含することを意図するものである。

【特許請求の範囲】
【請求項１】
入力信号にウィンドウ関数を掛け算し、
ウィンドウ処理された入力信号の元の自己相関係数を計算し、
前記元の自己相関係数に従って自己相関係数補正率を調節し、ここで、前記自己相関係数補正率は、白色雑音補正率とラグウィンドウとを含み、前記元の自己相関係数に従って自己相関係数補正率を調節することは、前記元の自己相関係数に従って前記白色雑音補正率と前記ラグウィンドウの少なくとも一つを調節することを含み、
前記元の自己相関係数と、前記調節された自己相関係数補正率とに従って、修正された自己相関係数を計算し、
前記修正された自己相関係数に従って線形予測係数を計算し、
前記線形予測係数に従って、前記入力信号を符号化し、符号化されたビットストリームを出力すること
を含むことを特徴とする、信号圧縮方法。
【請求項２】
前記元の自己相関係数に従って自己相関係数補正率を調節することは、
前記元の自己相関係数に従ってエネルギーパラメータを計算し、前記エネルギーパラメータに従って白色雑音補正率を調節し、
前記元の自己相関係数に従って前記ウィンドウ処理された入力信号の少なくとも１つの反射係数を計算し、前記少なくとも１つの反射係数に従って拡張帯域幅を調節し、調節された拡張帯域幅に従ってラグウィンドウを計算すること
を含む、請求項１に記載の信号圧縮方法。
【請求項３】
前記元の自己相関係数に従って自己相関係数補正率を調節することは、
前記元の自己相関係数に従ってエネルギーパラメータを計算し、前記エネルギーパラメータに従って白色雑音補正率を調節し、
拡張帯域幅に従ってラグウィンドウを計算すること
を含む、請求項１に記載の信号圧縮方法。
【請求項４】
前記元の自己相関係数に従ってエネルギーパラメータを計算し、前記エネルギーパラメータに従って白色雑音補正率を調節することは、
前記元の自己相関係数の第１の係数ｒ（０）に従って前記エネルギーパラメータを計算し、
前記エネルギーパラメータが分布する異なるエネルギー閾値間隔、すなわち、
【数２４】

ここで、ｗｉｎ_lag（０）は、前記白色雑音補正率、Ｅは、前記エネルギーパラメータ、及びＥ_thrは前記エネルギー閾値、
に従って、異なる調節関数を使用して前記白色雑音補正率を調節すること
を含む、請求項２又は３に記載の信号圧縮方法。
【請求項５】
前記元の自己相関係数に従ってエネルギーパラメータを計算し、前記エネルギーパラメータに従って白色雑音補正率を調節することは、
前記元の自己相関係数の第１の係数ｒ（０）に従って、式
【数２５】

を介して、フレームエネルギーパラメータＥｎｅｒを計算し、
前記フレームエネルギーパラメータＥｎｅｒがエネルギー閾値Ｅ_thr以上である場合、式Ｗｉｎ_lag（０）＝Ｈ＋α＊（Ｅｎｅｒ＋Ｅ_thr）を介して、前記白色雑音補正率Ｗｉｎ_lag（０）を調節し、前記フレームエネルギーパラメータＥｎｅｒが前記エネルギー閾値Ｅ_thr未満である場合、式Ｗｉｎ_lag（０）＝Ｌ＋β＊（Ｅｎｅｒ＋Ｅ_thr）を介して、前記白色雑音補正率Ｗｉｎ_lag（０）を調節すること
を含み、ここで、Ｈ、Ｌ、α、βは経験的な定数である、請求項２又は３に記載の信号圧縮方法。
【請求項６】
前記元の自己相関係数に従ってエネルギーパラメータを計算し、前記エネルギーパラメータに従って白色雑音補正率を調節することは、
前記元の自己相関係数の第１の係数ｒ（０）とフレーム長Ｎとに従って、式Ｅｎｅｒ＿ａｖｇ＝ｒ（０）／Ｎを介して、フレーム平均エネルギーＥｎｅｒ＿ａｖｇを計算し、
前記フレーム平均エネルギーＥｎｅｒ＿ａｖｇがエネルギー閾値Ｅ_thr以上である場合、式Ｗｉｎ_lag（０）＝Ｈ＋α＊Ｅｎｅｒ＿ａｖｇを介して、前記白色雑音補正率Ｗｉｎ_lag（０）を調節し、前記フレーム平均エネルギーＥｎｅｒ＿ａｖｇが前記エネルギー閾値Ｅ_thr未満である場合、式Ｗｉｎ_lag（０）＝Ｌ＋β＊Ｅｎｅｒ＿ａｖｇを介して、前記白色雑音補正率Ｗｉｎ_lag（０）を調節すること
を含み、ここで、Ｈ、Ｌ、α、βは経験的な定数である、請求項２又は３に記載の信号圧縮方法。
【請求項７】
前記元の自己相関係数に従って自己相関係数補正率を調節することは、
前記元の自己相関係数に従って前記ウィンドウ処理された入力信号の少なくとも１つの反射係数を計算し、前記少なくとも１つの反射係数に従って拡張帯域幅を調節し、調節された拡張帯域幅に従ってラグウィンドウを計算すること
を含む、請求項１に記載の信号圧縮方法。
【請求項８】
前記元の自己相関係数に従って前記ウィンドウ処理された入力信号の少なくとも１つの反射係数を計算し、前記少なくとも１つの反射係数に従って拡張帯域幅を調節することは、
式ｋ₁＝ｒ（１）／ｒ（０）を介して第１の反射係数ｋ₁を計算し、ここで、ｒ（０）は前記元の自己相関係数の第１の係数であり、ｒ（１）は前記元の自己相関係数の第２の係数であり、
式ｆ₀＝Ｆ＋αｋ₁に従って前記拡張帯域幅ｆ₀を計算すること
を含み、ここで、Ｆ及びαは経験的な定数である、請求項２又は７に記載の信号圧縮方法。
【請求項９】
前記線形予測係数に従って前記入力信号を符号化し、符号化されたビットストリームを出力することは、
前記線形予測係数に従って前記入力信号に対する線形予測を実行し、残留信号を計算し、前記残留信号を符号化し、前記符号化されたビットストリームを出力すること
を含む、請求項１〜３のいずれか一項に記載の信号圧縮方法。
【請求項１０】
入力信号にウィンドウ関数を掛けるように構成された、ウィンドウ処理ユニットと、
前記ウインドウ処理ユニットによって処理された入力信号の元の自己相関係数を計算するように構成された、元の自己相関係数計算ユニットと、
前記元の自己相関係数計算ユニットによって計算された前記元の自己相関係数に従って、自己相関係数補正率を調節し、前記元の自己相関係数と前記調節された自己相関係数補正率とに従って、修正された自己相関係数を計算するように構成された、帯域幅拡張ユニットであって、前記自己相関係数補正率は、白色雑音補正率とラグウィンドウとを含み、前記元の自己相関係数に従って自己相関係数補正率を調節することは、前記元の自己相関係数に従って前記白色雑音補正率と前記ラグウィンドウの少なくとも一つを調節することを含む、帯域幅拡張ユニットと、
前記帯域幅拡張ユニットによって計算された前記修正された自己相関係数に従って、線形予測係数を計算するように構成された、線形予測係数計算ユニットと、
前記線形予測係数計算ユニットによって計算された前記線形予測係数に従って前記入力信号を符号化し、符号化されたビットストリームを出力するように構成された、圧縮ユニットと
を備えることを特徴とする、信号圧縮装置。
【請求項１１】
前記帯域幅拡張ユニットは、
前記元の自己相関係数に従ってエネルギーパラメータを計算するように構成された、エネルギーモジュールと、
前記エネルギーモジュールによって計算された前記エネルギーパラメータに従って白色雑音補正率を調節するように構成された、白色雑音補正率モジュールと、
前記元の自己相関係数に従って前記ウィンドウ処理された入力信号の少なくとも１つの反射係数を計算するように構成された、反射係数計算モジュールと、
前記反射係数計算モジュールによって計算された、前記少なくとも１つの反射係数に従って拡張帯域幅を調節するように構成された、拡張帯域幅計算モジュールと、
前記拡張帯域幅計算モジュールによって出力された、調節された拡張帯域幅に従ってラグウィンドウを計算するように構成された、ラグウィンドウモジュールと、
前記元の自己相関係数と、調節された白色雑音補正率と、前記ラグウィンドウとに従って、前記修正された自己相関係数を計算するように構成された、修正された自己相関係数計算モジュールと
を備える、請求項１０に記載の信号圧縮装置。
【請求項１２】
前記帯域幅拡張ユニットは、
前記元の自己相関係数に従ってエネルギーパラメータを計算するように構成された、エネルギーモジュールと、
前記エネルギーモジュールによって計算された前記エネルギーパラメータに従って白色雑音補正率を調節するように構成された、白色雑音補正率モジュールと、
拡張帯域幅に従ってラグウィンドウを計算するように構成された、ラグウィンドウモジュールと、
前記元の自己相関係数と、調節された白色雑音補正率と、前記ラグウィンドウとに従って前記修正された自己相関係数を計算するように構成された、修正された自己相関係数計算モジュールと
を備える、請求項１０に記載の信号圧縮装置。
【請求項１３】
前記帯域幅拡張ユニットは、
白色雑音補正率を決定するように構成された白色雑音補正率モジュールと、
前記元の自己相関係数に従って前記ウィンドウ処理された入力信号の少なくとも１つの反射係数を計算するように構成された、反射係数計算モジュールと、
前記反射係数計算モジュールによって計算された前記少なくとも１つの反射係数に従って、拡張帯域幅を調節するように構成された、拡張帯域幅計算モジュールと、
前記拡張帯域幅計算モジュールによって出力された調節された拡張帯域幅に従って、ラグウィンドウを計算するように構成された、ラグウィンドウモジュールと、
前記元の自己相関係数と、前記白色雑音補正率と、前記ラグウィンドウとに従って、前記修正された自己相関係数を計算するように構成された、修正された自己相関係数計算モジュールと
を備える、請求項１０に記載の信号圧縮装置。
【請求項１４】
前記入力信号を後続のモジュールによって処理されるのにより適したものとするために、様々なタイプの圧縮用に前記入力信号を前処理し、前処理された入力信号を前記ウィンドウ処理ユニットに送信するように構成された、前処理ユニット
を更に備える、請求項１０〜１３のいずれか一項に記載の信号圧縮装置。
【請求項１５】
方法を実行するための、プロセッサによる実行のために、コンピュータ使用可能な命令が記憶された、コンピュータ読み取り可能な媒体であって、前記方法は、
入力信号にウィンドウ関数を掛け、
ウィンドウ処理された入力信号の、元の自己相関係数を計算し、
前記元の自己相関係数に従って、自己相関係数補正率を調節し、
前記元の自己相関係数と、前記調節された自己相関係数補正率とに従って、修正された自己相関係数を計算し、
前記修正された自己相関係数に従って、線形予測係数を計算し、
前記線形予測係数に従って、前記入力信号を符号化し、符号化されたビットストリームを出力すること
を含むことを特徴とする、コンピュータ読み取り可能な媒体。
【請求項１６】
入力信号にウィンドウ関数を掛け算し、
ウィンドウ処理された入力信号の元の自己相関係数を計算し、
前記元の自己相関係数の第１の係数に従ってエネルギーパラメータを計算し、当該エネルギーパラメータに従って白色雑音補正率を調節し、
拡張帯域幅に従ってラグウィンドウを計算し、
前記元の自己相関係数と、前記調節された白色雑音補正率と、前記ラグウィンドウと、に従って、修正された自己相関係数を計算し、
前記修正された自己相関係数に従って線形予測係数を計算し、
前記線形予測係数に従って前記入力信号に対する線形予測を実行し、残留信号を計算し、前記残留信号を符号化し、符号化されたビットストリームを出力すること
を含むことを特徴とする、信号圧縮方法。
【請求項１７】
前記元の自己相関係数に従ってエネルギーパラメータを計算することは、
前記元の自己相関係数の第１の係数ｒ（０）に従って、式
【数２５】

を介して、前記エネルギーパラメータＥｎｅｒを計算すること
を含む、請求項１６に記載の信号圧縮方法。
【請求項１８】
前記元の自己相関係数に従ってエネルギーパラメータを計算することは、
前記元の自己相関係数の第１の係数ｒ（０）とフレーム長Ｎとに従って、式Ｅｎｅｒ＿ａｖｇ＝ｒ（０）／Ｎを介して、フレーム平均エネルギーＥｎｅｒ＿ａｖｇを計算すること
を含む、請求項１６に記載の信号圧縮方法。
【請求項１９】
前記エネルギーパラメータに従って白色雑音補正率を調節することは、
前記エネルギーパラメータが分布する異なるエネルギー閾値間隔、すなわち、
【数２４】

ここで、ｗｉｎ_lag（０）は、前記白色雑音補正率、Ｅは、前記エネルギーパラメータ、及びＥ_thrは前記エネルギー閾値、
に従って、異なる調節関数を使用して前記白色雑音補正率を調節すること
を含む、請求項１７又は１８に記載の信号圧縮方法。
【請求項２０】
前記エネルギーパラメータに従って白色雑音補正率を調節することは、
前記エネルギーパラメータＥｎｅｒがエネルギー閾値Ｅ_thr以上である場合、式Ｗｉｎ_lag（０）＝Ｈ＋α＊（Ｅｎｅｒ＋Ｅ_thr）を介して、前記白色雑音補正率Ｗｉｎ_lag（０）を調節し、前記エネルギーパラメータＥｎｅｒが前記エネルギー閾値Ｅ_thr未満である場合、式Ｗｉｎ_lag（０）＝Ｌ＋β＊（Ｅｎｅｒ＋Ｅ_thr）を介して、前記白色雑音補正率Ｗｉｎ_lag（０）を調節すること
を含み、ここで、Ｈ、Ｌ、α、βは経験的な定数である、請求項１７に記載の信号圧縮方法。
【請求項２１】
前記エネルギーパラメータに従って白色雑音補正率を調節することは、
前記元の自己相関係数の第１の係数ｒ（０）とフレーム長Ｎとに従って、式Ｅｎｅｒ＿ａｖｇ＝ｒ（０）／Ｎを介して、フレーム平均エネルギーＥｎｅｒ＿ａｖｇを計算し、
前記フレーム平均エネルギーＥｎｅｒ＿ａｖｇがエネルギー閾値Ｅ_thr以上である場合、式Ｗｉｎ_lag（０）＝Ｈ＋α＊Ｅｎｅｒ＿ａｖｇを介して、前記白色雑音補正率Ｗｉｎ_lag（０）を調節し、前記フレーム平均エネルギーＥｎｅｒ＿ａｖｇが前記エネルギー閾値Ｅ_thr未満である場合、式Ｗｉｎ_lag（０）＝Ｌ＋β＊Ｅｎｅｒ＿ａｖｇを介して、前記白色雑音補正率Ｗｉｎ_lag（０）を調節すること
を含み、ここで、Ｈ、Ｌ、α、βは経験的な定数である、請求項１８に記載の信号圧縮方法。

【図１】

【図２】

【図３】

【図４】

【図５】

【図６】

【図７】

【図８】

【図９】

【図１０】

【公開番号】特開２０１３−１０９３８１（Ｐ２０１３−１０９３８１Ａ）
【公開日】平成２５年６月６日（２０１３．６．６）
【国際特許分類】

物理学 (1,541,580)
- 楽器；音響 (32,226)
  - 音声の分析または合成；音声認識；音響分析または処理 (17,022)
    - 冗長を減らすための音声または音響信号の分析合成技術，例．ボコー... (3,650)
      - 予測技術を用いるもの (505)
        
        スペクトルの特徴の抽出またはコード化，例．短期予測係数 (51)

【出願番号】特願２０１３−５１０２８（Ｐ２０１３−５１０２８）
【出願日】平成２５年３月１３日（２０１３．３．１３）
【分割の表示】特願２００９−２９０５７９（Ｐ２００９−２９０５７９）の分割
【原出願日】平成２１年１２月２２日（２００９．１２．２２）
【出願人】（５０３４３３４２０）華為技術有限公司 (107)
【氏名又は名称原語表記】ＨＵＡＷＥＩ　ＴＥＣＨＮＯＬＯＧＩＥＳ　ＣＯ．，ＬＴＤ．
【住所又は居所原語表記】Ｈｕａｗｅｉ　Ａｄｍｉｎｉｓｔｒａｔｉｏｎ　Ｂｕｉｌｄｉｎｇ，　Ｂａｎｔｉａｎ　Ｌｏｎｇｇａｎｇ　Ｄｉｓｔｒｉｃｔ，　Ｓｈｅｎｚｈｅｎ　５１８１２９　Ｐ．Ｒ．　Ｃｈｉｎａ

[ Back to top ]

信号圧縮方法及び装置

メニュー

スポンサーリンク

次の公報 »

« 前の公報

信号圧縮方法及び装置

メニュー

スポンサー リンク

次の公報 »

« 前の公報

スポンサーリンク