減衰率を取得する方法および装置

【課題】自己適応型の、動的に調整可能な減衰率を取得する方法および装置を提供する。
【解決手段】本方法は、パケットロス補償において合成信号を処理するよう構成されており、信号の変動傾向を取得し、前記信号の変動傾向に基づいて減衰率を取得することを含む。本発明は減衰率を取得するための装置もまた開示している。本発明を利用すれは、履歴信号の最新の変動傾向を使用することによって、自己適応型の減衰率が動的に調整される。履歴データから最後に受信されたデータまでの円滑な遷移が実現されるので、補償信号とオリジナル信号との間の減衰速度は、さまざまな人間の音声特性に適合できる程度に一貫して維持される。

【発明の詳細な説明】
【技術分野】
【０００１】
本出願は、中華人民共和国の国家知的財産局に２００７年１１月５日に提出された、「減衰率を取得する方法および装置」と題する、中国特許出願第２００７１０１６９６１８．０号の優先権を主張するものである。
本発明は、信号処理の分野に関するものであり、詳しくは、減衰率を取得する方法および装置に関するものである。
【背景技術】
【０００２】
リアルタイム音声通信システム、例えばＶｏＩＰ（ＶｏｉｃｅｏｖｅｒＩＰ）システムにおいて、音声データの送信はリアルタイムであることと、信頼性があることが必要である。ネットワークシステムの信頼性のない諸特性のために、データパケットは、送信側から受信側への送信処理において、喪失されるかあるいは時が経っても宛先へ到達しないことがある。これら２種類の状況はともに、前記受信側では端部によるネットワークパケットロスとみなされる。ネットワークパケットロスが起きることは避けられない。その一方で、ネットワークパケットロスは、音声の会話特性に影響を及ぼす最も重要な因子の１つである。それゆえ、リアルタイム通信システムにおいて喪失されたデータパケットを回復して、ネットワークパケットロスの状況においてもなお良好な会話特性を得るためには、頑強なパケットロス補償法が必要である。
【０００３】
従来のリアルタイム音声通信技術では、その送信側において、エンコーダーが、広帯域音声を高い副帯域（サブバンド）と低い副帯域とに分割するとともに、ＡＤＰＣＭ（適応的差分パルス符号変調方式）を使用してこれら２つの副帯域を符号化するとともに、それらを共にネットワークを介して受信側へ送信する。受信側では、これら２つの副帯域は、ＡＤＰＣＭデコーダによってそれぞれ復号化され、その後、ＱＭＦ（直交ミラーフィルター）合成フィルターを使用して、最終信号が合成される。
【０００４】
異なるパケットロス補償（ＰＬＣ）法が２つの異なる副帯域に採用されている。低帯域信号については、パケットロスがまったくない状況下では、再構成信号がクロスフェード（ＣＲＯＳＳ−ＦＡＤＩＮＧ）の間に変更されることはない。パケットロスがある状況の下では、最初のロスト（欠落)フレームについて履歴信号（本明細書では、この履歴信号は上記ロストフレームの前の音声信号である）が短期予測器および長期予測器を使用して解析されるともに、音声分類情報が抽出される。ロストフレーム信号が、ピッチ反復法、上記予測器および上記分類情報に基づいてＬＰＣ（線形予測符号化）を利用して再構成される。これに同期してＡＤＰＣＭの状態が、良好なフレームが発見されるまで、更新されてもよい。加えて、上記ロストフレームに対応する信号を生成することが必要であるだけでなく、クロスフェードに適合するための信号の部分を生成することもまた必要である。このようにして、良好なフレームが一旦受信されると、クロスフェードが実行されて、良好なフレーム信号と前記信号の部分が処理される。この種のクロスフェードは上記受信側がフレームを喪失するとともに最初の良好なフレームを受信した後にだけ起きる、ということに留意すべきである。
【０００５】
本発明を実現する過程の間に、本発明者は、従来技術における少なくとも次の問題に気が付いた。即ち、上記合成信号のエネルギーが、従来技術では静的な自己適応型減衰率を利用して制御されることである。定義された減衰率が徐々に変化しても、その減衰速度、すなわち上記減衰率の値は、同一の音声分類に対して同一である。しかしながら、人間の音声はさまざまである。減衰率が人間の音声の特性に合致していないときには、再構成信号には、とりわけ定常母音の終わりに不快なノイズが存在するであろう。上記の静的な自己適応型減衰率は、さまざまな人間の音声の特性に適応させることができない。
【０００６】
図１に示された状況が一例であり、ここで、Ｔ₀は上記履歴信号のピッチ周期である。上側の信号は、オリジナル信号、すなわち、パケットロスがまったくない状況の下における概略波形図に対応している。破線による下側の信号は、従来技術により合成された信号である。この図からわかるように、この合成信号は、オリジナル信号と同一の減衰速度を維持していない。同一のピッチ反復の回数があまりにも多い場合には、上記合成信号は、明らかな音楽ノイズをもたらすため、上記合成信号の状況と望ましい状況との差は大きい。
【発明の概要】
【発明が解決しようとする課題】
【０００７】
本発明の実施形態によれば、合成信号の処理において使用される自己適応型で動的に調整可能な減衰率を取得するよう構成された、減衰率を取得する方法および装置が提供される。
【課題を解決するための手段】
【０００８】
本発明の実施形態によれば、パケットロス補償において合成信号の処理に適合された減衰率を取得する方法であって、
信号の連続するピッチの変動傾向を取得し、
前記信号の連続するピッチの変動傾向に基づいて減衰率を取得すること
を含む方法が提供される。
【０００９】
本発明のある実施形態によれば、パケットロス補償において合成信号を処理するための減衰率を取得する装置もまた提供される。前記減衰率を取得する装置は、
信号の連続するピッチの変動傾向を取得し、
取得された変動傾向に従って減衰率を取得するように構成されている。
【００１０】
本発明のある実施形態によれば、履歴データから最新の受信データへの円滑な遷移を実現するように適合された減衰率を取得する方法および装置もまた提供される。
【００１１】
上記目的を実現するために、本発明のある実施形態によれば、パケットロス補償において合成信号を処理するよう構成された方法であって、
信号の連続するピッチの変動傾向を取得し、
前記信号の連続するピッチの変動傾向に従って減衰率を取得し、
前記減衰率に基づく減衰処理の後に再構成されたロストフレームを取得すること、
を含む信号処理方法が提供される。
【００１２】
本発明のある実施形態によれば、パケットロス補償において合成信号を処理するための信号処理を行う装置もまた提供され、前記装置は、
パケットロス補償において合成信号を処理するための減衰率を取得する装置と、
前記減衰率に従った減衰処理後に再構成されたロストフレームを取得するよう構成されたロストフレーム再構成ユニットと、
を含む。
【００１３】
本発明のある実施形態によれば、前記音声信号を復号化するよう構成され、低帯域復号化ユニット、高帯域復号化ユニットおよび直交ミラーフィルター処理ユニットを含む音声デコーダもまた提供される。
【００１４】
低帯域復号化ユニットは、受信した低帯域復号信号を復号するとともに欠落した低帯域信号を補償するよう構成されている。
【００１５】
高帯域復号化ユニットは、受信した高帯域復号信号を復号するとともに欠落した高帯域信号を補償するよう構成されている。
【００１６】
直交ミラーフィルター処理ユニットは、前記低帯域復号信号および前記高帯域復号化信号を合成することによって最終的な出力信号を取得するよう構成されている。
【００１７】
低帯域復号化ユニットには、低帯域復号化サブユニット、ピッチ反復に基づくＬＰＣサブユニット、およびクロスフェードサブユニットが含まれている。
【００１８】
低帯域復号化ユニットは、受信した低帯域ストリーム信号を復号化するよう構成されている。
【００１９】
ピッチ反復に基づくＬＰＣサブユニットは、前記ロストフレームに対応する合成信号を生成するよう構成されている。
【００２０】
クロスフェードサブユニットは、低帯域復号化ユニットによって処理された信号と、ピッチ反復に基づくＬＰＣサブユニットによって生成された前記ロストフレームに対応する合成信号とをクロスフェードするよう構成されている。
【００２１】
ピッチ反復に基づくＬＰＣサブユニットには、解析モジュールおよび信号処理モジュールが含まれている。
【００２２】
解析モジュールは、履歴信号を解析するとともに再構成されたロストフレーム信号を発生させるよう構成されている。
【００２３】
本発明のある実施形態によれば、コンピュータによって実行されることにより、パケットロス補償において合成信号を処理するよう構成された減衰率を取得する方法におけるあらゆるステップ、あるいはパケットロス補償において合成信号を処理するための信号処理方法におけるあらゆるステップをコンピュータに実行させることのできるコンピュータプログラムコードを含む、コンピュータプログラム製品がさらに提供される。
【発明の効果】
【００２４】
従来技術に比べて、本発明の実施形態には次の利点がある。
【００２５】
自己適応型の減衰率が、履歴信号の変更履歴を使用することで動的に調整される。履歴データから最新の受信データへの円滑な遷移が実現されるので、補償信号とオリジナル信号との間の減衰速度が、さまざまな人間の音声の特性に適応できる程度に、一貫して維持される。
【図面の簡単な説明】
【００２６】
【図１】従来技術によるオリジナル信号および合成信号を示す概略図である。
【図２】本発明の実施形態１による減衰率を取得する方法を示すフローチャートである。
【図３】エンコーダーの原理を示す概略図である。
【図４】低帯域復号化ユニットのピッチ反復に基づくＬＰＣサブユニットのモジュールを示す概略図である。
【図５】本発明の実施形態１による動的減衰法を適用した後の出力信号を示している概略図である。
【図６Ａ】本発明の実施形態２による減衰率を取得するための装置の構造を示す概略図である。
【図６Ｂ】本発明の実施形態２による減衰率を取得するための装置の構造を示す概略図である。
【図７】本発明の実施形態２による減衰率を取得するための装置の適用場面（例）を示す概略図である。
【図８Ａ】本発明の実施形態３による信号処理装置の構造を示す概略図である。
【図８Ｂ】本発明の実施形態３による信号処理装置の構造を示している概略図である。
【図９】本発明の実施形態４による音声デコーダのモジュールを示す概略図である。
【図１０】本発明の実施形態４による音声デコーダにおける低帯域復号化ユニットのモジュールを示す概略図である。
【図１１】本発明の実施形態４によるピッチ反復に基づくＬＰＣサブユニットのモジュールを示す概略図である。
【発明を実施するための形態】
【００２７】
本発明を図面および実施形態を参照してより詳しく説明する。
【００２８】
本発明の実施形態１は、図２に示されるような、パケットロス補償において合成信号を処理するように適合された、減衰率を取得する方法を提供しており、この方法には以下のステップが含まれている。
【００２９】
ステップｓ１０１では、信号の変動傾向が取得される。
【００３０】
具体的には、この変動傾向は次のパラメーターで表現することができる。
（１）この信号における先のピッチ周期信号のエネルギーに対する、最後のピッチ周期信号のエネルギーの比。
（２）この信号における先のピッチ周期信号の最大振幅値と最小振幅値との差に対する、最後のピッチ周期信号の最大振幅値と最小振幅値との差の比。
【００３１】
ステップｓ１０２では、上記変動傾向に基づいて減衰率が取得される。
【００３２】
本発明の実施形態１の詳細な処理方法が、特定の適用例とともに説明される。
【００３３】
本発明の実施形態１は、パケットロス補償において合成信号を処理するように適合された減衰率を取得する方法を提供する。
【００３４】
図３に示されるように、異なるＰＬＣ法が異なる２つの副帯域（サブバンド）に対して採用されている。低帯域部に対するＰＬＣ法が、図３における破線のフレームの丸１部分として示されている。これに対して、図３における破線のフレーム丸２は、高帯域に対するＰＬＣアルゴリズムに対応している。高帯域信号としてはｚｈ（ｎ）が最終的に出力される高帯域信号である。低帯域信号ｚｌ（ｎ）および高帯域信号ｚｈ（ｎ）を取得した後に、この低帯域信号およびこの高帯域信号に対して上記ＱＭＦが実行され、最終的に出力される広帯域信号ｙ（ｎ）が合成される。
【００３５】
低帯域信号についてのみ、次に詳しく説明する。
【００３６】
フレームロスがまったくない状況下では、信号ｘｌ（ｎ）（但しｎ＝０，…，Ｌ−１）は、低帯域ＡＤＰＣＭデコーダによって受信された現在のフレームを復号化した後に取得され、また、その出力はｚｌ（ｎ）（但しｎ＝０，…，Ｌ−１）であり、現在のフレームに対応している。この状況では、再構成信号はクロスフェードの間に変動することがなく、Ｌがフレーム長であるとき、ｚｌ〔ｎ〕＝ｘｌ〔ｎ〕（但しｎ＝０，…，Ｌ−１）である。
【００３７】
フレームのロスがある状況下では、最初のロストフレームに関して、履歴信号ｚｌ（ｎ）（ｎ＜０）は、短期予測器および長期予測器を使用して解析され、また、音声分類情報が抽出される。上記の予測器および分類情報を採用することで、信号ｙｌ（ｎ）が、ピッ

チ反復に基づくＬＰＣ法を利用して生成される。また、ロストフレーム信号ｚｌ（ｎ）が、ｚｌ（ｎ）＝ｙｌ（ｎ），ｎ＝０，…，Ｌ−１として再構成される。加えて、ＡＤＰＣＭの状態もまた、良好なフレームが発見されるまで、同期して更新される。このロストフレームに対応する信号を生成する必要があるだけでなく、クロスフェードに適応する１０ミリ秒信号ｙｌ（ｎ），ｎ＝Ｌ，…，Ｌ＋Ｍ−１を生成する必要もある、ということに留意すべきであり、ここでＭは上記エネルギーを算出する処理に含まれる信号サンプリング箇所の数である。このようにして、良好なフレームが一旦受信されると、ｘｌ（ｎ），ｎ＝Ｌ，…，Ｌ＋Ｍ−１およびｙｌ（ｎ），ｎ＝Ｌ，…，Ｌ＋Ｍ−１についてクロスフェードが実行される。この種のクロスフェードは、フレームロスの後に上記受信側が上記の良好な第１フレームデータを受信するときにだけ、生じることに留意されたい。
【００３８】
図３におけるピッチ反復に基づくＬＰＣ法が図４に示されている。
【００３９】
データフレームが良好なフレームであるときには、ｚｌ（ｎ）は、将来使用するためにバッファの中へ記憶される。
【００４０】
最初のロストフレームが発見されると、最終的な信号ｙｌ（ｎ）は２つのステップで合成される必要がある。最初に、履歴信号ｚｌ（ｎ），ｎ＝−２９７，…，−１が解析される。その後、信号ｙｌ（ｎ），ｎ＝０，…，Ｌ−１が解析の結果に従って合成され、ここで、Ｌは上記データフレームのフレーム長、すなわち、信号の１つのフレームに対応するサンプリング箇所の数であり、Ｑは履歴信号を解析するために必要である信号の長さである。
【００４１】
上記ピッチ反復に基づくＬＰＣモジュールには、詳細には以下の部分が含まれている。
【００４２】
（１）ＬＰ（線形予測）解析
短期解析フィルターＡ（ｚ）および合成フィルター１／Ａ（ｚ）は、階数Ｐに基づく線形予測（ＬＰ）フィルターである。このＬＰ解析フィルターは、
Ａ（ｚ）＝１＋ａ₁ｚ^-1＋ａ₂ｚ^-2＋…＋ａ_pｚ^-p
として定義される。
【００４３】
フィルターＡ（ｚ）での履歴信号ｚｌ（ｎ），ｎ＝−Ｑ，…，−１のＬＰ解析によって、履歴信号ｚｌ（ｎ），ｎ＝−Ｑ，…，−１に対応する残りの信号ｅ（ｎ），ｎ＝−Ｑ，…，−１が取得される。
【数２】

【００４４】
（２）履歴信号解析
喪失（欠落）した信号はピッチ反復法によって補償される。それゆえ、初めに、履歴信号ｚｌ（ｎ），ｎ＝−Ｑ，…，−１に対応するピッチ周期Ｔ₀を推定する必要がある。このステップは以下のとおりである。ｚｌ（ｎ）は、ＬＴＰ（長期予測）解析において不要な低周波数成分を除去するために前処理され、ｚｌ（ｎ）のピッチ周期Ｔ₀をＬＴＰ解析によって取得することができる。ピッチ周期Ｔ₀を取得した後に、信号分類モジュールを組み合わせることによって、音声分類が取得される。
【００４５】
音声分類は、次の表１に示されたようなものである。
【表１】

【００４６】
（３）ピッチ反復
ピッチ反復モジュールは、ロストフレームのＬＰ残余信号ｅ（ｎ），ｎ＝０，…，Ｌ−１を評価するよう構成されている。ピッチ反復が実行される前に、音声の分類が有声でない場合には、次の式が用いられて、あるサンプルの振幅が制限される。
【数３】

【００４７】
音声分類が有声である場合には、新たに受信された良好なフレームの信号における最後のピッチ周期の信号に対応する残余信号を反復するステップを用いることで、喪失信号に対応する残余信号ｅ（ｎ），ｎ＝０，…，Ｌ−１が取得される。すなわち、
ｅ（ｎ）＝ｅ（ｎ−Ｔ₀）
である。
【００４８】
他の音声分類に関しては、生成された信号の周期性が強くなりすぎることを防止するために（非音声信号に関しては周期性がきわめて強い場合、音楽ノイズのような何らかの不快なノイズが聞えることがある）、喪失信号に対応する残余信号ｅ（ｎ），ｎ＝０，…，Ｌ−１は、次の式を使用することで生成される。
ｅ（ｎ）＝ｅ（ｎ−Ｔ₀＋（−１）ⁿ）
【００４９】
喪失信号に対応する残余信号の生成に加えて、ロストフレームとこのロストフレームの後の良好な最初のフレームとの間における円滑な接続を保証するために、付加的なＮ個のサンプルの残余信号ｅ（ｎ），ｎ＝Ｌ，…，Ｌ＋Ｎ−１が、クロスフェードに適合された信号を生成するために、引き続いて生成される。
【００５０】
（４）ＬＰ合成
ロストフレームに対応する残余信号ｅ（ｎ）の生成とクロスフェードとの後に、再構成ロストフレーム信号ｙｌ_pre（ｎ），ｎ＝０，…，Ｌ−１が、次の式を使用することで生成される。
【数４】

【００５１】
ここで、残余信号ｅ（ｎ），ｎ＝０，…，Ｌ−１は、上記ピッチ反復ステップで取得された残余信号である。
【００５２】
さらに、クロスフェードに適合する、Ｎ個のサンプルを有するｙｌ_pre（ｎ），ｎ＝Ｌ，…，Ｌ＋Ｎ−１が、上記の式を使用して生成される。
【００５３】
（５）適応ミューティング
円滑なエネルギー遷移を実現するために、高帯域信号でＱＭＦを実行する前に、低帯域信号もまたクロスフェードを行う必要があり、その規則が次の表に示されている。
【表２】

【００５４】
上の表において、ｚｌ（ｎ）は、現在のフレームに対応する最終的に出力される信号であり、ｘｌ（ｎ）は、現在のフレームに対応する良好なフレームの信号であり、ｙｌ（ｎ）は、現在のフレームの同一時刻に対応する合成信号であり、ここで、Ｌはフレーム長であり、Ｎはクロスフェードを実行するサンプルの数である。
【００５５】
異なる音声分類に対して、ｙｌ_pre（ｎ）における信号のエネルギーは、すべてのサンプルに対応する係数に従って、クロスフェードを実行する前に制御される。この係数の値は、異なる音声分類とパケットロスの状況とに応じて変化する。
【００５６】
詳しく説明すると、受信された履歴信号における最後の２つのピッチ周期信号が図５に示されたようにオリジナル信号である場合、自己適応型の動的減衰率は、その履歴信号における最後の２つのピッチ周期の変動傾向に従って動的に調整される。詳しい調整方法は以下のステップを含んでいる。
【００５７】
ステップｓ２０１では、信号の変動傾向が取得される。
【００５８】
この信号の変動傾向は、この信号における先のピッチ周期信号のエネルギーに対する、最後のピッチ周期信号のエネルギーの比、すなわち履歴信号の最後の２つのピッチ周期信号のエネルギーＥ₁およびＥ₂の比によって表現することができ、これら２つのエネルギーの比が算出される。
【数５】

【００５９】
Ｅ₁は最後のピッチ周期信号のエネルギーであり、Ｅ₂はその前のピッチ周期信号のエネルギーであり、また、Ｔ₀は履歴信号に対応するピッチ周期である。
【００６０】
場合によっては、信号の変動傾向は、履歴信号における最後の２つのピッチ周期の山−谷の差どうしの比によって表現することができる。
Ｐ₁＝ｍａｘ（ｘｌ（ｉ））−ｍｉｎ（ｘｌ（ｊ））
（ｉ，ｊ）＝−Ｔ₀，…，−１
Ｐ₂＝ｍａｘ（ｘｌ（ｉ））−ｍｉｎ（ｘｌ（ｊ））
（ｉ，ｊ）＝−２Ｔ₀，…，−（Ｔ₀＋１）
【００６１】
ここで、Ｐ₁は最後のピッチ周期信号の最大振幅値と最小振幅値との差であり、Ｐ₂はその前のピッチ周期信号の最大振幅値と最小振幅値との差であり、その比は次のように算出される。
【数６】

【００６２】
ステップｓ２０２で、合成信号は、取得された信号の変動傾向に従って、動的に減衰される。
【００６３】
その計算式は次のように示される。
ｙｌ（ｎ）＝ｙｌ_pre（ｎ）＊（１−Ｃ＊（ｎ＋１））ｎ＝０，…，Ｎ−１
【００６４】
ここで、ｙｌ_pre（ｎ）は再構成ロストフレーム信号であり、Ｎは合成信号の長さであり、また、Ｃは自己適応型減衰係数であり、その値は次のように示される。
【数７】

【００６５】
減衰率が１−Ｃ＊（ｎ＋１）＜０である状況下では、これらのサンプルに対応する減衰率がマイナスとなる状況の出現を回避するために、１−Ｃ＊（ｎ＋１）＝０に設定することが必要である。
【００６６】
具体的には、Ｒ＞１の状況下であるサンプルに対応する振幅値がオーバーフローする状況を回避するために、合成信号は、Ｒ＜１の状況だけを考慮することのできる本実施形態におけるステップｓ２０２の式を使用して、動的に減衰される。
【００６７】
具体的には、エネルギーが少ない信号の減衰速度が速すぎるという状況を回避するために、Ｅ₁がある限界値を超える状況下にあるときにだけ、合成信号は、本実施形態におけるステップｓ２０２の式を使用することで、動的に減衰される。
【００６８】
具体的には、合成信号の減衰速度が速すぎることを回避するために、特に連続的なフレームロスの状況の下では、減衰係数Ｃについて上限値が設定される。Ｃ＊（ｎ＋１）がある限界値を超えると、上記減衰係数は上限値に設定される。
【００６９】
具体的には、劣悪なネットワーク環境および連続的フレームロスの状況の下で、速すぎる減衰速度を回避するために、一定の条件を設定することができる。例えば、ロストフレームの数が所定の数、例えば２フレームを超えるとき、あるいは、そのロストフレームに対応している信号が所定の長さ、例えば２０ミリ秒を超えるとき、あるいは、上記条件の少なくとも１つにおいて現在の減衰係数１−Ｃ＊（ｎ＋１）が所定の臨界値を超えるときには、出力信号が無音性になるという状況をもたらしうる速すぎる減衰速度を回避するように、減衰係数Ｃを調整する必要がある。
【００７０】
例えば、８キロヘルツの周波数と４０サンプルのフレーム長でサンプリングを行う状況下では、ロストフレームの数は４として設定することができ、また、減衰率１−Ｃ＊（ｎ＋１）が０．９未満になったときには、減衰係数Ｃはより小さい値に調整される。より小さい値を調整する規則は次のとおりである。
【００７１】
現在の減衰係数がＣであり、減衰率の値がＶであることが予測され、減衰率Ｖは、Ｖ／Ｃ個がサンプリングされた後に、０まで減衰されると仮定する。これに対して、Ｍ個（Ｍ≠Ｖ／Ｃ）がサンプリングされた後に、減衰率Ｖが０まで減衰される状況がより好ましい。そこで、減衰係数Ｃは
Ｃ＝Ｖ／Ｍ
に調整される。
【００７２】
図５に示されるように、上段の信号はオリジナル信号であり、中段の信号は合成信号である。この図からわかるように、この信号にはある程度の減衰があるものの、強い有音特性がまだ残っている。その持続時間が長すぎるときには、この信号は、とりわけ有声音の終端で、音楽ノイズとして現れることがある。下段の信号は、本発明の実施形態における動的減衰を利用した後の信号であり、オリジナル信号と極めて類似しうる。
【００７３】
上記実施形態によって提供された方法によれば、自己適応型の減衰率は履歴信号の変動

傾向を利用して動的に調整されるので、履歴データから最新の受信データまでの円滑な遷移が実現される。この減衰速度は、さまざまな人間の音声の特性にできるだけ適合するように、補償信号とオリジナル信号との間でできるだけ一貫して（整合するよう）維持される。
【００７４】
減衰率を取得するための装置が、本発明の実施形態２において提供されており、パケットロス補償における合成信号を処理するよう構成され、この装置には、
信号の変動傾向を取得するよう構成された変動傾向取得ユニット１０と、
前記変動傾向取得ユニット１０によって取得された変動傾向によって減衰率を取得するよう構成された減衰率取得ユニット２０と
が含まれている。
【００７５】
減衰率取得ユニット２０は、変動傾向取得ユニット１０によって取得された変動傾向に基づいて減衰係数を生成するよう構成された減衰係数取得サブユニット２１と、減衰係数取得サブユニット２１によって生成された減衰係数に基づいて減衰率を取得するよう構成された減衰率取得サブユニット２２とが、さらに含まれている。減衰率取得ユニット２０には、減衰係数取得サブユニット２１によって取得された減衰係数の値を、減衰係数の値がある上限値を超えているかどうか、連続的なフレームロスの状況が存在しているかどうか、また減衰速度が速すぎるかどうか、のうちの少なくとも１つが含まれる所定条件によって所定の値に調整するよう構成された減衰係数調整サブユニット２３がさらに含まれている。
【００７６】
上記実施形態における減衰率の取得方法は、本開示の方法のいくつかの実施形態における減衰率を取得する方法と同一である。
【００７７】
詳しく説明すると、変動傾向取得ユニット１０によって取得された変動傾向は次のパラメーターで表わすことができる。
（１）信号における先のピッチ周期信号のエネルギーに対する、最後のピッチ周期信号のエネルギーの比。
（２）信号における先のピッチ周期信号の最大振幅値と最小振幅値との差に対する、最後のピッチ周期信号の最大振幅値と最小振幅値との差の比。
【００７８】
変動傾向が上記（１）におけるエネルギー比で表わされるとき、減衰率を取得するための装置の構造は図６Ａに示される通りである。この変動傾向取得ユニット１０には、
最後のピッチ周期信号のエネルギーと、その前のピッチ周期信号のエネルギーとを取得するよう構成されたエネルギー取得サブユニット１１と、
このエネルギー取得サブユニット１１によって取得された先のピッチ周期信号のエネルギーに対する最後のピッチ周期信号のエネルギーの比を取得するとともに、この比を信号の変動傾向を示すために利用するよう構成されたエネルギー比取得サブユニット１２と
がさらに含まれる。
【００７９】
変動傾向が上記（２）における振幅差の比で表わされるとき、減衰率を取得するための装置の構造は図６Ｂに示される通りである。この変動傾向取得ユニット１０には、
最後のピッチ周期信号の最大振幅値と最小振幅値との差と、その前のピッチ周期信号の最大振幅値と最小振幅値との差とを取得するよう構成された振幅差取得サブユニット１３と、
先のピッチ周期信号の最大振幅値と最小振幅値との差に対する最後のピッチ周期信号の最大振幅値と最小振幅値との差の比を取得するとともに、この比を信号の変動傾向を示すために利用するよう構成された振幅差比取得サブユニット１４と
がさらに含まれている。
【００８０】
本発明の実施形態２による減衰率を取得するための装置の適用例を示す概略図は、図７に示される通りである。自己適応型減衰率は履歴信号の変動傾向を利用して動的に調整される。
【００８１】
上記実施形態によって提供された装置を使用することで、自己適応型減衰率が履歴信号の変動傾向を利用して動的に調整されるので、履歴データから最新の受信データへの円滑な遷移が実現される。この減衰速度は、さまざまな人間の音声の特性にできる限り適合するように、補償信号とオリジナル信号との間でできるだけ一貫（整合)するように維持される。
【００８２】
信号処理装置が本発明の実施形態３に提供されており、この装置は、図８Ａおよび図８Ｂに示されたように、パケットロス補償において合成信号を処理するよう構成されている。実施形態２に基づいて、上記減衰率取得ユニットと相互関係があるロストフレーム再構成ユニット３０が加えられている。このロストフレーム再構成ユニット３０は、減衰率取得ユニット２０によって取得された減衰率に基づいた減衰処理の後に、再構成されたロストフレームを取得する。
【００８３】
上記実施形態によって提供された装置を使用すれば、自己適応型減衰率は履歴信号の変動傾向を利用して動的に調整され、また、減衰後に再構成されたロストフレームが上記減衰率によって取得されるので、履歴データから最新の受信データへの円滑な遷移が実現される。この減衰速度は、さまざまな人間の音声の特性にできる限り適合するように、補償信号とオリジナル信号との間でできるだけ一貫（整合)するように維持される。
【００８４】
図９に示されるように、本発明の実施形態４によって音声デコーダが提供される。この音声デコーダには、受信された高帯域復号信号を復号化するとともに喪失された高帯域信号を補償するよう構成された高帯域復号化ユニット４０と、受信された低帯域復号信号を復号化するとともに喪失された低帯域信号を補償するよう構成された低帯域復号化ユニット５０と、上記低帯域復号信号および上記高帯域復号信号を合成することによって最終的な出力信号を取得するよう構成された直交ミラーフィルター処理ユニット６０が含まれている。高帯域復号化ユニット４０は、受信側によって受信した高帯域ストリーム信号を復号化するとともに高帯域喪失信号を合成する。低帯域復号化ユニット５０は、受信側によって受信した低帯域ストリーム信号を復号化するとともに低帯域喪失信号を合成する。直交ミラーフィルター処理ユニット６０は、低帯域復号化ユニット５０によって出力された低帯域復号信号と高帯域復号化ユニット４０によって出力された高帯域復号信号とを合成することで、最終的な出力信号を取得する。
【００８５】
図１０に示されたように、低帯域復号化ユニット５０には、次のユニットが含まれている。即ち、ロストフレームに対応する合成信号を生成するよう構成されたピッチ反復に基づくＬＰＣサブユニット５１、受信した低帯域ストリーム信号を復号化するよう構成された低帯域復号化サブユニット５２、および、この低帯域復号化サブユニットによって復号化された信号と、ピッチ反復に基づくＬＰＣサブユニットによって生成された、ロストフレームに対応する合成信号とをクロスフェードするよう構成されたクロスフェードサブユニット５３である。
【００８６】
低帯域復号化サブユニット５２は、受信した低帯域ストリーム信号を復号化する。ピッチ反復に基づくＬＰＣサブユニット５１は、上記低帯域喪失信号にＬＰＣを実行することで、合成信号を生成する。そして最後に、クロスフェードサブユニット５３は、上記ロストフレーム補償後の最終的な復号信号を取得するために、低帯域復号化サブユニット５２によって処理された信号と上記合成信号をクロスフェードする。
【００８７】
図１０に示されたように、ピッチ反復に基づくＬＰＣサブユニット５１には、解析モジュール５１１と信号処理モジュール５１２とがさらに含まれている。解析モジュール５１１は、履歴信号を解析するとともに、再構成されたロストフレーム信号を生成し、信号処理モジュール５１２は、信号の変動傾向を取得し、信号の変動傾向に基づいて減衰率を取得し、再構成ロストフレーム信号を減衰させるとともに、減衰後の再構成ロストフレームを取得する。
【００８８】
信号処理モジュール５１２には、減衰率取得ユニット５１２１とロストフレーム再構成ユニット５１２２とがさらに含まれている。減衰率取得ユニット５１２１は、信号の変動傾向を取得するとともに、この変動傾向に基づいて減衰率を取得し、ロストフレーム再構成ユニット５１２２は、この減衰率に従って、再構成されたロストフレーム信号を減衰させるとともに、減衰後の再構成ロストフレームを取得する。信号処理モジュール５１２には、図８Ａおよび図８Ｂの信号処理装置の構造をそれぞれ示す概略図に対応する２つの構造が含まれている。
【００８９】
減衰率取得ユニット５１２１には、図６Ａおよび図６Ｂの減衰率を取得するための装置の構造を示す概略図に対応する２つの構造が各々含まれている。上記モジュールおよびユニットにおける特定の機能および実施手段は、本方法の実施形態において明らかにされた内容を参照することができる。ここでは、必要のない細部は繰り返して説明しない。
【００９０】
上記実施形態の説明を通して、当業者は、本発明を、ソフトウェアおよび必要かつ一般的なハードウェアのプラットフォームに応じて実現することができ、また、ハードウェアによっても確実に実現することができる。しかしながら、たいていの状況では、前者が好ましい実施形態である。このような理解に基づいて、本発明の技術計画において従来技術の一助となる本質あるいは部分は、記憶媒体に記憶されたソフトウェア製品の形態で実施することができ、前記ソフトウェア製品には、本発明の実施形態を実行するように１つの装置へ指示を行うための１以上の命令が含まれる。
【００９１】
本開示の図示および説明は実施形態を参照して行われたが、当業者であれば、本開示の範囲から逸脱することなく形態および細部にさまざまな変更を行うことができる、ということが認識されるであろう。

【特許請求の範囲】
【請求項１】
パケットロス補償において合成信号の処理に使用する減衰率を取得する方法であって、
信号の連続するピッチの変動傾向を取得し、
前記信号の連続するピッチの変動傾向に基づいて減衰率を取得すること
を含む、方法。
【請求項２】
前記信号の連続するピッチの変動傾向を取得することは、前記信号における先のピッチ周期信号のエネルギーに対する、最後のピッチ周期信号のエネルギーの比を取得することを含む、請求項１に記載の方法。
【請求項３】
前記信号の連続するピッチの変動傾向を取得することは、前記信号における先のピッチ周期信号の最大振幅値と最小振幅値との差に対する、最後のピッチ周期信号の最大振幅値と最小振幅値との差の比を取得することを含む、請求項１に記載の方法。
【請求項４】
前記信号の連続するピッチの変動傾向に基づいて減衰率を取得する前に、前記比が１未満である場合に、前記信号の連続するピッチの変動傾向に基づいて減衰率を取得することをさらに含む、請求項２または３に記載の方法。
【請求項５】
前記信号の連続するピッチの変動傾向に基づいて減衰率を取得する前に、前記最後のピッチ周期信号のエネルギーが予め設定された限界値よりも大きい場合に、前記信号の連続するピッチの変動傾向に基づいて減衰率を取得することをさらに含む、請求項２に記載の方法。
【請求項６】
前記信号における先のピッチ周期信号のエネルギーに対する最後のピッチ周期信号のエネルギーの比は、
【数１】

であり、ここで、Ｅ₁は前記最後のピッチ周期信号のエネルギーであり、Ｅ₂は前記先のピッチ周期信号のエネルギーである、
請求項２に記載の方法。
【請求項７】
前記信号における先のピッチ周期信号の最大振幅値と最小振幅値との差に対する、最後の周期信号の最大振幅値と最小振幅値との差の比は、Ｒ＝Ｐ₁／Ｐ₂であり、ここで、Ｐ₁
は前記最後のピッチ周期信号の最大振幅値と最小振幅値との差であり、Ｐ₂は前記先のピ
ッチ周期信号の最大振幅値と最小振幅値との差である、請求項３に記載の方法。
【請求項８】
前記信号の連続するピッチの変動傾向に基づいて取得された減衰率は、
１−Ｃ＊（ｎ＋１）但し、ｎ＝０，…，Ｎ−１
であり、ここで、Ｃは減衰係数であってＣ＝（１−Ｒ）／Ｔ₀であり、Ｎは前記合成信
号の長さであり、Ｔ₀はピッチ周期の長さである、
請求項６または７に記載の方法。
【請求項９】
減衰率１−Ｃ＊（ｎ＋１）＜０である場合は、減衰率１−Ｃ＊（ｎ＋１）＝０が設定される、請求項８に記載の方法。
【請求項１０】
減衰係数Ｃについて上限値が予め設定され、減衰係数Ｃは、Ｃ＝（１−Ｒ）／Ｔ₀によって取得されたＣ＊（ｎ＋１）がある限界値を超えた場合は、前記上限値に設定される、請求項８に記載の方法。
【請求項１１】
減衰速度が速すぎる場合は、前記減衰係数Ｃが減少される、請求項８に記載の方法。
【請求項１２】
前記減衰係数Ｃを減少させることは、
前記信号が、Ｍ個のサンプルがサンプリングされた後に０まで減衰するよう予め設定され、
Ｖが現在の減衰率であるとき、調整された減衰係数がＣ＝Ｖ／Ｍに設定されることからなる、請求項１１に記載の方法。
【請求項１３】
請求項１〜１２のいずれか１項に記載のステップと、前記減衰率での減衰の後に再構成されたロストフレームを取得するステップを含む、パケットロス補償における合成信号の処理に使用する信号処理方法。
【請求項１４】
前記信号の連続するピッチの変動傾向に基づいて取得された減衰の後に再構成されたロストフレームは、
ｙｌ（ｎ）＝ｙｌ_pre（ｎ）＊（１−Ｃ＊（ｎ＋１））
但し、ｎ＝０，…，Ｎ−１
であり、ここで、ｙｌ_pre（ｎ）は、再構成されたロストフレーム信号であり、Ｎは前
記合成信号の長さであり、Ｃは減衰係数であってＣ＝（１−Ｒ）／Ｔ₀であり、Ｔ₀は前記ピッチ周期の長さである、請求項１３に記載の方法。
【請求項１５】
前記信号は複数のフレームを含み、少なくとも１つのフレームが、少なくとも２つの連続するピッチを含む、請求項１〜１４のいずれか一項に記載の方法。
【請求項１６】
パケットロス補償において合成信号の処理に使用する減衰率を取得する装置であって、前記装置が、
信号の連続するピッチの変動傾向を取得するよう構成された変動傾向取得ユニットと、
前記変動傾向取得ユニットによって取得された変動傾向に基づいて減衰率を取得するよう構成された減衰率取得ユニットと、
を備える、装置。
【請求項１７】
前記変動傾向取得ユニットは、
前記信号における最後のピッチ周期信号のエネルギーと、その前のピッチ周期信号のエネルギーとを取得するよう構成されたエネルギー取得サブユニットと、
前記エネルギー取得サブユニットによって取得された前のピッチ周期信号のエネルギーに対する、最後のピッチ周期信号のエネルギーの比を取得し、前記比を信号ピッチの変動傾向を示すために利用するよう構成されたエネルギー比取得サブユニット
を備える、請求項１６に記載の装置。
【請求項１８】
前記変動傾向取得ユニットは、
最後のピッチ周期信号の最大振幅値と最小振幅値との差と、その前のピッチ周期信号の最大振幅値と最小振幅値との差とを取得するよう構成された振幅差取得サブユニットと、
前記振幅差取得サブユニットにより取得された前のピッチ周期信号の前記差に対する、前記振幅差取得サブユニットにより取得された最後のピッチ周期信号の前記差の比を取得し、前記比が信号ピッチの変動傾向を示すために利用されるよう構成された振幅差比率取得サブユニットと、
を備える、請求項１６に記載の装置。
【請求項１９】
前記減衰率取得ユニットは、
変動傾向取得ユニットによって取得された変動傾向に基づいて減衰係数を生成するよう構成された減衰係数取得サブユニットと、
前記減衰係数取得サブユニットによって生成された減衰係数に基づいて減衰率を取得するよう構成された減衰率取得サブユニットと、
を備える、請求項１６に記載の装置。
【請求項２０】
前記減衰率取得ユニットは、前記減衰係数取得サブユニットによって取得された減衰係数の値を、ある所定条件が満たされたときに、ある値に調整するように構成された減衰係数調整ユニットをさらに備え、
前記所定条件が、
前記減衰係数の値がある上限値を超えているかどうか、
連続的なフレームロスの状況が存在しているかどうか、
減衰速度が速すぎるかどうか、
のうちの少なくとも１つを含む、請求項１９に記載の装置。
【請求項２１】
請求項１６〜２０のいずれか１項に記載の減衰率を取得する装置と、
前記減衰率に従った減衰処理後に再構成されたロストフレームを取得するよう構成されたロストフレーム再構成ユニットと、
を備える、パケットロス補償において合成信号を処理するための信号処理装置。
【請求項２２】
前記信号は複数のフレームを含み、少なくとも１つのフレームが、少なくとも２つの連続するピッチを含む、請求項１６〜２１のいずれか一項に記載の装置。
【請求項２３】
低帯域復号化ユニットと、高帯域復号化ユニットと、直交ミラーフィルター処理ユニットと、を備える、音声デコーダであって、
前記低帯域復号化ユニットは、受信した低帯域復号信号を復号するとともに喪失された低帯域信号を補償するよう構成され、
前記高帯域復号化ユニットは、受信した高帯域復号信号を復号するとともに喪失された高帯域信号を補償するよう構成され、
前記直交ミラーフィルター処理ユニットは、前記低帯域復号信号および前記高帯域復号信号を合成することによって最終的な出力信号を取得するよう構成され、
前記低帯域復号化ユニットは、低帯域復号化サブユニットと、ピッチ反復に基づく線形予測符号化サブユニットと、クロスフェードサブユニットを備え、
前記低帯域復号化ユニットは、受信した低帯域ストリーム信号を復号化するよう構成され、
前記ピッチ反復に基づく線形予測符号化（ＬＰＣ）サブユニットは、ロストフレームに対応する合成信号を生成するよう構成され、
前記クロスフェードサブユニットは、低帯域復号化ユニットによって処理された信号と、ピッチ反復に基づくＬＰＣサブユニットによって生成された前記ロストフレームに対応する合成信号とをクロスフェードするよう構成され、
前記ピッチ反復に基づくＬＰＣサブユニットは、請求項２１又は２２に記載の信号処理装置と、解析モジュールとを備え、前記解析モジュールは、履歴信号を解析するとともに再構成されたロストフレーム信号を生成するよう構成されている、
音声デコーダ。
【請求項２４】
コンピュータにより実行されることにより、コンピュータに請求項１〜１５のいずれか１つに記載のステップを実行可能とさせるコンピュータプログラムを備える、コンピュータプログラム。

【図１】

【図２】

【図３】

【図４】

【図５】

【図６Ａ】

【図６Ｂ】

【図７】

【図８Ａ】

【図８Ｂ】

【図９】

【図１０】

【図１１】

【公開番号】特開２０１０−１７６１４２（Ｐ２０１０−１７６１４２Ａ）
【公開日】平成２２年８月１２日（２０１０．８．１２）
【国際特許分類】

物理学 (1,541,580)
- 楽器；音響 (32,226)
  - 音声の分析または合成；音声認識；音響分析または処理 (17,022)
    - 他の可聴信号，または不可聴信号への音声信号変換処理，例．特性や... (2,017)
      - 音声の強調，例．雑音低減またはエコー除去 (1,255)
    - 冗長を減らすための音声または音響信号の分析合成技術，例．ボコー... (3,650)

【出願番号】特願２０１０−６０１２７（Ｐ２０１０−６０１２７）
【出願日】平成２２年３月１７日（２０１０．３．１７）
【分割の表示】特願２００８−２８４２６０（Ｐ２００８−２８４２６０）の分割
【原出願日】平成２０年１１月５日（２００８．１１．５）
【出願人】（５０２３８５８７２）華為技術有限公司 (139)

[ Back to top ]

減衰率を取得する方法および装置

メニュー

スポンサーリンク

次の公報 »

« 前の公報

減衰率を取得する方法および装置

メニュー

スポンサー リンク

次の公報 »

« 前の公報

スポンサーリンク