説明

減衰率を取得する方法および装置

【課題】自己適応型の、動的に調整可能な減衰率を取得する方法および装置を提供する。
【解決手段】本方法は、パケットロス補償において合成信号を処理するよう構成されており、信号の変動傾向を取得し、前記信号の変動傾向に基づいて減衰率を取得することを含む。本発明は減衰率を取得するための装置もまた開示している。本発明を利用すれは、履歴信号の最新の変動傾向を使用することによって、自己適応型の減衰率が動的に調整される。履歴データから最後に受信されたデータまでの円滑な遷移が実現されるので、補償信号とオリジナル信号との間の減衰速度は、さまざまな人間の音声特性に適合できる程度に一貫して維持される。

【発明の詳細な説明】
【技術分野】
【0001】
本出願は、中華人民共和国の国家知的財産局に2007年11月5日に提出された、「減衰率を取得する方法および装置」と題する、中国特許出願第200710169618.0号の優先権を主張するものである。
本発明は、信号処理の分野に関するものであり、詳しくは、減衰率を取得する方法および装置に関するものである。
【背景技術】
【0002】
リアルタイム音声通信システム、例えばVoIP(Voice over IP)システムにおいて、音声データの送信はリアルタイムであることと、信頼性があることが必要である。ネットワークシステムの信頼性のない諸特性のために、データパケットは、送信側から受信側への送信処理において、喪失されるかあるいは時が経っても宛先へ到達しないことがある。これら2種類の状況はともに、前記受信側では端部によるネットワークパケットロスとみなされる。ネットワークパケットロスが起きることは避けられない。その一方で、ネットワークパケットロスは、音声の会話特性に影響を及ぼす最も重要な因子の1つである。それゆえ、リアルタイム通信システムにおいて喪失されたデータパケットを回復して、ネットワークパケットロスの状況においてもなお良好な会話特性を得るためには、頑強なパケットロス補償法が必要である。
【0003】
従来のリアルタイム音声通信技術では、その送信側において、エンコーダーが、広帯域音声を高い副帯域(サブバンド)と低い副帯域とに分割するとともに、ADPCM(適応的差分パルス符号変調方式)を使用してこれら2つの副帯域を符号化するとともに、それらを共にネットワークを介して受信側へ送信する。受信側では、これら2つの副帯域は、ADPCMデコーダによってそれぞれ復号化され、その後、QMF(直交ミラーフィルター)合成フィルターを使用して、最終信号が合成される。
【0004】
異なるパケットロス補償(PLC)法が2つの異なる副帯域に採用されている。低帯域信号については、パケットロスがまったくない状況下では、再構成信号がクロスフェード(CROSS−FADING)の間に変更されることはない。パケットロスがある状況の下では、最初のロスト(欠落)フレームについて履歴信号(本明細書では、この履歴信号は上記ロストフレームの前の音声信号である)が短期予測器および長期予測器を使用して解析されるともに、音声分類情報が抽出される。ロストフレーム信号が、ピッチ反復法、上記予測器および上記分類情報に基づいてLPC(線形予測符号化)を利用して再構成される。これに同期してADPCMの状態が、良好なフレームが発見されるまで、更新されてもよい。加えて、上記ロストフレームに対応する信号を生成することが必要であるだけでなく、クロスフェードに適合するための信号の部分を生成することもまた必要である。このようにして、良好なフレームが一旦受信されると、クロスフェードが実行されて、良好なフレーム信号と前記信号の部分が処理される。この種のクロスフェードは上記受信側がフレームを喪失するとともに最初の良好なフレームを受信した後にだけ起きる、ということに留意すべきである。
【0005】
本発明を実現する過程の間に、本発明者は、従来技術における少なくとも次の問題に気が付いた。即ち、上記合成信号のエネルギーが、従来技術では静的な自己適応型減衰率を利用して制御されることである。定義された減衰率が徐々に変化しても、その減衰速度、すなわち上記減衰率の値は、同一の音声分類に対して同一である。しかしながら、人間の音声はさまざまである。減衰率が人間の音声の特性に合致していないときには、再構成信号には、とりわけ定常母音の終わりに不快なノイズが存在するであろう。上記の静的な自己適応型減衰率は、さまざまな人間の音声の特性に適応させることができない。
【0006】
図1に示された状況が一例であり、ここで、T0は上記履歴信号のピッチ周期である。上側の信号は、オリジナル信号、すなわち、パケットロスがまったくない状況の下における概略波形図に対応している。破線による下側の信号は、従来技術により合成された信号である。この図からわかるように、この合成信号は、オリジナル信号と同一の減衰速度を維持していない。同一のピッチ反復の回数があまりにも多い場合には、上記合成信号は、明らかな音楽ノイズをもたらすため、上記合成信号の状況と望ましい状況との差は大きい。
【発明の概要】
【発明が解決しようとする課題】
【0007】
本発明の実施形態によれば、合成信号の処理において使用される自己適応型で動的に調整可能な減衰率を取得するよう構成された、減衰率を取得する方法および装置が提供される。
【課題を解決するための手段】
【0008】
本発明の実施形態によれば、パケットロス補償において合成信号の処理に適合された減衰率を取得する方法であって、
信号の連続するピッチの変動傾向を取得し、
前記信号の連続するピッチの変動傾向に基づいて減衰率を取得すること
を含む方法が提供される。
【0009】
本発明のある実施形態によれば、パケットロス補償において合成信号を処理するための減衰率を取得する装置もまた提供される。前記減衰率を取得する装置は、
信号の連続するピッチの変動傾向を取得し、
取得された変動傾向に従って減衰率を取得するように構成されている。
【0010】
本発明のある実施形態によれば、履歴データから最新の受信データへの円滑な遷移を実現するように適合された減衰率を取得する方法および装置もまた提供される。
【0011】
上記目的を実現するために、本発明のある実施形態によれば、パケットロス補償において合成信号を処理するよう構成された方法であって、
信号の連続するピッチの変動傾向を取得し、
前記信号の連続するピッチの変動傾向に従って減衰率を取得し、
前記減衰率に基づく減衰処理の後に再構成されたロストフレームを取得すること、
を含む信号処理方法が提供される。
【0012】
本発明のある実施形態によれば、パケットロス補償において合成信号を処理するための信号処理を行う装置もまた提供され、前記装置は、
パケットロス補償において合成信号を処理するための減衰率を取得する装置と、
前記減衰率に従った減衰処理後に再構成されたロストフレームを取得するよう構成されたロストフレーム再構成ユニットと、
を含む。
【0013】
本発明のある実施形態によれば、前記音声信号を復号化するよう構成され、低帯域復号化ユニット、高帯域復号化ユニットおよび直交ミラーフィルター処理ユニットを含む音声デコーダもまた提供される。
【0014】
低帯域復号化ユニットは、受信した低帯域復号信号を復号するとともに欠落した低帯域信号を補償するよう構成されている。
【0015】
高帯域復号化ユニットは、受信した高帯域復号信号を復号するとともに欠落した高帯域信号を補償するよう構成されている。
【0016】
直交ミラーフィルター処理ユニットは、前記低帯域復号信号および前記高帯域復号化信号を合成することによって最終的な出力信号を取得するよう構成されている。
【0017】
低帯域復号化ユニットには、低帯域復号化サブユニット、ピッチ反復に基づくLPCサブユニット、およびクロスフェードサブユニットが含まれている。
【0018】
低帯域復号化ユニットは、受信した低帯域ストリーム信号を復号化するよう構成されている。
【0019】
ピッチ反復に基づくLPCサブユニットは、前記ロストフレームに対応する合成信号を生成するよう構成されている。
【0020】
クロスフェードサブユニットは、低帯域復号化ユニットによって処理された信号と、ピッチ反復に基づくLPCサブユニットによって生成された前記ロストフレームに対応する合成信号とをクロスフェードするよう構成されている。
【0021】
ピッチ反復に基づくLPCサブユニットには、解析モジュールおよび信号処理モジュールが含まれている。
【0022】
解析モジュールは、履歴信号を解析するとともに再構成されたロストフレーム信号を発生させるよう構成されている。
【0023】
本発明のある実施形態によれば、コンピュータによって実行されることにより、パケットロス補償において合成信号を処理するよう構成された減衰率を取得する方法におけるあらゆるステップ、あるいはパケットロス補償において合成信号を処理するための信号処理方法におけるあらゆるステップをコンピュータに実行させることのできるコンピュータプログラムコードを含む、コンピュータプログラム製品がさらに提供される。
【発明の効果】
【0024】
従来技術に比べて、本発明の実施形態には次の利点がある。
【0025】
自己適応型の減衰率が、履歴信号の変更履歴を使用することで動的に調整される。履歴データから最新の受信データへの円滑な遷移が実現されるので、補償信号とオリジナル信号との間の減衰速度が、さまざまな人間の音声の特性に適応できる程度に、一貫して維持される。
【図面の簡単な説明】
【0026】
【図1】従来技術によるオリジナル信号および合成信号を示す概略図である。
【図2】本発明の実施形態1による減衰率を取得する方法を示すフローチャートである。
【図3】エンコーダーの原理を示す概略図である。
【図4】低帯域復号化ユニットのピッチ反復に基づくLPCサブユニットのモジュールを示す概略図である。
【図5】本発明の実施形態1による動的減衰法を適用した後の出力信号を示している概略図である。
【図6A】本発明の実施形態2による減衰率を取得するための装置の構造を示す概略図である。
【図6B】本発明の実施形態2による減衰率を取得するための装置の構造を示す概略図である。
【図7】本発明の実施形態2による減衰率を取得するための装置の適用場面(例)を示す概略図である。
【図8A】本発明の実施形態3による信号処理装置の構造を示す概略図である。
【図8B】本発明の実施形態3による信号処理装置の構造を示している概略図である。
【図9】本発明の実施形態4による音声デコーダのモジュールを示す概略図である。
【図10】本発明の実施形態4による音声デコーダにおける低帯域復号化ユニットのモジュールを示す概略図である。
【図11】本発明の実施形態4によるピッチ反復に基づくLPCサブユニットのモジュールを示す概略図である。
【発明を実施するための形態】
【0027】
本発明を図面および実施形態を参照してより詳しく説明する。
【0028】
本発明の実施形態1は、図2に示されるような、パケットロス補償において合成信号を処理するように適合された、減衰率を取得する方法を提供しており、この方法には以下のステップが含まれている。
【0029】
ステップs101では、信号の変動傾向が取得される。
【0030】
具体的には、この変動傾向は次のパラメーターで表現することができる。
(1)この信号における先のピッチ周期信号のエネルギーに対する、最後のピッチ周期信号のエネルギーの比。
(2)この信号における先のピッチ周期信号の最大振幅値と最小振幅値との差に対する、最後のピッチ周期信号の最大振幅値と最小振幅値との差の比。
【0031】
ステップs102では、上記変動傾向に基づいて減衰率が取得される。
【0032】
本発明の実施形態1の詳細な処理方法が、特定の適用例とともに説明される。
【0033】
本発明の実施形態1は、パケットロス補償において合成信号を処理するように適合された減衰率を取得する方法を提供する。
【0034】
図3に示されるように、異なるPLC法が異なる2つの副帯域(サブバンド)に対して採用されている。低帯域部に対するPLC法が、図3における破線のフレームの丸1部分として示されている。これに対して、図3における破線のフレーム丸2は、高帯域に対するPLCアルゴリズムに対応している。高帯域信号としてはzh(n)が最終的に出力される高帯域信号である。低帯域信号zl(n)および高帯域信号zh(n)を取得した後に、この低帯域信号およびこの高帯域信号に対して上記QMFが実行され、最終的に出力される広帯域信号y(n)が合成される。
【0035】
低帯域信号についてのみ、次に詳しく説明する。
【0036】
フレームロスがまったくない状況下では、信号xl(n)(但しn=0,…,L−1)は、低帯域ADPCMデコーダによって受信された現在のフレームを復号化した後に取得され、また、その出力はzl(n)(但しn=0,…,L−1)であり、現在のフレームに対応している。この状況では、再構成信号はクロスフェードの間に変動することがなく、Lがフレーム長であるとき、zl〔n〕=xl〔n〕(但しn=0,…,L−1)である。
【0037】
フレームのロスがある状況下では、最初のロストフレームに関して、履歴信号zl(n)(n<0)は、短期予測器および長期予測器を使用して解析され、また、音声分類情報が抽出される。上記の予測器および分類情報を採用することで、信号yl(n)が、ピッ

チ反復に基づくLPC法を利用して生成される。また、ロストフレーム信号zl(n)が、zl(n)=yl(n),n=0,…,L−1として再構成される。加えて、ADPCMの状態もまた、良好なフレームが発見されるまで、同期して更新される。このロストフレームに対応する信号を生成する必要があるだけでなく、クロスフェードに適応する10ミリ秒信号yl(n),n=L,…,L+M−1を生成する必要もある、ということに留意すべきであり、ここでMは上記エネルギーを算出する処理に含まれる信号サンプリング箇所の数である。このようにして、良好なフレームが一旦受信されると、xl(n),n=L,…,L+M−1およびyl(n),n=L,…,L+M−1についてクロスフェードが実行される。この種のクロスフェードは、フレームロスの後に上記受信側が上記の良好な第1フレームデータを受信するときにだけ、生じることに留意されたい。
【0038】
図3におけるピッチ反復に基づくLPC法が図4に示されている。
【0039】
データフレームが良好なフレームであるときには、zl(n)は、将来使用するためにバッファの中へ記憶される。
【0040】
最初のロストフレームが発見されると、最終的な信号yl(n)は2つのステップで合成される必要がある。最初に、履歴信号zl(n),n=−297,…,−1が解析される。その後、信号yl(n),n=0,…,L−1が解析の結果に従って合成され、ここで、Lは上記データフレームのフレーム長、すなわち、信号の1つのフレームに対応するサンプリング箇所の数であり、Qは履歴信号を解析するために必要である信号の長さである。
【0041】
上記ピッチ反復に基づくLPCモジュールには、詳細には以下の部分が含まれている。
【0042】
(1)LP(線形予測)解析
短期解析フィルターA(z)および合成フィルター1/A(z)は、階数Pに基づく線形予測(LP)フィルターである。このLP解析フィルターは、
A(z)=1+a1-1+a2-2+…+ap-p
として定義される。
【0043】
フィルターA(z)での履歴信号zl(n),n=−Q,…,−1のLP解析によって、履歴信号zl(n),n=−Q,…,−1に対応する残りの信号e(n),n=−Q,…,−1が取得される。
【数2】

【0044】
(2)履歴信号解析
喪失(欠落)した信号はピッチ反復法によって補償される。それゆえ、初めに、履歴信号zl(n),n=−Q,…,−1に対応するピッチ周期T0を推定する必要がある。このステップは以下のとおりである。zl(n)は、LTP(長期予測)解析において不要な低周波数成分を除去するために前処理され、zl(n)のピッチ周期T0をLTP解析によって取得することができる。ピッチ周期T0を取得した後に、信号分類モジュールを組み合わせることによって、音声分類が取得される。
【0045】
音声分類は、次の表1に示されたようなものである。
【表1】

【0046】
(3)ピッチ反復
ピッチ反復モジュールは、ロストフレームのLP残余信号e(n),n=0,…,L−1を評価するよう構成されている。ピッチ反復が実行される前に、音声の分類が有声でない場合には、次の式が用いられて、あるサンプルの振幅が制限される。
【数3】

【0047】
音声分類が有声である場合には、新たに受信された良好なフレームの信号における最後のピッチ周期の信号に対応する残余信号を反復するステップを用いることで、喪失信号に対応する残余信号e(n),n=0,…,L−1が取得される。すなわち、
e(n)=e(n−T0
である。
【0048】
他の音声分類に関しては、生成された信号の周期性が強くなりすぎることを防止するために(非音声信号に関しては周期性がきわめて強い場合、音楽ノイズのような何らかの不快なノイズが聞えることがある)、喪失信号に対応する残余信号e(n),n=0,…,L−1は、次の式を使用することで生成される。
e(n)=e(n−T0+(−1)n
【0049】
喪失信号に対応する残余信号の生成に加えて、ロストフレームとこのロストフレームの後の良好な最初のフレームとの間における円滑な接続を保証するために、付加的なN個のサンプルの残余信号e(n),n=L,…,L+N−1が、クロスフェードに適合された信号を生成するために、引き続いて生成される。
【0050】
(4)LP合成
ロストフレームに対応する残余信号e(n)の生成とクロスフェードとの後に、再構成ロストフレーム信号ylpre(n),n=0,…,L−1が、次の式を使用することで生成される。
【数4】

【0051】
ここで、残余信号e(n),n=0,…,L−1は、上記ピッチ反復ステップで取得された残余信号である。
【0052】
さらに、クロスフェードに適合する、N個のサンプルを有するylpre(n),n=L,…,L+N−1が、上記の式を使用して生成される。
【0053】
(5)適応ミューティング
円滑なエネルギー遷移を実現するために、高帯域信号でQMFを実行する前に、低帯域信号もまたクロスフェードを行う必要があり、その規則が次の表に示されている。
【表2】

【0054】
上の表において、zl(n)は、現在のフレームに対応する最終的に出力される信号であり、xl(n)は、現在のフレームに対応する良好なフレームの信号であり、yl(n)は、現在のフレームの同一時刻に対応する合成信号であり、ここで、Lはフレーム長であり、Nはクロスフェードを実行するサンプルの数である。
【0055】
異なる音声分類に対して、ylpre(n)における信号のエネルギーは、すべてのサンプルに対応する係数に従って、クロスフェードを実行する前に制御される。この係数の値は、異なる音声分類とパケットロスの状況とに応じて変化する。
【0056】
詳しく説明すると、受信された履歴信号における最後の2つのピッチ周期信号が図5に示されたようにオリジナル信号である場合、自己適応型の動的減衰率は、その履歴信号における最後の2つのピッチ周期の変動傾向に従って動的に調整される。詳しい調整方法は以下のステップを含んでいる。
【0057】
ステップs201では、信号の変動傾向が取得される。
【0058】
この信号の変動傾向は、この信号における先のピッチ周期信号のエネルギーに対する、最後のピッチ周期信号のエネルギーの比、すなわち履歴信号の最後の2つのピッチ周期信号のエネルギーE1およびE2の比によって表現することができ、これら2つのエネルギーの比が算出される。
【数5】

【0059】
1は最後のピッチ周期信号のエネルギーであり、E2はその前のピッチ周期信号のエネルギーであり、また、T0は履歴信号に対応するピッチ周期である。
【0060】
場合によっては、信号の変動傾向は、履歴信号における最後の2つのピッチ周期の山−谷の差どうしの比によって表現することができる。
1=max(xl(i))−min(xl(j))
(i,j)=−T0,…,−1
2=max(xl(i))−min(xl(j))
(i,j)=−2T0,…,−(T0+1)
【0061】
ここで、P1は最後のピッチ周期信号の最大振幅値と最小振幅値との差であり、P2はその前のピッチ周期信号の最大振幅値と最小振幅値との差であり、その比は次のように算出される。
【数6】

【0062】
ステップs202で、合成信号は、取得された信号の変動傾向に従って、動的に減衰される。
【0063】
その計算式は次のように示される。
yl(n)=ylpre(n)*(1−C*(n+1)) n=0,…,N−1
【0064】
ここで、ylpre(n)は再構成ロストフレーム信号であり、Nは合成信号の長さであり、また、Cは自己適応型減衰係数であり、その値は次のように示される。
【数7】

【0065】
減衰率が1−C*(n+1)<0である状況下では、これらのサンプルに対応する減衰率がマイナスとなる状況の出現を回避するために、1−C*(n+1)=0に設定することが必要である。
【0066】
具体的には、R>1の状況下であるサンプルに対応する振幅値がオーバーフローする状況を回避するために、合成信号は、R<1の状況だけを考慮することのできる本実施形態におけるステップs202の式を使用して、動的に減衰される。
【0067】
具体的には、エネルギーが少ない信号の減衰速度が速すぎるという状況を回避するために、E1がある限界値を超える状況下にあるときにだけ、合成信号は、本実施形態におけるステップs202の式を使用することで、動的に減衰される。
【0068】
具体的には、合成信号の減衰速度が速すぎることを回避するために、特に連続的なフレームロスの状況の下では、減衰係数Cについて上限値が設定される。C*(n+1)がある限界値を超えると、上記減衰係数は上限値に設定される。
【0069】
具体的には、劣悪なネットワーク環境および連続的フレームロスの状況の下で、速すぎる減衰速度を回避するために、一定の条件を設定することができる。例えば、ロストフレームの数が所定の数、例えば2フレームを超えるとき、あるいは、そのロストフレームに対応している信号が所定の長さ、例えば20ミリ秒を超えるとき、あるいは、上記条件の少なくとも1つにおいて現在の減衰係数1−C*(n+1)が所定の臨界値を超えるときには、出力信号が無音性になるという状況をもたらしうる速すぎる減衰速度を回避するように、減衰係数Cを調整する必要がある。
【0070】
例えば、8キロヘルツの周波数と40サンプルのフレーム長でサンプリングを行う状況下では、ロストフレームの数は4として設定することができ、また、減衰率1−C*(n+1)が0.9未満になったときには、減衰係数Cはより小さい値に調整される。より小さい値を調整する規則は次のとおりである。
【0071】
現在の減衰係数がCであり、減衰率の値がVであることが予測され、減衰率Vは、V/C個がサンプリングされた後に、0まで減衰されると仮定する。これに対して、M個(M≠V/C)がサンプリングされた後に、減衰率Vが0まで減衰される状況がより好ましい。そこで、減衰係数Cは
C=V/M
に調整される。
【0072】
図5に示されるように、上段の信号はオリジナル信号であり、中段の信号は合成信号である。この図からわかるように、この信号にはある程度の減衰があるものの、強い有音特性がまだ残っている。その持続時間が長すぎるときには、この信号は、とりわけ有声音の終端で、音楽ノイズとして現れることがある。下段の信号は、本発明の実施形態における動的減衰を利用した後の信号であり、オリジナル信号と極めて類似しうる。
【0073】
上記実施形態によって提供された方法によれば、自己適応型の減衰率は履歴信号の変動

傾向を利用して動的に調整されるので、履歴データから最新の受信データまでの円滑な遷移が実現される。この減衰速度は、さまざまな人間の音声の特性にできるだけ適合するように、補償信号とオリジナル信号との間でできるだけ一貫して(整合するよう)維持される。
【0074】
減衰率を取得するための装置が、本発明の実施形態2において提供されており、パケットロス補償における合成信号を処理するよう構成され、この装置には、
信号の変動傾向を取得するよう構成された変動傾向取得ユニット10と、
前記変動傾向取得ユニット10によって取得された変動傾向によって減衰率を取得するよう構成された減衰率取得ユニット20と
が含まれている。
【0075】
減衰率取得ユニット20は、変動傾向取得ユニット10によって取得された変動傾向に基づいて減衰係数を生成するよう構成された減衰係数取得サブユニット21と、減衰係数取得サブユニット21によって生成された減衰係数に基づいて減衰率を取得するよう構成された減衰率取得サブユニット22とが、さらに含まれている。減衰率取得ユニット20には、減衰係数取得サブユニット21によって取得された減衰係数の値を、減衰係数の値がある上限値を超えているかどうか、連続的なフレームロスの状況が存在しているかどうか、また減衰速度が速すぎるかどうか、のうちの少なくとも1つが含まれる所定条件によって所定の値に調整するよう構成された減衰係数調整サブユニット23がさらに含まれている。
【0076】
上記実施形態における減衰率の取得方法は、本開示の方法のいくつかの実施形態における減衰率を取得する方法と同一である。
【0077】
詳しく説明すると、変動傾向取得ユニット10によって取得された変動傾向は次のパラメーターで表わすことができる。
(1)信号における先のピッチ周期信号のエネルギーに対する、最後のピッチ周期信号のエネルギーの比。
(2)信号における先のピッチ周期信号の最大振幅値と最小振幅値との差に対する、最後のピッチ周期信号の最大振幅値と最小振幅値との差の比。
【0078】
変動傾向が上記(1)におけるエネルギー比で表わされるとき、減衰率を取得するための装置の構造は図6Aに示される通りである。この変動傾向取得ユニット10には、
最後のピッチ周期信号のエネルギーと、その前のピッチ周期信号のエネルギーとを取得するよう構成されたエネルギー取得サブユニット11と、
このエネルギー取得サブユニット11によって取得された先のピッチ周期信号のエネルギーに対する最後のピッチ周期信号のエネルギーの比を取得するとともに、この比を信号の変動傾向を示すために利用するよう構成されたエネルギー比取得サブユニット12と
がさらに含まれる。
【0079】
変動傾向が上記(2)における振幅差の比で表わされるとき、減衰率を取得するための装置の構造は図6Bに示される通りである。この変動傾向取得ユニット10には、
最後のピッチ周期信号の最大振幅値と最小振幅値との差と、その前のピッチ周期信号の最大振幅値と最小振幅値との差とを取得するよう構成された振幅差取得サブユニット13と、
先のピッチ周期信号の最大振幅値と最小振幅値との差に対する最後のピッチ周期信号の最大振幅値と最小振幅値との差の比を取得するとともに、この比を信号の変動傾向を示すために利用するよう構成された振幅差比取得サブユニット14と
がさらに含まれている。
【0080】
本発明の実施形態2による減衰率を取得するための装置の適用例を示す概略図は、図7に示される通りである。自己適応型減衰率は履歴信号の変動傾向を利用して動的に調整される。
【0081】
上記実施形態によって提供された装置を使用することで、自己適応型減衰率が履歴信号の変動傾向を利用して動的に調整されるので、履歴データから最新の受信データへの円滑な遷移が実現される。この減衰速度は、さまざまな人間の音声の特性にできる限り適合するように、補償信号とオリジナル信号との間でできるだけ一貫(整合)するように維持される。
【0082】
信号処理装置が本発明の実施形態3に提供されており、この装置は、図8Aおよび図8Bに示されたように、パケットロス補償において合成信号を処理するよう構成されている。実施形態2に基づいて、上記減衰率取得ユニットと相互関係があるロストフレーム再構成ユニット30が加えられている。このロストフレーム再構成ユニット30は、減衰率取得ユニット20によって取得された減衰率に基づいた減衰処理の後に、再構成されたロストフレームを取得する。
【0083】
上記実施形態によって提供された装置を使用すれば、自己適応型減衰率は履歴信号の変動傾向を利用して動的に調整され、また、減衰後に再構成されたロストフレームが上記減衰率によって取得されるので、履歴データから最新の受信データへの円滑な遷移が実現される。この減衰速度は、さまざまな人間の音声の特性にできる限り適合するように、補償信号とオリジナル信号との間でできるだけ一貫(整合)するように維持される。
【0084】
図9に示されるように、本発明の実施形態4によって音声デコーダが提供される。この音声デコーダには、受信された高帯域復号信号を復号化するとともに喪失された高帯域信号を補償するよう構成された高帯域復号化ユニット40と、受信された低帯域復号信号を復号化するとともに喪失された低帯域信号を補償するよう構成された低帯域復号化ユニット50と、上記低帯域復号信号および上記高帯域復号信号を合成することによって最終的な出力信号を取得するよう構成された直交ミラーフィルター処理ユニット60が含まれている。高帯域復号化ユニット40は、受信側によって受信した高帯域ストリーム信号を復号化するとともに高帯域喪失信号を合成する。低帯域復号化ユニット50は、受信側によって受信した低帯域ストリーム信号を復号化するとともに低帯域喪失信号を合成する。直交ミラーフィルター処理ユニット60は、低帯域復号化ユニット50によって出力された低帯域復号信号と高帯域復号化ユニット40によって出力された高帯域復号信号とを合成することで、最終的な出力信号を取得する。
【0085】
図10に示されたように、低帯域復号化ユニット50には、次のユニットが含まれている。即ち、ロストフレームに対応する合成信号を生成するよう構成されたピッチ反復に基づくLPCサブユニット51、受信した低帯域ストリーム信号を復号化するよう構成された低帯域復号化サブユニット52、および、この低帯域復号化サブユニットによって復号化された信号と、ピッチ反復に基づくLPCサブユニットによって生成された、ロストフレームに対応する合成信号とをクロスフェードするよう構成されたクロスフェードサブユニット53である。
【0086】
低帯域復号化サブユニット52は、受信した低帯域ストリーム信号を復号化する。ピッチ反復に基づくLPCサブユニット51は、上記低帯域喪失信号にLPCを実行することで、合成信号を生成する。そして最後に、クロスフェードサブユニット53は、上記ロストフレーム補償後の最終的な復号信号を取得するために、低帯域復号化サブユニット52によって処理された信号と上記合成信号をクロスフェードする。
【0087】
図10に示されたように、ピッチ反復に基づくLPCサブユニット51には、解析モジュール511と信号処理モジュール512とがさらに含まれている。解析モジュール511は、履歴信号を解析するとともに、再構成されたロストフレーム信号を生成し、信号処理モジュール512は、信号の変動傾向を取得し、信号の変動傾向に基づいて減衰率を取得し、再構成ロストフレーム信号を減衰させるとともに、減衰後の再構成ロストフレームを取得する。
【0088】
信号処理モジュール512には、減衰率取得ユニット5121とロストフレーム再構成ユニット5122とがさらに含まれている。減衰率取得ユニット5121は、信号の変動傾向を取得するとともに、この変動傾向に基づいて減衰率を取得し、ロストフレーム再構成ユニット5122は、この減衰率に従って、再構成されたロストフレーム信号を減衰させるとともに、減衰後の再構成ロストフレームを取得する。信号処理モジュール512には、図8Aおよび図8Bの信号処理装置の構造をそれぞれ示す概略図に対応する2つの構造が含まれている。
【0089】
減衰率取得ユニット5121には、図6Aおよび図6Bの減衰率を取得するための装置の構造を示す概略図に対応する2つの構造が各々含まれている。上記モジュールおよびユニットにおける特定の機能および実施手段は、本方法の実施形態において明らかにされた内容を参照することができる。ここでは、必要のない細部は繰り返して説明しない。
【0090】
上記実施形態の説明を通して、当業者は、本発明を、ソフトウェアおよび必要かつ一般的なハードウェアのプラットフォームに応じて実現することができ、また、ハードウェアによっても確実に実現することができる。しかしながら、たいていの状況では、前者が好ましい実施形態である。このような理解に基づいて、本発明の技術計画において従来技術の一助となる本質あるいは部分は、記憶媒体に記憶されたソフトウェア製品の形態で実施することができ、前記ソフトウェア製品には、本発明の実施形態を実行するように1つの装置へ指示を行うための1以上の命令が含まれる。
【0091】
本開示の図示および説明は実施形態を参照して行われたが、当業者であれば、本開示の範囲から逸脱することなく形態および細部にさまざまな変更を行うことができる、ということが認識されるであろう。

【特許請求の範囲】
【請求項1】
パケットロス補償において合成信号の処理に使用する減衰率を取得する方法であって、
信号の連続するピッチの変動傾向を取得し、
前記信号の連続するピッチの変動傾向に基づいて減衰率を取得すること
を含む、方法。
【請求項2】
前記信号の連続するピッチの変動傾向を取得することは、前記信号における先のピッチ周期信号のエネルギーに対する、最後のピッチ周期信号のエネルギーの比を取得することを含む、請求項1に記載の方法。
【請求項3】
前記信号の連続するピッチの変動傾向を取得することは、前記信号における先のピッチ周期信号の最大振幅値と最小振幅値との差に対する、最後のピッチ周期信号の最大振幅値と最小振幅値との差の比を取得することを含む、請求項1に記載の方法。
【請求項4】
前記信号の連続するピッチの変動傾向に基づいて減衰率を取得する前に、前記比が1未満である場合に、前記信号の連続するピッチの変動傾向に基づいて減衰率を取得することをさらに含む、請求項2または3に記載の方法。
【請求項5】
前記信号の連続するピッチの変動傾向に基づいて減衰率を取得する前に、前記最後のピッチ周期信号のエネルギーが予め設定された限界値よりも大きい場合に、前記信号の連続するピッチの変動傾向に基づいて減衰率を取得することをさらに含む、請求項2に記載の方法。
【請求項6】
前記信号における先のピッチ周期信号のエネルギーに対する最後のピッチ周期信号のエネルギーの比は、
【数1】

であり、ここで、E1は前記最後のピッチ周期信号のエネルギーであり、E2は前記先のピッチ周期信号のエネルギーである、
請求項2に記載の方法。
【請求項7】
前記信号における先のピッチ周期信号の最大振幅値と最小振幅値との差に対する、最後の周期信号の最大振幅値と最小振幅値との差の比は、R=P1/P2であり、ここで、P1
は前記最後のピッチ周期信号の最大振幅値と最小振幅値との差であり、P2は前記先のピ
ッチ周期信号の最大振幅値と最小振幅値との差である、請求項3に記載の方法。
【請求項8】
前記信号の連続するピッチの変動傾向に基づいて取得された減衰率は、
1−C*(n+1) 但し、n=0,…,N−1
であり、ここで、Cは減衰係数であってC=(1−R)/T0であり、Nは前記合成信
号の長さであり、T0はピッチ周期の長さである、
請求項6または7に記載の方法。
【請求項9】
減衰率1−C*(n+1)<0である場合は、減衰率1−C*(n+1)=0が設定される、請求項8に記載の方法。
【請求項10】
減衰係数Cについて上限値が予め設定され、減衰係数Cは、C=(1−R)/T0によって取得されたC*(n+1)がある限界値を超えた場合は、前記上限値に設定される、請求項8に記載の方法。
【請求項11】
減衰速度が速すぎる場合は、前記減衰係数Cが減少される、請求項8に記載の方法。
【請求項12】
前記減衰係数Cを減少させることは、
前記信号が、M個のサンプルがサンプリングされた後に0まで減衰するよう予め設定され、
Vが現在の減衰率であるとき、調整された減衰係数がC=V/Mに設定されることからなる、請求項11に記載の方法。
【請求項13】
請求項1〜12のいずれか1項に記載のステップと、前記減衰率での減衰の後に再構成されたロストフレームを取得するステップを含む、パケットロス補償における合成信号の処理に使用する信号処理方法。
【請求項14】
前記信号の連続するピッチの変動傾向に基づいて取得された減衰の後に再構成されたロストフレームは、
yl(n)=ylpre(n)*(1−C*(n+1))
但し、n=0,…,N−1
であり、ここで、ylpre(n)は、再構成されたロストフレーム信号であり、Nは前
記合成信号の長さであり、Cは減衰係数であってC=(1−R)/T0であり、T0は前記ピッチ周期の長さである、請求項13に記載の方法。
【請求項15】
前記信号は複数のフレームを含み、少なくとも1つのフレームが、少なくとも2つの連続するピッチを含む、請求項1〜14のいずれか一項に記載の方法。
【請求項16】
パケットロス補償において合成信号の処理に使用する減衰率を取得する装置であって、前記装置が、
信号の連続するピッチの変動傾向を取得するよう構成された変動傾向取得ユニットと、
前記変動傾向取得ユニットによって取得された変動傾向に基づいて減衰率を取得するよう構成された減衰率取得ユニットと、
を備える、装置。
【請求項17】
前記変動傾向取得ユニットは、
前記信号における最後のピッチ周期信号のエネルギーと、その前のピッチ周期信号のエネルギーとを取得するよう構成されたエネルギー取得サブユニットと、
前記エネルギー取得サブユニットによって取得された前のピッチ周期信号のエネルギーに対する、最後のピッチ周期信号のエネルギーの比を取得し、前記比を信号ピッチの変動傾向を示すために利用するよう構成されたエネルギー比取得サブユニット
を備える、請求項16に記載の装置。
【請求項18】
前記変動傾向取得ユニットは、
最後のピッチ周期信号の最大振幅値と最小振幅値との差と、その前のピッチ周期信号の最大振幅値と最小振幅値との差とを取得するよう構成された振幅差取得サブユニットと、
前記振幅差取得サブユニットにより取得された前のピッチ周期信号の前記差に対する、前記振幅差取得サブユニットにより取得された最後のピッチ周期信号の前記差の比を取得し、前記比が信号ピッチの変動傾向を示すために利用されるよう構成された振幅差比率取得サブユニットと、
を備える、請求項16に記載の装置。
【請求項19】
前記減衰率取得ユニットは、
変動傾向取得ユニットによって取得された変動傾向に基づいて減衰係数を生成するよう構成された減衰係数取得サブユニットと、
前記減衰係数取得サブユニットによって生成された減衰係数に基づいて減衰率を取得するよう構成された減衰率取得サブユニットと、
を備える、請求項16に記載の装置。
【請求項20】
前記減衰率取得ユニットは、前記減衰係数取得サブユニットによって取得された減衰係数の値を、ある所定条件が満たされたときに、ある値に調整するように構成された減衰係数調整ユニットをさらに備え、
前記所定条件が、
前記減衰係数の値がある上限値を超えているかどうか、
連続的なフレームロスの状況が存在しているかどうか、
減衰速度が速すぎるかどうか、
のうちの少なくとも1つを含む、請求項19に記載の装置。
【請求項21】
請求項16〜20のいずれか1項に記載の減衰率を取得する装置と、
前記減衰率に従った減衰処理後に再構成されたロストフレームを取得するよう構成されたロストフレーム再構成ユニットと、
を備える、パケットロス補償において合成信号を処理するための信号処理装置。
【請求項22】
前記信号は複数のフレームを含み、少なくとも1つのフレームが、少なくとも2つの連続するピッチを含む、請求項16〜21のいずれか一項に記載の装置。
【請求項23】
低帯域復号化ユニットと、高帯域復号化ユニットと、直交ミラーフィルター処理ユニットと、を備える、音声デコーダであって、
前記低帯域復号化ユニットは、受信した低帯域復号信号を復号するとともに喪失された低帯域信号を補償するよう構成され、
前記高帯域復号化ユニットは、受信した高帯域復号信号を復号するとともに喪失された高帯域信号を補償するよう構成され、
前記直交ミラーフィルター処理ユニットは、前記低帯域復号信号および前記高帯域復号信号を合成することによって最終的な出力信号を取得するよう構成され、
前記低帯域復号化ユニットは、低帯域復号化サブユニットと、ピッチ反復に基づく線形予測符号化サブユニットと、クロスフェードサブユニットを備え、
前記低帯域復号化ユニットは、受信した低帯域ストリーム信号を復号化するよう構成され、
前記ピッチ反復に基づく線形予測符号化(LPC)サブユニットは、ロストフレームに対応する合成信号を生成するよう構成され、
前記クロスフェードサブユニットは、低帯域復号化ユニットによって処理された信号と、ピッチ反復に基づくLPCサブユニットによって生成された前記ロストフレームに対応する合成信号とをクロスフェードするよう構成され、
前記ピッチ反復に基づくLPCサブユニットは、請求項21又は22に記載の信号処理装置と、解析モジュールとを備え、前記解析モジュールは、履歴信号を解析するとともに再構成されたロストフレーム信号を生成するよう構成されている、
音声デコーダ。
【請求項24】
コンピュータにより実行されることにより、コンピュータに請求項1〜15のいずれか1つに記載のステップを実行可能とさせるコンピュータプログラム備える、コンピュータプログラム

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6A】
image rotate

【図6B】
image rotate

【図7】
image rotate

【図8A】
image rotate

【図8B】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate


【公開番号】特開2010−176142(P2010−176142A)
【公開日】平成22年8月12日(2010.8.12)
【国際特許分類】
【出願番号】特願2010−60127(P2010−60127)
【出願日】平成22年3月17日(2010.3.17)
【分割の表示】特願2008−284260(P2008−284260)の分割
【原出願日】平成20年11月5日(2008.11.5)
【出願人】(502385872)華為技術有限公司 (139)