説明

ノイズ生成装置、方法、及びコンピュータ可読記録媒体

【課題】さまざまな標準プロトコルに適応して、復号器がユーザに快適なノイズを回復できる。
【解決手段】ノイズ生成装置及び方法が提供される。ノイズ生成方法は、再構成されるパラメータの初期値を決定し、その再構成パラメータの初期値に基づいてランダム値域を決定し、そのランダム値域の中の1つの値を再構成ノイズパラメータとしてランダムに取り、その再構成ノイズパラメータに基づいてノイズを生成することを含む。

【発明の詳細な説明】
【技術分野】
【0001】
本出願は、中華人民共和国の国家知的財産局に2007年9月28日に提出された、「ノイズ生成装置及び方法」と題する、中国特許出願第200710151408.9号の優先権を主張するものであり、その全体が参照によりここに組み込まれるものとする。
【0002】
本発明は通信技術に関するものであり、より具体的には、ノイズ生成装置及び方法に関するものである。
【背景技術】
【0003】
音声伝送においては、一般に音声符号化技術を用いて音声メッセージを圧縮し、通信システムの容量改善が図られる。
【0004】
音声通信においては、音声は通信時間の内の40%を占めるだけであり、残りの時間は、無音あるいは背景ノイズとなっている。一般的に言えば、音声通信を行っている人は音声の内容にしか関心がなく、無音あるいは背景ノイズのみの時間については注意を払わない。従って、音声メッセージを圧縮する場合には、音声メッセージであるか、無音、背景ノイズであるかによって符号化及び伝送の方法が異なり、通信システムの容量をより改善できるようになっている。非連続伝送システム/コンフォートノイズ生成(DTX/CNG)は、そのような、通信システムの容量改善を更に図る方法である。
【0005】
このDTX/CNG技術を用いて背景ノイズを符号化して得られるフレームは、一般に無音挿入記述子(SID)フレームと呼ばれる。通常の音声フレームには、スペクトルパラメータ、信号エネルギーゲインパラメータ、並びに固定コードブックと適応コードブックに関するパラメータが含まれる。音声フレームを受信すると、それらの情報に基づいて復号器が元の音声データを回復する。しかし、SIDフレームは一般的には、スペクトルパラメータと信号エネルギーゲインパラメータしか含んでいない。復号器は、スペクトルパラメータと信号エネルギーゲインパラメータに基づいて背景ノイズを回復する。これはユーザが通常、背景ノイズ中に含まれる情報には注意を払わない、という事実によるものである。従って、SIDフレームは少量の参照情報、即ちスペクトルパラメータと信号エネルギーゲインパラメータのみを配信する。このような参照情報に基づいて復号器が背景ノイズを回復し、ユーザは相手のいる環境をおおよそ知ることができ、かつユーザが受ける聴取品質には顕著な影響を及ぼさない。音声伝送において、SIDフレームは数フレームのインタバルで送信される。符号化されたパラメータが送信されないか、符号化されたパラメータが全くないフレームは、一般にNO_DATAフレームと呼ばれる。
【0006】
DTX/CNG技術は、さまざまな組織や機関において開発された最近の音声コーディング標準で広く用いられている。
【0007】
DTX/CNG技術は、第3世代パートナーシッププロジェクト(3GPP)により開発された音声符号化標準である、適応マルチレート(AMR)に採用されている。SIDフレームは固定インタバルで、即ち8フレーム毎に送信される。連続して受信される2つのSIDフレームから復号化されるパラメータ、即ち信号エネルギーゲインパラメータとスペクトルパラメータとを用いて線形補完を行い、ノイズ合成のために必要なパラメータを次式のように算出する。
【0008】
【数1】



【0009】
ここで、Pn+kはn番目のSIDフレームの後のk番目のフレームのCNGパラメータの算出された値を表し,Psid(nー1)は復号器により受信されたn−1番目のS
IDフレームのパラメータを表し,Psid(n)は復号器により受信されたn番目のS
IDフレームのパラメータを表わす。n=0の場合には、Psid(ー1)は直前の8つの音声フレームのスペクトルパラメータと信号エネルギーゲインパラメータの平均値を表す。
【0010】
DTX/CNG技術はまた、音声符号化標準である、国際電気通信連合(ITU)により開発された共役構造代数符号励振型線形予測音声コーデックにより定義される無音圧縮方式にも採用されている。符号器は、ノイズパラメータの変化に基づきSIDフレームを送信するかどうかを状況に適応して決定する。2つの連続するSIDフレーム間のインタバルは、少なくとも20msであり、最大値を持たない。復号器に使用されるCNGアルゴリズムは以下のように与えられる。
【0011】
信号エネルギーゲインパラメータの再構成に関しては、
【0012】
【数2】



【0013】
スペクトルパラメータの再構成に関しては、
【0014】
【数3】



【0015】
【数4】

【0016】
ここで、

【0017】
【数5】



【0018】
は、復号器で新たに受信したSIDフレームから復号化された信号エネルギーゲインパラメータを表し、LSFsid_lastは、復号器で最後に受信したSIDフレームから復号化されたスペクトルパラメータを表し、LSFsid_newは、復号器で新たに受信したSIDフレームから復号化されたスペクトルパラメータを表す。
【発明の概要】
【発明が解決しようとする課題】
【0019】
従来技術の調査及び適用において、発明者らは従来技術には以下の問題があることを発見した。
【0020】
3GPPの音声コーディング標準、即ちAMRに用いられるDTX/CNG技術に関しては、符号器は固定インタバルでしかSIDフレームを送信できない。符号器がSIDフレームを適応インタバルで送信する場合には、システムは正常に動作しない。
【0021】
ITUの音声コーディング標準、即ち共役構造代数符号励振型線形予測ボコーダにより定義される無音圧縮方式に利用されるDTX/CNG技術に関しては、現フレームがSIDフレームである場合には、現フレーム中の第1のサブフレームのスペクトルパラメータは、現フレームの復号化されたスペクトルパラメータとその前のSIDフレームのスペクトルパラメータとを平均して生成され、この復号化されたスペクトルパラメータが第2のサブフレームのスペクトルパラメータとして直接利用される。次のSIDフレームが来る前のNO_DATAフレームに関しては、直近のSIDフレームの復号化されたスペクトルパラメータがノイズ再構成に直接利用される。次のSIDフレームが来て、その複合化されたスペクトルパラメータと前のSIDフレームのスペクトルパラメータとが異なっている場合には、不連続性が生じる。更には、スペクトルパラメータは一定の変化をする変数であり、従って、2つの連続したスペクトルパラメータ間には一般的に差異があるので、再構成されたコンフォートノイズのスペクトルは不連続になりがちであり、特に2つの連続するスペクトルパラメータ間に大きな差異がある場合には、それが聴取品質に影響を与える。
【課題を解決するための手段】
【0022】
本発明の実施形態における解決すべき技術課題は、さまざまな標準プロトコルに適応して、復号器がユーザに快適なノイズを回復できるようなノイズ生成の方法及び装置を提供することである。
【0023】
上記の技術課題を解決するために、本発明の実施形態は、
再構成パラメータの初期値を決定し、
再構成パラメータの初期値に基づいてランダムな値域を決定し、
再構成ノイズパラメータとしてランダムな値域の中から1つの値をランダムに取り出し、
再構成ノイズパラメータを用いてノイズを生成することを含む、ノイズ生成の方法を提供する。
【0024】
本発明の実施形態は、
再構成パラメータの初期値を決定するための初期値ユニットと、
再構成パラメータの初期値に基づいてランダムな値域を決定するためのレンジユニットと、
ランダム値域の中から再構成ノイズパラメータとして1つの値をランダムに取り出す再構成ユニットと、
再構成ノイズパラメータを用いてノイズを生成するための合成ユニットと、
を備えるノイズ生成のための装置を提供する。
【発明の効果】
【0025】
上記の技術的解決策から、本発明の実施形態では、符号器におけるプロトコル標準に関する制限がないことがわかる。本発明の技術的解決策は、符号器がSIDフレームを固定インタバルで伝送しても、あるいは適応インタバルで伝送しても、操作可能である。更には、第1のSIDフレームを受信した後に新しいSIDフレームを受信すると、新しく受信したSIDフレームの前のフレームに対する再構成ノイズパラメータが、再構成パラメータの初期値とされる。再構成パラメータの初期値と、新しく受信したSIDフレームのノイズパラメータとを参照して、ランダムな値域が決定される。その範囲内の1つの値をランダムに取ってノイズパラメータとする。このようにして、生成されたノイズの遷移はより自然となり、ユーザの聴取感がより良くなる。
【図面の簡単な説明】
【0026】
【図1】本発明の一実施形態によるノイズ生成方法を示すフローチャートである。
【図2】本発明の別の実施形態によるノイズ生成方法を示すフローチャートである。
【図3】本発明の更に別の実施形態によるノイズ生成方法を示すフローチャートである。
【図4】本発明の更に別の実施形態によるノイズ生成方法を示すフローチャートである。
【図5】本発明の一実施形態によるノイズ生成装置の構成を示すブロック図である。
【発明を実施するための形態】
【0027】
本発明の実施形態は、ノイズ生成の装置及び方法を提供する。これは各種の標準プロトコルに適応し、復号器がユーザにとって快適なノイズを回復することができる。
【0028】
本発明の実施形態によるノイズ生成方法においては、復号器が少数のSIDフレームのノイズパラメータを用いて、ランダムな変化と滑らかなカーブとを有するノイズパラメータを再構成する。このようにして、ユーザにとって快適なノイズの回復を支援する。
【0029】
本発明の実施形態1によるノイズ生成方法のフローが図1に示される。
【0030】
ステップ101では、SIDフレームで搬送されるノイズパラメータが取得される。
【0031】
音声通信が開始された後、復号器は受信したデータパケットからフレーム情報を復号する。そして、フレームのフォーマットに関する決定が行われる。フレームが音声フレームである場合には、音声フレーム処理フローが開始される。フレームが、SIDフレームやNO_DATAフレームなどの非音声フレームである場合、本実施形態で提供されるノイズ生成方法のフローが開始される。
【0032】
非音声フレームが処理される場合、NO_DATAフレームには音声データが含まれていないので、この手順はステップ102に直接進む。SIDフレームが受信されると、SIDフレーム中で搬送されたノイズパラメータ、即ち信号エネルギーゲインパラメータとスペクトルパラメータとが取得される。
【0033】
ステップ102において、取得されたノイズパラメータに基づいて、予測された方向にランダムに変化し、滑らかな曲線を有する連続ノイズパラメータが再構成されてもよい。ここで、連続ノイズパラメータは信号エネルギーゲインパラメータとスペクトルパラメータとを含んでいる。
【0034】
現フレーム、即ちノイズパラメータが現に再構成されようとしているフレームは、SIDフレームとNO_DATAフレームとを含む非音声フレームであってよい。
【0035】
再構成されるノイズパラメータが実際の値からあまり大きくかけ離れないようにするために、再構成ノイズパラメータの変化曲線に対する中心値を先ず第1に決め、再構成ノイズパラメータの値がその中心値の周りで浮動するようにする。この中心値を浮動中心Cと呼ぶ。その一方で、再構成ノイズパラメータの値がCを中心とするある範囲内に浮動するための浮動範囲を決めなければならない。この浮動範囲を、浮動半径Δと呼ぶ。
【0036】
この浮動半径Δを得るための様々な方法がある。本実施形態ではその内の2つを提供する。1つの方法によれば、浮動半径は、ノイズパラメータ増分dP、予想インタバル長length、及び現フレームと新しく受信したSIDフレームとの間の時間インタバルk、とによって得られてもよい。別の方法によれば、浮動半径はノイズパラメータ増分dPと、予想インタバル長length、とによって得られてもよい。
【0037】
第1の方法によって浮動半径Δが得られる場合には、現フレームのノイズパラメータに対する浮動半径Δは次式によって求めることができる。
【0038】
【数6】



【0039】
ここで、lengthは新規に受信したSIDフレームとその次のSIDフレームとの間の予想インタバル長である。つまり、次のSIDフレームが時間インタバルlengthの後に受信されるものと仮定する。
【0040】
現フレームが、音声フレームの次に復元器が受信した最初のSIDフレームである場合には、新しく受信したSIDフレームのノイズパラメータPsidか、バッファ中に格納されている以前のいくつかの音声フレームのエネルギーゲインパラメータ及びスペクトルパラメータ、を利用してノイズパラメータ増分dPが取得される。
【0041】
復元器が音声フレームの次に最初の非音声フレームを受信する場合には、いくつかの実施形態に従ってノイズパラメータ増分を取得する2つの方法が提供される。
【0042】
方法1:バッファ中に格納されたそれ以前のいくつかの音声フレームのエネルギーゲインパラメータとスペクトルパラメータが、再構成パラメータPrefの初期値として、以前の平均エネルギーゲインパラメータとスペクトルパラメータとを算出するのに用いられる。新規に受信されたノイズパラメータPsidと再構成パラメータPrefの初期値との間の差が、ノイズパラメータの増分dPとされる。この場合、ノイズパラメータの増分dPは、次式により求めることができる。
【0043】
【数7】



【0044】
再構成パラメータPrefの初期値の評価は変化するかもしれない。それ以前のいくつかのフレームのエネルギーゲインパラメータとスペクトルパラメータの平均値を、再構成パラメータPrefの初期値としてもよい。あるいは、それ以前のいくつかのフレームのエネルギーゲインパラメータとスペクトルパラメータの荷重平均値を、再構成パラメータPrefの初期値としてもよい。
【0045】
方法2:新規に受信したSIDフレームの中で搬送されてきたエネルギーゲインパラメータとスペクトルパラメータとを直接用いて、新規に受信したSIDフレームと次のSIDフレームとの間のノイズを再構成することができる。新規に受信したSIDフレームの次のSIDフレームを受信すると、ノイズパラメータの再構成が開始される。音声フレームの後の最初のSIDフレーム中に搬送されたエネルギーゲインパラメータとスペクトルパラメータが、再構成パラメータPrefの初期値として採用される。そして、新規に受信されたノイズパラメータPsidと再構成パラメータPrefの初期値との間の差が、ノイズパラメータ増分dPとされる。そうすると、ノイズパラメータの増分dPは、次式により求めることができる。
【0046】
【数8】



【0047】
現フレームが、最初のSIDフレームの後に受信されたSIDフレームであるか、最初のSIDフレームの後のNO_DATAフレームである場合には、ある実施形態により、ノイズパラメータ増分を得る2つの方法が提供される。
【0048】
方法1:新規に受信されたSIDフレームの前のフレームの再構成ノイズパラメータPk−1を、再構成パラメータPrefの初期値とし、新しく受信したSIDフレームのノイズパラメータPsidと再構成パラメータPrefの初期値との差を、ノイズパラメータ増分dPとする。そうすると、ノイズパラメータの増分dPは、次式により求めることができる。
【0049】
【数9】



【0050】
方法2:新規に受信したSIDフレームの中で搬送されてきたノイズパラメータと前のSIDフレーム中に搬送されてきたノイズパラメータとの差を、ノイズパラメータ増分dPとする。新規に受信したSIDフレームがn番目のフレームである例においては、ノイズパラメータ増分dPは次式で得られる。
【0051】
【数10】



【0052】
次のSIDフレームが受信される前に、2つのSIDフレームの間のNO_DATAフレームに対してノイズパラメータを再構成しなければならない場合には、新規に受信したSIDフレームに対するノイズパラメータ増分dPが、NO_DATAフレームに対する浮動半径Δを決定するために利用される。また、ノイズパラメータ増分dPは、新規のNO_DATAフレームに対してノイズが再構成されると必ず更新される。ある実施態様が、ノイズパラメータ増分dPを更新するための2つの方法を提供する。
【0053】
方法1:新規に受信されたSIDフレームのノイズパラメータPsidと再構成パラメータPrefの初期値との間の差がノイズパラメータの増分dPとされる。NO_DATAフレームに対してノイズパラメータが再構成される場合に、前のフレームに対する再構成ノイズパラメータPk−1が再構成パラメータPrefの初期値を更新するために利用される。その結果、再構成ノイズパラメータPrefの初期値を利用して得られるノイズパラメータ増分dPが更新される。
【0054】
方法2:新しく受信したSIDフレームのノイズパラメータと前のSIDフレーム中のノイズパラメータとの差をdとし、新しく受信したSIDフレームの前のフレームの再構成ノイズパラメータをPとし、現フレームが新しく受信したSIDフレームからk番目のフレームであり、現フレームのノイズパラメータ増分がdであるとする。現フレームのノイズパラメータ増分dは、再構成パラメータの初期値PrefとPとの差をdから差し引いて得られ、従ってd=dPとなる。そこでdは以下の式から得られる。
【0055】
【数11】



【0056】
NO_DATAフレームのノイズパラメータを再構成する場合、再構成パラメータPrefの初期値は前のフレームの再構成ノイズパラメータPk−1により更新される。その結果、再構成ノイズパラメータPrefの初期値を利用して得られるノイズパラメータ増分dが更新される。
【0057】
変化曲線の予想される方向は、浮動半径Δの値の方向でもある。浮動半径Δの値の方向は、ノイズパラメータ増分dPの影響を受ける。ノイズパラメータ増分dPが“+”の場合は、Δの値は“+”である。ノイズパラメータ増分dPが“−”の場合は、Δの値は“−”である。
【0058】
現フレームがSIDフレームであれば、kは“0”であり、
【0059】
【数12】



【0060】
【数13】



【0061】
となる。
【0062】
複数のNO_DATAフレームから成るNO_DATAセグメントの継続時間が長くなれば、値kもゆっくりと大きくなる。ノイズパラメータ増分dPが不変であれば、2(|k−length|+1)の値がゆっくりと小さくなり、kの値がゆっくりと大きくなる。
【0063】
k=lengthである場合、即ち現フレームが新しく受信したSIDフレームの後のlength番目のフレームである場合には、
【0064】
【数14】



【0065】
【数15】



【0066】
となる。
【0067】
そのフレームの後に新規のSIDフレームが受信されない場合には、kの値は増加し続ける。ノイズパラメータ増分dPが不変であれば、2(|k−length|+1)の値がゆっくりと大きくなり、Δの値がゆっくりと小さくなる。
【0068】
2つのSIDフレームの間のNO_DATAフレームのノイズパラメータが再
構成され、ノイズパラメータ増分dPが不変であれば、Δの値は、
【0069】
【数16】



【0070】
に等しい初期値を持ち、最大値dP/2を取って、その後次第に小さくなる。そのようにノイズパラメータ増分dPが変化すれば、Δの値はそれに応じて影響を受ける。
【0071】
第2の方法によって浮動半径Δが取得される場合には、現フレームのノイズパラ
メータの浮動半径Δは次式によって求めることができる。
【0072】
【数17】



【0073】
ノイズパラメータ増分dP及び予想インタバル長lengthを取得する方法は、浮動半径Δを得る上記の第1の方法と実質的に同じである。
【0074】
そのような場合、浮動半径Δの値の方向は、いまだノイズパラメータ増分dPの影響を受ける。ノイズパラメータ増分dPが“+”であれば、Δの値も“+”であり、ノイズパラメータ増分dPが“−”であれば、Δの値も“−”である。
【0075】
現フレームのノイズパラメータの浮動中心Cは、再構成パラメータPrefの初期値及び現フレームのノイズパラメータの浮動半径Δを通して得られる。浮動中心Cは次式から得られる。
【0076】
【数18】



【0077】
ここで再構成パラメータPrefの初期値は、ノイズパラメータが再構成される度に更新される。現行のノイズパラメータはPでありPrefはPk−1により更新されものとする。浮動中心Cは次のように表される。
【0078】
【数19】



【0079】
を中心とすると、この方法を用いて区間
【0080】
【数20】



【0081】
における1つのランダム値がきめられてて、現フレームのノイズパラメータPが再構成される。ノイズパラメータPは、次のように表される。
【0082】
【数21】



【0083】
現フレームがSIDフレームであり、Δ値が“+”である場合には、Cは前のフレームのノイズパラメータPk−1より大きく、
【0084】
【数22】



【0085】
の最小値は、
【0086】
【数23】



【0087】
で表される。
【0088】
【数24】

【0089】
の最小値はPk−1よりΔだけ大きい。第1の方法でΔを求めると、Δの初期値は
【0090】
【数25】



【0091】
に等しい。これはノイズ増分dPの
【0092】
【数26】



【0093】
倍である。これはノイズ増分dPに比べれば非常に小さい。従って、
【0094】
【数27】



【0095】
の最小値はPk−1より少し大きい値である。
【0096】
第2の方法でΔが得られる場合には、
【0097】
【数28】



【0098】
となる。Δの値はノイズパラメータ増分の
【0099】
【数29】



【0100】
倍である。これはノイズパラメータ増分dPに比較して大変小さい値である。従って、
【0101】
【数30】



【0102】
の最小値もまたPk−1より少し大きい値である。
【0103】
【数31】



【0104】
の最大値は、
【0105】
【数32】



【0106】
となる。
【0107】
【数33】



【0108】
の最大値はPk−1より3Δだけ大きい。Δが第1の方法で求められる場合、例としてlengthの値が“2”であるとすると、3Δの値はノイズパラメータ増分dPの1/2であり、これはノイズパラメータ増分dPよりもまだ小さい。言い換えると、
【0109】
【数34】



【0110】
の最大値はPk−1とノイズパラメータ増分dPとの和よりも小さい。
【0111】
Δが第2の方法で求められる場合、例としてlengthの値が“2”であるとすると、3Δの値はPsidとPk−1との差の3/4であり、これはノイズパラメータ増分dPよりもまだ小さい。言い換えると、
【0112】
【数35】



【0113】
の最大値はPk−1とノイズパラメータ増分dPとの和よりも小さい。更に、第2の方法は一般にSIDフレームが固定インタバルで送信される場合に適用される。この場合、lengthは通常“2”よりもはるかに大きく、従って、3Δは更に小さい。
【0114】
同様に、現フレームがSIDフレームであり、Δの値が“−”である場合、
【0115】
【数36】



【0116】
の最小値は新規に受信したSIDフレームのノイズパラメータPsidよりも大きい。そして最大値は、前のフレームのノイズパラメータPk−1よりもわずかに小さい。
【0117】
従って、現フレームがSIDフレームである場合には、区間
【0118】
【数37】



【0119】
の中のランダムな値を取るノイズパラメータPは、前のフレームのノイズパラメータPk−1に比較してわずかだけ変化するパラメータとなる。そのような変化は、新規に受信されたSIDフレームのノイズパラメータPsidによる影響を軽く受ける変化である。新しく受信したSIDフレームのノイズパラメータPsidが、前のフレームのノイズパラメータPk−1とは明らかに異なるとしても、Pは円滑な遷移を有する値である。Pから生成されるノイズもまた変化が軽微であり、ユーザにはよりよい使用感をもたらすであろう。
【0120】
現フレームがNO_DATAフレームである場合、再構成パラメータPrefの初期値は前のフレームの再構成ノイズパラメータPk−1である。浮動中心Cは、再構成パラメータPrefの初期値の影響を受け、浮動半径Δの値の方向に向かって円滑な変化をする。区間
【0121】
【数38】



【0122】
内のランダムな値を有するノイズパラメータPは、前のフレームのノイズパラメータPk−1に対して僅かに変化するパラメータである。2つのSIDフレーム間で再構成される連続的なノイズパラメータPは、滑らかな遷移をする値となる。Pから生成されるノイズもまた変化が軽微であり、ユーザにはよりよい使用感をもたらすであろう。
【0123】
更に、2つのSIDフレーム間の浮動半径Δは、kの値あるいはdPの値の影響を受けて変化するかもしれない。ランダムな値の範囲もまたそれに従って変化するであろう。2つのSIDフレーム間で再構成された連続的なノイズパラメータPは、よりランダムに変化する曲線となろう。Pから生成されるノイズもまたより違った変化をし、ユーザにはよりよい使用感をもたらすであろう。
【0124】
ある場合には、現フレームがNO_DATAフレームであって、再構成パラメータPrefの初期値が次にSIDフレームが来るまでは更新されない可能性がある。ランダムな値の範囲の変化は、浮動半径Δの変化に依存する。
【0125】
本実施形態においては、再構成パラメータPrefの初期値は、再構成された信号エネルギーゲインパラメータの初期値と再構成されたスペクトルパラメータの初期値とを含む。
【0126】
ステップ103において、再構成ノイズパラメータを用いてノイズが生成される。
【0127】
復号器はランダム系列発生器を用いて励起信号を合成する。ノイズが再構成される場合、励起信号は、例えば固定コードブックや適応コードブックに関連するパラメータなどの、通常の音声フレームに比べてSIDフレームに欠けているものと等価である。ノイズの共通性に基づいて、復号器はノイズ再構成のための励起信号合成にランダム系列発生器を利用する。
【0128】
励起信号と再構成ノイズパラメータとを利用するノイズ生成に2つの方法がある。
【0129】
第1の方法では、復号器が再構成ノイズパラメータのスペクトルパラメータを合成フィルタ係数に変換し、励起信号に対して合成フィルタリングを実行し、そうしてノイズ信号を得る。次に、再構成ノイズパラメータ中のエネルギーゲインパラメータを用いて合成ノイズ信号に時間領域形成を行う。後処理が施され、最終の再構成ノイズが出力される。
【0130】
第2の方法では、復号器が再構成ノイズパラメータ中のエネルギーゲインパラメータとランダム系列発生器を用いて励起信号を合成する。次に、再構成ノイズパラメータ中のスペクトルパラメータが合成フィルタ係数に変換される。合成フィルタリングが励起信号に適用されてノイズ信号が得られる。
【0131】
この実施形態においては、符号器に使用されるプロトコル標準に関する制約はない。本発明の技術的解決策は、符号器がSIDフレームを固定インタバルで伝送しても、あるいは適応インタバルで伝送しても、操作可能である。更に、新しいSIDフレームが受信される度に、ノイズパラメータ再構成が前のフレームの再構成ノイズパラメータと新しく受信したノイズパラメータとを参照する。こうして、生成されたノイズの遷移が自然であり、ユーザの聴取感がより良くなる。更には、実際のノイズパラメータの影響が参照されてユーザが近似的な音声環境を認識できるようにする。更に、NO_DATAフレームが処理される場合、NO_DATAフレームと直近SIDフレームとの間の距離と、直近SIDフレームのノイズパラメータの変化方向と、直近SIDフレームのノイズパラメータと再構成パラメータの初期値との間の差異とに基づいて、前のフレームとは少し変化したノイズパラメータがNO_DATAフレーム用に再構成される。こうして、再構成ノイズパラメータの変化曲線が滑らかになる。その結果、生成されたノイズのフレーム間での遷移が自然となり、ユーザの聴取感がより良くなる。
【0132】
本発明の実施形態2によるノイズ生成方法においては、符号器はSIDフレー
ムを適応インタバルで送信する。フローが図2に示される。
【0133】
ステップ201において、SIDフレームが受信され、そのSIDフレームで搬送されるノイズパラメータが取得される。
【0134】
音声通信が開始された後、復号器は受信したデータパケットからフレーム情報
を復号する。そして、フレームのフォーマットに関する決定が行われる。フレームが音声フレームである場合には、音声フレーム処理フローが開始される。フレームが、SIDフレームやNO_DATAフレームなどの非音声フレームである場合、本実施形態で提供されるノイズ生成方法のフローが開始される。
【0135】
非音声フレームが処理される場合、NO_DATAフレームには音声データが含まれていないので、この手順は直接ステップ202に進む。SIDフレームが受信されると、SIDフレーム中で搬送されたノイズパラメータ、即ち信号エネルギーゲインパラメータGsidとスペクトルパラメータlsfsidが取得される。
【0136】
ステップ202においては、再構成パラメータの初期値が取得される。
【0137】
フレームタイプが音声フレームから非音声フレームに変わったことを復号器が検出すると、即ち第1のSIDフレームを受信すると、バッファ中に格納されている前のNフレームのエネルギーゲインパラメータとスペクトルパラメータとを用いて、再構成パラメータの初期値として、平均エネルギーゲインパラメータGrefとスペクトルパラメータlsfrefを計算する。ここで、Nの値は0より大きい整数であり、例えばN=5である。その前のフレームは音声フレームかあるいはSIDフレームである。エネルギーゲインパラメータGrefの初期値の再構成、及びスペクトルパラメータlsfrefの初期値の再構成は、次式に従って得られる。
【0138】
【数39】



【0139】
【数40】



【0140】
受信したSIDフレームが最初のSIDフレームでない場合には、そのSIDフレームの前のフレームに対して再構成されたエネルギーゲインパラメータとスペクトルパラメータが、再構成パラメータの初期値として使用される。
【0141】
1つの実施形態に従って、ノイズパラメータがNO_DATAフレームに対して再構成される場合は、再構成パラメータの初期値が、前のフレームに対して再構成されたエネルギーゲインパラメータとスペクトルパラメータとを用いて更新される。又は、次のSIDフレームが来るまでは、再構成パラメータの初期値は更新されない。
【0142】
ステップ203において、ノイズパラメータが再構成される。
【0143】
音声セグメントからノイズセグメントへの遷移が生じると、つまり、音声フレームの次に最初のSIDフレームが受信されると、lengthの初期値がNに設定される。その後、別のSIDフレームが受信されると、直近のSIDフレームとその前のSIDフレームとの間のインタバルの長さが採用される。DTXの効率を保障するために、SIDフレームの伝送インタバルは一般には制限がある。即ち、lengthは自然数より大きいか等しくなければならない。例えば、プロトコルG729Bリリースでは、lengthは2より大きいか等しくなければならない、と規定されている。
【0144】
直近のSIDフレームから復号されたエネルギーゲインパラメータはGsidであり、スペクトルパラメータはlsfsidである。SIDフレームからk番目のフレームに対しては、次式に従ってエネルギーゲインパラメータのノイズパラメータ増分dk,Gが与えられる。
【0145】
【数41】



【0146】
そのエネルギーゲインパラメータの浮動半径Δは、次式により与えられる。
【0147】
【数42】



【0148】
そのスペクトルパラメータのノイズパラメータ増分dk,lsfは次のように表される。
【0149】
【数43】



【0150】
そのスペクトルパラメータの浮動半径Δlsfは次のように表される。
【0151】
【数44】



【0152】
ここで、Mはスペクトルパラメータの線形予測法の次数である。
【0153】
次に、現フレームの再構成ノイズパラメータ中の再構成エネルギーゲインパラメータの浮動中心CG,kが次式により与えられる。
【0154】
【数45】



【0155】
現フレームの再構成ノイズパラメータ中の再構成スペクトルパラメータの浮動中心Clsf,kが次式により与えられる。
【0156】
【数46】



【0157】
現フレームの再構成ノイズパラメータの中の再構成エネルギーゲインパラメータGが次式により与えられる。
【0158】
【数47】



【0159】
現フレームの再構成ノイズパラメータ中の再構成スペクトルパラメータlsfが次式により与えられる。
【0160】
【数48】



【0161】
ここで、関数rand(a,b)は区間[a,b]に均一に分散している値からランダムに1つの値を取り出すことを表している。
【0162】
新しいSIDが受信されると、関連する変数が以下のように更新される。
【0163】
【数49】



【0164】
【数50】



【0165】
【数51】



【0166】
そして、k=1である。
【0167】
NO_DATAフレームが受信されると、再構成パラメータの初期値が更新されて、次のようになる。
【0168】
【数52】



【0169】
【数53】



【0170】
再構成パラメータの初期値が更新され、k=k+1となる。
【0171】
フレームのノイズパラメータの再構成は、新しいSIDフレームが受信されるまで続く。
【0172】
ステップ204において、再構成ノイズパラメータを用いてノイズが生成される。
【0173】
ランダム系列を用いてホワイトノイズ励起信号e(n)が生成される。
【0174】
再構成スペクトルパラメータlsfは合成フィルタa(z)を形成するの
に用いられる。
【0175】
合成フィルタは、生成された励起信号:
【0176】
【数54】



【0177】
を合成フィルタリングするのに使用される。
【0178】
再構成エネルギーゲインパラメータGが、合成ノイズy(n)の時間領域形成に使用される。
【0179】
【数55】



【0180】
ここで、Nは復号器でコンフォートノイズが回復されるフレームの長さである。
【0181】
本実施形態においては、ステップ204では再構成ノイズパラメータを用いたノイズ生成方法、即ち、励起信号及び再構成ノイズパラメータを用いる、前述のノイズ生成の第1の方法、が使われる。
【0182】
この実施形態においては、符号器に使用されるプロトコル標準に関する制約はない。本発明の技術的解決策は、符号器がSIDフレームを固定インタバルで伝送しても、あるいは適応インタバルで伝送しても、操作可能である。更に、音声セグメントからノイズセグメントへの遷移が生じると、直近の音声セグメントの平均エネルギーゲインパラメータとスペクトルパラメータを初期値とし、新しく受信したノイズパラメータを参照して、ノイズパラメータが再構成される。こうして、音声セグメントからノイズセグメントへ変化が生じると、生成されたノイズと音声セグメントの遷移は自然であり、ユーザの聴取感がより良くなる。その一方で、実際のノイズパラメータの影響を参照することにより、ユーザが近似的な音声環境を認識できる。新しいSIDフレームが受信される度に、前のフレームの再構成ノイズパラメータを初期値とし、新しく受信したノイズパラメータを参照することにより、ノイズパラメータが再構成される。生成されたノイズの遷移はこのように自然であり、ユーザの聴取感がより良くなる。その一方でまた、実際のノイズパラメータの影響を参照することにより、ユーザが近似的な音声環境を認識できる。更に、NO_DATAフレームが処理される場合、再構成ノイズパラメータの変化曲線を滑らかとするために、NO_DATAフレームと直近のSIDフレームとの間の距離と、直近のSIDフレームのノイズパラメータの変化方向と、直近のSIDフレームのノイズパラメータと再構成パラメータの初期値との間の差異と、に基づいて、前のフレームとは少し変化したノイズパラメータがNO_DATAフレーム用に再構成される。こうして、生成されたノイズの遷移はフレーム間で自然であり、ユーザにはより良い聴取感がもたらされる。
【0183】
本発明の実施形態3によるノイズ生成方法においては、符号器はSIDフレームを固定インタバルで送信する。図3にフロー図が示される。
【0184】
ステップ301において、SIDフレームが受信され、そのSIDフレームで搬送されるノイズパラメータが取得される。
【0185】
音声通信が開始された後、復号器は受信したデータパケットからフレーム情報を復号する。そして、フレームのフォーマットに関する決定が行われる。フレームが音声フレームである場合には、音声フレーム処理フローが開始される。フレームが、SIDフレームやNO_DATAフレームなどの非音声フレームである場合、本実施形態で提供されるノイズ生成方法のフローが開始される。
【0186】
非音声フレームが処理される場合、NO_DATAフレームには音声データが含まれていないので、この手順は直接ステップ302に進む。SIDフレームが受信されると、SIDフレーム中で搬送されたノイズパラメータ、即ち信号エネルギーゲインパラメータGsid及びスペクトルパラメータlsfsidが取得される。
【0187】
ステップ302においては、再構成パラメータの初期値が取得される。
【0188】
符号器が、固定SIDフレームインタバルでSIDフレームを送信する。ここで、SIDフレームインタバルをLENGTHとする。LENGTHの値は0より大きい自然数である。
【0189】
フレームタイプが音声フレームから非音声フレームに変わったことを復号器が検出すると、即ち最初のSIDフレームを受信すると、受信したSIDフレームのノイズパラメータは後から来るLENGTHフレームの再構成ノイズパラメータとして利用することができ、再構成ノイズエネルギーゲインパラメータGrefとスペクトルパラメータlsfrefの初期値として利用される。エネルギーゲインパラメータGrefの初期値の再構成、及びスペクトルパラメータlsfrefの初期値の再構成は、以下のようになる。
【0190】
【数56】



【0191】
【数57】



【0192】
ステップ303において、ノイズパラメータが再構成される。
【0193】
ノイズパラメータの再構成が、第2のSIDフレームの受信で始まる。直近のSIDフレームから復号されたエネルギーゲインパラメータはGsidであり、スペクトルパラメータはlsfsidである。SIDフレームからk番目のフレームに対しては、次式に従ってエネルギーゲインパラメータのノイズパラメータ増分dk,Gが与えられる。
【0194】
【数58】

【0195】
そのエネルギーゲインパラメータの浮動半径Δは、次式により与えられる。
【0196】
【数59】



【0197】
そのスペクトルパラメータのノイズパラメータ増分dk,lsfは次のように表される。
【0198】
【数60】



【0199】
そのスペクトルパラメータの浮動半径Δlsfは次のように表される。
【0200】
【数61】



【0201】
ここで、Mは形予測法の次数である。
【0202】
現フレームの再構成ノイズパラメータ中の再構成エネルギーゲインパラメータの浮動中心CG,kが次式により与えられる。
【0203】
【数62】



【0204】
現フレームの再構成ノイズパラメータ中の再構成スペクトルパラメータの浮動中心Clsf,kが次式により与えられる。
【0205】
【数63】



【0206】
現フレームの再構成ノイズパラメータ中の再構成エネルギーゲインパラメータGが次式により与えられる。
【0207】
【数64】

【0208】
現フレームの再構成ノイズパラメータ中の再構成スペクトルパラメータlsfが次式により与えられる。
【0209】
【数65】



【0210】
ここで、関数rand(a,b)は区間[a,b]に均一に分散している値からランダムに1つの値を取り出すことを表している。
【0211】
新しいSIDが受信されると、関連する変数が以下のように更新される。
【0212】
【数66】



【0213】
【数67】



【0214】
【数68】



【0215】
最後にk=1とする。
【0216】
NO_DATAフレームが受信されると、再構成パラメータの初期値が更新されて、次のようになる。
【0217】
【数69】



【0218】
【数70】



【0219】
再構成パラメータの初期値が更新され、k=k+1となる。
【0220】
フレームのノイズパラメータの再構成は、新しいSIDフレームが受信されるまで続く。
【0221】
ステップ304において、再構成ノイズパラメータを用いてノイズが生成される。
【0222】
ランダム系列発生器と再構成エネルギーゲインパラメータGを用いてホワイトノイズ励起信号e(n)が合成される。
【0223】
再構成スペクトルパラメータlsfは合成フィルタa(z)を形成するのに用いられる。
【0224】
生成された励起信号は合成フィルタで合成フィルタリングされてもよい。
【0225】
【数71】



【0226】
更に後フィルタリングを行った後、コンフォートノイズが復号器で回復される。
【0227】
本実施形態においては、ステップ304では再構成ノイズパラメータを用いたノイズ生成方法、即ち、励起信号及び再構成ノイズパラメータを用いる、前記のノイズ生成の第2の方法、が使われる。
【0228】
この実施形態においては、符号器に使用されるプロトコル標準に関する制約はない。符号器がSIDフレームを固定インタバルで伝送しても、あるいは適応インタバルで伝送しても、エネルギーゲインパラメータ、スペクトルパラメータなどを含む、滑らかなノイズパラメータが再構成される。そうして、自然なコンフォートノイズが生成される。
【0229】
音声セグメントからノイズセグメントへの変化が生じると、新規に受信したSIDフレームのノイズパラメータが、最初のSIDフレームとその次のSIDフレームとの間のノイズ生成に利用される。新しいSIDフレームが受信される度に、ノイズパラメータが再構成され、前のフレームの再構成ノイズパラメータを初期値とし、新しく受信したノイズパラメータを参照することにより、ノイズが生成される。音声セグメントからノイズセグメントへの変化が生じる場合、伝送されるSIDフレームは音声セグメントに非常に近接している。従って、新しく受信したSIDフレームのノイズパラメータが、最初のSIDフレームとその次のSIDフレームとの間のノイズ生成に直接利用される。音声セグメントからノイズセグメントへの遷移は自然なものとなる。2つのSIDフレーム間のインタバルは非常に短い。従ってノイズは短期間では変化せず、普通の人は聞いても気がつかない。従って、ユーザの聴取感がより良くなる。新しいSIDフレームが受信される度に、前のフレームの再構成ノイズパラメータを初期値とし、新しく受信したノイズパラメータを参照することにより、ノイズパラメータが再構成される。生成されたノイズの遷移は自然であり、ユーザの聴取感がより良くなる。その一方で、実際のノイズパラメータの影響を参照することにより、ユーザが近似的な音声環境を認識できる。更に、NO_DATAフレームが処理される場合、NO_DATAフレームと直近のSIDフレームとの間の距離と、直近のSIDフレームのノイズパラメータの変化方向と、直近のSIDフレームのノイズパラメータと再構成パラメータの初期値との間の差異と、に基づいて、前のフレームとは少し変化したノイズパラメータがNO_DATAフレームに対して再構成される。その結果再構成ノイズパラメータは滑らかな変化曲線となる。従って、生成されたノイズの遷移はフレーム間でより自然であり、ユーザの聴取感がより良くなる。
【0230】
本発明の実施形態4によるノイズ生成方法においては、符号器はSIDフレームを適応インタバルで送信する。図4にそのフロー図が示される。
【0231】
ステップ401において、SIDフレームが受信され、そのSIDフレームで搬送されるノイズパラメータが取得される。
【0232】
音声通信が開始された後、復号器は受信したデータパケットからフレーム情報を復号する。次に、フレームのフォーマットに関する決定が行われる。フレームが音声フレームである場合には、音声フレーム処理フローが開始される。フレームが、SIDフレームやNO_DATAフレームなどの非音声フレームである場合、本実施形態で提供されるノイズ生成方法のフローが開始される。
【0233】
非音声フレームが処理される場合、NO_DATAフレームには音声データが含まれていないので、この手順は直接ステップ402に進む。SIDフレームが受信されると、SIDフレーム中で搬送されたノイズパラメータ、即ち信号エネルギーゲインパラメータGsidとスペクトルパラメータlsfsidとが取得される。
【0234】
ステップ402においては、再構成パラメータの初期値が取得される。
【0235】
フレームタイプが音声フレームから非音声フレームに変わったことを復号器が検出すると、即ち最初のSIDフレームを受信すると、そのフレームから得られた信号エネルギーゲインパラメータをGsid(1)及びスペクトルパラメータをlsfsid(1)とする。エネルギーゲインパラメータGrefの初期値の再構成、及びスペクトルパラメータlsfrefの初期値の再構成は、次式に従って得られる。
【0236】
【数72】



【0237】
【数73】



【0238】
受信したSIDフレームが最初のSIDフレームでない場合には、そのSIDフレームの前のフレームに対して再構成されたエネルギーゲインパラメータとスペクトルパラメータが、再構成パラメータの初期値として使用される。
【0239】
この実施形態においては、ノイズパラメータがNO_DATAフレームに対して再構成される場合は、再構成パラメータの初期値が、前のフレームに対して再構成されたエネルギーゲインパラメータとスペクトルパラメータを用いて更新される。又は、次のSIDフレームが来るまでは、再構成パラメータの初期値は更新されない。
【0240】
ステップ403において、ノイズパラメータが再構成される。
【0241】
音声セグメントからノイズセグメントへの変化が生じると、つまり、音声フレームの次に最初のSIDフレームが受信されると、lengthの初期値がNに設定される。その後、別のSIDフレームが受信されると、直近のSIDフレームとその前のSIDフレームとの間のインタバルの長さが用いられる。DTXの効率を保障するために、SIDフレームの伝送間隔は一般には制限がある。即ち、lengthは自然数より大きいか等しくなければならない。例えば、プロトコルG729Bリリースでは、lengthは2より大きいか等しくなければならない、と規定されている。
【0242】
復号器により直近のSIDフレームから復号されるエネルギーゲインパラメータはGsid(n)であり、スペクトルパラメータはlsfsid(n),(n=1,2,・・)である、従って、
【0243】
【数74】



【0244】
【数75】



【0245】
となる。
【0246】
n番目のSIDフレームの後のk番目のフレームに対しては、そのエネルギーゲインパラメータのノイズパラメータ増分dk,Gは次のように表される。
【0247】
【数76】



【0248】
ここで、Grefはエネルギーゲインパラメータの再構成パラメータの初期値であり、Gは新しく受信したSIDフレームの前のフレームに対して再構成されたエネルギーゲインパラメータである。
【0249】
新しく受信したSIDフレームが最初のSIDフレームであれば、Gはバッファに格納されている、以前のNフレームのエネルギーゲインパラメータの荷重平均Gsid(0)である。Gsid(0)は次のように表される。
【0250】
【数77】



【0251】
ここで、wは荷重であり、
【0252】
【数78】



【0253】
である。
【0254】
そのエネルギーゲインパラメータの浮動半径Δは次のように表される。
【0255】
【数79】



【0256】
そのスペクトルパラメータのノイズパラメータ増分dk,lsfは次のように表される。
【0257】
【数80】



【0258】
ここで、lsfrefはスペクトルパラメータに対する再構成パラメータの初期値であり、lsfは新たに受信したSIDフレームの前のフレームに対して再構成されたスペクトルパラメータである。
【0259】
新しく受信したSIDフレームが最初のSIDフレームであれば、lsfは、バッファに格納されている、以前のNフレームに対するエネルギーゲインパラメータの荷重平均lsfsid(0)である。lsfsid(0)は次のように表される。
【0260】
【数81】



【0261】
ここで、wは荷重であり、
【0262】
【数82】



【0263】
である。
【0264】
そのスペクトルパラメータの浮動半径Δlsfは次のように表される。
【0265】
【数83】



【0266】
ここで、Mはスペクトルパラメータの線形予測法の次数である。
【0267】
現フレームの再構成ノイズパラメータ中の再構成エネルギーゲインパラメータの浮動中心CG,kが次式により与えられる。
【0268】
【数84】



【0269】
現フレームの再構成ノイズパラメータ中の再構成スペクトルパラメータの浮動中心Clsf,kが次式により与えられる。
【0270】
【数85】



【0271】
現フレームの再構成ノイズパラメータ中の再構成エネルギーゲインパラメータGが次のように表される。
【0272】
【数86】



【0273】
現フレームの再構成ノイズパラメータ中の再構成スペクトルパラメータlsfが次のように表される。
【0274】
【数87】



【0275】
ここで、関数rand(a,b)は区間[a,b]に均一に分散している値からランダムに1つの値を取り出すことを表している。
【0276】
新しいSIDフレームが受信されると、関連する変数が以下のように更新される。
【0277】
【数88】



【0278】
【数89】



【0279】
【数90】



【0280】
最後にk=1である。
【0281】
NO_DATAフレームが受信されると、再構成パラメータの初期値が更新されて、次のようになる。
【0282】
【数91】



【0283】
【数92】



【0284】
再構成パラメータの初期値が更新され、k=k+1となる。
【0285】
フレームのノイズパラメータの再構成は、新しいSIDフレームが受信されるま
で続く。
【0286】
ステップ404において、再構成ノイズパラメータを用いてノイズが生成される。
【0287】
ランダム系列を用いてホワイトノイズ励起信号e(n)が生成される。
【0288】
再構成スペクトルパラメータlsfは合成フィルタa(z)を形成するのに用いられる。
【0289】
合成フィルタは、生成された励起信号:
【0290】
【数93】



【0291】
をフィルタリングするのに使用される。
【0292】
次に、再構成エネルギーゲインパラメータGが、合成ノイズy(n)の時間領域形成に使用される。
【0293】
【数94】



【0294】
ここで、Nは復号器でコンフォートノイズが回復されるフレームの長さである。
【0295】
本実施形態においては、ステップ404で再構成ノイズパラメータを用いたノイズ生成方法、即ち、励起信号及び再構成ノイズパラメータを用いる前述のノイズ生成の第1の方法、が使われる。
【0296】
この実施形態においては、符号器で使用されるプロトコル標準に関する制約はない。符号器がSIDフレームを固定インタバルで伝送しても、あるいは適応インタバルで伝送しても、エネルギーゲインパラメータ、スペクトルパラメータなどを含む、滑らかなノイズパラメータが再構成される。そうして、自然なコンフォートノイズが生成される。
【0297】
音声セグメントからノイズセグメントへの遷移が生じると、新しく受信したフレームのノイズパラメータを初期値とし、新しく受信したノイズパラメータを参照することにより、ノイズパラメータが再構成される。音声セグメントからノイズセグメントへの変化が生じる場合、伝送されるSIDフレームは音声セグメントに非常に近接している。従って、新しく受信したSIDフレームのノイズパラメータが初期値として直接用いられてもよい。従って、音声セグメントからノイズセグメントへの遷移はより自然なものとなる。新しいSIDフレームが受信される度に、前のフレームの再構成ノイズパラメータが初期値とされる。ノイズパラメータの再構成には、新しく受信したノイズパラメータも参照される。こうして、生成されたノイズの遷移はより自然となり、ユーザの聴取感はより良いものになるであろう。その一方で、実際のノイズパラメータの影響を参照することにより、ユーザが近似的な音声環境を認識できる。更に、直近のSIDフレームと前のSIDフレームとの差、及び、再構成パラメータの初期値と直近のSIDフレームより前のフレームの再構成ノイズパラメータとの差、とに従って、再構成ノイズパラメータのランダム値範囲に更に影響を及ぼすノイズパラメータ増分が求められる。ノイズパラメータ増分による影響を受ける値域が、前のフレームに対して滑らかに変化する。この値域の範囲内でランダムな値を取る再構成ノイズパラメータは、それに応じた影響を受けて再構成ノイズパラメータの変化曲線が滑らかになる。こうして、フレーム間での生成ノイズの遷移がより自然となり、ユーザにはよりよい聴取感がもたらされる。
【0298】
本発明の実施形態で提供されるノイズ生成装置は、一般に復号器の中に配置される。ランダムな変化と滑らかな曲線を有するノイズパラメータは、少数のSIDフレームのノイズパラメータの使用を介して再構成され、ユーザにとって快適なノイズが回復される。
【0299】
当業者であれば、本発明の実施形態による上記の方法における、ステップのすべてあるいは一部は、関連するハードウェアに命令するプログラムで実行されてもよいことは理解されるであろう。プログラムはコンピュータ可読媒体に格納されてもよい。プログラムが実行される場合、上記の記憶媒体は読み出し専用メモリ(ROM)、磁気ディスク、光ディスク、等であってよい。
【0300】
本発明の実施形態で提供されるノイズ生成装置は、図5の構成であって、以下の部品を含んでよい。
【0301】
前もって得られたノイズパラメータに従って再構成パラメータの初期値を取得するための初期値ユニット5100、
再構成パラメータの初期値に基づいてランダムな値域を得るためのレンジユニット5200、
前記ランダム値域の中から再構成ノイズパラメータとして1つの値をランダムに取り出す再構成ユニット5300、 再構成ノイズパラメータを用いてノイズを合成するための合成ユニット5400。
【0302】
復号器はランダム系列発生器を用いて励起信号を合成する。ノイズが再構成される場合、励起信号は、例えば固定コードブックや適応コードブックに関連するパラメータなどの、通常の音声フレームに比べてSIDフレームに欠けているものと等価である。ノイズの共通性に基づいて、復号器はノイズ再構成のための励起信号合成にランダム系列発生器を利用する。
【0303】
合成ユニット5400はノイズ生成に、励起信号と再構成ノイズパラメータとを用いた2つの方法を利用する。
【0304】
第1の方法では、合成ユニット5400が再構成ノイズパラメータ中のスペクトルパラメータを合成フィルタ係数に変換し、励起信号に対して合成フィルタリングを実行し、そうしてノイズ信号を得る。次に、再構成ノイズパラメータ中のエネルギーゲインパラメータを用いて合成ノイズ信号に時間領域形成を行う。後処理が施され、最終の再構成ノイズが出力される。
【0305】
第2の方法では、合成ユニット5400が再構成ノイズパラメータ中のエネルギーゲインパラメータとランダム系列発生器を用いて励起信号を合成する。次に、再構成ノイズパラメータ中のスペクトルパラメータが合成フィルタ係数に変換される。合成フィルタリングが励起信号に適用されてノイズ信号が得られる。
【0306】
初期値ユニット5100は、第1の初期値ユニット5101と、所望により第2の初期値ユニット5102とを含む。
【0307】
第1の初期値ユニット5101は、第1のSIDフレームを受信すると、SIDフレームの前の所定数のフレームに対するノイズパラメータの平均値あるいは荷重平均値を再構成パラメータの初期値とするように構成されている。
【0308】
第2の初期値ユニット5102は、最初のSIDフレームの受信した後にSIDフレームを受信すると、新規に受信したSIDフレーム以前のフレームに対する再構成ノイズパラメータを、再構成ノイズパラメータの初期値とするか、NO_DATAフレームに対してノイズパラメータを再構成する場合に、NO_DATAフレームの前のフレームに対する再構成ノイズパラメータを再構成ノイズパラメータの初期値とする、ように構成されている。
【0309】
レンジユニット5200は、
SIDフレームから取得されたノイズパラメータに基づいてノイズパラメータ増分を取得するように構成された増分ユニット5210と、
予想インタバル長を取得するように構成されたインタバル取得ユニット5220と、
予想インタバル長とノイズパラメータ増分とに基づいて浮動半径を取得するように構成された半径取得ユニット5230と、
再構成パラメータの初期値と浮動半径とに基づいて浮動中心を取得するように構成された中心取得ユニットと、
浮動中心をランダム値域の中心とし、浮動半径をランダム値域の半径とすることにより、ランダム値域を決定するように構成された操作ユニット5240と、を含む。
【0310】
増分ユニット5210は第1の増分ユニット5211か、第2の増分ユニット5212か、あるいは第3の増分ユニット5213か、を含んでよい。
【0311】
第1の増分ユニット5211は、新規に取得されたSIDフレームから得られるノイズパラメータと、再構成パラメータの初期値との差をノイズパラメータ増分とするように構成される。
【0312】
第2の増分ユニット5212は、新規に取得されたSIDフレームから得られるノイズパラメータと、以前のSIDフレームから得られるノイズパラメータとの差をノイズパラメータ増分とするように構成される。
【0313】
第3の増分ユニット5213は、新規に取得されたSIDフレームから得られるノイズパラメータと以前のSIDフレームから得られるノイズパラメータとの差と、再構成パラメータの初期値と新規に取得されたSIDフレームより前のフレームの再構成ノイズパラメータとの差と、の両者の差を、ノイズパラメータ増分とするように構成される。
【0314】
半径取得ユニット5230は、第1の半径取得ユニット5231、あるいは第2の半径取得ユニット5232を含んでよい。
【0315】
第1の半径取得ユニット5231は、ノイズパラメータ増分を予想インタバル長の2倍で割ることにより浮動半径を取得するように構成される。
【0316】
第2の半径取得ユニット5232は、ノイズパラメータ増分と、予想インタバル長と、現フレームと新しく受信したSIDフレームとの間の距離と、に基づいて浮動半径を取得するように構成される。
【0317】
インタバル取得ユニット5220は、第1のインタバル取得ユニット5221又は第2のインタバル取得ユニット5222と、所望により第3のインタバル取得ユニット5223とを含んでよい。
【0318】
第1のインタバル取得ユニット5221は、最初のSIDフレームを受信すると所定の値をインタバル長とするように構成される。
【0319】
第2のインタバル取得ユニット5222は、最初のSIDフレームを受信すると、システムにより設定される伝送音声挿入記述子フレームインタバルをインタバル長とするように構成される。
【0320】
第3のインタバル取得ユニット5223は、最初のSIDフレームを受信した後に任意のSIDフレームを受信するか、ノイズパラメータをNO_DATAフレームに対して再構成するか、のいずれかの場合に、新しく受信したSIDフレームとその前に受信したSIDフレームとの間のインタバル長を予想インタバル長とするように構成される。
【0321】
本発明の実施形態で提供されるノイズ生成装置の操作方法は、本発明の実施形態で提供される上記のノイズ生成法と実質的に同一であり、ここでは繰り返し説明しない。
【0322】
この実施形態においては、符号器に使用されるプロトコル標準に関する制約はない。本発明の技術的解決策は、符号器がSIDフレームを固定インタバルで伝送しても、あるいは適応インタバルで伝送しても、操作可能である。更に、新しいSIDフレームが受信される度に、ノイズパラメータ再構成が前のフレームの再構成ノイズパラメータと新しく受信したノイズパラメータとを参照する。こうして、生成されたノイズの遷移がより自然となり、ユーザにはよりよい聴取感がもたらされる。更には、実際のノイズパラメータの影響が参照されてユーザが近似的な音声環境を認識できるようにする。更に、NO_DATAフレームが処理される場合、NO_DATAフレームと直近SIDフレームとの間の距離と、直近SIDフレームのノイズパラメータの変化方向と、直近SIDフレームのノイズパラメータと再構成パラメータの初期値との間の差異と、に基づいて、前のフレームから少し変化したノイズパラメータがNO_DATAフレームに対して再構成される。こうして、再構成ノイズパラメータの変化曲線が滑らかになる。その結果、フレーム間での生成されたノイズの遷移がより自然であり、ユーザにはよりよい聴取感がもたらされる。
【0323】
以上、本発明で提供されるノイズ生成の装置及び方法について、詳細な説明を行った。ある特定の例示的実施形態を用いて本発明の原理及び実行を説明した。これは単に、本発明の方法及び基本概念の理解に資するためだけのものである。当業者にとっては、本発明の範囲から逸脱することなしに種々の変更が可能である。従って、上記の記述は本発明の範囲を制限するものと見なすべきではない。

【特許請求の範囲】
【請求項1】
再構成パラメータの初期値を取得し、
前記再構成パラメータの前記初期値に基づいてランダムな値域を決定し、
前記ランダムな値域の中から再構成ノイズパラメータとして1つの値をランダムに取り出し、
前記再構成ノイズパラメータを用いてノイズを生成する、
ことを含む、ノイズ生成方法。
【請求項2】
前記再構成パラメータの前記初期値を取得するプロセスが、
最初の無音挿入記述子(SID)フレームを受信すると、前記最初のSIDの前の所定数のフレームに対するノイズパラメータの平均値あるいは荷重平均値を前記再構成パラメータの前記初期値とする、
ことを含む、請求項1に記載のノイズ生成方法。
【請求項3】
前記再構成パラメータの前記初期値を取得する前記プロセスが、
前記最初のSIDフレームを受信した後に任意のSIDフレームを受信すると、新たに受信したSIDフレームの前のフレームに対する前記再構成ノイズパラメータを、前記再構成パラメータの前記初期値とするか、又は
NO_DATAフレームに対してノイズパラメータが再構成される場合に、前記NO_DATAフレームの前のフレームに対する前記再構成ノイズパラメータを、前記再構成パラメータの前記初期値とする、
ことを含む、請求項1に記載のノイズ生成方法。
【請求項4】
前記再構成パラメータの前記初期値に基づいて前記ランダム値域を決定するプロセスが、
SIDフレームから取得したノイズパラメータに基づいてノイズパラメータ増分を決定し、
予想インタバル長を決定し、かつ前記予想インタバル長と前記ノイズパラメータ増分とに基づいて浮動半径を決定し、
前記再構成パラメータの前記初期値と前記浮動半径とに基づいて浮動中心を決定し、
前記浮動中心を前記ランダム値域の中心とし、前記浮動半径を前記ランダム値域の半径とすることにより、前記ランダム値域を決定する、
ことを含む、請求項1〜請求項3の何れか1項に記載のノイズ生成方法。
【請求項5】
前記再構成パラメータの前記初期値と前記浮動半径とに基づいて前記浮動中心を決定するプロセスが、
前記再構成パラメータの前記初期値と前記浮動半径の2倍との合計を前記浮動中心とする、
ことを含む、請求項4に記載のノイズ生成方法。
【請求項6】
前記SIDフレームから得られた前記ノイズパラメータに基づいて前記ノイズパラメータ増分を決定するプロセスが、
新たに取得されたSIDフレームから得られるノイズパラメータと、前記再構成パラメータの前記初期値との差を前記ノイズパラメータ増分とするか、
新たに取得されたSIDフレームから得られるノイズパラメータと、以前のSIDフレームから得られるノイズパラメータとの差を前記ノイズパラメータ増分とするか、又は
新たに取得されたSIDフレームから得られるノイズパラメータと以前のSIDフレームから得られるノイズパラメータとの差と、前記再構成パラメータの前記初期値と新たに取得されたSIDフレームより前のフレームの前記再構成ノイズパラメータとの差とを、前記ノイズパラメータ増分とする、
ことを含む、請求項4に記載のノイズ生成方法。
【請求項7】
前記予想インタバル長と前記ノイズパラメータ増分とに基づいて前記浮動半径を決定するプロセスが、
【数1】



を前記浮動半径とするか、又は
【数2】



を前記浮動半径とする、
ことを含み、
ここで、dPは前記ノイズパラメータ増分であり、lengthは前記予想インタバル長であり、kは現フレームと前記新たに受信したSIDフレームとの間の距離である、
請求項4に記載のノイズ生成方法。
【請求項8】
前記予想インタバル長を決定するプロセスが、
最初のSIDフレームを受信すると、前記予想インタバル長として所定の値を取るか、又は
システムにより設定された無音挿入記述子フレームインタバルを前記予想インタバル長とする、
ことを含む、請求項4に記載のノイズ生成方法。
【請求項9】
前記予想インタバル長を決定する前記プロセスが、
前記最初のSIDフレームを受信した後に任意のSIDフレームを受信するか、又はNO_DATAフレームに対して前記ノイズパラメータを再構成する場合に、前記新しく受信したSIDフレームと以前に受信したSIDフレームとの間のインタバル長を前記予想インタバル長とする、
ことを更に含む、請求項8に記載のノイズ生成方法。
【請求項10】
前記ノイズパラメータは、エネルギーパラメータとスペクトルパラメータとを含む、請求項1〜請求項9の何れか1項に記載のノイズ生成方法。
【請求項11】
再構成パラメータの初期値を取得するための初期値ユニットと、
前記再構成パラメータの前記初期値に基づいてランダムな値域を決定するためのレンジユニットと、
前記ランダム値域の中から再構成ノイズパラメータとして1つの値をランダムに取り出す再構成ユニットと、
前記再構成ノイズパラメータを用いてノイズを生成するための合成ユニットと、
を備える、ノイズ生成装置。
【請求項12】
前記初期値ユニットは、
最初のSIDフレームを受信すると、前記SIDフレームの前の所定数のフレームに対する前記ノイズパラメータの平均値あるいは荷重平均値を前記再構成パラメータの前記初期値とするように構成された第1の初期値ユニット、
を含む、請求項11に記載のノイズ生成装置。
【請求項13】
前記初期値ユニットは、
前記最初のSIDフレームを受信した後に任意のSIDフレームを受信すると、前記の新たに受信したSIDフレームより前のフレームに対する前記再構成ノイズパラメータを、前記再構成パラメータの前記初期値とするか、又は
NO_DATAフレームに対してノイズパラメータを再構成する場合に、前記NO_DATAフレームの前のフレームに対する前記再構成ノイズパラメータを前記再構成パラメータの前記初期値とする、
ように構成された第2の初期値ユニットを更に備える、
請求項12に記載のノイズ生成装置。
【請求項14】
前記レンジユニットは、
SIDフレームから取得されたノイズパラメータに基づいてノイズパラメータ増分を決定するように構成された増分ユニットと、
予想インタバル長を決定するように構成されたインタバル取得ユニットと、
前記予想インタバル長と前記ノイズパラメータ増分とに基づいて浮動半径を決定するように構成された半径取得ユニットと、
前記再構成パラメータの前記初期値と前記浮動半径とに基づいて浮動中心を決定するように構成された中心取得ユニットと、
前記浮動中心を前記ランダムな値域の中心とし、前記浮動半径を前記ランダム値域の半径とすることにより、前記ランダム値域を決定するように構成された操作ユニットと、
を含む、請求項11〜請求項13の何れか1項に記載のノイズ生成装置。
【請求項15】
前記増分ユニットは、
新たに取得されたSIDフレームから得られるノイズパラメータと、前記再構成パラメータの前記初期値との差を前記ノイズパラメータ増分とするように構成された第1の増分ユニット、
新たに取得されたSIDフレームから得られるノイズパラメータと、以前のSIDフレームから得られるノイズパラメータとの差を前記ノイズパラメータ増分とするように構成された第2の増分ユニット、又は
新たに取得されたSIDフレームから得られるノイズパラメータと以前のSIDフレームから得られるノイズパラメータとの差と、前記再構成パラメータの前記初期値と新たに取得されたSIDフレームより前のフレームに対する前記再構成ノイズパラメータとの差と、の両者の差を、前記ノイズパラメータ増分とするように構成された第3の増分ユニット
を備える、請求項14に記載のノイズ生成装置。
【請求項16】
前記半径取得ユニットは、
前記ノイズパラメータ増分を前記予想インタバル長の2倍で割ることにより前記浮動半径を得るように構成された第1の半径取得ユニット、又は
前記ノイズパラメータ増分と、前記予想インタバル長と、前記現フレームと前記新しく受信したSIDフレームとの間の前記距離と、に基づいて、前記浮動半径を得るように構成された第2の半径取得ユニット
を備える、請求項14に記載のノイズ生成装置。
【請求項17】
前記インタバル取得ユニットは、
最初のSIDフレームを受信すると、所定の値を前記インタバル長とするように構成された第1のインタバル取得ユニット、又は最初のSIDフレームを受信すると、システムにより設定される伝送音声挿入記述子フレームインタバルを前記インタバル長とするように構成された第2のインタバル取得ユニット
を備える、請求項14に記載のノイズ生成装置。
【請求項18】
前記インタバル取得ユニットは、
前記最初のSIDフレームを受信した後に任意のSIDフレームを受信するか、又はNO_DATAフレームに対して前記ノイズパラメータを再構成するかした場合に、新たに受信したSIDフレームとその前に受信したSIDフレームとの間の前記インタバル長を前記予想インタバル長とするように構成された第3のインタバル取得ユニットを、
更に含む、請求項17に記載のノイズ生成装置。
【請求項19】
請求項1〜請求項10の何れか1項に記載の方法を実行するためのプログラムを格納したコンピュータ可読記録媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公開番号】特開2012−247810(P2012−247810A)
【公開日】平成24年12月13日(2012.12.13)
【国際特許分類】
【出願番号】特願2012−206602(P2012−206602)
【出願日】平成24年9月20日(2012.9.20)
【分割の表示】特願2010−526136(P2010−526136)の分割
【原出願日】平成20年9月25日(2008.9.25)
【出願人】(503433420)華為技術有限公司 (107)
【氏名又は名称原語表記】HUAWEI TECHNOLOGIES CO.,LTD.
【住所又は居所原語表記】Huawei Administration Building, Bantian Longgang District, Shenzhen 518129 P.R. China