説明

音声信号の切り替えの方法およびデバイス

音声信号の切り替えの方法およびデバイスが提示される。音声信号の切り替えの方法は、音声信号が切り替わったとき、現在のフレームの音声信号の第1高周波数帯域信号および以前のM個のフレームの音声信号の第2高周波数帯域信号に対してウェイト付け処理を実行して、処理済み第1高周波数帯域信号を取得するステップ(101)と、処理済み第1高周波数帯域信号および現在のフレームの音声信号の第1低周波数帯域信号を広帯域信号に合成するステップ(102)とを含む。

【発明の詳細な説明】
【技術分野】
【0001】
本出願は、その全体が参照により本明細書に組み込まれる、2010年4月28日に出願された「METHOD AND APPARATUS FOR SWITCHING SPEECH OR AUDIO SIGNALS」と題する中国特許出願第201010163406.3号の優先権を主張する。
【0002】
本発明は、通信技術に関し、特に音声信号を切り替えるための方法および装置に関する。
【背景技術】
【0003】
現在、ネットワーク上における音声信号の送信の処理中に、ネットワーク状態が異なりうることから、ネットワークは様々なビットレートでエンコーダからネットワークに送信される音声信号のビットストリームをインターセプトすることがあり、その結果デコーダは、インターセプトされたビットストリームから様々な帯域幅を有する音声信号を復号することがある。
【0004】
従来技術では、ネットワーク上で送信される音声信号は様々な帯域幅を有するため、狭周波数帯域音声信号と広周波数帯域音声信号との間の双方向の切り替えが音声信号の送信処理中に生じることがある。本発明の実施形態では、狭周波数帯域信号は、アップサンプリングおよびローパスフィルタ処理により低周波数帯域要素のみを有する広周波数帯域信号に切り替えられる。広周波数帯域音声信号は、低周波数帯域信号要素および高周波数帯域信号要素の両方を含む。
【発明の概要】
【発明が解決しようとする課題】
【0005】
本発明の実施中に、本発明者は、従来技術における少なくとも以下の問題を発見している。高周波数帯域信号情報は、広周波数帯域音声信号で入手できるが、狭周波数帯域音声信号では存在しないため、様々な帯域幅を有する音声信号が切り替えられたとき、音声信号においてエネルギーの急変が生じて聞き心地が悪くなり、結果的にユーザが受信する音声信号の品質が低下することがある。
【課題を解決するための手段】
【0006】
本発明の実施形態は、様々な帯域幅の間で音声信号を円滑に切り替え、それによりユーザが受信する音声信号の品質を改善する、音声信号を切り替えるための方法および装置を提示する。
【0007】
音声信号を切り替えるための方法は以下を含む。
音声信号の切り替えが生じたとき、現在の音声信号のフレームの第1高周波数帯域信号および以前のM(Mは1以上)個の音声信号のフレームの第2高周波数帯域信号をウェイト付けして、処理済み第1高周波数帯域信号を取得するステップ、および
処理済み第1高周波数帯域信号および現在の音声信号のフレームの第1低周波数帯域信号を広周波数帯域信号に合成するステップ。
【0008】
音声信号を切り替えるための装置は以下を含む。
音声信号の切り替えが生じたとき、現在の音声信号のフレームの第1高周波数帯域信号および以前のM(Mは1以上)個の音声信号のフレームの第2高周波数帯域信号をウェイト付けして、処理済み第1高周波数帯域信号を取得するように構成された処理モジュール、および
処理済み第1高周波数帯域信号および現在の音声信号のフレームの第1低周波数帯域信号を広周波数帯域信号に合成するように構成された第1合成モジュール。
【0009】
本発明の実施形態における音声信号を切り替えるための方法および装置を使用することによって、現在の音声信号のフレームの第1高周波数帯域信号は、以前のM個の音声信号のフレームの第2高周波数帯域信号に従って処理され、その結果、以前のM個の音声信号のフレームの第2高周波数帯域信号を処理済み第1高周波数帯域信号に円滑に切り替えることができ、処理済み第1高周波数帯域信号および第1低周波数帯域信号は広周波数帯域信号に合成される。このようにして、様々な帯域幅を有する音声信号間の切り替えの処理中に、こうした音声信号を円滑に切り替えることができ、それによりエネルギーの急変が音声信号の主観的音声品質に及ぼす悪影響を減らし、ユーザが受信する音声信号の品質を改善することができる。
【0010】
本発明の技術的解決策を明確化するため、本発明の実施形態を示す添付の図面について以下に概説する。見かけ上、添付の図面は例にすぎず、当業者は創造的努力なしにかかる添付の図面から他の図面を導出できよう。
【図面の簡単な説明】
【0011】
【図1】音声信号を切り替えるための方法の第1実施形態の流れ図である。
【図2】音声信号を切り替えるための方法の第2実施形態の流れ図である。
【図3】図2に示すステップ201の実施形態の流れ図である。
【図4】図3に示すステップ302の実施形態の流れ図である。
【図5】図3に示すステップ302の別の実施形態の第2流れ図である。
【図6】図2に示すステップ202の実施形態の流れ図である。
【図7】図2に示すステップ201の別の実施形態の第2流れ図である。
【図8】図2に示すステップ201の別の実施形態の第3流れ図である。
【図9】音声信号を切り替えるための装置の第1実施形態の構造を示す図である。
【図10】音声信号を切り替えるための装置の第2実施形態の構造を示す図である。
【図11】音声信号を切り替えるための装置の第2実施形態における処理モジュールの構造を示す第1概略図である。
【図12】音声信号を切り替えるための装置の第2実施形態における第1モジュールの構造を示す概略図である。
【図13a】音声信号を切り替えるための装置の第2実施形態における処理モジュールの構造を示す第2概略図である。
【図13b】音声信号を切り替えるための装置の第2実施形態における処理モジュールの構造を示す第3概略図である。
【発明を実施するための形態】
【0012】
本発明の目的、技術的解決策および利点を理解しやすくするため、以下では、実施形態および添付の図面を参照して本発明について詳述する。見かけ上、実施形態は例にすぎず、本発明はかかる実施形態に限定されない。当業者は著しい創造的努力を払うことなく本明細書で与えられる実施形態から他の実施形態を導出することができ、かかる実施形態はすべて本明細書の範囲内に入る。
【0013】
図1は、音声信号を切り替えるための方法の第1実施形態の流れ図である。図1に示すように、音声信号を切り替えるための方法を使用することにより、音声の切り替えが生じたときに、切り替えフレームより後の各フレームが以下のステップに従い処理される。
【0014】
ステップ101:音声の切り替えが生じたとき、現在の音声信号のフレームの第1高周波数帯域信号および以前のM(Mは1以上)個の音声信号のフレームの第2高周波数帯域信号をウェイト付けして、処理済み第1高周波数帯域信号を取得する。
【0015】
ステップ102:処理済み第1高周波数帯域信号および現在の音声信号のフレームの第1低周波数帯域信号を広周波数帯域信号に合成する。
【0016】
この実施形態では、以前のM個の音声信号のフレームは、現在のフレームより前のM個の音声信号のフレームを指す。切り替え前のL個の音声信号のフレームは、音声の切り替えが生じたときの切り替えフレームより前のL個の音声信号のフレームを指す。現在の音声フレームは広周波数帯域信号であるが、以前の音声フレームは狭周波数帯域信号である場合、または現在の音声フレームは狭周波数帯域信号であるが、以前の音声フレームは広周波数帯域信号である場合、音声信号は切り替えされ、現在の音声フレームは切り替えフレームである。
【0017】
この実施形態における音声信号を切り替えるための方法を使用することによって、現在の音声信号のフレームの第1高周波数帯域信号が、以前のM個の音声信号のフレームの第2高周波数帯域信号に従って処理され、その結果、以前のM個の音声信号のフレームの第2高周波数帯域信号を処理済み第1高周波数帯域信号に円滑に切り替えることができる。このようにして、様々な帯域幅を有する音声信号間の切り替えの処理中に、こうした音声信号の高周波数帯域信号を円滑に切り替えることができる。最後に、処理済み第1高周波数帯域信号および第1低周波数帯域信号は広周波数帯域信号に合成され、広周波数帯域信号はユーザ端末に送信され、その結果、ユーザは高品質の音声信号を享受することができる。この実施形態における音声信号を切り替えるための方法を使用することによって、様々な帯域幅を有する音声信号を円滑に切り替えることができ、それによりエネルギーの急変が音声信号の主観的音声品質に及ぼす影響を減らし、ユーザが受信する音声信号の品質を改善することができる。
【0018】
図2は、音声信号を切り替えるための方法の第2実施形態の流れ図である。図2に示すように、本方法は以下のステップを含む。
【0019】
ステップ200:音声信号の切り替えが生じていないとき、現在の音声信号のフレームの第1高周波数帯域信号および第1低周波数帯域信号を広周波数帯域信号に合成する。
【0020】
具体的には、この実施形態における第1周波数帯域音声信号は、広周波数帯域音声信号または狭周波数帯域音声信号でありうる。第1周波数帯域音声信号が音声信号の送信中に切り替えられていないとき、以下の2つのケースに従ってオペレーションを実行できる。1.第1周波数帯域音声信号が広周波数帯域音声信号である場合、広周波数帯域音声信号の低周波数帯域信号および高周波数帯域信号が広周波数帯域信号に合成される。2.第1周波数帯域音声信号が狭周波数帯域音声信号である場合、狭周波数帯域音声信号の低周波数帯域信号および高周波数帯域信号が広周波数帯域信号に合成される。この場合、信号は広周波数帯域信号であるが、高周波数帯域はヌルである。
【0021】
ステップ201:音声信号が切り替えられたとき、現在の音声信号のフレームの第1高周波数帯域信号および以前のM個の音声信号のフレームの第2高周波数帯域信号をウェイト付けして、処理済み第1高周波数帯域信号を取得する。Mは1以上である。
【0022】
具体的には、様々な帯域幅を有する音声信号間で切り替えが生じたとき、現在の音声信号のフレームの第1高周波数帯域信号が、以前のM個の音声信号のフレームの第2高周波数帯域信号に従って処理され、その結果、以前のM個の音声信号のフレームの第2高周波数帯域信号を処理済み第1高周波数帯域信号に円滑に切り替えることができる。例えば、広周波数帯域音声信号が狭周波数帯域音声信号に切り替えられたとき、狭周波数帯域音声信号に対応する高周波数帯域信号情報がヌルであるため、狭周波数帯域音声信号に対応する高周波数帯域信号の要素を復元して、広周波数帯域音声信号を狭周波数帯域音声信号に円滑に切り替えられるようにする必要がある。一方、狭周波数帯域音声信号が広周波数帯域音声信号に切り替えられたとき、広周波数帯域音声信号の高周波数帯域信号はヌルでないため、切り替え後の連続する複数のフレームの広周波数帯域音声信号の高周波数帯域信号のエネルギーを弱めて、狭周波数帯域音声信号を広周波数帯域音声信号に円滑に切り替えることを可能にし、その結果、広周波数帯域音声信号の高周波数帯域信号が真の高周波数帯域信号に徐々に切り替えられるようにしなければならない。ステップ201で現在の音声信号のフレームを処理することによって、様々な帯域幅を有する音声信号の高周波数帯域信号を円滑に切り替えることができ、広周波数帯域音声信号と狭周波数帯域音声信号との間の切り替えの処理中におけるエネルギーの急変に起因するユーザの聞き心地の悪さが回避され、ユーザは高品質の音声信号を受信することができる。処理済み第1高周波数帯域信号を取得する処理を単純化するため、第1高周波数帯域信号および以前のM個の音声信号のフレームの第2高周波数帯域信号は直接的にウェイト付けできる。ウェイト付け結果は、処理済み第1高周波数帯域信号である。
【0023】
ステップ202:処理済み第1高周波数帯域信号および現在の音声信号のフレームの第1低周波数帯域信号を広周波数帯域信号に合成する。
【0024】
具体的には、ステップ201で現在の音声信号のフレームが処理された後、以前のM個の音声信号のフレームの第2高周波数帯域信号を、現在のフレームの処理済み第1高周波数帯域信号に円滑に切り替えることができ、次いでステップ202で、処理済み第1高周波数帯域信号および現在の音声信号のフレームの第1低周波数帯域信号が広周波数帯域信号に合成されて、その結果、ユーザが受信する音声信号は常に広周波数帯域音声信号となる。このようにして、様々な帯域幅を有する音声信号は円滑に切り替えられ、これはユーザが受信する音声信号の品質改善に寄与する。
【0025】
この実施形態における音声信号を切り替えるための方法を使用することによって、現在の音声信号のフレームの第1高周波数帯域信号が、以前のM個の音声信号のフレームの第2高周波数帯域信号に従って処理され、その結果、以前のM個の音声信号のフレームの第2高周波数帯域信号を処理済み第1高周波数帯域信号に円滑に切り替えることができる。このようにして、様々な帯域幅を有する音声信号間の切り替えの処理中に、こうした音声信号の高周波数帯域信号を円滑に切り替えることができる。最後に、処理済み第1高周波数帯域信号および第1低周波数帯域信号は広周波数帯域信号に合成され、広周波数帯域信号はユーザ端末に送信され、その結果、ユーザは高品質の音声信号を享受することができる。この実施形態における音声信号を切り替えるための方法を使用することによって、様々な帯域幅を有する音声信号を円滑に切り替えることができ、それによりエネルギーの急変が音声信号の主観的音声品質に及ぼす影響を減らし、ユーザが受信する音声信号の品質を改善することができる。加えて、様々な帯域幅を有する音声信号が切り替えられていないとき、現在の音声信号のフレームの第1高周波数帯域信号および第1低周波数帯域信号が広周波数帯域信号に合成され、その結果、ユーザは高品質の音声信号を取得することができる。
【0026】
上述の技術的解決策によれば、随意に、図3に示すように、広周波数帯域音声信号から狭周波数帯域音声信号への切り替えが生じたとき、ステップ201は以下のステップを含む。
【0027】
ステップ301:第1高周波数帯域信号に対応する微細構造情報およびエンベロープ情報を予測する。
【0028】
具体的には、音声信号を微細構造情報およびエンベロープ情報に分割することができ、その結果、微細構造情報およびエンベロープ情報に従って音声信号を復元することができる。広周波数帯域音声信号から狭周波数帯域音声信号への切り替えの処理において、低周波数帯域信号のみが狭周波数帯域音声信号で入手でき、高周波数帯域信号はヌルであるため、広周波数帯域音声信号を狭周波数帯域音声信号に円滑に切り替えることを可能にするには、現在の狭周波数帯域音声信号が必要とする高周波数帯域信号を復元することで、音声信号間の円滑な切り替えを実施できるようにする必要がある。ステップ301において、狭周波数帯域音声信号の第1高周波数帯域信号に対応する予測される微細構造情報およびエンベロープ情報が予測される。
【0029】
現在の音声信号のフレームに対応する微細構造情報およびエンベロープ情報をより正確に予測するために、ステップ301で現在の音声信号のフレームの第1低周波数帯域信号を分類することができ、次いで第1高周波数帯域信号に対応する予測される微細構造情報およびエンベロープ情報が、第1低周波数帯域信号の信号タイプに従って予測される。例えば、現在のフレームの狭周波数帯域音声信号は、調波信号、または非調波信号、または過渡信号でありうる。この場合、狭周波数帯域音声信号のタイプに対応する微細構造情報およびエンベロープ情報を取得することができ、その結果、高周波数帯域信号に対応する微細構造情報およびエンベロープ情報をより正確に予測することができる。この実施形態における音声信号を切り替えるための方法は、狭周波数帯域音声信号の信号タイプを限定しない。
【0030】
ステップ302:予測済みエンベロープ情報および以前のM個の音声信号のフレームの第2高周波数帯域信号に対応する以前のM個のフレームのエンベロープ情報をウェイト付けして、第1高周波数帯域信号に対応する第1エンベロープ情報を取得する。
【0031】
具体的には、ステップ301で現在のフレームの第1高周波数帯域信号に対応する予測される微細構造情報およびエンベロープ情報が予測された後、第1高周波数帯域信号に対応する第1エンベロープ情報を、予測済みエンベロープ情報および以前のM個の音声信号のフレームの第2高周波数帯域信号に対応する以前のM個のフレームのエンベロープ情報に従い生成できる。
【0032】
具体的には、ステップ302における第1高周波数帯域信号に対応する第1エンベロープ情報を生成するプロセスは、以下の2つの方式を使用して実施できる。
【0033】
1.図4に示すように、ステップ302による第1エンベロープ情報を取得する実施形態は以下のステップを含むことができる。
【0034】
ステップ401:第1低周波数帯域信号と以前のN個の音声信号のフレームの低周波数帯域信号との間の相関係数を、第1低周波数帯域信号および以前のN個の音声信号のフレームの低周波数帯域信号に従って計算する(Nは1以上)。
【0035】
具体的には、現在の音声信号のフレームの第1低周波数帯域信号を以前のN個の音声信号のフレームの低周波数帯域信号と比較して、現在の音声信号のフレームの第1低周波数帯域信号と以前のN個の音声信号のフレームの低周波数帯域信号との間の相関係数を取得する。例えば、現在の音声信号のフレームの第1低周波数帯域信号と以前のN個の音声信号のフレームの低周波数帯域信号との間の相関は、エネルギー規模または情報タイプの点で、現在の音声信号のフレームの第1低周波数帯域信号の周波数帯域と以前のN個の音声信号のフレームの低周波数帯域信号の同じ周波数帯域との差を判断することによって割り出すことができ、その結果、所望の相関係数を計算することができる。以前のN個の音声信号のフレームは狭周波数帯域音声信号、広周波数帯域音声信号、または狭周波数帯域音声信号および広周波数帯域音声信号の混成信号でありうる。
【0036】
ステップ402:相関係数が所与の第1しきい値範囲内にあるか否かを判断する。
【0037】
具体的には、ステップ401で相関係数が計算された後に、相関係数が所与のしきい値範囲内にあるか否かが判断される。相関係数を計算する目的は、現在の音声信号のフレームが、以前のN個の音声信号のフレームから徐々に切り替えられているか、それとも以前のN個の音声信号のフレームから突然切り替えられているかを判断することである。すなわち、目的は、それらの特性が同じであるか否かを判断し、次いで、現在の音声信号の高周波数帯域信号を予測する処理における以前のフレームの高周波数帯域信号のウェイトを決定することである。例えば、現在の音声信号のフレームの第1低周波数帯域信号が、以前の音声信号のフレームの低周波数帯域信号と同じエネルギーを有し、これらの信号タイプが同じである場合、それは、以前の音声信号のフレームは現在の音声信号のフレームとの相関が高いことを示している。したがって、現在の音声信号のフレームに対応する第1エンベロープ情報を正確に復元するにあたり、以前の音声信号のフレームに対応する高周波数帯域のエンベロープ情報または過渡エンベロープ情報はより大きなウェイトを占める。一方、エネルギーおよび信号タイプの点で、現在の音声信号のフレームの第1低周波数帯域信号と以前の音声信号のフレームの低周波数帯域信号との間に大きな差がある場合、それは、以前の音声信号と現在の音声信号のフレームとの相関が低いことを示している。したがって、現在の音声信号のフレームに対応する第1エンベロープ情報を正確に復元するにあたり、以前の音声信号のフレームに対応する高周波数帯域のエンベロープ情報または過渡エンベロープ情報は、より小さなウェイトを占める。
【0038】
ステップ403:相関係数が所与の第1しきい値範囲内にない場合、指定の第1ウェイト1および指定の第1ウェイト2に従いウェイト付けして、第1エンベロープ情報を計算する。第1ウェイト1は、以前の音声信号のフレームの高周波数帯域信号に対応する以前のフレームのエンベロープ情報のウェイト値を指し、第1ウェイト2は、エンベロープ情報のウェイト値を指す。
【0039】
具体的には、ステップ402において、相関係数が所与の第1しきい値範囲内にないと判断された場合、それは、現在の音声信号のフレームと以前のN個の音声信号のフレームとの相関がわずかであることを示している。したがって、以前のM個のフレームの第1周波数帯域音声信号に対応する以前のM個のフレームのエンベロープ情報または過渡エンベロープ情報、または以前の音声信号のフレームに対応する高周波数帯域のエンベロープ情報は、第1エンベロープ情報にわずかな影響を及ぼす。現在の音声信号のフレームに対応する第1エンベロープ情報が復元されるとき、以前のM個のフレームの第1周波数帯域音声信号に対応する以前のM個のフレームのエンベロープ情報または過渡エンベロープ情報、または以前の音声信号のフレームに対応する高周波数帯域のエンベロープ情報は、より小さなウェイトを占める。したがって、現在のフレームの第1エンベロープ情報は、指定の第1ウェイト1および第1ウェイト2に従って計算できる。第1ウェイト1は、以前の音声信号のフレームの高周波数帯域信号に対応するエンベロープ情報のウェイト値を指す。以前の音声信号のフレームは、広周波数帯域音声信号または処理済み狭周波数帯域音声信号でありうる。第1切り替えの場合、以前の音声信号のフレームは広周波数帯域音声信号であり、一方で第1ウェイト2は予測済みエンベロープ情報のウェイト値を指す。予測済みエンベロープ情報と第1ウェイト2との積は、以前のフレームのエンベロープ情報と第1ウェイト1との積に加えられ、ウェイト付け和は、現在のフレームの第1エンベロープ情報である。また、その後に送信される音声信号は、この方法およびウェイトに従って処理される。音声信号に対応する第1エンベロープ情報は、音声信号が再び切り替えられるまで復元される。
【0040】
ステップ404:相関係数が所与の第1しきい値範囲内にある場合、指定の第2ウェイト1および指定の第2ウェイト2に従いウェイト付けして、過渡エンベロープ情報を計算する。第2ウェイト1は、切り替え前のエンベロープ情報のウェイト値を指し、第2ウェイト2は、以前のM(Mは1以上)個のフレームのエンベロープ情報のウェイト値を指す。
【0041】
具体的には、ステップ402で相関係数が所与のしきい値範囲内にあると判断された場合、現在の音声信号のフレームは、以前の連続したN個の音声信号のフレームと似た特性を有し、現在の音声信号のフレームに対応する第1エンベロープ情報は、以前の連続したN個の音声信号のフレームのエンベロープ情報によりかなり影響される。以前のM個のフレームのエンベロープに対する信頼性の観点から、現在の音声信号のフレームに対応する過渡エンベロープ情報を、以前のM個のフレームのエンベロープ情報および切り替え前のエンベロープ情報に従って計算する必要がある。現在の音声信号のフレームの第1エンベロープ情報が復元されるとき、以前のM個のフレームのエンベロープ情報および切り替え前の以前のL個のフレームのエンベロープ情報はより大きなウェイトを占めることになる。次いで、第1エンベロープ情報が過渡エンベロープ情報に従って計算される。第2ウェイト1は、切り替え前のエンベロープ情報のウェイト値を指し、第2ウェイト2は、以前のM個のフレームのエンベロープ情報のウェイト値を指す。この場合、切り替え前のエンベロープ情報と第2ウェイト1との積が、以前のM個のフレームのエンベロープ情報と第2ウェイト2との積に加えられ、ウェイト付け値は過渡エンベロープ情報となる。
【0042】
ステップ405:第1ウェイトステップにより第2ウェイト1を縮小し、第1ウェイトステップにより第2ウェイト2を拡大する。
【0043】
具体的には、音声信号が送信されると、切り替え前の広周波数帯域音声信号がその後の狭周波数帯域音声信号に及ぼす影響は、徐々に減少する。第1エンベロープ情報をより正確に計算するため、第2ウェイト1および第2ウェイト2に対して適応的調整を実行する必要がある。切り替え前のL個のフレームの広周波数帯域音声信号がその後の音声信号に及ぼす影響は徐々に減少するため、第2ウェイト1の値は徐々に小さくなり、一方で第2ウェイト2の値が徐々に大きくなることで、切り替え前のエンベロープ情報が第1エンベロープ情報に及ぼす影響が弱まる。ステップ405では、第2ウェイト1および第2ウェイト2を以下の式により修正できる。新第2ウェイト1=旧第2ウェイト1-第1ウェイトステップ;新第2ウェイト2=旧第2ウェイト2+第1ウェイトステップ、ここで第1ウェイトステップは指定の値である。
【0044】
ステップ406:指定の第3ウェイト1が第1ウェイト1より大きいか否かを判断する。
【0045】
具体的には、第3ウェイト1は過渡エンベロープ情報のウェイト値を指す。過渡エンベロープ情報が現在のフレームの第1エンベロープ情報に及ぼす影響は、第3ウェイト1を第2ウェイト1と比較することによって判断できる。過渡エンベロープ情報は以前のM個のフレームのエンベロープ情報および切り替え前のエンベロープ情報に従って計算される。したがって、第3ウェイト1は実際に、第1エンベロープ情報が切り替え前のエンベロープ情報から受ける影響の度合いを表す。
【0046】
ステップ407:第3ウェイト1が第1ウェイト1より大きくない場合、指定の第1ウェイト1および第1ウェイト2に従いウェイト付けして、第1エンベロープ情報を計算する。
【0047】
具体的には、ステップ406で第3ウェイト1が第1ウェイト1以下であると判断された場合、それは、現在の音声信号のフレームが切り替え前のL個の音声信号のフレームから少し遠いこと、および第1エンベロープ情報が主に以前のM個のフレームのエンベロープ情報により影響されていることを示している。したがって、現在のフレームの第1エンベロープ情報は、指定の第1ウェイト1および第1ウェイト2に従って計算できる。
【0048】
ステップ408:第3ウェイト1が第1ウェイト1より大きい場合、指定の第3ウェイト1および第3ウェイト2に従いウェイト付けして、第1エンベロープ情報を計算する。第3ウェイト1は、過渡エンベロープ情報のウェイト値を指し、第3ウェイト2は、予測済みエンベロープ情報のウェイト値を指す。
【0049】
具体的には、ステップ406で第3ウェイト1が第1ウェイト1より大きいと判断された場合、それは、現在の音声信号のフレームが切り替え前のL個の音声信号のフレームにより近いこと、および第1エンベロープ情報が切り替え前のエンベロープ情報によって大きく影響されていることを示している。したがって、現在のフレームの第1エンベロープ情報を、過渡エンベロープ情報に従って計算する必要がある。第3ウェイト1は、過渡エンベロープ情報のウェイト値を指し、第3ウェイト2は、予測済みエンベロープ情報のウェイト値を指す。この場合、過渡エンベロープ情報と第3ウェイト1との積が、予測済みエンベロープ情報と第3ウェイト2との積に加えられ、ウェイト付け値は第1エンベロープ情報となる。
【0050】
ステップ409:第2ウェイトステップにより第3ウェイト1を縮小し、第3ウェイト1が0に等しくなるまで第2ウェイトステップにより第3ウェイト2を拡大する。
【0051】
具体的には、ステップ409で第3ウェイト1および第3ウェイト2を修正する目的は、ステップ405で第2ウェイト1および第2ウェイト2を修正する目的と同じである。すなわち、その目的は、切り替え前のL個の音声信号のフレームがその後に送信される音声信号に及ぼす影響が徐々に減少するときに、第3ウェイト1および第3ウェイト2に対して適応的調整を実行して、第1エンベロープ情報をより正確に計算することである。切り替え前のL個の音声信号のフレームがその後の音声信号に及ぼす影響は徐々に減少するため、第3ウェイト1の値は徐々に小さくなり、一方で第3ウェイト2の値が徐々に大きくなることで、切り替え前のエンベロープ情報が第1エンベロープ情報に及ぼす影響は弱まる。ステップ409では、第3ウェイト1および第3ウェイト2を以下の式により修正できる。新第3ウェイト1=旧第3ウェイト1-第2ウェイトステップ;新第3ウェイト2=旧第3ウェイト2+第2ウェイトステップ、ここで第2ウェイトステップは指定の値である。
【0052】
第1ウェイト1と第1ウェイト2との和は1に等しく、第2ウェイト1と第2ウェイト2との和は1に等しく、第3ウェイト1と第3ウェイト2との和は1に等しく、第3ウェイト1の初期値は第1ウェイト1の初期値より大きく、第1ウェイト1および第1ウェイト2は定数である。具体的には、この実施形態におけるウェイト1およびウェイト2は実際に、現在のフレームの第1エンベロープ情報における、切り替え前のエンベロープ情報および以前のM個のフレームのエンベロープ情報のパーセンテージを表す。現在の音声信号のフレームが切り替え前のL個の音声信号のフレームに近く、両者の相関が高い場合、切り替え前のエンベロープ情報のパーセンテージは高く、一方で以前のM個のフレームのエンベロープ情報のパーセンテージは低い。現在の音声信号のフレームが切り替え前のL個の音声信号のフレームから少し遠い場合、それは、音声信号がネットワーク上で安定的に送信されていることを示しており、あるいは、現在の音声信号のフレームが切り替え前のL個の音声信号のフレームとわずかに相関する場合、それは、現在の音声信号のフレームの特性が既に変更されていることを示している。したがって、現在の音声信号のフレームが、切り替え前のL個の音声信号のフレームによりわずかに影響されている場合、切り替え前のエンベロープ情報のパーセンテージは低い。
【0053】
さらに、ステップ404をステップ405の後に実行することもできる。すなわち、最初に第2ウェイト1および第2ウェイト2を修正することができ、次に過渡エンベロープ情報が第2ウェイト1および第2ウェイト2に従って計算される。同様に、ステップ408をステップ409の後に実行することもできる。すなわち、最初に第3ウェイト1および第3ウェイト2を修正することができ、次に第1エンベロープ情報が第3ウェイト1および第3ウェイト2に従って計算される。
【0054】
2.図5に示すように、ステップ302による第1エンベロープ情報を取得する別の実施形態は、以下のステップをさらに含むことができる。
【0055】
ステップ501:第1低周波数帯域信号と以前の音声信号のフレームの低周波数帯域信号との間の相関を、現在の音声信号のフレームの第1低周波数帯域信号および以前の音声信号のフレームの低周波数帯域信号に従って計算する。
【0056】
具体的には、より正確な第1エンベロープ情報を取得するために、現在の音声信号のフレームの第1低周波数帯域信号の周波数帯域と以前の音声信号のフレームの低周波数帯域信号の同じ周波数帯域との間の関係が計算される。この実施形態において、「corr」を使用して相関係数を示すことがある。この相関係数は、現在の音声信号のフレームの第1低周波数帯域信号と以前の音声信号のフレームの低周波数帯域信号との間のエネルギー関係により取得される。エネルギー差が小さい場合は「corr」が大きく、逆の場合は「corr」が小さい。具体的なプロセスについては、ステップ401における以前のN個の音声信号のフレームの係数に関する計算を参照されたい。
【0057】
ステップ502:相関係数が所与の第2しきい値範囲内にあるか否かを判断する。
【0058】
具体的には、ステップ501で「corr」の値が計算された後、計算された「corr」値が所与の第2しきい値内にあるか否かが判断される。例えば、第2しきい値範囲はこの実施形態でc1〜c2によって表されうる。
【0059】
ステップ503:相関係数が所与の第2しきい値範囲内にない場合、指定の第1ウェイト1および第1ウェイト2に従いウェイト付けして、第1エンベロープ情報を計算する。第1ウェイト1は、以前の音声信号のフレームの高周波数帯域信号に対応する以前のフレームのエンベロープ情報のウェイト値を指し、第1ウェイト2は、予測済みエンベロープ情報のウェイト値を指す。第1ウェイト1および第2ウェイト2は定数である。
【0060】
具体的には、「corr」値がc1より小さいか、c2より大きいと判断されたとき、現在の音声信号のフレームに対応する第1エンベロープ情報が、切り替え前の以前の音声信号のフレームのエンベロープ情報によってわずかに影響されていると判断される。したがって、現在のフレームの第1エンベロープ情報は指定の第1ウェイト1および第1ウェイト2に従って計算される。予測済みエンベロープ情報と第1ウェイト2との積が、以前のフレームのエンベロープ情報と第1ウェイト1との積に加えられ、ウェイト付け和は、現在のフレームの第1エンベロープ情報である。また、その後に送信される狭帯域音声信号は、この方法およびウェイトに従って処理される。狭帯域音声信号に対応する第1エンベロープ情報は、様々な帯域幅を有する音声信号が再び切り替えられるまで復元される。例えば、この実施形態における第1ウェイト1はa1によって表すことができ、第1ウェイト2はb1によって表すことができ、以前のフレームのエンベロープ情報はpre_fenvによって表すことができ、予測済みエンベロープ情報はfenvによって表すことができ、第1エンベロープ情報はcur_fenvによって表すことができる。この場合、ステップ503は以下の式によって表すことができる。cur_fenv = pre_fenv×a1 + fenv×b1
【0061】
ステップ504:相関係数が第2しきい値範囲内にある場合、指定の第2ウェイト1が第1ウェイト1より大きいか否かを判断する。第2ウェイト1は、切り替え前の以前の音声信号のフレームの高周波数帯域信号に対応する切り替え前のエンベロープ情報のウェイト値を指す。
【0062】
具体的には、c1<corr<c2の場合、切り替え前のエンベロープ情報および以前のフレームのエンベロープ情報が現在のフレームの第1エンベロープ情報に及ぼす影響の度合いは、第2ウェイト1を第1ウェイト1と比較することによって取得できる。
【0063】
ステップ505:第2ウェイト1が第1ウェイト1より大きくない場合、指定の第1ウェイト1および第1ウェイト2に従いウェイト付けして、第1エンベロープ情報を計算する。
【0064】
具体的には、ステップ504で第2ウェイト1が第1ウェイト1より小さいと判断された場合、それは、現在の音声信号のフレームが切り替え前の以前の音声信号のフレームから少し遠いこと、および第1エンベロープ情報が切り替え前の以前のフレームのエンベロープ情報によりわずかに影響されていることを示している。したがって、現在のフレームの第1エンベロープ情報は、指定の第1ウェイト1および第1ウェイト2に従って計算できる。この場合、ステップ505は以下の式によって表すことができる。cur_fenv = pre_fenv×a1 + fenv×b1
【0065】
ステップ506:第2ウェイト1が第1ウェイト1より大きい場合、第2ウェイト1および指定の第2ウェイト2に従いウェイト付けして、第1エンベロープ情報を計算する。第2ウェイト2は、予測済みエンベロープ情報のウェイト値を指す。例えば、第2ウェイト1はa2によって表すことができ、第2ウェイト2はb2によって表すことができる。
【0066】
具体的には、ステップ504で第2ウェイト1が第1ウェイト1より大きいと判断された場合、それは、現在の音声信号のフレームが切り替え前の以前のフレームの第1周波数帯域音声信号により近いこと、および第1エンベロープ情報が切り替え前の以前の音声信号のフレームに対応する切り替え前のエンベロープ情報によって大きく影響されていることを示している。したがって、現在のフレームの第1エンベロープ情報は指定の第2ウェイト1および第2ウェイト2に従って計算される。この場合、予測済みエンベロープ情報と第2ウェイト2との積が、切り替え前のエンベロープ情報と第2ウェイト1との積に加えられ、ウェイト付け和は、現在のフレームの第1エンベロープ情報となる。切り替え前のエンベロープ情報は、con_fenvによって表すことができる。この場合、ステップ506は以下の式によって表すことができる。cur_fenv = con_fenv×a2 + fenv×b2
【0067】
ステップ507:第2ウェイトステップにより第2ウェイト1を縮小し、第2ウェイトステップにより第2ウェイト2を拡大する。
【0068】
具体的には、音声信号が送信されると、切り替え前の音声信号がその後の音声信号のフレームに及ぼす影響は、徐々に減少する。第1エンベロープ情報をより正確に計算するため、第2ウェイト1および第2ウェイト2に対して適応的調整を実行する必要がある。切り替え前の音声信号がその後の音声信号のフレームに及ぼす影響は徐々に減少し、一方で現在の音声信号のフレームに近い以前の音声信号のフレームが及ぼす影響は徐々に大きくなる。したがって、第2ウェイト1の値は徐々に小さくなり、一方で第2ウェイト2の値は徐々に大きくなる。このようにして、切り替え前のエンベロープ情報が第1エンベロープ情報に及ぼす影響は弱まり、一方で予測済みエンベロープ情報が第1エンベロープ情報に及ぼす影響は強まる。ステップ507では、第2ウェイト1および第2ウェイト2を以下の式により修正できる。新第2ウェイト1=旧第2ウェイト1-第1ウェイトステップ;新第2ウェイト2=旧第2ウェイト2+第1ウェイトステップ、ここで第1ウェイトステップは指定の値である。
【0069】
第1ウェイト1と第1ウェイト2との和は1に等しく、第2ウェイト1と第2ウェイト2との和は1に等しく、第2ウェイト1の初期値は第1ウェイト1の初期値より大きい。
【0070】
ステップ303:第1エンベロープ情報および予測済み微細構造情報に従い、処理済み第1高周波数帯域信号を生成する。
【0071】
具体的には、ステップ302で現在のフレームの第1エンベロープ情報が取得された後、処理済み第1高周波数帯域信号を第1エンベロープ情報および予測済み微細構造情報に従って生成することができ、その結果、第2高周波数帯域信号を処理済み第1高周波数帯域信号に円滑に切り替えることができる。
【0072】
この実施形態における音声信号を切り替えるための方法を使用することによって、音声信号を広周波数帯域音声信号から狭周波数帯域音声信号に切り替える処理において、現在のフレームの処理済み第1高周波数帯域信号が、予測済み微細構造情報および第1エンベロープ情報に従って取得される。このようにして、切り替え前の広周波数帯域音声信号の第2高周波数帯域信号を、狭周波数帯域音声信号に対応する処理済み第1高周波数帯域信号に円滑に切り替えることができ、その結果、ユーザが受信する音声信号の品質を改善することができる。
【0073】
前述の技術的解決策に基づき、図6に示すステップ202は以下のステップを含む。
【0074】
ステップ601:現在の音声信号のフレームおよび切り替え前の以前の音声信号のフレームに従い、処理済み第1高周波数帯域信号が減衰する必要があるか否かを判断する。
【0075】
具体的には、狭帯域音声信号の第1高周波数帯域信号はヌルである。広周波数帯域音声信号を狭周波数帯域音声信号に切り替える処理において、復元済み狭周波数帯域音声信号に対応する処理済み第1高周波数帯域信号による悪影響を防ぐため、処理済み第1高周波数帯域信号のエネルギーは、狭周波数帯域音声信号から拡大した広周波数帯域信号のフレーム数が所与のフレーム数に達した後に減衰係数が所与のしきい値に達するまで、フレーム単位で減衰させられる。現在の音声信号のフレームと切り替え前のフレームの音声信号との間隔は、現在の音声信号のフレームおよび切り替え前のフレームの音声信号に従って取得できる。例えば、狭周波数帯域音声信号のフレーム数は、カウンタを使用して記録でき、この場合のフレーム数は0以上の所定の値でありうる。
【0076】
ステップ602:処理済み第1高周波数帯域信号が減衰する必要がない場合、処理済み第1高周波数帯域信号および第1低周波数帯域信号を広周波数帯域信号に合成する。
【0077】
具体的には、ステップ601で処理済み第1高周波数帯域信号が減衰する必要がないと判断された場合、処理済み第1高周波数帯域信号および第1低周波数帯域信号は広周波数帯域信号に直接合成される。
【0078】
ステップ603:処理済み第1高周波数帯域信号が減衰する必要がある場合、処理済み第1高周波数帯域信号に対応する減衰係数がしきい値より大きいか否かを判断する。
【0079】
具体的には、減衰係数の初期値が1であり、しきい値が0以上1未満である。ステップ601で処理済み第1高周波数帯域信号が減衰する必要があると判断された場合、ステップ603において、処理済み第1高周波数帯域信号に対応する減衰係数が所与のしきい値より大きいか否かが判断される。
【0080】
ステップ604:減衰係数が所与のしきい値より大きくない場合、処理済み第1高周波数帯域信号としきい値とを掛け、積および第1低周波数帯域信号を広周波数帯域信号に合成する。
【0081】
具体的には、ステップ603で減衰係数が所与のしきい値より大きくないと判断された場合、それは、処理済み第1高周波数帯域信号のエネルギーが既にある程度減衰していること、および処理済み第1高周波数帯域信号が悪影響をもたらさないかもしれないことを示している。この場合、この減衰率が維持されうる。次いで、処理済み第1高周波数帯域信号にしきい値を掛け、次に、積および第1低周波数帯域信号が広周波数帯域信号に合成される。
【0082】
ステップ605:減衰係数が所与のしきい値より大きい場合、処理済み第1高周波数帯域信号と減衰係数とを掛け、積および第1低周波数帯域信号を広周波数帯域信号に合成する。
【0083】
具体的には、ステップ603で減衰係数が所与のしきい値より大きい場合、それは、処理済み第1高周波数帯域信号が減衰係数において聞き心地の悪さをもたらす可能性があり、所与のしきい値に達するまでさらに減衰する必要があることを示している。次いで、処理済み第1高周波数帯域信号に減衰係数を掛け、次に、積および第1低周波数帯域信号が広周波数帯域信号に合成される。
【0084】
ステップ606:減衰係数を修正して減衰係数を縮小する。
【0085】
具体的には、音声信号が送信されると、切り替え前の音声信号がその後の狭帯域音声信号に及ぼす影響は徐々に小さくなり、減衰係数も徐々に小さくなる。
【0086】
随意に、前述の技術的解決策に基づき、狭周波数帯域音声信号から広周波数帯域音声信号への切り替えが生じたとき、ステップ201により処理済み第1高周波数帯域信号を取得する実施形態は、図7に示すように以下のステップを含む。
【0087】
ステップ701:指定の第4ウェイト1および第4ウェイト2に従いウェイト付けして、処理済み第1高周波数帯域信号を計算する。第4ウェイト1は、第2高周波数帯域信号のウェイト値を指し、第4ウェイト2は、現在の音声信号のフレームの第1高周波数帯域信号のウェイト値を指す。
【0088】
具体的には、狭周波数帯域音声信号を広周波数帯域音声信号に切り替える処理において、広周波数帯域音声信号の高周波数帯域信号はヌルではなく、狭周波数帯域音声信号に対応する高周波数帯域信号がヌルであるため、広周波数帯域音声信号の高周波数帯域信号のエネルギーを減衰させることで、狭周波数帯域音声信号を広周波数帯域音声信号に円滑に切り替えることができるようにする必要がある。第2高周波数帯域信号と第4ウェイト1との積が、第1高周波数帯域信号と第4ウェイト2との積に加えられ、ウェイト付け値は処理済み第1高周波数帯域信号となる。
【0089】
ステップ702:第3ウェイトステップにより第4ウェイト1を縮小し、第4ウェイト1が0に等しくなるまで第3ウェイトステップにより第4ウェイト2を拡大する。第4ウェイト1と第4ウェイト2との和は1に等しくなる。
【0090】
具体的には、音声信号が送信されると、切り替え前の狭周波数帯域音声信号がその後の広周波数帯域音声信号に及ぼす影響は、徐々に小さくなる。したがって、第4ウェイト1は徐々に小さくなり、一方で第4ウェイト1が0に等しくなって第4ウェイト2が1に等しくなるまで、第4ウェイト2は徐々に大きくなる。すなわち、送信される音声信号は常に広周波数帯域音声信号となる。
【0091】
同様に、図8に示すように、ステップ201による処理済み第1高周波数帯域信号を取得する別の実施形態は、以下のステップをさらに含むことができる。
【0092】
ステップ801:指定の第5ウェイト1および第5ウェイト2に従いウェイト付けして、処理済み第1高周波数帯域信号を計算する。第5ウェイト1は指定の固定パラメータのウェイト値であり、第5ウェイト2は現在の音声信号のフレームの第1高周波数帯域信号のウェイト値である。
【0093】
具体的には、狭周波数帯域音声信号の第1高周波数帯域信号はヌルであるため、固定パラメータは狭周波数帯域音声信号の高周波数帯域信号を交換するように設定でき、ここで固定パラメータは0以上で、第1高周波数帯域信号のエネルギーより小さい定数である。固定パラメータと第5ウェイト1との積が、第1高周波数帯域信号と第5ウェイト2との積に加えられ、ウェイト付け値は、処理済み第1高周波数帯域信号となる。
【0094】
ステップ802:第4ウェイトステップにより第5ウェイト1を縮小し、第5ウェイト1が0に等しくなるまで第4ウェイトステップにより第5ウェイト2を拡大する。第5ウェイト1と第5ウェイト2との和は1に等しくなる。
【0095】
具体的には、音声信号が送信されると、切り替え前の狭周波数帯域音声信号がその後の広周波数帯域音声信号に及ぼす影響は、徐々に小さくなる。したがって、第5ウェイト1は徐々に小さくなり、一方で第5ウェイト1が0に等しくなって第5ウェイト2が1に等しくなるまで、第5ウェイト2は徐々に大きくなる。すなわち、送信される音声信号は常に真の広周波数帯域音声信号となる。
【0096】
この実施形態における音声信号を切り替えるための方法を使用することによって、音声信号を狭周波数帯域音声信号から広周波数帯域音声信号に切り替える処理において、広周波数帯域音声信号の高周波数帯域信号を減衰させて、処理済み高周波数帯域信号を取得する。このようにして、切り替え前の狭周波数帯域音声信号に対応する高周波数帯域信号を、広周波数帯域音声信号に対応する処理済み高周波数帯域信号に円滑に切り替えることができ、ひいてはユーザが受信する音声信号の品質改善に寄与することができる。
【0097】
この実施形態において、エンベロープ情報を、高周波数帯域信号を表すことができる他のパラメータ、例えば線形予測符号化(LPC)パラメータまたは振幅パラメータによって交換することもできる。
【0098】
当業者は、本発明の実施形態による方法のステップの全部または一部を、関連ハードウェアに命令するプログラムによって実施できることを理解しうる。プログラムはコンピュータ可読記憶媒体に記憶できる。プログラムが作動するとき、本発明の実施形態による方法のステップが実行される。記憶媒体は読み取り専用メモリ(ROM)、ランダムアクセスメモリ(RAM)、磁気ディスクまたはコンパクトディスク読み取り専用メモリ(CD-ROM)でありうる。
【0099】
図9は、音声信号を切り替えるための装置の第1実施形態の構造を示している。図9に示すように、音声信号を切り替えるための装置は、処理モジュール91および第1合成モジュール92を含む。
【0100】
処理モジュール91は、音声の切り替えが生じたとき、現在の音声信号のフレームの第1高周波数帯域信号および以前のM個の音声信号のフレームの第2高周波数帯域信号をウェイト付けして、処理済み第1高周波数帯域信号を取得するように適合される。Mは1以上である。
【0101】
第1合成モジュール92は、処理済み第1高周波数帯域信号および現在の音声信号のフレームの第1低周波数帯域信号を広周波数帯域信号に合成するように適合される。
【0102】
この実施形態における音声信号を切り替えるための装置において、処理モジュールが、現在の音声信号のフレームの第1高周波数帯域信号を、以前のM個の音声信号のフレームの第2高周波数帯域信号に従って処理し、その結果、第2高周波数帯域信号を処理済み第1高周波数帯域信号に円滑に切り替えることができる。このようにして、様々な帯域幅を有する音声信号間の切り替えの処理中に、こうした音声信号の高周波数帯域信号を円滑に切り替えることができる。最後に、第1合成モジュールは、処理済み第1高周波数帯域信号および第1低周波数帯域信号を広周波数帯域信号に合成し、広周波数帯域信号はユーザ端末に送信され、その結果、ユーザは高品質の音声信号を享受することができる。この実施形態における音声信号を切り替えるための方法を使用することによって、様々な帯域幅を有する音声信号を円滑に切り替えることができ、それによりエネルギーの急変が音声信号の主観的音声品質に及ぼす影響を減らし、ユーザが受信する音声信号の品質を改善することができる。
【0103】
図10は、音声信号を切り替えるための装置の第2実施形態の構造を示している。図10に示すように、この実施形態における音声信号を切り替えるための装置は、第1実施形態に基づき、第2合成モジュール103をさらに含む。
【0104】
第2合成モジュール103は、音声信号の切り替えが生じていないときに第1高周波数帯域信号および第1低周波数帯域信号を広周波数帯域信号に合成するように適合される。
【0105】
この実施形態における音声信号を切り替えるための装置において、第2合成モジュールは、様々な帯域幅を有する音声信号間の切り替えが生じたとき、現在のフレームの第1周波数帯域音声信号の第1低周波数帯域信号および第1高周波数帯域信号を広周波数帯域信号に合成するように設定される。このようにして、ユーザが受信する音声信号の品質が改善される。
【0106】
上述の技術的解決策によれば、随意に、図10および図11に示すように、広周波数帯域音声信号から狭周波数帯域音声信号への切り替えが生じたとき、処理モジュール101は以下のモジュールを含む。
第1高周波数帯域信号に対応する微細構造情報およびエンベロープ情報を予測するように適合された予測モジュール1011、
予測済みエンベロープ情報および以前のM個の音声信号のフレームの第2高周波数帯域信号に対応する以前のM個のフレームのエンベロープ情報をウェイト付けして、第1高周波数帯域信号に対応する第1エンベロープ情報を取得するように適合された第1生成モジュール1012、および
第1エンベロープ情報および予測済み微細構造情報に従い、処理済み第1高周波数帯域信号を生成するように適合された第2生成モジュール1013。
【0107】
さらに、この実施形態における音声信号を切り替えるための装置は、現在の音声信号のフレームの第1低周波数帯域信号を分類するように適合された分類モジュール1010を含むことができる。予測モジュール1011は、現在の音声信号のフレームの第1低周波数帯域信号に対応する微細構造情報およびエンベロープ情報を予測するようにさらに適合される。
【0108】
この実施形態における音声信号を切り替えるための装置において、予測モジュールは、第1高周波数帯域信号に対応する微細構造情報およびエンベロープ情報を予測し、その結果、処理済み第1高周波数帯域信号は第1生成モジュールおよび第2生成モジュールによって正確に生成できる。このようにして、第1高周波数帯域信号を処理済み第1高周波数帯域信号に円滑に切り替えることができ、それによりユーザが受信する音声信号の品質を改善することができる。さらに、分類モジュールは現在の音声信号のフレームの第1低周波数帯域信号を分類し、予測モジュールは信号タイプに従い予測済み微細構造情報および予測済みエンベロープ情報を取得する。このようにして、予測済み微細構造情報および予測済みエンベロープ情報がより正確となることで、ユーザが受信する音声信号の品質を改善する。
【0109】
前述の技術的解決策に基づき、随意に、図10および図12に示すように、第1合成モジュール102は以下のモジュールを含む。
現在の音声信号のフレームおよび切り替え前の以前の音声信号のフレームに従い、処理済み第1高周波数帯域信号が減衰する必要があるか否かを判断するように適合された第1判断モジュール1021、
処理済み第1高周波数帯域信号が減衰する必要がないと第1判断モジュール1021が判断したときに、処理済み第1高周波数帯域信号および第1低周波数帯域信号を広周波数帯域信号に合成するように適合された第3合成モジュール1022、
処理済み第1高周波数帯域信号が減衰する必要があると第1判断モジュール1021が判断したときに、処理済み第1高周波数帯域信号に対応する減衰係数が所与のしきい値より大きいか否かを判断するように適合された第2判断モジュール1023、
減衰係数が所与のしきい値より大きくないと第2判断モジュール1023が判断した場合、処理済み第1高周波数帯域信号としきい値とを掛け、積および第1低周波数帯域信号を広周波数帯域信号に合成するように適合された第4合成モジュール1024、
減衰係数が所与のしきい値より大きいと第2判断モジュール1023が判断した場合、処理済み第1高周波数帯域信号と減衰係数とを掛け、積および第1低周波数帯域信号を広周波数帯域信号に合成するように適合された第5合成モジュール1025、および
減衰係数を修正して減衰係数を縮小するように適合された第1修正モジュール1026。
【0110】
減衰係数の初期値は1であり、しきい値は0以上1未満である。
【0111】
音声信号を切り替えるための装置を使用することによって、処理済み第1高周波数帯域信号が減衰し、その結果、現在の音声信号のフレームを処理することによって得られる広周波数帯域信号がより正確となり、ひいてはユーザが受信する音声信号の品質を改善する。
【0112】
上述の技術的解決策によれば、随意に、図10および図13aに示すように、狭周波数帯域音声信号から広周波数帯域音声信号への切り替えが生じたとき、この実施形態における処理モジュール101は以下のモジュールを含む。
指定の第4ウェイト1および第4ウェイト2に従いウェイト付けして処理済み第1高周波数帯域信号を計算するように適合され、第4ウェイト1は第2高周波数帯域信号のウェイト値を指し、第4ウェイト2は第1高周波数帯域信号のウェイト値を指す、第1計算モジュール1011a、および
第3ウェイトステップにより第4ウェイト1を縮小し、第4ウェイト1が0に等しくなるまで第3ウェイトステップにより第4ウェイト2を拡大するように適合され、第4ウェイト1と第4ウェイト2との和は1に等しくなる、第2修正モジュール1012a。
【0113】
同様に、図10および図13bに示すように、狭周波数帯域音声信号から広周波数帯域音声信号への切り替えが生じたとき、この実施形態における処理モジュール101は以下のモジュールをさらに含むことができる。
指定の第5ウェイト1および第5ウェイト2に従いウェイト付けして処理済み第1高周波数帯域信号を計算するように適合され、第5ウェイト1は指定の固定パラメータのウェイト値を指し、第5ウェイト2は第1高周波数帯域信号のウェイト値を指す、第2計算モジュール1011b、および
第4ウェイトステップにより第5ウェイト1を縮小し、第5ウェイト1が0に等しくなるまで第4ウェイトステップにより第5ウェイト2を拡大するように適合され、第5ウェイト1と第5ウェイト2との和は1に等しくなり、固定パラメータは0以上であり、第1高周波数帯域信号のエネルギー値より小さい定数である、第3修正モジュール1012b。
【0114】
この実施形態における音声信号を切り替えるための装置を使用することによって、音声信号を狭周波数帯域音声信号から広周波数帯域音声信号に切り替える処理において、広周波数帯域音声信号の高周波数帯域信号を減衰させて、処理済み高周波数帯域信号を取得する。このようにして、切り替え前の狭周波数帯域音声信号に対応する高周波数帯域信号を、広周波数帯域音声信号に対応する処理済み高周波数帯域信号に円滑に切り替えることができ、ひいてはユーザが受信する音声信号の品質改善に寄与することができる。
【0115】
上記の実施形態は本発明の技術的解決策を説明するために提示されているにすぎず、本発明を限定する意図はないことに留意されたい。上記の実施形態を参照して本発明について詳述してきたが、当業者は本発明の趣旨および範囲から離れることなく本発明に様々な修正および変更を加えることができることは明らかである。本発明は、以下の特許請求の範囲またはその等価物に定める保護の範囲内にある限り、修正および変更を網羅するものである。
【符号の説明】
【0116】
91 処理モジュール
92 第1合成モジュール
103 第2合成モジュール
101 処理モジュール
102 第1合成モジュール
1010 分類モジュール
1011 予測モジュール
1012 第1生成モジュール
1013 第2生成モジュール
1021 第1判断モジュール
1022 第3合成モジュール
1023 第2判断モジュール
1024 第4判断モジュール
1025 第5合成モジュール
1026 第1修正モジュール
1011a 第1計算モジュール
1012a 第2修正モジュール
1011b 第2計算モジュール
1012b 第3修正モジュール

【特許請求の範囲】
【請求項1】
音声信号を切り替えるための方法であって、
音声信号の切り替えが生じたとき、現在の音声信号のフレームの第1高周波数帯域信号および以前の1以上であるM個の音声信号のフレームの第2高周波数帯域信号をウェイト付けして、処理済み第1高周波数帯域信号を取得するステップと、
前記処理済み第1高周波数帯域信号および前記現在の音声信号のフレームの第1低周波数帯域信号を広周波数帯域信号に合成するステップと
を含む方法。
【請求項2】
前記音声信号の切り替えが生じていないときに、前記第1高周波数帯域信号および前記第1低周波数帯域信号を前記広周波数帯域信号に合成するステップ
をさらに含む、請求項1に記載の方法。
【請求項3】
広周波数帯域音声信号から狭周波数帯域音声信号への切り替えが生じたとき、前記現在の音声信号のフレームの前記第1高周波数帯域信号および前記以前のM個の音声信号のフレームの前記第2高周波数帯域信号をウェイト付けして前記処理済み第1高周波数帯域信号を取得する前記ステップが、
前記現在の音声信号のフレームの前記第1高周波数帯域信号に対応する微細構造情報およびエンベロープ情報を予測するステップと、
前記予測済みエンベロープ情報および前記以前のM個の音声信号のフレームの前記第2高周波数帯域信号に対応する以前のM個のフレームのエンベロープ情報をウェイト付けして、前記第1高周波数帯域信号に対応する第1エンベロープ情報を取得するステップと、
前記第1エンベロープ情報および前記予測済み微細構造情報に従い、前記処理済み第1高周波数帯域信号を生成するステップと
を含む、請求項1または2に記載の方法。
【請求項4】
前記現在の音声信号のフレームの前記第1高周波数帯域信号に対応する前記微細構造情報およびエンベロープ情報を予測する前記ステップが、
前記現在の音声信号のフレームの前記第1低周波数帯域信号を分類するステップと、
前記第1低周波数帯域信号の信号タイプに従い、前記微細構造情報およびエンベロープ情報を予測するステップと
を含む、請求項3に記載の方法。
【請求項5】
前記予測済みエンベロープ情報および前記以前のM個の音声信号のフレームの前記第2高周波数帯域信号に対応する前記以前のM個のフレームのエンベロープ情報をウェイト付けして、前記第1高周波数帯域信号に対応する前記第1エンベロープ情報を取得する前記ステップが、
前記第1低周波数帯域信号と以前の1以上であるN個の音声信号のフレームの低周波数帯域信号との間の相関係数を、前記第1低周波数帯域信号および前記以前のN個の音声信号のフレームの前記低周波数帯域信号に従って計算するステップと
前記相関係数が所与の第1しきい値範囲内にあるか否かを判断するステップと、
前記相関係数が前記第1しきい値範囲内にない場合、指定の第1ウェイト1および指定の第1ウェイト2に従いウェイト付けして、前記第1エンベロープ情報を計算するステップであって、前記第1ウェイト1は以前の音声信号のフレームの高周波数帯域信号に対応する以前のフレームのエンベロープ情報のウェイト値を指し、前記第1ウェイト2は前記エンベロープ情報のウェイト値を指す、ステップと、
前記相関係数が前記第1しきい値範囲内にある場合、指定の第2ウェイト1および指定の第2ウェイト2に従いウェイト付けして、過渡エンベロープ情報を計算するステップであって、前記第2ウェイト1は前記切り替え前の1以上であるL個の音声信号のフレームの高周波数帯域信号に対応するエンベロープ情報のウェイト値を指し、前記第2ウェイト2は前記以前のM個のフレームのエンベロープ情報の前記ウェイト値を指す、ステップと、
第1ウェイトステップにより前記第2ウェイト1を縮小し、前記第1ウェイトステップにより前記第2ウェイト2を拡大するステップと、
指定の第3ウェイト1が前記第1ウェイト1より大きいか否かを判断するステップと、
前記第3ウェイト1が前記第1ウェイト1より大きくない場合、前記指定の第1ウェイト1および前記第1ウェイト2に従いウェイト付けして、前記第1エンベロープ情報を計算するステップと、
前記第3ウェイト1が前記第1ウェイト1より大きい場合、前記指定の第3ウェイト1および前記第3ウェイト2に従いウェイト付けして、前記第1エンベロープ情報を計算するステップであって、前記第3ウェイト1は前記過渡エンベロープ情報のウェイト値を指し、前記第3ウェイト2は前記予測済みエンベロープ情報のウェイト値を指す、ステップと、
第2ウェイトステップにより前記第3ウェイト1を縮小し、前記第3ウェイト1が0に等しくなるまで前記第2ウェイトステップにより前記第3ウェイト2を拡大するステップと
を含み、
前記第1ウェイト1と前記第1ウェイト2との和は1に等しく、前記第2ウェイト1と前記第2ウェイト2との和は1に等しく、前記第3ウェイト1と前記第3ウェイト2との和は1に等しく、前記第3ウェイト1の初期値は前記第1ウェイト1の初期値より大きく、前記第1ウェイト1および前記第1ウェイト2は定数である、請求項3に記載の方法。
【請求項6】
前記予測済みエンベロープ情報および前記以前のM個の音声信号のフレームの前記第2高周波数帯域信号に対応する前記以前のM個のフレームのエンベロープ情報をウェイト付けして、前記第1高周波数帯域信号に対応する前記第1エンベロープ情報を取得する前記ステップが、
現在のフレームの前記第1低周波数帯域信号と以前の音声信号のフレームの低周波数帯域信号との間の相関係数を、前記現在のフレームの前記第1低周波数帯域信号および前記以前の音声信号のフレームの前記低周波数帯域信号に従い計算するステップと、
前記相関係数が所与の第2しきい値範囲内にあるか否かを判断するステップと、
前記相関係数が前記第2しきい値範囲内にない場合、指定の第1ウェイト1および指定の第1ウェイト2に従いウェイト付けして、前記第1エンベロープ情報を計算するステップであって、前記第1ウェイト1は前記以前の音声信号のフレームの高周波数帯域信号に対応する以前のフレームのエンベロープ情報のウェイト値を指し、前記第1ウェイト2は前記予測済みエンベロープ情報のウェイト値を指し、前記第1ウェイト1および前記第1ウェイト2は定数である、ステップと、
前記相関係数が前記第2しきい値範囲内にある場合、指定の第2ウェイト1が前記第1ウェイト1より大きいか否かを判断するステップであって、前記第2ウェイト1は、前記切り替え前の前記以前の音声信号のフレームの前記高周波数帯域信号に対応するエンベロープ情報のウェイト値を指す、ステップと、
前記第2ウェイト1が前記第1ウェイト1より大きくない場合、前記指定の第1ウェイト1および前記第1ウェイト2に従いウェイト付けして、前記第1エンベロープ情報を計算するステップと、
前記第2ウェイト1が前記第1ウェイト1より大きい場合、前記第2ウェイト1および指定の第2ウェイト2に従いウェイト付けして前記第1エンベロープ情報を計算するステップであって、前記第2ウェイト2は前記予測済みエンベロープ情報のウェイト値を指す、ステップと、
第2ウェイトステップにより前記第2ウェイト1を縮小し、前記第2ウェイトステップにより前記第2ウェイト2を拡大するステップと
を含み、
前記第1ウェイト1と前記第1ウェイト2との和は1に等しく、前記第2ウェイト1と前記第2ウェイト2との和は1に等しく、前記第2ウェイト1の初期値は前記第1ウェイト1の初期値より大きい、請求項3に記載の方法。
【請求項7】
前記処理済み第1高周波数帯域信号および前記現在の音声信号のフレームの前記第1低周波数帯域信号を前記広周波数帯域信号に合成する前記ステップが、
前記現在の音声信号のフレームおよび前記切り替え前の以前の音声信号のフレームに従い、前記処理済み第1高周波数帯域信号が減衰する必要があるか否かを判断するステップと、
減衰が必要とされない場合、前記処理済み第1高周波数帯域信号および前記第1低周波数帯域信号を前記広周波数帯域信号に合成するステップと、
減衰が必要とされる場合、前記第1高周波数帯域信号に対応する減衰係数が所与のしきい値より大きいか否かを判断するステップと、
前記減衰係数が前記所与のしきい値より大きくない場合、前記処理済み第1高周波数帯域信号と前記しきい値とを掛け、前記処理済み第1高周波数帯域信号と前記しきい値との積および前記第1低周波数帯域信号を前記広周波数帯域信号に合成するステップと、
前記減衰係数が前記所与のしきい値より大きい場合、前記処理済み第1高周波数帯域信号と前記減衰係数とを掛け、前記処理済み第1高周波数帯域信号と前記減衰係数との積および前記第1低周波数帯域信号を前記広周波数帯域信号に合成するステップと、
前記減衰係数を修正して前記減衰係数を縮小するステップと
を含み、
前記減衰係数の初期値は1であり、前記しきい値は0以上1未満である、請求項3に記載の方法。
【請求項8】
狭周波数帯域音声信号から広周波数帯域音声信号への切り替えが生じたとき、前記現在の音声信号のフレームの前記第1高周波数帯域信号および前記以前のM個の音声信号のフレームの前記第2高周波数帯域信号をウェイト付けして前記処理済み第1高周波数帯域信号を取得する前記ステップが、
指定の第4ウェイト1および指定の第4ウェイト2に従いウェイト付けして前記処理済み第1高周波数帯域信号を計算するステップであって、前記第4ウェイト1は前記第2高周波数帯域信号のウェイト値を指し、前記第4ウェイト2は前記第1高周波数帯域信号のウェイト値を指す、ステップと、
第3ウェイトステップにより前記第4ウェイト1を縮小し、前記第4ウェイト1が0に等しくなるまで前記第3ウェイトステップにより前記第4ウェイト2を拡大するステップであって、前記第4ウェイト1と前記第4ウェイト2との和は1に等しくなる、ステップと
を含む、請求項1または2に記載の方法。
【請求項9】
広周波数帯域音声信号から狭周波数帯域音声信号への切り替えが生じたとき、前記現在の音声信号のフレームの前記第1高周波数帯域信号および前記以前のM個の音声信号のフレームの前記第2高周波数帯域信号をウェイト付けして前記処理済み第1高周波数帯域信号を取得する前記ステップが、
指定の第5ウェイト1および指定の第5ウェイト2に従いウェイト付けして前記処理済み第1高周波数帯域信号を計算するステップであって、前記第5ウェイト1は指定の固定パラメータのウェイト値を指し、前記第5ウェイト2は前記第1高周波数帯域信号のウェイト値を指す、ステップと、
第4ウェイトステップにより前記第5ウェイト1を縮小し、前記第5ウェイト1が0に等しくなるまで前記第4ウェイトステップにより前記第5ウェイト2を拡大するステップであって、前記第5ウェイト1と前記第5ウェイト2との和は1に等しくなる、ステップと
を含み、
前記固定パラメータは、0以上であり、前記第1高周波数帯域信号のエネルギー値より小さい定数である、請求項1または2に記載の方法。
【請求項10】
音声信号を切り替えるための装置であって、
音声信号の切り替えが生じたとき、現在の音声信号のフレームの第1高周波数帯域信号および以前の1以上であるM個の音声信号のフレームの第2高周波数帯域信号をウェイト付けして、処理済み第1高周波数帯域信号を取得するように適合された処理モジュールと、
前記処理済み第1高周波数帯域信号および前記現在の音声信号のフレームの第1低周波数帯域信号を広周波数帯域信号に合成するように適合された第1合成モジュールと
を含む装置。
【請求項11】
前記音声信号の切り替えが生じていないときに、前記第1高周波数帯域信号および前記第1低周波数帯域信号を前記広周波数帯域信号に合成するように適合された第2合成モジュール
をさらに含む、請求項10に記載の装置。
【請求項12】
広周波数帯域音声信号から狭周波数帯域への切り替えが生じたときに、前記処理モジュールが
前記現在の音声信号のフレームの前記第1高周波数帯域信号に対応する微細構造情報およびエンベロープ情報を予測するように適合された予測モジュールと、
前記予測済みエンベロープ情報および前記以前のM個の音声信号のフレームの前記第2高周波数帯域信号に対応する以前のM個のフレームのエンベロープ情報をウェイト付けして、前記第1高周波数帯域信号に対応する第1エンベロープ情報を取得するように適合された第1生成モジュールと、
前記第1エンベロープ情報および前記予測済み微細構造情報に従い、前記処理済み第1高周波数帯域信号を生成するように適合された第2生成モジュールと
を含む、請求項10または11に記載の装置。
【請求項13】
前記現在の音声信号のフレームの前記第1低周波数帯域信号を分類するように適合された分類モジュールをさらに含み、
前記予測モジュールが、前記第1低周波数帯域信号の信号タイプに従い、前記微細構造情報および前記エンベロープ情報を予測するようにさらに適合された、
請求項12に記載の装置。
【請求項14】
前記第1合成モジュールが、
前記現在の音声信号のフレームおよび前記切り替え前の以前の音声信号のフレームに従い、前記処理済み第1高周波数帯域信号が減衰する必要があるか否かを判断するように適合された第1判断モジュールと、
前記処理済み第1高周波数帯域信号が減衰する必要がないと前記第1判断モジュールが判断したときに、前記処理済み第1高周波数帯域信号および前記第1低周波数帯域信号を前記広周波数帯域信号に合成するように適合された第3合成モジュールと、
前記処理済み第1高周波数帯域信号が減衰する必要があると前記第1判断モジュールが判断したときに、前記処理済み第1高周波数帯域信号に対応する減衰係数が所与のしきい値より大きいか否かを判断するように適合された第2判断モジュールと、
前記減衰係数が前記所与のしきい値より大きくないと前記第2判断モジュールが判断した場合、前記処理済み第1高周波数帯域信号と前記しきい値とを掛け、積および前記第1低周波数帯域信号を前記広周波数帯域信号に合成するように適合された第4合成モジュールと、
前記減衰係数が前記所与のしきい値より大きいと前記第2判断モジュールが判断した場合、前記処理済み第1高周波数帯域信号と前記減衰係数とを掛け、積および前記第1低周波数帯域信号を前記広周波数帯域信号に合成するように適合された第5合成モジュールと、
前記減衰係数を修正して前記減衰係数を縮小するように適合された第1修正モジュールと
を含み、
前記減衰係数の初期値は1であり、前記しきい値は0以上1未満である、請求項12に記載の装置。
【請求項15】
狭周波数帯域音声信号から広周波数帯域音声信号への切り替えが生じたときに、前記処理モジュールが
指定の第4ウェイト1および指定の第4ウェイト2に従いウェイト付けして前記処理済み第1高周波数帯域信号を計算するように適合され、前記第4ウェイト1は前記第2高周波数帯域信号のウェイト値を指し、前記第4ウェイト2は前記第1高周波数帯域信号のウェイト値を指す、第1計算モジュールと、
第3ウェイトステップにより前記第4ウェイト1を縮小し、前記第4ウェイト1が0に等しくなるまで前記第3ウェイトステップにより前記第4ウェイト2を拡大するように適合され、前記第4ウェイト1と前記第4ウェイト2との和が1に等しくなる、第2修正モジュールと
を含む、請求項10または11に記載の装置。
【請求項16】
狭周波数帯域音声信号から広周波数帯域音声信号への切り替えが生じたときに、前記処理モジュールが、
指定の第5ウェイト1および指定の第5ウェイト2に従いウェイト付けして前記処理済み第1高周波数帯域信号を計算するように適合され、前記第5ウェイト1は指定の固定パラメータのウェイト値を指し、前記第5ウェイト2は前記第1高周波数帯域信号のウェイト値を指す、第2計算モジュールと、
第4ウェイトステップにより前記第5ウェイト1を縮小し、前記第5ウェイト1が0に等しくなるまで前記第4ウェイトステップにより前記第5ウェイト2を拡大するように適合され、前記第5ウェイト1と前記第5ウェイト2との和は1に等しくなり、前記固定パラメータは0以上であり、前記第1高周波数帯域信号のエネルギー値より小さい定数である、第3修正モジュールと
を含む、請求項13に記載の装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13a】
image rotate

【図13b】
image rotate


【公表番号】特表2013−512468(P2013−512468A)
【公表日】平成25年4月11日(2013.4.11)
【国際特許分類】
【出願番号】特願2012−541316(P2012−541316)
【出願日】平成23年4月28日(2011.4.28)
【国際出願番号】PCT/CN2011/073479
【国際公開番号】WO2011/134415
【国際公開日】平成23年11月3日(2011.11.3)
【出願人】(504277388)▲ホア▼▲ウェイ▼技術有限公司 (220)