説明

正弦波符号化

【課題】有利な符号化を提供する。
【解決手段】信号の符号化が供給され、ここで、この信号における少なくとも1つの正弦波成分の周波数及び振幅情報が決定され、これら周波数及び振幅情報を表す正弦波パラメータが送信され、更に、送信された正弦波パラメータから正弦波成分を復元する間に追加されるべき位相ジッタの量を表す位相ジッタパラメータが送信される。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、少なくとも1つの正弦波成分の周波数及び振幅情報が決定され、これら周波数及び振幅情報を表す正弦波パラメータが送信される、信号の符号化に関する。
【背景技術】
【0002】
米国特許公報US-A 5,664,051号は、音声符号器で音声を処理することにより生成される型式のデジタル化された音声ビットストリームから音声信号を合成する音声復号装置を開示している。この装置は、前記音声符号器により処理された音声を表す複数の正弦波成分の各々に対する角周波数及び振幅を生成するように、前記デジタル化された音声ビットストリームを処理する分析器であって、一連の時間を通じて角周波数及び大きさを生成する分析器と、ランダム位相成分の時系列を生成するランダム信号発生器と、少なくとも幾つかの正弦波成分に対し、角周波数及びランダム位相成分から生成される合成された位相の時系列を生成する位相合成器と、合成器が角周波数、振幅及び合成された位相の時系列から音声を合成する合成器とを含む。この文献は、合成された音声の品質における大幅な改善が、音声の有声音(すなわち、主要な高調波で構成される)部分における高調波の位相を符号化せずに、代わりに受信側でこの高調波の人工的な位相を合成することにより達成することが可能である。この高調波の位相情報を符号化しないことによって、この位相を表すのに使用されていたビットは、符号化された音声の他の成分(例えば、ピッチ、高調波の大きさ)の質を改善するのに利用可能である。前記人工的な位相を合成するとき、セグメント内の高調波の位相及び周波数が考慮される。更に、ランダム位相成分、すなわちジッタ(jitter)は、位相のランダム性を取り入れるために加えられる。多くのジッタは、周波数帯域のより多くの部分が無音である音声セグメントに使用される。このランダムなジッタは、バジー(buzzy)を避けて合成された音声の質、位相が人工的に合成されるときに生じる人工的な質を改善する。
【発明の概要】
【発明が解決しようとする課題】
【0003】
本発明の目的は、有利な符号化を提供することである。このために、本発明は、独立請求項に規定されるような、信号を符号化する方法、符号化された信号を復号する方法、音声符号器、オーディオプレーヤ、オーディオシステム、符号化信号及び記憶媒体を提供する。有利な実施例は、従属請求項に規定されている。本発明は、合成中に復号器において与えられるべき位相ジッタの量を示すために、符号器から復号器へ位相ジッタパラメータを送信することによって位相ジッタを与えるという有利なやり方を提供する。とりわけ、位相ジッタパラメータを送ることは、復号器において与えられる位相ジッタの量と本来の信号との関係が確立されるという利点を有する。このようにして、本来の音声信号に上手く対応する再現された音声信号のより自然な音が得られる。更に、与えるべき位相ジッタの量は、自然な音信号(sounding signal)を生成するのに与えられるべき位相ジッタの量を復号器において部分的に決定される必要はないので、より素早くそして確実に決定することが可能である。
【課題を解決するための手段】
【0004】
符号化されたビットストリームに位相ジッタパラメータを含むことにより、ビットレートが増大する。しかしながら、この増大するビットレートは、これらの位相ジッタパラメータが非常に低い更新率、例えばトラックに一度することができるため、最小にすることができる。トラックは、所与の周波数及び振幅を持った正弦波成分、すなわち、正弦波セグメントの完全な組である。好ましくは、位相ジッタパラメータは、トラックの最初のインスタンスにおいて正弦波の周波数及び振幅とほぼ一緒に送信される。この場合、全ての必要とされる情報が復号時の初期の段階で利用可能となる。
【0005】
本問題の他の解決法は、本来の位相、すなわち、例えば、周波数は、合成中に個々の時間においてこの本来の位相を整合させるような様々な時間において本来の位相又は位相差を送信することである。これら本来の位相パラメータを送信することは、良好な品質となるが、より高いビットレートを必要とする。
【0006】
好ましい実施例において、高次的に関係する周波数に与えられる位相ジッタがこの関係する周波数と同じ高次関係を持つとする。それは、高次的に関係する周波数の集合毎に1つの位相ジッタパラメータを送信するのに十分である。
【0007】
これら位相ジッタパラメータは、本来の位相において測定される統計的な偏差から得られることが好ましい。好ましい実施例において、信号の本来の位相と予測される位相との差が決定され、この予測される位相は、送信される周波数パラメータ及び位相の連続性の条件から計算され、位相ジッタパラメータは前記差から得られる。連続する位相の場合、各トラックにおける正弦波の最初のインスタンスだけに位相パラメータを含むので、この正弦波の連続するセグメントは、現在の正弦波のセグメントの位相と揃えるように、これらの位相パラメータを整合、すなわち計算する。連続する位相の基準に基づく復元される位相は、本来の位相との関係を失っている。従来技術において述べたように、連続する位相と共同して一定の周波数及び振幅で復元される信号は、幾らか人工的に聞こえる。
【0008】
一般的には、位相ジッタパラメータが位相ジッタの正確な量を示すことは必要とされない。復号器は、この位相ジッタパラメータの値及び/又は信号の特性に基づくある決まった計算を行なう。
【0009】
極端な場合、位相ジッタパラメータはたった1つのビットで構成される。この場合、例えば、0は、位相ジッタが与えられるべきではないことを示し、1は、位相ジッタが与えられるべきであることを示す。復号器において与えられるべき位相ジッタは、既定量でもよく、信号の特性から既定のやり方で得られてもよい。
【図面の簡単な説明】
【0010】
【図1】本発明による音声符号器を有する実施例を示す。
【図2】本発明によるオーディオプレーヤを有する実施例を示す。
【図3】本発明によるオーディオシステムの実施例を示す。
【発明を実施するための形態】
【0011】
本発明の上述した及び他の特徴は、以下に記載される実施例から明らかであり、これらを参照して説明する。
【0012】
図面は、本発明を理解するのに必要な要素のみを示す。
【0013】
本発明は、音声符号化手法だけでなく、正弦波音声符号化手法でもある、一般的な正弦波符号化手法に好ましくは適用される。正弦波符号化手法において、符号化すべき音声信号は、それの周波数及び振幅が符号器において決定される複数の正弦波によって表される。しばしば、位相が送信されるのではなく、2つの連続するセグメント間の位相が連続するように合成が行なわれる。これがビットレートを節約するために行なわれる。典型的な正弦波符号化手法において、多くの正弦波成分に対する正弦波パラメータが抽出される。1つの成分に対する正弦波パラメータの組は、少なくとも周波数及び振幅で構成される。より高度な符号化手法は、時間の関数として、周波数及び/又は振幅の推移に関する情報も抽出する。最も簡単な場合、これら周波数及び振幅は、ある時間内において一定であると仮定される。この時間は、更新間隔として示され、典型的には5msから40msに及ぶ。合成中、連続するフレームの周波数及び振幅は、接続されなければならない。トラッキングアルゴリズムは、周波数トラックを特定するのに適用することができる。この情報に基づいて、例えば1つのトラックに対応する正弦波成分が適切に接続するように連続する位相が計算されることが可能である。これは、位相が不連続となることを避けるので、重要であり、これらはほぼ常時可聴である。これら周波数は、各更新間隔にわたり一定であるので、連続して復元される位相は、本来の位相との関係を失っている。
【0014】
図1は、本発明による例示的な音声符号器2を示す。音声信号Aは、例えば、マイク、記憶媒体、ネットワーク等のような音源1から得られる。この音声信号Aは、音声符号器2に入力される。この音声信号Aの正弦波成分は、音声符号器2においてパラメータによりモデル化される。符号ユニット20は、音声信号A、少なくとも1つの正弦波成分の周波数パラメータf及び振幅パラメータaから得られる。これら正弦波パラメータf及びaは、マルチプレクサ21において符号化音声信号A'に含まれる。この音声ストリームA'は、無線接続、データバス又は記憶媒体等でもよい通信チャンネル3を介して音声符号器からオーディオプレーヤへ供給される。符号器において、正弦波トラックが特定される。これは、2つのインスタンスt及びtにおいて、周波数及び位相は公知であることを意味している。tにおける周波数トラック及び位相から、tにおける位相が予測可能である。これは、復号器において行なわれるのと同じやり方で好ましくは行なわれる。tにおける予測される位相と実際に測定された位相との誤差が計算される。例えば平均絶対値又は分散のようなこの誤差の特性値が決定される。好ましくは、位相ジッタパラメータは、この特性値から得られる。このようにして、必要とされる位相ジッタは、実際の位相と符号器の正弦波パラメータから決定される位相との差を計算することによって、符号器において決定される。この差から得られる位相ジッタパラメータは、合成時に、対応する信号の位相を僅かに変化させることで位相ジッタの得られる量を導入するように位相ジッタパラメータを使用する復号器に送信される。
【0015】
位相ジッタパラメータを決定する代わりのやり方は、本来の周波数の変動(fluctuation)を監視することである。
【0016】
本発明によるオーディオプレーヤ4を有する実施例を図2に示す。音声信号A'は、通信チャンネル3から得られ、符号化された音声信号A'に含まれる正弦波パラメータf及びa並びに位相ジッタパラメータpを得るために、デマルチプレクサ40において多重分離(demultiplex)される。これらパラメータf、a及びpは、正弦波合成(SS)ユニット41に供給される。SSユニット41において、本来の音声信号Aにおける正弦波成分Sとほぼ同じ特性を有する正弦波成分S'が作成される。正弦波成分S'は、他の復元される成分と一緒に多重化され、スピーカでもよい出力ユニット5に出力される。復号器において、位相ジッタパラメータpが使用可能である。位相の連続性及び周波数(従って位相)の補間という何らかを用いて各インスタンスにおいて信号の位相を決定するのに次いで、この位相ジッタパラメータは、構成される位相の補間に外乱を加えるのに使用される。この新しい位相は、周波数が合成中にこれら新しい位相の値に整合するように調節される程度まで「本来の位相」として扱われる。
【0017】
図3は、図1に示される音声符号器2及び図2に示されるオーディオプレーヤ4を有する本発明によるオーディオシステムを示す。このようなシステムは、再生及び記録機能を提供する。通信チャンネル3は、オーディオシステムの一部であってもよいが、しばしばこのオーディオシステムの外側にある。この通信チャンネル3が記憶媒体である場合、この記憶媒体はこのシステム内に取り付けられてもよいし、脱着可能なディスク、テープ、メモリースティック等でもよい。
【0018】
上述の実施例は本発明を限定するのではなく、説明するものであり、当業者は、付してある請求項の範囲から逸脱せずに、多数の他の実施例を設計可能であることに注意すべきである。これら請求項において、カッコの中にある参照番号が本請求項を制限するとは解釈されない。「有する」という単語は、請求項に挙げられた以外の他の要素又はステップの存在を排除するものではない。本発明は、幾つかの別個の要素を有するハードウェア及び適当にプログラムされたコンピュータを用いて実施することが可能である。幾つかの手段を列挙する装置の請求項において、これら手段の幾つかがハードウェアの同じ項目により具体化される。ある方策が互いに異なる従属請求項に述べられるという単なる事実は、これら方策の組み合わせが有利に使用することができないことを示すものではない。
【0019】
要約すると、信号の符号化が供給され、ここで、この信号における少なくとも1つの正弦波成分の周波数及び振幅情報が決定され、これら周波数及び振幅情報を表す正弦波パラメータが送信され、更に、送信された正弦波パラメータから正弦波成分を復元する間に追加されるべき位相ジッタの量を表す位相ジッタパラメータが送信される。

【特許請求の範囲】
【請求項1】
信号を符号化する方法であって、
前記信号における少なくとも1つの正弦波成分の周波数及び振幅情報を決定するステップと、
前記周波数及び振幅情報を表す正弦波パラメータを送信するステップと、
送信された正弦波パラメータから前記正弦波成分を復元する間に加えられるべき位相ジッタの量を表す位相ジッタパラメータを送信するステップとを有する、方法。
【請求項2】
前記位相ジッタパラメータは、トラックの最初のインスタンスにおいて前記正弦波パラメータとほぼ一緒に送信される、請求項1に記載の方法。
【請求項3】
位相ジッタパラメータは、正弦波成分の所与のグループに対して送信され、これらの正弦波成分は、高次的に関係する周波数を有する、請求項1に記載の方法。
【請求項4】
前記正弦波成分の位相と予測された位相との間の差を決定するステップであって、当該予測された位相は、前記送信された正弦波パラメータと位相の連続性の条件とから計算される、ステップと、
前記差から前記位相ジッタパラメータを導出するステップとを有する、請求項1に記載の方法。
【請求項5】
符号化された信号を復号する方法であって、
少なくとも1つの正弦波成分の周波数及び振幅情報を表す正弦波パラメータを受信するステップと、
前記正弦波パラメータから前記少なくとも1つの正弦波成分を復元するステップと、
位相ジッタパラメータを受信するステップと、
位相ジッタの量を前記正弦波成分に加えステップとを有し、
前記位相ジッタの量は、前記位相ジッタパラメータから導出される、方法。
【請求項6】
信号における少なくとも1つの正弦波成分の周波数及び振幅情報を決定する手段と、
前記周波数及び振幅情報を表す正弦波パラメータを送信する手段と、
送信された正弦波パラメータから前記正弦波成分を復元する間に加えられるべき位相ジッタの量を表す位相ジッタパラメータを送信する手段とを有する、音声符号器。
【請求項7】
少なくとも1つの正弦波成分の周波数及び振幅情報を表す正弦波パラメータを受信する手段と、
前記正弦波パラメータから前記少なくとも1つの正弦波成分を復元する手段と、
位相ジッタパラメータを受信する手段と、
位相ジッタの量を前記正弦波成分に加える手段とを有し、
前記位相ジッタの量は、前記位相ジッタパラメータから導出される、オーディオプレーヤ。
【請求項8】
請求項6に記載の音声符号器と請求項7に記載のオーディオプレーヤとを有する、オーディオシステム。
【請求項9】
少なくとも1つの正弦波成分の周波数及び振幅情報を表す正弦波パラメータを有し、更に前記正弦波パラメータから前記正弦波成分を復元する間に加えられるべき位相ジッタの量を表す位相ジッタパラメータを有する符号化された信号。
【請求項10】
請求項9に記載の符号化された信号が記憶されている記憶媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate


【公開番号】特開2013−80252(P2013−80252A)
【公開日】平成25年5月2日(2013.5.2)
【国際特許分類】
【外国語出願】
【出願番号】特願2012−283301(P2012−283301)
【出願日】平成24年12月26日(2012.12.26)
【分割の表示】特願2002−503861(P2002−503861)の分割
【原出願日】平成13年6月14日(2001.6.14)
【出願人】(590000248)コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ (12,071)
【Fターム(参考)】