説明

音響信号の部分音を修復する方法

本発明は、周波数ωと位相φが分かっているピークPとピークPi+Nとの間の音響信号の部分音を修復する方法(1)に関するものである。本発明の方法(1)は、一つの部分音の欠損ピークPi+1からPi+N―1のそれぞれの周波数ωを計算し(2)、ピークPの位相からピークPi+Nの位相まで、前記計算によって得られたすべての周波数ωにつき、ピークからピークへと展開された位相の計算を行い(3)、同一のピークPi+Nにおける展開された位相と既知の位相との間の位相の誤差errφを計算し(4)、位相誤差errφによる値で、展開された位相φのそれぞれの補正を行う(5)、という手順からなる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、電気通信の分野に関するものであり、特に、音響信号のデジタル処理の分野に関するものであり、そのような信号の調和的表現に関するものである。
【背景技術】
【0002】
音響デジタル信号を調和的にモデル化するに際して、音響信号は発振器の集まりで表現され、そのパラメーター(周波数、振幅、位相)は、時間の経過と共にゆっくりと変化する。調和解析には、短期の時間/周波数解析が含まれ、それにより、これらのパラメーターの値を決定することができ、その後にピークの抽出、つぎに部分音の追跡が続く。
【0003】

【0004】
この種の解析と表示が使用可能なのは、特に、ビットレートの削減でのコード化を行う場合、パラメーター的なコード化(つまり、過渡的なもの、正弦曲線、ノイズと言う三つの様相に応じて信号を処理するコード化)の場合、音源を分離して指標付けする場合や、サウンドファイルを修復する場合である。
【0005】
広く認められている、部分音の合成の質を最良のものにするのに用いられる技術は、IEEE Transaction on Acoustics、Speech and Signal Processing、PP744−754、1986の“Speech Analysis/Synthesis Based on a Sinusoidal Representation”という記事でRobert J.McAulayとThomas F.Quatieriが提案し、あるいはWASPAA、New Paltz、NY、USA、October 2003の“Comparing the order of a Polynomial Phase Model for the Synthesis of Quasi−Harmonic Audio Signals”という記事でLaurent Girin、Sylvain Marchand、Joseph di Martino、axel Robel並びにGeoffroy Peetersが提案している位相を内挿する技術である。このような技術により、ピーク(A、f、φ)の部分音をピーク(Ai+1、f+1、φ+1)に合成することができるのだが、その際には、次元が3か5の多項式を用いて中間位相をすべて計算し、周波数は偏移により控除する。次元が3の内挿が用いられるのは、出発時と到着時の周波数と位相のみが分かっている場合である。次元が5の内挿が用いられるのは、(周波数は位相の導関数だと定義されているので、その周波数の1の次元における偏差に相当する)位相の2の次元の偏差が、更に分かっている場合である。
【0006】
ピークP(A、f、φ)とピークPi+1(Ai+1、fi+1、φi+1)との間の部分音の合成というのは、フレームiとi+1の間の部分音の値p(n)を計算することである。つまり、
【0007】
【数1】

【0008】
その目的の為に、周知のように、以下の二つの内挿法のうちのいずれかを用いて中間の位相をすべて計算する。
【0009】
Mac Aulay他の次元3の内挿法について言うと、位相の計算に用いる式は以下の通りである。
【0010】
【数2】

ただしTeはサンプリング期間。
【0011】
二つの未知数αとβの計算は、(f、φ、fi+1、φi+1)を用いる式の体系を解くことにより行う。周波数の控除は以下の偏移により行う。
【0012】
【数3】

【0013】
Girin他の次元5の内挿法について言うと、ピークPとピークPi+1での周波数の次元1での偏差δfとδfi+1は既知のものとする。その場合、位相の計算に用いる式は以下の通りである。
【0014】
【数4】

【0015】
三つの未知数β、δ、γの計算は、(f、fi+1、φ、φi+1、δf、δfi+1)を用いる式の体系を解くことにより行う。周波数の控除は以下の偏移により行う。
【0016】
【数5】

【0017】
様々な理由により、その信号の中に存在する幾つかの部分音が解析後の出力及び/または合成の際の入力において、欠如していたり、改竄されていたり、断絶していたりすることが起こりうる。例えば、インターネット上で音響プログラムを配信するアプリケーションにおいて、パケットが喪失した場合、デコーダーの入力のところで信号が欠けていることがありうるし、解析対象の信号が(ノイズ、クリック、他の信号等の)雑音信号により擾乱される場合には改竄されることがありうるし、あるいは、エネルギーが弱すぎて正確に連続して検出することができない場合には、断続的になることもある。従って、元の信号にできるだけ近い合成信号を再現できるように、欠損したピークを修復する技術を活用することが必要となるのは明らかである。その為には、それぞれが振幅、周波数、及び位相によって特徴づけられるピークを再現することが必要である。
【0018】
前述の内挿技術は、先行技術で既に知られているものであるが、欠損したピークに対応する部分を合成し、部分音を修復する為に用いられる。
【発明の開示】
【発明が解決しようとする課題】
【0019】
しかしながら、そのような周知の内挿技術は、短期のもの、つまり、10ms未満の期間用に適合化されたものである。更に長期間のものについては、再合成された信号は、しばしば元のものとはかけ離れたものであり、不快なアーチファクトが生じることがある。事実、そのような技術により、存在するピークと修復されたピークとの間の位相の連続性は確保されるのではあるが、それとは逆に、式(3)及び(5)で得られる誘導周波数を制御することはできない。このような結果は、内挿の距離が大きくなれば、それだけ一層、目立ったものになる。
【0020】
本発明の一つの目的は、特に、欠損部分が、既知の技術では効果の薄い(10msを越える)長時間のものに対応している場合に、欠損した部分であり、かつ部分音の欠損部分と識別される部分を修復する上での問題につき、代替の解決策を提案することである。
【0021】
また、本発明の対象により解決されるべき技術的課題は、調和解析の際に、一つの音響信号の部分音の欠損部分を修復する方法を提案することであり、その調和解析により、その音響信号が、時間フレームに切り分けられるのであり、その時間フレームに適用される時間/周波数解析が供給する短期の連続スペクトルは、サンプルの周波数フレームで表示され、その解析というのは更には、周波数フレームの中でスペクトルのピークを抽出し、そのようなピーク同士を時間の経過と共に結合させて、部分音を形成することにあり、この方法は、既に知られている解決法とは別の選択肢となるものである。
【課題を解決するための手段】
【0022】
与えられた技術的課題の、本発明による解決法は、周波数ωと位相φが分かっているピークPとピークPi+Nとの間の部分音の前記修復方法が、以下のような手順からなる解決法である。

【0023】
本発明の方法が、既に知られている方法と異なっている点は、欠損ピークの周波数の検査を更に緻密に行い、対応する位相が現れたあとで計算を行うことにより、存在するピークの位相との連続性を確保することである。したがって、既に説明した既知の方法とは逆に、本発明の方法では、欠損部分音の断片に対応するアーチファクトのない信号を、再合成することができる。
【0024】
更に、好都合なことに、本発明の方法により、再構成の誤差の点で、既に知られている方法で得られるものよりも、元の信号により近い信号を再構成することができる。
【0025】
最後に、本発明の方法の利点として、アルゴリズムがあまり複雑でないということがある。
【0026】
本発明が更に対象とするのは、ピークPとピークPi+Nとの間の部分音を修復する方法を実行する為の音響信号合成装置である。この装置は例えば、本発明の方法を実行できるように適合化された音響デコーダーかパラメーター・エンコーダーである。
【0027】
本発明が更に対象とするのは、前記装置または装置群の内部メモリーに直接実装可能なコンピューター・プログラム製品である。このコンピューター・プログラム製品は、そのプログラムがその装置または装置群で実行された際に、本発明の方法の手順を実行する為のソフトウェア・コードの幾つかの部分を含むものである。
【0028】
本発明が更に対象とするのは、前記装置または装置群の内部で使用可能な媒体であり、そこには前記装置または装置群の内部メモリーに直接実装可能なコンピューター・プログラム製品がインストールされており、そのプログラムは、その装置または装置群で実行された際に、本発明の方法の手順を実行する為のソフトウェア・コードの幾つかの部分を含むものである。
【発明を実施するための最良の形態】
【0029】
本発明の他の特徴と利点は、添付図面を参照しつつ行う以下の説明で明らかになっていくが、図面は例示の為のものであり、限定する趣旨のものではない。
【0030】
図1は、本発明の方法を進めていく一例のフローチャート。
【0031】
図2は、本発明の方法の使用例の一つの概略図。
【0032】
本発明の方法は、図1のフローチャートを参照しつつ説明される、以下のやり方で進められていく。方法1は、周波数ωと位相φが既に分かっているピークPとピークPi+Nとの間の一つの部分音を修復することにある。
【0033】

【0034】
一つの部分音が、互いに結合された一連のピークP(A、f、φ)で構成され、時点iTで得られたものであり、以下の通りに特徴づけられるとする。
・A、時点iTにおけるピークの振幅
・ω、時点iTにおけるピークの周波数
・φ、2πを法として時点iTにおけるピークの位相。
【0035】
ピークPとピークPi+Nとの間の欠損ピークの周波数の計算は、例えば、ωとωi+Nとの間での線形内挿か、例えばProceedings of the Digital Audio Effects(DAFx)Conference、pp141−146、Queen Mary、University of London、UK、September 2003のMathieu Lagrange、Sylvain Marchand、martin Raspaud並びにJean−Bernard Raultの“Enhanced Partial Tracking using linear Prediction”という記事で説明されているような、過去または未来についての線形予想か、あるいはまた、過去または未来についてのバランスのとれた組み合わせといった手段によって行われる。
【0036】
欠損ピークの振幅Aの計算は、例えば、AとAi+Nとの間での線形内挿か、過去または未来についての線形予想か、あるいはまた、過去または未来についてのバランスのとれた組み合わせといった手段によって行われる。
【0037】

【0038】

【0039】
【数6】

【0040】

【0041】

【0042】
【数7】

【0043】
【数8】

【0044】
【数9】

【0045】

【0046】
【数10】

【0047】
そのような配分は、均等でなくともよく、例えば非線形的な法則に従ってもよい。
【0048】

【図面の簡単な説明】
【0049】
【図1】本発明の方法を進めていく一例のフローチャート
【図2】本発明の方法の使用例の一つの概略図
【符号の説明】
【0050】
1 本発明方法

【特許請求の範囲】
【請求項1】
調和解析の際に、一つの音響信号の部分音を修復する方法(1)であり、その調和解析により、その音響信号が、時間フレームに切り分けられるのであり、その時間フレームに適用される時間/周波数解析が供給する短期の連続スペクトルは、サンプルの周波数フレームで表示され、その解析は、更には、周波数フレームの中でスペクトルのピークを抽出し、そのようなピーク同士を時間の経過と共に結合させて、部分音を形成することにあり、周波数と位相が分かっているピークPとピークPi+Nとの間の部分音を修復するその方法は、以下のような手順、

からなることを特徴とする方法。
【請求項2】

【数1】

で行う、請求項1に記載の音響信号の部分音の修復方法(1)。
【請求項3】

請求項1または2に記載の音響信号の部分音の修復方法(1)。
【請求項4】

請求項1または2に記載の音響信号の部分音の修復方法(1)。
【請求項5】

請求項1または2に記載の音響信号の部分音の修復方法(1)。
【請求項6】

請求項1または2に記載の音響信号の部分音の修復方法(1)。
【請求項7】
本方法が、更には、
・この部分音の欠損ピークPi+1からPi+N−1のそれぞれの振幅の計算を、既知のピークP及びPi+Nの振幅Aの間での線形予想によって行う、という手順を含むことにある、請求項1から6のいずれか一つに記載の音響信号の部分音の修復方法(1)。
【請求項8】
本方法が、更には、
・この部分音の欠損ピークPi+1からPi+N−1のそれぞれの振幅の計算を、過去についての線形予想によって行う、という手順を含むことにある、請求項1から6のいずれか一つに記載の音響信号の部分音の修復方法(1)。
【請求項9】
本方法が、更には、
・この部分音の欠損ピークPi+1からPi+N−1のそれぞれの振幅の計算を、未来についての線形予想によって行う、という手順を含むことにある、請求項1から6のいずれか一つに記載の音響信号の部分音の修復方法(1)。
【請求項10】
本方法が、更には、
・この部分音の欠損ピークPi+1からPi+N−1のそれぞれの振幅の計算を、過去についての線形予想と未来についての線形予想によって行う、という手順を含むことにある、請求項1から6のいずれか一つに記載の音響信号の部分音の修復方法(1)。
【請求項11】
位相の補正が、時点i+Nで計算された位相誤差errφを、その部分音のPi+1からPi+N−1までの全ての欠損ピークの間で均等に配分することにある、請求項1〜10のいずれか一つに記載の音響信号の部分音の修復方法(1)。
【請求項12】
補正された位相は以下の式:
【数2】

によって確定される、請求項11に記載の音響信号の部分音の修復方法(1)。
【請求項13】
位相誤差errφは以下の式の体系:
【数3】

【数4】

【数5】

によって確定される、請求項12に記載の音響信号の部分音の修復方法(1)。
【請求項14】
請求項1〜13のいずれか一つに記載の方法を実行する為の音響信号の合成装置であり、

含むことを特徴とする装置。
【請求項15】
請求項14に記載の装置または装置群の内部メモリーに直接実装可能なコンピューター・プログラム製品であり、そのプログラムがその装置または装置群で実行された際に、請求項1から13のいずれか一つの方法(1)の手順を実行する為のソフトウェア・コードの幾つかの部分を含むコンピューター・プログラム製品。
【請求項16】
請求項14に記載の装置または装置群の内部で使用可能であり、前記装置または装置群の内部メモリーに直接実装可能なコンピューター・プログラム製品がインストールされた媒体であり、そのプログラムが、その装置または装置群の上で実行された際に、請求項1から13のいずれか一つに記載の方法(1)の手順を実行する為のソフトウェア・コードの幾つかの部分を含む媒体。

【図1】
image rotate

【図2】
image rotate


【公表番号】特表2007−519043(P2007−519043A)
【公表日】平成19年7月12日(2007.7.12)
【国際特許分類】
【出願番号】特願2006−550220(P2006−550220)
【出願日】平成17年1月4日(2005.1.4)
【国際出願番号】PCT/FR2005/000019
【国際公開番号】WO2005/081228
【国際公開日】平成17年9月1日(2005.9.1)
【出願人】(591034154)フランス テレコム (290)