説明

信号分離方法および装置ならびに信号分離プログラムおよびそのプログラムを記録した記録媒体

【課題】 局所解に陥ることなく安定した最適化を行うと共に、分離信号の歪みを抑制する。
【解決手段】 歪み補正部2は、歪みが内在する分離信号と所定量だけ遅延させた観測信号から、歪みを補正した分離信号を算出する。このため、分離信号生成部1は、分離信号の歪みを考慮せず、分離信号の独立性などを高めることを最優先にして最適化を行う。信号分離装置は、分離信号の独立性制約条件を満たす分離信号を抽出し、所定の遅延を持つ観測信号と当該観測信号の重み付け線形和との誤差が最小となるようなフィルタを選択し、歪みを補正した分離信号を生成出力する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、複数の信号が空間内で混合されたものから目的とする信号の成分のみを抽出する、信号分離方法および装置、ならびに信号分離プログラムおよびそのプログラムを記録した記録媒体に係わり、特に、独立成分分析(ICA:Independent Component Analysis)により得られた分離フィルタの各要素が持つ任意性が引き起こす分離信号の歪みを抑制する、信号分離方法および装置ならびに信号分離プログラムおよびそのプログラムを記録した記録媒体に関する。
【背景技術】
【0002】
ICAによるブラインド信号分離技術について説明するために、ここで、ブラインド信号分離の定式化を行う。すべての信号はあるサンプリング周波数でサンプリングされ、離散的に表現されるものとする。また、N個の信号が混合されてM個のセンサで観測されたとする。ここでは、信号の発生源からセンサの設置場所までに距離があり、信号が減衰・遅延し、かつ複数の経路を経てセンサに到達する状況を扱うものとする。このような状況での混合は、源信号sk(t)からセンサxj(t)へのインパルス応答hjk(l)による畳み込み混合となり、そのときの観測信号xj(t)は、以下の演算式(1)で表現される。
【0003】
【数1】

【0004】
ここで、Pはインパルス応答hjk(l)の持続時間を表す。具体的な例として音信号が室内で混合される場合、音源からマイクまでの距離により音が減衰・遅延し、また壁などの反射により残響が発生する。その際のインパルス応答hjk(l)は、適当な時間経過後にパルス的な強い応答を持ち、時間と共に減衰していくものとなる。ブラインド信号分離の目的は、源信号s1(t)、…、sN(t)やインパルス応答h11(l)、…、h1N(l)、…、hM1(l)、…hMN(l)、…を知らずに、観測信号x1(t)、…、xM(t)のみから、個々の源信号を取り出した分離信号y1(t)、…、y(t)を求めることにある。
センサの数Mが信号源の数N以上である場合は、分離フィルタw11(l),…、w1M(l)、…wN1(l)、…wNM(l)を用いて以下の演算式(2)で分離信号を算出するのが一般的である。
【0005】
【数2】

【0006】
ここで、Lは分離フィルタのタップ数であり、混合の状況に応じて適当に定められる。例えば上記に述べたような室内での音信号の混合では、部屋の音響時間などを考慮して定められる。
【0007】
ブラインド信号分離を達成するために、これまでに様々な手法が提案されている。その中でも、ICAを用いた手法が主流となっている。この手法では、信号の独立性に着目して分離を達成するため、得られる分離信号yiにはフィルタの任意性が内在する。すなわち、yi(t)、…、y(t)が互いに独立となり、各yi(t)が分離信号となり得れば、それに任意のフィルタをかけた、以下の演算式(3)で示される信号も分離信号となり得る。この操作により、分離信号yiの他の信号に対する独立性は変化しないためである。
【0008】
【数3】

【0009】
ところで、フィルタの任意性は、適切に対処しなければ、分離信号の歪みを引き起こす。フィルタの任意性に対処するため、従来、以下に列挙する方法が用いられていた。
(1)白色化
最初に紹介する対処法は、分離信号を白色化するというものである。具体的にICAの学習が収束した際に、以下の演算式(4)が満たされるようにする。
【0010】
【数4】

【0011】
ここで、f(・)は信号のある高次統計量を反映する任意の奇関数であり、〈・〉tは時間方向に間する平均操作である。f(・)の例としては、サイン(sign)関数やシグモイド(sigmoid)関数がある。これが、i1≠i2のときに0になることはyi1とyi2が互いに独立になることに対応し、同じi1=i2に対してp≠0のときに0になることは分離信号が白色化されることに対応する(例えば、非特許文献1参照)。
無線通信における応用では、源信号が白色であることが多く、この白色化の制約はうまく働く。一方で、音声や音楽信号に対する応用では、信号が白色化されると音色が失われてしまい都合が悪い。
【0012】
(2)nonholonomic拘束
2つ目の対処法は、信号の独立性のみを考慮し、分離信号自身に対して何も制約をかけないというものである。これは[nonholonomic拘束]と称され、以下の演算式(5)が提案されている(例えば、非特許文献2、3、4参照)。
【0013】
【数5】

【0014】
上記した[nonholonomic拘束]によれば、分離信号の白色化を防ぐことはできる。しかしながらi1=i2のときは何も制約がないため、分離信号の歪みが大きくなる可能性があるといった問題がある。
【0015】
(3)観測信号の参照
3つ目の対処法は、上記した演算式(5)の条件に、観測信号と分離信号との差をできるだけ小さくするという条件を加えたものである。ここでは、分離信号の添字と同じ添字の観測信号を参照して以下の演算式(6)で示される最小化をICAの制約として導入している(例えば、非特許文献3参照)。
【0016】
【数6】

【0017】
また、すべての分離信号を足し合わせたものとある観測信号が同一になり得ることに着目し、以下の演算式(7)で示される最小化をICAの制約として導入している(例えば、非特許文献4参照)。
【0018】
【数7】

【0019】
いずれも、これらの制約が満たされた際には、源信号siのみをあるセンサjで観測したものが以下の演算式(8)で示される分離信号として算出される。
【0020】
【数8】

【0021】
上記した非特許文献3および4に示す手法によれば、観測信号を参照してフィルタの任意性を解決するため、音声や音楽信号に対する応用でも自然な音色を持つ分離信号が得られる。
【非特許文献1】S.Amari,S.C.Douglas,A.Cichocki,H.H.Yang,”Multichannel blind deconvolution and equalization using the natural gradient," IEEE Workshop on Signal Processing Advances in Wireless Communications,pp.101-104,April 1997.
【非特許文献2】S.Choi,S.Amari,A.Cichocki,R.liu,”Nateral Gradient Learning with a Nonholonomic Constraint for Blind Deconvolution of Multiple Channels," Proc.International Workshop on Independent Component Analysis and Blind Signal Separation (ICA' 99), pp 371-376, 1999.
【非特許文献3】K.Matsuoka,S.Nakashima,"Minimal Distortion Principle for Blind Source Separation," Proc.International Conference on Independent Component Analysis and Blind Signal Separation (ICA2001),pp.411-419,2001.
【非特許文献4】高谷、西川、猿渡、鹿野、「SIMPモデルに基づくICAを用いたブラインド音源分離」、日本音響学会2003年春季研究発表会講演論文集、 pp。 677-678。
【非特許文献5】S.Haykin著、鈴木、府川、大鐘、高田、村田、真田訳、「適応フィルタ理論」、科学技術出版、ISBN 4-87653-056-4
【発明の開示】
【発明が解決しようとする課題】
【0022】
上記した、非特許文献3、4に開示された手法では、演算式(5)で示す制約を表現するコスト関数の項と、演算式(6)あるいは演算式(7)の制約を表現するコスト関数の項の重み付き線形和により、全体のコスト関数が定義されている。
一般に、ICAにおけるコスト関数の最小化は、閉じた式により求められるものは少なく、コスト関数の微分により勾配を計算して、小さなステップサイズで徐々に最小化を進めていく。しかしながら、これらの手法のように、異なる複数のコスト関数を導入すると、それらの勾配が互いに相反することがある。その結果、局所最適解に陥り、複数の制約を同時に満たす解に到達できないことがある。特に、性質の悪い初期解から最小化を開始した場合は、その可能性が高まる。
【0023】
上記したように、ブラインド信号分離におけるフィルタの任意性に対する対処方法は幾つかあり、特に、音声や音楽等、有色信号への応用においては観測信号を参照する3つ目の方法(観測信号の参照)が有効である。しかしながら、これまでに提案されている方法によれば、複数の制約を同時に満たす解になかなか到達することができない。
本発明は上記事情に鑑みてなされたものであり、複数の制約を同時に満たす解に容易に到達する新規な手法を提案することにより、局所解に陥ることなく安定した最適化を行うと共に、分離信号の歪みを抑制することのできる、信号分離方法および装置ならびに信号分離プログラムおよびそのプログラムを記録した記録媒体を提供することを目的とする。
【課題を解決するための手段】
【0024】
上記した課題を解決するために本発明の信号分離装置は、入力される観測信号から互いに独立な分離信号を生成する分離信号生成部と、前記入力される観測信号に所定量の遅延を施した観測信号と、前記生成された分離信号との重み付け線形和の誤差を最小とするフィルタを算出して歪みを補正した分離信号を生成する歪み補正部と、を具備することを特徴とする。
【0025】
また、本発明において、前記所定量の遅延は、前記分離信号生成部における遅延と前記歪み補正部における遅延の和とすることを特徴とする。
【0026】
また、本発明において、前記歪み補正部は、前記生成された分離信号のそれぞれに対して設けられる前記フィルタと、前記フィルタのそれぞれに付随して設けられ、前記遅延が施されたある観測信号を参照信号とし、当該参照信号と前記歪みを補正した分離信号の少なくとも一部の和との差分を前記重み付け線形和の誤差として前記フィルタの係数を更新するフィルタ係数制御部と、を具備することを特徴とする。
【0027】
また、本発明は、センサによって観測される信号から、演算装置により、歪みを補正した、互いに独立した分離信号を生成出力する信号分離方法であって、前記演算装置は、入力される観測信号から互いに独立な分離信号を生成するステップと、前記入力される観測信号に所定量の遅延を施した観測信号と、前記生成された分離信号との重み付け線形和の誤差を最小とするフィルタを算出して前記歪みを補正した分離信号を生成出力するステップと、を有することを特徴とする。
【0028】
また、本発明は、センサによって観測される信号から、歪みを補正した、互いに独立した分離信号を生成出力する信号分離装置に用いられるプログラムであって、入力される観測信号から互いに独立な分離信号を生成するステップと、前記入力される観測信号に所定量の遅延を施した観測信号と、前記生成された分離信号との重み付け線形和の誤差を最小とするフィルタを算出して前記歪みを補正した分離信号を生成出力するステップと、をコンピュータに実行させることを特徴とする。
【0029】
また、本発明は、センサによって観測される信号から、歪みを補正した、互いに独立した分離信号を生成出力する信号分離装置に用いられるプログラムを記録したコンピュータ読み取り可能な記録媒体であって、入力される観測信号から互いに独立な分離信号を生成するステップと、前記入力される観測信号に所定量の遅延を施した観測信号と、前記生成された分離信号との重み付け線形和の誤差を最小とするフィルタを算出して前記歪みを補正した分離信号を生成出力するステップと、をコンピュータに実行させるプログラムを記録したことを特徴とする。
【発明の効果】
【0030】
本発明によれば、歪み補正部が、歪みを内在する分離信号と所定量だけ遅延させた観測信号から歪みを補正した分離信号を算出することで、分離信号生成部は、分離信号の歪みを考慮せずに分離信号の独立性などを高めることを最優先にして最適化を行うことができる。このため、分離信号の独立性制約条件を満たす分離信号を抽出し、所定の遅延を持つ観測信号と当該観測信号の重み付け線形和との誤差が最小となるようなフィルタを選択し、歪みを補正した分離信号を生成出力することで、分離信号の歪みを抑制し、局所解に陥ることなく安定した最適化が可能になる。
また、本発明によれば、様々な干渉が発生する環境において、その干渉を抑制し目的とする信号のみを取り出すことができ、例えば、音声認識のフロントエンドとして働く音源分離システムに適用することで、話者とマイクが離れた位置にあり、マイクが話者の音声以外をも集音してしまう環境にあっても、話者の音声のみを抽出することで信頼性の高い音声認識が可能になる。
【発明を実施するための最良の形態】
【0031】
図1は、本発明実施形態に係わる信号分離装置の全体構成を示すブロック図である。本発明実施形態に係わる信号分離装置は、分離信号生成部1の後段に歪み補正を行う歪み補正部2が接続され、また、歪み補正部2には、上記した分離信号の他に、遅延生成部3により、所定量の遅延が施された観測信号が供給されている。
上記構成において、N個の源信号が混合された信号が図示せぬセンサで観測されると、観測信号x1(t)、…、x(t)が分離信号生成部1に入力され、互いに独立な分離信号z1(t)、…、zN(t)として出力される。これらの分離信号には、歪みが内在し得るものとする。そして後段の歪み補正部2において、所定量(D)だけサンプル遅延された観測信号x1(t−D)、…、xM(t−D)(すべてあるいはその一部分)と歪みを内在する分離信号zl(t)、…zN(t)を入力とし、歪みを補正した分離信号y1(t)、…、yN(t)を出力する。
【0032】
ここで、遅延量Dは、分離信号生成部1での遅延Dと、歪み補正部2での遅延Dの和D=D十Dとする。なお、各部での遅延は、各部で用いられるフィルタのタップ数LおよびLの半分、すなわちD=L/2およびD=L/2とするのが一般的である。
【0033】
分離信号生成部1では、任意のブラインド信号分離方法を用いることができ、後述する摘要結果に示されるように、ここでは、歪み補正の効果を強調するために非特許文献1に開示された方法を用いることとする。この方法によれば、上記した演算式(4)による制約に従うため、分離信号ziが白色化される。
歪み補正部2では、Dサンプル遅延の観測信号x1(t−D)、…、xM(t−D)と歪みを内在する分離信号zl(t)、…、zN(t)を入力とし、Lタップのフィルタaji(l)を複数個用意して、以下の演算式(9)で示される誤差の自乗平均〈|ej(t)|〉tが最小化されるようにフィルタajiを算出する。
【0034】
【数9】

【0035】
そして、各分離信号ziに対して適当にフィルタajiを選び、歪みを補正した、以下の演算式(10)で示される分離信号yi(t)を算出する。
【0036】
【数10】

【0037】
フィルタajiを算出する方法としては様々なものが考えられるが、ここでは、LMSアルゴリズムに従い、以下に示すフィルタ係数更新のための演算式(11)に従いフィルタ係数を更新していく。
【0038】
【数11】

【0039】
ここで、μは適度に小さなステップサイズである。
【0040】
図2に、LMSアルゴリズムに従い歪み補正を行う歪み補正部の実施形態を示す。ここでは、ある1つの観測信号xj(t−D)を参照信号として、歪みを補正した分離信号y1(t)、…、yN(t)を算出している。
演算式(9)に従い誤差ej(t)が算出され、これがフィルタ21、22、23に付随してそれぞれ設けられた係数制御部24、25、26に入力されている。係数制御部24、25、26では、上記した演算式(11)のうち、μzi(t-l)ej(t)に関する項を計算し、演算式(11)に従ってフィルタ係数を更新する。
【0041】
歪み補正部2では、「歪みを補正したどの分離信号の総和(加算器27、28による)と参照信号の差分(減算器29による)差を最小化するか」と、「どの観測信号を参照信号として用いるか」の2つについて設計の自由度が存在する。
前者については、ここでは、歪みを補正した分離信号の全ての総和(y1(t)+y(t)+…+y(t))を用いているが、それら一部の総和を用いても良い。すなわち、|I|≧1を満たす部分集合I⊆{1,…,N}を用いて、以下の演算式(12)で示す誤差を最小化するようにしてもよい。
【0042】
【数12】

【0043】
後者に関しては、ここでは、ある1つのxjのみを参照信号として用いた。これは、上記した演算式(10)において同じjに関するフィルタajiを選んでいることになる。もし、個々の分離信号yiに対して異なるjを選ぶ場合は、対応するそれぞれのjに関して、演算式(9)もしくは演算式(12)に基づく最小化を同様に行えばよい。
【0044】
ここで、上記した本発明実施形態を2つの音声の分離に適用した場合の結果について説明する。ここでは、残響時間130msの部屋で7秒間の音声2つs1、s2を混合し、2つのマイクでの観測信号x1、x2に対して本発明実施形態を適用した。その結果、分離信号生成部1の出力に白色化された分離信号z1、z2を得て、歪み補正部2の出力に歪みを補正した分離信号y1、y2を得た。このときの元の音声と分離信号の周波数毎のパワー比較について図3、図4にグラフで示す。図3、図4共に、横軸は周波数、縦軸はパワー(利得)を示す。
【0045】
図3のグラフにおいて、濃い実線は元の音声s1、淡い実線は白色化された分離信号z1のパワーである。図3によれば、z1は大きく歪んでおり、元の音色は失われていることが分かる。
一方、図4のグラフにおいて、濃い実線は元の音声s1、淡い実線は歪みを補正した分離信号y1のパワーである。y1は元の音声に近い周波数毎のパワーを持っており、音色がほぼ回復されていることが分かる。
【0046】
上記したように、本発明実施形態によれば、分離信号生成部1の後段に歪み補正を行う歪み補正部2が接続される。このため分離信号生成部1は、分離信号の歪みを考慮する必要はない。歪み補正部2は、歪みが内在する分離信号と、適切なサンプル数遅延させた観測信号から、歪みを補正した分離信号を算出する。このため、分離信号生成部1は、分離信号の歪みを考慮せず、分離信号の独立性などを高めることを最優先にして最適化を行うことができる。具体的には、演算式(4)、あるいは演算式(5)の制約を表現するコスト関数のみを最小化すれば良く、これらの制約を満たす解に到達しやすくなる。
また、歪み補正部2は、歪みを小さくするための制約、例えば、演算式(6)あるいは演算式(7)の制約を表現するコスト関数のみを最小化すれば良い。これらは、LMS(Least Mean Square)アルゴリズム、RLS(Recursive Least Squares)アルゴリズム、Affine Projectionアルゴリズムなど、従来の適応フィルタに関する技法により容易に最小化できる。なお、LMSとRLSに関しては、上記した非特許文献5に詳細な開示かある。
【0047】
以上説明のように、本発明は、ブラインド信号分離におけるフィルタの任意性を解決するものであり、上記した適用結果をグラフ表示したように、混合系インパルス応答hjkによる信号の劣化が顕著でなければ(音を例示した場合、残響時間がそれほど長くなければ)、源信号の周波数特性をほぼ回復した分離信号を得ることができる。た但し、これは、上記した従来技術における3つ目の対処(観測信号を参照する)がうまく働くことにより達成できたものである。
このため、本発明によれば、従来技術における3つ目の対処法と比較して以下に列挙する利点がある。
(1)独立成分分析などによる信号分離と、分離信号の歪み補正する操作を別々に行うため、双方が安定して動作する。従来技術における3つ目の対処法によれば、信号分離のためのコスト関数と歪み補正のためのコスト関数が同時に最小化されていたため、安定して動作するとは限らない。
(2)分離信号生成部1に任意の手法を用いることができる。本発明実施形態によれば、非特許文献1に開示された手法を用いたが、非特許文献2に開示された手法を少し変更したものであっても、その他、どの手法を用いてもよい。今後、より高い分離性能を達成する信号分離の手法が提案された場合にも何等変更を要することなく分離信号生成部1の実装が可能である。
(3)歪み補正部2は、分離信号生成部1の内部の実装に依存することなく、フィルタの任意性を含む分離信号を受信するのみで正しく歪みを補正することができる。
【図面の簡単な説明】
【0048】
【図1】本発明実施形態に係わる信号分離装置の全体構成を示すブロック図である。
【図2】図1に示す歪み補正部の内部構成を示すブロック図である。
【図3】本発明実施形態を音声分離に適用した場合の周波数特性を示す図である。
【図4】本発明実施形態を音声分離に適用した場合の周波数特性を示す図である。
【符号の説明】
【0049】
1…分離信号生成部、2…歪み補正部、3…遅延生成部、21〜23…フィルタ、24〜26…係数制御部、27、28…加算器、29…減算器


【特許請求の範囲】
【請求項1】
入力される観測信号から、互いに独立な分離信号を生成する分離信号生成部と、
前記入力される観測信号に所定量の遅延を施した観測信号と、前記生成された分離信号との重み付け線形和の誤差を最小とするフィルタを算出して歪みを補正した分離信号を生成する歪み補正部と、
を具備することを特徴とする信号分離装置。
【請求項2】
前記所定量の遅延は、
前記分離信号生成部における遅延と前記歪み補正部における遅延の和とすることを特徴とする請求項1に記載の信号分離装置。
【請求項3】
前記歪み補正部は、
前記生成された分離信号のそれぞれに対して設けられる前記フィルタと、
前記フィルタのそれぞれに付随して設けられ、前記遅延が施されたある観測信号を参照信号とし、当該参照信号と前記歪みを補正した分離信号の少なくとも一部の和との差分を前記重み付け線形和の誤差として前記フィルタの係数を更新するフィルタ係数制御部と、
を具備することを特徴とする請求項1または2に記載の信号分離装置。
【請求項4】
センサによって観測される信号から、演算装置により、歪みを補正した、互いに独立した分離信号を生成出力する信号分離方法であって、
前記演算装置は、
入力される観測信号から互いに独立な分離信号を生成するステップと、
前記入力される観測信号に所定量の遅延を施した観測信号と、前記生成された分離信号との重み付け線形和の誤差を最小とするフィルタを算出して前記歪みを補正した分離信号を生成出力するステップと、
を有することを特徴とする信号分離方法。
【請求項5】
センサによって観測される信号から、歪みを補正した、互いに独立した分離信号を生成出力する信号分離装置に用いられるプログラムであって、
入力される観測信号から互いに独立な分離信号を生成するステップと、
前記入力される観測信号に所定量の遅延を施した観測信号と、前記生成された分離信号との重み付け線形和の誤差を最小とするフィルタを算出して前記歪みを補正した分離信号を生成出力するステップと、
をコンピュータに実行させるプログラム。
【請求項6】
センサによって観測される信号から、歪みを補正した、互いに独立した分離信号を生成出力する信号分離装置に用いられるプログラムを記録したコンピュータ読み取り可能な記録媒体であって、
入力される観測信号から互いに独立な分離信号を生成するステップと、
前記入力される観測信号に所定量の遅延を施した観測信号と、前記生成された分離信号との重み付け線形和の誤差を最小とするフィルタを算出して前記歪みを補正した分離信号を生成出力するステップと、
をコンピュータに実行させるプログラムを記録した記録媒体。


【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate


【公開番号】特開2006−17961(P2006−17961A)
【公開日】平成18年1月19日(2006.1.19)
【国際特許分類】
【出願番号】特願2004−194945(P2004−194945)
【出願日】平成16年6月30日(2004.6.30)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】