信号分離方法および信号分離装置

【課題】複数の信号の中から必要とする信号を分離抽出する場合、周波数領域および時間領域での独立成分分析法では、Permutationと呼ばれる現象の為に分離精度が低下する問題があった。特に、この現象は信号源の数がセンサの数よりも小さい時に顕著となっている。このため本発明においては、信号源の数とセンサの数との不整合による性能劣化の問題解決を目的とした。
【解決手段】周波数領域（ＦＤ）および時間領域（ＴＤ）での独立成分分析（ＩＣＡ）を順次行い、特に、ＦＤＩＣＡにおける信号の識別過程を複数個のサブブロックに分割する構成とした。この処理過程で信号源の数を推定し、この結果を用いて実質的に実働センサの数と信号源の数とを合わせるようにした。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、複数のマイクロホン（以下マイクと略記）等のセンサで検知した複数の信号の中から必要とする信号を分離抽出する方法およびその装置に関する。
【背景技術】
【０００２】
複数の信号が混在されて観測された場合に、観測信号だけを用いて源信号を同定する技術を Blind
Source Separation(以下ＢＳＳと記述)と呼ぶ。近年では、独立成分分析（Independent Component Analysis；以下ＩＣＡと記述）に基づく信号分離手法が主流である。
この信号分離手法によれば、例えば、複数の音信号をＫ個のマイク（センサ）で受信し、各音源から到来する音信号同士が統計的に独立であることを利用して前記の受信信号を処理することで、マイクと同数のＫ個もしくはＫ個以下の音源を分離することができる。当初、ＩＣＡを用いた音源分離法は、各音源からの到来音の時間差が考慮されていなかったため、マイクアレーに適用することは困難であった。しかし近年では、時間差を考慮し、マイクアレーを用いて複数の音信号を観測し、周波数領域でこれら複数の音源から到来する信号の混合過程に対する逆変換を求める手法が多数提案されている。
【０００３】
一般に、Ｌ個の複数音源から到来する音信号が線形に混合されてＫ個のマイクで観測されている場合、観測された音信号は、ある周波数ｆにおいて以下のように書くことができる。
【０００４】
【数１】

ここで、Ｓ(f)は各音源から送出される音信号ベクトル、Ｘ(f)は受音点であるマイクアレーで観測された観測信号ベクトル、Ａ(f)は各音源と受音点との空間的な音響系の伝搬特性を示す伝搬ベクトルに関する混合行列であり、それぞれ以下のように書くことができる。
【０００５】
【数２】

【０００６】
【数３】

【０００７】
【数４】

ここで右肩付のＴはベクトルの転置を、’記号は各行列における要素（スカラー量）をそれぞれ表す。このとき、混合行列Ａ(f)が既知であれば、受音点での観測信号ベクトルＸ(f)を用いて、
【０００８】
【数５】

のようにＡ(f)の一般逆行列を計算することで音源から送出される音信号ベクトルＳ(f)を計算することができる。しかし一般に伝搬ベクトルＡ(f)は未知であり、観測信号ベクトルＸ(f)だけを利用することで音信号ベクトルＳ(f)を求めなければならない。
【０００９】
ＢＳＳ問題を解くためには、音信号ベクトルＳ(f)が確率的に発生し、更に、この音信号ベクトルＳ(f)の各成分が全て互いに独立であると仮定する。このときマイクで検知された観測信号ベクトルＸ(f)は複数の音源信号が混合された信号であるため、この観測信号ベクトルＸ(f)の各成分の分布は独立ではない。そこで、観測信号ベクトルＸ(f)に含まれる独立な成分、すなわち混合された音源信号からＩＣＡによって各音源信号を探索することを考える。すなわち、観測信号ベクトルＸ(f)を独立な成分に変換する行列Ｗ(f)（以下、逆混合行列）を計算し、観測信号ベクトルＸ(f)に逆混合行列Ｗ(f)を適用することで、音源から送出される音信号ベクトルＳ(f)に対して近似的な信号を求める。
【００１０】
ＩＣＡによる混合過程の逆変換を求める処理には時間領域で分析する手法と、周波数領域で分析する手法が提案されている。ここでは、図１２により周波数領域で計算する手法を例にして説明する。
【００１１】
図１２においては、音源からの到来信号Ｘ(f)はマイク４０１および４０２で検知された後、適切な直交変換（例えば図１２においては短時間離散フーリエ変換／ｓｔ−ＤＦＴ）を用いて短時間フレーム分析を行う。このとき、一方のマイク４０１の入力における、特定の周波数ビンでの複素スペクトル値をプロットすることにより、それを時系列として考える。ここで、周波数ビンとは短時間離散フーリエ変換によって周波数変換された信号ベクトルにおける個別の複素成分を示す。同様に、他方のマイク４０２の入力に対しても同じ操作を行う。ここで得られた、時間‐周波数信号系列は、
【００１２】
【数６】

と記述できる。次に、逆混合行列Ｗ(f)を用いて信号分離を行う。マイク４０１、４０２に入力された信号から分離された信号をＹ(f,t)とすれば、この信号分離の処理は以下のように示される。
【００１３】
【数７】

ここで、逆混合行列Ｗ(f)は、Ｌ個の時系列の出力Ｙ(f,t)、すなわちＹ₁’(f,t)およびＹ_２’(f,t)、が互いに独立になるように最適化される。これらの処理を全ての周波数ビンについて行う。最後に、分離した時系列Ｙ(f,t)に図１２に図示していないが逆直交変換を適用して、音源信号時間波形復元の再構成を行う。
【００１４】
以上の処理において、独立性の評価および逆混合行列の最適化方法としては、下記「非特許文献１」においてKullback-Leibler divergenceの最小化に基づく教師無し学習アルゴリズムや、２次または高次の相関を無相関化するアルゴリズムが提案されている。
【００１５】
一般に、周波数領域で分析する手法は時間領域で分析する手法と比較して、計算量が少なく、分離性能も向上することが知られている。しかしながら、周波数領域で分析する手法は、周波数ごとに分析した音源が隣り合った周波数ビンにおいて入れ替わる現象（Permutation）が生じることがある。
【００１６】
一方、西川らは周波数領域におけるＩＣＡ（以後ＦＤＩＣＡと記述）を前段の処理に、時間領域におけるＩＣＡ（以後ＴＤＩＣＡと記述）を後段の処理とし、それぞれの弱点を補うことを狙い、周波数領域と時間領域におけるＩＣＡを直列接続した多段接続のＭＳＩＣＡ(Multi Stage ICA)として図１３に示す処理法を下記「非特許文献２」において提案している。西川らは、信号源の数が２個、マイクの数が２個の場合においては、従来報告されている周波数領域のみにおける方法（ＦＤＩＣＡ）よりも目的信号の分離精度が向上することを指摘しているが、信号源の数、マイクの数が２以上の場合について成功した報告例はない。
【００１７】
上記のようなＩＣＡ処理は音信号処理だけではなく、例えば、移動体通信などで話が混線して到達した信号を、其々に分離する、或いは下記非特許文献３に報告されている脳の内部の各所で生ずる信号を脳電計や脳磁計、ｆＭＲＩ（Functional Magnetic Resonance Imaging;磁気共鳴機能画像）などを用いて外部から測定した場合に、測定信号の中から目的の信号を分離抽出すること等にも用いられている。
【００１８】
【非特許文献１】「アレー信号処理を用いたブラインド音源分離の基礎」、Technical report of IEICE, EA2001-7）
【非特許文献２】T.Nishikawa,H.Saruwatari and K.Shikano, ”Blind source separation of acoustic signals basedon Multistage ICA combining Frequency-domain ICA and Time-domain ICA”, IEICETrans. Fundamentals, vol.E84-A, No.1 Jan 2001）
【非特許文献３】「独立成分解析とは」Computer Today,p38-43,1998.9,No.87、「ｆＭＲＩ画像解析への応用」ComputerToday, p60-67, 2001.1 No.95）。
【発明の開示】
【発明が解決しようとする課題】
【００１９】
周波数領域で分析する手法の問題点の一つとして、周波数毎に分析した音源が隣り合った周波数ビンにおいて入れ替わるPermutationと呼ばれる現象がある。この現象は、特に信号源の数がセンサ数より少ないときに顕著に発生しており、分離した目的信号の分離精度は著しく低下する。しかしながら、信号源の数とマイク数を常に一致させることは難しく、実際にシステムを作成したときには音源数の違いが原因となり目的信号の分離精度の分散が大きくなる。
【００２０】
前記「非特許文献２」における西川らの手法では、後段にＴＤＩＣＡが設置されているため、前段のＦＤＩＣＡにおいて発生するPermutation問題に対し効果が期待できる。しかし、信号源の数がセンサ数より少ないとき、周波数ビン毎のPermutation問題が複雑になるため、前段で実行するＦＤＩＣＡにおける分離精度の低下は著しくなることが予想される。また、信号源の数がセンサ数より少ないとＦＤＩＣＡの最適化学習過程において、局所解に陥りやすく収束性が悪くなる。これらの問題に対する容易な解決手法としては、信号源の数を予測し、冗長に配置された複数のセンサから予測された信号源の数と同数のセンサを選択することで、信号源の数とセンサ数を一致させることが考えられる。しかしながらこの手法では、すべてのセンサを有効に用いることができないためコストの点で不利である。
【００２１】
そこで本発明では、すべてのセンサを利用することで最大の目的信号の分離性能を確保しつつ、信号源の数がセンサ数より小さい場合においても分離性能が低下しない手法を構築すると共に、システムとして実現する手法を与えることを目的とする。
【課題を解決するための手段】
【００２２】
上記目的を達成するために本発明においては、独立成分分析法（ＩＣＡ）を採用した。すなわち、第１の処理過程として、複数の信号源からの波動性信号を、複数の固定したセンサで検出し、この検出した複数のチャネル毎の信号を、増幅増幅波形整形等データ検出のための信号検知処理を行った後、周波数帯域毎のチャネルに分割し、周波数領域での独立成分分析を行う（ＦＤＩＣＡ）ことにより、目的とする信号のパラメタ値であると識別したデータである時間信号群１と、不要信号パラメタ値であると識別したデータである時間信号群２の両者を送出する複数の信号識別過程１を有している。なお、パラメータ値とは、複数音源からの受信信号を示す行列の各要素の出力に対応する周波数ビンに含まれるエネルギに相当する。
【００２３】
次いで、第２の処理過程として、上記の分離された信号をさらに時間領域において独立成分分析を行う（ＴＤＩＣＡ）ことにより、上記の時間信号群１と時間信号群２の時間的特徴を統計的に分析し、少なくとも１つの信号源の目的信号を分離する信号識別過程２を有している。この信号識別過程２においては上記の識別された不要信号のパラメタ値を減衰させる二次減衰過程も含まれている。
特に、本発明においては、上記の信号識別過程１は複数のセンサから入力される信号を分析するため、この信号識別過程１を上記全てのセンサ数より少ない複数のサブブロックに分割し、上記の周波数帯域に分割された複数チャネルの信号群が入力された時、この各信号群はそれぞれのサブブロックにおいて独立に識別処理される構成としている。
【発明の効果】
【００２４】
周波数領域における独立成分分析（ＦＤＩＣＡ）と、時間領域における独立成分分析（ＴＤＩＣＡ）を併用し、ＦＤＩＣＡの中では不要信号パラメタ値に関する信号であると識別した時間信号群２を減衰させる一次減衰過程と、ＴＤＩＣＡの中では同様に信号源の目的信号パラメタ値以外に識別された不要信号パラメタ値を減衰させる二次減衰過程とを有し、さらに、信号識別過程１をサブブロックに分割して信号処理を行い、受信信号から音源数の推定を行うことにより音源の数と受信用センサの数を同程度とすることで信号抽出すなわち音源分離を高い精度で実行することが出来るようになった。
【発明を実施するための最良の形態】
【００２５】
以下、本発明の基本構成とその動作原理について説明する。
本発明では、西川らの手法（非特許文献２）における前段に設置されたＦＤＩＣＡをサブブロック化することで、Permutation問題の解決を図っている。
始めに、周波数領域での処理（以下ＦＤＩＣＡと表記）と時間領域での処理（以下ＴＤＩＣＡと表記）とを組み合わせた多段構成の処理（以下ＭＳＩＣＡと表記）について説明する。以下では信号を時間-周波数領域で表記すれば、入力および出力信号に関して、Ｌ個の音源信号ベクトルＳ_L(f,m)、観測信号ベクトルＸ_K(f,m)、ＦＤＩＣＡの出力信号ベクトルＺ_L(f,m)は、各ベクトルを示す行列を構成する要素に記号 ’
を付して表示すれば
【００２６】
【数８】

【００２７】
【数９】

【００２８】
【数１０】

で示され、音源信号ベクトルＳ_L(f,m)と観測信号ベクトルＸ_K(f,m)との関係は、
【００２９】
【数１１】

で与えられる。ここでＡ_KL(f)は信号の空間伝搬特性を与えるＫ行Ｌ列の混合行列であり、ｍは短時間離散フーリエ（ｓｔ−ＤＦＴ）分析におけるフレーム番号、fは周波数を表す。ＭＳＩＣＡの処理手順では、始めに観測信号に対してＦＤＩＣＡ処理を実行する。ＦＤＩＣＡの出力信号Ｚ_L(f,m)は入出力間相互の信号を関係付ける分離行列Ｖ_LL(f)を用いて、
【００３０】
【数１２】

として得られる。ＦＤＩＣＡでは、図１２におけるＷ(f)とＹ(f,t)間の処理の場合のように周波数ｆ毎にＬ個の出力信号が互いに独立となるようＶ_LL(f)を最適化する。
【００３１】
次に、周波数領域でのＦＤＩＣＡによる信号源分離後の個々の出力信号
【００３２】
【数１３】

を次段であるＴＤＩＣＡの入力信号とみなしＴＤＩＣＡの処理を実行する。但し、tは時間を表し、Ｆ^-1[ ]は［］内の式に対する逆離散フーリエ変換を表す。最終的な分離信号であるＴＤＩＣＡの出力信号ｙ_L(t)は、
【００３３】
【数１４】

として
【００３４】
【数１５】

で与えられる。ここで、ｗ_LL(τ)はＦＩＲフィルタを要素とする分離フィルタ行列であり、Ｑはフィルタ長である。ＴＤＩＣＡでは、Ｌ個の出力信号が互いに独立となるようにｗ_LL(τ)を最適化する。
【００３５】
（実施の形態１）
本発明では、Ｋ個のマイクから得られた観測信号をＬ(<Ｋ)個の観測信号の組と考え、これを図１に示すサブブロック（ＦＤＩＣＡ１，ＦＤＩＣＡ２，…，ＦＤＩＣＡＮ）とみなす。そして、Ｎ個のサブブロックを構成し，各サブブロックにおいてＦＤＩＣＡを行う。ｎ番目のサブブロックにおけるＦＤＩＣＡの分離処理は、サブブロック番号ｎに括弧を付して上付き文字を添えて表記すれば（数１２）式は
【００３６】
【数１６】

で示すことが出来る。但し、
【００３７】
【数１７】

【００３８】
【数１８】

である。次にＮ個のサブブロックの出力信号を次段のＴＤＩＣＡの入力信号とみなし、ＴＤＩＣＡの処理を行う。ＴＤＩＣＡの分離処理は、
【００３９】
【数１９】

で与えられる。但し、
【００４０】
【数２０】

【００４１】
【数２１】

であり、ｗ_L(L×N)(τ)はＬ行×Ｎ列の分離フィルタ行列である。ＴＤＩＣＡの分離フィルタ行列ｗ_L(L×N)(τ)は、以下の繰り返し学習を用いて最適化される。
【００４２】
【数２２】

ここで、ｗⁱ_L(L×N)(τ)はｉ番目の分離フィルタ行列、αは繰り返し学習のステップサイズである。（数２２）式では、学習回数を固定しても良いが、識別レベル２が一定の閾値を超えた段階で学習を終了することで、分離フィルタの分離性能を保証しつつ、収束時間を早めることが出来る。識別レベル２を与える計算例としては、例えば、西川等（T.
Nishikawa, H. Saruwatari and K. Shkano, ”Blind Source
Separation of acoustic signals based on multistage ICA combining
Frequency-domain ICA and Time-domain ICA” IEICE TRANS.
Fundamentals, Vol.E-84A, No1 Jan 2001）が提案している評価関数Ｊを用いれば良い。すなわち、（数１９）の分離信号ｙ_L(t)の短時間フレーム分析における時間切り出し信号を周波数変換した信号Ｙ_L(f,t)を用いて
【００４３】
【数２３】

を計算し、評価関数Ｊが一定の閾値を超えるまで学習を繰り返す構成とすると良い。（数２３）式において、< >_tおよび< >_fは< >内の数式に対して時間および周波数に関する平均をとることを表し、記号^Hはこの記号を付された行列の共役転置行列を表し、ｄｉａｇは対角線行列を表し、右辺の縦２重線はフロベニウスのノルムを表している。また、Φ(Ｙ_L(f,t))は
【００４４】
【数２４】

で与えられる関数である。
本発明では、其々のサブブロックにおいて入力信号を少数のチャネル群に分割し、該チャネル群に対してＦＤＩＣＡを適用している。よって、全てのマイクを用いた場合に信号源の数よりマイク数が大きい場合でも、該チャネル群のチャネル数を信号源の数と一致させることにより、信号源の数よりマイク数が大きいことによるＦＤＩＣＡの分離精度の低下を防ぐことができる。更に、全てのサブブロックからの出力信号をＴＤＩＣＡの入力信号とするため、Ｋ個全てのマイクに対する入力情報を有効に利用できる。
【００４５】
図２は以上の処理過程のブロック図を示すものである。
図２において、観測信号はセンサ１０−１乃至１０−ｎおよび検知過程２０において検知し電気信号に変換される。次のステップである帯域分割過程３０は(数１６)式における観測信号Ｘ⁽ⁿ⁾_L(f,m)を与える。この帯域分割された信号は４０で示される信号識別過程１に入力され、分散行列Ｖ⁽ⁿ⁾_LL(f)が求められる。ここで信号識別過程１は、チャネル毎に周波数分析された帯域における信号の状態を示すパラメタ値について、信号源とセンサとの空間的な位置の違いおよび信号源の種類による信号種（例えば車両内の場合は人間の音声、エンジンノイズ、ロードノイズ等）の違いに起因する前記検知信号の時間的特徴及び周波数的特徴を統計的に分析して、上記のパラメタ値から同一信号源から入力された少なくとも一つの信号源の目的信号パラメタ値を識別する為の識別レベル１を計算し、該識別レベル１を用いて、目的信号パラメタ値に関する信号であると識別した時間信号群１と、不要信号パラメタ値に関する信号であると識別した時間信号群２との何れをも送出する複数個の信号識別過程である。
【００４６】
次いで、一次減衰過程５０において(数１６)式の計算を実行し、ｎ番目のＦＤＩＣＡサブブロックの出力信号Ｚ⁽ⁿ⁾_LL(f,m)を算出する。以上の処理の結果を踏まえて６０で示す信号識別過程２により、（数１９）式における分離フィルタ行列ｗ_L(L×N)(τ)を求める。この６０で示す信号処理過程２においては分離フィルタの信号識別レベル２を計算し、信号識別レベル２が所望のレベルに達するまで学習を繰り返す。二次減衰過程７０において、(数１９)式の計算を実行し、分離信号ｙ_L(t)を算出する。以上(数１６)式乃至(数２１)式までは、あくまでも一例であり、本発明の計算方法および全てを表したものではない。
【００４７】
本発明の効果を示すため、オフラインシミュレーションによる音源信号の分離実験を行った。本実験では，２chによるＭＳＩＣＡと本発明を適用した１２chのＭＳＩＣＡの音響信号における分離精度を比較する。
音源信号としては、この種実験に良く用いられているＲＷＣＰデータベースにより残響時間３００msのインパルス応答を信号源に畳み込み、残響付加音声(標本化周波数:
８kHz)を作成する。
信号源は音声信号とし、１２通りの話者・音源位置の組合せに関して実験を行った。マイク数は２個（２ch-ＭＳＩＣＡ）および１２個(１２ch-ＭＳＩＣＡ:提案手法)とし、２.８３cm
間隔で、床から１.４６mの高さに直線状に配置した。音源信号は床から１.７２mの高さに設定された２つの異なる方位から到来することを想定し、２つの条件（信号源配置パターン１：方位
−６０°及び＋４０°の２方向から音声が放射、信号源配置パターン２：方位−４０°及び＋２０°の２方向から音声が放射、ただし０°方向はマイク列に対し垂直な方向）について分離精度を調べる。音源とマイクアレー中心との間の距離は２.０２m、２信号混合時のＳＮＲは０dB
である。
【００４８】
また、ＦＤＩＣＡにはSaruwatariによって提案された分離手法（H.Saruwatari
et al. : Proc. Eurospeech2001, vol.4, pp.2603--2606, Sep. 2001.）を、ＴＤＩＣＡにはChoiによって提案された分離手法（S.Choi
et al.: Proc. International Conference on
ICA and BSS）pp.371--376, Jan. 1999.）を用いた。各サブブロックにおけるＦＤＩＣＡの分離フィルタは１０２４タップで、初期値は±６０°へ死角を形成する死角制御型ビームフォーマとした。また、ＴＤＩＣＡの分離フィルタは２０４８タップとした。本実験では，分離精度の客観評価尺度として，Noise
Reduction Rate (ＮＲＲ; 出力ＳＮＲ [dB]-入力ＳＮＲ [dB])を用いた。
【００４９】
図３に２つの実験条件に対する分離精度の結果を示す。
始めに分離フィルタの収束精度について述べる。いずれの条件についても、ＮＲＲ値が正数であることから混合時よりＳＮＲが向上している。このことから、２ch-ＭＳＩＣＡの分離フィルタの収束が良好に行われており, 更に、マイク数に対して信号源の数が少ない１２ch−ＭＳＩＣＡにおいても分離フィルタの収束が良好に行われたことがわかる。
【００５０】
次に、２つの手法について分離精度を比較する。信号源配置パターン１では、２ch-ＭＳＩＣＡのＮＲＲ値が１１．９２dBに対して、１２ch−ＭＳＩＣＡのＮＲＲ値は１５．０６dBであり、３．１４dBの性能向上が観測できる。また、信号源配置パターン２では、２ch-ＭＳＩＣＡのＮＲＲ値が７．９２dBに対して、１２ch−ＭＳＩＣＡは１０．９８dBであり、３．０６dBの性能向上が観測された。以上のことから、本発明では、従来法と比較して分離精度が向上していることがわかる。
【００５１】
次に、図４により上記処理手順に対応した装置の基本構成を、図５により処理装置中心部分の構成を説明する。
図４に示すセンサ手段１１０−１乃至１１０−ｎおよび検知手段１２０は、到来した観測信号を受信して検知することに用いられる。これは図５のセンサ２１０−１乃至２１０−２に示すマイク等によるセンサ群とフィルタ２２０、Ａ／Ｄ変換器２３０によって実現できる。
センサ群２１０−１乃至２１０−２は、光、音、振動、磁気変化、磁場変化、電気、電波のような波動信号を検知し、電気信号に変換する機能を有するものを複数個（ｎ個）、空間的に異なる位置に配置して用いる。具体的には、光センサ、音センサ、マイクロホン、振動センサ、磁気センサ、電気センサ、アンテナに代表される波動を検知するセンサを単数、あるいは複数個用いる。
【００５２】
フィルタは、センサから得られた電気信号に含まれるノイズを除去することに用いられる。これは、其々のセンサによって検知された電気信号に対し、信号源の特性ではあり得ない成分の信号だけを除去する帯域通過フィルタを用いればよく、従来から存在する電気的なフィルタ回路を用いることで実現できる。
Ａ／Ｄ変換器は、信号源がもつ帯域の信号を正確に離散化するために十分なサンプリング周波数をもつ装置であれば良く、連続的な電気信号を離散的な情報信号に変換できるＡ／Ｄ変換回路などを用いることで実現できる。
【００５３】
図４における帯域分割手段１３０では、検知された信号を直交変換系の関数を用いて、数学的に直交する空間に変換する。具体的には、離散フーリエ変換、Ｚ変換、ラプラス変換などの周波数変換関数を用いればよく、図５の演算装置２４０および記憶装置２５０によって計算できる。
演算装置２４０は一般的なコンピュータのＣＰＵ、ＭＰＵ、ＤＳＰ、ＦＰＧＡ等の主演算回路および回路群と、周辺回路である副演算回路、記憶回路を単数または複数個組み合わせることで構成される。記憶装置２５０は、キャッシュメモリ、メインメモリ、ディスクメモリ、コンパクトディスク、フラッシュメモリ、ＤＶＤ、テープ、フロッピー(登録商標)ディスク、光磁気ディスク、ＭＤ、ＤＡＴに代表される、電気信号を記憶できる装置および媒体を用いることで実現できる。
また、１４０で示す信号識別手段１では、各周波数帯域において、分離フィルタの識別レベル１を計算し、分割された信号から目的の信号を抽出するための演算を行う。これは図５の演算装置２４０および記憶装置２５０によって実現できる。
【００５４】
図４のＦＤＩＣＡ処理を実行する一次減衰手段１５０およびＴＤＩＣＡ処理を実行する二次減衰手段１６０においては、入力された信号から必要とする目的の信号を抽出し、それ以外の不要な信号を減衰させる処理を行う。これは、図５における演算装置２４０および記憶装置２５０によって実現できる。
【００５５】
（実施の形態２）
本発明の一次減衰過程では複数の方向性信号源からの信号の分離を目指している。しかしながら、実環境では、拡散性の信号源も存在しており、信号源の分離性能悪化の原因となる。このため、拡散性の信号源の存在によって、ＦＤＩＣＡを用いても信号の分離が困難であった周波数帯域において、目的とする信号源から送出される信号以外の成分の混入を防ぐための処理方法およびその装置の実現が要求される。本実施の形態２においては周波数帯域抑圧（ＳＢＥ/SubBand Elimination）により拡散性雑音を除去する処理について述べる。
【００５６】
始めに、図６を用いて本発明による手法を用いた処理過程について説明する。
図６において、センサ１０−１乃至１０−ｎ、検知過程２０、帯域分割過程３０および一次減衰過程５０に付いては図２で述べたとおりでありここでは説明を省略する。図６において一次副減衰過程５５では、一次減衰過程５０によって識別レベル１が予め定められたレベルに達せず分離が困難であった周波数帯域での信号の状態を示すパラメタ値を不要成分とみなして時間信号群２を抑圧する。これにより、少なくとも２個以上のセンサを用い、信号識別過程１のパラメタ値を用いて少なくとも一つの信号源の目的信号パラメタ値が、不要信号パラメタ値より時間的、周波数的、幾何空間的に独立性が高い場合に識別レベル１が高くなるようにした。このように、一次減衰過程５０の後に一次副減衰過程５５を設けることにより、周波数帯域での抑圧が困難であった不要信号の状態を示すパラメタ値を識別した時間信号群２の抑圧をより容易にした。
【００５７】
分離が困難であった不要信号の周波数帯域を知るためには、例えば、猿渡らが提案したコサイン距離によるコスト関数を用いる帯域抑圧手法（猿渡他、「ブラインド音源分離とサブバンド除去処理を用いた車室内音性認識」,IEICE,EA2002-8）を導入することで実現できる。猿渡らの手法では、ＦＤＩＣＡを計算する際に用いるコスト関数が大きい周波数帯域ほどＩＣＡによる信号分離精度が悪化していることに着目し、これらの帯域を抑圧することによりＳＮＲ向上率を改善させている。
すなわち、上記の目的信号パラメタ値と上記の不要信号パラメタ値の差異を示すコサイン距離をコスト関数として定義し、該コスト関数の値が低いときに独立性が高いとみなして、前記識別レベル１を高くしている。ここで、コスト関数とは分離した信号間の独立性を評価するためのもので、分離信号間の高次相関値あるいは信号の行列空間におけるコサイン距離等を用いて求めることが出来る。特に、後者のコサイン距離を利用する方法は演算量も少なく効率的とされている。（数２５）式は２音源のコサイン距離に基づくコスト関数Ｊ(f)を示す。
【００５８】
【数２５】

（数２５）式においてＹ₁(f,t)、Ｙ₂(f,t)は不要帯域が除去された後の分離信号であり、<
>は時間平均、^＊は複素共役を示している。これにより得られたコスト関数を実際に適用するには平滑化等の処理も必要であるが、いずれにしても、この手法は本発明に対し導入可能であり、二次減衰過程７０よりも前段で予め拡散性の雑音を含む帯域を除去しておくことにより、二次減衰過程７０における分離性能の向上が期待できる。
【００５９】
図６における修正過程８０では、４０で示される信号識別過程１において分離のための一次減衰過程５０が計算されるたびに、上記のコスト関数Ｊ(f)を参照し、一次副減衰過程５５において抑圧する周波数帯域を修正することにより学習が行われている。
【００６０】
（実施の形態３）
図７に本発明の実施の形態３を示す。図７および図５を用いて、実施の形態３を説明する。
【００６１】
図７における一次副減衰手段１５５では、一次減衰手段１５０によって分離が困難であった周波数帯域のパラメタ値を抑圧する。ここでパラメタ値とは複数音源からの受信信号を示す行列の各要素の出力に対応する周波数ビンに含まれるエネルギに相当する。上記のパラメタ値抑圧とは、具体的には、対象となる周波数帯域のパラメタ値のエネルギを小さくする処理を行えばよく、例えば、該パラメタ値を1/nにする、或いは、ノッチフィルタと組合せることによって対象となる周波数帯域を除去する、等の手法を適用すればよい。これは、図７における演算装置２４０および記憶装置２５０を用いることで実現できる。
【００６２】
図７における記憶手段１８０では、帯域分割手段１３０によって分割された信号の帯域幅に関する情報および１４０に示す信号識別手段１で用いる信号識別時に用いた識別レベルに関する情報を記憶する。この帯域幅に関する情報は、例えば、信号を分析して周波数変換する際の分析幅に関する情報や、周波数変換した後にサブバンド化した場合の分析幅に関する情報等を記憶する。また識別レベルに関する情報は、前記のコスト関数の情報等を記憶する。また、図７における修正手段１９０は、１４０で示される信号識別手段１において分離のための一次減衰手段１５０が計算されるたびに、コスト関数を参照し、一次副減衰手段１５５を修正する。
【００６３】
（実施の形態４）
ＦＤＩＣＡにおいては信号源の数とマイク数が一致している場合は良好な分離精度が得られる。このため、信号源の数とマイク数を一致させる手段の実現が必要となり、信号源の数を予測することが必要となってくる。
例えば、本発明を車室内のハンドフリー音声通信および音声入力装置に適用した場合を考える。このとき、目的信号はユーザの音声であり、不要信号は車内で発生する様々な雑音、例えば、ロードノイズ、エンジンノイズ、エアコンノイズ、などとして考えることができる。ロードノイズについては、車速を検知することによって予測でき、エンジンノイズについては、車速、アイドリングの有無によって予測できる。エアコンノイズについては、エアコンのＯＮ／ＯＦＦ、噴出口の切り替え状態によって予測できる。本実施の形態４においては、これら不要信号の発生の有無を予測し、信号識別手段１のサブブロックの数と、一つのサブブロックに対応させるチャネルおよびチャネル数の決定処理について述べる。
【００６４】
図８はこの処理系のブロック図である。図８および図５を用いて、本発明による装置の構成について説明する。
図８における予測手段１８０は、実環境における様々な不要信号の発生を予測し、信号源の数を図８における変更手段１９０に送出する。変更手段１９０では、信号源の数に応じて、図８の１４０で示す信号識別手段１に含まれるサブブロックの数と、一つのサブブロックに対応させるチャネルおよびチャネル数を決定し、サブブロックの数と一つのサブブロックに対応させるチャネルおよびチャネル数とを変更する。
【００６５】
（実施の形態５）
サブブロックの数、一つのサブブロックの入出力端子に対応させるチャネルおよびチャネル数は以下のようにして決定することが出来る。
【００６６】
図９は上記の数を決定する系のブロック図である。以下、図１０および図５を併用しながら、本実施の形態５を説明する。
【００６７】
図９におけるテーブル手段２００は、変更手段１９０によって変更するサブブロックの数、一つのサブブロックの入出力端子に対応させるチャネルおよびチャネル数を記述した複数の標準パターンが記憶されている。テーブル手段２００は、図５の記憶手段２５０を用いることによって実現できる。標準パターンの一例を図１０に示す。図１０では、マイクに対応するセンサ数が５個のシステムにおいて、信号源が２個と予測された場合のサブブロック、各センサから各サブブロックへの経路および一つのサブブロックに入力されるチャネル数を決定した状態を示してある。このとき、サブブロックは３個生成され、それぞれのサブブロックに入力されるチャネル数は、予測された信号源の数と同じ２個とされている。各センサから各サブブロックへの経路は、センサ1とセンサ２はサブブロック１の入力、センサ３とセンサ４はサブブロック２の入力、センサ４とセンサ５はサブブロック３の入力、となっている。また、２次減衰手段１７０に対応するＴＤＩＣＡからの出力信号のチャネル数は、予測された信号源の数と同じ２個となっている。これらサブブロックの数と、一つのサブブロックに対応させるチャネルおよびチャネル数の標準パターンは、センサの位置に影響を受けるため、本発明を適用させる環境に応じて決定していくことが望ましい。
【００６８】
（実施の形態６）
本実施の形態６においては、センサ配置の一手法として、サブセンサアレーを構築し、個々のサブセンサアレーに対し一つのサブブロックを対応させる手法を開示している。図１１１１に示すサブセンサアレー３０４、３０５、３０６はそれぞれ一つのサブセンサアレーに２つのセンサを有し、これらのサブセンサアレーの後段に一つのサブブロックが配置されている。このような手法を用いる場合は、予め信号源が２個と仮定されているため、サブセンサアレーを空間的に独立に信号を検知できる配置にすることが望ましい。このように、センサとなるマイクを複数本づつアレー化することにより、センサの配置の自由度を向上させることが出来、実用性を高めることが出来るようになった。
尚、上記の各実施の形態は、本発明を適用する一例を示したに過ぎず、本発明の適用範囲を限定するものではない。
【図面の簡単な説明】
【００６９】
【図１】本発明における信号の流れを示す系統図。
【図２】実施の形態１に係る信号処理過程を説明するフロー図。
【図３】本発明による信号処理結果を示すヒストグラム。
【図４】実施の形態１に係る信号処理装置の基本構成を示すブロック図。
【図５】信号処理系の中心部分ハードウエアの接続関係を示すブロック図。
【図６】実施の形態２に係る信号処理過程を説明するフロー図。
【図７】実施の形態３に係る信号処理装置に係るブロック図。
【図８】実施の形態４に係る信号処理装置に係るブロック図。
【図９】実施の形態５に係る信号処理装置に係るブロック図。
【図１０】実施の形態５におけるサブブロックに関する相互接続図。
【図１１】実施の形態６におけるサブブロックに関する相互接続図。
【図１２】従来の信号分離処理を説明する処理系系統図。
【図１３】従来の他の信号分離処理を説明する処理系系統図。
【符号の説明】
【００７０】
10_1〜10_n、110_1〜110_n、210_1〜210_n：センサ
２０：検知過程３０：帯域分割過程
４０：信号識別過程１５０：一次減衰過程
５５：一次副減衰過程６０：信号識別過程２
７０：２次減衰過程８０：修正過程
１２０：検知手段１３０：帯域分割手段
１４０：信号識別手段１１５０：一次減衰手段
１５５：一次副減衰手段１６０：信号識別手段２
１７０：２次減衰手段１８０：記憶手段
１８１：予測手段１９０：修正手段
１９１：変更手段２００：テーブル手段
２２０：フィルタ２３０：ＡＤ変換器
２４０：演算装置２５０：記憶装置
３００：サブブロック１３０１：サブブロック２
３０２：サブブロック３３０３：ＴＤＩＣＡ
３０４，３０５，３０６：サブセンサアレー

【特許請求の範囲】
【請求項１】
複数の信号源からそれぞれ放出された波動性信号を、複数の固定されたセンサによって検知し、該検知した信号から少なくとも一つの信号源の信号を分離する方法であって、
前記複数のセンサからの信号を入力する検知過程と、
該検知過程によって検知された複数の検知信号を周波数帯域毎のチャネルに分割する帯域分割過程と、
該帯域分割過程によってチャネル毎に分割された各帯域における信号の状態を示すパラメタ値について、前記信号源と前記センサとの空間的な位置の違いおよび信号種の違いに起因する前記検知信号の時間的特徴及び周波数的特徴を統計的に分析して、少なくとも一つの信号源について同一信号源から入力された信号の目的信号パラメタ値を前記パラメタ値から識別する為の識別レベル１を計算し、該識別レベル１を用いて、前記目的信号パラメタ値に関する信号である時間信号群１と不要信号パラメタ値に関する信号である時間信号群２とをそれぞれ識別し、該時間信号群１と該時間信号群２とを送出する複数の信号識別過程１と、
該時間信号群２を減衰させる一次減衰過程と、
前記信号識別過程１から送出された前記時間信号群１および前記時間信号群２について、前記信号源と前記センサの空間的な位置の違い及び信号源による信号種の違いに起因する前記時間信号群１および前記時間信号群２の時間的特徴を統計的に分析して、少なくとも一つの信号源の目的信号を分離する信号識別過程２と、
前記信号識別過程２において、識別された少なくとも一つの信号源の前記目的信号パラメタ値以外に識別された不要信号パラメタ値を減衰させる二次減衰過程とを有し、
前記信号識別過程１は、複数のセンサから入力される信号を分析するための全ての前記センサ数より少ない複数のサブブロックによって構成されており、
各サブブロックそれぞれに対し、前記検知過程によって検知され前記帯域分割過程によって分割された複数チャネルの信号群が入力されたとき、該信号群はそれぞれのサブブロックにおいて独立に識別処理されることを特徴とする信号分離方法。
【請求項２】
前記信号識別過程２で信号識別レベル２を計算し、信号識別レベル２が所望のレベルに達するまで学習を繰り返すことを特徴とする請求項１に記載の信号分離方法。
【請求項３】
少なくとも２個以上のセンサを用い、前記信号識別過程１の前記パラメタ値から識別した前記識別レベル１について、少なくとも一つの信号源についての該目的信号パラメタ値が、該不要信号パラメタ値より時間的、周波数的、幾何空間的に独立性が高い場合に前記識別レベル１が高くなるようにしたことを特徴とする請求項１に記載の信号分離方法。
【請求項４】
前記目的信号パラメタ値と前記不要信号パラメタ値の差異を示すコサイン距離をコスト関数として定義し、該コスト関数の値が低いときに独立性が高いとみなして、前記識別レベル１を高くすることを特徴とする請求項１または請求項２に記載の信号分離方法。
【請求項５】
前記信号識別過程１において計算された前記識別レベル１が所望レベルに達していない前記帯域においては、該帯域のパラメタ値を不要成分とみなし、該帯域の信号を減衰させる一次副減衰過程を有することを特徴とする請求項１乃至請求項４のいずれかに記載の信号分離方法。
【請求項６】
複数の信号源からそれぞれ放出された波動性信号を、複数の固定されたセンサによって検知し、該検知した信号から少なくとも一つの信号源の信号を分離する方法であって、
前記複数のセンサからの信号を入力する検知過程と、
該検知過程によって検知された複数の検知信号を周波数帯域毎のチャネルに分割する帯域分割過程と、
該帯域分割過程によってチャネル毎に分割された各帯域における信号の状態を示すパラメタ値について、前記信号源と前記センサとの空間的な位置の違いおよび信号種の違いに起因する前記検知信号の時間的特徴及び周波数的特徴を統計的に分析して、少なくとも一つの信号源について同一信号源から入力された信号の目的信号パラメタ値を前記パラメタ値から識別する為の識別レベル１を計算し、該識別レベル１を用いて、前記目的信号パラメタ値に関する信号である時間信号群１と不要信号パラメタ値に関する信号である時間信号群２とをそれぞれ識別し、該時間信号群１と該時間信号群２とを送出する複数の信号識別過程１と、
該時間信号群２を減衰させる一次減衰過程と、
前記信号識別過程１から送出された前記時間信号群１および前記時間信号群２について、前記信号源と前記センサの空間的な位置の違い及び信号源による信号種の違いに起因する前記時間信号群１および前記時間信号群２の時間的特徴を統計的に分析して、少なくとも一つの信号源の目的信号を分離する信号識別過程２と、
前記信号識別過程２において、識別された少なくとも一つの信号源の前記目的信号パラメタ値以外に識別された不要信号パラメタ値を減衰させる二次減衰過程と、
前記信号識別過程１において計算された前記識別レベル１が所望レベルに達していない前記帯域においては、該帯域のパラメタ値を不要成分とみなし、該帯域の信号を減衰させる一次副減衰過程と、を有することを特徴とする信号分離方法。
【請求項７】
複数の信号源からそれぞれ放出された波動性信号を、複数の固定されたセンサによって検知し、該検知した信号から少なくとも一つの信号源の信号を分離する装置であって、
前記複数のセンサからの信号を入力する検知手段と、
該検知手段によって検知された複数の検知信号を周波数帯域毎のチャネルに分割する帯域分割手段と、
該帯域分割手段によってチャネル毎に分割された各帯域における信号の状態を示すパラメタ値について、前記信号源と前記センサとの空間的な位置の違いおよび信号種の違いに起因する前記検知信号の時間的特徴及び周波数的特徴を統計的に分析して、少なくとも一つの信号源について同一信号源から入力された信号の目的信号パラメタ値を前記パラメタ値から識別する為の識別レベル１を計算し、該識別レベル１を用いて、前記目的信号パラメタ値に関する信号である時間信号群１と不要信号パラメタ値に関する信号である時間信号群２とをそれぞれ識別し、該時間信号群１と該時間信号群２とを送出する複数の信号識別手段１と、
該時間信号群２を減衰させる一次減衰手段と、
前記信号識別手段１から送出された前記時間信号群１および前記時間信号群２について、前記信号源と前記センサの空間的な位置の違い及び信号源による信号種の違いに起因する前記時間信号群１および前記時間信号群２の時間的特徴を統計的に分析して、少なくとも一つの信号源の目的信号を分離する信号識別手段２と、
前記信号識別手段２において、識別された少なくとも一つの信号源の前記目的信号パラメタ値以外に識別された不要信号パラメタ値を減衰させる二次減衰手段とを有し、
前記信号識別手段１は、複数のセンサから入力される信号を分析するための全ての前記センサ数より少ない複数のサブブロックによって構成されており、
各サブブロックそれぞれに対し、前記検知手段によって検知され前記帯域分割手段によって分割された複数チャネルの信号群が入力されたとき、該信号群はそれぞれのサブブロックにおいて独立に識別処理されることを特徴とする信号分離装置。
【請求項８】
前記信号識別手段２において、信号識別レベル２を計算し、該信号識別レベル２が所望のレベルに達するまで学習を繰り返すことを特徴とする請求項７に記載の信号分離装置。
【請求項９】
少なくとも２個以上のセンサを用い、前記信号識別手段１の前記パラメタ値から識別した前記識別レベル１について、少なくとも一つの信号源についての該目的信号パラメタ値が、該不要信号パラメタ値より時間的、周波数的、幾何空間的に独立性が高い場合に前記識別レベル１が高くなるようにしたことを特徴とする請求項７に記載の信号分離装置。
【請求項１０】
前記目的信号パラメタ値と前記不要信号パラメタ値の差異を示すコサイン距離をコスト関数として定義し、該コスト関数の値が低いときに独立性が高いとみなして、前記識別レベル１を高くすることを特徴とする請求項７または請求項８に記載の信号分離装置。
【請求項１１】
前記信号識別手段１において計算された前記識別レベル１が所望のレベルに達していない前記帯域においては、該帯域のパラメタ値を不要成分とみなし、該帯域の信号を減衰させる一次副減衰手段を有することを特徴とする請求項７乃至請求項１０の何れかに記載の信号分離装置。
【請求項１２】
信号源の数を予測する予測手段と、予測された該信号源の数に基づいて前記サブブロックの数と各サブブロックに入力するチャネルおよびチャネル数を変更する変更手段と、
を有して成ることを特徴とする請求項７に記載の信号分離装置。
【請求項１３】
前記変更手段において決定するサブブロックの数、各サブブロックに入力するチャネルおよびチャネル数の標準パターンを保持するテーブル手段を有して成ることを特徴とする請求項１２に記載の信号分離装置。
【請求項１４】
前記サブブロックにおいて、空間的に互いに独立性を維持しやすい位置に設置された、全体のマイク数より少ないマイク数によって構成された一つ以上のサブセンサアレーが、個々のサブブロックに対して割り当てられ配置されていることを特徴とする請求項７に記載の信号源分離装置。
【請求項１５】
複数の信号源からそれぞれ放出された波動性信号を、複数の固定されたセンサによって検知し、該検知した信号から少なくとも一つの信号源の信号を分離する装置であって、
前記複数のセンサからの信号を入力する検知手段と、
該検知手段によって検知された複数の検知信号を周波数帯域毎のチャネルに分割する帯域分割手段と、
該帯域分割手段によってチャネル毎に分割された各帯域における信号の状態を示すパラメタ値について、前記信号源と前記センサとの空間的な位置の違いおよび信号種の違いに起因する前記検知信号の時間的特徴及び周波数的特徴を統計的に分析して、少なくとも一つの信号源について同一信号源から入力された信号の目的信号パラメタ値を前記パラメタ値から識別する為の識別レベル１を計算し、該識別レベル１を用いて、前記目的信号パラメタ値に関する信号である時間信号群１と不要信号パラメタ値に関する信号である時間信号群２とをそれぞれ識別し、該時間信号群１と該時間信号群２とを送出する複数の信号識別手段１と、
該時間信号群２を減衰させる一次減衰手段と、
前記信号識別手段１から送出された前記時間信号群１および前記時間信号群２について、前記信号源と前記センサの空間的な位置の違い及び信号源による信号種の違いに起因する前記時間信号群１および前記時間信号群２の時間的特徴を統計的に分析して、少なくとも一つの信号源の目的信号を分離する信号識別手段２と、
前記信号識別手段２において、識別された少なくとも一つの信号源の前記目的信号パラメタ値以外に識別された不要信号パラメタ値を減衰させる二次減衰手段と、
前記信号識別手段１において計算された前記識別レベル１が所望レベルに達していない前記帯域においては、該帯域のパラメタ値を不要成分とみなし、該帯域の信号を減衰させる一次副減衰手段と、を有することを特徴とする信号分離装置。

【図１】