説明

信号分離方法および信号分離装置

【課題】複数の信号の中から必要とする信号を分離抽出する場合、周波数領域および時間領域での独立成分分析法では、Permutationと呼ばれる現象の為に分離精度が低下する問題があった。特に、この現象は信号源の数がセンサの数よりも小さい時に顕著となっている。このため本発明においては、信号源の数とセンサの数との不整合による性能劣化の問題解決を目的とした。
【解決手段】周波数領域(FD)および時間領域(TD)での独立成分分析(ICA)を順次行い、特に、FDICAにおける信号の識別過程を複数個のサブブロックに分割する構成とした。この処理過程で信号源の数を推定し、この結果を用いて実質的に実働センサの数と信号源の数とを合わせるようにした。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、複数のマイクロホン(以下マイクと略記)等のセンサで検知した複数の信号の中から必要とする信号を分離抽出する方法およびその装置に関する。
【背景技術】
【0002】
複数の信号が混在されて観測された場合に、観測信号だけを用いて源信号を同定する技術を Blind
Source Separation(以下BSSと記述)と呼ぶ。近年では、独立成分分析(Independent Component Analysis;以下ICAと記述)に基づく信号分離手法が主流である。
この信号分離手法によれば、例えば、複数の音信号をK個のマイク(センサ)で受信し、各音源から到来する音信号同士が統計的に独立であることを利用して前記の受信信号を処理することで、マイクと同数のK個もしくはK個以下の音源を分離することができる。当初、ICAを用いた音源分離法は、各音源からの到来音の時間差が考慮されていなかったため、マイクアレーに適用することは困難であった。しかし近年では、時間差を考慮し、マイクアレーを用いて複数の音信号を観測し、周波数領域でこれら複数の音源から到来する信号の混合過程に対する逆変換を求める手法が多数提案されている。
【0003】
一般に、L個の複数音源から到来する音信号が線形に混合されてK個のマイクで観測されている場合、観測された音信号は、ある周波数fにおいて以下のように書くことができる。
【0004】
【数1】



ここで、S(f)は各音源から送出される音信号ベクトル、X(f)は受音点であるマイクアレーで観測された観測信号ベクトル、A(f)は各音源と受音点との空間的な音響系の伝搬特性を示す伝搬ベクトルに関する混合行列であり、それぞれ以下のように書くことができる。
【0005】
【数2】



【0006】
【数3】



【0007】
【数4】



ここで右肩付のTはベクトルの転置を、’記号は各行列における要素(スカラー量)をそれぞれ表す。このとき、混合行列A(f)が既知であれば、受音点での観測信号ベクトルX(f)を用いて、
【0008】
【数5】



のようにA(f)の一般逆行列を計算することで音源から送出される音信号ベクトルS(f)を計算することができる。しかし一般に伝搬ベクトルA(f)は未知であり、観測信号ベクトルX(f)だけを利用することで音信号ベクトルS(f)を求めなければならない。
【0009】
BSS問題を解くためには、音信号ベクトルS(f)が確率的に発生し、更に、この音信号ベクトルS(f)の各成分が全て互いに独立であると仮定する。このときマイクで検知された観測信号ベクトルX(f)は複数の音源信号が混合された信号であるため、この観測信号ベクトルX(f)の各成分の分布は独立ではない。そこで、観測信号ベクトルX(f)に含まれる独立な成分、すなわち混合された音源信号からICAによって各音源信号を探索することを考える。すなわち、観測信号ベクトルX(f)を独立な成分に変換する行列W(f)(以下、逆混合行列)を計算し、観測信号ベクトルX(f)に逆混合行列W(f)を適用することで、音源から送出される音信号ベクトルS(f)に対して近似的な信号を求める。
【0010】
ICAによる混合過程の逆変換を求める処理には時間領域で分析する手法と、周波数領域で分析する手法が提案されている。ここでは、図12により周波数領域で計算する手法を例にして説明する。
【0011】
図12においては、音源からの到来信号X(f)はマイク401および402で検知された後、適切な直交変換(例えば図12においては短時間離散フーリエ変換/st−DFT)を用いて短時間フレーム分析を行う。このとき、一方のマイク401の入力における、特定の周波数ビンでの複素スペクトル値をプロットすることにより、それを時系列として考える。ここで、周波数ビンとは短時間離散フーリエ変換によって周波数変換された信号ベクトルにおける個別の複素成分を示す。同様に、他方のマイク402の入力に対しても同じ操作を行う。ここで得られた、時間‐周波数信号系列は、
【0012】
【数6】



と記述できる。次に、逆混合行列W(f)を用いて信号分離を行う。マイク401、402に入力された信号から分離された信号をY(f,t)とすれば、この信号分離の処理は以下のように示される。
【0013】
【数7】



ここで、逆混合行列W(f)は、L個の時系列の出力Y(f,t)、すなわちY1’(f,t)およびY’(f,t)、が互いに独立になるように最適化される。これらの処理を全ての周波数ビンについて行う。最後に、分離した時系列Y(f,t)に図12に図示していないが逆直交変換を適用して、音源信号時間波形復元の再構成を行う。
【0014】
以上の処理において、独立性の評価および逆混合行列の最適化方法としては、下記「非特許文献1」においてKullback-Leibler divergenceの最小化に基づく教師無し学習アルゴリズムや、2次または高次の相関を無相関化するアルゴリズムが提案されている。
【0015】
一般に、周波数領域で分析する手法は時間領域で分析する手法と比較して、計算量が少なく、分離性能も向上することが知られている。しかしながら、周波数領域で分析する手法は、周波数ごとに分析した音源が隣り合った周波数ビンにおいて入れ替わる現象(Permutation)が生じることがある。
【0016】
一方、西川らは周波数領域におけるICA(以後FDICAと記述)を前段の処理に、時間領域におけるICA(以後TDICAと記述)を後段の処理とし、それぞれの弱点を補うことを狙い、周波数領域と時間領域におけるICAを直列接続した多段接続のMSICA(Multi Stage ICA)として図13に示す処理法を下記「非特許文献2」において提案している。西川らは、信号源の数が2個、マイクの数が2個の場合においては、従来報告されている周波数領域のみにおける方法(FDICA)よりも目的信号の分離精度が向上することを指摘しているが、信号源の数、マイクの数が2以上の場合について成功した報告例はない。
【0017】
上記のようなICA処理は音信号処理だけではなく、例えば、移動体通信などで話が混線して到達した信号を、其々に分離する、或いは下記非特許文献3に報告されている脳の内部の各所で生ずる信号を脳電計や脳磁計、fMRI(Functional Magnetic Resonance Imaging;磁気共鳴機能画像)などを用いて外部から測定した場合に、測定信号の中から目的の信号を分離抽出すること等にも用いられている。
【0018】
【非特許文献1】「アレー信号処理を用いたブラインド音源分離の基礎」、Technical report of IEICE, EA2001-7)
【非特許文献2】T.Nishikawa,H.Saruwatari and K.Shikano, ”Blind source separation of acoustic signals basedon Multistage ICA combining Frequency-domain ICA and Time-domain ICA”, IEICETrans. Fundamentals, vol.E84-A, No.1 Jan 2001)
【非特許文献3】「独立成分解析とは」Computer Today,p38-43,1998.9,No.87、「fMRI画像解析への応用」ComputerToday, p60-67, 2001.1 No.95)。
【発明の開示】
【発明が解決しようとする課題】
【0019】
周波数領域で分析する手法の問題点の一つとして、周波数毎に分析した音源が隣り合った周波数ビンにおいて入れ替わるPermutationと呼ばれる現象がある。この現象は、特に信号源の数がセンサ数より少ないときに顕著に発生しており、分離した目的信号の分離精度は著しく低下する。しかしながら、信号源の数とマイク数を常に一致させることは難しく、実際にシステムを作成したときには音源数の違いが原因となり目的信号の分離精度の分散が大きくなる。
【0020】
前記「非特許文献2」における西川らの手法では、後段にTDICAが設置されているため、前段のFDICAにおいて発生するPermutation問題に対し効果が期待できる。しかし、信号源の数がセンサ数より少ないとき、周波数ビン毎のPermutation問題が複雑になるため、前段で実行するFDICAにおける分離精度の低下は著しくなることが予想される。また、信号源の数がセンサ数より少ないとFDICAの最適化学習過程において、局所解に陥りやすく収束性が悪くなる。これらの問題に対する容易な解決手法としては、信号源の数を予測し、冗長に配置された複数のセンサから予測された信号源の数と同数のセンサを選択することで、信号源の数とセンサ数を一致させることが考えられる。しかしながらこの手法では、すべてのセンサを有効に用いることができないためコストの点で不利である。
【0021】
そこで本発明では、すべてのセンサを利用することで最大の目的信号の分離性能を確保しつつ、信号源の数がセンサ数より小さい場合においても分離性能が低下しない手法を構築すると共に、システムとして実現する手法を与えることを目的とする。
【課題を解決するための手段】
【0022】
上記目的を達成するために本発明においては、独立成分分析法(ICA)を採用した。すなわち、第1の処理過程として、複数の信号源からの波動性信号を、複数の固定したセンサで検出し、この検出した複数のチャネル毎の信号を、増幅増幅波形整形等データ検出のための信号検知処理を行った後、周波数帯域毎のチャネルに分割し、周波数領域での独立成分分析を行う(FDICA)ことにより、目的とする信号のパラメタ値であると識別したデータである時間信号群1と、不要信号パラメタ値であると識別したデータである時間信号群2の両者を送出する複数の信号識別過程1を有している。なお、パラメータ値とは、複数音源からの受信信号を示す行列の各要素の出力に対応する周波数ビンに含まれるエネルギに相当する。
【0023】
次いで、第2の処理過程として、上記の分離された信号をさらに時間領域において独立成分分析を行う(TDICA)ことにより、上記の時間信号群1と時間信号群2の時間的特徴を統計的に分析し、少なくとも1つの信号源の目的信号を分離する信号識別過程2を有している。この信号識別過程2においては上記の識別された不要信号のパラメタ値を減衰させる二次減衰過程も含まれている。
特に、本発明においては、上記の信号識別過程1は複数のセンサから入力される信号を分析するため、この信号識別過程1を上記全てのセンサ数より少ない複数のサブブロックに分割し、上記の周波数帯域に分割された複数チャネルの信号群が入力された時、この各信号群はそれぞれのサブブロックにおいて独立に識別処理される構成としている。
【発明の効果】
【0024】
周波数領域における独立成分分析(FDICA)と、時間領域における独立成分分析(TDICA)を併用し、FDICAの中では不要信号パラメタ値に関する信号であると識別した時間信号群2を減衰させる一次減衰過程と、TDICAの中では同様に信号源の目的信号パラメタ値以外に識別された不要信号パラメタ値を減衰させる二次減衰過程とを有し、さらに、信号識別過程1をサブブロックに分割して信号処理を行い、受信信号から音源数の推定を行うことにより音源の数と受信用センサの数を同程度とすることで信号抽出すなわち音源分離を高い精度で実行することが出来るようになった。
【発明を実施するための最良の形態】
【0025】
以下、本発明の基本構成とその動作原理について説明する。
本発明では、西川らの手法(非特許文献2)における前段に設置されたFDICAをサブブロック化することで、Permutation問題の解決を図っている。
始めに、周波数領域での処理(以下FDICAと表記)と時間領域での処理(以下TDICAと表記)とを組み合わせた多段構成の処理(以下MSICAと表記)について説明する。以下では信号を時間-周波数領域で表記すれば、入力および出力信号に関して、L個の音源信号ベクトルSL(f,m)、観測信号ベクトルXK(f,m)、FDICAの出力信号ベクトルZL(f,m)は、各ベクトルを示す行列を構成する要素に記号 ’
を付して表示すれば
【0026】
【数8】



【0027】
【数9】



【0028】
【数10】



で示され、音源信号ベクトルSL(f,m)と観測信号ベクトルXK(f,m)との関係は、
【0029】
【数11】



で与えられる。ここでAKL(f)は信号の空間伝搬特性を与えるK行L列の混合行列であり、mは短時間離散フーリエ(st−DFT)分析におけるフレーム番号、fは周波数を表す。MSICAの処理手順では、始めに観測信号に対してFDICA処理を実行する。FDICAの出力信号ZL(f,m)は入出力間相互の信号を関係付ける分離行列VLL(f)を用いて、
【0030】
【数12】



として得られる。FDICAでは、図12におけるW(f)とY(f,t)間の処理の場合のように周波数f毎にL個の出力信号が互いに独立となるようVLL(f)を最適化する。
【0031】
次に、周波数領域でのFDICAによる信号源分離後の個々の出力信号
【0032】
【数13】



を次段であるTDICAの入力信号とみなしTDICAの処理を実行する。但し、tは時間を表し、F-1[ ]は[ ]内の式に対する逆離散フーリエ変換を表す。最終的な分離信号であるTDICAの出力信号yL(t)は、
【0033】
【数14】



として
【0034】
【数15】



で与えられる。ここで、wLL(τ)はFIRフィルタを要素とする分離フィルタ行列であり、Qはフィルタ長である。TDICAでは、L個の出力信号が互いに独立となるようにwLL(τ)を最適化する。
【0035】
(実施の形態1)
本発明では、K個のマイクから得られた観測信号をL(<K)個の観測信号の組と考え、これを図1に示すサブブロック(FDICA1,FDICA2,…,FDICAN)とみなす。そして、N個のサブブロックを構成し,各サブブロックにおいてFDICAを行う。n番目のサブブロックにおけるFDICAの分離処理は、サブブロック番号nに括弧を付して上付き文字を添えて表記すれば(数12)式は
【0036】
【数16】



で示すことが出来る。但し、
【0037】
【数17】



【0038】
【数18】



である。次にN個のサブブロックの出力信号を次段のTDICAの入力信号とみなし、TDICAの処理を行う。TDICAの分離処理は、
【0039】
【数19】



で与えられる。但し、
【0040】
【数20】



【0041】
【数21】



であり、wL(L×N)(τ)はL行×N列の分離フィルタ行列である。TDICAの分離フィルタ行列wL(L×N)(τ)は、以下の繰り返し学習を用いて最適化される。
【0042】
【数22】



ここで、wiL(L×N)(τ)はi番目の分離フィルタ行列、αは繰り返し学習のステップサイズである。(数22)式では、学習回数を固定しても良いが、識別レベル2が一定の閾値を超えた段階で学習を終了することで、分離フィルタの分離性能を保証しつつ、収束時間を早めることが出来る。識別レベル2を与える計算例としては、例えば、西川等(T.
Nishikawa, H. Saruwatari and K. Shkano, ”Blind Source
Separation of acoustic signals based on multistage ICA combining
Frequency-domain ICA and Time-domain ICA” IEICE TRANS.
Fundamentals, Vol.E-84A, No1 Jan 2001)が提案している評価関数Jを用いれば良い。すなわち、(数19)の分離信号yL(t)の短時間フレーム分析における時間切り出し信号を周波数変換した信号YL(f,t)を用いて
【0043】
【数23】



を計算し、評価関数Jが一定の閾値を超えるまで学習を繰り返す構成とすると良い。(数23)式において、< >tおよび< >fは< >内の数式に対して時間および周波数に関する平均をとることを表し、記号Hはこの記号を付された行列の共役転置行列を表し、diagは対角線行列を表し、右辺の縦2重線はフロベニウスのノルムを表している。また、Φ(YL(f,t))は
【0044】
【数24】



で与えられる関数である。
本発明では、其々のサブブロックにおいて入力信号を少数のチャネル群に分割し、該チャネル群に対してFDICAを適用している。よって、全てのマイクを用いた場合に信号源の数よりマイク数が大きい場合でも、該チャネル群のチャネル数を信号源の数と一致させることにより、信号源の数よりマイク数が大きいことによるFDICAの分離精度の低下を防ぐことができる。更に、全てのサブブロックからの出力信号をTDICAの入力信号とするため、K個全てのマイクに対する入力情報を有効に利用できる。
【0045】
図2は以上の処理過程のブロック図を示すものである。
図2において、観測信号はセンサ10−1乃至10−nおよび検知過程20において検知し電気信号に変換される。次のステップである帯域分割過程30は(数16)式における観測信号X(n)L(f,m)を与える。この帯域分割された信号は40で示される信号識別過程1に入力され、分散行列V(n)LL(f)が求められる。ここで信号識別過程1は、チャネル毎に周波数分析された帯域における信号の状態を示すパラメタ値について、信号源とセンサとの空間的な位置の違いおよび信号源の種類による信号種(例えば車両内の場合は人間の音声、エンジンノイズ、ロードノイズ等)の違いに起因する前記検知信号の時間的特徴及び周波数的特徴を統計的に分析して、上記のパラメタ値から同一信号源から入力された少なくとも一つの信号源の目的信号パラメタ値を識別する為の識別レベル1を計算し、該識別レベル1を用いて、目的信号パラメタ値に関する信号であると識別した時間信号群1と、不要信号パラメタ値に関する信号であると識別した時間信号群2との何れをも送出する複数個の信号識別過程である。
【0046】
次いで、一次減衰過程50において(数16)式の計算を実行し、n番目のFDICAサブブロックの出力信号Z(n)LL(f,m)を算出する。以上の処理の結果を踏まえて60で示す信号識別過程2により、(数19)式における分離フィルタ行列wL(L×N)(τ)を求める。この60で示す信号処理過程2においては分離フィルタの信号識別レベル2を計算し、信号識別レベル2が所望のレベルに達するまで学習を繰り返す。二次減衰過程70において、(数19)式の計算を実行し、分離信号yL(t)を算出する。以上(数16)式乃至(数21)式までは、あくまでも一例であり、本発明の計算方法および全てを表したものではない。
【0047】
本発明の効果を示すため、オフラインシミュレーションによる音源信号の分離実験を行った。本実験では,2chによるMSICAと本発明を適用した12chのMSICAの音響信号における分離精度を比較する。
音源信号としては、この種実験に良く用いられているRWCPデータベースにより残響時間300msのインパルス応答を信号源に畳み込み、残響付加音声(標本化周波数:
8kHz)を作成する。
信号源は音声信号とし、12通りの話者・音源位置の組合せに関して実験を行った。マイク数は2個(2ch-MSICA)および12個(12ch-MSICA:提案手法)とし、2.83cm
間隔で、床から1.46mの高さに直線状に配置した。音源信号は床から1.72mの高さに設定された2つの異なる方位から到来することを想定し、2つの条件(信号源配置パターン1:方位
−60°及び +40°の2方向から音声が放射、信号源配置パターン2:方位−40°及び +20°の2方向から音声が放射、ただし0°方向はマイク列に対し垂直な方向)について分離精度を調べる。音源とマイクアレー中心との間の距離は2.02m、2信号混合時のSNRは0dB
である。
【0048】
また、FDICAにはSaruwatariによって提案された分離手法(H.Saruwatari
et al. : Proc. Eurospeech2001, vol.4, pp.2603--2606, Sep. 2001.)を、TDICAにはChoiによって提案された分離手法(S.Choi
et al.: Proc. International Conference on
ICA and BSS)pp.371--376, Jan. 1999.)を用いた。各サブブロックにおけるFDICAの分離フィルタは1024タップで、初期値は±60°へ死角を形成する死角制御型ビームフォーマとした。また、TDICAの分離フィルタは2048タップとした。本実験では,分離精度の客観評価尺度として,Noise
Reduction Rate (NRR; 出力 SNR [dB]-入力 SNR [dB])を用いた。
【0049】
図3に2つの実験条件に対する分離精度の結果を示す。
始めに分離フィルタの収束精度について述べる。いずれの条件についても、NRR値が正数であることから混合時よりSNRが向上している。このことから、2ch-MSICAの分離フィルタの収束が良好に行われており, 更に、マイク数に対して信号源の数が少ない12ch−MSICAにおいても分離フィルタの収束が良好に行われたことがわかる。
【0050】
次に、2つの手法について分離精度を比較する。信号源配置パターン1では、2ch-MSICAのNRR値が11.92dBに対して、12ch−MSICAのNRR値は15.06dBであり、3.14dBの性能向上が観測できる。また、信号源配置パターン2では、2ch-MSICAのNRR値が7.92dBに対して、12ch−MSICAは10.98dBであり、3.06dBの性能向上が観測された。以上のことから、本発明では、従来法と比較して分離精度が向上していることがわかる。
【0051】
次に、図4により上記処理手順に対応した装置の基本構成を、図5により処理装置中心部分の構成を説明する。
図4に示すセンサ手段110−1乃至110−nおよび検知手段120は、到来した観測信号を受信して検知することに用いられる。これは図5のセンサ210−1乃至210−2に示すマイク等によるセンサ群とフィルタ220、A/D変換器230によって実現できる。
センサ群210−1乃至210−2は、光、音、振動、磁気変化、磁場変化、電気、電波のような波動信号を検知し、電気信号に変換する機能を有するものを複数個(n個)、空間的に異なる位置に配置して用いる。具体的には、光センサ、音センサ、マイクロホン、振動センサ、磁気センサ、電気センサ、アンテナに代表される波動を検知するセンサを単数、あるいは複数個用いる。
【0052】
フィルタは、センサから得られた電気信号に含まれるノイズを除去することに用いられる。これは、其々のセンサによって検知された電気信号に対し、信号源の特性ではあり得ない成分の信号だけを除去する帯域通過フィルタを用いればよく、従来から存在する電気的なフィルタ回路を用いることで実現できる。
A/D変換器は、信号源がもつ帯域の信号を正確に離散化するために十分なサンプリング周波数をもつ装置であれば良く、連続的な電気信号を離散的な情報信号に変換できるA/D変換回路などを用いることで実現できる。
【0053】
図4における帯域分割手段130では、検知された信号を直交変換系の関数を用いて、数学的に直交する空間に変換する。具体的には、離散フーリエ変換、Z変換、ラプラス変換などの周波数変換関数を用いればよく、図5の演算装置240および記憶装置250によって計算できる。
演算装置240は一般的なコンピュータのCPU、MPU、DSP、FPGA等の主演算回路および回路群と、周辺回路である副演算回路、記憶回路を単数または複数個組み合わせることで構成される。記憶装置250は、キャッシュメモリ、メインメモリ、ディスクメモリ、コンパクトディスク、フラッシュメモリ、DVD、テープ、フロッピー(登録商標)ディスク、光磁気ディスク、MD、DATに代表される、電気信号を記憶できる装置および媒体を用いることで実現できる。
また、140で示す信号識別手段1では、各周波数帯域において、分離フィルタの識別レベル1を計算し、分割された信号から目的の信号を抽出するための演算を行う。これは図5の演算装置240および記憶装置250によって実現できる。
【0054】
図4のFDICA処理を実行する一次減衰手段150およびTDICA処理を実行する二次減衰手段160においては、入力された信号から必要とする目的の信号を抽出し、それ以外の不要な信号を減衰させる処理を行う。これは、図5における演算装置240および記憶装置250によって実現できる。
【0055】
(実施の形態2)
本発明の一次減衰過程では複数の方向性信号源からの信号の分離を目指している。しかしながら、実環境では、拡散性の信号源も存在しており、信号源の分離性能悪化の原因となる。このため、拡散性の信号源の存在によって、FDICAを用いても信号の分離が困難であった周波数帯域において、目的とする信号源から送出される信号以外の成分の混入を防ぐための処理方法およびその装置の実現が要求される。本実施の形態2においては周波数帯域抑圧(SBE/SubBand Elimination)により拡散性雑音を除去する処理について述べる。
【0056】
始めに、図6を用いて本発明による手法を用いた処理過程について説明する。
図6において、センサ10−1乃至10−n、検知過程20、帯域分割過程30および一次減衰過程50に付いては図2で述べたとおりでありここでは説明を省略する。図6において一次副減衰過程55では、一次減衰過程50によって識別レベル1が予め定められたレベルに達せず分離が困難であった周波数帯域での信号の状態を示すパラメタ値を不要成分とみなして時間信号群2を抑圧する。これにより、少なくとも2個以上のセンサを用い、信号識別過程1のパラメタ値を用いて少なくとも一つの信号源の目的信号パラメタ値が、不要信号パラメタ値より時間的、周波数的、幾何空間的に独立性が高い場合に識別レベル1が高くなるようにした。このように、一次減衰過程50の後に一次副減衰過程55を設けることにより、周波数帯域での抑圧が困難であった不要信号の状態を示すパラメタ値を識別した時間信号群2の抑圧をより容易にした。
【0057】
分離が困難であった不要信号の周波数帯域を知るためには、例えば、猿渡らが提案したコサイン距離によるコスト関数を用いる帯域抑圧手法(猿渡他、「ブラインド音源分離とサブバンド除去処理を用いた車室内音性認識」,IEICE,EA2002-8)を導入することで実現できる。猿渡らの手法では、FDICAを計算する際に用いるコスト関数が大きい周波数帯域ほどICAによる信号分離精度が悪化していることに着目し、これらの帯域を抑圧することによりSNR向上率を改善させている。
すなわち、上記の目的信号パラメタ値と上記の不要信号パラメタ値の差異を示すコサイン距離をコスト関数として定義し、該コスト関数の値が低いときに独立性が高いとみなして、前記識別レベル1を高くしている。ここで、コスト関数とは分離した信号間の独立性を評価するためのもので、分離信号間の高次相関値あるいは信号の行列空間におけるコサイン距離等を用いて求めることが出来る。特に、後者のコサイン距離を利用する方法は演算量も少なく効率的とされている。(数25)式は2音源のコサイン距離に基づくコスト関数J(f)を示す。
【0058】
【数25】



(数25)式においてY1(f,t)、Y2(f,t)は不要帯域が除去された後の分離信号であり、<
>は時間平均、は複素共役を示している。これにより得られたコスト関数を実際に適用するには平滑化等の処理も必要であるが、いずれにしても、この手法は本発明に対し導入可能であり、二次減衰過程70よりも前段で予め拡散性の雑音を含む帯域を除去しておくことにより、二次減衰過程70における分離性能の向上が期待できる。
【0059】
図6における修正過程80では、40で示される信号識別過程1において分離のための一次減衰過程50が計算されるたびに、上記のコスト関数J(f)を参照し、一次副減衰過程55において抑圧する周波数帯域を修正することにより学習が行われている。
【0060】
(実施の形態3)
図7に本発明の実施の形態3を示す。図7および図5を用いて、実施の形態3を説明する。
【0061】
図7における一次副減衰手段155では、一次減衰手段150によって分離が困難であった周波数帯域のパラメタ値を抑圧する。ここでパラメタ値とは複数音源からの受信信号を示す行列の各要素の出力に対応する周波数ビンに含まれるエネルギに相当する。上記のパラメタ値抑圧とは、具体的には、対象となる周波数帯域のパラメタ値のエネルギを小さくする処理を行えばよく、例えば、該パラメタ値を1/nにする、或いは、ノッチフィルタと組合せることによって対象となる周波数帯域を除去する、等の手法を適用すればよい。これは、図7における演算装置240および記憶装置250を用いることで実現できる。
【0062】
図7における記憶手段180では、帯域分割手段130によって分割された信号の帯域幅に関する情報および140に示す信号識別手段1で用いる信号識別時に用いた識別レベルに関する情報を記憶する。この帯域幅に関する情報は、例えば、信号を分析して周波数変換する際の分析幅に関する情報や、周波数変換した後にサブバンド化した場合の分析幅に関する情報等を記憶する。また識別レベルに関する情報は、前記のコスト関数の情報等を記憶する。また、図7における修正手段190は、140で示される信号識別手段1において分離のための一次減衰手段150が計算されるたびに、コスト関数を参照し、一次副減衰手段155を修正する。
【0063】
(実施の形態4)
FDICAにおいては信号源の数とマイク数が一致している場合は良好な分離精度が得られる。このため、信号源の数とマイク数を一致させる手段の実現が必要となり、信号源の数を予測することが必要となってくる。
例えば、本発明を車室内のハンドフリー音声通信および音声入力装置に適用した場合を考える。このとき、目的信号はユーザの音声であり、不要信号は車内で発生する様々な雑音、例えば、ロードノイズ、エンジンノイズ、エアコンノイズ、などとして考えることができる。ロードノイズについては、車速を検知することによって予測でき、エンジンノイズについては、車速、アイドリングの有無によって予測できる。エアコンノイズについては、エアコンのON/OFF、噴出口の切り替え状態によって予測できる。本実施の形態4においては、これら不要信号の発生の有無を予測し、信号識別手段1のサブブロックの数と、一つのサブブロックに対応させるチャネルおよびチャネル数の決定処理について述べる。
【0064】
図8はこの処理系のブロック図である。図8および図5を用いて、本発明による装置の構成について説明する。
図8における予測手段180は、実環境における様々な不要信号の発生を予測し、信号源の数を図8における変更手段190に送出する。変更手段190では、信号源の数に応じて、図8の140で示す信号識別手段1に含まれるサブブロックの数と、一つのサブブロックに対応させるチャネルおよびチャネル数を決定し、サブブロックの数と一つのサブブロックに対応させるチャネルおよびチャネル数とを変更する。
【0065】
(実施の形態5)
サブブロックの数、一つのサブブロックの入出力端子に対応させるチャネルおよびチャネル数は以下のようにして決定することが出来る。
【0066】
図9は上記の数を決定する系のブロック図である。以下、図10および図5を併用しながら、本実施の形態5を説明する。
【0067】
図9におけるテーブル手段200は、変更手段190によって変更するサブブロックの数、一つのサブブロックの入出力端子に対応させるチャネルおよびチャネル数を記述した複数の標準パターンが記憶されている。テーブル手段200は、図5の記憶手段250を用いることによって実現できる。標準パターンの一例を図10に示す。図10では、マイクに対応するセンサ数が5個のシステムにおいて、信号源が2個と予測された場合のサブブロック、各センサから各サブブロックへの経路および一つのサブブロックに入力されるチャネル数を決定した状態を示してある。このとき、サブブロックは3個生成され、それぞれのサブブロックに入力されるチャネル数は、予測された信号源の数と同じ2個とされている。各センサから各サブブロックへの経路は、センサ1とセンサ2はサブブロック1の入力、センサ3とセンサ4はサブブロック2の入力、センサ4とセンサ5はサブブロック3の入力、となっている。また、2次減衰手段170に対応するTDICAからの出力信号のチャネル数は、予測された信号源の数と同じ2個となっている。これらサブブロックの数と、一つのサブブロックに対応させるチャネルおよびチャネル数の標準パターンは、センサの位置に影響を受けるため、本発明を適用させる環境に応じて決定していくことが望ましい。
【0068】
(実施の形態6)
本実施の形態6においては、センサ配置の一手法として、サブセンサアレーを構築し、個々のサブセンサアレーに対し一つのサブブロックを対応させる手法を開示している。図1111に示すサブセンサアレー304、305、306はそれぞれ一つのサブセンサアレーに2つのセンサを有し、これらのサブセンサアレーの後段に一つのサブブロックが配置されている。このような手法を用いる場合は、予め信号源が2個と仮定されているため、サブセンサアレーを空間的に独立に信号を検知できる配置にすることが望ましい。このように、センサとなるマイクを複数本づつアレー化することにより、センサの配置の自由度を向上させることが出来、実用性を高めることが出来るようになった。
尚、上記の各実施の形態は、本発明を適用する一例を示したに過ぎず、本発明の適用範囲を限定するものではない。
【図面の簡単な説明】
【0069】
【図1】本発明における信号の流れを示す系統図。
【図2】実施の形態1に係る信号処理過程を説明するフロー図。
【図3】本発明による信号処理結果を示すヒストグラム。
【図4】実施の形態1に係る信号処理装置の基本構成を示すブロック図。
【図5】信号処理系の中心部分ハードウエアの接続関係を示すブロック図。
【図6】実施の形態2に係る信号処理過程を説明するフロー図。
【図7】実施の形態3に係る信号処理装置に係るブロック図。
【図8】実施の形態4に係る信号処理装置に係るブロック図。
【図9】実施の形態5に係る信号処理装置に係るブロック図。
【図10】実施の形態5におけるサブブロックに関する相互接続図。
【図11】実施の形態6におけるサブブロックに関する相互接続図。
【図12】従来の信号分離処理を説明する処理系系統図。
【図13】従来の他の信号分離処理を説明する処理系系統図。
【符号の説明】
【0070】
10_1〜10_n、110_1〜110_n、210_1〜210_n:センサ
20:検知過程 30:帯域分割過程
40:信号識別過程1 50:一次減衰過程
55:一次副減衰過程 60:信号識別過程2
70:2次減衰過程 80:修正過程
120:検知手段 130:帯域分割手段
140:信号識別手段1 150:一次減衰手段
155:一次副減衰手段 160:信号識別手段2
170:2次減衰手段 180:記憶手段
181:予測手段 190:修正手段
191:変更手段 200:テーブル手段
220:フィルタ 230:AD変換器
240:演算装置 250:記憶装置
300:サブブロック1 301:サブブロック2
302:サブブロック3 303:TDICA
304,305,306:サブセンサアレー

【特許請求の範囲】
【請求項1】
複数の信号源からそれぞれ放出された波動性信号を、複数の固定されたセンサによって検知し、該検知した信号から少なくとも一つの信号源の信号を分離する方法であって、
前記複数のセンサからの信号を入力する検知過程と、
該検知過程によって検知された複数の検知信号を周波数帯域毎のチャネルに分割する帯域分割過程と、
該帯域分割過程によってチャネル毎に分割された各帯域における信号の状態を示すパラメタ値について、前記信号源と前記センサとの空間的な位置の違いおよび信号種の違いに起因する前記検知信号の時間的特徴及び周波数的特徴を統計的に分析して、少なくとも一つの信号源について同一信号源から入力された信号の目的信号パラメタ値を前記パラメタ値から識別する為の識別レベル1を計算し、該識別レベル1を用いて、前記目的信号パラメタ値に関する信号である時間信号群1と不要信号パラメタ値に関する信号である時間信号群2とをそれぞれ識別し、該時間信号群1と該時間信号群2とを送出する複数の信号識別過程1と、
該時間信号群2を減衰させる一次減衰過程と、
前記信号識別過程1から送出された前記時間信号群1および前記時間信号群2について、前記信号源と前記センサの空間的な位置の違い及び信号源による信号種の違いに起因する前記時間信号群1および前記時間信号群2の時間的特徴を統計的に分析して、少なくとも一つの信号源の目的信号を分離する信号識別過程2と、
前記信号識別過程2において、識別された少なくとも一つの信号源の前記目的信号パラメタ値以外に識別された不要信号パラメタ値を減衰させる二次減衰過程とを有し、
前記信号識別過程1は、複数のセンサから入力される信号を分析するための全ての前記センサ数より少ない複数のサブブロックによって構成されており、
各サブブロックそれぞれに対し、前記検知過程によって検知され前記帯域分割過程によって分割された複数チャネルの信号群が入力されたとき、該信号群はそれぞれのサブブロックにおいて独立に識別処理されることを特徴とする信号分離方法。
【請求項2】
前記信号識別過程2で信号識別レベル2を計算し、信号識別レベル2が所望のレベルに達するまで学習を繰り返すことを特徴とする請求項1に記載の信号分離方法。
【請求項3】
少なくとも2個以上のセンサを用い、前記信号識別過程1の前記パラメタ値から識別した前記識別レベル1について、少なくとも一つの信号源についての該目的信号パラメタ値が、該不要信号パラメタ値より時間的、周波数的、幾何空間的に独立性が高い場合に前記識別レベル1が高くなるようにしたことを特徴とする請求項1に記載の信号分離方法。
【請求項4】
前記目的信号パラメタ値と前記不要信号パラメタ値の差異を示すコサイン距離をコスト関数として定義し、該コスト関数の値が低いときに独立性が高いとみなして、前記識別レベル1を高くすることを特徴とする請求項1または請求項2に記載の信号分離方法。
【請求項5】
前記信号識別過程1において計算された前記識別レベル1が所望レベルに達していない前記帯域においては、該帯域のパラメタ値を不要成分とみなし、該帯域の信号を減衰させる一次副減衰過程を有することを特徴とする請求項1乃至請求項4のいずれかに記載の信号分離方法。
【請求項6】
複数の信号源からそれぞれ放出された波動性信号を、複数の固定されたセンサによって検知し、該検知した信号から少なくとも一つの信号源の信号を分離する方法であって、
前記複数のセンサからの信号を入力する検知過程と、
該検知過程によって検知された複数の検知信号を周波数帯域毎のチャネルに分割する帯域分割過程と、
該帯域分割過程によってチャネル毎に分割された各帯域における信号の状態を示すパラメタ値について、前記信号源と前記センサとの空間的な位置の違いおよび信号種の違いに起因する前記検知信号の時間的特徴及び周波数的特徴を統計的に分析して、少なくとも一つの信号源について同一信号源から入力された信号の目的信号パラメタ値を前記パラメタ値から識別する為の識別レベル1を計算し、該識別レベル1を用いて、前記目的信号パラメタ値に関する信号である時間信号群1と不要信号パラメタ値に関する信号である時間信号群2とをそれぞれ識別し、該時間信号群1と該時間信号群2とを送出する複数の信号識別過程1と、
該時間信号群2を減衰させる一次減衰過程と、
前記信号識別過程1から送出された前記時間信号群1および前記時間信号群2について、前記信号源と前記センサの空間的な位置の違い及び信号源による信号種の違いに起因する前記時間信号群1および前記時間信号群2の時間的特徴を統計的に分析して、少なくとも一つの信号源の目的信号を分離する信号識別過程2と、
前記信号識別過程2において、識別された少なくとも一つの信号源の前記目的信号パラメタ値以外に識別された不要信号パラメタ値を減衰させる二次減衰過程と、
前記信号識別過程1において計算された前記識別レベル1が所望レベルに達していない前記帯域においては、該帯域のパラメタ値を不要成分とみなし、該帯域の信号を減衰させる一次副減衰過程と、を有することを特徴とする信号分離方法。
【請求項7】
複数の信号源からそれぞれ放出された波動性信号を、複数の固定されたセンサによって検知し、該検知した信号から少なくとも一つの信号源の信号を分離する装置であって、
前記複数のセンサからの信号を入力する検知手段と、
該検知手段によって検知された複数の検知信号を周波数帯域毎のチャネルに分割する帯域分割手段と、
該帯域分割手段によってチャネル毎に分割された各帯域における信号の状態を示すパラメタ値について、前記信号源と前記センサとの空間的な位置の違いおよび信号種の違いに起因する前記検知信号の時間的特徴及び周波数的特徴を統計的に分析して、少なくとも一つの信号源について同一信号源から入力された信号の目的信号パラメタ値を前記パラメタ値から識別する為の識別レベル1を計算し、該識別レベル1を用いて、前記目的信号パラメタ値に関する信号である時間信号群1と不要信号パラメタ値に関する信号である時間信号群2とをそれぞれ識別し、該時間信号群1と該時間信号群2とを送出する複数の信号識別手段1と、
該時間信号群2を減衰させる一次減衰手段と、
前記信号識別手段1から送出された前記時間信号群1および前記時間信号群2について、前記信号源と前記センサの空間的な位置の違い及び信号源による信号種の違いに起因する前記時間信号群1および前記時間信号群2の時間的特徴を統計的に分析して、少なくとも一つの信号源の目的信号を分離する信号識別手段2と、
前記信号識別手段2において、識別された少なくとも一つの信号源の前記目的信号パラメタ値以外に識別された不要信号パラメタ値を減衰させる二次減衰手段とを有し、
前記信号識別手段1は、複数のセンサから入力される信号を分析するための全ての前記センサ数より少ない複数のサブブロックによって構成されており、
各サブブロックそれぞれに対し、前記検知手段によって検知され前記帯域分割手段によって分割された複数チャネルの信号群が入力されたとき、該信号群はそれぞれのサブブロックにおいて独立に識別処理されることを特徴とする信号分離装置。
【請求項8】
前記信号識別手段2において、信号識別レベル2を計算し、該信号識別レベル2が所望のレベルに達するまで学習を繰り返すことを特徴とする請求項7に記載の信号分離装置。
【請求項9】
少なくとも2個以上のセンサを用い、前記信号識別手段1の前記パラメタ値から識別した前記識別レベル1について、少なくとも一つの信号源についての該目的信号パラメタ値が、該不要信号パラメタ値より時間的、周波数的、幾何空間的に独立性が高い場合に前記識別レベル1が高くなるようにしたことを特徴とする請求項7に記載の信号分離装置。
【請求項10】
前記目的信号パラメタ値と前記不要信号パラメタ値の差異を示すコサイン距離をコスト関数として定義し、該コスト関数の値が低いときに独立性が高いとみなして、前記識別レベル1を高くすることを特徴とする請求項7または請求項8に記載の信号分離装置。
【請求項11】
前記信号識別手段1において計算された前記識別レベル1が所望のレベルに達していない前記帯域においては、該帯域のパラメタ値を不要成分とみなし、該帯域の信号を減衰させる一次副減衰手段を有することを特徴とする請求項7乃至請求項10の何れかに記載の信号分離装置。
【請求項12】
信号源の数を予測する予測手段と、予測された該信号源の数に基づいて前記サブブロックの数と各サブブロックに入力するチャネルおよびチャネル数を変更する変更手段と、
を有して成ることを特徴とする請求項7に記載の信号分離装置。
【請求項13】
前記変更手段において決定するサブブロックの数、各サブブロックに入力するチャネルおよびチャネル数の標準パターンを保持するテーブル手段を有して成ることを特徴とする請求項12に記載の信号分離装置。
【請求項14】
前記サブブロックにおいて、空間的に互いに独立性を維持しやすい位置に設置された、全体のマイク数より少ないマイク数によって構成された一つ以上のサブセンサアレーが、個々のサブブロックに対して割り当てられ配置されていることを特徴とする請求項7に記載の信号源分離装置。
【請求項15】
複数の信号源からそれぞれ放出された波動性信号を、複数の固定されたセンサによって検知し、該検知した信号から少なくとも一つの信号源の信号を分離する装置であって、
前記複数のセンサからの信号を入力する検知手段と、
該検知手段によって検知された複数の検知信号を周波数帯域毎のチャネルに分割する帯域分割手段と、
該帯域分割手段によってチャネル毎に分割された各帯域における信号の状態を示すパラメタ値について、前記信号源と前記センサとの空間的な位置の違いおよび信号種の違いに起因する前記検知信号の時間的特徴及び周波数的特徴を統計的に分析して、少なくとも一つの信号源について同一信号源から入力された信号の目的信号パラメタ値を前記パラメタ値から識別する為の識別レベル1を計算し、該識別レベル1を用いて、前記目的信号パラメタ値に関する信号である時間信号群1と不要信号パラメタ値に関する信号である時間信号群2とをそれぞれ識別し、該時間信号群1と該時間信号群2とを送出する複数の信号識別手段1と、
該時間信号群2を減衰させる一次減衰手段と、
前記信号識別手段1から送出された前記時間信号群1および前記時間信号群2について、前記信号源と前記センサの空間的な位置の違い及び信号源による信号種の違いに起因する前記時間信号群1および前記時間信号群2の時間的特徴を統計的に分析して、少なくとも一つの信号源の目的信号を分離する信号識別手段2と、
前記信号識別手段2において、識別された少なくとも一つの信号源の前記目的信号パラメタ値以外に識別された不要信号パラメタ値を減衰させる二次減衰手段と、
前記信号識別手段1において計算された前記識別レベル1が所望レベルに達していない前記帯域においては、該帯域のパラメタ値を不要成分とみなし、該帯域の信号を減衰させる一次副減衰手段と、を有することを特徴とする信号分離装置。

【図1】
image rotate



【図2】
image rotate



【図3】
image rotate



【図4】
image rotate



【図5】
image rotate



【図6】
image rotate



【図7】
image rotate



【図8】
image rotate



【図9】
image rotate



【図10】
image rotate



【図11】
image rotate



【図12】
image rotate



【図13】
image rotate


【公開番号】特開2005−91560(P2005−91560A)
【公開日】平成17年4月7日(2005.4.7)
【国際特許分類】
【出願番号】特願2003−322746(P2003−322746)
【出願日】平成15年9月16日(2003.9.16)
【出願人】(000003997)日産自動車株式会社 (16,386)
【Fターム(参考)】