ブラインド信号抽出装置、その方法、そのプログラム、及びそのプログラムを記録した記録媒体
【課題】目的信号のインパルス応答ベクトル等の事前知識がなくても、ビームフォーマを用いて、混合信号から目的信号を抽出する。
【解決手段】N個の信号源から発せられた信号をM個のセンサ4mで観測し、1個以上の信号を抽出する場合において、ただし、N、Mは2以上の整数であり、センサ4mで観測された観測信号xm(t)を周波数領域の信号xn(f、τ)に変換し(5)、xn(f、τ)に対し、正規化を行い(22)、正規化されたxn(f、τ)をN個のクラスタCnにクラスタリングし(24)、Cnから、不要信号のみが含まれる観測信号の相関行列RnJ(f)を推定し(25)、クラスタの情報CnとRnJ(f)とからビームフォーマwn(f)を計算し(28)、wn(f)を用い、xn(f、τ)から目的信号yn(f、τ)を抽出し(30)、yn(f、τ)を時間領域の信号に変換する(32)。
【解決手段】N個の信号源から発せられた信号をM個のセンサ4mで観測し、1個以上の信号を抽出する場合において、ただし、N、Mは2以上の整数であり、センサ4mで観測された観測信号xm(t)を周波数領域の信号xn(f、τ)に変換し(5)、xn(f、τ)に対し、正規化を行い(22)、正規化されたxn(f、τ)をN個のクラスタCnにクラスタリングし(24)、Cnから、不要信号のみが含まれる観測信号の相関行列RnJ(f)を推定し(25)、クラスタの情報CnとRnJ(f)とからビームフォーマwn(f)を計算し(28)、wn(f)を用い、xn(f、τ)から目的信号yn(f、τ)を抽出し(30)、yn(f、τ)を時間領域の信号に変換する(32)。
【発明の詳細な説明】
【技術分野】
【0001】
この発明は、必要である源信号(目的信号)のみを直接観測することが出来ず、目的信号に他のノイズ、干渉信号などが重畳されて観測されるという状況において目的信号を推定して抽出するブラインド信号抽出装置、方法、プログラム、および記録媒体に関するものである。
【背景技術】
【0002】
ここでは、まず観測信号のモデル化と信号の周波数領域の定義を行い、次に従来技術について簡単に述べる。
[観測信号]
全ての信号はあるサンプリング周波数fsでサンプリングされ、離散的に表現されるものとする。N個(Nは2以上の整数)の源信号が混合されて、M個(Mは2以上の整数)のセンサで観測されたとする。この発明は、信号の発生源からセンサまでの距離により信号が減衰・遅延し、また壁などにより、信号が反射するなどして伝送路歪みが発生しうる状況を扱う。このような状況では、複数の信号源からの源信号sn(t)(n=1、...、N)が複数のセンサで観測信号xm(t)(m=1、...、M)として観測され、各信号源nからセンサmまでのインパルス応答をhmn(u)(uは時間を表す)とする。センサmでの観測信号xm(t)は各源信号sn(t)に対し、対応するインパルス応答hmn(u)が畳込み混合され、次式で表される。
xm(t)=Σn=1NΣu=0∞hmn(u)sn(t−u) (1)
ここでは、源信号s1(t)、...、sN(t)やインパルス応答h11(u)、...、h1N(u)、...、hM1(u)、...、hMN(u)についての情報を事前に得られない状況を考える。この状況で、観測信号x1(t)、...、xM(t)のみを用いて源信号s1(t)、...、sN(t)を分離抽出することがこの発明の広義の目的である。
[周波数領域表現]
この発明では、周波数領域において、各操作を行う。そのため、センサでの観測信号xm(t)にL点(Lは任意の整数)に、公知の技術である例えば、短時間フーリエ変換を適用して周波数ごとの時間系列
xm(f、τ)=Σu=-L/2L/2-1xm(τ+u)g(u)e−i2πfu (2)
を求める。ここで、fは周波数であり、f=0、fs/L、...、fs(L−1)/Lと離散化されており、τは任意の時間であり、上述の通り、fsはサンプリング周波数である。g(u)は例えばハニング窓などの窓関数である。
【0003】
式(1)で示される時間領域での畳み込み混合は、周波数領域では、
xm(f、τ)=Σn=1Nhmn(f)sn(f、τ) (3)
と各周波数での単純混合に近似表現される。ここで、hmn(f)は信号源nからセンサmまでの周波数成分fについての周波数応答(インパルス応答)、sn(f、τ)は式(2)と同様の式に従って、源信号sn(t)に短時間フーリエ変換を施したものであり、以下も同様とする。センサ1〜Mの観測信号x1(f、τ)、...、xM(f、τ)を式(3)を用いて、ベクトルで表記すると、
x(f、τ)=Σn=1Nhn(f)sn(f、τ) (4)
となる。ここで、x(f、τ)は、x(f、τ)=[x1(f、τ)、...、xm(f、τ)、...、xM(f、τ)]Tとなる観測信号ベクトルであり、hn(f)は、hn(f)=[h1n(f)、...、hmn(f)、...、hMn(f)]Tであり、信号源から各センサへの周波数応答をまとめたベクトルである。また、[A]TはベクトルAの転置ベクトルを示す。以下の説明も同様とする。
[代表的な従来技術]
混合信号から目的とする信号を抽出する代表的な信号抽出手法として、適応型ビームフォーマ(adaptive beamformer:ABF)が非特許文献1等に記載され、広く知られている。
【0004】
従来の適応型ビームフォーマ(以下、従来型ビームフォーマという)の機能構成例を図1に示す。複数のセンサ4mで観測された信号xm(t)が周波数領域変換部5に入力される。周波数領域変換部5で信号xm(t)が周波数領域信号xm(f、τ)に変換される。xm(f、τ)(m=1、...、M)は全て従来型ビームフォーマ6へ入力される。
【0005】
従来型ビームフォーマ6は複数のセンサを用いたシステムにおいて、目的信号sn(t)を強調し、不要信号s1(t)、...、sn−1(t)、...、sn+1(t)、...、sN(t)をできるだけ抑圧するフィルタwn(f)=[w1n(f)、...、wmn(f)、...、wMn(f)]Tを推定することで実現される。
【0006】
従来型ビームフォーマ6を設計する際には、「目的信号発生源から各センサへのインパルス応答ベクトルhn(f)もしくは、その近似であるステアリングベクトル
an(f)=[exp(−i2πfτ1n),…,exp(−i2πfτMn)]T (5)
が既知である」ということを仮定する。ここでτmnは信号源nがセンサmに達する時刻と原点0に達する時間差である。従来は、図2に示すように直線状に配置したセンサシステムを用いることが多く、信号源nの方向をθn、センサ4mのセンサ41を基準とした座標dmとすると、上述のτmnは、τmn=dmcosθn/cで与えられる。ここでcは信号の速度である。
【0007】
図1に説明を戻すと、不要信号を抑圧する従来型ビームフォーマ6として、以下の式で表される出力パワーA’(wn(f))を最小にするフィルタ群(ベクトル)wn(f)を推定する。
A’(wn(f))=E{|yn|2(f、τ)}
=E{yn(f、τ)yn*(f、τ)}
=E{wnH(f)x(f、τ)xH(f、τ)wn(f)}
=wnH(f)Rx(f)wn(f) (6)
ここで、E{・}は時間τに関する平均操作、A*はAの複素共役、Rx(f)=E{x(f、τ)xH(f、τ)}は観測信号の相関行列、[A]Hは行列(ベクトル)Aの共役転置行列(ベクトル)を示し、yn(f、τ)は従来型ビームフォーマ6の出力であり、以下の式(7)で表すことが出来る。
yn(f、τ)=wnH(f)x(f、τ) (7)
ここで、意味のない解(wn(f)=0=[0、...、0]T)を回避するために、目的信号が無歪みで得られるという以下の式に示す拘束条件を付与する。
wnH(f)hn(f)=1 (8)
これにより、式(8)を満たし、かつ上記式(6)のA’(wn(f))の値が最小となるwn(f)の値を求める問題はLagurangeの未定乗数pを用いて、以下の式(9)で表すことができる。
A(wn(f))=A’(wn(f))+p(wnH(f)hn(f)−1) (9)
式(9)を解くことにより、従来型ビームフォーマ6は、
【数1】
で得られる。
【0008】
従来型ビームフォーマ6(従来の適応型ビームフォーマ)では、式(10)におけるインパルス応答ベクトルhn(f)は実測してインパルス応答記憶部10に記憶させておいたインパルス応答ベクトルhn(f)を読み出して用いることが理想である。しかし、代わりに上記式(5)に示すステアリングベクトルan(f)をステアリングベクトル記憶部12に記憶させ、読み出されたステアリングベクトルan(f)を上記式(10)のインパルス応答ベクトルhn(f)の代わりに用いることが広く行われている。
【0009】
しかし、実環境において、インパルス応答ベクトルhn(f)やステアリングベクトルan(f)が正しく与えられることは稀であり、上記式(9)に示すA(wn(f))の最小化が必ずしも不要信号のみの最小化にはならないことが多い。このことから、混合信号(観測信号)の相関行列Rx(f)の代わりに、不要信号のみの時間区間における信号ξ(f、τ)の相関行列RJ(f)=E{ξ(f、τ)ξH(f、τ)}を用いることが非特許文献2などで広く行われている。これは、Rx(f)を用いる場合よりも高い性能を実現することが知られている。即ち、従来型ビームフォーマにおいては、不要信号のみの時間区間(目的音不在の時間区間)における相関行列が精度よく推定できることが望ましい。
【0010】
従来型ビームフォーマ6は上記式(10)のwn(f)と観測信号ベクトルx(f、τ)により、上記式(7)により、出力信号ベクトルyn(f、τ)が出力される。出力信号yn(f、τ)は時間領域変換部8に入力され、周波数領域から時間領域に変換され、yn(t)が生成される。
【非特許文献1】Haykin,S. 適応フィルタ理論 科学技術出版 2001 690頁−693頁
【非特許文献2】大賀寿郎 山崎芳男 金田豊 音響システムとディジタル処理 電子情報通信学会編 コロナ社 190頁−191頁
【発明の開示】
【発明が解決しようとする課題】
【0011】
上述の通り、従来型ビームフォーマでは目的信号源から各センサへのインパルス応答ベクトルhn(f)もしくはその近似であるステアリングベクトルan(f)が必要である。すなわち目的信号に関する事前知識が必要であるという難点がある。更にそれらは、実環境では正しく得ることが困難であり、事前知識と使用環境でのインパルス応答ベクトルhn(f)がずれてしまった場合の従来型ビームフォーマの性能は著しく低下する。
また、高い性能を得るためには、不要信号のみの時間区間における信号の相関行列RJ(f)を推定する必要があるが、不要信号が非定常な信号である場合には、それは非常に困難である。
【課題を解決するための手段】
【0012】
N個の信号源から発せられた信号をM個のセンサで観測し、観測された信号のうち、1個以上の信号を抽出する信号抽出装置において、ただし、N、Mは2以上の整数であり、上記M個のセンサで観測された観測信号を周波数領域の信号に変換し、上記周波数領域の信号に対し、正規化を行い、正規化観測信号ベクトルを算出し、上記正規化観測信号ベクトルを上記N個のクラスタにクラスタリングし、
上記クラスタの情報から、不要信号のみが含まれる観測信号の相関行列である不要信号相関行列を推定し、上記クラスタの情報と、上記不要信号相関行列と、からビームフォーマを計算し、上記ビームフォーマを用い、上記周波数領域の信号から上記目的信号を抽出し、上記抽出された上記目的信号を時間領域の信号に変換する。
【発明の効果】
【0013】
上記の構成により、事前にインパルス応答ベクトルあるいは、ステアリングベクトルを測定しておくことなく、また不要信号が非定常な信号であっても、目的信号を精度よく、分離抽出することが可能となる。
【発明を実施するための最良の形態】
【0014】
以下に発明を実施するための最良の形態を示す。
【実施例1】
【0015】
この発明の機能構成例を図3に示し、この発明の主要な処理の流れを図4に示す。図1と同一機能構成部分には同一参照符号を付け、重複説明を省略する。以下も同様とする。
【0016】
また、この発明では、信号のスパース性を仮定する。スパースとは、信号が殆どの時刻τにおいて、0であることを示す。信号のスパース性は、例えば、音声信号で確認される。信号のスパース性を仮定することで、複数の源信号が存在しても、各時間周波数ポイント(f、τ)では互いに重ならず、高々1つしか存在しないと仮定することが出来る。即ち上記式(4)は以下の式で表すことができる。
【0017】
x(f、τ)=hn(f)sn(f、τ) (11)
ここで、hn(f)はインパルス応答ベクトル、sn(f、τ)は(f、τ)に存在する源信号を表す。
【0018】
センサ4mで収音されたそれぞれの観測信号xm(t)(m=1、...M)は周波数領域変換部5に入力される。周波数領域変換部5でそれぞれの観測信号xm(t)は、例えば、公知の技術である上記の短時間フーリエ変換などで、時間領域から周波数領域に変換され、xm(f、τ)に変換される(ステップS2)。更に、xm(f、τ)は、観測信号ベクトルx(f、τ)として出力される。観測信号ベクトルx(f、τ)は正規化部22に入力され、正規化観測信号ベクトルが算出される(ステップS4)。具体的には、観測信号ベクトルx(f、τ)=[x1(f、τ)、...、xm(f、τ)]Tに対し、偏角の正規化を以下の式で行う。
【数2】
また、ノルム正規化を以下の式で行う。
【0019】
x−(f、τ)←x−(f、τ)/‖x−(f、τ)‖ (13)
ここで、x−(f、τ)は正規化された観測信号ベクトルx(f、τ)を表し、arg(r)はrの偏角を表し、iは虚数単位を表し、│r│はrの絶対値を表し、‖r‖はrのノルムを表し、Qは基準とするセンサの番号(Q∈{1、...、M})を表し、cは信号の速度を表し、αは任意の正の定数を表す。αについては、α=4dmaxが最も好ましい。ただし、dmaxは、基準として選択された任意のセンサQと他のセンサとの距離の最大値を表す。また、αは他の数値でもよい。
【0020】
上記式(11)〜(13)より、正規化された観測信号ベクトルx−(f、τ)は以下の式で表すことができる。
【数3】
ここで、An=(Σm=1M│hmn│2)1/2であり、信号sn(f、τ)に関するインパルス応答情報にのみ依存することが分かる。
【0021】
正規化された全ての時間周波数の観測信号ベクトルx−(f、τ)はクラスタリング部24に入力され、N個のクラスタにクラスタリングされる(ステップS6)。このクラスタリングは、例えば、k−means法を用いて効果的に行うことができる。また、詳細は「R.O.Duda、P.E.Hart、and D.G.Stork,Pattern Classification,Wiley Interscience, 2nd edition,2000.」に記載されている。以下にクラスタリングの方法を具体的に説明する。
【0022】
記憶部26にはあらかじめ、上記式(14)で示される正規化観測信号ベクトルx−(f、τ)とセントロイドの初期値cjn(j=0、n=1、...、N)が記憶されている。
クラスタリング部24は、記憶部26から正規化観測信号ベクトルx−(f、τ)を読み込み、これらをクラスタリングしてN個のクラスタC1、...、CNを生成する。すなわち、M次元複素ベクトルである正規化された観測信号ベクトルx−(f、τ)をM次元複素空間で以下の手順で直接クラスタリングする。
【0023】
1.クラスタのセントロイドの初期値cjnを記憶部26から読み込む。セントロイドの初期値cjnは、正規化観測信号ベクトルx−(f、τ)と同じ次元のベクトル(M次元複素ベクトル)である。なお、セントロイドの初期値c0nの選び方については後述する。
2.j+1を新たなjとする。
3.すべての時間周波数(f、τ)における正規化観測信号ベクトルx−(f、τ)を、最も近いセントロイドcj−1nで代表されるクラスタCnに割り当てる。すなわち、各正規化ベクトルx−(f、τ)に対して、‖x−(f、τ)−cj−1n‖が最も小さくなるようにnを選ぶ。
4.各クラスタCnに割りあてられた正規化観測信号ベクトルx−(f、τ)の平均値を計算し、そのノルムを1にすることでセントロイドを更新する。すなわち、各クラスタCnに割りあてられた正規化観測信号ベクトルx−(f、τ)に対して、
cnj=E{x(f、τ)}n/‖E{x−(f、τ)}n‖ (15)
の演算を行うことにより、セントロイドを更新する。ここで、E{・}nは、クラスタCnのメンバに対する平均操作を表す。
5.セントロイドcjnが収束するまで、手順2−5を繰り返す。最後に収束したセントロイドを、cn(n=1、...、N)として、記憶部26に記憶する。以上が、クラスタリング手順である。
【0024】
次に、セントロイドの初期値の選び方の例を説明する。
《初期値設定方法1》
正規化観測信号ベクトルx−(f、τ)の中からランダムにN個のベクトルを選び、それをセントロイドの初期値c0n(n=1、...、N)とする。
《初期値設定方法2》
セントロイドは、式(11)〜(15)において、全てのm、nについて、│hmn(f)│=1と仮定すると、以下の式(16)のように書けるので、これを用いる。
{cn}q=E[x−(f、τ)]n
=exp[i2π(dm−dQ)Tvn/α]/M1/2
=exp[i2π‖dm−dQ‖TcosΘnmQ/α]/M1/2
(16)
ここで、dmはセンサ4mの位置ベクトルを表し、vn=cosΘnmQは、センサ4mと基準として選択したセンサ4Qを結ぶ軸に対する信号sn(t)の到来方向ベクトルを表し、図5において、太いベクトルで示されているものである。また、vnは単位ベクトルであり、‖vn‖=1である。
【0025】
センサ位置dm(m=1、...、M)は、記憶部26において保持されている値を、方位θnと仰角φn(n=1、...、N)を適当に与える。ここで、センサ位置dm、方位θnと仰角φnは初期値であるので、適当な値で良い。例えば、θn=2πn/N、φn=0とすると、空間的に散らばった初期値が得られる。
【0026】
図3に説明を戻すと、クラスタリング部24により求まったクラスタCnは各源信号sn(f、τ)に対応している。また、そのセントロイドc−n=E{x−(f、τ)}x−(f、τ)∈Cnは上記式(14)から理解されるように、源信号sn(f、τ)に関するインパルス応答情報を表すことが分かる。
【0027】
各クラスタCnはそれぞれ、不要信号相関行列推定部25に入力される。不要信号相関行列推定部25では各クラスタCnごとにその情報から、源信号sn(f、τ)に対する不要信号区間の相関行列、つまり、不要信号のみが含まれる観測信号の相関行列である不要信号相関行列RnJ(f)を以下の式(17)(18)で推定する(ステップS8)。
【数4】
推定された不要信号相関行列RnJ(f)とクラスタリング部24よりのクラスタのセントロイド情報c―nは、ビームフォーマ計算部28に入力される。ビームフォーマ計算部28ではクラスタの情報Cnと、不要信号相関行列RnJ(f)とからビームフォーマwn(f)を計算する(ステップS10)。ビームフォーマwn(f)の具体的な計算方法については、実施例2で詳細に説明する。
【0028】
計算されたビームフォーマwn(f)は目的信号抽出部30に入力される。目的信号抽出部30では、ビームフォーマwn(f)を用いて、以下の式(19)を計算して、周波数領域の観測信号x(f、τ)から目的信号yn(f、τ)を抽出する(ステップS12)。
yn(f、τ)=wn(f)Hx(f、τ) (19)
式(17)〜(19)を全てのn(n=1、...、N)に対して行うことで、N個全ての信号を抽出する。yn(f、τ)は全て、時間領域変換部32に入力される。目的信号抽出部30で抽出された目的信号yn(f、τ)は、例えば公知の技術である短時間逆フーリエ変換などで時間領域の信号yn(t)に変換される(ステップS14)。
【実施例2】
【0029】
次に、この発明の実施例2について説明する。実施例2は、実施例1で説明したビームフォーマ計算部28をより詳細に構成した例である。図6に実施例2のビームフォーマ計算部28とこれに関係する部分の機能構成例を示す。図6に図示されていない部分は実施例1で説明したものと同様の処理を行うものとし、以下の実施例についても同様とする。ビームフォーマ計算部28はインパルス応答推定部40と適応型ビームフォーマ計算部42とで構成されている。
【0030】
インパルス応答推定部40では、クラスタCnのセントロイド情報c―nから目的信号のインパルス応答ベクトルhn(f)を推定する。具体的には、クラスタリング部24よりのセントロイド情報c―nについて逆正規化を行うことで源信号sn(f、τ)に対するインパルス応答ベクトルの推定を行う。
【0031】
まず、クラスタCnのセントロイドは上記式(15)であり、x−(f、τ)は式(14)で表すことができる。ここで、全てのm、nに対して、│hmn│=1と仮定するとセントロイドc―nのm番目の成分c―mnは、以下の式(20)が成り立つ。
【数5】
式(20)を、hmn(f)について解くと、以下の式(21)を得ることが出来る。
【0032】
【数6】
式(20)の右辺はインパルス応答hmn(f)が正規化されたものになっているが、式(21)は式(20)から逆にインパルス応答ベクトルhn(f)について求め直しているので、式(21)は逆正規化と呼ぶ。
【0033】
図6の説明に戻ると、推定されたインパルス応答ベクトルhn(f)と、不要信号相関行列推定部25よりのRnJ(f)とが、適応型ビームフォーマ計算部42に入力される。
【0034】
適応型ビームフォーマ計算部42は、インパルス応答ベクトルhn(f)と上記不要信号相関行列RnJ(f)を用いて適応型ビームフォーマwn(f)を計算する。具体的には、以下の式(22)により適応型ビームフォーマwn(f)を計算することが出来る。
【数7】
上記式(22)は、上記式(10)のRx(f)をRnJ(f)に置き換えることで得ることができる。
【0035】
目的信号抽出部30では、式(22)の適応型ビームフォーマwn(f)と、周波数領域の信号x(f、τ)とを上記式(19)に適用して、目的信号yn(f、τ)を抽出する。
【0036】
次に実施例2の変形例として実施例2’を示す。インパルス応答推定部40による、上記式(22)を用いたインパルス応答ベクトルhn(f)の推定を出力する代わりに、ステアリングベクトルan(f)を推定して、出力させることも考えられる。信号sn(f、τ)のステアリングベクトルを上記式(5)と同様に
an(f)=[exp(−i2πfτ1n)、・・・、exp(−i2πfτMn)]T (23)
とすると、ステアリングベクトルan(f)はインパルス応答ベクトルhn(f)の推定であるから、上記式(21)と上記式(23)の位相項を比較すると、τmn(m=1、...、M)は以下の式(24)で推定できる。
τ^mn=αc−1arg[c−mnc−Qn]/2π (24)
この式(24)の計算をインパルス応答推定部40’で行う。
【0037】
τ^mnを用いたステアリングベクトルan(f)をインパルス応答ベクトルhn(f)の推定として出力する。すなわち上記式(23)(24)からステアリングベクトルan(f)は以下の式(27)で表すことができ、インパルス応答推定部40’からインパルス応答h^n(f)として出力される。
an(f)=[exp(−i2πfτ^1n)、・・・、exp(−i2πfτ^Mn)]T≒h^n(f) (25)
式(25)のh^n(f)とRnJから、上記式(22)で適応型ビームフォーマを計算する。
【0038】
また、上記式(22)を使用して不要信号相関行列推定部25で適応型ビームフォーマwn(f)を推定する際に、不要信号相関行列RnJ(f)を使用して、音響伝達特性つまり、インパルス応答ベクトルhn(f)やステアリングベクトルan(f)が既知の場合はそれらを使用しても良い。また、式(22)中の不要信号相関行列RnJ(f)の代わりに、観測信号の相関行列Rx(f)を使用しても良い。これらのことは、以下の実施例においても同様である。
【実施例3】
【0039】
実施例2で示した適応型ビームフォーマでは、N≦Mの場合には、高い性能を得ることが出来るが、N>Mの場合には、性能が限られることが問題であった。具体的には、適応型ビームフォーマは不要信号の数がM−1個以下であれば、効果的に目的信号yn(f、τ)を抽出できるが、M個以上であると、その効果が不十分であることが知られている。そこで実施例3では、N>Mの場合、即ち、N−1(>M−1)個の不要信号がある場合にも目的信号を抽出できることを示す。実施例3の機能構成例を図7に示す。実施例3は、実施例2と比較して、不要信号選択部49、入力信号推定部50が追加され、不要信号相関行列推定部25、インパルス応答推定部40、適応型ビームフォーマ計算部42、の処理が変更されている。
【0040】
不要信号選択部49で、K個の不要信号についての不要信号相関行列RnJ(f)を推定する。ここで、Kは、K≦M−1を満たす整数とする。つまり、目的信号sn(f、τ)に相当するクラスタCn以外の不要信号に相当するクラスタCL(L=1、...、n−1、n+1、...、N)からK個のクラスタを選び、これらのクラスタをCJとする。
K個のクラスタの選び方として、クラスタCL中で、クラスタメンバが多いものから順にK個のクラスタを選ぶ方法や、以下の式(26)で表されるξL(f、τ)のパワーが大きいものから順にK個のクラスタを選ぶ方法等が考えられる。
【数8】
【0041】
不要信号選択部49で選択されたK個のクラスタCJを用いて、K個の不要信号についての不要信号相関行列RnJ(f)を以下の式(27)(28)で計算する。
【数9】
【0042】
また、入力信号推定部50において、不要信号選択部49で選択したK個の不要信号と目的信号Cnとが混合したビームフォーマ入力信号ベクトルx(f、τ)を推定する。これは、不要信号クラスタCJと目的信号クラスタCnを用いて、以下の式(29)で得ることができる。
【数10】
適応型ビームフォーマ計算部42では、上記式(27)(28)で得られた不要信号相関行列RnJ(f)とインパルス応答推定部40または40’よりのインパルス応答ベクトルhn(f)を用いて、上記式(22)を用いて、適応型ビームフォーマwn(f)を計算する。
【0043】
目的信号抽出部30では、入力信号推定部50よりのビームフォーマ入力信号x(f、τ)が入力される。目的信号抽出部30では適応型ビームフォーマ計算部42よりの適応型ビームフォーマwn(f)と、ビームフォーマ入力信号ベクトルx(f、τ)を用いて、上記式(19)を計算して、目的信号yn(f、τ)を抽出する。
【0044】
実施例3では上述の通り、N>Mの場合を説明した。しかし、N≦Mの場合でも実施できる。この場合は、実施例2と比較して、入力信号推定部50と不要信号選択部49の処理の分だけ余計にコストがかかる。
【実施例4】
【0045】
実施例4は、センサの位置情報が既知の場合の実施例である。実施例4の機能構成例の一部を図8に示す。実施例2もしくは3で説明したインパルス応答推定部40は到来方向推定部60とインパルス応答計算部62により構成されている。また、M個のセンサの位置を表すセンサ位置情報を記憶しているセンサ位置情報記憶部64を有する。
【0046】
到来方向推定部60で、信号の到来方向を推定する。到来方向推定部60には、クラスタリング部24よりのセントロイド情報c−nとセンサ位置情報記憶部64よりの各センサの位置を表す3次元ベクトルdm(m=1、...、M)が入力される。信号snの到来方向を表す長さ1の3次元ベクトルをvn(n=1、...、N)とすると、信号snの到来方向の推定値はセントロイド情報c−nを用いて、以下の式(30)で計算することができる。
【0047】
vn=αD+arg[c−n]/2π (30)
ここで、D=[d1−dQ、...、dm−dQ、...、dM−dQ]Tであり、dQは基準として、任意に選択したセンサ4Qの位置を表す3次元ベクトルであり、D+は、Dの一般化逆行列を表す。
【0048】
次にインパルス応答計算部62において、信号snの到来方向とセンサ位置情報とを用いて、インパルス応答を計算する。インパルス応答計算部62には、到来方向推定部60よりの信号snの到来方向の推定値qnと、センサ位置情報記憶部64よりのセンサ位置情報dQが入力される。インパルス応答計算部62は以下の式(31)で表す信号snについてのステアリングベクトルan^(f)の推定値を求める。このステアリングベクトルan^(f)をインパルス応答ベクトルの推定値hn(f)として計算する。
【数11】
そして、ステアリングベクトルan^(f)(インパルス応答ベクトルの推定値hn(f))がインパルス応答計算部62から出力され、適応型ビームフォーマ計算部42に入力される。
【実施例5】
【0049】
本実施例では、適応型ビームフォーマの代わりに、最大利得ビームフォーマを用いる構成を示す。最大利得ビームフォーマとは、センサアレイ出力における目的信号を最大にしつつセンサアレイ出力における不要信号成分を最小にするようなフィルタwn(f)をビームフォーマとする方法である。(D.H.Johnson and D.E.Dudgeon,“Array Signal Processing Concepts and Techniques”,Prentice Hall,1993.)
最大利得ビームフォーマにおいては、センサアレイ出力中の目的信号成分と不要信号成分を推定することが1つのポイントとなるが、不要信号が非定常信号である場合、不要信号を推定することは非常に困難であるという問題があった。実施例5では、この問題をスパース性の仮定を用いることで解決する。つまり(1)目的信号のみの観測信号の相関行列である目的信号相関行列RTn(f)と、不要信号のみの観測信号の相関行列である不要信号相関行列RJn(f)とを推定すること、(2)最大利得ビームフォーマ計算部で、目的信号相関行列RTn(f)と不要信号相関行列RJn(f)とから最大利得ビームフォーマwn(f)を推定することにより解決することが出来る。
【0050】
また、最大利得ビームフォーマでは「目的信号の歪みを最小にする」という上記式拘束条件(8)が無いため、各周波数fにおいて、様々な、ゲイン特性を持つビームフォーマwn(f)が構成される。これは、例えば、音声信号のような広帯域信号に最大利得ビームフォーマを適用した場合、出力がwn(f)の周波数特性により歪んでしまうことを意味する。このため、従来は最大利得ビームフォーマを広帯域信号に用いることは困難であった。実施例5では、観測信号ベクトルx(f、τ)と最大利得ビームフォーマwn(f)の出力信号との誤差が最小となるように、最大利得ビームフォーマwn(f)を補正することでこれを解決する。
【0051】
まず、最大利得ビームフォーマの原理を簡単に説明する。上述したように「センサアレイ出力における目的信号を最大にしつつセンサアレイ出力における不要信号成分を最小にする」との条件より評価関数は以下の式(32)となる。
【数12】
【0052】
ここで、分母は不要信号の出力パワー、分子は目的信号の出力パワーであり、RTn(f)は目的信号のみの観測信号の相関行列、RJn(f)は不要信号のみの観測信号の相関行列である。また、(RJn(f))1/2=EF1/2EHで表すことが出来、ここで、E=[e1、...em]であり、eiはRJn(f)の固有ベクトルであり、F=diag(λ1、...、λM)であり、λiはeiに対応するRJnの固有値とし、w〜=(RJn(f))1/2wnとすると、上記式(32)は以下の式(33)に変えることが出来る。
【数13】
【0053】
ここで「児玉、須田、“システム制御のためのマトリクス理論、コロナ社、1995」に記載のレイリー商の定理より、g(w〜)の最大値は、(RJn(f))−1/2(RTn(f))(RJn(f))−1/2の最大固有値λで与えられ、対応する固有ベクトルをeとすると、最大値はmaxg(w〜)=λ=g(e)となる。すなわち求める最大利得ビームフォーマwnは以下の式(34)(35)で表すことができる。
w〜=e (34)
wn=(RJn(f))−1/2e (35)
実施例5の機能構成例を図9に示す。実施例1と比較して、観測信号相関行列推定部72が追加され、ビームフォーマ計算部28は、目的信号相関行列推定部70、固有ベクトル計算部74、最大利得ビームフォーマ計算部76、補正ベクトル計算部78、補正部80、とで構成されている。
【0054】
目的信号相関行列推定部70で、クラスタの情報から目的信号sn(f、τ)のみの時間区間の相関行列を以下の式(36)(37)で推定する。
【数14】
ここで、Cnは目的信号に対応するクラスタである。不要信号相関行列推定部25よりの不要信号相関行列RJn(f)と、目的信号相関行列RTn(f)とが、固有ベクトル計算部74に入力される。固有ベクトル計算部74で(RJn(f))−1/2(RTn(f))(RJn(f))−1/2の最大固有ベクトルen(f)を上記で説明したレイリー商の定理より、計算する。
【0055】
不要信号相関行列推定部25よりのRJn(f)と固有ベクトル計算部74よりのen(f)とが最大利得ビームフォーマ計算部76に入力される。最大利得ビームフォーマ計算部76では、以下の式(38)より最大利得ビームフォーマwn(f)を計算する。
wn(f)=(RJn(f))−1/2en(f) (38)
この式(38)は、上記式(35)に基づいている。
【0056】
一方、観測信号相関行列推定部72で、観測信号ベクトルx(f、τ)の相関行列である観測信号相関行列Rx(f)を以下の式(39)を用いて推定する。
Rx(f)=E{x(f、τ)xH(f、τ)} (39)
補正ベクトル計算部78に、最大利得ビームフォーマ計算部76よりの最大利得ビームフォーマwn(f)と、観測信号相関行列推定部72よりの観測信号相関行列Rx(f)が入力される。補正ベクトル計算部78では、最大利得ビームフォーマwn(f)を補正するための補正ベクトルαn(f)を生成する。この補正は、最大利得ビームフォーマwn(f)が出力に与える歪みが最小になるよう最大利得ビームフォーマwn(f)を変換する。例えば、以下の式(40)であらわされる観測信号ベクトルx(f、τ)と出力信号ベクトルyn(f、τ)との誤差Aを最小にする補正ベクトルαn(f)を計算する。
A(αn(f))=E{‖x(f、τ)−αn(f)yn(f、τ)‖2} (40)
ここで、yn(f、τ)は最大利得ビームフォーマwn(f)の出力yn(f、τ)=wn(f)x(f、τ)である。
上記式(40)の右辺を展開すると、
A(αn(f))={E[‖x(f、τ)‖]}2−αn(f)E[xH(f、τ)yn(f、τ)]−αnH(f)E[yn(f、τ)*x(f、τ)]
+αnαnHE[│yn(f、τ)│2] (41)
式(41)において、両辺をαnH(f)で偏微分すると、以下の式(42)になる。
∂A(αn(f))/∂ αnH(f)=
−E[yn(f、τ)*x(f、τ)]+αnE[│yn(f、τ)│2] (42)
上記式(42)の左辺を0とおき、αnについて求めると、以下の式(43)になる。
αn(f)=E[yn(f、τ)*x(f、τ)]/E[│yn(f、τ)│2]
(43)
ここで、上記式(19)と上記式(39)より上記式(43)は以下の式(44)になる。
【0057】
【数15】
ここで、上述したように、Rx(f)は観測信号ベクトルx(f、τ)の相関行列である。上記式(44)から理解されるように、最大利得ビームフォーマwn(f)と観測信号ベクトルx(f、τ)を用いて、補正ベクトル計算部78では、補正ベクトルαn(f)が計算される。
【0058】
補正部80は、最大利得ビームフォーマwn(f)に対し、補正ベクトルαn(f)を用いて、周波数歪みを補正し、補正ビームフォーマを計算する。具体的には以下の式(45)により補正して補正ビームフォーマwn’(f)を求めることが出来る。
wn’(f)=[αn(f)]Bwn(f) (45)
ここで、Bは任意のセンサの番号であり、B∈{1、...、M}であり、[q]BはベクトルqのB番目の要素であることを示している。
【0059】
目的信号抽出部30では、補正ビームフォーマwn’(f)を用いて、以下の式(46)で目的信号yn(f、τ)を抽出する。
yn(f、τ)=wn’H(f)x(f、τ) (46)
また、実施例5の変形例の機能構成例を図10に示す。ビームフォーマ計算部28は目的信号相関行列推定部70、固有ベクトル計算部74、最大利得ビームフォーマ計算部76、とで構成され、目的信号抽出部30は信号抽出部81と歪み補正部82とで構成されている。
【0060】
最大利得ビームフォーマ計算部76よりの最大利得ビームフォーマwn(f)と、周波数領域変換部5よりの観測信号ベクトルx(f、τ)とは、信号抽出部81に入力される。信号抽出部81では、以下の式(47)を計算して、歪みを含んだ目的信号yn(f、τ)を抽出する。
yn(f、τ)=wnH(f)x(f、τ) (47)
歪みを含んだ目的信号yn(f、τ)は歪み補正部82に入力される。
また、補正ベクトル計算部78よりの補正ベクトルαn(f)も歪み補正部82に入力される。歪み補正部82では、以下の式(48)で出力信号を変換することで、歪みを補正して補正出力信号yn’(f、τ)を出力する。
yn’(f、τ)=[αn(f)]Byn(f、τ) (48)
なお、以上で説明した実施例1〜5では、全てのnについて信号を抽出するとしてきたが、単独の信号(1つのn)についてのみ、ビームフォーマを構成するだけでもよい。目的信号の選択については、例えば、データベース上の目的信号のインパルス応答ベクトルhdと発明法により全ての音源nについて推定されたインパルス応答ベクトルhnを比較して、最もhdに近いhnを持つ音源nを選ぶことで選択できる。例えば、minn(h1・hn)などのアルゴリズムが考えられる。選ばれたnについてのみ実施例2〜5で説明したビームフォーマ計算部28による上記式(24)などを用いたビームフォーマを構成すれば、目的信号についての適応型ビームフォーマを得ることができる。
【0061】
[実験結果]
上記実施例の効果を示すために、実験を行った。図11に示す部屋で測定したインパルス応答を複数の音声に畳み込み混合することで、混合信号を模した。実験条件は図11に示す通りである。長辺が880cm、短辺が375cm、高さが240cm、残響は120msの室内において、底面の長辺から200cm、短辺から282cmの位置に3つのセンサ41、42、43を配置した。長辺と平行軸をx、短辺と平行軸をyとし、図12に示すように、3つのセンサ41、42、43をy軸上に2個、x軸上に1個、辺の長さ4cmの正三角形の頂点につまり2次元に配した場合の実験を行う。またセンサとしてはマイクロホンを用いた。
4通りの音声組み合わせについて、信号対不要信号比(SIR)と信号対歪み比(SDR)を評価した。なお、単位はdBである。
【0062】
4つの音源をセンサ位置におけるx軸とy軸の交点を中心とし、x軸の+方向を0度とし、左回りに30度、315度方向とセンサ位置を中心と半径50cmの円との各交差点上にそれぞれの音源を、225度、315度の方向と半径80cmの円との交差点上に、それぞれ音源を配置させる。実施例2の効果を確かめる実験では、120度、225度、315度方向の音源を用い、N(源信号の数)=M(センサの数)=3とした。また実施例3の効果を確かめる実験ではN=4、M=3とした。
【0063】
図13にこの実験の結果を示す。実施例3は従来法、実施例2、実施例2’、実施例4、実施例5において、図7記載の入力信号推定部50を設けた場合を示す。従来法では、図1記載の適応型ビームフォーマ6を表す上記式(10)において、hn(f)に既知のステアリングベクトルan(f)を与えたものを用いた。この場合、N=Mの場合も、N>Mの場合も、共に高い性能を得られなかった。これは、残響のある環境での実験であるため、与えられたステアリングベクトルan(f)が残響の影響まで、考慮できなかったことが主な原因として考えられる。また、N>Mの場合に十分なSIRが得られないのは、適応型ビームフォーマの限界つまりM−1個の不要信号しか効果的に抑圧できないことを示している。
【0064】
従来法に対し、N=Mの場合、N>Mの場合であっても、上記実施例はSIR、SDRの値を比較すると、従来法よりも高い性能を持つことが理解される。
【0065】
以上の各実施形態の他、本発明であるブラインド信号抽出装置は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、ブラインド信号抽出装置において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。
【0066】
また、この発明のブラインド信号抽出装置における処理をコンピュータによって実現する場合、ブラインド信号抽出装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、ブラインド信号抽出装置における処理機能がコンピュータ上で実現される。
【0067】
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto−Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable−Read Only Memory)等を用いることができる。
【0068】
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
【0069】
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
【0070】
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、ブラインド信号抽出装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
【産業上の利用可能性】
【0071】
この発明は、オーディオ分野の応用として、音声認識機の入力マイクロホンと話者が離れた位置にあるためマイクロホンが目的話者音声以外の音まで収音してしまうような状況でも、目的音声を分離抽出することで、認識率の高い音声認識系の構築が可能になる。
【図面の簡単な説明】
【0072】
【図1】従来技術のシステムの機能構成例を示すブロック図。
【図2】直線状に配置したセンサシステムを用いた場合において、音源nが任意のセンサjに達する時刻と原点0に達する時刻との時間差τを説明するための図。
【図3】この発明の実施例1のシステムの機能構成例を示すブロック図。
【図4】この発明の実施例1の主な処理の流れを示すフローチャート。
【図5】任意の2つのセンサであるセンサmとセンサQとにおいて、上記式(16)で使用するcosΘnmQを説明するための図。
【図6】この発明の実施例2のシステムの機能構成例の一部を示すブロック図。
【図7】この発明の実施例3のシステムの機能構成例の一部を示すブロック図。
【図8】この発明の実施例4のシステムの機能構成例の一部を示すブロック図。
【図9】この発明の実施例5のシステムの機能構成例の一部を示すブロック図。
【図10】この発明の実施例5の変形例のシステムの機能構成例の一部を示すブロック図。
【図11】従来の技術とこの発明の技術との比較実験を真上から見た図。
【図12】図11の3つのセンサ41、42、43の位置関係の詳細を示す図。
【図13】従来の技術とこの発明の技術の効果を比較した実験結果を示す図。
【技術分野】
【0001】
この発明は、必要である源信号(目的信号)のみを直接観測することが出来ず、目的信号に他のノイズ、干渉信号などが重畳されて観測されるという状況において目的信号を推定して抽出するブラインド信号抽出装置、方法、プログラム、および記録媒体に関するものである。
【背景技術】
【0002】
ここでは、まず観測信号のモデル化と信号の周波数領域の定義を行い、次に従来技術について簡単に述べる。
[観測信号]
全ての信号はあるサンプリング周波数fsでサンプリングされ、離散的に表現されるものとする。N個(Nは2以上の整数)の源信号が混合されて、M個(Mは2以上の整数)のセンサで観測されたとする。この発明は、信号の発生源からセンサまでの距離により信号が減衰・遅延し、また壁などにより、信号が反射するなどして伝送路歪みが発生しうる状況を扱う。このような状況では、複数の信号源からの源信号sn(t)(n=1、...、N)が複数のセンサで観測信号xm(t)(m=1、...、M)として観測され、各信号源nからセンサmまでのインパルス応答をhmn(u)(uは時間を表す)とする。センサmでの観測信号xm(t)は各源信号sn(t)に対し、対応するインパルス応答hmn(u)が畳込み混合され、次式で表される。
xm(t)=Σn=1NΣu=0∞hmn(u)sn(t−u) (1)
ここでは、源信号s1(t)、...、sN(t)やインパルス応答h11(u)、...、h1N(u)、...、hM1(u)、...、hMN(u)についての情報を事前に得られない状況を考える。この状況で、観測信号x1(t)、...、xM(t)のみを用いて源信号s1(t)、...、sN(t)を分離抽出することがこの発明の広義の目的である。
[周波数領域表現]
この発明では、周波数領域において、各操作を行う。そのため、センサでの観測信号xm(t)にL点(Lは任意の整数)に、公知の技術である例えば、短時間フーリエ変換を適用して周波数ごとの時間系列
xm(f、τ)=Σu=-L/2L/2-1xm(τ+u)g(u)e−i2πfu (2)
を求める。ここで、fは周波数であり、f=0、fs/L、...、fs(L−1)/Lと離散化されており、τは任意の時間であり、上述の通り、fsはサンプリング周波数である。g(u)は例えばハニング窓などの窓関数である。
【0003】
式(1)で示される時間領域での畳み込み混合は、周波数領域では、
xm(f、τ)=Σn=1Nhmn(f)sn(f、τ) (3)
と各周波数での単純混合に近似表現される。ここで、hmn(f)は信号源nからセンサmまでの周波数成分fについての周波数応答(インパルス応答)、sn(f、τ)は式(2)と同様の式に従って、源信号sn(t)に短時間フーリエ変換を施したものであり、以下も同様とする。センサ1〜Mの観測信号x1(f、τ)、...、xM(f、τ)を式(3)を用いて、ベクトルで表記すると、
x(f、τ)=Σn=1Nhn(f)sn(f、τ) (4)
となる。ここで、x(f、τ)は、x(f、τ)=[x1(f、τ)、...、xm(f、τ)、...、xM(f、τ)]Tとなる観測信号ベクトルであり、hn(f)は、hn(f)=[h1n(f)、...、hmn(f)、...、hMn(f)]Tであり、信号源から各センサへの周波数応答をまとめたベクトルである。また、[A]TはベクトルAの転置ベクトルを示す。以下の説明も同様とする。
[代表的な従来技術]
混合信号から目的とする信号を抽出する代表的な信号抽出手法として、適応型ビームフォーマ(adaptive beamformer:ABF)が非特許文献1等に記載され、広く知られている。
【0004】
従来の適応型ビームフォーマ(以下、従来型ビームフォーマという)の機能構成例を図1に示す。複数のセンサ4mで観測された信号xm(t)が周波数領域変換部5に入力される。周波数領域変換部5で信号xm(t)が周波数領域信号xm(f、τ)に変換される。xm(f、τ)(m=1、...、M)は全て従来型ビームフォーマ6へ入力される。
【0005】
従来型ビームフォーマ6は複数のセンサを用いたシステムにおいて、目的信号sn(t)を強調し、不要信号s1(t)、...、sn−1(t)、...、sn+1(t)、...、sN(t)をできるだけ抑圧するフィルタwn(f)=[w1n(f)、...、wmn(f)、...、wMn(f)]Tを推定することで実現される。
【0006】
従来型ビームフォーマ6を設計する際には、「目的信号発生源から各センサへのインパルス応答ベクトルhn(f)もしくは、その近似であるステアリングベクトル
an(f)=[exp(−i2πfτ1n),…,exp(−i2πfτMn)]T (5)
が既知である」ということを仮定する。ここでτmnは信号源nがセンサmに達する時刻と原点0に達する時間差である。従来は、図2に示すように直線状に配置したセンサシステムを用いることが多く、信号源nの方向をθn、センサ4mのセンサ41を基準とした座標dmとすると、上述のτmnは、τmn=dmcosθn/cで与えられる。ここでcは信号の速度である。
【0007】
図1に説明を戻すと、不要信号を抑圧する従来型ビームフォーマ6として、以下の式で表される出力パワーA’(wn(f))を最小にするフィルタ群(ベクトル)wn(f)を推定する。
A’(wn(f))=E{|yn|2(f、τ)}
=E{yn(f、τ)yn*(f、τ)}
=E{wnH(f)x(f、τ)xH(f、τ)wn(f)}
=wnH(f)Rx(f)wn(f) (6)
ここで、E{・}は時間τに関する平均操作、A*はAの複素共役、Rx(f)=E{x(f、τ)xH(f、τ)}は観測信号の相関行列、[A]Hは行列(ベクトル)Aの共役転置行列(ベクトル)を示し、yn(f、τ)は従来型ビームフォーマ6の出力であり、以下の式(7)で表すことが出来る。
yn(f、τ)=wnH(f)x(f、τ) (7)
ここで、意味のない解(wn(f)=0=[0、...、0]T)を回避するために、目的信号が無歪みで得られるという以下の式に示す拘束条件を付与する。
wnH(f)hn(f)=1 (8)
これにより、式(8)を満たし、かつ上記式(6)のA’(wn(f))の値が最小となるwn(f)の値を求める問題はLagurangeの未定乗数pを用いて、以下の式(9)で表すことができる。
A(wn(f))=A’(wn(f))+p(wnH(f)hn(f)−1) (9)
式(9)を解くことにより、従来型ビームフォーマ6は、
【数1】
で得られる。
【0008】
従来型ビームフォーマ6(従来の適応型ビームフォーマ)では、式(10)におけるインパルス応答ベクトルhn(f)は実測してインパルス応答記憶部10に記憶させておいたインパルス応答ベクトルhn(f)を読み出して用いることが理想である。しかし、代わりに上記式(5)に示すステアリングベクトルan(f)をステアリングベクトル記憶部12に記憶させ、読み出されたステアリングベクトルan(f)を上記式(10)のインパルス応答ベクトルhn(f)の代わりに用いることが広く行われている。
【0009】
しかし、実環境において、インパルス応答ベクトルhn(f)やステアリングベクトルan(f)が正しく与えられることは稀であり、上記式(9)に示すA(wn(f))の最小化が必ずしも不要信号のみの最小化にはならないことが多い。このことから、混合信号(観測信号)の相関行列Rx(f)の代わりに、不要信号のみの時間区間における信号ξ(f、τ)の相関行列RJ(f)=E{ξ(f、τ)ξH(f、τ)}を用いることが非特許文献2などで広く行われている。これは、Rx(f)を用いる場合よりも高い性能を実現することが知られている。即ち、従来型ビームフォーマにおいては、不要信号のみの時間区間(目的音不在の時間区間)における相関行列が精度よく推定できることが望ましい。
【0010】
従来型ビームフォーマ6は上記式(10)のwn(f)と観測信号ベクトルx(f、τ)により、上記式(7)により、出力信号ベクトルyn(f、τ)が出力される。出力信号yn(f、τ)は時間領域変換部8に入力され、周波数領域から時間領域に変換され、yn(t)が生成される。
【非特許文献1】Haykin,S. 適応フィルタ理論 科学技術出版 2001 690頁−693頁
【非特許文献2】大賀寿郎 山崎芳男 金田豊 音響システムとディジタル処理 電子情報通信学会編 コロナ社 190頁−191頁
【発明の開示】
【発明が解決しようとする課題】
【0011】
上述の通り、従来型ビームフォーマでは目的信号源から各センサへのインパルス応答ベクトルhn(f)もしくはその近似であるステアリングベクトルan(f)が必要である。すなわち目的信号に関する事前知識が必要であるという難点がある。更にそれらは、実環境では正しく得ることが困難であり、事前知識と使用環境でのインパルス応答ベクトルhn(f)がずれてしまった場合の従来型ビームフォーマの性能は著しく低下する。
また、高い性能を得るためには、不要信号のみの時間区間における信号の相関行列RJ(f)を推定する必要があるが、不要信号が非定常な信号である場合には、それは非常に困難である。
【課題を解決するための手段】
【0012】
N個の信号源から発せられた信号をM個のセンサで観測し、観測された信号のうち、1個以上の信号を抽出する信号抽出装置において、ただし、N、Mは2以上の整数であり、上記M個のセンサで観測された観測信号を周波数領域の信号に変換し、上記周波数領域の信号に対し、正規化を行い、正規化観測信号ベクトルを算出し、上記正規化観測信号ベクトルを上記N個のクラスタにクラスタリングし、
上記クラスタの情報から、不要信号のみが含まれる観測信号の相関行列である不要信号相関行列を推定し、上記クラスタの情報と、上記不要信号相関行列と、からビームフォーマを計算し、上記ビームフォーマを用い、上記周波数領域の信号から上記目的信号を抽出し、上記抽出された上記目的信号を時間領域の信号に変換する。
【発明の効果】
【0013】
上記の構成により、事前にインパルス応答ベクトルあるいは、ステアリングベクトルを測定しておくことなく、また不要信号が非定常な信号であっても、目的信号を精度よく、分離抽出することが可能となる。
【発明を実施するための最良の形態】
【0014】
以下に発明を実施するための最良の形態を示す。
【実施例1】
【0015】
この発明の機能構成例を図3に示し、この発明の主要な処理の流れを図4に示す。図1と同一機能構成部分には同一参照符号を付け、重複説明を省略する。以下も同様とする。
【0016】
また、この発明では、信号のスパース性を仮定する。スパースとは、信号が殆どの時刻τにおいて、0であることを示す。信号のスパース性は、例えば、音声信号で確認される。信号のスパース性を仮定することで、複数の源信号が存在しても、各時間周波数ポイント(f、τ)では互いに重ならず、高々1つしか存在しないと仮定することが出来る。即ち上記式(4)は以下の式で表すことができる。
【0017】
x(f、τ)=hn(f)sn(f、τ) (11)
ここで、hn(f)はインパルス応答ベクトル、sn(f、τ)は(f、τ)に存在する源信号を表す。
【0018】
センサ4mで収音されたそれぞれの観測信号xm(t)(m=1、...M)は周波数領域変換部5に入力される。周波数領域変換部5でそれぞれの観測信号xm(t)は、例えば、公知の技術である上記の短時間フーリエ変換などで、時間領域から周波数領域に変換され、xm(f、τ)に変換される(ステップS2)。更に、xm(f、τ)は、観測信号ベクトルx(f、τ)として出力される。観測信号ベクトルx(f、τ)は正規化部22に入力され、正規化観測信号ベクトルが算出される(ステップS4)。具体的には、観測信号ベクトルx(f、τ)=[x1(f、τ)、...、xm(f、τ)]Tに対し、偏角の正規化を以下の式で行う。
【数2】
また、ノルム正規化を以下の式で行う。
【0019】
x−(f、τ)←x−(f、τ)/‖x−(f、τ)‖ (13)
ここで、x−(f、τ)は正規化された観測信号ベクトルx(f、τ)を表し、arg(r)はrの偏角を表し、iは虚数単位を表し、│r│はrの絶対値を表し、‖r‖はrのノルムを表し、Qは基準とするセンサの番号(Q∈{1、...、M})を表し、cは信号の速度を表し、αは任意の正の定数を表す。αについては、α=4dmaxが最も好ましい。ただし、dmaxは、基準として選択された任意のセンサQと他のセンサとの距離の最大値を表す。また、αは他の数値でもよい。
【0020】
上記式(11)〜(13)より、正規化された観測信号ベクトルx−(f、τ)は以下の式で表すことができる。
【数3】
ここで、An=(Σm=1M│hmn│2)1/2であり、信号sn(f、τ)に関するインパルス応答情報にのみ依存することが分かる。
【0021】
正規化された全ての時間周波数の観測信号ベクトルx−(f、τ)はクラスタリング部24に入力され、N個のクラスタにクラスタリングされる(ステップS6)。このクラスタリングは、例えば、k−means法を用いて効果的に行うことができる。また、詳細は「R.O.Duda、P.E.Hart、and D.G.Stork,Pattern Classification,Wiley Interscience, 2nd edition,2000.」に記載されている。以下にクラスタリングの方法を具体的に説明する。
【0022】
記憶部26にはあらかじめ、上記式(14)で示される正規化観測信号ベクトルx−(f、τ)とセントロイドの初期値cjn(j=0、n=1、...、N)が記憶されている。
クラスタリング部24は、記憶部26から正規化観測信号ベクトルx−(f、τ)を読み込み、これらをクラスタリングしてN個のクラスタC1、...、CNを生成する。すなわち、M次元複素ベクトルである正規化された観測信号ベクトルx−(f、τ)をM次元複素空間で以下の手順で直接クラスタリングする。
【0023】
1.クラスタのセントロイドの初期値cjnを記憶部26から読み込む。セントロイドの初期値cjnは、正規化観測信号ベクトルx−(f、τ)と同じ次元のベクトル(M次元複素ベクトル)である。なお、セントロイドの初期値c0nの選び方については後述する。
2.j+1を新たなjとする。
3.すべての時間周波数(f、τ)における正規化観測信号ベクトルx−(f、τ)を、最も近いセントロイドcj−1nで代表されるクラスタCnに割り当てる。すなわち、各正規化ベクトルx−(f、τ)に対して、‖x−(f、τ)−cj−1n‖が最も小さくなるようにnを選ぶ。
4.各クラスタCnに割りあてられた正規化観測信号ベクトルx−(f、τ)の平均値を計算し、そのノルムを1にすることでセントロイドを更新する。すなわち、各クラスタCnに割りあてられた正規化観測信号ベクトルx−(f、τ)に対して、
cnj=E{x(f、τ)}n/‖E{x−(f、τ)}n‖ (15)
の演算を行うことにより、セントロイドを更新する。ここで、E{・}nは、クラスタCnのメンバに対する平均操作を表す。
5.セントロイドcjnが収束するまで、手順2−5を繰り返す。最後に収束したセントロイドを、cn(n=1、...、N)として、記憶部26に記憶する。以上が、クラスタリング手順である。
【0024】
次に、セントロイドの初期値の選び方の例を説明する。
《初期値設定方法1》
正規化観測信号ベクトルx−(f、τ)の中からランダムにN個のベクトルを選び、それをセントロイドの初期値c0n(n=1、...、N)とする。
《初期値設定方法2》
セントロイドは、式(11)〜(15)において、全てのm、nについて、│hmn(f)│=1と仮定すると、以下の式(16)のように書けるので、これを用いる。
{cn}q=E[x−(f、τ)]n
=exp[i2π(dm−dQ)Tvn/α]/M1/2
=exp[i2π‖dm−dQ‖TcosΘnmQ/α]/M1/2
(16)
ここで、dmはセンサ4mの位置ベクトルを表し、vn=cosΘnmQは、センサ4mと基準として選択したセンサ4Qを結ぶ軸に対する信号sn(t)の到来方向ベクトルを表し、図5において、太いベクトルで示されているものである。また、vnは単位ベクトルであり、‖vn‖=1である。
【0025】
センサ位置dm(m=1、...、M)は、記憶部26において保持されている値を、方位θnと仰角φn(n=1、...、N)を適当に与える。ここで、センサ位置dm、方位θnと仰角φnは初期値であるので、適当な値で良い。例えば、θn=2πn/N、φn=0とすると、空間的に散らばった初期値が得られる。
【0026】
図3に説明を戻すと、クラスタリング部24により求まったクラスタCnは各源信号sn(f、τ)に対応している。また、そのセントロイドc−n=E{x−(f、τ)}x−(f、τ)∈Cnは上記式(14)から理解されるように、源信号sn(f、τ)に関するインパルス応答情報を表すことが分かる。
【0027】
各クラスタCnはそれぞれ、不要信号相関行列推定部25に入力される。不要信号相関行列推定部25では各クラスタCnごとにその情報から、源信号sn(f、τ)に対する不要信号区間の相関行列、つまり、不要信号のみが含まれる観測信号の相関行列である不要信号相関行列RnJ(f)を以下の式(17)(18)で推定する(ステップS8)。
【数4】
推定された不要信号相関行列RnJ(f)とクラスタリング部24よりのクラスタのセントロイド情報c―nは、ビームフォーマ計算部28に入力される。ビームフォーマ計算部28ではクラスタの情報Cnと、不要信号相関行列RnJ(f)とからビームフォーマwn(f)を計算する(ステップS10)。ビームフォーマwn(f)の具体的な計算方法については、実施例2で詳細に説明する。
【0028】
計算されたビームフォーマwn(f)は目的信号抽出部30に入力される。目的信号抽出部30では、ビームフォーマwn(f)を用いて、以下の式(19)を計算して、周波数領域の観測信号x(f、τ)から目的信号yn(f、τ)を抽出する(ステップS12)。
yn(f、τ)=wn(f)Hx(f、τ) (19)
式(17)〜(19)を全てのn(n=1、...、N)に対して行うことで、N個全ての信号を抽出する。yn(f、τ)は全て、時間領域変換部32に入力される。目的信号抽出部30で抽出された目的信号yn(f、τ)は、例えば公知の技術である短時間逆フーリエ変換などで時間領域の信号yn(t)に変換される(ステップS14)。
【実施例2】
【0029】
次に、この発明の実施例2について説明する。実施例2は、実施例1で説明したビームフォーマ計算部28をより詳細に構成した例である。図6に実施例2のビームフォーマ計算部28とこれに関係する部分の機能構成例を示す。図6に図示されていない部分は実施例1で説明したものと同様の処理を行うものとし、以下の実施例についても同様とする。ビームフォーマ計算部28はインパルス応答推定部40と適応型ビームフォーマ計算部42とで構成されている。
【0030】
インパルス応答推定部40では、クラスタCnのセントロイド情報c―nから目的信号のインパルス応答ベクトルhn(f)を推定する。具体的には、クラスタリング部24よりのセントロイド情報c―nについて逆正規化を行うことで源信号sn(f、τ)に対するインパルス応答ベクトルの推定を行う。
【0031】
まず、クラスタCnのセントロイドは上記式(15)であり、x−(f、τ)は式(14)で表すことができる。ここで、全てのm、nに対して、│hmn│=1と仮定するとセントロイドc―nのm番目の成分c―mnは、以下の式(20)が成り立つ。
【数5】
式(20)を、hmn(f)について解くと、以下の式(21)を得ることが出来る。
【0032】
【数6】
式(20)の右辺はインパルス応答hmn(f)が正規化されたものになっているが、式(21)は式(20)から逆にインパルス応答ベクトルhn(f)について求め直しているので、式(21)は逆正規化と呼ぶ。
【0033】
図6の説明に戻ると、推定されたインパルス応答ベクトルhn(f)と、不要信号相関行列推定部25よりのRnJ(f)とが、適応型ビームフォーマ計算部42に入力される。
【0034】
適応型ビームフォーマ計算部42は、インパルス応答ベクトルhn(f)と上記不要信号相関行列RnJ(f)を用いて適応型ビームフォーマwn(f)を計算する。具体的には、以下の式(22)により適応型ビームフォーマwn(f)を計算することが出来る。
【数7】
上記式(22)は、上記式(10)のRx(f)をRnJ(f)に置き換えることで得ることができる。
【0035】
目的信号抽出部30では、式(22)の適応型ビームフォーマwn(f)と、周波数領域の信号x(f、τ)とを上記式(19)に適用して、目的信号yn(f、τ)を抽出する。
【0036】
次に実施例2の変形例として実施例2’を示す。インパルス応答推定部40による、上記式(22)を用いたインパルス応答ベクトルhn(f)の推定を出力する代わりに、ステアリングベクトルan(f)を推定して、出力させることも考えられる。信号sn(f、τ)のステアリングベクトルを上記式(5)と同様に
an(f)=[exp(−i2πfτ1n)、・・・、exp(−i2πfτMn)]T (23)
とすると、ステアリングベクトルan(f)はインパルス応答ベクトルhn(f)の推定であるから、上記式(21)と上記式(23)の位相項を比較すると、τmn(m=1、...、M)は以下の式(24)で推定できる。
τ^mn=αc−1arg[c−mnc−Qn]/2π (24)
この式(24)の計算をインパルス応答推定部40’で行う。
【0037】
τ^mnを用いたステアリングベクトルan(f)をインパルス応答ベクトルhn(f)の推定として出力する。すなわち上記式(23)(24)からステアリングベクトルan(f)は以下の式(27)で表すことができ、インパルス応答推定部40’からインパルス応答h^n(f)として出力される。
an(f)=[exp(−i2πfτ^1n)、・・・、exp(−i2πfτ^Mn)]T≒h^n(f) (25)
式(25)のh^n(f)とRnJから、上記式(22)で適応型ビームフォーマを計算する。
【0038】
また、上記式(22)を使用して不要信号相関行列推定部25で適応型ビームフォーマwn(f)を推定する際に、不要信号相関行列RnJ(f)を使用して、音響伝達特性つまり、インパルス応答ベクトルhn(f)やステアリングベクトルan(f)が既知の場合はそれらを使用しても良い。また、式(22)中の不要信号相関行列RnJ(f)の代わりに、観測信号の相関行列Rx(f)を使用しても良い。これらのことは、以下の実施例においても同様である。
【実施例3】
【0039】
実施例2で示した適応型ビームフォーマでは、N≦Mの場合には、高い性能を得ることが出来るが、N>Mの場合には、性能が限られることが問題であった。具体的には、適応型ビームフォーマは不要信号の数がM−1個以下であれば、効果的に目的信号yn(f、τ)を抽出できるが、M個以上であると、その効果が不十分であることが知られている。そこで実施例3では、N>Mの場合、即ち、N−1(>M−1)個の不要信号がある場合にも目的信号を抽出できることを示す。実施例3の機能構成例を図7に示す。実施例3は、実施例2と比較して、不要信号選択部49、入力信号推定部50が追加され、不要信号相関行列推定部25、インパルス応答推定部40、適応型ビームフォーマ計算部42、の処理が変更されている。
【0040】
不要信号選択部49で、K個の不要信号についての不要信号相関行列RnJ(f)を推定する。ここで、Kは、K≦M−1を満たす整数とする。つまり、目的信号sn(f、τ)に相当するクラスタCn以外の不要信号に相当するクラスタCL(L=1、...、n−1、n+1、...、N)からK個のクラスタを選び、これらのクラスタをCJとする。
K個のクラスタの選び方として、クラスタCL中で、クラスタメンバが多いものから順にK個のクラスタを選ぶ方法や、以下の式(26)で表されるξL(f、τ)のパワーが大きいものから順にK個のクラスタを選ぶ方法等が考えられる。
【数8】
【0041】
不要信号選択部49で選択されたK個のクラスタCJを用いて、K個の不要信号についての不要信号相関行列RnJ(f)を以下の式(27)(28)で計算する。
【数9】
【0042】
また、入力信号推定部50において、不要信号選択部49で選択したK個の不要信号と目的信号Cnとが混合したビームフォーマ入力信号ベクトルx(f、τ)を推定する。これは、不要信号クラスタCJと目的信号クラスタCnを用いて、以下の式(29)で得ることができる。
【数10】
適応型ビームフォーマ計算部42では、上記式(27)(28)で得られた不要信号相関行列RnJ(f)とインパルス応答推定部40または40’よりのインパルス応答ベクトルhn(f)を用いて、上記式(22)を用いて、適応型ビームフォーマwn(f)を計算する。
【0043】
目的信号抽出部30では、入力信号推定部50よりのビームフォーマ入力信号x(f、τ)が入力される。目的信号抽出部30では適応型ビームフォーマ計算部42よりの適応型ビームフォーマwn(f)と、ビームフォーマ入力信号ベクトルx(f、τ)を用いて、上記式(19)を計算して、目的信号yn(f、τ)を抽出する。
【0044】
実施例3では上述の通り、N>Mの場合を説明した。しかし、N≦Mの場合でも実施できる。この場合は、実施例2と比較して、入力信号推定部50と不要信号選択部49の処理の分だけ余計にコストがかかる。
【実施例4】
【0045】
実施例4は、センサの位置情報が既知の場合の実施例である。実施例4の機能構成例の一部を図8に示す。実施例2もしくは3で説明したインパルス応答推定部40は到来方向推定部60とインパルス応答計算部62により構成されている。また、M個のセンサの位置を表すセンサ位置情報を記憶しているセンサ位置情報記憶部64を有する。
【0046】
到来方向推定部60で、信号の到来方向を推定する。到来方向推定部60には、クラスタリング部24よりのセントロイド情報c−nとセンサ位置情報記憶部64よりの各センサの位置を表す3次元ベクトルdm(m=1、...、M)が入力される。信号snの到来方向を表す長さ1の3次元ベクトルをvn(n=1、...、N)とすると、信号snの到来方向の推定値はセントロイド情報c−nを用いて、以下の式(30)で計算することができる。
【0047】
vn=αD+arg[c−n]/2π (30)
ここで、D=[d1−dQ、...、dm−dQ、...、dM−dQ]Tであり、dQは基準として、任意に選択したセンサ4Qの位置を表す3次元ベクトルであり、D+は、Dの一般化逆行列を表す。
【0048】
次にインパルス応答計算部62において、信号snの到来方向とセンサ位置情報とを用いて、インパルス応答を計算する。インパルス応答計算部62には、到来方向推定部60よりの信号snの到来方向の推定値qnと、センサ位置情報記憶部64よりのセンサ位置情報dQが入力される。インパルス応答計算部62は以下の式(31)で表す信号snについてのステアリングベクトルan^(f)の推定値を求める。このステアリングベクトルan^(f)をインパルス応答ベクトルの推定値hn(f)として計算する。
【数11】
そして、ステアリングベクトルan^(f)(インパルス応答ベクトルの推定値hn(f))がインパルス応答計算部62から出力され、適応型ビームフォーマ計算部42に入力される。
【実施例5】
【0049】
本実施例では、適応型ビームフォーマの代わりに、最大利得ビームフォーマを用いる構成を示す。最大利得ビームフォーマとは、センサアレイ出力における目的信号を最大にしつつセンサアレイ出力における不要信号成分を最小にするようなフィルタwn(f)をビームフォーマとする方法である。(D.H.Johnson and D.E.Dudgeon,“Array Signal Processing Concepts and Techniques”,Prentice Hall,1993.)
最大利得ビームフォーマにおいては、センサアレイ出力中の目的信号成分と不要信号成分を推定することが1つのポイントとなるが、不要信号が非定常信号である場合、不要信号を推定することは非常に困難であるという問題があった。実施例5では、この問題をスパース性の仮定を用いることで解決する。つまり(1)目的信号のみの観測信号の相関行列である目的信号相関行列RTn(f)と、不要信号のみの観測信号の相関行列である不要信号相関行列RJn(f)とを推定すること、(2)最大利得ビームフォーマ計算部で、目的信号相関行列RTn(f)と不要信号相関行列RJn(f)とから最大利得ビームフォーマwn(f)を推定することにより解決することが出来る。
【0050】
また、最大利得ビームフォーマでは「目的信号の歪みを最小にする」という上記式拘束条件(8)が無いため、各周波数fにおいて、様々な、ゲイン特性を持つビームフォーマwn(f)が構成される。これは、例えば、音声信号のような広帯域信号に最大利得ビームフォーマを適用した場合、出力がwn(f)の周波数特性により歪んでしまうことを意味する。このため、従来は最大利得ビームフォーマを広帯域信号に用いることは困難であった。実施例5では、観測信号ベクトルx(f、τ)と最大利得ビームフォーマwn(f)の出力信号との誤差が最小となるように、最大利得ビームフォーマwn(f)を補正することでこれを解決する。
【0051】
まず、最大利得ビームフォーマの原理を簡単に説明する。上述したように「センサアレイ出力における目的信号を最大にしつつセンサアレイ出力における不要信号成分を最小にする」との条件より評価関数は以下の式(32)となる。
【数12】
【0052】
ここで、分母は不要信号の出力パワー、分子は目的信号の出力パワーであり、RTn(f)は目的信号のみの観測信号の相関行列、RJn(f)は不要信号のみの観測信号の相関行列である。また、(RJn(f))1/2=EF1/2EHで表すことが出来、ここで、E=[e1、...em]であり、eiはRJn(f)の固有ベクトルであり、F=diag(λ1、...、λM)であり、λiはeiに対応するRJnの固有値とし、w〜=(RJn(f))1/2wnとすると、上記式(32)は以下の式(33)に変えることが出来る。
【数13】
【0053】
ここで「児玉、須田、“システム制御のためのマトリクス理論、コロナ社、1995」に記載のレイリー商の定理より、g(w〜)の最大値は、(RJn(f))−1/2(RTn(f))(RJn(f))−1/2の最大固有値λで与えられ、対応する固有ベクトルをeとすると、最大値はmaxg(w〜)=λ=g(e)となる。すなわち求める最大利得ビームフォーマwnは以下の式(34)(35)で表すことができる。
w〜=e (34)
wn=(RJn(f))−1/2e (35)
実施例5の機能構成例を図9に示す。実施例1と比較して、観測信号相関行列推定部72が追加され、ビームフォーマ計算部28は、目的信号相関行列推定部70、固有ベクトル計算部74、最大利得ビームフォーマ計算部76、補正ベクトル計算部78、補正部80、とで構成されている。
【0054】
目的信号相関行列推定部70で、クラスタの情報から目的信号sn(f、τ)のみの時間区間の相関行列を以下の式(36)(37)で推定する。
【数14】
ここで、Cnは目的信号に対応するクラスタである。不要信号相関行列推定部25よりの不要信号相関行列RJn(f)と、目的信号相関行列RTn(f)とが、固有ベクトル計算部74に入力される。固有ベクトル計算部74で(RJn(f))−1/2(RTn(f))(RJn(f))−1/2の最大固有ベクトルen(f)を上記で説明したレイリー商の定理より、計算する。
【0055】
不要信号相関行列推定部25よりのRJn(f)と固有ベクトル計算部74よりのen(f)とが最大利得ビームフォーマ計算部76に入力される。最大利得ビームフォーマ計算部76では、以下の式(38)より最大利得ビームフォーマwn(f)を計算する。
wn(f)=(RJn(f))−1/2en(f) (38)
この式(38)は、上記式(35)に基づいている。
【0056】
一方、観測信号相関行列推定部72で、観測信号ベクトルx(f、τ)の相関行列である観測信号相関行列Rx(f)を以下の式(39)を用いて推定する。
Rx(f)=E{x(f、τ)xH(f、τ)} (39)
補正ベクトル計算部78に、最大利得ビームフォーマ計算部76よりの最大利得ビームフォーマwn(f)と、観測信号相関行列推定部72よりの観測信号相関行列Rx(f)が入力される。補正ベクトル計算部78では、最大利得ビームフォーマwn(f)を補正するための補正ベクトルαn(f)を生成する。この補正は、最大利得ビームフォーマwn(f)が出力に与える歪みが最小になるよう最大利得ビームフォーマwn(f)を変換する。例えば、以下の式(40)であらわされる観測信号ベクトルx(f、τ)と出力信号ベクトルyn(f、τ)との誤差Aを最小にする補正ベクトルαn(f)を計算する。
A(αn(f))=E{‖x(f、τ)−αn(f)yn(f、τ)‖2} (40)
ここで、yn(f、τ)は最大利得ビームフォーマwn(f)の出力yn(f、τ)=wn(f)x(f、τ)である。
上記式(40)の右辺を展開すると、
A(αn(f))={E[‖x(f、τ)‖]}2−αn(f)E[xH(f、τ)yn(f、τ)]−αnH(f)E[yn(f、τ)*x(f、τ)]
+αnαnHE[│yn(f、τ)│2] (41)
式(41)において、両辺をαnH(f)で偏微分すると、以下の式(42)になる。
∂A(αn(f))/∂ αnH(f)=
−E[yn(f、τ)*x(f、τ)]+αnE[│yn(f、τ)│2] (42)
上記式(42)の左辺を0とおき、αnについて求めると、以下の式(43)になる。
αn(f)=E[yn(f、τ)*x(f、τ)]/E[│yn(f、τ)│2]
(43)
ここで、上記式(19)と上記式(39)より上記式(43)は以下の式(44)になる。
【0057】
【数15】
ここで、上述したように、Rx(f)は観測信号ベクトルx(f、τ)の相関行列である。上記式(44)から理解されるように、最大利得ビームフォーマwn(f)と観測信号ベクトルx(f、τ)を用いて、補正ベクトル計算部78では、補正ベクトルαn(f)が計算される。
【0058】
補正部80は、最大利得ビームフォーマwn(f)に対し、補正ベクトルαn(f)を用いて、周波数歪みを補正し、補正ビームフォーマを計算する。具体的には以下の式(45)により補正して補正ビームフォーマwn’(f)を求めることが出来る。
wn’(f)=[αn(f)]Bwn(f) (45)
ここで、Bは任意のセンサの番号であり、B∈{1、...、M}であり、[q]BはベクトルqのB番目の要素であることを示している。
【0059】
目的信号抽出部30では、補正ビームフォーマwn’(f)を用いて、以下の式(46)で目的信号yn(f、τ)を抽出する。
yn(f、τ)=wn’H(f)x(f、τ) (46)
また、実施例5の変形例の機能構成例を図10に示す。ビームフォーマ計算部28は目的信号相関行列推定部70、固有ベクトル計算部74、最大利得ビームフォーマ計算部76、とで構成され、目的信号抽出部30は信号抽出部81と歪み補正部82とで構成されている。
【0060】
最大利得ビームフォーマ計算部76よりの最大利得ビームフォーマwn(f)と、周波数領域変換部5よりの観測信号ベクトルx(f、τ)とは、信号抽出部81に入力される。信号抽出部81では、以下の式(47)を計算して、歪みを含んだ目的信号yn(f、τ)を抽出する。
yn(f、τ)=wnH(f)x(f、τ) (47)
歪みを含んだ目的信号yn(f、τ)は歪み補正部82に入力される。
また、補正ベクトル計算部78よりの補正ベクトルαn(f)も歪み補正部82に入力される。歪み補正部82では、以下の式(48)で出力信号を変換することで、歪みを補正して補正出力信号yn’(f、τ)を出力する。
yn’(f、τ)=[αn(f)]Byn(f、τ) (48)
なお、以上で説明した実施例1〜5では、全てのnについて信号を抽出するとしてきたが、単独の信号(1つのn)についてのみ、ビームフォーマを構成するだけでもよい。目的信号の選択については、例えば、データベース上の目的信号のインパルス応答ベクトルhdと発明法により全ての音源nについて推定されたインパルス応答ベクトルhnを比較して、最もhdに近いhnを持つ音源nを選ぶことで選択できる。例えば、minn(h1・hn)などのアルゴリズムが考えられる。選ばれたnについてのみ実施例2〜5で説明したビームフォーマ計算部28による上記式(24)などを用いたビームフォーマを構成すれば、目的信号についての適応型ビームフォーマを得ることができる。
【0061】
[実験結果]
上記実施例の効果を示すために、実験を行った。図11に示す部屋で測定したインパルス応答を複数の音声に畳み込み混合することで、混合信号を模した。実験条件は図11に示す通りである。長辺が880cm、短辺が375cm、高さが240cm、残響は120msの室内において、底面の長辺から200cm、短辺から282cmの位置に3つのセンサ41、42、43を配置した。長辺と平行軸をx、短辺と平行軸をyとし、図12に示すように、3つのセンサ41、42、43をy軸上に2個、x軸上に1個、辺の長さ4cmの正三角形の頂点につまり2次元に配した場合の実験を行う。またセンサとしてはマイクロホンを用いた。
4通りの音声組み合わせについて、信号対不要信号比(SIR)と信号対歪み比(SDR)を評価した。なお、単位はdBである。
【0062】
4つの音源をセンサ位置におけるx軸とy軸の交点を中心とし、x軸の+方向を0度とし、左回りに30度、315度方向とセンサ位置を中心と半径50cmの円との各交差点上にそれぞれの音源を、225度、315度の方向と半径80cmの円との交差点上に、それぞれ音源を配置させる。実施例2の効果を確かめる実験では、120度、225度、315度方向の音源を用い、N(源信号の数)=M(センサの数)=3とした。また実施例3の効果を確かめる実験ではN=4、M=3とした。
【0063】
図13にこの実験の結果を示す。実施例3は従来法、実施例2、実施例2’、実施例4、実施例5において、図7記載の入力信号推定部50を設けた場合を示す。従来法では、図1記載の適応型ビームフォーマ6を表す上記式(10)において、hn(f)に既知のステアリングベクトルan(f)を与えたものを用いた。この場合、N=Mの場合も、N>Mの場合も、共に高い性能を得られなかった。これは、残響のある環境での実験であるため、与えられたステアリングベクトルan(f)が残響の影響まで、考慮できなかったことが主な原因として考えられる。また、N>Mの場合に十分なSIRが得られないのは、適応型ビームフォーマの限界つまりM−1個の不要信号しか効果的に抑圧できないことを示している。
【0064】
従来法に対し、N=Mの場合、N>Mの場合であっても、上記実施例はSIR、SDRの値を比較すると、従来法よりも高い性能を持つことが理解される。
【0065】
以上の各実施形態の他、本発明であるブラインド信号抽出装置は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、ブラインド信号抽出装置において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。
【0066】
また、この発明のブラインド信号抽出装置における処理をコンピュータによって実現する場合、ブラインド信号抽出装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、ブラインド信号抽出装置における処理機能がコンピュータ上で実現される。
【0067】
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto−Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable−Read Only Memory)等を用いることができる。
【0068】
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
【0069】
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
【0070】
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、ブラインド信号抽出装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
【産業上の利用可能性】
【0071】
この発明は、オーディオ分野の応用として、音声認識機の入力マイクロホンと話者が離れた位置にあるためマイクロホンが目的話者音声以外の音まで収音してしまうような状況でも、目的音声を分離抽出することで、認識率の高い音声認識系の構築が可能になる。
【図面の簡単な説明】
【0072】
【図1】従来技術のシステムの機能構成例を示すブロック図。
【図2】直線状に配置したセンサシステムを用いた場合において、音源nが任意のセンサjに達する時刻と原点0に達する時刻との時間差τを説明するための図。
【図3】この発明の実施例1のシステムの機能構成例を示すブロック図。
【図4】この発明の実施例1の主な処理の流れを示すフローチャート。
【図5】任意の2つのセンサであるセンサmとセンサQとにおいて、上記式(16)で使用するcosΘnmQを説明するための図。
【図6】この発明の実施例2のシステムの機能構成例の一部を示すブロック図。
【図7】この発明の実施例3のシステムの機能構成例の一部を示すブロック図。
【図8】この発明の実施例4のシステムの機能構成例の一部を示すブロック図。
【図9】この発明の実施例5のシステムの機能構成例の一部を示すブロック図。
【図10】この発明の実施例5の変形例のシステムの機能構成例の一部を示すブロック図。
【図11】従来の技術とこの発明の技術との比較実験を真上から見た図。
【図12】図11の3つのセンサ41、42、43の位置関係の詳細を示す図。
【図13】従来の技術とこの発明の技術の効果を比較した実験結果を示す図。
【特許請求の範囲】
【請求項1】
N個の信号源から発せられた信号をM個のセンサで観測し、観測された信号のうち、1個以上の信号を抽出する信号抽出装置において、ただし、N、Mは2以上の整数であり、
上記M個のセンサで観測された観測信号を周波数領域の信号に変換する周波数領域変換部と、
上記周波数領域の信号に対し、正規化を行い、正規化観測信号ベクトルを算出する正規化部と、
上記正規化観測信号ベクトルをN個のクラスタにクラスタリングするクラスタリング部と、
上記クラスタの情報から、不要信号のみが含まれる観測信号の相関行列である不要信号相関行列を推定する不要信号相関行列推定部と、
上記クラスタの情報と、上記不要信号相関行列と、からビームフォーマを計算するビームフォーマ計算部と、
上記ビームフォーマを用い、上記周波数領域の信号から目的信号を抽出する目的信号抽出部と、
上記抽出された上記目的信号を時間領域の信号に変換する時間領域変換部と、を具備することを特徴とするブラインド信号抽出装置。
【請求項2】
請求項1記載のブラインド信号抽出装置であって、
上記ビームフォーマ計算部は、
上記クラスタのセントロイド情報から上記目的信号のインパルス応答を推定するインパルス応答推定部と、
上記インパルス応答と上記不要信号相関行列を用いて適応型ビームフォーマを計算する適応型ビームフォーマ計算部と、により構成され、
上記目的信号抽出部は、上記適応型ビームフォーマを用い、上記周波数領域の信号から上記目的信号を抽出するものであることを特徴とするブラインド信号抽出装置。
【請求項3】
請求項1記載のブラインド信号抽出装置であって、
上記不要信号相関行列推定部は、上記クラスタの情報から選択されたK個の不要信号の相関行列である不要信号相関行列を推定するものであり、ただし、KはK≦M−1を満たす整数であり、
更に、上記クラスタの情報から目的信号と上記選択されたK個の不要信号のみを含むビームフォーマ入力信号を推定する入力信号推定部を有し、
上記ビームフォーマ計算部は、
上記クラスタのセントロイド情報から上記目的信号のインパルス応答を推定するインパルス応答推定部と、
上記インパルス応答と上記不要信号相関行列とを用いて、適応型ビームフォーマを計算する適応型ビームフォーマ計算部と、により構成され、
上記目的信号抽出部は、上記適応型ビームフォーマを用い、上記ビームフォーマ入力信号から目的信号を抽出するものであることを特徴とするブラインド信号抽出装置。
【請求項4】
請求項2又は3記載のブラインド信号抽出装置であって、
更に、上記M個のセンサの位置を表すセンサ位置情報を記憶しているセンサ位置情報記憶部を備え、
上記インパルス応答推定部は、
上記センサ位置情報と上記クラスタの上記セントロイド情報とを用いて信号の到来方向を推定する到来方向推定部と、
上記推定された信号の到来方向と上記センサ位置情報からインパルス応答を計算するインパルス応答計算部と、で構成されていることを特徴とするブラインド信号抽出装置。
【請求項5】
請求項1記載のブラインド信号抽出装置であって、
更に、観測信号から観測信号の相関行列である観測信号相関行列を推定する観測信号相関行列推定部を備え、
上記ビームフォーマ計算部は、
上記クラスタの情報から上記目的信号が含まれる観測信号の相関行列である目的信号相関行列を推定する目的信号相関行列推定部と、
上記不要信号相関行列と上記目的信号相関行列とから最大利得ビームフォーマを計算する最大利得ビームフォーマ計算部と、
上記最大利得ビームフォーマに対し、上記観測信号相関行列を用いて、周波数歪みを補正し、補正ビームフォーマを計算する補正部と、を具備し、
上記目的信号抽出部は、上記補正ビームフォーマを用い、上記周波数領域の信号から目的信号を抽出するものである、
ことを特徴とするブラインド信号抽出装置。
【請求項6】
請求項1記載のブラインド信号抽出装置であって、
更に、観測信号から観測信号の相関行列である観測信号相関行列を推定する観測信号相関行列推定部を備え、
上記ビームフォーマ計算部は、
上記クラスタの情報から上記目的信号が含まれる観測信号の相関行列である目的信号相関行列を推定する目的信号相関行列推定部と、
上記不要信号相関行列と上記目的信号相関行列とから最大利得ビームフォーマを計算する最大利得ビームフォーマ計算部とを具備し、
上記観測信号相関行列と上記最大利得ビームフォーマとを用いて、補正ベクトルを計算する補正ベクトル計算部を備え、
上記目的信号抽出部は、
上記最大ビームフォーマを用い、上記周波数領域の信号から歪みを含む目的信号を抽出する信号抽出部と、
上記抽出された歪みを含む目的信号に対し、上記補正ベクトルを用いて、歪み補正をして、上記目的信号を出力する歪み補正部とを具備する
ことを特徴とするブラインド信号抽出装置。
【請求項7】
N個の信号源から発せられた信号をM個のセンサで観測し、観測された信号のうち、1個以上の信号を抽出する信号抽出方法において、ただし、N、Mは2以上の整数であり、
周波数領域変換手段が、上記M個のセンサで観測された観測信号を周波数領域の信号に変換する周波数領域変換過程と、
正規化手段が、上記周波数領域の信号に対し、正規化を行い、正規化観測信号ベクトルを算出する正規化過程と、
クラスタリング手段が、上記正規化観測信号ベクトルをN個のクラスタにクラスタリングするクラスタリング過程と、
不要信号相関行列推定過程が、上記クラスタの情報から、不要信号のみが含まれる観測信号の相関行列である不要信号相関行列を推定する不要信号相関行列推定過程と、
ビームフォーマ計算手段が、上記クラスタの情報と、上記不要信号相関行列と、からビームフォーマを計算するビームフォーマ計算過程と、
目的信号抽出手段が、上記ビームフォーマを用い、上記周波数領域の信号から目的信号を抽出する目的信号抽出過程と、
時間領域変換手段が、上記抽出された上記目的信号を時間領域の信号に変換する時間領域変換過程と、を有することを特徴とするブラインド信号抽出方法。
【請求項8】
請求項7記載のブラインド信号抽出方法であって、
上記ビームフォーマ計算過程は、
インパルス応答推定手段が、上記クラスタのセントロイド情報から上記目的信号のインパルス応答を推定するインパルス応答推定過程と、
適応型ビームフォーマ計算手段が、上記インパルス応答と上記不要信号相関行列を用いて適応型ビームフォーマを計算する適応型ビームフォーマ計算過程と、を有し、
上記目的信号抽出過程は、上記適応型ビームフォーマを用い、上記周波数領域の信号から上記目的信号を抽出する過程であることを特徴とするブラインド信号抽出方法。
【請求項9】
請求項7記載のブラインド信号抽出方法であって、
上記不要信号相関行列推定過程は、上記クラスタの情報から選択されたK個の不要信号の相関行列である不要信号相関行列を推定する過程であり、ただし、KはK≦M−1を満たす整数であり、
更に、入力信号推定手段が、上記クラスタの情報から目的信号と上記選択されたK個の不要信号のみを含むビームフォーマ入力信号を推定する入力信号推定過程を有し、
上記ビームフォーマ計算過程は、
インパルス応答手段が、上記クラスタのセントロイド情報から上記目的信号のインパルス応答を推定するインパルス応答推定過程と、
適応型ビームフォーマ計算手段が、上記インパルス応答と上記不要信号相関行列とを用いて、適応型ビームフォーマを計算する適応型ビームフォーマ計算過程とを有し、
上記目的信号抽出過程は、上記適応型ビームフォーマを用い、上記ビームフォーマ入力信号から目的信号を抽出する過程であることを特徴とするブラインド信号抽出方法。
【請求項10】
請求項8又は9記載のブラインド信号抽出方法であって、
上記インパルス応答推定過程は、
到来方向推定手段が、センサ位置情報記憶部中の上記センサ位置情報と上記クラスタの上記セントロイド情報とを用いて信号の到来方向を推定する到来方向推定過程と、ここで、センサ位置情報記憶部とは、上記M個のセンサの位置を表すセンサ位置情報を記憶しているものであり、
インパルス応答計算手段が、上記推定された信号の到来方向と上記センサ位置情報からインパルス応答を計算するインパルス応答計算過程と、を有することを特徴とするブラインド信号抽出方法。
【請求項11】
請求項7記載のブラインド信号抽出方法であって、
更に、観測信号相関行列推定手段が、観測信号から観測信号の相関行列である観測信号相関行列を推定する観測信号相関行列推定過程を備え、
上記ビームフォーマ計算過程は、
目的信号相関行列推定手段が、上記クラスタの情報から上記目的信号が含まれる観測信号の相関行列である目的信号相関行列を推定する目的信号相関行列推定過程と、
最大利得ビームフォーマ計算手段が、上記不要信号相関行列と上記目的信号相関行列とから最大利得ビームフォーマを計算する最大利得ビームフォーマ計算過程と、
補正手段が、上記最大利得ビームフォーマに対し、上記観測信号相関行列を用いて、周波数歪みを補正し、補正ビームフォーマを計算する補正過程と、を有し、
上記目的信号抽出過程は、上記補正ビームフォーマを用い、上記周波数領域の信号から目的信号を抽出する過程である、
ことを特徴とするブラインド信号抽出方法。
【請求項12】
請求項7記載のブラインド信号抽出方法であって、
更に、観測信号相関行列推定手段が、観測信号から観測信号の相関行列である観測信号相関行列を推定する観測信号相関行列推定過程を備え、
上記ビームフォーマ計算過程は、
目的信号相関行列推定手段が、上記クラスタの情報から上記目的信号が含まれる観測信号の相関行列である目的信号相関行列を推定する目的信号相関行列推定過程と、
最大利得ビームフォーマ計算手段が、上記不要信号相関行列と上記目的信号相関行列とから最大利得ビームフォーマを計算する最大利得ビームフォーマ計算過程とを有し、
更に、補正ベクトル計算手段が、上記観測信号相関行列と上記最大利得ビームフォーマとを用いて、補正ベクトルを計算する補正ベクトル計算過程を有し、
上記目的信号抽出過程は、
信号抽出手段が、上記最大ビームフォーマを用い、上記周波数領域の信号から歪みを含む目的信号を抽出する信号抽出過程と、
歪み補正手段が、上記抽出された歪みを含む目的信号に対し、上記補正ベクトルを用いて、歪み補正をして、上記目的信号を出力する歪み補正過程とを有する
ことを特徴とするブラインド信号抽出方法。
【請求項13】
請求項7〜12の何れかに記載のブラインド信号抽出方法の各過程をコンピュータに実行させるためのブラインド信号抽出プログラム。
【請求項14】
請求項13記載のブラインド信号抽出プログラムを記録したコンピュータ読み取り可能な記録媒体。
【請求項1】
N個の信号源から発せられた信号をM個のセンサで観測し、観測された信号のうち、1個以上の信号を抽出する信号抽出装置において、ただし、N、Mは2以上の整数であり、
上記M個のセンサで観測された観測信号を周波数領域の信号に変換する周波数領域変換部と、
上記周波数領域の信号に対し、正規化を行い、正規化観測信号ベクトルを算出する正規化部と、
上記正規化観測信号ベクトルをN個のクラスタにクラスタリングするクラスタリング部と、
上記クラスタの情報から、不要信号のみが含まれる観測信号の相関行列である不要信号相関行列を推定する不要信号相関行列推定部と、
上記クラスタの情報と、上記不要信号相関行列と、からビームフォーマを計算するビームフォーマ計算部と、
上記ビームフォーマを用い、上記周波数領域の信号から目的信号を抽出する目的信号抽出部と、
上記抽出された上記目的信号を時間領域の信号に変換する時間領域変換部と、を具備することを特徴とするブラインド信号抽出装置。
【請求項2】
請求項1記載のブラインド信号抽出装置であって、
上記ビームフォーマ計算部は、
上記クラスタのセントロイド情報から上記目的信号のインパルス応答を推定するインパルス応答推定部と、
上記インパルス応答と上記不要信号相関行列を用いて適応型ビームフォーマを計算する適応型ビームフォーマ計算部と、により構成され、
上記目的信号抽出部は、上記適応型ビームフォーマを用い、上記周波数領域の信号から上記目的信号を抽出するものであることを特徴とするブラインド信号抽出装置。
【請求項3】
請求項1記載のブラインド信号抽出装置であって、
上記不要信号相関行列推定部は、上記クラスタの情報から選択されたK個の不要信号の相関行列である不要信号相関行列を推定するものであり、ただし、KはK≦M−1を満たす整数であり、
更に、上記クラスタの情報から目的信号と上記選択されたK個の不要信号のみを含むビームフォーマ入力信号を推定する入力信号推定部を有し、
上記ビームフォーマ計算部は、
上記クラスタのセントロイド情報から上記目的信号のインパルス応答を推定するインパルス応答推定部と、
上記インパルス応答と上記不要信号相関行列とを用いて、適応型ビームフォーマを計算する適応型ビームフォーマ計算部と、により構成され、
上記目的信号抽出部は、上記適応型ビームフォーマを用い、上記ビームフォーマ入力信号から目的信号を抽出するものであることを特徴とするブラインド信号抽出装置。
【請求項4】
請求項2又は3記載のブラインド信号抽出装置であって、
更に、上記M個のセンサの位置を表すセンサ位置情報を記憶しているセンサ位置情報記憶部を備え、
上記インパルス応答推定部は、
上記センサ位置情報と上記クラスタの上記セントロイド情報とを用いて信号の到来方向を推定する到来方向推定部と、
上記推定された信号の到来方向と上記センサ位置情報からインパルス応答を計算するインパルス応答計算部と、で構成されていることを特徴とするブラインド信号抽出装置。
【請求項5】
請求項1記載のブラインド信号抽出装置であって、
更に、観測信号から観測信号の相関行列である観測信号相関行列を推定する観測信号相関行列推定部を備え、
上記ビームフォーマ計算部は、
上記クラスタの情報から上記目的信号が含まれる観測信号の相関行列である目的信号相関行列を推定する目的信号相関行列推定部と、
上記不要信号相関行列と上記目的信号相関行列とから最大利得ビームフォーマを計算する最大利得ビームフォーマ計算部と、
上記最大利得ビームフォーマに対し、上記観測信号相関行列を用いて、周波数歪みを補正し、補正ビームフォーマを計算する補正部と、を具備し、
上記目的信号抽出部は、上記補正ビームフォーマを用い、上記周波数領域の信号から目的信号を抽出するものである、
ことを特徴とするブラインド信号抽出装置。
【請求項6】
請求項1記載のブラインド信号抽出装置であって、
更に、観測信号から観測信号の相関行列である観測信号相関行列を推定する観測信号相関行列推定部を備え、
上記ビームフォーマ計算部は、
上記クラスタの情報から上記目的信号が含まれる観測信号の相関行列である目的信号相関行列を推定する目的信号相関行列推定部と、
上記不要信号相関行列と上記目的信号相関行列とから最大利得ビームフォーマを計算する最大利得ビームフォーマ計算部とを具備し、
上記観測信号相関行列と上記最大利得ビームフォーマとを用いて、補正ベクトルを計算する補正ベクトル計算部を備え、
上記目的信号抽出部は、
上記最大ビームフォーマを用い、上記周波数領域の信号から歪みを含む目的信号を抽出する信号抽出部と、
上記抽出された歪みを含む目的信号に対し、上記補正ベクトルを用いて、歪み補正をして、上記目的信号を出力する歪み補正部とを具備する
ことを特徴とするブラインド信号抽出装置。
【請求項7】
N個の信号源から発せられた信号をM個のセンサで観測し、観測された信号のうち、1個以上の信号を抽出する信号抽出方法において、ただし、N、Mは2以上の整数であり、
周波数領域変換手段が、上記M個のセンサで観測された観測信号を周波数領域の信号に変換する周波数領域変換過程と、
正規化手段が、上記周波数領域の信号に対し、正規化を行い、正規化観測信号ベクトルを算出する正規化過程と、
クラスタリング手段が、上記正規化観測信号ベクトルをN個のクラスタにクラスタリングするクラスタリング過程と、
不要信号相関行列推定過程が、上記クラスタの情報から、不要信号のみが含まれる観測信号の相関行列である不要信号相関行列を推定する不要信号相関行列推定過程と、
ビームフォーマ計算手段が、上記クラスタの情報と、上記不要信号相関行列と、からビームフォーマを計算するビームフォーマ計算過程と、
目的信号抽出手段が、上記ビームフォーマを用い、上記周波数領域の信号から目的信号を抽出する目的信号抽出過程と、
時間領域変換手段が、上記抽出された上記目的信号を時間領域の信号に変換する時間領域変換過程と、を有することを特徴とするブラインド信号抽出方法。
【請求項8】
請求項7記載のブラインド信号抽出方法であって、
上記ビームフォーマ計算過程は、
インパルス応答推定手段が、上記クラスタのセントロイド情報から上記目的信号のインパルス応答を推定するインパルス応答推定過程と、
適応型ビームフォーマ計算手段が、上記インパルス応答と上記不要信号相関行列を用いて適応型ビームフォーマを計算する適応型ビームフォーマ計算過程と、を有し、
上記目的信号抽出過程は、上記適応型ビームフォーマを用い、上記周波数領域の信号から上記目的信号を抽出する過程であることを特徴とするブラインド信号抽出方法。
【請求項9】
請求項7記載のブラインド信号抽出方法であって、
上記不要信号相関行列推定過程は、上記クラスタの情報から選択されたK個の不要信号の相関行列である不要信号相関行列を推定する過程であり、ただし、KはK≦M−1を満たす整数であり、
更に、入力信号推定手段が、上記クラスタの情報から目的信号と上記選択されたK個の不要信号のみを含むビームフォーマ入力信号を推定する入力信号推定過程を有し、
上記ビームフォーマ計算過程は、
インパルス応答手段が、上記クラスタのセントロイド情報から上記目的信号のインパルス応答を推定するインパルス応答推定過程と、
適応型ビームフォーマ計算手段が、上記インパルス応答と上記不要信号相関行列とを用いて、適応型ビームフォーマを計算する適応型ビームフォーマ計算過程とを有し、
上記目的信号抽出過程は、上記適応型ビームフォーマを用い、上記ビームフォーマ入力信号から目的信号を抽出する過程であることを特徴とするブラインド信号抽出方法。
【請求項10】
請求項8又は9記載のブラインド信号抽出方法であって、
上記インパルス応答推定過程は、
到来方向推定手段が、センサ位置情報記憶部中の上記センサ位置情報と上記クラスタの上記セントロイド情報とを用いて信号の到来方向を推定する到来方向推定過程と、ここで、センサ位置情報記憶部とは、上記M個のセンサの位置を表すセンサ位置情報を記憶しているものであり、
インパルス応答計算手段が、上記推定された信号の到来方向と上記センサ位置情報からインパルス応答を計算するインパルス応答計算過程と、を有することを特徴とするブラインド信号抽出方法。
【請求項11】
請求項7記載のブラインド信号抽出方法であって、
更に、観測信号相関行列推定手段が、観測信号から観測信号の相関行列である観測信号相関行列を推定する観測信号相関行列推定過程を備え、
上記ビームフォーマ計算過程は、
目的信号相関行列推定手段が、上記クラスタの情報から上記目的信号が含まれる観測信号の相関行列である目的信号相関行列を推定する目的信号相関行列推定過程と、
最大利得ビームフォーマ計算手段が、上記不要信号相関行列と上記目的信号相関行列とから最大利得ビームフォーマを計算する最大利得ビームフォーマ計算過程と、
補正手段が、上記最大利得ビームフォーマに対し、上記観測信号相関行列を用いて、周波数歪みを補正し、補正ビームフォーマを計算する補正過程と、を有し、
上記目的信号抽出過程は、上記補正ビームフォーマを用い、上記周波数領域の信号から目的信号を抽出する過程である、
ことを特徴とするブラインド信号抽出方法。
【請求項12】
請求項7記載のブラインド信号抽出方法であって、
更に、観測信号相関行列推定手段が、観測信号から観測信号の相関行列である観測信号相関行列を推定する観測信号相関行列推定過程を備え、
上記ビームフォーマ計算過程は、
目的信号相関行列推定手段が、上記クラスタの情報から上記目的信号が含まれる観測信号の相関行列である目的信号相関行列を推定する目的信号相関行列推定過程と、
最大利得ビームフォーマ計算手段が、上記不要信号相関行列と上記目的信号相関行列とから最大利得ビームフォーマを計算する最大利得ビームフォーマ計算過程とを有し、
更に、補正ベクトル計算手段が、上記観測信号相関行列と上記最大利得ビームフォーマとを用いて、補正ベクトルを計算する補正ベクトル計算過程を有し、
上記目的信号抽出過程は、
信号抽出手段が、上記最大ビームフォーマを用い、上記周波数領域の信号から歪みを含む目的信号を抽出する信号抽出過程と、
歪み補正手段が、上記抽出された歪みを含む目的信号に対し、上記補正ベクトルを用いて、歪み補正をして、上記目的信号を出力する歪み補正過程とを有する
ことを特徴とするブラインド信号抽出方法。
【請求項13】
請求項7〜12の何れかに記載のブラインド信号抽出方法の各過程をコンピュータに実行させるためのブラインド信号抽出プログラム。
【請求項14】
請求項13記載のブラインド信号抽出プログラムを記録したコンピュータ読み取り可能な記録媒体。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【公開番号】特開2008−60635(P2008−60635A)
【公開日】平成20年3月13日(2008.3.13)
【国際特許分類】
【出願番号】特願2006−231648(P2006−231648)
【出願日】平成18年8月29日(2006.8.29)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】
【公開日】平成20年3月13日(2008.3.13)
【国際特許分類】
【出願日】平成18年8月29日(2006.8.29)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】
[ Back to top ]