説明

パーティクルフィルタリングによる移動ロボットからの2次元音源地図作成方法

【課題】移動ロボット本体だけで断続的に取得したセンサデータをもとに方位単独SLAMを行うことができる2次元音源地図作成方法を提供する。
【解決手段】移動ロボットに搭載された遅延和ビームフォーミング法により最適化されたマイクアレイにより音源からの音声データを断続的に取得し、取得した音声データに対し、周波数帯域選択法を利用したパーティクルフィルタリングにより、方位単独SLAM(Bearing only Simultaneous Localization and Mapping)を行い、2次元音源地図を作成することを特徴とする。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、移動ロボットに搭載したマイクアレイの短時間の方位角計測の結果から、パーティクルフィルタを用いて2次元音源地図作成を行う方法に関するものである。
【背景技術】
【0002】
音源地図作成機能は、人間環境の中で動作するロボットにとって非常に重要である。近年、光学カメラを用いた方位単独SLAM(Bearing only Simultaneous Localization and Mapping)技術が精力的に研究されている(例えば、非特許文献1)。SLAMとは、各種センサから取得した情報から、ロボットが自己位置推定と地図作成を同時に行う方法である。しかしながら、音声信号は2つの点、すなわち音源の定位と特性において非常に異なっている。定位の困難性は、残響、回折、共鳴、干渉等に起因している。 他方、特性の困難性は、音源により生成される音が通常未知であり、常に時間とともに変化し、ある場合には消失してしまうことによる。
【0003】
パーティクルフィルタは、環境、地図やロボット位置を推定するために雑音入力を扱うロボット工学における認識の分野で広く使用されている。定位やマイクを中心とする座標系における追跡を行うため、パーティクルフィルタを用いたいくつかの方法が提案されている。地図作成機能について言えば、部屋の中とロボットの両方に取り付けたマイクアレイから、パーティクルフィルタを用いて音源位置を地図化する方法が提案されている(非特許文献2)。
【0004】
ところが、従来の方位単独SLAMでは、センサデータが継続的に取得できるものを取り扱っており、とくにロボット本体だけで断続的なセンサデータをもとに取り組んだものはなかった。
【0005】
しかしながら、未来のロボットの展開としては、ロボット本体だけで断続的に取得したセンサデータをもとに方位単独SLAMを行うことが強く望まれる。
【先行技術文献】
【非特許文献】
【0006】
【非特許文献1】S. Thrun, W. Burgard, and D. Fox, “Probabilistic Robotics (Intelligent Robotic and Autonomous Agents), The MIT Press, September 2005
【非特許文献2】H. Asoh, I. Hara, and H.Asano, “Tracking human speech events using a particle filter”, in In Proceedings International Conference on Audio, Speech and Signal Processing, 2005, pp.II/1153-1156
【発明の概要】
【発明が解決しようとする課題】
【0007】
本発明は、以上のような従来技術の実情に鑑みてなされたもので、移動ロボット本体だけで断続的に取得したセンサデータをもとに方位単独SLAMを行うことができる、パーティクルフィルタリングによる移動ロボットからの2次元音源地図作成方法を提供することを課題とする。
【課題を解決するための手段】
【0008】
上記課題を解決するため、本発明は、移動ロボットに搭載された遅延和ビームフォーミング法により最適化されたマイクアレイにより音源からの音声データを断続的に取得し、取得した音声データに対し、周波数帯域選択法を利用したパーティクルフィルタリングにより、方位単独SLAM(Bearing only Simultaneous Localization and Mapping)を行い、2次元音源地図を作成することを特徴とする、パーティクルフィルタリングによる移動ロボットからの2次元音源地図作成方法を提供する。
【発明の効果】
【0009】
本発明によれば、上記手法を採用したので、パーティクルフィルタリングを利用して、移動ロボット本体だけで断続的に取得したセンサデータをもとに方位単独SLAMを行うことができる2次元音源地図作成が可能となった。また、本発明は、2次元音源地図作成のほか、自己位置推定や周辺音響環境理解などにも応用可能である。
【図面の簡単な説明】
【0010】
【図1】本発明による一例の音源推定管理を示すフローチャートである。
【図2】遅延和ビームフォーミング(DSBF)法により最適化された低サイドローブ・マイクアレイの配置例を示す図とその写真である。
【図3】異なる周波数でのビームフォーミングのシミュレーションの結果を示す図である。
【図4】マイクアレイのシミュレートしたパターンと測定したパターンを比較して示す図である。
【図5】周波数帯域選択(FBS)法の手順を示す図である。
【図6】実施例で用いた移動ロボットの構造を示す写真である。
【図7】実施例による音源の定位の結果を示す図である。
【発明を実施するための形態】
【0011】
以下、本発明について詳述する。
【0012】
本発明は、移動ロボットのみに取り付けたマイクアレイを用いて2次元音源地図作成を行うものである。本発明では、音源は方位角と距離のそれぞれに独立したガウス分布に従うと仮定したモデルによりパーティクルフィルタの分散を決定する。また、本発明においては、方位単独状態推定技術を利用することにより、2次元音源推定を行う。
【0013】
先ず、2次元音源推定について述べる。個々のパーティクルフィルタは座標系上の分布を表わすパーティクルの集合により、1つのパーティクル音源の位置推定を保持するために使用される。ある環境に未知の個数の音源を存在させ、音源推定を生成させ、必要に応じて削除することにより、音源推定の数を管理する。図1に、本発明による一例の音源推定管理のフローチャートを示す。ここでは、断続的なセンサデータとして、移動ロボットに取付けたマイクアレイからの音源定位データを用いる。
【0014】
観察された音源の方位データが入力すると、その方位データは予め定めた関数Fに変換され、以前の方位データのFとの関連付けが行われる。ここで、Fが以前の方位データと一致していれば、推定方位データF(θ)を更新する。Fが以前の方位データと不一致であれば、新たな推定方位データF(θ)が加えられる。次に、各推定の方位データFについて減衰状態が判定される。減衰状態にあれば、次のステップでその減衰率が閾値を越えているか判定され、閾値を越えていればその推定方位データFが削除される。以上のような推定方位データFの生成、削除が行われることにより、音源推定の数が管理される。
【0015】
より具体的に述べると、時刻kに特定の方位θにおいて新しい音源Obsが観測されると、新しいパーティクルフィルタFが生成され、現在のロボット位置から、パーティクルがデフォルト距離rで推定方位θにわたり2次元ガウス分布の広がりで初期化される。分布に関連する分散は、方位音源の推定値σθデフォルトの距離の分散σとの誤差により決定され、方位単独観測における距離情報がないことを反映する。
【0016】
初期化後、次のようになる。
【0017】
1.音源Obs(k)=θ
2.ロボットの姿勢(x,y,θ)からパーティクルS={s…sNp−1}を初期化する。
【0018】
Sにおける全てのsに対して、
・r=r+G(σ),α=θ+G(σθ
ここでG(σ)は偏差σでガウス分布するランダム値に回帰する関数である
・s=((x+r)cos(α+θ
(y+r)cos(α+θ))
次に、フィルタは音源位置の確率密度関数を表わすパーティクルを次のように伝播させる。
【0019】
1.(x,y,θ)から音源Obs(k)=θを観測
2.Sを分散s(k)=s(k−1)+ω
ここでωはランダムな動き
3.p(s(k))=SM(s(k),θ(x,y,θ))となるようにSを観測
4.p(s(k))を基に置換によりSを再サンプリング
ただし、SM(s(k),θ(x,y,θ))は現在のロボット位置から角度θでの位置s(k)における音源位置が観測される確率に回帰するモデルである。
【0020】
本発明の音源地図作成方法は、方向定位のノイズを取り扱う。しかし、ノイズは統計的には小さい。従って、方向定位システムはフォールスポジティブ検出に対してロバストでなければならない。このため、本発明者らは、遅延和ビームフォーミング(Delay and Sum Beam Forming;以下DSBFと称する)法により最適化された低サイドローブ・マイクアレイを設計、開発した。すなわち、未知の周波数を持つ音声入力に対する音源の方位を検出するため、マイクアレイ&ファイアワイヤ・インタフェースボードを開発した。このマイクアレイの直径は移動ロボットのサイズのため33cmに制限した。音圧分布のシミュレーションにより、サイドローブを最小化するマイク配置は経験的に決定した。図2の左側に、一例として、等脚台形の形状を有する8つの4chマイクボードの配置を示し、図2の右側にその写真を示す。本システムでは16bit、16kHzの条件でサンプリングを行うようになっている。
【0021】
図3に、1000、1400、2000[Hz]でのビームフォーミングのシミュレーションの結果を示す。各周波数においてサイドローブと対比した焦点方位ゲインは最小12[dB]、平均16[dB](700〜2500[dB])であった。
【0022】
図4に、このマイクアレイのシミュレートしたパターンと測定したパターンを示す。水平軸は方位であり、アレイは0(deg)の方向に収束している。垂直軸は焦点方位と対比した信号ゲイン[dB])である。下方のパターンはシミュレーションによるもので、上方のパターンは測定したものである。
【0023】
本発明では、周波数帯域選択(Frequency Band Selection、以下FBSと称する)法を利用するが、この手法は性能が限定されており、特に特定音源からの音声信号以外の信号は完全に除去できず、減少させるだけである。そこで、本発明では、複数音源の検出のために、FBS法の適用の前にDSBF法を適用する。FBSは一種のバイナリ・マスクであり、共通の対象音源から判断される周波数成分を選択することにより混合音から対象音源を分離する。X(ω)とX(ω)をそれぞれ対象音源とノイズ音源のDSBF誘起信号の周波数成分とすると、選択された周波数成分Xas(ω)は式(1)で表わされる。
【0024】
(ω)≧X(ω)のとき、Xas(ω)=X(ω
それ以外のとき、Xas(ω)=0 ・・・(1)
このプロセスは、DSBF誘起信号からの減衰したノイズ信号を受け付けない。分離された波形はXas(ω)の逆フーリエ変換により得られる。
【0025】
各信号の周波数成分が独立している場合,FSBは所望の音源を分離することができる。これは人の声や短時間の日常音に対して通常有効である。
【0026】
図5に、FBSの手順を示す。第1のステップでは、FBSにより入力する各マイクロホンの平均信号(遅延信号でない)にフィルタをかけ、空間スペクトルから最も大きな音を検出する。この平均信号の周波数成分が各方位からのあらゆるDSBF誘起信号より大きい場合には、システムはその周波数のスペクトルにフィルタをかける。このプロセスは、種々の方位ノイズ音は受け付けない。
【0027】
第2のステップでは、FBSによる第1の音声信号にフィルタをかけ、スペクトルから第2番目に強い音声を検出する。第1の音声の方位のDSBF誘起信号の周波数成分が他のあらゆる方位の周波数成分より大きい場合、システムは各周波数でのスペクトルにフィルタをかける。
【0028】
2以上の音が存在すると、システムは第2番目に強い音信号にフィルタをかけた後、第3番目に強い音信号に検出し、以下同様なプロセスを行う。この方法は各タイムステップにおいて最も大きいパワー強度から最も小さいパワー強度まで複数音を定位する。そして、システムは多数の音源を連続的に定位し移動中に各音源を分離する。
【0029】
本発明によれば、以上のようにして、パーティクルフィルタリングを利用して、移動ロボット本体だけで断続的に取得したセンサデータをもとに方位単独SLAMを行うことができる2次元音源地図作成を可能とする。
【実施例】
【0030】
次に、本発明の実施例を述べる。
【0031】
本実施例では、図6に示す構造を有する移動ロボット用いて実験を行った。4つのスピーカを移動ロボットのマイクの高さにセットした。マイクとしては、本発明者らが作成してきたビームフォーミング用の32ch低サイドローブ・マイクアレイを用いた。このサイドローブ・マイクアレイは、DSBF法により最適化されたものである。また、12台のカメラを有する市販の動画キャプチャーシステム(Motion Analysis Eagle)により正解データ(ground truth)として240[Hz]でロボット位置を測定した。このMACAPシステムにより測定したロボット位置の標準偏差は、並進で0.042[mm]、回転で1.09×e−5[deg]であった。マイクアレイは12[Hz]近傍で音源方位に配置させた。残響時間T60は500[msec]であり、バックグランドノイズのレベルは50[dBA](主にファンのノイズ)であった。信号ノイズ比は20[dBA]であった。音源は音楽、男性の声及び女性の声とした。測定手法としては、上記のDSBF法により最適化された低サイドローブ・マイクアレイと、帯域選択(FBS)法を組み合わせた音源定位手法を用いた。
【0032】
図7に、本実施例による4つの音源の定位の結果を示す。図7a)で、は○が実際の位置、+が推定位置を示し、黄色のドットは音源の付近に収束した、関連付けられたパーティクルを示す。青の軌跡はロボットの動きを示す。図7b)は定位プロセスの収束性と残留誤差を示す。100のサンプリング(8秒)の後、本システムにより2次元地図作成を行った。その結果、ロボット本体だけで断続的に取得したセンサデータをもとに方位単独SLAMが行えることが確認された。
【0033】
また、スピーカの高さ位置を異ならせて上記と同様の実験を行った結果、±50cm程度の精度で方位単独SLAMが行えることが確認された。

【特許請求の範囲】
【請求項1】
移動ロボットに搭載された遅延和ビームフォーミング法により最適化されたマイクアレイにより音源からの音声データを断続的に取得し、取得した音声データに対し、周波数帯域選択法を利用したパーティクルフィルタリングにより、方位単独SLAM(Bearing only Simultaneous Localization and Mapping)を行い、2次元音源地図を作成することを特徴とする、パーティクルフィルタリングによる移動ロボットからの2次元音源地図作成方法。

【図1】
image rotate

【図2】
image rotate

【図4】
image rotate

【図5】
image rotate

【図7】
image rotate

【図3】
image rotate

【図6】
image rotate


【公開番号】特開2011−149782(P2011−149782A)
【公開日】平成23年8月4日(2011.8.4)
【国際特許分類】
【出願番号】特願2010−10438(P2010−10438)
【出願日】平成22年1月20日(2010.1.20)
【出願人】(301021533)独立行政法人産業技術総合研究所 (6,529)
【出願人】(000156938)関西電力株式会社 (1,442)
【Fターム(参考)】