説明

音源方向推定装置、音源方向推定方法、及びロボット装置

【課題】本発明の目的は、対雑音耐力向上のため、音響効果のみで音源方向の特定をせず、音声とセンサが収集した情報とを用いて簡易的に且つ総合的に音源の同定を行うことであり、また、音源が存在する方向の推定において、より小規模な構成で且つコストも削減できる音源方向の推定を実現することである。
【解決手段】本発明のシステムは、音源の方向を推定するにあたって、音源からの音情報を収集するマイクだけで行うのではなく、赤外線センサや超音波センサやスイッチ等によって音源の方向を特定するための情報を収集して、音源方向の同定精度を向上させることを特徴とする。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音源が存在する方向を推定する技術に関し、特に、音源からの音声情報とその音源が存在する方向を推定する為に収集した音声情報以外の情報とを用いて音源が存在する方向を推定する技術に関する。
【背景技術】
【0002】
音源方向を同定する技術として特許文献1が挙げられる。この特許文献1に記載されている技術を、図6を参照して説明する。
【0003】
図6は、特許文献1に記載されているマイクロホンユニットのブロック図である。図6に示すように、特許文献1に記載されているマイクロホンユニット110は、第1のマイク111および第2のマイク112を内蔵している。
【0004】
第1のマイク111には、音源からの音情報が入力される。第2のマイク112にも、第1のマイク111と同様に、音源からの音情報が入力される。マイクロホンユニット110内部において、第1のマイク111および第2のマイク112は一定距離を隔てて設けられており、音源からの音情報をそれぞれ独立して集音し、それぞれが音声信号を出力する。そして、各マイクからの出力は、音源方向同定部120に入力され、各マイクからの音声信号の位相差や減衰量等に基づいて音源の方向の同定が行われている。更に、特許文献1の技術では、音源方向同定部120で同定された音源方向の情報をモータ制御部130に入力させ、この情報に基づいて頭部稼働用モータ140に適切な制御命令を与えてロボットの頭を稼働させている。
【0005】
また、音源方向を同定する技術として特許文献2の技術がある。特許文献2の技術は、左右一対のマイク部を装備させ、このマイク部から入力された音声を音声認識部で叫び声や声の方向や音量などをパラメータとして言語処理を行い、更に、左右のマイク部間の音圧差及び音の到達時間差に基づいて音源を認識し、この認識した方向にカメラを向けて画像情報に基づいて人物を検出している。
【特許文献1】特開2003−172773号公報
【特許文献2】特開2004−298988号広報
【発明の開示】
【発明が解決しようとする課題】
【0006】
上記の特許文献1及び特許文献2の技術は、複数のマイクからの入力による音情報のみによって音源方向の同定を行っているため、音の反射や干渉を含む周囲の雑音、音源の音声出力レベル等のような達成性能の阻害要因や環境に求める条件指標が高く、また、外的要因の変動により安定した性能確保ができないという問題点がある。
【0007】
また、複数のマイクから入力される音情報の位相差を得る必要があるため、一定距離を隔てた上で平面(同一指向性)に近いマイク配置を求められ、音源方向同定システムを搭載する装置自体のサイズの肥大化を余儀なくされ、装置サイズの小型化と品質確保とが両立できないという問題点がある。
【0008】
そこで、本発明が解決しようとする課題は、上記問題点を解決することであって、対雑音耐力向上のため、音響効果のみで音源方向の特定をせず、音声とセンサが収集した情報とを用いて簡易的に且つ総合的に音源の同定を行うことである。
【0009】
また、本発明が解決しようとする課題は、音源が存在する方向の推定において、より小規模な構成で且つコストも削減できる音源方向の推定を実現することである。
【課題を解決するための手段】
【0010】
上記課題を解決するための第1の発明は、音源が存在する方向を推定する音源方向推定装置であって、
音声を検出する音声検出手段と、
物体を検知する物体検知手段と、
前記音声検出手段と前記物体検知手段とからの情報に基づいて、音源が存在する方向を推定する音源方向推定手段と
を有することを特徴とする。
【0011】
上記課題を解決するための第2の発明は、上記第1の発明において、
前記物体検知手段は、前記物体を検知できる検知範囲が重複しないように複数個設けられており、
前記音源方向推定手段は、物体を検知した物体検知手段の検知範囲に基づいて、音源が存在する方向を推定することを特徴とする。
【0012】
上記課題を解決するための第3の発明は、上記第1又は第2の発明において、前記物体検知手段は、赤外線センサ、超音波センサ、又はタッチセンサであることを特徴とする。
【0013】
上記課題を解決するための第4の発明は、音源が存在する方向を推定する音源方向推定方法であって、
音源からの音声を検出する音声検出ステップと、
前記音源が存在する方向を推定する為に用いる前記音声以外の情報を収集する収集ステップと、
前記検出結果と前記収集した情報とに基づいて、前記音源が存在する方向を推定する音源方向推定ステップと
を有することを特徴とする。
【0014】
上記課題を解決するための第5の発明は、上記第4の発明において、前記収集ステップは、所定の方向毎に前記音源が存在するか否かの情報を収集することを特徴とする。
【0015】
上記課題を解決するための第6の発明は、上記第4又は第5の発明において、前記収集ステップは、赤外線又は超音波を用いて前記音源が存在するか否かの情報を収集することを特徴とする。
【0016】
上記課題を解決するための第7の発明は、上記第4から第6のいずれかの発明において、前記収集ステップは、所定の方向毎に接触があるか否かの情報を収集することを特徴とする。
【0017】
上記課題を解決するための第8の発明は、ロボット装置であって、
音声を検出する音声検出手段と、
特定方向に対しての指向性を有し、その特定方向にある物体を検知する物体検知手段と、
前記音声検出手段と前記物体検知手段とからの情報に基づいて、音源が存在する方向を推定する音源方向推定手段と、
前記推定した方向に自装置の正面を対向させる駆動手段と
を有することを特徴とする。
【0018】
本発明は、音源の方向の特定にあたって、音源からの音情報を収集するマイクだけで行うのではなく、赤外線センサや超音波センサやスイッチ等によって音源の方向を特定するための情報を補完して、音源方向の同定精度を向上させることを特徴とする。
【発明の効果】
【0019】
本発明によると、音源からの音情報を得る為のマイクだけでなく音源の方向の特定を補完するセンサを装備しているので、周囲雑音や音声の反射・減衰による影響を受けにくく、音源の方向の特定精度を向上することができる。
【0020】
また、本発明によると、一定距離を隔てた上で平面(同一指向性)に近いマイク配置を求めないため、装置形状、即ち音源に対して正対する部分の面積を小型化することができる。
【0021】
更に、本発明によると、マイクと併用するセンサ配置によって音源方向検出範囲を限定できるので、音源同定ではなく音源の位置する範囲を推定することができる。
【発明を実施するための最良の形態】
【0022】
本発明は、音源が存在する方向を推定する技術であり、本発明の特徴を説明するために、以下において図面を参照して述べる。
【0023】
図1は、本発明における音源方向推定装置のブロック図である。
【0024】
音源方向推定装置は、マイク10と、増幅器20と、センサ30(1〜n+1:nは自然数)と、マイコン40とを有する。
【0025】
マイク10は、自装置の周辺からの一定以上の音声を受信して、音声信号として出力する。
【0026】
増幅器20は、マイク10からの音声信号のうち、主信号となる音声信号のみを増幅して出力する。
【0027】
センサ30は、複数のセンサ30−1、センサ30−2、・・・センサ30−n、センサ30−n+1が設けられており、各々が指向性を持ち、特定方向における人等の生体を含む物体の存在有無に関する、音声情報以外の情報を収集して生体等の物体の存在を検知する。また、センサ30を1つのみ配置させる場合、センサ30はロボット装置の周囲の各方向に対して生体等の物体の存在有無に関する情報を収集して生体等の物体の存在を検知し、その旨を示す検知情報を出力する。
【0028】
マイコン40は、増幅器20からの音声信号とセンサ30からの検知情報とに基づいて、音源である物体を検知したセンサを特定し、そのセンサの検知範囲に基づいて音源の方向を推定する。
【0029】
以下において、実施例を用いて、本発明の特徴を具体的に説明する。
【0030】
図2は、本発明の音源方向推定装置を搭載したロボット装置のブロック図である。尚、このロボット装置は、本発明の一実施例である。
【0031】
マイク10は、自装置の周辺からの一定以上の音声を受信して、音声信号として出力する。マイク10は、複数個配置させても良いが、以下の説明においては1つだけ設けられている場合を用いて説明する。マイクを複数個配置させる場合は、それぞれ単一指向性の特徴を活かし、指向範囲の重複を避けて配置することで、広範囲の音声情報を受信可能とさせる。
【0032】
増幅器20は、マイク10からの音声信号のうち、主信号となる音声信号のみを増幅して出力する。
【0033】
センサ30は、複数のセンサ30−1、センサ30−2、・・・センサ30−n、センサ30−n+1が設けられており、各々が指向性を持ち、特定方向における人等の生体を含む物体の存在有無を検知する。センサ30は、受信可能範囲に依って複数個配置させる場合、受信可能範囲が互いに重複しないように配置することが望ましい。尚、以下の説明においては、センサを複数個設けた場合を用いて説明するが、センサ30を1つのみ配置させる場合、センサ30はロボット装置の周囲の各方向に対して生体等の物体が存在するかを検知し、その旨を示す検知情報を出力する。
【0034】
ここで、センサ30について一例を挙げて説明する。
【0035】
図3は、センサ30の機能を説明するための図である。図3に示されているセンサ30は、センサの一例である焦電型赤外線センサを示している。この焦電型赤外線センサは、生体等の物体の熱移動を検出したりして、熱源の変化等に基づいて生体等の物体の存在を認識する。センサ30は、受信可能範囲に依って複数個配置させる場合、受信可能範囲の重複を避けて配置することが望ましい。また、センサ30を1つのみ配置させる場合、センサ30はロボット装置の周囲の各方向に対して生体等の物体が存在するかを検知する。尚、焦電型赤外線センサは、当業者にとって周知の技術であり、その詳細な構成は本発明の主題ではないので詳細な説明は省略する。
【0036】
上記では、センサ30の一例として焦電型赤外線センサを挙げたが、焦電型赤外線センサ以外にも、超音波センサや光電型赤外線センサ、更に検知対象である生体等の物体が直接的にロボット装置への接触が方向の検出のトリガとなるタッチセンサ(スイッチ)であってもよく、生体等の物体の存在を検知又は検出できるものであれば良い。検出の目標とする方向、検出範囲、分解能、距離によってもセンサ選定基準は変わるため、最適なセンサを選定する必要がある。
【0037】
マイコン40は、センサからの検知情報を入力するセンサ入力部をセンサと同一個数分有し、増幅器20からの音声信号が入力されるアナログ入力部を有する。このセンサ入力部に入力された検知情報とアナログ入力部から入力された音声情報とに基づき、信号処理にて演算を行い、音源である物体を検知したセンサを特定し、そのセンサの検知範囲に基づいて音源の方向を推定する。そして推定した結果を音源方向情報として出力する。また、マイコン40は、アナログ入力信号のフィルタ設定値(閾値)を調整することで、対象とする音源である人等から発音された音声と周囲雑音とを区別して検知目標の音声(主音声)のみを抽出し、音源の方向を推定するために用いている。
【0038】
駆動システム制御部50は、マイコン40で推定された音源の方向を示す音源方向情報に基づいて、駆動システム60を制御する。尚、駆動システム制御部50については、マイコン40の一機能としてマイコン40に動作させても良い。尚、隣接する複数のセンサが物体を検知した場合、それらの中間の方向にロボット装置の正面が向くように設定したりロボット装置を転回しないように設定したりなど、駆動システム制御部50に設定する判定基準により、駆動システムの動作を決定することもできる。
【0039】
駆動システム60は、駆動システム制御部60からの制御信号に従い、モーター70を回転させロボット装置の可動部を制御し、推定した音源の方向に自装置の正面が正対するよう転回させる。この場合、音源の方向を人が存在する方向として捉えるものとする。尚、駆動システム60については、ロボット装置において、音源が存在する方向を推定する技術の一利用例として記述したもので、駆動システム60を構成させなくても本発明の主目的は実現できる。
【0040】
次に、本発明の音源方向推定装置を搭載したロボット装置の動作を、図4を用いて説明する。尚、以下の説明においては、センサ30は図3に示した焦電型赤外線センサを用いて説明する。
【0041】
図4は、本発明の音源方向推定装置を搭載したロボット装置の動作を説明するためのフロー図である。
【0042】
音源が存在する方向の推定が開始されると(ステップS101)、各センサ30は自身の検出範囲内において生体等の物体による熱源移動の検出を開始する(ステップS102)。
【0043】
熱源移動を検出したセンサは、熱源移動が検出されたことを示す熱源移動検出情報をマイコン40に送出し、マイコン40はその熱源移動検出情報を受信すると、熱源移動を検出したセンサを特定する(ステップS103)。
【0044】
検出したセンサの特定ができると、その情報を保持し、マイク10(増幅器20)からの音声信号の有無を確認する(ステップS104)。
【0045】
マイク10から音声信号の入力がある場合は、マイコン40内部は入力された音声信号をフィルタ閾値と比較して有効な入力であるかを判定する(ステップ105)。
【0046】
マイク10からの音声信号が有効入力であると判定された場合、マイコン40は保持している熱源移動を検出したセンサの検出範囲に基づいて、音源が存在する方向の推定処理を行う(ステップS106)。
【0047】
音源の方向を推定すると、音源の方向を示す情報を駆動システム制御部50に送出し、対応するリアクションを開始するように駆動システム60に指示を発行し、この指示を受けてモータ70はロボット装置の正面を音源の方向に対向させるように駆動を開始する(ステップ107)。
【0048】
上記のように、本願では、装置周辺からの音声入力に対し、音響効果のみによる音源方向同定手段だけでなく、センサによる生体等の物体の検知情報を加味させた上で音源が存在する方向を推定しているので、音響効果のみで音源を同意鄭させる場合と比較して雑音耐力を改善することができる。また、センサおよびマイクの配置、数量によって音源の方向を推定する分解能を限定または細分化することができ、音源方向の特定精度を任意に選択できる。尚、本願では、入力された音声信号のレベルが一定以上ない場合もセンサによって生体等の物体の検出が可能となり、より正確な音源および人のいる方向の検出が可能となる。
【0049】
次に、上記とは異なる構成の実施例2について説明する。基本的構成は上記と同様であるが、マイコン40についてさらに工夫している。尚、上記と同様の構成については同一の番号を付し、詳細な説明は省略する。
【0050】
図6は、実施例2のブロック図である。図6に示すように、本実施例においては、マイコン40の代わりに複数の加算器が設けられている。
【0051】
センサ30は、ロボット装置周辺の特定方向に指向性を有し、自身の検知範囲内における生体等の物体の存在有無を検知するための情報を収集して、生体等の物体の存在有無を検知する。生体等の物体を検知した時には”1”、未検知の時は”0”を出力する。
【0052】
増幅器20は、マイク1からの主信号である音声部分のみを増幅し、比較器90に出力する。
【0053】
比較器80は、増幅器20が増幅した音声信号のレベルに対し、外付け回路によって設定されている閾値と比較し、閾値を超えた場合は”1”、閾値以下の場合は”0”を各加算器90に出力する。
【0054】
加算器90は、センサの個数と同じ数だけ設けられており、センサ毎に1つの加算器が接続されている。また、各加算器90は、比較器80が接続されている。加算器90は、比較器80とセンサ30との両方の出力信号が”1”の場合、”1”を出力する。本実施例では、このような構成によって、簡易的に音源の方向を推定する。
【0055】
駆動システム制御部50は、加算器90−1〜加算器90−n+1からの出力信号が”1”である加算器の検知範囲に基づいて、駆動システムを制御する。
【0056】
駆動システム60は、駆動システム制御部50からの制御信号に従い、モータ70を回転させ、ロボット装置の可動部を制御して音源が存在する方向にロボット装置が正対するよう転回させる。この場合、推定された音源方向を人等の物体が位置している方向として捉えるものとする。尚、隣接する複数のセンサが物体を検知した場合、それらの中間にロボット装置の正面が向くように設定したりロボット装置を転回しないように設定したりなど、駆動システム制御部50に設定する判定基準によって駆動システムの動作を決定させてもよい。
【0057】
このように、本実施例では、音源の方向を推定するためのマイコンを削除し、マイコンによる高度なマイク入力フィルタ処理や位置推定処理を省略しているので、簡易的な方向の推定とはなるがコスト低減という効果が得られる。
【0058】
上記のように、本願では、装置周辺からの音声入力に対し、音響効果のみによる音源方向同定手段だけでなく、センサによる方向検出情報を加味した上で音源方向の同定を判断しているので、音響効果のみの場合と比較し、雑音耐力を改善できる。また、センサおよびマイクの配置、数量によって音源方向検出の分解能を限定または細分化でき、音源方向の検出精度を選択できる。尚、音声入力が一定以上ない場合もセンサによって人の検出が可能となり、より正確な音源および人のいる方向の検出が可能となる。
【図面の簡単な説明】
【0059】
【図1】図1は、本発明の音源方向推定装置のブロック図である。
【図2】図2は、本発明の音源方向推定装置を搭載したロボット装置のブロック図である。
【図3】図3は、センサの一実施例を説明するための図である。
【図4】図4は、本発明の動作を説明するためのフロー図である。
【図5】図5は、本発明の実施例2の音源方向推定装置を搭載したロボット装置のブロック図である。
【図6】図6は、従来技術を説明するための図である。
【符号の説明】
【0060】
10 マイク
20 増幅器
30 センサ
40 マイコン
50 駆動システム制御
60 駆動システム
70 モータ
80 加算器

【特許請求の範囲】
【請求項1】
音源が存在する方向を推定する音源方向推定装置であって、
音声を検出する音声検出手段と、
物体を検知する物体検知手段と、
前記音声検出手段と前記物体検知手段とからの情報に基づいて、音源が存在する方向を推定する音源方向推定手段と
を有することを特徴とする音源方向推定装置。
【請求項2】
前記物体検知手段は、前記物体を検知できる検知範囲が重複しないように複数個設けられており、
前記音源方向推定手段は、物体を検知した物体検知手段の検知範囲に基づいて、音源が存在する方向を推定することを特徴とする請求項1に記載の音源方向推定装置。
【請求項3】
前記物体検知手段は、赤外線センサ、超音波センサ、又はタッチセンサであることを特徴とする請求項1又は請求項2に記載の音源方向推定装置。
【請求項4】
音源が存在する方向を推定する音源方向推定方法であって、
音源からの音声を検出する音声検出ステップと、
前記音源が存在する方向を推定する為に用いる前記音声以外の情報を収集する収集ステップと、
前記検出結果と前記収集した情報とに基づいて、前記音源が存在する方向を推定する音源方向推定ステップと
を有することを特徴とする音源方向推定方法。
【請求項5】
前記収集ステップは、所定の方向毎に前記音源が存在するか否かの情報を収集することを特徴とする請求項4に記載の音源方向推定方法。
【請求項6】
前記収集ステップは、赤外線又は超音波を用いて前記音源が存在するか否かの情報を収集することを特徴とする請求項4又は請求項5に記載の音源方向推定方法。
【請求項7】
前記収集ステップは、所定の方向毎に接触があるか否かの情報を収集することを特徴とする請求項4から請求項6のいずれかに記載の音源方向推定装置。
【請求項8】
ロボット装置であって、
音声を検出する音声検出手段と、
特定方向に対しての指向性を有し、その特定方向にある物体を検知する物体検知手段と、
前記音声検出手段と前記物体検知手段とからの情報に基づいて、音源が存在する方向を推定する音源方向推定手段と、
前記推定した方向に自装置の正面を対向させる駆動手段と
を有することを特徴とするロボット装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2008−145574(P2008−145574A)
【公開日】平成20年6月26日(2008.6.26)
【国際特許分類】
【出願番号】特願2006−330467(P2006−330467)
【出願日】平成18年12月7日(2006.12.7)
【出願人】(000197366)NECアクセステクニカ株式会社 (1,236)
【Fターム(参考)】