説明

スピーカ制御装置、ロボット、スピーカ制御方法、およびスピーカ制御プログラム

【課題】健聴者および難聴者の双方にとって適切になるように、スピーカの発する音を自動で制御することが可能なスピーカ制御装置等を提供する。
【解決手段】実施形態のスピーカ制御装置は、第一の人の位置と第二の人の位置とを検出する人物認識手段201と、第一および第二の人の位置に基づいて、第二のスピーカ102の指向性の範囲内に第二の人が入り且つ第一の人が入らないような、第二のスピーカ102の位置の範囲を算出する配置算出手段301と、当該範囲内に入るように、第二のスピーカ102の位置を変更する動作手段401と、第一の人に到達する第一のスピーカ101の音量が所定の範囲内となり、且つ、第二の人に到達する第二のスピーカ102の音量が所定の範囲内となるように、第一のスピーカ101および第二のスピーカ102の音量を調整する音量補償手段501と、を備えている。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、スピーカ制御装置およびそれを備えるロボット、スピーカ制御方法、ならびにスピーカ制御プログラムに関する。
【背景技術】
【0002】
近年、人と音声でコミュケーションを行うパートナー型ロボットが多く開発されている。その中に、難聴者やその介護者に話しかけたり、難聴者やその介護者からの話しかけに応答することを目的として開発されているロボットがある。これは、難聴者と介護者の間のコミュニケーション支援をロボットが行ったり、ロボットと難聴者の間のコミュニケーションを介護者がサポートすることなどが目的である。
【0003】
ロボットがこのような音声コミュニケーションを行う場合、ロボットの発する音の大きさが重要でなる。なぜならば、中年以下で活動度が通常である人とロボットが音声でコミュニケーションを行う場合、ロボットの発する音声が適切で無いと人間が思えば、ロボットの出す音の大きさを自ら変えたり、音が小さければ人間がロボットに近づいたりするだろうが、難聴者の場合には、活動度や興味が低下しているので、ロボットが発する音が大きかったり小さかったりしても、自らそれを適性に修正しようとはしないし、難聴者が移動したりすることはほとんど無い。
【0004】
また、介護者にしても、ロボットが発する音の音量が難聴者にとって好ましいかどうかはよくわからないので、音量を補正することが難しい。その結果、難聴者とロボットとの音声によるコミュニケーションがうまく成立しない場合が多いことになる。また、難聴者の場合には一般的に聴力が衰えており、一般健聴者に比べ、特許文献3の図5にあるように、高域レベルが平均で10〜20dB低下しているので、それを補償することも考えなければならない。
【0005】
ロボットの音量を制御する方法としては、特許文献1および特許文献2にあるように、ロボットから相手の人間までの距離を測定し、その距離によって音量を変える方法がある。特許文献1では、相手の人間を識別して、その相手に応じて基準音量を変えるようにしている。特許文献2では、ロボットから人間までの距離に応じて、音の大きさを変えるようにしている。
【0006】
また、ロボットではないが、特許文献3および特許文献4がある。特許文献3では、無指向性スピーカと指向性スピーカを同時に使用する。無指向性スピーカからは健聴者向けの通常の音を出し、指向性スピーカからは難聴者向けの高域レベルを強調した音を出すということを特徴としている。特許文献3によると、指向性スピーカは、正面から30度ずれた方向で2KHzの高域が約15dB減衰するので、指向性スピーカの向きを調節することにより、健聴者にも難聴者にも適した音が聞こえることになる。
【0007】
また、特許文献4は、指向性スピーカの指向性を調整することができるスピーカ装置である。目的としては、健聴者と難聴者がともに存在するときには指向性を絞り、難聴者だけが存在するときには指向性を広く調整することを想定している。
【0008】
また、非特許文献1には、人の顔を検出し識別できるロボットが開示されている。
【特許文献1】特開2005−202076号公報
【特許文献2】特開2005−335001号公報
【特許文献3】特開平10−234094号公報
【特許文献4】特開2000−184488号公報
【非特許文献1】NEC メディア情報研究所 ロボット開発センター、インターネット<http://www.incx.nec.co.jp/robot/robotcenter.html>
【発明の開示】
【発明が解決しようとする課題】
【0009】
特許文献1では、相手の人間を識別して、その相手に応じて基準音量を変えるようにしているので、一般健聴者と難聴者のどちらにも対応することが可能となるし、個別難聴者に対する個人適応が可能となる。しかしながら、特許文献1では、ロボットのコミュニケーション相手が、基準音量の異なる複数の人間である場合を考慮していない。したがって、難聴者とその介護者がロボットと音声でコミュニケーションをする場合には、ロボットの発する音が双方ともに適切にはならず、音声コミュニケーションがうまくいかない。
【0010】
特許文献2では、ロボットから人間までの距離に応じて、音の大きさを変えることが可能となるが、人によってその変化量が変わらないので、一般健聴者か難聴者かどちらかを想定して音量を変えることになる。しかし、これまで述べたように、難聴者であっても耳の聞こえ方は人それぞれであり、個人ごとに基準音量を変えることが望ましい。よって、特許文献2に係る発明は、難聴者を対象とするときには不十分である。
【0011】
特許文献3および特許文献4では、指向性スピーカを利用することを述べているものの、その指向性スピーカをどのようにして難聴者へ向けるか、についてはまったく言及していない。人が自分で向きを変えることを想定しているのかも知れないが、スピーカの位置を人手でいちいち変えるのはかなり煩雑であり(通常の生活でそのようなことをする習慣は無い)、有効に利用されないケースが多いと考えられる。
【課題を解決するための手段】
【0012】
現在開発が進んでいるロボットでは、例えば非特許文献1のように、人の顔を検出し識別できるものがある。そこで、この顔検出・識別機能と組み合わせて、指向性スピーカを難聴者(難聴者)へ向ける方法が考えられる。しかしながら問題はそれほど単純では無い。指向性スピーカを難聴者に向けるにしても、介護者(健聴者)が指向性スピーカの指向範囲からできるだけ離れるようにしなければ、介護者にとって聞きづらい音になってしまう。したがって、難聴者と健聴者の位置関係を認識し、指向性スピーカを難聴者に向けつつも健聴者がその範囲に入らないように、スピーカ(ロボット)の適切な位置と方向を判断して稼動したり、スピーカの方向を変える必要がある。
【0013】
本発明によるスピーカ制御装置は、第一および第二のスピーカを制御する装置であって、第一の人の位置と第二の人の位置とを検出する人物認識手段と、上記人物認識手段により検出された上記第一および第二の人の位置に基づいて、上記第二のスピーカの指向性の範囲内に上記第二の人が入り且つ上記第一の人が入らないような、上記第二のスピーカの位置の範囲を算出する配置算出手段と、上記配置算出手段により算出された上記第二のスピーカの位置の範囲内に入るように、上記第二のスピーカの位置を変更する動作手段と、上記第一の人に到達する上記第一のスピーカの音量が所定の範囲内となり、且つ、上記第二の人に到達する上記第二のスピーカの音量が所定の範囲内となるように、上記第一および第二のスピーカの音量を調整する音量補償手段と、を備えることを特徴とする。
【0014】
このスピーカ制御装置においては、第一および第二の人の各々の位置が人物認識手段によって検出される。その検出された位置に基づいて、第二のスピーカの位置範囲(存在可能領域)が配置算出手段によって算出される。その存在可能領域は、第二の人が第二のスピーカの指向範囲内に入り且つ第一の人がその範囲内に入らないような領域とされる。そして、その存在可能領域内に入るように、第二のスピーカの位置が動作手段によって変更される。よって、健聴者(第一の人)および難聴者(第二の人)の双方にとって適切になるように、スピーカの発する音を自動で制御することができる。
【0015】
また、本発明によるスピーカ制御方法は、第一および第二のスピーカを制御する方法であって、第一の人の位置と第二の人の位置とを検出する人物認識ステップと、上記人物認識ステップにおいて検出された上記第一および第二の人の位置に基づいて、上記第二のスピーカの指向性の範囲内に上記第二の人が入り且つ上記第一の人が入らないような、上記第二のスピーカの位置の範囲を算出する配置算出ステップと、上記配置算出ステップにおいて算出された上記第二のスピーカの位置の範囲内に入るように、上記第二のスピーカの位置を変更する動作ステップと、上記第一の人に到達する上記第一のスピーカの音量が所定の範囲内となり、且つ、上記第二の人に到達する上記第二のスピーカの音量が所定の範囲内となるように、上記第一および第二のスピーカの音量を調整する音量補償ステップと、を含むことを特徴とする。
【0016】
また、本発明によるスピーカ制御プログラムは、第一および第二のスピーカを制御するプログラムであって、第一の人の位置と第二の人の位置とを検出する人物認識ステップと、上記人物認識ステップにおいて検出された上記第一および第二の人の位置に基づいて、上記第二のスピーカの指向性の範囲内に上記第二の人が入り且つ上記第一の人が入らないような、上記第二のスピーカの位置の範囲を算出する配置算出ステップと、上記配置算出ステップにおいて算出された上記第二のスピーカの位置の範囲内に入るように、上記第二のスピーカの位置を変更する動作ステップと、上記第一の人に到達する上記第一のスピーカの音量が所定の範囲内となり、且つ、上記第二の人に到達する上記第二のスピーカの音量が所定の範囲内となるように、上記第一および第二のスピーカの音量を調整する音量補償ステップと、をコンピュータに実行させることを特徴とする。
【0017】
これらのスピーカ制御方法およびスピーカ制御プログラムにおいては、第一および第二の人の各々の位置が人物認識ステップにおいて検出される。その検出された位置に基づいて、第二のスピーカの存在可能領域が配置算出ステップにおいて算出される。そして、その存在可能領域内に入るように、第二のスピーカの位置が動作ステップにおいて変更される。よって、健聴者(第一の人)および難聴者(第二の人)の双方にとって適切になるように、スピーカの発する音を自動で制御することができる。
【発明の効果】
【0018】
本発明によれば、健聴者および難聴者の双方にとって適切になるように、スピーカの発する音を自動で制御することが可能なスピーカ制御装置およびそれを備えるロボット、スピーカ制御方法、ならびにスピーカ制御プログラムが実現される。
【発明を実施するための最良の形態】
【0019】
以下、図面を参照しつつ、本発明の好適な実施形態について詳細に説明する。なお、図面の説明においては、同一要素には同一符号を付し、重複する説明を省略する。
【0020】
図1は、本発明によるスピーカ制御装置の一実施形態を示すブロック図である。このスピーカ制御装置は、第一のスピーカ101および第二のスピーカ102を制御する装置であって、第一の人の位置と第二の人の位置とを検出する人物認識手段201と、人物認識手段201により検出された第一および第二の人の位置に基づいて、第二のスピーカ102の指向性の範囲内に第二の人が入り且つ第一の人が入らないような、第二のスピーカ102の位置の範囲(存在可能領域)を算出する配置算出手段301と、配置算出手段301により算出された第二のスピーカ102の位置の範囲内に入るように、第二のスピーカ102の位置を変更する動作手段401と、第一の人に到達する第一のスピーカ101の音量が所定の範囲内となり、且つ、第二の人に到達する第二のスピーカ102の音量が所定の範囲内となるように、第一のスピーカ101および第二のスピーカ102の音量を調整する音量補償手段501と、を備えている。本実施形態において、第二の人は難聴者であり、第一の人はその介護者(健聴者)である。
【0021】
図2は、本実施形態のスピーカ制御装置を備えるロボットの外観を示す正面図である。また、図3は、図2のロボットの電気的構成を示すブロック図である。本実施形態では、ロボットは、例えば、胴体部1、頭部2が連結されることにより構成されている。胴体部1は円筒形であり、平面が上下に来るようになっている。胴体部1の下部には左右にそれぞれ車輪3A、3Bが取り付けられており、それらの車輪は独立に前後に回転することができる。頭部2は、胴体部1に垂直に取り付けられた垂直軸とその垂直軸に対して90度の角度で設置された水平軸に関して決められた範囲で回転することができる。垂直軸は頭部2の中心を通るように設置されており、水平軸は胴体部1と頭部2が正面を向いた状態で頭部2の中心を通りかつ左右方向に水平に設置されている。つまり、頭部2は左右と上下の2自由度で、決められた範囲内で回転することができる。
【0022】
胴体部1には、ロボット全体の制御を行うコントローラ10、ロボットの動力源となるバッテリ11、スピーカ12、2つの車輪を動かすためのアクチュエータ14Aと14B、タッチセンサ15が収納されている。
【0023】
頭部2には、マイクロフォン13、スピーカ16、CCDカメラ21Aと21B、頭部2を回転するためのアクチュエータ22Aと22Bなどが収納されている。頭部2におけるマイクロフォン13は、ユーザからの発話を含む周囲の音声を集音し、得られた音声信号をコントローラ10に送出する。スピーカ16は指向性を持つスピーカである。本実施形態では、スピーカ16の指向性の範囲は固定である。CCDカメラ21Aと21Bは、周囲の状況を撮像し、得られた画像信号を、コントローラ10に送出する。
【0024】
胴体部1におけるタッチセンサ15は、人間がタッチセンサに触れたことを検知し、検知したときに接触検知信号をコントローラ10に送出する。
【0025】
コントローラ10は、CPU10Aやメモリ10Bを内蔵しており、CPU10Aにおいて、メモリ10Bに記憶された制御プログラムが実行されることにより、各種の処理を行う。
【0026】
すなわち、コントローラ10は、マイクロフォン13、CCDカメラ21Aと21B、タッチセンサ15から与えられる音声信号、画像信号、接触検知信号に基づいて、周囲の状況や、ユーザからの指令を判断する。
【0027】
さらに、コントローラ10は、この判断結果などに基づいて、続く行動を決定し、その決定結果に基づいて、アクチュエータ14A、14B、22A、22Bの必要なものを駆動させる。これにより頭部2を上下左右に回転したり、ロボットを移動または回転させるなどの行動を行わせる。また、コントローラ10は、必要に応じて、合成音を生成し、スピーカ12およびスピーカ16に供給して出力させる。
【0028】
以上のようにして、ロボットは、周囲の状況などに基づいて行動をとるようになっている。
【0029】
次に、図4は、図3のコントローラ10の機能的構成例を示すブロック図である。なお、図4に示す機能的構成は、CPU10Aが、メモリ10Bに記憶された制御プログラムを実行することで実現されるようになっている。
【0030】
コントローラ10は、人物認識部51A、音声認識部51B、接触認識部51C、行動決定部52、制御部53、音声合成部54、出力部55、配置算出手段56、とから構成されている。
【0031】
人物認識部51Aは、CCDカメラ21Aおよび21Bから入力される映像に対して画像処理を施し、あらかじめ登録されてある特徴と照合して人の識別を行い、識別した人を健聴者と難聴者に分類し、その情報を配置算出部56へ送出する。このように、本実施形態では、登録されている人が健聴者であるか難聴者であるかを記憶することが前提となっている。これは、登録時に人が指定することによってなされる。人物認識部51Aは、入力がステレオカメラである特性を利用し、その人の位置情報も算出して配置算出部56へ送出する。
【0032】
音声認識部51Bは、マイク13から入力される人間の音声を認識し、認識した結果を行動決定部52へ送出する。認識した結果とは、「おはよう」「こんにちは」などの、人がロボットに対して話しかけた言葉である。行動決定部52が、音声認識部51Bから認識結果を受け取ると、その認識結果に応じた応答をするよう、制御部53と音声合成部54へ指示を送る。たとえば、認識結果が「おはよう」である場合には、制御部53には、頭部2を上下に振る指示を送り、音声合成部54には、「おはようございます」という発話を行う指示を送る。これによって、人がロボットに「おはよう」と話しかけ、ロボットがその言葉を認識すると、ロボットは頭部2を上下に振りながら「おはようございます」という発話を行うことができる。
【0033】
タッチセンサ15は、人がタッチセンサに触れたときに、その検知情報を接触認識部51Cに送出する。接触認識部51Cは、接触認識情報を行動決定部52に送出する。行動決定部52が接触認識情報を受け取ると、その認識結果に応じた応答をするよう、制御部53と音声合成部54へ指示を送る。たとえば、触られたことに対して喜びを表現することとし、そのために、制御部53に対しては、頭部2を左右に振る指示を送り、音声合成部54へは「わーい」という言葉を発話する指示を送る、というような内容である。
【0034】
制御部53は、行動決定部52から与えられる動作データに基づいて、アクチュエータ14A、14B、22A、22Bを駆動するための制御信号を生成し、これをアクチュエータ14A、14B、22A、22Bへ送出する。これにより、アクチュエータ14A、14B、22A、22Bは、制御信号にしたがって駆動し、ロボットは動作する。
【0035】
配置算出部56は、人物認識部51Aから、健聴者と難聴者の位置情報が送られて来ると、スピーカ16の指向性の範囲に難聴者が入り、かつ、健聴者がスピーカ16の指向性の範囲からはずれるような、ロボット自身の位置取りを計算して求める。スピーカ16の指向性の範囲としては、本実施形態ではスピーカの正面から左右30度の範囲より外側を指向性の範囲外とする。特許文献3にあるように、正面から30度において2KHz以上の高域の音が約15dB以上減衰していることから、スピーカの正面から左右30度の範囲より外側を指向性の範囲外とすることは妥当だと考えられる。この指向性の範囲外を示す角度を一般化してθ0と表すことにする。今の例ではθ0=30(deg)である。
【0036】
ロボット、難聴者、健聴者の配置を図5に示した。図5において、点Rがロボットの位置を、点A(XY座標の原点)が難聴者の位置を、点B(X=d、Y=0)が健聴者の位置を示している。難聴者と健聴者の間の距離がd(m)である。ここで、X軸とRAのなす角度をφ、RAとRBのなす角度をθとする。実際には、ロボットから見たときに、難聴者と健聴者の位置が逆転しているケースも存在するが、その場合には、X軸を反転して以下の議論を同様に適用すれば良い。
【0037】
本実施形態では、ロボットがスピーカ16の正面を難聴者へ向けることとする。図5では、スピーカ16の向きを矢印で示した。これは、指向性スピーカであるものの、正面からずれると音の強さが弱くなってしまうので、正面を向けるのが最も望ましいからである。
【0038】
そうすると、このとき、角度θがθ0よりも大きければ、図5に示した配置で、難聴者が指向性スピーカ16の正面に位置し、健聴者が指向性スピーカ16の指向性の範囲外に存在することになる。
【0039】
ここで次のように考える。θ=θ0とし一定の値とする。このとき、RAの長さはφの関数となるので、それをr(φ)とする。そうすると、r(φ)の関数形は次式で表される。
r(φ)= d×sin(θ0+φ)/sin(θ0) …(1)
【0040】
そして、この(1)式で表されるr(φ)は、ロボットと難聴者の間の距離の最大値となることが容易にわかる。したがって、健聴者(B)が指向性の範囲外に存在するためには、ロボット(R)は、難聴者(A)から距離r(φ)より近い場所に位置しなければならない。
【0041】
具体的な数値をいくつか挙げてみる。d=0.5(m)の場合、φ=90(deg)、すなわちロボットが難聴者の正面に位置する場合、r(φ)=0.866(m)である。また、そこから30度ずれた場所を見てみると、φ=120(deg)のときr(φ)=0.5(m)、φ=60(deg)のときr(φ)=1.0(m)である。
【0042】
距離d(m)離れた二人の人間と音声コミュニケーションを行う場合、ロボットの位置取りとしては、60(deg)≦φ≦120(deg)が適当だと考えられる。そこで、配置算出部56が難聴者と健聴者を見つけたとき、二人を結ぶ直線を仮想的に考え、ロボットが難聴者に対して向くようにしたとき、ロボットから難聴者へと向かうベクトルと仮想直線との角度が60度から120度の範囲になる位置にロボットを移動させる。そして、ロボットと難聴者との距離が、式(1)で表される値以下であるような位置にロボットを移動させれば良いことになる。
【0043】
図6にロボットの存在位置を示した。図6のAcdeで示される領域の内部がロボットが存在することが望ましい(指向性スピーカ16の正面に難聴者Aを捉えつつ、健聴者Bが指向性スピーカ16の指向性領域の外にいる)範囲である。ただしロボット(指向性スピーカ16)は難聴者(A)を向く。
【0044】
ロボットと難聴者の間の距離を具体的にいくつにするか、任意性がある。本実施形態では、ロボットが難聴者と健聴者を検出した時点でロボットが領域Acdeの外に存在するとき、ロボットがdの位置に移動するように、配置算出部56が行動決定部52へ指示を送り、行動決定部52が制御部53へ指示を送りアクチュエータ14A、14Bを動作させ、ロボットをdの位置に移動させる。また、ロボットが難聴者と健聴者を検出した時点でロボットが領域Acdeの中または境界上に存在するときには、その場でロボットを自転させてロボットと指向性スピーカ16の正面が難聴者に向くようにロボットを回転させる。
【0045】
また、配置算出部56は、ロボットと難聴者までの距離およびロボットと健聴者までの距離をそれぞれ行動決定部52へ送り、行動決定部はそれらの距離情報を音声合成部54へ送る。
【0046】
音声合成部54は、行動決定部52から与えられる文章から合成音声を生成し、出力部55へ供給するが、その際に、難聴者までの距離と健聴者までの距離を参照する。すなわち、音量には基準音量と基準距離が存在し、実際の人までの距離に応じて基準音量から適切な音量を算出して出力する。ここで、本実施形態では、基準音量をD0、基準距離をL0とし、人までの距離をRとするとき、音量は D0×R×R/(L0×L0)で算出される。このようにして、難聴者までの距離と健聴者までの距離を参照して適切な音量が計算され、各々合成音が生成され、出力部55へ送られる。ただし、スピーカ16から出力される音は、2KHz以上の高域を10dBから15dB強調した音である。
【0047】
出力部55には、音声合成部54から二つの合成音のディジタルデータが供給されるようになっており、出力部55は、それらのディジタルデータを、アナログの音声信号にD/A変換し、スピーカ12およびスピーカ16に供給して出力させる。
【0048】
なお、本実施形態では、人を認識し人までの距離を算出する手段として画像認識を利用したが、これは、他の方法、たとえば、超音波タグの技術を利用しても構わない。人までの距離を算出する方法としてレーザレンジファインダを利用しても良い。
【0049】
指向性の範囲外を示す角度を30度としたが、これは、指向性スピーカ16の実際の性能に合わせて変えるべきものである。
【0050】
また、スピーカ16の指向性の範囲は固定であるとしたが、これはこの限りではない。すなわち、スピーカ16の指向性の範囲は可変でも良い。この場合には、指向性の範囲を変えることが可能となるので、スピーカ16の存在可能位置は本実施形態よりも広くなる。
【0051】
また、本実施形態では、指向性スピーカ16を難聴者へ向けることを前提にしたが、これは指向性スピーカの指向性の範囲内に難聴者が来るようにしても構わない。
【0052】
ロボットの好ましい存在領域として、60(deg)≦φ≦120(deg)としたが、実際にはこれに限るものではない。
【0053】
また、ロボットが難聴者と健聴者を検出した時点でロボットが領域Acdeの外に存在するとき、ロボットがdの位置に移動するようにしたが、これもこの限りではない。領域の内部であればどこに移動しても構わない。
【0054】
ロボットが適切な場所に移動したのち、人が動く場合がある。配置算出部56は常に人の位置を把握し、ロボットの配置が不適切である場合には、ロボットの配置が適切となるよう、行動決定部52へ指示を送る。
【0055】
音声合成部54では、指向性スピーカから発する音について、2KHz以上の高域を10dBから15dB強調するとしたが、強調する範囲は2KHz以上に限るものではない。また、強調の度合いも10dBから15dBに限るものではなく、周波数帯ごとに異なる強調の度合いとすることも可能であるし、個別の難聴者(難聴者)ごとに強調の度合いを異なるものにすることもできる。
【0056】
また、難聴者にはスピーカ12から到達する通常の音声が届くので、音声合成部54では、スピーカ16から発する音として、このスピーカ12から到達する分を差し引いた音声を発するようにしても良い。
【0057】
また、音声合成部54では、人までの距離に応じて音量を決めるだけでなく、ロボットを移動させるとともにその移動後の位置から人までの距離に応じて音量を決めるようにしても良い。その場合、音声合成部54が制御部53に対して移動の命令を送る。ただし、移動する範囲は、配置算出部56で算出された範囲とする。たとえば、配置算出部56が決定した位置より近づくことが望ましい場合、このような方法が考えられる。スピーカの最大限界音量が小さい場合には、このようにロボットが人に近づく方法をとらねばならない。
【0058】
さらには、本実施形態では、ロボットにスピーカを搭載する形態を説明したが、スピーカ12が部屋に置かれていてスピーカ16がロボットに搭載されている場合にも本発明は適用可能である。さらには、ロボットに限らず、スピーカの位置を変えられる仕組みになっているシステムに対しても本発明は適用することが可能である。
【0059】
また、本実施形態では、スピーカ12とスピーカ16を各々一つのスピーカとしたが、実際には、スピーカ12とスピーカ16がそれぞれ複数のスピーカから構成されていても良い。
【0060】
次に、図7のフローチャートを参照して本実施の形態の全体の動作について詳細に説明する。
【0061】
ステップS1において、ロボットが難聴者と健聴者を検出する。ステップS2において、ロボットが難聴者と健聴者に対して適切な配置にいるかどうかを判断する。ステップS2において、ロボットが難聴者と健聴者に対して適切な配置にいないと判断された場合、ステップS3において、ロボットを適切な位置に移動する。ステップS2において、ロボットが難聴者と健聴者に対して適切な配置にいると判断された場合、ステップS4において、タッチセンサに触られたこと、あるいは、音声認識をしたかどうかを待ち、ステップS4において、タッチセンサに触られたか、あるいは、音声認識をした場合、ステップS5においてロボットが応答を行う。
【0062】
次に、本実施形態の効果について説明する。本実施形態では、難聴者向けに高域を強調した音を難聴者に対して出力し、健聴者向けに通常の音を出力することが可能となるため、ロボットが難聴者やその介護者と好適に音声コミュニケーションを行うことができる。
【0063】
また、ロボットが人物の映像を記録しておき、インターネットなどを介して要求されたときに、人物の映像を外部の端末へ送出する機能を持っていても良い。また、本実施の形態では、ロボットにマイクロフォンが装備されているが、ワイアレスマイクを使用する形態も考ええられる。また、ロボットは、赤外線センサを備え、難聴者の体温をチェックする機能を備えていても良い。また、ロボットは、マップ生成機能、自己位置同定機能を備えていても良い。また、ロボットは、タッチセンサを複数備えていても良い。
【0064】
以上述べたように、本実施形態のスピーカ制御装置において、音量補償手段501(図1参照)は、第一のスピーカ101の位置を算出して動作手段401へ出力し、配置算出手段301により算出された第二のスピーカ102の位置の範囲内で第二のスピーカ102の位置を算出して動作手段401へ出力し、また、第一のスピーカ101の音量と第二のスピーカ102の音量とを変更し、動作手段401は、音量補償手段501から与えられた第一のスピーカ101および第二のスピーカ102の位置に関する情報に従って、第一のスピーカ101および第二のスピーカ102を移動してもよい。
【0065】
配置算出手段301は、人物認識手段201によって検出された第一の人の位置と第二の人の位置とから第二のスピーカ102の位置の範囲を算出するときに、第二のスピーカ102の正面が第二の人の方向を向き、且つ、第二のスピーカ102が第二の人の正面方向から左右に所定の角度範囲内に存在するという前提で、第一の人が第二のスピーカ102の指向性の範囲内に入らないような、第二のスピーカ102の位置の範囲を算出してもよい。
【0066】
第二のスピーカ102の指向性の向きが可変であり且つ指向性の範囲が可変であり、配置算出手段301は、第二のスピーカ102の指向性の範囲に第二の人が入り且つ第一の人が入らないような、第二のスピーカ102の位置、指向性の向きおよび指向性の範囲を算出してもよい。
【0067】
また、本実施形態のスピーカ制御方法は、第一のスピーカ101および第二のスピーカ102を制御する方法であって、第一の人の位置と第二の人の位置とを検出する人物認識ステップと、人物認識ステップにおいて検出された第一および第二の人の位置に基づいて、第二のスピーカ102の指向性の範囲内に第二の人が入り且つ第一の人が入らないような、第二のスピーカ102の位置の範囲を算出する配置算出ステップと、配置算出ステップにおいて算出された第二のスピーカ102の位置の範囲内に入るように、第二のスピーカ102の位置を変更する動作ステップと、第一の人に到達する第一のスピーカ101の音量が所定の範囲内となり、且つ、第二の人に到達する第二のスピーカ102の音量が所定の範囲内となるように、第一のスピーカ101および第二のスピーカ102の音量を調整する音量補償ステップと、を含むものである。
【0068】
また、本実施形態のスピーカ制御プログラムは、上記人物認識ステップと、上記配置算出ステップと、上記動作ステップと、上記音量補償ステップと、をコンピュータに実行させるものである。
【0069】
本発明は、上記実施形態に限定されるものではなく、様々な変形が可能である。
【0070】
本発明によれば、マイクなどの音声入力装置を備え、人を検出する機能を持つ、人とインタラクションするロボットに広く適用できる。さらに、本実施の形態においては、上述した一連の処理を、CPU10A(図3)にプログラムを実行させることにより行うようにしたが、一連の処理は、それ専用のハードウェアによって行うことも可能である。
【0071】
なお、プログラムは、あらかじめメモリ10B(図3)に記憶させておく他、フロッピー(登録商標)ディスク、CD−ROM、MOディスク、DVD、磁気ディスク、半導体メモリなどのリムーバブル記録媒体に、一時的あるいは永続的に格納(記録)しておくことができる。そして、このようなリムーバブル記録媒体を、いわゆるパッケージソフトウェアとして提供し、ロボット(メモリ10B)にインストールするようにすることができる。
【0072】
また、プログラムは、ダウンロードサイトから、ディジタル衛星放送用の人工衛星を介して、無線で転送したり、LAN、インターネットといったネットワークを介して、有線で転送し、メモリ10Bにインストールすることができる。この場合、プログラムがバージョンアップされたとき等に、そのバージョンアップされたプログラムを、メモリ10Bに、容易にインストールすることができる。
【0073】
ここで、本明細書において、CPU10Aに各種の処理を行わせるためのプログラムを記述する処理ステップは、必ずしもフローチャートとして記載された順序に沿って時系列に処理する必要はなく、並列的あるいは個別に実行される処理も含むものである。また、プログラムは、1つのCPUにより処理されるものであっても良いし、複数のCPUによって分散処理されるものであっても良い。
【図面の簡単な説明】
【0074】
【図1】本発明によるスピーカ制御装置の一実施形態を示すブロック図である。
【図2】本実施形態のスピーカ制御装置を備えるロボットの外観を示す正面図である。
【図3】図2のロボットの電気的構成を示すブロック図である。
【図4】図3のコントローラの機能的構成例を示すブロック図である。
【図5】実施形態の動作を説明するための図である。
【図6】実施形態の動作を説明するための図である。
【図7】実施形態の動作を説明するためのフローチャートである。
【符号の説明】
【0075】
101 第一のスピーカ
102 第二のスピーカ
201 人物認識手段
301 配置算出手段
401 動作手段
501 音量補償手段
1 ロボットの胴体部
2 ロボットの頭部
3A、3B ロボットに取り付けられた車輪
10 コントローラ
10A CPU
10B メモリ
11 バッテリ
12 スピーカ
13 マイクロフォン
14A、14B アクチュエータ
15 タッチセンサ
16 スピーカ
21A、21B CCDカメラ
22A、22B アクチュエータ
51A 人物認識部
51B 音声認識部
51C 接触認識部
52 行動決定部
53 制御部
54 音声合成部
55 出力部
56 配置算出部

【特許請求の範囲】
【請求項1】
第一および第二のスピーカを制御する装置であって、
第一の人の位置と第二の人の位置とを検出する人物認識手段と、
前記人物認識手段により検出された前記第一および第二の人の位置に基づいて、前記第二のスピーカの指向性の範囲内に前記第二の人が入り且つ前記第一の人が入らないような、前記第二のスピーカの位置の範囲を算出する配置算出手段と、
前記配置算出手段により算出された前記第二のスピーカの位置の範囲内に入るように、前記第二のスピーカの位置を変更する動作手段と、
前記第一の人に到達する前記第一のスピーカの音量が所定の範囲内となり、且つ、前記第二の人に到達する前記第二のスピーカの音量が所定の範囲内となるように、前記第一および第二のスピーカの音量を調整する音量補償手段と、
を備えることを特徴とするスピーカ制御装置。
【請求項2】
請求項1に記載のスピーカ制御装置において、
前記音量補償手段は、前記第一のスピーカの位置を算出して前記動作手段へ出力し、前記配置算出手段により算出された前記第二のスピーカの位置の範囲内で第二のスピーカの位置を算出して前記動作手段へ出力し、また、前記第一のスピーカの音量と前記第二のスピーカの音量とを変更し、
前記動作手段は、前記音量補償手段から与えられた前記第一および第二のスピーカの位置に関する情報に従って、前記第一および第二のスピーカを移動するスピーカ制御装置。
【請求項3】
請求項1または2に記載のスピーカ制御装置において、
前記配置算出手段は、前記人物認識手段によって検出された前記第一の人の位置と前記第二の人の位置とから前記第二のスピーカの位置の範囲を算出するときに、前記第二のスピーカの正面が前記第二の人の方向を向き、且つ、前記第二のスピーカが前記第二の人の正面方向から左右に所定の角度範囲内に存在するという前提で、前記第一の人が前記第二のスピーカの指向性の範囲内に入らないような、前記第二のスピーカの位置の範囲を算出するスピーカ制御装置。
【請求項4】
請求項1乃至3いずれかに記載のスピーカ制御装置において、
前記第二のスピーカの指向性の向きが可変であり且つ指向性の範囲が可変であり、
前記配置算出手段は、前記第二のスピーカの指向性の範囲に前記第二の人が入り且つ前記第一の人が入らないような、前記第二のスピーカの位置、指向性の向きおよび指向性の範囲を算出するスピーカ制御装置。
【請求項5】
請求項1乃至4いずれかに記載のスピーカ制御装置と、
前記スピーカ制御装置によって制御される前記第一および第二のスピーカと、
を備えることを特徴とするロボット。
【請求項6】
第一および第二のスピーカを制御する方法であって、
第一の人の位置と第二の人の位置とを検出する人物認識ステップと、
前記人物認識ステップにおいて検出された前記第一および第二の人の位置に基づいて、前記第二のスピーカの指向性の範囲内に前記第二の人が入り且つ前記第一の人が入らないような、前記第二のスピーカの位置の範囲を算出する配置算出ステップと、
前記配置算出ステップにおいて算出された前記第二のスピーカの位置の範囲内に入るように、前記第二のスピーカの位置を変更する動作ステップと、
前記第一の人に到達する前記第一のスピーカの音量が所定の範囲内となり、且つ、前記第二の人に到達する前記第二のスピーカの音量が所定の範囲内となるように、前記第一および第二のスピーカの音量を調整する音量補償ステップと、
を含むことを特徴とするスピーカ制御方法。
【請求項7】
第一および第二のスピーカを制御するプログラムであって、
第一の人の位置と第二の人の位置とを検出する人物認識ステップと、
前記人物認識ステップにおいて検出された前記第一および第二の人の位置に基づいて、前記第二のスピーカの指向性の範囲内に前記第二の人が入り且つ前記第一の人が入らないような、前記第二のスピーカの位置の範囲を算出する配置算出ステップと、
前記配置算出ステップにおいて算出された前記第二のスピーカの位置の範囲内に入るように、前記第二のスピーカの位置を変更する動作ステップと、
前記第一の人に到達する前記第一のスピーカの音量が所定の範囲内となり、且つ、前記第二の人に到達する前記第二のスピーカの音量が所定の範囲内となるように、前記第一および第二のスピーカの音量を調整する音量補償ステップと、
をコンピュータに実行させることを特徴とするスピーカ制御プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate