説明

装置とユーザとの間のコミュニケーションのための電気装置及び方法

装置とユーザとの間のコミュニケーションのための電気装置及び方法が説明される。
装置は、該装置の近傍の物体(34、36)を検出するためのセンサ手段(例えばカメラ(18))を有する。物体(34、36)の位置は、メモリ(M)に記憶される。例えば機械的ポインティング素子の形式の、又は、集中化された光ビームを発生させるための光源を備えた、方向ポインティングユニット(20)は、該装置の近傍にある物体の方向に向けられることができる。このようにして、対話において、対応する物体が、人間ユーザに指し示されることができる。

【発明の詳細な説明】
【技術分野】
【0001】
ユーザと電気装置との間の通信には多くの可能性があることが知られている。装置への入力については、これらの可能性は、キー又はタッチスクリーン等の機械的又は電気的入力手段、及び、光学的(例えば画像センサ)又は音響的入力手段(その対応する信号処理、例えば音声認識を有するマイクロフォン)を含む。装置のユーザへの出力については、幾つかの可能性が、例えば特別な光学的(LED、表示スクリーン等)及び音響的表示が、更に知られている。音響表示は、単純な基準音だけでなく、例えば、音声合成も有してよい。音声認識及び音声合成を組み合わせることにより、電気装置を制御するための自然音声対話が用いられることができる。
【背景技術】
【0002】
米国特許第6,118,888号は、制御装置、及び、電気装置(例えばコンピュータ又は家庭用電化製品)を制御する方法を説明する。装置の制御のために、ユーザは、例えば、キーボード又はマウス等の機械的な入力可能性、及び音声認識等の多くの入力可能性を持つ。更に、制御装置は、カメラを備え、該カメラにより、ユーザのジェスチャ及び摸倣(mimicry)が取得されて他の入力信号として処理されることができる。ユーザとのコミュニケーションは、システムが、ユーザに情報を伝える多くのモードの処理も持つ、対話の形式で実現される。これらのモードは、音声合成及び音声出力である。特に、これらのモードは、擬人化表現(例えば、人間、人の顔又は動物の表現)も有する。この表示は、表示スクリーン上のコンピュータグラフィック画像として示される。
【発明の開示】
【発明が解決しようとする課題】
【0003】
しかし、従来の入力及び出力手段は、例えば、電気装置がユーザとの対話中に該装置の近傍の位置又は物体を示すべきとき等、幾つかのアプリケーションにおいては扱いにくい。
【0004】
従って、本発明の目的は、特に近傍にある物体を示すときに単純で効率的なコミュニケーションが可能である、装置とユーザとの間のコミュニケーションのための装置及び方法を提供することである。
【課題を解決するための手段】
【0005】
この目的は、請求項1に記載の装置及び請求項10に記載の方法により解決される。従属請求項は、本発明の有利な実施例において規定される。
【0006】
本発明は、人間のコミュニケーション手段のシミュレーションが、装置と人間ユーザとの間のコミュニケーションにとっても有利であるという認識に基づく。このようなコミュニケーション手段は、指し示すこと(ポインティング、pointing)である。従って、本発明による装置は、該装置の近傍にある物体の方向に向けられることができる方向ポインティングユニットを有する。
【0007】
ポインティングの有用なアプリケーションのためには、装置は、その近傍に関する情報を必要とする。本発明によれば、物体を検出するためのセンサ手段が設けられる。このようにして、装置は、該装置自体で該装置の近傍を検出し、物体の場所を突き止めることができる。ユーザとの対話の中で、それに応じてポインティングユニットは、これら物体を指し示す方向に向けられることができる。
【0008】
装置内で、物体の位置は、センサ手段からポインティングユニットに直接伝送されることができる。このことは、例えば、移動する物体をトラックする、即ち追跡することが所望されるときに有用である。しかし、装置は、好適には、物体の位置を記憶するための少なくとも1つのメモリを有する。
【0009】
ポインティングユニットは、種々の方法で実現されることができる。一方で、例えば細長い形を持ち、機械的に移動可能な機械的ポインティング素子を使用することが可能である。好適には、機械的移動は、少なくとも1つ、好適には2つの、指示方向に垂直な軸の周りの機械的ポインティング素子の回転運動を含む。ポインティング素子は、このとき、その近傍にある物体の方を向くように適当な駆動手段によって回転される。従って、人間のコミュニケーションにおいて(指で)指し示すときと同様に、装置が物体を示すことが可能である。
【0010】
他方では、ポインティングユニットは、光源も有してよい。ポインティングの目的のため、例えば、レーザ又は適当な光学システム若しくは絞りを用いることにより、集中化された(concentrated)光ビームが発生させられる。光ビームは、装置と人間ユーザとの間のコミュニケーションのプロセスにおいてこれらの物体が照らされることにより示されるように、適当な手段を用いることにより装置の近傍の物体に向けられることができる。光ビームの方向決めのために、光源は、機械的に移動可能に構成されてよい。代わりに、光源によって発生させられた光は、1つ又は複数の機械的に移動可能なミラーによって所望の方向に偏向されてもよい。
【0011】
該装置の近傍にある物体を検出するための本発明によるセンサ手段は、例えば光学センサ手段として、特にカメラとして形成されることができる。画像を適切に処理するときには、検出範囲内の物体を認識し、装置に対する相対位置を決定することが可能である。次に、ユーザとのコミュニケーションのプロセスにおいて物体を示すことが必要になるときに、ポインティングユニットが、この物体に向けられることができるように、上記の物体の位置は、適切に記憶されることができる。
【0012】
本発明の他の実施例によれば、装置は、機械的に移動可能な擬人化素子を有する。これは、装置の、ユーザの対話パートナーの擬人化として働く部分である。このような擬人化素子の具体的な実現態様は、非常に異なってよい。例えば、電気装置の静止ハウジングに対してモータ移動可能なハウジングの一部であってよい。擬人化素子が、ユーザに前面として認識されることができる前面を持つことは必須である。この前面がユーザに面すれば、該ユーザは、これにより、該装置が「注意深い(attentive)」、即ち、例えば音声命令を受けることができる、という印象を与えられる。
【0013】
この目的のため、装置は、ユーザの位置を決定するための手段を有する。これらの手段は、好適には、装置の近傍にある物体を検出するために用いられるのと同じセンサ手段である。擬人化素子の運動手段(motion means)は、擬人化素子の前面がユーザの位置の方向に向けられるように制御される。これにより、ユーザは、該ユーザが言うことを装置が「聞く」準備ができているとの印象を常に持つ。
【0014】
擬人化素子は、例えば、擬人化表現であってよい。これは、人間又は動物の表現であってよいが、空想上の形であってもよい。この表現は、好適には、人間の顔の摸倣である。これは、写実的な表現であってよく、又は、例えば目、鼻及び口等の輪郭のみが示される、記号的な表現に過ぎなくともよい。
【0015】
ポインティングユニットは、好適には、擬人化素子上に構成される。擬人化素子の機械的移動性は、ポインティングユニットの方向的可能性が完全に又は部分的に保証されるように用いられることができる。例えば、擬人化素子が垂直軸の周りで回転可能であれば、この回転のため、擬人化素子上に構成されるポインティングユニットも動かされ、物体の方向に向けられることができる。必要ならば、ポインティングユニットは、追加の方向手段(ドライブ、ミラー)を持ってよい。
【0016】
装置が、音声信号を入力及び出力するための手段を有することが好ましい。音声入力は、一方では、音響信号のピックアップを、他方では、音声認識によるこれら音響信号の処理を、意味すると理解される。音声出力は、例えばスピーカによる音声合成及び出力を有する。音声入力及び出力手段を用いることにより、装置の完全な対話制御が実現されることができる。代わりに、ユーザを楽しませるために、該ユーザと対話がなされることもできる。
【発明を実施するための最良の形態】
【0017】
装置の一実施例が、以下で、図面を参照して説明される。
【0018】
図1は、電気装置10を示す。装置10は、ベース12に対して垂直軸の周りを360°回転可能である擬人化素子14を備えたベース12を持つ。擬人化素子14は、平らであり、前面16を有する。
【0019】
装置10は、人間のユーザから入力情報を受けるための、そして、出力情報をユーザに伝達するための、対話システムを有する。装置10の実施態様に応じて、この対話は、それ自体が装置10を制御するのに用いられることができ、又は、装置10は、該装置10に接続された他の装置を制御するための該装置10自体の制御ユニットとして動作する。例えば、装置10は、家庭用電化製品、例えばオーディオ又はビデオプレーヤであってよく、又は、装置10によってこのような家庭用電化製品が制御される。最後に、装置10となされた対話は、装置機能の制御を優先的な目標として持たないことも可能であり、ユーザを楽しませるために用いられてもよい。
【0020】
装置10は、該装置10の近傍をセンサにより検出することができる。カメラ18が、擬人化素子14に構成される。カメラ18は、擬人化素子14の前面16の前の範囲内で画像を検出する。
【0021】
カメラ18によって、装置10は、その近傍の物体及び人を検出し認識することができる。人間ユーザの位置はこのようにして検出される。擬人化素子14のモータドライブ(示されない)は、擬人化素子14の前面16がユーザの方を向くようにその調整角度αに関して制御される。
【0022】
装置10は、人間ユーザと対話することができる。装置10は、マイクロフォン(示されない)を介してユーザから音声コマンドを受ける。音声コマンドは、音声認識システムによって認識される。追加として、該装置は、音声合成ユニット(示されない)を含み、これにより、ユーザへの音声メッセージは、スピーカ(示されない)を介して発生され生成されることができる。このようにして、ユーザとの対話は自然な対話の形式で起こることができる。
【0023】
更に、ポインティングユニット20が擬人化素子14上に構成される。示される実施例において、ポインティングユニット20は、集中化された可視の光ビームを発生させるための対応する光学システムを備えたレーザダイオードの形式の機械的に移動可能な光源である。
【0024】
ポインティングユニット20は、指向性のタイプである。適切なモータドライブ(示されない)によって、ポインティングユニットは、擬人化素子14に対して高さ角度βで回転されることができる。角度αでの擬人化素子の回転と、適切な高さ角度βの調整とを組み合わせることによって、ポインティングユニット20からの光ビームは、装置10の近傍の物体の方向に向けられることができる。
【0025】
装置10は、オペレーティングプログラムが実行される中央ユニットを介して制御される。オペレーティングプログラムは、異なった機能のための異なったモジュールを有する。
【0026】
上述のとおり、装置10は、ユーザとの自然な対話を実行することができる。対応する機能は、ソフトウェアモジュールの形で実現される。音声認識、音声合成及び対話制御において必要とされるモジュールは、当業者には知られているので、詳細には説明されない。音声認識の基本は、そして更に、音声合成対話システム構成に関する情報は、例えば、Lawrence
Rabiner及びBiing-Hwang
Juangによる「Fundamentals
of Speech Recognition」(Prentice
Hall、1993(ISBN
0-13-015157-2))、Frederick
Jelinekによる「Statistical
Methods for Speech Recognition」(MIT
Press、1997(ISBN
0-262-10066-5))及びE.G.
Schukat-Talamazziniによる「Automatische
Spracherkennung」(Vieweg、1995(ISBN
3-528-05492-1))並びにこれらの本において参考文献として述べられた文書において説明されている。概説が、Bernd
Souvignier、Andreas
Kellner、Bernhard
Rueber、Hauke
Schramm及びFrank
Seideによる文献「The
thoughtful elephant: Strategies for spoken dialog systems」(IEEE Transactions on Speech and Audio
Processing、8(1):
51-62, 2000年1月)にも提供されている。
【0027】
ユーザとの対話の中で、装置10は、該物体を指し示すことによりその近傍にある物体を、示すことができる。この目的のため、ポインティングユニット20は、これに応じて位置合わせされ、光ビームが関連する物体の方向に向けられる。
【0028】
ここで、ポインティングユニットを制御するためのソフトウェア構造が説明される。図2の下方部は、装置10の入力サブシステム24を示す。この図中で、センサユニット、即ち装置10のカメラ18は、概略ブロックとして示される。カメラによって取得された信号は、近傍分析の目的で、ソフトウェアモジュール22によって処理される。装置10の近傍にある物体に関する情報が、カメラ18によって取得された画像から抽出される。物体を分離して認識するための、対応する画像処理アルゴリズムは、当業者に知られている。
【0029】
認識された物体と、この例において回転角度α及び高さ角度βにより表現される、これら物体の装置10に対する相対位置とに関する情報は、メモリMに記憶される。
【0030】
図2の上方部は、装置10の出力サブシステム26を示す。出力サブシステム26は、該出力サブシステム26が所与の出力情報を供給するように対話モジュール28によって制御される。出力プラニングモジュール30は、出力情報のプラニングを引き継ぎ、ポインティングユニット20を用いることにより出力情報が与えられるべきか確認する。その部分モジュール32が、装置10の近傍にあるどの物体が指し示されるべきかを決定する。
【0031】
ポインティングユニットのためのドライバDは、インタフェースモジュールIを介して制御される。ドライバDは、どの物体が指し示されなければならないか知らされる。ドライバモジュールDは、制御されるべき位置についてメモリMに照会し、これに応じてポインティングユニット20を制御する。物体を指し示すために、ドライブ(示されない)は、固定角度αで擬人化素子14を回転させるように、そして、ポインティングユニット20を関連する高さ角度βに向けるように、制御される。
【0032】
状況の一例が図3に示される。多くのCD36を備えたCDラックが装置10の近傍に存在する。擬人化素子14の前面16にあるカメラは、CDラック34の画像を検出する。適切な画像処理によって、ラック34に存在する個々のCD36が認識されることができる。適切な光学解像度の場合、タイトル及び演奏者を読むことが可能である。この情報は、個々のCDの位置に関する情報(即ちラック34の装置10に対する回転角度α及び関連するCDの高さ角度β)と共にメモリに記憶される。
【0033】
ユーザとの間でなされた対話中で、装置10は、該ユーザが聞くことができるCDについてユーザに提案をすべきである。対話制御モジュール28は、これに応じてプログラムされ、このため、音声合成を介して、該装置は、ユーザに好む音楽ジャンルに関する質問をし、該ユーザの答えを音声認識を介して設定する。このようにして収集された情報に基づいてラック34中のCD36の適切な選択がなされた後に、出力サブシステム2は、作動させられる。このサブシステムは、これに応じてポインティングユニット20を制御する。ポインティングユニットによって発せられた光ビーム40は、このようにして、選択されたCD36の方向に向けられる。同時に、ユーザは、音声出力情報を介して、これが装置によってなされた推薦であるということを知らされる。
【0034】
適当なCDを選択するための装置10の上述のアプリケーションは、ポインティングユニットを用いる一例に過ぎないと理解されるべきである。他の実施例(示されない)において、装置10は、例えば、警報装置の制御ユニットに接続されたセキュリティシステムである。この場合には、ポインティングユニットは、ユーザの注意を、部屋の中でセキュリティの問題が生じる可能性のある場所、例えば空いた窓に向けるのに用いられる。
【0035】
種々の他のアプリケーションが、ポインティングユニット20によってその近傍の物体を指し示すことができる装置において、適切である。このような装置は、静止した装置のみである必要はなく、移動可能な装置、例えばロボットであってもよい。
【0036】
他の実施例において、装置10は、カメラ18によって該装置10の近傍にある物体の移動を追跡することができる。擬人化素子及びポインティングユニット20は、光ビーム40が移動する物体の方向に向いたままであるように制御される。この場合においては、物体の座標がメモリMにバッファされるのではなく、近傍分析のために、ポインティングユニットのためのドライバDがソフトウェアモジュール22によって直接的に制御されることが可能である。
【図面の簡単な説明】
【0037】
【図1】装置の一実施例を示す。
【図2】装置の機能ユニットの記号的な表示である。
【図3】近傍に物体がある図1の装置を示す。

【特許請求の範囲】
【請求項1】
電気装置であって、
当該装置の近傍の物体を検出するためのセンサ手段と、
当該装置の近傍の物体の方向に向けられることができる方向ポインティングユニットと、
を有する電気装置。
【請求項2】
請求項1に記載の装置において、物体の位置を記憶するための少なくとも1つのメモリを有する、装置。
【請求項3】
請求項1又は2に記載の装置において、前記ポインティングユニットは、機械的ポインティング素子を有し、当該機械的ポインティング素子は、当該機械的ポインティング素子が前記装置の近傍にある物体の方向に向けられることができるように機械的に移動可能である、装置。
【請求項4】
請求項1、2又は3に記載の装置において、前記ポインティングユニットは、集中化された光ビームを発生させるための光源と、前記光ビームを前記装置の近傍の物体の方向に向けるための手段とを有する、装置。
【請求項5】
請求項4に記載の装置において、前記光源は機械的に移動可能である、装置。
【請求項6】
請求項4又は5に記載の装置において、前記光ビームを方向決めするための前記手段は、1つ又は複数の機械的に移動可能なミラーを有する、装置。
【請求項7】
請求項1乃至6の何れか1項に記載の装置において、
前面を持つ擬人化素子と、
前記擬人化素子を機械的に移動させるための運動手段と、
ユーザの前記位置を決定するための手段と、
前記擬人化素子の前記前面が前記ユーザの前記位置の方向に向けられるように前記運動手段を制御するように構成される制御手段と、
を有する装置。
【請求項8】
請求項7に記載の装置において、前記ポインティングユニットは、前記擬人化素子上に構成される、装置。
【請求項9】
請求項1乃至8の何れか1項に記載の装置において、音声認識及び音声出力のための手段を有する装置。
【請求項10】
装置とユーザとの間のコミュニケーションの方法であって、
前記装置がセンサ手段により当該装置の近傍の物体を検出するステップと、
物体の前記位置をメモリに記憶して、前記物体のうちの1つに方向ポインティングユニットを位置合わせするステップと、
を有する方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate


【公表番号】特表2007−527502(P2007−527502A)
【公表日】平成19年9月27日(2007.9.27)
【国際特許分類】
【出願番号】特願2006−506451(P2006−506451)
【出願日】平成16年4月5日(2004.4.5)
【国際出願番号】PCT/IB2004/001066
【国際公開番号】WO2004/090702
【国際公開日】平成16年10月21日(2004.10.21)
【出願人】(590000248)コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ (12,071)
【Fターム(参考)】