説明

注目期間を有する音声入力装置

【課題】ユーザが使い易い機器制御装置を提供する。
【解決手段】音声入力に基づく入力装置(100)は、該装置の活性化命令のみを認識することができる待機モードと、該装置が機器の制御のための命令を認識することができる作動モードとを有する。装置(100)が音声入力において該装置の活性化命令を認識すると、該装置は作動モードに切り替わる。該装置は、命令が認識される限り作動モードに留まり、或る期間にわたり何の命令も認識されないと待機モードに戻る。本発明による装置は、ユーザに該装置のモード及びモードの変化に関して通知する可聴信号を生成するための通知モジュール(126)を有することができる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、機器を制御する装置であって、該装置が、音声入力を受信する受信ユニットと、該受信された入力を解析して命令を認識する解析ユニットと、該命令を上記機器に送信する送信ユニットと、当該装置を上記機器の実際の制御のために動作していない待機モードから上記機器の実際の制御のために動作する作動モードへ切り換える活性化ユニットとを有するような装置に関する。
【0002】
また、本発明は斯かる装置を有する遠隔制御器にも関する。
【0003】
また、本発明は複数の斯様な装置を有するシステムにも関する。
【0004】
また、本発明は機器を制御する方法であって、該方法が、音声入力を受信する受信ステップと、該受信された入力を解析して命令を認識する解析ステップと、該命令を上記機器に送信する送信ステップと、上記命令の認識及び送信を可能にする活性化ステップとを有するような方法に関する。
【背景技術】
【0005】
このような装置は、マイクロソフト・エージェントAPI(アプリケーション・プログラミング・インターフェース)を用いて、エージェントとして実施化することができる。マイクロソフト・コーポレーションから入手可能な1997年8月発行の"マイクロソフト・エージェント用の設計キャラクタ"なる文献は、エージェントを如何にして機器のインターフェースの一部として開発するかを記載している。
【発明の概要】
【発明が解決しようとする課題】
【0006】
マイクロソフト・エージェントによれば、機器はコンピュータ上で動作するクライアント・アプリケーション・プログラムである。該エージェントはユーザに対して異なるアニメーションを用いたキャラクタとして表示され、これにより当該エージェントの実際の状態に応じて実際のアニメーションが選択される。マウス及びキーボードを介しての命令に加えて、該エージェントは音声入力を介しての命令を受信することができる。これを実現するため、ユーザは、所謂プッシュ/トーク・ホット・キーを押すことにより該エージェントを聴話モードにする。これにより、該エージェントは音声入力を知覚するようになり、ユーザは所望の命令又は複数の命令を話すことができる。該エージェントが聴話状態に入ったことを視覚化するために、対応する聴話アニメーションが画面上に表示される。聴話状態においては、エージェントは音声入力における命令を認識しようとする。該エージェントが命令を認識したら、この命令は、実行のために、当該エージェントが割り当てられたクライアント・アプリケーション・プログラムに伝送される。
【0007】
本発明の一つの目的は、既知の装置よりもユーザが使い易い冒頭で述べたような装置を提供することにある。
【課題を解決するための手段】
【0008】
本発明によれば、この目的は、前記活性化ユニットが音声入力を受信すると共に、受信された該音声入力を解析して活性化命令を認識し、且つ、該活性化命令を認識すると当該装置を前記待機モードから前記作動モードに切り換えるように構成されていることを特徴とする装置において達成される。ユーザは、上記活性化命令を話すことにより本発明による上記装置を作動モードにすることができ、ユーザは特別なキーを押す必要がない。このことは、この装置が斯様な特別なキーを必要としないことを意味する。更に、ユーザは当該装置を物理的に操作する必要がない。何故なら、音声入力のみが必要とされ、手作業無しで操作が完了するからである。このことは、ユーザが当該機器の制御に加えて他の仕事を行っている状況では特に有利である。斯様な状況の一例は、車を運転しながら、カーラジオ又は自動車電話を操作する場合である。本発明による装置には物理的に接触する必要はないので、ユーザは、該ユーザにより話される入力が当該装置において受信され得る限りにおいて該装置から或る距離離れてさえしてもよい。
【0009】
本発明による装置の一実施例が、請求項2に記載されている。この装置は、或る期間にわたり命令が付与されないと、作動モードから待機モードへ自律的に切り替わるので、ユーザが該装置をはっきりと待機モードに切り換える必要はない。待機モードへの上記自律的な切換により、該装置が偶発的に作動モードに留まる可能性は殆どない。該装置は偶発的に作動モードに留まるべきでない。何故なら、その場合には、何らかの進行中の会話中の命令を認識し、これらの意図しない命令を実行のために被制御機器に送信してしまう可能性があるからである。ユーザが上記活性化命令を話した場合、該装置は、ユーザが上記機器を制御する命令の何れかを話してよい注目期間を提供する。斯様な命令が上記注目期間中に与えられない場合は、該装置は待機モードに戻る。この仕組みも、該装置の意図せぬ動作、及びそれに対応する上記機器の意図せぬ制御を防止する。待機モードの該装置が、会話から活性化命令を偶発的に拾ったとしても、該装置は続いて、その注目期間の間だけしか作動状態に留まらず、次いで待機モードに戻る。これは、上記機器の意図しない制御の可能性を低減する。
【0010】
本発明による装置の一実施例が、請求項3に記載されている。この装置は、該装置が作動モードに入ると可聴信号によりユーザに通知し、音声入力における命令に対して感知的となる。この通知の目的では、可聴信号の方が視覚信号より優れている。何故なら、視覚信号は、ユーザが画面又は該可視信号を表示する装置の一部に連続して注意を払うことを要するからである。従って、視覚信号は、特に意図せぬ作動モードへの投入の場合に通知されないままとなり得、かくして、ユーザは該装置のモードの変化に気が付かないままとなる。この装置の他の利点は、該装置が表示画面ないしで完全に動作し、かくして、製造コストを節約する点にある。
【0011】
本発明による装置の一実施例が、請求項4に記載されている。注意信号が、ユーザに上記注目期間中の時間の進行を通知すると共に、ユーザに当該装置が作動モードにあり、音声入力を介して命令を受信する準備ができていることを再び通知するために使用される。
【0012】
本発明による装置の一実施例が、請求項5に記載されている。終了信号は、ユーザに対して、当該装置が最早作動モードにはなく、従って音声入力における命令に対して感知的でないことを通知する。この装置は、待機モードと作動モードとの間の容易且つ明確な切換により、機器のユーザが使い易い且つ柔軟性のある制御を見込んでいる。前記活性化命令を認識すると、当該装置は、ユーザに対して該装置が音声入力における命令に対して感知的である注目期間の開始を通知するような開始信号を生成する。そして、該装置は認識された命令を実行のために上記機器に送信する。所定の期間の間に何の命令も付与及び認識されない場合は、当該装置は時間切れとなり、上記注目期間の終了を示すと共に該装置が最早音声入力における命令に対して感知的でないことを示す終了信号を生成する。2つの命令の間の期間が上記所定の"時間切れ"期間よりも短い限り、該装置は作動モードに留まり、音声入力における命令を受信する用意ができている。
【0013】
テレビジョン受像機又はハイファイセットのような機器を制御するために遠隔制御器を使用することは良く知られている。被制御機器の機能は、該遠隔制御器上の対応するキー及びキーの組み合わせを押すことにより活性化又は調整することができる。斯かる遠隔制御器上のキーを押す結果、該遠隔制御器により例えば赤外線のような無線の符号化された信号が送信される。この信号は上記機器において受信され、対応する作用に変換される。例としては、ハイファイセットの音量設定を調整する、及びテレビジョン受像機上のチャンネルを選択する等が挙げられる。このように、命令は当該遠隔制御器上のキーを押すことにより与えられ、該命令は各遠隔制御器により制御される機器により実行される。
【0014】
遠隔制御器には、本発明による装置を有効に備えることができる。この場合、該遠隔制御器によりサポートされる命令の幾つかは、音声入力として与えることができる。これは、同じ命令がサポートされねばならない場合、該遠隔制御器上の所要のキーの数を減少させる。他の例として、本発明による装置により新たな命令がサポートされる場合には、該遠隔制御器はキーの数を増やすことなく多数の命令をサポートすることが可能である。更に、該遠隔制御器の全ての命令が本発明による装置によりサポートされるようにし、かくして、遠隔制御器を全く命令キーを備えないものとすることも可能である。
【0015】
多数の制御されるべき機器を有するシステムは、この制御のために各々の装置を有する。斯様なシステムにおいては、各装置が自身の固有な活性化命令を有しているのが有利である。何故なら、その場合には、単一の装置を作動モードにし、他の装置を待機モードのままとするのが容易であるからである。ユーザは、単に、所望の機器を制御する装置の活性化命令を話し、次いで該機器用の命令を話せばよい。他の機器は、命令の幾つかが目下制御されている機器用のものと同一であっても、応答することはない。何故なら、それらの装置は、斯かる命令を認識及び送信しない待機モードにあるからである。このシステムの上記装置の1以上は1つの総合装置に統合することもできる。この総合装置は、対応する活性化命令が受信及び認識された後、上記装置のうちの当該1つのものの仕事を実行する。
【0016】
上記被制御機器は、種々の種類のものの1つとすることができる。例えば、該機器は、テレビジョン受像機又はコンピュータ上で走るアプリケーション・プログラムのような単一の独立した機器とすることができる。この目的のため、本発明による装置は、異なる実施例を有することができる。該装置は、遠隔制御器のような、単独で動作し、且つ、認識された命令を無線リンクを介して機器に送信するような別体の装置とすることができる。また、該装置は、コンピュータ上で走ると共にアプリケーション・プログラムに対するインターフェースの一部を形成するようなソフトウェアとして実施化することもできる。その場合、該装置は当該被制御アプリケーション・プログラムに対して、命令をソフトウェア・プロトコルにおけるパラメータとして送信し、これにより或るソフトウェア・コンポーネントが他のソフトウェア・コンポーネントを或るパラメータ集合を用いて呼び出すようにする。更に、該装置は上記被制御機器に、例えば専用ハードウェア・ユニットとして、統合することができ、かくして、単一の物理的機器を形成する。その場合には、命令のはっきりした送信は存在せず、該装置は上記被制御機器を直接制御することができる。
【0017】
本発明の他の目的は、冒頭で述べたような方法であって、既知の方法よりもユーザが一層使い易い方法を提供することにある。本発明によれば、この目的は、前記活性化ステップが、音声入力を受信し、受信された前記入力を解析して活性化命令を認識し、前記活性化命令を認識すると前記命令の前記認識及び送信を可能にする、ような各副ステップを有していることを特徴とする方法において達成される。
【図面の簡単な説明】
【0018】
【図1】図1は、本発明による装置の最も重要な構成要素を概念的に示す。
【図2】図2は、本発明の装置の一実施例における主要なステップを伴うフローチャートを示す。
【図3A】図3Aは、本発明による遠隔制御器の平面図を示す。
【図3B】図3Bは、本発明による上記遠隔制御器の開放側面図を示す。
【図4】図4は、本発明による複数の装置を備えるシステムを示す。
【発明を実施するための形態】
【0019】
以下、本発明及びその作用効果を実施例に基づき添付図面を参照して更に解説する。
【0020】
図1は、本発明による装置の最も重要な構成要素を概念的に示している。該装置100は、音声入力を用いて機器101を遠隔制御しようとするものである。該装置は、フィリップス社製のパームPC、ニノ(Nino)上で実施化される。該パームPCは、ウィンドウズ(登録商標)CE・オペレーティング・システムを動作させる小さな物理的寸法のコンピュータであるので、手に容易に保持することができる。しかしながら、該装置は他の好適な型式のコンピュータ上でも実施化することができる。該装置は、ワーキング・メモリ104にロードされたプログラム命令を実行するプロセッサ102を有している。また、該装置は周辺機器と通信するためのインターフェース106も有している。更に、該装置は種々の構成要素間で命令及びデータを交換するためのバス108を有している。該装置に取り付けられるものとしては、該装置のユーザから音声を受信するためのマイクロフォン110及びユーザに対して可聴信号を発生するスピーカ112がある。更に、該装置は、該装置により制御される機器101に対して赤外線信号の形で命令を送信する送信機114を有している。
【0021】
該装置の種々のタスクは、当該装置の上記ワーキング・メモリにロードされるプログラム・モジュールにより実行される。マイクロフォン110により捕捉された音声入力を受信する受信モジュール116が設けられている。該音声入力は、或る単語及び句を認識するために解析モジュール118において解析される。該装置の待機モードにおいては、上記解析モジュールは音声入力における"Nino"なる単語を認識しようと試みる。この単語は当該装置の活性化命令であり、音声入力中で該単語が認識されたら、該装置は活性化ユニット120により作動モードに切り換えられる。該作動モードにおいては、前記解析モジュールは、機器101を制御するために使用される所定の命令集合からの命令を認識しようと試みる。命令が認識された場合、送信モジュール122は、該命令が送信機114により赤外線信号として送出されるよう準備する。更に、該装置は、前記活性化命令の認識後又は或る命令の認識後に経過した時間を測定するタイマ・モジュール124を有している。斯かる認識から所定の期間以上に経過したら、該装置は上記作動モードから待機モードに戻る。他の例として、該装置は特別な待機命令を用いて作動モードから待機モードに切り換えられることもできる。その場合には、作動モードにおいて認識される前記命令集合は該待機命令を含み、該待機命令は音声入力において認識されると機器101には送信されず、当該装置が待機モードになるようにする。従って、この代替え例では、ユーザははっきりと待機モードに切り換えることができる。
【0022】
音声認識を処理する上記モジュールは、Vocomなる音声認識ソフトウェア・パッケージに基づいて実施化されている。装置100は、上記機器に対して意図しない命令を伝送する可能性を減らすために、待機モード及び作動モードを有している。当該装置が作動モードのみしか有していないとしたら、命令が進行中の会話中で誤って認識されてしまう可能性が存在することになる。このように認識された命令は機器101に送信され、該機器により実行されてしまうであろう。上記待機モードにおいては、当該装置は前記活性化命令の認識に関してのみ感知的であり、他の話し命令には応答しないであろう。この構成は、意図しない命令の認識及び実行の危険性を低減する。意図しない命令の認識により発生するエラーは挿入エラーとしても知られている。何故なら、命令が誤って挿入されたかのように見えるからである。
【0023】
本発明による装置の一実施例は、ユーザにモード又はモードの変更に関して通知する可聴信号を生成する通知モジュール126を有している。当該装置が作動モードに切り換えられた場合、該通知モジュールは"それで?(Yes?)"なる句である開始信号を生成する。この句はスピーカ112により再生される。該開始信号は、上記機器を制御する目的の音声入力における命令に対して該装置が感知的となる注目期間の開始を示す。何の命令も認識されない場合、上記注目期間より短い所定の期間後に、上記通知モジュールは注意信号を生成してユーザに注目期間の経過を通知する。該注意信号は、"それで?(Well?)"なる句として実施化され、当該装置が依然として音声入力における命令を待つ作動モードにあることをユーザに対して示す。該注目期間の全期間の間に何の命令も認識されない場合は、上記通知モジュールは終了信号を生成して、当該装置が待機モードに戻ったことを示す。該終了信号は、聴者から興味を失ったことをまねた、あくびのような音として実施化される。上記の代わりとして、上記注目期間の活性は、該注目期間の間に邪魔にならない音を発生させることにより聴覚的に示すことも可能である。その場合には、該注目期間の過程は発生される音の変化により示すことができる。この場合、上記の発生される音は、該注目期間の進行と調和させて変化される。例えば、該音の周波数が、該注目期間がその終了に向かって進むにつれて益々高くなる。
【0024】
図2は、本発明の装置の一実施例における主要なステップを伴うフローチャートを示している。ステップ202においては音声入力が解析され、ステップ204においては該入力において"Nino"なる活性化命令が認識されたかが判断される。そうでない場合は、制御はステップ202に戻され、更なる音声入力を解析する。ステップ204において活性化命令が認識された場合は、ステップ205において前記開始信号が付与され、ステップ206において該装置の注目期間が開始される。この場合、該装置はステップ208において音声入力における命令を受信及び認識して前記機器を制御すべく活動状態になる。ステップ210において命令が認識されると、この命令はステップ212において上記被制御機器に送信される。該装置は音声入力における命令の更なる受信のために作動モードに留まるので、ステップ206において新たな注目期間が開始される。ステップ210において何の命令も認識されないと判断されると(これは、何の命令も全く与えられないという事実によっても生じ得る)、ステップ214において当該注目期間の第1部分が既に経過したかが判断される。該第1期間が経過していた場合は、ステップ216において注意信号が付与されると共に、制御がステップ208に渡され、当該注目期間の残部に関して音声入力を解析する。依然として何の命令も認識されず、且つ、上記注意信号が付与された場合は、ステップ218において当該注目期間の全てが経過したかが判断される。そうでない場合は、制御はステップ208に戻され、更なる音声入力を解析する。しかしながら、該注目期間が経過した場合は、ステップ220において前記終了信号が付与され、当該装置は待機モードに切り換えられる。更に、実行はステップ202で継続され、音声入力において前記活性化命令が再び付与されたかが解析される。
【0025】
図3Aは本発明による遠隔制御器の平面図を示し、図3Bは本発明による該遠隔制御器の開放側面図を示している。該遠隔制御器は図1に関連して説明した装置100を有している。該遠隔制御器は、更に、音声入力を受信するためのマイクロフォン110を有すると共に、ユーザに対して信号を再生するためのスピーカ112を有することができる。ユーザにより話され且つ装置100により認識された命令は、赤外線信号302として被制御機器に送信される。該遠隔制御器は該被制御機器を制御するための多数の命令キー304を有することができる。その場合、一つのキーは、話し命令としても付与することができる命令に対応するか、又は当該キーを押すことにより専ら付与することが可能な命令に対応させることができる。本発明による遠隔制御器の一実施例においては、該遠隔制御器によりサポートされる全ての命令は音声入力において該装置100により認識することができる。斯かる実施例においては、上記遠隔制御器上には命令キーは必要とされない。
【0026】
図4は、本発明による多数の装置を備えるシステムを示している。これら装置の各々は、当該システムにおける各機器を制御するためのものである。装置402は機器404を制御し、装置406は機器408を制御し、装置410は機器412を制御する。前記制御命令は当該遠隔制御器により赤外線信号として送出され、これにより各装置は自身の被制御機器に対して特別に符号化された信号を使用する。この固有の符号化により、装置402により送信された赤外線信号414は機器404に対してのみ効果を有するが、該信号は上記機器の各々に到達し得る。本発明によれば、上記装置の各々は、特定の装置を待機モードから作動モードに切り換えるための、例えば装置402に対して符号416で示されるように、自身の固有の活性化命令を有している。ユーザは所望の機器を制御する装置の活性化命令を話すことができ、該装置は作動モードに切り替わる。ユーザにより話される後続の命令は、当該装置によってのみ認識され、この装置により該装置に関連する機器を制御するために送信される。他の装置は待機モードに留まり、如何なる命令も送信することはないであろう。従って、1以上の命令が異なる機器に対して同一であっても、当該機器の制御に問題が生じることはない。何故なら、1個のみの装置を作動モードに切り換える可能性が遥かに高いからである。
【0027】
他の例としては、装置402、406及び410を1つの制御装置に合成するものがある。この場合、これはバスを介して各被制御機器に接続され、特定の機器の固有の活性化命令が認識された場合に該機器をアドレス指定する。
【0028】
他の実施例においては、本発明の装置は表示器を備える。これは、被制御機器の表示器とすることもできる。この実施例においては、上記注目期間の開始が当該表示器上にアイコンの形で示される。他の例として、アイコンは当該装置を表すために使用することができ、該装置が待機モードから作動モードに切り替わる際に該アイコンは形を変化させる。この場合、該アイコンは作動モードにおいて或る命令が認識されたことを示すために使用することもできる。例えば、該事例がアニメーション化された人の場合、命令が正しく認識された場合、該人が頷くようにすることができる。この場合、上記注目期間の進行は、当該アイコンの大きさを変化させることにより示すことができ、かくして、該アイコンは上記注目期間の間に時間の経過に関連して縮む。
【符号の説明】
【0029】
100…装置
101…機器
102…プロセッサ
110…マイクロフォン
112…スピーカ
114…送信機
116…受信モジュール
118…解析モジュール
120…活性化ユニット
122…送信モジュール
124…タイマ・モジュール
126…通知モジュール

【特許請求の範囲】
【請求項1】
機器を制御する装置であって、
・音声入力を受信する受信ユニットと、
・当該受信された入力を解析して命令を認識する解析ユニットと、
・当該装置を、当該装置が前記機器の実際の制御のために作動していない待機モードから、当該装置が前記機器の実際の制御のために作動する作動モードへ切り換える活性化ユニットと、
を有する装置であって、
前記活性化ユニットは、音声入力を受信し、この受信された音声入力を解析して活性化命令を認識し、さらに前記活性化命令を認識すると当該装置を前記待機モードから前記作動モードに切り換えるように構成されている装置。
【請求項2】
請求項1に記載の装置であって、該装置は、前記作動モードにおいて所定の注目期間の間に何れかの命令が認識されるかを判定するように構成されると共に、前記注目期間の間に何の命令も認識されなかった場合は前記作動モードを離脱して前記待機モードに入るように構成されていることを特徴とする装置。
【請求項3】
請求項1に記載の装置であって、該装置は、前記作動モードに入る際に、当該装置が前記作動モードに留まる注目期間の開始を示す可聴開始信号を生成するように構成されていることを特徴とする装置。
【請求項4】
請求項3に記載の装置であって、該装置は、前記作動モードにおいて所定の他の期間の間に何れかの命令が認識されるかを判定するように構成されると共に、該所定の他の期間の間に何の命令も認識されなかった場合に、当該装置が前記作動モードに留まる前記注目期間の進行を示す可聴注意信号を生成するように構成されていることを特徴とする装置。
【請求項5】
請求項3に記載の装置であって、該装置は、前記作動モードにおいて所定の期間の間に何れかの命令が認識されるかを判定するよう構成されると共に、前記所定の期間の間に何の命令も認識されなかった場合に前記作動モードを離脱して前記待機モードに入ると共に、この場合に、前記注目期間の終了を示す可聴終了信号を生成するように構成されていることを特徴とする装置。
【請求項6】
請求項1に記載の装置であって、該装置は、前記作動モードへ入った後に、注目期間を示す繰り返し可聴音を生成するように構成されていることを特徴とする装置。
【請求項7】
請求項1ないし6の何れか一項に記載の装置を有する機器。
【請求項8】
請求項1ないし6の何れか一項に記載の装置を有する遠隔制御器。
【請求項9】
請求項1に記載の装置を複数有し、各装置は対応する機器を制御し、各装置は自身の固有の活性化命令を認識するように構成されていることを特徴とするシステム。
【請求項10】
機器を制御する方法であって、
・音声入力を受信する受信ステップと、
・当該受信された入力を解析して命令を認識する解析ステップと、
・前記命令の前記認識と送信とを可能にする活性化ステップと、
を有する方法であって、
前記活性化ステップは、
・音声入力を受信する副ステップと、
・当該受信された入力を解析して、活性化命令を認識する副ステップと、
・前記活性化命令を認識すると、前記命令の当該認識及び送信を可能にする副ステップと、
を有していることを特徴とする方法。

【図1】
image rotate

【図2】
image rotate

【図3A】
image rotate

【図3B】
image rotate

【図4】
image rotate


【公開番号】特開2011−176879(P2011−176879A)
【公開日】平成23年9月8日(2011.9.8)
【国際特許分類】
【外国語出願】
【出願番号】特願2011−115310(P2011−115310)
【出願日】平成23年5月24日(2011.5.24)
【分割の表示】特願2000−592724(P2000−592724)の分割
【原出願日】平成11年9月3日(1999.9.3)
【出願人】(590000248)コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ (12,071)
【Fターム(参考)】