説明

音声認識操作装置及び音声認識操作方法

【課題】周囲の雑音に影響されることなくユーザの音声指示を正確に認識することができ、ひいては被制御機器をユーザの所望する通りに正しく制御することを可能とした音声認識操作装置及び音声認識操作方法を提供すること。
【解決手段】実施の形態によれば、音声認識操作装置は、音検出手段とキーワード検出手段と音声ミュート手段と送信手段とを備える。音検出手段は、音を検出する。キーワード検出手段は、音検出手段で音が検出された場合、特定のキーワードを音声認識により検出する。音声ミュート手段は、キーワード検出手段でキーワードが検出された場合、音声ミュートを指示する操作信号を送信する。送信手段は、キーワード検出手段でキーワードが検出された後の音声指示を認識し、当該音声指示に対応する操作信号を送信する。

【発明の詳細な説明】
【技術分野】
【0001】
この発明の実施の形態は、音声指示を認識して被制御機器を操作する音声認識操作装置及び音声認識操作方法に関する。
【背景技術】
【0002】
周知のように、近年では、ユーザのキー操作に対応した操作信号を送信して、被制御機器を遠隔操作する従前のリモートコントローラに代わり、ユーザの音声指示を認識し、その音声指示に対応した操作信号を送信して被制御機器を遠隔操作する、音声認識機能を備えた遠隔操作機器が開発されてきている。
【0003】
ところで、このような音声認識機能を備えた遠隔操作機器は、従前のリモートコントローラのように多数のキーの中から所望のキーを選択して操作するといった煩雑な作業が不要となる反面、周囲の雑音を認識して誤動作することがあるという不都合な面も持ち合わせており、実用化に向けて種々の点で改良の余地が多々残されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2000−148682号公報
【特許文献2】特開2006−320004号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
周囲の雑音に影響されることなくユーザの音声指示を正確に認識することができ、ひいては被制御機器をユーザの所望する通りに正しく制御することを可能とした音声認識操作装置及び音声認識操作方法を提供することを目的とする。
【課題を解決するための手段】
【0006】
実施の形態によれば、音声認識操作装置は、音検出手段とキーワード検出手段と音声ミュート手段と送信手段とを備える。音検出手段は、音を検出する。キーワード検出手段は、音検出手段で音が検出された場合、特定のキーワードを音声認識により検出する。音声ミュート手段は、キーワード検出手段でキーワードが検出された場合、音声ミュートを指示する操作信号を送信する。送信手段は、キーワード検出手段でキーワードが検出された後の音声指示を認識し、当該音声指示に対応する操作信号を送信する。
【図面の簡単な説明】
【0007】
【図1】実施の形態における音声認識遠隔操作システムの一例を説明するために示す図。
【図2】同実施の形態における音声認識遠隔操作システムを構成する遠隔操作機器を説明するために示す外観図。
【図3】同実施の形態における遠隔操作機器の信号処理系の一例を説明するために示すブロック構成図。
【図4】同実施の形態における音声認識遠隔操作システムを構成するデジタルテレビジョン放送受信装置の信号処理系の一例を説明するために示すブロック構成図。
【図5】同実施の形態における遠隔操作機器が行なう主要な処理動作の一例を説明するために示すフローチャート。
【発明を実施するための形態】
【0008】
以下、実施の形態について図面を参照して詳細に説明する。図1は、この実施の形態で説明する音声認識遠隔操作システムの一例を示している。この音声認識遠隔操作システムは、ユーザUSが、音声認識機能を備えた遠隔操作機器11を用いて、被制御機器としてのデジタルテレビジョン放送受信装置12を制御する構成となっている。
【0009】
すなわち、ユーザUSが音声指示を発生すると、その音声指示を遠隔操作機器11が認識する。そして、遠隔操作機器11は、認識した音声指示に対応する操作信号を生成し、例えば赤外線や電波等を伝送媒体としてデジタルテレビジョン放送受信装置12に無線送信する。
【0010】
このため、デジタルテレビジョン放送受信装置12では、遠隔操作機器11が送信する操作信号を受信し、その操作内容に対応した状態に各部を制御する。これにより、ユーザUSの音声指示によって、被制御機器であるデジタルテレビジョン放送受信装置12を遠隔操作することができるようになる。
【0011】
ここで、上記遠隔操作機器11は、ユーザUSの発生する音声指示の認識を行なう以前の状態として、拍手検出モードに設定されている。この拍手検出モードでは、遠隔操作機器11は、ユーザUSが予め設定された回数(例えば2回)以上の拍手を連続的に行なったことを音声認識により検出している。
【0012】
そして、拍手検出モードに設定された状態において、予め設定された回数以上の連続的な拍手音を検出すると、遠隔操作機器11は、キーワード検出モードに設定される。このキーワード検出モードでは、遠隔操作機器11は、予め設定された特定のキーワード(例えば「テレビ」等)のみを対象とした音声認識を行なっており、ユーザUSが特定のキーワードを言ったことを音声認識により検出している。
【0013】
このように、キーワード検出モードに設定された状態において、特定のキーワードを検出すると、遠隔操作機器11は、デジタルテレビジョン放送受信装置12に対して、その音声をミュート状態にすることを指示する操作信号を送信する。その後、遠隔操作機器11は、ユーザUSからのデジタルテレビジョン放送受信装置12に対する各種の音声指示を認識する音声指示認識モードに設定される。
【0014】
そして、この音声指示認識モードに設定された状態において、ユーザUSが音声指示を発生すると、遠隔操作機器11は、ユーザUSの発生する音声指示を認識し、認識した音声指示に対応する操作信号を生成してデジタルテレビジョン放送受信装置12に無線送信する。これにより、デジタルテレビジョン放送受信装置12が、ユーザUSの音声指示により遠隔操作されることになる。
【0015】
このようにして、ユーザUSの発生する音声指示を認識し、認識した音声指示に対応する操作信号を生成してデジタルテレビジョン放送受信装置12に無線送信すると、遠隔操作機器11は、再び拍手検出モードに設定されて、ユーザUSによる次の拍手を検出すべく待機状態となる。
【0016】
上記した遠隔操作機器11では、ユーザUSが予め設定された回数以上の連続的な拍手を行ない、続いて、ユーザUSが予め設定された特定のキーワードを言った状態で、始めて、デジタルテレビジョン放送受信装置12に対するユーザUSの音声指示を認識するようにしている。このため、周囲の雑音に影響されることなくユーザUSの音声指示を極力正確に認識することができるようになり、ひいてはデジタルテレビジョン放送受信装置12をユーザUSの所望する通りに正しく制御することが可能となる。
【0017】
また、上記した遠隔操作機器11では、予め設定された回数以上の連続的な拍手音を検出し、続いて、予め設定された特定のキーワードを検出した状態で、デジタルテレビジョン放送受信装置12の音声をミュート状態にするようにしている。このため、ユーザUSの発生する音声指示を、デジタルテレビジョン放送受信装置12の発生する音声に妨害されることなく、正確に認識することができるようになる。
【0018】
なお、デジタルテレビジョン放送受信装置12の音声をミュート状態にする際には、音声を完全に消音状態、つまり、100%ミュート状態にするだけでなく、必要に応じて、例えば音量を現在の音量の半分にする、いわゆる、50%ミュート状態にすることも可能である。つまり、音声ミュートとは、音量を現在の音量よりも低くするという意味を含むものとする。
【0019】
また、ユーザUSの発生する音声指示が認識され、その音声指示に対応して送信された操作信号に基づいて、デジタルテレビジョン放送受信装置12が新たな状態に制御されたときには、デジタルテレビジョン放送受信装置12は、その音声ミュート状態を自動的に解除するようになっている。
【0020】
ただし、デジタルテレビジョン放送受信装置12が音声ミュート状態を自動的に解除する機能を持っていない場合には、遠隔操作機器11が、デジタルテレビジョン放送受信装置12に対して、音声ミュート状態を解除することを指示する操作信号を送信する必要がある。
【0021】
この場合、遠隔操作機器11としては、2通りの動作を取り得る。1つ目は、ユーザUSの音声指示を認識したとき、音声ミュートを解除する操作信号を送信し、音声指示に対応した操作信号を送信し、拍手検出モードに移行する動作である。2つ目は、ユーザUSの音声指示を認識したとき、音声指示に対応した操作信号を送信し、音声ミュートを解除する操作信号を送信し、拍手検出モードに移行する動作である。
【0022】
なお、音声ミュートを解除する操作信号を送信する処理と、音声指示に対応した操作信号を送信する処理とは、時間的にほぼ同時に行なうことが可能であり、また、これらの2つの処理は、拍手検出モードに移行する前または後のいずれの時点で行なわれても良いものである。
【0023】
さらに、上記した遠隔操作機器11では、拍手検出モードにおいて、例えばボールのバウンド音やドアのノック音等を拍手音と誤認識したとしても、その後のキーワード検出モードで特定のキーワードが検出されない限り、音声指示認識モードにならないので、誤操作の発生を極力防止することができる。
【0024】
また、予め設定された回数以上の連続的な拍手音が検出されたという条件の元に、特定のキーワードを検出するようにしているので、特定のキーワードとしても特別に変わったフレーズ(例えば日常的に用いられない言葉等)を用いる必要は必ずしもなく、例えば「テレビ」等の日常的に使用され易い簡単な言葉でも誤操作防止効果が期待できるため、ユーザUSが言い易いキーワードを設定することができるという利点もある。
【0025】
図2(a)は、上記遠隔操作機器11の外観を示している。この遠隔操作機器11は、ほぼ薄型の円柱形状に形成された2つの筐体13,14を、同心円状に重ね合わせるように構成されている。この遠隔操作機器11は、その一方の筐体14の底面に複数(図では2つしか見えない)の脚部14aが突設されており、例えばテーブル等の水平台上に載置して使用される。
【0026】
また、この筐体14には、その側面にマイクロホン15が設置されている。さらに、他方の筐体13には、その側面に一対の赤外線LED(light emitting diode)16a,16bが設置されている。そして、この遠隔操作機器11は、マイクロホン15で拍手、キーワード及び音声指示等の音声情報を採集し、一対の赤外線LED16a,16bから操作情報を無線送信している。
【0027】
さらに、この遠隔操作機器11は、2つの筐体13,14が、その軸心を中心として相互に回動自在となるように構成されている。すなわち、筐体14に対して、図2(b)に示すように筐体13を右方向に回動させることや、図2(c)に示すように筐体13を左方向に回動させることができる。
【0028】
これにより、遠隔操作機器11は、マイクロホン15をユーザUSのいる方向に向け、一対の赤外線LED16a,16bデジタルテレビジョン放送受信装置12のある方向に向けるというように、それぞれの位置に合わせて細かい調整を行なうことが可能となっている。
【0029】
図3は、上記遠隔操作機器11の信号処理系の一例を示している。すなわち、上記マイクロホン15で採集された音声情報は、音声信号として音声認識用LSI(large scale integration)17に供給される。この音声認識用LSI17は、入力された音声信号をA/D(analog/digital)変換部18でデジタル化し、音声認識処理部19に供給する。
【0030】
この音声認識処理部19は、入力されたデジタルの音声信号を音声認識し、入力音声信号がユーザUSの発生した音声指示である場合、その音声指示に対応した操作信号を出力する。そして、この音声認識処理部19から出力された操作信号は、上記した一対の赤外線LED16a,16bで構成される赤外線発光部16により赤外線を伝送媒体として送信され、デジタルテレビジョン放送受信装置12に受信されることになる。
【0031】
この場合、音声認識処理部19は、メモリ部20を利用している。すなわち、このメモリ部20には、デジタルテレビジョン放送受信装置12に対する各種の音声指示と、それらの音声指示に対する符号化された操作コードとを対応させた音声指示操作コード対応テーブルが格納されている。
【0032】
そして、音声認識処理部19は、入力されたデジタルの音声信号を音声認識した結果、入力音声信号がユーザUSの発生した音声指示であると判断した場合、その音声指示に対応した操作コードを音声指示操作コード対応テーブルから検索し、検索した操作コードを操作信号として赤外線発光部16に出力する。
【0033】
また、この音声認識処理部19は、拍手検出部21a、キーワード検出部21b及び音声ミュート処理部21cを含んでいる。このうち、拍手検出部21aは、予め設定された回数以上の連続的な拍手が行なわれたことを検出するものである。この場合、拍手は音のインパルスとして捉えられ、拍手検出部21aは、そのインパルスの発生回数を検出する動作を行なえればよいため、構成が簡易で電力消費量も僅かな回路で実現することができる。
【0034】
このため、上記遠隔操作機器11は、ユーザUSの発生する音声指示の認識を行なう以前の拍手検出モードでは、主としてA/D変換部18及び拍手検出部21aに電源電力を供給し、拍手検出部21a以外の音声認識処理部19には電源電力を供給せず、電力消費量を低く抑えるようにしている。
【0035】
すなわち、拍手検出モードでは、主としてA/D変換部18及び拍手検出部21aが駆動状態となり、拍手検出部21a以外の音声認識処理部19は非駆動(スリープ)状態となっている。このため、遠隔操作機器11が電池の電力で駆動される場合、電池電力の延命を図ることができる。
【0036】
そして、拍手検出部21aは、予め設定された回数以上の連続的な拍手音を検出した場合、音声認識処理部19の全体に電源電力を供給する。すなわち、音声認識処理部19全体が駆動状態となる。これにより、音声認識処理部19は、以後、ユーザUSの発生する特定のキーワードや音声指示等を音声認識することができるようになる。
【0037】
また、上記キーワード検出部21bは、先に述べたキーワード検出モードにおいて、予め設定された特定のキーワードのみを対象とした音声認識を行なっており、ユーザUSがその特定のキーワードを言ったことを音声認識により検出している。
【0038】
さらに、上記音声ミュート処理部21cは、キーワード検出モードで特定のキーワードが検出される場合、デジタルテレビジョン放送受信装置12に対して、その音声をミュート状態にすることを指示する操作信号を送信する。
【0039】
なお、拍手検出部21aとキーワード検出部21bとは、別々に構成しても良いが、1つの音声検出部の中に、拍手検出機能とキーワード検出機能とが共に含まれる構成とするようにしても良いものである。
【0040】
また、音声認識処理部19には、操作部22が接続されている。この操作部22は、電源スイッチや、ユーザUSが遠隔操作機器11に対して各種の設定等を行なうための複数の操作子を含んでいる。そして、音声認識処理部19は、操作部22から得られた操作信号に基づいて、その操作内容が反映されるように各部を制御している。
【0041】
さらに、上記音声認識処理部19には、音声発生部23が接続されている。このため、音声認識処理部19は、遠隔操作機器11の動作状態、設定状態、または、ユーザUSに対する入力要求、入力確認等を、音声発生部23を用いて音によりユーザUSに通知することができる。
【0042】
また、この音声認識処理部19には、表示部24が接続されている。これにより、音声認識処理部19は、遠隔操作機器11の動作状態、設定状態、または、ユーザUSに対する入力要求、入力確認等を、表示部24を用いて光を点滅させる等の手法によりユーザUSに通知することができる。
【0043】
図4は、被制御機器の一例である上記デジタルテレビジョン放送受信装置12の信号処理系の概略を示している。すなわち、アンテナ25で受信したデジタルテレビジョン放送信号は、入力端子26を介してチューナ部27に供給されることにより、所望のチャンネルの放送信号が選局される。
【0044】
このチューナ部27で選局された放送信号は、復調復号部28に供給されてデジタルの映像信号及び音声信号等に復元された後、信号処理部29に出力される。この信号処理部29は、復調復号部28から供給されたデジタルの映像信号及び音声信号に対してそれぞれ所定のデジタル信号処理を施している。
【0045】
そして、この信号処理部29は、デジタルの映像信号を合成処理部30に出力し、デジタルの音声信号を音声処理部31に出力している。このうち、合成処理部30は、信号処理部29から供給されるデジタルの映像信号に、OSD(on screen display)信号を重畳して映像処理部32に出力している。
【0046】
この映像処理部32は、入力されたデジタルの映像信号を、後段の、例えば液晶表示パネル等を有する平面型の映像表示部33で表示可能なフォーマットに変換している。そして、この映像処理部32から出力された映像信号が、映像表示部33に供給されて映像表示に供される。
【0047】
また、上記音声処理部31は、入力されたデジタルの音声信号を、後段のスピーカ34で再生可能なフォーマットのアナログ音声信号に変換している。そして、この音声処理部31から出力されたアナログ音声信号が、スピーカ34に供給されることにより音声再生に供される。
【0048】
ここで、このデジタルテレビジョン放送受信装置12は、上記した各種の受信動作を含むその全ての動作を制御部35によって統括的に制御されている。この制御部35は、CPU(central processing unit)35aを内蔵しており、デジタルテレビジョン放送受信装置12の本体に設置された操作部36からの操作信号を受けて、または、上記遠隔操作機器11から送出され受信部37で受信した操作信号を受けて、その操作内容が反映されるように各部をそれぞれ制御している。
【0049】
この場合、制御部35は、メモリ部35bを利用している。このメモリ部35bは、主として、CPU35aが実行する制御プログラムを格納したROM(read only memory)と、該CPU35aに作業エリアを提供するためのRAM(random access memory)と、各種の設定情報及び制御情報等が格納される不揮発性メモリとを有している。
【0050】
また、この制御部35には、HDD(hard disk drive)38が接続されている。この制御部35は、ユーザによる操作部36や遠隔操作機器11等の操作に基づいて、上記復調復号部28から得られるデジタルの映像信号及び音声信号を、記録再生処理部39によって暗号化し所定の記録フォーマットに変換した後、HDD38に供給してハードディスク38aに記録させるように制御することができる。
【0051】
さらに、この制御部35は、ユーザによる操作部36や遠隔操作機器11等の操作に基づいて、HDD38によりハードディスク38aからデジタルの映像信号及び音声信号を読み出させ、上記記録再生処理部39によって復号化した後、信号処理部29に供給することによって、以後、上記した映像表示及び音声再生に供させるように制御することができる。
【0052】
また、上記デジタルテレビジョン放送受信装置12には、入力端子40が接続されている。この入力端子40は、デジタルテレビジョン放送受信装置12の外部からデジタルの映像信号及び音声信号を直接入力するためのものである。この入力端子40を介して入力されたデジタルの映像信号及び音声信号は、ユーザによる操作部36や遠隔操作機器11等の操作に対応した制御部35の制御に基づいて、記録再生処理部39を介した後、信号処理部29に供給されて、以後、上記した映像表示及び音声再生に供される。
【0053】
さらに、この入力端子40を介して入力されたデジタルの映像信号及び音声信号は、ユーザによる操作部36や遠隔操作機器11等の操作に対応した制御部35の制御に基づいて、記録再生処理部39を介した後、HDD38によるハードディスク38aに対しての記録再生に供される。
【0054】
また、上記制御部35は、ネットワークインターフェース41を介して外部のネットワーク42に接続されている。このため、制御部35は、ユーザによる操作部36や遠隔操作機器11等の操作に基づいて、ネットワーク42上の複数のネットワークサーバ431〜43nに選択的にアクセスすることにより、そこで提供している各種のサービスを利用することができるようになっている。
【0055】
図5は、上記遠隔操作機器11が行なう主要な処理動作の一例をまとめたフローチャートを示している。この処理動作は、遠隔操作機器11が拍手検出モード、つまり、主としてA/D変換部18及び拍手検出部21aが駆動状態となり、拍手検出部21a以外の音声認識処理部19が非駆動(スリープ)状態となっている設定で開始(ステップS1)される。
【0056】
すると、遠隔操作機器11は、ステップS2で、拍手検出部21aにより予め設定された回数以上の連続的な拍手音が検出されたか否かを判別し、検出されたと判断された場合(YES)、ステップS3で、音声認識処理部19の全体に電源電力を供給して、音声認識処理部19全体を駆動状態とする。
【0057】
その後、遠隔操作機器11は、ステップS4で、拍手検出モードから特定のキーワードのみを対象として音声認識を行なうキーワード検出モードに切り替えられ、ステップS5で、特定のキーワードが入力されるのを待つ、いわゆる、キーワード待ち状態であることをユーザUSに通知する。
【0058】
このキーワード待ち状態をユーザUSに通知する手段としては、音声発生部23により「ピ、ピ、ピ」といったアラーム音を発生させる手法や、音声発生部23に「キーワード待ちです」のような音声によるメッセージを発生させる手法等を用いることができる。また、表示部24により光を点滅させる手法や、表示部24に「キーワード待ちです」のような文字によるメッセージを表示させる手法等を用いることができる。
【0059】
さらに、キーワード待ち状態をユーザUSに通知する手段としては、遠隔操作機器11がデジタルテレビジョン放送受信装置12に対して、そのスピーカ34からアラーム音や音声によるメッセージを発生させる操作信号を送信する手法も考えられる。また、遠隔操作機器11がデジタルテレビジョン放送受信装置12に対して、その映像表示部33に文字によるメッセージを表示させる操作信号を送信する手法も考えられる。
【0060】
このように、遠隔操作機器11が自己の音声発生部23や表示部24等を用いてキーワード待ち状態であることを通知するようにしても良いし、被制御機器(この場合、デジタルテレビジョン放送受信装置12)の映像表示部33やスピーカ34等を用いてキーワード待ち状態であることを通知するようにしても良いものである。
【0061】
そして、遠隔操作機器11は、ステップS6で、特定のキーワードが検出されたか否かを判別し、検出されたと判断された場合(YES)、ステップS7で、デジタルテレビジョン放送受信装置12に対して音声をミュート状態にさせる操作信号を送信し、ステップS8で、音声指示が入力されるのを待つ状態となる。
【0062】
その後、遠隔操作機器11は、ステップS9で、音声指示が検出されたか否かを判別し、検出されたと判断された場合(YES)、ステップS10で、その検出された音声指示に対応した操作信号を送信し、ステップS11で、拍手検出モード、つまり、主としてA/D変換部18及び拍手検出部21aが駆動状態で、拍手検出部21a以外の音声認識処理部19が非駆動(スリープ)状態になっているモードに設定し、処理を終了(ステップS12)する。
【0063】
なお、予め設定された回数以上の連続的な拍手音が検出された時点から、予め設定された所定時間内に特定のキーワードが検出されなかった場合、または、特定のキーワードが検出された時点から、予め設定された所定時間内にユーザUSの音声指示が検出されなかった場合には、自動的に拍手検出モードに戻るようにしている。これにより、無駄な電力消費を抑えることができる。
【0064】
次に、上記した遠隔操作機器11を用いてデジタルテレビジョン放送受信装置12を操作する一使用形態について説明する。すなわち、デジタルテレビジョン放送受信装置12によってデジタルテレビジョン放送番組を視聴する際、ユーザUSが、視聴可能な複数のチャンネルを頻繁に切り替えて視聴する、いわゆる、ザッピングと称される行為をよく行なうことが知られている。
【0065】
そして、上記した遠隔操作機器11を用いてザッピングを行なう場合には、ユーザUSは、例えば「ザッピング・アップ」なる音声指示を発する。すると、遠隔操作機器11は、視聴可能な複数のチャンネルを選局するための操作信号を、そのチャンネル番号の最小チャンネルから最大チャンネルに向けて、数秒毎に順次自動的に送信する。これにより、視聴可能な複数のチャンネルの放送番組を、チャンネル番号の最小チャンネルから最大チャンネルに向けて、数秒毎に切り替えて順次視聴することができる。
【0066】
また、ユーザUSが例えば「ザッピング・アップ」なる音声指示を発した場合、遠隔操作機器11は、視聴可能な複数のチャンネルを選局するための操作信号を、現在選択しているチャンネルからチャンネル番号の最大チャンネルに向けて、数秒毎に順次自動的に送信するようにすることも可能である。これにより、視聴可能な複数のチャンネルの放送番組を、現在選択しているチャンネルからチャンネル番号の最大チャンネルに向けて、数秒毎に切り替えて順次視聴することができる。
【0067】
逆に、ユーザUSが「ザッピング・ダウン」なる音声指示を発したときには、遠隔操作機器11は、視聴可能な複数のチャンネルを選局するための操作信号を、そのチャンネル番号の最大チャンネルから最小チャンネルに向けて、数秒毎に順次自動的に送信する。これにより、視聴可能な複数のチャンネルの放送番組を、チャンネル番号の最大チャンネルから最小チャンネルに向けて、数秒毎に切り替えて順次視聴することができる。
【0068】
また、ユーザUSが例えば「ザッピング・ダウン」なる音声指示を発した場合、遠隔操作機器11は、視聴可能な複数のチャンネルを選局するための操作信号を、現在選択しているチャンネルからチャンネル番号の最小チャンネルに向けて、数秒毎に順次自動的に送信するようにすることも可能である。これにより、視聴可能な複数のチャンネルの放送番組を、現在選択しているチャンネルからチャンネル番号の最小チャンネルに向けて、数秒毎に切り替えて順次視聴することができる。
【0069】
このようにして、数秒毎に自動的にチャンネルの切り替えを行なっている状態で、ユーザUSが例えば「ストップ」または「このチャンネル」といった音声指示を発した場合には、遠隔操作機器11は、その音声指示以降、自動的にチャンネルを切り替える処理を停止する。これにより、ユーザUSは、音声指示により指定したチャンネルの放送番組を連続して視聴することができるようになる。
【0070】
また、数秒毎に自動的にチャンネルの切り替えを行なっている状態で、ユーザUSが例えば「ネクスト」なる音声指示を発した場合には、遠隔操作機器11は、現在表示されている番組の放送チャンネルを、数秒間待つことなく、次のチャンネルに切り替えるための操作信号を直ちに送信する。
【0071】
さらに、数秒毎に自動的にチャンネルの切り替えを行なっている状態で、ユーザUSが例えば「もう少し」または「延長」といった音声指示を発した場合には、遠隔操作機器11は、現在表示されている番組の放送チャンネルを数秒間で切り替えず、さらに数秒間待ってから、次のチャンネルに切り替えるための操作信号を送信する。
【0072】
また、数秒毎に自動的にチャンネルの切り替えを行なっている状態で、ユーザUSが例えば「次、次、次」のように音声指示を連続して発した場合には、遠隔操作機器11は、チャンネルを次のチャンネルに切り替えるための操作信号を、音声指示された「次」の回数だけ即座に送信する。これにより、ユーザUSが「次」といった数だけチャンネルを飛ばすことができる。
【0073】
さらに、数秒毎に自動的にチャンネルの切り替えを行なっている状態で、ユーザUSが例えば「速く」なる音声指示を発した場合には、遠隔操作機器11は、次のチャンネルに切り替えるための操作信号を、通常(数秒間)よりも短い間隔(例えば通常の1/2倍の間隔等)で送信し、チャンネルの切り替え間隔を短くすることができる。
【0074】
また、逆に、数秒毎に自動的にチャンネルの切り替えを行なっている状態で、ユーザUSが例えば「遅く」なる音声指示を発した場合には、遠隔操作機器11は、次のチャンネルに切り替えるための操作信号を、通常(数秒間)よりも長い間隔(例えば通常の2倍の間隔等)で送信し、チャンネルの切り替え間隔を長くすることができる。
【0075】
ここで、遠隔操作機器11は、ユーザUSの音声指示により、数秒毎に自動的にチャンネルを切り替える処理を開始する際に、これからザッピングを開始することを、デジタルテレビジョン放送受信装置12に操作信号で通知する。このようにすれば、デジタルテレビジョン放送受信装置12の画面に「ザッピング中」というメッセージを表示させたり、デジタルテレビジョン放送受信装置12の図示しないインジケータ(LED等)を点灯または点滅させたりすることができる。これにより、ユーザUSは、遠隔操作機器11がザッピングの自動処理を現在実施していることを、視覚的に知ることができる。
【0076】
なお、「ザッピング中」であるというメッセージは、デジタルテレビジョン放送受信装置12の画面やインジケータに表示させるだけでなく、遠隔操作機器11の表示部24により光を点滅させる手法や、表示部24に「ザッピング中」のような文字によるメッセージを表示させる手法等を用いることができる。
【0077】
また、数秒毎に自動的にチャンネルの切り替えを行なっている状態で、遠隔操作機器11が、チャンネルの切り替えられた時点から1秒経過する毎に時間情報を、デジタルテレビジョン放送受信装置12に操作信号で通知する。このようにすれば、あと何秒で次のチャンネルに自動的に切り替わるのかを、デジタルテレビジョン放送受信装置12の画面に秒数でカウントダウン表示することができる。
【0078】
なお、次のチャンネルに自動的に切り替わるまでの時間のカウントダウン表示は、デジタルテレビジョン放送受信装置12の画面に表示させるだけでなく、スピーカ34からアラーム音によってユーザUSに通知するようにしても良いものである。また、遠隔操作機器11の音声発生部23によりアラーム音でユーザUSに通知することもできる。
【0079】
ここで、ザッピングにより数秒毎に自動的にチャンネルを切り替える際、視聴可能な全てのチャンネルをチャンネル切り替えの対象とすることができる。この場合、ユーザUSが「ザッピング・アップ」または「ザッピング・ダウン」なる音声指示を発すると、遠隔操作機器11は、視聴可能な全てのチャンネルを選局するための操作信号を数秒毎に順次自動的に送信し、視聴可能な全てのチャンネルの放送番組を1つ1つ順番に視聴することができる。
【0080】
ところで、視聴可能なチャンネルの数は、数100を越えることがある。この場合、視聴可能な全てのチャンネルを切り替えの対象とすることは現実的でないと思われる。このため、ユーザUSが予めお好みのチャンネルをデジタルテレビジョン放送受信装置12に登録しておき、その登録されたチャンネルだけをザッピング時に切り替える対象とすることが考えられている。
【0081】
この場合、ユーザUSは、例えば「お好み・アップ」または「お好み・ダウン」といった音声指示を発する。すると、遠隔操作機器11は、お好みチャンネル・アップまたはお好みチャンネル・ダウンを指示する操作信号を数秒毎に順次自動的に送信する。そして、デジタルテレビジョン放送受信装置12では、お好みチャンネル・アップまたはお好みチャンネル・ダウンを指示する操作信号を受信する毎に、自己に登録されたチャンネルのみを順次アップまたはダウン選局する。これにより、ユーザUSは、自己が登録したチャンネルの放送番組のみを1つ1つ順番に視聴することができる。
【0082】
また、ユーザUSが予めお好みのチャンネルのチャンネル番号を遠隔操作機器11に登録しておき、その登録されたチャンネルだけをザッピング時に切り替える対象とすることも考えられる。この場合、ユーザUSが「お好み・アップ」または「お好み・ダウン」といった音声指示を発すると、遠隔操作機器11は、自己に登録されたお好みチャンネルのチャンネル番号(例えば“1”→“5”→“8”)を送信する。そして、数秒後に、次のお好みチャンネルのチャンネル番号(例えば“3”→“6”→“4”)を送信する。これにより、ユーザUSは、自己が登録したチャンネルの放送番組のみを1つ1つ順番に視聴することができる。
【0083】
さらに、ユーザUSが、ザッピング時に切り替え対象となるチャンネルの数を設定することができるようにしておいても良いものである。このようにすれば、例えばユーザUSが「ザッピング・アップ」なる音声指示を発すると、遠隔操作機器11は、視聴可能な複数のチャンネルを選局するための操作信号を、そのチャンネル番号の最小チャンネルから最大チャンネルに向けて数秒毎に順次自動的に送信するが、予め設定された数だけチャンネルを切り替えると自動的にザッピングを停止するようになる。
【0084】
ここで、上記した実施の形態では、被制御機器としてデジタルテレビジョン放送受信装置12を例に説明したが、被制御機器としては、デジタルテレビジョン放送受信装置12に限るものではなく、例えばSTB(set top box)や音声再生機能を有するAV(audio visual)機器等に広く適用することが可能である。
【0085】
なお、この発明は上記した実施の形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を種々変形して具体化することができる。また、上記した実施の形態に開示されている複数の構成要素を適宜に組み合わせることにより、種々の発明を形成することができる。例えば、実施の形態に示される全構成要素から幾つかの構成要素を削除しても良いものである。さらに、異なる実施の形態に係る構成要素を適宜組み合わせても良いものである。
【符号の説明】
【0086】
11…遠隔操作機器、12…デジタルテレビジョン放送受信装置、13,14…筐体、14a…脚部、15…マイクロホン、16…赤外線発光部、16a,16b…赤外線LED、17…音声認識用LSI、18…A/D変換部、19…音声認識処理部、20…メモリ部、21a…拍手検出部、21b…キーワード検出部、21c…音声ミュート処理部、22…操作部、23…音声発生部、24…表示部、25…アンテナ、26…入力端子、27…チューナ部、28…復調復号部、29…信号処理部、30…合成処理部、31…音声処理部、32…映像処理部、33…映像表示部、34…スピーカ、35…制御部、35a…CPU、35b…メモリ部、36…操作部、37…受信部、38…HDD、38a…ハードディスク、39…記録再生処理部、40…入力端子、41…ネットワークインターフェース、42…ネットワーク、431〜43n…ネットワークサーバ、US…ユーザ。

【特許請求の範囲】
【請求項1】
音を検出する音検出手段と、
前記音検出手段で音が検出された場合、特定のキーワードを音声認識により検出するキーワード検出手段と、
前記キーワード検出手段でキーワードが検出された場合、音声ミュートを指示する操作信号を送信する音声ミュート手段と、
前記キーワード検出手段でキーワードが検出された後の音声指示を認識し、当該音声指示に対応する操作信号を送信する送信手段とを具備する音声認識操作装置。
【請求項2】
前記音検出手段で音が検出された場合、キーワード待ちであることを通知するように制御する通知制御手段を具備する請求項1記載の音声認識操作装置。
【請求項3】
前記通知制御手段は、音声及び表示の少なくとも一方の手段を用いてキーワード待ちであることを通知するように制御する請求項2記載の音声認識操作装置。
【請求項4】
前記キーワード検出手段は、前記音検出手段で音が検出された時点から所定時間以内、キーワードを音声認識により検出する請求項1記載の音声認識操作装置。
【請求項5】
前記送信手段は、前記キーワード検出手段でキーワードが検出された時点から所定時間以内だけ音声指示を認識する請求項1記載の音声認識操作装置。
【請求項6】
前記音検出手段は、拍手音を検出する請求項1記載の音声認識操作装置。
【請求項7】
前記音検出手段は、所定回数以上の連続的な拍手音を検出する請求項6記載の音声認識操作装置。
【請求項8】
前記送信手段は、音声認識された音声指示がザッピングの開始要求である場合、所定時間毎に自動的にチャンネルの切り替えを行なう操作信号を送信する請求項1記載の音声認識操作装置。
【請求項9】
前記送信手段は、音声認識された音声指示がザッピングの停止要求である場合、チャンネルの切り替えを行なう操作信号の送信を停止して、その時点で選局していたチャンネルを継続して選局する請求項1記載の音声認識操作装置。
【請求項10】
前記送信手段は、ザッピング中に音声認識された音声指示がチャンネルの切り替え間隔を変更する要求である場合、チャンネルの切り替えを行なう操作信号を送信する間隔を変える請求項8記載の音声認識操作装置。
【請求項11】
ザッピング中であることを通知する通知手段を具備する請求項8記載の音声認識操作装置。
【請求項12】
音検出手段により音を検出し、
前記音検出手段で音が検出された場合、キーワード検出手段により特定のキーワードを音声認識により検出し、
前記キーワード検出手段でキーワードが検出された場合、音声ミュート手段により音声ミュートを指示する操作信号を送信し、
前記キーワード検出手段でキーワードが検出された後の音声指示を認識し、送信手段により当該音声指示に対応する操作信号を送信する音声認識操作方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate