説明

音声応答装置、音声応答方法および音声応答プログラム

【課題】 使用者が初心者である場合にはわかりやすい案内をし、使用者が熟練者である場合には使用者へのわずらわしさを軽減することができる案内をするための音声応答装置、音声応答方法および音声応答プログラムを提供する。
【解決手段】 応答装置のCPUは、音声による機器の操作案内を行う(ステップS1)。次に、CPUは、後戻り操作が必要であるか否かを判定する(ステップS2)。後戻り操作が必要でない場合には、CPUは、使用者による次の操作までのタイムラグが長いか否かを判定する(ステップS3)。使用者による次の操作までの時間が所定時間を超えていない場合、CPUは、音声のテキストの簡略化の段階を進める(ステップS4)。ステップS2において後戻り操作が必要な場合およびステップS3において次の操作までの時間が所定時間を超えている場合には、CPUは、音声のテキストの簡略化の段階を戻す(ステップS5)。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声応答装置、音声応答方法および音声応答プログラムに関する。
【背景技術】
【0002】
カーナビゲーションシステム(以下、カーナビと呼ぶ)、ビデオテープレコーダ等の種々の機器には、音声を用いたナビゲーションシステムがよく用いられている(例えば、特許文献1参照)。
【0003】
使用者は、上記の機器を使用する場合、音声ナビゲーションシステムの音声により機器の操作手順の案内を受ける。
【特許文献1】特開2000−231697号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
一般的に、上記の音声ナビゲーションシステムを用いた機器は長期間使用されても、音声による操作手順の案内は変わらない。
【0005】
しかし、使用者は、機器を長期間使用している間に、機器の操作に熟練する。この場合、例えば、使用者が操作手順に慣れない初心者であるときは、「わかりました」または「もう一度言ってください」等の言葉を用いた音声による丁寧な表現が役に立つが、使用者が操作手順に慣れるにつれ、使用者にとって上記音声がわずらわしく感じられるようになる。そして、熟練した使用者は音声を消音する場合がある。
【0006】
しかしながら、使用者が音声ナビゲーションシステムの進行の状態を把握するためには、なんらかの音または音声による案内が重要である。特に、カーナビでは、運転への集中を妨害しないためには、音声による案内が必要不可欠である。
【0007】
本発明の目的は、使用者が初心者である場合にはわかりやすい案内をし、使用者が熟練者である場合には使用者へのわずらわしさを軽減することができる案内をするための音声応答装置、音声応答方法および音声応答プログラムを提供することである。
【課題を解決するための手段】
【0008】
第1の発明に係る音声応答装置は、機器の操作を音声で案内する音声応答装置であって、機器の操作に関する説明を音声出力する音声出力手段と、機器の操作の習熟度を判定する判定手段と、判定手段により判定される習熟度に基づいて音声出力手段による音声出力を簡略化する簡略化手段とを備えたものである。
【0009】
本発明に係る音声応答装置においては、機器の操作に関する説明が音声出力手段により音声出力され、使用者による機器の操作の習熟度が判定手段により判定される。また、判定手段により判定される使用者の機器の操作の習熟度に基づいて、音声出力手段による音声出力が簡略手段により簡略化される。
【0010】
簡略化手段により音声出力をイントネーション等の韻律情報を適度に保ちながら連続的に簡略化させることによって、使用者が初心者である場合にはわかりやすい音声出力による説明が行われ、使用者が熟練者である場合には使用者へのわずらわしさを軽減することができる音声出力による説明が行われる。
【0011】
また、使用者による機器の操作の習熟度に基づいて機器の操作に関する説明が変化することにより、使用者が音声応答装置に対して愛着を抱き、また、音声応答装置に対してより親和性を抱くことも期待できる。
【0012】
簡略化手段は、音声を非分節化することにより音声出力を簡略化してもよい。この場合、使用者の習熟度に基づいて音声出力による説明が簡略化手段により通常の言語的音声から非分節的な音声へと、イントネーション等の韻律情報を適度に保ちながら連続的に変化されることによって、使用者へのわずらわしさを軽減することができる。これにより、使用者は快適に音声応答装置を使用することができる。
【0013】
簡略化手段は、音声の周波数帯域を減少させるとともに音声の再生速度を増加させることにより音声を非分節化してもよい。この場合、簡略化手段により音声の周波数帯域が減少されるとともに音声の再生速度が増加されることにより、音声出力による説明が通常の言語的音声から非分節的な音声へと、イントネーション等の韻律情報を適度に保ちながら連続的に変化され、使用者へのわずらわしさを軽減することができる。これにより、使用者は快適に音声応答装置を使用することができる。
【0014】
簡略化手段は、説明の一部の語句を省略することにより音声出力を簡略化してもよい。この場合、使用者の習熟度に基づいて音声出力による説明の一部の語句が簡略化手段により省略されることにより、使用者へのわずらわしさを軽減することができる。これにより、使用者は快適に音声応答装置を使用することができる。
【0015】
判定手段は、機器の操作のやり直しまたは操作時間に基づいて操作の習熟度を判定してもよい。この場合、使用者が所望の操作を行うことができなかった場合または使用者が操作に戸惑っている場合等が使用者の習熟度の度合いとして判定手段により判定される。これにより、音声応答装置の円滑な進行が実現される。
【0016】
簡略化手段は、機器の操作のやり直しがなくかつ操作時間が所定時間を超えない場合に、音声出力を段階的に簡略化し、機器の操作のやり直しがあった場合または操作時間が所定時間を超えた場合に音声出力の簡略化の段階を戻してもよい。
【0017】
この場合、使用者の機器の操作の習熟度に基づいて使用者にとって適切な音声出力の段階的な簡略化が行われ、また簡略化の段階が戻される。
【0018】
音声応答装置は、使用者を認識する認識手段をさらに備え、判定手段は、認識手段により認識された使用者ごとに機器の操作の習熟度を判定してもよい。
【0019】
この場合、複数の使用者が、それぞれの習熟度に基づいた音声出力による説明を得ることができる。
【0020】
第2の発明に係る音声応答方法は、機器の操作を音声で案内する音声応答方法であって、機器の操作に関する説明を音声出力するステップと、機器の操作の習熟度を判定するステップと、判定される習熟度に基づいて音声出力を簡略化するステップとを備えたものである。
【0021】
本発明に係る音声応答方法においては、機器の操作に関する説明が音声出力され、使用者による機器の操作の習熟度が判定される。また、判定される使用者の機器の操作の習熟度に基づいて音声出力が簡略化される。
【0022】
これにより、音声出力をイントネーション等の韻律情報を適度に保ちながら連続的に簡略化させることによって、使用者が初心者である場合にはわかりやすい音声出力による説明が行われ、使用者が熟練者である場合には使用者へのわずらわしさを軽減することができる音声出力による説明が行われる。
【0023】
また、使用者による機器の操作の習熟度に基づいて機器の操作に関する説明が変化することにより、使用者が音声応答に対して愛着を抱き、また、音声応答に対してより親和性を抱くことも期待できる。
【0024】
第3の発明に係る音声応答プログラムは、コンピュータにより実行可能な音声応答プログラムであるとともに機器の操作を音声で案内する音声応答プログラムであって、機器の操作に関する説明を音声出力する処理と、機器の操作の習熟度を判定する処理と、判定される習熟度に基づいて音声出力を簡略化する処理とを、コンピュータに実行させるものである。
【0025】
本発明に係る音声応答プログラムにおいては、機器の操作に関する説明が音声出力され、使用者による機器の操作の習熟度が判定される。また、判定される使用者の機器の操作の習熟度に基づいて音声出力が簡略化される。
【0026】
これにより、音声出力をイントネーション等の韻律情報を適度に保ちながら連続的に簡略化させることによって、使用者が初心者である場合にはわかりやすい音声出力による説明が行われ、使用者が熟練者である場合には使用者へのわずらわしさを軽減することができる音声出力による説明が行われる。
【0027】
また、使用者による機器の操作の習熟度に基づいて機器の操作に関する説明が変化することにより、使用者が音声応答に対して愛着を抱き、また、音声応答に対してより親和性を抱くことも期待できる。
【発明の効果】
【0028】
本発明によれば、音声出力をイントネーション等の韻律情報を適度に保ちながら連続的に簡略化させることによって、使用者が初心者である場合にはわかりやすい音声出力による説明が行われ、使用者が熟練者である場合には使用者へのわずらわしさを軽減することができる音声出力による説明が行われる。
【0029】
また、使用者による機器の操作の習熟度に基づいて機器の操作に関する説明が変化することにより、使用者が音声応答装置に対して愛着を抱き、また、音声応答装置に対してより親和性を抱くことも期待できる。
【発明を実施するための最良の形態】
【0030】
以下、本実施の形態に係る音声応答装置(以下、単に応答装置と呼ぶ)について図面を参照しながら説明する。
【0031】
本実施の形態に係る応答装置は、例えばカーナビゲーションシステムまたはビデオテープレコーダの録画予約システム等の種々の機器(以下、単に機器と呼ぶ)に用いることができる。
【0032】
図1は、本実施の形態に係る応答装置の構成を示すブロック図である。
【0033】
図1に示すように、応答装置10は、CPU(中央演算処理装置)1、ROM(リードオンリメモリ)2、RAM(ランダムアクセスメモリ)3、入力装置4、表示装置5、外部記憶装置6、記録媒体駆動装置7およびスピーカ8を含む。
【0034】
入力装置4は、キーボード、マウス、スキャナ、デジタルカメラ等からなり、各種指令、データおよび画像を入力するために用いられる。
【0035】
ROM2にはシステムプログラムが記憶される。記録媒体駆動装置7は、CD−ROMドライブ、フロッピー(登録商標)ディスクドライブ等からなり、CD−ROM、フロッピィディスクドライブ等の記録媒体9に対してデータの読み書きを行う。
【0036】
記録媒体9には、音声応答プログラムが記憶されている。外部記憶装置6は、ハードディスク装置等からなり、記憶媒体駆動装置7を介して記録媒体9から読み込まれた音声応答プログラムおよび各種データを記憶する。CPU1は、外部記憶装置6に記憶された音声応答プログラムをRAM3上で実行する。
【0037】
表示装置5は、液晶表示パネル、CRT(陰極線管)等からなり、各種画像等を表示する。スピーカ8は、音声応答プログラムに基づいて案内の音声を出力する。
【0038】
なお、音声応答プログラムを記憶する記録媒体9として、ROM等の半導体メモリ、ハードディスク等の種々の記録媒体を用いることができる。また、音声応答プログラムを通信回線等の通信媒体を介して外部記憶装置6にダウンロードし、RAM3上で実行してもよい。
【0039】
図2は、本実施の形態に係る応答装置10の外部記憶装置6に記憶される音声応答プログラムの構成の一例を示すブロック図である。
【0040】
図2に示すように、外部記憶装置6に記憶される音声応答プログラムは、操作の円滑性判定モジュール6a、音声合成モジュール6bおよび音声合成パラメータ設定モジュール6cにより構成されている。
【0041】
操作の円滑性判定モジュール6aは、使用者による機器の操作が円滑に行われているか否かを判定する機能を有する。
【0042】
音声合成モジュール6bは、説明のテキストを音声として合成する。音声合成パラメータ設定モジュール6cは、合成される音声の周波数、再生速度等のパラメータを設定する。具体的には、音声合成パラメータ設定モジュール6cは、音声をローパスフィルタに通過させてその通過帯域を狭めると同時に、音声の再生速度を段階的に速める。それにより、合成音声を非分節化する。
【0043】
このようにして非分節化された合成音声は、本来の合成音声に比べて明瞭度は低下し音声としての品質は劣化してはくるが、上記の合成音声を聞き慣れた使用者は十分上記の合成音声による説明の意味合いを理解することができ、音声でのアナウンスの意味合いから単なる合図のような感覚で音声を受けとめることができる。
【0044】
図3は、本実施の形態に係る応答装置10の外部記憶装置6に記憶される音声応答プログラムの構成の他の例を示すブロック図である。
【0045】
図3に示す外部記憶装置6に記憶される音声応答プログラムが、図2に示す外部記憶装置6に記憶される音声応答プログラムと異なる点は、音声合成パラメータ設定モジュール6cの代わりに操作案内テキスト生成モジュール6dを含む点である。
【0046】
操作案内テキスト生成モジュール6dは、説明のテキストの語句を省略することにより音声出力を簡略化する機能を有する。詳細については後述する。
【0047】
図4は、図3の外部記憶装置6の操作案内テキスト生成モジュール6dによる説明のテキストの簡略化の段階を示す説明図である。なお、図4(a),(b),(c)に示すテキストはこの順に音声としてスピーカ8から出力されるものとする。説明のテキストは、予め外部記憶装置6に記憶されている。
【0048】
図4(a),(b),(c)に示すように、それぞれ例えば「目的地を設定するときは設定のボタンを押してください」、「エリアを選択するときは選択のボタンを押してください」および「やり直しは※のボタンを押してください」というテキストがある。
【0049】
ここで、簡略化の段階が一段階進行した場合には、図4(a)に示す<1>の分節である「を設定するときは」および「のボタン」が省略される。すなわち、簡略化後のテキストは「目的地は設定を押してください」となる。
【0050】
同様に、図4(b)に示す<1>の分節である「を選択するときは」および「のボタン」が省略される。すなわち、簡略化後のテキストは「エリアは選択を押してください」となる。
【0051】
同様に、図4(c)に示す<1>の分節である「のボタン」が省略される。すなわち、簡略化後のテキストは「やり直しは※を押してください」となる。
【0052】
また、簡略化の段階がさらに一段階進行した場合には、図4(a)に示す<2>の分節である「押してください」が省略される。すなわち、簡略化後のテキストは「目的地は設定を」となる。
【0053】
同様に、図4(b)に示す<2>の分節である「押してください」が省略される。すなわち、簡略化後のテキストは「エリアは選択を」となる。
【0054】
また、簡略化の段階がさらに一段階進行した場合には、図4(a)に示す<3>の分節である「を」が省略される。すなわち、簡略化後のテキストは「目的地は設定」となる。
【0055】
同様に、図4(b)に示す<3>の分節である「を」が省略される。ずなわち、簡略化後のテキストは「エリアは選択」となる。
【0056】
また、簡略化の段階がさらに一段階進行した場合には、図4(c)に示す<4>の分節である「を」および「押してください」が省略される。すなわち、簡略化後のテキストは「やり直しは※」となる。
【0057】
そして、簡略化の段階がさらに進行した場合には、図4(c)に示す<5>の分節である「やり直しは」および「※」が省略される。すなわち、図4(c)に示す「やり直しは※のボタンを押してください」のテキストが省略される。
【0058】
このように、本例では、使用者の操作の習熟度が高くなるに従って説明のテキストの語句を段階的に省略する。それにより、音声を非分節化する。
【0059】
なお、図4に示す音声のテキストの省略の順序は一例であり、これに限定されるものではなく、適宜テキストの省略の順序を変更することができる。
【0060】
次に、本実施の形態に係る応答装置10による操作案内の簡略化について説明する。本実施の形態に係る応答装置10では、操作案内の簡略化が行われる前に、まず使用者により機器の操作が円滑に行われているか否かが判定される。
【0061】
図5は、本実施の形態に係る応答装置10における音声応答プログラムに基づく音声の簡略化を示すフローチャートである。
【0062】
図5に示すように、まず、応答装置10のCPU1は、音声による機器の操作案内を行う(ステップS1)。この場合、スピーカ8から案内の音声が出力される。
【0063】
次に、CPU1は、後戻り操作が必要であるか否かを判定する(ステップS2)。例えば、使用者により機器に設けられているやり直しスイッチが押下されたか否かがCPU1により判定される。この場合、使用者によりやり直しスイッチが押下された場合には後戻り操作が必要であると判定され、やり直しスイッチが押下されていない場合には後戻り操作が必要でないと判定される。
【0064】
後戻り操作が必要でない場合には、CPU1は、使用者による次の操作までのタイムラグが長いか否かを判定する(ステップS3)。この場合、使用者による次の操作までの時間が所定時間を超えているか否かが判定される。
【0065】
使用者による次の操作までの時間が所定時間を超えていない場合、CPU1は、音声のテキストの簡略化の段階を進める(ステップS4)。その後、ステップS1に戻る。
【0066】
ここで、上記の簡略化の段階とは、図4において示した順序に基づいた操作案内テキスト生成モジュール6dによる音声のテキストの簡略化の段階または音声合成パラメータ設定モジュール6cによる音声のテキストの簡略化の段階をいう。
【0067】
上記のステップS2において後戻り操作が必要であると判定された場合およびステップS3において使用者による次の操作までの時間が所定時間を超えていると判定された場合には、CPU1は、音声のテキストの簡略化の段階を戻す(ステップS5)。その後、ステップS1に戻り、簡略化の段階が戻されたテキストに基づく操作案内が行われる。
【0068】
本実施の形態においては、音声合成パラメータ設定モジュール6cおよび操作案内テキスト生成モジュール6dにより音声出力をイントネーション等の韻律情報を適度に保ちながら連続的に簡略化させることによって、使用者が初心者である場合にはわかりやすい音声出力による説明が行われ、使用者が熟練者である場合には使用者へのわずらわしさを軽減することができる音声出力による説明が行われる。
【0069】
また、使用者による機器の操作の習熟度に基づいて機器の操作に関する説明が変化することにより、使用者が応答装置10に対して愛着を抱き、また、応答装置10に対してより親和性を抱くことも期待できる。
【0070】
上記実施の形態に係る応答装置10は、機器に直接設けることも可能であるが、ネットワークを介して機器に接続することも可能である。
【0071】
上記実施の形態に係る応答装置10は、ペットロボットに設けることもできる。この場合、使用者によるペットロボットの操作の習熟度に応じて上記の音声出力の簡略化が進められる。ここで、ペットロボットと使用者との間の会話の頻度、円滑性等に基づいて操作の習熟度が判定される。
【0072】
なお、応答装置10は、使用者を認識するための認識モジュールを備えてもよい。認識モジュールは、例えば使用者の顔、指紋、声または使用者によるパスワード入力等により上記使用者を認識する。この場合、複数の使用者が、それぞれの習熟度に基づいた音声出力による説明を得ることができる。
【0073】
本実施の形態においては、応答装置10が音声応答装置に相当し、スピーカ8が音声出力手段に相当し、操作の円滑性判定モジュール6aが判定手段に相当し、音声合成パラメータ設定モジュール6cおよび操作案内テキスト生成モジュール6dが簡略化手段に相当し、認識モジュールが認識手段に相当する。
【0074】
なお、上記実施の形態では、判定手段、簡略化手段および認識手段がCPU1および音声応答プログラムにより構成されているが、判定手段、簡略化手段および認識手段が電子回路等のハードウェアにより構成されてもよい。
【産業上の利用可能性】
【0075】
本発明は、カーナビゲーションシステム、ビデオテープレコーダの録画予約システム、ペットロボットまたはチケット予約システム等の種々の機器に利用することができる。
【図面の簡単な説明】
【0076】
【図1】本実施の形態に係る応答装置の構成を示すブロック図である。
【図2】本実施の形態に係る応答装置の外部記憶装置に記憶される音声応答プログラムの構成の一例を示すブロック図である。
【図3】本実施の形態に係る応答装置の外部記憶装置に記憶される音声応答プログラムの構成の他の例を示すブロック図である。
【図4】図3の外部記憶装置の操作案内テキスト生成モジュールによる説明のテキストの簡略化の段階を示す説明図である。
【図5】本実施の形態に係る応答装置における音声応答プログラムに基づく音声の簡略化を示すフローチャートである。
【符号の説明】
【0077】
1 CPU
2 ROM
3 RAM
4 入力装置
5 表示装置
6 外部記憶装置
6a 操作の円滑性判定モジュール
6b 音声合成モジュール
6c 音声合成パラメータ設定モジュール
6d 操作案内テキスト生成モジュール
7 記録媒体駆動装置
8 スピーカ
9 記録媒体
10 応答装置

【特許請求の範囲】
【請求項1】
機器の操作を音声で案内する音声応答装置であって、
前記機器の操作に関する説明を音声出力する音声出力手段と、
前記機器の操作の習熟度を判定する判定手段と、
前記判定手段により判定される習熟度に基づいて前記音声出力手段による音声出力を簡略化する簡略化手段とを備えたことを特徴とする音声応答装置。
【請求項2】
前記簡略化手段は、音声を非分節化することにより音声出力を簡略化することを特徴とする請求項1記載の音声応答装置。
【請求項3】
前記簡略化手段は、音声の周波数帯域を減少させるとともに音声の再生速度を増加させることにより音声を非分節化することを特徴とする請求項2記載の音声応答装置。
【請求項4】
前記簡略化手段は、説明の一部の語句を省略することにより音声出力を簡略化することを特徴とする請求項1記載の音声応答装置。
【請求項5】
前記判定手段は、前記機器の操作のやり直しまたは操作時間に基づいて操作の習熟度を判定することを特徴とする請求項1〜4のいずれかに記載の音声応答装置。
【請求項6】
前記簡略化手段は、前記機器の操作のやり直しがなくかつ前記操作時間が所定時間を超えない場合に、前記音声出力を段階的に簡略化し、前記機器の操作のやり直しがあった場合または前記操作時間が所定時間を超えた場合に前記音声出力の簡略化の段階を戻すことを特徴とする請求項1〜5のいずれかに記載の音声応答装置。
【請求項7】
使用者を認識する認識手段をさらに備え、
前記判定手段は、前記認識手段により認識された使用者ごとに前記機器の操作の習熟度を判定することを特徴とする請求項1〜6のいずれかに記載の音声応答装置。
【請求項8】
機器の操作を音声で案内する音声応答方法であって、
前記機器の操作に関する説明を音声出力するステップと、
前記機器の操作の習熟度を判定するステップと、
判定される習熟度に基づいて音声出力を簡略化するステップとを備えたことを特徴とする音声応答方法。
【請求項9】
コンピュータにより実行可能な音声応答プログラムであるとともに機器の操作を音声で案内する音声応答プログラムであって、
前記機器の操作に関する説明を音声出力する処理と、
前記機器の操作の習熟度を判定する処理と、
判定される習熟度に基づいて音声出力を簡略化する処理とを、
前記コンピュータに実行させることを特徴とする音声応答プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公開番号】特開2006−11002(P2006−11002A)
【公開日】平成18年1月12日(2006.1.12)
【国際特許分類】
【出願番号】特願2004−187358(P2004−187358)
【出願日】平成16年6月25日(2004.6.25)
【出願人】(393031586)株式会社国際電気通信基礎技術研究所 (905)
【Fターム(参考)】