説明

音声認識制御装置

【課題】音声認識率を向上させ、且つ誤認識及びこれによる誤動作を抑制する。
【解決手段】ユーザが発話する音声が所定の音声コマンド又は当該音声コマンドをなまけて発話した時の音声に対応するなまけコマンドに該当すると認識した場合、認識した音声コマンド又はなまけコマンドに対応する制御を実行する音声認識制御装置10であり、音声コマンド及びなまけコマンドの照合用データを格納する照合用データ記憶部14と、ユーザが発話する音声を入力し、この音声を所定の音声信号に変換する音声入力部40と、変換された音声信号と照合用データ記憶部14に格納された照合用データとを照合して、入力された音声が所定の音声コマンド又はなまけコマンドに該当するか否かを判定する音声認識部12と、音声認識部12による判定結果に基づいてユーザが必要のないなまけコマンドを特定し音声認識部12の照合対象から削除する照合対象削除部16とを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ユーザが発話する音声を入力し、入力された音声が所定の音声コマンドに該当すると認識した場合、認識した音声コマンドに対応する制御を実行する音声認識制御装置に関する。
【背景技術】
【0002】
発声の仕方や個人差によって、発話がなまける、例えば、発話する音声の語頭又は語尾が弱くなったり、欠落したり、或いはrの子音が抜けたりすることが一般的に知られている。このように、なまけて発話した音声が音声認識制御装置に入力された場合、各制御内容に対応する音声コマンドが1つしか登録されていないと、音声認識制御装置は、入力された音声から音声コマンドを認識することができず制御を実行することができない。
【0003】
そこで、従来から、音声コマンドをなまけて発話した時の音声に対応するコマンド(以後、「なまけコマンド」という)を予め前記の音声コマンドとは別に管理しておくことにより、発話がなまけた場合であってもなまけコマンドを認識して当該なまけコマンドに対応する制御を実行できるようにしている(特許文献1参照)。
【特許文献1】特開昭62−111295号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
しかし、なまけコマンドを音声認識の対象語彙として新たに追加してしまうと、対象語彙の数が増えてしまうため音声認識率が低下してしまう。また、類似する対象語彙が増えるため誤認識が増加し、これに伴う機器の誤動作も増加してしまう。
【0005】
本発明は、上記問題点を解決するために成されたものであり、その目的は、音声認識率を向上させ、且つ誤認識及びこれによる誤動作を抑制することである。
【課題を解決するための手段】
【0006】
本発明の特徴は、ユーザが発話する音声が所定の音声コマンドに該当すると認識した場合は、当該認識した音声コマンドに対応する制御を実行し、ユーザが発話する音声が当該音声コマンドをなまけて発話した時の音声に対応するなまけコマンドに該当すると認識した場合は、前記音声コマンドに対応する制御を実行する音声認識制御装置であって、音声認識制御装置が認識することができる音声コマンドの照合用データ及びなまけコマンドの照合用データを格納する照合用データ記憶部と、ユーザが発話する音声を入力し、この音声を所定の音声信号に変換する音声入力部と、音声入力部によって変換された音声信号と照合用データ記憶部に格納された照合用データとを照合して、入力された音声が所定の音声コマンド又はなまけコマンドに該当するか否かを判定する音声認識部と、音声認識部による判定の結果に基づいて、ユーザにとって必要のないなまけコマンドを特定し音声認識部の照合対象から削除する照合対象削除部とを備えることである。
【0007】
音声認識部による判定の結果に基づいて当該ユーザにとって必要のないなまけコマンドを特定し照合対象から削除することにより、照合対象となる照合用データのデータ量が削減されるので、音声認識率が向上し、誤認識及びこれによる誤動作が抑制される。
【0008】
ここで、照合対象削除部は、照合用データ記憶部から、当該なまけコマンドの照合用データを削除するのではなく、音声認識部が音声入力部から出力された音声信号(音声データ)と比較する照合用データの中から、ユーザにとって必要のないなまけコマンドの照合用データを削除することが望ましいが、照合用データ記憶部から当該なまけコマンドの照合用データを削除しても構わない。
【0009】
本発明の特徴において、音声認識制御装置は、ユーザに対して所定の初期発話を促す発話促進手段を更に備え、音声認識部は、初期発話の音声が所定の音声コマンド又はなまけコマンドに該当するか否かを判定し、照合対象削除部は、初期発話の判定の結果に基づいて、ユーザにとって必要のないなまけコマンドを音声認識部の照合対象から削除してもよい。
【0010】
ユーザに対して所定の初期発話を促し、初期発話の判定結果に基づいてユーザにとって必要のないなまけコマンドを照合対象から削除することにより、音声認識制御装置の使用を開始する時から、照合対象となる照合用データのデータ量を削減することができる。
【0011】
なお、発話促進手段は、ユーザに対して所定の初期発話を促すための画面に表示する表示手段であってもよい。
【0012】
本発明の特徴において、照合対象削除部は、音声認識部がなまけコマンドを認識する頻度が低いなまけコマンドを特定し、音声認識部の照合対象から削除してもよい。
【0013】
例えば、音声認識制御装置は、音声認識部がなまけコマンドを認識する頻度を当該なまけコマンドが示す制御内容ごとに計数する第1の頻度計数部を更に備え、照合対象削除部は、第1の頻度計数部により計数された頻度に応じて、音声認識部の照合対象から削除するなまけコマンドを制御内容ごとに特定してもよい。
【0014】
或いは、音声認識制御装置は、音声認識部がなまけコマンドを認識する頻度を当該なまけコマンドが属する発話なまけの傾向ごとに計数する第2の頻度計数部を更に備え、照合対象削除部は、第2の頻度計数部により計数された頻度に応じて、音声認識部の照合対象から削除するなまけコマンドを発話なまけの傾向ごとに特定してもよい。各なまけコマンドを認識する頻度に応じて照合対象から削除するなまけコマンドを特定することにより、ユーザにとって必要のないなまけコマンドを削除することができる。
【0015】
本発明の特徴において、音声認識制御装置は、音声入力部に入力された音声に基づいて当該音声を発話する話者を識別する話者識別部を更に備え、照合対象削除部は、話者識別部により識別された話者に応じて、音声認識部の照合対象から削除するなまけコマンドを変更してもよい。発話なまけの傾向は各話者によってほぼ特定されるので、話者識別部により識別された話者に応じて照合対象から削除するなまけコマンドを変更することにより、ユーザ(話者)ごとに適切ななまけコマンドを選択することができる。
【発明の効果】
【0016】
本発明の音声認識制御装置によれば、ユーザにとって必要のないなまけコマンドを照合対象から削除することにより、照合対象となる照合用データのデータ量が削減されるので、音声認識率が向上し、且つ誤認識及びこれによる誤動作を抑制することができる。
【発明を実施するための最良の形態】
【0017】
以下図面を参照して、本発明の実施形態を説明する。図面の記載において同一部分には同一符号を付して説明を省略する。
(第1の実施の形態)
図1を参照して、本発明の第1の実施の形態に係わる音声認識制御装置10及び被制御機器20の具体的な構成を説明する。音声認識制御装置10は、ユーザが発話する音声による命令(コマンド)を認識し、この音声による命令に応じた被制御機器20の制御を実行する装置である。また、音声認識制御装置10は、被制御機器20の制御に限らず、音声認識制御装置10内の各構成要素の制御をこの音声による命令に基づいて実行する。なお、本発明の実施の形態においては、被制御機器20として浴室に設置された様々な機器を音声認識制御装置10が制御する場合を例にとり説明する。
【0018】
具体的に、音声認識制御装置10は、ユーザインターフェースを形成するコントローラ11と、コントローラ11を介して入力されたユーザの音声による命令が所定の音声コマンドに該当するか否かを判断する音声認識部12と、音声認識部12により認識された音声コマンドに対応する被制御機器20の制御を実行するための制御信号を出力する制御実行部13と、制御実行部13から出力された制御信号を被制御機器20へ送信する制御IF部15と、ユーザに対して出力する音声を合成する音声合成部と、音声認識制御装置10が認識することができる音声コマンドの照合用データ及びなまけコマンドの照合用データを格納する照合用データ記憶部14と、音声認識部12による判定の結果に基づいて、ユーザにとって必要のないなまけコマンドを音声認識部12の照合対象から削除する照合対象削除部16と、音声認識部12がなまけコマンドを認識する頻度を当該なまけコマンドが示す制御内容ごとに計数する第1の頻度計数部17と、音声認識部12がなまけコマンドを認識する頻度を当該なまけコマンドが属する発話なまけの傾向ごとに計数する第2の頻度計数部18と、コントローラ11を介して入力された音声に基づいて当該音声を発話する話者を識別する話者識別部19とを備える。
【0019】
通常、発声の仕方や個人差によって、例えば、発話する音声の語頭又は語尾が弱くなったり、欠落したり、或いはrの子音が抜けたりする等、発話のなまけが発生することがある。本発明の実施形態における「なまけコマンド」は、音声コマンドをなまけて発話した時の音声に対応するコマンドであり、「音声コマンド」は、音声による命令をなまけることなく、正しく発話した時の音声に対応するコマンドである。なまけコマンドの詳細については、図4及び図5を参照して後述する。
【0020】
音声認識制御装置10は、ユーザが発話する音声が所定の音声コマンドに該当すると認識した場合は、当該認識した音声コマンドに対応する制御を実行し、ユーザが発話する音声が当該音声コマンドをなまけて発話した時の音声に対応するなまけコマンドに該当すると認識した場合は、前記音声コマンドに対応する制御を実行する。
【0021】
コントローラ11は、ユーザが発する音声を入力し、これを電気信号(音声信号)として出力する音声入力部40と、音声合成部によって合成された音声を出力する音声出力部50と、ユーザに対して所定の画面などを表示する表示部70とを備える。なお、図1には示さないが、本実施形態においてコントローラ11はユーザのボタン操作を受け付ける操作ボタン部を更に備えている。コントローラ11の詳細については図3を参照して後述する。
【0022】
音声入力部40は、ユーザの発話音声を入力し、これを音声信号に変換するマイクと、この音声信号を増幅する増幅部と、増幅された音声信号をデジタル信号に変換するA/D変換部と、このデジタル化された音声信号から雑音成分を除去する雑音減算部とを備える。雑音減算部により雑音が除去された音声信号は、音声認識部12及び話者識別部19へ送信される。
【0023】
音声出力部50は、音声合成部にて合成された音声信号をアナログ信号に変換するD/A変換部と、アナログ化された音声信号を増幅する増幅部と、増幅された音声信号を音声に変換して出力するスピーカとを備える。
【0024】
表示部70は、点灯/消灯/点滅によって被制御機器20の動作状況をユーザに対して表示するLEDと、文字や絵図等の画像により被制御機器20の動作状況をユーザに対して表示する液晶表示装置とを有する。
【0025】
操作ボタン部は、被制御機器20の動作設定などをユーザの手入力により行うための各種ボタンからなり、この中には、コントローラ11の運転のオン/オフ状態を切替えるコントローラオン/オフスイッチが含まれる。
【0026】
音声認識部12は、音声入力部40から出力された音声信号と照合用データ記憶部14に記憶されている照合用データとを照合して、上記音声信号が所定の音声コマンド又はなまけコマンドに該当するか否かを判定する。具体的に、音声認識部12は、音声入力部40から出力された音声信号(音声データ)と照合用データベースに格納された照合用データとを比較することによりユーザが発する音声が所定の音声コマンド又はなまけコマンドに該当するか否かを判定し、音声コマンド又はなまけコマンドに該当すると判定した場合には当該音声コマンド又はなまけコマンドに対応する所定の信号を制御実行部13へ出力する。
【0027】
なまけコマンドの照合方法の詳細は次の通りである。照合用データ記憶部14には音声コマンドごとに想定されるなまけコマンドの照合用データが記憶されている。音声認識部12は、音声入力部40から入力された音声信号を、音素ごとの音声信号として識別し、入力された文字が例えば(て)(え)(び)であると認識する。そして、なまけコマンドの照合用データの中に(て)(え)(び)があるか否かを照合する。なお、照合用データ記憶部14が、なまけコマンドの照合用データとして、(て)(え)(び)という“言葉”の音声データを保持している場合は、音声入力部40から入力された音声信号を、直接なまけコマンドの照合用データと照合することができる。このように、音声認識部12は、音声入力部40から入力された音声信号を、音素ごとに分けて照合しても良いし、コマンド単位で照合しても構わない。
【0028】
また、音声認識部12は、音声コマンド又はなまけコマンドに該当するか否かの判定結果に基づいて、ユーザの発話なまけの傾向を特定する。通常、発話のなまけには、発話する音声の語頭又は語尾が弱くなったり、欠落したり、或いはrの子音が抜けたりするなどの幾つかの傾向があるが、音声認識部12は、なまけコマンドに該当するか否かの判定結果に基づいて、ユーザがどの発話なまけの傾向にあるかを特定する。発話なまけの傾向については、図4を参照して後述する。
【0029】
制御実行部13は、マイクロコンピュータと所定の記憶領域(RAM)を備え、所定のプログラムに従って被制御機器20及び音声認識制御装置10の各構成要素の動作を制御する。具体的に、制御実行部13は、音声認識部12が認識した音声コマンド又はなまけコマンドに対応する所定の信号を受信するか、操作ボタン部のボタン操作による所定の信号を受信すると、被制御機器20又は音声認識制御装置10の各構成要素に対して、当該音声コマンド又はなまけコマンド或いはボタン操作に相当する制御信号を送信する。
【0030】
照合対象削除部16は、入力された音声が所定の音声コマンド又はなまけコマンドに該当するか否かの音声認識部12による判定の結果に基づいて、ユーザにとって必要のないなまけコマンドを音声認識部12の照合対象から削除する。ここで、照合対象削除部16は、照合用データ記憶部14から、当該なまけコマンドの照合用データを削除するのではなく、音声認識部12が音声入力部40から出力された音声信号(音声データ)と比較する照合用データの中から、ユーザにとって必要のないなまけコマンドの照合用データを削除する。よって、なまけコマンドの照合用データは音声認識部12の照合対象から削除されても、照合用データ記憶部14には依然として格納されている。このように、音声認識部12による判定の結果に基づいて当該ユーザにとって必要のないなまけコマンドを音声認識部12の照合対象から削除することにより、音声認識部12の照合対象となる照合用データのデータ量が削減されるので、音声認識率が向上し、誤認識及びこれによる誤動作が抑制される。なお、照合対象削除部16は、照合用データ記憶部14から当該なまけコマンドの照合用データを削除しても構わない。
【0031】
また、照合対象削除部16は、入力された音声が所定の音声コマンド又はなまけコマンドに該当するか否かの音声認識部12の判定結果を直接参照して、音声認識部12の照合対象から削除するなまけコマンドを特定してよいが、音声認識部12により特定されたユーザの発話なまけの傾向を介して実施しても構わない。すなわち、照合対象削除部16は、入力された音声が所定の音声コマンド又はなまけコマンドに該当するか否かの音声認識部12の判定結果を直接的又は間接的に参照して、音声認識部12の照合対象から削除するなまけコマンドを特定しても構わない。
【0032】
第1の頻度計数部17及び第2の頻度計数部18は、音声認識部12がなまけコマンドを認識する頻度を計数する。例えば、音声認識部12が総ての音声コマンド及びなまけコマンドの音声認識に成功した回数に対する各なまけコマンドの認識回数の割合、音声入力部40に音声が入力された回数に対する各なまけコマンドの認識回数の割合、その他に、音声認識部12が同じ制御内容を示す音声コマンド及び総てのなまけコマンドの音声認識に成功した回数に対する当該制御内容を示す各なまけコマンドの認識回数の割合、音声認識部12が同じ制御内容を示す総てのなまけコマンドの音声認識に成功した回数に対する当該制御内容を示す各なまけコマンドの認識回数の割合、などが、このなまけコマンドを認識する頻度に含まれる。第1の頻度計数部17は、当該なまけコマンドが示す制御内容ごとにこの頻度を計数し、第2の頻度計数部18は、当該なまけコマンドが属する発話なまけの傾向ごとにこの頻度を計数する。第1の頻度計数部17及び第2の頻度計数部18の詳細については図4及び図5を参照して後述する。
【0033】
話者識別部19は、予め音声入力部40で変換された音声信号(音声データ)をユーザごとに格納したメモリを備え(図示せず)、このメモリに格納された音声データと音声入力部40に入力された音声とを比較して当該音声を発話する話者を識別する。
【0034】
被制御機器20には、照明機器21、空調機器22、給湯器23、テレビ24、ジェット噴流バス装置25、及びミストサウナ装置26が含まれる。照明機器21は、浴室内を人工的な光で照らして明るくするための装置であり、浴室全体を明るくする主照明や光源からの光を間接的に照射する間接照明が含まれる。空調機器22は、浴室の壁や窓などに取り付けられ、空気の温度・湿度や清浄度などが調節された空気をモーターで羽根を回転させて浴室内に送出し、浴室内を快適な状態に保つための装置である。ジェット噴流バス装置25は、浴槽の壁面の数カ所に設置された噴出口から気泡混じりの湯を噴き出し、入浴者の背中や足腰などに当てる装置である。ミストサウナ装置26は、浴室内に暖められた霧状の水蒸気を送出する装置であって、送出される水蒸気をユーザが浴びることによりユーザの体を温める入浴方法において使用される装置である。
【0035】
図2は、図1に示した音声認識制御装置10及び被制御機器20の配置例を示す浴室内の外観図である。被制御機器20として、照明機器21に属する主照明21a及び間接照明21bや空調機器22が浴室内天井に設置され、浴室の浴槽3付近の壁面にテレビ24及びミストサウナ装置26が設置され、ジェット噴流バス装置25の噴出口25a及び吸込口25bが浴室の浴槽3内に設置されている。また、浴室の浴槽3付近の壁面には、コントローラ11が設置されている。なお、被制御機器20の1つである給湯器23やジェット噴流バス装置25のポンプ装置、ミストサウナ装置26の熱源機、及び音声認識制御装置10のコントローラ以外の構成要素は浴室外に設置されている。
【0036】
なお、図2で示した配置例は一例であり、音声認識制御装置10及び被制御機器20は他のレイアウトを取り得る。また、図1及び図2では、照明機器21、空調機器22、給湯器23、テレビ24、ジェット噴流バス装置25及びミストサウナ装置26を被制御機器20の例として挙げたが、これに限らず、被制御機器20には、カセットテープ、CD、MD、DVDなどの記録媒体に格納された音楽や映像を再生する電気器具や、暖房機器やパーソナルコンピュータなど、浴室内においてユーザが利用する電気器具が含まれる。
【0037】
次に、図3を参照して、図1及び図2に示したコントローラ11の操作面のレイアウトを説明する。コントローラ11の操作面には、音声入力部40のマイク41、音声出力部50のスピーカ53、各種操作ボタン60a〜60i、及び表示部70としてのLED71及び液晶表示装置72が配置されている。
【0038】
各種操作ボタン60a〜60iは、メニューボタン60a、確定ボタン60b、戻るボタン60c、十字キー60d、優先ボタン60e、追いだきボタン60f、ふろ自動ボタン60g、通話ボタン60h及びコントローラオンオフスイッチ60iからなる。これらボタン60a〜60iのうち、優先ボタン60e、追いだきボタン60f、ふろ自動ボタン60g、及び通話ボタン60hは、給湯器23の制御のために用いられる。また、他のボタン及びスイッチは、給湯器23に限らず、その他の被制御機器20及び音声認識制御装置10の各構成要素の制御のためにも用いられる。このように、コントローラ11は、被制御機器20をスイッチ操作により制御する浴室リモコンと、音声認識制御装置10のコントロールパネルとの機能を兼ねる構成となっている。
【0039】
具体的に、優先ボタン60eは、浴室で給湯温度やシャワー温度を設定したいときに使用するボタンである。一般的に水や湯は、浴室以外にも台所等で用いられる。このため、給湯器23の給湯温度やシャワー温度を設定しても他の箇所で水や湯を使用されると、実際の給湯温度やシャワー温度にズレが生じる可能性がある。そこで、優先ボタン60eを押下することにより、他の箇所よりも浴室を優先し、実際の給湯温度やシャワー温度にズレが生じ難いようにすることができる。また、優先ボタン60eが押下されると、LED71が点灯する、又は液晶表示装置72に優先状態を表示する等の方法により、表示部70に優先マーク(不図示)が表示される。
【0040】
追いだきボタン60fは、浴槽内の湯水の温度を高くするときに使用されるボタンである。追いだきボタン60fが押下されると、前記の優先マークと同様にして、表示部70に追いだきマーク(不図示)が表示される。ふろ自動ボタン60gは、予め設定した湯量と温度とで浴槽内にお湯をはるときに使用されるボタンである。ふろ自動ボタン60gが押下されると、前記の優先マークと同様にして、表示部70に自動マーク(不図示)が表示される。
【0041】
通話ボタン60hは、浴室外、例えば台所などに設置される台所用リモコンと通話するときに使用されるボタンである。通話ボタン60hが押下されると、前記の優先マークと同様にして、表示部70に通話マーク(不図示)が表示される。
【0042】
メニューボタン60aは、手入力により被制御機器20及び音声認識制御装置10の動作を設定するためのボタンである。メニューボタン60aが押下されると、被制御機器20及び音声認識制御装置10の動作項目(例えば空調機器オフ、テレビ電源オン、テレビチャンネル+1、ミストサウナ装置オン、音声認識部オンなど)が液晶表示装置72に複数個表示される。ユーザは、これら複数の動作項目から十字キー60dを操作して1つの動作項目を選択することとなる。
【0043】
確定ボタン60bは、十字キー60dを操作して選択された動作項目の動作を被制御機器20及び音声認識制御装置10に実行させる際に押下されるボタンである。戻るボタン60cは、液晶表示装置72に表示される画面を1つ前の状態に戻すときなどに使用されるボタンである。例えば、液晶表示装置72上に動作項目の一部しか表示できない場合、十字キー60dを操作することにより、次の画面に移行して、残りの動作項目を表示させることができる。また、戻るボタン60cを押下すれば、移行した画面を元に戻して、前回画面の動作項目を液晶表示装置72に表示させることができる。十字キー60dは、給湯温度やシャワー温度の温度設定、湯量の設定、動作項目の選択、オン/オフの選択などに用いられるボタンである。
【0044】
コントローラオンオフスイッチ60iは、コントローラ11の電源をオン又はオフするためのボタンであり、コントローラオンオフスイッチ60iを押下する度に、コントローラ11の電源のオンとオフが切り替わる。コントローラオンオフスイッチ60iによりコントローラ11の電源がオフされた場合、液晶表示装置72の表示は消去し、コントローラ11のスイッチ操作を介した被制御機器20及び音声認識制御装置10の制御が無効となり、かつ音声認識による被制御機器20及び音声認識制御装置10の制御も無効となる。
【0045】
上記した各種操作ボタン60a〜60iのボタン操作による制御は、ユーザの発話音声の音声認識機能を用いても同様にして実行することができる。即ち、照合用データ記憶部14は、上記したコントローラ11のボタン操作と同等な制御に相当する音声コマンド及びなまけコマンドの照合用データを格納し、音声認識部12は、音声入力部40から出力された音声信号(音声データ)と照合用データベースに格納された照合用データとを比較することにより、上記した各種操作ボタン60a〜60iのボタン操作と同等な制御に相当する音声コマンド及びなまけコマンドを認識することができる。
【0046】
液晶表示装置72は、時刻、浴槽内の湯水の量及び温度、給湯温度、シャワー温度などを表示する。また、液晶表示装置72は、ユーザに対して所定の初期発話を促すための画面に表示する。例えば、初期発話の内容(言葉)を画面に表示し、併せて、表示されている言葉をコントローラ11のマイク41に向かって発話することをユーザに対して促す文字案内を表示する。当該文字案内に従ってユーザが初期発話を行うと、初期発話の音声は音声入力部40で音声信号に変換され、音声認識部12は、初期発話の音声が所定の音声コマンド又はなまけコマンドに該当するか否かを判定し、照合対象削除部16は、初期発話の判定の結果に基づいて、ユーザにとって必要のないなまけコマンドを音声認識部12の照合対象から削除することができる。
【0047】
なお、初期発話の画面表示は、音声認識制御装置10の使用を開始する前に実施することが望ましい。音声認識制御装置10の使用を開始する時から、音声認識部12の照合対象となる照合用データのデータ量を削減することができる。初期発話の画面表示は、コントローラオンオフスイッチ60iを操作してコントローラ11の電源をオンさせる度に、すべてのユーザに対して実施してもよいし、ユーザ登録機能を備えている場合には、初めて音声認識制御装置10を使用するユーザにたいしてのみ、初期発話の画面表示を行っても構わない。
【0048】
また、初期発話をユーザに促すための手段としては、液晶表示装置72などによる画面表示に限らず、音声出力部50による音声案内でも構わない。具体的には、初期発話の内容(言葉)をコントローラ11のマイク41に向かって発話することをユーザに対して促すための音声案内をスピーカ53から出力すればよい。
【0049】
したがって、図1に示したように、ユーザに対して所定の初期発話を促す発話促進部60(発話促進手段)には、画面案内を行うための表示部70及び音声案内を行うための音声出力部50が含まれる。
【0050】
次に、図4及び図5を参照して、音声認識部12により特定される発話なまけの傾向を説明する。音声認識部12は、入力された音声が音声コマンド又はなまけコマンドに該当するか否かの判定結果に基づいて、ユーザがどの発話なまけの傾向にあるかを特定する。図4に示すように、発話なまけの傾向には、例えば、発話する音声の語頭が弱くなるか欠落する「語頭の弱化(なまけ傾向1)」、発話する音声の語尾が弱くなるか欠落する「語尾の弱化(なまけ傾向2)」、及びrの子音が抜ける「rの抜け(なまけ傾向3)」がある。
【0051】
図5に示すように、例えば、「テレビ24の電源をオンする」制御内容に対応する音声コマンドが「てれびをつけて」である場合、当該「てれびをつけて」に対応するなまけコマンドのうち、「語頭の弱化(なまけ傾向1)」に属するなまけコマンドは「れびをつけて」であり、「語尾の弱化(なまけ傾向2)」に属するなまけコマンドは「てれびをつけ」であり、「rの抜け(なまけ傾向3)」に属するなまけコマンドは「てえびをつけて」である。
【0052】
同様に、「照明機器21の電源をオンする」制御内容に対応する音声コマンドが「あかりをつけて」である場合、当該「あかりをつけて」に対応するなまけコマンドのうち、「語頭の弱化(なまけ傾向1)」に属するなまけコマンドは「かりをつけて」であり、「語尾の弱化(なまけ傾向2)」に属するなまけコマンドは「あかりをつけ」であり、「rの抜け(なまけ傾向3)」に属するなまけコマンドは「あかいをつけて」である。
【0053】
図示は省略するが、この他に、音声認識部12は、以下のような発話なまけの傾向も特定する。
(a)「ei」が「ee」に変化する。例「ていし(停止)」が「てえし」へ変化する等、
(b)「ou」が「oo」に変化する。例「ぼこう(母校)」が「ぼこお」へ変化する等、
(c)「し」と「ひ」が入れ替わる。例「ひつじ(羊)」と「しつじ」等、
(d)その他、ルール化できないもの。例「ぜんいん(全員)」が「ぜえいん」へ変化する、「ばあい(場合)」が「ばわい」へ変化する等。
【0054】
また、第1の頻度計数部17は、音声認識部12がなまけコマンドを認識する頻度を当該なまけコマンドが示す制御内容ごとに計数する。例えば、音声認識部12がなまけ傾向1に属する「れびをつけて」を認識した場合、制御内容「テレビ24の電源をオンする」について、なまけ傾向1の頻度を計数する。
【0055】
これに対して、第2の頻度計数部18は、音声認識部12がなまけコマンドを認識する頻度を当該なまけコマンドが属する発話なまけの傾向ごとに計数する。例えば、音声認識部12がなまけ傾向1に属する「れびをつけて」を認識した場合、総ての制御内容について、なまけ傾向1の頻度を計数する。
【0056】
照合対象削除部16は、第1の頻度計数部17又は第2の頻度計数部18により計数された頻度に応じて、音声認識部12の照合対象から削除するなまけコマンドを制御内容ごと又は発話なまけの傾向ごとに特定しても構わない。
【0057】
次に、図9を参照して、図1の音声認識制御装置10の動作手順の一例を説明する。
【0058】
(イ)先ず、音声認識制御装置10に電源が供給され、音声認識制御装置10が作動状態になると、音声認識制御装置10は、コントローラ11の運転スイッチ60iがオン状態であるか否かを判断する(S101)。判断の結果、オン状態である場合(S101でYES)、ステップS103へ進む。
【0059】
(ロ)ステップS103において、音声入力部40にユーザの発話音声が入力されたか否かを判断する。ユーザの発話音声が入力されて音声信号が音声認識部12へ出力された場合(S103でYES)ステップS105へ進み、発話音声が入力されなかった場合(S103でNO)、ステップS117に進む。
【0060】
(ハ)ステップS105において、音声認識部12は、照合用データ記憶部14に格納された照合用データと音声入力部40から出力された音声信号とを照合してユーザが発する音声が所定の音声コマンド又はなまけコマンドに該当するか否かを判定する。音声コマンド又はなまけコマンドに該当すると判定した(音声認識に成功した)場合(S105でYES)、当該音声コマンド又はなまけコマンドに対応する所定の信号を制御実行部13へ出力し、ステップS107に進む。一方、音声コマンド又はなまけコマンドに該当すると判定しない(音声認識に失敗した)場合(S105でNO)、音声認識できない旨を液晶表示装置72に表示し、その後、S117に進む。
【0061】
(ニ)ステップS107において、制御実行部13は当該音声コマンドに対応する被制御機器20の制御を実行する。その後、ステップS109に進む。
【0062】
(ホ)ステップS109において、音声認識部12は、入力された音声が音声コマンド又はなまけコマンドに該当するか否かの判定結果に基づいて、ユーザの発話なまけの傾向を特定する。例えば、ステップS105において音声認識部12が図6のなまけ傾向1に属する「れびをつけて」及び図6のなまけ傾向3に属する「てえびをつけて」をそれぞれ認識した場合、音声認識部12は、ユーザがなまけ傾向1及びなまけ傾向3を有すると特定する。その後、ステップS111へ進む。
【0063】
(へ)ステップS111において、第1の頻度計数部17及び第2の頻度計数部18は、音声認識部12がなまけコマンドを認識する頻度を計数する。例えば、「れびをつけて」及び「てえびをつけて」を認識した場合、第1の頻度計数部17は、「テレビ24の電源をオンする」制御内容について、なまけ傾向1及びなまけ傾向3の頻度を計数し、第2の頻度計数部18は、総ての制御内容について、なまけ傾向1及びなまけ傾向3の頻度を計数する。その後、ステップS113へ進む。
【0064】
(ト)ステップS113において、照合対象削除部16は、第1の頻度計数部17又は第2の頻度計数部18により計数された頻度に応じて、音声認識部12の照合対象からなまけコマンドを削除するか否かを判断する。削除する場合(S113でYES)ステップS115へ進み、照合対象削除部16は、音声認識部12の照合対象から削除するなまけコマンドを制御内容ごと又は発話なまけの傾向ごとに特定し、なまけコマンドの削除を実行する。その後、ステップS117へ進む。一方、削除しない場合(S113でNO)ステップS117へ進む。
【0065】
(チ)ステップS117において、コントローラ11の運転スイッチ60iがオフされたか否かを判断する。オフされた場合(S117でYES)、図9のフローチャートは終了し、オン状態に維持されている場合(S117でNO)、ステップS103に戻る。
【0066】
図6は、図9のフローチャートに示す動作手順により、音声認識部12の照合対象からなまけコマンドを削除した結果の一例を示す表である。ここでは、第2の頻度計数部18により計数された発話なまけの傾向ごとの頻度に応じて、音声認識部12の照合対象からなまけ傾向2に属する総てのなまけコマンドを削除した例を示す。図9のステップS105において音声認識部12が「れびをつけて」及び「てえびをつけて」を認識し、ステップS109において音声認識部12がユーザはなまけ傾向1及びなまけ傾向3を有すると特定し、ステップS111において第2の頻度計数部18がなまけ傾向1及びなまけ傾向3全体の頻度を計数している。このような手順による頻度の計数を繰り返し実施し、統計が取れる程度まで繰り返された時に、ステップS115において照合対象削除部16は、第2の頻度計数部18により計数された頻度に応じて、音声認識部12の照合対象から、当該ユーザにとって必要のないなまけ傾向2に属する総てのなまけコマンドを削除する。すなわち、図6の「てれびをつけ」及び「あかりをつけ」など「語尾の弱化(なまけ傾向2)」に属するなまけコマンドの総てを照合対象から削除する。
【0067】
以上説明したように、本発明の第1の実施の形態によれば、なまけコマンドを認識する頻度に応じて音声認識部12の照合対象から削除するなまけコマンドを特定することにより、ユーザにとって必要のないなまけコマンドを削除することができる。よって、照合対象となる照合用データのデータ量が削減されるので、音声認識率が向上し、誤認識及びこれによる誤動作が抑制される。
【0068】
なお、図9のフローチャートでは、ステップS111において頻度の計数を実施し、第1の頻度計数部17又は第2の頻度計数部18により計数された頻度に応じて、なまけコマンドの削除を実行する場合を示したが、第1の実施の形態における動作手順はこれに限らない。例えば、ステップS109において特定されたユーザの発話なまけの傾向に基づいて、認識頻度の計数(S111)を実施することなく、S113へ進んで、なまけコマンドの削除を判断及び実行してもよい。即ち、照合対象削除部16は、音声認識部12により特定されたユーザの発話なまけの傾向を参照して、音声認識部12の照合対象から削除するなまけコマンドを特定してもよい。
【0069】
或いは、入力された音声が所定の音声コマンド又はなまけコマンドに該当するか否かの判定の結果(S105)に基づいて、なまけ傾向の特定(S109)及び認識頻度の計数(S111)を実施することなく、S113へ進んで、なまけコマンドの削除を判断及び実行してもよい。即ち、照合対象削除部16は、入力された音声が所定の音声コマンド又はなまけコマンドに該当するか否かの音声認識部12による判定の結果に基づいて、音声認識部12の照合対象から削除するなまけコマンドを特定してもよい。
(第2の実施の形態)
音声認識制御装置10の使用を開始する前にユーザに対して所定の初期発話を促す「調整モード」について説明する。第2の実施の形態では、コントローラオンオフスイッチ60iを操作してコントローラ11の電源をオンさせる度に、すべてのユーザに対して調整モードを実施する場合について説明する。
【0070】
図10は、第2の実施の形態に係わる図1の音声認識制御装置10の動作手順の一例を示すフローチャートである。
【0071】
(イ)先ず、音声認識制御装置10に電源が供給され、音声認識制御装置10が作動状態になると、音声認識制御装置10は、コントローラ11の運転スイッチ60iがオン状態であるか否かを判断する(S201)。判断の結果、オン状態である場合(S201でYES)、ステップS203へ進む。
【0072】
(ロ)ステップS203において、液晶表示装置72は、ユーザに対して所定の初期発話を促すための画面に表示する。そして、ユーザが初期発話を行い、音声入力部40に音声が入力された場合(S205でYES)、ステップS207に進み、音声入力部40に音声が入力されない場合(S205でNO)、ステップS203に戻り、再度、所定の初期発話を促すための画面に表示する。
【0073】
(ハ)ステップS207において、音声認識部12は、照合用データ記憶部14に格納された照合用データと音声入力部40から出力された音声信号とを照合してユーザが発する音声が所定の音声コマンド又はなまけコマンドに該当するか否かを判定する。音声コマンド又はなまけコマンドに該当すると判定した(音声認識に成功した)場合(S207でYES)、ステップS211に進み、音声コマンド又はなまけコマンドに該当すると判定しない(音声認識に失敗した)場合(S207でNO)、音声認識できない旨を液晶表示装置72に表示し(S209)、その後、ステップS203に戻る。
【0074】
(ニ)ステップS211において、音声認識部12は、入力された音声が音声コマンド又はなまけコマンドに該当するか否かの判定結果に基づいて、ユーザの発話なまけの傾向を特定する。
【0075】
(ホ)ステップS213に進み、照合対象削除部16は、音声認識部12により特定されたユーザの発話なまけの傾向を参照して、音声認識部12の照合対象からなまけコマンドを削除するか否かを判断する。削除する場合(S213でYES)ステップS215へ進み、照合対象削除部16は、音声認識部12の照合対象から削除するなまけコマンドを特定し、なまけコマンドの削除を実行する。その後、ステップS217へ進む。一方、削除しない場合(S213でNO)ステップS217へ進む。
【0076】
(へ)ステップS217において、音声認識部12が総ての発話なまけの傾向について判定を行ったか否かを判断し、総ての発話なまけの傾向について判定を行った場合(S217でYES)、図10のフローチャートは終了し、総ての発話なまけの傾向について判定を行っていない場合(S217でNO)、ステップS203に戻る。
【0077】
以上説明したように、本発明の第2の実施の形態によれば、「調整モード」において、音声認識制御装置10の使用を開始する前にユーザに対して所定の初期発話を促し、入力された初期発話から、ユーザの発話なまけの傾向を特定することにより、音声認識制御装置10の使用を開始する時から、照合対象となる照合用データのデータ量を削減することができる。
【0078】
なお、所定の初期発話をユーザに促すための手段としては、液晶表示装置72などによる画面表示に限らず、音声出力部50による音声案内であっても構わない。
(第3の実施の形態)
第3の実施の形態では、予めユーザごとに発話なまけの傾向を登録しておき、音声認識制御装置10の使用を開始する前に話者の識別を実施する場合について説明する。
【0079】
図7は、ユーザごとの発話なまけの傾向の例を示す表である。照合対象削除部16は、ユーザごとの発話なまけの傾向を記憶する第2のメモリを備える。初めて音声認識制御装置10を使用するユーザに対して前記の「調整モード」を実施し、ユーザごとに発話なまけの傾向を特定し、第2のメモリに予め記憶しておく。そして、以下に示す「話者識別モード」を音声認識制御装置10の使用を開始する前に実施する。
【0080】
図11は、第3の実施の形態に係わる図1の音声認識制御装置10の動作手順の一例を示すフローチャートである。
【0081】
(イ)先ず、音声認識制御装置10に電源が供給され、音声認識制御装置10が作動状態になると、音声認識制御装置10は、コントローラ11の運転スイッチ60iがオン状態であるか否かを判断する(S301)。判断の結果、オン状態である場合(S301でYES)、ステップS303へ進む。
【0082】
(ロ)ステップS303において、液晶表示装置72は、ユーザに対して所定の発話を促すための画面に表示する。そして、ユーザが所定の発話を行い、音声入力部40に音声が入力された場合(S305でYES)、ステップS307に進み、音声入力部40に音声が入力されない場合(S305でNO)、ステップS303に戻り、再度、所定の発話を促すための画面に表示する。
【0083】
(ハ)ステップS307において、話者識別部19は、自らが備えるメモリに格納されたユーザごとの音声データと音声入力部40に入力された音声とを比較して当該音声を発話する話者を識別する。話者の識別に成功した場合(S307でYES)、ステップS309に進み、話者の識別に失敗した場合(S307でNO)、ステップS303に戻る。
【0084】
(ニ)ステップS309において、照合対象削除部16は、ユーザごとに発話なまけの傾向を記憶する第2のメモリを参照して、識別された話者の発話なまけの傾向を特定する。
【0085】
(ホ)ステップS311に進み、照合対象削除部16は、特定されたユーザの発話なまけの傾向を参照して、音声認識部12の照合対象からなまけコマンドを削除するか否かを判断する。削除する場合(S311でYES)ステップS313へ進み、照合対象削除部16は、音声認識部12の照合対象から削除するなまけコマンドを特定し、なまけコマンドの削除を実行して、図11のフローチャートは終了する。一方、削除しない場合(S213でNO)、なまけコマンドの削除を実行せずに、図11のフローチャートは終了する。
【0086】
以上説明したように、本発明の第3の実施の形態によれば、発話なまけの傾向は各話者によってほぼ特定されるので、話者識別部19により識別された話者に応じて照合対象から削除するなまけコマンドを変更することにより、ユーザ(話者)ごとに適切ななまけコマンドを選択することができ、音声認識率が向上する。
【0087】
なお、所定の発話をユーザに促すための手段としては、液晶表示装置72などによる画面表示に限らず、音声出力部50による音声案内であっても構わない。
【0088】
上記のように、本発明は、3つの実施形態によって記載したが、この開示の一部をなす論述及び図面はこの発明を限定するものであると理解すべきではない。この開示から当業者には様々な代替実施の形態、実施例及び運用技術が明らかとなろう。
【0089】
本発明に係わる音声認識制御装置は、浴室に限らず、寝室、リビング、会社のデスク付近及び会議室など、他の箇所に適用することが可能であり、これらの部屋に設置されている電気器具の制御を行うことができる。また、本発明に係わる音声認識制御装置は、自動車等のナビゲーション装置、携帯電話、パーソナルコンピュータなど、音声認識機能を用いて操作可能な機器に対しても適用可能である。
【0090】
また、図8に示すように、被制御機器20ごとに、音声コマンドと制御内容の対応関係をまとめた表を、液晶表示装置72に表示したり、或いは音声認識制御装置10の使用説明書などに記載しておく。これにより、ユーザは、所望する制御内容に対応する音声コマンドを直ぐに認識できるので、音声による命令の正しい発話方法を容易に学習することができる。
【0091】
このように、本発明はここでは記載していない様々な実施の形態等を包含するということを理解すべきである。したがって、本発明はこの開示から妥当な特許請求の範囲に係る発明特定事項によってのみ限定されるものである。
【図面の簡単な説明】
【0092】
【図1】本発明の第1の実施の形態に係わる音声認識制御装置10及び被制御機器20の具体的な構成を示すブロック図である。
【図2】図1に示した音声認識制御装置10及び被制御機器20の配置例を示す浴室内の外観図である。
【図3】図1及び図2に示したコントローラ11の操作面のレイアウトを示す平面図である。
【図4】音声認識部12により特定される発話なまけの傾向を例示する表である。
【図5】音声コマンド及びなまけコマンドの例を示す表である。
【図6】図9のフローチャートに示す動作手順により、音声認識部12の照合対象からなまけコマンドを削除した結果の一例を示す表である。
【図7】ユーザごとの発話なまけの傾向の例を示す表である。
【図8】被制御機器20ごとに音声コマンドと制御内容の対応関係をまとめた表である。
【図9】図1の音声認識制御装置10の動作手順の一例を示すフローチャートである。
【図10】第2の実施の形態に係わる図1の音声認識制御装置10の動作手順の一例を示すフローチャートである。
【図11】第3の実施の形態に係わる図1の音声認識制御装置10の動作手順の一例を示すフローチャートである。
【符号の説明】
【0093】
3…浴槽
10…音声認識制御装置
11…コントローラ
12…音声認識部
13…制御実行部
14…照合用データ記憶部
15…制御IF部
16…照合対象削除部
17…第1の頻度計数部
18…第2の頻度計数部
19…話者識別部
20…被制御機器
21…照明機器
21a…主照明
21b…間接照明
22…空調機器
23…給湯器
24…テレビ
25…ジェット噴流バス装置
25a…噴出口
25b…吸込口
26…ミストサウナ装置
40…音声入力部
41…マイク
50…音声出力部
53…スピーカ
60…発話促進部(発話促進手段)
60a…メニューボタン
60b…確定ボタン
60c…戻るボタン
60d…十字キー
60e…優先ボタン
60f…追いだきボタン
60g…ふろ自動ボタン
60h…通話ボタン
60i…コントローラオンオフスイッチ
70…表示部
71…LED
72…液晶表示装置

【特許請求の範囲】
【請求項1】
ユーザが発話する音声が所定の音声コマンドに該当すると認識した場合は、当該認識した音声コマンドに対応する制御を実行し、
ユーザが発話する音声が当該音声コマンドをなまけて発話した時の音声に対応するなまけコマンドに該当すると認識した場合は、前記音声コマンドに対応する制御を実行する音声認識制御装置において、
前記音声認識制御装置が認識することができる音声コマンドの照合用データ及び前記なまけコマンドの照合用データを格納する照合用データ記憶部と、
前記ユーザが発話する音声を入力し、この音声を所定の音声信号に変換する音声入力部と、
前記音声入力部によって変換された音声信号と前記照合用データ記憶部に格納された照合用データとを照合して、前記入力された音声が所定の音声コマンド又はなまけコマンドに該当するか否かを判定する音声認識部と、
前記音声認識部による判定の結果に基づいて、前記ユーザにとって必要のないなまけコマンドを特定し前記音声認識部の照合対象から削除する照合対象削除部と
を備えることを特徴とする音声認識制御装置。
【請求項2】
前記ユーザに対して所定の初期発話を促す発話促進手段を更に備え、
前記音声認識部は、前記初期発話の音声が所定の音声コマンド又はなまけコマンドに該当するか否かを判定し、前記照合対象削除部は、前記初期発話の判定の結果に基づいて、前記ユーザにとって必要のないなまけコマンドを前記音声認識部の照合対象から削除することを特徴とする請求項1記載の音声認識制御装置。
【請求項3】
前記発話促進手段は、前記ユーザに対して前記所定の初期発話を促すための画面に表示する表示手段であることを特徴とする請求項2記載の音声認識制御装置。
【請求項4】
前記照合対象削除部は、前記音声認識部がなまけコマンドを認識する頻度が低いなまけコマンドを特定し、前記音声認識部の照合対象から削除することを特徴とする請求項1乃至3いずれか一項に記載の音声認識制御装置。
【請求項5】
前記音声認識部がなまけコマンドを認識する頻度を当該なまけコマンドが示す制御内容ごとに計数する第1の頻度計数部を更に備え、
前記照合対象削除部は、前記第1の頻度計数部により計数された前記頻度に応じて、前記音声認識部の照合対象から削除するなまけコマンドを前記制御内容ごとに特定することを特徴とする請求項4に記載の音声認識制御装置。
【請求項6】
前記音声認識部がなまけコマンドを認識する頻度を当該なまけコマンドが属する発話なまけの傾向ごとに計数する第2の頻度計数部を更に備え、
前記照合対象削除部は、前記第2の頻度計数部により計数された前記頻度に応じて、前記音声認識部の照合対象から削除するなまけコマンドを前記発話なまけの傾向ごとに特定することを特徴とする請求項4に記載の音声認識制御装置。
【請求項7】
前記音声入力部に入力された音声に基づいて当該音声を発話する話者を識別する話者識別部を更に備え、
前記照合対象削除部は、前記話者識別部により識別された話者に応じて、前記音声認識部の照合対象から削除するなまけコマンドを変更することを特徴とする請求項1乃至3いずれか一項に記載の音声認識制御装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate


【公開番号】特開2009−109585(P2009−109585A)
【公開日】平成21年5月21日(2009.5.21)
【国際特許分類】
【出願番号】特願2007−279455(P2007−279455)
【出願日】平成19年10月26日(2007.10.26)
【出願人】(000005832)パナソニック電工株式会社 (17,916)
【Fターム(参考)】