説明

音声認識装置

【課題】音声認識率を向上させる。
【解決手段】ユーザが発したコマンドと同一機能に分類された他の音声認識コマンドがコマンド一覧情報にあるか否かを判定し(S108)、ユーザが発したコマンドと同一機能に分類された他の音声認識コマンドがコマンド一覧情報にあると判定(S108でYESと判定)した場合、コマンドと同一機能に分類された他の音声認識コマンドをコマンド一覧情報から削除する(S112)。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、機能毎に分類された音声認識コマンドが登録されたコマンド一覧情報の中からユーザが発したコマンドを認識し、認識したコマンドに応じた機能動作を行う音声認識装置に関する。
【背景技術】
【0002】
従来、ユーザの音声入力に応じて音声認識を行う音声認識装置が種々提案されている(例えば、特許文献1参照)。
【特許文献1】特開2004−101070号公報
【発明の開示】
【発明が解決しようとする課題】
【0003】
このような音声認識装置は、予め登録された多数の音声認識コマンドの中からユーザの音声入力と一致するコマンドを特定してコマンドを音声認識するようになっている。したがって、登録されている音声認識コマンドの数が多いほどユーザの発したコマンドが誤認識されやすく、音声認識率が低下してしまう。
【0004】
本発明は上記問題に鑑みたもので、音声認識率を向上させることを目的とする。
【課題を解決するための手段】
【0005】
上記目的を達成するため、本発明の第1の特徴は、ユーザが発したコマンドと同一機能に分類された他の音声認識コマンドがコマンド一覧情報にあるか否かを判定し、ユーザが発したコマンドと同一機能に分類された他の音声認識コマンドがコマンド一覧情報にあると判定した場合、コマンドと同一機能に分類された他の音声認識コマンドをコマンド一覧情報から削除することである。
【0006】
このような構成では、ユーザが発したコマンドと同一機能に分類された他の音声認識コマンドがコマンド一覧情報にあると判定した場合、コマンドと同一機能に分類された他の音声認識コマンドがコマンド一覧情報から削除されるので、コマンド一覧情報に含まれる音声認識コマンドの数が少なくなり、音声認識率を向上させることができる。
【0007】
また、本発明の第2の特徴は、音声認識コマンド削除手段が、ユーザ確認手段によって確認されたユーザ毎に用意されたコマンド一覧情報からコマンドと同一機能に分類された他の音声認識コマンドを削除することである。
【0008】
このような構成では、ユーザ毎にコマンド一覧情報が用意され、ユーザ確認手段によって確認されたユーザ用に用意されたコマンド一覧情報からコマンドと同一機能に分類された他の音声認識コマンドが削除されるので、他のユーザの使用によって、コマンド一覧情報から音声認識コマンドが削除されてしまうようなことをなくすことができる。
【発明を実施するための最良の形態】
【0009】
本発明の一実施形態に係る音声認識装置の構成を図1に示す。本音声認識装置は、ナビゲーション装置1を用いて構成されている。ナビゲーション装置1は、LCD10、GPSレシーバ11、ジャイロセンサ12、メモリ13、DVDデッキ14、音声インタフェース(図中では、音声I/Fと記す)15およびCPU16を備えている。なお、図示してないが、CPU16と各部10〜15との間は、基板上の配線パターンあるいはケーブルを介して接続されている。また、CPU16には、音声認識の開始を指示するためのPTT(Push to Talk)スイッチ20が接続され、音声インタフェース16には、ユーザの音声を集音するためのマイク21および音声を出力するためのスピーカ22が接続されている。
【0010】
LCD10は、CPU16から入力される映像信号に応じた映像を表示するための装置である。
【0011】
GPSレシーバ11には、GPS衛星から送信される電波を受信するGPSアンテナ11aが接続されている。GPSレシーバ11は、GPSアンテナ11aから入力される信号に基づいて自車位置を特定するための信号をCPU16へ出力する。
【0012】
ジャイロセンサ12は、自車の旋回角やロール角を検出し、検出信号をCPU16へ出力する。
【0013】
メモリ13は、プログラム等を記憶するROM、一時的にデータを格納するRAM、音声認識処理で用いられるコマンド一覧情報を記憶する書き換え可能な不揮発性記憶媒体(例えば、フラッシュメモリ、EEPROM等)によって構成されている。
【0014】
DVDデッキ14は、地図データや音楽データ等が記憶されたDVDディスクからデータを読み出すための装置である。
【0015】
音声インタフェース15は、マイク21を接続するためのマイク端子およびスピーカ22を接続するためのスピーカ端子(いずれも図示せず)を有している。音声インタフェース15は、マイク端子を介してマイク21から入力されるアナログ信号をデジタル信号に変換してCPU16へ出力するとともに、CPU16から入力されるデジタル信号をアナログ信号に変換してスピーカ端子を介してスピーカ22へ出力する。
【0016】
CPU16は、メモリ13のROMに記憶されたプログラムに従って各種処理を行う。CPU16の処理としては、GPSレシーバ11およびジャイロセンサ12から入力される信号に基づいて自車位置を特定する自車位置特定処理、DVDデッキ14を介してDVDメディアから自車位置周辺の地図データを読み出して、自車位置周辺の地図上に自車位置マークを重ねてLCD10に表示させる地図表示処理、音声インタフェース15を介してマイク21から入力される音声信号の音声認識を行う音声認識処理等がある。
【0017】
次に、音声認識処理について説明する。ユーザがPTTスイッチ20を押下すると音声認識処理が開始される。この音声認識処理が開始された状態で、ユーザがコマンドを発すると、CPU16は、多数の音声認識コマンドが登録されたコマンド一覧情報の中からユーザが発したコマンドと一致する音声コマンドを検索して音声認識を行う。
【0018】
図2に、コマンド一覧情報の概要を示す。図に示すように、機能Aに対してコマンドA1、A2、A3、…に示すような複数の音声認識コマンドが登録されている。同様に、機能B、機能C、機能D、…等の各機能に対してもそれぞれ複数の音声認識コマンドが登録されている。
【0019】
例えば、地図を拡大表示する機能に対しては、「拡大」、「詳細」、「ズームイン」の各音声認識コマンドが登録されており、地図を縮小する機能に対しては、「縮小」、「広域」、「ズームアウト」の各音声認識コマンドが登録されている。
【0020】
CPU16は、図2に示すような、機能毎に分類された音声認識コマンドが登録されたコマンド一覧情報を参照して、ユーザが発したコマンドを音声認識し、認識したコマンドに応じた機能動作を行う。
【0021】
すなわち、CPU16は、ユーザによって、「拡大」、「詳細」、「ズームイン」のいずれかが発せられると、コマンド一覧情報を参照してユーザが発したコマンドを音声認識し、音声認識したコマンドに応じた「地図を拡大表示する機能」を実施する。また、ユーザによって、「縮小」、「広域」、「ズームアウト」のいずれかが発せられると、コマンド一覧情報を参照してユーザが発したコマンドを音声認識し、音声認識したコマンドに応じた「地図を縮小表示する機能」を実施する。
【0022】
しかし、このように1つの機能に対して複数の音声認識コマンドが登録されていても、ユーザは特定のコマンドしか使用しない場合が多い。例えば、図2の太線に示すように、機能AについてはコマンドA1、機能BについてはコマンドB2、機能CについてはコマンドC1、機能DについてはコマンドD3といったように、複数の音声認識コマンドが用意されていても、いつも決まったコマンドしか使用しない場合が多い。
【0023】
そこで、本ナビゲーション装置1では、ユーザが使用するコマンドをコマンド一覧情報に残し、ユーザが使用したコマンドと同一機能に分類された他のコマンド(言い替えコマンド)をコマンド一覧情報から削除することにより、コマンド一覧情報に登録されている音声認識コマンドの数を減らす処理を行う。
【0024】
また、本ナビゲーション装置1は、予めメニュー画面に従ってユーザ毎にユーザ情報を登録するようになっている。ナビゲーション装置1のCPU16は、ユーザによってユーザ情報の登録操作が行われると、ユーザ毎にコマンド一覧情報を用意するようになっている。
【0025】
次に、図3に示すフローチャートに従って、CPU16の処理について説明する。イグニッションスイッチがオンしてバッテリから電源が供給されると、ナビゲーション装置1は動作状態となり、CPU16は、図3に示す処理を開始する。
【0026】
まず、ユーザ確認を行う(S100)。具体的には、ユーザ情報を入力する画面をLCD10に表示させ、この画面に従って入力されるユーザ情報が予めユーザ登録によって登録されているか否かに基づいてユーザ確認を行う。
【0027】
なお、ユーザ情報の入力画面に従って入力されたユーザ情報がユーザ登録されていない場合、図示してないが、ユーザを確認することができないことを示すメッセージをLCD10に表示させて、S100のユーザ確認を繰り返す。
【0028】
ユーザ情報の入力画面に従って入力されたユーザ情報がユーザ登録されている場合、次に、PTTスイッチ20がオンしたか否かを判定する(S102)。具体的には、PTTスイッチ20から入力される信号に基づいてPTTスイッチ20がオンしたか否かを判定する。
【0029】
ユーザによってPTTスイッチ20が押下されない場合、S102の判定はNOとなり、S102の判定を繰り返す。また。ユーザによってPTTスイッチ20が押下されると、S102の判定はYESとなり、次に、音声認識の開始を示すアイコンをLCD10に表示させる(S104)。
【0030】
次に、コマンド認識を行う(S106)。具体的には、音声インタフェース15を介してマイク21から入力されるコマンド(音声データ)と、先のS100のユーザ確認にて確認されたユーザ用に用意されたコマンド一覧情報に含まれる音声認識コマンド(音声データ)を比較して、コマンド認識を行う。
【0031】
次に、認識したコマンドの言い替えコマンドがコマンド一覧情報にあるか否かを判定する(S108)。具体的には、認識したコマンドと同一機能に分類された他のコマンド(言い替えコマンド)がコマンド一覧情報にあるか否かを判定する。
【0032】
認識したコマンドの言い替えコマンドがコマンド一覧情報にない場合、S108の判定はNOとなり、次に、認識したコマンドに応じた機能動作を行う(S110)。例えば、認識したコマンドが「拡大」の場合、地図を拡大表示させ、認識したコマンドが「縮小」の場合、地図を拡大表示させる。そして、認識したコマンドに応じた機能動作を実施すると、S102へ戻り、上記した処理を繰り返す。
【0033】
また、認識したコマンドの言い替えコマンドがコマンド一覧情報にある場合、S108の判定はYESとなり、次に、認識したコマンドと同一機能に分類された他のコマンド(言い替えコマンド)をコマンド一覧情報から削除する(S112)。例えば、認識したコマンドが「拡大」の場合、「詳細」、「ズームイン」といった言い替えコマンドをコマンド一覧情報から削除し、認識したコマンドが「縮小」の場合、「広域」、「ズームアウト」といった言い替えコマンドをコマンド一覧情報から削除する。
【0034】
そして、言い替えコマンドのコマンド一覧情報からの削除が終わると、S110へ進む。
【0035】
したがって、上記した処理を繰り返すことにより、各種機能の言い替えコマンドがコマンド一覧情報から削除され、コマンド一覧情報に登録されている音声認識コマンドの数が減少していく。
【0036】
また、S100のユーザ確認において、別のユーザが確認された場合、そのユーザ用に用意されたコマンド一覧情報を用いてS102〜S112の処理が行われる。
【0037】
なお、本ナビゲーション装置1は、メニュー画面に従って、各種言い替えコマンドが削除されたコマンド一覧情報を、初期状態に戻すことができるようになっている。
【0038】
上記した構成によれば、ユーザが発したコマンドと同一機能に分類された他の音声認識コマンドがコマンド一覧情報にあるか否かを判定し、ユーザが発したコマンドと同一機能に分類された他の音声認識コマンドがコマンド一覧情報にあると判定した場合、コマンドと同一機能に分類された他の音声認識コマンドをコマンド一覧情報から削除するので、コマンド一覧情報に含まれる音声認識コマンドの数が少なくなり、音声認識率を向上させることができる。
【0039】
また、ユーザ毎にコマンド一覧情報が用意され、ユーザ確認によって確認されたユーザ用に用意されたコマンド一覧情報からコマンドと同一機能に分類された他の音声認識コマンドが削除されるので、他のユーザの使用によって、コマンド一覧情報から音声認識コマンドが削除されてしまうようなことをなくすことができる。
【0040】
なお、上記実施形態における構成と特許請求の範囲の構成との対応関係について説明すると、S108が判定手段に相当し、S112が音声認識コマンド削除手段に相当し、S100がユーザ確認手段に相当する。
【0041】
また、上記実施形態では、上記実施形態では、音声認識装置として音声認識機能を備えたナビゲーション装置の例を示したが、ナビゲーション装置に限定されるものではなく、各種音声認識機能を備えた装置に適用することができる。
【図面の簡単な説明】
【0042】
【図1】本発明の一実施形態に係る音声認識装置の構成を示す図である。
【図2】コマンド一覧情報の概要を示す図である。
【図3】音声認識装置の処理を示すフローチャートである。
【符号の説明】
【0043】
1…ナビゲーション装置、10…LCD、11…GPSレシーバ、
11a…GPSアンテナ、12…ジャイロセンサ、13…メモリ、
14…DVDデッキ、15…音声インタフェース、16…CPU、
20…PTTスイッチ、21…マイク、22…スピーカ。

【特許請求の範囲】
【請求項1】
機能毎に分類された音声認識コマンドが登録されたコマンド一覧情報を参照してユーザが発したコマンドを音声認識し、認識したコマンドに応じた機能動作を行う音声認識装置であって、
前記ユーザが発したコマンドと同一機能に分類された他の音声認識コマンドが前記コマンド一覧情報にあるか否かを判定する判定手段と、
前記判定手段よって前記ユーザが発したコマンドと同一機能に分類された他の音声認識コマンドが前記コマンド一覧情報にあると判定された場合、前記コマンドと同一機能に分類された他の音声認識コマンドを前記コマンド一覧情報から削除する音声認識コマンド削除手段と、を備えたことを特徴とする音声認識装置。
【請求項2】
ユーザを確認するユーザ確認手段を備え、
前記コマンド一覧情報は、前記ユーザ確認手段によって確認されたユーザ毎に用意されており、
前記音声認識コマンド削除手段は、前記ユーザ確認手段によって確認されたユーザ用に用意された前記コマンド一覧情報から前記コマンドと同一機能に分類された他の音声認識コマンドを削除することを特徴とする請求項1に記載の音声認識装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate


【公開番号】特開2007−226098(P2007−226098A)
【公開日】平成19年9月6日(2007.9.6)
【国際特許分類】
【出願番号】特願2006−49881(P2006−49881)
【出願日】平成18年2月27日(2006.2.27)
【出願人】(000004260)株式会社デンソー (27,639)
【Fターム(参考)】