説明

音声認識装置、及びナビゲーションシステム

【課題】入力音声の言語に対応する言語辞書に速やかに切り替えることができる音声認識装置、及びナビゲーションシステムを提供する。
【解決手段】言語1辞書30a、言語2辞書30b、・・・、言語n辞書30cの各々が記憶する切り替えコマンドを集約した言語切り替え用辞書30dを用いて、この言語切り替え用辞書30dに記憶された切り替え用コマンドと入力音声との一致を判定する。そして、音声入力によってナビゲーションシステム1を操作する際に設定する言語辞書として、デフォルト設定された(現在設定された)言語辞書から、一致すると判定された切り替えコマンドに対応する言語辞書に切り替える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声認識装置、及びナビゲーションシステムに関するものである。
【背景技術】
【0002】
従来、複数の言語に対応可能な音声認識装置では、使用する言語を選択したうえで、その選択した言語で音声認識を開始する。このような音声認識装置において、言語の選択を音声入力で行おうとする場合、例えば、現在設定されている英語から日本語に言語を変更する場合には、英語を発声することによって日本語に変更することになるが、英語の話せないユーザは言語を変更することができなくなる。また、ユーザの発音が明瞭でない場合には入力音声を誤認識する可能性が高くなり、言語を容易に変更できない問題もある。
【0003】
このような問題を解決するものとして、例えば、特許文献1に記載された技術がある。この技術によれば、各言語毎の辞書(日本語辞書、英語辞書、及びドイツ語辞書)を記憶する音声辞書用メモリを備え、この音声辞書用メモリは、ナビゲーションシステムを操作する音声コマンドと、入力音声がどの言語区分に属するかを判断するための音声区分特定語句と、を含む音声認識のための認識対象語句を各辞書毎に記憶する。そして、音声入力及び音声認識が行われると、その音声認識結果に基づいて、音声辞書用メモリに記憶された辞書を順次切り替えて、入力音声と一致する認識対象語句を検索する。
【特許文献1】特開2001−83991号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
上述した従来技術は、音声辞書用メモリに記憶された各辞書を順次切り替えて入力音声と一致する認識対象語句を検索する。従って、入力音声の言語によっては、音声辞書用メモリに記憶された全ての辞書を対象に検索しなければ入力音声の言語が判断できない場合があり、また、より多くの言語をサポートする場合には、その検索により多くの時間が掛るという問題がある。
【0005】
本発明は、上記の問題を鑑みてなされたもので、入力音声の言語に対応する言語辞書に速やかに切り替えることができる音声認識装置、及びナビゲーションシステムを提供することを目的とする。
【課題を解決するための手段】
【0006】
上記目的を達成するためになされた請求項1記載の音声認識装置は、複数の異なる言語毎に、操作対象機器を操作するための音声コマンドと、言語辞書を切り替えるための切り替えコマンドと、を記憶する複数の言語辞書、及び複数の言語辞書の各々が記憶する切り替えコマンドを集約して記憶する言語切り替え用辞書を記憶する音声認識用記憶手段と、
音声を入力するための音声入力手段と、
音声入力手段から入力した入力音声と、言語切り替え用辞書に記憶された切り替えコマンドとが一致するかどうかを判定する判定手段と、
音声入力手段を介した音声入力によって操作対象機器を操作する際に設定する言語辞書として、現在設定されている言語辞書から判定手段によって一致すると判定された切り替えコマンドに対応する言語辞書に切り替える言語辞書切り替え手段と、を備えることを特徴とする。
【0007】
これにより、複数の言語辞書を順次切り替えて検索することなく、言語切り替え用辞書を用いて、入力音声と一致する切り替えコマンドを速やかに検索することができる。その結果、現在設定されている言語辞書から入力音声の言語に対応する言語辞書に速やかに切り替えることができるようになる。
【0008】
請求項2に記載の音声認識装置によれば、判定手段は、入力音声と一致するかどうかの判定対象のコマンドとして、言語切り替え用辞書に記憶された切り替えコマンドとともに、現在設定されている言語辞書に記憶された音声コマンドを判定対象とすることを特徴とする。これにより、現在設定されている言語辞書に記憶された音声コマンドを判定対象に含めて、入力音声が音声コマンドと一致するかどうかを判定することができる。
【0009】
請求項3に記載の音声認識装置によれば、判定手段は、音声コマンドに対して切り替えコマンドを優先して入力音声と一致するかどうかを判定することを特徴とする。これにより、切り替えコマンドから入力音声と一致するかどうかを判定することができ、また、入力音声が切り替えコマンドと一致しない場合であっても、現在設定されている言語辞書に記憶された音声コマンドと一致するかどうかを判定することができる。
【0010】
請求項4に記載のナビゲーションシステムは、請求項1〜3の何れか1項に記載の音声認識装置を備え、入力手段からの入力音声と一致する、言語辞書切り替え手段によって切り替えられた言語辞書に記憶された音声コマンドに基づいて、地図表示処理、施設検索処理、経路設定処理、及び経路案内処理の少なくとも1つの処理を実行することを特徴とする。これにより、ナビゲーションシステムにおける各種処理を音声入力によって実行させることが可能となる。
【発明を実施するための最良の形態】
【0011】
以下、本発明の音声認識装置が適用されたナビゲーションシステムについて、図面を用いて説明する。なお、本発明は、下記の実施形態に何ら限定されることなく、本発明の技術的範囲に属する限り、種々の形態を採り得ることは言うまでもない。
【0012】
図1は、ナビゲーションシステム1の全体構成を示すブロック図である。本ナビゲーションシステム1は、制御部10を中心に構成されており、この制御部10に接続される音声入出力制御部20、音声辞書用メモリ30、表示装置40、位置検出部50、地図データ入力器60、操作スイッチ群70及びリモコンセンサ80を備えている。なお、制御部10は通常のコンピュータとして構成されており、内部には、CPU、ROM、RAM、I/Oおよびこれらの構成を接続するバスラインなどが備えられている。また、制御部10は、音声制御を司る音声制御部11を備えている。
【0013】
音声入出力制御部20は、音声制御部11に接続されており、音声出力制御部21と音声入力制御部22とを備えている。音声出力制御部21にはスピーカ21aが接続されており、音声制御部11からの指示に基づき音声出力制御部21にて音声がスピーカ21aを介して出力される。音声出力制御部21はアンプ等から構成されており、音声信号を増幅して出力する。この音声は、例えば、機械的に合成された合成音声とする。
【0014】
一方、音声入力制御部22にはマイク22aが接続されており、音声入力制御部22は、フィルタ回路等から構成されており、マイク22aを介して入力されるユーザの入力音声から音声周波数以外のノイズを除去し、その後、音声制御部11へ送出する。この入力音声によって、ナビゲーションシステム1における各種処理を実行させることが可能となる。
【0015】
また、上述した音声辞書用メモリ30には、複数の異なる言語(言語1、言語2、・・・、言語n)毎に、ナビゲーションシステム1を操作するための音声コマンドと、上記各言語辞書を切り替えるための切り替えコマンドとを記憶した言語1辞書30a、言語2辞書30b、・・・、言語n辞書30cが記憶されている。さらに、図2に示すように、音声辞書用メモリ30には、上記の言語1辞書30a、言語2辞書30b、・・・、言語n辞書30cの各々が記憶する切り替えコマンドを集約した言語切り替え用辞書30dが記憶されている。
【0016】
表示装置40は、液晶やCRT等を用いたカラーディスプレイである。この表示装置40を介して、ナビゲーションシステム1からユーザへの情報表示が行われる。位置検出部50は、いずれも周知の地磁気センサ51、ジャイロスコープ52、距離センサ53、及び衛星からの電波に基づいて車両の位置を検出するGPS(Global Positioning System )のためのGPS受信機54を有している。
【0017】
これら各センサは各々が性質の異なる誤差を持っているため、複数のセンサにより、各々補間しながら使用するように構成されている。なお、精度によっては上述した内の一部で構成してもよく、更に、ステアリングの回転センサ、各転動輪の車輪センサ等を用いてもよい。
【0018】
地図データ入力器60は、位置検出の精度向上のためのいわゆるマップマッチング用データ、地図データ等を含む各種データを入力するための装置である。記憶媒体としては、そのデータ量からCD−ROMを用いるのが一般的であるが、例えばDVDやメモリカード等の他の媒体を用いても差し支えない。
【0019】
操作スイッチ群70は、例えば表示装置40と一体になったタッチスイッチもしくはメカニカルなスイッチ等で構成され、各種入力に使用される。リモコンセンサ80は、リモートコントロール端末(以下「リモコン」という。)80aを介した利用者の操作情報を取得する。
【0020】
上述した、制御部10、表示装置40、位置検出部50、地図データ入力器60、操作スイッチ群70、リモコンセンサ80等により、いわゆるナビゲーション装置が構成される。表示装置40の画面には、位置検出部50から入力された車両現在地マークと、地図データ入力器60より入力された地図データと、更に地図上に表示する案内経路、名称、目印等の付加データとを重ねて表示することができる。
【0021】
そして、本ナビゲーションシステム1では、リモコン80aを介してリモコンセンサ80から、操作スイッチ群70から、あるいは、マイク22aを介して音声入力制御部22から、目的地の位置および、必要に応じて高速道路等の特定の経路の指定(すなわち通過点の指定)を入力すると、現在地からその目的地までの最適な経路が自動的に選択され、案内経路が形成されて表示される。
【0022】
このような自動的に最適な経路を設定する経路設定処理に用いられる手法は、ダイクストラ法等の手法が知られている。そして、この案内経路が形成され表示された後、車両の走行状況に応じて音声出力制御部21からスピーカ21aを介してルートを案内する音声が出力される。なお、この案内経路の設定・表示については本発明の主要な特徴部分ではないので、詳しい説明は省略する。ナビゲーションシステム1は、このような経路案内処理に加えて、地図上の施設を検索する施設検索処理や車両現在地マークとその周辺の地図を表示する地図表示処理を実行する。
【0023】
ナビゲーションシステム1は、音声入力に用いる言語辞書を言語1辞書30a、言語2辞書30b、・・・、言語n辞書30cの何れかに切り替えることができるものであり、その切り替えのための入力を音声によって可能としたものである。
【0024】
次に、この言語辞書を切り替える言語辞書切り替え処理について、図4のフローチャートに基づいて説明する。なお、図4に示す言語辞書切り替え処理は、音声制御部11にて実行されるものであり、本ナビゲーションシステム1への電源投入時に自動的に実行される。例えば車両に搭載した場合には、車両のエンジン始動時に、もしくは、アクセサリのオン(ACCオン)時に自動的に実行されることになる。ただし、これに限らず、例えば、ユーザからのスイッチ操作によって実行されるようにしてもよい。
【0025】
また、ナビゲーションシステム1が工場から出荷される前に、言語1辞書30a、言語2辞書30b、・・・、言語n辞書30cの何れかの言語辞書が、音声入力に用いる言語辞書としてデフォルト設定されており、後述する言語辞書切り替え処理によって言語辞書が切り替えた場合には、その切り替えられた言語辞書をその後の音声入力に用いる言語辞書としてデフォルト設定し直す。従って、ユーザが最初にナビゲーションシステム1を使用する場合に設定されている言語辞書は、デフォルト設定された言語辞書となる。
【0026】
図4に示すステップS10において、表示装置40による画面表示を行う。この処理は、ユーザからの音声入力を促す処理であり、言語1、言語2、・・・、言語nの各々の言語で、言語切り替えのための発話内容を画面表示して、その発話内容をユーザに発声させる。具体的には、例えば、日本語の場合には、「言語切り替え_日本語」などの画面表示を行う。
【0027】
ステップS20では、言語切り替え用辞書30dと、デフォルト設定された(現在設定された)言語辞書の2つの辞書を、入力音声と一致するかどうかの判定(検索)対象として設定する。例えば、図3に示すように、デフォルト設定された(現在設定された)言語辞書が言語1辞書30aの場合には、言語切り替え用辞書30dと言語1辞書30aを設定する。
【0028】
ステップS30では、音声入力及び音声認識を行う。ユーザからの入力音声は、上述したようにマイク22aを介し音声入力制御部22から取り込まれる。従って、ここでは、音声入力制御部22から入力音声を取り込み、この入力音声と、ステップS20にて設定した言語切り替え用辞書30dに記憶された切り替え用コマンド、及び言語1辞書30aに記憶された音声コマンドとの一致を判定する。これにより、デフォルト設定された(現在設定された)言語1辞書30aに記憶された音声コマンドを判定対象に含めて、入力音声が音声コマンドと一致するかどうかを判定することができる。
【0029】
なお、ステップS30では、音声コマンドに対して切り替えコマンドを優先して入力音声と一致するかどうかを判定するとよい。これにより、切り替えコマンドから入力音声と一致するかどうかを判定することができ、また、入力音声が切り替えコマンドと一致しない場合であっても、デフォルト設定された(現在設定された)言語辞書に記憶された音声コマンドと一致するかどうかを判定することができる。
【0030】
ステップS40では、ステップS30における音声認識結果に基づき、入力音声が言語切り替え用辞書30dに記憶された切り替えコマンドと一致するかどうかを判定する。ここで、肯定判定される場合には、ステップS45において、デフォルト設定された(現在設定された)言語辞書から、一致した切り替えコマンドに対応する言語辞書に切り替えて、本処理を終了する。
【0031】
一方、否定判定される場合には、ステップS50では、入力音声がデフォルト設定された(現在設定された)言語1辞書30aに記憶された音声コマンドと一致するかどうかを判定する。ここで、肯定判定される場合には、言語辞書を切り替える必要がないため、本処理を終了する。
【0032】
ステップS60では、言語切り替え用辞書30d、及び言語1辞書30aを除く他の言語辞書(言語2辞書30b、・・・、言語n辞書30c)のうちの何れかの言語辞書を入力音声と一致するかどうかの判定(検索)対象として設定する。ステップS70では、入力音声がステップS60にて設定した言語辞書に記憶された音声コマンドと一致するかどうかを判定する。ここで、肯定判定される場合には、ステップS75において、デフォルト設定された(現在設定された)言語辞書から、ステップS60にて設定した言語辞書に切り替えて、本処理を終了する。
【0033】
一方、否定判定される場合には、ステップS80にて判定(検索)していない言語辞書が有るかどうかを判定し、肯定判定される場合にはステップS60に移行し、否定判定される場合には、ステップS20に処理を移行して、上述した処理を繰り返し行う。
【0034】
なお、ステップS20〜S80までの処理が所定回数(例えば3回)繰り返されても特定の言語辞書への切り替えができなかった場合には、本処理を中止し、処理実行前にデフォルト設定されていた言語辞書を用いて、ナビゲーションシステム1の各種処理の音声入力及び音声認識を行う。また、その場合、本処理を中止し、手動による言語辞書切り替え、すなわち画面にメニューなどを表示してユーザに使用言語を選択させて、その選択した言語に相当する言語辞書に切り替えるようにしてもよい。
【0035】
このように、本実施形態のナビゲーションシステム1は、言語1辞書30a、言語2辞書30b、・・・、言語n辞書30cの各々が記憶する切り替えコマンドを集約した言語切り替え用辞書30dを用いて、この言語切り替え用辞書30dに記憶された切り替え用コマンドと入力音声との一致を判定する。そして、音声入力によってナビゲーションシステム1を操作する際に設定する言語辞書として、デフォルト設定された(現在設定された)言語辞書から、一致すると判定された切り替えコマンドに対応する言語辞書に切り替える。
【0036】
これにより、複数の言語辞書を順次切り替えて検索することなく、言語切り替え用辞書30dを用いて、入力音声と一致する切り替えコマンドを速やかに検索することができる。その結果、デフォルト設定された(現在設定された)言語辞書から入力音声の言語に対応する言語辞書に速やかに切り替えることができるようになる。
【図面の簡単な説明】
【0037】
【図1】ナビゲーションシステム1の概略構成を示すブロック図である。
【図2】言語切り替え用辞書30dを説明するための図である。
【図3】判定(検索)対象の辞書の一例を示す図である。
【図4】言語辞書設定処理を示すフローチャートである。
【符号の説明】
【0038】
1…ナビゲーションシステム
10…制御部
11…音声制御部
20…音声入出力制御部
21…音声出力制御部
21a…スピーカ
22…音声入力制御部
22a…マイク
30…音声認識用メモリ
30a…言語1辞書
30b…言語2辞書
30c…言語n辞書
30d…言語切り替え用辞書
40…表示装置
50…位置検出部
51…地磁気センサ
52…ジャイロスコープ
53…距離センサ
54…GPS受信機
60…地図データ入力器
70…操作スイッチ群
80…リモコンセンサ
80a…リモコン

【特許請求の範囲】
【請求項1】
複数の異なる言語毎に、操作対象機器を操作するための音声コマンドと、言語辞書を切り替えるための切り替えコマンドと、を記憶する複数の言語辞書、及び前記複数の言語辞書の各々が記憶する切り替えコマンドを集約して記憶する言語切り替え用辞書を記憶する音声認識用記憶手段と、
音声を入力するための音声入力手段と、
前記音声入力手段から入力した入力音声と、前記言語切り替え用辞書に記憶された切り替えコマンドとが一致するかどうかを判定する判定手段と、
前記音声入力手段を介した音声入力によって前記操作対象機器を操作する際に設定する言語辞書として、現在設定されている言語辞書から前記判定手段によって一致すると判定された切り替えコマンドに対応する言語辞書に切り替える言語辞書切り替え手段と、を備えることを特徴とする音声認識装置。
【請求項2】
前記判定手段は、前記入力音声と一致するかどうかの判定対象のコマンドとして、前記言語切り替え用辞書に記憶された切り替えコマンドとともに、前記現在設定されている言語辞書に記憶された音声コマンドを判定対象とすることを特徴とする請求項1記載の音声認識装置。
【請求項3】
前記判定手段は、前記音声コマンドに対して前記切り替えコマンドを優先して前記入力音声と一致するかどうかを判定することを特徴とする請求項2記載の音声認識装置。
【請求項4】
請求項1〜3の何れか1項に記載の音声認識装置を備え、
前記入力手段からの入力音声と一致する、前記言語辞書切り替え手段によって切り替えられた言語辞書に記憶された音声コマンドに基づいて、地図表示処理、施設検索処理、経路設定処理、及び経路案内処理の少なくとも1つの処理を実行することを特徴とするナビゲーションシステム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate


【公開番号】特開2007−248523(P2007−248523A)
【公開日】平成19年9月27日(2007.9.27)
【国際特許分類】
【出願番号】特願2006−68051(P2006−68051)
【出願日】平成18年3月13日(2006.3.13)
【出願人】(000004260)株式会社デンソー (27,639)
【Fターム(参考)】