説明

音声認識装置及び車両ナビゲーション装置

【課題】ユーザにとって語句を発声する負担を軽減すると共に、ユーザが音声認識させたい語句を速やかに音声認識することを可能とする。
【解決手段】音声認識装置10は、ユーザがステアリング16を握っている位置を検出し、複数の音声辞書15a〜15cのうちから握り位置に対応する音声辞書を使用辞書として切替え、ユーザが発した音声を入力すると、その入力した音声の音声波形と使用辞書として切替えた音声辞書に登録されている語句の近似波形とを照合して当該ユーザが発した音声を音声認識する。ユーザが複数の音声辞書15a〜15cのうちからいずれかを使用辞書として切替えるための語句を発声する必要がなくなり、ユーザが音声認識させたい語句のみを発声すれば良くなる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ユーザが発した音声の音声波形と複数の音声辞書のうちから使用辞書として切替えた音声辞書に登録されている語句の近似波形とを照合して当該ユーザが発した音声を音声認識する音声認識装置及び車両ナビゲーション装置に関する。
【背景技術】
【0002】
例えば車両ナビゲーション装置に搭載されている音声認識装置では、ユーザが発した音声の音声波形と音声辞書に登録されている語句の近似波形とを照合して当該ユーザが発した音声を音声認識するように構成されている(例えば特許文献1参照)。
【特許文献1】特開2005−121966号公報
【発明の開示】
【発明が解決しようとする課題】
【0003】
ところで、近年では、機能追加に伴って音声認識が多種多様な状況で使用されるようになっており、それに伴って、例えば住所用の音声辞書、施設名称用の音声辞書及びナビゲーション機能制御用の音声辞書などの用途に応じて複数の音声辞書を用意しておき、最初に複数の音声辞書のうちからいずれかを使用辞書として切替え、続いて音声認識させたい音声の音声波形と使用辞書として切替えた音声辞書に登録されている語句の近似波形とを照合し、音声認識させたい音声を音声認識する構成が供されている。
【0004】
この場合、ユーザは、最初に複数の音声辞書のうちからいずれかを使用辞書として切替えるための語句を発声し、続いて音声認識させたい語句を発声する。具体的には、ユーザは、最初に例えば「ジ」「ュ」「ウ」「シ」「ョ」と発声することにより、住所用の音声辞書を使用辞書として切替えることができ、続いて例えば「ア」「イ」「チ」「ケ」「ン」と発声することにより、音声認識させたい「愛知県」という語句を音声認識させることができる。
【0005】
しかしながら、これでは、使用辞書を切替えるための語句と音声認識させたい語句との2つの語句を音声認識することになるので、ユーザにとって語句を2回発声することが煩雑であり、また、ユーザが音声認識させたい語句を音声認識するまでに時間がかかり、操作性に劣るという問題があった。
【0006】
本発明は、上記した事情に鑑みてなされたものであり、その目的は、ユーザにとって語句を発声する負担を軽減することができると共に、ユーザが音声認識させたい語句を速やかに音声認識することができ、操作性を高めることができる音声認識装置及び車両ナビゲーション装置を提供することにある。
【課題を解決するための手段】
【0007】
請求項1に記載した発明によれば、操作位置検出手段は、複数の音声辞書に対応して操作対象に設定されている複数の操作位置のうちからユーザの操作位置を検出し、音声辞書切替手段は、複数の音声辞書のうちから操作位置検出手段が検出した操作位置に対応する音声辞書を使用辞書として切替える。そして、音声認識手段は、ユーザが発した音声を音声入力手段が入力すると、その音声入力手段が入力した音声の音声波形と音声辞書切替手段が使用辞書として切替えた音声辞書に登録されている語句の近似波形とを照合して当該ユーザが発した音声を音声認識する。
【0008】
これにより、ユーザの操作位置に基づいて複数の音声辞書のうちからいずれかを使用辞書として切替えることにより、ユーザが複数の音声辞書のうちからいずれかを使用辞書として切替えるための語句を発声する必要がなくなり、ユーザが音声認識させたい語句のみを発声すれば良く、ユーザにとって語句を発声する負担を軽減することができると共に、ユーザが音声認識させたい語句を速やかに音声認識することができ、操作性を高めることができる。
【0009】
請求項2に記載した発明によれば、音声辞書切替手段は、自装置が音声認識待ち状態に移行する前に、複数の音声辞書のうちから操作位置検出手段が検出した操作位置に対応する音声辞書を使用辞書として切替えるので、自装置が音声認識待ち状態に移行した時点では、既に複数の音声辞書のうちからいずれかを使用辞書として切替えておくことができ、ユーザが音声認識させたい語句をより速やかに音声認識することができる。
【0010】
請求項3に記載した発明によれば、操作対象は、ステアリングであり、操作位置検出手段は、ユーザがステアリングを握っている位置を検出し、音声辞書切替手段は、複数の音声辞書のうちから操作位置検出手段が検出したステアリング握り位置に対応する音声辞書を使用辞書として切替えるので、ユーザがステアリングを握る位置を切替えることにより、複数の音声辞書のうちからいずれかを使用辞書として切替えることができる。
【0011】
請求項4に記載した発明によれば、操作対象は、ステアリングの一部であるので、ステアリングの操作対象とされている箇所を一方の手で握ることにより複数の音声辞書のうちからいずれかを使用辞書として切替えることができると共に、ステアリングの操作対象とされていない箇所を他方の手で握ることにより運転操作することができ、運転操作に支障を来たすことなく複数の音声辞書のうちからいずれかを使用辞書として容易に切替えることができる。
【0012】
請求項5に記載した発明によれば、握り圧力検出手段は、ユーザがステアリングを握っている握り圧力を検出し、その握り圧力検出手段が検出した握り圧力が閾値以上であると、自装置が音声認識待ち状態に移行するので、ユーザが例えばステアリングから手を離して別のスイッチを操作しなくとも、ユーザがステアリングを握ったまま閾値以上の握り圧力で握ることにより、音声認識待ち状態に移行することができ、操作性をより一層高めることができる。
【0013】
請求項6に記載した発明によれば、音声辞書割当切替手段は、ステアリングの握り位置に対する音声辞書の割当を切替えるので、例えばステアリングにあってユーザが握り易い位置に使用頻度が高い音声辞書を割当てることにより、操作性をより一層高めることができる。
【発明を実施するための最良の形態】
【0014】
以下、本発明の一実施形態について、図面を参照して説明する。図2は、車両ナビゲーション装置の構成を機能ブロック図として示している。車両ナビゲーション装置1は、制御装置2、位置検出器3、地図データ記憶装置4、操作スイッチ群5、車両信号入出力器6、通信装置7、VICS受信機8、音声制御装置9、音声認識装置10、表示装置11、メモリ12及びリモコンセンサ13を備えて構成されている。
【0015】
制御装置2は、CPU、ROM、RAM、I/Oインタフェース、これらを接続するバスなど(いずれも図示せず)を備えて構成されており、車両ナビゲーション装置1の動作全般を制御する。位置検出器3は、Gセンサ3a、ジャイロスコープ3b、距離センサ3c及びGPS受信機3dから構成されており、これら位置検出器3の各構成要素は互いに性質の異なる検出誤差を有している。この場合、制御装置2は、位置検出器3の各構成要素から検出信号を入力すると、それら入力した検出信号を互いに補完し、自車両の現在位置及び進行方向などを検出(特定)する。
【0016】
地図データ記憶装置4は、例えばDVD−ROMなどの記録媒体14から転送された地図データを記憶する。この場合、記録媒体14は、経路案内に使用する地図データを記録していると共に、図1に示すように、音声辞書として住所用の音声辞書15a、施設名称用の音声辞書15b及びナビゲーション機能制御用の音声辞書15cなどの用途に応じた複数(本実施形態では3個)の音声辞書を記録している。尚、記録媒体14は、例えばHDDやメモリカードなどであっても良い。操作スイッチ群5は、表示装置11の周辺に配置されているメカニカルスイッチ、表示装置11の例えばカラー液晶ディスプレイ上に形成されるタッチスイッチ及び車室内の所定位置に配置されているPTTスイッチなどから構成されている。
【0017】
車両信号入出力器6は、車両に搭載されている各種センサや車載機器との間で各種信号を入出力し、例えば車速センサから車速を表す車速信号を入力すると共に、ステアリング16(本発明でいう操作対象)からユーザが当該ステアリング16を握っている位置(握り位置)を表す握り位置信号を入力する。ステアリング16は、図3に示すように、その正面視にて円環状のリム部の左半部の領域に3個の曲線形状をなす圧力センサ17a〜17cが均等に埋込まれており、各々の圧力センサ17a〜17cは、ユーザがステアリング16の該当する箇所を握っていることに応じて所定値以上の圧力を検出すると、ユーザがステアリング16の該当する箇所を握っている旨を表す握り位置信号を出力する。この場合、各々の圧力センサ17a〜17cは、ユーザがステアリングを握っている握り圧力を示す数値を握り位置信号に含めて出力する。
【0018】
ここで、各々の圧力センサ17a〜17cが埋込まれている箇所は、上記した記録媒体14に記録されている3個の音声辞書15a〜15cに対応している。具体的には、圧力センサ17aが埋込まれている箇所は、住所用の音声辞書15aに対応しており、圧力センサ17bが埋込まれている箇所は、施設名称用の音声辞書17bに対応しており、圧力センサ17cが埋込まれている箇所は、ナビゲーション機能制御用の音声辞書17cに対応している。
【0019】
通信装置7は、移動通信網との間で通信する。VICS受信機8は、外部からVICS情報を受信する。音声制御装置9は、車室内の所定位置に配置されているマイクロホン18が入力した音声及び車室内の所定位置に配置されているスピーカ19が出力する音声を音声制御する。
【0020】
音声認識装置10は、図1に示すように、機能毎に、握り位置検出部20a(本発明でいう操作位置検出手段、握り圧力検出手段)、音声辞書切替部20b(本発明でいう音声辞書切替手段、音声辞書割当切替手段)、音声辞書格納部20c、音声入力部20d(本発明でいう音声入力手段)、音声認識部20e(本発明でいう音声認識手段)及び認識結果出力部20fを備えて構成されている。
【0021】
握り位置検出部20aは、ステアリング16から出力された握り位置信号を車両信号入出力器6を介して入力すると、その握り位置信号を解析してユーザがステアリング16を握っている位置(握り位置)を検出すると共に、ユーザがステアリングを握っている握り圧力をも検出する。音声辞書切替部20bは、DVD14に記録されている住所用の音声辞書15a、施設名称用の音声辞書15b及びナビゲーション機能制御用の音声辞書15cからいずれかを使用辞書として切替える(選択する)。また、音声辞書切替部20bは、例えばユーザが操作スイッチ群5にて音声辞書の割当を切替える操作を行うと、上記した圧力センサ17a〜17cが埋込まれている箇所と記録媒体14に記録されている3個の音声辞書15a〜15cとの対応(割当)を切替える。音声辞書格納部20cは、音声辞書切替部20bが使用辞書として切替えた音声辞書を格納する。
【0022】
音声入力部20dは、マイクロホン18が入力した音声を音声制御装置9を介して入力する。音声認識部20eは、音声入力部20dが音声を入力すると、音声辞書切替部20bが格納している音声辞書、つまり、音声辞書切替部20bが使用辞書として切替えた音声辞書を参照し、音声入力部20dが入力した音声の音声波形と音声辞書格納部20cが使用辞書として格納している音声辞書に登録されている語句の近似波形とを照合し、ユーザが発した音声を音声認識する。認識結果出力部20fは、音声認識部20eが音声認識した認識結果を制御装置2に出力する。
【0023】
制御装置2は、このようにして音声認識装置10から入力した認識結果に基づいて、例えば目的地を検索したり地図表示の縮尺を変更したりする。尚、音声認識装置10は、例えば上記したPTTスイッチが押下されている期間に音声認識待ち状態となり、上記した音声認識を行うことが可能になる。
【0024】
表示装置11は、例えばカラー液晶ディスプレイから構成されており、自車両の現在位置を表す現在位置図形や走行軌跡を地図データに対応する地図上に重ねて表示する。尚、表示装置10は、有機ELやプラズマディスプレイなどから構成されていても良い。メモリ12は、例えば着脱可能なフラッシュメモリカードなどにより構成されている。リモコンセンサ13は、操作リモコン21から送信された操作信号を受信して制御装置2に出力する。
【0025】
次に、上記した構成の作用として、音声認識装置10が行う処理を図4に示すフローチャートを参照して説明する。
音声認識装置10は、ユーザがPTTスイッチを押下したことに応じて音声認識待ち状態に移行すると、その時点でステアリング16から車両信号入出力器6を介して入力している握り位置信号を解析してユーザがステアリング16を握っている位置(握り位置)を握り位置検出部20aにて検出する(ステップS1)。
【0026】
次いで、音声認識装置10は、その時点で音声辞書格納部20cが格納している音声辞書、つまり、音声辞書切替部20bが使用辞書として切替えている音声辞書を参照し(ステップS2)、音声辞書切替部20bが使用辞書として切替えている音声辞書が当該検出した握り位置に対応しているか否かを判定する(ステップS3)。
【0027】
ここで、音声認識装置10は、音声辞書切替部20bが使用辞書として切替えている音声辞書が当該検出した握り位置に対応している旨を判定すると(ステップS3にて「YES」)、ユーザが発した音声の入力を待機すると共に(ステップS6)、音声認識待ち状態を解除したか否かを判定する(ステップS7)。そして、音声認識装置10は、ユーザが発した音声を音声入力部20dにて入力した旨を判定すると(ステップS6にて「YES」)、入力した音声の音声波形と使用辞書として切替えている音声辞書に登録されている語句の近似波形とを照合してユーザが発した音声を音声認識部20eにて音声認識し(ステップS8)、その音声認識した認識結果を制御装置2に出力し(ステップS9)、
上記したステップS1に戻り、上記した一連の処理を繰返して行う。
【0028】
一方、音声認識装置10は、音声辞書切替部20bが使用辞書として切替えている音声辞書が当該検出した握り位置に対応していない旨を判定すると(ステップS3にて「NO」)、検出した握り位置に対応する音声辞書を使用辞書として切替え(ステップS4)、使用辞書として切替えた音声辞書を音声辞書格納部20cに格納する(ステップS5)。そして、音声認識装置10は、ユーザが発した音声の入力を待機すると共に(ステップS6)、音声認識待ち状態を解除したか否かを判定し(ステップS7)、ユーザが発した音声を入力した旨を判定すると(ステップS6にて「YES」)、これ以降、上記したステップS8,S9を行う。
【0029】
また、音声認識装置10は、PTTスイッチの押下が解除されたことに応じて音声認識待ち状態を解除した旨を判定すると(ステップS7にて「YES」)、上記した一連の処理を終了する。
【0030】
ところで、以上は、ユーザがPTTスイッチを押下したことに応じて音声認識待ち状態に移行する構成を説明したが、握り位置検出部20aが検出した握り圧力が閾値以上であることを条件として音声認識待ち状態に移行する構成であっても良い。また、ユーザがPTTスイッチを押下したことに応じて音声認識待ち状態に移行した後に、ユーザがステアリング16を握っている位置に応じて音声辞書を切替える構成を説明したが、例えば車両ナビゲーション装置1が起動している場合に、ユーザがPTTスイッチを押下していない状況であっても、ユーザがステアリング16を握っている位置に応じて音声辞書を切替える構成であっても良い。
【0031】
以上に説明したように本実施形態によれば、音声認識装置10において、ユーザがステアリング16を握っている位置を検出し、複数の音声辞書15a〜15cのうちから握り位置に対応する音声辞書を使用辞書として切替え、ユーザが発した音声を入力すると、その入力した音声の音声波形と使用辞書として切替えた音声辞書に登録されている語句の近似波形とを照合して当該ユーザが発した音声を音声認識するように構成したので、ユーザが複数の音声辞書15a〜15cのうちからいずれかを使用辞書として切替えるための語句を発声する必要がなくなり、ユーザが音声認識させたい語句のみを発声すれば良く、ユーザにとって語句を発声する負担を軽減することができると共に、ユーザが音声認識させたい語句を速やかに音声認識することができ、操作性を高めることができる。
【0032】
また、音声認識装置10が音声認識待ち状態に移行する前に、複数の音声辞書15a〜15cのうちから握り位置に対応する音声辞書を使用辞書として切替えるように構成すれば、音声認識装置10が音声認識待ち状態に移行した時点では、既に複数の音声辞書15a〜15cのうちからいずれかを使用辞書として切替えておくことができ、ユーザが音声認識させたい語句をより速やかに音声認識することができる。
【0033】
また、ステアリング16の左半部を利用してユーザがステアリング16を握っている位置を検出するように構成したので、ステアリング16の左半部を左手で握ることにより複数の音声辞書15a〜15cのうちからいずれかを使用辞書として切替えることができると共に、ステアリング16の右半部を右手で握ることにより運転操作することができ、運転操作に支障を来たすことなく複数の音声辞書15a〜15cのうちからいずれかを使用辞書として容易に切替えることができる。
【0034】
また、握り位置検出部20aが検出した握り圧力が閾値以上であることを条件として音声認識待ち状態に移行するように構成すれば、ユーザが例えばステアリング16から手を離して別のスイッチを操作しなくとも、ユーザがステアリング16を握ったまま閾値以上の握り圧力で握ることにより、音声認識待ち状態に移行することができ、操作性をより一層高めることができる。
【0035】
さらに、例えばユーザが操作スイッチ群5にて音声辞書の割当を切替える操作を行うと、ステアリング16の握り位置に対する音声辞書の割当を切替えるように構成したので、ステアリング16にあってユーザが握り易い位置に使用頻度が高い音声辞書を割当てることにより、操作性をより一層高めることができる。
【0036】
本発明は、上記した実施形態にのみ限定されるものではなく、以下のように変形または拡張することができる。
操作対象は、ステアリングに限らず、運転操作に支障を来たすことがない範囲でユーザが運転中に操作可能な別の機器(例えばシフトレバーなど)であっても良い。
ユーザがステアリングを握っている位置を検出する手段として、圧力センサが利用される構成に限らず、例えば電極などの他のセンサが利用される構成であっても良い。また、センサがステアリングの右半部、下部あるいは上部に配置される構成であっても良い。
音声辞書は、住所用の音声辞書、施設名称用の音声辞書及びナビゲーション機能制御用の音声辞書以外の用途のものであっても良い。
ユーザがPTTスイッチを押下することやユーザがステアリングを閾値以上の握り圧力で握ること以外のユーザ操作をトリガとして音声認識装置が音声認識待ち状態に移行する構成であっても良い。
【図面の簡単な説明】
【0037】
【図1】本発明の一実施形態を示すもので、音声認識装置の機能ブロック図
【図2】車両ナビゲーション装置の機能ブロック図
【図3】ステアリングの握り位置と音声辞書との対応を示す図
【図4】フローチャート
【符号の説明】
【0038】
図面中、1は車両ナビゲーション装置、10は音声認識装置、15a〜15cは音声辞書、16はステアリング(操作対象)、20aは握り位置検出部(操作位置検出手段、握り圧力検出手段)、20bは音声辞書切替部(音声辞書切替手段、音声辞書割当切替手段)、20dは音声入力部(音声入力手段)、20eは音声認識部(音声認識手段)である。

【特許請求の範囲】
【請求項1】
複数の音声辞書のうちからいずれかを使用辞書として切替える音声辞書切替手段と、ユーザが発した音声を入力する音声入力手段と、前記音声入力手段が入力した音声の音声波形と前記音声辞書切替手段が使用辞書として切替えた音声辞書に登録されている語句の近似波形とを照合して当該ユーザが発した音声を音声認識する音声認識手段とを備えた音声認識装置であって、
複数の音声辞書に対応して操作対象に設定されている複数の操作位置のうちからユーザの操作位置を検出する操作位置検出手段を備え、
前記音声辞書切替手段は、複数の音声辞書のうちから前記操作位置検出手段が検出した操作位置に対応する音声辞書を使用辞書として切替えることを特徴とする音声認識装置。
【請求項2】
請求項1に記載した音声認識装置において、
前記音声辞書切替手段は、自装置が音声認識待ち状態に移行する前に、複数の音声辞書のうちから前記操作位置検出手段が検出した操作位置に対応する音声辞書を使用辞書として切替えることを特徴とする音声認識装置。
【請求項3】
請求項1または2に記載した音声認識装置において、
前記操作対象は、ステアリングであり、
前記操作位置検出手段は、ユーザがステアリングを握っている位置を検出し、
前記音声辞書切替手段は、複数の音声辞書のうちから前記操作位置検出手段が検出したステアリング握り位置に対応する音声辞書を使用辞書として切替えることを特徴とする音声認識装置。
【請求項4】
請求項3に記載した音声認識装置において、
前記操作対象は、ステアリングの一部であることを特徴とする音声認識装置。
【請求項5】
請求項3または4に記載した音声認識装置において、
ユーザがステアリングを握っている握り圧力を検出する握り圧力検出手段を備え、
前記握り圧力検出手段が検出した握り圧力が閾値以上である場合に、自装置が音声認識待ち状態に移行することを特徴とする音声認識装置。
【請求項6】
請求項3ないし5のいずれかに記載した音声認識装置において、
ステアリングの握り位置に対する音声辞書の割当を切替える音声辞書割当切替手段を備えたことを特徴とする音声認識装置。
【請求項7】
請求項1ないし6のいずれかに記載した音声認識装置を備え、
前記音声認識装置が音声認識した認識結果に基づいてナビゲーションに係る処理を行うことを特徴とする車両ナビゲーション装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate


【公開番号】特開2008−145676(P2008−145676A)
【公開日】平成20年6月26日(2008.6.26)
【国際特許分類】
【出願番号】特願2006−331876(P2006−331876)
【出願日】平成18年12月8日(2006.12.8)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.VICS
【出願人】(000004260)株式会社デンソー (27,639)
【Fターム(参考)】