説明

車両用情報端末及びプログラム

【課題】音声認識できなかった音声情報をその後の操作に基づいて音声認識に係る辞書に適切に記憶させ、音声認識できなかった音声情報を適切に音声認識させることができる車両用情報端末およびプログラムを提供する。
【解決手段】発話者の発した音声情報を認識処理し、認識結果が得られないと判断された場合、音声情報を認識不可音声情報として保持する。認識結果が得られないと判断された後に実行された操作に基づき、認識音声不可情報に対応すると推定される地図上の推定地点を特定し(S114)、推定地点に関する推定地点情報と認識不可音声情報とを関連付けて記憶させる(S118)。これにより、認識結果が得られなかった認識不可音声情報を、認識不可音声情報に対応すると推定される推定地点に関する推定地点情報と関連付けて記憶させることができるので、音声認識できなかった音声情報を適切に音声認識させることができる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、車両情報端末およびプログラムに関する。
【背景技術】
【0002】
従来、音声認識機能を備える音声認識装置が知られている。音声認識処理装置において、発話者の発した内容を認識できない場合、発話したときの視線や指差し動作から音声認識対象の物品を特定し、特定された物品と音声認識できなかった単語とを対応付けて音声認識に係る辞書に登録する技術が開示されている(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2009−223172号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら特許文献1では、視線や指差しを検知する手段が必要であった。また、発話者の発した音声が示す音声認識対象が、例えばナビゲーション装置における目的地のように音声認識を行う地点から視認できない場合、視線や指差しを検知する手段を有していたとしても、音声認識対象を特定することはできない。
本発明は、上述の課題に鑑みてなされたものであり、その目的は、音声認識できなかった音声情報をその後の操作に基づいて音声認識に係る辞書に適切に記憶させることにより、音声認識できなかった音声情報を適切に音声認識させることができる車両用情報端末およびプログラムを提供することにある。
【課題を解決するための手段】
【0005】
請求項1に記載の車両用情報端末は、発話者の発した音声情報を取得する音声情報取得手段と、音声情報取得手段により取得された音声情報を認識処理する認識処理手段と、認識処理手段により認識結果が得られたか否かを判断する認識結果判断手段と、認識結果判断手段により認識結果が得られないと判断された場合、音声情報を認識不可音声情報として保持する音声情報保持手段と、認識結果判断手段により認識結果が得られないと判断された後に実行された操作に基づき認識不可音声情報に対応すると推定される地図上の推定地点を特定する地点特定手段と、推定地点に関する推定地点情報と認識不可音声情報とを関連付けて記憶させる記憶制御手段と、を備える。これにより、認識結果が得られなかった認識不可音声情報を、認識不可音声情報に対応すると推定される推定地点に関する推定地点情報と関連付けて適切に記憶させることができるので、音声認識できなかった音声情報を適切に音声認識させることができる。
【0006】
請求項2に記載の発明では、認識結果判断手段により認識結果が得られないと判断された後、目的地の設定に係る情報が取得されたか否かを判断する新情報取得判断手段を備える。地点特定手段は、新情報取得判断手段により目的地の設定に係る情報が取得されたと判断された場合、目的地の設定に係る情報に基づいて推定地点を特定する。これにより、目的地の設定に係る情報に基づいて推定地点を特定するので、認識不可音声情報に対応すると推定される推定地点をより適切に特定することができる。
【0007】
請求項3に記載の発明では、地点特定手段は、新情報取得判断手段により目的地の設定に係る情報が取得されていないと判断された場合、車両のイグニッションがオフされた地点を推定地点として特定する。請求項4に記載の発明では、地点特定手段は、認識結果判断手段により認識結果が得られないと判断された後に車両のイグニッションがオフされた地点を推定地点として特定する。これにより、認識不可音声情報に対応すると推定される推定地点を容易に特定することができる。
【0008】
請求項5に記載の発明では、認識不可音声情報の発話に至る事前情報が取得されている場合、推定地点情報に含まれる属性情報と事前情報とが一致するか否かを判断する一致判断手段を備える。記憶制御手段は、一致判断手段により属性情報と事前情報とが一致すると判断された場合、推定地点情報と認識不可音声情報とを関連付けて記憶させる。これにより、推定地点情報と認識不可音声情報とを精度よく関連付けて記憶させることができる。
【0009】
以上、車両用情報端末の発明として説明してきたが、次に示すようなプログラムの発明として実現することもできる。
すなわち、発話者の発した音声情報を取得する音声情報取得手段、音声情報取得手段により取得された音声情報を認識処理する認識処理手段、認識処理手段により認識結果が得られたか否かを判断する認識結果判断手段、認識結果判断手段により認識結果が得られないと判断された場合、音声情報を認識不可音声情報として保持する音声情報保持手段、認識結果判断手段により認識結果が得られないと判断された後に実行された操作に基づき、認識不可音声情報に対応すると推定される地図上の推定地点を特定する地点特定手段、および、推定地点に関する推定地点情報と認識不可音声情報とを関連付けて記憶させる記憶制御手段、としてコンピュータを機能させるプログラムである。このようなプログラムを実行することで、上述の車両用情報端末と同様の効果が奏される。
【図面の簡単な説明】
【0010】
【図1】本発明の一実施形態の車両用情報端末の構成を示すブロック図である。
【図2】本発明の一実施形態の認識辞書に記憶されたデータを説明する説明図である。
【図3】本発明の一実施形態の音声認識処理を説明するフローチャートである。
【図4】本発明の一実施形態の認識辞書登録処理を説明するフローチャートである。
【発明を実施するための形態】
【0011】
以下、本発明による車両用情報端末を図面に基づいて説明する。
(一実施形態)
図1は、本発明の一実施形態による車両用情報端末としてのナビゲーション装置1の全体構成を示すブロック図である。ナビゲーション1は、制御部10を中心に構成されており、制御部10に接続される位置検出器20、地図データ記憶部30、音声認識情報記憶部40、操作スイッチ群50、音声入力部60、音声出力部70、描画部80等を備えている。
【0012】
制御部10は、通常のコンピュータとして構成されている。制御部10の内部には、CPU、ROM、I/O、および、これらの構成を接続するバスラインなどが備えられている。
位置検出器20は、いずれも周知の地磁気センサ21、ジャイロスコープ22、距離センサ23、および、衛星からの電波を受信するGPS(Global Positioning System)受信機24等を有している。これらのセンサ21〜24は、各々が性質の異なる誤差を持っているため、相互に補完しながら使用される。
【0013】
地図データ記憶部30は、例えばハードディスク装置(HDD)として実現される記憶装置である。なお、本実施形態ではHDDを用いたが、DVD−ROMや、メモリカード等の他の媒体を用いても差し支えない。地図データ記憶部30は、位置検出の精度向上のためのいわゆるマップマッチング用データおよび経路を探索するための地図データを記憶している。地図データには、各種データが含まれるが、その一つとして施設に関する施設情報が含まれる。施設情報は、具体的には施設を特定するIDと関連付けられて記憶されているPOI(Point Of Interest)情報である。POI情報には、施設名称、施設ID、位置座標、種別(ジャンル)を示す情報などが含まれる。
【0014】
音声認識情報記憶部40は、地図データ記憶部30と同一のHDDで構成されている。もちろん、メモリカード等の他の媒体を用いてもよい。音声認識情報記憶部40には、認識辞書41が記憶されている。
【0015】
認識辞書41は、音声波形データと対応する単語とが関連付けて記憶されている。認識辞書41では、音声波形データに対応する単語が地図データに含まれるものである場合、音声波形データと地図データとが関連付けて記憶されている。図2に示すように、例えば、音声波形データXと対応する単語が「おかざきしやくしょ」である場合、施設名称である「岡崎市役所」、ジャンル「市役所」、住所「愛知県岡崎市・・・」、位置座標(x1,y1)が、音声波形データXと関連付けて記憶されている。
【0016】
図1に戻り、操作スイッチ群50は、ディスプレイ81と一体になったタッチスイッチもしくはメカニカルなスイッチやリモコン装置等で構成され、各種入力に使用される。操作スイッチ群50には、トークスイッチ51が含まれる。トークスイッチ51は、音声入力時に操作される。
【0017】
音声入力部60は、音声を入力するためのマイク61が接続されている。トークスイッチ51がオンされたとき、マイク61を介して発話者の発した音声が入力される。
音声出力部70には、音声を出力するためのスピーカ71が接続されている。
描画部80には、ディスプレイ81が接続されている。ディスプレイ81は、液晶やCRTを用いたカラーディスプレイである。このディスプレイ81を介して情報表示が行われる。
【0018】
ここで、図3に示すフローチャートに基づいて音声認識処理を説明する。図3に示す音声認識処理は、トークスイッチ51がオンされたときに行われる処理であり、発話者の発した音声に基づいて目的地を設定する場合を例に説明する。
初めのステップS101(以下、「ステップ」を省略し、単に記号「S」で示す。)では、トークスイッチ51がオンされたことを検知する。
S102では、認識辞書41をセットする。
【0019】
S103では、マイク61を介して入力された発話者の発した音声情報を取得する。
S104では、S103で取得した音声情報について認識処理を行う。ここでは、S103で取得された音声情報をA/D変換し、データ処理が可能な波形データに変換する。そして波形データと認識辞書41に記憶されている音声波形データとを照合し、認識候補を特定する。
【0020】
S105では、S104における認識処理において、認識結果が得られたか否かを判断する。本実施形態では、S104にて認識候補が特定できた場合、認識結果が得られたと判断する。認識結果が得られなかった場合(S105:NO)、S107へ移行する。認識結果が得られた場合(S105:YES)、S106へ移行する。
【0021】
S106では、特定された認識候補を出力する。具体的には、特定された認識候補が「岡崎市役所」である場合、スピーカ71を介して「岡崎市役所を目的地として設定します」といった音声を出力する。また、ディスプレイ81に岡崎市役所を中心とする地図を表示する。そして、岡崎市役所を目的地として設定して経路と探索し、岡崎市役所への経路案内を行う。なお、目的地の設定、経路の探索、経路案内は、本処理とは別処理で行われるものとする。
【0022】
認識結果が得られなかった場合(S105:NO)に移行するS107では、S103にて取得した音声情報の波形データを認識不可音声情報として制御部10を構成するRAMに保持するとともに、認識不可フラグをセットする。また、スピーカ71を介して「認識できませんでした」といった音声を出力する。
【0023】
続いて、認識できなかった音声情報をその後の操作に基づいて認識辞書登録を行う認識辞書登録処理について図4に示すフローチャートに基づいて説明する。図4に示す認識辞書登録処理は、認識不可フラグがセットされたときに行われる処理である。
【0024】
初めのS111では、目的地の設定に係る新たな情報が取得されたか否かを判断する。
取得される新たな情報は、操作スイッチ群50を介して入力された情報でもよいし、マイク61を介して入力された音声情報であってもよい。新たな情報が取得されていないと判断された場合(S111:NO)、S113へ移行する。新たな情報が取得されたと判断された場合(S111:YES)、S112へ移行する。
S112では、取得された新たな情報に基づき、目的地を設定する。
【0025】
目的地の設定に係る新たな情報が取得されていないと判断された場合(S111:NO)に移行するS113では、イグニッションがオフされたか否かを判断する。イグニッションがオフされていないと判断された場合(S113:NO)、S111へ戻る。イグニッションがオフされたと判断された場合(S113:YES)、S114へ移行する。
【0026】
S114では、推定地点を特定する。すなわち、新たな情報が取得され(S111:YES)、取得された新たな情報に基づいて目的地が設定された(S112)後に移行するS114では、設定された目的地を推定地点として特定する。また、イグニッションがオフされたと判断された(S113:YES)後に移行するS114では、イグニッションがオフされた地点を推定地点として特定する。
本実施形態においては、認識不可音声情報が保持された後に行われた目的地を設定する操作、或いは、認識音声付加情報が保持された後に車両のイグニッションをオフする操作が、「認識結果判断手段により認識結果が得られないと判断された後に実行された操作」に対応している。
【0027】
S115では、特定された推定地点に関する推定地点情報を地図データ記憶部30から取得する。ここでは、当該推定地点に対応するPOI情報が取得される。
S116では、施設のジャンルが予め設定されているか否かを判断する。本実施形態は、図3中のS107以前であって、S107に至る一連の操作処理において、施設のジャンルが設定されているか否かを判断する。ここで、「一連の操作処理」とは、例えば音声認識や操作スイッチ群50を介した操作によりジャンル「ラーメン屋」が設定されており、「どこのラーメン屋ですか?」という問いかけに対する回答として、ユーザがトークスイッチ51をオンして図2および図3に示す処理が行われる場合におけるジャンル「ラーメン屋」を設定する操作処理である。換言すると、ジャンルが設定されていることを前提により詳細な情報の入力をユーザに促す場合における当該ジャンルの設定に係る操作処理が「一連の操作処理」と対応している、といえる。また本実施形態では、予め設定されている施設のジャンル(以下、「設定施設ジャンル」という。)に関する情報が「認識不可音声の発話に至る事前情報」に対応している。施設のジャンルが予め設定されていない場合(S116:NO)、S118へ移行する。施設のジャンルが予め設定されている場合(S116:YES)、S117へ移行する。
【0028】
S117では、推定地点情報に含まれる施設のジャンルと設定施設ジャンルとが一致するか否かを判断する。本実施形態では、事前情報が施設のジャンルに関する情報であるので、推定地点情報に含まれる施設のジャンルに関する情報が「属性情報」に対応している。推定地点情報に含まれる施設のジャンルと設定施設ジャンルとが一致しない場合(S117:NO)、S118の処理を行わない。推定地点情報に含まれる施設のジャンルと設定施設ジャンルとが一致する場合(S117:YES)、S118へ移行する。
【0029】
施設のジャンルが予め設定されていない場合(S116:NO)、および施設のジャンルが予め設定されていて、かつ、推定地点情報に含まれる施設のジャンルと設定施設ジャンルとが一致する場合(S116:YES、S117:YES)に移行するS118では、図3中のS107で保持された認識不可音声情報と推定地点情報とを関連付けて認識辞書41に記憶する。このとき、「先ほど認識できなかったキーワードをこの地点を示す言葉として登録します」といった音声を、スピーカ71を介して出力する。また、S107においてセットされた認識不可フラグをリセットし、認識辞書登録処理を終了する。
【0030】
ここで、認識辞書登録処理の具体例を説明する。
(1)具体例1
具体例1、2では、目的地を設定する際に、発話者が「おじいちゃん家」という単語を発話した例である。具体例1では、「おじいちゃん家」が認識できなかった後に目的地を設定した場合の辞書登録処理を説明する。
【0031】
目的地の設定に際し、トークスイッチ51がオンされると(S101)、認識辞書41がセットされる(S102)。発話者が「おじいちゃん家」と発話すると、音声情報が取得され(S103)、認識処理が行われる(S104)。発話された「おじいちゃん家」の波形データAに対応する音声波形データが認識辞書41に記憶されておらず、認識結果が得られない場合(S105:NO)、「認識できませんでした」といった音声を出力するとともに、波形データAを認識不可音声情報として保持する(S107)。
【0032】
ここで、「おじいちゃん家」が認識できなかったことを通知された発話者が、操作スイッチ群50を介して「名古屋市緑区A町3−18」という住所を入力し、目的地として設定した場合(S111:YES)、入力された住所である「名古屋市緑区A町3−18」が「おじいちゃん家」の住所である蓋然性が高い。本実施形態では、新たに取得された情報に基づいて目的地が設定されたので(S111:YES、S112)、設定された目的地である「名古屋市緑区A町3−18」を「おじいちゃん家」に対応すると推定される推定地点として特定し(S114)、推定地点情報を取得する(S115)。
【0033】
「おじいちゃん家」の波形データAを認識不可音声情報として保持する前に施設のジャンルが設定されていないものとすると(S116:NO)、認識不可情報として保持された「おじいちゃん家」の波形データAと、推定地点として特定された「名古屋市緑区A町3−18」の地点に関する情報とを関連付けて認識辞書41に記憶する。具体的には、図2に示すように、住所「名古屋市緑区A町3−18」(図2中においては「A町」以降を省略している。)、及び入力された住所に対応する位置座標(xa,ya)と、波形データAとを関連付けて認識辞書41に記憶する。また、「先ほど認識できなかったキーワードをこの地点を示す言葉として登録します」といった音声を、スピーカ71を介して出力する(S118)。
【0034】
(2)具体例2
具体例2では、「おじいちゃん家」の波形データAを認識不可音声情報として保持した後(S107)、目的地の設定に係る新たな情報が取得されなかった場合(S111:NO)の辞書登録処理を説明する。
この例では、目的地を設定せずに走行しているので、「おじいちゃん家」の波形データAを認識不可音声情報として保持した(S107)後にイグニッションがオフされた地点が目的地として設定しようとした「おじいちゃん家」に対応する地点である蓋然性が高い。そこで本実施形態では、「おじいちゃん家」の波形データAを認識不可音声情報として保持した後(S107)、目的地が設定されなかった場合(S111:NO)、イグニッションがオフされた地点を「おじいちゃん家」の波形データAに対応すると推定される推定地点として特定し(S113:YES、S114)、推定地点に関する推定地点情報を取得する(S115)。
【0035】
「おじいちゃん家」の波形データAを認識不可音声情報として保持する前に施設のジャンルが設定されていないものとすると(S116:NO)、認識不可情報として保持された「おじいちゃん家」の波形データAと、イグニッションがオフされた地点に関する情報である推定地点情報とを関連付けて認識辞書41に記憶する。また、「先ほど認識できなかったキーワードをこの地点を示す言葉として登録します」といった音声を、スピーカ71を介して出力する(S118)。
【0036】
具体例1、2によれば、発話者は、「おじいちゃん家」の波形データAに対して住所「名古屋市緑区A町3−18」を登録するための操作を行う必要がない。また次回からは、「おじいちゃん家」と発話することにより、「おじいちゃん家」の波形データAに関連付けて記憶された推定地点の情報を好適に利用することができ、利便性が向上する。
【0037】
(3)具体例3
具体例3では、発話者の発した音声情報に基づいて目的地の施設のジャンルを設定する場合を説明する。
スピーカ71を介して「ジャンルを発話して下さい」といったジャンルを問う音声が出力され、発話者がトークスイッチ51をオンにすると(S101)、ジャンルに関する認識辞書41がセットされる(S102)。次いで、発話者が「コンビニ」と発話したものとする。すると、発話された「コンビニ」が音声情報として取得され(S103)、認識処理が行われる(S104)。「コンビニ」の波形データBに対応する音声波形データが認識辞書41に「ジャンル」として記憶されておらず、認識結果が得られない場合(S105:NO)、「認識できませんでした」といった音声を出力するとともに、「コンビニ」の波形データBを認識不可音声情報として保持する(S107)。
【0038】
「コンビニ」の波形データBを認識不可音声情報として保持した後(S107)、目的地の設定を行わずに走行した場合(S111:NO)、イグニッションがオフされた地点を「コンビニ」に対応すると推定される推定地点として特定し(S113:YES、S114)、推定地点に関する推定地点情報を取得する(S115)。イグニッションがオフされた地点に対応する施設のジャンルが「コンビニエンスストア」であった場合、ユーザは、施設のジャンルである「コンビニエンスストア」を「コンビニ」と発話した蓋然性が高い。そこで、図2に示すように、「コンビニ」の波形データBと、施設のジャンルである「コンビニエンスストア」とを関連付けて認識辞書41に記憶する。また、「先ほど認識できなかったキーワードを『コンビニエンスストア』を示す言葉として登録します」といった音声を、スピーカ71を介して出力する(S118)。
【0039】
具体例3では、「ジャンルを発話して下さい」という問いかけに対して発話された「コンビニ」の波形データBは、ジャンルに関する単語であることが特定されている、といえる。このように、認識不可音声情報がジャンルに関する情報であると特定されている場合、推定地点情報のジャンルに関する情報を参照し、該当するジャンル(具体例3では「コンビニエンスストア」)と認識不可音声情報とを関連付けて記憶するように構成してもよい。換言すると、「記憶制御手段は、認識不可音声情報の属性が特定されている場合、推定地点情報を参照し、認識不可音声情報の属性に該当する属性情報と認識不可音声情報とを関連付けて記憶する」ということである。
【0040】
(4)具体例4
具体例4では、目的地の施設のジャンルが予め設定されている場合の辞書登録処理を説明する。
スピーカ71を介して「ジャンルを発話して下さい」といった音声が出力され、ジャンルが質問されていた場合であって、発話者が「ラーメン屋」と発話したものとする。すると、「ラーメン屋」の波形データCが音声情報として取得され(S103)、認識処理が行われ(S104)、「ラーメン屋」が認識候補として特定された場合(S105:YES)、認識候補が出力される(S106)。この例では、「どこのラーメン屋ですか?」という新たな入力を促す音声がスピーカ71を介して出力され(S106)、図3に示す音声認識処理を終了する。このとき、目的地の施設のジャンルとして「ラーメン屋」が設定され、内部的に記憶される。ここまでの処理が、次に行われる音声認識処理のS107に至る一連の操作処理に対応し、「ラーメン屋」が「認識不可音声情報の発話に至る事前情報」に対応している。
【0041】
「どこのラーメン屋ですか?」という質問に対し、トークスイッチがオンされると(S101)、施設ジャンル「ラーメン屋」に対応する認識辞書がセットされる(S102)。ここで発話者が「KR苑」と発話したものとする。すると、発話された「KR苑」が音声情報として取得され(S103)、認識処理が行われる(S104)。「KR苑」に対応する波形データDが認識辞書41の「ラーメン屋」に対応する認識辞書に記憶されておらず、認識結果が得られない場合(S105:NO)、「認識できませんでした」といった音声を出力するとともに、「KR苑」の波形データDを認識不可音声情報として保持する(S107)。
【0042】
「KR苑」の波形データDを認識不可音声情報として保持した後(S107)、目的地の設定を行わずに走行した場合(S111:NO)、イグニッションをオフした地点を「KR苑」の波形データDに対応すると推定される推定地点として特定し(S113:YES、S114)、推定地点に関する推定地点情報を取得する(S115)。
【0043】
この例では、目的地の施設のジャンルが予め「ラーメン屋」と設定されている(S116:YES)。次に推定地点情報に含まれる施設のジャンルが設定施設ジャンルとしてのラーメン屋と一致するか否かを判断する(S117)。推定地点情報に含まれる施設のジャンルがラーメン屋である場合、推定地点情報に含まれる施設のジャンルと設定施設ジャンルとが一致するので(S117:YES)、認識不可音声情報として保持された「KR苑」の波形データDと推定地点情報とを関連付けて認識辞書41に記憶する。具体的には、図2に示すように、推定地点情報である名称「KR苑」、ジャンル「ラーメン屋」、住所および位置座標と、波形データDとが関連付けられて認識辞書41に記憶される。また、「先ほど認識できなかったキーワードをこの地点を示す言葉として登録します」といった音声を、スピーカ71を介して出力する(S118)。
【0044】
一方、推定地点情報に含まれる施設のジャンルがラーメン屋ではなく、例えばコンビニエンスストアである場合、推定地点情報に含まれる施設のジャンルと設定施設ジャンルとが一致しない(S117:NO)。この場合、例えば目的地であるラーメン屋に向かう途中にコンビニエンスストアに立ち寄ったと考えられ、イグニッションがオフされた地点が目的地ではない可能性が高い。そのため、認識不可音声情報として保持された「KR苑」の波形データDと推定地点情報とを関連付けて認識辞書41に記憶する処理(S118)を行わない。このとき、「KR苑」の波形データDを破棄してもよいし、イグニッションがオンされたときに図4に示す処理を再度行うようにしてもよい。
【0045】
以上詳述したように、発話者の発した音声情報を取得し(S103)、音声情報を認識処理し(S104)、認識結果が得られたか否かを判断する(S105)。認識結果が得られないと判断された場合(S105:NO)、音声情報を認識不可音声情報として保持する(S107)。また、認識結果が得られないと判断された後に実行された操作に基づき、認識音声不可情報に対応すると推定される地図上の推定地点を特定し(S114)、推定地点に関する推定地点情報と認識不可音声情報とを関連付けて記憶させる(S118)。これにより、認識結果が得られなかった認識不可音声情報を、認識不可音声情報に対応すると推定される推定地点に関する推定地点情報と関連付けて適切に記憶させることができるので、音声認識できなかった音声情報を適切に音声認識させることができる。また、認識不可音声情報と推定地点情報とを関連付けて認識辞書41に記憶することにより、その後の音声認識処理おいて、記憶された認識不可音声情報を認識可能な情報として利用することができ、ユーザの利便性が向上する。
本実施形態では、登録のための操作をユーザがしなくても推定地点情報と認識不可音声情報とを関連付けて記憶させることにより、認識不可音声情報を音声認識可能な情報として自動的に記憶させることができる。
【0046】
認識結果が得られないと判断された後(S105:NO)、目的地の設定に係る情報が取得されたか否かを判断する(S111)。目的地の設定に係る情報に基づいて目的地が設定された場合(S111:YES、S112)、当該目的地を推定地点として特定する(S114)。これにより、目的地の設定に係る情報に基づいて推定地点を特定するので、認識不可音声情報に対応すると推定される推定地点をより適切に特定することができる。
【0047】
また、目的地の設定に係る新たな情報が取得されていないと判断された場合(S111:NO)、車両のイグニッションがオフされた地点を推定地点として特定する(S113:YES、S114)。これにより、認識不可音声情報に対応すると推定される推定地点を容易に特定することができる。
【0048】
さらに、目的地の施設のジャンルが予め設定されている場合(S116:YES)、推定地点情報に含まれる施設のジャンルと設定施設ジャンルとが一致するか否かを判断し(S117)、推定地点情報に含まれる施設のジャンルと設定施設ジャンルとが一致する場合(S117:YES)、推定地点情報と認識音声不可情報とを関連付けて記憶させる。これにより、推定地点情報と認識不可音声情報とを精度よく関連付けて記憶させることができる。
【0049】
本実施形態では、制御部10が「音声情報取得手段」、「認識処理手段」、「認識結果判断手段」、「音声情報保持手段」、「地点特定手段」、「記憶制御手段」、「新情報取得判断手段」、「一致判断手段」を構成する。また、図3中のS103が「音声情報取得手段」の機能としての処理に相当し、S104が「認識処理手段」の機能としての処理に相当し、S105が「認識結果判断手段」の機能としての処理に相当し、S107が「音声情報保持手段」の機能としての処理に相当し、図4中のS114が「地点特定手段」の機能としての処理に相当し、S118が「記憶制御手段」の機能としての処理に相当する。また、S111が「新情報取得判断手段」の機能としての処理に相当し、S117が「一致判断手段」の機能としての処理に相当する。
【0050】
以上、本発明は、上記実施形態になんら限定されるものではなく、発明の趣旨を逸脱しない範囲において種々の形態で実施可能である。
(ア)地点特定手段
上記実施形態では、目的地の設定に係る新たな情報が取得されていないと判断された場合(S111:NO)、イグニッションがオフされたか否かを判断し(S113)、イグニッションがオフされた地点を推定地点として特定した。変形例では、目的地の設定に係る新たな情報が取得されたか否かの判断を省略し、イグニッションがオフされた地点を推定地点として特定するように構成してもよい。これにより、認識不可音声情報に対応すると推定される推定地点を容易に特定することができる。
【0051】
(イ)一致判断手段
上記実施形態では、推定地点情報に含まれる目的地の施設のジャンルと事前情報としての設定施設ジャンルとが一致するか否かを判断し(S117)、推定地点情報に含まれる目的地の施設のジャンルと設定施設ジャンルとが一致する場合(S117:YES)、認識不可音声情報と推定地点情報とを関連付けて記憶した。事前情報は、施設のジャンルに限らず、S107に至る一連の操作において取得された情報であればどのような情報であってもよい。
【0052】
具体的には、事前情報は、住所に関する情報であってもよい。例えば、発話者の発した音声情報のうち、「愛知県岡崎市」までは認識できたものの、その先が認識できなかったとする。このとき、「愛知県岡崎市」に続く音声信号の波形データEを認識不可音声情報として保持する。また、「愛知県岡崎市」を事前情報とする。そして、特定された推定地点の住所が「愛知県岡崎市岡町」である場合、認識不可音声情報に含まれる属性情報(この例では住所)が事前情報である「愛知県岡崎市」と一致するので、認識音声不可情報として保持された波形データEと「愛知県岡崎市」に続く「岡町」とを関連付けて認識辞書41に記憶する。一方、特定された推定地点の住所が愛知県岡崎市以外であった場合、認識不可音声情報に含まれる属性情報と事前情報とが一致しないので、認識不可音声情報と推定地点情報とを関連付けて記憶する処理を行わない。
【0053】
(ウ)認識辞書
上記実施形態では、認識辞書には、音声情報としてA/D変換された波形データが記憶されていた。変形例では、認識辞書の音声情報は、音素列として記憶されていてもよい。この場合、認識不可音声情報についても、波形データに替えて音素列として保持するように構成してもよい。
【0054】
(エ)発話者への確認処理
図3中のS106にて認識結果を出力した後、認識結果が発話者の意図したものであるか否かを判断するステップを追加してもよい。例えば、スピーカ71を介し「これでよろしいですか?」といった音声を発することにより発話者に確認を促し、マイク61を介して入力された音声情報または操作スイッチ群50を操作することにより入力された情報を取得し、取得された情報に基づいて認識結果が発話者の意図したものであるか否かを判断する。認識結果が発話者の意図したものでないと判断された場合、S107へ移行し、S103にて取得した音声情報の波形データを認識不可音声情報として保持するように構成してもよい。
【0055】
また、S104における認識処理において、複数の認識候補が特定された場合、発話者に選択を促すように構成してもよい。
さらにまた、図4中のS118の直前に、認識音声不可情報と推定地点情報とを関連付けて記憶させるか否かの判断を発話者に促す処理を追加し、認識音声不可情報と推定地点情報とを関連付けて記憶させない旨の情報が取得された場合、S118の処理を行わないように構成してもよい。
【0056】
(オ)記憶制御手段
上記実施形態では、認識不可音声情報に対応すると推定される地図上の推定地点と認識不可音声情報とを関連付けて記憶させた。変形例では、認識不可音声情報と、車両用情報端末の操作に係る情報とを関連付けて記憶するように構成してもよい。具体的には、例えば、「空調を消す」という音声情報が取得されたが認識できなかった場合、「空調を消す」の音声データの波形データFを認識不可音声情報として保持する。そして、その後エアコンをオフにする操作がなされた場合、「空調を消す」の音声データの波形データFとエアコンをオフにする操作情報とを関連付けて記憶する、といった具合である。
【符号の説明】
【0057】
1:ナビゲーション装置(車両用情報端末)、10:制御部(音声情報取得手段、認識処理手段、認識結果判断手段、音声情報保持手段、地点特定手段、記憶制御手段、新情報取得判断手段、一致判断手段)、20:位置検出器、21:地磁気センサ、22:ジャイロスコープ、23:距離センサ、24:GPS受信機、30:地図データ記憶部、40:音声認識情報記憶部、41:認識辞書、50:操作スイッチ群、51:トークスイッチ、60:音声入力部、61:マイク、70:音声出力部、71:スピーカ、80:描画部、81:ディスプレイ

【特許請求の範囲】
【請求項1】
発話者の発した音声情報を取得する音声情報取得手段と、
前記音声情報取得手段により取得された前記音声情報を認識処理する認識処理手段と、
前記認識処理手段により認識結果が得られたか否かを判断する認識結果判断手段と、
前記認識結果判断手段により前記認識結果が得られないと判断された場合、前記音声情報を認識不可音声情報として保持する音声情報保持手段と、
前記認識結果判断手段により前記認識結果が得られないと判断された後に実行された操作に基づき、前記認識不可音声情報に対応すると推定される地図上の推定地点を特定する地点特定手段と、
前記推定地点に関する推定地点情報と前記認識不可音声情報とを関連付けて記憶させる記憶制御手段と、
を備えることを特徴とする車両用情報端末。
【請求項2】
前記認識結果判断手段により前記認識結果が得られないと判断された後、目的地の設定に係る情報が取得されたか否かを判断する新情報取得判断手段を備え、
前記地点特定手段は、前記新情報取得判断手段により前記目的地の設定に係る情報が取得されたと判断された場合、前記目的地の設定に係る情報に基づいて前記推定地点を特定することを特徴とする請求項1に記載の車両用情報端末。
【請求項3】
前記地点特定手段は、前記新情報取得判断手段により前記目的地の設定に係る情報が取得されていないと判断された場合、車両のイグニッションがオフされた地点を前記推定地点として特定することを特徴とする請求項2に記載の車両用情報端末。
【請求項4】
前記地点特定手段は、前記認識結果判断手段により前記認識結果が得られないと判断された後に車両のイグニッションがオフされた地点を前記推定地点として特定することを特徴とする請求項1に記載の車両用情報端末。
【請求項5】
前記認識不可音声情報の発話に至る事前情報が取得されている場合、前記推定地点情報に含まれる属性情報と前記事前情報とが一致するか否かを判断する一致判断手段を備え、
前記記憶制御手段は、前記一致判断手段により前記属性情報と前記事前情報とが一致すると判断された場合、前記推定地点情報と前記認識不可音声情報とを関連付けて記憶させることを特徴とする請求項1〜4のいずれか一項に記載の車両用情報端末。
【請求項6】
発話者の発した音声情報を取得する音声情報取得手段、
前記音声情報取得手段により取得された前記音声情報を認識処理する認識処理手段、
前記認識処理手段により認識結果が得られたか否かを判断する認識結果判断手段、
前記認識結果判断手段により前記認識結果が得られないと判断された場合、前記音声情報を認識不可音声情報として保持する音声情報保持手段、
前記認識結果判断手段により前記認識結果が得られないと判断された後に実行された操作に基づき、前記認識不可音声情報に対応すると推定される地図上の推定地点を特定する地点特定手段、
および、前記推定地点に関する推定地点情報と前記認識不可音声情報とを関連付けて記憶させる記憶制御手段、
としてコンピュータを機能させるプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate


【公開番号】特開2011−203455(P2011−203455A)
【公開日】平成23年10月13日(2011.10.13)
【国際特許分類】
【出願番号】特願2010−70180(P2010−70180)
【出願日】平成22年3月25日(2010.3.25)
【出願人】(000100768)アイシン・エィ・ダブリュ株式会社 (3,717)
【Fターム(参考)】