説明

音声認識装置及びこれを備えた車両用走行誘導装置

【課題】 音声認識辞書が有する比較データの容量を好適に抑制し、同時に音声認識処理時間を短縮するとともに入力音声の認識結果のうちからユーザが所望の目的地を選択する操作の操作性向上を図ることが可能な音声認識装置及びこれを備えた車両用走行誘導装置を提供する。
【解決手段】 入力音声を認識するための比較データを格納する音声認識辞書3Aと、入力音声に基づき生成される入力音声データと比較データとを比較して入力音声を認識し、該入力音声の認識結果を出力する音声認識部4とを備えた音声認識装置1Aであって、音声認識辞書3Aは、地名を表示情報として有する地名比較データを有し、一の地名を表示情報として有する地名比較データを有している場合に、他の同一名称の地名を表示情報として有する地名比較データを有していないことを特徴とする。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声認識装置及びこれを備えた車両用走行誘導装置に関する。
【背景技術】
【0002】
近年、車両が現在走行している位置情報を人工衛星から受信し、車両の位置情報を地図情報と共に表示部に表示し、運転者を誘導する車両用走行誘導装置が実用化されている。さらに、車両用走行誘導装置では、音声によって目的地設定などの操作を可能とするための音声認識装置を備えたものが実用化されている。この音声認識装置はユーザに要する操作の容易化を意図するものである。ところが、音声認識の対象語は、地名、施設名など膨大な数にのぼり、入力音声との比較を基本処理とする音声認識処理は必然的に時間がかかり、また誤認識の可能性も高くなっている。
【0003】
そのため、特許文献1では目的地設定などの操作の容易化を図り、音声認識処理時間の短縮を図り、しかも誤認識の可能性も低くすることのできる音声認識装置及び該音声認識装置が搭載されたナビゲーション装置を提案している。特許文献1の提案技術によれば、認識辞書が記憶する比較データのうちから、音声認識処理を行う処理対象データを例えば指定した地図の範囲に絞り込むことができる。これによって、音声認識処理時間を短縮し、また誤認識の可能性を低くすることができ、結果として入力音声の認識結果のうちから所望の対象を選択する操作の容易化を図ることが可能である。
【特許文献1】特開2004−20883号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
しかしながら、音声認識装置には上述の課題以外にも、以下に示す課題が存在する。音声認識装置が備える音声認識辞書は、入力音声を認識するための比較対象として比較データを有している。比較データのうち地名に関する比較データ(以下、地名比較データという。)は、一般的には地域単位でまとめて構成され、さらに地名比較データ全体は地域単位でまとめて構成されたものの集合体として構成される。このようにして地名比較データ全体を構成した場合、同一名称の地名が複数の地域に存在すると、それぞれに対応する地名比較データが存在することになる。例えば地名比較データ全体が全米や日本全国を対象とするものであり、地域が州や都道府県である場合には、同一名称の地名それぞれに地名比較データが存在すると、地名比較データ全体はより膨大なデータとなってしまう。また、これら地名比較データは入力音声を認識する上で比較の対象となるため、地名比較データ数が多いとそれだけ音声認識処理時間も増大してしまう。また、入力音声の認識結果としても、異なる地域に存在する同一名称の地名が複数候補地名として挙がるため、ユーザが認識結果のうちから所望する目的地を探し出し選択するのに時間がかかるという問題も発生してしまう。
【0005】
本発明は、上記課題に鑑みてなされたものであり、音声認識辞書が有する比較データの容量を好適に抑制し、同時に音声認識処理時間を短縮するとともに入力音声の認識結果のうちからユーザが所望の目的地を選択する操作の操作性向上を図ることが可能な音声認識装置及びこれを備えた車両用走行誘導装置を提供することを目的とする。
【課題を解決するための手段】
【0006】
上記課題を解決するために、本発明は、入力音声を認識するための比較データを格納する音声認識辞書と、前記入力音声に基づき生成される入力音声データと前記比較データとを比較して前記入力音声を認識し、該入力音声の認識結果を出力する音声認識部とを備えた音声認識装置であって、前記音声認識辞書は、地名を表示情報として有する地名比較データを有し、一の地名を表示情報として有する地名比較データを有している場合に、他の同一名称の地名を表示情報として有する地名比較データを有していないことを特徴とする。本発明によれば、地名比較データ全体を地名別で構成することによって、言い換えれば音声認識辞書を地名でユニークな辞書として作成することによって、重複する他の同一名称の地名をデータ内容とする地名比較データを音声認識辞書から除外することができる。これによって、音声認識辞書が有する地名比較データの容量を抑制することが可能である。また、地名比較データの容量を抑制することによって、音声認識処理に要する時間を短縮することが可能である。さらに、入力音声の認識結果として同一名称の地名が複数候補に挙がることがないため、認識結果のうちからユーザが所望の目的地を選択する操作の操作性向上を図ることが可能である。なお、称呼が同一の地名であっても例えば漢字やアルファベットなど同種の文字列で表現した場合に異なる文字列で表現される地名は、同一名称の地名としては扱わない。
【0007】
また、本発明は、前記地名比較データは、該地名比較データに基づく地名が存在する地域数を表示情報として有してもよい。本発明によれば、同一名称の地名が複数の地域に存在するかどうかをユーザに知らせるための表示を地名比較データに基づき様々な態様で実現可能である。なお、音声認識辞書が地名比較データに関連付けられた他のデータを有して、この他のデータが地名比較データに基づく地名の存在する地域数を表示情報として有してもよい。
【0008】
また、本発明は、前記入力音声が地名である場合に、前記認識結果に基づく候補地名とともに、該候補地名に対応する候補地域数を表示するための第1の表示情報を生成する表示情報生成部を備えてもよい。本発明によれば、認識結果に基づく候補地名とともにその候補地名が複数の地域に存在するかどうかをユーザに知らせるための第1の表示情報を、様々な表示態様で実現可能である。
【0009】
また、本発明は、制御部と、道路地図や施設情報などをデータ内容として有する地図データベースから地図データを読取る読取り機構とを備え、前記認識結果のうちから候補地域が複数存在する候補地名をユーザが選択した場合に、前記制御部が、選択された前記候補地名を含む地名をデータ内容として有する地図データを、前記地図データベースのうちから検索してもよい。ここで、地図データは地名比較データと異なり、地名とともに地名が存在する地域を表示情報として有している。本発明によれば、選択された候補地名が複数の地域に存在していても、同一名称の地名それぞれを特定することが可能である。
【0010】
また、本発明は、前記表示情報生成部は、前記制御部が前記地図データベースから検索した地図データに基づいて、地名とともに、該地名が存在する地域名称を表示するための第2の表示情報を生成してもよい。本発明によれば、複数の同一名称の地名をその地名が存在する地域とともにユーザに知らせるための第2の表示情報を、様々な表示態様で実現可能である。これによって、ユーザは所望する目的地がどの地域に存在するものであるかを認識して選択することが可能である。
【0011】
また、本発明は、前記第1の表示情報の地名の表示態様は、前記認識結果のマッチング度合いが高い順のリスト形式であってもよい。本発明によれば、ユーザが認識結果のうちから所望する目的地を探し出して選択することが容易になる。
【0012】
また、本発明は、前記第2の表示情報の地名の表示態様は、前記地域名称のアルファベット順のリスト形式であってもよい。本発明によれば、ユーザはその地域名称の頭文字を手掛かりに所望する目的地を容易に探し出して選択することが可能である。
【0013】
また、本発明は、前記第2の表示情報の地名の表示態様は、車両の現在位置から近い順のリスト形式であることを特徴とする前記音声認識装置を備えた車両用走行誘導装置であってもよい。本発明によれば、車両の現在位置からそれほど離れていない地名を目的地としてユーザが音声で入力していた場合に、ユーザは第2の表示情報に基づく表示のうちから所望する目的地を容易に探し出して選択することが可能である。
【発明の効果】
【0014】
本発明によれば、音声認識辞書が有する比較データの容量を好適に抑制し、同時に音声認識処理時間を短縮するとともに入力音声の認識結果のうちからユーザが所望の目的地を選択する操作の操作性向上を図ることが可能な音声認識装置及びこれを備えた車両用走行誘導装置を提供できる。
【発明を実施するための最良の形態】
【0015】
以下、本発明を実施するための最良の形態を図面と共に詳細に説明する。
【0016】
本実施例に係る音声認識装置1A及び音声認識装置1Aを備えるナビゲーション装置10Aの構成を、図1を用いて詳細に説明する。図1において、二重線囲みで示す構成が、本実施例に係る音声認識装置1Aの構成である。図1において、読取り機構11は、地図データやその他の案内データを格納したCD(コンパクトディスク)−ROM(Read Only Memory)やDVD(Digital Versatile Disc)−ROM等の記録媒体(地図データベース)を読み込むための構成である。ただし、これに限定されず、たとえばハードディスクドライブなどの記憶装置も適用することができる。
【0017】
操作部12は、ユーザが車載用ナビゲーション装置10Aに各種操作・設定を入力するための構成である。これは、リモートコントローラ装置やコントロールパネル等のように個別に構成されていても、後述する表示部16と一体に形成されたタッチパネル式の入力装置として構成されていても良い。更には、音声入力用のマイクロフォン等で構成されてもよい。
【0018】
VICS(道路交通情報通信システム)受信部13は、電波ビーコン又は光ビーコンから送信されてくるVICS情報を受信するための構成である。GPS(Global Positioning System)受信部14は、GPS衛星から送信されてくるGPS信号を受信して車両の現在位置の緯度及び経度を検出するための構成である。自立航法センサ15は、車両方位を検出するためのジャイロ等を含む角度センサ15aと、一定の走行距離毎にパルスを発生する距離センサ15bとを有して構成されており、車両の進行方向や速度を検出する。
【0019】
表示部16は、例えば液晶表示方式のディスプレイ装置等で構成され、ナビゲーション装置10Aから入力された、地図や誘導経路や車両の現在位置や建造物その他アイコン等の各種情報を表示するための構成である。スピーカ17は、同じくナビゲーション装置10Aから入力された音声案内情報等を出力するための構成である。尚、スピーカ17はその他、音響装置等から入力された音楽等も出力することができる。
【0020】
また、ナビゲーション装置10Aにおいて、バッファメモリ21は、後述する制御部27からの制御の下に読取り機構11から入力された地図データ等を一時的に格納するための構成である。I/F(インタフェース)22,23,24,25は、それぞれ操作部12,VICS受信部13,GPS受信部14,自立航法センサ15と車載用ナビゲーション装置10Aにおける内部バスとを接続するための構成である。
【0021】
制御部27は、例えばマイクロコンピュータやCPU(中央演算処理装置)等の演算処理装置で構成される。この制御部27は、ナビゲーション用のプログラムを内蔵しており、このプログラムに従い、GPS受信部14及び自立航法センサ15から出力される信号に基づいて車両の現在位置を検出したり、表示させたい地図のデータ等を読取り機構11からバッファメモリ21に読み出したり、バッファメモリ21に読み出した地図データから誘導経路を探索したり、設定された探索条件に合う誘導経路をバッファメモリ21に読み出された地図データ等を用いて1つ以上探索する等のナビゲーションに係る種々の処理を実行する。但し、例えば上記のプログラムはCD−ROMやDVD−ROM等に記憶しておくことも可能である。この場合、制御部27は必要に応じてこれを読出し、実行する。
【0022】
地図描画部28は、バッファメモリ21に読み出された地図データを用いて地図イメージの描画処理を行うための構成である。表示情報生成部29は、動作状況に応じて各種メニュー画面(操作画面)やカーソル等の各種マークを生成するための構成であり、また、後述する第1の表示情報と第2の表示情報とを生成するための構成である。誘導経路記憶部30は、出発地及び目的地やその他の探索条件に基づいて制御部27において探索された誘導経路の全てのノードに関するデータ及び探索中に変更された誘導経路のデータ(以下、これらを誘導経路データという)を格納しておくための構成である。誘導経路描画部31は、誘導経路記憶部30から誘導経路データを読み出して誘導経路を他の道路とは異なる表示態様(色や線幅を用いた強調表示等)で描画するための構成である。アイコン描画部32は、地図イメージ上に描画する建造物やスポットや自車または他車などのアイコンの描画処理を行うための構成である。音声出力部33は、例えばDSP(Digital Signal Processor)等を含んで構成され、制御部27からの信号に基づいて音声信号をスピーカ17に出力する。
【0023】
画像合成部34は、地図描画部28で描画された地図イメージに、誘導経路描画部31で描画された誘導経路や、表示情報生成部29で描画された操作画面及び各種マークや、アイコン描画部32で描画された各種アイコンや、制御部27から入力された画像等を適宜重ねて、表示部16に表示させるための構成である。
【0024】
次に、図1に示す本実施例に係る音声認識装置1Aの構成について詳述する。前述したように、音声認識装置1Aの構成は図1において2重囲みで示す構成である。ナビゲーション装置10Aが音声認識装置1Aを備える場合には、図1に示すように制御部27や表示情報生成部29などの構成はナビゲーション装置10Aと共用可能である。すなわち、制御部27や表示情報生成部29はナビゲーション装置10Aの構成であるとともに音声認識装置1Aの構成でもある。
【0025】
マイクロフォン2は、ユーザが入力した音声を電気信号に変換するための構成である。ただし、ナビゲーション装置10Aの操作部12が音声入力用のマイクロフォンで構成されている場合には、別途マイクロフォン2を備えることなく操作部12を援用することも可能である。音声認識辞書3Aは、入力音声を認識するための比較対象である比較データを格納したCD−ROMやDVD−ROMなどの記録媒体で構成される。ただし、ハードディスクドライブなどの記憶装置を適用することも可能であり、地図データベースが地図データを格納した記憶装置で構成されている場合には、この記憶装置の一部の容量を利用する態様で記憶装置を共用することも可能である。音声認識部4は、電気信号に変換された入力音声をさらにデジタル信号の入力音声データに生成し、比較データと比較することによって入力音声を認識するための構成である。ただし、マイクロフォン2がデジタル信号の入力音声データを生成してもよく、マイクロフォン2と音声認識辞書4との間にA/D変換器を備えてもよい。
【0026】
次に、音声認識辞書3が格納する比較データについて詳述する。比較データのうち地名に関する比較データ(以下、地名比較データという。)は、一般的には地域単位でまとめて構成され、さらに地名比較データ全体は地域単位でまとめて構成されたものの集合体として構成される。このようにして地名比較データ全体が構成されるのは、比較データを作成する対象範囲が例えば日本全国や全米など広範囲に渡るため、まず地域毎にそれぞれ地名比較データを作成するほうが便宜であることによる。
【0027】
このよう地域単位で地名比較データ全体を構成した場合、同一名称の地名が複数の地域に存在すると、それぞれの地域に対応する同一名称の地名をデータ内容として有する地名比較データが複数存在することになる。ここで、説明の便宜のため、地域単位で構成された地名比較データを有する音声認識辞書3を音声認識辞書3Bとし、この音声認識辞書3Bを備える音声認識装置1を音声認識装置1Bとする。また、音声認識装置1Bを備えるナビゲーション装置10をナビゲーション装置10Bとする。
【0028】
図2は、地域単位で構成された地名比較データの一部を模式的に示す図である。図2に示すように、地名比較データはより具体的には、入力音声データと比較するための読みデータと、表示部16に地名を文字列によって表示するための文字列データとを有している。すなわち、文字列データが地名を表示情報として有している。ここで、「KIMBERLY(キンバリー)」は全米において複数の州(地域)に存在する市の名称(地名)である。このような場合、地域単位で構成された地名比較データは、図2に示すように「キンバリー」をデータ内容とする読みデータとともに「KIMBERLY,AL」、「KIMBERLY,ID」などの地名とその地名が存在する地域とからなる文字列をデータ内容とする文字列データを有している。なお、「AL」「ID」などは州の略称である。このように互いに他の地域に存在する同一名称の地名をデータ内容とする地名比較データに同一の読みデータを設定するのは、入力音声として地名を複雑に指定する必要性を回避するためである。
【0029】
図3は、音声認識装置1Bを備えるナビゲーション装置10Bにおいて、入力音声により目的地を検索する方法を示す図である。図3に示すように、ユーザが音声により目的地を検索する場合には、ナビゲーション装置10Bは表示部16に表示画面41を表示し、ユーザに対して市の名称(地名)を音声入力するよう促す。なお、この表示画面41は目的地を検索するに当たってユーザが音声入力モードを選択したときに表示されるものである。続いてユーザは、マイクロフォン2に「キンバリー」と音声入力する。「キンバリー」という入力音声に対し、ナビゲーション装置10Bは音声認識装置1Bの認識結果の候補地名を表示画面42に示すようなリスト形式で表示する。これに対しユーザは、マイクロフォン2に「リストナンバーフォー」と音声入力する。「リストナンバーフォー」という入力音声に対し、ナビゲーション装置10Bはリストの4番目に挙がっている候補地名「KIMBERLY,MO」の道路地図を目的地として表示画面43に示すような表示態様で表示する。
【0030】
図3の表示画面42に示すように、地名比較データが地域単位で構成されている場合には、音声認識部4は入力音声「キンバリー」に対して、「KIMBERLY,AL」「KIMBERLY,ID」などを候補地名として認識する。また、音声認識部4では入力音声データと地名比較データとの比較による同一性の判断はマッチングによって行われるため、所定のマッチング度合いを満たす場合には例えば「KIMBERLINGCITY,MO」「KIMBERTON,PA」なども候補地名として挙げられる。このように、地名比較データが地域単位で構成されていると、異なる地域に存在する同一名称の地名のほか、所定のマッチング度合いを満たす地名も候補地名として挙がる。そのため、ユーザが表示画面42で示されるような認識結果のうちから所望する目的地を探し出し選択するのには時間がかかってしまう。
【0031】
上述した問題に対し、本実施例に係る音声認識辞書3Aは地名でユニークな辞書となるような地名比較データを格納している。図4は、音声認識辞書3Aが格納する地名比較データの一部を模式的に示す図である。図4に示すように、音声認識辞書3Aには、「キンバリー」をデータ内容とする読みデータに対しては、「KIMBERLY」の文字列をデータ内容とする文字列データを有している地名比較データしか存在しない。すなわち、音声認識辞書3Aには、図3で示した音声認識辞書3Bのように「キンバリー」をデータ内容とする読みデータに対して、「KIMBERLY,AL」「KIMBERLY,ID」などの文字列をデータ内容とする文字列データを有する地名比較データが存在しない。さらに、音声認識辞書3Aが格納する地名比較データは、音声認識辞書3Bが格納する地名比較データと異なり、地名が存在する地域数を表示情報とする地域数データを有している。
【0032】
次に、音声認識装置1Aを備えるナビゲーション装置10Aにおいて、入力音声により目的地を検索する方法を図5と図6とを用いて詳述する。図5は、音声認識装置1Aを備えるナビゲーション装置10Aにおいて、入力音声により目的地を検索する方法を示す図である。また、図6は、図5に示す表示画面52、53それぞれを生成するにあたって音声認識辞書3A及び地図データベースが利用される過程を模式的に示す図である。図5に示すように、ユーザが音声により目的地を検索する場合には、ナビゲーション装置10Aは表示部16に表示画面51を表示し、ユーザに対して市の名称(地名)を音声入力するよう促す。これに対しユーザは、マイクロフォン2に「キンバリー」と音声入力する。「キンバリー」という入力音声に対し、ナビゲーション装置10Aは音声認識装置1Aの認識結果の候補地名を表示画面52に示すようなリスト形式で表示する。
【0033】
この表示画面52を生成する過程においては、図6に示すように音声認識辞書3Aが利用される。より具体的には音声認識部4が入力音声「KIMBERLY」を入力音声データに変換し、音声認識辞書3Aの有する地名比較データと比較して入力音声「KIMBERLY」を認識する(矢印1)。続いて、音声認識部4は入力音声「KIMBERLY」と所定のマッチング度合いを満たす地名比較データを選出する。ここで、選出された地名比較データがデータ内容として有する地名が、候補地名となる。候補地名を有する地名比較データが選出されると、表示情報生成部29は候補地名とその候補地名に対応する候補地域数を表示するための第1の表示情報を生成する。また、第1の表示情報は、制御部27の指令に基づき選出された候補地名をデータ内容として有する地名比較データが、音声認識辞書3Aから表示情報生成部29に読み出されることによって生成される。第1の表示情報が生成されると、制御部27は第1の表示情報を表示画面52に示すような表示態様で表示部16に表示する(矢印2)。この表示画面52にはカーソル55が当たっている候補地名の存在する地域数を表示する地域数表示52aが設けてある。なお、地域数表示52aに表示される地域数は、カーソルが当たっている候補地名をデータ内容として有する地名比較データに基づいて表示される。すなわち、カーソル55が他の候補地名に移動する度に、制御部27の指令に基づきその候補地名をデータ内容として有する地名比較データから表示情報生成部29に地域数データが読み出され、表示情報生成部29は読み出された地域数データに基づき地域数表示52aを変更する。ただし、表示情報生成部29は候補地名毎に地域数を表示するような表示態様で第1の表示情報を生成しても構わない。表示画面52に示すように、この地域数表示52aによってユーザはカーソル55が当たっている「KIBALL」が全米で15の州に存在していることを知ることができる。
【0034】
表示画面52に示すように、「キンバリー」という入力音声に対しては、「KIMBERLY」の他「KIMBALL」「KINBRAE」「KINGSDALE」「KINGSTON」「KINNEY」などが候補地名として挙がっている。このように、入力音声が「キンバリー」であっても所定のマッチング度合いを満たせば他の地名も候補地名として挙げられる。ところが、本実施例では音声認識辞書3Aを地名でユニークな辞書として作成しているので、他の地域に存在する同一名称の地名が複数候補地名として挙がることがなく、ユーザは容易に「KIMBERLY」を探し出すことが可能である。
【0035】
また、第1の表示情報は表示画面52に示すような表示態様のほかに次に示すような表示態様で表示することが可能である。前述したように、表示画面52に表示される候補地名を有する地名比較データは、入力音声とのマッチング度合いによって音声認識部4により選出される。従って、入力音声の確からしさを基準として、第1の表示情報の候補地名をマッチング度合いが高い順にリスト形式で表示すれば、ユーザが容易に所望の目的地を探し出せることを期待できる。
【0036】
図5に示すように、表示画面52に対しユーザが「KIMBERLY」を選択するとナビゲーション装置10Aは、表示画面53を表示する。表示画面53には、地名「KIMBERLY」とともにその地名が存在する「AL」「ID」などの地域名称がリスト形式で表示される。この表示画面53を生成する過程においては、図6に示すように地図データベースが利用される。より具体的には、制御部27は、選択された候補地名「KIMBERLY」をデータ内容として有する地名比較データの文字列データを音声認識辞書3Aから取得する。続いて制御部27は、地図データベースから読取り機構11に地図データを読み出し、さらにバッファメモリ21に地図データを読み出す。制御部27は、文字列データに基づいてバッファメモリ21に読み出した地図データのデータ内容に文字列「KIMBERLY」が含まれるかどうかを判定する。判定し終えると、制御部27は再び地図データベースから読取り機構11に他の地図データを読み出し、さらにバッファメモリ21に地図データを読み出す作業を、すべての地図データについて判定し終えるまで実行する(矢印3)。上述のようにして、文字列「KIMBERLY」をデータ内容として含む地図データを地図データベースから検索することが可能である。
【0037】
続いて表示情報生成部29は、地図データベースから検索された地図データに基づいて、地名「KIMBERLY」とともに地名が存在する地域名称「AL」「ID」などを表示するための第2の表示情報を生成する。また、第2の表示情報は、制御部27の指令に基づき、バッファメモリ21から表示情報生成部29へ検索された地図データが読み出されることによって生成される。なお、図6に示すように、地図データはデータ内容として地名と地名が存在する地域名称とで構成された表示情報を有している。第2の表示情報が生成されると、制御部27は表示部16に第2の表示情報を表示画面53に示すような表示態様で表示する(矢印4)。このようにして、表示情報生成部29は、複数の同一名称の地名「KIMBERLY」を、「KIMBERLY」が存在する地域「AL」「ID」とともにユーザに知らせる表示画面53に示すような表示態様の第2の表示情報を生成することが可能である。
【0038】
また第2の表示情報は表示画面53に示すような表示態様のほかに以下に示すような表示態様で表示することも可能である。表示画面53では、地名が地域名称のアルファベット順にリスト形式で表示されているが、ユーザが目的地を検索するために音声入力した地名は、車両の現在位置の近くに存在している場合が多い。このような事情を考慮すると、第2の表示情報の地名を車両の現在位置から近い順にリスト形式で表示することがユーザにとって有効である。ここで、第2の表示情報の地名は地図データに基づくものであるので、この地図データから同時に地名の存在位置を把握することが可能である。また、車両の現在位置については、GPS受信部14が受信したGPS信号によって検出することが可能である。これらの情報に基づけば、車両の現在位置から第2の表示情報の地名がどれだけ離れているかを認識することが可能である。これによって、ユーザが第2の表示情報に基づく表示画面から容易に所望の目的地を探し出せることを期待できる。
【0039】
ユーザが表示画面53のうちから所望の目的地を探し出して選択すると、ナビゲーション装置10Aは目的地として道路地図を表示画面54のように表示する(矢印5)。これによってユーザは所望の目的地を知ることができる。なお、表示画面52において、ユーザが1つの地域にしか存在しない候補地名を選択した場合には、図5に示すようにただちに表示画面54が表示される。
【0040】
なお、第1の表示情報や第2の表示情報や対象の道路地図を表示する態様としては、図5または図6で示した表示態様以外にも以下に示すような表示態様が可能である。例えば、第1の表示情報と第2の表示情報とを同時に1画面で表示したり、対象の道路地図と第1の表示情報または第2の表示情報とを同時に1画面で表示したりすることも可能である。同時に1画面で表示することの利点としては、例えば第1の表示情報に基づく候補地名を指定するカーソル55が移動すると、第2の表示情報に基づく複数の同一名称の地名が同じ画面に表示されるので、直感的にユーザに伝わりやすいなどの利点がある。また、第1の表示情報の表示態様としては、前述したようにアルファベット順に表示したりマッチング度合いが高い順に表示したりすることも可能であるが、これらの表示態様をさらにユーザが選択可能に適用することも可能である。また、本実施例では、全米を対象として音声認識辞書3Aを作成しているが、例えば日本全国を対象とする場合には、第1の表示情報の表示態様として候補地名を50音順に表示することも可能である。また、これら第1の表示情報の表示態様の変形は第2の表示情報の表示態様についても同様に適用可能である。
【0041】
また、地名でユニークな音声認識辞書3Aを作成する効果として以下のような具体的効果が挙げられる。全米を対象として音声認識辞書を作成するとき、市の名称(地名)について各州(地域)別に地名比較データを作成して地名比較データ全体を構成した場合には、音声認識辞書には95,967個の地名比較データが存在することになる。これを本実施例に係る音声認識辞書3Aのように市の名称でユニークに作成した場合には、音声認識辞書3Aが有する地名比較データ数は60,350個になる。このように本実施例に係る音声認識辞書3Aでは、データ容量を抑制することが可能である。また、全米で1つの州にしか存在しない地名数は48,641個あり、11,709個の地名は複数の州に存在することになる。さらに、もっとも多くの州に存在する市の名称「FRANKLIN」は35の州に存在する。これらの地名複数が候補地名として図3に示す表示画面41のように表示された場合には、ユーザが所望する目的地を選択するのに多大な時間を要することは容易に想像できる。本実施例に係る音声認識辞書3Aに基づけば、図4に示す表示画面52のように例えば「FRANKLIN」は1つしか表示されないので、ユーザは候補地名のうちから容易に所望する目的地を探し出して選択することが可能である。以上により、音声認識辞書3が有する比較データの容量を好適に抑制し、同時に音声認識処理時間を短縮するとともに入力音声の認識結果のうちからユーザが所望の目的地を選択する操作の操作性向上を図ることが可能な音声認識装置1A及びこれを備えたナビゲーション装置10Aを実現可能である。
【0042】
上述した実施例は本発明の好適な実施の例である。但し、これに限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々変形実施可能である。
【図面の簡単な説明】
【0043】
【図1】本実施例に係る音声認識装置1A及び音声認識装置1Aを備えるナビゲーション装置10Aの構成を示す図である。
【図2】地域単位で構成された地名比較データの一部を模式的に示す図である。
【図3】音声認識装置1Bを備えるナビゲーション装置10Bにおいて、入力音声により目的地を検索する方法を示す図である。
【図4】音声認識辞書3Aが格納する地名比較データの一部を模式的に示す図である。
【図5】音声認識装置1Aを備えるナビゲーション装置10Aにおいて、入力音声により目的地を検索する方法を示す図である。
【図6】図5に示す表示画面52、53それぞれを生成するにあたって音声認識辞書3A及び地図データベースが利用される過程を模式的に示す図である。
【符号の説明】
【0044】
1 音声認識装置
2 マイクロフォン
3 音声認識辞書
4 音声認識部
10 ナビゲーション装置
11 読取り機構
12 操作部
13 VICS受信部
14 GPS受信部
15 自立航法センサ
15a 角度センサ
15b 距離センサ
16 表示部
17 スピーカ
21 バッファメモリ
22、23、24、25 I/F
27 制御部
28 地図描画部
29 表示情報生成部
30 誘導経路記憶部
31 誘導経路描画部
32 アイコン描画部
33 音声出力部
34 画像合成部
41、42、43 ナビゲーション装置10Bによる表示画面
51、52、53、54 ナビゲーション装置10Aによる表示画面
52a 地域数表示
55 カーソル

【特許請求の範囲】
【請求項1】
入力音声を認識するための比較データを格納する音声認識辞書と、前記入力音声に基づき生成される入力音声データと前記比較データとを比較して前記入力音声を認識し、該入力音声の認識結果を出力する音声認識部とを備えた音声認識装置であって、
前記音声認識辞書は、地名を表示情報として有する地名比較データを有し、
一の地名を表示情報として有する地名比較データを有している場合に、他の同一名称の地名を表示情報として有する地名比較データを有していないことを特徴とする音声認識装置。
【請求項2】
前記地名比較データは、該地名比較データに基づく地名が存在する地域数を表示情報として有することを特徴とする請求項1記載の音声認識装置。
【請求項3】
前記入力音声が地名である場合に、前記認識結果に基づく候補地名とともに、該候補地名に対応する候補地域数を表示するための第1の表示情報を生成する表示情報生成部を備えることを特徴とする請求項2記載の音声認識装置。
【請求項4】
制御部と、道路地図や施設情報などをデータ内容として有する地図データベースから地図データを読取る読取り機構とを備え、
前記認識結果のうちから候補地域が複数存在する候補地名をユーザが選択した場合に、前記制御部が、選択された前記候補地名を含む地名をデータ内容として有する地図データを、前記地図データベースのうちから検索することを特徴とする請求項3記載の音声認識装置。
【請求項5】
前記表示情報生成部は、前記制御部が前記地図データベースから検索した地図データに基づいて、地名とともに、該地名が存在する地域名称を表示するための第2の表示情報を生成することを特徴とする請求項4記載の音声認識装置。
【請求項6】
前記第1の表示情報の地名の表示態様は、前記認識結果のマッチング度合いが高い順のリスト形式であることを特徴とする請求項3から5いずれか1項記載の音声認識装置。
【請求項7】
前記第2の表示情報の地名の表示態様は、前記地域名称のアルファベット順のリスト形式であることを特徴とする請求項5または6記載の音声認識装置。
【請求項8】
前記第2の表示情報の地名の表示態様は、車両の現在位置から近い順のリスト形式であることを特徴とする請求項5または6記載の前記音声認識装置を備えた車両用走行誘導装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2007−3602(P2007−3602A)
【公開日】平成19年1月11日(2007.1.11)
【国際特許分類】
【出願番号】特願2005−180751(P2005−180751)
【出願日】平成17年6月21日(2005.6.21)
【出願人】(000101732)アルパイン株式会社 (2,424)
【Fターム(参考)】