音声認識装置及び音声認識方法

【課題】本発明は、従来と比して簡易な操作で、かつ音声認識率を上げながら使い勝手を向上する。
【解決手段】本発明は、モニター３に表示した初期メニュー画面ＭＷ１上のメニューアイコンＭＩの中からロータリコマンダ４の回転操作子２１を介して例えば場所アイコンＭＩ１が選択されたことを認識したときから、場所アイコンＭＩ１に関連した単語及び単語列からなる複数の言語モデルが登録された場所辞書１４ＡをＲＡＭ１３上に読み出し、場所アイコンＭＩ１を認識したとき以降、当該認識している間だけ音声を入力し、その音声信号と、ＲＡＭ１３上に読み出した言語モデルとを比較し、当該音声信号と最も一致度の高い言語モデルに対応した単語又は単語列を認識結果として得、その認識結果に対応した目的地検索処理を行うことでき、かくして簡易な操作で、かつ音声認識率を上げながら使い勝手を向上することができる。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、音声認識装置及び音声認識方法に関し、例えば車両に搭載されるナビゲーション装置（以下、これをカーナビゲーション装置と呼ぶ。）に適用して好適なものである。
【背景技術】
【０００２】
従来、カーナビゲーション装置においては、ユーザにより発話された音声をマイクによって集音し、その音声を認識する音声認識装置が備えられたものがある。
【０００３】
このようなカーナビゲーション装置のなかには、複数の単語又は単語列を音声認識した場合、当該複数の単語又は単語列をキーワード候補としてタッチ操作可能なモニターにそれぞれ表示し、当該キーワード候補をそれぞれユーザにタッチ操作させ、検索条件、除外条件、或いは排他条件等を設定させ、その条件で例えば目的地を検索するようになされたものがある（例えば、特許文献１参照）。
【０００４】
またカーナビゲーション装置のなかには、例えば「レストラン」のリストをモニターに表示している場合、「レストラン」の単語及び単語列だけを対象とした「レストラン」辞書を用い、その「レストラン」辞書に格納された単語及び単語列だけを音声認識の比較対象とするものがある（例えば、特許文献２参照）。
【０００５】
すなわち、カーナビゲーション装置は、モニターに表示している状態を認識し、認識した状態に関連する単語及び単語列を抽出することにより辞書として設定し、当該辞書に登録された単語及び単語列だけを音声認識の比較対象とすることにより、比較対象となる単語及び単語列の数を減らすことができるので、認識率の高い音声認識を実現するようになされたものがある。
【特許文献１】特開２００６−９５５７６公報
【特許文献２】特開２０００−２００８６公報
【発明の開示】
【発明が解決しようとする課題】
【０００６】
ところで上述した特許文献１に記載のカーナビゲーション装置においては、キーワード候補を検索条件、除外条件、或いは排他条件のいずれかに設定するようになされているため、ユーザに対して複数回のタッチ操作を行わせざるを得ず、煩雑な操作を強いるという問題があった。
【０００７】
また実際上、カーナビゲーション装置は、メニューを階層型に構成するようになされている。そのため、上述した特許文献２に記載のカーナビゲーション装置においては、メニュー画面を上位階層から下位階層まで移行させる際、ユーザに対して複数回の操作を行わせざるを得ず、煩雑な操作を強いるという問題があった。
【０００８】
本発明は以上の点を考慮してなされたもので、従来と比して簡易な操作で、かつ音声認識率を上げながら使い勝手を向上し得る音声認識装置及び音声認識方法を提案しようとするものである。
【課題を解決するための手段】
【０００９】
かかる課題を解決するため本発明の音声認識装置においては、表示手段に対して表示した階層型メニューでなる初期メニュー画面上の複数の項目の中から所定の操作手段を介してユーザにより選択された任意の選択項目を認識する選択項目認識手段と、複数の項目の内容にそれぞれ関連した単語及び単語列からなる複数の言語モデルが登録されている項目別辞書を複数種類記憶する記憶手段と、選択項目認識手段により選択項目を認識したとき、選択項目に対応した項目別辞書に登録されている言語モデルを記憶手段から読み出す辞書読出手段と、選択項目認識手段により選択項目を認識した時点から、認識している間だけユーザの音声を入力し、その音声信号と、辞書読出手段により読み出した言語モデルとを比較し、音声信号と最も一致度の高い言語モデルに対応した単語又は単語列を認識結果して供給する音声認識手段とを設けるようにした。
【００１０】
これにより、階層型メニューでなる初期メニュー画面上の任意の項目をユーザ選択させるだけの操作により、その選択項目に対応した項目別辞書を読み出し、比較対象となる言語モデルを予め減らした状態で比較することになり、音声認識率を上げることができる。
【００１１】
また本発明の音声認識方法においては、表示手段に対して表示した階層型メニューでなる初期メニュー画面上の複数の項目の中から所定の操作手段を介してユーザにより選択された任意の選択項目を認識する選択項目認識ステップと、選択項目認識ステップにより選択項目を認識したときから、複数の項目の内容にそれぞれ関連した単語及び単語列からなる複数の言語モデルが登録されている項目別辞書を複数種類記憶する記憶手段から、選択項目に対応した項目別辞書に登録されている言語モデルを読み出す辞書読出ステップと、選択項目認識ステップにより選択項目を認識した時点以降、当該認識している間だけユーザの音声を入力し、その音声信号と、辞書読出ステップにより読み出した言語モデルとを比較し、音声信号と最も一致度の高い言語モデルに対応した単語又は単語列を認識結果して供給する音声認識ステップとを設けるようにした。
【００１２】
これにより、階層型メニューでなる初期メニュー画面上の任意の項目をユーザ選択させるだけの操作により、その選択項目に対応した項目別辞書を読み出し、比較対象となる言語モデルを予め減らした状態で比較することになり、音声認識率を上げることができる。
【発明の効果】
【００１３】
本発明によれば、階層型メニューでなる初期メニュー画面上の任意の項目をユーザ選択させるだけの少ない操作により、その選択項目に対応した項目別辞書を読み出し、比較対象となる言語モデルを予め減らした状態で比較することになり、音声認識率を上げることができ、従来と比して簡易な操作で、かつ音声認識率を上げながら使い勝手を向上し得る音声認識装置及び音声認識方法を実現できる。
【発明を実施するための最良の形態】
【００１４】
以下に、図面について、本発明の一実施の形態を詳述する。
【００１５】
（１）カーナビゲーション装置の全体構成
図１において、１は全体として本発明における音声認識装置を搭載したカーナビゲーション装置を示し、自動車１０に取り付けられた本体部２、ＬＣＤ（Liquid Crystal Display）等からなるモニター３、ユーザに操作させるためのロータリコマンダ４（詳しくは後述する）、マイク５及びスピーカ６等により構成されている。
【００１６】
カーナビゲーション装置１は、本体部２に内蔵されたＲＯＭ（Read Only Memory）やＨＤＤ（Hard Disk Drive）等に格納されている地図データに応じた地図画像等をモニター３に対して表示し得るようになされている。
【００１７】
またカーナビゲーション装置１は、ユーザにより発話された音声をマイク５によって集音し、音声認識するようになされており、当該音声認識することにより得られた認識結果に対応する目的地検索処理、地図操作処理及びＡＶ（Audio Visual）操作処理等の各種処理を行うようになされている。
【００１８】
さらにカーナビゲーション装置１は、本体部２に内蔵されたＲＯＭやＨＤＤ等に格納されている音楽データ等を再生することにより、その再生音をスピーカ６から出力し得るようになされている。
【００１９】
また図２に示すように、カーナビゲーション装置１は、運転席８と助手席（図示せず）との間に設けられたシフトレバー９の近くにロータリコマンダ４を載置するようになされている。従って、カーナビゲーション装置１では、ユーザが自動車１０を運転している場合、ユーザに対して片方の手によりハンドル７を握らせたまま、もう片方の手によりロータリコマンダ４を操作させることができるので、ユーザの姿勢をほとんど変えさせることなくロータリコマンダ４を操作させ得るようになされている。
【００２０】
因みにカーナビゲーション装置１においては、本体部２及びモニター３が別々に構成されるような場合について述べたが、本体部２及びモニター３が一体型に構成されるようにしても良い。
【００２１】
（２）ロータリコマンダの構成
図３に示すように、ロータリコマンダ４は、略円柱形状でなり、回転操作子２１と、決定ボタン３１、左ボタン３２、上ボタン３３、右ボタン３４及び下ボタン３５からなる操作ボタン群２３とによって構成されている。
【００２２】
ロータリコマンダ４は、その回転操作子２１を、ロータリコマンダ４自身の中心を通る軸を回転軸として左右一定の範囲に回転操作させ得るようになされており、何ら力が加えられていない状態において、基準位置に復帰させるようになされている。すなわちロータリコマンダ４は、回転操作子２１がユーザによって回転操作された後、ユーザの手が離されると回転操作子２１を基準位置に復帰させるようになされている。
【００２３】
このようにカーナビゲーション装置１は、ユーザが自動車１０を運転中であっても、ロータリコマンダ４の回転操作子２１をユーザに対して手探りの状態で操作させ得るようになされている。
【００２４】
因みにカーナビゲーション装置１は、ロータリコマンダ４の操作ボタン群２３が押下操作された場合、後述する音声認識処理以外にも階層型でなるメニューを操作させ得るようになされている。
【００２５】
（３）カーナビゲーション装置の回路構成
図４に示すように、カーナビゲーション装置１は、ＣＰＵ（Central Processing Unit）１１がＲＯＭ１２又はＨＤＤ１４から読み出した基本プログラム及び各種アプリケーションプログラムをＲＡＭ（Random Access Memory）１３上で起動し、当該基本プログラム及び各種アプリケーションプログラムに従って全体を統括制御することにより、通常のナビゲーション処理や、音声認識処理等を実現するようになされている。
【００２６】
カーナビゲーション装置１は、ＧＰＳ（Global Positioning System）衛星からの電波をＧＰＳアンテナ１５Ａ及びＧＰＳユニット１５によって受信することにより、緯度、経度及び高度等からなるＧＰＳ情報を常時算出するようになされており、その結果得られたＧＰＳ情報をＣＰＵ１１へ供給するようになされている。
【００２７】
このときカーナビゲーション装置１のＣＰＵ１１は、ＧＰＳユニット１５から供給されたＧＰＳ情報とＨＤＤ１４に記憶されている地図データを比較することにより、現時点で自動車１０（図１）が存在する位置（以下、これを現在地と呼ぶ。）を含む所定範囲の地図データを読み出し、その地図データに応じて自動車１０の現在地とその周辺とを表す所定倍率の地図画像をモニター３に表示するようになされている。
【００２８】
またカーナビゲーション装置１のＣＰＵ１１は、目的地が任意に選択された場合、自動車１０の現在地から当該目的地までの到達経路等を探索し、その到達経路を表した地図画像をモニター３に表示し得るようになされている。
【００２９】
このときカーナビゲーション装置１のＣＰＵ１１は、到達経路を表した地図画像をモニター３に表示すると共に、自動車１０が到達経路に従って目的地まで走行する間、ユーザの運転を誘導及び補助するための音声情報を生成し、そのナビゲート音声を音声処理部１７を介してスピーカ６から出力するようになされている。
【００３０】
またカーナビゲーション装置１のＣＰＵ１１は、ＨＤＤ１４に格納された音楽データを読み出し、当該音楽データに対してＡＶ処理部１６により所定の信号処理を施した後、その音声信号に基づく音声を音声処理部１７を介して所定レベルに増幅し、スピーカ６から出力するようになされている。
【００３１】
さらにカーナビゲーション装置１のＣＰＵ１１は、図示しないＤＶＤ（Digital Versatile Disc）ドライブを介してＤＶＤの映像データ及び音声データを読み出し、当該映像データ及び当該音声データに対してＡＶ処理部１６により所定の信号処理を施した後、映像信号に基づく映像をモニター３に表示すると共に、音声信号に基づく音声を音声処理部１７を介して所定レベルに増幅した後、スピーカ６から出力するようになされている。
【００３２】
ところでロータリコマンダ４の回転検出部２２は、回転操作子２１が基準位置から回転操作されたことを検出すると、ＣＰＵ１１へ開始信号を供給する。また回転検出部２２は、回転操作子２１が基準位置から回転される角度を検出しており、当該回転操作子２１が所定角度回転される毎にＣＰＵ１１へ検出信号を供給するようになされている。
【００３３】
カーナビゲーション装置１のＣＰＵ１１は、回転操作子２１が回転操作され、回転検出部２２から開始信号を受信すると、初期メニュー画面ＭＷ１（図６（Ａ））をモニター３に表示する。その後、カーナビゲーション装置１のＣＰＵ１１は、回転検出部２２から供給された検出信号を受信すると、その検出信号に応じたユーザ所望のメニューアイコンＭＩが選択されたことを認識する。そしてカーナビゲーション装置１のＣＰＵ１１は、ユーザ所望のメニューアイコンＭＩが選択されたことを認識したとき以降、音声認識部１８に対して音声認識させるようになされている。
【００３４】
このときカーナビゲーション装置１のＣＰＵ１１は、ユーザの発話された音声をマイク５によって集音させ、その結果得られた音声信号を音声認識部１８に対して認識させることにより認識結果を得るようになされている。このときカーナビゲーション装置１のＣＰＵ１１は、この認識結果に対応する目的地検索処理、地図操作処理及びＡＶ操作処理等の各種処理を行うようになされている。
【００３５】
因みにカーナビゲーション装置１のＣＰＵ１１は、ロータリコマンダ４の操作ボタン群２３に対するユーザ操作に応じて目的地検索処理、地図操作処理及びＡＶ操作処理等の各種処理を実行し得るようになされている。
【００３６】
ところでカーナビゲーション装置１のＨＤＤ１４には、複数の言語モデルが格納されている。この言語モデルは、音素や音節等を組み合わせることにより、音声認識の比較対象となる単語や単語列を構成したものである。
【００３７】
図５に示すように、カーナビゲーション装置１のＨＤＤ１４は、初期メニュー画面ＭＷ１（図６（Ａ）及び（Ｂ））に表示されたメニュー項目である場所アイコンＭＩ１、地図アイコンＭＩ２、ＡＶアイコンＭＩ３、電話アイコンＭＩ４、ＷｅｂアイコンＭＩ５及び質問アイコンＭＩ６にそれぞれ関連した複数の言語モデルが登録された場所辞書１４Ａ、地図辞書１４Ｂ、ＡＶ辞書１４Ｃ、電話辞書１４Ｄ、Ｗｅｂ辞書１４Ｅ及び質問辞書１４Ｆを有している。
【００３８】
すなわちカーナビゲーション装置１では、ＨＤＤ１４に対して、例えば「東京都」及び「東京ディズニーランド」等の地名や施設等の目的地を検索するための言語モデルが登録された場所辞書１４Ａ、「拡大」、「縮小」及び「目的地表示」等の地図画像の表示設定を変更するための言語モデルが登録された地図辞書１４Ｂ、「曲送り」、「ＤＶＤ再生」及び「リピート」等のＡＶ操作を行うための言語モデルが登録されたＡＶ辞書１４Ｃ、人名や電話番号等の電話帳及び「電話を掛ける」等の電話操作を行うための言語モデルが登録された電話辞書１４Ｄ、ＵＲＬやキーワード等によりサーバに接続するための言語モデルが登録されたＷｅｂ辞書１４Ｅ、及び「目的地検索方法」及び「ＤＶＤ再生方法」等のカーナビゲーション装置１の使い方やエラー対処方法等を質問するための言語モデルが登録された質問辞書１４Ｆが格納されている。
【００３９】
（４）音声認識処理
図６（Ａ）に示すように、カーナビゲーション装置１のＣＰＵ１１は、回転操作子２１が回転操作されたことにより回転検出部２２から開始信号を受信すると、初期メニュー画面ＭＷ１をモニター３に表示するようになされている。このときカーナビゲーション装置１のＣＰＵ１１は、初期メニュー画面ＭＷ１のメニューアイコンＭＩが何れも選択されていない状態であり、全ての当該メニューアイコンＭＩを例えば黄色に表示するようになされている。
【００４０】
そして図６（Ｂ）に示すように、カーナビゲーション装置１のＣＰＵ１１は、ロータリコマンダ４の回転操作子２１が基準位置から例えば右方向に回転操作され、所定角度回転される毎に回転検出部２２から供給される検出信号を受信すると、初期メニュー画面ＭＷ１の場所アイコンＭＩ１を例えば橙色に表示し、当該場所アイコンＭＩ１が選択されていることをユーザに対して目視確認させ得るようになされている。
【００４１】
またカーナビゲーション装置１のＣＰＵ１１は、回転操作子２１が右方向にさらに回転操作され、回転検出部２２から検出信号を再度受信すると、地図アイコンＭＩ２を橙色に表示するようになされている。このようにしてカーナビゲーション装置１のＣＰＵ１１は、回転操作子２１が右方向に回転操作され、回転検出部２２から検出信号を受信する毎に、メニューアイコンＭＩの橙色に表示するアイコンを順に上から下へ移動させるようになされている。
【００４２】
なおカーナビゲーション装置１のＣＰＵ１１は、回転操作子２１が基準位置から左方向に回転された場合も右方向に回転された場合と同様に、回転操作子２１が左方向に回転操作されたことにより回転検出部２２から開始信号を受信すると初期メニュー画面ＭＷ１をモニター３に表示し、回転検出部２２から検出信号を受信する毎に、メニューアイコンＭＩの橙色に表示するアイコンを順に上から下へ移動させるようになされている。
【００４３】
またカーナビゲーション装置１のＣＰＵ１１は、例えば回転操作子２１が右方向に回転操作されたことにより初期メニュー画面ＭＷ１の地図アイコンＭＩ２を橙色に表示した状態で、当該回転操作子２１が左方向に回転操作され、回転検出部２２から検出信号を受信すると、場所アイコンＭＩ１を橙色に表示するようになされている。すなわち、カーナビゲーション装置１のＣＰＵ１１は、回転操作子２１が右方向に回転操作された後、当該回転操作子２１が左方向に回転操作されることにより回転検出部２２から検出信号を受信する毎にメニューアイコンＭＩの橙色に表示するアイコンを順に下から上へ移動させるようになされている。
【００４４】
さらにカーナビゲーション装置１のＣＰＵ１１は、例えば回転操作子２１が左方向に回転操作された後、当該回転操作子２１が右方向に回転操作されることにより回転検出部２２から検出信号を受信する毎にメニューアイコンＭＩの橙色に表示するアイコンを順に下から上へ移動させるようになされている。
【００４５】
なおカーナビゲーション装置１のＣＰＵ１１は、ロータリコマンダ４の回転操作子２１が回転操作されることによりモニター３に初期メニュー画面ＭＷ１を表示した後、音声認識せずに当該回転操作子２１が基準位置に復帰したことを認識すると、当該回転操作子２１が操作される前に表示していた画面をモニター３に対して表示するようになされている。
【００４６】
因みにカーナビゲーション装置１のＣＰＵ１１は、初期メニュー画面ＭＷ１のメニューアイコンＭＩの何れかが選択された場合、黄色から橙色に変えて表示するようにした場合について述べたが、メニューアイコンＭＩをどのような色に表示しても良いし、選択されたメニューアイコンＭＩ自体を点滅表示するようにしても良い。
【００４７】
ところでカーナビゲーション装置１のＣＰＵ１１は、例えば場所アイコンＭＩ１が選択されたことを認識すると、当該場所アイコンＭＩ１に対応する場所辞書１４Ａに登録された言語モデルをＲＡＭ１３上に読み出し、マイク５から供給された音声信号と直ちに比較可能な状態にするようになされている。
【００４８】
またカーナビゲーション装置１のＣＰＵ１１は、場所辞書１４Ａに登録された言語モデルをＲＡＭ１３上に読み出し終えた時点から、マイク５による音声入力を受け付けるようになされている。
【００４９】
このときカーナビゲーション装置１のＣＰＵ１１は、回転検出部２２から新たな検出信号が供給されていない間、すなわち場所アイコンＭＩ１が選択され続けている間だけ、マイク５による音声入力を受け付けるようになされている。
【００５０】
そしてカーナビゲーション装置１のＣＰＵ１１は、ユーザの発話した音声をマイク５によって集音させ、その結果得られた音声信号を音声認識部１８へ供給するようになされている。
【００５１】
カーナビゲーション装置１の音声認識部１８は、マイク５から供給された音声信号とＲＡＭ１３上に読み出された言語モデルとを比較し、最も一致度の高い言語モデルに対応した単語又は単語列を認識結果として得、その認識結果をＣＰＵ１１へ供給するようになされている。
【００５２】
このときカーナビゲーション装置１のＣＰＵ１１は、音声認識部１８から供給された認識結果に対応する目的地検索処理を行うようになされており、例えば認識結果である地名を目的地としてモニター３の地図画像上に表示するようになされている。
【００５３】
これによりカーナビゲーション装置１のＣＰＵ１１は、ユーザに対してロータリコマンダ４の回転操作子２１を回転操作させることにより初期メニュー画面ＭＷ１の場所アイコンＭＩ１を選択し、ユーザに目的地を発話させるだけの簡易な作業により、その目的地をモニター３の地図画像上に表示し得るようになされている。
【００５４】
因みにカーナビゲーション装置１の音声認識部１８は、マイク５から供給された音声信号とＲＡＭ１３上に読み出された言語モデルとを比較する際、一致度に一定の基準値を設けており、すべての言語モデルが基準値未満の一致度であった場合、認識結果を得ることなく、基準値以上の一致度となる認識結果を得るまで音声認識処理を継続し続けるようになされている。
【００５５】
なおカーナビゲーション装置１のＣＰＵ１１は、初期メニュー画面ＭＷ１の地図アイコンＭＩ２、ＡＶアイコンＭＩ３、電話アイコンＭＩ４、ＷｅｂアイコンＭＩ５及び質問アイコンＭＩ６が選択された場合も同様に、それぞれ地図辞書１４Ｂ、ＡＶ辞書１４Ｃ、電話辞書１４Ｄ、Ｗｅｂ辞書１４Ｅ及び質問辞書１４Ｆに登録された言語モデルをＲＡＭ１３上に読み出すようになされている。
【００５６】
その後、カーナビゲーション装置１のＣＰＵ１１は、マイク５から供給された音声信号と、ＲＡＭ１３上に読み出した言語モデルとを音声認識部１８に比較させることにより認識結果を得、その認識結果に対応する地図操作処理、ＡＶ操作処理、電話操作処理、サーバ接続処理及び質問回答処理等を行うようになされている。
【００５７】
（５）音声認識処理手順
図７及びこれに続く図８に示すように、カーナビゲーション装置１のＣＰＵ１１は、ルーチンＲＴ１の開始ステップから入って次のステップＳＰ１へ移り、ロータリコマンダ４の回転操作子２１が回転操作されたことにより回転検出部２２から開始信号が供給されたか否かを判断する。ここで否定結果が得られると、カーナビゲーション装置１のＣＰＵ１１は、回転操作子２１が操作され、回転検出部２２から開始信号が供給されるまで待ち受けるのに対し、肯定結果が得られると、モニター３に初期メニュー画面ＭＷ１を表示して次のステップＳＰ２へ移る。
【００５８】
ステップＳＰ２においてカーナビゲーション装置１のＣＰＵ１１は、初期メニュー画面ＭＷ１の場所アイコンＭＩ１が選択されたか否かを判断し、肯定結果が得られると次のステップＳＰ３へ移る。
【００５９】
ステップＳＰ３においてカーナビゲーション装置１のＣＰＵ１１は、ＨＤＤ１４の場所辞書１４Ａ（図５）に登録された複数の言語モデルをＲＡＭ１３上に読み出し、次のステップＳＰ４へ移る。
【００６０】
ステップＳＰ４においてカーナビゲーション装置１のＣＰＵ１１は、場所アイコンＭＩ１が選択され続けているか否か、すなわち場所アイコンＭＩ１が選択された後、ロータリコマンダ４の回転検出部２２から新たな検出信号が供給されていないか否かを判断し、肯定結果が得られると、このことは回転検出部２２から検出信号が供給されていないことを表しており、次のステップＳＰ５へ移る。
【００６１】
これに対してステップＳＰ４において否定結果が得られると、このことは場所アイコンＭＩ１が選択された後、ロータリコマンダ４の回転検出部２２から新たな検出信号が供給されたことを表しており、すでに場所アイコンＭＩ１が選択されておらず、このときカーナビゲーション装置１のＣＰＵ１１は、ステップＳＰ３８（図８）へ移って処理を終了する。
【００６２】
ステップＳＰ５においてカーナビゲーション装置１のＣＰＵ１１は、マイク５による音声入力を受け付け、ユーザの発話した音声をマイク５によって集音させ、その集音結果として得られた音声信号を音声認識部１８へ供給して、次のステップＳＰ６へ移る。
【００６３】
ステップＳＰ６においてカーナビゲーション装置１のＣＰＵ１１は、マイク５から供給された音声信号を音声認識部１８に対して認識させ、当該音声認識部１８から認識結果が供給されたか否かを判断する。このとき肯定結果が得られると、このことは、音声認識部１８が、マイク５から入力された音声信号とＲＡＭ１３上に読み出した言語モデルとを比較し、基準値以上の一致度で、かつ最も一致度の高い言語モデルに対応した単語又は単語列を認識結果として得、その認識結果をＣＰＵ１１へ供給したことを表しており、このときカーナビゲーション装置１のＣＰＵ１１は、当該認識結果を受信し、次のステップＳＰ７へ移る。
【００６４】
これに対しステップＳＰ６において否定結果が得られると、このことは、音声認識部１８が、マイク５から供給された音声信号とＲＡＭ１３上に読み出した言語モデルとを比較し、基準値以上の一致度となる言語モデルが得られず、ＣＰＵ１１へ認識結果を供給していないことを表しており、このときカーナビゲーション装置１のＣＰＵ１１はステップＳＰ５に戻って上述の処理を繰り返す。
【００６５】
ステップＳＰ７においてカーナビゲーション装置１のＣＰＵ１１は、音声認識部１８から供給された認識結果を受信すると、その認識結果から得られた地名を目的地としてモニター３の地図画像上に表示することにより、当該認識結果に対応する目的地検索処理を行い、次のステップＳＰ３８へ移って処理を終了する。
【００６６】
これに対してステップＳＰ２で否定結果が得られると、このことは初期メニュー画面ＭＷ１の場所アイコンＭＩ１が選択されていないことを表しており、カーナビゲーション装置１のＣＰＵ１１は、次のステップＳＰ８へ移る。
【００６７】
ステップＳＰ８においてカーナビゲーション装置１のＣＰＵ１１は、初期メニュー画面ＭＷ１の地図アイコンＭＩ２が選択されたか否かを判断し、肯定結果が得られると次のステップＳＰ９へ移る。
【００６８】
ステップＳＰ９においてカーナビゲーション装置１のＣＰＵ１１は、ＨＤＤ１４の地図辞書１４Ｂ（図５）に登録された複数の言語モデルをＲＡＭ１３上に読み出し、次のステップＳＰ１０へ移る。
【００６９】
ステップＳＰ１０においてカーナビゲーション装置１のＣＰＵ１１は、地図アイコンＭＩ２が選択され続けているか否か、すなわち地図アイコンＭＩ２が選択された後、ロータリコマンダ４の回転検出部２２から新たな検出信号が供給されていないか否かを判断し、肯定結果が得られると、このことは回転検出部２２から検出信号が供給されていないことを表しており、次のステップＳＰ１１へ移る。
【００７０】
これに対してステップＳＰ１０において否定結果が得られると、このことは地図アイコンＭＩ２が選択された後、ロータリコマンダ４の回転検出部２２から新たな検出信号が供給されたことを表しており、すでに地図アイコンＭＩ２が選択されておらず、このときカーナビゲーション装置１のＣＰＵ１１は、ステップＳＰ３８（図８）へ移って処理を終了する。
【００７１】
ステップＳＰ１１においてカーナビゲーション装置１のＣＰＵ１１は、マイク５による音声入力を受け付け、ユーザの発話した音声をマイク５によって集音させ、その集音結果として得られた音声信号を音声認識部１８へ供給して、次のステップＳＰ１２へ移る。
【００７２】
ステップＳＰ１２においてカーナビゲーション装置１のＣＰＵ１１は、マイク５から供給された音声信号を音声認識部１８に対して認識させ、当該音声認識部１８から認識結果が供給されたか否かを判断する。このとき肯定結果が得られると、このことは、音声認識部１８が、マイク５から供給された音声信号とＲＡＭ１３上に読み出した言語モデルとを比較し、基準値以上の一致度で、かつ最も一致度の高い言語モデルに対応した単語又は単語列を認識結果として得、その認識結果をＣＰＵ１１へ供給したことを表しており、このときカーナビゲーション装置１のＣＰＵ１１は、当該認識結果を受信し、次のステップＳＰ１３へ移る。
【００７３】
これに対してステップＳＰ１２において否定結果が得られると、このことは、音声認識部１８が、マイク５から供給された音声信号とＲＡＭ１３上に読み出した言語モデルとを比較し、基準値以上の一致度となる言語モデルが得られず、ＣＰＵ１１へ認識結果を供給しなかったことを表しており、カーナビゲーション装置１のＣＰＵ１１は、ステップＳＰ１１に戻って上述の処理を繰り返す。
【００７４】
ステップＳＰ１３においてカーナビゲーション装置１のＣＰＵ１１は、音声認識部１８から供給された認識結果を受信すると、認識結果から得られた例えば「拡大」のコマンドに対応してモニター３に表示されていた地図画像を拡大表示するという、当該認識結果に対応する地図操作処理を行い、次のステップＳＰ３８（図８）へ移って処理を終了する。
【００７５】
これに対してステップＳＰ８で否定結果が得られると、このことは初期メニュー画面ＭＷ１の地図アイコンＭＩ２が選択されていないことを表しており、カーナビゲーション装置１のＣＰＵ１１は、次のステップＳＰ１４へ移る。
【００７６】
ステップＳＰ１４においてカーナビゲーション装置１のＣＰＵ１１は、初期メニュー画面ＭＷ１のＡＶアイコンＭＩ３が選択されたか否かを判断し、肯定結果が得られると次のステップＳＰ１５へ移る。
【００７７】
ステップＳＰ１５においてカーナビゲーション装置１のＣＰＵ１１は、ＨＤＤ１４のＡＶ辞書１４Ｃ（図５）に登録された複数の言語モデルをＲＡＭ１３上に読み出し、次のステップＳＰ１６へ移る。
【００７８】
ステップＳＰ１６においてカーナビゲーション装置１のＣＰＵ１１は、ＡＶアイコンＭＩ３が選択され続けているか否か、すなわちＡＶアイコンＭＩ３が選択された後、ロータリコマンダ４の回転検出部２２から新たな検出信号が供給されていないか否かを判断し、肯定結果が得られると、このことは回転検出部２２から検出信号が供給されていないことを表しており、次のステップＳＰ１７へ移る。
【００７９】
これに対してステップＳＰ１６において否定結果が得られると、このことはＡＶアイコンＭＩ３が選択された後、ロータリコマンダ４の回転検出部２２から新たな検出信号が供給されたことを表しており、すでにＡＶアイコンＭＩ３が選択されておらず、このときカーナビゲーション装置１のＣＰＵ１１は、ステップＳＰ３８（図８）へ移って処理を終了する。
【００８０】
ステップＳＰ１７においてカーナビゲーション装置１のＣＰＵ１１は、マイク５から音声入力を受け付け、ユーザの発話した音声をマイク５によって集音させ、その集音結果として得られた音声信号を音声認識部１８へ供給して、次のステップＳＰ１８へ移る。
【００８１】
ステップＳＰ１８においてカーナビゲーション装置１のＣＰＵ１１は、マイク５から供給された音声信号を音声認識部１８に対して認識させ、当該音声認識部１８から認識結果が供給されたか否かを判断する。このとき肯定結果が得られると、このことは、音声認識部１８が、マイク５から供給された音声信号とＲＡＭ１３上に読み出した言語モデルとを比較し、基準値以上の一致度で、かつ最も一致度の高い言語モデルに対応した単語又は単語列を認識結果として得、その認識結果をＣＰＵ１１へ供給したことを表しており、カーナビゲーション装置１のＣＰＵ１１は、当該認識結果を受信し、次のステップＳＰ１９へ移る。
【００８２】
これに対してステップＳＰ１８において否定結果が得られると、このことは、音声認識部１８が、マイク５から供給された音声信号とＲＡＭ１３上に読み出した言語モデルとを比較し、基準値以上の一致度となる言語モデルが得られず、ＣＰＵ１１へ認識結果を供給しなかったことを表しており、カーナビゲーション装置１のＣＰＵ１１は、ステップＳＰ１７に戻って上述の処理を繰り返す。
【００８３】
ステップＳＰ１９においてカーナビゲーション装置１のＣＰＵ１１は、音声認識部１８から供給された認識結果を受信すると、認識結果から得られた例えば「ＤＶＤ再生」のコマンドに対応してＤＶＤを読み出し、その結果得られた映像をモニター３に表示し、音声を音声処理部１７を介してスピーカ６から出力する。このようしてカーナビゲーション装置１のＣＰＵ１１は、認識結果に対応するＡＶ操作処理を行い、次のステップＳＰ３８（図８）へ移って処理を終了する。
【００８４】
これに対してステップＳＰ１４で否定結果が得られると、このことは初期メニュー画面ＭＷ１のＡＶアイコンＭＩ３が選択されていないことを表しており、カーナビゲーション装置１のＣＰＵ１１は、次のステップＳＰ２０（図８）へ移る。
【００８５】
ステップＳＰ２０においてカーナビゲーション装置１のＣＰＵ１１は、初期メニュー画面ＭＷ１の電話アイコンＭＩ４が選択されたか否かを判断し、肯定結果が得られると次のステップＳＰ２１へ移る。
【００８６】
ステップＳＰ２１においてカーナビゲーション装置１のＣＰＵ１１は、ＨＤＤ１４の電話辞書１４Ｄ（図５）に登録された複数の言語モデルをＲＡＭ１３上に読み出し、次のステップＳＰ２２へ移る。
【００８７】
ステップＳＰ２２においてカーナビゲーション装置１のＣＰＵ１１は、電話アイコンＭＩ４が選択され続けているか否か、すなわち電話アイコンＭＩ４が選択された後、ロータリコマンダ４の回転検出部２２から新たな検出信号が供給されていないか否かを判断し、肯定結果が得られると、このことは回転検出部２２から検出信号が供給されていないことを表しており、次のステップＳＰ２３へ移る。
【００８８】
これに対してステップＳＰ２２において否定結果が得られると、このことは電話アイコンＭＩ４が選択された後、ロータリコマンダ４の回転検出部２２から新たな検出信号が供給されたことを表しており、すでに電話アイコンＭＩ４が選択されておらず、このときカーナビゲーション装置１のＣＰＵ１１は、ステップＳＰ３８へ移って処理を終了する。
【００８９】
ステップＳＰ２３においてカーナビゲーション装置１のＣＰＵ１１は、マイク５から音声入力を受け付け、ユーザの発話した音声をマイク５によって集音させ、その集音結果として得られた音声信号を音声認識部１８へ供給して、次のステップＳＰ２４へ移る。
【００９０】
ステップＳＰ２４においてカーナビゲーション装置１のＣＰＵ１１は、マイク５から供給された音声信号を音声認識部１８に対して認識させ、当該音声認識部１８から認識結果が供給されたか否かを判断する。このとき肯定結果が得られると、このことは、音声認識部１８が、マイク５から供給された音声信号とＲＡＭ１３上に読み出した言語モデルとを比較し、基準値以上の一致度で、かつ最も一致度の高い言語モデルに対応した単語又は単語列を認識結果として得、その認識結果をＣＰＵ１１へ供給したことを表しており、カーナビゲーション装置１のＣＰＵ１１は、認識結果を受信し、次のステップＳＰ２５へ移る。
【００９１】
これに対してステップＳＰ２４において否定結果が得られると、このことは、音声認識部１８が、マイク５から供給された音声信号とＲＡＭ１３上に読み出した言語モデルとを比較し、基準値以上の一致度となる言語モデルが得られず、ＣＰＵ１１へ認識結果を供給しなかったことを表しており、カーナビゲーション装置１のＣＰＵ１１は、ステップＳＰ２３に戻って上述の処理を繰り返す。
【００９２】
ステップＳＰ２５においてカーナビゲーション装置１のＣＰＵ１１は、音声認識部１８から供給された認識結果を受信すると、例えば認識結果から得られた氏名に対応した電話番号をモニター３に表示する。このようしてカーナビゲーション装置１のＣＰＵ１１は、認識結果に対応する電話操作処理を行い、次のステップＳＰ３８へ移って処理を終了する。
【００９３】
これに対してステップＳＰ２０で否定結果が得られると、このことは初期メニュー画面ＭＷ１の電話アイコンＭＩ４が選択されていないことを表しており、カーナビゲーション装置１のＣＰＵ１１は、次のステップＳＰ２６へ移る。
【００９４】
ステップＳＰ２６においてカーナビゲーション装置１のＣＰＵ１１は、初期メニュー画面ＭＷ１のＷｅｂアイコンＭＩ５が選択されたか否かを判断し、肯定結果が得られると次のステップＳＰ２７へ移る。
【００９５】
ステップＳＰ２７においてカーナビゲーション装置１のＣＰＵ１１は、ＨＤＤ１４のＷｅｂ辞書１４Ｅ（図５）に登録された複数の言語モデルをＲＡＭ１３上に読み出し、次のステップＳＰ２８へ移る。
【００９６】
ステップＳＰ２８においてカーナビゲーション装置１のＣＰＵ１１は、ＷｅｂアイコンＭＩ５が選択され続けているか否か、すなわちＷｅｂアイコンＭＩ５が選択された後、ロータリコマンダ４の回転検出部２２から新たな検出信号が供給されていないか否かを判断し、肯定結果が得られると、このことは回転検出部２２から検出信号が供給されていないことを表しており、次のステップＳＰ２９へ移る。
【００９７】
これに対してステップＳＰ２８において否定結果が得られると、このことはＷｅｂアイコンＭＩ５が選択された後、ロータリコマンダ４の回転検出部２２から新たな検出信号が供給されたことを表しており、すでにＷｅｂアイコンＭＩ５が選択されておらず、このときカーナビゲーション装置１のＣＰＵ１１は、ステップＳＰ３８へ移って処理を終了する。
【００９８】
ステップＳＰ２９においてカーナビゲーション装置１のＣＰＵ１１は、マイク５から音声入力を受け付け、ユーザの発話した音声をマイク５によって集音させ、その集音結果として得られた音声信号を音声認識部１８へ供給して、次のステップＳＰ３０へ移る。
【００９９】
ステップＳＰ３０においてカーナビゲーション装置１のＣＰＵ１１は、マイク５から供給された音声信号を音声認識部１８に対して認識させ、当該音声認識部１８から認識結果が供給されたか否かを判断する。このとき肯定結果が得られると、このことは、音声認識部１８が、マイク５から供給された音声信号とＲＡＭ１３上に読み出した言語モデルとを比較し、基準値以上の一致度で、かつ最も一致度の高い言語モデルに対応した単語又は単語列を認識結果として得、その認識結果をＣＰＵ１１へ供給したことを表しており、カーナビゲーション装置１のＣＰＵ１１は、認識結果を受信し、次のステップＳＰ３１へ移る。
【０１００】
これに対してステップＳＰ３０において否定結果が得られると、このことは、音声認識部１８が、マイク５から供給された音声信号とＲＡＭ１３上に読み出した言語モデルとを比較し、基準値以上の一致度となる言語モデルが得られず、ＣＰＵ１１へ認識結果を供給しなかったことを表しており、カーナビゲーション装置１のＣＰＵ１１は、ステップＳＰ２９に戻って上述の処理を繰り返す。
【０１０１】
ステップＳＰ３１においてカーナビゲーション装置１のＣＰＵ１１は、音声認識部１８から供給された認識結果を受信すると、例えば認識結果から得られたＵＲＬをモニター３に表示し、図示しない外部通信ユニットを介して当該ＵＲＬに従ってサーバに接続する。このようしてカーナビゲーション装置１のＣＰＵ１１は、認識結果に対応するサーバ接続処理を行い、次のステップＳＰ３８へ移って処理を終了する。
【０１０２】
これに対してステップＳＰ２６で否定結果が得られると、このことは初期メニュー画面ＭＷ１のＷｅｂアイコンＭＩ５が選択されていないことを表しており、カーナビゲーション装置１のＣＰＵ１１は、次のステップＳＰ３２へ移る。
【０１０３】
ステップＳＰ３２においてカーナビゲーション装置１のＣＰＵ１１は、初期メニュー画面ＭＷ１の質問アイコンＭＩ６（図５）が選択されたか否かを判断し、肯定結果が得られると次のステップＳＰ３３へ移る。
【０１０４】
これに対してステップＳＰ３２において否定結果が得られると、このことはメニューアイコンＭＩの何れも選択されていないことを表しており、カーナビゲーション装置１のＣＰＵ１１は、ステップＳＰ３８へ移って処理を終了する。
【０１０５】
ステップＳＰ３３においてカーナビゲーション装置１のＣＰＵ１１は、ＨＤＤ１４の質問辞書１４Ｆに登録された複数の言語モデルをＲＡＭ１３上に読み出し、次のステップＳＰ３４へ移る。
【０１０６】
ステップＳＰ３４においてカーナビゲーション装置１のＣＰＵ１１は、質問アイコンＭＩ６が選択され続けているか否か、すなわち質問アイコンＭＩ６が選択された後、ロータリコマンダ４の回転検出部２２から新たな検出信号が供給されていないか否かを判断し、肯定結果が得られると、このことは回転検出部２２から検出信号が供給されていないことを表しており、次のステップＳＰ３５へ移る。
【０１０７】
これに対してステップＳＰ３４において否定結果が得られると、このことは質問アイコンＭＩ６が選択された後、ロータリコマンダ４の回転検出部２２から新たな検出信号が供給されたことを表しており、すでに質問アイコンＭＩ６が選択されておらず、このときカーナビゲーション装置１のＣＰＵ１１は、ステップＳＰ３８へ移って処理を終了する。
【０１０８】
ステップＳＰ３５においてカーナビゲーション装置１のＣＰＵ１１は、マイク５から音声入力を受け付け、ユーザの発話した音声をマイク５によって集音させ、その集音結果として得られた音声信号を音声認識部１８へ供給して、次のステップＳＰ３６へ移る。
【０１０９】
ステップＳＰ３６においてカーナビゲーション装置１のＣＰＵ１１は、マイク５から供給された音声信号を音声認識部１８に対して認識させ、当該音声認識部１８から認識結果が供給されたか否かを判断する。このとき肯定結果が得られると、このことは、音声認識部１８が、マイク５から供給された音声信号とＲＡＭ１３上に読み出した言語モデルとを比較し、基準値以上の一致度で、かつ最も一致度の高い言語モデルに対応した単語又は単語列を認識結果として得、その認識結果をＣＰＵ１１へ供給したことを表しており、カーナビゲーション装置１のＣＰＵ１１は、当該認識結果を受信し、次のステップＳＰ３７へ移る。
【０１１０】
これに対してステップＳＰ３６において否定結果が得られると、このことは、音声認識部１８が、マイク５から供給された音声信号とＲＡＭ１３上に読み出した言語モデルとを比較し、基準値以上の一致度となる言語モデルが得られず、ＣＰＵ１１へ認識結果を供給しなかったことを表しており、カーナビゲーション装置１のＣＰＵ１１は、ステップＳＰ３５に戻って上述の処理を繰り返す。
【０１１１】
ステップＳＰ３７においてカーナビゲーション装置１のＣＰＵ１１は、音声認識部１８から供給された認識結果を受信すると、例えば認識結果から得られた質問に対する回答をモニター３に表示する。このようしてカーナビゲーション装置１のＣＰＵ１１は、認識結果に対応する質問回答処理を行い、次のステップＳＰ３８へ移って処理を終了する。
【０１１２】
（６）動作及び効果
以上の構成において、カーナビゲーション装置１のＣＰＵ１１は、ロータリコマンダ４の回転操作子２１が回転操作されたことを認識すると、メニュー項目であるメニューアイコンＭＩが付された初期メニュー画面ＭＷ１をモニター３に表示する。その後、カーナビゲーション装置１のＣＰＵ１１は、ロータリコマンダ４の回転操作子２１が回転操作されることにより場所アイコンＭＩ１が選択されたことを認識したときから、当該場所アイコンＭＩ１に対応する場所辞書１４Ａに登録された複数の言語モデルをＨＤＤ１４からＲＡＭ１３上に読み出す。
【０１１３】
そしてカーナビゲーション装置１のＣＰＵ１１は、場所辞書１４Ａに登録された複数の言語モデルをＲＡＭ１３上に読み出し終えた時点から、場所アイコンＭＩ１が選択されている間のみ、音声入力を受け付ける。
【０１１４】
このときカーナビゲーション装置１のＣＰＵ１１は、ユーザの発話した音声をマイク５によって集音させ、その結果得られた音声信号を音声認識部１８へ供給し、その音声信号を音声認識部１８に対して認識させる。音声認識部１８は、マイク５から供給された音声信号と、ＲＡＭ１３上に読み出された言語モデルとを比較し、基準値以上の一致度である言語モデルのうち、最も一致度の高い言語モデルに対応した単語又は単語列を認識結果として得、ＣＰＵ１１へ当該認識結果を供給する。カーナビゲーション装置１のＣＰＵ１１は、音声認識部１８から受信した認識結果に対応する目的地検索処理を行うようにした。
【０１１５】
従ってカーナビゲーション装置１のＣＰＵ１１は、初期メニュー画面ＭＷ１の場所アイコンＭＩ１が選択された場合、当該場所アイコンＭＩ１に対応する場所辞書１４Ａに登録された言語モデルだけをＨＤＤ１４からＲＡＭ１３上に読み出すことにより、認識対象となる言語モデルを限定している分だけ、それ以外の言語モデルに対応した単語又は単語列を誤認識してしまうことを回避できるので、音声認識率を上げることができる。
【０１１６】
因みにカーナビゲーション装置１のＣＰＵ１１は、初期メニュー画面ＭＷ１の地図アイコンＭＩ２、ＡＶアイコンＭＩ３、電話アイコンＭＩ４、ＷｅｂアイコンＭＩ５及び質問アイコンＭＩ６が選択されたことを認識した場合も同様に、ＨＤＤ１４からそれぞれ地図辞書１４Ｂ、ＡＶ辞書１４Ｃ、電話辞書１４Ｄ、Ｗｅｂ辞書１４Ｅ及び質問辞書１４Ｆに登録された言語モデルだけをＲＡＭ１３上に読み出し、認識対象となる言語モデルを限定している分だけ、それ以外の言語モデルに対応した単語又は単語列を誤認識してしまうことを回避できるので、音声認識率を上げることができる。
【０１１７】
カーナビゲーション装置１のＣＰＵ１１は、初期メニュー画面ＭＷ１の例えば場所アイコンＭＩ１が選択され、場所辞書１４Ａに登録された言語モデルをＲＡＭ１３上に読み出し終えた時点から直ちにユーザの音声が入力された場合、音声とノイズとを判別する必要がなく、ノイズとして扱われてしまうような音声でも認識することができるので、その分だけ音声認識率を上げることができる。
【０１１８】
またカーナビゲーション装置１のＣＰＵ１１は、音声認識処理を行うタイミングをユーザが知っていた場合、ユーザが意識的に静かな環境を作るためにノイズを減らすので、音声認識率を上げることができる。
【０１１９】
さらにカーナビゲーション装置１のＣＰＵ１１は、音声認識処理を行うタイミングをユーザが知らない場合にも、初期メニュー画面ＭＷ１のメニューアイコンＭＩのいずれかを選択させ続けている間だけ、音声入力を受け付けるようにしたことにより、例えばラジオの音声やユーザ同士の音声といったノイズが混入される機会を減らすことができるため、音声認識処理における当該ノイズによる誤認識を減らすことができるので、音声認識率を上げることができる。
【０１２０】
またカーナビゲーション装置１のＣＰＵ１１は、ロータリコマンダ４の回転操作子２１が回転操作されることにより、モニター３に初期メニュー画面ＭＷ１を表示し、当該初期メニュー画面ＭＷ１上の例えば場所アイコンＭＩ１が選択されたことを認識したとき以降、音声入力を受け付けるようにした。従ってカーナビゲーション装置１は、音声入力を受け付けるまでに、ユーザに対して回転操作子２１を回転操作させるだけ良く、従来のような複数回の操作を行わせる必要がない分、使い勝手を向上できる。
【０１２１】
カーナビゲーション装置１は、運転席８と助手席（図示せず）との間に設けられたシフトレバー９の近くにロータリコマンダ４を載置するようになされており、ユーザが自動車１０を運転している場合でも、ユーザの姿勢をほとんど変えさせることなくロータリコマンダ４を操作させることができ、かつ手探り状態でも当該ロータリコマンダ４を操作させることができる。これによりカーナビゲーション装置１は、ユーザにロータリコマンダ４を注視させなくても簡易に操作を行わせることができる。
【０１２２】
さらにカーナビゲーション装置１のＣＰＵ１１は、ロータリコマンダ４の回転操作子２１が回転操作されたことを認識すると、モニター３に初期メニュー画面ＭＷ１を表示し、当該初期メニュー画面ＭＷ１上の例えば場所アイコンＭＩ１が選択されたことを認識したとき以降、音声入力を受け付けるため、例えばＤＶＤを再生している場合であっても音声認識処理を行うことができる。
【０１２３】
以上の構成によれば、カーナビゲーション装置１は、ロータリコマンダ４の回転操作子２１を回転操作されたことを認識すると、初期メニュー画面ＭＷ１をモニター３に表示し、例えば場所アイコンＭＩ１が選択されたことを認識したときから、場所辞書１４Ａに登録された言語モデルをＲＡＭ１３上に読み出し終えた時点から、当該場所アイコンＭＩ１が選択されている間だけ音声入力を受け付け、マイク５から供給された音声信号と、ＲＡＭ１３上に読み出した言語モデルとを音声認識部１８に比較させ、その結果得られた認識結果に対応した目的地検索処理を行うことでき、かくして簡易な操作で、かつ音声認識率を上げながら使い勝手を向上することができる。
【０１２４】
またカーナビゲーション装置１のＣＰＵ１１は、初期メニュー画面ＭＷ１の地図アイコンＭＩ２、ＡＶアイコンＭＩ３、電話アイコンＭＩ４、ＷｅｂアイコンＭＩ５及び質問アイコンＭＩ６が選択された場合も同様に、マイク５から供給された音声信号と、地図辞書１４Ｂ、ＡＶ辞書１４Ｃ、電話辞書１４Ｄ、Ｗｅｂ辞書１４Ｅ及び質問辞書１４Ｆに登録された言語モデルとを音声認識部１８に比較させ、その結果得られた認識結果に対応した地図操作処理、ＡＶ操作処理、電話操作処理、サーバ接続処理及び質問回等処理を行うことができ、かくして簡易な操作で、かつ音声認識率を上げながら使い勝手を向上することができる。
【０１２５】
（７）他の実施の形態
なお上述した実施の形態においては、ロータリコマンダ４の回転操作子２１が回転操作させることにより、初期メニュー画面ＭＷ１の例えば場所アイコンＭＩ１が選択されている間だけ、音声入力を受け付けるようにした場合について述べたが、本発明はこれに限らず、タクトスイッチにより、初期メニュー画面ＭＷ１の例えば場所アイコンＭＩ１が選択され、当該タクトスイッチが押下されている間だけ、音声入力を受け付けるようにしても良い。
【０１２６】
この場合カーナビゲーション装置１は、図９に示すように、ハンドル１０７にタクトスイッチでなる上ボタンＵＢ及び下ボタンＤＢが設けられ、上ボタンＵＢ及び下ボタンＤＢが押下操作されたことを認識すると、初期メニュー画面ＭＷ１をモニター３に表示し、上ボタンＵＢ及び下ボタンＤＢが押下され続けている間だけ、音声入力を受け付けるようにする。
【０１２７】
また上述した実施の形態においては、ロータリコマンダ４の回転操作子２１が、左右一定の範囲に回転操作させることができ、かつ力が加えられていない状態において、左右の基準位置に復帰する場合について述べたが、本発明はこれに限らず、回転操作子２１を左右に回転操作させることができ、かつ力を加えられていない状態において、基準位置に復帰せず、その位置に止まるようにしても良い。この場合、カーナビゲーション装置１は、ロータリコマンダ４が操作され続けていることを認識するために、例えばタッチセンサ等を設ける必要がある。
【０１２８】
さらに上述した実施の形態においては、運転席８と助手席（図示せず）との間に設けられたシフトレバー９の近くにロータリコマンダ４が載置された場合について述べたが、本発明はこれに限らず、自動車１０のハンドル７又はシフトレバー９に設けられるようにしても良く、要は自動車１０を運転中のユーザに姿勢を変えさせることなく、かつ手探り状態でも操作させられる位置であればどこでも良い。
【０１２９】
さらに上述した実施の形態においては、ロータリコマンダ４の回転操作子２１を回転操作させることにより、初期メニュー画面ＭＷ１の例えば場所アイコンＭＩ１が選択されている間だけ、音声入力を受け付けるようにした場合について述べたが、本発明はこれに限らず、ロータリコマンダ４の回転操作子２１を回転操作させることにより、初期メニュー画面ＭＷ１の例えば場所アイコンＭＩ１が選択されてから一定時間の間、音声入力を受け付けるようにしても良いし、場所アイコンＭＩ１が選択された後、発声ボタンが押下されてから音声入力を受け付けるようにしても良い。
【０１３０】
さらに上述した実施の形態においては、ロータリコマンダ４の回転操作子２１が回転操作されたことにより回転検出部２２から開始信号を供給されたカーナビゲーション装置１のＣＰＵ１１が、モニター３に初期メニュー画面ＭＷ１を表示し、メニューアイコンＭＩの何れも橙色に表示していないようにした場合について述べたが、本発明はこれに限らず、ロータリコマンダ４の回転操作子２１が回転操作されたことにより回転検出部２２から開始信号を供給されたカーナビゲーション装置１のＣＰＵ１１が、モニター３に初期メニュー画面ＭＷ１を表示すると同時に、場所アイコンＭＩ１を橙色に表示するようにしても良い。
【０１３１】
さらに上述した実施の形態においては、ロータリコマンダ４の回転操作子２１を回転操作させることにより、初期メニュー画面ＭＷ１をモニター３に表示した場合について述べたが、本発明はこれに限らず、図１０に示すように、ロータリコマンダ４回転操作子２１を回転操作させることにより、メニューアイコンＭＩと、例えば「ロータリコマンダをタッチしている間、音声認識を行います」等の通知文とからなる初期メニュー画面ＭＷ２をモニター３に表示するようにしても良い。
【０１３２】
これによりカーナビゲーション装置１は、ロータリコマンダ４の回転操作子２１が操作されている間だけ、音声入力が受け付けられていることをユーザに伝えることにより、音声認識処理が行われていることをユーザに意識させることができる。
【０１３３】
さらに上述した実施の形態においては、初期メニュー画面ＭＷ１の例えば場所アイコンＭＩ１が選択され、場所辞書１４Ａに格納された言語モデルをＲＡＭ１３上に読み出し終わった時点から、マイク５による音声入力を受け付けるようにした場合について述べたが、本発明はこれに限らず、初期メニュー画面ＭＷ１の例えば場所アイコンＭＩ１が選択された時点から、マイク５による音声入力を受け付けるようにしても良い。
【０１３４】
この場合、カーナビゲーション装置１のＣＰＵ１１は、場所辞書１４Ａに格納された言語モデルをＲＡＭ１３上に読み出すと同時に、マイク５による音声入力を受け付けることになるが、実際上、当該言語モデルを読み出す時間が短いため、当該言語モデルを読み出し終える前に、音声認識することはない。
【０１３５】
さらに上述した実施の形態においては、カーナビゲーション装置１のＣＰＵ１１が、予めＨＤＤ１４に格納されているアプリケーションプログラムに従い、上述したルーチンＲＴ１の音声認識処理手順を行うようにした場合について述べたが、本発明はこれに限らず、記憶媒体からインストールしたアプリケーションプログラムや、インターネットからダウンロードしたアプリケーションプログラム、その他種々のルートによってインストールしたアプリケーションプログラムに従って上述した音声認識処理手順を行うようにしても良い。
【０１３６】
さらに上述した実施の形態においては、選択項目認識手段としてＣＰＵ１１、記憶手段としてＨＤＤ１４、辞書読出手段としてＣＰＵ１１、音声認識手段として音声認識部１８によって本発明の音声認識装置としてのカーナビゲーション装置１を構成するようにした場合について述べたが、本発明はこれに限らず、この他種々の構成でなる選択項目認識手段、記憶手段、辞書読出手段及び音声認識手段によってナビゲーション装置を構成するようにしても良い。
【産業上の利用可能性】
【０１３７】
本発明の音声認識装置及び音声認識方法は、例えばカーナビゲーション装置以外の携帯電話機、オーディオ装置等のその他種々に実装された音声認識装置及び音声認識方法に適用することができる。
【図面の簡単な説明】
【０１３８】
【図１】カーナビゲーション装置の構成（１）を示す略線図である。
【図２】カーナビゲーション装置の構成（２）を示す略線図である。
【図３】ロータリコマンダの構成を示す略線図である。
【図４】カーナビゲーション装置の回路構成を示す略線図である。
【図５】ハードディスクドライブの構成を示す略線図である。
【図６】メニュー画面の様子を示す略線図である。
【図７】音声認識処理手順（１）の説明に供するフローチャートである。
【図８】音声認識処理手順（２）の説明に供するフローチャートである。
【図９】他の実施形態におけるハンドルを示す略線図である。
【図１０】他の実施形態におけるメニュー画面の様子を示す略線図である。
【符号の説明】
【０１３９】
１……カーナビゲーション装置、２……本体部、３……モニター、４……ロータリコマンダ、５……マイク、６……スピーカ、７……ハンドル、８……運転席、９……シフトレバー、１０……自動車、１１……ＣＰＵ、１２……ＲＯＭ、１３……ＲＡＭ、１４……ＨＤＤ、１５…ＧＰＳユニット、１６……ＡＶ処理部、１７……音声処理部、１８……音声認識部、２１……回転操作子、２２……回転検出部、２３……操作ボタン群、３１……決定ボタン、３２……左ボタン、３３……上ボタン、３４……左ボタン、３５……下ボタン。

【特許請求の範囲】
【請求項１】
表示手段に対して表示した階層型メニューでなる初期メニュー画面上の複数の項目の中から所定の操作手段を介してユーザにより選択された任意の選択項目を認識する選択項目認識手段と、
上記複数の項目の内容にそれぞれ関連した単語及び単語列からなる複数の言語モデルが登録されている項目別辞書を複数種類記憶する記憶手段と、
上記選択項目認識手段により上記選択項目を認識したときから、上記選択項目に対応した上記項目別辞書に登録されている言語モデルを上記記憶手段から読み出す辞書読出手段と、
上記選択項目認識手段により上記選択項目を認識したとき以降、当該認識している間だけ上記ユーザの音声を入力し、その音声信号と、上記辞書読出手段により読み出した上記言語モデルとを比較し、上記音声信号と最も一致度の高い上記言語モデルに対応した上記単語又は上記単語列を認識結果して供給する音声認識手段と
を具えることを特徴とする音声認識装置。
【請求項２】
上記音声認識手段は、
上記辞書読出手段により上記言語モデルを全て読み出し終わってから上記ユーザの音声を入力する
ことを特徴とする請求項１に記載の音声認識装置。
【請求項３】
上記音声認識装置は、
上記選択項目認識手段により上記選択項目を認識したとき、上記音声認識手段による音声認識処理が行われている旨を上記表示手段に表示させることにより通知する通知手段と
を具えることを特徴とする請求項１に記載の音声認識装置。
【請求項４】
上記操作手段は、
回転操作子が上記ユーザにより回転操作されたことに応じて上記初期メニュー画面上の上記複数の項目の中から上記選択項目を選択し、上記回転操作子が回転操作された後、上記回転操作子が何ら力を加えられなくなると、所定の位置に上記回転操作子が復帰する
ことを特徴とする請求項１に記載の音声認識装置。
【請求項５】
表示手段に対して表示した階層型メニューでなる初期メニュー画面上の複数の項目の中から所定の操作手段を介してユーザにより選択された任意の選択項目を認識する選択項目認識ステップと、
上記選択項目認識ステップにより上記選択項目を認識したときから、上記複数の項目の内容にそれぞれ関連した単語及び単語列からなる複数の言語モデルが登録されている項目別辞書を複数種類記憶する上記記憶手段から、上記選択項目に対応した上記項目別辞書に登録されている言語モデルを読み出す辞書読出ステップと、
上記選択項目認識ステップにより上記選択項目を認識した時点以降、当該認識している間だけユーザの音声を入力し、その音声信号と、上記辞書読出ステップにより読み出した上記言語モデルとを比較し、上記音声信号と最も一致度の高い上記言語モデルに対応した上記単語又は上記単語列を認識結果して供給する音声認識ステップと
を具えることを特徴とする音声認識方法。

【図１】