説明

音声認識装置、音声認識方法、音声認識プログラム、および記録媒体

【課題】利用者が煩わしい操作をおこなうことなく、音声をより迅速に入力すること。
【解決手段】音声認識装置100は、出力部103による案内音声の出力途中に、受付部102によって中断操作を受け付けたか否かを判断し、中断操作を受け付けた場合には、案内音声の出力を中断して、計数部106によって計数される中断操作回数に「1」を加算する。そして、加算された中断操作回数と判断用の回数とを、比較部107によって比較して、中断操作回数が判断用の回数を超えた場合には、以降、受付部102によって開始操作を受け付けた場合にも案内音声を出力しないように、案内音声の出力設定情報を変更する。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は、音声認識装置、音声認識方法、音声認識プログラム、および記録媒体に関する。ただし、この発明の利用は、前述の音声認識装置、音声認識方法、音声認識プログラム、および記録媒体に限らない。
【背景技術】
【0002】
従来、利用者の発話内容を音声データとして入力し、入力された音声データとあらかじめ記憶された音声認識用のテンプレートデータとを比較し、入力された音声データに合致するテンプレートデータに基づいて、入力された音声データの内容を認識する音声認識技術がある。音声認識技術を用いた従来の技術として、従来、音声認識処理の開始操作がおこなわれた場合に、「ピッとなったらお話しください。」や「○×県の施設名称をどうぞ。」などの、つぎにおこなう操作内容を案内する音声案内を出力するナビゲーション装置がある。
【0003】
このようなナビゲーション装置では、案内音声を最後まで出力した後に入力された音声データを用いて音声認識処理をおこなう設定がなされている場合にも、案内音声の出力途中に所定の操作をおこなうことで、案内音声の出力を中断し、音声データを入力することができるものがある。また、「経路探索」機能や「特定地点の検索」機能などの機能ごとに、案内音声を出力するか否かを設定できるものもある。
【0004】
また、音声認識技術を用いた従来の技術として、従来、たとえば、車両が到達すべき目的地点を示す地点情報の候補となる複数の認識ワードであって、m(mは2以上の自然数)層の階層を含む階層構造を為して構成されている複数の認識ワードを記憶するDVD−ROMディスクと、いずれか一の階層に属する認識用ワードに対応する音声情報を入力するための外部マイクと、入力された音声情報に対応する認識用ワードが属する階層を判定すると共に、その判定結果に基づいて目的地点を検索するCPUと、を備える情報検索装置がある(たとえば、下記特許文献1参照。)。
【0005】
【特許文献1】特開平11−224265号公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
しかしながら、上述した従来の技術では、音声認識処理の開始操作があった場合には、当該開始操作に応じた案内音声が一様に出力されるため、利用者が、利用頻度の高い機能を利用する場合には、案内音声の出力を煩わしく感じることがあるという問題が一例として挙げられる。
【0007】
また、上述した従来の技術では、案内音声の出力途中に所定の操作をおこなうことで、案内音声の出力を中断することができるが、この場合、利用者は、中断する都度所定の操作をおこなわなくてはならず、所定の操作を煩わしく感じることがあるという問題が一例として挙げられる。
【0008】
また、上述した従来の技術では、音声案内を出力するか否かを利用者に機能ごとに任意に設定させることで、音声案内を必要とする機能を利用する場合に限って、音声案内を出力することができるが、この場合、音声案内を出力するか否かを利用者が機能ごとに設定しなくてはならず煩わしいという問題が一例として挙げられる。
【課題を解決するための手段】
【0009】
請求項1の発明にかかる音声認識装置は、音声認識処理における操作内容を案内する案内音声の出力途中に、当該案内音声の出力を中断させる中断操作を受け付ける受付手段と、前記受付手段によって受け付けられた中断操作の回数を計数する計数手段と、前記計数手段によって計数された回数に応じて、前記案内音声を出力する出力手段と、を備えることを特徴とする。
【0010】
また、請求項3の発明にかかる音声認識方法は、音声認識処理における操作内容を案内する案内音声の出力途中に、当該案内音声の出力を中断させる中断操作を受け付ける受付工程と、前記受付工程によって受け付けられた中断操作の回数を計数する計数工程と、前記計数工程によって計数された回数に応じて、前記案内音声を出力する出力工程と、を含んだことを特徴とする。
【0011】
また、請求項4の発明にかかる音声認識プログラムは、請求項3に記載の音声認識方法をコンピュータに実行させることを特徴とする。
【0012】
また、請求項5の発明にかかる記録媒体は、コンピュータに読み取り可能であって、請求項4に記載の音声認識プログラムを記録したことを特徴とする。
【発明を実施するための最良の形態】
【0013】
以下に添付図面を参照して、この発明にかかる音声認識装置、音声認識方法、音声認識プログラム、および記録媒体の好適な実施の形態を詳細に説明する。
【0014】
(音声認識装置の機能的構成)
はじめに、この発明の実施の形態にかかる音声認識装置の機能的構成について説明する。図1は、この発明の実施の形態にかかる音声認識装置の機能的構成を示すブロック図である。実施の形態にかかる音声認識装置100は、記憶部101と、受付部102と、出力部103と、音声認識処理部104と、入力部105と、計数部106と、比較部107と、を備えている。
【0015】
記憶部101は、音声認識用のテンプレートデータを記憶する。ここで、音声認識用のテンプレートデータとは、音声を波形の形状にパターン化してあらわすデータである。テンプレートデータは、入力が想定される用語ごとに設けられている。記憶部101は、テンプレートデータを、音声認識する内容ごとに分類して記憶する。具体的には、たとえば、地名をあらわすテンプレートデータ、施設名をあらわすテンプレートデータ、検索項目の分類をあらわすテンプレートデータのように、認識結果として出力されるデータの種類に応じて分類されている。
【0016】
音声認識用のテンプレートデータには、所定の処理を特定する特定情報がそれぞれ対応付けられていてもよい。ここで、所定の処理とは、たとえば、特定の画像を表示画面に表示させる処理である。具体例として、地名をあらわすテンプレートデータには、当該地名によってあらわされる地点およびその周辺の地図を表示画面に表示させる処理を特定する特定情報が対応付けられている。
【0017】
また、別の具体例として、施設名をあらわすテンプレートデータには、当該施設名によってあらわされる施設の内容(所在地や施設の概要など)を説明する情報を表示画面に表示させる処理を特定する特定情報が対応付けられていてもよい。
【0018】
さらに、別の具体例として、検索項目の分類をあらわすテンプレートデータには、『ガソリンスタンド』、『駐車場』、『レストラン』などのように、分類別に検索可能な項目を説明する一覧表を表示画面に表示させる処理を特定する特定情報が対応付けられていてもよい。
【0019】
受付部102は、利用者による各種操作を受け付ける。たとえば、受付部102は、音声認識処理の開始操作を受け付ける。出力部103は、受付部102によって音声認識処理の開始操作を受け付けた場合に、音声認識処理部104によっておこなわれる音声認識処理における操作内容を案内する案内音声を出力する。
【0020】
音声認識処理部104は、記憶部101によって記憶されているテンプレートデータの中から、入力部105によって入力された音声データに合致するパターンのテンプレートデータを検索する音声認識処理をおこなう。
【0021】
入力部105は、利用者によって発話された音声を波形としてパターン化した音声データを入力する。入力部105は、上述した出力部103による案内音声の出力後に検出した所定レベル以上の大きさの音声を音声データとして入力する。
【0022】
音声認識処理に際して、音声認識処理部104は、音声認識用のテンプレートデータを作業メモリ上に展開し、作業メモリ上に展開されたテンプレートデータの中から、入力部105によって入力された音声データに合致するテンプレートデータを検索する。検索に際して、音声認識処理部104は、作業メモリ上に展開されたテンプレートデータの中から、入力部105によって入力された音声データの波形にもっとも類似する波形を有するテンプレートデータを、音声データに合致するテンプレートデータとして検索する。
【0023】
音声認識処理部104による音声認識処理結果は、当該音声認識処理の内容に応じた機能を実行する際に用いられる。たとえば、「特定地点の検索」機能に関する音声認識処理の結果は、特定地点を検索したり、検索された特定地点およびその周辺の地図を表示したりする処理に用いられる。
【0024】
また、上述した受付部102は、上述した出力部103による案内音声の出力途中に、当該案内音声の出力を中断させる中断操作を受け付けることも可能である。受付部102によって中断操作を受け付けた場合、出力部103は出力途中の案内音声の出力を中断し、入力部105は中断操作を受け付けた時点以降に検出した所定レベル以上の大きさの音声を音声データとして入力する。
【0025】
計数部106は、受付部102によって受け付けられた中断操作の回数を計数する。計数部106は、中断操作の回数を、上述した機能ごとに計数してもよい。比較部107は、計数部106によって計数された回数と任意に設定された判断用の回数とを比較する。ここで、判断用の回数は、たとえば、音声認識装置100の製造時などに任意に設定することが可能であり、たとえば、「10回」などのように設定される。判断用の回数は、上述した機能ごとに設定されていてもよい。
【0026】
上述した出力部103は、計数部106によって計数された中断操作の回数に応じて、案内音声を出力する。具体的には、出力部103は、比較部107によって比較された比較結果に基づいて、計数部106によって計数された回数が判断用の回数を超えるまでの間、案内音声を出力する。すなわち、計数部106によって計数された回数が判断用の回数を超えた場合、出力部103は、以降、案内音声を出力しない。
【0027】
(音声認識装置における案内音声出力処理手順)
つぎに、音声認識装置100における案内音声出力処理手順について説明する。図2は、音声認識装置100における案内音声出力処理手順を示すフローチャートである。図2のフローチャートにおいて、まず、出力部103による案内音声の出力が開始されるまで待って(ステップS201:No)、開始された場合(ステップS201:Yes)には、案内音声の出力が終了したか否かを判断する(ステップS202)。
【0028】
ステップS202において、案内音声の出力が終了した場合(ステップS202:Yes)には、一連の処理を終了する。案内音声の出力が終了していない場合(ステップS202:No)には、受付部102によって中断操作を受け付けたか否かを判断する(ステップS203)。中断操作を受け付けていない場合(ステップS203:No)には、ステップS202へ戻る。
【0029】
ステップS203において、出力部103による案内音声の出力途中に、受付部102によって中断操作を受け付けた場合(ステップS203:Yes)には、案内音声の出力を中断し(ステップS204)、計数部106によって計数される中断操作回数に「1」を加算する(ステップS205)。
【0030】
そして、ステップS205において加算された中断操作回数と判断用の回数とを、比較部107によって比較して、中断操作回数が判断用の回数を超えたか否かを判断する(ステップS206)。超えていない場合(ステップS206:No)には、一連の処理を終了する。超えた場合(ステップS206:Yes)には、以降、受付部102によって開始操作を受け付けた場合にも案内音声を出力しないように、案内音声の出力設定情報を変更して(ステップS207)、一連の処理を終了する。
【0031】
なお、案内音声の出力設定情報とは、受付部によって受け付けられた開始操作に応じた案内音声を出力するか否かを設定する情報である。具体的には、たとえば、「案内音声を出力する」あるいは「案内音声を出力しない」の2項目のうち、いずれかにフラグを立てることによって実現することができる。出力設定情報は、上述した機能ごとに設定されていてもよい。
【0032】
上述したように、実施の形態の音声認識装置によれば、案内音声の出力途中に受け付けた中断操作の回数に応じて、案内音声を出力することができる。したがって、音声認識装置100は、利用者が案内音声を必要とする場合に限って、案内音声を出力することができる。これによって、利用者は、音声認識処理をおこなわせるごとに中断操作をおこなうという煩わしい操作をおこなうことなく、音声をより迅速に入力することができる。
【0033】
また、実施の形態の音声認識装置100によれば、中断操作の回数が判断用の回数を超えるまでの間に限って、案内音声を出力することができる。したがって、音声認識装置100は、利用者が案内音声を必要とする間に限って、案内音声を出力することができる。これによって、利用者は、案内音声が必要な期間に限って案内音声を活用し、音声認識装置100の利用習熟度に応じて、容易かつ迅速に音声を入力することができる。
【0034】
また、実施の形態の音声認識装置100によれば、音声認識処理結果を用いておこなわれる機能ごとに中断操作の回数を計数することで、機能ごとに案内音声を出力したり出力せずに音声データの入力を受け付けたりすることができる。したがって、音声認識装置100は、利用者が案内音声を必要とする機能に限って、案内音声を出力することができる。これによって、利用者は、案内音声が必要な機能に限って案内音声を活用し、機能ごとの利用習熟度に応じて、容易かつ迅速に音声を入力することができる。
【実施例】
【0035】
つぎに、上述した実施の形態にかかる音声認識装置100の実施例について説明する。この実施例においては、上述した実施の形態にかかる音声認識装置100を、車両に搭載されたナビゲーション装置に適用した例を示す。
【0036】
(ナビゲーション装置のハードウェア構成)
はじめに、ナビゲーション装置のハードウェア構成について説明する。図3は、実施例のナビゲーション装置のハードウェア構成を示すブロック図である。図3において、実施例のナビゲーション装置300は、CPU301と、ROM302と、RAM303と、磁気ディスクドライブ304と、磁気ディスク305と、光ディスクドライブ306と、光ディスク307と、音声I/F(インターフェース)308と、マイク309と、スピーカ310と、入力デバイス311と、映像I/F312と、ディスプレイ313と、通信I/F314と、GPSユニット315と、各種センサ316と、を備えている。各構成部301〜316は、バス320によってそれぞれ接続されている。
【0037】
まず、CPU301は、ナビゲーション装置300の全体の制御を司る。ROM302は、ナビゲーション処理に関する各種プログラムを記録している。また、RAM303は、CPU301のワークエリアとして使用される。すなわち、CPU301は、RAM303をワークエリアとして使用しながら、ROM302に記録された各種プログラムを実行することによって、ナビゲーション装置300の全体の制御を司る。
【0038】
RAM303には、上述した実施の形態で説明した中断操作回数を記録するメモリエリアが確保されている。このメモリエリアは、ナビゲーション装置300の電源がOFFになった場合にも中断操作回数を継続して記録することができるフラッシュメモリなどに確保される。
【0039】
磁気ディスクドライブ304は、CPU301の制御にしたがって磁気ディスク305に対するデータの読み取り/書き込みを制御する。磁気ディスク305は、図1に示した音声認識装置100が備える記憶部101を実現し、磁気ディスクドライブ304の制御で書き込まれたデータを記録する。磁気ディスク305としては、たとえば、HD(ハードディスク)やFD(フレキシブルディスク)を用いることができる。
【0040】
磁気ディスク305には、地図データなどのナビゲーション処理に用いられる各種データが記録されている。地図データは、ノードおよびリンクからなる道路ネットワークデータと、施設や道路その他地形(山、川、土地)に関するフィーチャを用いて描画される画像データとを含んでいる。地図データには、文字情報、施設の名称や住所などの情報、道路や施設の画像などが含まれていてもよい。地図データは、複数の地区ごとに分けられた複数の地区データによって構成されていてもよい。この場合、各地区データは、ディスプレイ313に表示された地図上の所定の地区をあらわす。
【0041】
道路形状データは、さらに交通条件データを有する。交通条件データには、たとえば、各ノードについて、信号や横断歩道などの有無、高速道路の出入り口やジャンクションの有無、各リンクについての長さ(距離)、道幅、進行方向、道路種別(高速道路、有料道路、一般道路など)などの情報が含まれている。
【0042】
また、交通条件データには、過去の渋滞情報を、季節・曜日・大型連休・時刻などを基準に統計処理した過去渋滞情報を記憶している。ナビゲーション装置300は、後述する通信I/F314によって受信される道路交通情報によって現在発生している渋滞の情報を得るが、過去渋滞情報により、指定した時刻における渋滞状況の予想をおこなうことが可能となる。
【0043】
ナビゲーション処理に用いられる各種データには、地図上の施設の形状をあらわす3次元データ、当該施設の説明をあらわす文字データに加えて、各種の機能を実現する機能データが含まれている。機能データとしては、たとえば、経路探索、所要時間の算出、経路誘導などを実現するプログラムデータなどの機能を実現するためのデータが含まれている。
【0044】
なお、実施例では、地図データを磁気ディスク305に記録するようにしたが、これに限るものではない。地図データは、ナビゲーション装置300のハードウェアと一体に設けられているものに限って記録されているものではなく、ナビゲーション装置300外部に設けられていてもよい。その場合、ナビゲーション装置300は、たとえば、通信I/F314を通じて、ネットワークを介して地図データを取得する。取得された地図データは、RAM303などに記憶される。
【0045】
光ディスクドライブ306は、CPU301の制御にしたがって光ディスク307に対するデータの読み取り/書き込みを制御する。光ディスク307は、光ディスクドライブ306の制御にしたがってデータの読み出される着脱自在な記録媒体である。光ディスク307は、書き込み可能な記録媒体を利用することもできる。着脱可能な記録媒体として、光ディスク307のほか、MO、メモリカードなどであってもよい。
【0046】
音声I/F308は、音声入力用のマイク309および音声出力用のスピーカ310に接続される。マイク309に集音された音声は、音声I/F308内でA/D変換される。マイク309は、たとえば、車両のサンバイザー付近に設置され、その数は単数でも複数でもよい。スピーカ310からは、所定の音声信号を音声I/F308内でD/A変換した音声が出力される。なお、マイク309から入力された音声は、音声データとして磁気ディスク305あるいは光ディスク307に記録可能である。
【0047】
入力デバイス311は、文字、数値、各種指示などの入力のための複数のキーを備えたリモコン、キーボード、タッチパネルなどが挙げられる。入力デバイス311は、リモコン、キーボード、タッチパネルのうちいずれか一つの形態によって実現されてもよいが、複数の形態によって実現することも可能である。
【0048】
映像I/F312は、ディスプレイ313に接続される。映像I/F312は、具体的には、たとえば、ディスプレイ313全体を制御するグラフィックコントローラと、即時表示可能な画像情報を一時的に記録するVRAM(Video RAM)などのバッファメモリと、グラフィックコントローラから出力される画像データに基づいてディスプレイ313を制御する制御ICなどによって構成される。
【0049】
ディスプレイ313には、アイコン、カーソル、メニュー、ウインドウ、あるいは文字や画像などの各種データが表示される。ディスプレイ313には、上述した地図データが、2次元または3次元に描画される。ディスプレイ313に表示された地図データには、ナビゲーション装置300を搭載した車両の現在地点をあらわすマークなどを重ねて表示することができる。なお、車両の現在地点は、CPU301によって算出される。
【0050】
ディスプレイ313としては、たとえば、CRT、TFT液晶ディスプレイ、プラズマディスプレイなどを用いることができる。ディスプレイ313は、たとえば、車両のダッシュボード付近に設置される。ディスプレイ313は、車両のダッシュボード付近のほか、車両の後部座席周辺などに設置するなどして、車両において複数設置されていてもよい。
【0051】
また、通信I/F314は、無線を介してネットワークに接続され、ナビゲーション装置300とCPU301とのインターフェースとして機能する。通信I/F314は、さらに、無線を介してインターネットなどの通信網に接続され、この通信網とCPU301とのインターフェースとしても機能する。
【0052】
通信網には、LAN、WAN、公衆回線網や携帯電話網などがある。具体的には、通信I/F314は、たとえば、FMチューナー、VICS(Vehicle Information and Communication System)/ビーコンレシーバ、無線ナビゲーション装置、およびその他のナビゲーション装置によって構成され、VICSセンターから配信される渋滞や交通規制などの道路交通情報を取得する。なお、VICSは登録商標である。
【0053】
GPSユニット315は、GPS衛星からの電波を受信し、車両の位置に関する情報を出力する。GPSユニット315の出力情報は、後述する各種センサ316の出力値とともに、CPU301による車両の現在地点の算出に際して利用される。現在地点を示す情報は、たとえば緯度・経度、高度などの、地図データ上の1点を特定する情報である。
【0054】
各種センサ316は、車速センサ、加速度センサ、角速度センサなどの、車両の位置や挙動を判断することが可能な情報を出力する。各種センサ316の出力値は、CPU301による車両の現在地点の算出や、速度や方位の変化量の測定に用いられる。なお、ナビゲーション装置300は、各種センサ316からの出力値を、ドライブレコーダ機能で記録するデータとしてもよい。
【0055】
なお、図示および説明を省略するが、ナビゲーション装置300は、上述した構成301〜316に加えて、DVDやCDなどの再生、テレビ放送の受信・録画などの各種機能を実現する構成を備えていてもよい。
【0056】
図1に示した音声認識装置100が備える各部の機能は、図3に示したナビゲーション装置300におけるROM302、RAM303、磁気ディスク305、光ディスク307などに記録されたプログラムやデータを用いて、CPU301が所定のプログラムを実行し、ナビゲーション装置300における各部を制御することによって実現される。
【0057】
すなわち、実施例のナビゲーション装置300は、ナビゲーション装置300における記録媒体としてのROM302に記録されているデータ更新プログラムを実行することにより、図1に示した音声認識装置100が備える機能を、図2に示した音声認識処理手順で実行することができる。
【0058】
(ナビゲーション装置の音声認識処理手順)
つぎに、ナビゲーション装置300の音声認識処理手順について説明する。図4は、ナビゲーション装置300の音声認識処理手順を示すフローチャートである。図4のフローチャートにおいて、まず、音声操作の開始操作があるまで待機する(ステップS401:No)。ここで、音声操作とは、ナビゲーション装置300が実行可能な各種の処理のうち、利用者によって発話された内容に応じた処理を開始させるための操作である。音声操作の開始操作は、入力デバイス311の操作によっておこなわれる。
【0059】
ステップS401において、音声操作の開始操作があった場合(ステップS401:Yes)には、上述した実施の形態で説明した案内音声の出力設定情報を検索し(ステップS402)、案内音声を出力するか否かを判断する(ステップS403)。
【0060】
ステップS403において、案内音声を出力する場合(ステップS403:Yes)には、開始操作に応じた案内音声の出力を開始し(ステップS404)、当該案内音声の出力が終了したか否かを判断する(ステップS405)。終了した場合(ステップS405:Yes)には、ステップS411へ移行する。終了していない場合には(ステップS405:No)、中断操作を受け付けたか否かを判断する(ステップS406)。
【0061】
ステップS406において、中断操作を受け付けていない場合(ステップS406:No)には、ステップS405へ戻る。中断操作を受け付けた場合(ステップS406:Yes)には、案内音声の出力を中断し(ステップS407)、RAM303に記録されている中断操作回数に「1」を加算する(ステップS408)。
【0062】
そして、ステップS408において加算された中断操作回数と判断用の回数とを比較して、中断操作回数が判断用の回数を超えたか否かを判断する(ステップS409)。超えていない場合(ステップS409:No)には、一連の処理を終了する。超えた場合には(ステップS409:Yes)、以降、入力デバイス311によって音声操作の開始操作を受け付けた場合にも案内音声を出力しないように、案内音声の出力設定情報を変更して(ステップS410)、一連の処理を終了する。
【0063】
一方、ステップS403において、案内音声を出力しない場合(ステップS403:No)には、マイク309を介して音声データが入力されるまで待ち(ステップS411:No)、入力された場合(ステップS411:Yes)には、音声認識処理をおこなう(ステップS412)。
【0064】
ステップS412における音声認識処理については、上述した実施の形態と同様であるため説明を省略するが、音声認識用のテンプレートデータを、RAM303などに展開し、展開されたテンプレートデータの中から入力された音声データのパターンにもっとも類似するテンプレートデータを検索する。
【0065】
そして、音声認識処理の結果を該当する機能を実現する各部へ、当該音声認識処理結果を出力する(ステップS413)。ステップS413においては、たとえば、音声認識処理の結果を音声としてスピーカ310から出力したり、文字や図形を用いてディスプレイ313に表示したりする。
【0066】
具体的に、ステップS413においては、たとえば、音声認識処理結果を地名や施設名の検索機能に用いる場合、音声認識処理結果を用いて検索された地名や施設名を順次読み上げてもよいし、検索された地名や施設名の一覧表をディスプレイ313に表示してもよい。なお、該当するテンプレートデータがない場合には、その旨を案内する音声メッセージをスピーカ310から出力したり、ディスプレイ313に表示してもよい。
【0067】
その後、ステップS413において出力された音声認識処理結果が、最終階層の音声認識処理結果であるか否かを判断し(ステップS414)、最終階層ではない場合(ステップS414:No)には、ステップS411へ戻り、最終階層である場合(ステップS414:Yes)には、一連の処理を終了する。
【0068】
上述したように、実施例のナビゲーション装置300は、利用者が案内音声を必要とする場合に限って、案内音声を出力することができる。これによって、利用者は、案内音声が不要な機能を利用する都度、中断操作をおこなうという煩わしい操作をおこなうことなく、音声をより迅速に入力することができる。
【0069】
また、実施例のナビゲーション装置300は、利用者が案内音声を必要とする間に限って、案内音声を出力することができる。これによって、利用者は、操作に不慣れである間などのように、案内音声が必要な期間に限って案内音声を活用し、音声認識装置100の利用習熟度に応じて、容易かつ迅速に音声を入力することができる。
【0070】
また、実施例のナビゲーション装置300は、利用者が案内音声を必要とする機能に限って、案内音声を出力することができる。これによって、利用者は、案内音声が必要な機能に限って案内音声を活用し、機能ごとの利用習熟度に応じて、容易かつ迅速に音声を入力することができる。
【0071】
以上説明したように、上述した音声認識装置、音声認識方法、音声認識プログラム、および記録媒体によれば、利用者が煩わしい操作をおこなうことなく、音声をより迅速に入力することができる。
【0072】
なお、本実施の形態で説明した音声認識方法は、あらかじめ用意されたプログラムをパーソナル・コンピュータやワークステーションなどのコンピュータで実行することにより実現することができる。このプログラムは、ハードディスク、フレキシブルディスク、CD−ROM、MO、DVDなどのコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。またこのプログラムは、インターネットなどのネットワークを介して配布することが可能な伝送媒体であってもよい。
【図面の簡単な説明】
【0073】
【図1】この発明の実施の形態にかかる音声認識装置の機能的構成を示すブロック図である。
【図2】音声認識装置の案内音声出力処理手順を示すフローチャートである。
【図3】実施例のナビゲーション装置のハードウェア構成を示すブロック図である。
【図4】ナビゲーション装置の音声認識処理手順を示すフローチャートである。
【符号の説明】
【0074】
100 音声認識装置
102 受付部
103 出力部
106 計数部
107 比較部




【特許請求の範囲】
【請求項1】
音声認識処理における操作内容を案内する案内音声の出力途中に、当該案内音声の出力を中断させる中断操作を受け付ける受付手段と、
前記受付手段によって受け付けられた中断操作の回数を計数する計数手段と、
前記計数手段によって計数された回数に応じて、前記案内音声を出力する出力手段と、
を備えることを特徴とする音声認識装置。
【請求項2】
前記計数手段によって計数された回数と任意に設定された判断用の回数とを比較する比較手段を備え、
前記出力手段は、前記比較手段によって比較された比較結果に基づいて、前記計数手段によって計数された回数が前記判断用の回数を超えるまでの間、前記案内音声を出力することを特徴とする請求項1に記載の音声認識装置。
【請求項3】
音声認識処理における操作内容を案内する案内音声の出力途中に、当該案内音声の出力を中断させる中断操作を受け付ける受付工程と、
前記受付工程によって受け付けられた中断操作の回数を計数する計数工程と、
前記計数工程によって計数された回数に応じて、前記案内音声を出力する出力工程と、
を含んだことを特徴とする音声認識方法。
【請求項4】
請求項3に記載の音声認識方法をコンピュータに実行させることを特徴とする音声認識プログラム。
【請求項5】
請求項4に記載の音声認識プログラムを記録したことを特徴とするコンピュータに読み取り可能な記録媒体。



【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate


【公開番号】特開2007−241122(P2007−241122A)
【公開日】平成19年9月20日(2007.9.20)
【国際特許分類】
【出願番号】特願2006−66515(P2006−66515)
【出願日】平成18年3月10日(2006.3.10)
【出願人】(000005016)パイオニア株式会社 (3,620)
【Fターム(参考)】