説明

音声案内装置、音声案内装置の制御方法及び制御プログラム

【課題】所定の入力装置から入力されるユーザの所望の音声が、既設音声と対応しているか否かを判定することにより正確な音声登録が可能な音声案内装置、音声案内装置の制御方法及び制御プログラムを提供する。
【解決手段】 変更受付部41は、ユーザからの既設音声の変更要求を受け付ける手段である。信号処理部42は、入力されるアナログ音声信号をデジタルの信号へ変換処理する手段である。音声認識部43は、音声データを解析し、発話者が何を言ったかを認識する手段である。キーワード判定部44は、変更対象の既設音声に該当するキーワードをキーワードテンプレートから読み取り、当該キーワードが、入力音声データに含まれるか否かのパターンマッチングを行う手段である。音声登録部45は、既設音声に代えて、入力音声を案内音声として、音声案内データベースに記録する手段である。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ナビゲーション装置の経路案内等に用いられる音声案内装置であって、既設の音声に限らず、ユーザの希望する音声を登録することのできる音声案内装置に関する。
【背景技術】
【0002】
近年急速に普及したナビゲーション装置では、地図上の道路や地名、建物などを数値化して得られたデータベースをCD−ROM等の記憶媒体に保持させ、それらデジタル地図データベースに基づいて目的地を設定し、予め装置が保持している道路データベースにしたがって誘導路を探索計算し、得られた誘導路と、GPS、ジャイロ、車速パルス等の航法データから逐次計算する自車位置を周辺地図上に画面表示したり、指定される目的地への最適な経路についても、計算のうえ画面表示や合成音声で誘導案内(ナビゲーション)するものである。
【0003】
従来、このような誘導案内における合成音声を、入力装置からユーザの所望の音声(以下、入力音声という)を入力することによって、予め登録された既設の音声(以下、既設音声という)を自由に変更できる音声案内装置がある。この入力音声は、例えば、既設音声の「まもなく左方向です。」を「次の交差点を対向車に注意して右折してください。」(特許文献2参照)と言い換えた場合のように、既設音声と同内容のものである必要がある。すなわち、既設音声と入力音声とは対応している必要がある。
【特許文献1】特開2000−258180号公報
【特許文献2】特開平9−325043号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
しかしながら、従来技術では、既設音声と入力音声とが対応しない場合であっても、通常、入力音声に対する録音制限はなく、入力装置から入力され登録された音声はどのようなものであっても自由に登録されていた。例えば、本来「次の交差点を右折してください。」と登録すべきところを「次の交差点を左折してください。」とするように右左折を全く逆に入力したとしても登録される。
【0005】
このようなチェック手段のない装置では、ユーザが所望の音声を登録し、これによって誘導案内を実行するように設定していた場合に、録音時に誤った内容で録音されているとそのまま誤った内容で誘導案内がなされる。極端に言えば、上記のように右左折を反対に案内する場合も考えられ、正確な誘導案内ができない場合があった。また、このような誤った音声案内は、画面表示とも当然食い違うから、ユーザを混乱させてしまう可能性があった。
【0006】
本発明は、上記のような課題を解決するもので、その目的は、所定の入力装置から入力されるユーザの入力音声が、既設音声と対応しているか否かを判定することにより正確な音声登録が可能な音声案内装置、音声案内装置の制御方法及び制御プログラムを提供することにある。
【課題を解決するための手段】
【0007】
上記の目的を達成するため、請求項1の発明は、所定の入力手段から入力される音声を認識する音声認識部と、当該音声を案内音声として登録する音声登録部とを備えた、ナビゲーション装置における経路誘導等に用いられる音声案内装置において、前記入力音声が、すでに登録された既設音声と対応しているかを判定する音声判定部を備え、前記音声登録部は、前記音声登録部は、前記入力音声が前記既設音声と対応している場合に、前記入力音声を登録することを特徴とすることを特徴とする。
【0008】
請求項5の発明は、請求項1の発明を方法の観点から捉えたものであって、制御部により、所定の入力手段から入力される音声を認識する音声認識処理と、当該音声を案内音声として登録する音声登録処理とを実行する、ナビゲーション装置における経路誘導案内等に用いられる音声案内装置の制御方法において、前記入力音声がすでに登録された既設音声と対応しているかを、前記制御部により判定する音声判定処理を含み、前記音声登録処理は、前記入力音声が前記既設音声と対応している場合に、前記制御部により、前記入力音声を登録するものであることを特徴とする。
【0009】
請求項8の発明は、請求項1、4の発明をコンピュータプログラムの観点から捉えたものであって、制御部により、所定の入力手段から入力される音声を認識させ、当該音声を案内音声として登録させる、ナビゲーション装置における経路誘導等に用いられる音声案内装置の制御プログラムにおいて、前記入力音声がすでに登録された既設音声と対応しているかを、前記制御部により判定させ、前記音声を登録させる方法は、前記入力音声が前記既設音声と対応している場合に、前記制御部により、前記入力音声を登録するものであることを特徴とする。
【0010】
以上のような態様では、マイク等の入力手段から入力された入力音声を解析し、この解析した音声に既設音声と対応するか否かの判定を行い、既設音声に対応する音声を登録することにより、既設音声の内容と合致した正確な入力音声の登録が可能となる。
【0011】
請求項2の発明は、請求項1の発明において、前記既設音声には既設音声ごとにキーワードが設定され、前記音声判定部は、前記入力音声中に、前記キーワードが含まれるかを判定する手段を備えたことを特徴とする。
【0012】
請求項6の発明は、請求項2の発明を方法の観点から捉えたものであって、請求項5の発明において、前記既設音声には既設音声ごとにキーワードが設定され、前記音声判定処理は、前記入力音声中に、前記キーワードが含まれるかを判定するものであることを特徴とする。
【0013】
請求項9の発明は、請求項2、6の発明をコンピュータプログラムの観点から捉えたものであって、請求項6の発明において、前記既設音声には既設音声ごとにキーワードが設定され、前記入力音声がすでに登録された既設音声と対応しているかを判定させる方法は、前記入力音声中に、前記キーワードが含まれるかを判定させるものであることを特徴とする。
【0014】
以上のような態様では、既設音声と入力音声との対比を、既設音声中に含まれる所定のキーワードが入力音声に含まれるか否かのパターンマッチングによって行うため、既設音声と入力音声との内容の合致が許容される最大公約数的な条件を、キーワードとして設定することによって、入力音声の選択の自由度が高まり、ユーザの多種多様な好みに対応しかつ正確性が担保された入力音声の登録が可能となる。
【0015】
請求項3の発明は、請求項1又は2の発明において、前記既設音声による音声案内と前記入力音声による音声案内とは、ユーザの操作により、常時切換え可能とする音声案内切替部を備えることを特徴とする。
【0016】
請求項7の発明は、請求項3の発明を方法の観点から捉えたものであって、請求項5又は6の発明において、前記既設音声による音声案内と前記入力音声による音声案内とは、ユーザの操作により、常時切換え可能とする音声案内切替処理を実行することを特徴とする。
【0017】
請求項10の発明は、請求項3,7の発明をコンピュータプログラムの観点から捉えたものであって、請求項8又は9記載の発明において、前記既設音声による音声案内と前記入力音声による音声案内とは、ユーザの操作により、常時切換え可能とする音声案内処理を実行させることを特徴とする。
【0018】
以上のような態様では、ナビゲーション処理中など、随時ユーザの変更要求に応じて、既設音声の変更を可能とすることにより、ユーザがドライブ時の情況に応じた音声案内を随時、選択し登録することができるようになる。
【0019】
請求項4の発明は、請求項1乃至3のいずれか1項に記載の発明において、前記入力手段には、集音器のほか、音声信号を記憶した外部記憶手段も含まれることを特徴とする。
【0020】
以上のような態様では、入力音声の入力は、マイクに限られず、例えば、フラッシュメモリカードやUSBメモリなどの外部記憶メディアや携帯端末などによる入力等、多様な方法によるものが可能であるので、ユーザの利便性を高めることができる。
【発明の効果】
【0021】
以上のように、本発明によれば、所定の入力装置から入力されるユーザの入力音声が既設音声と対応しているか否かを判定することにより、正確な音声登録が可能な音声案内装置、音声案内装置の制御方法及び制御プログラムを提供することができる。
【発明を実施するための最良の形態】
【0022】
次に、本発明の音声案内装置(以下「本装置」と呼ぶ)、対応する制御方法及び制御プログラムを実施するための最良の実施形態について、図を参照して説明する。なお、以下の実施形態では、本発明の音声案内装置をナビゲーションシステムに搭載した場合を例にとって説明する。また、すでに説明した従来の技術と共通の前提事項は再言しない。
【0023】
〔1.構成〕
本実施形態は、車載型に代表されるナビゲーションシステムであるが、ナビゲーション装置に搭載された本発明の音声案内装置として把握可能であり、本装置のハードウェア構成例を図1に示す。すなわち、図1に示す各符号のうち、1は、GPSに代表される絶対位置・方位検出部であり、GPSのアンテナ、レシーバ等を含み、自車位置を検出する絶対位置・方位検出部1として用いる。2は、ジャイロ等を利用した相対方位検出部で、自車の進行方向を検出する相対方位検出部2として用いる。
【0024】
3は、車両から得られる車速パルスを処理する為の車速検出部である。5〜8はメモリで、このうち5は、上記制御部4の実行すべきプログラムを格納するROMである。6は、制御部4により処理されるデータを格納するダイナミックRAM(DRAM)である。7は、電源OFFから再度ONまで設定等のメモリ内容を保持するスタティックRAM(SRAM)であり、メイン電源OFFの間もリチウム電池などによりバッテリーパックアップされる。8は、表示部10用のVideoRAM(VRAM)である。
【0025】
9は、表示部10や入力部11と制御部4を結ぶユーザインタフェース部である。10は、地図やメニューなどを表示するTFT液晶表示パネルなどの表示部である。11は、ユーザにより様々な情報を入力するための入力部で、押しボタンスイッチ、リモコンユニット、タッチパネルなどである。
【0026】
12は、誘導案内、特に音声案内のための既設音声、施設検索、経路探索、地図表示などのためのデータベースを記憶媒体(例えばCD−ROM、DVD−ROM、HDDなど)から読み取るディスク制御部である。
【0027】
ここで、誘導案内、特に音声案内のためのデータベースについて詳しく説明すると、このデータベースは、右折時や左折時、車両が目的地付近に到達した場合などの定型的な音声案内と地図上の各案内地点特有の音声案内とから構成される既設音声データを格納しているものである。本実施形態においては、この既設音声データのうち、変更可能な音声データを変更可能既設音声リストとしてまとめられている。また、当該変更可能な既設音声データごとのキーワードがキーワードテンプレートとしてデータベースに格納されている。例えば、図4に示すように「次の交差点を右折です。」との定型的な既設音声データを「1」として、このキーワードは「ツギ」と「ミギ」又は「ウセツ」から構成されている。
【0028】
13は、通信装置及び処理部であり、FM放送波を受信すると共にVICSなど所望のデータを取り出すとともに、有線又は無線モデムなどのネットワーク機器を経由して携帯電話やPDAあるいはBluetooth(商標)を搭載した端末など(以下、携帯端末21という。)と通信を行い、携帯端末21とデータを送受信する部分である。
【0029】
14は、外部記憶装置制御部であり、制御部4におけるナビゲーションに関するデータあるいは音声案内における入力音声データを、各種規格の知られている着脱式フラッシュメモリカード類やUSBメモリ等の外部記憶装置20から読み出す部分である。また、15は、入力音声を集音するマイクである。
【0030】
4は、システム全体の制御を司る制御部(メインCPU及びその周辺回路)であり、他の各部の制御を含む情報処理を行う。この制御部4が所定の制御プログラムにより、後述のような機能作用を実現・実行するところの、変更受付部41、信号処理部42と、音声認識部43と、キーワード判定部44と、音声登録部45としての役割を果たす。
【0031】
具体的には、変更受付部41は、ユーザからの入力部11を通じた既設音声の変更要求を受け付ける手段である。ここにおいて変更要求を受け付けることにより、本装置は既設音声変更モードとなり、マイク15あるいは外部記憶装置制御部14さらには通信装置及び処理部13が入力待機状態となる。
【0032】
また、変更受付部41は、ユーザに対して、変更可能既設音声リストを提示し、既設音声データのうち、どれを変更するかの選択を要求する手段である。これにより、変更希望の既設音声が特定され、後述のキーワード判定部44へ該当既設音声がキーワードテンプレートのいずれのデータであるかが通知される。
【0033】
また、信号処理部42は、マイク15から入力されるアナログ音声信号をデジタルの信号へ変換処理し、処理後の音声データをメモリMに記録する部分である。なお、音声データが外部記憶装置20あるいは携帯端末21から提供される場合には、この信号処理部42は処理を行わず、外部記憶装置制御部14が外部記憶装置20に格納された音声データを読み出すか、通信装置及び処理部13が携帯端末21から送信される音声データを受信し、それぞれメモリMへ記憶する。
【0034】
音声認識部43は、記録された音声データをメモリMから読み出し、解析し、入力された音声データにおいて発話者が何を言ったかを認識する部分である。なお、この認識処理には、一般的なHMM(Hidden Markov Model)や、DPマッチング法など、周知の処理であればいずれの手法でも構わない。
【0035】
キーワード判定部44は、変更受付部41から通知された変更対象となる既設音声に該当するキーワードを、キーワードテンプレートから読み取り、当該キーワードが、音声認識部43において認識され解析された入力音声データの入力音声中に含まれるか否かをパターンマッチングで検出する手段である。またこのパターンマッチングの結果、該当既設音声のキーワードが、入力音声に含まれていないと判断された場合には、表示部10へエラーメッセージを出力するように構成されている。
【0036】
音声登録部45は、キーワード判定部44において、該当既設音声のキーワードが入力音声に含まれていると判断された場合に、該当既設音声に代えて、入力音声を案内音声として音声案内データベースに登録する手段である。なお、既設音声データは、案内音声の変更によって、音声内の初期データとして音声案内データベースに格納されており、ユーザの指示により、常時初期状態に戻せるようになっている。
【0037】
なお、自車位置検出、施設検索、目的地の指定受付、地図表示、誘導案内等は、本発明の特徴ではなく従来技術と同様でよいので、ナビゲーション部40としてまとめて示し説明は省略する。
【0038】
〔2.作用〕
以上のような構成からなる本実施形態の作用について、図2のフローチャートを用いて説明する。
ユーザが、入力部11等を通して音声案内変更モードを選択すると(START)、変更受付部41が音声案内の変更要求を受け付けるため、図3に示す音声案内変更受付画面例のように、表示部10に変更可能音声リストを表示し(S1)、変更対象となる既設音声の選択を求める(S2)。そして、ユーザによる既設音声の選択があるまではこの処理を繰り返し(S2のNO)、ユーザが変更希望の既設音声を選択した場合には(S2のYES)、変更対象の既設音声データを特定し(S3)、その旨をキーワード判定部44に通知する。
【0039】
次に、変更受付部41は、マイク15に入力があったか否かを確認する(S4)。入力があれば(S4のYES)、信号処理部42はアナログ音声信号を受信し、これをデジタル信号に変換する(S5)。一方、マイク15に入力がない場合には(S4のNO)、次に外部記憶装置制御部14に外部記憶装置20からの入力があるか否かを確認させる(S6)。外部記憶装置20からの入力があれば(S6のYES)、当該データを読み込み(S7)、入力がなければ(S6のNO)、通信装置及び処理部13に携帯端末21からの入力を確認させる(S8)。さらに携帯端末21からの入力があれば(S8のYES)、その入力された音声データを受信し(S9)、入力がなければ(S8のNO)、S4に戻って、再度入力の確認処理を行う(S4〜S9)。
【0040】
S5、S7又はS9において変換あるいは読み込まれた入力音声データは、一旦メモリMへ記録されるとともに、変換あるいは読み込みがなされた旨が音声認識部43へ通知される。そうすると、音声認識部43は、当該入力音声データをメモリMから読み出し、音声認識処理を行う(S10)。
【0041】
音声認識部43において、入力音声が解析され発話者が何を言ったかが特定されると、次に、キーワード判定部44において、変更受付部41から通知された変更対象の既設音声に該当するキーワードをキーワードテンプレートから読み取り、当該キーワードが、入力音声データの入力音声中に含まれるか否かのパターンマッチングを行う(S11)。
【0042】
この点を具体的に説明すると、図3に示すように既設音声が「左折案内」であるとすると、図4に示したようにキーワードテンプレートは既設音声番号「2」のキーワードが「ツギ」と「ヒダリ」又は「サセツ」で構成され、これらの語句を入力音声が含むかどうかが判定される。
【0043】
そして、例えば、入力音声が「次の交差点を右へ」の場合には、「ツギ」は含むが、「ヒダリ」及び「サセツ」を含まないため、キーワード条件を満たさず(S11のNO)、表示部10にエラーメッセージが表示されるとともに(S12)、ユーザに再度の音声入力を要求する(S4)。
【0044】
一方、入力音声が「次、左」(つぎ、ひだり)の場合には、「ツギ」も「ヒダリ」も含むため、キーワード条件を満たすものとして(S11のYES)、音声登録部45は、当該入力音声である「次、左」を入力音声として、音声案内データベースへ登録を行い(S13)、入力音声の登録処理を終了する(END)。
【0045】
以上のように入力音声が登録されると、ナビゲーション部40におけるナビゲーション処理での誘導案内は、音声案内データベースに登録された入力音声によって行われる。
【0046】
〔3.効果〕
以上のような本実施形態によれば、マイク、外部記憶メディアあるいは携帯端末から入力された入力音声を、音声認識部により解析し、この解析した音声に既設音声のキーワードが含まれるか否かの判定をキーワード判定部において行うことにより、既設音声の内容と合致した正確な入力音声の登録が可能となる。
【0047】
また、既設音声と入力音声との対比を、既設音声中に含まれる所定のキーワードが入力音声に含まれるか否かのパターンマッチングを行うため、既設音声と入力音声との内容の合致が許容される最大公約数的な条件としてキーワードを設定することによって、入力音声の選択の自由度が高まり、ユーザの多種多様な好みに対応しかつ正確性が担保された入力音声の登録が可能となる。
【0048】
さらに、入力音声の入力は、マイクからの方法に限られず、例えば、フラッシュメモリカードやUSBメモリなどの外部記憶メディアや携帯端末などによる入力等、多様な方法によるものが可能で、ユーザの利便性を高めることができる。
【0049】
〔4.他の実施形態〕
なお、本発明は上記実施形態に限定されるものではなく、次に例示するような他の実施形態も含むものである。上記実施形態では、ナビゲーション部によるナビゲーション処理前の装置の設定段階における音声案内変更処理を説明したが、本発明では、ナビゲーション部による経路誘導処理中などにおいても、随時、変更受付部がユーザからの音声案内変更要求に従って、変更を受け付けることによって、図2に示した変更処理を行うことは可能である(音声案内切替部の処理)。
【0050】
このような場合、変更受付部は、ナビゲーション部によって算出される現在位置に基づいて、例えば、次の案内地点に変更対象となる既設音声データがあれば、これをユーザに選択対象として提示し、変更の可否を求めることによって、次の案内地点での音声案内の種類を決定し発話させることも可能である。
【0051】
以上のような他の実施形態によれば、ナビゲーション処理中など、随時ユーザの変更要求に応じて、既設音声の変更を可能とすることにより、ユーザがドライブ時の情況に応じた音声案内を随時、選択し登録することができるようになる。
【0052】
また、本発明においては、音声案内の変更は、既設音声から入力音声への変更だけでなく、入力音声から既設音声への変更も可能である。この変更も変更受付部により、随時行うようにすることもできる。また、一度登録した入力音声は、他の入力音声が登録されるまで、音声案内データベースに登録され、入力音声から既設音声への変更及び既設音声から入力音声への変更は常に繰り返すことができる。
【図面の簡単な説明】
【0053】
【図1】本発明の実施形態の構成を示す機能ブロック図。
【図2】本発明の実施形態の処理を示すフローチャート。
【図3】本発明の実施形態における音声案内変更受付画面の例を示す図。
【図4】本発明の実施形態におけるキーワードテンプレートの例を示す図。
【符号の説明】
【0054】
1…絶対位置・方位検出部
2…相対方位検出部
3…車速検出部
4…制御部(メインCPU及びその周辺回路)
5…ROM
6…ダイナミックRAM(DRAM)
7…スタティックRAM(SRAM)
8…ビデオRAM(VRAM)
9…ユーザインターフェース部
10…表示部
11…入力部
12…ディスク制御部
13…通信装置及び処理部
14…外部記憶装置制御部
15…マイク
20…外部記憶装置
21…携帯端末
40…ナビゲーション部
41…変更受付部
42…信号処理部
43…音声認識部
44…キーワード判定部
45…音声登録部

【特許請求の範囲】
【請求項1】
所定の入力手段から入力される音声を認識する音声認識部と、当該音声を案内音声として登録する音声登録部とを備えた、ナビゲーション装置における経路誘導等に用いられる音声案内装置において、
前記入力音声が、すでに登録された既設音声と対応しているかを判定する音声判定部を備え、
前記音声登録部は、前記入力音声が前記既設音声と対応している場合に、前記入力音声を登録することを特徴とする音声案内装置。
【請求項2】
前記既設音声には既設音声ごとにキーワードが設定され、
前記音声判定部は、前記入力音声中に、前記キーワードが含まれるかを判定する手段を備えたことを特徴とする請求項1記載の音声案内装置。
【請求項3】
前記既設音声による音声案内と前記入力音声による音声案内とは、ユーザの操作により、常時切換え可能とする音声案内切替部を備えることを特徴とする請求項1又は2記載の音声案内装置。
【請求項4】
前記入力手段には、集音器のほか、音声信号を記憶した外部記憶手段も含まれることを特徴とする請求項1乃至3のいずれか1項に記載の音声案内装置。
【請求項5】
制御部により、所定の入力手段から入力される音声を認識する音声認識処理と、当該音声を案内音声として登録する音声登録処理とを実行する、ナビゲーション装置における経路誘導案内等に用いられる音声案内装置の制御方法において、
前記入力音声がすでに登録された既設音声と対応しているかを、前記制御部により判定する音声判定処理を含み、
前記音声登録処理は、前記入力音声が前記既設音声と対応している場合に、前記制御部により、前記入力音声を登録するものであることを特徴とする音声案内装置の制御方法。
【請求項6】
前記既設音声には既設音声ごとにキーワードが設定され、
前記音声判定処理は、前記入力音声中に、前記キーワードが含まれるかを判定するものであることを特徴とする請求項5記載の音声案内装置の制御方法。
【請求項7】
前記既設音声による音声案内と前記入力音声による音声案内とは、ユーザの操作により、常時切換え可能とする音声案内切替処理を実行することを特徴とする請求項5又は6記載の音声案内装置の制御方法。
【請求項8】
制御部により、所定の入力手段から入力される音声を認識させ、当該音声を案内音声として登録させる、ナビゲーション装置における経路誘導等に用いられる音声案内装置の制御プログラムにおいて、
前記入力音声がすでに登録された既設音声と対応しているかを、前記制御部により判定させ、
前記音声を登録させる方法は、前記入力音声が前記既設音声と対応している場合に、前記制御部により、前記入力音声を登録するものであることを特徴とする音声案内装置の制御プログラム。
【請求項9】
前記既設音声には既設音声ごとにキーワードが設定され、
前記入力音声がすでに登録された既設音声と対応しているかを判定させる方法は、前記入力音声中に、前記キーワードが含まれるかを判定させるものであることを特徴とする請求項8記載の音声案内装置の制御プログラム。
【請求項10】
前記既設音声による音声案内と前記入力音声による音声案内とは、ユーザの操作により、常時切換え可能とする音声案内切替処理を実行させることを特徴とする請求項8又は9記載の音声案内装置の制御プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate


【公開番号】特開2006−284677(P2006−284677A)
【公開日】平成18年10月19日(2006.10.19)
【国際特許分類】
【出願番号】特願2005−101288(P2005−101288)
【出願日】平成17年3月31日(2005.3.31)
【出願人】(000001487)クラリオン株式会社 (1,722)
【Fターム(参考)】