説明

音声案内装置及び音声案内プログラム

【課題】様々なキャラクタの音声によりナビゲーションを行うことを可能にすることである。
【解決手段】音声案内を行う複数のキャラクタの音片データを格納する第1格納手段と、 複数のキャラクタの素片データを前記音片データに対応づけて格納する第2格納手段とを備え、切替手段によりキャラクタが切換えられると、当該キャラクタに対応する音片データを第1格納手段から検索し、当該音片データに対応する素片データを第2格納手段から検索し、検索した音片データと素片データを合成することにより合成データを作成し、その合成データを音声出力する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声案内装置及び音声案内プログラムに関する。
【背景技術】
【0002】
近年、走行ルートや交通情報等の音声案内を行うカーナビゲーション装置や、目的地までの道順を音声案内する携帯端末装置、各種電化製品の操作方法の説明を音声により行う操作補助装置といった各種音声案内装置が開発されている。このような音声案内装置は、特に、カーナビゲーション装置において多く使用され、音声案内装置を搭載したカーナビゲーション装置が普及している。カーナビゲーション装置は、主に、目的地までの経路や、進行先の渋滞情報等をユーザに提供するものであり、その案内方法は、モニタへの地図画像表示と音声とにより行われる。モニタへの表示はあるものの、ユーザは運転中にディスプレイを注視することはできないため、主に、音声案内を聞くことにより、その案内に従って運転を行っている。従って、カーナビゲーション装置の音声案内は、ユーザにとってなくてはならないものとなってきている。
【0003】
一方、最近では、単に情報を提供するだけのカーナビゲーション装置ではなく、画面上にキャラクタを表示させるユニークなカーナビゲーション装置が開発されている。例えば、いくつかのタイプのキャラクタを目的地に対応づけて記憶し、目的地が選択されると、その目的地に対応するキャラクタを表示画面上に登場させるというカーナビゲーション装置が開示されている(特許文献1、参照。)。
【特許文献1】特開2000−249567号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
しかしながら、キャラクタを表示するユニークなカーナビゲーション装置では、ユーザが表示画面を注視してしまい、危険であるという問題があった。また、従来のカーナビゲーション装置による音声案内では、目的地までの経路案内としては充分な機能を果たしているものの、その内容はユーザに事務的に情報を与えているだけであり、また、その音声は、肉声を使用しているが、誰もが違和感無く受け入れられるように、アナウンサー調の画一的なものになってしまうという問題があった。
【0005】
本発明の課題は、様々なキャラクタの音声によりナビゲーションを行うことを可能にすることである。さらに、音声案内させるキャラクタに切り替えると、そのキャラクタに対応付けられたナビゲーション動作ができるようにし、音声案内だけでなくナビゲーション動作にキャラクタごとの個性を持たせることである。
【課題を解決するための手段】
【0006】
上記課題を解決するために、請求項1に記載の発明は、音声案内を行う複数のキャラクタの音片データを格納する第1格納手段と、複数のキャラクタの素片データを前記音片データに対応づけて格納する第2格納手段と、前記キャラクタを切り替える切替手段と、 前記切替手段により切り替えられたキャラクタに対応する音片データを第1格納手段から検索し、当該音片データに対応する素片データを第2格納手段から検索する検索手段と、 前記検索手段により検索された音片データと素片データを合成する音声合成手段と、前記音声合成手段により合成された合成データを音声出力する音声出力手段とを備えることを特徴とする音声案内装置。
【0007】
請求項2に記載の発明は、請求項1に記載の音声案内装置において、地図情報及び交通情報を含む案内情報を受信し、前記案内情報に基づいてナビゲーションを行うナビゲーション手段と、前記第1格納手段に格納された複数のキャラクタの音片データと、前記第2格納手段に格納された複数のキャラクタの素片データとに、それぞれ対応付けて複数のナビゲーション動作情報を格納する第3格納手段とを更に備え、前記切替手段によりキャラクタが切り替えられると、前記第3格納手段から当該キャラクタに対応づけて格納されているナビゲーション動作情報が前記ナビゲーション手段に送信され、前記ナビゲーション手段は、前記ナビゲーション動作情報に基づいて、ナビゲーション制御を実行することを特徴としている。
【0008】
請求項3に記載の発明は、請求項2に記載の音声案内装置において、前記ナビゲーション動作情報は、前記音声案内装置起動時に実行される起動動作制御を含み、前記切替手段によりキャラクタが切り替えられると、当該キャラクタに対応付けられた起動動作制御を実行することを特徴としている。
【0009】
請求項4に記載の発明は、請求項2又は3に記載の音声案内装置において、前記ナビゲーション動作情報は、経路探索時の優先度設定情報を含み、前記切替手段によりキャラクタが切り替えられると、前記ナビゲーション手段は、当該キャラクタに対応付けられた前記優先度設定に基づいて、経路探索を実行することを特徴としている。
【0010】
請求項5に記載の発明は、請求項2から4の何れか一項に記載の音声案内装置において、前記ナビゲーション手段から送信される前記案内情報を表示画面に表示させる表示制御手段を更に備え、前記第3格納手段は、前記ナビゲーション動作情報と共にキャラクタに対応付けて画像データを格納し、前記切替手段によりキャラクタが切り替えられると、前記表示制御手段は、当該キャラクタに対応付けられた画像データを表示画面に表示させることを特徴としている。
【0011】
請求項6に記載の発明は、コンピュータを、音声案内を行う複数のキャラクタの音片データを格納させる第1格納手段、複数のキャラクタの素片データを前記音片データに対応づけて格納させる第2格納手段、前記キャラクタを切り替えさせる切替手段、前記切替手段により切り替えられたキャラクタに対応する音片データを第1格納手段から検索させ、当該音片データに対応する素片データを第2格納手段から検索させる検索手段、前記検索手段により検索された音片データと素片データを合成させる音声合成手段、前記音声合成手段により合成された合成データを音声出力させる音声出力手段として機能させることを特徴としている。
【発明の効果】
【0012】
本発明によれば、音片辞書ファイルと素片辞書ファイルそれぞれに、複数のキャラクタデータベースをキャラクタ毎に対応させて格納することで、様々なキャラクタの音声によるナビゲーションを行うことが可能となる。また、各キャラクタに異なったナビゲーション動作情報を格納し、キャラクタが切り替えられると、切り替えられたキャラクタに対応付けられたナビゲーション案内をさせることができることにより、音声案内だけでなく、ナビゲーション動作にもキャラクタ毎の個性を持たせることが可能となる。
【発明を実施するための最良の形態】
【0013】
以下、図を参照して、本発明の実施形態について詳細に説明する。
【0014】
図1に、カーナビゲーション装置1の主要部構成を示す。図に示すように、カーナビゲーション装置1は、制御部2、ナビゲーション部3、音声合成部4(音声案内装置)、入力部5、表示部6、音声出力部7等により構成される。
【0015】
制御部2は、図示は省略するが、CPU(Central Processing Unit)、RAM(Random Access Memory)、ROM(Read Only Memory)等により構成される。CPUは、ROMに記憶された各種プログラムに従って、カーナビゲーション装置1を構成する各部の動作を制御する。例えば、ユーザが入力部5を操作することにより目的地を登録すると、制御部2のCPUは、その操作信号を受信する。CPUは、受信した操作信号に従って、カーナビゲーション部3に格納された地図情報を取得し、取得したデータを表示部6へ出力する。そして、表示部6を制御し、ユーザが登録した目的地までの道順を表示画面へ表示させる。
【0016】
RAMは、CPUによって実行される各種プログラムをプログラム格納エリアに展開する。また、RAMは、各種プログラムの実行時に生じる処理結果等のデータをワークエリアに一時的に記憶する。ROMは、カーナビゲーション装置1の動作に必要なプログラムの実行に係るデータを格納する。これらのプログラムは何れも書き換える必要の無いプログラムや、書き換えてはいけないプログラムである。
【0017】
ナビゲーション部3は、記憶部及び受信手段としての通信部等を備える(図示省略)。記憶部は、プログラムやデータ等が予め記憶されている記録媒体を有しており、例えば、地図情報やテキストデータ等を記憶している。テキストデータは、音声案内のためのデータであり、「次の交差点右折です」といった道案内に必要なデータ等が複数記憶されている。なお、記憶部は着脱可能な構成としてもよく、例えば、新しい店舗の設置や道路の開拓などにより、地図情報が変更となった場合は、その着脱可能な記録媒体を更新することにより実行する。
【0018】
また、ナビゲーション部3は、ユーザによりキャラクタが選択されると、選択されたキャラクタに設定されているナビゲーション動作情報を受信する。そして、受信したナビゲーション動作情報に基づいて、選択されたキャラクタに対応するナビゲーションを実行する(後述)。
【0019】
ここで、キャラクタとは、音声案内を行う人物やアニメの登場人物、擬人化した動物等、特徴的又は個性的な口調、表現方法、役柄、声色、外観等を組み合わせた特有の性格を有する対象のことをいう。また、以下、このキャラクタが発生する音声をキャラクタボイスと称す。
【0020】
通信部はGPS衛星から送信されてくる位置情報を受信し、受信した情報を制御部2へ送信する。制御部2は、通信部からの位置情報を取得すると、記憶部に記憶された位置情報から現時点の位置を把握し、その位置情報と地図情報を組み合わせ、それらの情報を表示部6へ表示させる制御を行う。また、位置情報と地図情報を組み合わせることにより、ROMに記憶されたプログラムを動作させ最適な道案内情報を取得し、その情報を基に、記憶部に記憶されたテキストデータを読み込む。そして、そのテキストデータを音声合成部4へ出力する。
【0021】
入力部5は、タッチパネル5a及び操作キー5bを有し、ユーザはこれらを操作することにより、目的地の設定や登録、その他の機能を使用する。ユーザにより入力部5が操作されると、その操作信号は制御部2へ入力され、制御部2は、その入力された操作信号に従って、各部の制御を実行する。
【0022】
表示部6は、LCD(Liquid Crystal Display)等の表示画面を備え、制御部2から入力される表示制御信号に従って、地図案内等の各種データを表示する。
【0023】
音声合成部4は、制御部2からテキストデータが入力されると、それらのデータに基づいて音声合成データを生成する(後述)。そして、生成した合成音声データを音声出力部7へ出力する。
【0024】
音声出力部7は、音声合成部4により作成された音声合成データが入力されると、その音声合成データをユーザが把握できる声に変換し、出力する。この音声出力部7が音声を出力することで、ユーザは道案内を聞くことができる。
【0025】
次に、図2に、カーナビゲーション装置1を構成する本実施形態に係る音声合成部4の主要部構成を示す。
【0026】
図に示すように、音声合成部4は、キャラクタ切替処理部8、言語処理部9、音片編集処理部10、音響処理部11、音片検索部12、素片検索部13、音片辞書ファイル14、素片辞書ファイル15、キャラクタ設定ファイル16等により構成される。言語処理部9、音片編集処理部10、音響処理部11、音片検索部12、素片検索部13は、いずれも、CPUやDSP(Digital Signal Processor)等のプロセッサや、このプロセッサが実行するためのプログラムを記憶するメモリなどにより構成されている。なお、言語処理部9、音片編集処理部10、音響処理部11、音片検索部12、素片検索部13の一部又は全部の機能を単一のプロセッサが行うようにしてもよい。
【0027】
キャラクタ切替処理部8は、ユーザの入力部5の操作によりキャラクタ切替制御信号が入力されると、キャラクタ設定ファイル16に格納された複数のキャラクタDB(データベース)から、キャラクタ切替制御信号により指定されたキャラクタDBに切り替える制御を実行する。具体的には、切り替えられたキャラクタDBに格納されるナビゲーション動作情報を取得し、その情報をナビゲーション部3へ送信することにより、ナビゲーション部3のナビゲーション動作設定を当該キャラクタの動作設定へ切り替える制御を行う(図5参照)。
【0028】
また、キャラクタ切替処理部8は、キャラクタ切替制御信号に従って、指定されたキャラクタDBに切り替えると同時に、その制御信号を音片編集処理部10及び音響処理部11へ送信する。そして、音片編集処理部10は、キャラクタ切替信号に従って、音片辞書ファイル14が格納する複数のキャラクタDBから指定されたキャラクタDBに切り替える制御を実行する。音響処理部11も同様にして、キャラクタ切替信号を受信すると、その信号に従って、素片辞書ファイル15が格納する複数のキャラクタDBから指定されたキャラクタDBに切り替える制御を実行する。従って、キャラクタ切替処理部8は、キャラクタ切替制御信号が入力されると、キャラクタ設定ファイル16、音片辞書ファイル14及び素片辞書ファイル15にキャラクタ切替制御信号を送信し、すべて同じキャラクタDBに切り替える。
【0029】
以下、キャラクタ切替制御信号により、キャラクタDB1に切り替えられたとして説明するが、他のキャラクタDBに切り替えられた場合も同様である。
【0030】
言語処理部9は、制御部2からテキストデータが入力されると、そのテキストデータに形態素解析を施すことにより、このテキストデータを構成する表意文字列を表音文字列へと変換する。また、テキストデータ内で連続する複数の単語を表す表意文字列を、一つの音片の読みを表す表音文字列として変換する。例えば、「今日は天気がいい」という表意文字列が言語処理部9へ入力されると、言語処理部9は、形態素解析の結果として、読みがそれぞれ「今日は」「天気が」「いい」という3個の音片を特定する。
【0031】
なお、テキストデータの取得の手法は任意であり、例えば、インターフェース回路を介して外部の装置やネットワークから取得してもよいし、記録媒体ドライブ装置(図示省略)にセットされた記録媒体(例えば、フレキシブルディスクやCD−ROM等)から、この記録媒体ドライブ装置を介して読み取る構成としてもよい。
【0032】
言語処理部9は、3個の音片データを特定すると、それぞれの表意文字について、これらに相当する3個の表音文字列「キョウハ」「テンキガ」「イイ」に変換する。この場合、言語処理部9は、例えば、表音文字列「テンキガ」を、名詞である「天気(テンキ)」と助詞である「が(ガ)」とを含む1個の音片の読みを示すものとして扱っている。言語処理部9は、テキストデータ内の表意文字列をすべて表音文字列へと置換し、その表音文字列を音片編集処理部10へ出力する。
【0033】
音片編集処理部10は、図示は省略するが、一致音片決定部、韻律予測部、出力合成部等により構成される。音片編集処理部10を構成する一致音片決定部は、言語処理部9から上述した表音文字列が入力されると、この表音文字列に一致する表音文字列が対応付けられている音片データが有るか否かを検索するよう、音片検索部12に対して指示をする。音片検索部12は、一致音片決定部の指示に応答して音片辞書ファイル14のキャラクタDB1を検索し、該当する音片データが有るか否かを検索する。
【0034】
ここで、音片辞書ファイル14について説明する。音片辞書ファイル14は、PROMやハードディスク等の不揮発性メモリより構成されている。これらのファイルに格納される各キャラクタDBは、複数の音片が連続して発話されて得られる音声を表す連続音声データを格納し、この連続音声データは、例えば、PCM化されたデジタル形式のデータであればよい。また、このキャラクタDBは、キャラクタ設定ファイル16のキャラクタDBと対応づけられている。キャラクタ切替処理部8は、キャラクタ制御信号を受信し指定されたキャラクタDB1に切り替えると同時に、そのキャラクタ制御信号を音片編集処理部10へ入力する。音片編集処理部10は、この制御信号を受信すると、音片検索部12に対して、音片辞書ファイル14の検索はキャラクタDB1から実行するように指示をする。
【0035】
音片辞書ファイル14の各キャラクタDBが格納する連続音声データは、連続音声データ内で個々の音片を表す部分が音片データである。なお、音片とは、音声のうち音素1個以上を含む連続した1区間をいい、通常は、単語1個分又は複数個分の区間からなり、助詞や接続詞を含む場合もある。また、連続音声データは、個々の音片データの先頭(開始)の論理的位置を示すマークデータを含んでいる。また、個々の音片データの後端(終了)の論理的位置を示すマークデータを更に含んでいる構成としてもよい。
【0036】
また、音片辞書ファイル14の各キャラクタDBに格納されている音片データは、人により録音された音声であるため、上述した処理により、連続して索出された各音片データが全体として表す音声は、人が実際に発話する音声の連続した一部をなすものであり、これらの音片データ相互のつながりも自然なものである。従って、キャラクタDBに格納された音声は、それぞれ声質は違うが、自然な人の声による音声である。また、キャラクタDBに格納される音声はキャラクタ毎に異なり、それぞれ個性的なキャラクタボイスで録音される。従って、同じ内容の音声案内でも、キャラクタによって声音はもちろんのこと、更に口調や語尾を変化させて録音する。
【0037】
音片検索部12による音片データの索出は、音片辞書ファイル14の各キャラクタDBが記憶する連続音声データ内での個々の音片データの先頭(開始)アドレス及び終端(終了)アドレスを特定することにより行われる。従って、それぞれの音片データが互いに別個のファイルとして管理されている場合に比べ、連続音声データ内のアドレスに基づいて音片データの索出を実行することにより、音声データの索出に係る処理工程を大幅に削減することができる。
【0038】
また、テキストデータにある複数の表意文字列の連続が、音片辞書ファイル14のキャラクタDB1における連続音声データ内にある複数の連続する音片データ全体の読みに一致している場合には、この音片データの先頭(開始)アドレスと終端(終了)アドレスを特定し、これらの連続する音片データをまとめて索出することが可能である。
【0039】
例えば、音片辞書ファイル14のキャラクタDB1が記憶する連続音声データ内に、読みがそれぞれ「キョウハ」「テンキガ」「イイ」という3個の音片データが、連続して含まれている場合について説明する。これらの音片データのそれぞれには、上述したように、当該音片データの先頭(開始)アドレスと終端(終了)アドレスが対応付けて記憶されている。この場合において、テキストデータとして「今日は天気がいい」という表意文字列が言語処理部9に出力されていると、言語処理部9は、「キョウハ」「テンキガ」「イイ」という3個の表音文字列を生成する。そして、一致音片決定部へ、生成した3個の表音文字列を出力する。一致音片決定部は、これらの表音文字列が入力されると、音片検索部12に対して、これらの表音文字列のいずれかに読みが一致する音片データがキャラクタDB1に有るか否かの検索を実行するように指示をする。
【0040】
音片検索部12は、一致音片決定部からの指示を受けると、その指示に従って、音片辞書ファイル14のキャラクタDB1の検索を開始し、検索の結果、例えば、3個の表音文字列のうち、「キョウハ」「テンキガ」の2個の読みに一致する音片データが有ると判定したとする。音片検索部12は、索出すべき音片データが存在すると判定すると、この連続する表音文字列全体の先頭及び終端アドレス、つまり、先頭アドレスとして「キョウハ」、終端アドレスとして「テンキガ」を特定し、特定した範囲に存在する連続した音片データを音片辞書ファイル14のキャラクタDB1から読み出し、一致音片決定部へ出力する。
【0041】
また、音片検索部12は、これらの連続した音片データが、連続して索出されたものであることを示す識別データを、当該連続した音片データに付加して出力する構成としてもよい。さらに、一致音片決定部は、得られた検索結果のうち、連続する音片データとして索出された音片データが存在する場合には、音片編集処理部10を構成する韻律予測部による韻律予測に結果に拘束されず、これらの連続する音片データを優先的に選択する構成としてもよい。このような構成にすることにより、連続する音片データが表す音片に一致する部分については、韻律予測部に韻律予測を実行させる必要は無く、処理を迅速に行うことが可能となる。
【0042】
ここで、音片編集処理部10を構成する韻律予測部について説明する。韻律予測部は、一致音片決定部から音片データに対応する表音文字列が入力されると、入力された表音文字列に対して、韻律予測の手法に基づいた解析を施すことにより、この表音文字列が表す音声の韻律、つまり、アクセント、イントネーション、強勢、音素の時間長等を予測し、予測結果を表す韻律予測データを生成する。そして、この韻律予測データを音響処理部11へ出力する動作を行う。
【0043】
音片検索部12は、検索の結果、圧縮音片データを索出できなかった音片データがあった場合は、該当する音片を識別するデータ(以下、欠落部分識別データと称す。)を生成する。音片検索部12は、検索により一致した連続音片データと、音片検索部12が検索できなかった音片、つまり、欠落部分識別データが示す音片を含む音片データを一致音片決定部へ出力する。
【0044】
一致音片決定部は、音片検索部12より音片データが入力されると、この音片データのうち連続音声データにより連続して索出されたデータを検出する。この検出は、例えば、上述した識別データに基づいて実行される。
【0045】
上述した処理において、3個の表音文字列のうち、2個の読みに一致する音片データの処理について説明したが、次に、残りの1個の音片データ、つまり、検索部の検索により索出できなかった、音片データについての処理について説明する。
【0046】
音片検索部12から一致音片決定部に出力された音片データに、欠落部分識別データが含まれていると、一致音片決定部は、欠落部分識別データが示す音片の読みを表す表音文字列を抽出して、音響処理部11へ出力し、欠落部分識別データが示す音片の波形を合成するように指示をする。音響処理部11は、一致音片決定部から指示を受けると、指示をされた表音文字列に含まれるそれぞれの表音文字について、当該表音文字が表す音素を構成する素片の波形を検索するように、素片検索部13へ指示をする。指示を受けた素片検索部13は、波形辞書ファイル15が格納する複数のキャラクタDBのうち、設定されたキャラクタDB1を検索し、指定された内容に一致する圧縮波形データを索出する。
【0047】
ここで、波形辞書ファイル15は、PROMやハードディスク装置等の不揮発性メモリより構成されている。波形辞書ファイル15の各キャラクタDBには、表音文字と、この表音文字が表す音素を構成する素片(すなわち、1個の音素を構成する音声の波形1サイクル分(又はその他所定数のサイクル分)の音声)を表す素片波形データをエントロピー符号化して得られる圧縮波形データとが、予め互いに対応付けて記憶されている。なお、エントロピー符号化される前の素片波形データは、例えば、PCM化されたデジタル形式のデータから構成されていればよい。また、これらの素片波形データはキャラクタ毎に対応づけて設定されている。
【0048】
音響処理部11の指示内容に一致する圧縮波形データが索出されると、その索出された圧縮波形データを伸長部(図示省略)へ出力する。伸長部は、素片検索部13より入力された圧縮波形データを、圧縮される前の素片波形データへと復元し、素片検索部13へ返送する。そして、素片検索部13は、その素片波形データを、音響処理部11へ出力する。
【0049】
一方、韻律予測部は、一致音片決定部から音片検索部12により検出された音片データに対応する表音文字列が入力されると、予測結果を表す韻律予測データを生成する。そして、生成した韻律予測データを音響処理部11へ出力する。
【0050】
音響処理部11は、素片検索部13から素片波形データが供給され、韻律予測部から韻律予測データが出力されると、供給された素片波形データを用いて、一致音片決定部が入力した表音文字列に含まれるそれぞれの表音文字が表す音声の波形を表す音声波形データを生成する。具体的には、音響処理部11は、素片検索部13から入力された各々の素片波形データが表す素片により構成されている音素の時間長を、韻律予測部により生成され、入力された韻律予測データに基づいて特定する。そして、特定した音素の時間長を、当該素片波形データが表す素片の時間長で除した値に最も近い整数を求め、当該素片波形データを、求めた整数に等しい個数分相互に結合することにより、音声波形データを生成する。生成した音声波形データを一致音変決定部により入力された表音文字列内での各表音文字の並びに従った順序で、音片編集処理部10の出力合成部へ出力する。
【0051】
出力合成部は、一致音片決定部より音片データが供給され、音響処理部11により、素片波形データより生成された音声波形データが供給されると、供給されたそれぞれの音声波形データに含まれる素片波形データの個数を調整する。そして、素片波形データの個数の調整が完了した音声波形データと、一致音片決定部により供給された音片データとを、テキストデータ内での各音片又は音素の並びに従った順序で互いに結合し、合成音声データを音声出力部7へ出力する。
【0052】
次に、図3のフローチャートを参照して、上述した音声合成部4で実行される処理につてい簡単に説明する。
【0053】
まず、ユーザの入力部5操作によりキャラクタが決定されると、音声合成部4のキャラクタ切替処理部8は入力されたキャラクタ切替制御信号を受信する(ステップS1)。ステップS1において、キャラクタ切替制御信号を受信すると、キャラクタ切替処理部8は、受信したキャラクタ切替制御信号を音片編集処理部10及び音響処理部11へ出力する(ステップS2)。
【0054】
ステップS2において、音片編集処理部10へキャラクタ切替制御信号が入力されると、音片編集処理部10は、音片データの検索対象をキャラクタDB1へ切り替える(ステップS3)。この切り替えを行うと、音片編集処理部10は、音片検索部12へ検索指示を行う際は、キャラクタDB1を検索するよう指示をする。同様にして、ステップS2において、音響処理部11へキャラクタ切替制御信号が入力されると、音響処理部11は、素片データの検索対象をキャラクタDB1へ切り替える(ステップS3)。この切り替えを行うと、音響処理部は、素片検索部13へ検索指示を行う際は、キャラクタDB1を検索するよう指示をする。
【0055】
一方、ステップS1において、キャラクタ切替処理部8はキャラクタ切替制御信号を受信すると、キャラクタ設定ファイル16から切替信号に対応するキャラクタDB1を決定する(ステップS4)。ステップS4において、対応するキャラクタDB1を決定すると、決定したキャラクタDB1が格納するナビゲーション動作情報を取得し、取得したナビゲーション動作情報をナビゲーション部3へ送信する(ステップS5)。
【0056】
ステップS3において、音片辞書ファイル及び素片辞書ファイルの検索対象をキャラクタDB1へ切り替え、ステップS5において、切り替えたキャラクタDB1が格納するナビゲーション動作情報をナビゲーション部3へ送信すると、ナビゲーション部3から、テキストデータが言語処理部9へ入力される。言語処理部9は、テキストデータを取得すると(ステップS6)、取得したテキストデータに形態素解析を施すことにより、このテキストデータを構成する表意文字列を表音文字列へと変換する(ステップS7)。
【0057】
ステップS7において、テキストデータを表音文字列へと変換すると、その表音文字列を音片編集処理部10へ出力する。音片編集処理部10は、表音文字列が入力されると、音片検索部12へ該当する表音文字列の読みに相当する音片データを、設定したキャラクタDB1から索出するように指示を出す。音片検索部12は、音片編集処理部10からの指示を受け、言語処理部9が変換した表音文字列の読みに相当する音片データを、音片辞書ファイル14のキャラクタDB1から索出する(ステップS8)。
【0058】
ステップS8において、音片検索部12は、指示された表音文字列の読みに相当する音片データを索出するが、該当する音片データがない表音文字列があった場合は、その表音文字列について欠落部分識別データを生成する(ステップS9)。ステップS8において、該当する音片データがない表音文字列が無かった場合は、索出した音片データを音片編集処理部10へ出力する。
【0059】
ステップS9において、該当する音片データがない表音文字列について欠落部分識別データを生成すると、欠落部分識別データを含む音片データを音片編集処理部10へ出力し、その欠落部分識別データが示す音片の読みを示す表音文字列を抽出し(ステップS10)、抽出した表音文字列を音響処理部11へ出力する。音響処理部11は、欠落部分識別データが示す音片の読みを示す表音文字列が出力されると、素片検索部13に対して、当該表音文字列が表す音素を構成する素片の波形を、素片辞書ファイル15のキャラクタDBのうち設定されたキャラクタDB1から索出するように指示をする。素片検索部13は、その指示を受けると検索を開始し(ステップS11)、一致する素片波形データを索出する(ステップS12)。
【0060】
ステップS12において、素片検索部13は、一致する素片波形データを索出すると、索出した素片波形データを音響処理部11へ出力する。音響処理部11は、素片波形データが出力されると、その素片波形データから音声波形データを生成し(ステップS13)、生成した音声波形データを音片編集処理部10へ出力する。音片編集処理部10は、ステップS8において索出した音片データと、音響処理部11から出力された音声波形データを合成し合成音声データを生成する。そして、生成した合成音声データを音声出力部7へ出力する(ステップS14)。
【0061】
次に、図4のフローチャートを参照して、音片検索部12で実行される処理について説明する。
【0062】
音片検索部12は、音片編集処理部10から音片データの検索対象を切り替える指示を受信すると(ステップT1)、検索対象を音片辞書ファイル14が格納する複数のキャラクタDBのうち、指定されたキャラクタDB1に切り替える(ステップT2)。
【0063】
ステップT2において、検索対象を指定されたキャラクタDB1に切り替えると、カーナビゲーション装置1から入力され、言語処理部9にて変換された表音文字列を取得する(ステップT3)。ステップT3において、表音文字列を取得すると、その表音文字列に対応する音片データの検索を開始する旨の指示を受信する(ステップT4)。ステップT4において、音片編集処理部10の一致音片決定部から検索開始の指示を受信すると、該当する音片データが音片辞書ファイル14のキャラクタDB1に有るか否かを判定する(ステップT5)。
【0064】
ステップT5において、該当する音片データがキャラクタDB1に無いと判定すると(ステップT5;NO)、該当しない音片データについて、欠落部分識別データを生成する(ステップT6)。ステップT5において、該当する音片データがキャラクタDB1に有ると判定すると(ステップT5;YES)、該当する音片データをキャラクタDB1から索出する(ステップT7)。ステップT7において、該当する音片データをキャラクタDB1より索出すると、索出した音片データを音片編集処理部10へ出力し、処理を終了する。
【0065】
なお、ステップT5の判定の結果、検索を指示された表音文字列について、該当する音片データはあるが、一部については該当する音片データが無かった場合は、その部分について欠落部分識別データを生成する。そして、該当しなかった部分についての欠落部分識別データと、該当した音片データを音片編集処理部10へ出力する。
【0066】
以上のように、音片辞書ファイル14と素片辞書ファイル15に複数のキャラクタDBを対応づけて格納することにより、アナウンサー調の単一な音声による今までの退屈な音声案内ではなく、様々なキャラクタボイスの音声案内によるナビゲーションが可能となる。また、音声案内させるキャラクタはユーザにより選択可能とすることにより、ユーザは、その日の気分により、好みのキャラクタボイスによるナビゲーションを楽しむことができる。
【0067】
次に、キャラクタ設定ファイル16と、キャラクタ設定ファイル16が格納するキャラクタDBについて説明する。
【0068】
キャラクタ設定ファイル16は、PROMやハードディスク等の不揮発メモリにより構成されており、複数のキャラクタDBを格納する。これらのキャラクタDBに格納されるデータは、キャラクタにより異なっており、キャラクタに対応づけてそれぞれ格納される。具体的には、キャラクタ毎に特徴づけたナビゲーション動作情報(後述)を格納する。キャラクタ切替処理部8により、キャラクタDBが切り替えられると、該当するキャラクタDBに格納されたナビゲーション動作情報が読み出され、それらの情報がナビゲーション部3へ送信される。この動作により、カーナビゲーション装置1の動作設定が、キャラクタDB1に格納された設定に切り替えられ、切り替えられたナビゲーション動作設定によりナビゲーションが実行される。
【0069】
次に、キャラクタ設定ファイル16の各キャラクタDBが記憶するナビゲーション動作情報について説明する。ナビゲーション動作情報は、カーナビゲーション装置起動時の起動音、起動メッセージ、経路探索時の優先度設定、キャラクタ独自のお薦めのメモリ地点設定、表示画面に表示するキャラクタの画像データ等がある。
【0070】
起動音、起動メッセージ設定は、カーナビゲーション起動時に再生する起動音及び画面に表示されるメッセージの設定であり、キャラクタ毎に起動音を設定する。例えば、カーナビゲーション起動時にキャラクタ自身の音声を出力するとしてもよいし、キャラクタから連想される音楽を出力するとしてもよい。起動メッセージも同様にキャラクタ毎に設定し、表示画面に表示するメッセージの文体や内容を、キャラクタに合わせて変化させる。
【0071】
経路探索時の優先度設定は、経路探索時に特定の経路の検索優先度を高く、若しくは、低くする設定である。この設定では、キャラクタ毎に性格を設定し、その性格に対応づけて優先して検索する経路を設定する。例えば、性格設定が几帳面であるキャラクタには、有料道路を優先的に検索するように設定するなどである。その他、性格設定が倹約家であるキャラクタには、一般道路を優先的に検索させ、性格設定が走り屋であるキャラクタには、山道を優先的に検索させ、性格設定がドライブ好きであるキャラクタには、海沿いの道を優先的に検索させるなどの設定がある。なお、これらは、上述した設定に限定されず、さらに他の設定を付加するとしてもよい。
【0072】
また、キャラクタ独自のお薦めメモリ地点の設定では、キャラクタ毎にいくつかのランドマークを予めメモリ地点として登録し、その地点情報に対応づけて音片辞書ファイル14の該当するキャラクタDBに、その地点を紹介する音声データを予め格納する。そして、通常のナビゲーション中に、登録されているメモリ地点付近を通過する際に、ナビゲーション部3からのテキストデータ入力がなければ、地点情報に基づいて、予め格納しているメッセージを出力する。キャラクタ毎に、設定された性格に関連する地点情報などを設定するとしてもよい。また、メモリ地点の設定は複数可能であり、複数設定されたメモリ地点の中からいくつか選択し、立ち寄り地点や目的地として設定し、キャラクタお薦めのドライビングコースとして提案する構成としてもよい。さらに、地点情報の他に、観光案内やお薦めお土産情報等を登録しておくとしてもよい。
【0073】
ただし、メモリ地点に対応づけて音声データを登録する際は、ナビゲーション部3からのテキストデータに対応づけて登録する音声データとは別のDBに格納する必要がある。音片辞書ファイル14のキャラクタDBには、入力されるテキストデータの読みに対応付けて音片データが登録されており、ナビゲーション部3から言語処理部9へテキストデータが入力されることにより、それに対応する音片データが読み出される。従って、メモリ地点情報と、それに対応する音片データを格納するDBを、キャラクタDB毎に用意し、ナビゲーション部3が受信したメモリ地点情報を音声合成部へ入力させ、当該キャラクタDBを検索することで音片データを読み出す構成とすれば、キャラクタ毎に指定されたメモリ地点の観光案内等を出力することができ、音声案内がない場合でも、キャラクタボイスを出力させることが可能となる。
【0074】
また、キャラクタ設定ファイル16には、ナビゲーション動作情報と共にキャラクタの画像データをキャラクタ毎に格納する。この画像データは、キャラクタ毎に設定されている性格がイメージできるような画像データとする。カーナビゲーション装置起動時や、キャラクタ切替時、ナビゲーション案内時に表示画面上に表示させる。音声案内だけでなく、表示画面上にキャラクタに対応づけられたが画像データを表示することで、ユーザは視覚的にキャラクタを認識できる。なお、キャラクタ画像データの表示は、ユーザが表示選択可能とするとしてもよいし、強制的に表示しない構成としてもよい。これは、ユーザがキャラクタの音声を聞いて想像していたキャラクタと、登録されている画像データとが大きく異なっていた場合が想定できるため、若しくは、そのキャラクタの音声のみが有名であり、画像データが存在しないものと一般に認識されているキャラクタがある場合が想定できるため、その対処方法として、表示選択を可能とする。また、必要に応じて、画像データを有しない構成としてもよく、この場合には当然、当該キャラクタにおける画像の表示は行われない。
【0075】
キャラクタDBが切り替えられ、該当するキャラクタDBに対応づけられたナビゲーション動作情報に設定されると、上述した動作設定に切り替えられ、当該キャラクタ特有のナビゲーション案内が実行される。
【0076】
次に、図5のフローチャートを参照して、キャラクタ切替制御信号が入力された際に、ナビゲーション部3に対して実行される処理について説明する。
【0077】
キャラクタ切替処理部8にキャラクタ切替制御信号が入力されると、キャラクタ切替処理部8は、入力された切替信号に対応するキャラクタDB1に切り替え、切り替えたキャラクタDB1が格納するナビゲーション動作情報を取得し、取得したナビゲーション動作情報をナビゲーション部3へ送信する(図3、ステップS5)。
【0078】
ナビゲーション部3は、切り替え操作により切り替えられたキャラクタDB1のナビゲーション動作情報を音声合成部4より受信する(ステップP1)。ステップP1において、切り替え操作により決定されたキャラクタDB1のナビゲーション動作情報を受信すると、ナビゲーション部3は、受信したナビゲーション動作情報に基づいてナビゲーション部3の設定を変更する(ステップP2)。具体的には、切り替えられたキャラクタに対応づけて設定されているナビゲーション動作に切り替えられるのである。従って、例えば、ドライブ好きのキャラクタに切替られると、カーナビゲーション装置1の起動音が波の音になり、目的地までの優先道路として海沿いの道を検索するなどの動作が実行される。
【0079】
以上のように、キャラクタ設定ファイル16が格納するキャラクタDBに、音声データだけでなく、キャラクタに対応付けてナビゲーション動作情報を格納し、キャラクタ切り替え信号により、ナビゲーション動作設定もキャラクタ独自の設定に変更することにより、キャラクタ毎に異なる起動音や起動メッセージ、優先経路にてナビゲーションを行わせることができる。従って、音声案内だけでなくナビゲーションの案内内容にもキャラクタ毎の個性を持たせることができ、キャラクタ毎にユニークな経路案内によるドライブを楽しむことができる。
【0080】
さらに、ユーザは、好きなキャラクタに切り替えることができ、同じ目的地に行く場合でも、日によって違う経路を通り、違うキャラクタボイスによるナビゲーションで目的地までの運転を楽しむことができる。また、特定の地点を経過すると、その土地の観光案内をさせたり、道案内をしないタイミングでも何かメッセージを発話させることができ、ユーザを退屈させずに目的地まで到着させることが可能となる。
【0081】
さらに、キャラクタ毎に画像データを設定し、表示画面に表示させることで、視覚的にそのキャラクタを認識でき、運転者だけでなく助手席の搭乗者も楽しませることができる。また、その画像データを表示させるか否かをユーザが自由に選択できるようにすることで、キャラクタに対してユーザが想像していた画像と一致しなかった場合にも対応できる。
【0082】
なお、予め登録されているキャラクタ画像データ、性格設定、音声などをユーザが自由に組み合わせて、オリジナルのキャラクタを設定可能である。
【0083】
また、本発明に係る音声合成部4は、カーナビゲーション装置1に備える構成としたがこれに限られず、携帯電話などの通信情報端末に搭載する構成としても同様の効果を得ることが可能である。
【図面の簡単な説明】
【0084】
【図1】カーナビゲーション装置の主要部構成を示す図である。
【図2】図1のカーナビゲーション装置を構成する、本実施形態に係る音声合成部の主要部構成を示す図である。
【図3】図2の音声合成部において実行される処理を示すフローチャートである。
【図4】図2の音声合成部4を構成する音片検索部12において実行される処理を示すフローチャートである。
【図5】キャラクタ切替制御信号が入力された際に、ナビゲーション部に対して実行される処理を示すフローチャートである。
【符号の説明】
【0085】
1 カーナビゲーション装置
2 制御部
3 ナビゲーション部
4 音声合成部
5 入力部
5a タッチパネル
5b 操作キー
6 表示部
7 音声出力部
8 キャラクタ切替処理部
9 言語処理部
10 音片編集処理部
11 音響処理部
12 音片検索部
13 素片検索部
14 音片辞書ファイル
15 素片辞書ファイル
16 キャラクタ設定ファイル

【特許請求の範囲】
【請求項1】
音声案内を行う複数のキャラクタの音片データを格納する第1格納手段と、
複数のキャラクタの素片データを前記音片データに対応づけて格納する第2格納手段と、
前記キャラクタを切り替える切替手段と、
前記切替手段により切り替えられたキャラクタに対応する音片データを第1格納手段から検索し、当該音片データに対応する素片データを第2格納手段から検索する検索手段と、
前記検索手段により検索された音片データと素片データを合成する音声合成手段と、
前記音声合成手段により合成された合成データを音声出力する音声出力手段と、
を備えることを特徴とする音声案内装置。
【請求項2】
地図情報及び交通情報を含む案内情報を受信し、前記案内情報に基づいてナビゲーションを行うナビゲーション手段と、
前記第1格納手段に格納された複数のキャラクタの音片データと、前記第2格納手段に格納された複数のキャラクタの素片データとに、それぞれ対応付けて複数のナビゲーション動作情報を格納する第3格納手段と、を更に備え、
前記切替手段によりキャラクタが切り替えられると、前記第3格納手段から当該キャラクタに対応づけて格納されているナビゲーション動作情報が前記ナビゲーション手段に送信され、
前記ナビゲーション手段は、前記ナビゲーション動作情報に基づいて、ナビゲーション制御を実行することを特徴とする請求項1に記載の音声案内装置。
【請求項3】
前記ナビゲーション動作情報は、前記音声案内装置起動時に実行される起動動作制御を含み、
前記切替手段によりキャラクタが切り替えられると、当該キャラクタに対応付けられた起動動作制御を実行することを特徴とする請求項2に記載の音声案内装置。
【請求項4】
前記ナビゲーション動作情報は、経路探索時の優先度設定情報を含み、
前記切替手段によりキャラクタが切り替えられると、前記ナビゲーション手段は、当該キャラクタに対応付けられた前記優先度設定に基づいて、経路探索を実行することを特徴とする請求項2又は3に記載の音声案内装置。
【請求項5】
前記ナビゲーション手段から送信される前記案内情報を表示画面に表示させる表示制御手段を更に備え、
前記第3格納手段は、前記ナビゲーション動作情報と共にキャラクタに対応付けて画像データを格納し、
前記切替手段によりキャラクタが切り替えられると、前記表示制御手段は、当該キャラクタに対応付けられた画像データを表示画面に表示させることを特徴とする請求項2から4の何れか一項に記載の音声案内装置。
【請求項6】
コンピュータを、
音声案内を行う複数のキャラクタの音片データを格納させる第1格納手段、
複数のキャラクタの素片データを前記音片データに対応づけて格納させる第2格納手段、
前記キャラクタを切り替えさせる切替手段、
前記切替手段により切り替えられたキャラクタに対応する音片データを第1格納手段から検索させ、当該音片データに対応する素片データを第2格納手段から検索させる検索手段、
前記検索手段により検索された音片データと素片データを合成させる音声合成手段、
前記音声合成手段により合成された合成データを音声出力させる音声出力手段、
として機能させることを特徴とする音声案内プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公開番号】特開2006−330484(P2006−330484A)
【公開日】平成18年12月7日(2006.12.7)
【国際特許分類】
【出願番号】特願2005−155841(P2005−155841)
【出願日】平成17年5月27日(2005.5.27)
【出願人】(000003595)株式会社ケンウッド (1,981)
【Fターム(参考)】