音声案内システム、キャラクタ人形、携帯端末装置、音声案内装置及びプログラム

【課題】より多くのキャラクタボイスの再生が可能な音声案内システム等を実現すること。
【解決手段】音片検索部６０は、Ｉ／Ｆ部６６,２６０を介してキャラクタ人形２００が接続されているか否かを判定する。そして、接続されていると判定した場合は、キャラクタ音声データ２１０の音片辞書データ２４０から表音文字列の音片データを索出する。そして、音片編集部５８は、音片検索部６０により索出されなかった音片の表音文字列を音響処理部６２に出力する。素片検索部６４は、音響処理部６２に入力された表音文字列を構成する音素毎の素片データをキャラクタ人形２００の素片辞書データ２２０から索出する。音響処理部６４が、索出された素片データを合成して音声波形データを生成し、音片編集部５８は、音声波形データと音片データとを結合して合成音声データを生成し、合成音声データに基づく音声をスピーカ８２から出力させる。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、音声案内システム、キャラクタ人形、携帯端末装置、音声案内装置及びプログラムに関する。
【背景技術】
【０００２】
近年、走行ルートや交通情報等の音声案内を行うカーナビゲーション装置や、目的地までの道順を音声案内する携帯端末装置、各種電化製品の操作方法の説明・アドバイスを音声により行う操作補助装置といった音声を用いてユーザに様々な情報を提供する音声案内装置が広く普及するようになった。
【０００３】
この音声案内装置の一例としては、ぬいぐるみであるキャラクタ人形の手をモータによって駆動制御して、車輌が進むべき方向を当該キャラクタ人形に指示させると共に、音声案内するナビゲーション装置が知られている（特許文献１参照）。
【０００４】
音声案内装置の音声案内は、予めアナウンサー等により発話された音声をＰＣＭ（Pulse Code Modulation）形式やＡＤＰＣＭ（Adaptive Differential ＰＣＭ）形式等の音声データに変換して記憶しておき、この音声データに基づいた音声出力により行われる。また、多くの音声案内装置は、一般にアナウンサー調の音声によって音声案内を行うが、特許文献１のナビゲーション装置であれば、キャラクタ人形に合わせた音声データを記憶して、当該音声データに基づいて音声案内を行うこともできる。
【特許文献１】特開２００２−７１３７２号公報
【発明の開示】
【発明が解決しようとする課題】
【０００５】
ところが、アナウンサー調の音声やキャラクタ人形に合わせた音声等の単一の音声で音声案内を行う場合、いつも同じ口調や声色になってしまうため、ワンパターン化し単調なものとなってしまう。このため、有名人やアニメキャラクタ等のキャラクタに合わせた音声を複数再生可能にする音声案内装置が望まれるようになった。
【０００６】
しかし、複数のキャラクタボイスを再生可能にするためには、キャラクタそれぞれの音声を再生するための音声データを個々に音声案内装置内に記憶しておかなければならない。上述したように、音声データは、予め録音した音声データであるため、音声データ１つ１つのデータ量が大きく、更に音声案内のパターン数に応じて全体のデータ量が膨大になる。従って、キャラクタ毎の音声データを複数記憶するには音声案内装置のメモリ領域を非常に多く占有してしまう。また、仮にハードディスク等の大容量の記憶媒体を用いたととしても、その記憶容量には限界があるため、記憶可能なキャラクタの数にも限りが生じてしまった。
【０００７】
本発明は、上述したような課題に鑑みて為されたものであり、その目的とするところは、より多くのキャラクタボイスの再生が可能な音声案内システム等を実現することである。
【課題を解決するための手段】
【０００８】
以上の課題を解決するために、請求項１に記載の発明は、
第１の通信手段を備えるキャラクタ人形と、前記第１の通信手段と接続可能な第２の通信手段を備える音声案内装置とを具備する音声案内システムであって、
前記キャラクタ人形は、
当該キャラクタ人形のキャラクタが音声案内する音声データを記憶する音声データ記憶手段を備え、
前記音声案内装置は、
前記２の通信手段が前記第１の通信手段に接続されたか否かを判定する判定手段と、
前記音声データ記憶手段に記憶された音声データを読み出す読み出し手段と、
前記判定手段により接続されたと判定された場合に、前記読み出し手段により読み出された音声データに基づいた音声出力を行う音声出力手段と、を備えることを特徴としている。
【０００９】
請求項２に記載の発明は、第１の通信手段を備えるキャラクタ人形と、前記第１の通信手段と接続可能な第２の通信手段を備える音声案内装置とを具備する音声案内システムであって、
前記キャラクタ人形は、
当該キャラクタ人形のキャラクタが音声案内する音声データを記憶する音声データ記憶手段と、
前記音声案内装置からの指示に基づいて音声出力する音声出力手段と、を備え、
前記音声案内装置は、
前記第２の通信手段が前記第１の通信手段に接続されたか否かを判定する判定手段と、
前記音声データ記憶手段に記憶された音声データを読み出す読み出し手段と、
前記判定手段により接続されたと判定された場合に、前記読み出し手段により読み出された音声データに基づいた音声出力を前記音声出力手段に指示する指示手段と、を備えることを特徴としている。
【００１０】
請求項３に記載の発明は、請求項１又は２に記載の発明において、
前記キャラクタ人形は、
当該キャラクタ人形を駆動する駆動手段と、
前記駆動手段の駆動を制御する駆動データを記憶する駆動データ記憶手段と、を更に備え、
前記音声案内装置は、
音声案内に応じた駆動データを前記駆動データ記憶手段から読み出す駆動データ読み出し手段と、
前記駆動データ読み出し手段により読み出された駆動データに基づいた駆動制御を前記駆動手段に指示する駆動指示手段と、を更に備えることを特徴としている。
【００１１】
請求項４に記載の発明は、第１の通信手段を備える携帯端末装置と、前記第１の通信手段と接続可能な第２の通信手段を備える音声案内装置とを具備する音声案内システムであって、
前記携帯端末装置は、
キャラクタが音声案内する音声データを記憶する音声データ記憶手段を備え、
前記音声案内装置は、
前記第２の通信手段が前記第１の通信手段に接続されたか否かを判定する判定手段と、
前記音声データ記憶手段に記憶された音声データを読み出す読み出し手段と、
前記判定手段により接続されたと判定された場合に、前記読み出し手段により読み出された音声データに基づいた音声出力を行う音声出力手段と、を備えることを特徴としている。
【００１２】
請求項５に記載の発明は、第１の通信手段を備える携帯端末装置と、前記第１の通信手段と接続可能な第２の通信手段を備える音声案内装置とを具備する音声案内システムであって、
前記携帯端末装置は、
キャラクタが音声案内する音声データを記憶する音声データ記憶手段と、
前記携帯端末装置からの指示に基づいて音声出力する音声出力手段と、を備え、
前記音声案内装置は、
前記第２の通信手段が前記第１の通信手段に接続されたか否かを判定する判定手段と、
前記音声データ記憶手段に記憶された音声データを読み出す読み出し手段と、
前記判定手段により接続されたと判定された場合に、前記読み出し手段により読み出された音声データに基づいた音声出力を前記音声出力手段に指示する指示手段と、を備えることを特徴としている。
【００１３】
請求項６に記載の発明は、請求項４又は５に記載の発明において、
前記携帯端末装置は、
表示手段と、キャラクタ画像を表示するための画像データを記憶する画像データ記憶手段と、を更に備え、
前記音声案内装置は、
音声案内に応じた画像データを前記画像データ記憶手段から読み出す画像データ読み出し手段と、
前記画像データ読み出し手段により読み出された画像データに基づいたキャラクタ画像の表示を前記表示手段に指示する表示指示手段と、を更に備えることを特徴としている。
【００１４】
請求項７に記載の発明は、請求項４〜６の何れか一項に記載の発明において、
前記携帯端末装置は、公衆回線網上のサーバから前記キャラクタの音声データをダウンロードするダウンロード手段と、
前記ダウンロード手段によりダウンロードされた音声データを前記音声データ記憶手段に記憶更新させる記憶更新手段と、を更に備えることを特徴としている。
【００１５】
請求項８に記載の発明は、請求項１〜７の何れか一項に記載の発明において、
車輌に搭載される車載用の音声案内システムであって、
前記車輌のナビゲーションを行うナビゲーション手段を更に備え、
前記音声データ記憶手段は、前記ナビゲーション手段によるナビゲーションの音声データを記憶することを特徴としている。
【００１６】
請求項９に記載の発明は、音声案内装置に通信手段を介して接続可能なキャラクタ人形であって、
キャラクタが音声案内する音声データを記憶する音声データ記憶手段と、
前記通信手段が前記音声案内装置に接続された際に、前記音声データ記憶手段から前記音声案内装置によって読み出された音声データに基づいた音声出力の指示を受信する受信手段と、
前記受信手段により受信された指示に基づいて音声出力を行う音声出力手段と、を備えることを特徴としている。
【００１７】
請求項１０に記載の発明は、音声案内するキャラクタの音声データを記憶するキャラクタ人形に通信手段を介して接続可能な音声案内装置であって、
前記通信手段が前記キャラクタ人形に接続されたか否かを判定する判定手段と、
前記判定手段により接続されたと判定された場合に、前記音声データ記憶手段に記憶された音声データを読み出す読み出し手段と、
前記読み出し手段により読み出された音声データに基づいた音声出力を行う音声出力手段と、を備えることを特徴としている。
【００１８】
請求項１１に記載の発明は、音声案内するキャラクタの音声データを記憶する音声データ記憶手段及び音声出力手段を備えたキャラクタ人形に通信手段を介して接続可能な音声案内装置であって、
前記通信手段が前記キャラクタ人形に接続されたか否かを判定する判定手段と、
前記音声データ記憶手段に記憶された音声データを読み出す読み出し手段と、
前記判定手段により接続されたと判定された場合に、前記読み出し手段により読み出された音声データに基づいた音声出力を前記音声出力手段に指示する指示手段と、を備えることを特徴としている。
【００１９】
請求項１２に記載の発明は、音声案内装置と通信手段を介して接続可能な携帯端末装置であって、
キャラクタが音声案内する音声データを記憶する音声データ記憶手段と、
前記音声案内装置との接続時に、前記音声データ記憶手段から前記音声案内装置によって読み出された音声データに基づいた音声出力の指示を受信する受信手段と、
前記受信手段により受信された指示に基づいて音声出力を行う音声出力手段と、
を備えることを特徴としている。
【００２０】
請求項１３に記載の発明は、音声案内するキャラクタの音声データを記憶する携帯端末装置に通信手段を介して接続可能な音声案内装置であって、
前記通信手段が前記携帯端末装置に接続されたか否かを判定する判定手段と、
前記判定手段により接続されたと判定された場合に、前記音声データ記憶手段に記憶された音声データを読み出す読み出し手段と、
前記読み出し手段により読み出された音声データに基づいた音声出力を行う音声出力手段と、を備えることを特徴としている。
【００２１】
請求項１４に記載の発明は、音声案内するキャラクタの音声データを記憶する音声データ記憶手段及び音声出力手段を備えた携帯端末装置に通信手段を介して接続可能な音声案内装置であって、
前記通信手段が前記携帯端末装置に接続されたか否かを判定する判定手段と、
前記音声データ記憶手段に記憶された音声データを読み出す読み出し手段と、
前記判定手段により接続されたと判定された場合に、前記読み出し手段により読み出された音声データに基づいた音声出力を前記音声出力手段に指示する指示手段と、を備えることを特徴としている。
【００２２】
請求項１５に記載の発明は、音声案内装置に通信手段を介して接続可能なコンピュータに、
キャラクタが音声案内する音声データを記憶する音声データ記憶機能と、
前記通信手段が前記音声案内装置に接続された際に、前記音声案内装置によって読み出された前記音声データに基づいた音声出力の指示を受信する受信機能と、
前記受信機能により受信された指示に基づいて音声出力を行う音声出力機能と、
を実現させることを特徴としている。
【００２３】
請求項１６に記載の発明は、音声案内するキャラクタの音声データを記憶するキャラクタ人形に通信手段を介して接続可能なコンピュータに、
前記通信手段が前記キャラクタ人形に接続されたか否かを判定する判定機能と、
前記判定機能により接続されたと判定された場合に、前記音声データ記憶機能に記憶された音声データを読み出す読み出し機能と、
前記読み出し機能により読み出された音声データに基づいた音声出力を行う音声出力機能と、を実現させることを特徴としている。
【００２４】
請求項１７に記載の発明は、音声案内するキャラクタの音声データを記憶する音声データ記憶手段及び音声出力手段を備えたキャラクタ人形に通信手段を介して接続可能なコンピュータに、
前記通信手段が前記キャラクタ人形に接続されたか否かを判定する判定機能と、
前記音声データ記憶手段に記憶された音声データを読み出す読み出し機能と、
前記判定機能により接続されたと判定された場合に、前記読み出し機能により読み出された音声データに基づいた音声出力を前記音声出力手段に指示する指示機能と、を実現させることを特徴としている。
【００２５】
請求項１８に記載の発明は、音声案内装置に通信手段を介して接続可能なコンピュータに、
キャラクタが音声案内する音声データを記憶する音声データ記憶機能と、
前記通信手段が前記音声案内装置に接続された際に、前記音声案内装置によって読み出された前記音声データに基づいた音声出力の指示を受信する受信機能と、
前記受信機能により受信された指示に基づいて音声出力を行う音声出力機能と、を実現させることを特徴としている。
【００２６】
請求項１９に記載の発明は、音声案内するキャラクタの音声データを記憶する携帯端末装置に通信手段を介して接続可能なコンピュータに、
前記通信手段が前記携帯端末装置に接続されたか否かを判定する判定機能と、
前記判定機能により接続されたと判定された場合に、前記音声データ記憶機能に記憶された音声データを読み出す読み出し機能と、
前記読み出し機能により読み出された音声データに基づいた音声出力を行う音声出力機能と、を実現させることを特徴としている。
【００２７】
請求項２０に記載の発明は、音声案内するキャラクタの音声データを記憶する音声データ記憶手段及び音声出力手段を備えた携帯端末装置に通信手段を介して接続可能なコンピュータに、
前記通信手段が前記携帯端末装置に接続されたか否かを判定する判定機能と、
前記音声データ記憶機能に記憶された音声データを読み出す読み出し機能と、
前記判定機能により接続されたと判定された場合に、前記読み出し機能により読み出された音声データに基づいた音声出力を前記音声出力機能に指示する指示機能と、を実現させることを特徴としている。
【発明の効果】
【００２８】
本発明によれば、より多くのキャラクタボイスの再生が可能な音声案内システム等を実現することできる。
【発明を実施するための最良の形態】
【００２９】
〔第１実施形態〕
先ず、本発明の音声案内装置を適用したカーナビゲーション装置（以下、「ナビゲーション装置」と略す。）１００と、キャラクタ人形２００とを具備した音声案内システムＳの第１実施形態について図１〜図３を用いて詳細に説明する。
【００３０】
〔音声案内システムの概要〕
図１は、音声案内システムＳの概略構成の一例を示す図である。図１に示すように音声案内システムＳは、ナビゲーション装置１００とキャラクタ人形２００とが通信接続可能に構成されている。ナビゲーション装置１００は、搭載された車輌の現在位置から目的地までの走行ルートや、近隣のランドマークに関す情報や交通情報等を表示出力及び音声出力よりナビゲーションを行う。特に本実施形態におけるナビゲーション装置１００は、接続されたキャラクタ人形２００のキャラクタの音声によってナビゲーションを行う。
【００３１】
キャラクタとは、音声案内を行う人物やアニメキャラクタ、擬人化した動物等の特徴的又は個性的な口調、役柄、声色、外観等の組み合わせた特有の性格を有する対象のことをいう。また、キャラクタ人形２００は、そのキャラクタを模写した人形であり、図１に示すように、ロボットのキャラクタ人形２００Ａ、子どものキャラクタ人形２００Ｂ、パンダのキャラクタ人形２００Ｃ等がある。
【００３２】
ナビゲーション装置１００は、接続されたキャラクタ人形２００に記憶された音声データを読み出し、当該音声データに基づいた音声出力を行うことでナビゲーションを行う。例えば、キャラクタ人形２００Ａが接続された場合には、キャラクタ人形２００Ａの声として知られる声音でナビゲーションが行われ、キャラクタ人形Ｂが接続された場合には、キャラクタ人形Ｂの声として知られる声音でナビゲーションが行われ、又、キャラクタ人形２００Ｂが有名なキャラクタではない場合（キャラクタ人形製造業者のオリジナルキャラクタのような場合）、当該キャラクタ人形２００Ｂに相応する子ども声音でナビゲーションが行われる。また、場合によっては、子供の言い回しを真似た口調に変更されて、ナビゲーションが行われる。
【００３３】
〔ナビゲーション装置の構成〕
次に、図１を用いて、ナビゲーション装置１００の機能構成について説明する。図１に示すように、ナビゲーション装置１００は、制御部１、入力部２、表示部３、ナビゲーション部４、音声合成部５及び音声出力部８を備えて構成されている。
【００３４】
制御部１は、ＣＰＵやＲＯＭ及びＲＡＭ等のメモリを備え構成され、各機能部への指示や各機能部間のデータの入出力を行うことで、ナビゲーション装置１００の種々の機能を司っている。より具体的には、入力部２から入力される位置信号や押下信号に基づいてメモリに記憶されたシステムプログラムやアプリケーションプログラムを読み出し、その読み出したプログラムに従った処理を行う。そして、その処理結果に基づいて映像信号を生成して表示部３に出力し、当該映像信号に従った表示画面や動画を表示部３に表示出力させる。
【００３５】
入力部２は、タッチパネル２０及び操作キー２２を備え構成される。タッチパネル２０は、表示部３と一体的に形成され、ユーザの指先やタッチペン等により当接された位置を検出して、当該位置に応じた位置信号を生成して制御部１に出力する。操作キー２２は、決定キーやクリアキー、カーソルキー等の各種キー群を備えて構成され、ユーザにより押下されたキーに応じた押下信号を制御部１に出力する。
【００３６】
表示部３は、カラーＬＣＤ（Liquid Crystal Display）やＥＬＤ（Electronic Luminescent Display）により構成され、ナビゲーション装置１００に係る各種情報や画像等を表示する。この表示部３とタッチパネル２０とにより所謂ＧＵＩ（Graphical User Interface）が実現される。
【００３７】
ナビゲーション部４は、ＧＰＳ（Global Positioning System）受信機、ＤＶＤ（Digital Versatile Disc）再生装置、ＶＩＣＳ（Vehicle Information Communication System）受信機及び車速センサ、ナビゲーション文章データベース（以下、「ＤＢ」と略す。）等を備えて構成され、表示部３に表示させるナビゲーションの映像信号を生成すると共に、音声出力部８に音声出力させるナビゲーションの文章をテキストデータ（音声案内情報）ＴＤとして生成する。
【００３８】
ＧＰＳ受信部は、車輌の現在位置（例えば、緯度や経度）を測位する回路部であり、ＧＰＳ信号を受信して、そのＧＰＳ信号から公知の測位方法を用いて現在位置を測位する。ＤＶＤ再生部は、各種施設や道路、交差点等のランドマーク情報、地図画像等を検索可能に蓄積記憶したＤＶＤを再生する。また、ＶＩＣＳ受信部は、光ビーコン及び電波ビーコン等によって送信されている渋滞や交通規制に関する所謂ＶＩＣＳ情報を受信する回路部であり、車速センサは、ジャイロや方位センサ等によって構成され、車輌の走行速度や進行方向を検出するセンサである。ナビゲーション文章ＤＢは、音声出力する文章の基本形を検索可能に記憶したＤＢである。
【００３９】
ナビゲーション部４は、現在位置や地図情報ＤＢ、ＶＩＣＳ情報、走行速度、進行方向をナビゲーション文章ＤＢに記憶された基本形に当てはめることで表記文字列により構成される種々のテキストデータＴＤを生成し、音声合成部５に出力する。例えば、現在位置からユーザにより予め設定された目的地までの走行ルートをランドマーク情報や地図画像等から決定し、その走行ルートをナビゲーションする文章として、例えば、「次の十字路を右折して下さい」といったテキストデータＴＤを生成する。また、ＶＩＣＳ情報に基づいて「この先、渋滞があります。」というテキストデータＴＤを生成したり、走行速度に基づいて「スピードが上がっています。気を付けて下さい。」というテキストデータＴＤを生成したりする。
【００４０】
音声合成部５は、ナビゲーション部４により生成されたテキストデータＴＤを、音声出力部８に音声出力させる機能部である。音声合成部５の機能構成は、簡単には、当該テキストデータＴＤに対応する音声データを読み出して、当該音声データに基づいた音声波形信号を生成して音声出力部８に出力するが、その詳細については後述する。音声出力部８は、増幅器（アンプ）８０及びスピーカ８２を備えて構成され、音声合成部５から出力される音声波形信号を増幅後、当該信号に基づいた音声をスピーカ８２から出力する。
【００４１】
〔キャラクタ人形の機能構成〕
図２は、キャラクタ人形２００及び音声案内部５の機能構成の一例を示すブロック図である。先ず、図２を用いてキャラクタ人形２００の機能構成について説明する。図２によれば、キャラクタ人形２００は、キャラクタ音声ファイル２１０と、Ｉ／Ｆ部２６０とを備えて構成される。
【００４２】
キャラクタ音声ファイル２１０は、ＰＲＯＭ（Programmable ＲＯＭ）やＨＤＤ等の不揮発性メモリに記憶され、素片辞書データ２２０と、音片辞書データ２４０とを有して構成される。素片辞書データ２２０は、表音文字と、素片データとを対応付けて記憶したデータテーブルである。素片データとは、表音文字が表す音素を構成する素片、即ち１個の音素を構成する音声の波形１サイクル分の音声を表す音声波形を、例えば、ＰＣＭ形式にＡ／Ｄ変換することにより得られたデジタル形式の音声データある。素片データは、エントロピー符号化されて、圧縮されて記憶される。
【００４３】
音片辞書データ２４０は、音片読みデータと音片データとを対応付けて格納したデータテーブルである。音片とは、音声のうち音素１個以上を含む連続した１区間をいい、通常は単語１個分又は複数個分の区間からなるが、助詞や接続詞を含んでもよい。音片読みデータは、音片の読みを表音文字で表した一連の文字列（表音文字列）である。音片データは、予め録音した音声を、例えば、ＰＣＭ形式にＡ／Ｄ変換することにより得られたデジタル形式の音声データである。この音片データを再生することで、音片読みデータの表音文字列に対応する音片データが音声出力される。但し、実際に出力される音声の内容と、表音文字列が完全に一致している必要はない。例えば、表音文字列を「次、右折です」とし、実際に出力される音声、つまり音片データを「次んとこ、右折しとくれや〜」として登録してもよい。このようにすれば、発声するテキストデータを変えずに、音声データベースを変えるだけで、声音だけでなく、言い回しまで変化させることができる。
【００４４】
キャラクタ音声ファイル２１０の素片辞書データ２２０が記憶する素片データ、音片辞書データ２４０が記憶する音片データは、キャラクタ人形２００のキャラクタにより発話される音声を再生するための音声データある。例えば、キャラクタ人形２００Ａの音声データは、キャラクタ人形２００Ａとして知られる声音でから生成され、キャラクタ人形２００Ｂの音声データは、キャラクタ人形２００Ａとして知られる声音（例えば子どもにより発話された音声）で生成される。従って、キャラクタ音声ファイル２１０に記憶された音声データに基づいて音声出力を行うことで、キャラクタ人形２００のキャラクタに対応するキャラクタボイスが音声出力される。
【００４５】
尚、キャラクタ音声ファイル２１０は、キャラクタ人形２００の外部から読み出し及び書き換えを受け付けない機構・設定により記憶されている。その読み出し及び書き換えを受け付けない方法としては、例えば、キャラクタ人形２００専用の特殊なネジを用いて不揮発性メモリを取り出せないようにする方法、パスワードを設定しておきメモリ内のデータを外部から参照不能にする方法等が、適宜公知技術を採用可能である。これにより、音声データの改竄や流出を防ぎ、キャラクタの著作権や肖像権の侵害を防止することができる。
【００４６】
Ｉ／Ｆ部２６０は、ナビゲーション装置１００のＩ／Ｆ部６６と同一規格の通信方式により接続して、データ通信を行うための機能部であり、例えば、ＬＡＮインターフェイス、ＵＳＢ等により構成される。
【００４７】
〔音声合成部の機能構成〕
次に、図２を用いて、音声合成部５の機能構成について説明する。図２によれば、音声合成部５は、デフォルト音声ファイル５０、言語処理部５６、音片編集部５８、音片検索部６０、音響処理部６２、素片検索部６４及びＩ／Ｆ部６６を備えて構成される。
【００４８】
音声合成部５、言語処理部５６、音片編集部５８、音片検索部６０、音響処理部６２及び素片検索部６４は、何れもＣＰＵやＤＳＰ（Digital Signal Processor）等のプロセッサと、当該プロセッサにより実行される各種処理に係るプログラムを記憶するメモリとを備えて構成される。特に、音声合成部５は、図３に示すフローチャートに従った処理を実現するためのプログラムをメモリに記憶している。このプログラムは、インターネット網等を介するダウンロードや、ＣＤ−ＲＯＭ等のフレキシブルな記憶媒体等により配布される。尚、これらの機能部のプロセッサやメモリの一部又は全部を、単一のプロセッサやメモリによって実現することとしてもよい。
【００４９】
デフォルト音声ファイル５０は、ＰＲＯＭやＨＤＤ等の不揮発性メモリに記憶され、素片辞書データ５２と、音片辞書データ５４とを有して構成される。その素片辞書データ５２が記憶する素片データ、音片辞書データ５４が記憶する音片データは、例えば、アナウンサーにより発話された音声から生成される。従って、デフォルト音声ファイル５０に記憶された音声データに基づいて音声出力を行うことで、アナウンサー調のキャラクタボイスでナビゲーションが行われる。尚、素片辞書データ５２及び音片辞書データ５４それぞれのデータ構成は、上述したキャラクタ音声ファイル２１０の素片辞書データ２２０及び音片辞書データ２４０それぞれのデータ構成と同一であるため、その詳細な説明は省略する。
【００５０】
言語処理部５６は、ナビゲーション部４から入力された表記文字列のテキストデータ（音声案内情報）ＴＤに、公知の形態素解析を施すことにより、連続する複数の単語により構成されるテキストデータＴＤから個々の音片を特定し、その音片の読みを表す表音文字列に変換する。具体的には、例えば、「次の十字路を右折して下さい。」というテキストデータＴＤが入力された場合は、当該テキストデータＴＤから「次の」、「十字路を」、「右折して」、「下さい」という４つの音片を特定する。そして、それぞれの音片の読みを表す表音文字列「ツギノ」、「ジュウジロヲ」、「ウセツシテ」、「クダサイ」に変換する。
【００５１】
音片編集部５８は、言語処理部５６により変換された音片毎の表音文字列を取得し、それぞれの表音文字列に合致する音片読みデータが対応付けられている音片データを索出するように音片検索部６０に指示する。
【００５２】
音片検索部６０は、キャラクタ人形２００がＩ／Ｆ部６６に接続されているか否かを判定し、キャラクタ人形２００が接続されていないと判定した場合には、デフォルト音声ファイル５０の音片辞書データ５４を、接続されていると判定した場合には、キャラクタ音声ファイル２１０の音片辞書データ２４０を選択する。そして、その選択した音片辞書データから、表音文字列に合致する音片読みデータに対応付けられた音片データを索出し、その索出した音片データを読み出して音片編集部５８に返す。また、合致する音片読みデータが索出されなかった表音文字列を識別する欠落部分識別データを音片編集部５８に返す。
【００５３】
例えば、「ツギノ」、「ジュウジロヲ」、「ウセツシテ」、「クダサイ」という表音文字列に対する索出が指示された場合、これらの表音文字列と合致する音片読みデータの索出を行う。このとき、「ツギノ」、「ウセツシテ」及び「クダサイ」とに合致する音片読みデータが索出されたとする。この場合、音片検索部６０は、その索出された音片読みデータに対応する音片データと共に、表音文字列「ジュウジロヲ」を識別する欠落部分識別データを音片編集部５８に返す。
【００５４】
音片編集部５８は、音片検索部６０から欠落部分識別データが返された場合、その欠落部分識別データによって識別される表音文字列、即ち音片辞書データから索出されなかった表音文字列を音響処理部６２に出力する。
【００５５】
音響処理部６２は、音片編集部５８から入力された表音文字列に含まれるそれぞれの表音文字について、当該表音文字が表す音素を構成する素片の素片データを素片辞書データ５２から索出するように素片検索部６４に指示する。
【００５６】
素片検索部６４は、音片検索部６０と同様に、キャラクタ人形２００が接続されているか否かを判定し、その判定結果に応じてキャラクタ音声ファイル２１０の素片辞書データ２２０と、デフォルト音声ファイル５０の素片辞書データ５２との何れかを選択して、その選択した素片辞書データから、音響処理部６２から索出の指示が為された素片毎の素片データを索出する。
【００５７】
音片編集部５８は、欠落部分識別データで識別される表音文字列に対して、例えば、「藤崎モデル」や「ＴｏＢＩ（Tone and Break Indices）」等の公知手法に基づいた解析を行うことにより、表音文字列毎の韻律（アクセント、イントネーション、強勢、音素の時間長等）の予測を行う。そして、音片編集部５８は、その韻律を表す韻律予測データを生成して音響処理部６２に出力する。
【００５８】
音響処理部６２は、音片編集部５８から出力された韻律予測データに基づいて、索出した素片データを合成することで、実際に発話したような自然なつながりのある音声波形データを生成し、音片編集部５８に出力する。音片編集部５８は、音響処理部６２により生成された音声波形データと、音片検索部６０により索出された音片データとを互いに結合して合成音声データを生成する。
【００５９】
音片編集部５８は、合成音声データ（デジタル）をＤ／Ａ変換して音声波形信号（アナログ）を生成した後、音声出力部８に出力する。このように、テキストデータＴＤを音片毎に分割し、その音片毎の音片データを音片辞書データ５４から検索して、音片辞書データ５４に記憶されていない音片は素片に分解し、その素片毎の素片データを素片辞書データ５２から検索する。そして、検索された音片データと素片データとを合成・結合することで、テキストデータＴＤに相当する音声データを生成する。これにより、キャラクタの肉声感を表現することのできるハイブリッド型の音声合成機能（以下、「ＨＢＴＴＳ」という。）が実現される。
【００６０】
このＨＢＴＴＳは、
（１）音片データのみで音声合成を行う場合、固定の言い回しかできなくなるため、汎用性を広げるためにデータ量が膨大となる。
（２）素片データのみで音声合成を行う場合、所謂ロボットボイスとなってしまいキャラクタ特有の肉声の表現が困難である。
という（１）及び（２）の２つの問題点を解決し両立を図ったものである。従って、比較的小さなデータ容量でキャラクタボイスでのナビゲーションが可能なナビゲーション装置１００が実現される。
【００６１】
Ｉ／Ｆ部６６は、キャラクタ人形２００のＩ／Ｆ部２６０と同一規格の通信方式により電気的に接続して、データ通信を行うための機能部であり、例えば、ＬＡＮインターフェイス、ＵＳＢ等を備えて構成される。
【００６２】
〔音声案内システムの具体的な動作〕
次に、図３のフローチャートを用いて、音声案内システムＳの具体的な動作について説明する。尚、図３のフローチャートは、音声合成部５の各機能部間における処理内容を総括して示したものであり、このフローチャートに相当する一連の処理をプログラム化することとしてもよい。
【００６３】
先ず、音声合成部５の言語処理部５６がテキストデータＴＤをナビゲーション部４から取得すると（ステップＡ１）、そのテキストデータＴＤに形態素解析を施して、音片毎の表音文字列に変換する（ステップＡ３）。
【００６４】
音片編集部５８は、言語処理部５６により変換された表音文字列を音片検索部６０に出力する。音片検索部６０は、Ｉ／Ｆ部６６にキャラクタ人形２００が接続されているか否かを判定する（ステップＡ５）。音片検索部６０は、Ｉ／Ｆ部６６にキャラクタ人形２００が接続されていないと判定した場合（ステップＡ５；ＮＯ）、音片毎の表音文字列に相当する音片データ、即ち、表音文字列と合致する音片読みデータに対応付けられた音片データをデフォルト音声ファイル５０の音片辞書データ５４から索出する（ステップＡ７）。
【００６５】
そして、音片検索部６０は、索出した音片データに基づいて欠落部分識別データを生成して、当該音片データと共に音片編集部５８に返す（ステップＡ９）。音片編集部５８が、音片検索部６０から返された欠落部分識別データで示される音片の表音文字列を音響処理部６２に出力すると、音響処理部６２は、その表音文字列に含まれる音素毎の表音文字についての素片データをデフォルト音声ファイル５０の素片辞書データ５２から索出するように素片検索部６４に指示する（ステップＡ１１）。
【００６６】
そして、音響処理部６２が、素片検索部６４により索出された素片データを音片編集部５８に返すと、音片編集部５８は、その素片データから音声波形データを生成し（ステップＡ１３）、ステップＡ７において索出された音片データと当該音声波形データと互いに結合して合成音声データを生成する（ステップＡ１５）。
【００６７】
そして、音片編集部５８は、その生成した合成音声データにＤ／Ａ変換を行った音声波形信号を音声出力部８に出力して、合成音声データに基づいた音声出力を行う。これにより、キャラクタ人形２００が接続されていない場合は、アナウンサー調のデフォルト音声でのナビゲーションが行われる。
【００６８】
一方、ステップＡ５において、音片検索部６０は、Ｉ／Ｆ部６６にキャラクタ人形２００が接続されていると判定した場合（ステップＡ５；ＹＥＳ）、音片毎の表音文字列に相当する音片データをキャラクタ音声ファイル２１０の音片辞書データ５４からＩ／Ｆ部６６及び２６０を介して索出する（ステップＡ１９）。
【００６９】
そして、音片検索部６０が、欠落部分識別データを生成して当該音片データと共に音片編集部５８に返すと（ステップＡ２１）、音片編集部５８は、当該欠落部分識別データで示される音片の表音文字列を音響処理部６２に出力する。次いで、音響処理部６２は、その表音文字列に含まれる音素毎の表音文字についての素片データをキャラクタ音声ファイル２１０の素片辞書データ２２０から索出するように素片検索部６４に指示する（ステップＡ２３）。
【００７０】
音響処理部６２が、素片検索部６４により索出された素片データを音片編集部５８に返すと、音片編集部５８は、その素片データから音声波形データを生成し（ステップＡ２５）、ステップＡ７において索出された音片データ、即ちキャラクタの音片データと当該音声波形データと互いに結合して、合成音声データを生成する（ステップＡ２７）。
【００７１】
そして、音片編集部５８は、その生成した合成音声データにＤ／Ａ変換を行った音声波形信号を音声出力部８に出力して音声出力を行わせる。これにより、キャラクタ人形２００が接続されている場合は、キャラクタ人形２００のキャラクタボイスでナビゲーションが行われる。
【００７２】
以上、第１実施形態によれば、キャラクタ人形２００にそのキャラクタの音声データ（素片辞書データ及び音片辞書データ）を記憶しておく。そして、ナビゲーション装置１００は、キャラクタ人形２００が接続された場合は、そのキャラクタ人形２００内の音声データを読み出して、当該音声データに基づいて音声出力を行う。このため、ナビゲーション装置１００内にキャラクタ毎の音声データを記憶しなくとも、キャラクタボイスでのナビゲーションを行うことができ、ナビゲーション装置１００のメモリを占有する容量を節減できる。また、接続するキャラクタ人形２００のキャラクタに応じて、キャラクタボイスが変わる。従って、より多くのキャラクタボイスでの音声再生が可能な音声案内システムＳが実現される。
【００７３】
また、複数のキャラクタの音声データをナビゲーション装置１００に記憶しなくてもよいため、キャラクタの肖像権や著作権に対する対価がナビゲーション装置１００の提供価格に含まなくてもよい。ユーザは、所望のキャラクタのキャラクタ人形２００を購入すればよく、ユーザに提供する際のナビゲーション装置１００の低価格化を図ることができる。
【００７４】
〔第２実施形態〕
次に、図４〜図６を用いて第２実施形態の音声案内システムＳについて説明する。第２実施形態における音声案内システムＳは、図１に示した音声合成部５を図４の音声合成部５ａに、キャラクタ人形２００をキャラクタ人形２００ａに置き換えた構成である。尚、第１実施形態における音声合成部５及びキャラクタ人形２００と同一の構成要素には、同一の符号を付して、その詳細な説明を省略する。
【００７５】
図４によれば、キャラクタ人形２００ａは、キャラクタ音声ファイル２１０と、駆動制御データ２５０と、Ｉ／Ｆ部２６０と、駆動部２７０と、音声出力部２８０とを備えて構成される。
【００７６】
駆動部２７０は、キャラクタ人形２００ａの手や足、顔等を駆動するためのモータや、その駆動電力を供給する電池等を有して構成される。駆動部２７０は、キャラクタ人形２００ａがナビゲーション装置１００に接続された場合に、当該ナビゲーション装置１００からの駆動指示に応じてモータを駆動する。
【００７７】
駆動制御データ２５０は、駆動部２７０の駆動を制御するための制御データを記憶するデータテーブルであり、ＰＲＯＭやＨＤＤ等の不揮発性メモリに記憶される。また、駆動制御データ２５０は、例えば図５に示すデータ構成の一例のように、キーワードと、駆動内容データとを対応付けて記憶している。駆動内容データは、駆動部２７０をどのように駆動するかを表すデータであり、例えば、駆動内容データ「右手を右側に上げる」は、駆動部２７０の右手を駆動するモータを制御して、キャラクタ人形２００ａの右手を右側に上げさせることを表している。
【００７８】
音声出力部２８０は、増幅器２８２と、スピーカ２８４とを備えて構成され、音声合成部５ａから出力される音声波形信号を増幅器２８２で増幅して、スピーカ２８４から当該音声波形信号に基づいた音声出力を行う。
【００７９】
また、図４によれば音声合成部５ａは、図２に示した音片検索部６０を音片検索部６０ａに置き換えた構成であるため、図２の音声合成部５と同一の構成要素には同一の符号を付してその説明を省略する。
【００８０】
音片検索部６０ａは、第１実施形態と同様に、音片編集部５８から出力された音片毎の表音文字列に相当する音片データを、デフォルト音声ファイル５０の音片辞書データ５４又はキャラクタ音声ファイル２１０ａの音片辞書データ２４０から索出するが、第２実施形態においては、キャラクタ人形２００ａが接続されていると判定した場合は、次のような処理を行う。
【００８１】
先ず、駆動制御データ２５０にアクセスし、この駆動制御データ２５０内のキーワードが音片編集部５８から出力された表音文字列内に含まれているか否かを判別する。そして、キーワードが含まれていた場合は、当該キーワードに対応する駆動内容データを読み出して駆動制御データ２５０を読み出し、当該駆動内容データに基づいた駆動指示をキャラクタ人形２００ａの駆動部２７０に対して送信する。
【００８２】
例えば、音片編集部５８から出力された表音文字列に「ウセツ」が含まれていた場合は、キーワード「ウセツ」に対応する駆動内容データを読み出して、キャラクタ人形２００ａの右手を右側に上げるための駆動指示を駆動部２７０に対して送信する。これにより、ナビゲーション装置１００側からキャラクタ人形２００ａの駆動を制御することができる。
【００８３】
次に、図６のフローチャートを用いて、第２実施形態における音声案内システムＳの具体的な動作について説明する。尚、図３に示したフローチャートと同一の処理ステップには、同一のステップ番号を付してその説明を省略する。
【００８４】
先ず、ナビゲーション装置１００の音声合成部５ａは、キャラクタ人形２００ａが接続されていないと判定した場合は（ステップＡ５；ＹＥＳ）、第１実施形態と同様にステップＡ１〜Ａ１７の処理を行ってデフォルトの音声出力を行う。
【００８５】
これに対し、キャラクタ人形２００ａが接続されていると判定した場合は（ステップＡ５；ＮＯ）、音片検索部６０ａは、音片毎の表音文字列に相当する音片データをキャラクタ音声ファイル２１０の音片辞書データ２４０から索出すると共に、表音文字列内に含まれたキーワードに対応する駆動内容データの索出を駆動制御データ２５０から行う（ステップＡ１８）。
【００８６】
そして、第１実施形態と同様に、素片辞書データ２２０から素片データを索出して、音声波形データを生成した後、音片データと音声波形データとを結合して合成音声データを生成する（ステップＡ２１〜Ａ２７）。
【００８７】
音片検索部６０ａは、索出した駆動内容データに基づいた駆動指示をＩ／Ｆ部６６及び２６０を介してキャラクタ人形２００ａに送信し（ステップＡ３１）、続いて、合成音声データをキャラクタ人形２００ａに送信する（ステップＡ３３）。
【００８８】
一方、キャラクタ人形２００ａの駆動部２７０は、音声合成部５ａから受信した駆動指示に従った駆動を行い（ステップＢ１）、音声出力部２８０は、受信した合成音声データに基づいた音声出力を行う（ステップＢ３）。
【００８９】
例えば、ナビゲーション部４が「右折して下さい」というテキストデータＴＤを出力したとすると、このテキストデータＴＤが「ウセツシテ」と「クダサイ」の表音文字列に変換される。そして、このテキストデータＴＤを読み上げる合成音声データが音片編集部５８により生成される。また、「ウセツシテ」の表音文字列内に含まれる「ウセツ」をキーワードとして対応付けられた駆動内容データ「右手を右側に上げる」が読み出される。これにより、キャラクタ人形２００ａは、「右折して下さい」と音声出力すると共に、右手を右側に上げるように駆動する。
【００９０】
以上、第２実施形態によれば、キャラクタ人形２００ａがナビゲーション装置１００に接続された場合、ナビゲーションの音声をキャラクタ人形２００ａのスピーカ２８４から行うと共に、この音声出力と共にキャラクタ人形２００ａの手足が駆動する。このように、キャラクタ人形２００ａが身振り手振りでナビゲーションしながら、音声案内を行うため、あたかもキャラクタ人形２００ａ自身がナビゲーションしているような臨場感をユーザに与えることができる。
【００９１】
尚、第１及び第２実施形態において、音片データ及び素片データの音声合成をナビゲーション装置１００側の音声合成部５，５ａにおいて行うこととしたが、キャラクタ人形２００，２００ａ側で行うことととしてもよい。この場合は、キャラクタ人形２００，２００ａに音片編集部、音片検索部、音響処理部、素片検索部及び音声出力部を設ける。そして、音声合成部５の言語処理部５６が、テキストデータＴＤの表音文字列をキャラクタ人形２００，２００ａ側の音片編集部にＩ／Ｆ部６６及び２６０を介して出力する。このとき、キャラクタ人形２００，２００ａ側で音声合成を行って合成音声データに基づいた音声出力を行う。これにより、ナビゲーション装置１００側の処理負荷を低減させることができる。
【００９２】
〔第３実施形態〕
次に、図７〜図９を用いて第３実施形態の音声案内システムＳｂについて説明する。図７に音声案内システムＳｂの概略構成の一例を示す。図７によれば、音声案内システムＳｂは、ナビゲーション装置１００ｂと、携帯端末装置（以下、「携帯端末」と略す。）３００とが通信接続可能に構成される。ナビゲーション装置１００ｂは、図１に示した音声合成部５を図８に示した音声合成部５ｂに置き換えた構成であるため、図１のナビゲーション装置１００と同一の構成要素には同一の符号を付してその説明を省略する。
【００９３】
携帯端末３００は、無線基地局４００と通信することにより、例えば、公衆回線網（インターネット網）上のサーバからキャラクタ音声ファイル２１０をダウンロードすることができる。ナビゲーション装置１００の制御部１は、複数のキャラクタ毎のダウンロード先（ＵＲＬ）をエンコードした例えば、ＱＲコード等の２次元コードを表示部３に表示させる。ユーザが、この２次元コードをカメラ部３５０により撮影すると、携帯端末３００が２次元コードのダウンロード先に接続して、キャラクタ音声ファイル２１０をダウンロードする。ユーザは、所望のキャラクタのキャラクタ音声ファイル２１０をダウンロードすることで、ナビゲーション装置１００ｂのナビゲーションが当該キャラクタでの音声で行われる。
【００９４】
図８は、音声合成部５ｂ及び携帯端末３００それぞれの機能構成の一例を示すブロック図である。音声合成部５ｂは、図２に示した音声合成部５の音片検索部６０及び素片検索部６４と、音片検索部６０ｂ及び素片検索部６４ｂに置き換えて構成であるため、当該音声合成部５と同一の構成要素には同一の符号を付してその説明を省略する。
【００９５】
第３実施形態において、音片検索部６０ｂは、Ｉ／Ｆ部６６を介して携帯端末３００が接続されたか否かを判定する。そして、携帯端末３００が接続されていると判定した場合は、音片編集部５８から出力された音片毎の表音文字列を、携帯端末３００に送信することで、携帯端末３００側に音片データの索出を行わせる。そして、携帯端末３００により索出された音片データに基づいて欠落部分識別データを生成して音片編集部５８に返す。音片編集部５８が、第１実施形態と同様に、欠落部分識別データで示される表音文字列を音響処理部６２に出力すると、音響処理部６２は、この表音文字列内の表音文字毎の素片データを素片検索部６４ｂに索出させる。
【００９６】
第３実施形態における素片検索部６４ｂは、携帯端末３００が接続されているか否かを判定して、接続されていると判定した場合は、音響処理部６２から出力された表音文字列を携帯端末３００に送信することで、当該携帯端末３００側に表音文字列の素片データの索出を行わせる。そして、携帯端末３００により索出された素片データを音響処理部６２に出力する。携帯端末３００が接続されていないと判定した場合には、第１実施形態と同様にデフォルト音声ファイル５０の素片辞書データ５２から素片データを索出する。このため、携帯端末３００が接続されている場合は、携帯端末３００にダウンロードされたキャラクタ音声ファイル２１０に基づいたキャラクタの音声でナビゲーションが行われることとなる。
【００９７】
次に、携帯端末３００の機能構成について説明する。図８によれば、携帯端末３００は、制御部３１０、入力部３２０、表示部３３０、通信部３４０、カメラ部３５０、記憶部３６０及びＩ／Ｆ部３９０を備えて構成される。
【００９８】
制御部３１０は、ＣＰＵやＲＯＭ及びＲＡＭ等のメモリを備え構成され、各機能部への指示や各機能部間のデータの入出力を行うことで、携帯端末３００の種々の機能を司っている。より具体的には、入力部３２０から入力される操作信号に基づいてメモリに記憶されたシステムプログラムやアプリケーションプログラムを読み出し、その読み出したプログラムに従った処理を行う。そして、その処理結果に基づいて映像信号を生成して表示部３３０に出力し、当該映像信号に従った表示画面や動画を表示部３３０に表示出力させる。
【００９９】
入力部３２０は、カーソルキー、決定キー、クリアキー、メニュキー、数字キー等の操作キーを備え構成され、ユーザにより押下されたキーに応じた操作信号を制御部３１０に出力する。表示部３３０は、カラーＬＣＤやＥＬＤにより構成され、制御部３１０から出力される映像信号に従って、携帯端末３００に係る各種情報や画像等を表示する。
【０１００】
通信部３４０は、制御部３１０の指示に基づき、アンテナＡＮＴを介して無線基地局４００との間でデータ通信を行う。より具体的には、無線基地局４００と接続して、制御部１により取得されたダウンロード先のサーバからキャラクタ音声ファイル２１０のデータ通信を開始する。そして、無線基地局４００から送信される信号をアンテナＡＮＴで受信し、当該信号を増幅及び復調することでキャラクタ音声ファイル２１０を取得して制御部３１０に出力する。通信部３４０と無線基地局４００間で無線通信方式は、ＰＤＣ（Personal Digital Cellular）方式、ＣＤＭＡ（Code Division Multiple Access）方式、ＧＳＭ（Global System for Mobile communication）方式等の各種公知技術の何れを利用することとしてもよい。また、通信部３４０は、有線通信によりサーバからキャラクタ音声ファイル２１０をダウンロードすることとしてもよい。
【０１０１】
カメラ部３５０は、ＣＣＤ（撮像素子）及びＡ／Ｄ変換部等を備えて構成され、ＣＣＤにより光電変換した電気信号をＡ／Ｄ変換することで撮影画像を生成する。制御部１は、カメラ部３５０により生成された撮影画像から２次元コードを抽出し、当該２次元コードをデコード（解読）することで、キャラクタ音声ファイル２１０のダウンロード先を取得する。
【０１０２】
記憶部３６０は、フラッシュメモリやＨＤＤ等の不揮発性メモリにより構成され、図８に示すようにキャラクタ音声ファイル２１０を記憶している。キャラク音声データ２１０は、ダウンロードの都度更新される。Ｉ／Ｆ部３８０は、ナビゲーション装置１００ｂのＩ／Ｆ部６６と同一規格の通信方式により電気的に接続して、データ通信を行うための機能部であり、例えば、ＬＡＮインターフェイス、ＵＳＢ等を備えて構成される。
【０１０３】
次に、図９のフローチャートを用いて、第３実施形態における音声案内システムＳｂの具体的な動作について説明する。尚、図３に示したフローチャートと同一の処理ステップには、同一のステップ番号を付してその説明を省略する。
【０１０４】
先ず、ナビゲーション装置１００の制御部１は、表示部３にダウンロード先の２次元コードを表示させる（ステップＣ１）。そして、テキストデータＴＤの取得、表音文字列への変換を行った後（ステップＡ１〜Ａ３）、携帯端末３００が接続されているか否かを判定する（ステップＣ５）。そして、携帯端末３００が接続されていないと判定した場合は（ステップＣ５；ＹＥＳ）、第１実施形態と同様にステップＡ１〜Ａ１７の処理を行ってデフォルトの音声出力を行う。
【０１０５】
一方、携帯端末３００が、ユーザの入力部３２０の操作に従ってカメラ部３５０を駆動し、ナビゲーション装置１００ｂの表示部３に表示された２次元コードを撮影すると（ステップＤ１）、制御部３１０は、撮影画像のデコードにより２次元コードの解読を行う（ステップＤ３）。そして、解読した２次元コードで示されるダウンロード先に通信部３４０を介して接続して、キャラクタ音声ファイル２１０をダウンロードし、記憶部３６０に記憶する（ステップＤ５）。
【０１０６】
ステップＣ５において、携帯端末３００が接続されていると判定した場合（ステップＣ５；ＹＥＳ）、音片検索部６０ｂは、音片毎の表音文字列をＩ／Ｆ部６６及び３８０を介して携帯端末３００へ送信する（ステップＣ１９）。
【０１０７】
このとき、携帯端末３００の制御部３１０は、ナビゲーション装置１００ｂの接続を検出して、Ｉ／Ｆ部６６及び３８０を介して表音文字列を受信したか否かを判定する（ステップＤ７）。そして、表音文字列を受信したと判定した場合は（ステップＤ７；ＹＥＳ）、その表文字列に相当する音片データを音片辞書データ２４０から索出して、ナビゲーション装置１００ｂに送信する（ステップＤ９）。
【０１０８】
ナビゲーション装置１００ｂにおいて、携帯端末３００から送信された音片データを受信して（ステップＣ２１）、当該音片データに基づいて欠落部分識別データを生成する（ステップＣ２３）。そして、音片編集部５８が、欠落部分識別データで識別される音片の表音文字列を音響処理部６２に出力すると、音響処理部６２は、表音文字列を構成する音素毎の表音文字の素片データを素片検索部６４ｂに索出させる。素片検索部６４ｂは、素片データの索出のために、Ｉ／Ｆ部６６及び３８０を介して表音文字を携帯端末３００に送信する（ステップＣ２５）。
【０１０９】
このとき、ナビゲーション装置１００ｂから音素毎の表音文字を受信したか否かを判定して、受信した場合には（ステップＤ１１；ＹＥＳ）、その表音文字の素片データを素片辞書データ２２０から索出してナビゲーション装置１００ｂに送信する（ステップＤ１３）。ナビゲーション装置１００ｂにおいて、素片検索部６４ｂは、携帯端末３００から送信された素片データを受信し、当該素片データを音響処理部６２に出力する（ステップＣ２７）。
【０１１０】
音響処理部６２が、その素片データを韻律予測データに基づいて合成して音声波形データを生成し音片編集部５８に出力すると（ステップＣ２９）、音片編集部５８は、音声波形データと索出した音片データとを互いに結合して合成音声データを生成する（ステップＣ３１）。そして、生成した合成音声データ、即ち、キャラクタ音声ファイル２１０から生成した音声データをＤ／Ａ変換した音声波形信号を音声出力部８に出力することで、キャラクタボイスでの音声出力を行う（ステップＣ３３）。
【０１１１】
以上、第３実施形態によれば、携帯端末３００においてキャラクタ音声ファイル２１０をダウンロードして記憶するため、ナビゲーション装置１００ｂに携帯端末３００が接続された場合には、そのキャラクタ音声ファイル２１０に基づいた音声出力を行う。このように、ダウロードによってキャラクタ音声ファイル２１０は更新可能であるため、ユーザは、所望のキャラクタの音声データを入れ替えながら、様々なキャラクタボイスでナビゲーションを楽しむことができる。従って、より多くのキャラクタボイスの再生が可能な音声案内システムＳｂを実現できる。
【０１１２】
〔第４実施形態〕
次に、図１０及び１１を用いて第４実施形態の音声案内システムＳｂについて説明する。第４実施形態における音声案内システムＳｂは、図７に示した音声合成部５ｂを図１０の音声合成部５ｃに、携帯端末３００を携帯端末３００ｃに置き換えた構成である。尚、第３実施形態における音声合成部５ｂ及び携帯端末３００と同一の構成要素には、同一の符号を付して、その詳細な説明を省略する。
【０１１３】
図１０によれば、ナビゲーション装置１００は、デフォルト音声ファイル５０、言語処理部５６、音片編集部５８、音片検索部６０ｃ、音響処理部６２、素片検索部６４ｂ及び、Ｉ／Ｆ部６６を備えて構成される。
【０１１４】
音片検索部６０ｃは、第３実施形態と同様の方法により合成音声データを生成するが、携帯端末３００ｃがＩ／Ｆ部６６に接続されている場合は、その合成音声データを携帯端末３００ｃに送信して、携帯端末３００ｃ側の音声出力部３９２に音声出力させる。
【０１１５】
また、携帯端末３００ｃは、制御部３１０、入力部３２０、表示部３３０、通信部３４０、カメラ部３５０、記憶部３６０、Ｉ／Ｆ部３９０及び音声出力部３９２を備えて構成される。
【０１１６】
第４実施形態における記憶部３６０は、素片辞書データ２２０及び音片辞書データ２４０をキャラクタ音声ファイル２１０と、キャラクタ動画データ３８０とを有するキャラクタファイル３７０を記憶する。このキャラクタファイル３７０は、ダウンロードの都度更新される。キャラクタ動画データ３８０は、キャラクタ音声ファイル２１０のキャラクタと同一のキャラクタの動画をＭＰＥＧ（Moving Picture Experts Group）形式に変換した動画データを記憶したデータテーブルである。そのデータ構成は、第２実施形態の駆動制御データ２５０のデータ構成のように、キーワードと動画データとを対応付けて記憶する。例えば、キーワード「ウセツ」には、キャラクタが「右手を右側に上げる」動作を行う動画を表示するための動画データが対応付けられている。
【０１１７】
制御部３１０は、キャラクタ動画データ３８０内のキーワードが音声合成部５ｃの音片検索部６０ｃから送信された表音文字列内に含まれているか否かを判別する。そして、キーワードが含まれていた場合は、当該キーワードに対応する動画データを読み出す。そして、その動画データに基づいた動画を表示部３３０に表示させる。例えば、音片検索部６０ｃから送信された表音文字列に「ウセツ」が含まれていた場合は、キーワード「ウセツ」に対応する動画データを読み出して、キャラクタが右手を右側に上げる動画を表示部３３０に表示させる。
【０１１８】
音声出力部３９２は、増幅器３９４と、スピーカ３９６とを備えて構成され、ナビゲーション装置１００ｃから送信される音声波形信号を増幅器３９４により増幅して、スピーカ３９６から当該音声波形信号に基づいた音声出力を行う。
【０１１９】
次に、図１１のフローチャートを用いて、第４実施形態における音声案内システムＳｂの具体的な動作について説明する。尚、図９に示したフローチャートと同一の処理ステップには、同一のステップ番号を付してその説明を省略する。
【０１２０】
先ず、ナビゲーション装置１００の制御部１は、第３実施形態と同様に、ダウンロード先のコード表示、テキストデータＴＤの取得、表音文字列への変換を行った後（ステップＣ１〜Ａ３）、携帯端末３００が接続されているか否かを判定し（ステップＣ５）、その判定結果に応じた一連の処理を行う。
【０１２１】
携帯端末３００が接続されていない場合は、ステップＣ１９〜Ｃ３１の処理工程を行うことで、合成音声データを生成し、当該合成音声データをＩ／Ｆ部６６及び３９０を介して携帯端末３００ｃに送信する（ステップＣ３５）。
【０１２２】
一方、携帯端末３００側でも第３実施形態と同様に、コード撮影及びコード解読を行う（ステップＤ１〜Ｄ３）。そして、解読した２次元コードで示されるダウンロード先に、通信部３４０を介して接続してキャラクタファイル３７０をダウンロードする（ステップＤ６）。
【０１２３】
次いで、制御部３１０は、ナビゲーション装置１００ｂの接続を検出して、受信した表音文字列及び、音素毎の表音文字に相当する音片データ及び素片データをキャラクタ音声ファイル２１０内から索出して、ナビゲーション装置１００ｃに送信する（ステップＤ７〜Ｄ１３）。
【０１２４】
そして、ステップＤ９において受信した表音文字列に含まれたキーワードに対応する動画データをキャラクタ動画データ３８０から索出して（ステップＤ１５）、当該動画データに基づいた動画を表示部３３０に表示させる（ステップＤ１７）。また、制御部３１０は、ナビゲーション装置１００ｃから受信した合成音声データに基づいた音声出力を行う（ステップＤ１９）。このため、例えば、「右折して下さい」というテキストデータＴＤであった場合、このテキストデータＴＤをキャラクタが読み上げる音声が出力されると共に、右手を右側に上げるキャラクタの動画表示される。
【０１２５】
以上、第４実施形態によれば、携帯端末３００ｃを音声合成部５ｃに接続した場合、携帯端末３００ｃにおいて記憶しているキャラクタ音声ファイル２１０に基づいて音声が携帯端末３００ｃ側から音声出力すると共に、キャラクタ動画データ３８０に基づいた動画を表示する。このため、様々なキャラクタの音声や動画でのナビゲーションをユーザに提供することができ、音声案内システムＳｂの付加価値を高めることができる。
【０１２６】
尚、第３及び第４実施形態において適用した本発明の携帯端末装置は、携帯電話機やＰＤＡ（Personal Digital Assistant）、携帯型ゲーム機、ノートパソコン等に適宜適用可能である。
【０１２７】
また、上述した実施形態において、ナビゲーション装置とキャラクタ人形、ナビゲーション装置と携帯端末を有線のＩ／Ｆ部を介して有線接続することとしたが、アンテナ、送信回路及び受信回路等を備えて無線通信を行うこととしてもよい。この場合の無線通信方式は、例えば、赤外線やＢｌｕｅｔｏｏｔｈ（登録商標）等の通信方式を適宜採用して、ナビゲーション装置を中心として所定範内（例えば、半径１ｍ内）にキャラクタ人形及び携帯端末が入ったことを無線通信により検出して、その検出後にキャラクタ音声ファイルのデータ通信を行う。
【０１２８】
また、キャラクタ人形側、携帯端末側でキャラクタ音声ファイルをＨＤＤ等の不揮発性メモリに記憶することとしたが、次のようにしてもよい。無線ＩＣタグ（ＲＦＩＤ（Radio Frequency ID））をキャラクタ人形及び携帯端末に設け、キャラクタ音声ファイルを記憶しておく。また、ナビゲーション装置に、ＩＣリーダを設けて駆動電力である電磁波（電力波）を送信する。無線ＩＣタグが、ＩＣリーダから電磁波を受信し、電磁誘導によって駆動電力を生成することで、当該無線ＩＣタグに記憶したキャラクタ音声ファイルのナビゲーション装置との間のデータ通信が可能となる。このように、キャラクタ人形及び携帯端末と、ナビゲーション装置との間の通信接続に無線通信を採用することで、ユーザは、わざわざケーブルをナビゲーション装置に接続する煩雑な操作を行わなくてもよくなる。
【０１２９】
また、キャラクタ人形及び携帯端末に所謂キーレスエントリ機能を設けることとしてもよい。即ち、車輌のドアロックの開閉を行うロック開閉機構と無線通信（電波や赤外線）するキーレスエントリモジュールをキャラクタ人形及び携帯端末に設ける。そして、キーレスエントリモジュールとロック開閉機構との距離が所定の距離（例えば、５ｍ）未満である場合に、ロック開閉機構を制御してドアロックを解錠するように暗号化通信を行う。これにより、ユーザがキャラクタ人形や携帯端末を持ち運ぶことで、車輌のドアロックを開閉することができる。
【０１３０】
また、本実施形態において音声案内装置をナビゲーション装置に適用することとしたが、例えば、目的地までの道順を音声案内する携帯端末装置、各種電化製品の操作方法の説明・アドバイスを音声により行う操作補助装置等に適用することとしてもよい。
【図面の簡単な説明】
【０１３１】
【図１】第１実施形態における音声案内システムの概略構成の一例を示す図。
【図２】第１実施形態における音声合成部及びキャラクタ人形の機能構成の一例を示すブロック図。
【図３】第１実施形態における音声案内システムの動作を説明するためのフローチャート。
【図４】第２実施形態における音声合成部及びキャラクタ人形の機能構成の一例を示すブロック図。
【図５】駆動制御データのデータ構成の一例を示す図。
【図６】第２実施形態における音声案内システムの動作を説明するためのフローチャート。
【図７】第３実施形態における音声案内システムの概略構成の一例を示す図。
【図８】第３実施形態における音声合成部及び携帯端末装置の機能構成の一例を示すブロック図。
【図９】第３実施形態における音声案内システムの動作を説明するためのフローチャート。
【図１０】第４実施形態における音声合成部及び携帯端末装置の機能構成の一例を示すブロック図。
【図１１】第４実施形態における音声案内システムの動作を説明するためのフローチャート。
【符号の説明】
【０１３２】
Ｓ音声案内システム
１００ナビゲーション装置
１制御部
２入力部
３表示部
４ナビゲーション部
８音声出力部
５音声合成部
５０デフォルト音声ファイル
５２素片辞書データ
５４音片辞書データ
５６言語処理部
５８音片編集部
６０音片検索部
６２音響処理部
６４素片検索部
６６Ｉ／Ｆ部
２００キャラクタ人形
２１０キャラクタ音声ファイル
２２０素片辞書データ
２４０音片辞書データ
２５０駆動制御データ
２６０Ｉ／Ｆ部
２７０駆動部
２８０音声出力部
３００携帯端末装置
３１０制御部
３２０入力部
３３０表示部
３４０通信部
３５０カメラ部
３６０記憶部
３７０キャラクタファイル
３８０キャラクタ動画データ
３９２音声出力部

【特許請求の範囲】
【請求項１】
第１の通信手段を備えるキャラクタ人形と、前記第１の通信手段と接続可能な第２の通信手段を備える音声案内装置とを具備する音声案内システムにおいて、
前記キャラクタ人形は、
キャラクタが音声案内する音声データを記憶する音声データ記憶手段を備え、
前記音声案内装置は、
前記第２の通信手段が前記第１の通信手段に接続されたか否かを判定する判定手段と、
前記音声データ記憶手段に記憶された音声データを読み出す読み出し手段と、
前記判定手段により接続されたと判定された場合に、前記読み出し手段により読み出された音声データに基づいた音声出力を行う音声出力手段と、
を備えることを特徴とする音声案内システム。
【請求項２】
第１の通信手段を備えるキャラクタ人形と、前記第１の通信手段と接続可能な第２の通信手段を備える音声案内装置とを具備する音声案内システムにおいて、
前記キャラクタ人形は、
当該キャラクタ人形のキャラクタが音声案内する音声データを記憶する音声データ記憶手段と、
前記音声案内装置からの指示に基づいて音声出力する音声出力手段と、
を備え、
前記音声案内装置は、
前記第２の通信手段が前記第１の通信手段に接続されたか否かを判定する判定手段と、
前記音声データ記憶手段に記憶された音声データを読み出す読み出し手段と、
前記判定手段により接続されたと判定された場合に、前記読み出し手段により読み出された音声データに基づいた音声出力を前記音声出力手段に指示する指示手段と、
を備えることを特徴とする音声案内システム。
【請求項３】
前記キャラクタ人形は、
当該キャラクタ人形を駆動する駆動手段と、
前記駆動手段の駆動を制御する駆動データを記憶する駆動データ記憶手段と、
を更に備え、
前記音声案内装置は、
音声案内に応じた駆動データを前記駆動データ記憶手段から読み出す駆動データ読み出し手段と、
前記駆動データ読み出し手段により読み出された駆動データに基づいた駆動制御を前記駆動手段に指示する駆動指示手段と、
を更に備えることを特徴とする請求項１又は２に記載の音声案内システム。
【請求項４】
第１の通信手段を備える携帯端末装置と、前記第１の通信手段と接続可能な第２の通信手段を備える音声案内装置とを具備する音声案内システムであって、
前記携帯端末装置は、
キャラクタが音声案内する音声データを記憶する音声データ記憶手段を備え、
前記音声案内装置は、
前記第２の通信手段が前記第１の通信手段に接続されたか否かを判定する判定手段と、
前記音声データ記憶手段に記憶された音声データを読み出す読み出し手段と、
前記判定手段により接続されたと判定された場合に、前記読み出し手段により読み出された音声データに基づいた音声出力を行う音声出力手段と、
を備えることを特徴とする音声案内システム。
【請求項５】
第１の通信手段を備える携帯端末装置と、前記第１の通信手段と接続可能な第２の通信手段を備える音声案内装置とを具備する音声案内システムであって、
前記携帯端末装置は、
キャラクタが音声案内する音声データを記憶する音声データ記憶手段と、
前記音声案内装置からの指示に基づいて音声出力する音声出力手段と、
を備え、
前記音声案内装置は、
前記第２の通信手段が前記第１の通信手段に接続されたか否かを判定する判定手段と、
前記音声データ記憶手段に記憶された音声データを読み出す読み出し手段と、
前記判定手段により接続されたと判定された場合に、前記読み出し手段により読み出された音声データに基づいた音声出力を前記音声出力手段に指示する指示手段と、
を備えることを特徴とする音声案内システム。
【請求項６】
前記携帯端末装置は、
表示手段と、
キャラクタ画像を表示するための画像データを記憶する画像データ記憶手段と、
を更に備え、
前記音声案内装置は、
音声案内に応じた画像データを前記画像データ記憶手段から読み出す画像データ読み出し手段と、
前記画像データ読み出し手段により読み出された画像データに基づいたキャラクタ画像の表示を前記表示手段に指示する表示指示手段と、
を更に備えることを特徴とする請求項４又は５に記載の音声案内システム。
【請求項７】
前記携帯端末装置は、
公衆回線網上のサーバから前記キャラクタの音声データをダウンロードするダウンロード手段と、
前記ダウンロード手段によりダウンロードされた音声データを前記音声データ記憶手段に記憶更新させる記憶更新手段と、
を更に備えることを特徴とする請求項４〜６の何れか一項に記載の音声案内システム。
【請求項８】
車輌に搭載される車載用の音声案内システムであって、
前記車輌のナビゲーションを行うナビゲーション手段を更に備え、
前記音声データ記憶手段は、前記ナビゲーション手段によるナビゲーションの音声データを記憶することを特徴とする請求項１〜７の何れか一項に記載の音声案内システム。
【請求項９】
音声案内装置に通信手段を介して接続可能なキャラクタ人形であって、
キャラクタが音声案内する音声データを記憶する音声データ記憶手段と、
前記通信手段が前記音声案内装置に接続された際に、前記音声データ記憶手段から前記音声案内装置によって読み出された音声データに基づいた音声出力の指示を受信する受信手段と、
前記受信手段により受信された指示に基づいて音声出力を行う音声出力手段と、
を備えることを特徴とするキャラクタ人形。
【請求項１０】
音声案内するキャラクタの音声データを記憶するキャラクタ人形に通信手段を介して接続可能な音声案内装置であって、
前記通信手段が前記キャラクタ人形に接続されたか否かを判定する判定手段と、
前記判定手段により接続されたと判定された場合に、前記音声データ記憶手段に記憶された音声データを読み出す読み出し手段と、
前記読み出し手段により読み出された音声データに基づいた音声出力を行う音声出力手段と、
を備えることを特徴とする音声案内装置。
【請求項１１】
音声案内するキャラクタの音声データを記憶する音声データ記憶手段及び音声出力手段を備えたキャラクタ人形に通信手段を介して接続可能な音声案内装置であって、
前記通信手段が前記キャラクタ人形に接続されたか否かを判定する判定手段と、
前記音声データ記憶手段に記憶された音声データを読み出す読み出し手段と、
前記判定手段により接続されたと判定された場合に、前記読み出し手段により読み出された音声データに基づいた音声出力を前記音声出力手段に指示する指示手段と、
を備えることを特徴とする音声案内装置。
【請求項１２】
音声案内装置に通信手段を介して接続可能な携帯端末装置であって、
キャラクタが音声案内する音声データを記憶する音声データ記憶手段と、
前記通信手段に前記音声案内装置が接続された際に、前記音声データ記憶手段から前記音声案内装置によって読み出された音声データに基づいた音声出力の指示を受信する受信手段と、
前記受信手段により受信された指示に基づいて音声出力を行う音声出力手段と、
を備えることを特徴とする携帯端末装置。
【請求項１３】
音声案内するキャラクタの音声データを記憶する携帯端末装置に通信手段を介して接続可能な音声案内装置であって、
前記通信手段が前記携帯端末装置に接続されたか否かを判定する判定手段と、
前記判定手段により接続されたと判定された場合に、前記音声データ記憶手段に記憶された音声データを読み出す読み出し手段と、
前記読み出し手段により読み出された音声データに基づいた音声出力を行う音声出力手段と、
を備えることを特徴とする音声案内装置。
【請求項１４】
音声案内するキャラクタの音声データを記憶する音声データ記憶手段及び音声出力手段を備えた携帯端末装置に通信手段を介して接続可能な音声案内装置であって、
前記通信手段が前記携帯端末装置と接続されたか否かを判定する判定手段と、
前記音声データ記憶手段に記憶された音声データを読み出す読み出し手段と、
前記判定手段により接続されたと判定された場合に、
前記読み出し手段により読み出された音声データに基づいた音声出力を前記音声出力手段に指示する指示手段と、
を備えることを特徴とする音声案内装置。
【請求項１５】
音声案内装置に通信手段を介して接続可能なコンピュータに、
キャラクタが音声案内する音声データを記憶する音声データ記憶機能と、
前記通信手段が前記音声案内装置に接続された際に、前記音声案内装置によって読み出された前記音声データに基づいた音声出力の指示を受信する受信機能と、
前記受信機能により受信された指示に基づいて音声出力を行う音声出力機能と、
を実現させるためのプログラム。
【請求項１６】
音声案内するキャラクタの音声データを記憶するキャラクタ人形に通信手段を介して接続可能なコンピュータに、
前記通信手段が前記キャラクタ人形に接続されたか否かを判定する判定機能と、
前記判定機能により接続されたと判定された場合に、前記音声データ記憶機能に記憶された音声データを読み出す読み出し機能と、
前記読み出し機能により読み出された音声データに基づいた音声出力を行う音声出力機能と、
を実現させるためのプログラム。
【請求項１７】
音声案内するキャラクタの音声データを記憶する音声データ記憶手段及び音声出力手段を備えたキャラクタ人形に通信手段を介して接続可能なコンピュータに、
前記通信手段が前記キャラクタ人形に接続されたか否かを判定する判定機能と、
前記音声データ記憶手段に記憶された音声データを読み出す読み出し機能と、
前記判定機能により接続されたと判定された場合に、前記読み出し機能により読み出された音声データに基づいた音声出力を前記音声出力手段に指示する指示機能と、
を実現させるためのプログラム。
【請求項１８】
音声案内装置に通信手段を介して接続可能なコンピュータに、
キャラクタが音声案内する音声データを記憶する音声データ記憶機能と、
前記通信手段が前記音声案内装置に接続された際に、前記音声案内装置によって読み出された前記音声データに基づいた音声出力の指示を受信する受信機能と、
前記受信機能により受信された指示に基づいて音声出力を行う音声出力機能と、
を実現させるためのプログラム。
【請求項１９】
音声案内するキャラクタの音声データを記憶する携帯端末装置に通信手段を介して接続可能なコンピュータに、
前記通信手段が前記携帯端末装置に接続されたか否かを判定する判定機能と、
前記判定機能により接続されたと判定された場合に、前記音声データ記憶機能に記憶された音声データを読み出す読み出し機能と、
前記読み出し機能により読み出された音声データに基づいた音声出力を行う音声出力機能と、
を実現させるためのプログラム。
【請求項２０】
音声案内するキャラクタの音声データを記憶する音声データ記憶手段及び音声出力手段を備えた携帯端末装置に通信手段を介して接続可能なコンピュータに、
前記通信手段が前記携帯端末装置に接続されたか否かを判定する判定機能と、
前記音声データ記憶機能に記憶された音声データを読み出す読み出し機能と、
前記判定機能により接続されたと判定された場合に、前記読み出し機能により読み出された音声データに基づいた音声出力を前記音声出力機能に指示する指示機能と、
を実現させるためのプログラム。

【図１】