説明

ディジタルオーディオファイル検索方法および装置

【課題】携帯ディジタルオーディオプレーヤ中の各オーディオファイルに関連するスピーチ音を生成することによりユーザが容易にオーディオファイルを選択できるようにする「ディジタルオーディオファイル検索方法および装置」を提供する。
【解決手段】テクスト・スピーチ変換処理(text−to−speech処理)を利用することにより、携帯ディジタルオーディオプレーヤ中の各オーディオファイルに関連するスピーチ音(アーチスト名、曲名など)のプレイリストを作成し、該プレイリストを用いて車載オーディオシステムより各オーディオファイルに関連するスピーチ音を出力し、該スピーチ音に応答してユーザが所望のオーディオファイルを指定し、携帯ディジタルオーディオプレーヤより該指定されたオーディオファイルを車載オーディオシステムに送信して再生する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、車載オーディオシステムに接続された携帯ディジタルオーディオプレーヤ内に存在するディジタルオーディオファイルを検索するためのディジタルオーディオファイル検索方法および装置に関わり、特に、text-to-speech変換処理(以後、テキスト・スピーチ変換処理という)を利用することにより、ディジタルオーディオファイルに関連する情報のスピーチ音を発生してユーザにオーディオファイルの段階的選択を行なわせるディジタルオーディオファイル検索方法および装置に関する。
【背景技術】
【0002】
MP3、ATRAC(adaptive transform acoustic coding)、WMA(windows media audio)、AAC(advanced audio coding)等の圧縮技術は、音楽またはオーディオドラマ、コメディ等のディジタルオーディオ情報を圧縮してディジタルオーディオファイルを作成するために利用されている。ディジタルオーディオファイルは一般に、小型の筐体中に収められたハードディスク、CD−ROM、メモリカード等の記憶媒体に格納される。そのようなディジタルオーディオファイルは上記圧縮技術により、従来のオーディオ形式のサイズよりも小さいという利点がある。ディジタルオーディオファイルは、オーディオデータに加え、アーチスト名、楽曲のタイトル、楽曲のジャンル等を記述するタグデータ(メタデータ)を含んでいる。そのような情報は、テキスト形式の楽曲情報を表示してユーザが楽曲を識別するのを助けるためにディジタルオーディオプレーヤにおいてしばしば使用されている。
【0003】
iPod(Apple,Inc.の登録商標)のような携帯ディジタルオーディオプレーヤは、大量の楽曲を格納できる容量およびその携帯性により人気がある。一般に、ユーザは、携帯ディジタルオーディオプレーヤ中に好きな楽曲のライブラリを作成しておき、作業中、勉強中、歩行中等にその楽曲を聴く。以上に加えて、ユーザは、自分が自動車を運転している時あるいはいずれにしても車内にいる時、携帯ディジタルオーディオプレーヤ中の自分のコレクションの楽曲を、携帯ディジタルオーディオプレーヤのヘッドセットを使用せずに聴くことも望む。
【0004】
すなわち、ユーザは、携帯ディジタルオーディオプレーヤを車載オーディオシステムで使用でき、かつ自動車を運転している時に、該携帯ディジタルオーディオプレーヤに格納された自分の好みの楽曲またドラマ等を楽しめるようにしたいという要望がある。しかし、そのような用途において、携帯ディジタルオーディオプレーヤ中の楽曲ファイル数が多いので、自動車を運転しながら特定のオーディオファイルを検索するのは容易でなく、しかも、安全運転上重大な問題をもたらす。
【0005】
車載オーディオシステムは通常、ユーザが乗り物を運転している時に使用されるので、ユーザの注意を運転から逸らすことは最小限にされなければならない。とりわけ、安全運転のために、携帯ディジタルオーディオプレーヤ中に格納された次の楽曲をユーザが検索する際、視覚的注意が逸らされることは極力最小限にされるべきである。従って、運転から注意を極力逸らすことなく、携帯ディジタルオーディオプレーヤ中の所望の音楽ファイルを検索し、車載オーディオシステムにより楽曲ファイルを再生する新しい方法が必要とされる。
【発明の開示】
【発明が解決しようとする課題】
【0006】
従って、本発明の目的は、選択された楽曲を車載オーディオシステムで再生するために携帯ディジタルオーディオプレーヤ中のディジタルオーディオファイルを、安全運転を妨げることなく検索する方法および装置を提供することである。
【0007】
本発明の別の目的は、テキスト・スピーチ変換処理を利用することにより車載オーディオシステムに接続される携帯ディジタルオーディオプレーヤ中のディジタルオーディオファイルを、安全運転を妨げることなく検索するためのオーディオファイル検索方法および装置を提供することである。
【0008】
本発明の別の目的は、ディジタルオーディオファイルのコンテンツに関する情報を説明するスピーチ音を生成するためにテキスト・スピーチ変換処理を利用することにより、及び該生成されたスピーチ音に応答してオーディオファイルを選択するようにユーザを促すことにより、ディジタルオーディオファイルを検索するオーディオファイル検索方法および装置を提供することである。
【課題を解決するための手段】
【0009】
本発明の1つの態様は、車載オーディオシステムに接続する携帯オーディオプレーヤ内に存在するディジタルオーディオファイルを検索するディジタルオーディオファイル検索方法であり、各オーディオファイルに関連付けられたタグデータを読み取り、該タグデータから取り出された情報についての音声データを生成し、該音声データをリスト化してなるプレイリストを作成するステップ、該生成したプレイリストおよびオーディオファイルを携帯オーディオプレーヤに格納するステップ、前記プレイリスト中の所定音声データおよびオーディオファイルを車載オーディオシステムに送信するために、かつ車載オーディオシステムからユーザコマンド信号を受信するために、前記携帯オーディオプレーヤを車載オーディオシステムに接続するステップ、携帯オーディオプレーヤから送られてくるプレイリスト中の音声データに基づいて車載オーディオシステムにおいてスピーチ音を所定の順序で生成して出力するステップ、前記スピーチ音に応答してユーザが入力する指示を反映するユーザコマンドを携帯オーディオプレーヤに送信するステップ、前記ユーザコマンドを受け取り、該ユーザコマンドに基づいて前記携帯オーディオプレーヤにおいてオーディオファイルを検索するステップを有している。
【0010】
本発明において、音声データをリスト化するプレイリストを作成する前記ステップは、テキストデータをテキスト・スピーチ変換アルゴリズムによりスピーチデータに変換するステップ、該音声データをリスト化してなるプレイリストを作成するステップを有している。
また、音声データをリスト化するプレイリストを作成する前記ステップは、階層的にリンクされる音声データを含む2つ以上の音声データファイルを作成するステップを有している。
【0011】
本発明において、音声データをリスト化するプレイリストを作成する前記ステップは、車載オーディオシステムがオーディオファイルと関連付けられたスピーチ音をアルファベット順に生成するように音声データを並べるステップを有している。
また、音声データをリスト化するプレイリストを作成する前記ステップは、車載オーディオシステムがオーディオファイルと関連付けられたスピーチ音をユーザ定義された順序で生成するようにユーザ定義された順序で音声データを並べるステップを有している。
【0012】
本発明において、音声データをリスト化するプレイリストを作成する前記ステップは、階層的にリンクされる音声データを含む2つ以上の音声データファイルを作成すると共に、最上位層の音声データファイルにおいて、次の層の音声データの最初のアルファベット文字をリスト化するステップを有している。
【0013】
本発明において、前記ユーザコマンドを送信するステップにおいて、所望のスピーチ音に応答して、車載オーディオシステムの所定のボタンが操作されたことによりユーザ指示を認識してユーザコマンドを作成して送信する。
本発明のディジタルオーディオファイル検索方法は、さらに、ユーザにより指示されて検索したオーディオファイルを前記携帯オーディオプレーヤより受信し、車載オーディオシステムにおいて該オーディオファイルを再生するステップを有している。
【0014】
本発明の別の態様は、車載オーディオシステムに使用する携帯オーディオプレーヤ内に存在するディジタルオーディオファイルを検索するディジタルオーディオファイル検索装置であり、上述のオーディオファイルを検索するための方法の様々なステップを実施するように設計される。この装置は、各オーディオファイルに関連付けられたタグデータを読んで音声データを生成し、各オーディオファイルの音声データを有するプレイリストを作成し、該プレイリストおよびオーディオファイルを携帯オーディオプレーヤに格納するように構成される。携帯オーディオプレーヤが車載オーディオシステムに接続されると、ディジタルオーディオファイル検索装置は、プレイリスト中の音声データを携帯オーディオプレーヤより車載オーディオシステムに送ることを可能にし、かつ、車載オーディオシステムからユーザコマンドを携帯オーディオプレーヤに送ることを可能にする。そして、プレイリスト中の音声データに基づいて車載オーディオシステムより所定の順序でスピーチ音を生成、出力させ、該スピーチ音に応答して入力されるユーザ指示に応じたユーザコマンドを車載オーディオシステムより携帯オーディオプレーヤに送らせ、ユーザコマンドに応答して携帯オーディオプレーヤにおいてディジタルオーディオファイルを検索させる。
【発明の効果】
【0015】
本発明によれば、ディジタルオーディオファイル検索方法および装置は、text-to-speech変換処理(テキスト・スピーチ変換処理)を利用することにより生成されたスピーチ音を介して車載オーディオシステムに接続される携帯ディジタルオーディオプレーヤ中のディジタルオーディオファイルを検索することができる。
車載オーディオシステムは、テキスト・スピーチ変換処理により作成されたスピーチ音を生成して出力し、これにより、スピーチ音に応答するオーディオファイルの段階的選択をユーザに促し、車載オーディオシステムは、ユーザにより選択されたオーディオファイルを再生する。従って、本発明の検索方法および装置により、携帯ディジタルオーディオプレーヤ中のオーディオファイルを検索する時、スムーズに検索でき、しかも運転から視覚的注意が逸れることが回避され、安全運転に支障をきたす恐れがない。
【発明を実施するための最良の形態】
【0016】
本発明は、携帯ディジタルオーディオプレーヤ中のディジタルオーディオファイルを検索し、選択されたオーディオコンテンツを車載オーディオシステムにより再生するための検索方法および検索装置を提供する。従って、ユーザは自動車を運転している時に、携帯ディジタルオーディオプレーヤ中に格納された好みの楽曲を楽しむことができる。本発明は主に、好みの楽曲を検索および再生する場合について説明されるが、本発明は、ドラマ、コメディ、教材等に関するその他のタイプのディジタルオーディオファイルに応用できることが留意されるべきである。
【0017】
今日、text-to-speech(TTS)技術により、テキストデータを音声データに変換することにより容易にテキストデータからスピーチ音を生成することが可能である。
一方、ディジタルオーディオファイルは、サービスプロバイダからインターネットのような通信ネットワークを介して取得し、あるいはCD ROMのオーディオファイルをCDプレーヤまたはパーソナルコンピュータを介してMP3形式のような圧縮ディジタルオーディオファイルに変換することにより取得することができる。各ディジタルオーディオファイルは、アーチスト名、楽曲タイトル、記録年度、作曲者名等のファイルの書誌的情報を示すタグデータを含む。
【0018】
そのような場合、各ディジタルオーディオファイルのタグデータはテキストデータの形式なので、TTS技術(テキスト・スピーチ変換アルゴリズム)によりタグデータに基づいて音声(スピーチ音)データを生成することが可能になる。すなわち、ある特定の曲のアーチスト名が「Mickel Jackson」であれば、テキスト・スピーチ変換アルゴリズムは、オーディオファイルからタグデータに基づいて、その名前「Mickel Jackson」のスピーチ音を生じる音声データを生成することができる。従って、本発明の検索方法および装置を実施する車載オーディオシステムは、アーチスト名のようなスピーチ音を生成して出力し、それによって、携帯ディジタルオーディオプレーヤ中のオーディオファイルに関する情報をユーザに提供する。
【0019】
本発明は、各オーディオファイルを、アーチスト名、楽曲名またはタイトル、アルバム名、ジャンル等によりインデックス(索引)できるようにTTSファイルを作成する手段を有しており、該インデックス(音声データ)は、オーディオシステムによって再生され、スピーカよりスピーチ音(音声)となって出力される。従って、ユーザは自分の好きなアーチスト名等を聞くと、該アーチストの楽曲名を示すスピーチ音を車載オーディオシステムが出力するように、車載オーディオシステムのキーまたはボタンを押す。次に、ユーザは、スピーチ音により告げられた特定の楽曲タイトルを聞いた時にキーまたはボタンを押すことにより、該特定の楽曲を選択することができる。車載オーディオシステムは、選択された楽曲のディジタルオーディオファイルを携帯ディジタルオーディオプレーヤから取り出し、選択された楽曲を再生する。
【0020】
本発明において、音声データのリストを有するTTSファイルは、パーソナルコンピュータにインストールされたソフトウェア(テキスト・スピーチ変換アルゴリズム)を用いて各ディジタルオーディオファイルのタグ情報から作成される。このソフトウェアは、アルファベット順またはユーザ指定順序のような所定の順序に基づいてTTSファイルを並べる。上記のように、そのようなタグ情報は、例えば、各ディジタルオーディオファイルのタグデータ(メタデータ)から抽出し、またはCD ROMのようなオリジナルのファイルに関する情報からユーザにより作成される。ソフトウェアは、アドレスデータ及びポインタをTTSファイル中の各音声データに割り当てる。パーソナルコンピュータ中のソフトウェアにより作成されたTTSファイルは、携帯ディジタルオーディオプレーヤに転送される。
【0021】
本発明の好ましい実施形態を添付図面に関連して説明する。図1は、リンクユニット20を介して車載オーディオシステム40に接続されたiPod(Apple,Inc.の登録商標)のような携帯ディジタルオーディオプレーヤ10を含む本発明の全体的構成を示す概略図である。携帯ディジタルオーディオプレーヤ10は、楽曲、アーチスト等に関する情報を示す表示部16、およびメニューまたは指示を選択するためのコントロールパッド13を有する。この例における車載オーディオシステム40は、ディスクスロット47、表示部45、トラックシークボタン43およびディスク交換ボタン41のような複数のキーおよびボタンを有するCDまたはDVDプレーヤである。リンクユニット20は一般に、マイクロプロセッサを含み、携帯ディジタルオーディオプレーヤ10と車載オーディオシステム40との間のインタフェースとして働く。
【0022】
図2を参照すると、携帯ディジタルオーディオプレーヤ10は、ディジタルオーディオファイルを受信するためにパーソナルコンピュータ60に接続できる。一般に、サービスプロバイダからのディジタルオーディオファイルは、インターネットのような通信ネットワークを介してダウンロードされ、パーソナルコンピュータ60中に格納され、あるいは、ディジタルオーディオファイルは、CDおよびDVDのような従来のオーディオ媒体の出力を変換することにより作成される。
【0023】
パーソナルコンピュータ60は、TTSファイルを作成するためにソフトウェア(テキスト・スピーチ変換アルゴリズ)62をインストールされる。このTTSファイルは、ディジタルオーディオファイルと関連付けられたインデックスデータ(アドレスデータ及びポインタを伴った音声データ)で構成され、各インデックスデータ(音声データ)は車載オーディオシステム40においてスピーチ音(音声)にされてユーザは聞くことができるようになっている。ユーザは、キーボード65およびマウス66のような入力手段を介して、アーチスト名や、特定のアーチストについての楽曲名のようなインデックスデータを追加したり、削除したり、修正することができる。パーソナルコンピュータ60は、結果として得られるインデックスデータおよびディジタルオーディオファイルを携帯ディジタルオーディオプレーヤ10に転送する。
【0024】
図3は、市場において現在入手可能なディジタルオーディオファイルの典型的な構造を概略的に示す説明図である。一般に、上述のように、ディジタルオーディオファイルは、オーディオコンテンツ205とオーディオファイルのプロパティ(内容、性質など)を記述するタグデータ(メタデータ)207を有する。図3の例において、そのようなタグデータは、楽曲タイトル、アーチスト名、および楽曲のジャンルを含んでいる。コメント、トラック番号、およびその楽曲が作成された年度も、タグデータに含めることができる。後により詳細に説明されるように、本発明において、オーディオファイルのプロパティを音声データによって索引付け可能となるように、スピーチファイルまたはTTS(text−to−speech)ファイルと呼ばれるファイルがパーソナルコンピュータ60中のソフトウェアによりタグデータに基づいて生成される。従って、オーディオファイルのプロパティは、車載オーディオシステムを介してスピーチ音により再現され、これにより、ユーザはオーディオファイルを検索するプロセスが容易になる。
【0025】
図4にはTTSファイルを作成するための基本的構成が記載されており、これは一般に、図2に示されるパーソナルコンピュータ60において具体化される。上述のように、テキスト・スピーチ変換技術(text−to−speech(TTS)変換技術)は、TTSファイル中の音声データ(インデックスデータ)を作成するために利用される。
図4において、TTS変換エンジン211、スピーチファイル220、およびリンクソフトウェア213が示されており、これらの機能ブロックは、図2のパーソナルコンピュータ60のソフトウェア62中に含めることができる。
【0026】
TTS変換エンジン211は、オーディオファイル中のタグデータ(テキストデータ)を、スピーチ音として再現できる音声データに変換する。一般に、TTS変換エンジン211は、ソフトウェアにより実施されるが、専用ハードウェアとすることもできる。音声データは、スピーチファイル220中に一時的に格納される。リンクソフトウェア213は、アーチスト名、楽曲タイトル、ジャンル等の様々なタイプの音声データをリスト化するプレイリスト215を作成するために設けられる。リンクソフトウェア213は、アドレスデータ及びポインタも音声データに割り当てる。アドレスは音声データを記憶する場所を示し、ポインタは下位レイヤの音声データを記憶する場所を指し示す。アドレスデータ、ポインタは一般に、所定の桁数の英数字エントリである。音声データは、アルファベット順またはパーソナルコンピュータ60の入力デバイス65および66の操作を介してユーザによって作成された順序のような所定の順序に基づいてリスト化される。
【0027】
一般に、ディジタルオーディオファイル201は、上述のようにオーディオコンテンツ205およびタグデータ(メタデータ)207によって構成される。TTS変換エンジン211は、タグデータ207を読み、対応する音声データを生成し、この音声データはスピーチファイル220中にまとめられる。一般に、TTS変換エンジン211は、アルファベット順にインデックス、アーチスト名、楽曲のタイトル、および楽曲のジャンル等を生成する。例えば、ディジタルオーディオファイル201のタグデータ207が「Cher」というアーチスト名を有していれば、TTS変換エンジン211は、車載オーディオシステム40による「Cher」のスピーチ音を生成する音声データを生成する。スピーチファイル220中の生成された音声データは、車載オーディオシステム40によって認識および再生され得る形式であり、好ましくは、携帯ディジタルオーディオプレーヤ10によっても認識および再生され得る形式(例えば、PCM音声データ形式)である。リンクソフトウェア213は、音声データおよびオーディオコンテンツの格納アドレス及びポインタを用いることにより、スピーチファイル220中の音声データ(例えば楽曲名の音声データ)に応じたオーディオコンテンツ205の格納位置を指示する。
【0028】
このようにして、図4のソフトウェア62は、プレイリスト215を生成する。プレイリスト215は、スピーチファイル220からの生成された音声データ間の関係を層化構造で記述するだけでなくオーディオコンテンツ205(ディジタルオーディオデータ)の格納場所を指示するデータのリストである。オーディオコンテンツ205及びプレイリスト215は、パーソナルコンピュータ60から図2に示される構成を介して携帯ディジタルオーディオプレーヤ10に転送されて内蔵のメモリに格納される。本発明の目的のため、図1に示されるように、携帯ディジタルオーディオプレーヤ10は、リンクユニット20を介して車載オーディオシステム40に接続される。
【0029】
図5Aおよび図5Bは、プレイリスト215、すなわち、図4のソフトウェア62により生成されたTTSファイルの構造の一例を示す。図5Aに示されるように、段階的なやり方でのディジタルオーディオファイルの検索を可能にするために、TTSファイルは、階層構造で配置されている。この例では、プレイリスト215は、TTSファイルの3つの層、すなわち、TTS−1、TTS−2、およびTTS−3により構成されている。言い換えれば、プレイリスト215は、音声データが樹状関係でリンクされる階層構造を有する。
【0030】
図5Bに示されるように、各音声データは、リンクユニット20からの読み取りコマンドに応答して音声データまたはオーディオコンテンツを携帯ディジタルオーディオプレーヤ10から取り出すことができるように、アドレスデータ及びポインタを伴っている。上述のように、アドレスデータ及びポインタは、パーソナルコンピュータ60中のソフトウェア62を介してTTSファイル中の各音声データに割り当てられ、所定の桁数により構成された英数字エントリである。
【0031】
TTS−1ファイルは、各アルファベット文字を所定の順序で発音する音声音を車載オーディオシステムが生成できるように、アルファベット文字に対応する音声データのリストを含んでいる。アルファベット文字は、携帯ディジタルオーディオプレーヤ10中のディジタルオーディオファイルのアーチスト名、楽曲タイトル等の最初の文字を示す。音声データの順序は、プレイリスト215を作成する時に、ユーザの好みでユーザにより自由に決めることができ、または、リンクソフトウェア213により、例えば、アルファベット順に決めることができる。なお、図5Aでは図示しないが、各アルファベットの音声データには、格納アドレスとポインタが付されており、該ポインタにより下位レイヤのアーチストの音声データ格納アドレスを指示するようになっている。
【0032】
この例では、TTS−2ファイルは、TTS−1ファイル中の音声データにリンクされたアーチスト名を示す音声データを含んでいる。TTS−2ファイルは、TTS−2(1)、TTS−2(2)、…TTS−2(n)ファイルにより構成されており、各ファイルは、TTS−1ファイル中の対応するアルファベット文字のポインタで所定のアルファベット文字にリンクされている。例えば、TTS−1ファイル中のアルファベット文字「A」のポインタは、アルファベット文字「A」で始まるアーチスト名、例えば、「Aba」、「Anton」、「Arnold」および「Ashcroft」の音声データをリスト化するTTS−2(1)ファイルの先頭位置を指示する事により、該TTS−2(1)ファイルにリンクされる。TTS−2(2)、TTS2−(3)、…TTS−2(n)ファイルも、上記と同様なやり方で作成され、階層化される。
【0033】
この例では、TTS−3ファイルは、TTS−2ファイルの音声データにリンクされている楽曲名を示す音声データを含んでいる。TTS−3ファイルは、TTS−3(1)、TTS−3(2)、…TTS−3(n)ファイルにより構成されており、各ファイルは、TTS−2ファイル中の対応するアーチスト名にリンクされている。例えば、TTS−2(1)ファイル中のアーチスト名「Anton」の音声データはポインタにより、Antonの楽曲タイトルの音声データ(「Avita Memory」、「Dream in Midwinter」・・・「Winter Sonata」等)をリスト化するTTS−3(2)ファイルにリンクされている。楽曲の対応するディジタルオーディオデータ(オーディオコンテンツ)は、TTS−3ファイルの各楽曲の音声データに付されているポインタPM1,PM2,...により、格納場所が指示されるようになっている。他のアーチストに対応するTTS−3(1)、TTS−3(3)、…TTS−3(n)ファイルも、上記と同様なやり方で作成される。
【0034】
図5Aに示されるように、アルファベット文字、アーチスト名、楽曲タイトルおよびディジタルオーディオファイルのTTSファイルは、ポインタにより階層構造中で互いにリンクされている。すなわち、アルファベット文字(TTS−1ファイル)についての音声データは、アーチスト名(TTS−2ファイル)の音声データとリンクされている。アーチスト名(TTS−2ファイル)についての音声データは、対応するオーディオコンテンツ(ディジタルオーディオファイル)とリンクされている楽曲タイトル(TTS−3ファイル)の音声データとリンクされている。
【0035】
従って、携帯ディジタルオーディオプレーヤ10が接続されている車載オーディオシステム40をユーザが起動させると、車載オーディオシステム40は、所定の順序でアルファベット文字を告げる音声メッセージを生成する。ユーザは、自分の好きなミュージシャンの名前が「A」で始まるので、文字「A」が発音された時にキーまたはボタンを押すことにより特定のアルファベット、例えば、文字「A」を選択する。次に、車載オーディオシステム40は、文字「A」で始まるアーチスト名を所定の順序で読み上げる。ユーザが特定のアーチスト名をさらに選択する場合、車載オーディオシステム40は、選択されたアーチストの楽曲タイトルを所定の順序で読み上げる。
【0036】
従って、特定の楽曲タイトルのスピーチ音を聞いた時にキーを押すことにより、ユーザは選択されたアーチストの特定の楽曲タイトルを選択することができる。車載オーディオシステム40は、選択された楽曲タイトルのディジタルオーディオファイルを携帯ディジタルオーディオプレーヤ10から取得して再生する。車載オーディオシステム40がアルファベット文字、アーチスト名、および楽曲タイトルを読み上げるので、ユーザは、携帯ディジタルオーディオプレーヤ10または車載オーディオシステム40の表示部を見る必要がない。従って、本発明の検索方法および装置は、携帯ディジタルオーディオプレーヤ10中の音楽ファイルを検索する際に、運転から視覚的注意が逸れることを回避できる。上記の例において、例示の目的でアルファベット文字が用いられているが、ディジタルオーディオプレーヤおよび車載オーディオシステムが用いられる特定の言語環境に応じて他の文字が使用できることが留意されるべきである。
図5は後述するインデックスモードで所定のディジタルオーディオファイルを検索する場合のTTSファイル例であるが,ジャンル別検索用のTTSファイル、楽曲名より検索するためのTTSファイルなどがある。図6はジャンル別のTTSファイル例であり、最上位レイヤにジャンル名を示す音声データ(ポップス、ソウル、カントリー、、ジャズ、ロック、クラッシック等)のファイルTTS1が配置され、各ジャンル名の音声データに次のレイヤであるアーチスト名の音声データファイルTTS2がリンクされ、更に、各アーチストの音声データに該アーチストの楽曲名を示す音声データのファイルリストTTS3がリンクし、各楽曲名音声データにディジタルオーディオデータ(オーディオコンテンツ)の位置を示すポインタ(図示せず)が付されている。
【0037】
特定のミュージシャンによる楽曲タイトルを検索するための本発明の操作を、図1、図7および図8に関連して説明する。図1および図8において、携帯ディジタルオーディオプレーヤ10は、リンクユニット20を介して車載オーディオシステム40に接続されている。接続は無線によりまたは物理的ワイヤを介して確立できる。車載オーディオシステム40は、数あるキーおよびボタンの中でもシークボタン43およびディスク番号ボタン41を含む。携帯ディジタルオーディオプレーヤ10は、パーソナルコンピュータ60により生成されたプレイリスト215および多数のディジタルオーディオファイルを格納する。
【0038】
シークボタン43およびディスク番号ボタン41は携帯ディジタルオーディオプレーヤ10が車載オーディオシステムに接続されていなければ、本来のシークコマンド、ディスク選択コマンド発生のために用いられるが、携帯ディジタルオーディオプレーヤ10が接続されると自動的に該携帯ディジタルオーディオプレーヤに記憶されているディジタルオーディオファイルのユーザコマンド発生用に変わる。すなわち、シークボタン43は所望のアルファベット、アーチスト名、楽曲名を特定するために使用され、ディスク番号ボタン41は選曲モードを選択するために使用される。
【0039】
リンクユニット20は車載オーディオ40から入力するシークオン信号やディスク番号を携帯ディジタルオーディオプレーヤ10が認識可能なデータに変換して入力すると共に、携帯ディジタルオーディオプレーヤ10から入力する音声データやオーディオコンテンツを車載オーディオシステム40のオーディオ回路に入力する。
例えば、リンクユニット20は、車載オーディオシステムよりディスク番号が入力すれば、該ディスク番号に応じた検索モード(1:インデックス検索モード、2:楽曲名検索モード、3:ジャンル別検索モード)を特定するデータを携帯ディジタルオーディオプレーヤ10に入力し、該モードに応じた最上位レイヤの音声データを順番に車載オーディオシステム40に送信するよう要求する。また、リンクユニット20は、車載オーディオシステムよりシークオン信号が入力すれば、携帯ディジタルオーディオプレーヤ10に対して、直前に送信した音声データに付されているポインタが示す下位レイヤの所定ファイルの音声データを順番に送信するよう、あるいはポインタが示すオーディオコンテンツを送信するよう要求する。
【0040】
携帯ディジタルオーディオプレーヤ10は、初期時、リンクユニット20より検索モード特定データを受信すれば該モードに応じた最上位レイヤの音声データを順番にリンクユニット20を介して車載オーディオシステム40に送信する。また、携帯ディジタルオーディオプレーヤ10は、直前に送信した音声データに付されているポインタが示す下位レイヤの所定ファイルの音声データの送信が要求されれば、以後、該ファイルを構成する音声データを順番にリンクユニット20を介して車載オーディオシステム40に送信し、あるいは、ポインタが示すオーディオコンテンツの送信が要求されれば、該要求されたオーディオコンテンツをリンクユニット20を介してオーディオシステム40に送信する。
【0041】
図7の流れ図を参照して、本発明の基本的な操作の流れを説明する。ユーザは最初に、ステップ101において検索方法((検索モード)を設定する。なお、ディスク番号ボタン41を用いてディスク番号1を設定すれば、アーチスト名検索(インデックス検索)モードで検索でき、ディスク番号2を設定すれば楽曲名検索モードで検索でき、ディスク番号3を設定すれば、ジャンル検索モードで楽曲を検索できる。上述の検索カテゴリに加え、楽曲をランダムに演奏するランダムモードも実施できる。
【0042】
ユーザがディスク番号1を設定してインデックス検索を選択すれば、車載オーディオシステム40は該ディスク番号をリンクユニット20に入力する。リンクユニット20は、車載オーディオシステムよりディスク番号が入力すれば、該ディスク番号に応じた検索モード(例ではインデックス検索モード)を特定するデータを携帯ディジタルオーディオプレーヤ10に入力し、該モードに応じた最上位レイヤの音声データを順番に車載オーディオシステム40に送信するよう要求する(ステップ102)。
携帯ディジタルオーディオプレーヤ10は、リンクユニット20より検索モード特定データ(例ではインデックス検索モード)を受信すれば該インデックスモードに応じた最上位レイヤのTTS−1ファイルの音声データ(アルファベットA,B,C...Z)を、「A」より順番に所定時間間隔でリンクユニット20を介して車載オーディオシステム40に送信する。車載オーディオシステム40は入力された音声データ(PCM音声データ)をオーディオ回路でDA変換して順次スピーカより出力する。
【0043】
所定のアルファベットの音声がスピーカより出力されたとき、次のアルファベットの音声が出力される前に、ユーザは車載オーディオシステム40のシークボタン43を押す。これにより、所望のアーチスト名の最初のアルファベット文字に関して携帯ディジタルオーディオプレーヤ10に指示することができる。例えば、車載オーディオシステム40は、A、B、C…のような所定の順序でアルファベット文字の読み上げを続ける。そして、車載オーディオシステム40が「C」と読み上げた時に、ユーザがシークボタン43を押せば、車載オーディオシステム40はシークオン信号をリンクユニット20に入力する。リンクユニット20は、車載オーディオシステムよりシークオン信号が入力すれば、携帯ディジタルオーディオプレーヤ10に対して、直前に送信した音声データに付されているポインタが示す下位レイヤの所定ファイル(アルファベットCで始まるアーチスト名ファイル)の音声データを順番に送信するよう要求する。
【0044】
これにより、アーチスト名の音声出力が開始する。図9は、アルファベット順に並べられた文字Cで始まるアーチスト名のリストを示している。TTSプレイリストがパーソナルコンピュータ60により作成される時、アーチスト名についてのスピーチファイル(例えば、図5におけるTTS−2ファイル)は、図4および図5に関連して説明されたように作成されている。
携帯ディジタルオーディオプレーヤ10は、直前に送信した音声データ「C」に付されているポインタが示すアーチストファイルの音声データの送信が要求されれば、以後、該ファイルを構成する音声データを順番に所定時間間隔でリンクユニット20を介して車載オーディオシステム40に送信する。これにより、車載オーディオシステム40は「Cake」、「Cars」、「Cassidy,Eva」等のアーチスト名を、アルファベット順に音声でスピーカより出力する。
【0045】
車載オーディオシステム40が「Cassidy,Eva」と読み上げた時に、ユーザがシークボタン43を押せば、車載オーディオシステム40はシークオン信号をリンクユニット20に入力する。リンクユニット20は、車載オーディオシステムよりシークオン信号が入力すれば、携帯ディジタルオーディオプレーヤ10に対して、直前に送信した音声データ(Cassidy,Eva)に付されているポインタが示す下位レイヤの所定ファイル(Cassidy,Evaの楽曲名ファイル)の音声データを順番に送信するよう要求する。これにより、楽曲名の音声出力が開始する。
携帯ディジタルオーディオプレーヤ10は、直前に送信した音声データ(Cassidy,Eva)に付されているポインタが示す楽曲ファイルの音声データの送信が要求されれば、以後、該ファイルを構成する音声データを順番に所定時間間隔でリンクユニット20を介して車載オーディオシステム40に送信する。これにより、車載オーディオシステム40は「Kathy`s Song」、「Ain't No Sunshine」、「The Letter」等のアーチスト名を、アルファベット順に音声でスピーカより出力する。
【0046】
聞きたい楽曲タイトルが告げられた時、ユーザが、シークボタン43を押せば、例えば、「The Letter」の音声が出力された後にシークボタン43を押せば、車載オーディオシステム40はシークオン信号をリンクユニット20に入力する。・・・以上ステップ103
リンクユニット20は、車載オーディオシステムよりシークオン信号が入力すれば、携帯ディジタルオーディオプレーヤ10に対して、直前に送信した音声データ(The Letter )に付されているポインタが示すオーディオコンテンツを送信するよう要求する。これにより、携帯ディジタルオーディオプレーヤ10は楽曲「The Letter」のオーディオコンテンツをリンクユニット20を介して車載オーディオシステム40に入力し、車載オーディオシステム40はスピーカより出力する(ステップ104)。
【0047】
以上では、楽曲名の音声データのポインタでオーディオコンテンツを指示するようにしたが、アーチスト名の音声データのポインタで該アーチストのオーディオコンテンツを指示するようにし、該アーチストの全曲を再生するように構成することもできる。
【0048】
上述の例において、第1の主要なセットアップ(図7におけるステップ101)において、ユーザは、アーチスト名により携帯ディジタルオーディオプレーヤ10中の音楽ファイルを検索する検索方法を選んでいる。しかしながら、上記の同様なやり方で楽曲ファイルを検索する際に他のカテゴリも利用できる。例えば、ユーザは、アルバムタイトルまたは楽曲のジャンルによって楽曲ファイルを検索できる。
【0049】
さらに、上述の例において、インデックスモードは、アーチスト名についてのアルファベット文字を列挙および読み上げ、その結果、車載オーディオシステムは、選択されたアルファベット文字で始まるアーチスト名についての楽曲ファイルを絞り込むことができる。しかしながら、アルファベットインデックスは、アーチスト名、アルバム名、およびジャンルのようないくつかのカテゴリを含み得る。従って、例えば、ユーザがインデックスモードにおいて文字「C」を選んだ場合、オーディオシステムは、文字「C」で始まるアーチスト名、アルバム名、およびジャンルを読み上げる。
【0050】
本発明によるスピーチファイルを用いる検索方法は、車載オーディオシステムにおいて実施される場合について説明されているが、本発明の検索方法は、もっぱら携帯ディジタルオーディオプレーヤによって、または家庭用オーディオシステム等の他のタイプのオーディオシステムと併用して利用できる。
【0051】
上述のように、本発明によれば、ディジタルオーディオファイル検索方法および装置は、テキスト・スピーチ変換処理を利用することにより生成されたスピーチ音を介して、車載オーディオシステムに接続する携帯ディジタルオーディオプレーヤ中のオーディオファイルを検索することができる。車載オーディオシステムは、テキスト・スピーチ変換処理により作成されたスピーチ音を生成、出力し、これによりスピーチ音に応答してオーディオファイルの段階的選択をユーザに促し、車載オーディオシステムは、ユーザにより選択されたオーディオファイルを再生する。従って、本発明の検索方法および装置は、携帯ディジタルオーディオプレーヤ中のオーディオファイルを検索する時に、運転から視覚的注意が逸れることを回避でき、暗線運転に支障を生じない。
【0052】
本発明は本明細書において好ましい実施形態に関連して説明されているが、本発明の精神および範囲を逸脱することなく様々な修正および変形がなし得ることを当業者は容易に理解するであろう。そのような修正および変形は、添付の特許請求の範囲およびその均等物の範囲内にあると考えられる。
【図面の簡単な説明】
【0053】
【図1】携帯ディジタルオーディオプレーヤがリンクユニットを介して車載オーディオシステムに接続される本発明における実施形態の基本的構造の一例を示す概略図である。
【図2】ディジタルオーディオファイルおよびパーソナルコンピュータにより生成されたプレイリストを携帯ディジタルオーディオプレーヤに転送するために、携帯ディジタルオーディオプレーヤがパーソナルコンピュータに接続される本発明における一実施形態を示す概略図である。
【図3】オーディオコンテンツおよびタグデータにより構成されるディジタルオーディオファイルの代表的な例を示す概略図である。
【図4】本発明において使用するプレイリストを作成するためにディジタルオーディオファイルからTTSファイル(スピーチファイル)を生成するための機能構成例を示す概略図である。
【図5】インデックスモードで使用するTTSファイルの構成例である。
【図6】ジャンル検索モードで使用するTTSファイルの構成例である。
【図7】スピーチ音に応答することにより、意図されたディジタルオーディオファイルを検索するための基本的操作を示す流れ図である。
【図8】スピーチ音に応答することにより、意図されたディジタルオーディオファイルを検索するための基本的操作を示す概略図である。
【図9】楽曲タイトルファイル中のTTSファイの音声データの一例を示す概略図である。
【符号の説明】
【0054】
10 携帯ディジタルオーディオプレーヤ
13 コントロールパッド
16 表示部
20 リンクユニット
40 車載オーディオシステム
41 ディスク交換ボタン
43 シークボタン
45 表示部
47 ディスクスロット

【特許請求の範囲】
【請求項1】
車載オーディオシステムに接続する携帯オーディオプレーヤ内に存在するディジタルオーディオファイルを検索するディジタルオーディオファイル検索方法において、
各オーディオファイルに関連付けられたタグデータを読み取り、該タグデータから取り出された情報についての音声データを生成し、該音声データをリスト化してなるプレイリストを作成するステップ、
該生成したプレイリストおよびオーディオファイルを携帯オーディオプレーヤに格納するステップ、
前記プレイリスト中の所定音声データおよびオーディオファイルを車載オーディオシステムに送信するために、かつ車載オーディオシステムからユーザコマンド信号を受信するために、前記携帯オーディオプレーヤを車載オーディオシステムに接続するステップ、
携帯オーディオプレーヤから送られてくるプレイリスト中の音声データに基づいて車載オーディオシステムにおいてスピーチ音を所定の順序で生成して出力するステップ、
前記スピーチ音に応答してユーザが入力する指示を反映するユーザコマンドを携帯オーディオプレーヤに送信するステップ、
前記ユーザコマンドを受け取り、該ユーザコマンドに基づいて前記携帯オーディオプレーヤにおいてオーディオファイルを検索するステップ、
を有することを特徴とするディジタルオーディオファイル検索方法。
【請求項2】
音声データをリスト化するプレイリストを作成する前記ステップは、
テキストデータをテキスト・スピーチ変換アルゴリズムによりスピーチデータに変換するステップ、
該音声データをリスト化してなるプレイリストを作成するステップ、
を有することを特徴とする請求項1記載のディジタルオーディオファイル検索方法。
【請求項3】
音声データをリスト化するプレイリストを作成する前記ステップは、
階層的にリンクされる音声データを含む2つ以上の音声データファイルを作成するステップ、
を有することを特徴とする請求項1記載のディジタルオーディオファイル検索方法。
【請求項4】
音声データをリスト化するプレイリストを作成する前記ステップは、
車載オーディオシステムがオーディオファイルと関連付けられたスピーチ音をアルファベット順に生成するように音声データを並べるステップ、
を有することを特徴とする請求項1記載のディジタルオーディオファイル検索方法。
【請求項5】
音声データをリスト化するプレイリストを作成する前記ステップは、
車載オーディオシステムがオーディオファイルと関連付けられたスピーチ音をユーザ定義された順序で生成するようにユーザ定義された順序で音声データを並べるステップ、
を有することを特徴とする請求項1記載のディジタルオーディオファイル検索方法。
【請求項6】
前記タグデータは、オーディオファイルのアーティスト名および楽曲のタイトルを少なくとも含む、ことを特徴とする請求項1記載のディジタルオーディオファイル検索方法。
【請求項7】
音声データをリスト化するプレイリストを作成する前記ステップは、
階層的にリンクされる音声データを含む2つ以上の音声データファイルを作成すると共に、最上位層の音声データファイルにおいて、次の層の音声データの最初のアルファベット文字をリスト化するステップ、
を有することを特徴とする請求項1記載のディジタルオーディオファイル検索方法。
【請求項8】
前記ユーザコマンド送信ステップにおいて、
所望のスピーチ音に応答して、車載オーディオシステムの所定のボタンが操作されたことによりユーザ指示を認識してユーザコマンドを作成して送信する、
ことを特徴とする請求項1記載のディジタルオーディオファイル検索方法。
【請求項9】
ユーザにより指示されて検索したオーディオファイルを前記携帯オーディオプレーヤより受信し、車載オーディオシステムにおいて該オーディオファイルを再生するステップ、
を有することを特徴とする請求項1記載のディジタルオーディオファイル検索方法。
【請求項10】
車載オーディオシステムに接続する携帯オーディオプレーヤ内に存在するディジタルオーディオファイルを検索するディジタルオーディオファイル検索装置において、
各オーディオファイルに関連付けられたタグデータを読み取り、該タグデータから取り出された情報についての音声データを生成し、該音声データをリスト化してなるプレイリストを作成する手段、
該生成したプレイリストおよびオーディオファイルを携帯オーディオプレーヤに格納する手段、
前記プレイリスト中の所定音声データおよびオーディオファイルを車載オーディオシステムに送信するために、かつ車載オーディオシステムからユーザコマンド信号を受信するために、前記携帯オーディオプレーヤを車載オーディオシステムに接続する手段、
携帯オーディオプレーヤから送られてくるプレイリスト中の音声データに基づいて車載オーディオシステムにおいてスピーチ音を所定の順序で生成して出力する手段、
前記スピーチ音に応答してユーザが入力する指示を反映するユーザコマンドを携帯オーディオプレーヤに送信する手段、
前記ユーザコマンドを受け取り、該ユーザコマンドに基づいて前記携帯オーディオプレーヤにおいてオーディオファイルを検索する手段、
を有することを特徴とするディジタルオーディオファイル検索装置。
【請求項11】
音声データをリスト化するプレイリストを作成する前記手段は、
テキストデータをテキスト・スピーチ変換アルゴリズムによりスピーチデータに変換する手段、
該音声データをリスト化してなるプレイリストを作成する手段、
を有することを特徴とする請求項10記載のディジタルオーディオファイル検索装置。
【請求項12】
音声データをリスト化するプレイリストを作成する前記手段は、
階層的にリンクされる音声データを含む2つ以上の音声データファイルを作成する手段、
を有することを特徴とする請求項10記載のディジタルオーディオファイル検索装置。
【請求項13】
音声データをリスト化するプレイリストを作成する前記手段は、
車載オーディオシステムがオーディオファイルと関連付けられたスピーチ音をアルファベット順に生成するように音声データを並べる手段、
を有することを特徴とする請求項10記載のディジタルオーディオファイル検索装置。
【請求項14】
音声データをリスト化するプレイリストを作成する前記手段は、
車載オーディオシステムがオーディオファイルと関連付けられたスピーチ音をユーザ定義された順序で生成するようにユーザ定義された順序で音声データを並べる手段、
を有することを特徴とする請求項10記載のディジタルオーディオファイル検索装置。
【請求項15】
前記タグデータは、オーディオファイルのアーティスト名および楽曲のタイトルを少なくとも含む、ことを特徴とする請求項10記載のディジタルオーディオファイル検索装置。
【請求項16】
音声データをリスト化するプレイリストを作成する前記手段は、
階層的にリンクされる音声データを含む2つ以上の音声データファイルを作成すると共に、最上位層の音声データファイルにおいて、次の層の音声データの最初のアルファベット文字をリスト化する手段、
を有することを特徴とする請求項10記載のディジタルオーディオファイル検索装置。
【請求項17】
前記ユーザコマンド送信手段は、所望のスピーチ音に応答して、車載オーディオシステムの所定のボタンが操作されたことによりユーザ指示を認識してユーザコマンドを作成して送信する、ことを特徴とする請求項10記載のディジタルオーディオファイル検索装置。
【請求項18】
ユーザにより指示されて検索したオーディオファイルを前記携帯オーディオプレーヤより受信し、車載オーディオシステムにおいて該オーディオファイルを再生する手段、
を有することを特徴とする請求項10記載のディジタルオーディオファイル検索装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2007−183947(P2007−183947A)
【公開日】平成19年7月19日(2007.7.19)
【国際特許分類】
【出願番号】特願2006−348983(P2006−348983)
【出願日】平成18年12月26日(2006.12.26)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.WINDOWS
【出願人】(000101732)アルパイン株式会社 (2,424)
【Fターム(参考)】