車載装置および楽曲検索システム
【課題】ユーザが口ずさんだ歌詞を含む楽曲を検索して再生することができる楽曲検索システム10を提供する。
【解決手段】本発明の楽曲検索システム10は、楽曲データ毎に、当該楽曲の歌詞を示す歌詞データを予め格納し、ユーザが口ずさんだ楽曲の音声から単語列を認識し、当該単語列を含む歌詞データに対応付けられている楽曲データを抽出して再生する。
【解決手段】本発明の楽曲検索システム10は、楽曲データ毎に、当該楽曲の歌詞を示す歌詞データを予め格納し、ユーザが口ずさんだ楽曲の音声から単語列を認識し、当該単語列を含む歌詞データに対応付けられている楽曲データを抽出して再生する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、車両等の移動体に搭載され、楽曲データから楽曲を再生する機能を備える車載装置に関する。
【背景技術】
【0002】
特許文献1には、音声により入力されたアーティスト名、アルバム名、および曲名に基づいて、ハードディスクドライブ等に格納された楽曲データを検索して再生する再生装置が開示されている。
【0003】
【特許文献1】特開2005−78705号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
ところで、ハードディスクドライブ等に格納される楽曲数が多くなると、楽曲毎にアーティスト名、アルバム名、および曲名を覚えておくことが難しくなる場合がある。そのため、特許文献1の技術では、ユーザは、歌詞は覚えているものの、アーティスト名、アルバム名、および曲名を忘れてしまった楽曲を再生させることができない場合がある。
【0005】
本発明は上記事情を鑑みてなされたものであり、本発明の目的は、ユーザが口ずさんだ歌詞を含む楽曲を検索して再生することにある。
【課題を解決するための手段】
【0006】
上記課題を解決するために、本発明の車載装置は、楽曲データ毎に、当該楽曲の歌詞を示す歌詞データを予め格納し、ユーザが口ずさんだ楽曲の音声から単語列を認識し、当該単語列を含む歌詞データに対応する楽曲データを抽出して再生する。
【0007】
例えば、本発明の第一の態様は、車両に搭載される車載装置であって、楽曲データ毎に、当該楽曲の歌詞を示す歌詞データを格納する楽曲情報格納手段と、楽曲データを格納する記録媒体から楽曲データを取得して楽曲情報格納手段に格納する楽曲データ取得手段と、楽曲データ取得手段によって取得された楽曲データに対応する歌詞データを、外部から取得して楽曲情報格納手段に格納する歌詞データ取得手段と、ユーザが口ずさんだ音声から当該音声が示す単語列を特定する音声認識手段と、楽曲情報格納手段を参照して、音声認識手段によって特定された単語列と同一の単語列を含む歌詞データを特定し、特定した歌詞データに対応付けられている楽曲データを抽出する楽曲データ抽出手段と、楽曲データ抽出手段によって抽出された楽曲データを再生する再生手段とを備えることを特徴とする車載装置を提供する。
【0008】
また、本発明の第二の態様は、車両に搭載される車載装置と、車載装置の外部に設けられ、楽曲毎の歌詞データを格納する歌詞データ格納サーバとを備える楽曲検索システムであって、車載装置は、楽曲データ毎に、当該楽曲の歌詞を示す歌詞データを格納する楽曲情報格納手段と、楽曲データを格納する記録媒体から楽曲データを取得して楽曲情報格納手段に格納する楽曲データ取得手段と、楽曲データ取得手段によって取得された楽曲データに対応する歌詞データを、歌詞データ格納サーバから取得して楽曲情報格納手段に格納する歌詞データ取得手段と、ユーザが口ずさんだ音声から当該音声が示す単語列を特定する音声認識手段と、楽曲情報格納手段を参照して、音声認識手段によって特定された単語列と同一の単語列を含む歌詞データを特定し、特定した歌詞データに対応付けられている楽曲データを抽出する楽曲データ抽出手段と、楽曲データ抽出手段によって抽出された楽曲データを再生する再生手段とを備えることを特徴とする楽曲検索システム
【発明の効果】
【0009】
本発明の車載装置によれば、ユーザが口ずさんだ歌詞を含む楽曲を検索して再生することができる。
【発明を実施するための最良の形態】
【0010】
以下、本発明の実施の形態について、図面を参照しながら説明する。
【0011】
図1は、本発明の一実施形態にかかる楽曲検索システム10の構成を示すシステム構成図である。楽曲検索システム10は、歌詞データ格納サーバ20、音声データ格納サーバ30、および車載装置40を備える。歌詞データ格納サーバ20および音声データ格納サーバ30は、インターネット等の通信回線11に接続されている。車載装置40は、車両13に搭載され、通信回線11に接続されている基地局12と無線通信することにより、通信回線11を介して、歌詞データ格納サーバ20および音声データ格納サーバ30と通信する。
【0012】
歌詞データ格納サーバ20は、図2に示すように、歌詞データ格納部21および歌詞データ送信部22を備える。歌詞データ格納部21には、例えば図3に示すように、曲名210、当該曲名210に対応する楽曲を歌っている歌手の歌手名211、および当該曲名210に対応する楽曲が収録されているアルバムのアルバム名212に対応付けて、当該曲名210に対応する楽曲の歌詞を示す歌詞データ213が格納されている。
【0013】
歌詞データ送信部22は、通信回線11を介して、曲名、歌手名、およびアルバム名を含む歌詞データ取得要求を車載装置40から受信した場合に、当該歌詞データ取得要求に含まれている曲名、歌手名、およびアルバム名に対応する歌詞データを歌詞データ格納部21から抽出する。そして、歌詞データ送信部22は、抽出した歌詞データを含む歌詞データ取得応答を、歌詞データ取得要求の送信元へ返信する。
【0014】
音声データ格納サーバ30は、図4に示すように、特徴データ格納部31および特徴データ送信部32を備える。特徴データ格納部31には、例えば図5に示すように、単語310毎に、当該単語310を発声した場合の音声の特徴量311を示す情報が格納されている。特徴データ送信部32は、通信回線11を介して、単語を示す情報を含む特徴量取得要求を車載装置40から受信した場合に、当該特徴量取得要求に含まれている単語に対応する特徴量を特徴データ格納部31から抽出し、抽出した特徴量を示す情報を含む特徴量取得応答を、特徴量取得要求の送信元へ返信する。
【0015】
車載装置40は、例えば図6に示すように、尤度算出部41、単語列特定部42、楽曲データ抽出部43、再生部44、特徴量取得部45、辞書データ格納部46、歌詞データ取得部47、楽曲情報格納部48、および楽曲データ取得部49を備える。
【0016】
辞書データ格納部46には、例えば図7に示すように、単語460毎に、当該単語460を発声した場合の音声の特徴量461を示す情報が格納される。楽曲情報格納部48には、例えば図8に示すように、曲名480、当該曲名480に対応する楽曲を歌っている歌手の歌手名481、および当該曲名480に対応する楽曲が収録されているアルバムのアルバム名482に対応付けて、当該曲名480に対応する楽曲の楽曲データ483および当該曲名480に対応する楽曲の歌詞を示す歌詞データ484が格納される。
【0017】
楽曲データ取得部49は、タッチパネル等の入力装置15を介して、楽曲の取得をユーザから指示された場合に、CD(Compact Disc)等の記録媒体19から楽曲データを取得する。そして、楽曲データ取得部49は、ユーザから入力された情報または予めCDDB(Compact Disc DataBase)等から取得した情報から、当該楽曲データに対応する楽曲の曲名、歌手名、およびアルバム名を取得し、記録媒体19から取得した楽曲データを、取得した曲名、歌手名、およびアルバム名に対応付けて楽曲情報格納部48に格納する。そして、楽曲データ取得部49は、新たに楽曲が登録された旨を歌詞データ取得部47に通知する。
【0018】
歌詞データ取得部47は、新たに楽曲が登録された旨を楽曲データ取得部49から通知された場合に、歌詞データの取得の可否をユーザに問い合わせるための画面を、LCD(Liquid Crystal Display)等の表示装置18に表示する。
【0019】
そして、入力装置15を介して、歌詞データの取得を許可する旨を示す入力をユーザから受けた場合、歌詞データ取得部47は、楽曲情報格納部48を参照して、歌詞データの取得を実行していない楽曲データを特定し、当該楽曲データに対応する曲名、歌手名、およびアルバム名を含む歌詞データ取得要求を生成し、生成した歌詞データ取得要求をアンテナ17を介して歌詞データ格納サーバ20へ送信する。
【0020】
そして、アンテナ17を介して、歌詞データを含む歌詞データ取得応答を受信した場合、歌詞データ取得部47は、当該歌詞データ取得応答に含まれている歌詞データを、対応する楽曲データに対応付けて楽曲情報格納部48に格納する。
【0021】
そして、歌詞データ取得部47は、辞書データ格納部46を参照して、歌詞データ取得応答に含まれている歌詞データ内の全ての単語が辞書データ格納部46内に格納されているか否かを判定する。歌詞データ取得応答に含まれている歌詞データ内に、辞書データ格納部46内に格納されていない単語がある場合、歌詞データ取得部47は、当該単語を示す情報を特徴量取得部45へ送る。
【0022】
特徴量取得部45は、歌詞データ取得部47から単語を示す情報を受け取った場合に、当該単語を含む特徴量取得要求を生成し、生成した特徴量取得要求をアンテナ17を介して音声データ格納サーバ30へ送信する。そして、アンテナ17を介して、特徴量を示す情報を含む特徴量取得応答を受信した場合、特徴量取得部45は、当該特徴量取得応答に含まれている特徴量を示す情報を、対応する単語と共に辞書データ格納部46に格納する。
【0023】
尤度算出部41は、入力装置15を介してユーザから音声による楽曲検索の開始を指示された場合に、マイク14を介して音声信号を取り込み、取り込んだ音声信号から音節毎の特徴量を抽出する。そして、尤度算出部41は、辞書データ格納部46を参照して、抽出した特徴量と、辞書データ格納部46内のそれぞれの単語の特徴量とを比較して、特徴量が類似している割合が高いほど高い値を示す尤度を、それぞれの単語について算出する。
【0024】
そして、尤度算出部41は、算出した尤度を、対応する単語を示す情報と共に単語列特定部42へ出力する。なお、尤度算出部41は、それぞれの音節毎に、尤度の高い順に、所定個数(例えば10個以内)の単語を、対応する尤度と共に単語列特定部42へ出力するようにしてもよい。
【0025】
単語列特定部42は、尤度算出部41から出力された尤度に基づいて、例えば尤度が最も高い単語を音声に対応する単語として特定する。そして、単語列特定部42は、特定した複数の単語列を、楽曲データ抽出部43へ出力する。なお、単語列特定部42は、直前に尤度算出部41から出力された尤度の高い単語や、その後に尤度算出部41から出力された尤度の高い単語との前後関係も加味して音声に対応する単語を特定するようにしてもよい。
【0026】
楽曲データ抽出部43は、単語列特定部42から単語列を受け取った場合に、楽曲情報格納部48を参照して、当該単語列が含まれる歌詞データに対応付けられている楽曲データを抽出し、抽出した楽曲データを再生部44へ送る。再生部44は、楽曲データ抽出部43から受け取った楽曲データをスピーカ16を介して再生する。
【0027】
なお、単語列特定部42から出力された単語列を含む歌詞データが楽曲情報格納部48内に複数存在する場合、楽曲データ抽出部43は、当該複数の楽曲の曲名、歌手名、およびアルバム名を表示装置18に表示し、再生部44は、入力装置15を介してユーザから指定された楽曲を再生する。
【0028】
また、単語列特定部42から出力された単語列を含む歌詞データが楽曲情報格納部48内に存在しない場合、楽曲データ抽出部43は、当該単語列の一部が含まれている歌詞データに対応付けられている楽曲データの曲名、歌手名、およびアルバム名を表示装置18に表示し、再生部44は、入力装置15を介してユーザから再生が指定された場合に、当該楽曲データを再生するようにしてもよい。
【0029】
このとき、楽曲データ抽出部43は、単語列特定部42から出力された単語列に含まれる単語を含む歌詞データに対応付けられている楽曲データの曲名、歌手名、およびアルバム名を、当該単語列に含まれている単語の数が多い順に数曲分(例えば5曲分)表示装置18に表示するようにしてもよい。
【0030】
図9は、楽曲データ取得時における楽曲検索システム10の動作の一例を示すフローチャートである。入力装置15を介してユーザから楽曲データの取得を指示された場合に、楽曲検索システム10は、本フローチャートに示す動作を開始する。
【0031】
まず、楽曲データ取得部49は、楽曲データが格納されている記録媒体19から楽曲データを取得し、取得した楽曲データを、当該楽曲データに対応する曲名、歌手名、およびアルバム名と共に楽曲情報格納部48に格納する(S100)。そして、楽曲データ取得部49は、新たに楽曲が登録された旨を歌詞データ取得部47に通知する。
【0032】
次に、歌詞データ取得部47は、歌詞データの取得の可否をユーザに問い合わせるための画面を表示装置18に表示し、入力装置15を介して、歌詞データの取得を許可する旨を示す入力をユーザから受け付けたか否かを判定する(S101)。歌詞データの取得を許可する旨を示す入力をユーザから受け付けなかった場合(S101:No)、楽曲検索システム10は、本フローチャートに示す動作を終了する。
【0033】
歌詞データの取得を許可する旨を示す入力をユーザから受け付けた場合(S101:Yes)、歌詞データ取得部47は、楽曲情報格納部48を参照して、歌詞データの取得を実行していない楽曲データを特定し、当該楽曲データに対応する曲名、歌手名、およびアルバム名を含む歌詞データ取得要求を生成し、生成した歌詞データ取得要求をアンテナ17を介して歌詞データ格納サーバ20へ送信する。
【0034】
そして、アンテナ17を介して、歌詞データを含む歌詞データ取得応答を受信した場合、歌詞データ取得部47は、当該歌詞データ取得応答に含まれている歌詞データを、対応する楽曲データに対応付けて楽曲情報格納部48に格納する(S102)。
【0035】
次に、歌詞データ取得部47は、辞書データ格納部46を参照して、歌詞データ取得応答に含まれている歌詞データ内の全ての単語が辞書データ格納部46内に格納されているか否かを判定する(S103)。歌詞データ取得応答に含まれている歌詞データ内の全ての単語が辞書データ格納部46内に格納されている場合(S103:Yes)、楽曲検索システム10は、本フローチャートに示す動作を終了する。
【0036】
歌詞データ取得応答に含まれている歌詞データ内に、辞書データ格納部46内に格納されていない単語がある場合(S103:No)、歌詞データ取得部47は、当該単語を示す情報を特徴量取得部45へ送る。そして、特徴量取得部45は、歌詞データ取得部47から受け取った単語を含む特徴量取得要求を生成し、生成した特徴量取得要求をアンテナ17を介して音声データ格納サーバ30へ送信する。
【0037】
そして、特徴量取得部45は、アンテナ17を介して、特徴量を示す情報を含む特徴量取得応答を受信することにより、単語の特徴量を取得する(S104)。そして、特徴量取得部45は、当該特徴量取得応答に含まれている特徴量を示す情報を、対応する単語と共に辞書データ格納部46に格納し(S105)、楽曲検索システム10は、本フローチャートに示す動作を終了する。
【0038】
図10は、楽曲データ再生時における楽曲検索システム10の動作の一例を示すフローチャートである。入力装置15を介してユーザから音声による楽曲検索の開始を指示された場合に、楽曲検索システム10は、本フローチャートに示す動作を開始する。
【0039】
まず、尤度算出部41は、マイク14を介して音声信号を取り込み、取り込んだ音声信号から音節毎の特徴量を抽出する。そして、尤度算出部41は、辞書データ格納部46を参照して、抽出した特徴量と、辞書データ格納部46内のそれぞれの単語の特徴量とを比較することにより、単語毎の尤度を算出し(S200)、算出した尤度を、対応する単語を示す情報と共に単語列特定部42へ出力する。
【0040】
次に、単語列特定部42は、尤度算出部41から出力された尤度に基づいて、音節毎に単語を特定する(S201)。そして、単語列特定部42は、特定した複数の単語を単語列として楽曲データ抽出部43へ出力する。
【0041】
次に、楽曲データ抽出部43は、単語列特定部42から受け取った単語列が含まれる歌詞データに対応付けられている楽曲データを楽曲情報格納部48から抽出し(S202)、抽出した楽曲データを再生部44へ送る。そして、再生部44は、楽曲データ抽出部43から受け取った楽曲データをスピーカ16を介して再生し(S203)、楽曲検索システム10は、本フローチャートに示す動作を終了する。
【0042】
図11は、歌詞データ格納サーバ20、音声データ格納サーバ30、または車載装置40の機能を実現するコンピュータ60のハードウェア構成の一例を示すハードウェア構成図である。コンピュータ60は、CPU(Central Processing Unit)61、RAM(Random Access Memory)62、ROM(Read Only Memory)63、HDD(Hard Disk Drive)64、通信装置65、入出力インターフェイス(I/F)66、およびメディアインターフェイス(I/F)67を備える。
【0043】
CPU61は、ROM63またはHDD64に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM63は、コンピュータ60の起動時にCPU61が実行するブートプログラムや、コンピュータ60のハードウェアに依存するプログラム等を格納する。HDD64は、CPU61によって実行されるプログラムを格納する。
【0044】
通信装置65は、通信回線を介して他の機器からデータを受信してCPU61へ送ると共に、CPU61によって生成されたデータを、通信回線を介して他の機器へ送信する。入出力インターフェイス66は、入出力装置からの信号を受信してCPU61へ送ると共に、CPU61から取得したデータを、入出力装置へ出力する。CPU61は、入出力インターフェイス66を介して入出力装置を制御し、入出力インターフェイス66を介して入出力装置から信号を取得すると共に、生成したデータを、入出力インターフェイス66を介して入出力装置へ出力する。
【0045】
メディアインターフェイス67は、記録媒体68に格納されたプログラムまたはデータを読み取り、RAM62に提供する。RAM62を介してCPU61に提供されるプログラムは、記録媒体68に格納されている。当該プログラムは、記録媒体68から読み出されて、RAM62を介してコンピュータ60にインストールされ、CPU61によって実行される。記録媒体68は、例えばDVD(Digital Versatile Disk)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
【0046】
コンピュータ60が歌詞データ格納サーバ20として機能する場合、コンピュータ60にインストールされて実行されるプログラムは、コンピュータ60を、歌詞データ格納部21および歌詞データ送信部22として機能させる。
【0047】
また、コンピュータ60が音声データ格納サーバ30として機能する場合、コンピュータ60にインストールされて実行されるプログラムは、コンピュータ60を、特徴データ格納部31および特徴データ送信部32として機能させる。
【0048】
また、コンピュータ60が車載装置40として機能する場合、コンピュータ60にインストールされて実行されるプログラムは、コンピュータ60を、尤度算出部41、単語列特定部42、楽曲データ抽出部43、再生部44、特徴量取得部45、辞書データ格納部46、歌詞データ取得部47、楽曲情報格納部48、および楽曲データ取得部49として機能させる。
【0049】
コンピュータ60は、これらのプログラムを、記録媒体68から読み取って実行するが、他の例として、コンピュータ60は、通信装置65により、通信回線を介してこれらのプログラムを取得してもよい。
【0050】
以上、本発明の実施の形態について説明した。
【0051】
上記説明から明らかなように、本実施形態の楽曲検索システム10によれば、ユーザが口ずさんだ歌詞を含む楽曲を検索して再生することができる。また、楽曲検索システム10は、ユーザが口ずさんだメロディーではなく、ユーザが口ずさんだ歌詞に基づいて楽曲を検索するため、音痴のユーザや、リズム感がないユーザであっても、所望の楽曲の歌詞を覚えていれば、曲名等を指定することなく楽曲を検索して再生させることができる。
【0052】
なお、本発明は、上記した実施形態に限定されるものではなく、その要旨の範囲内で数々の変形が可能である。
【0053】
例えば、車載装置40を、図12に示すように構成してもよい。図12に示す例において、車載装置40は、尤度算出部41、単語列特定部42、楽曲データ抽出部43、再生部44、特徴量取得部45、歌詞データ取得部47、楽曲情報格納部48、楽曲データ取得部49、第二の辞書データ50、第一の辞書データ51、およびコマンド実行部52を備える。なお、以下に説明する点を除き、図12において、図6と同じ符号を付した構成は、図6における構成と同一または同様の機能を有するため説明を省略する。
【0054】
第一の辞書データ51には、音声による楽曲検索時のみ使用される単語毎に、当該単語の特徴量が格納されている。コマンド実行部52には、楽曲検索時以外の音声認識時に使用される単語毎に、当該単語の特徴量が格納されている。
【0055】
歌詞データ取得部47は、歌詞データ取得応答に含まれている歌詞データを、対応する楽曲データに対応付けて楽曲情報格納部48に格納した後、第一の辞書データ51を参照して、当該歌詞データ取得応答に含まれている歌詞データ内の全ての単語が第一の辞書データ51内に格納されているか否かを判定する。歌詞データ取得応答に含まれている歌詞データ内に、第一の辞書データ51内に格納されていない単語がある場合、歌詞データ取得部47は、当該単語を示す情報を特徴量取得部45へ送る。
【0056】
特徴量取得部45は、アンテナ17を介して、特徴量取得応答を受信した場合に、当該特徴量取得応答に含まれている特徴量を示す情報を、対応する単語と共に第一の辞書データ51に格納する。
【0057】
尤度算出部41は、入力装置15を介してユーザから通常の音声認識を指示された場合に、マイク14を介して音声信号を取り込み、取り込んだ音声信号から音節毎の特徴量を抽出し、第二の辞書データ50を参照して、抽出した特徴量と、第二の辞書データ50内のそれぞれの単語の特徴量とを比較して、それぞれの単語の尤度を算出する。そして、尤度算出部41は、算出した尤度を、対応する単語を示す情報および通常の音声認識である旨を示す情報と共に単語列特定部42へ出力する。
【0058】
一方、入力装置15を介してユーザから音声による楽曲検索の開始を指示された場合、尤度算出部41は、マイク14を介して取り込んだ音声信号から音節毎の特徴量を抽出し、第一の辞書データ51を参照して、抽出した特徴量と、第一の辞書データ51内のそれぞれの単語の特徴量とを比較して、それぞれの単語の尤度を算出する。そして、尤度算出部41は、算出した尤度を、対応する単語を示す情報および楽曲検索である旨を示す情報と共に単語列特定部42へ出力する。
【0059】
単語列特定部42は、通常の音声認識である旨を示す情報と共に、単語および尤度を尤度算出部41から受け取った場合に、例えば尤度が最も高い単語を音声に対応する単語として特定し、特定した単語をコマンド実行部52へ出力する。コマンド実行部52は、単語列特定部42から出力された単語に対応するコマンドを実行する。
【0060】
一方、楽曲検索である旨を示す情報と共に、単語および尤度を尤度算出部41から受け取った場合、単語列特定部42は、例えば尤度が最も高い単語を音声に対応する単語として特定し、特定した複数の単語を単語列として楽曲データ抽出部43へ出力する。
【0061】
なお、上記した実施形態において、コンピュータ60は、歌詞データを、通信回線11を介して歌詞データ格納サーバ20から取得するが、他の形態として、コンピュータ60は、入力装置15を介してユーザから入力されえたテキストデータや、メモリカード等の記録媒体を介して入力されたテキストデータ等を歌詞データとして、ユーザから指定された楽曲データに対応付けて楽曲情報格納部48に格納してもよい。
【0062】
また、上記した実施形態において、コンピュータ60は、楽曲データを取得した場合に、対応する歌詞データおよび単語の特徴量を外部のサーバから取得するが、他の形態として、コンピュータ60は、歌詞データおよび単語の特徴量を、地図データの更新時等、他のデータの送受信の際に併せて取得するようにしてもよい。
【図面の簡単な説明】
【0063】
【図1】本発明の一実施形態にかかる楽曲検索システム10の構成を示すシステム構成図である。
【図2】歌詞データ格納サーバ20の機能構成の一例を示すブロック図である。
【図3】歌詞データ格納部21に格納されるデータの構造の一例を示す図である。
【図4】音声データ格納サーバ30の機能構成の一例を示すブロック図である。
【図5】特徴データ格納部31に格納されるデータの構造の一例を示す図である。
【図6】車載装置40の機能構成の一例を示すブロック図である。
【図7】辞書データ格納部46に格納されるデータの構造の一例を示す図である。
【図8】楽曲情報格納部48に格納されるデータの構造の一例を示す図である。
【図9】楽曲データ取得時における楽曲検索システム10の動作の一例を示すフローチャートである。
【図10】楽曲データ再生時における楽曲検索システム10の動作の一例を示すフローチャートである。
【図11】歌詞データ格納サーバ20、音声データ格納サーバ30、または車載装置40の機能を実現するコンピュータ60の一例を示すハードウェア構成図である。
【図12】車載装置40の機能構成の他の例を示すブロック図である。
【符号の説明】
【0064】
10・・・楽曲検索システム、11・・・通信回線、12・・・基地局、13・・・車両、14・・・マイク、15・・・入力装置、16・・・スピーカ、17・・・アンテナ、18・・・表示装置、19・・・記録媒体、20・・・歌詞データ格納サーバ、21・・・歌詞データ格納部、210・・・曲名、211・・・歌手名、212・・・アルバム名、213・・・歌詞データ、22・・・歌詞データ送信部、30・・・音声データ格納サーバ、31・・・特徴データ格納部、310・・・単語、311・・・特徴量、32・・・特徴データ送信部、40・・・車載装置、41・・・尤度算出部、42・・・単語列特定部、43・・・楽曲データ抽出部、44・・・再生部、45・・・特徴量取得部、46・・・辞書データ格納部、460・・・単語、461・・・特徴量、47・・・歌詞データ取得部、48・・・楽曲情報格納部、480・・・曲名、481・・・歌手名、482・・・アルバム名、483・・・楽曲データ、484・・・歌詞データ、49・・・楽曲データ取得部、50・・・第二の辞書データ、51・・・第一の辞書データ、52・・・コマンド実行部、60・・・コンピュータ、61・・・CPU、62・・・RAM、63・・・ROM、64・・・HDD、65・・・通信装置、66・・・入出力インターフェイス、67・・・メディアインターフェイス、68・・・記録媒体
【技術分野】
【0001】
本発明は、車両等の移動体に搭載され、楽曲データから楽曲を再生する機能を備える車載装置に関する。
【背景技術】
【0002】
特許文献1には、音声により入力されたアーティスト名、アルバム名、および曲名に基づいて、ハードディスクドライブ等に格納された楽曲データを検索して再生する再生装置が開示されている。
【0003】
【特許文献1】特開2005−78705号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
ところで、ハードディスクドライブ等に格納される楽曲数が多くなると、楽曲毎にアーティスト名、アルバム名、および曲名を覚えておくことが難しくなる場合がある。そのため、特許文献1の技術では、ユーザは、歌詞は覚えているものの、アーティスト名、アルバム名、および曲名を忘れてしまった楽曲を再生させることができない場合がある。
【0005】
本発明は上記事情を鑑みてなされたものであり、本発明の目的は、ユーザが口ずさんだ歌詞を含む楽曲を検索して再生することにある。
【課題を解決するための手段】
【0006】
上記課題を解決するために、本発明の車載装置は、楽曲データ毎に、当該楽曲の歌詞を示す歌詞データを予め格納し、ユーザが口ずさんだ楽曲の音声から単語列を認識し、当該単語列を含む歌詞データに対応する楽曲データを抽出して再生する。
【0007】
例えば、本発明の第一の態様は、車両に搭載される車載装置であって、楽曲データ毎に、当該楽曲の歌詞を示す歌詞データを格納する楽曲情報格納手段と、楽曲データを格納する記録媒体から楽曲データを取得して楽曲情報格納手段に格納する楽曲データ取得手段と、楽曲データ取得手段によって取得された楽曲データに対応する歌詞データを、外部から取得して楽曲情報格納手段に格納する歌詞データ取得手段と、ユーザが口ずさんだ音声から当該音声が示す単語列を特定する音声認識手段と、楽曲情報格納手段を参照して、音声認識手段によって特定された単語列と同一の単語列を含む歌詞データを特定し、特定した歌詞データに対応付けられている楽曲データを抽出する楽曲データ抽出手段と、楽曲データ抽出手段によって抽出された楽曲データを再生する再生手段とを備えることを特徴とする車載装置を提供する。
【0008】
また、本発明の第二の態様は、車両に搭載される車載装置と、車載装置の外部に設けられ、楽曲毎の歌詞データを格納する歌詞データ格納サーバとを備える楽曲検索システムであって、車載装置は、楽曲データ毎に、当該楽曲の歌詞を示す歌詞データを格納する楽曲情報格納手段と、楽曲データを格納する記録媒体から楽曲データを取得して楽曲情報格納手段に格納する楽曲データ取得手段と、楽曲データ取得手段によって取得された楽曲データに対応する歌詞データを、歌詞データ格納サーバから取得して楽曲情報格納手段に格納する歌詞データ取得手段と、ユーザが口ずさんだ音声から当該音声が示す単語列を特定する音声認識手段と、楽曲情報格納手段を参照して、音声認識手段によって特定された単語列と同一の単語列を含む歌詞データを特定し、特定した歌詞データに対応付けられている楽曲データを抽出する楽曲データ抽出手段と、楽曲データ抽出手段によって抽出された楽曲データを再生する再生手段とを備えることを特徴とする楽曲検索システム
【発明の効果】
【0009】
本発明の車載装置によれば、ユーザが口ずさんだ歌詞を含む楽曲を検索して再生することができる。
【発明を実施するための最良の形態】
【0010】
以下、本発明の実施の形態について、図面を参照しながら説明する。
【0011】
図1は、本発明の一実施形態にかかる楽曲検索システム10の構成を示すシステム構成図である。楽曲検索システム10は、歌詞データ格納サーバ20、音声データ格納サーバ30、および車載装置40を備える。歌詞データ格納サーバ20および音声データ格納サーバ30は、インターネット等の通信回線11に接続されている。車載装置40は、車両13に搭載され、通信回線11に接続されている基地局12と無線通信することにより、通信回線11を介して、歌詞データ格納サーバ20および音声データ格納サーバ30と通信する。
【0012】
歌詞データ格納サーバ20は、図2に示すように、歌詞データ格納部21および歌詞データ送信部22を備える。歌詞データ格納部21には、例えば図3に示すように、曲名210、当該曲名210に対応する楽曲を歌っている歌手の歌手名211、および当該曲名210に対応する楽曲が収録されているアルバムのアルバム名212に対応付けて、当該曲名210に対応する楽曲の歌詞を示す歌詞データ213が格納されている。
【0013】
歌詞データ送信部22は、通信回線11を介して、曲名、歌手名、およびアルバム名を含む歌詞データ取得要求を車載装置40から受信した場合に、当該歌詞データ取得要求に含まれている曲名、歌手名、およびアルバム名に対応する歌詞データを歌詞データ格納部21から抽出する。そして、歌詞データ送信部22は、抽出した歌詞データを含む歌詞データ取得応答を、歌詞データ取得要求の送信元へ返信する。
【0014】
音声データ格納サーバ30は、図4に示すように、特徴データ格納部31および特徴データ送信部32を備える。特徴データ格納部31には、例えば図5に示すように、単語310毎に、当該単語310を発声した場合の音声の特徴量311を示す情報が格納されている。特徴データ送信部32は、通信回線11を介して、単語を示す情報を含む特徴量取得要求を車載装置40から受信した場合に、当該特徴量取得要求に含まれている単語に対応する特徴量を特徴データ格納部31から抽出し、抽出した特徴量を示す情報を含む特徴量取得応答を、特徴量取得要求の送信元へ返信する。
【0015】
車載装置40は、例えば図6に示すように、尤度算出部41、単語列特定部42、楽曲データ抽出部43、再生部44、特徴量取得部45、辞書データ格納部46、歌詞データ取得部47、楽曲情報格納部48、および楽曲データ取得部49を備える。
【0016】
辞書データ格納部46には、例えば図7に示すように、単語460毎に、当該単語460を発声した場合の音声の特徴量461を示す情報が格納される。楽曲情報格納部48には、例えば図8に示すように、曲名480、当該曲名480に対応する楽曲を歌っている歌手の歌手名481、および当該曲名480に対応する楽曲が収録されているアルバムのアルバム名482に対応付けて、当該曲名480に対応する楽曲の楽曲データ483および当該曲名480に対応する楽曲の歌詞を示す歌詞データ484が格納される。
【0017】
楽曲データ取得部49は、タッチパネル等の入力装置15を介して、楽曲の取得をユーザから指示された場合に、CD(Compact Disc)等の記録媒体19から楽曲データを取得する。そして、楽曲データ取得部49は、ユーザから入力された情報または予めCDDB(Compact Disc DataBase)等から取得した情報から、当該楽曲データに対応する楽曲の曲名、歌手名、およびアルバム名を取得し、記録媒体19から取得した楽曲データを、取得した曲名、歌手名、およびアルバム名に対応付けて楽曲情報格納部48に格納する。そして、楽曲データ取得部49は、新たに楽曲が登録された旨を歌詞データ取得部47に通知する。
【0018】
歌詞データ取得部47は、新たに楽曲が登録された旨を楽曲データ取得部49から通知された場合に、歌詞データの取得の可否をユーザに問い合わせるための画面を、LCD(Liquid Crystal Display)等の表示装置18に表示する。
【0019】
そして、入力装置15を介して、歌詞データの取得を許可する旨を示す入力をユーザから受けた場合、歌詞データ取得部47は、楽曲情報格納部48を参照して、歌詞データの取得を実行していない楽曲データを特定し、当該楽曲データに対応する曲名、歌手名、およびアルバム名を含む歌詞データ取得要求を生成し、生成した歌詞データ取得要求をアンテナ17を介して歌詞データ格納サーバ20へ送信する。
【0020】
そして、アンテナ17を介して、歌詞データを含む歌詞データ取得応答を受信した場合、歌詞データ取得部47は、当該歌詞データ取得応答に含まれている歌詞データを、対応する楽曲データに対応付けて楽曲情報格納部48に格納する。
【0021】
そして、歌詞データ取得部47は、辞書データ格納部46を参照して、歌詞データ取得応答に含まれている歌詞データ内の全ての単語が辞書データ格納部46内に格納されているか否かを判定する。歌詞データ取得応答に含まれている歌詞データ内に、辞書データ格納部46内に格納されていない単語がある場合、歌詞データ取得部47は、当該単語を示す情報を特徴量取得部45へ送る。
【0022】
特徴量取得部45は、歌詞データ取得部47から単語を示す情報を受け取った場合に、当該単語を含む特徴量取得要求を生成し、生成した特徴量取得要求をアンテナ17を介して音声データ格納サーバ30へ送信する。そして、アンテナ17を介して、特徴量を示す情報を含む特徴量取得応答を受信した場合、特徴量取得部45は、当該特徴量取得応答に含まれている特徴量を示す情報を、対応する単語と共に辞書データ格納部46に格納する。
【0023】
尤度算出部41は、入力装置15を介してユーザから音声による楽曲検索の開始を指示された場合に、マイク14を介して音声信号を取り込み、取り込んだ音声信号から音節毎の特徴量を抽出する。そして、尤度算出部41は、辞書データ格納部46を参照して、抽出した特徴量と、辞書データ格納部46内のそれぞれの単語の特徴量とを比較して、特徴量が類似している割合が高いほど高い値を示す尤度を、それぞれの単語について算出する。
【0024】
そして、尤度算出部41は、算出した尤度を、対応する単語を示す情報と共に単語列特定部42へ出力する。なお、尤度算出部41は、それぞれの音節毎に、尤度の高い順に、所定個数(例えば10個以内)の単語を、対応する尤度と共に単語列特定部42へ出力するようにしてもよい。
【0025】
単語列特定部42は、尤度算出部41から出力された尤度に基づいて、例えば尤度が最も高い単語を音声に対応する単語として特定する。そして、単語列特定部42は、特定した複数の単語列を、楽曲データ抽出部43へ出力する。なお、単語列特定部42は、直前に尤度算出部41から出力された尤度の高い単語や、その後に尤度算出部41から出力された尤度の高い単語との前後関係も加味して音声に対応する単語を特定するようにしてもよい。
【0026】
楽曲データ抽出部43は、単語列特定部42から単語列を受け取った場合に、楽曲情報格納部48を参照して、当該単語列が含まれる歌詞データに対応付けられている楽曲データを抽出し、抽出した楽曲データを再生部44へ送る。再生部44は、楽曲データ抽出部43から受け取った楽曲データをスピーカ16を介して再生する。
【0027】
なお、単語列特定部42から出力された単語列を含む歌詞データが楽曲情報格納部48内に複数存在する場合、楽曲データ抽出部43は、当該複数の楽曲の曲名、歌手名、およびアルバム名を表示装置18に表示し、再生部44は、入力装置15を介してユーザから指定された楽曲を再生する。
【0028】
また、単語列特定部42から出力された単語列を含む歌詞データが楽曲情報格納部48内に存在しない場合、楽曲データ抽出部43は、当該単語列の一部が含まれている歌詞データに対応付けられている楽曲データの曲名、歌手名、およびアルバム名を表示装置18に表示し、再生部44は、入力装置15を介してユーザから再生が指定された場合に、当該楽曲データを再生するようにしてもよい。
【0029】
このとき、楽曲データ抽出部43は、単語列特定部42から出力された単語列に含まれる単語を含む歌詞データに対応付けられている楽曲データの曲名、歌手名、およびアルバム名を、当該単語列に含まれている単語の数が多い順に数曲分(例えば5曲分)表示装置18に表示するようにしてもよい。
【0030】
図9は、楽曲データ取得時における楽曲検索システム10の動作の一例を示すフローチャートである。入力装置15を介してユーザから楽曲データの取得を指示された場合に、楽曲検索システム10は、本フローチャートに示す動作を開始する。
【0031】
まず、楽曲データ取得部49は、楽曲データが格納されている記録媒体19から楽曲データを取得し、取得した楽曲データを、当該楽曲データに対応する曲名、歌手名、およびアルバム名と共に楽曲情報格納部48に格納する(S100)。そして、楽曲データ取得部49は、新たに楽曲が登録された旨を歌詞データ取得部47に通知する。
【0032】
次に、歌詞データ取得部47は、歌詞データの取得の可否をユーザに問い合わせるための画面を表示装置18に表示し、入力装置15を介して、歌詞データの取得を許可する旨を示す入力をユーザから受け付けたか否かを判定する(S101)。歌詞データの取得を許可する旨を示す入力をユーザから受け付けなかった場合(S101:No)、楽曲検索システム10は、本フローチャートに示す動作を終了する。
【0033】
歌詞データの取得を許可する旨を示す入力をユーザから受け付けた場合(S101:Yes)、歌詞データ取得部47は、楽曲情報格納部48を参照して、歌詞データの取得を実行していない楽曲データを特定し、当該楽曲データに対応する曲名、歌手名、およびアルバム名を含む歌詞データ取得要求を生成し、生成した歌詞データ取得要求をアンテナ17を介して歌詞データ格納サーバ20へ送信する。
【0034】
そして、アンテナ17を介して、歌詞データを含む歌詞データ取得応答を受信した場合、歌詞データ取得部47は、当該歌詞データ取得応答に含まれている歌詞データを、対応する楽曲データに対応付けて楽曲情報格納部48に格納する(S102)。
【0035】
次に、歌詞データ取得部47は、辞書データ格納部46を参照して、歌詞データ取得応答に含まれている歌詞データ内の全ての単語が辞書データ格納部46内に格納されているか否かを判定する(S103)。歌詞データ取得応答に含まれている歌詞データ内の全ての単語が辞書データ格納部46内に格納されている場合(S103:Yes)、楽曲検索システム10は、本フローチャートに示す動作を終了する。
【0036】
歌詞データ取得応答に含まれている歌詞データ内に、辞書データ格納部46内に格納されていない単語がある場合(S103:No)、歌詞データ取得部47は、当該単語を示す情報を特徴量取得部45へ送る。そして、特徴量取得部45は、歌詞データ取得部47から受け取った単語を含む特徴量取得要求を生成し、生成した特徴量取得要求をアンテナ17を介して音声データ格納サーバ30へ送信する。
【0037】
そして、特徴量取得部45は、アンテナ17を介して、特徴量を示す情報を含む特徴量取得応答を受信することにより、単語の特徴量を取得する(S104)。そして、特徴量取得部45は、当該特徴量取得応答に含まれている特徴量を示す情報を、対応する単語と共に辞書データ格納部46に格納し(S105)、楽曲検索システム10は、本フローチャートに示す動作を終了する。
【0038】
図10は、楽曲データ再生時における楽曲検索システム10の動作の一例を示すフローチャートである。入力装置15を介してユーザから音声による楽曲検索の開始を指示された場合に、楽曲検索システム10は、本フローチャートに示す動作を開始する。
【0039】
まず、尤度算出部41は、マイク14を介して音声信号を取り込み、取り込んだ音声信号から音節毎の特徴量を抽出する。そして、尤度算出部41は、辞書データ格納部46を参照して、抽出した特徴量と、辞書データ格納部46内のそれぞれの単語の特徴量とを比較することにより、単語毎の尤度を算出し(S200)、算出した尤度を、対応する単語を示す情報と共に単語列特定部42へ出力する。
【0040】
次に、単語列特定部42は、尤度算出部41から出力された尤度に基づいて、音節毎に単語を特定する(S201)。そして、単語列特定部42は、特定した複数の単語を単語列として楽曲データ抽出部43へ出力する。
【0041】
次に、楽曲データ抽出部43は、単語列特定部42から受け取った単語列が含まれる歌詞データに対応付けられている楽曲データを楽曲情報格納部48から抽出し(S202)、抽出した楽曲データを再生部44へ送る。そして、再生部44は、楽曲データ抽出部43から受け取った楽曲データをスピーカ16を介して再生し(S203)、楽曲検索システム10は、本フローチャートに示す動作を終了する。
【0042】
図11は、歌詞データ格納サーバ20、音声データ格納サーバ30、または車載装置40の機能を実現するコンピュータ60のハードウェア構成の一例を示すハードウェア構成図である。コンピュータ60は、CPU(Central Processing Unit)61、RAM(Random Access Memory)62、ROM(Read Only Memory)63、HDD(Hard Disk Drive)64、通信装置65、入出力インターフェイス(I/F)66、およびメディアインターフェイス(I/F)67を備える。
【0043】
CPU61は、ROM63またはHDD64に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM63は、コンピュータ60の起動時にCPU61が実行するブートプログラムや、コンピュータ60のハードウェアに依存するプログラム等を格納する。HDD64は、CPU61によって実行されるプログラムを格納する。
【0044】
通信装置65は、通信回線を介して他の機器からデータを受信してCPU61へ送ると共に、CPU61によって生成されたデータを、通信回線を介して他の機器へ送信する。入出力インターフェイス66は、入出力装置からの信号を受信してCPU61へ送ると共に、CPU61から取得したデータを、入出力装置へ出力する。CPU61は、入出力インターフェイス66を介して入出力装置を制御し、入出力インターフェイス66を介して入出力装置から信号を取得すると共に、生成したデータを、入出力インターフェイス66を介して入出力装置へ出力する。
【0045】
メディアインターフェイス67は、記録媒体68に格納されたプログラムまたはデータを読み取り、RAM62に提供する。RAM62を介してCPU61に提供されるプログラムは、記録媒体68に格納されている。当該プログラムは、記録媒体68から読み出されて、RAM62を介してコンピュータ60にインストールされ、CPU61によって実行される。記録媒体68は、例えばDVD(Digital Versatile Disk)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
【0046】
コンピュータ60が歌詞データ格納サーバ20として機能する場合、コンピュータ60にインストールされて実行されるプログラムは、コンピュータ60を、歌詞データ格納部21および歌詞データ送信部22として機能させる。
【0047】
また、コンピュータ60が音声データ格納サーバ30として機能する場合、コンピュータ60にインストールされて実行されるプログラムは、コンピュータ60を、特徴データ格納部31および特徴データ送信部32として機能させる。
【0048】
また、コンピュータ60が車載装置40として機能する場合、コンピュータ60にインストールされて実行されるプログラムは、コンピュータ60を、尤度算出部41、単語列特定部42、楽曲データ抽出部43、再生部44、特徴量取得部45、辞書データ格納部46、歌詞データ取得部47、楽曲情報格納部48、および楽曲データ取得部49として機能させる。
【0049】
コンピュータ60は、これらのプログラムを、記録媒体68から読み取って実行するが、他の例として、コンピュータ60は、通信装置65により、通信回線を介してこれらのプログラムを取得してもよい。
【0050】
以上、本発明の実施の形態について説明した。
【0051】
上記説明から明らかなように、本実施形態の楽曲検索システム10によれば、ユーザが口ずさんだ歌詞を含む楽曲を検索して再生することができる。また、楽曲検索システム10は、ユーザが口ずさんだメロディーではなく、ユーザが口ずさんだ歌詞に基づいて楽曲を検索するため、音痴のユーザや、リズム感がないユーザであっても、所望の楽曲の歌詞を覚えていれば、曲名等を指定することなく楽曲を検索して再生させることができる。
【0052】
なお、本発明は、上記した実施形態に限定されるものではなく、その要旨の範囲内で数々の変形が可能である。
【0053】
例えば、車載装置40を、図12に示すように構成してもよい。図12に示す例において、車載装置40は、尤度算出部41、単語列特定部42、楽曲データ抽出部43、再生部44、特徴量取得部45、歌詞データ取得部47、楽曲情報格納部48、楽曲データ取得部49、第二の辞書データ50、第一の辞書データ51、およびコマンド実行部52を備える。なお、以下に説明する点を除き、図12において、図6と同じ符号を付した構成は、図6における構成と同一または同様の機能を有するため説明を省略する。
【0054】
第一の辞書データ51には、音声による楽曲検索時のみ使用される単語毎に、当該単語の特徴量が格納されている。コマンド実行部52には、楽曲検索時以外の音声認識時に使用される単語毎に、当該単語の特徴量が格納されている。
【0055】
歌詞データ取得部47は、歌詞データ取得応答に含まれている歌詞データを、対応する楽曲データに対応付けて楽曲情報格納部48に格納した後、第一の辞書データ51を参照して、当該歌詞データ取得応答に含まれている歌詞データ内の全ての単語が第一の辞書データ51内に格納されているか否かを判定する。歌詞データ取得応答に含まれている歌詞データ内に、第一の辞書データ51内に格納されていない単語がある場合、歌詞データ取得部47は、当該単語を示す情報を特徴量取得部45へ送る。
【0056】
特徴量取得部45は、アンテナ17を介して、特徴量取得応答を受信した場合に、当該特徴量取得応答に含まれている特徴量を示す情報を、対応する単語と共に第一の辞書データ51に格納する。
【0057】
尤度算出部41は、入力装置15を介してユーザから通常の音声認識を指示された場合に、マイク14を介して音声信号を取り込み、取り込んだ音声信号から音節毎の特徴量を抽出し、第二の辞書データ50を参照して、抽出した特徴量と、第二の辞書データ50内のそれぞれの単語の特徴量とを比較して、それぞれの単語の尤度を算出する。そして、尤度算出部41は、算出した尤度を、対応する単語を示す情報および通常の音声認識である旨を示す情報と共に単語列特定部42へ出力する。
【0058】
一方、入力装置15を介してユーザから音声による楽曲検索の開始を指示された場合、尤度算出部41は、マイク14を介して取り込んだ音声信号から音節毎の特徴量を抽出し、第一の辞書データ51を参照して、抽出した特徴量と、第一の辞書データ51内のそれぞれの単語の特徴量とを比較して、それぞれの単語の尤度を算出する。そして、尤度算出部41は、算出した尤度を、対応する単語を示す情報および楽曲検索である旨を示す情報と共に単語列特定部42へ出力する。
【0059】
単語列特定部42は、通常の音声認識である旨を示す情報と共に、単語および尤度を尤度算出部41から受け取った場合に、例えば尤度が最も高い単語を音声に対応する単語として特定し、特定した単語をコマンド実行部52へ出力する。コマンド実行部52は、単語列特定部42から出力された単語に対応するコマンドを実行する。
【0060】
一方、楽曲検索である旨を示す情報と共に、単語および尤度を尤度算出部41から受け取った場合、単語列特定部42は、例えば尤度が最も高い単語を音声に対応する単語として特定し、特定した複数の単語を単語列として楽曲データ抽出部43へ出力する。
【0061】
なお、上記した実施形態において、コンピュータ60は、歌詞データを、通信回線11を介して歌詞データ格納サーバ20から取得するが、他の形態として、コンピュータ60は、入力装置15を介してユーザから入力されえたテキストデータや、メモリカード等の記録媒体を介して入力されたテキストデータ等を歌詞データとして、ユーザから指定された楽曲データに対応付けて楽曲情報格納部48に格納してもよい。
【0062】
また、上記した実施形態において、コンピュータ60は、楽曲データを取得した場合に、対応する歌詞データおよび単語の特徴量を外部のサーバから取得するが、他の形態として、コンピュータ60は、歌詞データおよび単語の特徴量を、地図データの更新時等、他のデータの送受信の際に併せて取得するようにしてもよい。
【図面の簡単な説明】
【0063】
【図1】本発明の一実施形態にかかる楽曲検索システム10の構成を示すシステム構成図である。
【図2】歌詞データ格納サーバ20の機能構成の一例を示すブロック図である。
【図3】歌詞データ格納部21に格納されるデータの構造の一例を示す図である。
【図4】音声データ格納サーバ30の機能構成の一例を示すブロック図である。
【図5】特徴データ格納部31に格納されるデータの構造の一例を示す図である。
【図6】車載装置40の機能構成の一例を示すブロック図である。
【図7】辞書データ格納部46に格納されるデータの構造の一例を示す図である。
【図8】楽曲情報格納部48に格納されるデータの構造の一例を示す図である。
【図9】楽曲データ取得時における楽曲検索システム10の動作の一例を示すフローチャートである。
【図10】楽曲データ再生時における楽曲検索システム10の動作の一例を示すフローチャートである。
【図11】歌詞データ格納サーバ20、音声データ格納サーバ30、または車載装置40の機能を実現するコンピュータ60の一例を示すハードウェア構成図である。
【図12】車載装置40の機能構成の他の例を示すブロック図である。
【符号の説明】
【0064】
10・・・楽曲検索システム、11・・・通信回線、12・・・基地局、13・・・車両、14・・・マイク、15・・・入力装置、16・・・スピーカ、17・・・アンテナ、18・・・表示装置、19・・・記録媒体、20・・・歌詞データ格納サーバ、21・・・歌詞データ格納部、210・・・曲名、211・・・歌手名、212・・・アルバム名、213・・・歌詞データ、22・・・歌詞データ送信部、30・・・音声データ格納サーバ、31・・・特徴データ格納部、310・・・単語、311・・・特徴量、32・・・特徴データ送信部、40・・・車載装置、41・・・尤度算出部、42・・・単語列特定部、43・・・楽曲データ抽出部、44・・・再生部、45・・・特徴量取得部、46・・・辞書データ格納部、460・・・単語、461・・・特徴量、47・・・歌詞データ取得部、48・・・楽曲情報格納部、480・・・曲名、481・・・歌手名、482・・・アルバム名、483・・・楽曲データ、484・・・歌詞データ、49・・・楽曲データ取得部、50・・・第二の辞書データ、51・・・第一の辞書データ、52・・・コマンド実行部、60・・・コンピュータ、61・・・CPU、62・・・RAM、63・・・ROM、64・・・HDD、65・・・通信装置、66・・・入出力インターフェイス、67・・・メディアインターフェイス、68・・・記録媒体
【特許請求の範囲】
【請求項1】
車両に搭載される車載装置であって、
楽曲データ毎に、当該楽曲の歌詞を示す歌詞データを格納する楽曲情報格納手段と、
楽曲データを格納する記録媒体から楽曲データを取得して前記楽曲情報格納手段に格納する楽曲データ取得手段と、
前記楽曲データ取得手段によって取得された楽曲データに対応する歌詞データを、外部から取得して前記楽曲情報格納手段に格納する歌詞データ取得手段と、
ユーザが口ずさんだ音声から当該音声が示す単語列を特定する音声認識手段と、
前記楽曲情報格納手段を参照して、前記音声認識手段によって特定された単語列と同一の単語列を含む歌詞データを特定し、特定した歌詞データに対応付けられている楽曲データを抽出する楽曲データ抽出手段と、
前記楽曲データ抽出手段によって抽出された楽曲データを再生する再生手段と
を備えることを特徴とする車載装置。
【請求項2】
請求項1に記載の車載装置であって、
前記歌詞データ取得手段は、
前記車載装置の外部に設けられ、楽曲毎の歌詞データを格納する歌詞データ格納サーバから、通信回線を介して歌詞データを取得することを特徴とする車載装置。
【請求項3】
請求項2に記載の車載装置であって、
前記歌詞データ取得手段は、
前記楽曲データ取得手段が新たに楽曲を取得して前記楽曲情報格納手段に格納した場合に、当該楽曲に対応する歌詞データを、前記歌詞データ格納サーバから取得して、当該楽曲データに対応付けて前記楽曲情報格納手段に格納することを特徴とする車載装置。
【請求項4】
請求項2に記載の車載装置であって、
前記歌詞データ取得手段は、
前記楽曲データ取得手段が新たに楽曲を取得して前記楽曲情報格納手段に格納した場合に、当該楽曲に対応する歌詞データの取得の可否をユーザに問い合わせ、ユーザから当該歌詞データの取得を許可された場合に、前記歌詞データ格納サーバから取得することを特徴とする車載装置。
【請求項5】
請求項1から4のいずれか一項に記載の車載装置であって、
単語毎に、当該単語を発声した場合の特徴量を示す情報を格納する音声データ格納サーバから、指定された単語の特徴量を取得する特徴量取得手段をさらに備え、
前記音声認識手段は、
複数の単語のそれぞれを、対応する特徴量を示す情報と共に格納する辞書データ格納手段と、
ユーザが口ずさんだ音声をマイクを介して受信し、受信した音声の特徴量を算出し、算出した特徴量に基づいて、前記辞書データ格納手段に格納されている単語の中で、類似している割合が高いほど高い値を示す尤度を算出する尤度算出手段と、
前記尤度算出手段によって算出された尤度に基づいて、マイクを介して受信した音声に対応する単語列を特定する単語列特定手段と
を有し、
前記歌詞データ取得手段は、
歌詞データを外部から新たに取得した場合に、当該歌詞データ内の単語が、前記辞書データ格納手段内に格納されていないならば、前記特徴量取得手段に指示して、当該単語の特徴量を示す情報を前記音声データ格納サーバから取得させ、前記特徴量取得手段によって取得された特徴量を示す情報を、対応する単語と共に前記辞書データ格納手段に格納することを特徴とする車載装置。
【請求項6】
請求項1から4のいずれか一項に記載の車載装置であって、
単語毎に、当該単語を発声した場合の特徴量を示す情報を格納する音声データ格納サーバから、指定された単語の特徴量を取得する特徴量取得手段をさらに備え、
前記音声認識手段は、
複数の単語のそれぞれを、対応する特徴量を示す情報と共に格納する、楽曲検索時の音声認識において使用される第一の辞書データ格納手段と、
複数の単語のそれぞれを、対応する特徴量を示す情報と共に格納する、楽曲検索時以外の通常の音声認識において使用される第二の辞書データ格納手段と、
ユーザが発した音声をマイクを介して受信し、受信した音声の特徴量を算出し、算出した特徴量に基づいて、楽曲検索時の音声認識では、前記第一の辞書データ格納手段に格納されている単語の中で、類似している割合が高いほど高い値を示す尤度を算出し、楽曲検索時以外の音声認識では、前記第二の辞書データ格納手段に格納されている単語の中で尤度を算出する尤度算出手段と、
前記尤度算出手段によって算出された尤度に基づいて、マイクを介して受信した音声に対応する単語列を特定する単語列特定手段と
を有し、
前記歌詞データ取得手段は、
歌詞データを外部から新たに取得した場合に、当該歌詞データ内の単語が、前記第一の辞書データ格納手段内に格納されていないならば、前記特徴量取得手段に指示して、当該単語の特徴量を示す情報を前記音声データ格納サーバから取得させ、前記特徴量取得手段によって取得された特徴量を示す情報を、対応する単語と共に前記第一の辞書データ格納手段に格納することを特徴とする車載装置。
【請求項7】
車両に搭載される車載装置と、
前記車載装置の外部に設けられ、楽曲毎の歌詞データを格納する歌詞データ格納サーバと
を備える楽曲検索システムであって、
前記車載装置は、
楽曲データ毎に、当該楽曲の歌詞を示す歌詞データを格納する楽曲情報格納手段と、
楽曲データを格納する記録媒体から楽曲データを取得して前記楽曲情報格納手段に格納する楽曲データ取得手段と、
前記楽曲データ取得手段によって取得された楽曲データに対応する歌詞データを、前記歌詞データ格納サーバから取得して前記楽曲情報格納手段に格納する歌詞データ取得手段と、
ユーザが口ずさんだ音声から当該音声が示す単語列を特定する音声認識手段と、
前記楽曲情報格納手段を参照して、前記音声認識手段によって特定された単語列と同一の単語列を含む歌詞データを特定し、特定した歌詞データに対応付けられている楽曲データを抽出する楽曲データ抽出手段と、
前記楽曲データ抽出手段によって抽出された楽曲データを再生する再生手段と
を備えることを特徴とする楽曲検索システム。
【請求項1】
車両に搭載される車載装置であって、
楽曲データ毎に、当該楽曲の歌詞を示す歌詞データを格納する楽曲情報格納手段と、
楽曲データを格納する記録媒体から楽曲データを取得して前記楽曲情報格納手段に格納する楽曲データ取得手段と、
前記楽曲データ取得手段によって取得された楽曲データに対応する歌詞データを、外部から取得して前記楽曲情報格納手段に格納する歌詞データ取得手段と、
ユーザが口ずさんだ音声から当該音声が示す単語列を特定する音声認識手段と、
前記楽曲情報格納手段を参照して、前記音声認識手段によって特定された単語列と同一の単語列を含む歌詞データを特定し、特定した歌詞データに対応付けられている楽曲データを抽出する楽曲データ抽出手段と、
前記楽曲データ抽出手段によって抽出された楽曲データを再生する再生手段と
を備えることを特徴とする車載装置。
【請求項2】
請求項1に記載の車載装置であって、
前記歌詞データ取得手段は、
前記車載装置の外部に設けられ、楽曲毎の歌詞データを格納する歌詞データ格納サーバから、通信回線を介して歌詞データを取得することを特徴とする車載装置。
【請求項3】
請求項2に記載の車載装置であって、
前記歌詞データ取得手段は、
前記楽曲データ取得手段が新たに楽曲を取得して前記楽曲情報格納手段に格納した場合に、当該楽曲に対応する歌詞データを、前記歌詞データ格納サーバから取得して、当該楽曲データに対応付けて前記楽曲情報格納手段に格納することを特徴とする車載装置。
【請求項4】
請求項2に記載の車載装置であって、
前記歌詞データ取得手段は、
前記楽曲データ取得手段が新たに楽曲を取得して前記楽曲情報格納手段に格納した場合に、当該楽曲に対応する歌詞データの取得の可否をユーザに問い合わせ、ユーザから当該歌詞データの取得を許可された場合に、前記歌詞データ格納サーバから取得することを特徴とする車載装置。
【請求項5】
請求項1から4のいずれか一項に記載の車載装置であって、
単語毎に、当該単語を発声した場合の特徴量を示す情報を格納する音声データ格納サーバから、指定された単語の特徴量を取得する特徴量取得手段をさらに備え、
前記音声認識手段は、
複数の単語のそれぞれを、対応する特徴量を示す情報と共に格納する辞書データ格納手段と、
ユーザが口ずさんだ音声をマイクを介して受信し、受信した音声の特徴量を算出し、算出した特徴量に基づいて、前記辞書データ格納手段に格納されている単語の中で、類似している割合が高いほど高い値を示す尤度を算出する尤度算出手段と、
前記尤度算出手段によって算出された尤度に基づいて、マイクを介して受信した音声に対応する単語列を特定する単語列特定手段と
を有し、
前記歌詞データ取得手段は、
歌詞データを外部から新たに取得した場合に、当該歌詞データ内の単語が、前記辞書データ格納手段内に格納されていないならば、前記特徴量取得手段に指示して、当該単語の特徴量を示す情報を前記音声データ格納サーバから取得させ、前記特徴量取得手段によって取得された特徴量を示す情報を、対応する単語と共に前記辞書データ格納手段に格納することを特徴とする車載装置。
【請求項6】
請求項1から4のいずれか一項に記載の車載装置であって、
単語毎に、当該単語を発声した場合の特徴量を示す情報を格納する音声データ格納サーバから、指定された単語の特徴量を取得する特徴量取得手段をさらに備え、
前記音声認識手段は、
複数の単語のそれぞれを、対応する特徴量を示す情報と共に格納する、楽曲検索時の音声認識において使用される第一の辞書データ格納手段と、
複数の単語のそれぞれを、対応する特徴量を示す情報と共に格納する、楽曲検索時以外の通常の音声認識において使用される第二の辞書データ格納手段と、
ユーザが発した音声をマイクを介して受信し、受信した音声の特徴量を算出し、算出した特徴量に基づいて、楽曲検索時の音声認識では、前記第一の辞書データ格納手段に格納されている単語の中で、類似している割合が高いほど高い値を示す尤度を算出し、楽曲検索時以外の音声認識では、前記第二の辞書データ格納手段に格納されている単語の中で尤度を算出する尤度算出手段と、
前記尤度算出手段によって算出された尤度に基づいて、マイクを介して受信した音声に対応する単語列を特定する単語列特定手段と
を有し、
前記歌詞データ取得手段は、
歌詞データを外部から新たに取得した場合に、当該歌詞データ内の単語が、前記第一の辞書データ格納手段内に格納されていないならば、前記特徴量取得手段に指示して、当該単語の特徴量を示す情報を前記音声データ格納サーバから取得させ、前記特徴量取得手段によって取得された特徴量を示す情報を、対応する単語と共に前記第一の辞書データ格納手段に格納することを特徴とする車載装置。
【請求項7】
車両に搭載される車載装置と、
前記車載装置の外部に設けられ、楽曲毎の歌詞データを格納する歌詞データ格納サーバと
を備える楽曲検索システムであって、
前記車載装置は、
楽曲データ毎に、当該楽曲の歌詞を示す歌詞データを格納する楽曲情報格納手段と、
楽曲データを格納する記録媒体から楽曲データを取得して前記楽曲情報格納手段に格納する楽曲データ取得手段と、
前記楽曲データ取得手段によって取得された楽曲データに対応する歌詞データを、前記歌詞データ格納サーバから取得して前記楽曲情報格納手段に格納する歌詞データ取得手段と、
ユーザが口ずさんだ音声から当該音声が示す単語列を特定する音声認識手段と、
前記楽曲情報格納手段を参照して、前記音声認識手段によって特定された単語列と同一の単語列を含む歌詞データを特定し、特定した歌詞データに対応付けられている楽曲データを抽出する楽曲データ抽出手段と、
前記楽曲データ抽出手段によって抽出された楽曲データを再生する再生手段と
を備えることを特徴とする楽曲検索システム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【公開番号】特開2009−92977(P2009−92977A)
【公開日】平成21年4月30日(2009.4.30)
【国際特許分類】
【出願番号】特願2007−264133(P2007−264133)
【出願日】平成19年10月10日(2007.10.10)
【出願人】(591132335)株式会社ザナヴィ・インフォマティクス (745)
【Fターム(参考)】
【公開日】平成21年4月30日(2009.4.30)
【国際特許分類】
【出願日】平成19年10月10日(2007.10.10)
【出願人】(591132335)株式会社ザナヴィ・インフォマティクス (745)
【Fターム(参考)】
[ Back to top ]