説明

評価装置

【課題】カラオケ演奏の再生などの処理を行う通信装置以外の装置において、利用者の歌唱音声を評価区間毎に評価し、その評価結果を逐次出力する。
【解決手段】採点サーバ装置は、利用者の歌唱音声を表す歌唱データをストリーミング方式でカラオケ装置から取得し、取得した歌唱データをメモリに記憶させる。また、採点サーバ装置は、メモリに記憶されている歌唱データの時間軸を、採点処理の対象となる複数の採点区間に分割し、分割された各々の採点区間を時間軸上の位置に応じた順番で選択し、選択された採点区間に含まれる歌唱データを、その採点区間に対応する区間に含まれる模範歌唱データと比較することにより、選択された採点区間における利用者の歌唱音声を採点し、採点結果を生成する。そして、採点サーバ装置は、各採点区間における採点結果が生成される度に、生成された採点結果をカラオケ装置に送信する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、歌唱を評価する技術に関する。
【背景技術】
【0002】
カラオケ装置を用いて行われた利用者の歌唱の巧拙を採点する技術が知られている。例えば、特許文献1〜3には、カラオケ演奏を再生するカラオケ装置において、利用者の歌唱の採点を行う技術が開示されている。また、特許文献4,5には、教師がコンピュータ装置を用いて遠隔にいる生徒の歌声を再生し、生徒の歌声の添削を行い、その添削結果を生徒に送信する技術が開示されている。また、特許文献6には、通信カラオケシステムのサーバが、歌唱者の使用する通信端末にカラオケデータを配信するとともに通信端末から歌唱者の歌唱音声信号を受信し、カラオケデータの配信が終了した時に、受信した歌唱音声信号に基づいて歌唱者の歌唱力を判定し、その判定結果を通信端末に送信する技術が開示されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2003−216168号公報
【特許文献2】特開2007−121550号公報
【特許文献3】特開平10−222182号公報
【特許文献4】特許第4087087号公報
【特許文献5】特開2003−15673号公報
【特許文献6】特開2007−17849号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
ところで、上述した特許文献1〜3のように、各々のカラオケ装置に利用者の歌唱を採点する採点機能を設けると、カラオケ装置のコストが高くなってしまう。また、カラオケ装置では、カラオケ演奏の再生などの処理も行わなくてはならないため、処理負荷の高い精密な採点処理を行うことができない。さらに、新たな採点機能を追加する場合には、カラオケ装置の1つひとつに新たな採点機能を追加しなくてはならないため、その作業に時間と手間がかかってしまう。
本発明は、カラオケ演奏の再生などの処理を行う通信装置以外の装置において、利用者の歌唱音声を評価区間毎に評価し、その評価結果を逐次出力することを目的とする。
【課題を解決するための手段】
【0005】
本発明は、模範となる歌唱音声を表す模範音声データを記憶する第1の記憶手段と、利用者の歌唱音声を表す音声データをストリーミング方式で通信装置から取得する取得手段と、前記取得手段によって取得された音声データを記憶する第2の記憶手段と、前記第2の記憶手段に記憶されている前記音声データの時間軸を、歌唱音声の評価の対象となる複数の評価区間に分割する分割手段と、前記分割手段によって分割された各々の評価区間を時間軸上の位置に応じた順番で選択し、選択された当該評価区間に含まれる音声データを、前記第1の記憶手段に記憶されている当該評価区間に対応する区間に含まれる模範音声データと比較することにより、当該選択された評価区間における前記利用者の歌唱音声を評価し、評価結果を生成する評価手段と、前記評価手段によって各評価区間における評価結果が生成される度に、生成された当該評価結果を前記通信装置に送信する送信手段とを備えることを特徴とする評価装置を提供する。
【0006】
本発明の好ましい態様において、前記模範音声データには、前記模範となる歌唱音声に含まれる各フレーズの時間軸上の区切り位置を示す区切データが付加されており、前記分割手段は、前記第2の記憶手段に記憶されている音声データの時間軸を、前記第1の記憶手段に記憶されている模範音声データにおいて前記区切データによって区切られた各フレーズ区間に対応する複数の評価区間に分割してもよい。
【0007】
本発明の好ましい態様において、前記通信装置は種別の異なるものが複数あり、前記評価手段は、前記取得手段が予め決められた種別の通信装置から前記音声データを取得した場合には、当該予め決められた種別とは異なる種別の通信装置から前記音声データを取得した場合よりも簡易な内容で前記評価を行ってもよい。
【発明の効果】
【0008】
本発明によれば、カラオケ演奏の再生などの処理を行う通信装置以外の装置において、利用者の歌唱音声を評価区間毎に評価し、その評価結果を逐次出力することができる。
【図面の簡単な説明】
【0009】
【図1】実施形態に係る採点システムの構成を示すブロック図である。
【図2】前記採点システムのカラオケ装置の構成を示すブロック図である。
【図3】前記採点システムの採点サーバ装置の構成を示すブロック図である。
【図4】前記採点システムの動作を示すシーケンス図である。
【図5】前記採点システムが用いる歌唱データ及び模範歌唱データの一例を示す図である。
【発明を実施するための形態】
【0010】
[構成]
図1は、本実施形態に係る採点システム1の構成を示すブロック図である。同図に示すように、採点システム1は、複数のカラオケ装置10と、採点サーバ装置20とを備えている。採点サーバ装置20とカラオケ装置10とは、インターネットなどのネットワークNを介して接続されている。このカラオケ装置10は、本発明に係る通信装置として機能する。また、採点サーバ装置20は、本発明に係る評価装置として機能する。
【0011】
(カラオケ装置)
次に、カラオケ装置10の構成について説明する。このカラオケ装置10は、例えばカラオケ店などに設置されている。図2は、カラオケ装置10の構成を示すブロック図である。同図に示すように、カラオケ装置10は、CPU(Central Processing Unit)11と、メモリ12と、通信部13と、記憶部14と、操作部15と、表示部16と、収音部17と、音源部18と、放音部19とを備えている。CPU11は、メモリ12に記憶されているプログラムを実行することにより、カラオケ装置10の各部を制御する。メモリ12は、例えばROM(Read Only Memory)とRAM(Random Access Memory)とを備えており、CPU11によって用いられるプログラムやデータを記憶する。通信部13は、ネットワークNを介して接続された採点サーバ装置20と通信を行う。記憶部14は、例えばハードディスクを備えており、各々のカラオケ装置10を識別するために用いられる装置IDと、利用者が歌唱を行うときに用いられる複数のカラオケデータDkとを記憶している。このカラオケデータDkには、演奏データと歌詞データとが含まれている。演奏データは、楽曲の演奏音を表すデータである。この演奏音には歌声は含まれていない。歌詞データは、楽曲の歌詞を示すデータである。操作部15は、例えば複数の操作ボタンを備えており、利用者の操作に応じた操作信号をCPU11に入力する。表示部16は、例えば液晶ディスプレイを備えており、CPU11の制御に応じた画像を表示する。収音部17は、例えばマイクロホンとA/D変換部とを備えており、収集した音声に応じたアナログ信号を生成し、生成したアナログ信号をA/D変換によりデジタルデータに変換して出力する。音源部18は、記憶部14に記憶されている演奏データに応じた音声信号を生成して放音部19に供給する。放音部19は、例えばスピーカー、D/A変換部及びアンプを備えており、音源部18から供給された音声信号をD/A変換によりアナログ信号に変換し、変換したアナログ信号を増幅して音声として放出する。
【0012】
(採点サーバ装置)
次に、採点サーバ装置20の構成について説明する。この採点サーバ装置20は、カラオケ装置10と同じカラオケ店に設置されていてもよいし、カラオケ店とは異なる場所に設置されていてもよい。図3は、採点サーバ装置20の構成を示すブロック図である。同図に示すように、採点サーバ装置20は、CPU21と、メモリ22と、通信部23と、記憶部24と、処理部25とを備えている。CPU21は、メモリ22に記憶されているプログラムを実行することにより、採点サーバ装置20の各部を制御する。メモリ22は、例えばROMとRAMとを備えており、CPU21によって用いられるプログラムやデータを記憶する。通信部23は、ネットワークNを介して接続された各カラオケ装置10と通信を行う。記憶部24は、例えばハードディスクを備えており、模範となる歌唱音声を表す複数の模範歌唱データDrを記憶している。つまり、この記憶部24は、模範となる歌唱音声を表す模範音声データ(模範歌唱データ)を記憶する第1の記憶手段として機能する。この模範歌唱データDrには、模範となる歌唱音声に含まれる各フレーズの時間軸上の区切り位置を示す区切データkが付加されている。処理部25は、例えばDSP(Digital Signal Processor)であり、カラオケ装置10から送信されてくる歌唱データDxと、記憶部24に記憶されている模範歌唱データDrとを比較して、利用者の歌唱の巧拙を評価する採点処理を行う。
【0013】
[動作]
次に、本実施形態に係る採点システム1の動作について説明する。図4は、採点システム1の動作を示すシーケンス図である。まず、利用者は、カラオケ装置10の操作部15を操作して、歌唱したい楽曲の楽曲IDを入力し、演奏開始を指示する。この楽曲IDとしては、例えば楽曲の名前や楽曲に割り当てられた番号などが用いられる。CPU11は、この操作に応じて、通信部13によって採点サーバ装置20との通信を確立させた後(ステップS11)、利用者によって入力された楽曲IDと記憶部14に記憶されている装置IDとを採点サーバ装置20に送信する(ステップS12)。このとき、通信部13は、公開されているAPI(Application Programming Interface)を用いて、採点サーバ装置20と通信を行う。カラオケ装置10から楽曲ID及び装置IDが送信されてくると、採点サーバ装置20のCPU21は、この楽曲ID及び装置IDを通信部23によって受信する(ステップS13)。
【0014】
また、カラオケ装置10のCPU11は、入力された楽曲IDの楽曲のカラオケデータDkを記憶部14から順次読み出し、カラオケ再生処理を行う(ステップS14)。具体的には、CPU11は、記憶部14から読み出したカラオケデータDkに含まれる演奏データを音源部18に供給する。音源部18は、CPU11によって供給された演奏データに応じた音声信号を生成し、生成した音声信号を放音部19に供給して、その音声信号に応じた音声を放出させる。これにより、利用者によって指定された楽曲の演奏が開始される。また、CPU11は、楽曲の演奏と同期するように、記憶部14から読み出したカラオケデータDkに含まれる歌詞データを表示部16に供給する。これにより、利用者によって指定された楽曲の歌詞が表示される。
【0015】
利用者は、楽曲の演奏に合わせて収音部17に向かって歌唱する。このとき、収音部17は、利用者の歌唱音声を収集し、収集した歌唱音声を表す歌唱データDxを生成する。CPU11は、収音部17によって生成された歌唱データDxを順次放音部19に供給し、その歌唱データDxに応じた歌唱音声を楽曲の演奏とともに放出させる。また、CPU11は、収音部17によって生成された歌唱データDxを順次通信部13に供給する。通信部13は、CPU11によって供給された歌唱データDxをストリーミング方式で採点サーバ装置20に送信する(ステップS15)。ストリーミング方式のデータ送信では、データが或るPDU(Protocol Data Unit)単位(例えば、パケット単位)で分割されて送信される。そのため、データの受信側では、データ全体を受信し終わるのを待つことなく、データをPDU単位で受信して処理を行うことができる。
【0016】
カラオケ装置10から歌唱データDxが送信されてくると、採点サーバ装置20のCPU21は、この歌唱データDxを通信部23によって受信し(ステップS16)、受信した歌唱データをメモリ22に記憶させる。つまり、CPU21は、利用者の歌唱音声を表す音声データ(歌唱データ)をストリーミング方式でカラオケ装置10から取得する取得手段として機能する。また、メモリ22は、CPU21によって取得された音声データを記憶する第2の記憶手段として機能する。上述したように、この歌唱データDxはPDU単位で送信されてくる。よって、メモリ22には、PDU単位で送信されてきた歌唱データが順次記憶されていくことになる。
【0017】
続いて、処理部25は、メモリ22に記憶されている歌唱データDxの時間軸を、採点処理の対象となる複数の採点区間に分割する(ステップS17)。この採点区間は、利用者の歌唱音声の評価の対象となる評価区間として用いられる。つまり、処理部25は、メモリ22に記憶されている音声データの時間軸を、歌唱音声の評価の対象となる複数の評価区間に分割する分割手段として機能する。図5を参照して具体的に説明すると、処理部25は、まず記憶部24に記憶されている模範歌唱データDrにおいて、区切データkによって区切られたフレーズ区間f1,f2,f3,f4・・・を特定する。続いて、処理部25は、メモリ22に記憶されている歌唱データDxの時間軸を、特定した各フレーズ区間に対応する採点区間に分割する。この例では、歌唱データDxの時間軸が、フレーズ区間f1に対応する採点区間h1,フレーズ区間f2に対応する採点区間h2,フレーズ区間f3に対応する採点区間h3,フレーズ区間f4に対応する採点区間h4・・・に分割される。つまり、処理部25は、メモリ22に記憶されている音声データの時間軸を、記憶部24に記憶されている模範音声データにおいて区切データによって区切られた各フレーズ区間に対応する複数の評価区間に分割する。
【0018】
続いて、処理部25は、分割した採点区間の中から今回の採点処理の対象となる採点区間を選択する(ステップS18)。この例では、いずれの採点区間についても採点処理が行われていないため、時間軸において先頭の採点区間h1が選択される。続いて、処理部25は、選択した採点区間に含まれる歌唱データDxと記憶部24に記憶されている模範歌唱データDrとに基づいて、採点処理を行う(ステップS19)。具体的には、処理部25は、選択した採点区間に含まれる歌唱データDxと、その採点区間に対応するフレーズ区間に含まれる模範歌唱データDrとを比較して、それらの類似度に応じた点数を算出する。続いて、処理部25は、算出した点数を採点結果とし、その採点結果を表す採点結果データを生成する。つまり、処理部25は、分割された複数の評価区間の中から選択された評価区間に含まれる音声データを、記憶部24に記憶されているその評価区間に対応する区間に含まれる模範音声データと比較することにより、選択された評価区間における利用者の歌唱音声を評価し、評価結果を生成する評価手段として機能する。この例では、図5中の採点区間h1に含まれる歌唱データDxとフレーズ区間f1に含まれる模範歌唱データDrとの類似度に応じた点数が算出され、算出された点数が採点区間h1の採点結果として用いられて、採点区間h1の採点結果を表す採点結果データが生成される。
【0019】
採点結果データが生成されると、CPU21は、この採点結果データを上述したステップS16にて受信された装置IDのカラオケ装置10に通信部23によって送信する(ステップS20)。この例では、図5中の採点区間h1の採点結果を表す採点結果データがカラオケ装置10に送信される。続いて、処理部25は、上述したステップS18にて選択された採点区間が時間軸における最後の採点区間であるか否かを判定する(ステップS21)。この例では、図5に示すように、採点区間h1は時間軸における最後の採点区間ではないため、処理部25は、選択した採点区間が最後の採点区間ではないと判定する(ステップS21:NO)。この場合、処理部25は、上述したステップS18に戻り、次の採点処理の対象となる採点区間を選択する。具体的には、処理部25は、上述にて採点区間h1の採点処理が行われているため、時間軸において採点区間h1の次の採点区間h2を選択する。つまり、処理部25は、分割された各々の評価区間を時間軸上の位置に応じた順番で選択する。続いて、処理部25は、上述と同様に、ステップS19において採点区間h2についての採点処理を行う。そして、CPU21は、ステップS20において採点区間h2の採点結果を表す採点結果データをカラオケ装置10に送信する。つまり、CPU21は、処理部25によって各評価区間における評価結果が生成される度に、生成された評価結果をカラオケ装置10に送信する送信手段として機能する。このようにして、処理部25とCPU21とは、ステップS21において、選択された採点区間が時間軸における最後の採点区間であると判定されるまで、上述したステップS18〜ステップS21の処理を繰り返す。
【0020】
一方、カラオケ装置10のCPU11は、上述したステップS14及びS15の処理を行いながら、採点サーバ装置20から採点結果データが送信されてくるまで待機する。そして、採点サーバ装置10から採点結果データが送信されてくると、CPU11は、通信部13によってこの採点結果データを受信する(ステップS22)。続いて、CPU11は、受信した採点結果データが表す採点結果を表示部16に表示させる(ステップS23)。例えば、上述したように、図5中の採点区間h1の採点結果を表す採点結果データが採点サーバ装置20から送信されてきた場合には、採点区間h1の採点結果が表示される。なお、このステップS22〜S23が行われている間も上述したカラオケ再生処理が継続しているため、表示部16には楽曲の歌詞が表示されている。従って、CPU11は、上述したステップS23にて採点結果を表示させるときには、楽曲の歌詞の表示をいったん中断して採点結果を表示させるか、あるいは楽曲の歌詞と採点結果とを合成したものを表示させる。
【0021】
続いて、CPU11は、上述したステップS14のカラオケ再生処理の状況に基づいて、利用者の歌唱が終了したか否かを判定する(ステップS24)。例えば、カラオケ再生処理が終了していない場合、CPU11は、利用者の歌唱が終了していないと判定する(ステップS24:NO)。この場合、CPU11は、上述したステップS22に戻り、新たな採点結果データが送信されてくるまで待機する。そして、採点サーバ装置20から新たな採点結果データが送信されてくると、CPU11は、上述と同様に、ステップS21にてその採点結果データを通信部13によって受信し、ステップS23にてその採点結果データが表す採点結果を表示部16に表示させる。これにより、表示部16には、図5中の各採点区間の採点結果が順次表示されていく。
【0022】
一方、上述したステップS14において、利用者によって指定された楽曲のカラオケデータDkが時間軸における最後の位置まで読み出されて処理されると、カラオケ再生処理が終了する。この場合、CPU11は、利用者の歌唱が終了したと判定し(ステップS24:YES)、通信部13によって採点サーバ装置20との間の通信を切断した後(ステップS25)、この処理を終了する。
【0023】
以上説明した実施形態によれば、カラオケ演奏の再生処理を行うカラオケ装置10とは異なる採点サーバ装置20において、利用者の歌唱音声を評価区間毎に評価し、その評価結果を逐次出力することができる。また、各々のカラオケ装置10に利用者の歌唱を採点する採点機能を設ける必要がないため、カラオケ装置10のコストを安くすることができる。さらに、採点サーバ装置20側では、カラオケ演奏の再生処理は行われないため、処理負荷の高い精密な採点処理を行うことができる。また、新たな採点機能を追加する場合には、採点サーバ装置20だけに新たな採点機能を追加すればよいため、新たな採点機能を追加する作業を容易に行うことができる。
【0024】
[変形例]
以上が実施形態の説明であるが、この実施形態の内容は以下のように変形し得る。また、以下の各変形例を適宜組み合わせてもよい。
(変形例1)
上述した実施形態では、歌唱データの時間軸を模範歌唱データの各フレーズ区間に対応する複数の採点区間に分割していたが、採点区間の分割に用いられる区間はフレーズ区間に限らない。例えば、歌唱データの時間軸を、歌唱データに含まれる各メロディーの時間軸上の区間に対応する複数の採点区間に分割してもよい。あるいは、歌唱データの時間軸を、歌唱データにおいて息継ぎが行われない区間に対応する複数の採点区間に分割してもよい。この息継ぎが行われない区間は、例えば歌唱データを解析して息継ぎが行われたタイミングを検出し、検出した息継ぎのタイミングに基づいて特定すればよい。あるいは、歌唱データにおいて息継ぎが行われる時間軸上の位置が予め決められている場合には、その息継ぎのタイミングに基づいて特定してもよい。
また、カラオケ装置10が採点区間を指定してもよい。この場合、カラオケ装置10のCPU11は、上述した楽曲ID及び装置IDとともに、採点区間を表す採点区間情報を採点サーバ装置20に送信する。そして、採点サーバ装置20の処理部25は、カラオケ装置10から送信された採点区間情報が表す採点区間に基づいて歌唱データの時間軸を分割する。
【0025】
(変形例2)
上述した実施形態において、例えば歌唱の対象となる楽曲が1番と2番とで構成されている場合には、1番の歌唱が終了した時点で、1番の歌唱全体の採点処理を行うようにしてもよい。この場合、歌唱データには、楽曲の1番と2番との時間軸上の区切り位置を表す区切データが付加されている。採点サーバ装置20の処理部25は、この区切データを含む採点区間の採点処理を終了すると、歌唱データの時間軸において、歌唱が開始される位置から1番の歌唱が終了する位置までの区間を採点区間として設定し、設定した採点区間について上述と同様の採点処理を行う。
また、利用者の歌唱が終了した時点で、歌唱全体の採点処理を行うようにしてもよい。この場合、処理部25は、歌唱データの終端を含む採点区間の採点処理を終了すると、歌唱データの時間軸において、歌唱が開始される位置から終了する位置までの区間を採点区間として設定し、設定した採点区間について上述と同様の採点処理を行う。
【0026】
さらに、歌唱全体の採点処理を行う場合には、採点処理の内容を変えてもよい。例えば、各評価区間の採点処理では、歌唱データと模範歌唱データとの類似度を表す点数だけを算出し、歌唱の全体を対象とする採点処理では、歌唱データと模範歌唱データとの類似度を表す点数に加えて、「こぶし」や「しゃくり」といった歌唱の技法が用いられた回数を算出してもよい。さらに、類似度に応じた採点に加え、「ビブラート」,「走り」,「タメ」,「抑揚」,「演奏時間」,「低音・高音の明瞭さ」,「デュエットにおける一致度」などを加味し、加点してもよい。また、歌唱の全体を対象とする採点処理では、適切なタイミングで適切な歌唱の技法を用いているか否かに基づいて、上述した点数を算出してもよい。
【0027】
(変形例3)
上述した実施形態では、歌唱データがそのまま採点サーバ装置20に送信されていたが、歌唱データに代えて歌唱データの特徴量だけが採点サーバ装置20に送信されてもよい。この特徴量としては、例えば歌唱データの周波数特性、音程又はリズムなどが用いられる。この場合、カラオケ装置10のCPU11は、収音部17によって生成された歌唱データから特徴量を抽出し、抽出した特徴量を通信部13によって採点サーバ装置20に送信する。そして、採点サーバ装置20のCPU21及び処理部25は、カラオケ装置10から送信されてきた特徴量を用いて、上述と同様の処理を行う。
【0028】
また、利用者の歌唱の途中では、歌唱データの特徴量に基づいて採点処理を行い、利用者の歌唱が終了すると、歌唱データに基づいて歌唱全体を対象とする採点処理を行ってもよい。この場合、カラオケ装置10のCPU11は、利用者の歌唱が終了するまでは、歌唱データから特徴量を抽出し、抽出した特徴量を採点サーバ装置20に送信する。そして、採点サーバ装置20の処理部25は、カラオケ装置10から送信されてきた歌唱データの特徴量を用いて、上述と同様の処理を行う。このように、歌唱データの特徴量だけを用いて採点処理を行う場合には、採点処理の負荷が小さくなるため、採点処理にかかる時間が短くなる。よって、採点結果データを迅速にカラオケ装置10に送信することができる。一方、利用者の歌唱が終了すると、カラオケ装置10のCPU11は、歌唱データそのものを採点サーバ装置20に送信する。カラオケ装置10から歌唱データが送信されてくると、採点サーバ装置20の処理部25は、この歌唱データの時間軸上の全ての区間を採点区間として設定し、設定した採点区間について上述と同様の採点処理を行う。このように、歌唱データそのものを用いて採点処理を行う場合には、採点処理において詳細な評価を行うことができる。よって、利用者は、詳細な採点結果を知ることができる。
【0029】
また、カラオケ装置10のCPU11は、ネットワークNの状態を検出し、ネットワークNの可用帯域が狭い状態である場合には、歌唱データに代えて歌唱データの特徴量を送信してもよい。この場合、採点サーバ装置20のCPU21及び処理部25は、カラオケ装置10から送信されてきた歌唱データの特徴量を用いて、上述と同様の処理を行う。
また、採点サーバ装置20の処理部25は、複数のカラオケ装置10との間で通信が確立された場合には、メモリ22に記憶されている歌唱データから特徴量を抽出し、抽出した特徴量を用いて上述と同様の処理を行ってもよい。これは、複数のカラオケ装置10との間で通信が確立された場合には、各々のカラオケ装置10から送信されてくる歌唱データについて採点処理を行うことになるため、処理部25の処理負荷を低く抑える必要があるためである。
【0030】
(変形例4)
上述した実施形態において、採点サーバ装置20のCPU21は、歌唱を行った利用者に対して課金を行ってもよい。この場合、利用者は、操作部15を操作して、自分のユーザIDを入力する。CPU11は、この操作に応じて、入力されたユーザIDを通信部13によって採点サーバ装置20に送信する。そして、採点サーバ装置20のCPU21は、上述した採点処理の計算量に応じた金額を算出し、カラオケ装置10から送信されてきたユーザIDが表す利用者に対して、算出した金額が課金されるように課金処理を行う。あるいは、CPU21は、利用者に対して予め決められた金額が課金されるように課金処理を行ってもよい。
【0031】
(変形例5)
上述した実施形態では、採点サーバ装置20に接続される装置がカラオケ装置10だけであったが、採点サーバ装置20に接続される装置はカラオケ装置10に限らない。例えば、携帯電話機や携帯ゲーム機が採点サーバ装置20に接続されてもよい。この場合、これらの機器は、上述したカラオケ装置10と同様に、カラオケ再生処理を行いながら、利用者の歌唱を表す歌唱データを採点サーバ装置20に送信し、採点サーバ装置20から送信されてきた採点結果データが表す採点結果を表示する。つまり、携帯電話機や携帯ゲーム機はいずれも、本発明に係る通信装置として機能する。
【0032】
また、採点サーバ装置20は、歌唱データの送信元の種別に応じて、採点処理の内容を変えてもよい。この種別とは、例えばカラオケ装置、ゲーム機、携帯電話機などのように、予め決められた装置の分類であってもよいし、本格的な歌唱音声の評価を得たいときに用いられる装置、簡易な歌唱音声の評価を得たいときに用いられる装置など、使用目的に応じた種別であってもよい。あるいは、装置の処理能力に応じた種別であってもよい。この場合、採点サーバ装置20の記憶部24には、装置の種別と採点処理のアルゴリズムとが対応付けて記憶される。そして、採点サーバ装置20のCPU21は、歌唱データの送信元からその種別を取得し、取得した種別と対応付けて記憶された採点処理のアルゴリズムを特定する。そして、処理部25は、特定されたアルゴリズムを用いて上述した採点処理を行う。
【0033】
ここでは、記憶部24において、「カラオケ装置」という種別と、「詳細な評価を行う採点処理のアルゴリズム」とが対応付けて記憶されており、「携帯電話機」という種別と、「簡易な評価を行う採点処理のアルゴリズム」とが対応付けて記憶されている場合を想定する。この場合、例えば、カラオケ装置10から歌唱データと「カラオケ装置」という種別とが送信されてくると、採点サーバ装置20の処理部25は、記憶部24において「カラオケ装置」という種別に対応付けられた「詳細な評価を行う採点処理のアルゴリズム」を用いて採点処理を行う。一方、携帯電話機から歌唱データと「携帯電話機」という種別とが送信されてくると、処理部25は、記憶部24において「携帯電話機」という種別に対応付けられた「簡易な評価を行う採点処理のアルゴリズム」を用いて採点処理を行う。つまり、処理部25は、予め決められた種別の通信装置から音声データを取得した場合には、予め決められた種別とは異なる種別の通信装置から音声データを取得した場合よりも簡易な評価を行う。この簡易な評価とは、採点処理における処理ステップ数が少ない、又は同一の歌唱音声を評価するときの処理時間が少ないことをいう。具体的には、評価項目を少なくする、処理負荷の大きい処理を省くなどによって実現される。なお、ここでは、採点処理のアルゴリズムが2つ設けられて場合を例に挙げて説明したが、評価の簡易度に応じた採点処理のアルゴリズムが3つ以上設けられていてもよい。
【0034】
(変形例6)
上述した実施形態では、歌唱データと模範歌唱データとの類似度に応じた点数が採点結果として用いられていたが、採点結果として用いられる情報はこれに限らない。例えば、歌唱データと模範歌唱データとの類似度に応じた点数を算出した後に、利用者の歌唱音声において点数の低下する要因を特定し、算出した点数に加えて、点数を高めるためのアドバイスを採点結果として用いてもよい。
【0035】
(変形例7)
上述した実施形態では、カラオケ装置10と採点サーバ装置20とが別体の装置である構成を例に挙げて説明したが、カラオケ装置10が採点サーバ装置20の機能を有していてもよい。この場合には、例えばカラオケ装置10の間で相互に情報を交換しながら、カラオケ再生処理を行っていないカラオケ装置10又はカラオケ再生処理を行っているが処理の負荷が低いカラオケ装置10を決定し、そのカラオケ装置10が採点サーバ装置20として機能する。あるいは、カラオケ装置10に管理装置が接続されている場合には、管理装置がカラオケ再生処理を行っていないカラオケ装置10又はカラオケ再生処理を行っているが処理の負荷が低いカラオケ装置10を検出し、検出したカラオケ装置10を採点サーバ装置20として動作させてもよい。
【0036】
(変形例8)
上述した実施形態では、採点サーバ装置20が歌唱の巧拙を採点する例を挙げて説明したが、採点サーバ装置20が採点する対象は歌唱に限らない。例えば、採点サーバ装置20が、利用者の英会話の巧拙を採点してもよい。ここでは、利用者が携帯電話機やコンピュータ装置などの端末装置に向けて英会話を行い、この端末装置が利用者の英会話を表す音声データを採点サーバ装置20に送信する場合を想定する。この端末装置は、上述したカラオケ装置10と同様に、収音部17と放音部19とを備えており、ネットワークNを介して採点サーバ装置20に接続されている。この場合、採点サーバ装置20の記憶部24には、模範となる英会話を表す模範音声データが予め記憶されている。そして、処理部25は、端末装置から送信されてきた音声データと記憶部24に記憶されている模範音声データとに基づいて、上述と同様に、利用者の英会話の巧拙を表す採点処理を行う。
【0037】
(変形例9)
上述した実施形態において、採点サーバ装置20の記憶部24に記憶されている模範音声データDrは、模範となる歌唱音声そのものを表すものであってもよいし、模範となる音声の音符、周波数、リズムなどを表すパラメータであってもよい。要するに、記憶部24には、模範となる歌唱音声を表す模範音声データが記憶されていればよい。つまり、本発明でいう「音声データ」とは、音声そのものを表すデータに限らず、音声の特徴を表すパラメータであってもよい。
【0038】
(変形例10)
上述した実施形態において、CPU21にて行われる処理が処理部25にて行われてもよい。また、処理部25にて行われる処理がCPU21にて行われてもよい。さらに、CPU21又は処理部25にて行なわれる処理は、単一又は複数のハードウェア資源によって実現されてもよいし、CPU21が1又は複数のプログラムを実行することにより実現されてもよい。また、このプログラムは、磁気テープや磁気ディスクなどの磁気記録媒体、光ディスクなどの光記録媒体、光磁気記録媒体、半導体メモリなどの、コンピュータ装置が読み取り可能な記録媒体に記憶された状態で提供し得る。また、プログラムを、インターネットなどのネットワーク経由でダウンロードさせることも可能である。
【符号の説明】
【0039】
1…採点システム、10…カラオケ装置、11…CPU、12…メモリ、13…通信部、14…記憶部、15…操作部、16…表示部、17…収音部、18…音源部、19…放音部、20…採点サーバ装置、21…CPU、22…メモリ、23…通信部、24…記憶部、25…処理部。

【特許請求の範囲】
【請求項1】
模範となる歌唱音声を表す模範音声データを記憶する第1の記憶手段と、
利用者の歌唱音声を表す音声データをストリーミング方式で通信装置から取得する取得手段と、
前記取得手段によって取得された音声データを記憶する第2の記憶手段と、
前記第2の記憶手段に記憶されている前記音声データの時間軸を、歌唱音声の評価の対象となる複数の評価区間に分割する分割手段と、
前記分割手段によって分割された各々の評価区間を時間軸上の位置に応じた順番で選択し、選択された当該評価区間に含まれる音声データを、前記第1の記憶手段に記憶されている当該評価区間に対応する区間に含まれる模範音声データと比較することにより、当該選択された評価区間における前記利用者の歌唱音声を評価し、評価結果を生成する評価手段と、
前記評価手段によって各評価区間における評価結果が生成される度に、生成された当該評価結果を前記通信装置に送信する送信手段と
を備えることを特徴とする評価装置。
【請求項2】
前記模範音声データには、前記模範となる歌唱音声に含まれる各フレーズの時間軸上の区切り位置を示す区切データが付加されており、
前記分割手段は、前記第2の記憶手段に記憶されている音声データの時間軸を、前記第1の記憶手段に記憶されている模範音声データにおいて前記区切データによって区切られた各フレーズ区間に対応する複数の評価区間に分割する
ことを特徴とする請求項1に記載の評価装置。
【請求項3】
前記通信装置は種別の異なるものが複数あり、
前記評価手段は、前記取得手段が予め決められた種別の通信装置から前記音声データを取得した場合には、当該予め決められた種別とは異なる種別の通信装置から前記音声データを取得した場合よりも簡易な内容で前記評価を行う
ことを特徴とする請求項1又は2に記載の評価装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公開番号】特開2010−237257(P2010−237257A)
【公開日】平成22年10月21日(2010.10.21)
【国際特許分類】
【出願番号】特願2009−82065(P2009−82065)
【出願日】平成21年3月30日(2009.3.30)
【出願人】(000004075)ヤマハ株式会社 (5,930)
【Fターム(参考)】