説明

歌唱評価装置

【課題】歌唱の対象となる曲に対して予め決められた基準から乖離している度合いである乖離度に応じて前記歌唱者の歌唱を評価するときの、当該乖離度を表すパラメータを変更可能にすることを目的とする。
【解決手段】評価基準が選択されると(ステップS104;Yes)、制御部10は、選択された評価基準に相当するパラメータデータをRAMに読み込む(ステップS108)。一方、ステップS104でNoの場合、制御部10は、パラメータデータ記憶領域25から、検索キーに設定された曲番号と紐付く曲別パラメータデータを評価基準として検索し、検索結果のパラメータデータをRAMに読み込む(ステップS108)。楽曲の再生が終了すると、制御部10は、ユーザ歌唱音声データ記憶領域24に記憶されたユーザ歌唱音声データとRAMに記憶されたパラメータデータとに基づいて、歌唱の採点を行う(ステップS114)。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、歌唱評価装置に関する。
【背景技術】
【0002】
カラオケ装置においては、歌唱者による歌唱の巧拙を採点する機能を備えるものがある。例えば特許文献1には、重み係数マップを用いて音程に関する得点を計算する方法が開示されている。また、特許文献2には、リファレンスデータと実際の歌唱におけるピッチデータとのズレに応じて音程に関する得点を計算する方法が開示されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2004−184506号公報
【特許文献2】特開2009−092871号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1や特許文献2に記載の技術では、歌唱の巧拙について採点が行われる際の基準が常に同一である。例えば楽曲のジャンルによる歌唱法の特徴の違い、或いは歌手毎の歌唱法における特徴の違い等によって、歌唱の巧拙について採点が行われる基準を異ならせたいという要望があっても、特許文献1や特許文献2に記載の技術によれば、常に単一の基準によって歌唱の巧拙が評価されてしまうため、歌唱者が採点結果に満足いかない場合がある。
本発明は上述の背景に鑑みてなされたものであり、歌唱の対象となる曲に対して予め決められた基準から乖離している度合いに基づき歌唱を評価するときの、その乖離の度合いをそれぞれの歌唱単位で変更可能にすることを目的とする。
【課題を解決するための手段】
【0005】
上述した課題を解決するために、本発明は、歌唱者が曲を歌唱したときの音声を表す音声データを取得する音声データ取得手段と、歌唱の対象となる曲に対して予め決められた基準から乖離している度合いである乖離度に応じて前記歌唱者の歌唱を評価するときの、当該乖離度を表す複数のパラメータのうち、少なくともいずれか1のパラメータを取得するパラメータ取得手段と、前記取得されたパラメータを用いて、前記取得された音声データが表す音声による歌唱に対する評価結果を算出する算出手段とを備えることを特徴とする歌唱評価装置を提供する。
【0006】
また、別の好ましい態様において、前記複数のパラメータのうち、少なくともいずれか1のパラメータを選択する操作を受け付ける操作手段を備え、前記パラメータ取得手段は、受け付けられた前記操作により選択された前記パラメータを取得する。
【0007】
また、別の好ましい態様において、前記複数のパラメータは、歌唱される曲毎に決められた複数のパラメータ、前記曲が属するジャンル毎に決められた複数のパラメータ、または、特定の歌唱者毎に決められた複数のパラメータのうち、少なくともいずれかを含む。
【0008】
また、別の好ましい態様において、前記複数のパラメータのうち、少なくともいずれか1種類のパラメータを選択する操作を受け付ける操作手段を備え、前記複数のパラメータは、歌唱される曲毎に決められた複数のパラメータと、当該曲毎に決められたパラメータ以外の複数のパラメータを含み、前記パラメータ取得手段は、前記パラメータを選択する操作が受け付けられた場合には、当該操作により選択された前記パラメータを取得し、前記パラメータを選択する操作が受け付けられなかった場合には、前記曲毎に決められた複数のパラメータのうち、歌唱の対象となる曲について決められたパラメータを取得する。
【0009】
また、本発明は、コンピュータに、歌唱者が歌唱したときの音声を表す音声データを取得する音声データ取得機能と、歌唱の対象となる曲に対して予め決められた基準から乖離している度合いである乖離度に応じて前記歌唱者の歌唱を評価するときの、当該乖離度を表す複数のパラメータのうち、少なくともいずれか1のパラメータを取得するパラメータ取得機能と、前記取得されたパラメータを基準にして、前記取得された音声データが表す音声による歌唱に対する評価結果を算出する算出機能とを実現させるためのプログラムとしても提供し得る。
【発明の効果】
【0010】
本発明によれば、歌唱の対象となる曲に対して予め決められた基準から乖離している度合いである乖離度に応じて前記歌唱者の歌唱を評価するときの、当該乖離度を表すパラメータを変更可能となる。
【図面の簡単な説明】
【0011】
【図1】本発明の実施形態におけるシステムの構成図
【図2】カラオケ装置のハードウェア構成を表すブロック図
【図3】伴奏データ記憶領域の内容を表す模式図
【図4】パラメータデータ記憶領域の内容を表す模式図
【図5】採点処理の具体例を説明する模式図
【図6】採点処理が行われる際のフロー図
【図7】手動パラメータテーブルを表す模式図
【図8】地域別パラメータテーブル及び時間帯別パラメータテーブルを表す模式図
【図9】カラオケ装置情報テーブル211を表す模式図
【図10】ビブラートの評価値を算出する計算式を説明するための図
【発明を実施するための形態】
【0012】
以下、本発明の一実施形態について説明する。
<実施形態>
<構成>
図1は、本発明の実施形態におけるシステムの構成を表した図である。
このシステムは、カラオケ装置100と、サーバ装置200と、ネットワークNWとを有する。カラオケ装置100は、ユーザからの要求に従ってカラオケ楽曲を再生するとともに、再生されるカラオケ楽曲についてのユーザによる歌唱を評価する装置である。ネットワークNWはLAN(Local Area Network)やインターネットであり、カラオケ装置100とサーバ装置200との間におけるデータ通信が行われる通信網である。サーバ装置200は、その内部あるいは外部に備えたHDD(Hard Disk Drive)等の記憶手段に、カラオケ楽曲に関するコンテンツデータ、及びカラオケ装置100がユーザによる歌唱を採点つまり歌唱を評価する際の基準となるパラメータデータ等を記憶しており、カラオケ装置100からの要求に従って、ネットワークNW経由でこのコンテンツデータ及びパラメータデータをカラオケ装置100に供給する装置である。ここで、コンテンツとは、カラオケ楽曲に関する音声と映像との組み合わせを指す。すなわち、コンテンツデータとは、主旋律の歌声が存在せず伴奏やコーラスで構成されたいわゆる伴奏データと、この楽曲の歌詞や歌詞の背景に表示する映像からなる映像データとから成り立っている。なお、サーバ装置200に対してカラオケ装置100は複数存在してもよい。また、カラオケ装置100に対してサーバ装置200が複数存在してもよい。
【0013】
図2は、カラオケ装置100のハードウェア構成を表したブロック図である。
カラオケ装置100は、制御部10、記憶部20、操作部30、表示部40、通信制御部50、音声処理部60、マイクロホン61、及びスピーカ62を有し、これら各部がバス70を介して接続されている。制御部10は、CPU(Central Processing Unit)、RAM(Random Access Memory)、及びROM(Read Only Memory)等を有している。制御部10において、CPUが、ROMや記憶部20に記憶されているコンピュータプログラムを読み出しRAMにロードして実行することにより、カラオケ装置100の各部を制御する。また、制御部10は、サーバ装置200から供給されたパラメータデータのうち選択されたパラメータデータに従って採点することで、ユーザによる歌唱に対して評価を行う。
【0014】
操作部30は、各種の操作子を備え、ユーザによる操作内容を表す操作信号を制御部10に出力する。表示部40は、例えば液晶パネルを備え、制御部10による制御の下、各カラオケ楽曲に応じた歌詞テロップや背景映像等を表示する。通信制御部50は、カラオケ装置100とネットワークNWとを有線あるいは無線で接続し、ネットワークNWを介したカラオケ装置100とサーバ装置200との間のデータ通信を制御する。
【0015】
サーバ装置200は、図示せぬCPUや各種メモリを備えたコンピュータであり、特にネットワークストレージ210を備えている。ネットワークストレージ210は例えばHDDであり、カラオケ楽曲のコンテンツデータ及びパラメータデータ等を記憶する。図2においてサーバ装置200は1つのネットワークストレージ210を備えているが、ネットワークストレージの数はこれに限ったものではなく、複数のネットワークストレージをサーバ装置200が備えてもよい。ユーザにより予約されたカラオケ楽曲のコンテンツデータがネットワークストレージ210に記憶されている場合、カラオケ装置100は、通信制御部50による制御に従ってサーバ装置200と通信を行い、ネットワークストレージ210から読み出されたコンテンツデータをネットワークNW経由でダウンロードしながら、ダウンロードが完了した部分から順次再生する、というストリーミング再生を行う。
【0016】
マイクロホン61は、収音した音声を表すアナログの音声信号を音声処理部60に出力する。音声処理部60は、A/D(Analog / Digital)コンバータを有し、マイクロホン61が出力したアナログの音声信号をデジタルの音声データに変換して制御部10に出力し、制御部10はこれを取得する。このように、制御部10はユーザ(歌唱者)が歌唱したときの音声を表す音声データを取得する音声取得手段として機能する。また、音声処理部60は、D/A(Digital / Analog)コンバータを有し、制御部10から受け取ったデジタルの音声データをアナログの音声信号に変換してスピーカ62に出力する。スピーカ62は、音声処理部60から受け取ったアナログの音声信号に基づく音を放音する。記憶部20は、各種のデータを記憶するための記憶手段であり、例えばHDDや不揮発性メモリである。記憶部20は、伴奏データ記憶領域21、映像データ記憶領域22、GM(Guide Melody)データ記憶領域23、ユーザ歌唱音声データ記憶領域24、及びパラメータ記憶領域25といった複数の記憶領域を備えている。
【0017】
図3は、伴奏データ記憶領域21の内容を表す模式図である。
伴奏データ記憶領域21には、各楽曲における伴奏の音声を表す伴奏データに関する情報が記憶されている。伴奏データ記憶領域21には、「曲番号」、「曲名」、「歌手名」、「ジャンル」、及び「ファイル格納場所」といった複数の項目からなる伴奏データレコードが複数記憶されている。「曲番号」は、楽曲を一意に識別するための番号であり、例えば4桁の親番号と2桁の枝番号とからなる。「曲名」は、各楽曲の名称を表す。「歌手名」は、各楽曲の歌い手の名称を表す。「ジャンル」は、予め決められた分類基準で分類された複数のジャンルのうち、各楽曲の属する音楽のジャンルを表す。「ファイル格納場所」は、各楽曲の伴奏データそのものであるデータファイルの格納場所を表し、server1又はserver2というフォルダを含む場合には伴奏データのデータファイルがサーバ装置200に格納されており、server1又はserver2というフォルダを含まない場合には伴奏データのデータファイルがカラオケ装置100に格納されていることを意味している。例えば図3において、曲名が「BBB」である楽曲は、伴奏データのデータファイルがサーバ装置200に格納されていることを表し、曲名が「CCC」である楽曲は、伴奏データのデータファイルがカラオケ装置100の記憶部20に格納されていることを表している。この伴奏データのデータファイルは、例えば、MIDI(Musical Instrument Digital Interface)形式のファイルである。
【0018】
映像データ記憶領域22には、各楽曲の歌詞を示す歌詞データ及び歌詞の背景に表示される背景映像を表す背景映像データが記憶されている。歌詞データによって示される歌詞は、カラオケ歌唱の際に、楽曲の進行に伴って歌詞テロップとして表示部40に表示される。また、背景映像データによって表される背景映像は、カラオケ歌唱の際に楽曲の進行に伴って歌詞テロップの背景として表示部40に表示される。GMデータ記憶領域23には、楽曲のボーカルパートのメロディを示すデータ、すなわち、歌唱すべき構成音の内容を指定するデータであるガイドメロディデータ(以下、GMデータという)が記憶されている。GMデータは、制御部10がユーザによる歌唱の巧拙を評価する際に比較の基準となるものである。GMデータは、例えば、MIDI形式により記述されている。ユーザ歌唱音声データ記憶領域24には、カラオケの対象となった各楽曲について、その伴奏データが再生されている期間中マイクロホン61によって収音されたユーザの歌唱音声が音声処理部60でデジタルデータに変換されることで生成された音声データが記憶される。この音声データをユーザ歌唱音声データという。このユーザ歌唱音声データは、例えば、WAVE(RIFF waveform Audio Format)形式のデータファイルとして記憶される。各楽曲についてのユーザ歌唱音声データは、制御部10によって、その楽曲のGMデータに対応付けられる。
【0019】
パラメータ記憶領域25には、前述したパラメータデータが複数種類記憶されている。これらのパラメータデータは、カラオケ装置100が予めサーバ装置200からネットワークNWを通じて取得したものである。カラオケ装置100は、一度ダウンロードしたパラメータデータについては、自装置内のパラメータ記憶領域25に記憶されたものを用いる。ユーザにより指定されたパラメータデータがパラメータ記憶領域25に記憶されていない場合、カラオケ装置100は、当該パラメータデータを、上述したようにサーバ装置200から取得する。パラメータデータの種類には、曲別、歌手別、ジャンル別という3種類があり、各パラメータデータには、少なくとも1つ以上の評価項目について採点に用いられる評価基準が含まれている。ユーザは、パラメータ記憶領域25に記憶されたパラメータデータ群から、操作部30を介して任意のパラメータデータを指定することで、カラオケ楽曲に合わせて歌唱を行う際の採点に用いられる評価基準を選択することが可能である。つまり、操作部30は、複数のパラメータのうち、少なくともいずれか1種類のパラメータを選択する操作を受け付ける操作手段として機能する。なお、カラオケ装置100においては、採点の方式に減点方式を採用している。ここで減点方式とは、あるカラオケ楽曲についてユーザが歌唱を開始した時点では満点から始まり(100点満点であれば100点)、ユーザによる歌唱が評価基準を満たさないときに、随時、制御部10によって減点が行われる、という方式である。
【0020】
図4は、パラメータ記憶領域25の内容を表す模式図である。パラメータ記憶領域25には、曲別パラメータテーブル25a、歌手別パラメータテーブル25b、及びジャンル別パラメータテーブル25cが含まれる。曲別パラメータテーブル25aには、「曲番号」、「曲名」、及び「ピッチ」といった複数の項目からなる曲別パラメータレコードが複数記述されている。「曲番号」及び「曲名」は、上述したとおりである。「ピッチ」は、制御部10が採点を行う際の評価項目であり、選択された楽曲のGMデータを比較の基準として、各々のノートを単位とした場合に、上下方向において音高のズレをどれだけ許容するかを表している。具体的には、例えば図4(a)における曲名「AAA」のカラオケ楽曲は、ピッチに関して「100セント(半音)」のズレを許容しており、ユーザの歌唱におけるピッチとGMデータにおけるピッチとのズレがこの基準値「100セント」を超えると、制御部10によって減点が行われることを意味している。例えば、曲名「AAA」のカラオケ楽曲をユーザが歌唱した際に、GMデータにおける或るノートが「C3」の音高であった場合、このノートについてのユーザの歌唱における音高が「C3#」から「C3♭」の範囲に収まらなかった場合に、制御部10は、このノートについて減点を行う。このようにして制御部10は、ユーザによる歌唱をその開始から終了まで減点方式により採点を行い、採点結果を表示部40に表示する。
【0021】
歌手別パラメータテーブル25bには、「歌手名」及び「ピッチ」といった複数の項目からなる歌手別パラメータレコードが複数記述されている。「歌手名」は、上述したとおりである。「ピッチ」は、制御部10が採点を行う際の評価項目であり、採点に用いられる評価基準として特定の「歌手名」の歌い手が選択された場合に、選択された楽曲のGMデータを比較の基準とし、各々のノートを単位として上下方向において音高のズレをどれだけ許容するかを表している。ジャンル別パラメータテーブル25cには、「ジャンル」及び「ピッチ」といった複数の項目からなるジャンル別パラメータレコードが複数記述されている。「ジャンル」は、上述したとおりである。「ピッチ」は、制御部10が採点を行う際の評価項目であり、採点に用いられる評価基準として「ジャンル」で示されるジャンルが選択された場合に、選択された楽曲のGMデータを比較の基準とし、各々のノートを単位として上下方向において音高のズレをどれだけ許容するかを表している。
【0022】
ユーザが操作部30を介していずれのパラメータデータも指定しない場合、制御部10は、予約された楽曲の曲名に対応する曲別パラメータデータを評価基準としてユーザの歌唱を採点する。一方、ユーザが操作部30を介していずれかのパラメータデータを指定した場合、制御部10は、指定されたパラメータデータを評価基準としてユーザの歌唱を採点する。例えばユーザが、図4における曲名「DDD」で示される楽曲を予約し、歌手名「ザ・○△」を採点に用いられる評価基準として指定した場合を考える。この場合、歌手名「ザ・○△」が評価基準としてユーザにより指定されているため、「150セント」迄の音高のズレは、制御部10によって減点の対象とされなくなる。一方、歌手名「ザ・○△」を評価基準として指定しない場合、制御部10は、曲別パラメータデータを評価基準としてユーザの歌唱を採点するため、図4に表されるように「50セント」の音高のズレしか許容しない。
【0023】
<動作>
次に、図5を用いて、制御部10による採点の考え方について説明を行う。
図5は、採点処理の具体例を説明する模式図である。図5において、横軸は時間を表し、図5中で左から右に進むほど時間が経過することを表している。また、縦軸は音高を表し、図5中で下から上に進むほど音高が高くなることを表している。縦軸の1つの目盛りは100セント(半音)の音高を意味している。つまり、例えば図5において、「C3」で示される領域の情報に位置する目盛りに対して1目盛り分だけ上方に位置する目盛りは、「C3#」の音高を表している。また、「C3」で示される領域の下方に位置する目盛りに対して1目盛り分だけ下方に位置する目盛りは、「C3♭」の音高を表している。また、図5において矩形の領域401〜403及び405〜407は、GMデータに基づくガイドメロディの音高を表している。例えば、図5に示される期間においては、C3の音高の音がT1の期間だけ続いた後に、E3の音高の音がT2の期間だけ続き、さらにその後G3の音高の音がT3の期間だけ続くと、T4の期間だけ無音の状態が続くといった具合である。また、実線300は、前述したユーザ歌唱音声データによって表されるユーザの歌唱時の音声の音高を表しており、以下、ユーザ歌唱音声曲線300という。
【0024】
制御部10は、ユーザ歌唱音声記憶領域24に記憶されたユーザ歌唱音声データと、このユーザ歌唱音声データに対応付けられたGMデータを取得する。また、制御部10は、複数のパラメータデータのうち、少なくともいずれか1のパラメータデータを取得する。GMデータは、上述したように、制御部10がユーザによる歌唱の巧拙を評価する際に比較の基準となるものであって、歌唱の対象となる曲に対して予め決められた基準である。一方、パラメータデータは、このGMデータから乖離している度合いを表す。例えば上述したように、パラメータデータにおいてピッチで「100セント」が設定されている場合、GMデータを基準として、上下「100セント」の音高のズレ(つまり乖離の度合い)が許容されることを表している。ここで制御部10が取得するパラメータデータは、カラオケ楽曲の予約時に、操作部30を介してユーザにより任意にパラメータデータが選択された場合、この選択されたパラメータデータであり、ユーザにより任意にパラメータデータが選択されなかった場合、歌唱の対象となった楽曲についての曲別のパラメータデータである。制御部10は、取得したユーザ歌唱音声データを解析し、このユーザ歌唱音声データに対応付けられたGMデータと比較して、取得したパラメータデータに基づいて評価項目に対しての評価値を算出する。この評価項目は、パラメータデータにおける評価項目であり、ここではピッチ(音高)の一致度である。
【0025】
制御部10は、ユーザ歌唱音声を解析する手法として、FFT(Fast Fourier Transform)などを用いた周波数分析、音量分析などの公知の様々な手法を用い、評価項目について評価値、つまり評価結果を算出する。例えば、音高の一致度については、制御部10は、ユーザ歌唱音声データが示す音声のピッチの変化と、GMデータが示すガイドメロディのピッチの変化とを比較し、これらの一致の程度を示す評価値を算出する。評価値は、あるノートにおいて、双方のピッチの差がパラメータデータに基づいて許容された範囲内に収まっていれば100%(すなわち減点なし)であり、双方のピッチの差が上記範囲内に収まらない部分の期間が、GMデータにおいてこのノートにおける音長の半分に渡っていれば50%である、といった具合である。つまり、あるノートにおいて、双方のピッチの差が上記範囲内に収まる期間を、GMデータにおいてこのノートにおける音長で序した値を評価値とする。制御部10は、算出した評価値に基づいて減点するポイントを決定する。例えば、あるノートに「2点」のポイントが割り当てられているときに、評価値が50%と算出された場合、制御部10は、「1点」を減点のポイントとして決定する。
【0026】
例えば図5において、ユーザが、操作部30を介して曲名「AAA」である楽曲を予約し、採点に用いられる評価の基準としてジャンル「ロック」を選択したものとする。このとき、図4に示すように、曲名「AAA」の曲別パラメータデータでは「100セント」の音高のズレが許容されるが、ユーザによりジャンル別パラメータデータとして「ロック」が指定されたため、制御部10は、図4に示すように、採点に際して「200セント」の音高のズレを許容することとなる。上記の設定の下で、制御部10がユーザの歌唱を採点すると、次のような結果となる。まず、T1の期間では、ユーザ歌唱音声曲線300の終端部分においてガイドメロディ401と100セントの音高のズレが生じているが、評価の基準値は「200セント」の音高のズレであるため、制御部10による減点の対象とならない。次にT2の期間では、ユーザ歌唱音声曲線300の出だしにおいてガイドメロディ402と200セントの音高のズレが生じているが、制御部10は、「200セント」の音高のズレを許容するため、T2の期間においては減点を行わない。次に、T3の期間では、ユーザ歌唱音声曲線300の出だしにおいてガイドメロディ403と100セントの音高のズレが生じているが、ここにおいても、評価の基準値である「200セント」の音高のズレの許容範囲内に収まるため、制御部10による減点は行われない。
【0027】
そしてT4の無音期間を経て、T5の期間においては、ユーザ歌唱音声曲線300は、ガイドメロディ405と同じ高さの音高を保っているため、制御部10によって減点が行われない。次に、T6の期間においては、ユーザ歌唱音声曲線300の出だしにおいてガイドメロディ406と400セントの音高のズレが生じている。ここで、T6の期間において生じた400セントの音高のズレが、評価の基準値である「200セント」の音高のズレの許容範囲を超えるため、制御部10は、前述したようにして評価値を算出したうえで、この評価値に基づいて減点するポイントを決定する。そしてT7の期間では、ユーザ歌唱音声曲線300の出だしにおいてガイドメロディ407と200セントの音高のズレが生じているが、評価の基準値である「200セント」の音高のズレの許容範囲内であるため、制御部10による減点は行われない。
【0028】
図6は、採点処理が行われる際のフロー図である。操作部30を介してユーザにより楽曲が予約されると(ステップS100;Yes)、制御部10は、記憶部20から予約された楽曲の検索を行う(ステップS102)。具体的にはステップS102において、制御部10は、伴奏データ記憶領域21、映像データ記憶領域22、及びGMデータ記憶領域23の各々から、選択された楽曲の曲番号または曲名をキーにして、その楽曲に関するデータを検索し、検索結果のデータをRAMに読み込む。次にユーザにより操作部30を介してパラメータデータが選択されると(ステップS104;Yes)、制御部10は、パラメータ記憶領域25から、選択されたパラメータデータに相当するパラメータデータを検索し、検索結果のパラメータデータをRAMに読み込む(ステップS108)。一方、ユーザにより操作部30を介してパラメータデータの選択が為されなかった場合(ステップS104;No)、制御部10は、予約された楽曲の曲番号を検索キーとして設定する(ステップS106)。そして制御部10は、パラメータデータ記憶領域25から、検索キーに設定された曲番号に対応する曲別パラメータデータを評価基準として検索し、検索結果のパラメータデータをRAMに読み込む(ステップS108)。
【0029】
ステップS108の次に、制御部10は、RAMに記憶された伴奏データ、映像データ、及びGMデータに基づいて、カラオケ楽曲の再生を行う(ステップS110)。具体的にはステップS110において、制御部10は、伴奏データ及びGMデータに基づく音声をスピーカ62から放音させるとともに、映像データに基づく映像を表示部40に表示させる。そして制御部10は、マイク61によって収音されたユーザの歌唱音声が音声処理部60によってデジタルのデータに変換されたものであるユーザ歌唱音声データを、ユーザ歌唱音声データ記憶領域24に記憶させる(ステップS112)。カラオケ楽曲の再生が終了すると、制御部10は、ユーザ歌唱音声データ記憶領域24に記憶されたユーザ歌唱音声データとRAMに記憶されたパラメータデータとに基づいて、歌唱の採点を行う(ステップS114)。そして制御部10は、採点結果を表示部40に表示させる(ステップS116)。
【0030】
このように、本実施形態によれば、歌唱の対象となる曲に対して予め決められた基準から乖離している度合いである乖離度に応じて前記歌唱者の歌唱を評価するときの、当該乖離度を表すパラメータを変更可能にすることが可能となる。これにより、ユーザは、単一の評価基準に縛られることなく、各々の楽曲、ジャンルや歌手の特徴に合わせた評価基準を用いて歌唱を行うことが可能となり、採点結果に対してより高い満足度を得ることができる。
【0031】
<変形例>
以上の実施形態は次のように変形可能である。尚、以下の変形例は適宜組み合わせて実施しても良い。
【0032】
<変形例1>
実施形態においては、ユーザは複数の評価基準のうちいずれか一の評価基準を選択し、制御部10は、選択された一の評価基準に基づいた採点結果を表示部40に表示させていたが、ユーザが選択可能な評価基準は複数としてもよい。この場合、制御部10は、選択された各々の評価基準に基づいて採点を行い、各々の採点結果を並べて表示部40に表示させるようにしてもよい。このようにすれば、ユーザは、一度の歌唱で複数の評価結果を得ることで、評価の違いを楽しむことが可能となる。また、ここで制御部10は、複数の評価結果の平均値を評価結果として出力するようにしてもよい。このようにすれば、ユーザは、一度の歌唱で複数の評価基準が同時に反映された評価結果を得ることが出来、異なる評価基準をミックスさせて歌唱を評価させる、という楽しみ方が可能となる。
【0033】
<変形例2>
実施形態においては、説明を簡易なものとするため、パラメータデータにおいて評価基準の評価項目とするものはピッチのズレのみとしていたが、評価項目はこれに限ったものではない。制御部10は、例えば他の評価基準として、各ノートを単位とした、発音タイミング、音長、ビブラートの良し悪し、抑揚の有無、こぶしの有無、声質、息遣いなど歌唱音声に関する内容であればどのような内容であっても評価項目とすることができる。具体的には、制御部10は、上記実施形態と同様に、上記の発音タイミング等について予め決められた基準を記憶しておき、ユーザの歌唱がその基準から乖離しているほど低い評価値を算出する、などの手法を採用すればよい。このようにすれば、ユーザは、複数の観点から自らの歌唱についての評価を得ることが可能となる。
【0034】
<変形例3>
実施形態において、ユーザが操作部30を介して選択可能な評価基準は、サーバ装置200から受信する、曲別、歌手別、或いはジャンル別のパラメータデータから選択されていたが、パラメータデータの種類はこれに限ったものではない。例えばユーザが操作部30を介して、評価基準の厳しさの度合いを手動で設定可能としてもよい。この場合、例えばパラメータ記憶領域25に、手動パラメータテーブルなるものが含まれる。図7は、手動パラメータテーブル25dを表す模式図である。ユーザは、「易しい」、「普通」、及び「難しい」といった、複数の評価基準から任意のものを選択する。ここで、図7に表されるように、評価の基準がピッチに関するものであれば、「易しい」が選択された場合、音高のズレの許容範囲が最も大きなものとなり、「難しい」が選択された場合、音高のズレの許容範囲が最も小さなものとなり、「普通」が選択された場合、音高のズレの許容範囲が「易しい」と「難しい」の中間程度となる、といった具合である。このようにすれば、ユーザは、歌唱力に応じて評価基準を段階的に変更することが可能であるため、複数のユーザ間において歌唱の巧拙にバラつきがある場合でも、歌唱者の歌唱におけるレベルに応じて評価基準を設定したり、徐々に難易度を上げていく、という楽しみ方をすることが可能となる。
【0035】
また、例えばパラメータ記憶領域25は、地域別パラメータテーブルや時間帯別パラメータテーブルを備えていてもよい。図8は、地域別パラメータテーブル25e及び時間帯別パラメータテーブル25fを表す模式図である。例えば地域別パラメータテーブル25eの場合、特定の地域ごと(例えば、関東、関西、東北等)に、地域ごとの発音のニュアンスに対応したパラメータデータを対応付けるようにしてもよい。例えば、一般的に、標準語が浸透している関東地方と比較して、関西地方は独自の関西弁が根強く残っており、話す際に発音の抑揚が強い確率が高いことが考えられる。従ってこの場合、ピッチに関して、地域が「関西」のパラメータデータにおいて、地域が「関東」のパラメータデータよりも音高のズレの許容範囲を大きくすればよい。このようにすれば、地域ごとの方言による発音のニュアンスの違いが考慮された採点が行われるようになる。上記及び図8のパラメータデータの設定は一例であり、例えば「関東」「関西」を「100セント」に設定し、「東北」だけ「200セント」に設定することや、広域の分類(例:「東日本」や「西日本」)、又は細分化した地域ごとのパラメータデータを設定することが可能である。さらに、行政区分に基づく分類に限らず、本発明に合わせて予め決めた、方言を基準とした独自の地域分類に基づくパラメータデータを設定することも可能である。
【0036】
また、図8における時間帯別パラメータテーブル25fの場合、夜間から早朝にかけての時間帯及び朝から昼にかけての時間帯にかけては、ピッチに関して、音高のズレの許容範囲が大きくなっている。これは、以下のような考えによるものである。夜間から早朝にかけての時間帯では、ユーザがアルコールを摂取している確率が高く、このような場合、アルコールを摂取していないときと比較して歌唱力が落ちることが多いと考えられる。また、朝から昼にかけての時間帯についても、起床してあまり時間が経っていないユーザが多いことが考えられ、このような場合、起床後に一定の時間が経過したときと比較して声が出にくい状態であることが多いと考えられる。従って、ユーザが上記時間帯を評価基準として選択した場合、例えばピッチの評価項目については、上記時間帯以外の時間帯よりも音高のズレをより広く許容するようにすればよい。時間帯別のパラメータデータについては、ユーザが評価基準として「時間帯別」を選択するだけで、自動的にユーザが操作を行った時間帯が選択されるようにしてもよい。この場合、制御部10は、カラオケ装置100に備えられた計時機能から時間を取得し、取得した時間で時間帯別パラメータテーブル25fを検索することで、評価の基準値を取得する。上記及び図8のパラメータデータの設定は一例であり、例えば学生や主婦やお年寄りの多いと考えられる昼間の時間帯(例:12:00〜17:00)に対して、音高のズレをより広く許容する「300セント」と設定し、それ以外の時間帯を「100セント」と設定することが可能である。さらに、1日における時間帯についての設定に限らず、「平日」又は「週末」といった観点からの分類に基づく設定が行われてもよい。この場合、ユーザがアルコールを摂取している可能性が高い「週末」は、「平日」と比較して、音高のズレをより広く許容するように設定してもよい。このように、時間帯別パラメータは、設計者が設計において任意に設定可能である。
【0037】
<変形例4>
カラオケ装置100はサーバ装置200とネットワークNWにより接続されているが、このシステム構成を利用して次のようにしてもよい。サーバ装置200のネットワークストレージ210には、接続されるカラオケ装置100に関する情報(どの地域の、どの店舗に設定されているか等)が記憶されたカラオケ装置情報テーブル211が含まれているから、これを利用して、サーバ装置200が、カラオケ装置100が設置された地域や店舗に応じたパラメータデータをカラオケ装置100に配信するようにしてもよい。
【0038】
図9は、カラオケ装置情報テーブル211を表す模式図である。「カラオケ装置ID」は、カラオケ装置の各々を一意に識別する識別子であり、例えば7桁のアルファベットで表される。「地域」は、対応付けられたカラオケ装置IDを保持するカラオケ装置100が設置された地域を表す。「店舗種別」は、対応付けられたカラオケ装置IDを保持するカラオケ装置100が設置された店舗の種別を表す。サーバ装置200は、NWを通じて接続されたカラオケ装置100からカラオケ装置IDを取得する。そしてサーバ装置200は、取得したカラオケ装置IDを用いてカラオケ装置情報テーブル211を検索することで、各々のカラオケ装置が設置された地域及び店舗種別に関する情報を得ることが出来る。このようにすれば、サーバ装置200は、接続される全てのカラオケ装置100に対して、一律、同一のパラメータデータを配信する場合と比較して、カラオケ装置100の設置された地域や店舗ごとの特徴に合わせて、各々異なるパラメータデータを配信することが可能となる。これにより、地域の特色や店舗種別の違い(カラオケ店、スナック等)に応じて適切なパラメータデータを配信可能となる。ここで、地域の特色は上述したとおりである。店舗種別の違いについては、例えばスナックであれば、利用客はアルコールを摂取している可能性が高いから、カラオケ店と比較して、ピッチのズレの許容範囲が大きなパラメータデータが配信されるようにすればよい。また、このようにすれば、サーバ装置200が必要なデータのみを送信することで配信対象のデータ量が縮小し、ネットワークNWの負荷を軽減すると共に、カラオケ装置100の記憶部20が記憶するデータ量を低減することで記憶部20の記憶容量を有効活用することが可能となる。
【0039】
<変形例5>
実施形態において、減点するポイント(すなわち評価結果)を算出するための計算式が設けられる場合、制御部10によって、この計算式で用いられる係数や閾値がパラメータデータに応じて変更されるようにしてもよい。この場合、各パラメータテーブルにはピッチに関する許容範囲といった基準値だけではなく、上記の係数や閾値そのものも格納される。そして、制御部10は、評価基準として選択されたパラメータデータに含まれる係数や閾値を上述の計算式に用いて、評価結果を算出する。
【0040】
変形例5の具体例として、例えばビブラートに関する計算式を用いる例を考える。
図10は、ビブラートの評価値を算出する計算式を説明するための図である。図10において、横軸は時間を表し、図10中で左から右に進むほど時間が経過することを表している。また、縦軸は音高を表し、図10中で下から上に進むほど音高が高くなることを表している。実線で表されたガイドメロディGMは、ガイドメロディの音高を表している。曲線で表されたユーザ歌唱音声曲線500は、ユーザの歌唱による音声の音高を表す。縦方向の矢印で表されたピークピッチ幅p1及びp2は、ユーザ歌唱音声曲線500における音高のピーク間の、音の高さ方向における幅であって、ユーザの歌唱におけるビブラートの音高の振れ幅を表している。横方向の矢印で表されたピーク時間幅t1及びt2は、ユーザ歌唱音声曲線500における音高のピーク間の、時間方向における幅であって、ユーザの歌唱におけるビブラートの期間を表している。
【0041】
ここで、ピークピッチ幅p1〜pnの分散をVpとし、ピーク時間幅t1〜tnの分散をVtとして、Vpに乗算するピッチ係数をα、Vtに乗算する時間係数をβ、閾値をkとしたときに、ビブラートの巧拙判定における数式は以下の数1で表される。ピッチ係数α、時間係数β及び閾値kは、上述したパラメータデータに含まれる閾値の一つである。ピッチ係数α及び時間係数βは、曲別、歌手別、ジャンル別等の違いによって異なる値であり、ピッチ係数αと時間係数βとの和は1.0である。
【数1】

【0042】
数1において、左辺の値が右辺における閾値kよりも小さいときに、制御部10は、ビブラートの巧拙が良好であると判定する。一方、数1において、左辺の値が右辺における閾値kよりも大きいときに、制御部10は、ビブラートの巧拙が不良であると判定する。Vpはピークピッチ幅の分散であるから、値が大きいほど、音高方向におけるビブラートのピーク同士の間隔にばらつきが多いことを表し、値が小さいほど、音高方向におけるビブラートのピーク同士の間隔にばらつきが少ないことを表している。また、Vtは、ピーク時間幅の分散であるから、値が大きいほど、時間方向におけるビブラートのピーク同士の間隔にばらつきが多いことを表し、値が小さいほど、時間方向におけるビブラートのピーク同士の間隔にばらつきが少ないことを表している。
【0043】
例えばユーザが、歌手別パラメータデータで歌手名「ザ・○△」を選択した場合を考える。歌手「ザ・○△」が歌唱したときのビブラートにおいては、音高の振れ幅がダイナミックで音高方向にバラつきが多い一方、時間方向の揺れは比較的正確でバラつきが少なかったとする。この場合、歌唱評価装置の設計時において、「α<β」となるように各々の係数が設定される。このようにすれば、制御部10により、歌手「ザ・○△」の特徴にあった歌唱法が、より高く採点され易くなる。
【0044】
また、例えばビブラートに加えて、ピッチ及び発音タイミングを採点の対象とした場合、ピッチに関する採点結果をPitchとし、ビブラートに関する採点結果をVibとし、発音タイミングに関する採点結果をTimingとして、Pitchに乗算するピッチ採点係数をγ、Vibに乗算するビブラート採点係数をδ、Timingに乗算する発音タイミング採点係数をε、得点をPtとしたときに、得点Ptを算出する数式は以下の数2で表される。ここで、ピッチ採点係数γ、ビブラート採点係数δ、及び発音タイミング採点係数εの総和は1.0である。
【数2】

【0045】
例えばユーザが、歌手別パラメータデータで歌手名「山○タロウ」を選択した場合を考える。歌手「山○タロウ」は、その歌唱において、ピッチが比較的正確であり、ビブラートは音高方向にバラつきが大きいため綺麗なビブラートとは言えず、発音タイミングは遅れ気味であったとする。このような場合、歌唱評価装置の設計時において、「δ<ε<γ」若しくは「ε<δ<γ」となるように各々の係数が設定される。このようにすれば、制御部10により、歌手「山○タロウ」の特徴にあった歌唱法が、より高く採点され易くなる。
【0046】
<変形例6>
実施形態において、記憶部20がパラメータデータ記憶領域25を備えることで、制御部10は、このパラメータデータ記憶領域25からパラメータデータを取得していたが、これに限らず、記憶部20がパラメータデータ記憶領域25を備えずに、制御部10は、必要なパラメータデータを例えばコンテンツデータを受信する前後のタイミングでサーバ装置200から受信して取得するようにしてもよい。この場合、制御部10は、サーバ装置200がパラメータデータを選択するために必要な情報をサーバ装置に通知する。このようにすれば、カラオケ装置100が要する記憶装置の記憶容量が削減可能となるとともに、実施形態と同様の効果を奏することが可能となる。
【0047】
<変形例7>
本発明は、歌唱評価装置以外にも、これらを実現するための方法や、コンピュータに音声評価機能を実現させるためのプログラムとしても把握される。かかるプログラムは、これを記憶させた光ディスク等の記録媒体の形態で提供されたり、インターネット等を介して、コンピュータにダウンロードさせ、これをインストールして利用させるなどの形態でも提供されたりする。
【符号の説明】
【0048】
10…制御部、20…記憶部、21…伴奏データ記憶領域、22…映像データ記憶領域、23…GMデータ記憶領域、24…ユーザ歌唱音声データ記憶領域、25…パラメータ記憶領域、25a…曲別パラメータテーブル、25b…歌手別パラメータテーブル、25c…ジャンル別パラメータテーブル、25d…手動パラメータテーブル、25e…地域別パラメータテーブル、25f…時間帯別パラメータテーブル、30…操作部、40…表示部、50…通信制御部、60…音声処理部、61…マイクロホン、62…スピーカ、70…バス、100…カラオケ装置、200…サーバ装置、210…ネットワークストレージ、211…カラオケ装置情報テーブル、300,500…ユーザ歌唱音声曲線、401〜403,405〜407…ガイドメロディ、GM…ガイドメロディ、NW…ネットワーク、p1,p2…ピークピッチ幅、t1,t2…ピーク時間幅

【特許請求の範囲】
【請求項1】
歌唱者が曲を歌唱したときの音声を表す音声データを取得する音声データ取得手段と、
歌唱の対象となる曲に対して予め決められた基準から乖離している度合いである乖離度に応じて前記歌唱者の歌唱を評価するときの、当該乖離度を表す複数のパラメータのうち、少なくともいずれか1のパラメータを取得するパラメータ取得手段と、
前記取得されたパラメータを用いて、前記取得された音声データが表す音声による歌唱に対する評価結果を算出する算出手段と
を備えることを特徴とする歌唱評価装置。
【請求項2】
前記複数のパラメータのうち、少なくともいずれか1のパラメータを選択する操作を受け付ける操作手段を備え、
前記パラメータ取得手段は、受け付けられた前記操作により選択された前記パラメータを取得する
ことを特徴とする請求項1に記載の歌唱評価装置。
【請求項3】
前記複数のパラメータは、歌唱される曲毎に決められた複数のパラメータ、前記曲が属するジャンル毎に決められた複数のパラメータ、または、特定の歌唱者毎に決められた複数のパラメータのうちいずれかを含む
ことを特徴とする請求項1又は2に記載の歌唱評価装置。
【請求項4】
前記複数のパラメータのうち、少なくともいずれか1のパラメータを選択する操作を受け付ける操作手段を備え、
前記複数のパラメータは、歌唱される曲毎に決められた複数のパラメータと、当該曲毎に決められたパラメータ以外の複数のパラメータを含み、
前記パラメータ取得手段は、前記パラメータを選択する操作が受け付けられた場合には、当該操作により選択された前記パラメータを取得し、前記パラメータを選択する操作が受け付けられなかった場合には、前記曲毎に決められた複数のパラメータのうち、歌唱の対象となる曲について決められたパラメータを取得する
ことを特徴とする請求項1に記載の歌唱評価装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate