歌唱評価装置

【課題】歌唱の対象となる曲に対して予め決められた基準から乖離している度合いである乖離度に応じて前記歌唱者の歌唱を評価するときの、当該乖離度を表すパラメータを変更可能にすることを目的とする。
【解決手段】評価基準が選択されると（ステップＳ１０４；Ｙｅｓ）、制御部１０は、選択された評価基準に相当するパラメータデータをＲＡＭに読み込む（ステップＳ１０８）。一方、ステップＳ１０４でＮｏの場合、制御部１０は、パラメータデータ記憶領域２５から、検索キーに設定された曲番号と紐付く曲別パラメータデータを評価基準として検索し、検索結果のパラメータデータをＲＡＭに読み込む（ステップＳ１０８）。楽曲の再生が終了すると、制御部１０は、ユーザ歌唱音声データ記憶領域２４に記憶されたユーザ歌唱音声データとＲＡＭに記憶されたパラメータデータとに基づいて、歌唱の採点を行う（ステップＳ１１４）。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、歌唱評価装置に関する。
【背景技術】
【０００２】
カラオケ装置においては、歌唱者による歌唱の巧拙を採点する機能を備えるものがある。例えば特許文献１には、重み係数マップを用いて音程に関する得点を計算する方法が開示されている。また、特許文献２には、リファレンスデータと実際の歌唱におけるピッチデータとのズレに応じて音程に関する得点を計算する方法が開示されている。
【先行技術文献】
【特許文献】
【０００３】
【特許文献１】特開２００４−１８４５０６号公報
【特許文献２】特開２００９−０９２８７１号公報
【発明の概要】
【発明が解決しようとする課題】
【０００４】
特許文献１や特許文献２に記載の技術では、歌唱の巧拙について採点が行われる際の基準が常に同一である。例えば楽曲のジャンルによる歌唱法の特徴の違い、或いは歌手毎の歌唱法における特徴の違い等によって、歌唱の巧拙について採点が行われる基準を異ならせたいという要望があっても、特許文献１や特許文献２に記載の技術によれば、常に単一の基準によって歌唱の巧拙が評価されてしまうため、歌唱者が採点結果に満足いかない場合がある。
本発明は上述の背景に鑑みてなされたものであり、歌唱の対象となる曲に対して予め決められた基準から乖離している度合いに基づき歌唱を評価するときの、その乖離の度合いをそれぞれの歌唱単位で変更可能にすることを目的とする。
【課題を解決するための手段】
【０００５】
上述した課題を解決するために、本発明は、歌唱者が曲を歌唱したときの音声を表す音声データを取得する音声データ取得手段と、歌唱の対象となる曲に対して予め決められた基準から乖離している度合いである乖離度に応じて前記歌唱者の歌唱を評価するときの、当該乖離度を表す複数のパラメータのうち、少なくともいずれか１のパラメータを取得するパラメータ取得手段と、前記取得されたパラメータを用いて、前記取得された音声データが表す音声による歌唱に対する評価結果を算出する算出手段とを備えることを特徴とする歌唱評価装置を提供する。
【０００６】
また、別の好ましい態様において、前記複数のパラメータのうち、少なくともいずれか１のパラメータを選択する操作を受け付ける操作手段を備え、前記パラメータ取得手段は、受け付けられた前記操作により選択された前記パラメータを取得する。
【０００７】
また、別の好ましい態様において、前記複数のパラメータは、歌唱される曲毎に決められた複数のパラメータ、前記曲が属するジャンル毎に決められた複数のパラメータ、または、特定の歌唱者毎に決められた複数のパラメータのうち、少なくともいずれかを含む。
【０００８】
また、別の好ましい態様において、前記複数のパラメータのうち、少なくともいずれか１種類のパラメータを選択する操作を受け付ける操作手段を備え、前記複数のパラメータは、歌唱される曲毎に決められた複数のパラメータと、当該曲毎に決められたパラメータ以外の複数のパラメータを含み、前記パラメータ取得手段は、前記パラメータを選択する操作が受け付けられた場合には、当該操作により選択された前記パラメータを取得し、前記パラメータを選択する操作が受け付けられなかった場合には、前記曲毎に決められた複数のパラメータのうち、歌唱の対象となる曲について決められたパラメータを取得する。
【０００９】
また、本発明は、コンピュータに、歌唱者が歌唱したときの音声を表す音声データを取得する音声データ取得機能と、歌唱の対象となる曲に対して予め決められた基準から乖離している度合いである乖離度に応じて前記歌唱者の歌唱を評価するときの、当該乖離度を表す複数のパラメータのうち、少なくともいずれか１のパラメータを取得するパラメータ取得機能と、前記取得されたパラメータを基準にして、前記取得された音声データが表す音声による歌唱に対する評価結果を算出する算出機能とを実現させるためのプログラムとしても提供し得る。
【発明の効果】
【００１０】
本発明によれば、歌唱の対象となる曲に対して予め決められた基準から乖離している度合いである乖離度に応じて前記歌唱者の歌唱を評価するときの、当該乖離度を表すパラメータを変更可能となる。
【図面の簡単な説明】
【００１１】
【図１】本発明の実施形態におけるシステムの構成図
【図２】カラオケ装置のハードウェア構成を表すブロック図
【図３】伴奏データ記憶領域の内容を表す模式図
【図４】パラメータデータ記憶領域の内容を表す模式図
【図５】採点処理の具体例を説明する模式図
【図６】採点処理が行われる際のフロー図
【図７】手動パラメータテーブルを表す模式図
【図８】地域別パラメータテーブル及び時間帯別パラメータテーブルを表す模式図
【図９】カラオケ装置情報テーブル２１１を表す模式図
【図１０】ビブラートの評価値を算出する計算式を説明するための図
【発明を実施するための形態】
【００１２】
以下、本発明の一実施形態について説明する。
＜実施形態＞
＜構成＞
図１は、本発明の実施形態におけるシステムの構成を表した図である。
このシステムは、カラオケ装置１００と、サーバ装置２００と、ネットワークＮＷとを有する。カラオケ装置１００は、ユーザからの要求に従ってカラオケ楽曲を再生するとともに、再生されるカラオケ楽曲についてのユーザによる歌唱を評価する装置である。ネットワークＮＷはＬＡＮ（Local Area Network）やインターネットであり、カラオケ装置１００とサーバ装置２００との間におけるデータ通信が行われる通信網である。サーバ装置２００は、その内部あるいは外部に備えたＨＤＤ（Hard Disk Drive）等の記憶手段に、カラオケ楽曲に関するコンテンツデータ、及びカラオケ装置１００がユーザによる歌唱を採点つまり歌唱を評価する際の基準となるパラメータデータ等を記憶しており、カラオケ装置１００からの要求に従って、ネットワークＮＷ経由でこのコンテンツデータ及びパラメータデータをカラオケ装置１００に供給する装置である。ここで、コンテンツとは、カラオケ楽曲に関する音声と映像との組み合わせを指す。すなわち、コンテンツデータとは、主旋律の歌声が存在せず伴奏やコーラスで構成されたいわゆる伴奏データと、この楽曲の歌詞や歌詞の背景に表示する映像からなる映像データとから成り立っている。なお、サーバ装置２００に対してカラオケ装置１００は複数存在してもよい。また、カラオケ装置１００に対してサーバ装置２００が複数存在してもよい。
【００１３】
図２は、カラオケ装置１００のハードウェア構成を表したブロック図である。
カラオケ装置１００は、制御部１０、記憶部２０、操作部３０、表示部４０、通信制御部５０、音声処理部６０、マイクロホン６１、及びスピーカ６２を有し、これら各部がバス７０を介して接続されている。制御部１０は、ＣＰＵ（Central Processing Unit）、ＲＡＭ（Random Access Memory）、及びＲＯＭ（Read Only Memory）等を有している。制御部１０において、ＣＰＵが、ＲＯＭや記憶部２０に記憶されているコンピュータプログラムを読み出しＲＡＭにロードして実行することにより、カラオケ装置１００の各部を制御する。また、制御部１０は、サーバ装置２００から供給されたパラメータデータのうち選択されたパラメータデータに従って採点することで、ユーザによる歌唱に対して評価を行う。
【００１４】
操作部３０は、各種の操作子を備え、ユーザによる操作内容を表す操作信号を制御部１０に出力する。表示部４０は、例えば液晶パネルを備え、制御部１０による制御の下、各カラオケ楽曲に応じた歌詞テロップや背景映像等を表示する。通信制御部５０は、カラオケ装置１００とネットワークＮＷとを有線あるいは無線で接続し、ネットワークＮＷを介したカラオケ装置１００とサーバ装置２００との間のデータ通信を制御する。
【００１５】
サーバ装置２００は、図示せぬＣＰＵや各種メモリを備えたコンピュータであり、特にネットワークストレージ２１０を備えている。ネットワークストレージ２１０は例えばＨＤＤであり、カラオケ楽曲のコンテンツデータ及びパラメータデータ等を記憶する。図２においてサーバ装置２００は１つのネットワークストレージ２１０を備えているが、ネットワークストレージの数はこれに限ったものではなく、複数のネットワークストレージをサーバ装置２００が備えてもよい。ユーザにより予約されたカラオケ楽曲のコンテンツデータがネットワークストレージ２１０に記憶されている場合、カラオケ装置１００は、通信制御部５０による制御に従ってサーバ装置２００と通信を行い、ネットワークストレージ２１０から読み出されたコンテンツデータをネットワークＮＷ経由でダウンロードしながら、ダウンロードが完了した部分から順次再生する、というストリーミング再生を行う。
【００１６】
マイクロホン６１は、収音した音声を表すアナログの音声信号を音声処理部６０に出力する。音声処理部６０は、Ａ／Ｄ（Analog / Digital）コンバータを有し、マイクロホン６１が出力したアナログの音声信号をデジタルの音声データに変換して制御部１０に出力し、制御部１０はこれを取得する。このように、制御部１０はユーザ（歌唱者）が歌唱したときの音声を表す音声データを取得する音声取得手段として機能する。また、音声処理部６０は、Ｄ／Ａ（Digital / Analog）コンバータを有し、制御部１０から受け取ったデジタルの音声データをアナログの音声信号に変換してスピーカ６２に出力する。スピーカ６２は、音声処理部６０から受け取ったアナログの音声信号に基づく音を放音する。記憶部２０は、各種のデータを記憶するための記憶手段であり、例えばＨＤＤや不揮発性メモリである。記憶部２０は、伴奏データ記憶領域２１、映像データ記憶領域２２、ＧＭ（Guide Melody）データ記憶領域２３、ユーザ歌唱音声データ記憶領域２４、及びパラメータ記憶領域２５といった複数の記憶領域を備えている。
【００１７】
図３は、伴奏データ記憶領域２１の内容を表す模式図である。
伴奏データ記憶領域２１には、各楽曲における伴奏の音声を表す伴奏データに関する情報が記憶されている。伴奏データ記憶領域２１には、「曲番号」、「曲名」、「歌手名」、「ジャンル」、及び「ファイル格納場所」といった複数の項目からなる伴奏データレコードが複数記憶されている。「曲番号」は、楽曲を一意に識別するための番号であり、例えば４桁の親番号と２桁の枝番号とからなる。「曲名」は、各楽曲の名称を表す。「歌手名」は、各楽曲の歌い手の名称を表す。「ジャンル」は、予め決められた分類基準で分類された複数のジャンルのうち、各楽曲の属する音楽のジャンルを表す。「ファイル格納場所」は、各楽曲の伴奏データそのものであるデータファイルの格納場所を表し、server1又はserver2というフォルダを含む場合には伴奏データのデータファイルがサーバ装置２００に格納されており、server1又はserver2というフォルダを含まない場合には伴奏データのデータファイルがカラオケ装置１００に格納されていることを意味している。例えば図３において、曲名が「ＢＢＢ」である楽曲は、伴奏データのデータファイルがサーバ装置２００に格納されていることを表し、曲名が「ＣＣＣ」である楽曲は、伴奏データのデータファイルがカラオケ装置１００の記憶部２０に格納されていることを表している。この伴奏データのデータファイルは、例えば、ＭＩＤＩ（Musical Instrument Digital Interface）形式のファイルである。
【００１８】
映像データ記憶領域２２には、各楽曲の歌詞を示す歌詞データ及び歌詞の背景に表示される背景映像を表す背景映像データが記憶されている。歌詞データによって示される歌詞は、カラオケ歌唱の際に、楽曲の進行に伴って歌詞テロップとして表示部４０に表示される。また、背景映像データによって表される背景映像は、カラオケ歌唱の際に楽曲の進行に伴って歌詞テロップの背景として表示部４０に表示される。ＧＭデータ記憶領域２３には、楽曲のボーカルパートのメロディを示すデータ、すなわち、歌唱すべき構成音の内容を指定するデータであるガイドメロディデータ（以下、ＧＭデータという）が記憶されている。ＧＭデータは、制御部１０がユーザによる歌唱の巧拙を評価する際に比較の基準となるものである。ＧＭデータは、例えば、ＭＩＤＩ形式により記述されている。ユーザ歌唱音声データ記憶領域２４には、カラオケの対象となった各楽曲について、その伴奏データが再生されている期間中マイクロホン６１によって収音されたユーザの歌唱音声が音声処理部６０でデジタルデータに変換されることで生成された音声データが記憶される。この音声データをユーザ歌唱音声データという。このユーザ歌唱音声データは、例えば、ＷＡＶＥ（RIFF waveform Audio Format）形式のデータファイルとして記憶される。各楽曲についてのユーザ歌唱音声データは、制御部１０によって、その楽曲のＧＭデータに対応付けられる。
【００１９】
パラメータ記憶領域２５には、前述したパラメータデータが複数種類記憶されている。これらのパラメータデータは、カラオケ装置１００が予めサーバ装置２００からネットワークＮＷを通じて取得したものである。カラオケ装置１００は、一度ダウンロードしたパラメータデータについては、自装置内のパラメータ記憶領域２５に記憶されたものを用いる。ユーザにより指定されたパラメータデータがパラメータ記憶領域２５に記憶されていない場合、カラオケ装置１００は、当該パラメータデータを、上述したようにサーバ装置２００から取得する。パラメータデータの種類には、曲別、歌手別、ジャンル別という３種類があり、各パラメータデータには、少なくとも１つ以上の評価項目について採点に用いられる評価基準が含まれている。ユーザは、パラメータ記憶領域２５に記憶されたパラメータデータ群から、操作部３０を介して任意のパラメータデータを指定することで、カラオケ楽曲に合わせて歌唱を行う際の採点に用いられる評価基準を選択することが可能である。つまり、操作部３０は、複数のパラメータのうち、少なくともいずれか１種類のパラメータを選択する操作を受け付ける操作手段として機能する。なお、カラオケ装置１００においては、採点の方式に減点方式を採用している。ここで減点方式とは、あるカラオケ楽曲についてユーザが歌唱を開始した時点では満点から始まり（１００点満点であれば１００点）、ユーザによる歌唱が評価基準を満たさないときに、随時、制御部１０によって減点が行われる、という方式である。
【００２０】
図４は、パラメータ記憶領域２５の内容を表す模式図である。パラメータ記憶領域２５には、曲別パラメータテーブル２５ａ、歌手別パラメータテーブル２５ｂ、及びジャンル別パラメータテーブル２５ｃが含まれる。曲別パラメータテーブル２５ａには、「曲番号」、「曲名」、及び「ピッチ」といった複数の項目からなる曲別パラメータレコードが複数記述されている。「曲番号」及び「曲名」は、上述したとおりである。「ピッチ」は、制御部１０が採点を行う際の評価項目であり、選択された楽曲のＧＭデータを比較の基準として、各々のノートを単位とした場合に、上下方向において音高のズレをどれだけ許容するかを表している。具体的には、例えば図４（ａ）における曲名「ＡＡＡ」のカラオケ楽曲は、ピッチに関して「１００セント（半音）」のズレを許容しており、ユーザの歌唱におけるピッチとＧＭデータにおけるピッチとのズレがこの基準値「１００セント」を超えると、制御部１０によって減点が行われることを意味している。例えば、曲名「ＡＡＡ」のカラオケ楽曲をユーザが歌唱した際に、ＧＭデータにおける或るノートが「Ｃ３」の音高であった場合、このノートについてのユーザの歌唱における音高が「Ｃ３＃」から「Ｃ３♭」の範囲に収まらなかった場合に、制御部１０は、このノートについて減点を行う。このようにして制御部１０は、ユーザによる歌唱をその開始から終了まで減点方式により採点を行い、採点結果を表示部４０に表示する。
【００２１】
歌手別パラメータテーブル２５ｂには、「歌手名」及び「ピッチ」といった複数の項目からなる歌手別パラメータレコードが複数記述されている。「歌手名」は、上述したとおりである。「ピッチ」は、制御部１０が採点を行う際の評価項目であり、採点に用いられる評価基準として特定の「歌手名」の歌い手が選択された場合に、選択された楽曲のＧＭデータを比較の基準とし、各々のノートを単位として上下方向において音高のズレをどれだけ許容するかを表している。ジャンル別パラメータテーブル２５ｃには、「ジャンル」及び「ピッチ」といった複数の項目からなるジャンル別パラメータレコードが複数記述されている。「ジャンル」は、上述したとおりである。「ピッチ」は、制御部１０が採点を行う際の評価項目であり、採点に用いられる評価基準として「ジャンル」で示されるジャンルが選択された場合に、選択された楽曲のＧＭデータを比較の基準とし、各々のノートを単位として上下方向において音高のズレをどれだけ許容するかを表している。
【００２２】
ユーザが操作部３０を介していずれのパラメータデータも指定しない場合、制御部１０は、予約された楽曲の曲名に対応する曲別パラメータデータを評価基準としてユーザの歌唱を採点する。一方、ユーザが操作部３０を介していずれかのパラメータデータを指定した場合、制御部１０は、指定されたパラメータデータを評価基準としてユーザの歌唱を採点する。例えばユーザが、図４における曲名「ＤＤＤ」で示される楽曲を予約し、歌手名「ザ・○△」を採点に用いられる評価基準として指定した場合を考える。この場合、歌手名「ザ・○△」が評価基準としてユーザにより指定されているため、「１５０セント」迄の音高のズレは、制御部１０によって減点の対象とされなくなる。一方、歌手名「ザ・○△」を評価基準として指定しない場合、制御部１０は、曲別パラメータデータを評価基準としてユーザの歌唱を採点するため、図４に表されるように「５０セント」の音高のズレしか許容しない。
【００２３】
＜動作＞
次に、図５を用いて、制御部１０による採点の考え方について説明を行う。
図５は、採点処理の具体例を説明する模式図である。図５において、横軸は時間を表し、図５中で左から右に進むほど時間が経過することを表している。また、縦軸は音高を表し、図５中で下から上に進むほど音高が高くなることを表している。縦軸の１つの目盛りは１００セント（半音）の音高を意味している。つまり、例えば図５において、「Ｃ３」で示される領域の情報に位置する目盛りに対して１目盛り分だけ上方に位置する目盛りは、「Ｃ３＃」の音高を表している。また、「Ｃ３」で示される領域の下方に位置する目盛りに対して１目盛り分だけ下方に位置する目盛りは、「Ｃ３♭」の音高を表している。また、図５において矩形の領域４０１〜４０３及び４０５〜４０７は、ＧＭデータに基づくガイドメロディの音高を表している。例えば、図５に示される期間においては、Ｃ３の音高の音がＴ１の期間だけ続いた後に、Ｅ３の音高の音がＴ２の期間だけ続き、さらにその後Ｇ３の音高の音がＴ３の期間だけ続くと、Ｔ４の期間だけ無音の状態が続くといった具合である。また、実線３００は、前述したユーザ歌唱音声データによって表されるユーザの歌唱時の音声の音高を表しており、以下、ユーザ歌唱音声曲線３００という。
【００２４】
制御部１０は、ユーザ歌唱音声記憶領域２４に記憶されたユーザ歌唱音声データと、このユーザ歌唱音声データに対応付けられたＧＭデータを取得する。また、制御部１０は、複数のパラメータデータのうち、少なくともいずれか１のパラメータデータを取得する。ＧＭデータは、上述したように、制御部１０がユーザによる歌唱の巧拙を評価する際に比較の基準となるものであって、歌唱の対象となる曲に対して予め決められた基準である。一方、パラメータデータは、このＧＭデータから乖離している度合いを表す。例えば上述したように、パラメータデータにおいてピッチで「１００セント」が設定されている場合、ＧＭデータを基準として、上下「１００セント」の音高のズレ（つまり乖離の度合い）が許容されることを表している。ここで制御部１０が取得するパラメータデータは、カラオケ楽曲の予約時に、操作部３０を介してユーザにより任意にパラメータデータが選択された場合、この選択されたパラメータデータであり、ユーザにより任意にパラメータデータが選択されなかった場合、歌唱の対象となった楽曲についての曲別のパラメータデータである。制御部１０は、取得したユーザ歌唱音声データを解析し、このユーザ歌唱音声データに対応付けられたＧＭデータと比較して、取得したパラメータデータに基づいて評価項目に対しての評価値を算出する。この評価項目は、パラメータデータにおける評価項目であり、ここではピッチ（音高）の一致度である。
【００２５】
制御部１０は、ユーザ歌唱音声を解析する手法として、ＦＦＴ（Fast Fourier Transform）などを用いた周波数分析、音量分析などの公知の様々な手法を用い、評価項目について評価値、つまり評価結果を算出する。例えば、音高の一致度については、制御部１０は、ユーザ歌唱音声データが示す音声のピッチの変化と、ＧＭデータが示すガイドメロディのピッチの変化とを比較し、これらの一致の程度を示す評価値を算出する。評価値は、あるノートにおいて、双方のピッチの差がパラメータデータに基づいて許容された範囲内に収まっていれば１００％（すなわち減点なし）であり、双方のピッチの差が上記範囲内に収まらない部分の期間が、ＧＭデータにおいてこのノートにおける音長の半分に渡っていれば５０％である、といった具合である。つまり、あるノートにおいて、双方のピッチの差が上記範囲内に収まる期間を、ＧＭデータにおいてこのノートにおける音長で序した値を評価値とする。制御部１０は、算出した評価値に基づいて減点するポイントを決定する。例えば、あるノートに「２点」のポイントが割り当てられているときに、評価値が５０％と算出された場合、制御部１０は、「１点」を減点のポイントとして決定する。
【００２６】
例えば図５において、ユーザが、操作部３０を介して曲名「ＡＡＡ」である楽曲を予約し、採点に用いられる評価の基準としてジャンル「ロック」を選択したものとする。このとき、図４に示すように、曲名「ＡＡＡ」の曲別パラメータデータでは「１００セント」の音高のズレが許容されるが、ユーザによりジャンル別パラメータデータとして「ロック」が指定されたため、制御部１０は、図４に示すように、採点に際して「２００セント」の音高のズレを許容することとなる。上記の設定の下で、制御部１０がユーザの歌唱を採点すると、次のような結果となる。まず、Ｔ１の期間では、ユーザ歌唱音声曲線３００の終端部分においてガイドメロディ４０１と１００セントの音高のズレが生じているが、評価の基準値は「２００セント」の音高のズレであるため、制御部１０による減点の対象とならない。次にＴ２の期間では、ユーザ歌唱音声曲線３００の出だしにおいてガイドメロディ４０２と２００セントの音高のズレが生じているが、制御部１０は、「２００セント」の音高のズレを許容するため、Ｔ２の期間においては減点を行わない。次に、Ｔ３の期間では、ユーザ歌唱音声曲線３００の出だしにおいてガイドメロディ４０３と１００セントの音高のズレが生じているが、ここにおいても、評価の基準値である「２００セント」の音高のズレの許容範囲内に収まるため、制御部１０による減点は行われない。
【００２７】
そしてＴ４の無音期間を経て、Ｔ５の期間においては、ユーザ歌唱音声曲線３００は、ガイドメロディ４０５と同じ高さの音高を保っているため、制御部１０によって減点が行われない。次に、Ｔ６の期間においては、ユーザ歌唱音声曲線３００の出だしにおいてガイドメロディ４０６と４００セントの音高のズレが生じている。ここで、Ｔ６の期間において生じた４００セントの音高のズレが、評価の基準値である「２００セント」の音高のズレの許容範囲を超えるため、制御部１０は、前述したようにして評価値を算出したうえで、この評価値に基づいて減点するポイントを決定する。そしてＴ７の期間では、ユーザ歌唱音声曲線３００の出だしにおいてガイドメロディ４０７と２００セントの音高のズレが生じているが、評価の基準値である「２００セント」の音高のズレの許容範囲内であるため、制御部１０による減点は行われない。
【００２８】
図６は、採点処理が行われる際のフロー図である。操作部３０を介してユーザにより楽曲が予約されると（ステップＳ１００；Ｙｅｓ）、制御部１０は、記憶部２０から予約された楽曲の検索を行う（ステップＳ１０２）。具体的にはステップＳ１０２において、制御部１０は、伴奏データ記憶領域２１、映像データ記憶領域２２、及びＧＭデータ記憶領域２３の各々から、選択された楽曲の曲番号または曲名をキーにして、その楽曲に関するデータを検索し、検索結果のデータをＲＡＭに読み込む。次にユーザにより操作部３０を介してパラメータデータが選択されると（ステップＳ１０４；Ｙｅｓ）、制御部１０は、パラメータ記憶領域２５から、選択されたパラメータデータに相当するパラメータデータを検索し、検索結果のパラメータデータをＲＡＭに読み込む（ステップＳ１０８）。一方、ユーザにより操作部３０を介してパラメータデータの選択が為されなかった場合（ステップＳ１０４；Ｎｏ）、制御部１０は、予約された楽曲の曲番号を検索キーとして設定する（ステップＳ１０６）。そして制御部１０は、パラメータデータ記憶領域２５から、検索キーに設定された曲番号に対応する曲別パラメータデータを評価基準として検索し、検索結果のパラメータデータをＲＡＭに読み込む（ステップＳ１０８）。
【００２９】
ステップＳ１０８の次に、制御部１０は、ＲＡＭに記憶された伴奏データ、映像データ、及びＧＭデータに基づいて、カラオケ楽曲の再生を行う（ステップＳ１１０）。具体的にはステップＳ１１０において、制御部１０は、伴奏データ及びＧＭデータに基づく音声をスピーカ６２から放音させるとともに、映像データに基づく映像を表示部４０に表示させる。そして制御部１０は、マイク６１によって収音されたユーザの歌唱音声が音声処理部６０によってデジタルのデータに変換されたものであるユーザ歌唱音声データを、ユーザ歌唱音声データ記憶領域２４に記憶させる（ステップＳ１１２）。カラオケ楽曲の再生が終了すると、制御部１０は、ユーザ歌唱音声データ記憶領域２４に記憶されたユーザ歌唱音声データとＲＡＭに記憶されたパラメータデータとに基づいて、歌唱の採点を行う（ステップＳ１１４）。そして制御部１０は、採点結果を表示部４０に表示させる（ステップＳ１１６）。
【００３０】
このように、本実施形態によれば、歌唱の対象となる曲に対して予め決められた基準から乖離している度合いである乖離度に応じて前記歌唱者の歌唱を評価するときの、当該乖離度を表すパラメータを変更可能にすることが可能となる。これにより、ユーザは、単一の評価基準に縛られることなく、各々の楽曲、ジャンルや歌手の特徴に合わせた評価基準を用いて歌唱を行うことが可能となり、採点結果に対してより高い満足度を得ることができる。
【００３１】
＜変形例＞
以上の実施形態は次のように変形可能である。尚、以下の変形例は適宜組み合わせて実施しても良い。
【００３２】
＜変形例１＞
実施形態においては、ユーザは複数の評価基準のうちいずれか一の評価基準を選択し、制御部１０は、選択された一の評価基準に基づいた採点結果を表示部４０に表示させていたが、ユーザが選択可能な評価基準は複数としてもよい。この場合、制御部１０は、選択された各々の評価基準に基づいて採点を行い、各々の採点結果を並べて表示部４０に表示させるようにしてもよい。このようにすれば、ユーザは、一度の歌唱で複数の評価結果を得ることで、評価の違いを楽しむことが可能となる。また、ここで制御部１０は、複数の評価結果の平均値を評価結果として出力するようにしてもよい。このようにすれば、ユーザは、一度の歌唱で複数の評価基準が同時に反映された評価結果を得ることが出来、異なる評価基準をミックスさせて歌唱を評価させる、という楽しみ方が可能となる。
【００３３】
＜変形例２＞
実施形態においては、説明を簡易なものとするため、パラメータデータにおいて評価基準の評価項目とするものはピッチのズレのみとしていたが、評価項目はこれに限ったものではない。制御部１０は、例えば他の評価基準として、各ノートを単位とした、発音タイミング、音長、ビブラートの良し悪し、抑揚の有無、こぶしの有無、声質、息遣いなど歌唱音声に関する内容であればどのような内容であっても評価項目とすることができる。具体的には、制御部１０は、上記実施形態と同様に、上記の発音タイミング等について予め決められた基準を記憶しておき、ユーザの歌唱がその基準から乖離しているほど低い評価値を算出する、などの手法を採用すればよい。このようにすれば、ユーザは、複数の観点から自らの歌唱についての評価を得ることが可能となる。
【００３４】
＜変形例３＞
実施形態において、ユーザが操作部３０を介して選択可能な評価基準は、サーバ装置２００から受信する、曲別、歌手別、或いはジャンル別のパラメータデータから選択されていたが、パラメータデータの種類はこれに限ったものではない。例えばユーザが操作部３０を介して、評価基準の厳しさの度合いを手動で設定可能としてもよい。この場合、例えばパラメータ記憶領域２５に、手動パラメータテーブルなるものが含まれる。図７は、手動パラメータテーブル２５ｄを表す模式図である。ユーザは、「易しい」、「普通」、及び「難しい」といった、複数の評価基準から任意のものを選択する。ここで、図７に表されるように、評価の基準がピッチに関するものであれば、「易しい」が選択された場合、音高のズレの許容範囲が最も大きなものとなり、「難しい」が選択された場合、音高のズレの許容範囲が最も小さなものとなり、「普通」が選択された場合、音高のズレの許容範囲が「易しい」と「難しい」の中間程度となる、といった具合である。このようにすれば、ユーザは、歌唱力に応じて評価基準を段階的に変更することが可能であるため、複数のユーザ間において歌唱の巧拙にバラつきがある場合でも、歌唱者の歌唱におけるレベルに応じて評価基準を設定したり、徐々に難易度を上げていく、という楽しみ方をすることが可能となる。
【００３５】
また、例えばパラメータ記憶領域２５は、地域別パラメータテーブルや時間帯別パラメータテーブルを備えていてもよい。図８は、地域別パラメータテーブル２５ｅ及び時間帯別パラメータテーブル２５ｆを表す模式図である。例えば地域別パラメータテーブル２５ｅの場合、特定の地域ごと（例えば、関東、関西、東北等）に、地域ごとの発音のニュアンスに対応したパラメータデータを対応付けるようにしてもよい。例えば、一般的に、標準語が浸透している関東地方と比較して、関西地方は独自の関西弁が根強く残っており、話す際に発音の抑揚が強い確率が高いことが考えられる。従ってこの場合、ピッチに関して、地域が「関西」のパラメータデータにおいて、地域が「関東」のパラメータデータよりも音高のズレの許容範囲を大きくすればよい。このようにすれば、地域ごとの方言による発音のニュアンスの違いが考慮された採点が行われるようになる。上記及び図８のパラメータデータの設定は一例であり、例えば「関東」「関西」を「１００セント」に設定し、「東北」だけ「２００セント」に設定することや、広域の分類（例：「東日本」や「西日本」）、又は細分化した地域ごとのパラメータデータを設定することが可能である。さらに、行政区分に基づく分類に限らず、本発明に合わせて予め決めた、方言を基準とした独自の地域分類に基づくパラメータデータを設定することも可能である。
【００３６】
また、図８における時間帯別パラメータテーブル２５ｆの場合、夜間から早朝にかけての時間帯及び朝から昼にかけての時間帯にかけては、ピッチに関して、音高のズレの許容範囲が大きくなっている。これは、以下のような考えによるものである。夜間から早朝にかけての時間帯では、ユーザがアルコールを摂取している確率が高く、このような場合、アルコールを摂取していないときと比較して歌唱力が落ちることが多いと考えられる。また、朝から昼にかけての時間帯についても、起床してあまり時間が経っていないユーザが多いことが考えられ、このような場合、起床後に一定の時間が経過したときと比較して声が出にくい状態であることが多いと考えられる。従って、ユーザが上記時間帯を評価基準として選択した場合、例えばピッチの評価項目については、上記時間帯以外の時間帯よりも音高のズレをより広く許容するようにすればよい。時間帯別のパラメータデータについては、ユーザが評価基準として「時間帯別」を選択するだけで、自動的にユーザが操作を行った時間帯が選択されるようにしてもよい。この場合、制御部１０は、カラオケ装置１００に備えられた計時機能から時間を取得し、取得した時間で時間帯別パラメータテーブル２５ｆを検索することで、評価の基準値を取得する。上記及び図８のパラメータデータの設定は一例であり、例えば学生や主婦やお年寄りの多いと考えられる昼間の時間帯（例：１２：００〜１７：００）に対して、音高のズレをより広く許容する「３００セント」と設定し、それ以外の時間帯を「１００セント」と設定することが可能である。さらに、１日における時間帯についての設定に限らず、「平日」又は「週末」といった観点からの分類に基づく設定が行われてもよい。この場合、ユーザがアルコールを摂取している可能性が高い「週末」は、「平日」と比較して、音高のズレをより広く許容するように設定してもよい。このように、時間帯別パラメータは、設計者が設計において任意に設定可能である。
【００３７】
＜変形例４＞
カラオケ装置１００はサーバ装置２００とネットワークＮＷにより接続されているが、このシステム構成を利用して次のようにしてもよい。サーバ装置２００のネットワークストレージ２１０には、接続されるカラオケ装置１００に関する情報（どの地域の、どの店舗に設定されているか等）が記憶されたカラオケ装置情報テーブル２１１が含まれているから、これを利用して、サーバ装置２００が、カラオケ装置１００が設置された地域や店舗に応じたパラメータデータをカラオケ装置１００に配信するようにしてもよい。
【００３８】
図９は、カラオケ装置情報テーブル２１１を表す模式図である。「カラオケ装置ＩＤ」は、カラオケ装置の各々を一意に識別する識別子であり、例えば７桁のアルファベットで表される。「地域」は、対応付けられたカラオケ装置ＩＤを保持するカラオケ装置１００が設置された地域を表す。「店舗種別」は、対応付けられたカラオケ装置ＩＤを保持するカラオケ装置１００が設置された店舗の種別を表す。サーバ装置２００は、ＮＷを通じて接続されたカラオケ装置１００からカラオケ装置ＩＤを取得する。そしてサーバ装置２００は、取得したカラオケ装置ＩＤを用いてカラオケ装置情報テーブル２１１を検索することで、各々のカラオケ装置が設置された地域及び店舗種別に関する情報を得ることが出来る。このようにすれば、サーバ装置２００は、接続される全てのカラオケ装置１００に対して、一律、同一のパラメータデータを配信する場合と比較して、カラオケ装置１００の設置された地域や店舗ごとの特徴に合わせて、各々異なるパラメータデータを配信することが可能となる。これにより、地域の特色や店舗種別の違い（カラオケ店、スナック等）に応じて適切なパラメータデータを配信可能となる。ここで、地域の特色は上述したとおりである。店舗種別の違いについては、例えばスナックであれば、利用客はアルコールを摂取している可能性が高いから、カラオケ店と比較して、ピッチのズレの許容範囲が大きなパラメータデータが配信されるようにすればよい。また、このようにすれば、サーバ装置２００が必要なデータのみを送信することで配信対象のデータ量が縮小し、ネットワークＮＷの負荷を軽減すると共に、カラオケ装置１００の記憶部２０が記憶するデータ量を低減することで記憶部２０の記憶容量を有効活用することが可能となる。
【００３９】
＜変形例５＞
実施形態において、減点するポイント（すなわち評価結果）を算出するための計算式が設けられる場合、制御部１０によって、この計算式で用いられる係数や閾値がパラメータデータに応じて変更されるようにしてもよい。この場合、各パラメータテーブルにはピッチに関する許容範囲といった基準値だけではなく、上記の係数や閾値そのものも格納される。そして、制御部１０は、評価基準として選択されたパラメータデータに含まれる係数や閾値を上述の計算式に用いて、評価結果を算出する。
【００４０】
変形例５の具体例として、例えばビブラートに関する計算式を用いる例を考える。
図１０は、ビブラートの評価値を算出する計算式を説明するための図である。図１０において、横軸は時間を表し、図１０中で左から右に進むほど時間が経過することを表している。また、縦軸は音高を表し、図１０中で下から上に進むほど音高が高くなることを表している。実線で表されたガイドメロディＧＭは、ガイドメロディの音高を表している。曲線で表されたユーザ歌唱音声曲線５００は、ユーザの歌唱による音声の音高を表す。縦方向の矢印で表されたピークピッチ幅ｐ１及びｐ２は、ユーザ歌唱音声曲線５００における音高のピーク間の、音の高さ方向における幅であって、ユーザの歌唱におけるビブラートの音高の振れ幅を表している。横方向の矢印で表されたピーク時間幅ｔ１及びｔ２は、ユーザ歌唱音声曲線５００における音高のピーク間の、時間方向における幅であって、ユーザの歌唱におけるビブラートの期間を表している。
【００４１】
ここで、ピークピッチ幅ｐ１〜ｐｎの分散をＶｐとし、ピーク時間幅ｔ１〜ｔｎの分散をＶｔとして、Ｖｐに乗算するピッチ係数をα、Ｖｔに乗算する時間係数をβ、閾値をｋとしたときに、ビブラートの巧拙判定における数式は以下の数１で表される。ピッチ係数α、時間係数β及び閾値ｋは、上述したパラメータデータに含まれる閾値の一つである。ピッチ係数α及び時間係数βは、曲別、歌手別、ジャンル別等の違いによって異なる値であり、ピッチ係数αと時間係数βとの和は１．０である。
【数１】

【００４２】
数１において、左辺の値が右辺における閾値ｋよりも小さいときに、制御部１０は、ビブラートの巧拙が良好であると判定する。一方、数１において、左辺の値が右辺における閾値ｋよりも大きいときに、制御部１０は、ビブラートの巧拙が不良であると判定する。Ｖｐはピークピッチ幅の分散であるから、値が大きいほど、音高方向におけるビブラートのピーク同士の間隔にばらつきが多いことを表し、値が小さいほど、音高方向におけるビブラートのピーク同士の間隔にばらつきが少ないことを表している。また、Ｖｔは、ピーク時間幅の分散であるから、値が大きいほど、時間方向におけるビブラートのピーク同士の間隔にばらつきが多いことを表し、値が小さいほど、時間方向におけるビブラートのピーク同士の間隔にばらつきが少ないことを表している。
【００４３】
例えばユーザが、歌手別パラメータデータで歌手名「ザ・○△」を選択した場合を考える。歌手「ザ・○△」が歌唱したときのビブラートにおいては、音高の振れ幅がダイナミックで音高方向にバラつきが多い一方、時間方向の揺れは比較的正確でバラつきが少なかったとする。この場合、歌唱評価装置の設計時において、「α＜β」となるように各々の係数が設定される。このようにすれば、制御部１０により、歌手「ザ・○△」の特徴にあった歌唱法が、より高く採点され易くなる。
【００４４】
また、例えばビブラートに加えて、ピッチ及び発音タイミングを採点の対象とした場合、ピッチに関する採点結果をＰｉｔｃｈとし、ビブラートに関する採点結果をＶｉｂとし、発音タイミングに関する採点結果をＴｉｍｉｎｇとして、Ｐｉｔｃｈに乗算するピッチ採点係数をγ、Ｖｉｂに乗算するビブラート採点係数をδ、Ｔｉｍｉｎｇに乗算する発音タイミング採点係数をε、得点をＰｔとしたときに、得点Ｐｔを算出する数式は以下の数２で表される。ここで、ピッチ採点係数γ、ビブラート採点係数δ、及び発音タイミング採点係数εの総和は１．０である。
【数２】

【００４５】
例えばユーザが、歌手別パラメータデータで歌手名「山○タロウ」を選択した場合を考える。歌手「山○タロウ」は、その歌唱において、ピッチが比較的正確であり、ビブラートは音高方向にバラつきが大きいため綺麗なビブラートとは言えず、発音タイミングは遅れ気味であったとする。このような場合、歌唱評価装置の設計時において、「δ＜ε＜γ」若しくは「ε＜δ＜γ」となるように各々の係数が設定される。このようにすれば、制御部１０により、歌手「山○タロウ」の特徴にあった歌唱法が、より高く採点され易くなる。
【００４６】
＜変形例６＞
実施形態において、記憶部２０がパラメータデータ記憶領域２５を備えることで、制御部１０は、このパラメータデータ記憶領域２５からパラメータデータを取得していたが、これに限らず、記憶部２０がパラメータデータ記憶領域２５を備えずに、制御部１０は、必要なパラメータデータを例えばコンテンツデータを受信する前後のタイミングでサーバ装置２００から受信して取得するようにしてもよい。この場合、制御部１０は、サーバ装置２００がパラメータデータを選択するために必要な情報をサーバ装置に通知する。このようにすれば、カラオケ装置１００が要する記憶装置の記憶容量が削減可能となるとともに、実施形態と同様の効果を奏することが可能となる。
【００４７】
＜変形例７＞
本発明は、歌唱評価装置以外にも、これらを実現するための方法や、コンピュータに音声評価機能を実現させるためのプログラムとしても把握される。かかるプログラムは、これを記憶させた光ディスク等の記録媒体の形態で提供されたり、インターネット等を介して、コンピュータにダウンロードさせ、これをインストールして利用させるなどの形態でも提供されたりする。
【符号の説明】
【００４８】
１０…制御部、２０…記憶部、２１…伴奏データ記憶領域、２２…映像データ記憶領域、２３…ＧＭデータ記憶領域、２４…ユーザ歌唱音声データ記憶領域、２５…パラメータ記憶領域、２５ａ…曲別パラメータテーブル、２５ｂ…歌手別パラメータテーブル、２５ｃ…ジャンル別パラメータテーブル、２５ｄ…手動パラメータテーブル、２５ｅ…地域別パラメータテーブル、２５ｆ…時間帯別パラメータテーブル、３０…操作部、４０…表示部、５０…通信制御部、６０…音声処理部、６１…マイクロホン、６２…スピーカ、７０…バス、１００…カラオケ装置、２００…サーバ装置、２１０…ネットワークストレージ、２１１…カラオケ装置情報テーブル、３００，５００…ユーザ歌唱音声曲線、４０１〜４０３，４０５〜４０７…ガイドメロディ、ＧＭ…ガイドメロディ、ＮＷ…ネットワーク、ｐ１，ｐ２…ピークピッチ幅、ｔ１，ｔ２…ピーク時間幅

【特許請求の範囲】
【請求項１】
歌唱者が曲を歌唱したときの音声を表す音声データを取得する音声データ取得手段と、
歌唱の対象となる曲に対して予め決められた基準から乖離している度合いである乖離度に応じて前記歌唱者の歌唱を評価するときの、当該乖離度を表す複数のパラメータのうち、少なくともいずれか１のパラメータを取得するパラメータ取得手段と、
前記取得されたパラメータを用いて、前記取得された音声データが表す音声による歌唱に対する評価結果を算出する算出手段と
を備えることを特徴とする歌唱評価装置。
【請求項２】
前記複数のパラメータのうち、少なくともいずれか１のパラメータを選択する操作を受け付ける操作手段を備え、
前記パラメータ取得手段は、受け付けられた前記操作により選択された前記パラメータを取得する
ことを特徴とする請求項１に記載の歌唱評価装置。
【請求項３】
前記複数のパラメータは、歌唱される曲毎に決められた複数のパラメータ、前記曲が属するジャンル毎に決められた複数のパラメータ、または、特定の歌唱者毎に決められた複数のパラメータのうちいずれかを含む
ことを特徴とする請求項１又は２に記載の歌唱評価装置。
【請求項４】
前記複数のパラメータのうち、少なくともいずれか１のパラメータを選択する操作を受け付ける操作手段を備え、
前記複数のパラメータは、歌唱される曲毎に決められた複数のパラメータと、当該曲毎に決められたパラメータ以外の複数のパラメータを含み、
前記パラメータ取得手段は、前記パラメータを選択する操作が受け付けられた場合には、当該操作により選択された前記パラメータを取得し、前記パラメータを選択する操作が受け付けられなかった場合には、前記曲毎に決められた複数のパラメータのうち、歌唱の対象となる曲について決められたパラメータを取得する
ことを特徴とする請求項１に記載の歌唱評価装置。

【図１】