説明

カラオケ装置、歌唱評価方法およびプログラム

【課題】抑揚のある歌唱を評価することができるカラオケ装置、歌唱評価方法およびプログラムを提供すること。
【解決手段】本発明のカラオケ装置は、歌唱者の歌唱音声についての音量レベルの変動の程度を示す値として、当該音量レベルと、当該音量レベルから算出した平均値との差分に基づいて算出した抑揚評価データを生成することができる。そして抑揚評価データが示す値の大きさから、歌唱の抑揚の程度を評価することができるから、歌唱者の歌唱による採点結果に歌唱の抑揚の評価を加えることができる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、歌唱を採点するカラオケ装置において、特殊な歌唱技法を評価する技術に関する。
【背景技術】
【0002】
カラオケ装置において、歌唱者の歌唱の巧拙を点数で表示する採点機能を備えたものがある。このような採点機能のうち、できるだけ実際の歌唱の巧拙と採点の結果が対応するように、歌唱者の歌唱音声信号から抽出された音程データや音量データなどのデータと、カラオケ曲の歌唱旋律(ガイドメロディ)と対応するデータとの比較機能を持たせたものがある。(例えば、特許文献1)
【特許文献1】特開平10−69216号公報
【発明の開示】
【発明が解決しようとする課題】
【0003】
このような採点機能を備えたカラオケ装置によって、1音を単位としてノートごとの音程変化などを比較して採点することが可能になったが、この採点機能は、MIDI(Musical Instrument Digital Interface)形式でデータ化されたガイドメロディを基準にして、歌唱者の歌唱と比較していたため、楽譜上の音符を基準にした採点に止まっていた。そのため、このような採点を行った場合、実際の巧拙の印象とは異なった採点結果となることがあった。例えば、楽曲全体において歌唱を強くしたり弱くしたりして、抑揚のある歌唱を行った場合、巧く聞こえることがあるにもかかわらず、ピッチに対しては何ら影響を与えるものではなかったから、採点結果が良くなることがなかった。
【0004】
本発明は、上述の事情に鑑みてなされたものであり、抑揚のある歌唱を評価することができるカラオケ装置、歌唱評価方法およびプログラムを提供することを目的とする。
【課題を解決するための手段】
【0005】
上述の課題を解決するため、本発明は、楽曲データを再生する再生手段と、前記再生手段が楽曲データを再生する間に入力された歌唱者の歌唱音声に基づいて、歌唱者音声データを生成する音声入力手段と、前記歌唱者音声データに基づいて、前記歌唱者の歌唱音声の音量レベルを抽出して歌唱音量レベルデータを生成する音量レベル抽出手段と、前記歌唱音量レベルデータに基づいて、評価の基準となる基準データを生成する基準データ生成手段と、前記歌唱音量レベルデータと前記基準データとに基づいて、前記評価の基準に対する前記歌唱音声の音量レベルの変動の程度を示す評価データを生成する評価データ生成手段と、評価データに基づいて前記歌唱音声の評価を行う評価手段とを具備することを特徴とするカラオケ装置を提供する。
【0006】
また、別の好ましい態様において、前記音量レベル抽出手段は、前記歌唱者音声データに基づいて、前記歌唱者の歌唱音声の特定の周波数帯域の音量レベルを増幅した修正音声データを生成し、当該修正音声データに基づいて、前記特定の周波数帯域の音量レベルを増幅した歌唱者の歌唱音声についての全周波数帯域に係る音量レベルを抽出して歌唱音量レベルデータを生成してもよい。
【0007】
また、別の好ましい態様において、前記音量レベル抽出手段は、前記歌唱者音声データに基づいて、前記歌唱者の歌唱音声の特定の周波数帯域における音量レベルを抽出して歌唱音量レベルデータを生成してもよい。
【0008】
また、別の好ましい態様において、前記基準データ生成手段は、前記歌唱音量レベルデータが示す音量レベルの平均レベルを示す基準データを生成してもよい。
【0009】
また、別の好ましい態様において、前記評価手段は、前記評価データと前記再生手段によって再生された楽曲データに応じて決定される評価の態様を示す評価基準データとに基づいて、前記歌唱音声の評価を行ってもよい。
【0010】
また、本発明は、楽曲データを再生する再生過程と、前記再生過程が楽曲データを再生する間に入力された歌唱者の歌唱音声に基づいて、歌唱者音声データを生成する音声入力過程と、前記歌唱者音声データに基づいて、前記歌唱者の歌唱音声の音量レベルを抽出して歌唱音量レベルデータを生成する音量レベル抽出過程と、前記歌唱音量レベルデータに基づいて、評価の基準となる基準データを生成する基準データ生成過程と、前記歌唱音量レベルデータと前記基準データとに基づいて、前記評価の基準に対する前記歌唱音声の音量レベルの変動の程度を示す評価データを生成する評価データ生成過程と、評価データに基づいて前記歌唱音声の評価を行う評価過程とを備えることを特徴とする歌唱評価方法を提供する。
【0011】
また、本発明は、コンピュータに、楽曲データを再生する再生機能と、前記再生機能が楽曲データを再生する間に入力された歌唱者の歌唱音声に基づいて、歌唱者音声データを生成する音声入力機能と、前記歌唱者音声データに基づいて、前記歌唱者の歌唱音声の音量レベルを抽出して歌唱音量レベルデータを生成する音量レベル抽出機能と、前記歌唱音量レベルデータに基づいて、評価の基準となる基準データを生成する基準データ生成機能と、前記歌唱音量レベルデータと前記基準データとに基づいて、前記評価の基準に対する前記歌唱音声の音量レベルの変動の程度を示す評価データを生成する評価データ生成機能と、評価データに基づいて前記歌唱音声の評価を行う評価機能とを実現させるためのプログラムを提供する。
【発明の効果】
【0012】
本発明によれば、抑揚のある歌唱を評価することができるカラオケ装置、歌唱評価方法およびプログラムを提供することができる。
【発明を実施するための最良の形態】
【0013】
以下、本発明の一実施形態について説明する。
【0014】
<実施形態>
本実施形態においては、抑揚のある歌唱の評価を行うことができるカラオケ装置1について説明する。まず、カラオケ装置1のハードウエアの構成について図1を用いて説明する。図1は、本発明の実施形態に係るカラオケ装置1のハードウエアの構成を示すブロック図である。
【0015】
CPU(Central Processing Unit)11は、ROM(Read Only Memory)12に記憶されているプログラムを読み出して、RAM(Random Access Memory)13にロードして実行することにより、カラオケ装置1の各部について、バス10を介して制御する。また、RAM13は、CPU11がデータ処理などを行う際のワークエリアとして機能する。
【0016】
記憶部14は、例えば、ハードディスクなどの大容量記憶手段であって、楽曲データ記憶領域14aおよび歌唱者音声データ記憶領域14bを有する。楽曲データ記憶領域14aには、カラオケ曲の楽曲データが複数記憶され、各楽曲データは、ガイドメロディトラック、伴奏データトラック、歌詞データトラックを有している。
【0017】
ガイドメロディトラックは、楽曲のボーカルパートのメロディを示すデータであり、発音の指令を示すノートオン、消音の指令を示すノートオフ、コントロールチェンジなどのイベントデータと、次のイベントデータを読み込んで実行するまでの時間を示すデルタタイムデータとを有している。このデルタタイムにより、実行すべきイベントデータの時刻と楽曲の進行が開始されてからの時間経過とを対応付けることができる。また、ノートオン、ノートオフは、それぞれ発音、消音の対象となる音の音程を示すノートナンバを有している。これにより、楽曲のボーカルパートのメロディを構成する各音は、ノートオン、ノートオフ、デルタタイムによって規定することができる。伴奏データトラックは、各伴奏楽器の複数のトラックから構成されており、各楽器のトラックは上述したガイドメロディトラックと同様のデータ構造を有している。なお、本実施形態の場合、MIDI形式のデータが記憶されている。
【0018】
歌詞データトラックは、楽曲の歌詞を示すテキストデータと、楽曲の進行に応じて後述する表示部15に歌詞テロップを表示するタイミングを示す表示タイミングデータと、表示される歌詞テロップを色替え(以下、ワイプという)するためのタイミングを示すワイプタイミングデータとを有する。そして、CPU11は、楽曲データ記憶領域14aに記憶される楽曲データを再生し、当該楽曲データの伴奏データトラックに基づいて生成した音声データを後述する音声処理部18に出力するとともに、歌詞データトラックに基づいて表示部15に歌詞テロップを表示させる。
【0019】
歌唱者音声データ記憶領域14bには、後述するマイクロフォン17から音声処理部18を経てA/D変換された音声データ(以下、歌唱者音声データという)が、例えばWAVE形式やMP3形式などで時系列に記憶される。このように時系列に記憶されることにより、歌唱者音声データの所定時間長の各フレームに対して、楽曲の進行が開始されてから経過した時間を対応付けることができる。
【0020】
表示部15は、液晶ディスプレイなどの表示デバイスであって、CPU11に制御されて、記憶部14の楽曲データ記憶領域14aに記憶された歌詞データトラックに基づいて、楽曲の進行に応じて背景画像などとともに歌詞テロップを表示する。また、カラオケ装置1を操作するためのメニュー画面、歌唱の評価結果画面などの各種画面を表示する。操作部16は、例えばキーボード、マウス、リモコンなどであり、カラオケ装置1の利用者が操作部16を操作すると、その操作内容を表すデータがCPU11へ出力される。
【0021】
マイクロフォン17は、歌唱者の歌唱音声を収音する。音声処理部18は、マイクロフォン17によって収音された音声をA/D変換して歌唱者音声データを生成する。歌唱者音声データは、上述したように記憶部14の歌唱者音声データ記憶領域14bに記憶される。また、音声処理部18は、CPU11によって入力された音声データをD/A変換し、スピーカ19から放音する。
【0022】
次に、CPU11が、ROM12に記憶されたプログラムを実行することによって実現する機能のうち、歌唱者の歌唱の評価を行う機能について説明する。図2は、CPU11が実現する機能を示したソフトウエアの構成を示すブロック図である。
【0023】
ピッチ抽出部101は、歌唱者音声データ記憶領域14bに記憶される歌唱者音声データを読み出し、所定時間長のフレーム単位で当該歌唱者音声データに係る歌唱音声のピッチを抽出する。そして、フレーム単位で抽出した歌唱音声のピッチを示す歌唱ピッチデータを通常評価部103に出力する。なお、ピッチの抽出にはFFT(Fast Fourier Transform)により生成されたスペクトルから抽出してもよいし、その他公知の方法により抽出してもよい。
【0024】
ピッチ算出部102は、楽曲データ記憶領域14aから評価対象となる楽曲のガイドメロディトラックを読み出し、読み出したガイドメロディトラックから楽曲のメロディを認識する。また、認識したメロディを構成する各音について、所定時間長のフレーム単位でピッチを算出する。そして、フレーム単位で算出したガイドメロディのピッチを示すメロディピッチデータを通常評価部103に出力する。なお、メロディを構成する各音の音程は、ノートナンバによって規定されているから、ノートナンバに対応してピッチが決定することになる。例えば、ノートナンバが69(A4)である場合には、ピッチは440Hzとなる。この際、ノートナンバとピッチを対応させるテーブルを記憶部14に記憶しておけば、ピッチ算出部102は当該テーブルを参照してピッチを算出してもよい。
【0025】
通常評価部103は、ピッチ抽出部101から出力された歌唱ピッチデータとピッチ算出部102から出力されたメロディピッチデータとをフレーム単位で比較し、ピッチの一致の程度を示す通常評価データを生成し、採点部104へ出力する。ここで、一致の程度は、各フレームにおけるメロディを構成する音のピッチと歌唱音声のピッチとの差分から算出してもよいし、メロディを構成する音のピッチと歌唱音声のピッチとが実質的に一致、すなわちメロディを構成する音のピッチに対して所定のピッチの範囲に入った時間的な割合から算出してもよい。なお、通常評価部103においては、歌唱音声のピッチを評価するだけでなく、音量、その他の特徴量を用いて評価してもよい。この場合には、歌唱音声からそれぞれ必要な特徴量を抽出する抽出手段を設けるとともに、記憶部14に評価の基準となる特徴量を記憶させておけばよい。
【0026】
音量抽出部105は、歌唱者音声データ記憶領域14bに記憶される歌唱者音声データを読み出し、所定時間長のフレーム単位で当該歌唱者音声データに係る歌唱音声の音量レベルを抽出する。そして、フレーム単位で抽出した歌唱音声の音量レベルを示す音量レベルデータをデータ加工部106に出力する。
【0027】
データ加工部106は、音量抽出部105から出力された音量レベルデータについて、所定のデータ処理を行うことにより生成した音量レベル加工データを抑揚評価部107に出力する。ここで、所定のデータ処理について図3を用いて説明する。
【0028】
まず、音量抽出部105から出力された音量レベルデータは、図3(a)に示すように、音量レベルが時刻の進行にともなって変化するデータであるものとして説明する。まず、音量レベルデータの音量レベルVb(t)の急峻な変動を除去するための処理について、図3(b)を用いて説明する。このtは楽曲の開始時点から経過した時刻を示している。ここで、音量レベルは所定時間長のフレーム単位で抽出されているから、各フレームに対して音量レベルが対応しているが、各フレームは所定時間長であるから楽曲の開始時点から経過した時刻に換算することができる。そのため、以下の説明においては時刻に換算して説明する。図3(b)は、音量レベル加工データに係る音量レベルV(t)を実線で示し、図3(a)に示した音量レベルデータに係る音量レベルVb(t)を破線で示した図である。ここで、図3(b)に示すように、ある時刻kにおけるV(k)は、時刻kを中心とする時間幅twにおけるVb(t)の最大値になるようにデータ処理が行われる。すなわち、Vb(k−(tw/2))からVb(k+(tw/2))のうち最大の音量レベルがV(k)となる。このようにして各時刻についてデータ処理を行うことにより、音量レベル加工データがデータ加工部106によって生成される。
【0029】
次に、データ加工部106は、生成した音量レベル加工データの変動をさらに低減するために、高周波成分を除去するLPF(Low Pass Filter)に通す。以上のようにして、データ加工部106は、音量抽出部105から出力された音量レベルデータについて、所定のデータ処理を行うことにより音量レベル加工データを生成し、抑揚評価部107に出力する。
【0030】
抑揚評価部107は、データ加工部106から出力された音量レベル加工データに基づいて、抑揚の程度、すなわち音量レベルの変動の程度を示す抑揚評価データを生成する。この生成について、図4を用いて説明する。まず、抑揚評価部107は、音量レベル加工データに係る音量レベルV(t)について、楽曲の全体のうち歌唱区間における平均値Vaを算出する。歌唱区間は、ガイドメロディトラックに基づいて決定する。例えば楽曲のメロディを示すデータがある区間として決定すればよく、本実施形態においては、時刻t=0からt=n(フレーム数としてはn+1)までが歌唱区間であるとする。すなわち、平均値Vaは以下の数1で表される。
【0031】
【数1】

【0032】
次に、抑揚評価部107は、図4に示すように、各時刻tにおけるV(t)と平均値Vaとの差分ΔV(t)=V(t)−Va(単位をdBとした場合)を算出し、当該差分の絶対値をt=0からt=nまで加算する。ここで、図4においては時刻mにおけるΔV(m)を示している。そして、その合計を歌唱区間の時間長に対応するフレーム数の合計n+1で除算することにより、抑揚評価データが示す値Deを算出する。すなわち、Deは以下の数2で表される。
【0033】
【数2】

【0034】
ここで、Deが大きいほど、V(t)とV(t)から算出した平均値Vaとの差分が大きいことになる。これは、V(t)の変動が大きいことになるから、音量レベルの変動が大きく抑揚のある歌唱を行っていることになる。また、データ加工部106におけるデータ処理により、急峻な変動などの影響を受けないようにしているから、Deは、局所的な音量レベルの変動の影響を受けず、楽曲全体の進行における大きな時間単位での変動の程度を示す値となる。
【0035】
そして、抑揚評価部107は、上述のようにして算出した抑揚評価データを採点部104へ出力する。
【0036】
採点部104は、通常評価部103から出力された通常評価データと、抑揚評価部107から出力された抑揚評価データとに基づいて歌唱者の歌唱の評価点を算出する。これにより、Deの値が大きければ、歌唱の抑揚があると判断して歌唱の評価点を高くすることができる。そして、算出した評価点はCPU11によって表示部15に表示される。
【0037】
次に、カラオケ装置1の動作について説明する。まず、歌唱者は操作部16を操作して、歌唱する楽曲を選択する。CPU11は、歌唱者が選択した楽曲に対応する楽曲データを楽曲データ記憶領域14aから読み出し、楽曲の進行に応じて、読み出した楽曲データの伴奏データトラックに基づいて楽曲の伴奏などをスピーカ19から放音させるとともに、読み出した楽曲データの歌詞データトラックに基づいて表示部15に歌詞をワイプ表示させる。歌唱者は、楽曲の進行にあわせて歌唱すると、当該歌唱の音声がマイクロフォン17に収音され、歌唱者音声データとして歌唱者音声データ記憶領域14bに記憶される。
【0038】
楽曲が最後まで進むことにより終了すると、CPU11によって歌唱者の歌唱の評価が開始される。ピッチ抽出部101は、歌唱者音声データ記憶領域14bに記憶された歌唱者音声データを読み出し、歌唱ピッチデータを通常評価部103に出力する。ピッチ算出部102は、楽曲データ記憶領域14aから評価基準となる楽曲のガイドメロディトラックを読み出し、メロディピッチデータを通常評価部103に出力する。
【0039】
通常評価部103は、ピッチ抽出部101から出力された歌唱ピッチデータとピッチ算出部102から出力されたメロディピッチデータとをフレーム単位で比較し、ピッチの一致の程度を示す通常評価データを生成し、採点部104へ出力する。
【0040】
音量抽出部105は、歌唱者音声データ記憶領域14bに記憶された歌唱者音声データを読み出し、音量レベルデータをデータ加工部106へ出力する。データ加工部106は、音量抽出部105から出力された音量レベルデータに対して、所定のデータ処理を行って音量レベル加工データを生成し、抑揚評価部107へ出力する。抑揚評価部107は、データ加工部106から出力された音量レベル加工データに基づいて抑揚評価データを算出し、採点部104へ出力する。
【0041】
そして、採点部104は、通常評価部103から出力された通常評価データと、抑揚評価部107から出力された抑揚評価データとに基づいて、所定のアルゴリズムによって歌唱者の歌唱の評価点を算出する。そして、その算出結果が表示部15に表示されることになる。
【0042】
以上のように、本実施形態におけるカラオケ装置1は、歌唱者の歌唱音声についての音量レベルの変動の程度を示す値として、当該音量レベルと、当該音量レベルから算出した平均値との差分に基づいて算出した抑揚評価データを生成することができる。そして抑揚評価データが示す値Deの大きさから、歌唱の抑揚の程度を評価することができるから、歌唱者の歌唱による採点結果に歌唱の抑揚の評価を加えることができる。
【0043】
以上、本発明の実施形態について説明したが、本発明は以下のように、さまざまな態様で実施可能である。
【0044】
<変形例1>
実施形態においては、音量抽出部105は、歌唱者音声データに係る歌唱者の歌唱音声の音量レベルを抽出して音量レベルデータを生成していた。ここで、強く歌唱する際には、倍音成分、すなわち高周波数帯域の成分が大きくなりやすいため、これを強調するような処理を行なってもよい。例えば、音量抽出部105は、歌唱者音声データに係る歌唱者の歌唱音声において、特定の周波数帯域の音量レベルを増幅するイコライザを用いて増幅することにより修正音声データを生成する。そして、生成した修正音声データに基づいて、特定の周波数帯域の音量レベルを増幅された歌唱音声について、当該歌唱音声の全周波数帯域に係る音量レベルを抽出するようにすればよい。このようにすると、抑揚のある歌唱の評価をより精度よく行うことができる。
【0045】
<変形例2>
実施形態においては、音量抽出部105は、歌唱者音声データに係る歌唱者の歌唱音声の音量レベルを抽出して音量レベルデータを生成していた。ここで、強く歌唱する際には、特定の倍音成分(例えば、3kHz程度の音)が大きくなりやすいため、この倍音成分のみを使って処理を行なってもよい。例えば、音量抽出部105は、歌唱者音声データを特定の周波数帯域(例えば、3kHz)が中心周波数であるBPF(Band Pass Filter)を通した後に、音量レベルを抽出するようにすればよい。なお、周波数帯域幅については、どのような帯域幅に設定してもよい。このようにすると、抑揚のある歌唱の評価をより精度よく行うことができる。
【0046】
<変形例3>
実施形態においては、歌唱の抑揚についての評価は、楽曲が終了し歌唱者の歌唱が終了した後に行っていたが、歌唱途中で順次処理が行なわれるようにしてもよい。この場合には、音量抽出部105は、楽曲の進行に応じて、すでに歌唱された部分のデータである歌唱者音声データから歌唱音声の音量レベルを順次抽出し、音量レベルデータをデータ加工部106へ出力していくようにすればよい。そして、データ加工部106は、音量抽出部105から順次出力される音量レベルデータにあわせて、所定のデータ処理を行って、音量レベル加工データを順次出力していくようにすればよい。すなわち、出力されたところまでの音量レベルデータが示す音量レベルが、楽曲全体の音量レベルであるとみなして、実施形態におけるデータ処理を行い、順次生成されたデータ処理結果を音量レベル加工データとして、抑揚評価部107に順次出力していけばよい。
【0047】
そして、抑揚評価部107は、データ加工部106から順次出力された音量レベル加工データが示す音量レベルが、楽曲全体の音量レベルであるとみなして、音量レベル加工データが出力された時点までの平均値を算出し、当該平均値と当該音量レベルとの差分に基づいて、抑揚評価データを順次生成すればよい。このようにすると、順次生成された抑揚評価データに基づいて、CPU11は、表示部15に抑揚評価データが生成された時点までの歌唱の抑揚の評価を示す表示を行うこともでき、歌唱者は歌唱しながら歌唱の抑揚の評価を確認することができる。また、楽曲が終了した後わずかな時間で歌唱の抑揚評価が終了するため、早く評価結果を表示部15に表示させることができる。
【0048】
<変形例4>
実施形態においては、データ加工部106は音量レベルの急峻な変動の影響を無くすためのデータ処理を行っていたが、データ処理の態様は実施形態における態様に限られない。例えば、ある時刻を中心とする時間幅twにおけるVL(t)の最大値になるようにデータ処理が行われていたが、最大値でなく中央値、平均値などであってもよい。また、ある時刻を中心とする時間幅twとせず、ある時刻の直前の時間twとしてもよい。このようにデータ処理は様々な態様が可能であり、これらは例えば操作部16を操作して設定しておけばよい。
【0049】
<変形例5>
実施形態においては、抑揚評価部107は、音量レベル加工データに係る音量レベルV(t)について、楽曲の全体のうち歌唱区間における平均値Vaを算出し、抑揚評価データ算出のために、差分ΔV(t)の絶対値を歌唱区間において積算することによって行なっていた。すなわち、楽曲データに基づいて決定された歌唱区間における歌唱者の歌唱が、抑揚の評価対象となっていた。ここで、評価対象となる歌唱の区間は、歌唱区間でなくてもよい。例えば、評価対象を楽曲全体の歌唱とする場合には、歌唱者音声データ全体を評価対象とすればよい。
【0050】
また、評価対象となる歌唱は、設定された指定区間における歌唱としてもよい。この場合には、楽曲データが当該指定区間を示す指定区間データを有するようにし、抑揚評価部107は、楽曲データが有する指定区間データを読み出すことにより、指定区間を設定すればよい。そして、例えば、指定区間を楽曲の中で強く歌唱する区間、弱く歌唱する区間としておけば、抑揚をつける区間に限定して評価することができるから、抑揚をつける必要の無い区間において抑揚をつけても評価対象としないことができる。
【0051】
さらに、評価対象となる歌唱の区間は、歌唱者音声データに係る音量レベルに基づいて決定されるようにしてもよい。例えば、楽曲における歌唱していない間、すなわち歌唱音声データに係る音声の音量レベルが非常に小さい状態が長く続く場合には、平均値Vaが小さく算出されることがあったり、差分ΔV(t)が非常に大きい値となることがあったりするため、当該音量レベルが所定の音量レベル以下となるフレームについては、評価対象から除外してもよい。
【0052】
<変形例6>
実施形態においては、差分ΔV(t)の絶対値をt=0からt=nまで加算、すなわちフレームごとに算出した差分ΔV(t)をt=0からt=nに相当するフレームにおいて積算するようにしていたが、数フレーム単位で差分ΔV(t)を算出するようにしてもよい。この場合には、当該数フレームに対応する音量レベルの平均値、最大値などを歌唱者音声データに係る音量レベルとしてもよいし、差分ΔV(t)の算出に対応するフレームに対応する音量レベルをそのまま用いてもよい。このようにした場合、音量レベルの急峻な変化が少なくなるから、データ加工部106におけるLPFを用いなくすることもできる。
【0053】
<変形例7>
実施形態においては、抑揚評価部107において、音量レベル加工データに係る音量データV(t)から算出される平均値VaとV(t)との差分によってΔV(t)が算出されていたが、平均値Va以外の値とV(t)の差分によってΔV(t)を算出するようにしてもよい。例えば、歌唱区間におけるV(t)の最大値、最小値などを用いてもよい。すなわち、音量レベルデータに基づいて決定された値とV(t)との差分によってΔV(t)を算出すれば、どのような値であってもよい。このようにしても、実施形態における効果を得ることができる。
【0054】
<変形例8>
実施形態においては、抑揚評価部107において生成された抑揚評価データの値Deが大きいほど歌唱の抑揚があるから、採点部104においては、歌唱の評価点を高くしていた。ここで、歌唱の評価点への加点、減点、割合など抑揚の評価の態様を変更できるようにしても良い。例えば、楽曲に応じて抑揚の評価の態様を変更してもよい。この場合には、楽曲データが抑揚の評価の態様を示す評価基準データを有するようにし、採点部104は、楽曲データが有する評価基準データを読み出して、当該評価基準データに基づいて、抑揚の評価の態様を決定すればよい。ここで、抑揚の評価の態様は、加点評価だけでなく、楽曲によっては抑揚を付けない方が良い場合もあるから、減点評価としてもよい。なお、楽曲単位でなく、楽曲のジャンルに応じて抑揚の評価の態様を変更しても良い。この場合は、楽曲データに楽曲のジャンルを示す楽曲ジャンルデータを有するようにするとともに、楽曲のジャンルと抑揚の評価の態様を対応付けたテーブルを示す対応データを記憶部14に記憶させればよい。そして、採点部104は、楽曲データが有する楽曲ジャンルデータと対応データとを読み出して、当該楽曲ジャンルデータが示す楽曲のジャンルに対応させて、抑揚の評価の態様を決定すればよい。
【0055】
また、歌唱者の歌唱の巧さ(歌唱レベル)に応じて抑揚の評価の態様を変更しても良い。この場合には、歌唱者が操作部16を操作することにより、歌唱レベルを入力するようにして、採点部104は、当該歌唱レベルに応じて抑揚の評価の態様を決定するようにすればよい。さらに、楽曲データに基づいて抑揚の評価の態様を変更してもよい。この場合には、採点部104は、ガイドメロディトラック、伴奏データトラックにおける音量レベルを示すデータ(例えば、ベロシティ)を参照して、これにより当該音量レベルが楽曲中で大きく変動する場合には、歌唱の評価点における抑揚の評価点の割合を大きくする態様とすればよい。このようにすれば、楽曲データから自動的に抑揚の評価の態様を決定することができる。
【図面の簡単な説明】
【0056】
【図1】実施形態に係るカラオケ装置のハードウエアの構成を示すブロック図である。
【図2】実施形態に係るカラオケ装置のソフトウエアの構成を示すブロック図である。
【図3】実施形態に係るデータ加工部におけるデータ処理の説明図である。
【図4】実施形態に係る抑揚評価部におけるデータ処理の説明図である。
【符号の説明】
【0057】
1…カラオケ装置、10…バス、11…CPU、12…ROM、13…RAM、14…記憶部、14a…楽曲データ記憶領域、14b…歌唱者音声データ記憶領域、15…表示部、16…操作部、17…マイクロフォン、18…音声処理部、19…スピーカ、101…ピッチ抽出部、102…ピッチ算出部、103…通常評価部、104…採点部、105…音量抽出部、106…データ加工部、107…抑揚評価部

【特許請求の範囲】
【請求項1】
楽曲データを再生する再生手段と、
前記再生手段が楽曲データを再生する間に入力された歌唱者の歌唱音声に基づいて、歌唱者音声データを生成する音声入力手段と、
前記歌唱者音声データに基づいて、前記歌唱者の歌唱音声の音量レベルを抽出して歌唱音量レベルデータを生成する音量レベル抽出手段と、
前記歌唱音量レベルデータに基づいて、評価の基準となる基準データを生成する基準データ生成手段と、
前記歌唱音量レベルデータと前記基準データとに基づいて、前記評価の基準に対する前記歌唱音声の音量レベルの変動の程度を示す評価データを生成する評価データ生成手段と、
評価データに基づいて前記歌唱音声の評価を行う評価手段と
を具備することを特徴とするカラオケ装置。
【請求項2】
前記音量レベル抽出手段は、前記歌唱者音声データに基づいて、前記歌唱者の歌唱音声の特定の周波数帯域の音量レベルを増幅した修正音声データを生成し、当該修正音声データに基づいて、前記特定の周波数帯域の音量レベルを増幅した歌唱者の歌唱音声についての全周波数帯域に係る音量レベルを抽出して歌唱音量レベルデータを生成する
ことを特徴とする請求項1に記載のカラオケ装置。
【請求項3】
前記音量レベル抽出手段は、前記歌唱者音声データに基づいて、前記歌唱者の歌唱音声の特定の周波数帯域における音量レベルを抽出して歌唱音量レベルデータを生成する
ことを特徴とする請求項1に記載のカラオケ装置。
【請求項4】
前記基準データ生成手段は、前記歌唱音量レベルデータが示す音量レベルの平均レベルを示す基準データを生成する
ことを特徴とする請求項1乃至請求項3のいずれかに記載のカラオケ装置。
【請求項5】
前記評価手段は、前記評価データと前記再生手段によって再生された楽曲データに応じて決定される評価の態様を示す評価基準データとに基づいて、前記歌唱音声の評価を行う
ことを特徴とする請求項1乃至請求項4のいずれかに記載のカラオケ装置。
【請求項6】
楽曲データを再生する再生過程と、
前記再生過程が楽曲データを再生する間に入力された歌唱者の歌唱音声に基づいて、歌唱者音声データを生成する音声入力過程と、
前記歌唱者音声データに基づいて、前記歌唱者の歌唱音声の音量レベルを抽出して歌唱音量レベルデータを生成する音量レベル抽出過程と、
前記歌唱音量レベルデータに基づいて、評価の基準となる基準データを生成する基準データ生成過程と、
前記歌唱音量レベルデータと前記基準データとに基づいて、前記評価の基準に対する前記歌唱音声の音量レベルの変動の程度を示す評価データを生成する評価データ生成過程と、
評価データに基づいて前記歌唱音声の評価を行う評価過程と
を備えることを特徴とする歌唱評価方法。
【請求項7】
コンピュータに、
楽曲データを再生する再生機能と、
前記再生機能が楽曲データを再生する間に入力された歌唱者の歌唱音声に基づいて、歌唱者音声データを生成する音声入力機能と、
前記歌唱者音声データに基づいて、前記歌唱者の歌唱音声の音量レベルを抽出して歌唱音量レベルデータを生成する音量レベル抽出機能と、
前記歌唱音量レベルデータに基づいて、評価の基準となる基準データを生成する基準データ生成機能と、
前記歌唱音量レベルデータと前記基準データとに基づいて、前記評価の基準に対する前記歌唱音声の音量レベルの変動の程度を示す評価データを生成する評価データ生成機能と、
評価データに基づいて前記歌唱音声の評価を行う評価機能と
を実現させるためのプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate


【公開番号】特開2008−268358(P2008−268358A)
【公開日】平成20年11月6日(2008.11.6)
【国際特許分類】
【出願番号】特願2007−108407(P2007−108407)
【出願日】平成19年4月17日(2007.4.17)
【出願人】(000004075)ヤマハ株式会社 (5,930)
【Fターム(参考)】