説明

歌唱音声評価装置

【課題】歌唱音声を解析してシャウト技法での歌唱がされている部分を検出すること。
【解決手段】本発明の実施形態におけるカラオケ装置は、歌唱音声を取得する取得手段と、歌唱ピッチを検出するピッチ検出手段と、歌唱音量を検出する音量検出手段と、無歌唱期間を特定する無歌唱期間特定手段と、無歌唱期間に前後を挟まれ、かつ楽曲データによって示される歌唱すべき構成音が2つ以上含まれない判定期間を特定する判定期間特定手段と、判定期間における歌唱音量の最大値が、判定期間以外における歌唱音量より大きいかを判定する音量判定手段と、判定期間における歌唱ピッチの変化が、ピッチが上昇した後に下降する変化パターンに対応するかを判定する変化判定手段と、音量判定手段および変化判定手段における判定結果により、判定期間における歌唱音声が特定の技法により歌唱されていると判定する技法判定手段とを有する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、歌唱音声における特定の歌唱技法を判定する技術に関する。
【背景技術】
【0002】
カラオケ装置において、歌唱音声を解析して評価する技術がある。この評価においては、特定の期間においてビブラート、こぶしなどの歌唱技法を用いた歌唱がされているかの判定なども行われることがある。歌唱技法としては、その他にも様々なものが存在するが、判定が難しいことなどから、評価対象とされていないものも数多くある。例えば、歌唱の合間などで発せられる「ワォ」、「イェーイ」などの叫び声(以下、シャウト技法という)については、歌唱者の盛り上がりにより発せられることも多いが、歌唱技法としては評価されなかった。したがって、シャウト技法を用いると、歌唱音声の評価においては、本来歌唱すべき内容を歌唱していないと判定されて低い評価となることもあった。
【0003】
歌唱音声の評価とは異なる分野においては、叫び声を検出する技術は既に開発されている。例えば、特許文献1においては、叫び声を検出してロボットを緊急停止させる技術が開示されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2008−049462号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
特許文献1に開示された技術においては、叫び声として、緊急事態を知らせる場合によく使われる「止まれー!」などの音を検出するものであり、叫び声という分類としては同じものであっても、歌唱中におけるシャウト技法とは異なっている。そのため、特許文献1に開示された叫び声の検出方法を用いても、歌唱音声からシャウト技法での歌唱がされている部分の検出はできなかった。
本発明は、歌唱音声を解析してシャウト技法での歌唱がされている部分を検出することを目的とする。
【課題を解決するための手段】
【0006】
上述の課題を解決するため、本発明は、楽曲データの再生期間の少なくとも一部を含む期間に入力された歌唱音声を取得する取得手段と、前記取得した歌唱音声のピッチを検出するピッチ検出手段と、前記取得した歌唱音声の音量を検出する音量検出手段と、前記検出された音量が予め決められたしきい値未満となる期間のうち、予め決められた時間以上継続する期間を無歌唱期間として特定する無歌唱期間特定手段と、前記検出された音量が前記しきい値以上となる歌唱期間のうち、前記無歌唱期間に前後を挟まれ、かつ前記楽曲データによって示される歌唱すべき構成音が2つ以上含まれない歌唱期間を判定期間として特定する判定期間特定手段と、前記判定期間において前記検出された音量の最大値が、前記歌唱期間のうち当該判定期間以外において前記検出された音量より大きいか否かを判定する音量判定手段と、前記判定期間において前記検出されたピッチの変化が、ピッチが上昇した後に下降する予め決められた変化パターンに対応するか否かを判定する変化判定手段と、前記音量判定手段において大きいと判定され、かつ、前記変化判定手段において対応すると判定された場合には、前記判定期間における前記歌唱音声が特定の技法により歌唱されていると判定する技法判定手段と、前記技法判定手段による判定結果に応じた情報を出力する出力手段とを具備することを特徴とする歌唱音声評価装置を提供する。
【0007】
また、別の好ましい態様において、前記判定期間特定手段が特定する判定期間は、前記検出された音量が前記しきい値以上となる歌唱期間のうち、前記無歌唱期間に前後を挟まれ、かつ前記楽曲データによって示される歌唱すべき構成音が含まれない歌唱期間である
ことを特徴とする。
【0008】
また、別の好ましい態様において、前記変化パターンは、ピッチが上昇する時間よりピッチが下降する時間が長く、当該下降の時間が所定の時間以上になるように決められていることを特徴とする。
【0009】
また、別の好ましい態様において、前記判定期間において前記検出された音量の変化を示す曲線に、2つ以上のピークが存在するか否かを判定するピーク判定手段をさらに具備し、前記判定期間特定手段が特定する判定する判定期間は、予め決められた時間未満となる歌唱期間であり、前記変化パターンは、ピッチの上昇前から上昇後への変化の割合が予め決められた値以上となるように決められ、前記技法判定手段は、前記音量判定手段において大きいと判定され、かつ、前記変化判定手段において対応すると判定され、かつ、前記ピーク判定手段において2つ以上のピークが存在しないと判定された場合には、前記判定期間における前記歌唱音声が前記特定の技法により歌唱されていると判定することを特徴とする。
【発明の効果】
【0010】
本発明によれば、歌唱音声を解析してシャウト技法での歌唱がされている部分を検出することができる。
【図面の簡単な説明】
【0011】
【図1】本発明の実施形態におけるカラオケ装置の構成を説明するブロック図である。
【図2】本発明の実施形態におけるシャウト技法検出機能の構成を説明する機能ブロック図である。
【図3】本発明の実施形態における判定期間と無歌唱期間とを説明する図である。
【図4】本発明の実施形態における評価基準情報に規定された変化パターンを説明する図である。
【図5】本発明の実施形態における評価基準情報に規定された判定基準を説明する図である。
【発明を実施するための形態】
【0012】
<実施形態>
[ハードウエア構成]
図1は、本発明の実施形態におけるカラオケ装置1の構成を説明するブロック図である。カラオケ装置1は、本発明の歌唱音声評価装置の一例であり、入力された歌唱音声の評価を行う装置である。カラオケ装置1は、歌唱者の歌唱音声が入力され、その歌唱音声においてシャウト技法での歌唱が行われているかの評価を行う。まず、カラオケ装置1のハードウエア構成について説明する。
【0013】
カラオケ装置1は、制御部10、操作部20、表示部30、通信部40、記憶部50、音響処理部60を有する。これらの各構成は、バスを介して接続されている。また、カラオケ装置1は、音響処理部60に接続されたスピーカ61およびマイクロフォン62を有する。
【0014】
制御部10は、CPU(Central Processing Unit)、RAM(Random Access Memory)、ROM(Read Only Memory)などを有する。制御部10は、ROMまたは記憶部50に記憶された制御プログラムを実行することにより、バスを介してカラオケ装置1の各部を制御する。この例においては、制御部10は、制御プログラムを実行することにより、入力された歌唱音声を解析してシャウト技法の検出を行うためのシャウト技法検出機能を実現する。
【0015】
操作部20は、操作パネルなどに設けられた操作ボタン、リモコンに設けられた操作ボタン、キーボード、マウスなどの操作デバイスであって、歌唱者の操作を受け付けて、その内容を示す操作信号を制御部10に出力する。
表示部30は、液晶ディスプレイなどの表示デバイスであり、制御部10の制御に応じた内容の表示を行う。この表示の内容は、カラオケの楽曲の進行に応じた背景画像、歌詞テロップ、メニュー画面、歌唱音声の評価結果、シャウト技法の検出結果などである。
通信部40は、制御部10の制御に応じて、インターネットなどの通信回線と接続して、サーバ装置などの通信装置と情報のやり取りを行う。制御部10は、通信部40を介して取得した情報を用いて、記憶部50に記憶される情報を更新するようにしてもよい。
記憶部50は、ハードディスク、不揮発性メモリなどの記憶手段であり、楽曲データ、歌唱音声データ、および評価基準情報をそれぞれ記憶する記憶領域を有する。
【0016】
楽曲データは、カラオケの歌唱対象となる楽曲に関連するデータが含まれ、例えば、ガイドメロディデータ(以下、GMデータという)、伴奏データ、歌詞データなどが含まれている。GMデータは、楽曲のボーカルパートのメロディを示すデータ、すなわち、歌唱すべき構成音の内容が指定されたデータであり、例えば、MIDI(Musical Instrument Digital Interface)形式により記述されている。伴奏データは、楽曲の伴奏の内容を示すデータであり、例えば、MIDI形式により記述されている。歌詞データは、楽曲の歌詞の内容を示すデータ、および表示部30に表示させた歌詞テロップを色替えするためのタイミングを示すデータを有する。また、楽曲データには、楽曲のサビ部分の位置、メロディの出だし部分の位置など、楽曲の各構成部分の位置を規定する情報も含まれていてもよい。
楽曲データは、歌唱者によって操作部20の操作により指定された楽曲に対応するものが制御部10によって読み出され、カラオケの伴奏音のスピーカ61からの出力、歌詞テロップの表示部30への表示に用いられる。
【0017】
歌唱音声データは、カラオケの対象となった楽曲を歌唱する歌唱者によって、マイクロフォン62から入力された歌唱音声を示すデータであり、例えば、WAVE形式などで記憶される。このようにして記憶される歌唱音声データは、制御部10によって、カラオケの対象となった楽曲を示す楽曲データに対応付けられる。
評価基準情報は、シャウト技法検出機能において用いられ、シャウト技法として判定する基準を示す情報である(図4、図5参照)。評価基準情報の具体的な内容については、後述するシャウト技法検出機能の説明において示すため、ここでは省略する。
【0018】
マイクロフォン62は、歌唱者の歌唱音声が入力され、歌唱音声を示すオーディオ信号を音響処理部60に出力する。スピーカ61は、音響処理部60から出力されるオーディオ信号を放音する。音響処理部60は、DSP(Digital Signal Processor)などの信号処理回路、MIDI形式の信号からオーディオ信号を生成する音源などを有する。音響処理部60は、マイクロフォン62から入力されるオーディオ信号をA/D変換して制御部10に出力する。音響処理部60は、制御部10から楽曲データに基づくMIDI形式の信号が入力され、その信号に基づいてオーディオ信号を生成する。音響処理部60は、このように生成したオーディオ信号、制御部10から出力されたオーディオ信号、マイクロフォン62から入力されたオーディオ信号などを、エフェクト処理、増幅処理などの信号処理を施してからスピーカ61に出力する。
【0019】
ここで、制御部10は、楽曲データを読み出して再生し、その楽曲の伴奏音をスピーカ61から出力させている再生期間において、音響処理部60から出力されるオーディオ信号を取得し、歌唱音声データを生成し、その楽曲データに対応付けて記憶部50へ記憶する。なお、歌唱音声データは、この再生期間以外の期間においても生成、記憶されるようにしてもよい。
以上が、カラオケ装置1のハードウエア構成についての説明である。
【0020】
[シャウト技法検出機能]
次に、カラオケ装置1の制御部10が制御プログラムを実行することによって実現されるシャウト技法検出機能について説明する。なお、以下に説明するシャウト技法検出機能を実現するシャウト技法検出部100における各構成の一部または全部については、ハードウエアによって実現してもよい。
【0021】
図2は、本発明の実施形態におけるシャウト技法検出部100の構成を説明する機能ブロック図である。シャウト技法検出部100は、取得部101、音量検出部102、ピッチ検出部103、無歌唱期間特定部104、判定期間特定部105、音量判定部106、ピーク判定部107、変化判定部108、技法判定部109および出力部110を有する。
【0022】
取得部101は、記憶部50に記憶された歌唱音声データのうち、予め決められた評価期間の歌唱音声に対応する部分(この例においては、楽曲全体)の歌唱音声データを取得して、音量検出部102およびピッチ検出部103に出力する。この例においては、取得部101は、楽曲データの再生中に順次生成される歌唱音声データを、順次取得して出力する。なお、取得部101は、楽曲データの再生が終了し、歌唱音声データが記憶部50へ全て記憶された後に、取得して出力するようにしてもよい。
【0023】
音量検出部102は、取得部101から取得した歌唱音声データから、歌唱音声の音量(以下、歌唱音量という)を検出する。この例においては、音量検出部102は、各フレームについて歌唱音声データが示す音声信号の振幅に基づいて検出する。音量検出部102は、検出した歌唱音量を示す情報を、無歌唱期間特定部104、判定期間特定部105、音量判定部106およびピーク判定部107に対して時系列に出力する。
【0024】
ピッチ検出部103は、取得部101から取得した歌唱音声データから、歌唱音声のピッチ(以下、歌唱ピッチという)を検出する。この例においては、ピッチ検出部103は、各フレームについて歌唱音声データが示す音声信号の波形が負から正に変化する際のゼロクロスを検出し、そのゼロクロスの時間間隔を測定することによってフレーム毎の歌唱ピッチ(周波数)を特定する。このとき、この音声信号から、ローパスフィルタによりノイズ成分となる高域成分をカットしたり、ハイパスフィルタにより直流成分をカットしたりしておいてもよい。なお、歌唱ピッチは、歌唱音声データにFFT(Fast Fourier Transform)を施して得られるスペクトルから特定してもよい。
ピッチ検出部103は、このようにして検出した歌唱ピッチを示す情報を、変化判定部108に対して時系列に出力する。
【0025】
無歌唱期間特定部104は、歌唱音量が予め決められたしきい値Vth未満となる無音期間のうち、予め決められた時間(この例においては、500msec.)以上継続する無音期間を無歌唱期間Soffとして特定する。なお、この予め決められた時間は、再生される楽曲データのテンポに応じて変化するものであってもよく、この場合には、例えば1拍分(4分音符1個分の時間)としてもよい。
無歌唱期間特定部104は、このようにして特定した無歌唱期間を示す情報を判定期間特定部105に出力する。
【0026】
判定期間特定部105は、歌唱音量がしきい値Vth以上となる歌唱期間のうち、無歌唱期間に前後を挟まれ、かつ楽曲データによって示される歌唱すべき構成音が2つ以上含まれない歌唱期間を、判定期間Sonとして特定する。すなわち、判定期間Sonの直前と直後には、500msec.以上の無音期間である無歌唱期間Soffが存在することになる。
ここで、判定期間特定部105は、無歌唱期間特定部104からの情報により無歌唱期間を特定し、記憶部50に記憶されたGMデータから、各歌唱期間において歌唱すべき構成音を特定する。判定期間特定部105は、特定した判定期間Sonを示す情報を、音量判定部106、ピーク判定部107、変化判定部108および技法判定部109に出力する。判定期間特定部105は、技法判定部109には、さらに特定した判定期間Sonに含まれる構成音が「0」であるか「1」であるかを示す構成音数情報についても出力する。なお、判定期間特定部105は、構成音が1つ含まれる歌唱期間については、判定期間Sonとして特定しないようにしてもよい。この場合には構成音数情報を出力しなくてもよい。
【0027】
図3は、本発明の実施形態における判定期間Sonと無歌唱期間Soffとを説明する図である。図3は、縦軸に音量、横軸に時刻を示し、歌唱音量の時系列変化を曲線VLにより示した図である。図3に示す歌唱音量であった場合には、無歌唱期間特定部104は、無音期間をt1からt2の期間、t3からt4の期間、t5からt6の期間とし、500msec.以上継続する無音期間であるt3からt4の期間、t5からt6の期間を無歌唱期間Soffとして特定する。判定期間特定部105は、歌唱期間をt0からt1の期間、t2からt3の期間、t4からt5の期間とし、無歌唱期間Soffに前後を挟まれた期間であるt4からt5の期間を判定期間Sonとして特定する。
【0028】
図2に戻って説明を続ける。音量判定部106は、判定期間Sonにおける歌唱音量の最大値が、判定期間Son以外の歌唱期間における歌唱音量よりも大きいか否かを判定する。判定期間Son以外の歌唱期間における歌唱音量とは、この例においては、判定期間Sonより一定時間前までに存在する歌唱期間における歌唱音量の平均値であるものとするが、判定期間Sonより前の全ての歌唱期間における歌唱音量の平均値であってもよい。また、歌唱音量の平均値でなくてもよく、歌唱音量に対して予め決められた演算処理が行われて得られた値でもよい。すなわち、音量判定部106は、判定期間Sonにおける歌唱音量の最大値が、判定期間Son以外の歌唱期間における歌唱音量より大きいとみなせるか否かを、予め決められた演算処理により判定すればよい。
【0029】
音量判定部106は、このようにして判定した結果を示す音量判定情報を技法判定部109に出力する。この例においては、音量判定部106は、判定期間Sonにおける歌唱音量の最大値が、判定期間Son以外の歌唱期間における歌唱音量よりも大きい場合には「OK」、小さい場合には「NG」を示す音量判定情報を出力する。
【0030】
ピーク判定部107は、判定期間Sonにおける歌唱音量の変化を示す曲線に、2つ以上のピークが存在するか否かを判定し、判定結果を示すピーク数情報を技法判定部109に出力する。この例においては、2つ以上のピークが存在する場合には「ピーク数2以上」、存在しない場合には「ピーク数1以下」を示すピーク数情報を出力する。なお、2以上のピークの検出においては、ピーク間の谷となる部分の音量が予め決められた値以下になっていることを条件としてもよい。
【0031】
変化判定部108は、判定期間Sonにおける歌唱ピッチの変化が、予め決められた変化パターンに対応するか否かを判定する。予め決められた変化パターンは、ピッチが上昇した後に下降するパターンであり、評価基準情報に規定されている。このようなピッチの変化は、シャウト技法に特徴的な変化である。
【0032】
図4は、本発明の実施形態における評価基準情報に規定された変化パターンを説明する図である。評価基準情報に規定されている変化パターンとしては、第1変化パターンと第2変化パターンとがある。図4(a)は、第1変化パターンにより例示されるピッチ変化の波形(以下、波形1という)であり、図4(b)は、第2変化パターンにより例示されるピッチ変化の波形(以下、波形2という)である。
【0033】
波形1は、時刻0からピッチが急激に上昇し、時刻tp1においてピーク値PL1となり、その後、時刻te1まで急激に下降する波形である。この例においては、ピーク値PL1は、900cent以上として決められている。ピーク値PL1は、ピッチ初期値P0からの上昇分を絶対的な周波数の値として表しているのではなく、変化の割合として表している。
このように、波形1のように例示される第1変化パターンについての規定は、評価基準情報において、予め決められた時間内でピッチが上昇して下降すること、そのピーク値の初期値に対しての変化の割合が予め決められた値以上であること(この例においては、初期値に対して+900cent以上であること)、として決められている。なお、この予め決められた値は、この値に限らず、様々な値とすることができる。また、例示した波形1においては、時刻0におけるピッチと時刻te1におけるピッチとがほぼ一致しているが、必ずしも一致している必要は無く、時刻te1におけるピッチがピッチ初期値P0より大きくても小さくてもよい。
【0034】
波形2は、時刻0からピッチが急激に上昇し、時刻tp2においてピーク値PL2となり、時刻te2まで緩やかに下降して予め決められた下降値PD2となる。以下、時刻0から時刻tp2までを上昇期間T1、時刻tp2から時刻te2までを下降期間T2という。
このように、波形2のように例示される第2変化パターンについての規定は、評価基準情報において、予め決められた時間内でピッチが上昇して下降すること、上昇期間T1より下降期間T2が長いこと、下降期間T2が規定の時間以上であることとして決められている。なお、この条件を満たしていれば、例示した波形2のように下降値PD2がピーク初期値P0より大きい値となっている条件は必ずしも必要ではなく、同じ値であってもよいし、小さい値であってもよい。また、上昇期間T1における単位時間当たりのピッチ上昇量よりも、下降期間T2における単位時間当たりのピッチ下降量が少なくなる条件をさらに加えてもよい。
【0035】
変化判定部108は、判定期間Sonにおける歌唱ピッチの変化と評価基準情報が規定する2種類の変化パターンとを比較して、歌唱ピッチの変化が第1変化パターンの規定内容を満たす場合には第1変化パターンと対応し、第2変化パターンの規定内容を満たす場合には第2変化パターンと対応し、いずれも満たさない場合にはいずれにも対応しないと判定する。
変化判定部108は、このようにして判定した結果を示す変化判定情報を、技法判定部109に出力する。この例においては、変化判定部108は、第1変化パターンと対応する場合には「波形1」、第2変化パターンと対応する場合には「波形2」、いずれにも対応しない場合には「NG」を示す変化判定情報を出力する。
【0036】
図2に戻って説明を続ける。技法判定部109は、判定期間Sonに対応した構成音数情報、音量判定情報、ピーク数情報、変化判定情報を取得する。技法判定部109は、評価基準情報に規定されたシャウト技法を判定するための判定基準を取得し、評価期間Sonにおける歌唱音声がシャウト技法で歌唱されているか否かを判定する。評価基準情報に規定された判定基準について、図5を用いて説明する。
【0037】
図5は、本発明の実施形態における評価基準情報に規定された判定基準を説明する図である。この例においては、技法判定部109によって判定されるシャウト技法には、短いシャウト技法および長いシャウト技法の2種類がある。短いシャウト技法とは、歌唱間における「ワォ」といったような短い叫び声であり、長いシャウト技法とは、歌唱間における「イェーイ」といったような長い叫び声である。図5に示すように、判定基準は、短いシャウト技法と判定するための条件と、長いシャウト技法と判定するための条件とが、技法判定部109において取得される各種情報と対応付けて表されている。
【0038】
短いシャウト技法と判定される条件は、判定期間Sonの時間(判定期間長)が予め決められた時間(この例においては800msec.)未満であること、音量判定情報が「OK」であること、変化判定情報が「波形1」であること、ピーク数情報が「ピーク数1以下」であることの全てを満たすことである。構成音数情報の内容は問わない(構成音数が1以下である)。なお、この予め決められた時間は、再生される楽曲データのテンポに応じて変化するものであってもよく、この場合には、例えば1.5拍分(4分音符1.5個分の時間))としてもよい。
【0039】
長いシャウト技法と判定される条件は、音量判定情報が「OK」であること、変化判定情報が「波形2」であること、構成音数情報が「0」であることの全てを満たすことである。ピーク数情報の内容、判定期間長は問わない。なお、構成音数情報の内容を問わないものとしてもよいが、長いシャウト技法は、判定期間長に制限が無いため、構成音が判定期間Sonに存在しないものとする条件、すなわち構成音数情報が「0」であるものとすることにより、歌唱すべき構成音がない期間での歌唱音声について判定することになるから、通常の歌唱との違いをより明確に区別するようにできる。
【0040】
技法判定部109は、上記の判定基準を用いて、判定期間Sonにおける歌唱音声が、短いシャウト技法で歌唱されているか、長いシャウト技法で歌唱されているか、またはいずれでもない歌唱であるかを判定する。これにより、短いシャウト技法または長いシャウト技法の歌唱がされた期間が検出されることになる。技法判定部109は、その判定結果を示す情報を出力部110に出力する。このようにして、取得部101において取得した歌唱音声データが示す歌唱音声から、長いシャウト技法または短いシャウト技法が用いられている期間を検出することができる。
【0041】
出力部110は、技法判定部109から出力された情報に基づいて、表示部30に表示させる内容を決定して、その内容を表示部30に表示させるための制御情報を出力する。表示部30において表示させる内容とは、例えば、長いシャウト技法または短いシャウト技法が検出された期間を示す内容であってもよいし、楽曲データの再生中であれば、長いシャウト技法または短いシャウト技法が検出されたことを示す内容であってもよい。このように出力部110は、シャウト技法の判定結果に応じた情報を出力するものであればよい。
【0042】
このように、本発明の実施形態におけるカラオケ装置1は、歌唱者の歌唱音声を解析して、歌唱音量および歌唱ピッチの変化の態様から、その歌唱音声においてシャウト技法が用いられた期間を検出することができる。
【0043】
<変形例>
以上、本発明の実施形態について説明したが、本発明は以下のように、さまざまな態様で実施可能である。
[変形例1]
上述した実施形態において、無歌唱期間特定部104および判定期間特定部105は、予め決められたしきい値Vthを用いて、歌唱期間、無音期間を検出していたが、検出以前の歌唱音量に応じて変化するしきい値Vthを用いて、歌唱期間、無音期間を検出してもよい。例えば、歌唱音量のピーク値を結んだ包絡線(以下、最大包絡線という)によって示される音量の一定割合または一定量減少させた値などをしきい値Vthとしてもよい。また、歌唱音量のディップ値を結んだ包絡線(以下、最小包絡線という)によって示される音量の一定割合または一定量増加させた値などをしきい値Vthとしてもよい。また、最大包絡線と最小包絡線とに基づいて決められる値、例えば、最大包絡線によって示される音量と最小包絡線によって示される音量との中央値をしきい値Vthとしてもよい。
【0044】
[変形例2]
上述した実施形態においては、シャウト技法の検出結果は表示部30における表示に用いられていたが、別の用途に用いられてもよい。例えば、制御部10が、歌唱音声について、歌唱のうまさを示す評価点を算出する算出部を構成する場合には、出力部110は、技法判定部109から出力された情報を、その算出部に出力すればよい。そして、算出部は、シャウト技法の検出結果を用いて、算出する評価点に反映させればよい。反映の方法としては、例えば、以下の方法がある。
【0045】
算出部における評価点の算出に、例えば、歌唱すべき構成音のピッチと歌唱ピッチとを比較して一致度に応じて加点または減点する方法が含まれる場合を想定する。ある比較期間において短いシャウト技法が検出された場合には、その検出された期間においては、構成音のピッチと歌唱ピッチとが大きくずれていることになるが、シャウト技法を用いたことによるものであるから、評価点の減点対象としないようにする方法である。
また、算出部における評価点の算出に、歌い始めのタイミングと歌唱すべき最初の構成音のタイミングとを比較して一致度に応じて加点または減点する方法が含まれる場合には、シャウト技法による歌唱は歌い始めの歌唱ではないものとして扱う方法である。
このように、シャウト技法の歌唱を通常の歌唱と区別することで、シャウト技法の歌唱を用いたことによる評価点への悪影響を抑えることができる。
なお、評価点の算出は算出部ではなく、出力部110において行うようにしてもよい。その場合には、出力部110は、シャウト技法の検出結果を用いた評価点の算出結果に応じた情報を示す内容を表示部30に表示させるようにする制御信号を出力すればよい。
【0046】
[変形例3]
上述した実施形態においては、シャウト技法の検出として、短いシャウト技法と長いシャウト技法とを検出していたが、いずれか一方のみ検出するようにしてもよい。長いシャウト技法のみを検出する場合には、技法判定部109において長いシャウト技法のみ判定すればよいから、例えば、ピーク数情報については判定基準にはないから不要であるから、ピーク判定部107が存在しなくてもよい。
【0047】
[変形例4]
上述した実施形態においては、出力部110から出力される情報は、シャウト技法の判定結果に応じた内容を表示部30に表示させるための情報であったが、それ以外の内容を示す情報であってもよい。出力部110から出力される情報は、歌唱者にシャウト技法が検出されたことを報知するためのものであればよいから、例えば、検出結果の内容を声で表した音声データであってもよい。また、出力部110から出力される情報は、音響処理部60における音源を用いて発音させるためのMIDI形式のシーケンスデータであってもよい
【0048】
なお、歌唱者にシャウト技法の検出を報知するものとしては、発光、香り、動きなどを用いたものであってもよい。この場合には、様々な発光態様で発光するLED(Light Emitting Diode)などを用いた発光装置、様々な香りの成分をもつガスを放出可能な香り放出装置、様々な動作を行うことが可能なロボットなどを外部装置として接続する。そして、その外部装置を時系列に沿って制御するための制御情報を出力部110から出力される情報とすればよい。
【0049】
[変形例5]
上述した実施形態において、シャウト技法検出機能は、楽曲の途中におけるシャウト技法について検出するように構成されていたが、楽曲の最初または最後において、シャウト技法が検出されるようにしてもよい。楽曲の最初においてシャウト技法での歌唱がなされた場合には、その直前において無歌唱期間特定部104は無歌唱期間Soffを特定する構成ではなく、また、楽曲の最後においてシャウト技法での歌唱がなされた場合には、その直後において無歌唱期間特定部104は無歌唱期間Soffを特定する構成ではない。そのため、判定期間Sonは、実施形態における処理においては、楽曲の最初または最後に存在しない構成であった。そのため、この例においては、判定期間特定部105は、楽曲の最初または最後、すなわち、歌唱音声データの開始直前または終了直後には、無歌唱期間Soffが存在する前提で処理をしてもよいし、無歌唱期間特定部104において、歌唱音声データの開始直前または終了直後において、無歌唱期間Soffを特定するようにしてもよい。
また、歌唱音声データが楽曲データの再生中以外でも生成されるように構成して、取得部101は、楽曲データ再生開始の一定時間前に対応する部分の歌唱音声データから取得し、楽曲データ再生終了後の一定時間後に対応する部分の歌唱音声データまで取得するようにしてもよい。
【0050】
[変形例6]
上述した実施形態における制御プログラムは、磁気記録媒体(磁気テープ、磁気ディスクなど)、光記録媒体(光ディスクなど)、光磁気記録媒体、半導体メモリなどのコンピュータ読み取り可能な記録媒体に記憶した状態で提供し得る。また、カラオケ装置1は、制御プログラムをネットワーク経由でダウンロードしてもよい。
【符号の説明】
【0051】
1…カラオケ装置、10…制御部、20…操作部、30…表示部、40…通信部、50…記憶部、60…音響処理部、61…スピーカ、62…マイクロフォン、100…シャウト技法検出部、101…取得部、102…音量検出部、103…ピッチ検出部、104…無歌唱期間特定部、105…判定期間特定部、106…音量判定部、107…ピーク判定部、108…変化判定部、109…技法判定部、110…出力部

【特許請求の範囲】
【請求項1】
楽曲データの再生期間の少なくとも一部を含む期間に入力された歌唱音声を取得する取得手段と、
前記取得した歌唱音声のピッチを検出するピッチ検出手段と、
前記取得した歌唱音声の音量を検出する音量検出手段と、
前記検出された音量が予め決められたしきい値未満となる期間のうち、予め決められた時間以上継続する期間を無歌唱期間として特定する無歌唱期間特定手段と、
前記検出された音量が前記しきい値以上となる歌唱期間のうち、前記無歌唱期間に前後を挟まれ、かつ前記楽曲データによって示される歌唱すべき構成音が2つ以上含まれない歌唱期間を判定期間として特定する判定期間特定手段と、
前記判定期間において前記検出された音量の最大値が、前記歌唱期間のうち当該判定期間以外において前記検出された音量より大きいか否かを判定する音量判定手段と、
前記判定期間において前記検出されたピッチの変化が、ピッチが上昇した後に下降する予め決められた変化パターンに対応するか否かを判定する変化判定手段と、
前記音量判定手段において大きいと判定され、かつ、前記変化判定手段において対応すると判定された場合には、前記判定期間における前記歌唱音声が特定の技法により歌唱されていると判定する技法判定手段と、
前記技法判定手段による判定結果に応じた情報を出力する出力手段と
を具備することを特徴とする歌唱音声評価装置。
【請求項2】
前記判定期間特定手段が特定する判定期間は、前記検出された音量が前記しきい値以上となる歌唱期間のうち、前記無歌唱期間に前後を挟まれ、かつ前記楽曲データによって示される歌唱すべき構成音が含まれない歌唱期間である
ことを特徴とする請求項1に記載の歌唱音声評価装置。
【請求項3】
前記変化パターンは、ピッチが上昇する時間よりピッチが下降する時間が長く、当該下降の時間が所定の時間以上になるように決められている
ことを特徴とする請求項1または請求項2に記載の歌唱音声評価装置。
【請求項4】
前記判定期間において前記検出された音量の変化を示す曲線に、2つ以上のピークが存在するか否かを判定するピーク判定手段をさらに具備し、
前記判定期間特定手段が特定する判定する判定期間は、予め決められた時間未満となる歌唱期間であり、
前記変化パターンは、ピッチの上昇前から上昇後への変化の割合が予め決められた値以上となるように決められ、
前記技法判定手段は、前記音量判定手段において大きいと判定され、かつ、前記変化判定手段において対応すると判定され、かつ、前記ピーク判定手段において2つ以上のピークが存在しないと判定された場合には、前記判定期間における前記歌唱音声が前記特定の技法により歌唱されていると判定する
ことを特徴とする請求項1または請求項2に記載の歌唱音声評価装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公開番号】特開2012−78701(P2012−78701A)
【公開日】平成24年4月19日(2012.4.19)
【国際特許分類】
【出願番号】特願2010−225725(P2010−225725)
【出願日】平成22年10月5日(2010.10.5)
【出願人】(000004075)ヤマハ株式会社 (5,930)
【出願人】(390004710)株式会社第一興商 (537)
【Fターム(参考)】