説明

歌唱音声評価装置

【課題】歌唱者自らの判断によらず、歌唱者の歌唱音域を評価すること。
【解決手段】本発明の実施形態におけるカラオケ装置は、楽曲データの再生中に入力された歌唱音声を取得し、歌唱音声の歌唱音高を特定するとともに、オクターブ単位で区切られた音高範囲であって歌唱音声の音高が属する音高範囲を特定する。そして、カラオケ装置は、歌唱すべき各構成音について、構成音の指定音高と歌唱音高とを比較して、当該指定音高と当該歌唱音高とが同じ音高範囲に属するようにオクターブ単位で変換した場合における音高の一致度を算出し、構成音の指定音高を特定された音高範囲に属するようにオクターブ単位で変換し、構成音について算出された一致度に基づいて変換した音高に対する歌唱評価を行う。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、歌唱音声を評価した結果を出力する技術に関する。
【背景技術】
【0002】
カラオケ装置において、歌唱者が歌える楽曲について予め登録しておき、登録された楽曲のガイドメロディデータから最高音と最低音とを検出し、歌唱者の歌唱音域を表示して、歌唱者に知らせる技術がある。(例えば、特許文献1)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2004−205818号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1に開示された技術においては、歌唱者が歌える楽曲を予め登録することになるが、歌える楽曲についての判断は歌唱者自身が行うため、実際にその楽曲を歌えているのかどうかについては正確性に欠けていた。また、歌唱者は、ある楽曲について歌えるものとして登録しても、その楽曲の最高音および最低音を超えて歌えるのかどうかは不明であり、自身の歌唱音域の限界を知ることにはならない。そのため、数多くの楽曲を歌ってみて、ぎりぎり歌える曲を探して登録しなくてはならない。
本発明は、歌唱者自らの判断によらず、歌唱者の歌唱音域を評価することを目的とする。
【課題を解決するための手段】
【0005】
上述の課題を解決するため、本発明は、楽曲データの再生中に入力された歌唱音声を取得する取得手段と、前記取得された歌唱音声の歌唱音高を特定する音高特定手段と、オクターブ単位で区切られた音高範囲であって前記取得された歌唱音声の音高が属する音高範囲を特定する範囲特定手段と、前記楽曲データにより指定される歌唱すべき各構成音について、前記楽曲データにより指定される指定音高と前記歌唱音高とを比較して、当該指定音高と当該歌唱音高とが同じ音高範囲に属するようにオクターブ単位で変換した場合における音高の一致度を算出する算出手段と、前記歌唱すべき構成音の指定音高を当該構成音について前記特定された音高範囲に属するようにオクターブ単位で変換し、当該構成音について算出された一致度に基づいて当該変換した音高に対する歌唱評価を行う評価手段と、前記歌唱評価の結果に応じた情報を出力する出力手段とを具備することを特徴とする歌唱音声評価装置を提供する。
【0006】
また、別の好ましい態様において、前記音高特定手段は、前記取得された歌唱音声を第1解析方法により解析して前記歌唱音高を特定し、前記範囲特定手段は、前記第1解析方法とは異なる第2解析方法により解析して前記音高範囲を特定することを特徴とする。
【0007】
また、別の好ましい態様において、前記範囲特定手段は、前記歌唱すべき構成音について前記特定した音高範囲の正確性の指標となる信頼度を算出し、前記評価手段は、前記構成音について特定した音高範囲の信頼度が予め決められたしきい値未満となった場合には、当該構成音より前の構成音に対応する信頼度が当該しきい値以上となった音高範囲と当該前の構成音の指定音高が属する音高範囲との関係に基づいて決定した音高範囲に属するように、前記指定音高を変換することを特徴とする。
【0008】
また、別の好ましい態様において、前記歌唱評価の結果に応じて、一定範囲の音高を前記歌唱音声の音域として特定する音域特定手段をさらに具備し、前記出力手段が出力する情報は、前記特定した音域を示す音域情報であることを特徴とする。
【発明の効果】
【0009】
本発明によれば、歌唱者自らの判断によらず、歌唱者の歌唱音域を評価することができる。
【図面の簡単な説明】
【0010】
【図1】本発明の実施形態におけるカラオケ装置の構成を説明するブロック図である。
【図2】本発明の実施形態における歌唱音声評価機能の構成を説明する機能ブロック図である。
【図3】本発明の実施形態における算出部における一致度算出の具体例を説明する図である。
【図4】本発明の実施形態における評価処理の動作を説明するフローチャートである。
【図5】本発明の実施形態における修正処理の動作を説明するフローチャートである。
【図6】本発明の実施形態における評価結果情報の内容を説明する図である。
【図7】本発明の実施形態における評価結果の表示内容の一例を説明する図である。
【発明を実施するための形態】
【0011】
<実施形態>
[ハードウエア構成]
図1は、本発明の実施形態におけるカラオケ装置1の構成を説明するブロック図である。カラオケ装置1は、本発明の歌唱音声評価装置の一例であり、入力された歌唱音声の評価を行う装置である。カラオケ装置1は、歌唱者の歌唱音声が入力され、その歌唱音声の音域の評価を行う。まず、カラオケ装置1のハードウエア構成について説明する。
【0012】
カラオケ装置1は、制御部10、操作部20、表示部30、通信部40、記憶部50、音響処理部60を有する。これらの各構成は、バスを介して接続されている。また、カラオケ装置1は、音響処理部60に接続されたスピーカ61およびマイクロフォン62を有する。
【0013】
制御部10は、CPU(Central Processing Unit)、RAM(Random Access Memory)、ROM(Read Only Memory)などを有する。制御部10は、ROMまたは記憶部50に記憶された制御プログラムを実行することにより、バスを介してカラオケ装置1の各部を制御する。この例においては、制御部10は、制御プログラムを実行することにより、入力された歌唱音声の音域の評価を行うための歌唱音声評価機能を実現する。
【0014】
操作部20は、操作パネルなどに設けられた操作ボタン、リモコンに設けられた操作ボタン、キーボード、マウスなどの操作デバイスであって、歌唱者の操作を受け付けて、その内容を示す操作信号を制御部10に出力する。
表示部30は、液晶ディスプレイなどの表示デバイスであり、制御部10の制御に応じた内容の表示を行う。この表示の内容は、カラオケの楽曲の進行に応じた背景画像、歌詞テロップ、メニュー画面、歌唱音声の評価結果などである。
通信部40は、制御部10の制御に応じて、インターネットなどの通信回線と接続して、サーバ装置などの通信装置と情報のやり取りを行う。制御部10は、通信部40を介して取得した情報を用いて、記憶部50に記憶される情報を更新するようにしてもよい。
記憶部50は、ハードディスク、不揮発性メモリなどの記憶手段であり、楽曲データ、歌唱音声データ、および評価結果情報をそれぞれ記憶する記憶領域を有する。
【0015】
楽曲データは、カラオケの歌唱対象となる楽曲に関連するデータが含まれ、例えば、ガイドメロディデータ(以下、GMデータという)、伴奏データ、歌詞データなどが含まれている。GMデータは、楽曲のボーカルパートのメロディを示すデータ、すなわち、歌唱すべき構成音の内容が指定されたデータであり、例えば、MIDI(Musical Instrument Digital Interface)形式により記述されている。伴奏データは、楽曲の伴奏の内容を示すデータであり、例えば、MIDI形式により記述されている。歌詞データは、楽曲の歌詞の内容を示すデータ、および表示部30に表示させた歌詞テロップを色替えするためのタイミングを示すデータを有する。また、楽曲データには、楽曲のサビ部分の位置、メロディの出だし部分の位置など、楽曲の各構成部分の位置を規定する情報も含まれていてもよい。
楽曲データは、歌唱者によって操作部20の操作により指定された楽曲に対応するものが制御部10によって読み出され、カラオケの伴奏音のスピーカ61からの出力、歌詞テロップの表示部30への表示に用いられる。
【0016】
歌唱音声データは、カラオケの対象となった楽曲を歌唱する歌唱者によって、マイクロフォン62から入力された歌唱音声を示すデータであり、例えば、WAVE形式などで記憶される。このようにして記憶される歌唱音声データは、制御部10によって、カラオケの対象となった楽曲を示す楽曲データに対応付けられる。
評価結果情報は、歌唱音声評価機能により生成され、歌唱音声の音域を評価するための情報である(図6参照)。具体的な内容については、歌唱音声評価機能における説明で述べる。
【0017】
マイクロフォン62は、歌唱者の歌唱音声が入力され、歌唱音声を示すオーディオ信号を音響処理部60に出力する。スピーカ61は、音響処理部60から出力されるオーディオ信号を放音する。音響処理部60は、DSP(Digital Signal Processor)などの信号処理回路、MIDI形式の信号からオーディオ信号を生成する音源などを有する。音響処理部60は、マイクロフォン62から入力されるオーディオ信号をA/D変換して制御部10に出力する。音響処理部60は、制御部10から楽曲データに基づくMIDI形式の信号が入力され、その信号に基づいてオーディオ信号を生成する。音響処理部60は、このように生成したオーディオ信号、制御部10から出力されたオーディオ信号、マイクロフォン62から入力されたオーディオ信号などを、エフェクト処理、増幅処理などの信号処理を施してからスピーカ61に出力する。
【0018】
ここで、制御部10は、楽曲データを読み出して再生し、その楽曲の伴奏音をスピーカ61から出力させている期間において、音響処理部60から出力されるオーディオ信号を取得し、歌唱音声データを生成し、その楽曲データに対応付けて記憶部50へ記憶する。
以上が、カラオケ装置1のハードウエア構成についての説明である。
【0019】
[歌唱音声評価機能]
次に、カラオケ装置1の制御部10が制御プログラムを実行することによって実現される歌唱音声評価機能について説明する。なお、以下に説明する歌唱音声評価機能を実現する歌唱音声評価部100における各構成の一部または全部については、ハードウエアによって実現してもよい。
【0020】
図2は、本発明の実施形態における歌唱音声評価部100の構成を説明する機能ブロック図である。歌唱音声評価部100は、取得部110、音高特定部120、範囲特定部130、算出部140、評価部150、音域特定部160、および出力部170を有する。
取得部110は、記憶部50に記憶された歌唱音声データのうち、予め決められた評価期間の歌唱音声に対応する部分(この例においては、楽曲全体)の歌唱音声データを取得して、音高特定部120および範囲特定部130に出力する。
【0021】
音高特定部120は、取得部110から取得した歌唱音声データから、歌唱すべき各構成音について、歌唱音声の音高(以下、歌唱音高という)を特定する。具体的には、音高特定部120は、各フレームについて歌唱音声データが示す音声信号の波形が負から正に変化する際のゼロクロスを検出し、そのゼロクロスの時間間隔を測定することによってフレーム毎の歌唱音高(周波数)を特定する。このとき、この音声信号から、ローパスフィルタによりノイズ成分となる高域成分をカットしたり、ハイパスフィルタにより直流成分をカットしたりしておいてもよい。
音高特定部120は、このようにして特定した歌唱音高を示す情報を時系列に算出部140に出力する。
【0022】
範囲特定部130は、取得部110から取得した歌唱音声データから、歌唱音高が属する音高範囲を特定する。音高範囲は、オクターブ単位で区切られた音高の範囲を示し、第1音高範囲、第1音高範囲より1オクターブ上の第2音高範囲、第2音高範囲より1オクターブ上の第3音高範囲・・・といったように区切られ、それぞれ、周波数帯域で規定されている。
【0023】
この例においては、MIDI形式のノートナンバ(以下、オクターブ表記付の音名で記載する)に対応して音高範囲を決めている。例えば、第3音高範囲は「C3」に相当するとみなされる周波数の下限から「B3」に相当するとみなされる周波数の上限までの周波数帯域、第4音高範囲は「C4」に相当するとみなされる周波数の下限から「B4」に相当するとみなされる周波数の上限までの周波数帯域、として決められている。すなわち、歌唱音高が、「A3」に対応する「440Hz」であるものについては、第3音高範囲に属するものとして取り扱われる。なお、オクターブ単位で区切られていればよいから、例えば、「A4」に相当するとみなされる周波数から「A5」に相当するとみなされる周波数までの周波数帯域を1つの音高範囲としてもよい。
【0024】
範囲特定部130は、歌唱音高が属する音高範囲を特定するときには、以下のように行う。まず、範囲特定部130は、取得部110から取得した歌唱音声データにFFT(Fast Fourier Transform)を施して、フレーム毎の周波数スペクトルを算出する。範囲特定部130は、算出した周波数スペクトルから第1フォルマント周波数を検出し、第1フォルマント周波数が含まれる周波数帯域に対応する音高範囲を歌唱音高が属する音高範囲として特定する。このとき、範囲特定部130は、第1フォルマント周波数の検出結果の正確性、すなわち、特定された音高範囲の正確性の指標となる信頼度を算出する。この信頼度は、周波数スペクトルの形状により変動する。例えば、周波数スペクトルのピークの位置が、倍音関係を満たしているほど、ピークのレベルが高いほど、信頼度が高くなるようにすればよい。この場合、歌唱音声において、子音であったり、ノイズが多かったりする部分においては信頼度が低くなる。
範囲特定部130は、このようにして特定した音高範囲(以下、特定音高範囲という)、算出した信頼度(以下、算出信頼度という)を示す範囲情報を時系列に評価部150に出力する。
【0025】
なお、範囲特定部130においては、第1フォルマント周波数から歌唱音高も特定できることとなるが、精度を高めるためには演算処理負担も大きくなるため、ここでは、音高範囲が特定できる程度に精度を緩くして第1フォルマント周波数を検出している。一方、音高特定部120においては、音声波形のゼロクロスから音高を特定しているが、この検出手法においては、倍音関係のいずれの音高であるかについて、範囲特定部130におけるFFT処理に比べて特定精度が低い。一方、ゼロクロスからの音高の特定において、ある音高範囲の周波数帯域に限って音高を特定する場合には、特定の精度はFFT処理に比べて高くなる。
この例においては、このように、範囲特定部130と音高特定部120とで異なる検出方法で検出された音高に基づいて歌唱音高、音高範囲を特定している。一方、例えば、FFT処理においても精度の高い第1フォルマントの周波数検出が可能であれば、音高特定部120に代えて、範囲特定部130において検出した第1フォルマントの周波数を示す歌唱音高を算出部140に出力するようにしてもよい。
【0026】
算出部140は、音高特定部120から出力された情報と記憶部50に記憶されたGMデータとを取得する。算出部140は、取得したGMデータに時系列に指定される歌唱すべき各構成音について、その構成音の音高(以下、指定音高という)と、音高特定部120において特定された歌唱音高とを比較して、音高の一致の程度を示す一致度を算出する。なお、指定音高は、周波数で示されていてもよいし、「A4」などのノートナンバに応じた値で示されていてもよい。
【0027】
算出部140は、歌唱音高を時系列に取得するから、GMデータに指定される各構成音と歌唱音高との時系列の対応関係を識別できる。また、算出部140は、この一致度の算出において、指定音高と歌唱音高とが同じ音高範囲に属するようにオクターブ単位で変換して、変換した指定音高と歌唱音高とを比較する。例えば、歌唱音高が220Hz(「A2」に相当)であれば、第2音高範囲に属するから、時系列に対応する構成音の音高を第2音高範囲に属するように変換(例えば、指定音高が「A3」なら「A2」に変換)してから比較する。
算出部140は、算出した一致度(以下、算出一致度という)を示す情報と、歌唱すべき構成音およびその指定音高を特定可能な情報とを対応付けた一致度情報を、評価部150に出力する。算出部140における処理の具体例について、図3を用いて説明する。
【0028】
図3は、本発明の実施形態における算出部140における一致度算出の具体例を説明する図である。図3において、横軸は時刻、縦軸は音高を示している。GMデータによって指定される歌唱すべき各構成音は、GMで示した斜線のある四角部分に対応し、「C4」、「E4」などの記載は各構成音の指定音高を示している。斜線のない四角部分については、各構成音をオクターブ単位で変換したものである。四角の範囲は、時刻方向については構成音の長さを示している。また、音高方向については、その指定音高とみなされる周波数の範囲を示し、指定音高の周波数を中心に、±50centの範囲である。
音高特定部120において特定された歌唱音高は、Pで示した曲線に対応している。
横軸に記載したN1、N2、・・・は、各構成音の期間に対応した部分として時系列で表され、以下、N1部分の構成音を構成音N1などというものとする。例えば、構成音N2は、指定音高が「E4」である。
【0029】
算出部140は、構成音N1について、指定音高は「C4」であるが、歌唱音高が第3音高範囲にあるため、1オクターブ下に変換した「C3」と比較する。そして、算出部140は、この例においては、構成音N1に対応する期間に対して、歌唱音高が「C3」の周波数±50centに含まれている期間の割合を、構成音N1についての一致度(この例においては、70%)として算出する。そして、この例においては、算出部140は、構成音N1およびその指定音高「C4」を示す情報と、算出一致度「70%」を示す情報とを対応付けた一致度情報を、評価部150に出力する。
【0030】
図2に戻って説明を続ける。評価部150は、算出部140から出力された一致度情報と、範囲特定部130から出力された範囲情報とを取得して、これらの情報に基づいて、各音高について評価する評価処理を行う。以下、評価処理について説明する。
【0031】
図4は、本発明の実施形態における評価処理の動作を説明するフローチャートである。評価部150は、一致度情報および範囲情報を取得すると評価処理を開始する。以下に説明する評価処理については、歌唱すべき構成音毎に行われる処理である。なお、評価部150は、特定音高範囲を時系列に取得し、また、各構成音も時系列に表されているから、これらの対応関係を識別できる。
【0032】
まず、評価部150は、取得した一致度情報および範囲情報に示されている内容を参照して、構成音について、指定音高、算出一致度、特定音高範囲、および算出信頼度の各種情報を対応付けて記憶する(ステップS110)。評価部150は、予め決められた数(例えば、20音)だけ前に遡った構成音についてまでは記憶しておき、それよりも前の構成音については記憶内容を削除する。なお、評価部150は、この記憶内容を削除せず、楽曲の最初の構成音についての情報をすべて記憶しておいてもよい。
【0033】
続いて、評価部150は、算出信頼度が予め決められた条件を満たしているかどうかを判定する(ステップS120)。予め決められた条件とは、算出信頼度が予め決められたしきい値以上になることである。評価部150は、算出信頼度が条件を満たさないと判定した場合(ステップS120;No)には、特定音高範囲の修正処理を行う(ステップS130)。特定音高範囲の修正処理については、図5を用いて説明する。
【0034】
図5は、本発明の実施形態における修正処理の動作を説明するフローチャートである。評価部150は、過去の構成音に対応してステップS110において記憶された内容を参照し、評価対象の構成音より1つ前の構成音についての算出信頼度を取得する(ステップS210)。評価部150は、取得した算出信頼度が予め決められた条件を満たしているかどうかを判定する(ステップS220)。この判定は、ステップS120における判定と同様の判定である。算出信頼度が条件を満たしていない場合(ステップS220;No)には、評価部150は、再びステップS210に戻って処理を続ける。すなわち、評価部150は、さらに1つ前の構成音についての算出信頼度を取得する(ステップS210)。
【0035】
算出信頼度が条件を満たしている場合(ステップS220;Yes)には、条件を満たしている構成音について、指定音高の属する音高範囲に対する特定音高範囲のずれの程度を判定する(ステップS230)。ずれの程度は、オクターブ単位で表される。例えば、指定音高が「C4」であり、特定音高範囲が第3音高範囲であれば、「C4」が属する第4音高範囲に対して特定音高範囲は1オクターブ下にずれているから、ずれの程度は「−1」として表される。
【0036】
評価部150は、当初の評価対象(算出信頼度が条件を満たしていない)である構成音についての特定音高範囲を、その構成音の指定音高が属する音高範囲に対して、ステップS230において判定したずれの程度だけずらした音高範囲として決定する(ステップS240)。例えば、上記の例を前提として、当初の評価対象である構成音についての指定音高が「B3」であれば、「B3」が属する第3音高範囲から1オクターブ下の第2音高範囲を、その構成音についての特定音高範囲として決定して、ステップS110において記憶した内容を修正し、修正処理を終了する。このようにして、ステップS110において記憶された特定音高範囲は、算出信頼度が条件を満たさない場合には、どのような音高範囲を示すものであっても、ステップS240において決定した音高範囲に修正される。
【0037】
なお、楽曲の最初の構成音まで戻っても条件を満たす算出信頼度が得られない場合には、予め決められた処理を行えばよい。例えば、評価部150は、評価対象である構成音についての特定音高範囲を、音高特定部120において特定された歌唱音高の属する音高範囲として決定し、ステップS110において記憶した内容を修正し修正処理を終了すればよい。
【0038】
図4に戻って説明を続ける。評価部150は、算出信頼度が条件を満たすと判定した場合(ステップS120;Yes)または修正処理(ステップS130)が終了した場合には、ステップS110において記憶した内容を参照して、指定音高を特定音高範囲に属するようにオクターブ単位で変換する(ステップS140)。このとき、修正処理(ステップS130)が行われていれば、修正後の特定音高範囲に属するように変換される。
そして評価部150は、算出一致度を、変換した音高に対する歌唱評価として評価結果情報に記録(ステップS150)し、その構成音についての評価処理を終了する。評価部150は、歌唱すべき全ての構成音について、これらの評価処理を繰り返す。続いて、評価結果情報について図6を用いて説明する。
【0039】
図6は、本発明の実施形態における評価結果情報の内容を説明する図である。評価結果情報は、評価音高、評価点および算出一致度履歴が対応付けられた情報であり、音高毎の歌唱評価の結果を示している。
【0040】
評価音高とは、評価対象となる音高であり、この例においては、MIDI形式のノートナンバに対応して定められている。
算出一致度履歴とは、上記評価処理のステップS150において記録される算出一致度であり、音高に対する歌唱評価として記録する度に、その評価音高に対応する履歴として記録されていく。例えば、図6に示す例においては、評価音高「D3」については、算出一致度の記録が4回なされた状態である。
評価点は、算出一致度履歴に記録された数値に応じて算出される点数であり、この例においては、算出一致度履歴における各点数の平均として決められている。例えば、図6に示す例においては、評価音高「C3」については、算出一致度の記録が「70」、「60」であるから、平均の「65」が評価点となっている。この評価点の算出は、評価処理のステップS150における一連の処理として評価部150が行う。
【0041】
このようにして、評価部150は、評価結果情報への記録により、構成音単位で歌唱を評価するのではなく、音高単位で歌唱を評価することになる。すなわち、評価点は、各音高について、どの程度うまく歌えているかの指標となる値である。
【0042】
図2に戻って説明を続ける。音域特定部160は、評価結果情報を参照し、一定範囲の音高を歌唱音声の音域(以下、歌唱音域という)として特定する。この例においては、音域特定部160は、評価結果情報における評価音高の低い音高から順に評価点が予め決められた合格点数を超えているか否かを判定し、最初に合格点数を超えている評価音高を最低音域音高として検出する。また、音域特定部160は、評価結果情報における評価音高の高い音高から順に評価点が予め決められた合格点数を超えているか否かを判定し、最初に合格点数を超えている評価音高を最高音域音高として検出する。
そして、音域特定部160は、検出した最低音域音高から最高音域音高までを歌唱音域として特定して、歌唱音域を示す情報を出力部170に出力する。
【0043】
出力部170は、音域特定部160から出力された情報に基づいて、表示結果として表示部30に表示させる内容を決定して、その内容を表示部30に表示させるための制御信号を出力する。表示部30において表示させる内容とは、最低音域音高と最高音域音高とを明示して歌唱音域を示すものであればよい。この表示内容は様々なものとすることができるが、一例として図7に示すような表示内容としてもよい。
【0044】
図7は、本発明の実施形態における評価結果の表示内容の一例を説明する図である。この例においては、歌唱者の歌唱音域を示すだけでなく、歌唱した楽曲の音域およびどの程度キーをずらせば歌唱者が歌唱できるかの推奨を行う表示内容である。このような表示内容を行うにあたっては、出力部170は、GMデータによって指定される構成音の音高の最低音高と最高音高とを検出しておく。そして、出力部170は、最低音高と最高音高がともに歌唱音域に含まれるようにするには、どの程度キーを変更する必要があるかを算出すればよい。
【0045】
図7に示す例においては、歌唱者の歌唱音域は、最高音域音高が「C4」、最低音域音高が「C3」とする評価結果である。その評価に用いられた楽曲の音域は、最高音高が「G4」、最低音高が「A3」であるものとする。その場合、出力部170は、楽曲の音域を下げて、歌唱音域内に含まれるようにキーの変更量を算出する。この場合には、半音6つ分から8つ分の範囲で下げることで、歌唱音域内に含まれるようになる。その場合には、出力部170は、ちょうど歌唱音域内の中心部分に含まれるになるように、半音を7つ分下げることを推奨するように決定して、歌唱音域、楽曲の音域、キー変更後の楽曲の音域、および推奨コメントを表示部30に表示させる。
【0046】
このように、本発明の実施形態におけるカラオケ装置1は、歌唱者の歌唱音域を評価して、その評価結果に応じた内容を表示部30に表示させることができる。この歌唱音域の評価結果は、歌唱者が歌唱できる最大幅の音域を示すものではなく、オクターブずれであっても歌唱すべき音高にあわせて歌唱できる最大幅の音域を示すものである。したがって、歌唱者は、信頼性の高い歌唱音域の評価結果を知ることができる。
【0047】
<変形例>
以上、本発明の実施形態について説明したが、本発明は以下のように、さまざまな態様で実施可能である。
[変形例1]
上述した実施形態において、カラオケ装置1は、楽曲が終了した後、楽曲全体を1つの評価期間として歌唱音域の評価をしていたが、1つの楽曲を複数の評価期間に分割して、各期間において評価をしてもよいい。例えば、複数の評価期間とは、楽曲の構成単位、例えば、歌詞の1番に相当する期間と2番に相当する期間であってもよいし、一定時間単位で区切られた期間であってもよい。
この場合には、評価部150は、楽曲データを参照したり、計時したりして複数の評価期間を認識し、各評価期間に対応する評価結果情報を生成して記録すればよい。
【0048】
[変形例2]
上述した実施形態において、出力部170は、評価結果情報に応じて音域特定部160により特定された歌唱音域に応じた表示をさせるための情報を表示部30に出力していたが、評価結果情報に示される各評価音高の評価点をヒストグラムなどによりグラフ化したものの表示をさせるための情報を表示部30に出力するようにしてもよい。これによっても歌唱者は、自らの歌唱音声がどの程度の歌唱音域を有するのかを知ることができる。
また、出力部170は、評価結果情報に応じて特定された歌唱音域に基づいて、歌唱音域に対する音域評価点を算出して、その音域評価点の表示をさせるための情報を表示部30に出力するようにしてもよい。この音域評価点は、歌唱音域と楽曲の音域との比較結果に基づいて算出されるようにしてもよい。
このように、出力部170は、評価結果情報に応じた内容で表示部30に表示させるための情報を出力するのであれば、どのような情報であってもよい。
【0049】
[変形例3]
上述した実施形態においは、範囲特定部130は、特定した音高範囲に対する信頼度を算出していたが、必ずしも信頼度を算出しなくてもよい。信頼度を算出しない構成である場合であれば、評価部150における評価処理において、図4のステップS120、S130における処理は不要である。
【0050】
[変形例4]
上述した実施形態において、評価部150の評価処理におけるステップS120の判定で用いられるしきい値は、予め決められたものであったが、変更可能に構成されていてもよい。例えば、しきい値を変更する指示が操作部20への操作によって入力されると、制御部10は、このしきい値を指示に応じて変更するようにすればよい。また、対応する構成音について算出部140において算出された算出一致度に応じてしきい値が変化するようにしてもよい。例えば、算出一致度が低ければしきい値を高くし、算出一致度が高ければしきい値を低くすればよい。
なお、音域特定部160において歌唱音域の特定のときに用いられる合格点数など、各種の判定処理に用いられるしきい値についても上記同様に変更可能に構成されていてもよい。
【0051】
[変形例5]
上述した実施形態において、評価結果情報に示される評価点は、算出一致度履歴における各点数の平均として決められていたが、それ以外の算出方法により決められるようにしてもよい。例えば、算出一致度履歴における最高点を評価点としてもよいし、最低点を評価点としてもよい。この場合には、評価部150は、評価結果情報に算出一致度を履歴として記録しなくてもよい。例えば、最高点を評価点とする場合には、評価部150は、現時点における評価点と取得した算出一致度とを比較して、算出一致度が評価点より高い場合に限り評価点を算出一致度に置き換えるようにすればよいためである。
また、評価部150は、算出一致度履歴に記録された点数に統計処理を行って得られる指標(中央値、最頻値など)に基づいて、評価点を決めるようにしてもよい。
【0052】
[変形例6]
上述した実施形態において、音域特定部160は、評価結果情報における評価音高の低い音高から順に評価点が予め決められた合格点数を超えているか否かを判定し、最初に合格点数を超えている評価音高を最低音域音高として検出していたが、他の判定手法により検出してもよい。例えば、音域特定部160は、評価結果情報に示される評価音高に対する評価点の分布から、統計処理などの演算処理を行って歌唱音域を特定するようにすればよい。なお、上記説明においては、最低音域音高を例として説明したが、最高音域音高の検出についても同様に変形可能である。
【0053】
[変形例7]
上述した実施形態において、範囲特定部130は、音高特定部120において特定された歌唱音高を用いて、音高範囲を特定するようにしてもよい。この場合には、範囲特定部130は、音高特定部120から出力される情報を取得し、検出した第1フォルマント周波数を、歌唱音高の整数分の1の周波数および整数倍の周波数のいずれに近いかという判定から音高範囲を決めてもよい。
例えば、音高特定部120において特定された歌唱音高が440Hzであれば、範囲特定部130は、第1フォルマント周波数が、110、220、440、880、1760Hzのいずれに近いかという判定をして音高範囲を決めてもよい。例えば、範囲特定部130は、第1フォルマント周波数が240Hzとして検出された場合には、220Hzに近いから、220Hzが属する音高範囲である第2音高範囲として特定すればよい。
【0054】
[変形例8]
上述した実施形態において、評価部150は、ステップS240において特定音高範囲を、ステップS230において判定したずれの程度に応じた音高範囲として決定したが、別の方法において判定したずれの程度に応じた音高範囲として決定してもよい。評価部150は、例えば、実施形態においては、条件を満たしている1つの構成音について、指定音高の属する音高範囲に対する特定音高範囲のずれの程度を判定していたが、条件を満たしている構成音をさらに前に遡った構成音も含んで複数抽出し、抽出した複数の構成音について、指定音高の属する音高範囲に対する特定音高範囲のずれの程度を判定してもよい。この場合、構成音ごとに対応してずれの程度が複数得られることになるが、評価部150は、複数のずれの程度に基づいて、ステップS230において判定すべきずれの程度を算出すればよい。例えば、複数のずれの程度が「−1」、「−1」、「−1」、「−2」であった場合には、これらの平均をとり整数となるように四捨五入した「−1」としてもよいし、最頻値である「−1」としてもよい。
【0055】
[変形例9]
上述した実施形態においては、出力部170から出力される情報は、歌唱音域を表示部30に表示させるための情報であったが、それ以外の内容を示す情報であってもよい。出力部170から出力される情報は、歌唱者に歌唱音域の評価結果を報知するためのものであればよいから、例えば、評価結果の内容を声で表した音声データであってもよい。また、出力部170から出力される情報は、音響処理部60における音源を用いて発音させるためのMIDI形式のシーケンスデータであってもよい
【0056】
なお、歌唱者に歌唱音域の評価結果を報知するものとしては、発光、香り、動きなどを用いたものであってもよい。この場合には、様々な発光態様で発光するLED(Light Emitting Diode)などを用いた発光装置、様々な香りの成分をもつガスを放出可能な香り放出装置、様々な動作を行うことが可能なロボットなどを外部装置として接続する。そして、その外部装置を時系列に沿って制御するための制御データを出力部170から出力される情報とすればよい。
【0057】
[変形例10]
上述した実施形態における制御プログラムは、磁気記録媒体(磁気テープ、磁気ディスクなど)、光記録媒体(光ディスクなど)、光磁気記録媒体、半導体メモリなどのコンピュータ読み取り可能な記録媒体に記憶した状態で提供し得る。また、カラオケ装置1は、制御プログラムをネットワーク経由でダウンロードしてもよい。
【符号の説明】
【0058】
1…カラオケ装置、10…制御部、20…操作部、30…表示部、40…通信部、50…記憶部、60…音響処理部、61…スピーカ、62…マイクロフォン、100…歌唱音声評価部、110…取得部、120…音高特定部、130…範囲特定部、140…算出部、150…評価部、160…音域特定部、170…出力部

【特許請求の範囲】
【請求項1】
楽曲データの再生中に入力された歌唱音声を取得する取得手段と、
前記取得された歌唱音声の歌唱音高を特定する音高特定手段と、
オクターブ単位で区切られた音高範囲であって前記取得された歌唱音声の音高が属する音高範囲を特定する範囲特定手段と、
前記楽曲データにより指定される歌唱すべき各構成音について、前記楽曲データにより指定される指定音高と前記歌唱音高とを比較して、当該指定音高と当該歌唱音高とが同じ音高範囲に属するようにオクターブ単位で変換した場合における音高の一致度を算出する算出手段と、
前記歌唱すべき構成音の指定音高を当該構成音について前記特定された音高範囲に属するようにオクターブ単位で変換し、当該構成音について算出された一致度に基づいて当該変換した音高に対する歌唱評価を行う評価手段と、
前記歌唱評価の結果に応じた情報を出力する出力手段と
を具備することを特徴とする歌唱音声評価装置。
【請求項2】
前記音高特定手段は、前記取得された歌唱音声から第1検出方法により検出された音高に基づいて前記歌唱音高を特定し、
前記範囲特定手段は、前記第1検出方法とは異なる第2検出方法により検出された音高に基づいて前記音高範囲を特定する
ことを特徴とする請求項1に記載の歌唱音声評価装置。
【請求項3】
前記範囲特定手段は、前記歌唱すべき構成音について前記特定した音高範囲の正確性の指標となる信頼度を算出し、
前記評価手段は、前記構成音について特定した音高範囲の信頼度が予め決められたしきい値未満となった場合には、当該構成音より前の構成音に対応する信頼度が当該しきい値以上となった音高範囲と当該前の構成音の指定音高が属する音高範囲との関係に基づいて決定した音高範囲に属するように、前記指定音高を変換する
ことを特徴とする請求項1または2に記載の歌唱音声評価装置。
【請求項4】
前記歌唱評価の結果に応じて、一定範囲の音高を前記歌唱音声の音域として特定する音域特定手段をさらに具備し、
前記出力手段が出力する情報は、前記特定した音域を示す音域情報である
ことを特徴とする請求項1乃至請求項3のいずれかに記載の歌唱音声評価装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate