説明

音声評価装置

【課題】入力される音声を様々な観点から評価し、評価結果に応じた情報を出力すること。
【解決手段】本発明の実施形態におけるカラオケ装置は、歌唱音声評価に用いる評価項目に対して評価基準が規定された評価情報を参照して、評価期間における歌唱音声について評価項目毎の評価結果を算出する。そして、評価結果を用いた論理式により規定される条件と、その条件を満たす場合に歌唱音声評価の結果として出力すべきコメントの内容とを対応付けた対応情報を参照して、評価項目毎の評価結果から条件を満たすコメントを特定して出力する。条件を満たすコメントが複数ある場合には、過去に特定したコメントの履歴を参照して、1つのコメントを選択して出力するようにしてもよい。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声を評価した結果を出力する技術に関する。
【背景技術】
【0002】
カラオケ装置などにおいては、歌唱者からマイクロフォンに入力された歌唱音声を解析し、歌唱のうまさを採点する技術がある。また、その採点結果に応じたコメントを表示する技術もある(例えば、特許文献1)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2003−173194号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1には、採点結果から予め定められた基準に従ってコメントを選んで表示させることが記載されているが、そのコメントの選択方法については具体的には開示されていない。
本発明は、入力される音声を様々な観点から評価し、評価結果に応じた情報を出力することを目的とする。
【課題を解決するための手段】
【0005】
上述の課題を解決するため、本発明は、音声評価に用いる複数の評価項目の各々に対して、評価結果を算出するための評価基準が規定された評価情報を記憶する評価情報記憶手段と、前記評価結果を用いた論理式により規定される条件と、当該条件を満たした場合に前記音声評価の結果として出力すべき内容を示す出力情報とを対応付けた対応情報を記憶する対応情報記憶手段と、予め決められた評価期間において入力された音声を取得する取得手段と、前記評価情報を参照して、前記取得された音声の前記評価項目に対する評価結果を算出する算出手段と、前記対応情報を参照して、前記算出された前記評価結果に対して、前記評価期間における音声評価の結果として出力すべき出力情報を特定する特定手段と、前記特定された出力情報を出力する出力手段とを具備することを特徴とする音声評価装置を提供する。
【0006】
また、別の好ましい態様において、前記算出手段は、一の評価期間に入力された音声の前記評価結果を算出する場合に、当該一の評価期間より過去の評価期間に入力された音声の前記評価結果に基づいて、前記評価情報に規定された評価基準を変更することを特徴とする。
【0007】
また、別の好ましい態様において、前記評価基準は、前記算出手段が一の評価期間に入力された音声の前記評価結果を算出する場合に、当該一の評価期間より過去の評価期間に入力された音声の評価に対する相対評価になるように決められ、前記算出手段は、前記一の評価期間に入力された音声の前記評価結果を、当該一の評価期間より過去の評価期間に入力された音声の評価に対する相対評価として算出することを特徴とする。
【0008】
また、別の好ましい態様において、前記特定手段は、一の評価期間において出力すべき出力情報が複数となる場合には、当該一の評価期間より過去の評価期間に出力すべき出力情報として特定された履歴に応じて、当該一の評価期間において出力すべき出力情報から一部を選択して特定することを特徴とする。
【発明の効果】
【0009】
本発明によれば、入力される音声を様々な観点から評価し、評価結果に応じた情報を出力することができる。
【図面の簡単な説明】
【0010】
【図1】本発明の実施形態におけるカラオケ装置の構成を説明するブロック図である。
【図2】本発明の実施形態における評価情報の内容を説明する図である。
【図3】本発明の実施形態における対応情報の内容を説明する図である。
【図4】本発明の実施形態における履歴情報の内容を説明する図である。
【図5】本発明の実施形態における歌唱音声評価機能の構成を説明する機能ブロック図である。
【図6】本発明の実施形態における評価値の算出結果を説明する図である。
【図7】本発明の実施形態における評価結果情報の内容を説明する図である。
【図8】本発明の実施形態における特定部の動作を説明するフローチャートである。
【図9】本発明の実施形態における条件判定結果を説明する図である。
【発明を実施するための形態】
【0011】
<実施形態>
[ハードウエア構成]
図1は、本発明の実施形態におけるカラオケ装置1の構成を説明するブロック図である。カラオケ装置1は、本発明の音声評価装置の一例であり、入力された歌唱音声の評価を行う装置である。カラオケ装置1は、歌唱者の歌唱音声が入力され、その歌唱音声の評価を行い、評価結果に応じてコメントを表示する。まず、カラオケ装置1のハードウエア構成について説明する。
【0012】
カラオケ装置1は、制御部10、操作部20、表示部30、通信部40、記憶部50、音響処理部60を有する。これらの各構成は、バスを介して接続されている。また、カラオケ装置1は、音響処理部60に接続されたスピーカ61およびマイクロフォン62を有する。
【0013】
制御部10は、CPU(Central Processing Unit)、RAM(Random Access Memory)、ROM(Read Only Memory)などを有する。制御部10は、ROMまたは記憶部50に記憶された制御プログラムを実行することにより、バスを介してカラオケ装置1の各部を制御する。この例においては、制御部10は、制御プログラムを実行することにより、入力された歌唱音声の評価を行い、評価結果に応じてコメントを表示させるための歌唱音声評価機能を実現する。
【0014】
操作部20は、操作パネルなどに設けられた操作ボタン、リモコンに設けられた操作ボタン、キーボード、マウスなどの操作デバイスであって、歌唱者の操作を受け付けて、その内容を示す操作信号を制御部10に出力する。
表示部30は、液晶ディスプレイなどの表示デバイスであり、制御部10の制御に応じた内容の表示を行う。この表示の内容は、カラオケの楽曲の進行に応じた背景画像、歌詞テロップ、メニュー画面、歌唱音声の評価結果などである。
通信部40は、制御部10の制御に応じて、インターネットなどの通信回線と接続して、サーバ装置などの通信装置と情報のやり取りを行う。制御部10は、通信部40を介して取得した情報を用いて、記憶部50に記憶される情報を更新するようにしてもよい。
【0015】
記憶部50は、ハードディスク、不揮発性メモリなどの記憶手段であり、楽曲データ、歌唱音声データ、評価情報、対応情報、および履歴情報をそれぞれ記憶する記憶領域を有する。
【0016】
楽曲データは、カラオケの歌唱対象となる楽曲に関連するデータが含まれ、例えば、ガイドメロディデータ(以下、GMデータという)、伴奏データ、歌詞データが含まれている。GMデータは、楽曲のボーカルパートのメロディを示すデータであり、例えば、MIDI(Musical Instrument Digital Interface)形式により記述されている。伴奏データは、楽曲の伴奏の内容を示すデータであり、例えば、MIDI形式により記述されている。歌詞データは、楽曲の歌詞の内容を示すデータ、および表示部30に表示させた歌詞テロップを色替えするためのタイミングを示すデータを有する。また、図示していないが、楽曲データには、楽曲のサビ部分の位置、メロディの出だし部分の位置など、楽曲の各構成部分の位置を規定する情報も含まれる。
楽曲データは、歌唱者によって操作部20の操作により指定された楽曲に対応するものが制御部10によって読み出され、カラオケの伴奏音のスピーカ61からの出力、歌詞テロップの表示部30への表示に用いられる。
【0017】
歌唱音声データは、カラオケの対象となった楽曲を歌唱する歌唱者によって、マイクロフォン62から入力された歌唱音声を示すデータであり、例えば、WAVE形式などで記憶される。このようにして記憶される歌唱音声データは、制御部10によって、カラオケの対象となった楽曲を示す楽曲データに対応付けられる。
【0018】
図2は、本発明の実施形態における評価情報の内容を説明する図である。評価情報は、歌唱音声評価に用いる複数の評価項目の各々に対して、評価結果を算出するための評価基準が規定された情報である。例えば、図2に示すように、評価項目としては、大分類として、「音高」、「リズム」などがあり、「音高」の小分類として「サビが悪い」、「サビ以外が悪い」、・・・など、「リズム」の小分類として「良い」、「走り」、・・・などが規定されている。
【0019】
ここで、評価項目に楽曲の構成を示す文字(サビ、出だしなど)が含まれていないもの(「全体良い」など)については、楽曲全体の評価項目である。評価基準は、小分類の各評価項目に対応してきてされている。例えば、評価項目が大分類「音高」の小分類「サビが悪い」については、「サビの音高の一致度が60%未満」であることが評価基準である。すなわち、後述するようにして、歌唱音声から算出されるサビの音高一致度が60%未満であった場合に、その歌唱音声は、「サビが悪い」と評価される。以下、各評価項目について、評価基準を満たしている場合には「True」、満たしていない場合には「False」とする。
【0020】
なお、評価項目としては、図2に示すものは例示であって、他にも様々な項目がある。例えば、評価項目としては、ビブラートの良し悪し、抑揚の有無、こぶしの有無、声質、息遣いなど歌唱音声に関する内容であればどのような内容であっても評価項目とすることができる。
【0021】
図3は、本発明の実施形態における対応情報の内容を説明する図である。対応情報は、評価結果を用いた論理式により規定される条件と、この条件を満たした場合に歌唱音声の評価結果として表示すべき内容を示すコメントとを対応付けた情報である。図3に示すように、対応情報は、この例においては、対応情報(1)および対応情報(2)に分けて記憶されている。対応情報(1)は、上記対応関係におけるコメントをコメントID(図においてはIDと記載)で示している。対応情報(2)は、コメントIDに対応するコメントの内容を示している。
【0022】
対応情報(1)に記載される論理式の規定について説明する。
「and」は「論理積をとるべき対象となる評価項目」であり、論理積をとるべき評価項目が全て「True」となっている場合にその結果が「True」となり、それ以外の場合には「False」となる。
「or」は「論理和をとるべき対象となる評価項目」であり、論理和をとるべき評価項目の少なくとも1つが「True」となっている場合にその結果が「True」となり、それ以外の場合「False」となる。そして、他の「and」に対応する評価項目と論理積をとるべき評価項目とする。
「not」は「否定をとるべき対象となる評価項目」であり、否定をとるべき評価項目が「True」である場合に「False」とし、「False」である場合に「True」とする。そして、他の「and」に対応する評価項目と論理積をとるべき評価項目とする。
なお、論理積を取るべき対象の評価項目が1つであり、他に存在しない場合には、その評価項目の評価結果がそのまま論理式の結果となる。
【0023】
評価結果を用いた論理式により規定される条件とは、以下に示す条件である。例えば、図3に示す対応情報においては、コメントID「1」に対応して、「サビが悪い」and(「全体良い」or「全体最良」)が論理式として規定され、この論理式の結果が「True」となることが条件である。すなわち、歌唱音声は、「全体良い」または「全体最良」と評価され、かつ「サビが悪い」と評価された場合に、コメントID「1」が表示されるべき内容となる条件を満たしていることになる。なお、この条件には、歌唱音声が他の評価項目について評価されているか否かについては、影響を与えない。例えば、コメントID「1」が表示されるべき内容となる条件を満たすかどうかにあたって、歌唱音声が「出だしが良い」と評価されている(「True」)か否(「False」)かは関係がない。
【0024】
図4は、本発明の実施形態における履歴情報の内容を説明する図である。履歴情報は、過去に表示したコメントを表示順に記録した情報である。図4に示すように、履歴No.とコメントIDとが対応付けられている。履歴No.「1」に対応するコメントIDは、前回表示されたコメントに対応するものであり、履歴No.「2」に対応するコメントIDは、さらに1回前に表示されたコメントに対応するものである。このように、履歴No.は、大きくなるほど古い時点を示している。
【0025】
図1に戻って説明を続ける。マイクロフォン62は、歌唱者の歌唱音声が入力され、歌唱音声を示すオーディオ信号を音響処理部60に出力する。スピーカ61は、音響処理部60から出力されるオーディオ信号を放音する。音響処理部60は、DSP(Digital Signal Processor)などの信号処理回路、MIDI形式の信号からオーディオ信号を生成する音源などを有する。音響処理部60は、マイクロフォン62から入力されるオーディオ信号をA/D変換して制御部10に出力する。音響処理部60は、制御部10から楽曲データに基づくMIDI形式の信号が入力され、その信号に基づいてオーディオ信号を生成する。音響処理部60は、このように生成したオーディオ信号、制御部10から出力されたオーディオ信号、マイクロフォン62から入力されたオーディオ信号などを、エフェクト処理、増幅処理などの信号処理を施してからスピーカ61に出力する。
【0026】
ここで、制御部10は、楽曲データを読み出して再生し、その楽曲の伴奏音をスピーカ61から出力させている期間において、音響処理部60から出力されるオーディオ信号を取得し、歌唱音声データを生成し、その楽曲データに対応付けて記憶部50へ記憶する。
以上が、カラオケ装置1のハードウエア構成についての説明である。
【0027】
[歌唱音声評価機能]
次に、カラオケ装置1の制御部10が制御プログラムを実行することによって実現される歌唱音声評価機能について説明する。なお、以下に説明する歌唱音声評価機能を実現する歌唱音声評価部100における各構成の一部または全部については、ハードウエアによって実現してもよい。
【0028】
図5は、本発明の実施形態における歌唱音声評価部100の構成を説明する機能ブロック図である。歌唱音声評価部100は、取得部110、算出部120、特定部130、および出力部140を有する。
取得部110は、記憶部50に記憶された歌唱音声データのうち、予め決められた評価期間の歌唱音声に対応する部分(この例においては、楽曲全体)の歌唱音声データを取得して算出部120に出力する。
【0029】
算出部120は、取得部110から出力された歌唱音声データを取得し、また、その歌唱音声データに対応する楽曲データおよび評価情報を読み出す。算出部120は、取得した歌唱音声データを解析して、楽曲データに含まれる各データと比較して、様々な評価対象に対しての評価値を算出する。評価対象は、評価情報における評価基準に対応したものであり、音高の一致度、発音タイミングのずれなどである。これらの評価対象は、曲全体としてだけでなく、サビの部分、出だしの部分など楽曲の構成毎についても決められている。
【0030】
算出部120は、歌唱音声を解析する手法として、FFT(Fast Fourier Transform)などを用いた周波数分析、音量分析など公知の様々な手法を用い、評価対象について評価値を算出する。
例えば、「音高一致度」については、算出部120は、歌唱音声のピッチの変化と、GMデータが示すガイドメロディのピッチの変化とを比較し、これらの一致の程度を示す評価値を算出する。評価値は、評価期間(曲全体、サビなど)にわたって一定誤差範囲内で双方の音高が一致していれば100%、一致していない部分が曲の半分であれば50%などとすればよい。
【0031】
また、別の例として、「タイミングずれ」については、メロディの各音に対応した歌唱音声の発音タイミングとGMデータが示すガイドメロディの各音の発音タイミングとを比較し、評価期間におけるタイミングのずれ量の平均を算出する。この例においては、歌唱音声が走り気味の場合には+側に、タメ気味の場合には−側の結果となる。ちょうどよいタイミングであれば、±0%となる。このようにして、算出部120は、各評価対象について歌唱音声の評価値を算出する。
【0032】
図6は、本発明の実施形態における評価値の算出結果を説明する図である。図6に示す評価値の算出結果は、ある歌唱音声データを解析して得られた結果の例である。この例において、評価対象「サビの音高一致度」は評価値「88%」になっている。すなわち、この歌唱音声データが示す歌唱音声の音高と、GMデータが示すガイドメロディとが、楽曲のサビ部分の88%において一定誤差範囲内で一致していたことを示している。
【0033】
算出部120は、各評価対象について歌唱音声の評価値を算出すると、評価情報を参照し、算出した各評価対象の評価値および評価情報における評価基準に基づいて、各評価項目についての評価結果を算出する。例えば、評価情報における評価項目「サビが悪い」については、評価基準「サビの音高一致度が60%未満」を満たしていれば「True」、満たしていなければ「False」となる。そして、算出部120は、算出した評価結果に基づいて評価結果情報を生成して特定部130に出力する。
【0034】
図7は、本発明の実施形態における評価結果情報の内容を説明する図である。図7に示す評価結果情報は、図6に示す評価値の算出結果の例と図2に示す評価情報の例とに基づいて、算出部120が算出した評価結果を示している。なお、評価結果における「T」は「True」を示し、「F」は「False」を示す。
図7に示すように、例えば、評価項目「サビが悪い」については、図6に示す評価値が図2に示す評価基準を満たしていない(評価対象「サビの音高一致度」の評価値が「88%」であり、評価基準に規定された「60%未満」を満たしていない)ことから、評価結果が「False」となる。
【0035】
図5に戻って説明を続ける。特定部130は、評価結果情報を取得すると、対応情報を参照して、評価結果情報に基づいてコメントIDを特定する特定処理を行う。特定部130は、具体的には、図8に示すようにコメントIDを特定する。
【0036】
図8は、本発明の実施形態における特定部130の動作を説明するフローチャートである。特定部130は、算出部120から評価結果情報を取得すると、記憶部50から対応情報を取得する(ステップS100)。そして、特定部130は、対応情報を参照して、コメントID毎に評価結果情報の評価結果を論理式に適用して、特定の条件(結果が「True」)を満たすか否かを判定する(ステップS110)。図3に示す対応情報の例と、図7に示す評価結果情報の例とを用いて説明する。まず、特定部130は、コメントID「1」に対応する論理式(「サビが悪い」and(「全体良い」or「全体最良」))に、評価結果情報の評価結果を適用する。この場合、「False」and(「False」or「False」)=「False」であるから、特定部130は、コメントID「1」については条件を満たさないと判定する。
【0037】
図9は、本発明の実施形態における条件判定結果を説明する図である。図9は、上述のように、図3に示す対応情報の例と、図7に示す評価結果情報の例とを用いた例とにおいて、各コメントIDについて条件の判定を行った場合を示している。図9において、特定部130が条件を満たすと判定したコメントIDは条件判定「OK」であり、条件を満たさないと判定したコメントIDは条件判定「NG」としている。この例においては、コメントID「2」および「4」が、条件を満たしている。
【0038】
図8に戻って説明を続ける。特定部130は、このようにして、各コメントIDについて条件を満たすか否かを判定すると、条件を満たすと判定したコメントIDが複数であるか否かの判定を行う(ステップS120)。特定部130は、1つのコメントIDについてのみ条件を満たすと判定した場合(ステップS120;No)には、このコメントIDを特定する(ステップS150)。
一方、特定部130は、上述の図9に示す例のように、複数のコメントIDについて条件を満たすと判定した場合(ステップS120;Yes)には、記憶部50から履歴情報を取得する(ステップS130)。
【0039】
特定部130は、履歴情報を参照して、条件を満たす複数のコメントIDから、過去に特定したコメントIDと異なる1つのコメントIDを選択する(ステップS140)。特定部130は、条件を満たす全てのコメントIDについて過去に特定した履歴があった場合には、特定した回数(頻度)が最も少ないコメントIDを選択する。上述の図9に示す例および図4に示す履歴情報の例においては、特定部130は、過去にコメントID「2」が特定されているから、コメントID「2」、「4」のうち、コメントID「4」を選択する。
【0040】
なお、特定部130は、履歴情報を参照して過去に特定したコメントIDに基づいて、今回特定すべきコメントIDを選択すればよいため、他のアルゴリズムによりコメントIDを選択してもよい。例えば、特定部130におけるコメントIDの選択対象は、直前に特定されたコメントIDのみが除外されるようにしてもよいし、より近い過去に特定されたコメントIDほど優先的に除外されるようにしてもよい。
【0041】
特定部130は、複数のコメントIDから1つのコメントIDを選択すると、そのコメントIDを特定(ステップS150)して、特定処理を終了する。特定部130は、特定したコメントIDに対応するコメントの内容、図3に示す例においては「イントロからメロディをイメージしておきましょう。」またはコメントIDを示す情報を出力部140に出力する。
そして、特定部130は、特定したコメントIDを履歴No.「1」に対応させて履歴情報に記録する。このとき、特定部130は、すでに履歴情報に記録されているコメントIDについては、履歴No.を1ずつ加算する。
【0042】
図5に戻って説明を続ける。出力部140は、特定部130から出力された情報を取得し、出力情報として表示部30に出力して、特定した内容のコメントを表示部30に表示させる。なお、出力部140は、特定部130から取得した情報がコメントIDにより示されている場合には、対応情報を参照してコメントの内容を取得すればよい。以上が、歌唱音声評価機能の説明である。
【0043】
このように、本発明の実施形態におけるカラオケ装置1は、歌唱音声を様々な評価項目において評価して、これらの評価結果を用いた論理式が特定の条件を満たすか否かにより、表示すべきコメントを特定する。そのため、カラオケ装置1は、歌唱音声を様々な観点から評価した結果に応じて、コメントを出力することができる。また、カラオケ装置1は、複数のコメントが表示部30に表示される候補となった場合には、過去の履歴を参照することにより、同じコメントが連続して表示されないようにすることもできる。
【0044】
<変形例>
以上、本発明の実施形態について説明したが、本発明は以下のように、さまざまな態様で実施可能である。
[変形例1]
上述した実施形態においては、カラオケ装置1は、楽曲が終了した後、楽曲全体を1つの評価期間として、評価結果に応じたコメントを表示させていたが、1つの楽曲を複数の評価期間に分割して評価結果に応じたコメントを表示させてもよい。例えば、複数の評価期間とは、楽曲の構成単位、例えば、歌詞の1番に相当する期間と2番に相当する期間であってもよいし、一定時間単位で区切られた期間であってもよい。
【0045】
この場合には、取得部110は、楽曲データを参照したり、計時したりして複数の評価期間を認識し、各評価期間に対応する歌唱音声データを取得して算出部120に出力する。算出部120は、この歌唱音声データに基づいて評価結果を算出し、評価結果情報を出力すればよい。このように、算出部120は、予め決められた期間に対応する歌唱音声データに基づいて、評価結果を算出すればよい。そして、出力部140は、各評価区間が終了する度に、表示部30にコメントを表示させてもよいし、楽曲終了後に各評価区間に対応したコメントをまとめて表示させてもよい。
【0046】
[変形例2]
上述した実施形態においては、評価情報に規定されている評価基準は、その内容が変更されることはなかったが、変更されるようにしてもよい。この場合には、算出部120は、新たに歌唱音声について評価結果の算出を行う前に、評価基準を変更し、変更した評価基準に基づいて評価結果情報を出力すればよい。以下、評価基準の変更の態様について、複数の例を示して説明する。
【0047】
第1の態様としては、算出部120は、予め決められたアルゴリズムに従って評価基準を変更して、評価情報を更新する。予め決められたアルゴリズムとは、例えば、評価項目「サビが悪い」に対する評価基準「サビの音高一致度が60%未満」となっている評価値に関数する部分を一定の範囲(例えば60±5%)において、予め決められた規則に従って、または、ランダムに選択した変動量で変更させるものとすればよい。また、変形例1に示すように、複数の評価期間に分割されている場合には、このアルゴリズムは、楽曲の前半から後半に向けて、評価基準を厳しく(上記60%を増加)したり、甘く(上記60%を低減)したりするように変更させるものであってもよい。
【0048】
第2の態様としては、算出部120は、過去の評価期間において入力された歌唱音声の評価結果に応じて評価基準を変更する。例えば、算出部120は、前回の評価期間において入力された歌唱音声の評価結果において、評価項目「サビが悪い」について「False」とした評価結果であった場合、これに対する評価基準「サビの音高一致度が60%未満」となっている評価値に関する部分を増加させて、「サビの音高一致度が65%未満」などとして評価をより厳しくすればよい。
【0049】
また、算出部120は、評価結果ではなく、評価値に応じて評価基準を変更してもよい。例えば、ある評価対象を評価基準に用いているものについて、変更前の評価基準についての評価値に関する部分と、前回の評価期間に入力された歌唱音声における評価対象の評価値との平均値(重み付け、特定の演算などを行ってもよい)を、新たな評価基準についての評価値としてもよい。また、前回の評価期間に入力された歌唱音声から得られた評価値そのものを新たな評価基準についての評価値としてもよい。平均値を用いる場合の例として、例えば、過去の評価期間に入力された歌唱音声から得られた評価値が、図6に示すように評価対象「サビの音高一致度」が評価値「88%」である場合には、評価項目「サビが悪い」に対する評価基準「サビの音高一致度が60%未満」となっている評価値に関数する部分(60%)を74%(=(88%+60%)/2)とすればよい。
【0050】
なお、算出部120は、前回算出した評価結果、評価値に限らず、過去の評価期間において入力された歌唱音声から算出したものを用いればよく、過去の複数の評価期間において入力された歌唱音声から算出された評価結果、評価値を用いて、平均値を取るなどの演算を行って、評価基準の変更に用いてもよい。また、これらの制御は、過去の同じ楽曲に対応して入力された歌唱音声であるものについてのみを対象として行ってもよい。
【0051】
ここで、変形例1に示すように、1つの楽曲が複数の評価期間に分割されている場合には、楽曲の構成における対応する部分の評価期間に入力された歌唱音声の評価値のみを過去の評価期間において入力された歌唱音声の評価値として扱ってもよい。例えば、算出部120は、1つの楽曲が前半部分と後半部分とに評価期間が分割されていた場合、次の楽曲の前半部分における評価基準は、過去の楽曲の前半部分における評価結果、評価値に基づいて変更すればよい。
【0052】
さらに、1つの楽曲が複数の評価期間に分割され、さらに、同一楽曲内の過去の評価期間に入力された歌唱音声の評価結果に応じて評価基準が変更される場合には、楽曲が終了したときの評価基準がどのような内容に変更されているかにより、その楽曲における歌唱音声の総合的な評価結果として用いることもできる。例えば、過去の評価期間に入力された歌唱音声が高い評価値であれば、評価基準は徐々に厳しくなっていくため、どの程度厳しくなっているかによって、楽曲全体の歌唱音声の評価結果とすることもできる。
【0053】
また、個々の歌唱者を識別するIDカードなどを読み取ったり、歌唱者が自らを識別する情報を、操作部20を介してカラオケ装置1に入力したりすることにより、カラオケ装置1が個々の歌唱者を判定できるものとすれば、上記の評価基準を変更する制御は、同一歌唱者による歌唱音声が入力された評価期間についてのみ対象としてもよい。
このように、評価基準が過去の評価結果などに応じて変更されることにより、歌唱者の歌唱の実力に応じて、評価の厳しさを変えることができる。
【0054】
[変形例3]
上述した実施形態においては、算出部120は、評価すべき歌唱音声データについて絶対的な評価値の算出をしていたが、過去の歌唱音声(変形例1に示すように評価期間単位であってもよい)の評価値に対する相対的な評価値として算出してもよい。この場合には、算出部120は、過去に算出した各評価対象についての評価値を、評価値履歴として、記憶部50に記憶しておく。そして、算出部120は、新たに評価すべき歌唱音声データについて各評価対象について評価値を算出し、さらに、評価値履歴を参照して、過去の評価値に対する相対結果も算出する。なお、過去の評価値とは、直前の評価期間に入力された歌唱音声の評価値であってもよいし、さらに複数回前の評価期間に入力された歌唱音声の評価値を含んだものであってもよい。複数回にわたった評価期間に入力された歌唱音声の評価値を用いる場合には、平均値など特定の演算を施して得られる評価値を基準とすればよい。
【0055】
記憶部50に記憶される評価情報の評価基準については、相対基準となるように規定される。例えば、実施形態における評価項目「サビが悪い」については「サビが悪くなっている」とし、評価基準「サビの音高一致度が60%未満」については「サビの音高一致度が5%以上減少」などとする。同様に記憶部50に記憶されている対応情報のコメントについても、相対評価に対応する内容にすればよい。
このように、過去の歌唱音声の評価に対して相対的な評価となるように決められていることにより、歌唱者による歌唱の実力の変動などについて評価することができる。
【0056】
なお、変形例1に示すように、1つの楽曲が複数の評価期間に分割されている場合には、変形例2においても説明したように、楽曲の構成における対応する部分の評価期間に入力された歌唱音声の評価値のみを過去の評価期間において入力された歌唱音声の評価値として扱って、相対評価をしてもよい。
また、個々の歌唱者を識別するIDカードなどを読み取ったり、歌唱者が自らを識別する情報を、操作部20を介してカラオケ装置1に入力したりすることにより、カラオケ装置1が個々の歌唱者を判定できるものとすれば、上記の相対評価の対象となる評価値は、過去に入力された同一歌唱者による歌唱音声の評価値を対象とすればよい。
【0057】
[変形例4]
上述した実施形態において、評価情報または対応情報は、楽曲に応じて異なるものであってもよい。この場合には、記憶部50に記憶されている評価情報または対応情報は、楽曲データに対応付けられる。また、評価情報または対応情報は、楽曲ジャンルに応じて異なるものであってもよいし、楽曲の構成の特徴(出だしが短いなど)に応じて異なるものであってもよい。また、対応情報におけるコメントの内容が、楽曲、楽曲ジャンル、または楽曲の構成の特徴に応じて異なるものであってもよい。
【0058】
[変形例5]
上述した実施形態において、特定部130は、複数のコメントIDが論理式の条件を満たす場合には、いずれか1つのコメントID選択して特定するようになっていたが、全部または一部である複数のコメントIDを選択して特定してもよい。その場合には、表示部30には、特定された複数のコメントが表示されることになる。
【0059】
[変形例6]
上述した実施形態においては、特定部130は、履歴情報を参照して複数のコメントIDから1つのコメントIDを選択していたが、別の方法によりコメントIDを選択してもよい。別の方法とは、例えば、ランダムに選択する方法であってもよい。また、さらに別の方法として、評価値と評価基準との差が大きかった評価項目が含まれる論理式に対応するコメントIDが優先して選択される方法であってもよい。この場合について、以下、実施形態において説明した具体例を用いて説明する。
【0060】
実施形態における例においては、特定部130においてコメントID「2」または「4」のいずれかが選択される。このとき、コメントID「2」に対応する論理式に含まれる評価項目「サビ以外が悪い」の評価基準「サビ以外の音高一致度が60%未満」と評価対象「サビ以外の音高一致度」の評価値「58%」とにおいて、評価値に関しての差は2%である。一方、コメントID「4」に含まれる評価項目「出だしが悪い」の評価基準「出だしの音高一致度が60%未満」と評価対象「出だしの音高一致度」の評価値「55%」とにおいて、評価値に関しての差は5%である。このような場合、特定部130は、他の評価項目よりも差が大きい評価項目「出だしが悪い」が論理式に含まれるコメントID「4」を選択して特定する。
【0061】
[変形例7]
上述した実施形態においては、対応情報における各コメントIDに対応するコメントは1つであったが、複数であってもよい。例えば、コメントID「1」に複数のコメントがある場合には、コメントID「1−1」、「1−2」、・・・といったようにして規定されるようにすればよい。そして、特定部130は、これらの複数コメントIDを含めて選択対象とし、1つのコメントIDを選択するようにすればよい。
【0062】
[変形例8]
上述した実施形態においては、出力情報としては、表示部30に出力するコメントの内容を示すものであったが、それ以外の内容を示す情報であってもよい。出力情報は、歌唱者に歌唱音声の評価結果を報知するためのものであればよいから、例えば、コメントの内容を声で表した音声データであってもよい。また、出力情報は、音響処理部60における音源を用いて発音させるためのMIDI形式のシーケンスデータであってもよい
【0063】
なお、歌唱者に歌唱音声の評価結果を報知するものとしては、発光、香り、動きなどを用いたものであってもよい。この場合には、様々な発光態様で発光するLED(Light Emitting Diode)などを用いた発光装置、様々な香りの成分をもつガスを放出可能な香り放出装置、様々な動作を行うことが可能なロボットなどを外部装置として接続する。そして、その外部装置を時系列に沿って制御するための制御データを出力情報として出力すればよい。
このように、コメント以外の出力情報を用いる場合には、対応情報においてコメントの内容に代えて、制御データなどの内容を規定するようにすればよい。
【0064】
[変形例9]
上述した実施形態においては、本発明の音声評価装置としてカラオケ装置1を例に説明したが、音響処理部60、スピーカ61およびマイクロフォン62を具備しないなどのカラオケの機能を有しないコンピュータ装置、サーバ装置などの他の装置であってもよい。この場合、取得部110は、音響処理部60から入力される歌唱音声に基づいて記憶部50に記憶された歌唱音声データを取得するのではなく、評価すべき歌唱音声を示す歌唱音声データとして、外部装置などから記憶部50に記憶されたものを取得すればよい。また、取得部110は、外部装置から直接、歌唱音声データを取得してもよい。
また、取得部110は、歌唱音声を示す歌唱音声データに限らず、音声を示すデータであれば、どのようなデータであってもよい。すなわち、本発明の音声評価装置は、歌唱音声以外の音声(朗読など)についても評価することができる。
【0065】
[変形例10]
上述した実施形態における制御プログラムは、磁気記録媒体(磁気テープ、磁気ディスクなど)、光記録媒体(光ディスクなど)、光磁気記録媒体、半導体メモリなどのコンピュータ読み取り可能な記録媒体に記憶した状態で提供し得る。また、カラオケ装置1は、制御プログラムをネットワーク経由でダウンロードしてもよい。
【符号の説明】
【0066】
1…カラオケ装置、10…制御部、20…操作部、30…表示部、40…通信部、50…記憶部、60…音響処理部、61…スピーカ、62…マイクロフォン、100…歌唱音声評価部、110…取得部、120…算出部、130…特定部、140…出力部

【特許請求の範囲】
【請求項1】
音声評価に用いる複数の評価項目の各々に対して、評価結果を算出するための評価基準が規定された評価情報を記憶する評価情報記憶手段と、
前記評価結果を用いた論理式により規定される条件と、当該条件を満たした場合に前記音声評価の結果として出力すべき内容を示す出力情報とを対応付けた対応情報を記憶する対応情報記憶手段と、
予め決められた評価期間において入力された音声を取得する取得手段と、
前記評価情報を参照して、前記取得された音声の前記評価項目に対する評価結果を算出する算出手段と、
前記対応情報を参照して、前記算出された前記評価結果に対して、前記評価期間における音声評価の結果として出力すべき出力情報を特定する特定手段と、
前記特定された出力情報を出力する出力手段と
を具備することを特徴とする音声評価装置。
【請求項2】
前記算出手段は、一の評価期間に入力された音声の前記評価結果を算出する場合に、当該一の評価期間より過去の評価期間に入力された音声の前記評価結果に基づいて、前記評価情報に規定された評価基準を変更する
ことを特徴とする請求項1に記載の音声評価装置。
【請求項3】
前記評価基準は、前記算出手段が一の評価期間に入力された音声の前記評価結果を算出する場合に、当該一の評価期間より過去の評価期間に入力された音声の評価に対する相対評価になるように決められ、
前記算出手段は、前記一の評価期間に入力された音声の前記評価結果を、当該一の評価期間より過去の評価期間に入力された音声の評価に対する相対評価として算出する
ことを特徴とする請求項1に記載の音声評価装置。
【請求項4】
前記特定手段は、一の評価期間において出力すべき出力情報が複数となる場合には、当該一の評価期間より過去の評価期間に出力すべき出力情報として特定された履歴に応じて、当該一の評価期間において出力すべき出力情報から一部を選択して特定する
ことを特徴とする請求項1乃至請求項3のいずれかに記載の音声評価装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2012−58278(P2012−58278A)
【公開日】平成24年3月22日(2012.3.22)
【国際特許分類】
【出願番号】特願2010−198324(P2010−198324)
【出願日】平成22年9月3日(2010.9.3)
【出願人】(000004075)ヤマハ株式会社 (5,930)
【Fターム(参考)】