説明

評価装置

【課題】歌唱されるべき基準に対して歌唱者が歌唱した音声が沿っている程度に反応するキャラクターを表示すること。
【解決手段】カラオケ装置においては、歌唱音声の評価結果に応じて様々な表情をするキャラクターDが表示される。例えば、評価期間X1における歌唱音声が「普通」と評価された結果、「普通」という感情を表した表情のキャラクターD1が表示される。また、評価期間X2における歌唱音声が「悪い」と評価された結果、「悪い」という感情を表した表情のキャラクターD2が表示される。また、評価期間X3における歌唱音声が「良い」と評価された結果、「良い」という感情を表した表情のキャラクターD3が表示される。カラオケ装置においては、このように、歌唱者の歌唱音声が歌唱されるべき基準に沿っている程度に反応するキャラクターが表示される。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、歌唱した音声を評価する際にキャラクターを表示する技術に関する。
【背景技術】
【0002】
従来より、カラオケなどで歌唱している歌唱者が上手に歌えるように補助する際、キャラクターを表示させる技術がある。特許文献1には、合成された歌声(いわゆるガイドボーカル)を出力することによって上記の補助をする場合に、その歌声の音韻、音高及び発音タイミング等に合わせた口の形状又は表情のキャラクターを表示させる技術が記載されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2001−42879号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1に記載された技術においては、1つの楽曲の中で様々な表情が表示される一方、同じ楽曲であれば表示される表情のパターン及びそれらが表示されるタイミングが決まっている。つまり、歌唱者がどのように歌っても、その内容に対する反応がないため、表示されたキャラクターと一緒に歌っているような臨場感を歌唱者に与えることが難しい。同じ理由で、歌唱者は、上記ガイドボーカル、すなわち、歌唱されるべき基準となる歌声に対して、自分が同じように歌唱しているのかどうかが分からず、楽曲の残り部分を今の調子で歌い続けるべきか、上記ガイドボーカルをもっと参考にすべきか、という判断をすることが難しい。
本発明は、このような事情に鑑みてなされたもので、その目的の1つは、歌唱されるべき基準に対して歌唱者が歌唱した音声が沿っている程度に反応するキャラクターを表示することである。
【課題を解決するための手段】
【0005】
上述の課題を解決するため、本発明は、再生されると楽曲の歌唱すべき位置を表す位置表示データと、歌唱音声を評価する基準を示すリファレンスデータとを記憶する記憶手段と、前記記憶手段から前記位置表示データを読み出して再生する再生手段と、前記再生手段が前記位置表示データを再生しているときに収音手段から供給されたオーディオ信号が表す歌唱音声と、前記記憶手段から読み出した前記リファレンスデータが示す基準とを比較して当該歌唱音声を評価する評価手段と、前記再生手段が前記位置表示データを再生している間、キャラクターの画像を示す第1画像データを出力し、前記評価手段により前記歌唱音声が評価された場合、前記キャラクターの表情を当該歌唱音声が評価された結果に応じた表情で表した画像を示す第2画像データを出力する出力手段と、を備えることを特徴とする評価装置を提供する。
【0006】
また、別の好ましい態様において、前記出力手段は、前記位置表示データに応じた表情の前記キャラクターの画像を示す第1画像データを出力することを特徴とする。
【0007】
また、別の好ましい態様において、前記リファレンスデータは、前記楽曲における複数の期間のそれぞれと対応付けられた前記基準を示し、前記記憶手段から読み出した前記リファレンスデータが示す複数の前記基準に対応づけられた前記期間から、前記評価手段により評価された歌唱音声が比較された基準と特徴が共通する基準に対応づけられた前記期間を特定する特定手段を備え、前記出力手段は、前記特定手段により特定された期間を伝えるための表情をする前記キャラクターの画像を示す前記第2画像データを、当該期間の開始よりも前に出力することを特徴とする。
【0008】
また、別の好ましい態様において、前記歌唱者の位置を検知する検知手段と、予め定められた領域から見た場合に立体的に見える画像を表示する面を有する表示手段を制御して、前記検知手段が検知した位置が前記領域に入るように前記面の向きを調整し、当該面に前記出力手段が出力する第2画像データが示す前記キャラクターの画像を立体的に表示させる表示制御手段とを備えることを特徴とする。
【0009】
また、別の好ましい態様において、歌唱者の画像を撮影する撮影手段を備え、前記出力手段は、前記撮影手段が撮影した画像と前記キャラクターを表現した画像とを合成して出力することを特徴とする。
【発明の効果】
【0010】
本発明によれば、歌唱されるべき基準に対して歌唱者が歌唱した音声が沿っている程度に反応するキャラクターを表示することが可能になる。
【図面の簡単な説明】
【0011】
【図1】実施形態に係るカラオケ装置の全体構成を示すブロック図である。
【図2】カラオケ装置の制御部の機能的構成を示すブロック図である。
【図3】ディスプレイに表示される画像の一例を示す図である。
【図4】ディスプレイに表示される画像の一例を示す図である。
【図5】ディスプレイに表示される画像の一例を示す図である。
【図6】変形例に係るカラオケ装置の構成を示す図である。
【図7】ディスプレイの方向を調整する様子を説明するための図である。
【発明を実施するための形態】
【0012】
[実施形態]
以下、本発明の実施形態について図面を参照して説明する。
図1は、カラオケ装置1の全体構成を示すブロック図である。カラオケ装置1は、例えばカラオケ店などに設置され、いわゆるカラオケの機能を利用者に提供すると共に、利用者(歌唱者)が歌唱する音声(歌唱音声)を評価する装置であり、本発明に係る「評価装置」の一例に相当する。カラオケ装置1は、制御部10と、操作部21と、音響処理部22と、収音部23と、放音部24と、立体画像表示部25と、記憶部30とを備えている。
制御部10は、CPU(Central Processing Unit)とメモリとを備えている。CPUは、メモリに記憶されているプログラムを実行することにより、カラオケ装置1の各部を制御する。メモリは、ROM(Read Only Memory)とRAM(Random Access Memory)とを備えており、CPUによって用いられるプログラムやデータを記憶する。
操作部21は、複数の操作ボタンを備えており、利用者が操作した内容を示す操作データを制御部10に供給する。
収音部23は、マイクロホン等の収音手段であり、歌唱者が発した歌唱音声が入力され、歌唱音声を示すオーディオ信号を音響処理部22に出力する。
放音部24は、スピーカ等の放音手段であり、音響処理部22から出力されるオーディオ信号を放音する。
音響処理部22は、DSP(Digital Signal Processor)などの信号処理回路、MIDI(Musical Instrument Digital Interface)形式の信号からオーディオ信号を生成する音源などを有する。音響処理部22は、収音部23から入力されるオーディオ信号をA/D変換して制御部10に出力する。音響処理部22は、制御部10からMIDI形式のデータが入力され、そのデータに基づいてオーディオ信号を生成する。音響処理部22は、このように生成したオーディオ信号、制御部10から出力されたオーディオ信号、収音部23から入力されたオーディオ信号などを、エフェクト処理、増幅処理などの信号処理を施してから放音部24に出力する。
立体画像表示部25は、立体画像に対応したディスプレイを備えており、制御部10から供給される立体画像を示す画像データに応じた立体画像を表示する。
【0013】
記憶部30は、ハードディスクを備えており、楽曲データベース310とキャラクターデータベース320とを記憶している。
楽曲データベース310には、カラオケで再生される楽曲に関するデータが記録されており、詳細には、伴奏データ311とリファレンスデータ312と歌詞データ313とが記録されている。伴奏データ311は、楽曲の伴奏の内容を示すデータであり、例えば、MIDI形式により記述されている。リファレンスデータ312は、歌唱すべき基準を示すデータであり、詳細には、歌唱すべき各構成音の音高を示している。これらの基準、すなわち、構成音の音高は、伴奏データ311が示す伴奏において各構成音が歌唱されるべき期間と対応付けられており、この期間に収音部23に入力された歌唱音声を評価するために用いられる。以下においては、この期間を「評価期間」という。評価期間の開始と終了とは、伴奏データ311が開始されてから経過する時間で表される。リファレンスデータ312は、例えば、各構成音の音高と音の長さ(評価期間に相当)とをMIDI形式により記述されている。歌詞データ313は、楽曲の歌詞の内容を示すデータ、および立体画像表示部25に表示させた歌詞テロップを色替えするためのタイミングを示すデータを有する。
【0014】
キャラクターデータベース320には、歌唱中に立体画像表示部25に表示される画像に関するデータが記録されており、詳細には、キャラクター画像データ321が記録されている。キャラクター画像データ321は、様々なキャラクターの様々な表情の画像を示すデータ(画像データ)である。ここでいうキャラクターは、例えば、絵で表された人、動物又は擬人化された物(ロボットなど)等であり、インターネットのコミュニティサイトで用いられるキャラクター(いわゆるアバター)も含まれる。なお、この絵には、実在の人、動物又は物の写真が用いられても良い。ここにおいて、キャラクターの表情とは、キャラクターの感情又は伝えたい情報等を顔つきや身振りで表したものをいい、例えば、笑っている表情、怒っている表情、悲しげに歩いている動作、うれしそうに跳び上がっている動作、テンポに合わせて手を振る又はあるタイミングを目配せして示す動作等である。
【0015】
次に、このようなハードウェア構成において、制御部10が機能プログラムを実行したときに構築される機能ブロックについて、図2を参照して説明する。
図2は、制御部10の機能的構成を示すブロック図である。制御部10は、再生部111と、評価部112と、特定部113と、画像生成部114と、表示制御部115とを有する。
再生部111は、操作部21から楽曲の再生を指示する操作データが供給されると、図1に示したその楽曲の伴奏データ311及び歌詞データ313を再生する。詳細には、再生部111は、楽曲データベース310からその楽曲の伴奏データ311と歌詞データ313とを読み出す。そして、再生部111は、伴奏データ311を音響処理部22に供給し、伴奏音を放音させ、また、歌詞データ313を表示制御部115に供給し、歌詞を表示させる。このとき、再生部111は、伴奏音の放音と歌詞の表示とが同じタイミングで開始されるようにこれらのデータを供給する。再生部111は、伴奏データ311を再生している間、その伴奏データ311の再生が開始されてから経過した時間(経過時間)を示すデータを、数msec毎に評価部112、画像生成部114及び表示制御部115に供給する。
【0016】
評価部112は、歌唱者の歌唱音声を、リファレンスデータ312が示す基準と比較して評価する手段であり、詳細には、以下のとおり動作する。評価部112は、再生部111から上記経過時間を示すデータが供給されている状態(つまり、伴奏データ311が再生されている状態)において、音響処理部22を介して図1に示した収音部23からオーディオ信号が供給されることで動作する。まず、評価部112は、操作部21から供給された操作データが示す楽曲のリファレンスデータ312を楽曲データベース310から読み出す。次に、評価部112は、再生部111から上記経過時間を示すデータが供給された時刻に供給されたオーディオ信号が表す歌唱音声の音高と、リファレンスデータ312が示す基準(構成音の音高)のうちこの経過時間を含む評価期間に対応付けられたものとを比較し、その差の値を例えばセント値で算出する。評価部112は、この差の値を、経過時間を示すデータが再生部111から供給される度(数msec毎)に算出する。そして、評価部112は、評価期間に算出された差の値を合計したものを評価値として算出し、その値が第1閾値よりも大きい場合に、評価点の基礎となる点数から減じる(減点する)。評価部112は、伴奏データ311の再生が終了するまで評価値の算出を行い、その結果の点数を最終的な評価点として算出する。このように、評価点は、評価値の値が大きいほど、すなわち、音高が基準から離れるほど、また、減点される評価期間が多いほど、すなわち、音高が基準から離れる回数が多いほど、低くなる。なお、第1閾値は、歌唱音声と構成音の音声との音高のずれを許容する程度を示す値であり、例えば、歌唱を厳しく評価する場合に小さくし、優しく評価する場合に大きくすれば良い。
【0017】
また、評価部112は、評価値が第1閾値以下の歌唱音声を「良い」と評価し、第1閾値より大きく第2閾値以下の歌唱音声を「普通」と評価し、第2閾値より大きい歌唱音声を「悪い」と評価する。この第2閾値は、減点が大きく評価が悪かったところ、すなわち、歌唱者が“苦手なところ”を判定するための値である。第2閾値も、第1閾値同様、歌唱を厳しく評価する場合に小さくし、優しく評価する場合に大きくすれば良い。評価部112は、画像生成部114に対して、評価期間が終了する度にこれらの評価結果(「良い」、「普通」、「悪い」)を示すデータを供給し、最後の基準に対する評価値を算出したときにこの評価値まで含めて算出した評価点を供給する。また、評価部112は、評価結果が「悪い」である場合は、この評価において比較された基準を示すデータと共に特定部113に供給する。
【0018】
特定部113は、リファレンスデータ312により示される基準に対応づけられた期間のうち、評価部112により供給されたデータが示す基準と音高が共通する基準に対応づけられた期間を特定し、特定した期間を示すデータ(例えば、評価期間が開始する時間及び終了する時間を示すデータ)を画像生成部114に供給する。
画像生成部114は、操作部21から楽曲を示す操作データが供給されると、その楽曲の伴奏データに応じたキャラクターの画像データをキャラクターデータベース320から読み出す。そして、画像生成部114は、読み出した画像を編集又は合成等した画像データを生成して表示制御部115に供給する。この読み出した画像データは、例えば、サビでは盛り上がりを表す表情となり、ビブラートさせたいところではビブラートする歌い方を喚起する表情となるキャラクターの画像を示す画像データである。これらの画像は、伴奏データの再生中に表情が変化するが、その変化の仕方は一定であり、伴奏データが同じであれば、毎回同じように表情が変化する。このキャラクターの画像を示す画像データは、本発明に係る「第1画像データ」の一例に相当する。画像生成部114は、評価部112及び特定部113からデータが供給されない間は、上記のとおり動作する。
【0019】
一方、画像生成部114は、評価部112から評価結果を示すデータが供給された場合、この評価結果に応じた表情のキャラクターを表す画像の画像データをキャラクターデータベース320から読み出す。また、画像生成部114は、特定部113から評価期間を示すデータが供給された場合、この評価期間に応じた表情のキャラクターを表す図1に示したキャラクター画像データ321をキャラクターデータベース320から読み出す。そして、それぞれの場合において、画像生成部114は、これらのキャラクターの画像を編集又は合成等した画像データを生成して表示制御部115に供給する。これらの場合に生成される画像データは、いずれの場合も、評価部112により歌唱が評価された結果に応じた表情のキャラクターの画像を示すものであり、本発明に係る「第2画像データ」の一例に相当する。これらの場合、画像生成部114は、生成した画像データを、上述した伴奏データに応じたキャラクターの画像データに代えて表示制御部115に供給する。表示制御部115は、立体画像表示部25の動作を制御して、画像生成部114から供給された画像データが表す画像を、再生部111から供給されるデータが示す経過時間に合わせて上述したディスプレイに表示させる。
【0020】
以上の各部の動作により表示される画像について、図3、図4、図5を参照して詳細に説明する。これらの各図は、カラオケ装置1においてディスプレイに表示される画像の一例を示す図である。また、図3、図4では、時間が経過したときにそれぞれディスプレイに表示される画像を(a)、(b)、(c)の順番に示している。
図3は、歌唱を評価した結果に応じたキャラクターが表示されている画像の一例を示す図である。これらの画像には、歌詞Aと、基準画像Bと、歌唱結果線C(C1、C2、C3)と、キャラクターD(D1、D2、D3)とが表示されている。歌詞Aは、図1に示した歌詞データ313が示す歌詞が表示されている。
歌詞Aは、図1に示した伴奏データ311が再生されている部分に対応する部分が白抜きの文字から黒い文字に画像が変化することで、現在歌唱者が歌唱するべき位置が分かるように表示されている。
基準画像Bは、上述した歌唱音声の基準を示す画像であり、詳細には、各構成音の音高とその評価期間を表す棒状の画像である。基準画像Bは、五線譜に重ねて表示されており、この五線譜は、各線に沿った矢印R1が示す方向に時刻が規定されている。基準画像Bは、この五線譜のどこに表示されているかによって音高を表し、矢印R1に沿った方向の長さによって評価時間を表す。基準画像Bは、図1に示したリファレンスデータ312が示す音高とこれに対応付けられた評価期間とに基づき表示される。
【0021】
歌唱結果線Cは、歌唱音声の音高の軌跡を示す線が、基準画像Bと共に表示された五線譜に重ねて示されたものであり、以下の図において、二点鎖線で示されている。詳細には、歌唱結果線Cは、図1に示した収音部23から出力されたオーディオ信号により表される音声の音高と、それが供給されたときの時刻とが上記五線譜において示す点を順番に結んだ線である。
キャラクターDは、歌唱の音声が評価された結果に応じて表示される画像である。図3(a)では、歌唱結果線C1のうち、評価期間X1に示される部分が「普通」と評価された結果、「普通」という感情を表した表情のキャラクターD1が表示されている。図3(b)では、歌唱結果線C2のうち、評価期間X2に示される部分が「悪い」と評価された結果、「悪い」という感情を表した表情のキャラクターD2が表示されている。図3(c)では、歌唱結果線C3のうち、評価期間X3に示される部分が「良い」と評価された結果、「良い」という感情を表した表情のキャラクターD3が表示されている。これらキャラクターDの画像は、各評価期間が経過し、評価結果を示すデータが図1に示した評価部112から画像生成部114に供給されることで表示される。
【0022】
図4は、特定部113により特定された評価期間に応じた表情のキャラクターが表示されている画像の一例を示す図である。図4では、図3と異なる点を中心に説明する。図4では、キャラクターE(E1、E2、E3)は、上述した「苦手なところ」を伝えるための表情をしている。この例では、図3(b)において「悪い」と評価された評価期間X2における基準(音高がG)と音高が共通する基準の評価期間が、時刻t3から始まる評価期間Y1である。図4(a)、(b)は、時刻t3よりも、時間T1前の時点又は時間T2前の時点に表示されている画像をそれぞれ示し、図4(c)は、時刻t3に表示されている画像を示している。
【0023】
図4(a)に示すキャラクターE1は、「苦手なところ」までもうすぐであることと、そのときにどのように歌唱するべきかを示した画像である。詳細には、キャラクターE1は、左腕E1Lを上げることで、「苦手なところ」が近づいてきたことを示している。また、キャラクターE1は、右腕E1Rを上げることで、その音声を発するときには、声を少し高めに出すと良いことを示している。図4(b)に示すキャラクターE2は、左腕E2Lを矢印R2の方向に少しずつ下げることで、「苦手なところ」が近づいていることを示している。図4(c)に示すキャラクターE3は、左腕E3Lを矢印R3の方向に一気に下げることで、「苦手なところ」に到達したことを示している。以上のとおり、これらのキャラクターEは、「苦手なところ」、すなわち、評価期間Yが開始するタイミングである時刻t3よりも前に表示され、その表情の変化でこのタイミングが近づいていることを示す。これにより、歌唱者は、評価期間Yの開始に合わせて音声を発することが容易になり、カラオケ装置1は、歌唱者が上手に歌うことを補助することができる。
【0024】
図5は、キャラクターの様々な表情を表す画像の例を示す図である。図5(a)は、音高をどのように修正するべきか(修正方法)を歌唱者に伝えるための画像である。キャラクターG(G1、G2)は、右腕の上げ方で音高を上げるか下げるかを伝えており、右腕を上げたキャラクターG1が表示されたときは、「音高を上げる」べきであることを伝え、右腕を下げたキャラクターG2が表示されたときは、「音高を下げる」べきであることを伝えている。なお、手の指を立てる本数で、上げる(又は下げる)べきである音高の程度を表しても良く、例えば、指1本なら半音、指2本なら1音音高を上げる(又は下げる)ことを示しても良い。また、右腕を上げる角度によって、音高の程度を表しても良い。
図5(b)は、音量の修正方法を歌唱者に伝えるための画像である。キャラクターH(H1、H2、H3)は、口の開け方で音量をどうするべきかを伝えている。この例では、口を小さく開けたキャラクターH1が表示されたときは、「音量を小さくする」べきであることを伝え、口を大きく開けたキャラクターH2が表示されたときは、「音量を大きくする」べきであることを伝え、口を閉じたキャラクターH3が表示されたときは、「発声するべきではない」ことを伝えている。
【0025】
図5(c)は、音量の修正方法を、立体画像で歌唱者に伝えるための画像である。キャラクターJ(J1、J2、J3)は、画像の飛び出し方で音量をどの程度大きくすべきかを伝えるための画像である。説明の便宜上、各キャラクターJが飛び出して見える程度を、立体でない画像との水平方向のずれK1、K2、K3(K1<K2<K3)を仮想的に示し、このずれが大きいほど飛び出して見えているものとした。この例では、飛び出して見える度合いが最も小さい(K1)キャラクターJ1が表示されたときは、「音量をやや大きくする」べきであることを伝え、飛び出して見える度合いが最も大きい(K3)キャラクターJ3が表示されたときは、「音量をとても大きくする」べきであることを伝え、飛び出して見える度合いがこれらの間(K2)のキャラクターJ2が表示されたときは、「音量を大きくする」べきであることを伝えている。
【0026】
カラオケ装置1においては、図5に示した表情が伝える様々な内容について、それらを実行すべきタイミングを図4に示した左腕の表情により伝えることで、歌唱者は、自分が苦手とする音声をいつ、どのように発するべきかを知ることができる。このため、歌唱者は、苦手な音声であっても、予めそれを改善するための準備をして発するため、評価を向上させる可能性が高まる。また、カラオケ装置1は、伴奏データ311を再生しているときに、キャラクターを表した画像を表示し、かつ、歌唱を評価した結果に応じてそのキャラクターの表示を変化させて表示する。これにより、カラオケ装置1は、歌唱されるべき基準に対して歌唱音声が沿っている程度に反応するキャラクターを表示することができ、このキャラクターと一緒に歌っているような臨場感を歌唱者に与えることができる。
【0027】
また、カラオケ装置1は、図5(c)に示すとおり、キャラクターの画像を立体的に表示して、その画像が飛び出す程度によって歌唱者に歌い方を伝えることができる。図1に示す立体画像表示部25が有するディスプレイは、画像を表示する面(表示面)に対して、予め定められた領域から見た場合に画像が立体的に見えるものである。例えば、カラオケルームのステージから歌唱者が見るディスプレイは、歌唱者以外の者からは見えない又は見にくい場合が多い。このディスプレイに上述したキャラクターを表示させて、それが飛び出して見える度合いで歌い方を伝えれば、キャラクターから歌い方を伝えられていることが歌唱者以外には分かりにくくすることができる。これにより、歌唱者は、他の者には気づかれにくい方法でキャラクターから歌い方を伝えてもらい、歌唱が高く評価されるように歌い方を改善することができる。
【0028】
[変形例]
上述した実施形態は、本発明の実施の一例に過ぎず、次のように種々の応用・変形が可能であり、また、必要に応じて組み合わせることも可能である。
【0029】
(変形例1)
本発明に係るカラオケ装置は、歌唱者にはキャラクターが立体的に見えるように画像を表示させても良い。例えば、カラオケ装置が表示部に複数のディスプレイを備えている場合に、歌唱者いる位置を検知して、その位置から見ることができるディスプレイにだけキャラクターを表示させても良いし、そのディスプレイだけキャラクターを立体的に表示させても良い。また、カラオケ装置は、ディスプレイをモータ等で回転させ、検知した位置から見ることができるように向きを調整したディスプレイにキャラクターを表示させても良い。
【0030】
図6は、本変形例に係るカラオケ装置1aの構成を示す図である。収音部23は、2つのマイクロホン231(231a、231b)を有し、放音部24は、2つのスピーカ241(241a、241b)を有する。立体画像表示部25は、2つのディスプレイ251(251a、251b)を有し、各ディスプレイには、それぞれモータ253(253a、253b)が設けられている。モータ253は、各ディスプレイをそれぞれ回転させる。各ディスプレイは、各モータにより回転させられることで、画像を表示する向きを変えられる。記憶部30aは、ディスプレイデータ330aを記憶する。ディスプレイデータ330aは、各ディスプレイが設置されている位置と、これらが画像を表示する向きとを示すデータである。これらの位置及び向きは、各ディスプレイを設置する際、図1に示す操作部21の操作により入力され、ディスプレイデータ330aとして記憶される。
【0031】
制御部10aは、位置検知部117aと、方向算出部118aと、モータ制御部119aとを有する。位置検知部117aは、歌唱者が歌唱している位置(歌唱位置)を検知する手段である。詳細には、位置検知部117aは、マイクロホン231の位置を測定するための音(測定音)を示すデータを、音響処理部22を介して2つのスピーカ241に出力し、これらのスピーカ241から測定音を放音させる。このとき、位置検知部117aは、スピーカ241が測定音を放音した時刻を取得する。続いて、位置検知部117aは、各マイクロホン231が収音した音を表すオーディオ信号から、測定音が収音された時刻を算出する。位置検知部117aは、測定音が放音されてから収音されるまでの時間から、その測定音を放音したスピーカから収音したマイクロホンまでの距離を算出し、これを2つのスピーカ241について算出することで、マイクロホン231の位置を測定する。位置検知部117aは、測定した各マイクロホンの位置のうち、評価部112により評価されている音声が収集されたマイクロホンの位置を歌唱位置として検知する。位置検知部117aは、検知した歌唱位置を示すデータを、方向算出部118aに供給する。マイクロホン231、スピーカ241及び位置検知部117aが協働することで、歌唱位置を検知する検知手段として機能する。
方向算出部118aは、供給されたデータが示す位置と記憶部30aから読み出したディスプレイデータ330aが示す位置及び向きから、キャラクターを表示するべきディスプレイを判断し、そのディスプレイが画像を表示すべき方向を算出する。方向算出部118aの動作の詳細については、後に示す図7を参照しながら説明する。方向算出部118aは、算出した方向とその方向に画像を表示すべきディスプレイとを示す算出結果データを、画像生成部114a、表示制御部115a及びモータ制御部119aに供給する。
【0032】
画像生成部114aは、上述したキャラクターを表す画像を含む画像データと、この画像を含まない画像データとを生成し、これらの画像データを表示制御部115aに供給する。
表示制御部115aは、画像生成部114aから供給された画像データのうち、キャラクターを表す画像を含む画像データが示す画像を、方向算出部118aから供給された算出結果データが示すディスプレイに対して表示させ、この画像を含まない画像データが示す画像を、このディスプレイ以外のディスプレイに表示させる。
モータ制御部119aは、方向算出部118aから供給された算出結果データが示すディスプレイに設けられたモータ253の動作を制御し、そのディスプレイが算出結果データが示す方向を向くように調整する。表示制御部115a、方向算出部118a及びモータ制御部119aが協働することで、本発明に係る「表示制御手段」として機能する。
【0033】
図7は、ディスプレイの方向を調整する様子を説明するための図である。図7では、各ディスプレイと、歌唱者を含む利用者M1、M2、M3を鉛直方向上方から見た様子を模式的に示している。ディスプレイ251a、251bは、それぞれ、表示面252a、252bに画像を表示する。図7では、各表示面に表示される画像を立体的に見える第1領域とそれ以外の第2領域との境界を、点線Xa、Xbでそれぞれ示している。つまり、第1領域は、2本の点線Xaに挟まれた領域であり、同じく2本の点線Xbに挟まれた領域である。
図7(a)では、利用者M1が歌唱者であり、マイクロホン231aから音声を入力している。この場合、図6に示した位置検知部117aは、歌唱者が用いているマイクロホン231aの位置を歌唱位置として検知する。そして、図6に示した方向算出部118aは、検知された歌唱位置が点線Xaで示される領域に含まれることから、キャラクターを表示するべきディスプレイをディスプレイ251aと判断し、そのディスプレイが画像を表示すべき方向として、現在向いている方向を算出する。これにより、図6に示した表示制御部115aは、ディスプレイ251aにキャラクターを含む画像を表示させ、ディスプレイ251bにはキャラクターを含まない画像を表示させる。また、図6に示したモータ制御部119aは、算出された向きが現在向いている向きであるため、モータを回転させない。
【0034】
図7(b)では、図7(a)の状態から歌唱者が利用者M3に変わり、利用者M3がマイクロホン231bから音声を入力している状態を示している。図7(a)の状態では、マイクロホン231bの位置から画像を立体的に見ることができるディスプレイがなかった。この場合、方向算出部118aは、検知された歌唱位置が点線Xa又は点線Xbで示される領域に含まれるように向けた場合の各ディスプレイの方向を算出する。そして、方向算出部118aは、算出した方向を向くことが可能なディスプレイのうち、その方向に向けるため回転させる角度が最も小さいディスプレイ(図7(b)の例では、ディスプレイ251b)を、キャラクターを表示するべきディスプレイとして判断する。続いて、方向算出部118aは、ディスプレイ251bが画像を表示すべき方向を算出する。そして、表示制御部115aは、ディスプレイ251bにキャラクターを含む画像を表示し、モータ制御部119aは、ディスプレイ251bを、図7(b)において二点鎖線で示した状態から実線で示した状態となるまで回転させる。これにより、歌唱者は、自分でディスプレイの向きを変えたり、自分の位置を変えたりしなくとも、ディスプレイに表示されるキャラクターが立体的に見えるようになる。これにより、歌唱者がどの位置で歌っていても、キャラクターの飛び出し具合が他の者からは分かりにくくなり、歌唱者は、他の者に知られることなく、歌唱が高く評価されるように歌い方を改善することができる。
【0035】
(変形例2)
本発明に係るカラオケ装置は、歌唱者の画像を撮影し、撮影した画像をキャラクターの画像と合成して表示させても良い。この場合、カラオケ装置は、歌唱者の画像を撮影する撮影手段を備え、撮影手段が撮影した画像と上述した各種画像とを合成した画像データを画像生成部が生成し、この画像データを立体画像表示部が有するディスプレイに出力して表示させれば良い。これにより、カラオケ装置は、キャラクターとデュエットをしているような雰囲気を歌唱者に与えることができ、上記合成した画像データを表示しない場合に比べて、臨場感をより高めることができる。
【0036】
(変形例3)
本発明に係るカラオケ装置は、上述した実施形態で示したキャラクターの表情以外にも、様々な表情で感情等を伝えても良い。例えば、キャラクターに目配せをさせてタイミングを伝えても良いし、上手く歌えたとき(評価が高いとき)に、キャラクターに飛び跳ねさせて歌唱者を盛り上げるようにしても良い。また、基準とは関係なく、例えばビブラートを検出したら表情を変えても良い。また、キャラクターの表情と伝えられる内容とは、歌唱者が対応付けて伝えられる内容を認識することができるものであれば、どのように対応付けられていても良い。例えば、表情とその表情が示す内容を対応付けた表を、予め利用者に提供しておけば良い。これにより、人により表情の受け取り方が異なる場合であっても、伝えるべき感情又は内容を歌唱者に対して伝えることができる。また、この対応を、ユーザが操作部21の操作などで設定できるようにしても良い。なお、キャラクターの表情に加え、背景により感情等を伝えても良く、例えば、評価が高い状態から低い状態になるに連れて、背景の色を青から赤に変化させ、間違いが増えていることを警告するようにしても良い。また、文字を表示しても良いし、音声を発声させても良い。音声を発声させる際は、発音する音に応じて、口の形を変えてキャラクターを表示させても良い。
【0037】
(変形例4)
本発明に係るカラオケ装置は、キャラクターの表情を1つ1つ異なる画像で表すものでなくともよく、例えば、表情を形作るいくつかのパーツを組み合わせることで、数通りのパーツから何十種類もの表情を表すものであっても良いし、パラメータを用いて表情を生成するものであっても良い。これにより、表情の数だけ画像を用意する場合よりも、キャラクター画像データの容量を小さくすることができる。
【0038】
(変形例5)
本発明においては、歌唱音声の様々な特徴を基準として用いて、これを評価しても良い。例えば、基準には、拍の長さ又は音量等の特徴を用いても良いし、「ビブラート」又は「こぶし」等の歌唱技法を特徴としてとらえて用いても良い。
【0039】
(変形例6)
本発明に係る制御部は、上述した実施形態において説明した方法に限らず、様々な方法で歌唱を評価しても良い。例えば、制御部が算出した評価値が第1閾値以下である場合に2点、第2閾値以下である場合に1点加点し、その合計を評価点とするというように、加点式で評価しても良い。また、評価期間を、構成音が歌唱されるべき期間とは異なる期間としても良く、例えば、1秒や2秒といった一定の時間を評価期間としても良いし、評価期間の長さをユーザが操作部21の操作などにより設定できるようにしても良い。
【0040】
(変形例7)
本発明に係るカラオケ装置は、上述した実施形態では、評価部112による評価結果に応じた表情のキャラクターを表示し、また、特定部113により特定された評価期間を伝えるための表情のキャラクターをそれぞれ異なる画像で表示させたが、これらは、同時に表示させても良いし、いずれか一方だけを表示させても良い。前者を表示させれば、歌唱者に臨場感を与えやすく、後者を表示させれば、歌唱者が上手に歌うことを補助することができる。
【0041】
(変形例8)
本発明において、特定部113により特定された評価期間に、過去に歌唱したときよりも上手に歌うことができたら、評価点を高くするように加点しても良い。詳細には、評価部112は、評価期間が特定部113により特定されたものであり、かつ、音高が共通する基準のうち、1回前の基準に対する評価値よりも評価値が小さくなった場合、評価点に1点加点する。なお、この際、過去の複数回の評価値の平均値よりも小さくなった場合に加点しても良いし、加点する代わりに減点する点数を減らしても良い。
【0042】
(変形例9)
本発明に係るカラオケ装置は、上述した実施形態においては、立体画像を表示する手段(立体画像表示部)を備えていたが、2次元の画像を表示する手段を備えていても良い。この場合、画像生成部は、図5(c)に示すような立体的に飛び出して見える画像を、遠近法を用いて2次元の画像で生成すれば良い。また、飛び出して見える画像は表示せずに、図4、図5(a)、(b)に示すような平面的に表現されたキャラクターの画像を表示させても良い。この場合でも、カラオケ装置は、歌唱されるべき基準に対して歌唱音声が沿っている程度に反応するキャラクターを表示することができる。
【0043】
(変形例10)
本発明に係るカラオケ装置は、上述した実施形態においては、表示制御部及び立体画像表示部を備えたが、これらの各部は、外部の装置に備えられていても良い。この場合、画像生成部は、例えばネットワークを介して、この外部の装置に備えられた表示制御部に画像データを出力すればよい。
【0044】
(変形例11)
本発明に係るカラオケ装置は、キャラクターの表情に加え、背景によって感情又は伝えたい情報等を表しても良い。この場合、記憶部にキャラクターの背景として表示させるための画像データである背景データを記憶させれば良い。ここでいう背景には、背後の景色を表したいわゆる背景に加え、上記キャラクターの表情と同様に、キャラクターの感情又は伝えたい情報等を色、形又は文字等で表したものが含まれる。
【0045】
(変形例12)
本発明に係るカラオケ装置は、歌唱者が歌唱すべき時刻又は歌唱すべき位置を、伴奏音に限らず、画像等で表しても良い。例えば、上述した実施形態においては、図3に示したように、歌詞Aの色を変化させて色が変化する境目を現在歌唱すべき位置として表しているので、歌唱者は、伴奏音がなくとも歌唱すべき位置を知ることができる。また、これに限らず、図3に示した五線譜に、現在再生されているところを示すマークを表示させ、矢印R1の方向に移動させて歌唱すべき位置を知らせても良い。上述した実施形態に係る「伴奏データ311」、「歌詞データ313」及び本変形例に係るマークを表示させるデータは、いずれも、再生されると楽曲の歌唱すべき位置を表すデータであり、本発明に係る「位置表示データ」の一例に相当する。
【0046】
(変形例13)
画像生成部114は、上述した実施形態において、生成した画像データ(第2画像データ)を伴奏データに応じたキャラクターの画像データ(第1画像データ)に代えて表示制御部115に供給したが、これに限らず、これらの画像データを共に表示制御部115に供給してもよい。例えば、画像生成部114は、第2画像データとして、第1画像データが示すキャラクターの表情を、上述した評価結果又は特定部113により特定された評価期間に応じた表情で表した画像を示すデータを生成し、表示制御部115は、第1画像データが示す画像に第2画像データが示す画像を重ねて(オーバーレイさせて)表示させれば良い。この場合であっても、カラオケ装置1は、歌唱されるべき基準に対して歌唱音声が沿っている程度に反応するキャラクターを表示することができる。
【0047】
(変形例14)
本発明は、コンピュータを本発明に係る評価装置として機能させるためのプログラムとしても特定され得るものである。かかるプログラムは、光ディスク等の記録媒体に記録した形態で提供されたり、インターネット等のネットワークを介して、コンピュータにダウンロードさせ、これをインストールして利用可能にするなどの形態で提供されたりすることも可能である。
【符号の説明】
【0048】
1…カラオケ装置、10、10a…制御部、21…操作部、22…音響処理部、23…収音部、24…放音部、25…立体画像表示部、30…記憶部、111…再生部、112…評価部、113…特定部、114…画像生成部、115、115a…表示制御部、117a…位置検知部、118a…方向算出部、119a…モータ制御部、231…マイクロホン、251…ディスプレイ、252…表示面、253…モータ、310…楽曲データベース、311…伴奏データ、312…リファレンスデータ、313…歌詞データ、320…キャラクターデータベース、321…キャラクター画像データ、330…ディスプレイデータ

【特許請求の範囲】
【請求項1】
再生されると楽曲の歌唱すべき位置を表す位置表示データと、歌唱音声を評価する基準を示すリファレンスデータとを記憶する記憶手段と、
前記記憶手段から前記位置表示データを読み出して再生する再生手段と、
前記再生手段が前記位置表示データを再生しているときに収音手段から供給されたオーディオ信号が表す歌唱音声と、前記記憶手段から読み出した前記リファレンスデータが示す基準とを比較して当該歌唱音声を評価する評価手段と、
前記再生手段が前記位置表示データを再生している間、キャラクターの画像を示す第1画像データを出力し、前記評価手段により前記歌唱音声が評価された場合、前記キャラクターの表情を当該歌唱音声が評価された結果に応じた表情で表した画像を示す第2画像データを出力する出力手段と、
を備えることを特徴とする評価装置。
【請求項2】
前記出力手段は、前記位置表示データに応じた表情の前記キャラクターの画像を示す第1画像データを出力する
ことを特徴とする請求項1に記載の評価装置。
【請求項3】
前記リファレンスデータは、前記楽曲における複数の期間のそれぞれと対応付けられた前記基準を示し、
前記記憶手段から読み出した前記リファレンスデータが示す複数の前記基準に対応づけられた前記期間から、前記評価手段により評価された歌唱音声が比較された基準と特徴が共通する基準に対応づけられた前記期間を特定する特定手段を備え、
前記出力手段は、前記特定手段により特定された期間を伝えるための表情をする前記キャラクターの画像を示す前記第2画像データを、当該期間の開始よりも前に出力する
ことを特徴とする請求項1又は2に記載の評価装置。
【請求項4】
前記歌唱者の位置を検知する検知手段と、
予め定められた領域から見た場合に立体的に見える画像を表示する面を有する表示手段を制御して、前記検知手段が検知した位置が前記領域に入るように前記面の向きを調整し、当該面に前記出力手段が出力する第2画像データが示す前記キャラクターの画像を立体的に表示させる表示制御手段と
を備えることを特徴とする請求項1ないし3のいずれかに記載の評価装置。
【請求項5】
歌唱者の画像を撮影する撮影手段を備え、
前記出力手段は、前記撮影手段が撮影した画像と前記キャラクターを表現した画像とを合成して出力する
ことを特徴とする請求項1ないし4のいずれかに記載の評価装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate