カラオケシステム
【課題】利用者が実際に感じる印象に近い演奏評価を実現するカラオケシステムを提供する。
【解決手段】マイクロフォン40により入力される音声情報に関して単位時間毎の音高及び音量を検出する音高・音量検出手段86と、複数の利用者それぞれの音声情報を対象として、前記音高・音量検出手段86によりN回連続的に検出される単位時間毎の音高及び音量に対応する2N種類のデータに関して多変量解析を行う多変量解析手段と、評価の基準データにおける音高の切り替わり部分において、前記複数の利用者の音声情報に対応する前記多変量解析手段90による解析結果に基づいて、対象となる利用者の音声情報に係る演奏評価を行う演奏評価手段100とを、備えたものであることから、高低差のある音高の繋ぎに相当する演奏部分を好適に評価することができる。
【解決手段】マイクロフォン40により入力される音声情報に関して単位時間毎の音高及び音量を検出する音高・音量検出手段86と、複数の利用者それぞれの音声情報を対象として、前記音高・音量検出手段86によりN回連続的に検出される単位時間毎の音高及び音量に対応する2N種類のデータに関して多変量解析を行う多変量解析手段と、評価の基準データにおける音高の切り替わり部分において、前記複数の利用者の音声情報に対応する前記多変量解析手段90による解析結果に基づいて、対象となる利用者の音声情報に係る演奏評価を行う演奏評価手段100とを、備えたものであることから、高低差のある音高の繋ぎに相当する演奏部分を好適に評価することができる。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、多数の演奏曲のうちから選択される演奏曲を出力させるカラオケ装置を用いたカラオケシステムに関し、特に、利用者が実際に感じる印象に近い演奏評価を実現するための改良に関する。
【背景技術】
【0002】
多数の演奏曲のうちから選択される演奏曲を出力させる音楽再生装置が知られている。例えば、カラオケボックス等で使用されるカラオケ装置がそれである。斯かるカラオケ装置によれば、予め記憶装置に記憶された多数のカラオケ演奏曲から選択されたカラオケ演奏曲の音楽情報を出力させると共に、そのカラオケ演奏曲の歌詞情報を含む映像をその出力に同期して画面に表示させることで、所望の歌のカラオケ演奏を楽しむことができる。
【0003】
ところで、近年普及しているカラオケ装置には、上述のような音楽再生装置としての機能のみならず、音声入力装置(マイクロフォン)から入力される音声情報に基づいて歌唱力等を評価(採点)する演奏評価機能を備えたものがある。例えば、特許文献1に記載されたカラオケ装置がそれである。斯かるカラオケ装置によれば、音程、テンポ、音量等を基準として音声入力装置から入力される音声情報とカラオケ演奏曲の演奏情報とを比較することで、その入力される音声情報に応じて歌唱の評価を採点することができる。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開平9−101794号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかし、上述した従来技術のような演奏評価は、通常、予め定められたアルゴリズムに従い、MIDI(Musical Instrument Digital Interface)データ等の演奏情報を基準データとして機械的に行われるものであったことから、利用者が実際に上手いと感じる演奏に正当な評価が与えられなかったり、逆に歌い方によっては下手な演奏に高い評価が与えられるというように、利用者の感じ方と演奏評価とか必ずしも一致しないという不具合があった。
【0006】
本発明者は、利用者が実際に感じる印象に近い演奏評価を実現するカラオケシステムを開発すべく鋭意研究を継続する過程において、特に基準データにおいて音高が切り替わる演奏部分に関して利用者の印象と演奏評価結果とが乖離する傾向が強いことに着目した。そして、斯かる演奏部分について利用者の印象と演奏評価結果とが乖離するのは、基準データにおける音高の切り替わりが段階的であるのに対して利用者の歌唱音声の時間変化は連続的であり、たとえ高低差のある音高の繋ぎを上手く歌ったとしてもそれを正しく評価することができないためであると考えた。換言すれば、利用者が実際に感じる印象において、高低差のある音高の繋ぎに相当する演奏部分をどのように歌うかということに関する評価は無視できない重要な要素であるが、斯かる演奏部分を好適に評価し得るカラオケシステムは、未だ開発されていないのが現状である。
【0007】
本発明は、以上の事情を背景として為されたものであり、その目的とするところは、利用者が実際に感じる印象に近い演奏評価を実現するカラオケシステムを提供することにある。
【課題を解決するための手段】
【0008】
斯かる目的を達成するために、本発明の要旨とするところは、多数の演奏曲のうちから選択される演奏曲を出力させると共に音声入力装置により入力される音声を増幅して出力させるカラオケ装置を用いたカラオケシステムであって、前記音声入力装置により入力される音声情報に関して単位時間毎の音高及び音量を検出する音高・音量検出手段と、複数の利用者それぞれの音声情報を対象として、前記音高・音量検出手段によりN回連続的に検出される単位時間毎の音高及び音量に対応する2N種類のデータに関して多変量解析を行う多変量解析手段と、評価の基準データにおける音高の切り替わり部分において、前記複数の利用者の音声情報に対応する前記多変量解析手段による解析結果に基づいて、対象となる利用者の音声情報に係る演奏評価を行う演奏評価手段とを、備えたことを特徴とするものである。
【発明の効果】
【0009】
このようにすれば、前記音声入力装置により入力される音声情報に関して単位時間毎の音高及び音量を検出する音高・音量検出手段と、複数の利用者それぞれの音声情報を対象として、前記音高・音量検出手段によりN回連続的に検出される単位時間毎の音高及び音量に対応する2N種類のデータに関して多変量解析を行う多変量解析手段と、評価の基準データにおける音高の切り替わり部分において、前記複数の利用者の音声情報に対応する前記多変量解析手段による解析結果に基づいて、対象となる利用者の音声情報に係る演奏評価を行う演奏評価手段とを、備えたものであることから、高低差のある音高の繋ぎに相当する演奏部分を好適に評価することができる。すなわち、利用者が実際に感じる印象に近い演奏評価を実現するカラオケシステムを提供することができる。
【0010】
ここで、好適には、前記多変量解析手段は、前記音高・音量検出手段により検出される音高の変化の起点をn=0とする、n=1からn=Nまでの前記2N種類のデータに関して主成分分析を行う主成分分析手段と、その主成分分析手段による分析結果に対応して、2N組の固有値・固有ベクトルを算出する固有値・固有ベクトル算出手段と、その固有値・固有ベクトル算出手段により算出される2N組の固有値・固有ベクトルに関して、各固有ベクトルを軸とする固有値の分散を算出する分散算出手段と、その分散算出手段により算出される分散が大きいものから順に前記2N組の固有値・固有ベクトルの順位を決定する順位付け手段とを、含むものであり、前記演奏評価手段は、その順位付け手段により決定された順位の高い固有値・固有ベクトルから優先的に前記演奏評価のパラメータとして用いるものである。このようにすれば、高低差のある音高の繋ぎに相当する演奏部分を実用的な態様で好適に評価することができる。
【図面の簡単な説明】
【0011】
【図1】本発明が好適に適用されるカラオケシステムを説明する概略図である。
【図2】図1のカラオケシステムに備えられたカラオケ装置の構成を例示するブロック線図である。
【図3】図1のカラオケシステムに備えられたサーバ装置の構成を例示するブロック線図である。
【図4】図2のカラオケ装置のCPU及び図3のサーバ装置のCPUに備えられた制御機能の要部を説明する機能ブロック線図である。
【図5】本実施例を含む一般的なカラオケ演奏評価制御に用いられる基準データについて説明する図であり、入力音声情報の実測値を実線で、評価の基準となる基準データを破線で囲繞した領域でそれぞれ示している。
【図6】図5に示すような基準データに基づく演奏評価制御の問題点を説明する図である。
【図7】図2に示す本実施例のカラオケ装置による、基準データにおける音高の切り替わり部分においての音高及び音量の検出について説明する図である。
【図8】図2に示す本実施例のカラオケ装置により算出される2N組の固有値・固有ベクトルのうち2本の固有ベクトルを示すパターン空間を例示しており、各サンプルの値を複数の点で示している。
【図9】図1に示す本実施例のカラオケシステムによる演奏評価制御の効果を検証するために、複数の利用者それぞれに対応する音声情報に係るn=1〜8の音高データ及び音量データについて多変量解析制御乃至演奏評価制御を行った結果を比較して示すグラフである。
【図10】図9の比較例としてベロシティを考慮しない結果、すなわち複数の利用者それぞれに対応する音声情報に係るn=1〜8に対応する音高データのみについて多変量解析制御乃至演奏評価制御を行った結果を比較して示すグラフである。
【図11】図2のカラオケ装置のCPUによる本実施例のカラオケ演奏評価制御の要部を説明するフローチャートである。
【図12】図3のサーバ装置のCPUによる本実施例のカラオケ演奏評価制御に係る多変量解析制御の要部を説明するフローチャートである。
【発明を実施するための形態】
【0012】
以下、本発明の好適な実施例を図面に基づいて詳細に説明する。
【実施例】
【0013】
図1は、本発明が好適に適用されるカラオケシステム10を説明する概略図である。この図1に示すように、本実施例のカラオケシステム10では、カラオケボックス、スナック、旅館等の店舗12における複数の個室14a、14b、14c、・・・(以下、特に区別しない場合には単に個室14と称する)にそれぞれ1台乃至は複数台ずつ(図1では1台ずつ)のカラオケ装置16a、16b、16c、・・・(以下、特に区別しない場合には単にカラオケ装置16と称する)が設置されている。これら複数のカラオケ装置16は、ルータ28を介して公衆電話回線等による通信回線18に接続されており、同じくその通信回線18に接続されたカラオケサービス提供会社のサーバ装置(センタ装置)20との相互間でその通信回線18を介して情報の通信が可能とされている。
【0014】
上記サーバ装置20は、カラオケ情報(楽曲データ)、背景映像情報、曲間情報等のデジタルコンテンツ(Digital Contents)の保管や入出力管理等の基本的な制御に加えて、後述する多変量解析制御等を行うサーバであり、上記通信回線18を介して上記カラオケ装置16に定期的にコンテンツの配信を行うと共に、そのカラオケ装置16からの要求に応じて所定の機能制御プログラムを送信する等の制御を行うものである。また、上記カラオケシステム10は、複数の電子早見本装置22a、22b、22c、・・・(以下、特に区別しない場合には単に電子早見本装置22と称する)を備えており、上記カラオケ装置16の利用に際して、各利用者(グループ)毎に1台ずつの電子早見本装置22が貸与され、各個室14において後述するように上記カラオケ装置16の遠隔操作装置として用いられるようになっている。上記店舗12内には上記複数のカラオケ装置16を相互に接続するLAN24が敷設されており、上記電子早見本装置22からのカラオケ装置16への入力は、所定のアクセスポイント26及びLAN24を介したLAN通信等により行われる。
【0015】
図2は、前記カラオケ装置16の構成を例示するブロック線図である。この図2に示すように、前記カラオケ装置16は、TFT(Thin Film Transistor Liquid Crystal)等の映像表示装置30と、映像出力制御部32と、映像情報デコーダ34と、ビデオミキサ36と、音源であるシンセサイザ38と、音声入力装置であるマイクロフォン40と、A/Dコンバータ41と、アンプミキサ42と、スピーカ44と、操作パネル46と、その操作パネル46等からの入力信号を処理する入出力インターフェイス48と、中央演算処理装置であるCPU50と、読出専用メモリであるROM52と、随時書込読出メモリであるRAM54と、記憶装置であるハードディスク56と、モデム58と、LANポート60と、上記電子早見本装置22やリモコン装置64等の入力装置からのリモコン信号を受信するためのリモコン受信部62とを、備えて構成されている。
【0016】
前記映像出力制御部32は、前記CPU50において生成された歌詞文字映像等の文字映像(テロップ)を出力する文字映像出力装置として機能する他、前記映像表示装置30による種々の映像表示を制御する表示制御装置である。また、前記映像情報デコーダ34は、利用者が歌詞を参照しながら歌を歌う際に前記ハードディスク56に記憶された背景映像情報に基づいて所定の背景映像を再生(デコード)する背景映像再生装置である。この背景映像情報は、例えば、MPEG(Moving Picture Experts Group)形式のデータであり、そのMPEGデータに基づいて前記映像情報デコーダ34により再生された背景映像は、前記ビデオミキサへ送られる。また、前記ビデオミキサ36は、前記CPU50において生成され且つ前記映像出力制御部32から出力される文字映像と、前記映像情報デコーダ34により再生される背景映像とを合成して前記映像表示装置30に表示させる映像合成装置である。
【0017】
前記シンセサイザ38は、前記ハードディスク56から読み出されて送られて来るカラオケ演奏曲の演奏情報に基づいて楽器の演奏信号等の音楽信号を生成する音源である。この演奏情報は、例えば、MIDI(Musical Instrument Digital Interface)形式のデータであり、そのMIDIデータに基づいて前記シンセサイザ38により生成された音楽信号は、アナログ信号に変換されて前記アンプミキサ42へ送られる。そのアンプミキサ42では、送られてきた音楽信号と前記マイクロフォン40を介して入力される利用者の歌声とがミキシングされ、それらの信号が電気的に増幅されて前記スピーカ44から出力される。また、前記A/Dコンバータ41は、音声入力装置である前記マイクロフォン40から入力されるアナログ信号としての音声情報をディジタル信号に変換して前記CPU50等へ供給する。
【0018】
前記操作パネル46は、前記カラオケ装置16の利用者が歌いたいカラオケ演奏曲を選択したり、演奏曲の音程を調整したり、演奏と歌との音量バランスを調整したり、その他、エコー、音量、トーン等の各種調整を行うための操作ボタン(スイッチ)或いはつまみを備えた入力装置である。また、前記カラオケ装置16には、前記操作パネル46の一部機能を遠隔で実行するための入力装置として機能するリモコン装置64が備えられており、前記リモコン受信部62は、そのリモコン装置64から送信されるリモコン信号を受信して前記CPU50へ供給する。また、前記カラオケ装置16と電子早見本装置22との対応付け(くくりつけ)処理も前記リモコン受信部62を介して行われ、そのようにして前記カラオケ装置16に対応付けられた電子早見本装置22も同様に入力装置として機能する。
【0019】
上記CPU50は、上記RAM54の一時記憶機能を利用しつつ上記ROM52に予め記憶された所定のプログラムに基づいて電子情報を処理・制御する所謂マイクロコンピュータであり、上記電子早見本装置22やリモコン装置64等により所定のカラオケ演奏曲が選曲された場合、その選曲されたカラオケ演奏曲を上記RAM54に設けられた予約曲テーブルに登録したり、その予約曲テーブルの演奏順に従って上記ハードディスク56から上記RAM54に選曲されたカラオケ演奏曲の演奏情報及び歌詞情報等を読み出したり、カラオケ演奏曲の演奏が進行するのに応じてそのRAM54から上記シンセサイザ38へ演奏情報を送信したり、歌詞情報に基づいて歌詞文字映像を生成して上記映像出力制御部32へ送ったり、選曲時には曲名文字映像を生成して上記映像出力制御部32へ送ったり、上記映像情報デコーダ34を制御して所定の背景映像を再生させたり、カラオケ演奏が行われていない間すなわち曲間において、新譜情報、選曲ランキング、店舗広告等の曲間情報を出力させたり、前記通信回線18を介した前記サーバ装置20との間の情報通信制御等の基本的な制御に加えて、後述する演奏評価制御に係る各種制御を実行する。
【0020】
前記モデム58は、前記カラオケ装置16を公衆電話回線等による通信回線18に接続するための装置であり、前記CPU50から出力されるディジタル信号をアナログ信号に変換して前記通信回線18に送り出すと共に、その通信回線18を介して伝送されるアナログ信号をディジタル信号に変換して前記CPU50に供給する処理を行う。なお、前記店舗12に備えられた複数のカラオケ装置16のうち何れかのカラオケ装置16が前記ルータ28の機能を備えてマスターコマンダとして前記通信回線18に接続される態様も考えられ、その場合、前記モデム58はそのマスターコマンダとして機能するカラオケ装置16には必要とされるが、そのマスターコマンダを介して前記サーバ装置20との間で情報の通信を行う他のカラオケ装置16には必ずしも設けられなくともよい。
【0021】
前記LANポート60は、前記カラオケ装置16をLAN24を介して他のカラオケ装置16や電子早見本装置22等の他の機器に接続するための接続器であり、前記カラオケ装置16は、そのようにLAN24を介して接続されることで、他のカラオケ装置16や電子早見本装置22等の他の機器との間で情報の送受信が可能とされる。例えば、前記アクセスポイント26を介して受信される前記電子早見本装置22からの選曲入力を受け付けて前記RAM54に設けられた予約曲テーブルに記憶したり、そのアクセスポイント26を介して前記カラオケ装置16から電子早見本装置22へ所定の情報を送信したりというように、電波を介して前記カラオケ装置16と電子早見本装置22との間における相互の情報のやりとりが実行される。
【0022】
前記ハードディスク56には、カラオケ演奏曲を出力させるための多数のカラオケ情報(楽曲データ)を記憶するカラオケデータベースをはじめとする各種データベースが設けられている。カラオケボックス等の店舗にそれぞれ備えられた複数のカラオケ装置16のうち所定のカラオケ装置16例えば前記カラオケ装置16aは、前記モデム58を介して前記通信回線18に接続されており、前記複数のカラオケ装置16によって常に新しい曲が演奏可能とされるように、随時新たな楽曲データ等が前記サーバ装置20から前記通信回線18を介して配信され、前記ハードディスク56のカラオケデータベース等に記憶される。また、そのようにして前記サーバ装置20から情報を取得したカラオケ装置16aとその他のカラオケ装置16との間で前記LAN24を介した通信が行われることにより、各カラオケ装置16のハードディスク56に記憶される情報が共有され、上記カラオケデータベース等の内容が等価なものとされる。
【0023】
上記カラオケデータベースに記憶されるカラオケ情報(カラオケデータ)は、演奏音を生成するための演奏情報及び歌詞文字映像(歌詞テロップ)を生成するための歌詞情報から成るものであり、コンテンツIDである各演奏曲に固有の選曲番号により識別される。このカラオケ情報に含まれる演奏情報は、例えば前記シンセサイザ38により所定の演奏音を出力させるためのMIDIデータであり、出力に係る演奏音(楽器)の種類と、各演奏音に対応する楽譜情報とを、含んでいる。また、上記歌詞情報は、前記映像出力制御部32等を介して演奏曲の歌詞文字映像を出力させるためのデータであり、前記歌詞文字映像に対応する歌詞のテキスト情報と、演奏出力に併行してその歌詞文字映像の表示を切り替えるための切替タイミング情報と、演奏出力に併行してその歌詞文字映像を順次色替えするための色替タイミング情報とを、含んでいる。また、後述する演奏評価制御の基準となる図5に示すような基準データが定められている。なお、この基準データは、上記カラオケデータベースに記憶されるカラオケ情報とは別に、各演奏曲の選曲番号と関連付けられて記憶されたものであってもよい。
【0024】
図3は、前記サーバ装置20の構成を説明するブロック線図である。この図3に示すように、前記サーバ装置20は、中央演算処理装置であるCPU66によりRAM70の一時記憶機能を利用しつつROM68に予め記憶されたプログラムに従って信号処理を行う所謂マイクロコンピュータシステムを備えており、前記カラオケ装置16へのカラオケ情報等のコンテンツ配信制御をはじめとする基本的な制御に加えて、後述する多変量解析制御等の各種制御を実行する。また、ビデオボード72により制御されるTFT等の映像表示装置74と、インターフェイス78を介して接続されるキーボード等の入力装置76と、上記CPU66を前記通信回線18に接続するための装置であるモデム80とを、備えて構成されている。また、それぞれハードディスク等の大容量記憶装置に、前記カラオケ装置16に配信するための多数のカラオケ情報を記憶するカラオケデータベース82や後述する多変量解析制御に関する各種情報を記憶する多変量解析データベース84等の各種データベースが設けられている。
【0025】
図4は、前記カラオケ装置16のCPU50及び前記サーバ装置30のCPU66に備えられた制御機能の要部を説明する機能ブロック線図である。この図4に示す各種制御手段に関して、好適には、音高・音量検出手段86及び検出結果送信手段88が前記カラオケ装置16のCPU50に、多変量解析手段90、演奏評価手段100、及び評価結果送信手段102が前記サーバ装置30のCPU66に備えられたものであるが、上記音高・音量検出手段86、多変量解析手段90、及び演奏評価手段100が一元的に前記カラオケ装置16に備えられた態様も考えられる。
【0026】
上記音高・音量検出手段86は、前記マイクロフォン40により入力される音声情報に関して単位時間毎の音高及び音量を検出する。例えば、前記マイクロフォン40により入力されて前記A/Dコンバータ41によりディジタル信号に変換された音声情報に関して、例えば0.025秒程度の極めて短い単位時間毎にその音声情報の要素としての音高(ピッチ)及び音量(ベロシティ)を検出する。具体的には、前記A/Dコンバータ41を介して入力される音声情報に対応する波形を前記RAM54等に記憶しておき、その波形を適宜読み出して解析することで、対象となる単位時間に相当する音高及び音量を数値的に算出する。
【0027】
前記音高・音量検出手段86は、本実施例の演奏評価制御に関して、その演奏評価の基準データにおける音高の切り替わり部分において上記検出を行う。図5は、本実施例を含む一般的なカラオケ演奏評価制御に用いられる基準データについて説明する図であり、前記マイクロフォン40により入力された音声情報の実測値を実線で、評価の基準となる基準データ(お手本データ)を破線で囲繞した領域でそれぞれ示している。この図5に示すように、前記カラオケ装置16によるカラオケ演奏の評価に用いられる基準データは、対象となる演奏曲の進行(時間経過)に対応して所定の音高帯域(例えば、ガイドメロディを中心とする一定の音程幅)が段階的に定められたものである。換言すれば、高低差のある音高の切り替わり部分においては、低音側の音高帯域から高音側の音高帯域へ、或いは高音側の音高帯域から低音側の音高帯域へ、繋ぎを考慮せず即時的に移行するように基準データが定められている。
【0028】
図5に示すように定められた基準データに基づく演奏評価制御では、例えば、前記マイクロフォン40により入力された音声情報の実測値がその基準データの範囲に入るか否かが判定される。すなわち、対象となる音声情報の実測値が基準データの範囲に入る場合には正しい音高で歌っているものと評価される一方、基準データの範囲から逸脱する場合には正しい音高で歌えていないものと評価される。そして、図5に示すように対象となる演奏曲の進行に伴って段階的に定められた基準データに関して、前記マイクロフォン40により入力される音声情報に関して検出される所定時間毎の音高がその基準データに入るか否かの判定が連続的に実行されることで、その演奏曲全体としての演奏評価(総合評価)が行われる。
【0029】
図6は、図5に示すような基準データに基づく演奏評価制御の問題点を説明する図である。前述のように、評価の基準データが演奏曲の進行に伴って段階的に定められたものである場合には、高低差のある音高の切り替わり部分における評価が問題となる。すなわち、斯かる音高の切り替わり部分において、低音側の音高帯域から高音側の音高帯域へ、或いは高音側の音高帯域から低音側の音高帯域へ、繋ぎを考慮せず即時的に移行するように基準データが定められていることから、立ち上がりにおける音声情報の実測値が切り替わり前乃至切り替わり後の何れの基準データにも入らず、その部分を上手く歌ったとしても正しい評価が行われなかった。これは、基準データにおける音高の切り替わりが段階的であるのに対して前記マイクロフォン40により検出される利用者の歌唱音声の時間変化は連続的であり、高低差のある音高の切り替わり部分においてはその音高(音程)が漸増乃至漸減することで滑らかで自然な歌い方となるからである。
【0030】
図7は、基準データにおける音高の切り替わり部分においての前記音高・音量検出手段86による音高及び音量の検出について説明する図である。この図7に示すように、前記音高・音量検出手段86は、好適には、評価の基準データにおける音高の切り替わり部分において、前記マイクロフォン40により検出される音声情報における音高の変化の起点をn=0とする、n=1からn=Nまでの音高及び音量を検出する。ここで、nは前記音高・音量検出手段86の検出単位である前記単位時間それぞれの検出結果に対して付される符号であり、Nは好適には6〜10の整数、最適には8である。すなわち、前記音高・音量検出手段86は、好適には、前記マイクロフォン40により検出される音声情報における音高の変化の起点をn=0とする、n=1からn=8までの0.2秒間(単位時間0.025×8)における8単位分の音高及び音量を検出する。なお、上記音高の変化の起点としては、図7に示すように、対象となる基準データの切り替わり直後において音高が変化(低音側から高音側への切り替わり部分においては上昇、高音側から低音側への切り替わり部分においては下降)し始めた瞬間をn=1(変化の直前としての起点をn=0)とするのが好ましいが、例えば基準データの切り替わりの瞬間をn=0とするように基準データに基づいて予め定められたものであってもよい。
【0031】
前記検出結果送信手段88は、前記通信回線18を介して前記音高・音量検出手段86による検出結果を前記サーバ装置20における多変量解析データベース84へ送信乃至蓄積する。すなわち、前記音高・音量検出手段86により検出されたn=1からn=Nまでの音高データ及び音量データを、対象となる演奏曲の識別情報(選曲番号)及びn=1〜Nの検出時点(例えば曲の演奏開始からの経過時点)、更には演奏者(音声情報の入力主体)である利用者の識別情報と関連付けて前記多変量解析データベース84に記憶する。そのようにして、斯かる多変量解析データベース84には、それぞれの演奏曲に係る基準データにおける各音高の切り替わり部分毎に、前記複数のカラオケ装置16において検出されたn=1〜Nの音高データ及び音量データが蓄積される。すなわち、各基準データにおける音高の切り替わり部分毎に、複数の利用者それぞれの音声情報を対象として、前記音高・音量検出手段86によりN回連続的に検出された単位時間毎の音高及び音量に対応する2N種類のデータ(音高データN個+音量データN個=2N個のデータ)がサンプルとして蓄積されるようになっている。
【0032】
前記多変量解析手段90は、上述のように多変量解析データベース84に蓄積されたデータ、すなわち複数の利用者それぞれの音声情報を対象として、前記音高・音量検出手段86によりN回連続的に検出された単位時間毎の音高及び音量に対応する2N種類のデータに関して多変量解析を行う。斯かる制御を行うために、前記多変量解析手段90は、図4に示すように主成分分析手段92、固有値・固有ベクトル算出手段94、分散算出手段96、及び順位付け手段98を含んでいる。以下、これらの制御手段それぞれの制御について分説する。
【0033】
上記主成分分析手段92は、各基準データにおける音高の切り替わり部分に対応して前記多変量解析データベース84に蓄積された2N種類のデータに関して、よく知られた主成分分析法(Principal Component Analysis)による主成分分析を行う。すなわち、各利用者それぞれの音声情報(対応する切り替わり部分に係るn=1〜8、16種類のデータ)に関して、次の数式1に示すような特徴ベクトルxを算出する。なお、この数式1におけるP(n)は、n番目の音高(入力ピッチ)をPi(n)、n番目のお手本ピッチをPm(n)としてPi(n)−Pm(n)で表される値であり、V(n)は、n番目の音量(ベロシティ)をVe(n)としてVe(n)−Ve(n-1)で表される値である。また、前述のように好適にはN=8である。また、前記主成分分析手段92は、上述のように算出された複数の利用者の音声情報に対応する特徴ベクトルxを標準化する。例えば、それら複数の特徴ベクトルxを分散1、平均1となるように標準化する。そして、そのようにして標準化された複数の特徴ベクトルxに基づいて分散・共分散行列を求めることにより主成分分析を行う。
【0034】
[数式1]
x={P(n),P(n+1),・・・,P(n+N),V(n),V(n+1),・・・,V(n+N)}
【0035】
前記固有値・固有ベクトル算出手段94は、前記主成分分析手段92による分析結果に対応して、2N組の固有値・固有ベクトルを算出する。前述のようにN=8である場合には、前記主成分分析手段92による分析結果に対応して16組の固有値・固有ベクトルを算出する。この固有値・固有ベクトル算出手段94により算出された固有値・固有ベクトルは以下の制御におけるパラメータとして用いられ、その固有ベクトルがパターン空間の軸として使用されると共に、対応する固有値がその軸の単位として使用される。
【0036】
前記分散算出手段96は、前記固有値・固有ベクトル算出手段94により算出される2N組の固有値・固有ベクトルに関して、各固有ベクトルを軸とする固有値の分散を算出する。また、前記順位付け手段98は、前記分散算出手段96により算出される分散が大きいものから順に前記2N組の固有値・固有ベクトルの順位を決定する。図8は、前記固有値・固有ベクトル算出手段94により算出される2N組の固有値・固有ベクトルのうち2本の固有ベクトルv1、v2を示すパターン空間を例示しており、各サンプルの値を複数の点(ドット)で示している。この図8に示す例では、固有ベクトルv1を軸とするものの方が、固有ベクトルv2を軸とするものよりも分散が大きいことがわかる。前記順位付け手段98は、前記固有値・固有ベクトル算出手段94により算出される2N組の固有値・固有ベクトルそれぞれについて前記分散算出手段96により算出される分散について斯かる比較を行うことにより、それらの固有値・固有ベクトルを分散が大きいものから順に第1位から第2N位まで順位付けする。
【0037】
前記演奏評価手段100は、評価の基準データにおける音高の切り替わり部分において、前記複数の利用者の音声情報に対応する前記多変量解析手段90による解析結果に基づいて、対象となる利用者の音声情報に係る演奏評価を行う。すなわち、前記固有値・固有ベクトル算出手段94により算出された固有ベクトルをパターン空間の軸として使用すると共に、対応する固有値をその軸の単位として使用することにより、基準値(例えば、対象となる固有ベクトルに係る平均値)からの各利用者に対応する値の偏差を求め、その偏差に対応する評価結果を算出する。好適には、斯かる基準値からの偏差が小さいほど高い評価となるように(偏差が大きいほど低い評価となるように)予め定められた関係から、各基準データにおける音高の切り替わり部分毎に算出される固有値・固有ベクトルをパラメータとして、それぞれの利用者の音声情報に対応する2N種類のデータに基づいて斯かる演奏評価を行う。
【0038】
前記演奏評価手段100は、好適には、順位付け手段により決定された順位の高い固有値・固有ベクトルから優先的に前記演奏評価のパラメータとして用いる。例えば、各基準データにおける音高の切り替わり部分に対応して前記固有値・固有ベクトル算出手段94により算出される2N種類の固有値・固有ベクトルのうち、前記順位付け手段98により最も高い順位(第1位)に順位付けされた固有ベクトルをパターン空間の軸として使用すると共に、対応する固有値をその軸の単位として前記評価を行う。すなわち、斯かる第1位の固有値・固有ベクトルに対応する基準値からの偏差が小さいほど高い評価となるように(偏差が大きいほど低い評価となるように)予め定められた関係から、それぞれの利用者の音声情報に対応する2N種類のデータに基づいて斯かる演奏評価を行う。
【0039】
図9は、本実施例の演奏評価制御の効果を検証するために、複数の利用者それぞれに対応する音声情報に係るn=1〜8の音高データ及び音量データについて前述の多変量解析制御乃至演奏評価制御を行った結果を比較して示すグラフである。この図9においては、利用者が実際に感じる印象において最も歌唱が上手い第1の歌い手(ガイド)の音声情報に対応する値を実線で、比較的歌唱が下手な第2の歌い手の音声情報に対応する値を一点鎖線で、比較的歌唱が上手い第3の歌い手の音声情報に対応する値を二点鎖線で、歌唱が上手くも下手でもない第4の歌い手の音声情報に対応する値を破線でそれぞれ示している。また、各値(サンプル番号)の基準値からの距離値(ユークリッド距離)を縦軸に示している。図9に示す例では、最も歌唱が上手い第1の歌い手に係る距離値の平均値が3.37、比較的歌唱が上手い第3の歌い手に係る距離値の平均値が4.07、歌唱が上手くも下手でもない第4の歌い手に係る距離値の平均値が4.34、比較的歌唱が下手な第2の歌い手に係る距離値の平均値が4.40という結果が得られている。すなわち、図9に示す距離値が小さいほど歌唱が上手いという関係が成立しており、利用者が実際に感じる印象に近い演奏評価を実現できることがわかる。
【0040】
一方、図10は、比較例としてベロシティを考慮しない結果、すなわち複数の利用者それぞれに対応する音声情報に係るn=1〜8に対応する音高データのみについて前述の多変量解析制御乃至演奏評価制御を行った結果を比較して示すグラフである。この図10においては、利用者が実際に感じる印象において最も歌唱が上手い第1の歌い手(ガイド)の音声情報に対応する値を実線で、比較的歌唱が下手な第2の歌い手の音声情報に対応する値を一点鎖線で、比較的歌唱が上手い第3の歌い手の音声情報に対応する値を破線でそれぞれ示している。また、各値(サンプル番号)の基準値からの距離値(ユークリッド距離)を縦軸に示している。図10に示す例では、最も歌唱が上手い第1の歌い手に係る距離値の平均値が2.69、比較的歌唱が上手い第3の歌い手に係る距離値の平均値が2.80、比較的歌唱が下手な第2の歌い手に係る距離値の平均値が2.06というように、最も上手い歌い手の評価と比較的上手い歌い手の評価が逆転していることに加え、比較的歌唱が下手な歌い手の評価に対する相対関係も上記図9の例に比べて狭まっており、評価がしづらい結果となっている。多変量解析においては、一般に解析対象となる対象の種類(何を解析するか)が重要になるが、図9及び図10に比較して示すように、本実施例のように基準データにおける音高の切り替わり部分の演奏評価に関しては、前記音高・音量検出手段86によりN回連続的に検出される単位時間毎の音高及び音量に対応する2N種類のデータを解析することで、利用者が実際に感じる印象に近い演奏評価を実現できるのである。
【0041】
前記評価結果送信手段102は、前記演奏評価手段100による評価結果を前記通信回線18を介して対応する各カラオケ装置16へ送信する。すなわち、評価の対象となった2N種類のデータの送信元であるカラオケ装置16へ、そのデータに係る前記演奏評価手段100による評価結果を送信(返信)する。ここで、好適には、前記カラオケ装置16には、前記演奏評価手段100とは別に、評価の基準データにおける音高の切り替わり部分以外の部分について演奏評価を行うための第2の演奏評価手段が備えられている。この第2の演奏評価手段は、演奏曲の出力に伴って前記マイクロフォン40から入力される音声に応じて演奏の内容を評価する。例えば、前記マイクロフォン40により入力されて前記A/Dコンバータ41によりディジタル信号に変換された音声情報と、図5に示すように定められた基準データとを比較し、メロディなどの基本音程と入力される音声情報から抽出される音高(音程)との相対的なずれやその音声の絶対的な音量(声量)などを基準として評価を行う。そして、好適には、対象となる演奏曲の演奏が終了した時点で、各音高の切り替わり部分に対応して前記評価結果送信手段102から受信された評価結果(演奏評価手段100による評価結果)と、それ以外の部分について第2の演奏評価手段により算出された評価結果とに基づいて、その演奏曲の演奏を通しての総合評価が算出される。
【0042】
図11は、前記カラオケ装置16のCPU50による本実施例のカラオケ演奏評価制御の要部を説明するフローチャートであり、所定の周期で繰り返し実行されるものである。
【0043】
先ず、ステップ(以下、ステップを省略する)SA1において、所定の演奏曲のカラオケ演奏が開始されたか否かが判断される。このSA1の判断が否定される場合には、それをもって本ルーチンが終了させられるが、SA1の判断が肯定される場合には、SA2において、対象となる演奏曲のカラオケデータが前記ハードディスク56のカラオケデータベースから読み出され、対応する演奏情報及び歌詞情報等が前記RAM54に展開される。次に、SA3において、対象となるカラオケ演奏制御すなわち前記シンセサイザ38による演奏音の出力制御及びその演奏の進行に伴う歌詞文字映像の表示制御が開始される。次に、SA4において、基準データにおいて音高が切り替わるタイミングであるか否かが判断される。このSA4の判断が否定される場合には、SA7以下の処理が実行されるが、SA4の判断が肯定される場合には、前記音高・音量検出手段86の動作に対応するSA5において、前記マイクロフォン40により入力される音声情報に関して単位時間毎の音高及び音量がN回連続して検出される。次に、前記検出結果送信手段88の動作に対応するSA6において、SA5にて検出されたN回分の音高データ及び音量データが演奏曲の選曲番号及び該当箇所の時間情報と共に前記通信回線18を介して前記サーバ装置20へ送信される。次に、SA7において、SA6の送信に対応して前記サーバ装置20からの評価結果の受信(返信)があったか否かが判断される。このSA7の判断が否定される場合には、SA9以下の処理が実行されるが、SA7の判断が肯定される場合には、SA8において、受信された評価結果が前記RAM54に記憶されて以降の演奏評価に反映された後、SA9において、カラオケ演奏終了であるか否かが判断される。このSA9の判断が否定される場合には、SA4以下の処理が再び実行されるが、SA9の判断が肯定される場合には、SA10において、SA8にて前記RAM54等に記憶された音高の切り替わり部分に係る演奏評価と、他のプロセスにより算出されたそれ以外の部分に係る演奏評価とに基づいて、対象となるカラオケ演奏全体を通しての総合評価が算出された後、本ルーチンが終了させられる。
【0044】
図12は、前記サーバ装置20のCPU66による本実施例の演奏評価制御に係る多変量解析制御の要部を説明するフローチャートであり、所定の周期で繰り返し実行されるものである。
【0045】
先ず、SB1において、前記カラオケ装置16からN回分の音高データ及び音量データが演奏曲の選曲番号及び該当箇所の時間情報と共に前記通信回線18を介して受信されたか否かが判断される。このSB1の判断が否定される場合には、それをもって本ルーチンが終了させられるが、SB1の判断が肯定される場合には、SB2において、受信されたN回分の音高データ及び音量データが演奏曲の選曲番号及び該当箇所の時間情報と対応付けられて前記多変量解析データベース84に記憶(蓄積)される。次に、SB3において、受信されたN回分の音高データ及び音量データに対応して前述した数式1に示すような特徴ベクトルxが算出される。次に、SB4において、SB3にて算出された特徴ベクトルが分散1、平均1となるように標準化される。次に、前記主成分分析手段92の動作に対応するSB5において、SB4にて標準化された特徴ベクトルに基づいて分散・共分散行列が算出されて主成分分析が行われる。次に、前記固有値・固有ベクトル算出手段94の動作に対応するSB6において、SB5における分析結果に対応して、2N組の固有値・固有ベクトルが算出される。次に、前記分散算出手段96の動作に対応するSB7において、SB6にて算出された固有値・固有ベクトルそれぞれに対応する分散が算出される。次に、前記順位付け手段98の動作に対応するSB8において、SB7にて算出された分散が大きいものから順にSB6にて算出された固有値・固有ベクトルが第1位から第2N位まで順位付けされる。次に、前記演奏評価手段100の動作に対応するSB9において、SB8にて第1位とされた固有ベクトルをパターン空間の軸として使用すると共に、対応する固有値をその軸の単位として使用することにより、受信されたN回分の音高データ及び音量データに係る演奏評価が行われる。次に、前記評価結果送信手段102の動作に対応するSB10において、SB9における評価結果がデータの送信元である前記カラオケ装置16に送信(返信)された後、本ルーチンが終了させられる。以上の制御において、SB3〜SB8が前記多変量解析手段90の動作に対応する。
【0046】
このように、本実施例によれば、音声入力装置であるマイクロフォン40により入力される音声情報に関して単位時間毎の音高及び音量を検出する音高・音量検出手段86(SA5)と、複数の利用者それぞれの音声情報を対象として、前記音高・音量検出手段86によりN回連続的に検出される単位時間毎の音高及び音量に対応する2N種類のデータに関して多変量解析を行う多変量解析手段(SB3〜SB8)と、評価の基準データにおける音高の切り替わり部分において、前記複数の利用者の音声情報に対応する前記多変量解析手段90による解析結果に基づいて、対象となる利用者の音声情報に係る演奏評価を行う演奏評価手段100(SB9)とを、備えたものであることから、高低差のある音高の繋ぎに相当する演奏部分を好適に評価することができる。すなわち、利用者が実際に感じる印象に近い演奏評価を実現するカラオケシステム10を提供することができる。
【0047】
また、前記多変量解析手段90は、前記音高・音量検出手段86により検出される音高の変化の起点をn=0とする、n=1からn=Nまでの前記2N種類のデータに関して主成分分析を行う主成分分析手段92(SB5)と、その主成分分析手段96による分析結果に対応して、2N組の固有値・固有ベクトルを算出する固有値・固有ベクトル算出手段94(SB6)と、その固有値・固有ベクトル算出手段94により算出される2N組の固有値・固有ベクトルに関して、各固有ベクトルを軸とする固有値の分散を算出する分散算出手段96(SB7)と、その分散算出手段96により算出される分散が大きいものから順に前記2N組の固有値・固有ベクトルの順位を決定する順位付け手段98(SB8)とを、含むものであり、前記演奏評価手段100は、その順位付け手段98により決定された順位の高い固有値・固有ベクトルから優先的に前記演奏評価のパラメータとして用いるものであるため、高低差のある音高の繋ぎに相当する演奏部分を実用的な態様で好適に評価することができる。
【0048】
以上、本発明の好適な実施例を図面に基づいて詳細に説明したが、本発明はこれに限定されるものではなく、更に別の態様においても実施される。
【0049】
例えば、前述の実施例において、前記音高・音量検出手段86及び検出結果送信手段88が前記カラオケ装置16のCPU50に、前記多変量解析手段90、演奏評価手段100、及び評価結果送信手段102が前記サーバ装置30のCPU66に備えられたものであったが、本発明はこれに限定されるものではなく、例えば、前記音高・音量検出手段86、多変量解析手段90、及び演奏評価手段100が一元的に前記カラオケ装置16に備えられ、それらの制御手段による処理を前記カラオケ装置16側で実行するものであってもよい。この場合、前記サーバ装置20に備えられていた多変量解析データベース84に相当する情報が前記カラオケ装置16のハードディスク56等に蓄積されるのが好ましいが、前記サーバ装置20の多変量解析データベース84に記憶された情報を前記カラオケ装置16により逐一読み出すことによっても前記実施例と同等の制御が可能である。なお、斯かる態様においては、前記検出結果送信手段88及び評価結果送信手段102は必ずしも設けられなくともよい。
【0050】
また、前述の実施例では、前記音高・音量検出手段86により各利用者の音声情報に対応するデータが検出される毎にそのデータが前記多変量解析データベース84に蓄積されるものであったが、サンプルとなるデータが十分に多変量解析データベース84に蓄積されている場合には、必ずしも毎回の検出結果が新たに蓄積されるものでなくともよい。
【0051】
その他、一々例示はしないが、本発明はその趣旨を逸脱しない範囲内において種々の変更が加えられて実施されるものである。
【符号の説明】
【0052】
10:カラオケシステム
16:カラオケ装置
40:マイクロフォン(音声入力装置)
86:音高・音量検出手段
90:多変量解析手段
92:主成分分析手段
94:固有値・固有ベクトル算出手段
96:分散算出手段
98:順位付け手段
100:演奏評価手段
【技術分野】
【0001】
本発明は、多数の演奏曲のうちから選択される演奏曲を出力させるカラオケ装置を用いたカラオケシステムに関し、特に、利用者が実際に感じる印象に近い演奏評価を実現するための改良に関する。
【背景技術】
【0002】
多数の演奏曲のうちから選択される演奏曲を出力させる音楽再生装置が知られている。例えば、カラオケボックス等で使用されるカラオケ装置がそれである。斯かるカラオケ装置によれば、予め記憶装置に記憶された多数のカラオケ演奏曲から選択されたカラオケ演奏曲の音楽情報を出力させると共に、そのカラオケ演奏曲の歌詞情報を含む映像をその出力に同期して画面に表示させることで、所望の歌のカラオケ演奏を楽しむことができる。
【0003】
ところで、近年普及しているカラオケ装置には、上述のような音楽再生装置としての機能のみならず、音声入力装置(マイクロフォン)から入力される音声情報に基づいて歌唱力等を評価(採点)する演奏評価機能を備えたものがある。例えば、特許文献1に記載されたカラオケ装置がそれである。斯かるカラオケ装置によれば、音程、テンポ、音量等を基準として音声入力装置から入力される音声情報とカラオケ演奏曲の演奏情報とを比較することで、その入力される音声情報に応じて歌唱の評価を採点することができる。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開平9−101794号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかし、上述した従来技術のような演奏評価は、通常、予め定められたアルゴリズムに従い、MIDI(Musical Instrument Digital Interface)データ等の演奏情報を基準データとして機械的に行われるものであったことから、利用者が実際に上手いと感じる演奏に正当な評価が与えられなかったり、逆に歌い方によっては下手な演奏に高い評価が与えられるというように、利用者の感じ方と演奏評価とか必ずしも一致しないという不具合があった。
【0006】
本発明者は、利用者が実際に感じる印象に近い演奏評価を実現するカラオケシステムを開発すべく鋭意研究を継続する過程において、特に基準データにおいて音高が切り替わる演奏部分に関して利用者の印象と演奏評価結果とが乖離する傾向が強いことに着目した。そして、斯かる演奏部分について利用者の印象と演奏評価結果とが乖離するのは、基準データにおける音高の切り替わりが段階的であるのに対して利用者の歌唱音声の時間変化は連続的であり、たとえ高低差のある音高の繋ぎを上手く歌ったとしてもそれを正しく評価することができないためであると考えた。換言すれば、利用者が実際に感じる印象において、高低差のある音高の繋ぎに相当する演奏部分をどのように歌うかということに関する評価は無視できない重要な要素であるが、斯かる演奏部分を好適に評価し得るカラオケシステムは、未だ開発されていないのが現状である。
【0007】
本発明は、以上の事情を背景として為されたものであり、その目的とするところは、利用者が実際に感じる印象に近い演奏評価を実現するカラオケシステムを提供することにある。
【課題を解決するための手段】
【0008】
斯かる目的を達成するために、本発明の要旨とするところは、多数の演奏曲のうちから選択される演奏曲を出力させると共に音声入力装置により入力される音声を増幅して出力させるカラオケ装置を用いたカラオケシステムであって、前記音声入力装置により入力される音声情報に関して単位時間毎の音高及び音量を検出する音高・音量検出手段と、複数の利用者それぞれの音声情報を対象として、前記音高・音量検出手段によりN回連続的に検出される単位時間毎の音高及び音量に対応する2N種類のデータに関して多変量解析を行う多変量解析手段と、評価の基準データにおける音高の切り替わり部分において、前記複数の利用者の音声情報に対応する前記多変量解析手段による解析結果に基づいて、対象となる利用者の音声情報に係る演奏評価を行う演奏評価手段とを、備えたことを特徴とするものである。
【発明の効果】
【0009】
このようにすれば、前記音声入力装置により入力される音声情報に関して単位時間毎の音高及び音量を検出する音高・音量検出手段と、複数の利用者それぞれの音声情報を対象として、前記音高・音量検出手段によりN回連続的に検出される単位時間毎の音高及び音量に対応する2N種類のデータに関して多変量解析を行う多変量解析手段と、評価の基準データにおける音高の切り替わり部分において、前記複数の利用者の音声情報に対応する前記多変量解析手段による解析結果に基づいて、対象となる利用者の音声情報に係る演奏評価を行う演奏評価手段とを、備えたものであることから、高低差のある音高の繋ぎに相当する演奏部分を好適に評価することができる。すなわち、利用者が実際に感じる印象に近い演奏評価を実現するカラオケシステムを提供することができる。
【0010】
ここで、好適には、前記多変量解析手段は、前記音高・音量検出手段により検出される音高の変化の起点をn=0とする、n=1からn=Nまでの前記2N種類のデータに関して主成分分析を行う主成分分析手段と、その主成分分析手段による分析結果に対応して、2N組の固有値・固有ベクトルを算出する固有値・固有ベクトル算出手段と、その固有値・固有ベクトル算出手段により算出される2N組の固有値・固有ベクトルに関して、各固有ベクトルを軸とする固有値の分散を算出する分散算出手段と、その分散算出手段により算出される分散が大きいものから順に前記2N組の固有値・固有ベクトルの順位を決定する順位付け手段とを、含むものであり、前記演奏評価手段は、その順位付け手段により決定された順位の高い固有値・固有ベクトルから優先的に前記演奏評価のパラメータとして用いるものである。このようにすれば、高低差のある音高の繋ぎに相当する演奏部分を実用的な態様で好適に評価することができる。
【図面の簡単な説明】
【0011】
【図1】本発明が好適に適用されるカラオケシステムを説明する概略図である。
【図2】図1のカラオケシステムに備えられたカラオケ装置の構成を例示するブロック線図である。
【図3】図1のカラオケシステムに備えられたサーバ装置の構成を例示するブロック線図である。
【図4】図2のカラオケ装置のCPU及び図3のサーバ装置のCPUに備えられた制御機能の要部を説明する機能ブロック線図である。
【図5】本実施例を含む一般的なカラオケ演奏評価制御に用いられる基準データについて説明する図であり、入力音声情報の実測値を実線で、評価の基準となる基準データを破線で囲繞した領域でそれぞれ示している。
【図6】図5に示すような基準データに基づく演奏評価制御の問題点を説明する図である。
【図7】図2に示す本実施例のカラオケ装置による、基準データにおける音高の切り替わり部分においての音高及び音量の検出について説明する図である。
【図8】図2に示す本実施例のカラオケ装置により算出される2N組の固有値・固有ベクトルのうち2本の固有ベクトルを示すパターン空間を例示しており、各サンプルの値を複数の点で示している。
【図9】図1に示す本実施例のカラオケシステムによる演奏評価制御の効果を検証するために、複数の利用者それぞれに対応する音声情報に係るn=1〜8の音高データ及び音量データについて多変量解析制御乃至演奏評価制御を行った結果を比較して示すグラフである。
【図10】図9の比較例としてベロシティを考慮しない結果、すなわち複数の利用者それぞれに対応する音声情報に係るn=1〜8に対応する音高データのみについて多変量解析制御乃至演奏評価制御を行った結果を比較して示すグラフである。
【図11】図2のカラオケ装置のCPUによる本実施例のカラオケ演奏評価制御の要部を説明するフローチャートである。
【図12】図3のサーバ装置のCPUによる本実施例のカラオケ演奏評価制御に係る多変量解析制御の要部を説明するフローチャートである。
【発明を実施するための形態】
【0012】
以下、本発明の好適な実施例を図面に基づいて詳細に説明する。
【実施例】
【0013】
図1は、本発明が好適に適用されるカラオケシステム10を説明する概略図である。この図1に示すように、本実施例のカラオケシステム10では、カラオケボックス、スナック、旅館等の店舗12における複数の個室14a、14b、14c、・・・(以下、特に区別しない場合には単に個室14と称する)にそれぞれ1台乃至は複数台ずつ(図1では1台ずつ)のカラオケ装置16a、16b、16c、・・・(以下、特に区別しない場合には単にカラオケ装置16と称する)が設置されている。これら複数のカラオケ装置16は、ルータ28を介して公衆電話回線等による通信回線18に接続されており、同じくその通信回線18に接続されたカラオケサービス提供会社のサーバ装置(センタ装置)20との相互間でその通信回線18を介して情報の通信が可能とされている。
【0014】
上記サーバ装置20は、カラオケ情報(楽曲データ)、背景映像情報、曲間情報等のデジタルコンテンツ(Digital Contents)の保管や入出力管理等の基本的な制御に加えて、後述する多変量解析制御等を行うサーバであり、上記通信回線18を介して上記カラオケ装置16に定期的にコンテンツの配信を行うと共に、そのカラオケ装置16からの要求に応じて所定の機能制御プログラムを送信する等の制御を行うものである。また、上記カラオケシステム10は、複数の電子早見本装置22a、22b、22c、・・・(以下、特に区別しない場合には単に電子早見本装置22と称する)を備えており、上記カラオケ装置16の利用に際して、各利用者(グループ)毎に1台ずつの電子早見本装置22が貸与され、各個室14において後述するように上記カラオケ装置16の遠隔操作装置として用いられるようになっている。上記店舗12内には上記複数のカラオケ装置16を相互に接続するLAN24が敷設されており、上記電子早見本装置22からのカラオケ装置16への入力は、所定のアクセスポイント26及びLAN24を介したLAN通信等により行われる。
【0015】
図2は、前記カラオケ装置16の構成を例示するブロック線図である。この図2に示すように、前記カラオケ装置16は、TFT(Thin Film Transistor Liquid Crystal)等の映像表示装置30と、映像出力制御部32と、映像情報デコーダ34と、ビデオミキサ36と、音源であるシンセサイザ38と、音声入力装置であるマイクロフォン40と、A/Dコンバータ41と、アンプミキサ42と、スピーカ44と、操作パネル46と、その操作パネル46等からの入力信号を処理する入出力インターフェイス48と、中央演算処理装置であるCPU50と、読出専用メモリであるROM52と、随時書込読出メモリであるRAM54と、記憶装置であるハードディスク56と、モデム58と、LANポート60と、上記電子早見本装置22やリモコン装置64等の入力装置からのリモコン信号を受信するためのリモコン受信部62とを、備えて構成されている。
【0016】
前記映像出力制御部32は、前記CPU50において生成された歌詞文字映像等の文字映像(テロップ)を出力する文字映像出力装置として機能する他、前記映像表示装置30による種々の映像表示を制御する表示制御装置である。また、前記映像情報デコーダ34は、利用者が歌詞を参照しながら歌を歌う際に前記ハードディスク56に記憶された背景映像情報に基づいて所定の背景映像を再生(デコード)する背景映像再生装置である。この背景映像情報は、例えば、MPEG(Moving Picture Experts Group)形式のデータであり、そのMPEGデータに基づいて前記映像情報デコーダ34により再生された背景映像は、前記ビデオミキサへ送られる。また、前記ビデオミキサ36は、前記CPU50において生成され且つ前記映像出力制御部32から出力される文字映像と、前記映像情報デコーダ34により再生される背景映像とを合成して前記映像表示装置30に表示させる映像合成装置である。
【0017】
前記シンセサイザ38は、前記ハードディスク56から読み出されて送られて来るカラオケ演奏曲の演奏情報に基づいて楽器の演奏信号等の音楽信号を生成する音源である。この演奏情報は、例えば、MIDI(Musical Instrument Digital Interface)形式のデータであり、そのMIDIデータに基づいて前記シンセサイザ38により生成された音楽信号は、アナログ信号に変換されて前記アンプミキサ42へ送られる。そのアンプミキサ42では、送られてきた音楽信号と前記マイクロフォン40を介して入力される利用者の歌声とがミキシングされ、それらの信号が電気的に増幅されて前記スピーカ44から出力される。また、前記A/Dコンバータ41は、音声入力装置である前記マイクロフォン40から入力されるアナログ信号としての音声情報をディジタル信号に変換して前記CPU50等へ供給する。
【0018】
前記操作パネル46は、前記カラオケ装置16の利用者が歌いたいカラオケ演奏曲を選択したり、演奏曲の音程を調整したり、演奏と歌との音量バランスを調整したり、その他、エコー、音量、トーン等の各種調整を行うための操作ボタン(スイッチ)或いはつまみを備えた入力装置である。また、前記カラオケ装置16には、前記操作パネル46の一部機能を遠隔で実行するための入力装置として機能するリモコン装置64が備えられており、前記リモコン受信部62は、そのリモコン装置64から送信されるリモコン信号を受信して前記CPU50へ供給する。また、前記カラオケ装置16と電子早見本装置22との対応付け(くくりつけ)処理も前記リモコン受信部62を介して行われ、そのようにして前記カラオケ装置16に対応付けられた電子早見本装置22も同様に入力装置として機能する。
【0019】
上記CPU50は、上記RAM54の一時記憶機能を利用しつつ上記ROM52に予め記憶された所定のプログラムに基づいて電子情報を処理・制御する所謂マイクロコンピュータであり、上記電子早見本装置22やリモコン装置64等により所定のカラオケ演奏曲が選曲された場合、その選曲されたカラオケ演奏曲を上記RAM54に設けられた予約曲テーブルに登録したり、その予約曲テーブルの演奏順に従って上記ハードディスク56から上記RAM54に選曲されたカラオケ演奏曲の演奏情報及び歌詞情報等を読み出したり、カラオケ演奏曲の演奏が進行するのに応じてそのRAM54から上記シンセサイザ38へ演奏情報を送信したり、歌詞情報に基づいて歌詞文字映像を生成して上記映像出力制御部32へ送ったり、選曲時には曲名文字映像を生成して上記映像出力制御部32へ送ったり、上記映像情報デコーダ34を制御して所定の背景映像を再生させたり、カラオケ演奏が行われていない間すなわち曲間において、新譜情報、選曲ランキング、店舗広告等の曲間情報を出力させたり、前記通信回線18を介した前記サーバ装置20との間の情報通信制御等の基本的な制御に加えて、後述する演奏評価制御に係る各種制御を実行する。
【0020】
前記モデム58は、前記カラオケ装置16を公衆電話回線等による通信回線18に接続するための装置であり、前記CPU50から出力されるディジタル信号をアナログ信号に変換して前記通信回線18に送り出すと共に、その通信回線18を介して伝送されるアナログ信号をディジタル信号に変換して前記CPU50に供給する処理を行う。なお、前記店舗12に備えられた複数のカラオケ装置16のうち何れかのカラオケ装置16が前記ルータ28の機能を備えてマスターコマンダとして前記通信回線18に接続される態様も考えられ、その場合、前記モデム58はそのマスターコマンダとして機能するカラオケ装置16には必要とされるが、そのマスターコマンダを介して前記サーバ装置20との間で情報の通信を行う他のカラオケ装置16には必ずしも設けられなくともよい。
【0021】
前記LANポート60は、前記カラオケ装置16をLAN24を介して他のカラオケ装置16や電子早見本装置22等の他の機器に接続するための接続器であり、前記カラオケ装置16は、そのようにLAN24を介して接続されることで、他のカラオケ装置16や電子早見本装置22等の他の機器との間で情報の送受信が可能とされる。例えば、前記アクセスポイント26を介して受信される前記電子早見本装置22からの選曲入力を受け付けて前記RAM54に設けられた予約曲テーブルに記憶したり、そのアクセスポイント26を介して前記カラオケ装置16から電子早見本装置22へ所定の情報を送信したりというように、電波を介して前記カラオケ装置16と電子早見本装置22との間における相互の情報のやりとりが実行される。
【0022】
前記ハードディスク56には、カラオケ演奏曲を出力させるための多数のカラオケ情報(楽曲データ)を記憶するカラオケデータベースをはじめとする各種データベースが設けられている。カラオケボックス等の店舗にそれぞれ備えられた複数のカラオケ装置16のうち所定のカラオケ装置16例えば前記カラオケ装置16aは、前記モデム58を介して前記通信回線18に接続されており、前記複数のカラオケ装置16によって常に新しい曲が演奏可能とされるように、随時新たな楽曲データ等が前記サーバ装置20から前記通信回線18を介して配信され、前記ハードディスク56のカラオケデータベース等に記憶される。また、そのようにして前記サーバ装置20から情報を取得したカラオケ装置16aとその他のカラオケ装置16との間で前記LAN24を介した通信が行われることにより、各カラオケ装置16のハードディスク56に記憶される情報が共有され、上記カラオケデータベース等の内容が等価なものとされる。
【0023】
上記カラオケデータベースに記憶されるカラオケ情報(カラオケデータ)は、演奏音を生成するための演奏情報及び歌詞文字映像(歌詞テロップ)を生成するための歌詞情報から成るものであり、コンテンツIDである各演奏曲に固有の選曲番号により識別される。このカラオケ情報に含まれる演奏情報は、例えば前記シンセサイザ38により所定の演奏音を出力させるためのMIDIデータであり、出力に係る演奏音(楽器)の種類と、各演奏音に対応する楽譜情報とを、含んでいる。また、上記歌詞情報は、前記映像出力制御部32等を介して演奏曲の歌詞文字映像を出力させるためのデータであり、前記歌詞文字映像に対応する歌詞のテキスト情報と、演奏出力に併行してその歌詞文字映像の表示を切り替えるための切替タイミング情報と、演奏出力に併行してその歌詞文字映像を順次色替えするための色替タイミング情報とを、含んでいる。また、後述する演奏評価制御の基準となる図5に示すような基準データが定められている。なお、この基準データは、上記カラオケデータベースに記憶されるカラオケ情報とは別に、各演奏曲の選曲番号と関連付けられて記憶されたものであってもよい。
【0024】
図3は、前記サーバ装置20の構成を説明するブロック線図である。この図3に示すように、前記サーバ装置20は、中央演算処理装置であるCPU66によりRAM70の一時記憶機能を利用しつつROM68に予め記憶されたプログラムに従って信号処理を行う所謂マイクロコンピュータシステムを備えており、前記カラオケ装置16へのカラオケ情報等のコンテンツ配信制御をはじめとする基本的な制御に加えて、後述する多変量解析制御等の各種制御を実行する。また、ビデオボード72により制御されるTFT等の映像表示装置74と、インターフェイス78を介して接続されるキーボード等の入力装置76と、上記CPU66を前記通信回線18に接続するための装置であるモデム80とを、備えて構成されている。また、それぞれハードディスク等の大容量記憶装置に、前記カラオケ装置16に配信するための多数のカラオケ情報を記憶するカラオケデータベース82や後述する多変量解析制御に関する各種情報を記憶する多変量解析データベース84等の各種データベースが設けられている。
【0025】
図4は、前記カラオケ装置16のCPU50及び前記サーバ装置30のCPU66に備えられた制御機能の要部を説明する機能ブロック線図である。この図4に示す各種制御手段に関して、好適には、音高・音量検出手段86及び検出結果送信手段88が前記カラオケ装置16のCPU50に、多変量解析手段90、演奏評価手段100、及び評価結果送信手段102が前記サーバ装置30のCPU66に備えられたものであるが、上記音高・音量検出手段86、多変量解析手段90、及び演奏評価手段100が一元的に前記カラオケ装置16に備えられた態様も考えられる。
【0026】
上記音高・音量検出手段86は、前記マイクロフォン40により入力される音声情報に関して単位時間毎の音高及び音量を検出する。例えば、前記マイクロフォン40により入力されて前記A/Dコンバータ41によりディジタル信号に変換された音声情報に関して、例えば0.025秒程度の極めて短い単位時間毎にその音声情報の要素としての音高(ピッチ)及び音量(ベロシティ)を検出する。具体的には、前記A/Dコンバータ41を介して入力される音声情報に対応する波形を前記RAM54等に記憶しておき、その波形を適宜読み出して解析することで、対象となる単位時間に相当する音高及び音量を数値的に算出する。
【0027】
前記音高・音量検出手段86は、本実施例の演奏評価制御に関して、その演奏評価の基準データにおける音高の切り替わり部分において上記検出を行う。図5は、本実施例を含む一般的なカラオケ演奏評価制御に用いられる基準データについて説明する図であり、前記マイクロフォン40により入力された音声情報の実測値を実線で、評価の基準となる基準データ(お手本データ)を破線で囲繞した領域でそれぞれ示している。この図5に示すように、前記カラオケ装置16によるカラオケ演奏の評価に用いられる基準データは、対象となる演奏曲の進行(時間経過)に対応して所定の音高帯域(例えば、ガイドメロディを中心とする一定の音程幅)が段階的に定められたものである。換言すれば、高低差のある音高の切り替わり部分においては、低音側の音高帯域から高音側の音高帯域へ、或いは高音側の音高帯域から低音側の音高帯域へ、繋ぎを考慮せず即時的に移行するように基準データが定められている。
【0028】
図5に示すように定められた基準データに基づく演奏評価制御では、例えば、前記マイクロフォン40により入力された音声情報の実測値がその基準データの範囲に入るか否かが判定される。すなわち、対象となる音声情報の実測値が基準データの範囲に入る場合には正しい音高で歌っているものと評価される一方、基準データの範囲から逸脱する場合には正しい音高で歌えていないものと評価される。そして、図5に示すように対象となる演奏曲の進行に伴って段階的に定められた基準データに関して、前記マイクロフォン40により入力される音声情報に関して検出される所定時間毎の音高がその基準データに入るか否かの判定が連続的に実行されることで、その演奏曲全体としての演奏評価(総合評価)が行われる。
【0029】
図6は、図5に示すような基準データに基づく演奏評価制御の問題点を説明する図である。前述のように、評価の基準データが演奏曲の進行に伴って段階的に定められたものである場合には、高低差のある音高の切り替わり部分における評価が問題となる。すなわち、斯かる音高の切り替わり部分において、低音側の音高帯域から高音側の音高帯域へ、或いは高音側の音高帯域から低音側の音高帯域へ、繋ぎを考慮せず即時的に移行するように基準データが定められていることから、立ち上がりにおける音声情報の実測値が切り替わり前乃至切り替わり後の何れの基準データにも入らず、その部分を上手く歌ったとしても正しい評価が行われなかった。これは、基準データにおける音高の切り替わりが段階的であるのに対して前記マイクロフォン40により検出される利用者の歌唱音声の時間変化は連続的であり、高低差のある音高の切り替わり部分においてはその音高(音程)が漸増乃至漸減することで滑らかで自然な歌い方となるからである。
【0030】
図7は、基準データにおける音高の切り替わり部分においての前記音高・音量検出手段86による音高及び音量の検出について説明する図である。この図7に示すように、前記音高・音量検出手段86は、好適には、評価の基準データにおける音高の切り替わり部分において、前記マイクロフォン40により検出される音声情報における音高の変化の起点をn=0とする、n=1からn=Nまでの音高及び音量を検出する。ここで、nは前記音高・音量検出手段86の検出単位である前記単位時間それぞれの検出結果に対して付される符号であり、Nは好適には6〜10の整数、最適には8である。すなわち、前記音高・音量検出手段86は、好適には、前記マイクロフォン40により検出される音声情報における音高の変化の起点をn=0とする、n=1からn=8までの0.2秒間(単位時間0.025×8)における8単位分の音高及び音量を検出する。なお、上記音高の変化の起点としては、図7に示すように、対象となる基準データの切り替わり直後において音高が変化(低音側から高音側への切り替わり部分においては上昇、高音側から低音側への切り替わり部分においては下降)し始めた瞬間をn=1(変化の直前としての起点をn=0)とするのが好ましいが、例えば基準データの切り替わりの瞬間をn=0とするように基準データに基づいて予め定められたものであってもよい。
【0031】
前記検出結果送信手段88は、前記通信回線18を介して前記音高・音量検出手段86による検出結果を前記サーバ装置20における多変量解析データベース84へ送信乃至蓄積する。すなわち、前記音高・音量検出手段86により検出されたn=1からn=Nまでの音高データ及び音量データを、対象となる演奏曲の識別情報(選曲番号)及びn=1〜Nの検出時点(例えば曲の演奏開始からの経過時点)、更には演奏者(音声情報の入力主体)である利用者の識別情報と関連付けて前記多変量解析データベース84に記憶する。そのようにして、斯かる多変量解析データベース84には、それぞれの演奏曲に係る基準データにおける各音高の切り替わり部分毎に、前記複数のカラオケ装置16において検出されたn=1〜Nの音高データ及び音量データが蓄積される。すなわち、各基準データにおける音高の切り替わり部分毎に、複数の利用者それぞれの音声情報を対象として、前記音高・音量検出手段86によりN回連続的に検出された単位時間毎の音高及び音量に対応する2N種類のデータ(音高データN個+音量データN個=2N個のデータ)がサンプルとして蓄積されるようになっている。
【0032】
前記多変量解析手段90は、上述のように多変量解析データベース84に蓄積されたデータ、すなわち複数の利用者それぞれの音声情報を対象として、前記音高・音量検出手段86によりN回連続的に検出された単位時間毎の音高及び音量に対応する2N種類のデータに関して多変量解析を行う。斯かる制御を行うために、前記多変量解析手段90は、図4に示すように主成分分析手段92、固有値・固有ベクトル算出手段94、分散算出手段96、及び順位付け手段98を含んでいる。以下、これらの制御手段それぞれの制御について分説する。
【0033】
上記主成分分析手段92は、各基準データにおける音高の切り替わり部分に対応して前記多変量解析データベース84に蓄積された2N種類のデータに関して、よく知られた主成分分析法(Principal Component Analysis)による主成分分析を行う。すなわち、各利用者それぞれの音声情報(対応する切り替わり部分に係るn=1〜8、16種類のデータ)に関して、次の数式1に示すような特徴ベクトルxを算出する。なお、この数式1におけるP(n)は、n番目の音高(入力ピッチ)をPi(n)、n番目のお手本ピッチをPm(n)としてPi(n)−Pm(n)で表される値であり、V(n)は、n番目の音量(ベロシティ)をVe(n)としてVe(n)−Ve(n-1)で表される値である。また、前述のように好適にはN=8である。また、前記主成分分析手段92は、上述のように算出された複数の利用者の音声情報に対応する特徴ベクトルxを標準化する。例えば、それら複数の特徴ベクトルxを分散1、平均1となるように標準化する。そして、そのようにして標準化された複数の特徴ベクトルxに基づいて分散・共分散行列を求めることにより主成分分析を行う。
【0034】
[数式1]
x={P(n),P(n+1),・・・,P(n+N),V(n),V(n+1),・・・,V(n+N)}
【0035】
前記固有値・固有ベクトル算出手段94は、前記主成分分析手段92による分析結果に対応して、2N組の固有値・固有ベクトルを算出する。前述のようにN=8である場合には、前記主成分分析手段92による分析結果に対応して16組の固有値・固有ベクトルを算出する。この固有値・固有ベクトル算出手段94により算出された固有値・固有ベクトルは以下の制御におけるパラメータとして用いられ、その固有ベクトルがパターン空間の軸として使用されると共に、対応する固有値がその軸の単位として使用される。
【0036】
前記分散算出手段96は、前記固有値・固有ベクトル算出手段94により算出される2N組の固有値・固有ベクトルに関して、各固有ベクトルを軸とする固有値の分散を算出する。また、前記順位付け手段98は、前記分散算出手段96により算出される分散が大きいものから順に前記2N組の固有値・固有ベクトルの順位を決定する。図8は、前記固有値・固有ベクトル算出手段94により算出される2N組の固有値・固有ベクトルのうち2本の固有ベクトルv1、v2を示すパターン空間を例示しており、各サンプルの値を複数の点(ドット)で示している。この図8に示す例では、固有ベクトルv1を軸とするものの方が、固有ベクトルv2を軸とするものよりも分散が大きいことがわかる。前記順位付け手段98は、前記固有値・固有ベクトル算出手段94により算出される2N組の固有値・固有ベクトルそれぞれについて前記分散算出手段96により算出される分散について斯かる比較を行うことにより、それらの固有値・固有ベクトルを分散が大きいものから順に第1位から第2N位まで順位付けする。
【0037】
前記演奏評価手段100は、評価の基準データにおける音高の切り替わり部分において、前記複数の利用者の音声情報に対応する前記多変量解析手段90による解析結果に基づいて、対象となる利用者の音声情報に係る演奏評価を行う。すなわち、前記固有値・固有ベクトル算出手段94により算出された固有ベクトルをパターン空間の軸として使用すると共に、対応する固有値をその軸の単位として使用することにより、基準値(例えば、対象となる固有ベクトルに係る平均値)からの各利用者に対応する値の偏差を求め、その偏差に対応する評価結果を算出する。好適には、斯かる基準値からの偏差が小さいほど高い評価となるように(偏差が大きいほど低い評価となるように)予め定められた関係から、各基準データにおける音高の切り替わり部分毎に算出される固有値・固有ベクトルをパラメータとして、それぞれの利用者の音声情報に対応する2N種類のデータに基づいて斯かる演奏評価を行う。
【0038】
前記演奏評価手段100は、好適には、順位付け手段により決定された順位の高い固有値・固有ベクトルから優先的に前記演奏評価のパラメータとして用いる。例えば、各基準データにおける音高の切り替わり部分に対応して前記固有値・固有ベクトル算出手段94により算出される2N種類の固有値・固有ベクトルのうち、前記順位付け手段98により最も高い順位(第1位)に順位付けされた固有ベクトルをパターン空間の軸として使用すると共に、対応する固有値をその軸の単位として前記評価を行う。すなわち、斯かる第1位の固有値・固有ベクトルに対応する基準値からの偏差が小さいほど高い評価となるように(偏差が大きいほど低い評価となるように)予め定められた関係から、それぞれの利用者の音声情報に対応する2N種類のデータに基づいて斯かる演奏評価を行う。
【0039】
図9は、本実施例の演奏評価制御の効果を検証するために、複数の利用者それぞれに対応する音声情報に係るn=1〜8の音高データ及び音量データについて前述の多変量解析制御乃至演奏評価制御を行った結果を比較して示すグラフである。この図9においては、利用者が実際に感じる印象において最も歌唱が上手い第1の歌い手(ガイド)の音声情報に対応する値を実線で、比較的歌唱が下手な第2の歌い手の音声情報に対応する値を一点鎖線で、比較的歌唱が上手い第3の歌い手の音声情報に対応する値を二点鎖線で、歌唱が上手くも下手でもない第4の歌い手の音声情報に対応する値を破線でそれぞれ示している。また、各値(サンプル番号)の基準値からの距離値(ユークリッド距離)を縦軸に示している。図9に示す例では、最も歌唱が上手い第1の歌い手に係る距離値の平均値が3.37、比較的歌唱が上手い第3の歌い手に係る距離値の平均値が4.07、歌唱が上手くも下手でもない第4の歌い手に係る距離値の平均値が4.34、比較的歌唱が下手な第2の歌い手に係る距離値の平均値が4.40という結果が得られている。すなわち、図9に示す距離値が小さいほど歌唱が上手いという関係が成立しており、利用者が実際に感じる印象に近い演奏評価を実現できることがわかる。
【0040】
一方、図10は、比較例としてベロシティを考慮しない結果、すなわち複数の利用者それぞれに対応する音声情報に係るn=1〜8に対応する音高データのみについて前述の多変量解析制御乃至演奏評価制御を行った結果を比較して示すグラフである。この図10においては、利用者が実際に感じる印象において最も歌唱が上手い第1の歌い手(ガイド)の音声情報に対応する値を実線で、比較的歌唱が下手な第2の歌い手の音声情報に対応する値を一点鎖線で、比較的歌唱が上手い第3の歌い手の音声情報に対応する値を破線でそれぞれ示している。また、各値(サンプル番号)の基準値からの距離値(ユークリッド距離)を縦軸に示している。図10に示す例では、最も歌唱が上手い第1の歌い手に係る距離値の平均値が2.69、比較的歌唱が上手い第3の歌い手に係る距離値の平均値が2.80、比較的歌唱が下手な第2の歌い手に係る距離値の平均値が2.06というように、最も上手い歌い手の評価と比較的上手い歌い手の評価が逆転していることに加え、比較的歌唱が下手な歌い手の評価に対する相対関係も上記図9の例に比べて狭まっており、評価がしづらい結果となっている。多変量解析においては、一般に解析対象となる対象の種類(何を解析するか)が重要になるが、図9及び図10に比較して示すように、本実施例のように基準データにおける音高の切り替わり部分の演奏評価に関しては、前記音高・音量検出手段86によりN回連続的に検出される単位時間毎の音高及び音量に対応する2N種類のデータを解析することで、利用者が実際に感じる印象に近い演奏評価を実現できるのである。
【0041】
前記評価結果送信手段102は、前記演奏評価手段100による評価結果を前記通信回線18を介して対応する各カラオケ装置16へ送信する。すなわち、評価の対象となった2N種類のデータの送信元であるカラオケ装置16へ、そのデータに係る前記演奏評価手段100による評価結果を送信(返信)する。ここで、好適には、前記カラオケ装置16には、前記演奏評価手段100とは別に、評価の基準データにおける音高の切り替わり部分以外の部分について演奏評価を行うための第2の演奏評価手段が備えられている。この第2の演奏評価手段は、演奏曲の出力に伴って前記マイクロフォン40から入力される音声に応じて演奏の内容を評価する。例えば、前記マイクロフォン40により入力されて前記A/Dコンバータ41によりディジタル信号に変換された音声情報と、図5に示すように定められた基準データとを比較し、メロディなどの基本音程と入力される音声情報から抽出される音高(音程)との相対的なずれやその音声の絶対的な音量(声量)などを基準として評価を行う。そして、好適には、対象となる演奏曲の演奏が終了した時点で、各音高の切り替わり部分に対応して前記評価結果送信手段102から受信された評価結果(演奏評価手段100による評価結果)と、それ以外の部分について第2の演奏評価手段により算出された評価結果とに基づいて、その演奏曲の演奏を通しての総合評価が算出される。
【0042】
図11は、前記カラオケ装置16のCPU50による本実施例のカラオケ演奏評価制御の要部を説明するフローチャートであり、所定の周期で繰り返し実行されるものである。
【0043】
先ず、ステップ(以下、ステップを省略する)SA1において、所定の演奏曲のカラオケ演奏が開始されたか否かが判断される。このSA1の判断が否定される場合には、それをもって本ルーチンが終了させられるが、SA1の判断が肯定される場合には、SA2において、対象となる演奏曲のカラオケデータが前記ハードディスク56のカラオケデータベースから読み出され、対応する演奏情報及び歌詞情報等が前記RAM54に展開される。次に、SA3において、対象となるカラオケ演奏制御すなわち前記シンセサイザ38による演奏音の出力制御及びその演奏の進行に伴う歌詞文字映像の表示制御が開始される。次に、SA4において、基準データにおいて音高が切り替わるタイミングであるか否かが判断される。このSA4の判断が否定される場合には、SA7以下の処理が実行されるが、SA4の判断が肯定される場合には、前記音高・音量検出手段86の動作に対応するSA5において、前記マイクロフォン40により入力される音声情報に関して単位時間毎の音高及び音量がN回連続して検出される。次に、前記検出結果送信手段88の動作に対応するSA6において、SA5にて検出されたN回分の音高データ及び音量データが演奏曲の選曲番号及び該当箇所の時間情報と共に前記通信回線18を介して前記サーバ装置20へ送信される。次に、SA7において、SA6の送信に対応して前記サーバ装置20からの評価結果の受信(返信)があったか否かが判断される。このSA7の判断が否定される場合には、SA9以下の処理が実行されるが、SA7の判断が肯定される場合には、SA8において、受信された評価結果が前記RAM54に記憶されて以降の演奏評価に反映された後、SA9において、カラオケ演奏終了であるか否かが判断される。このSA9の判断が否定される場合には、SA4以下の処理が再び実行されるが、SA9の判断が肯定される場合には、SA10において、SA8にて前記RAM54等に記憶された音高の切り替わり部分に係る演奏評価と、他のプロセスにより算出されたそれ以外の部分に係る演奏評価とに基づいて、対象となるカラオケ演奏全体を通しての総合評価が算出された後、本ルーチンが終了させられる。
【0044】
図12は、前記サーバ装置20のCPU66による本実施例の演奏評価制御に係る多変量解析制御の要部を説明するフローチャートであり、所定の周期で繰り返し実行されるものである。
【0045】
先ず、SB1において、前記カラオケ装置16からN回分の音高データ及び音量データが演奏曲の選曲番号及び該当箇所の時間情報と共に前記通信回線18を介して受信されたか否かが判断される。このSB1の判断が否定される場合には、それをもって本ルーチンが終了させられるが、SB1の判断が肯定される場合には、SB2において、受信されたN回分の音高データ及び音量データが演奏曲の選曲番号及び該当箇所の時間情報と対応付けられて前記多変量解析データベース84に記憶(蓄積)される。次に、SB3において、受信されたN回分の音高データ及び音量データに対応して前述した数式1に示すような特徴ベクトルxが算出される。次に、SB4において、SB3にて算出された特徴ベクトルが分散1、平均1となるように標準化される。次に、前記主成分分析手段92の動作に対応するSB5において、SB4にて標準化された特徴ベクトルに基づいて分散・共分散行列が算出されて主成分分析が行われる。次に、前記固有値・固有ベクトル算出手段94の動作に対応するSB6において、SB5における分析結果に対応して、2N組の固有値・固有ベクトルが算出される。次に、前記分散算出手段96の動作に対応するSB7において、SB6にて算出された固有値・固有ベクトルそれぞれに対応する分散が算出される。次に、前記順位付け手段98の動作に対応するSB8において、SB7にて算出された分散が大きいものから順にSB6にて算出された固有値・固有ベクトルが第1位から第2N位まで順位付けされる。次に、前記演奏評価手段100の動作に対応するSB9において、SB8にて第1位とされた固有ベクトルをパターン空間の軸として使用すると共に、対応する固有値をその軸の単位として使用することにより、受信されたN回分の音高データ及び音量データに係る演奏評価が行われる。次に、前記評価結果送信手段102の動作に対応するSB10において、SB9における評価結果がデータの送信元である前記カラオケ装置16に送信(返信)された後、本ルーチンが終了させられる。以上の制御において、SB3〜SB8が前記多変量解析手段90の動作に対応する。
【0046】
このように、本実施例によれば、音声入力装置であるマイクロフォン40により入力される音声情報に関して単位時間毎の音高及び音量を検出する音高・音量検出手段86(SA5)と、複数の利用者それぞれの音声情報を対象として、前記音高・音量検出手段86によりN回連続的に検出される単位時間毎の音高及び音量に対応する2N種類のデータに関して多変量解析を行う多変量解析手段(SB3〜SB8)と、評価の基準データにおける音高の切り替わり部分において、前記複数の利用者の音声情報に対応する前記多変量解析手段90による解析結果に基づいて、対象となる利用者の音声情報に係る演奏評価を行う演奏評価手段100(SB9)とを、備えたものであることから、高低差のある音高の繋ぎに相当する演奏部分を好適に評価することができる。すなわち、利用者が実際に感じる印象に近い演奏評価を実現するカラオケシステム10を提供することができる。
【0047】
また、前記多変量解析手段90は、前記音高・音量検出手段86により検出される音高の変化の起点をn=0とする、n=1からn=Nまでの前記2N種類のデータに関して主成分分析を行う主成分分析手段92(SB5)と、その主成分分析手段96による分析結果に対応して、2N組の固有値・固有ベクトルを算出する固有値・固有ベクトル算出手段94(SB6)と、その固有値・固有ベクトル算出手段94により算出される2N組の固有値・固有ベクトルに関して、各固有ベクトルを軸とする固有値の分散を算出する分散算出手段96(SB7)と、その分散算出手段96により算出される分散が大きいものから順に前記2N組の固有値・固有ベクトルの順位を決定する順位付け手段98(SB8)とを、含むものであり、前記演奏評価手段100は、その順位付け手段98により決定された順位の高い固有値・固有ベクトルから優先的に前記演奏評価のパラメータとして用いるものであるため、高低差のある音高の繋ぎに相当する演奏部分を実用的な態様で好適に評価することができる。
【0048】
以上、本発明の好適な実施例を図面に基づいて詳細に説明したが、本発明はこれに限定されるものではなく、更に別の態様においても実施される。
【0049】
例えば、前述の実施例において、前記音高・音量検出手段86及び検出結果送信手段88が前記カラオケ装置16のCPU50に、前記多変量解析手段90、演奏評価手段100、及び評価結果送信手段102が前記サーバ装置30のCPU66に備えられたものであったが、本発明はこれに限定されるものではなく、例えば、前記音高・音量検出手段86、多変量解析手段90、及び演奏評価手段100が一元的に前記カラオケ装置16に備えられ、それらの制御手段による処理を前記カラオケ装置16側で実行するものであってもよい。この場合、前記サーバ装置20に備えられていた多変量解析データベース84に相当する情報が前記カラオケ装置16のハードディスク56等に蓄積されるのが好ましいが、前記サーバ装置20の多変量解析データベース84に記憶された情報を前記カラオケ装置16により逐一読み出すことによっても前記実施例と同等の制御が可能である。なお、斯かる態様においては、前記検出結果送信手段88及び評価結果送信手段102は必ずしも設けられなくともよい。
【0050】
また、前述の実施例では、前記音高・音量検出手段86により各利用者の音声情報に対応するデータが検出される毎にそのデータが前記多変量解析データベース84に蓄積されるものであったが、サンプルとなるデータが十分に多変量解析データベース84に蓄積されている場合には、必ずしも毎回の検出結果が新たに蓄積されるものでなくともよい。
【0051】
その他、一々例示はしないが、本発明はその趣旨を逸脱しない範囲内において種々の変更が加えられて実施されるものである。
【符号の説明】
【0052】
10:カラオケシステム
16:カラオケ装置
40:マイクロフォン(音声入力装置)
86:音高・音量検出手段
90:多変量解析手段
92:主成分分析手段
94:固有値・固有ベクトル算出手段
96:分散算出手段
98:順位付け手段
100:演奏評価手段
【特許請求の範囲】
【請求項1】
多数の演奏曲のうちから選択される演奏曲を出力させると共に音声入力装置により入力される音声を増幅して出力させるカラオケ装置を用いたカラオケシステムであって、
前記音声入力装置により入力される音声情報に関して単位時間毎の音高及び音量を検出する音高・音量検出手段と、
複数の利用者それぞれの音声情報を対象として、前記音高・音量検出手段によりN回連続的に検出される単位時間毎の音高及び音量に対応する2N種類のデータに関して多変量解析を行う多変量解析手段と、
評価の基準データにおける音高の切り替わり部分において、前記複数の利用者の音声情報に対応する前記多変量解析手段による解析結果に基づいて、対象となる利用者の音声情報に係る演奏評価を行う演奏評価手段と
を、備えたものであることを特徴とするカラオケシステム。
【請求項2】
前記多変量解析手段は、
前記音高・音量検出手段により検出される音高の変化の起点をn=0とする、n=1からn=Nまでの前記2N種類のデータに関して主成分分析を行う主成分分析手段と、
該主成分分析手段による分析結果に対応して、2N組の固有値・固有ベクトルを算出する固有値・固有ベクトル算出手段と、
該固有値・固有ベクトル算出手段により算出される2N組の固有値・固有ベクトルに関して、各固有ベクトルを軸とする固有値の分散を算出する分散算出手段と、
該分散算出手段により算出される分散が大きいものから順に前記2N組の固有値・固有ベクトルの順位を決定する順位付け手段と
を、含むものであり、
前記演奏評価手段は、該順位付け手段により決定された順位の高い固有値・固有ベクトルから優先的に前記演奏評価のパラメータとして用いるものである
請求項1に記載のカラオケシステム。
【請求項1】
多数の演奏曲のうちから選択される演奏曲を出力させると共に音声入力装置により入力される音声を増幅して出力させるカラオケ装置を用いたカラオケシステムであって、
前記音声入力装置により入力される音声情報に関して単位時間毎の音高及び音量を検出する音高・音量検出手段と、
複数の利用者それぞれの音声情報を対象として、前記音高・音量検出手段によりN回連続的に検出される単位時間毎の音高及び音量に対応する2N種類のデータに関して多変量解析を行う多変量解析手段と、
評価の基準データにおける音高の切り替わり部分において、前記複数の利用者の音声情報に対応する前記多変量解析手段による解析結果に基づいて、対象となる利用者の音声情報に係る演奏評価を行う演奏評価手段と
を、備えたものであることを特徴とするカラオケシステム。
【請求項2】
前記多変量解析手段は、
前記音高・音量検出手段により検出される音高の変化の起点をn=0とする、n=1からn=Nまでの前記2N種類のデータに関して主成分分析を行う主成分分析手段と、
該主成分分析手段による分析結果に対応して、2N組の固有値・固有ベクトルを算出する固有値・固有ベクトル算出手段と、
該固有値・固有ベクトル算出手段により算出される2N組の固有値・固有ベクトルに関して、各固有ベクトルを軸とする固有値の分散を算出する分散算出手段と、
該分散算出手段により算出される分散が大きいものから順に前記2N組の固有値・固有ベクトルの順位を決定する順位付け手段と
を、含むものであり、
前記演奏評価手段は、該順位付け手段により決定された順位の高い固有値・固有ベクトルから優先的に前記演奏評価のパラメータとして用いるものである
請求項1に記載のカラオケシステム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【公開番号】特開2011−203383(P2011−203383A)
【公開日】平成23年10月13日(2011.10.13)
【国際特許分類】
【出願番号】特願2010−68815(P2010−68815)
【出願日】平成22年3月24日(2010.3.24)
【出願人】(396004833)株式会社エクシング (394)
【Fターム(参考)】
【公開日】平成23年10月13日(2011.10.13)
【国際特許分類】
【出願日】平成22年3月24日(2010.3.24)
【出願人】(396004833)株式会社エクシング (394)
【Fターム(参考)】
[ Back to top ]