説明

音評価システム

【課題】音評価システムにおいて、ユーザを含む複数の評価者による客観的評価に近い評価結果を得る。
【解決手段】ユーザ端末14(1)では、実歌唱信号と基準歌唱信号とで音響特徴を分析・比較してピッチずれ等の比較結果を得る。実歌唱信号についてユーザ等の評価者に採点を行なわせる。比較結果、採点結果等のデータを通信ネットワーク10を介してサーバ18に送る。14(2)等の端末についても同様とする。サーバ18は、曲毎に複数のユーザ端末からのデータを記憶する記憶部を有する。サーバ18では、あるユーザ端末における比較結果に基づいて評価処理により第1の採点結果を求め、ユーザ端末に表示させる。この際に、ユーザ端末の歌と同一の曲に関する複数の採点結果に基づいて目標採点結果を求め、この目標採点結果に近づくように評価処理を修正して第2の採点結果を求め、ユーザ端末に表示させる。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は、通信カラオケシステム等に用いるに好適な音評価システムの改良に関するものである。
【背景技術】
【0002】
従来、音評価システムとしては、入力音声から抽出した音響特徴を事前保存モデルと比較すると共にその比較結果をユーザ発音の審査に使用する構成にしたものが知られている(例えば、特許文献1参照)。
【0003】
また、音声認識システムとしては、音声分析及び音韻抽出までの処理をクライアントで行なうと共に残りの言語レベルの認識処理をサーバで行なうことによりクライアントの処理負荷の低減を図ったものが知られている(例えば、特許文献2参照)。
【特許文献1】特表2002−515136
【特許文献2】特開2003−44091
【発明の開示】
【発明が解決しようとする課題】
【0004】
一般に、歌唱、楽器演奏等に対する評価は、歌い手や演奏者等のユーザの主観的な評価に依存する。例えば、カラオケ等の評価処理において、基準歌唱に近いからといって高い点数を出しても、ユーザの主観的評価と一致するとは限らない。また、ユーザ仲間では、サビがうまければ高得点、面白いと感じれば高得点ということもある。
【0005】
上記した従来の音評価システムによると、正しいとされる発音が予め判明していることが前提になっており、ユーザの嗜好や時代性等による評価基準の変化に追従できないという問題点がある。
【0006】
また、上記した従来の音声認識システムにおいても、音声判定基準は固定されており、ユーザの主観的評価との乖離があった場合でも補正できないという問題点がある。
【0007】
この発明の目的は、ユーザを含む複数の評価者による客観的評価に近い評価結果を得ることができる新規な音評価システムを提供することにある。
【0008】
この発明の他の目的は、評価者の属する国等の評価区分を指定可能であると共に指定に係る評価区分内の複数の評価者による客観的評価に近い評価結果を得ることができる新規な音評価システムを提供することにある。
【課題を解決するための手段】
【0009】
この発明に係る第1の音評価システムは、
複数のユーザ端末とサーバとを通信ネットワークを介して接続した音評価システムであって、
各ユーザ端末又は前記サーバに設けられ、評価されるべき入力音の音響特徴を抽出する抽出手段と、
各ユーザ端末又は前記サーバに設けられ、基準音の音響特徴を発生する発生手段と、
各ユーザ端末又は前記サーバに設けられ、前記入力音の音響特徴と前記基準音の音響特徴とを比較して両者の差異を表わす比較結果データを送出する比較手段と、
各ユーザ端末又は前記サーバに設けられ、前記比較結果データに基づいて評価処理により第1の評価結果を求める評価手段と、
各ユーザ端末に設けられた表示手段と、
各ユーザ端末に設けられ、前記入力音の評価結果を入力する入力手段であって、入力に係る評価結果を表わす評価結果データを送出するものと、
前記サーバに設けられ、各ユーザ端末の入力手段からの評価結果データを記憶する記憶手段と、
前記サーバに設けられ、前記記憶手段に記憶された複数の評価結果データに基づいて目標評価結果を決定する決定手段と、
前記サーバ設けられ、前記目標評価結果に近づくように前記評価処理を修正して前記評価手段から第2の評価結果を得る修正手段と
を備え、いずれかのユーザ端末における評価結果の入力に基づいて該ユーザ端末の表示手段に前記第2の評価結果を表示させる構成にしたものである。
【0010】
第1の音評価システムによれば、サーバの記憶手段には、各ユーザ端末の入力手段からの評価結果データ(ユーザ等の評価者による主観的評価結果を表わすデータ)が記憶される。例えば、多数のユーザ端末が国内に分散配置されているものとすると、記憶手段には、多数のユーザの主観的評価結果をそれぞれ表わす多数の評価結果データが記憶されることになる。決定手段は、記憶手段に記憶された複数(又は多数)の評価結果データに基づいて(例えば平均処理するなどして)目標評価結果を決定する。この目標評価結果は、複数(又は多数)の主観的評価結果が反映されたもので、客観的評価結果といえる。修正手段は、目標評価結果に近づくように評価処理を修正して評価手段から第2の評価結果を得る。この第2の評価結果は、複数(又は多数)の評価者による客観的評価結果に近いもので、評価結果を入力したユーザ端末の表示手段で表示される。従って、ユーザは、ユーザ端末で評価結果を入力することで第2の評価結果(ユーザ主観も含めた客観的評価結果に近い評価結果)を知ることができ、しかも自己の主観的評価結果が第2の評価結果からどの程度乖離しているか知ることができる。
【0011】
なお、入力音の評価結果を入力したユーザ端末の表示手段には、第2の評価結果の表示に関連して第1の評価結果(機械的評価結果)を表示するようにしてもよい。このようにすると、ユーザは、第1及び第2の評価結果を比較することで機械的評価結果(第1の評価結果)が客観的評価に近い評価結果(第2の評価結果)によりどの程度修正されたか知ることができる。
【0012】
この発明に係る第2の音評価システムは、
複数のユーザ端末とサーバとを通信ネットワークを介して接続した音評価システムであって、
各ユーザ端末又は前記サーバに設けられ、評価されるべき入力音の音響特徴を抽出する抽出手段と、
各ユーザ端末又は前記サーバに設けられ、基準音の音響特徴を発生する発生手段と、
各ユーザ端末又は前記サーバに設けられ、前記入力音の音響特徴と前記基準音の音響特徴とを比較して両者の差異を表わす比較結果データを送出する比較手段と、
各ユーザ端末又は前記サーバに設けられ、前記比較結果データに基づいて評価処理により第1の評価結果を求める評価手段と、
各ユーザ端末に設けられた表示手段と、
各ユーザ端末に設けられ、前記入力音の評価結果を入力する第1の入力手段であって、入力に係る評価結果を表わす評価結果データを送出するものと、
各ユーザ端末に設けられ、所定の複数の評価区分のうち前記入力音の評価者の属する評価区分を入力する第2の入力手段であって、入力に係る評価区分を表わす評価区分データを送出するものと、
前記サーバに設けられ、各ユーザ端末の第1の入力手段からの評価結果データと、該ユーザ端末の第2の入力手段からの評価区分データとを組にして記憶する記憶手段と、
各ユーザ端末に設けられ、前記複数の評価区分のうち前記入力音に関して評価をなすべき所望の評価区分を指定する指定手段と、
前記サーバに設けられたサーチ手段であって、前記記憶手段に記憶された評価区分データのうち前記指定手段での指定に係る評価区分と同一の評価区分を表わす複数の評価区分データをサーチするものと、
前記サーバに設けられ、目標評価結果を決定する決定手段であって、前記サーチ手段でサーチされた複数の評価区分データとそれぞれ組をなす複数の評価結果データに基づいて前記目標評価結果の決定を行なうものと、
前記サーバに設けられ、前記目標評価結果に近づくように前記評価処理を修正して前記評価手段から第2の評価結果を得る修正手段と
を備え、いずれかのユーザ端末における評価区分の指定に基づいて該ユーザ端末の表示手段に前記第2の評価結果を表示させる構成にしたものである。
【0013】
第2の音評価システムによれば、各ユーザ端末毎に第2の入力手段を設け、所定の複数の評価区分(例えば国別評価区分)のうち入力音の評価者の属する評価区分(例えば日本)を入力して入力に係る評価区分を表わす評価区分データを送出し、第1の入力手段からの評価結果データと第2の入力手段からの評価区分データとを組にして記憶手段に記憶させるようにしたので、記憶手段には、評価結果データ及び評価区分データの組が多数記憶されることになる。各ユーザ端末に設けられた指定手段は、複数の評価区分のうち入力音に関して評価をなすべき所望の評価区分を指定するもので、記憶手段の記憶データを利用するために使用される。
【0014】
決定手段は、記憶手段に記憶された多数の評価区分データのうち指定手段での指定に係る評価区分(例えば日本)と同一の評価区分を表わす複数の評価区分データをサーチすると共に該複数の評価区分データとそれぞれ組をなす複数の評価結果データに基づいて目標評価結果を決定する。この目標評価結果は、指定に係る評価区分(例えば日本)内の複数(又は多数)の主観的評価結果が反映されたもので、客観的評価結果といえる。修正手段は、目標評価結果に近づくように評価処理を修正して評価手段から第2の評価結果を得る。この第2の評価結果は、指定に係る評価区分内の複数(又は多数)の評価者による客観的評価に近いもので、評価区分を指定したユーザ端末の表示手段で表示される。従って、ユーザは、ユーザ端末で評価区分を指定することで第2の評価結果(指定に係る評価区分内のユーザ主観を含めた客観的評価に近い評価結果)を知ることができ、しかも自己の主観的評価が客観的評価に近い評価結果(第2の評価結果)からどの程度乖離しているか知ることができる。
【0015】
その上、指定手段では入力音に関して評価をなすべき評価区分を適宜変更できるので、評価区分を例えば日本から韓国に変更するなどして他の評価区分内における客観的評価に近い評価結果(第2の評価結果)を知ることができる。また、評価者の評価区分及び評価をなすべき評価区分は、いずれも国別に限らず、地方別、年齢層別等にしてもよく、このようにすれば一層多様な客観的評価に近い評価結果を得ることができる。
【0016】
この発明に係る第3の音評価システムは、
複数のユーザ端末とサーバとを通信ネットワークを介して接続した音評価システムであって、
各ユーザ端末又は前記サーバに設けられ、評価されるべき入力音の音響特徴を抽出する抽出手段と、
各ユーザ端末又は前記サーバに設けられ、基準音の音響特徴を発生する発生手段と、
各ユーザ端末又は前記サーバに設けられ、前記入力音の音響特徴と前記基準音の音響特徴とを比較して両者の差異を表わす比較結果データを送出する比較手段と、
各ユーザ端末又は前記サーバに設けられ、前記比較結果データに基づいて評価処理により第1の評価結果を求める評価手段と、
各ユーザ端末に設けられた表示手段と、
各ユーザ端末に設けられ、前記入力音の評価結果を入力する入力手段であって、入力に係る評価結果を表わす評価結果データを送出するものと、
各ユーザ端末に設けられ、所定の複数の評価区分のうち該ユーザ端末に対応する評価区分を表わす評価区分データを生成する生成手段と、
前記サーバに設けられ、各ユーザ端末の入力手段からの評価結果データと、該ユーザ端末の生成手段からの評価区分データとを組にして記憶する記憶手段と、
各ユーザ端末に設けられ、前記複数の評価区分のうち前記入力音に関して評価をなすべき所望の評価区分を指定する指定手段と、
前記サーバに設けられたサーチ手段であって、前記記憶手段に記憶された評価区分データのうち前記指定手段での指定に係る評価区分と同一の評価区分を表わす複数の評価区分データをサーチするものと、
前記サーバに設けられ、目標評価結果を決定する決定手段であって、前記サーチ手段でサーチされた複数の評価区分データとそれぞれ組をなす複数の評価結果データに基づいて前記目標評価結果の決定を行なうものと、
前記サーバに設けられ、前記目標評価結果に近づくように前記評価処理を修正して前記評価手段から第2の評価結果を得る修正手段と
を備え、いずれかのユーザ端末における評価区分の指定に基づいて該ユーザ端末の表示手段に前記第2の評価結果を表示させる構成にしたものである。
【0017】
第3の音評価システムは、前述した第2の音評価システムにおいて、第2の入力手段の代りに生成手段を設けたものに相当する。生成手段は、各ユーザ端末に設けられ、所定の複数の評価区分のうち該ユーザ端末に対応する評価区分を表わす評価区分データを生成する。記憶手段では、各ユーザ端末の入力手段からの評価結果データと、該ユーザ端末の生成手段からの評価区分データとを組にして記憶する。その他の動作は、第2の音評価システムに関して前述したと同様である。
【0018】
第3の音評価システムによれば、ユーザは、評価区分を入力しなくてよい。例えば、ユーザ端末の設置場所が固定されていたり、ユーザの年齢層等の属性が予め判明していたりした場合、ユーザ端末毎に評価区分を対応付けすることで該ユーザ端末に対応する評価区分データを自動的に生成することができ、ユーザが入力するのは、入力音の評価結果のみとなる。あるユーザ端末にてユーザが指定手段により所望の評価区分を指定すると、該ユーザ端末の表示手段には第2の評価結果(指定に係る評価区分のユーザ主観を含めた客観的評価に近い評価結果)が表示され、ユーザは、第2の評価結果を知ることができる。
【0019】
なお、第2又は第3の音評価システムにおいて、評価区分を指定したユーザ端末の表示手段には、第2の評価結果の表示に関連して第1の評価結果(機械的評価結果)を表示するようにしてもよい。このようにすると、ユーザは、第1及び第2の評価結果を比較することで機械的評価結果(第1の評価結果)が指定に係る区分内の客観的評価結果(第2の評価結果)によりどの程度修正されたか知ることができる。
【発明の効果】
【0020】
この発明によれば、ユーザ等の複数の評価者の主観的評価を通信ネットワークを介して集計すると共に集計結果に基づいて目標評価結果を決定し、この目標評価結果に近づくように評価処理を修正してユーザの主観を含む客観的評価に近い評価結果を得るようにしたので、ユーザの嗜好や時代性等による評価基準の変化に追従できる効果が得られる。また、多くの評価者の評価結果が反映された評価結果を見ることで、ユーザ自身の主観的評価の客観性を高める学習効果も期待できる。
【0021】
その上、評価をなすべき複数の評価区分のうち任意の評価区分を指定して該評価区分内の客観的評価に近い評価結果が得られるようにしたので、ユーザが多様な評価結果を利用可能となる効果も得られる。
【発明を実施するための最良の形態】
【0022】
図1は、この発明の一実施形態に係る音評価システムの構成を示すものである。この音評価システムは、例えば通信カラオケシステムに用いることができる。
【0023】
図1に示す音評価システムにおいて、通信ネットワーク10には、通信インターフェース12(1)〜12(N)(Nは2以上の整数)をそれぞれ介してユーザ端末14(1)〜14(N)が接続されると共に、通信インターフェース16を介してサーバ18が接続されている。通信ネットワーク10は、例えばLAN(ローカル・エリア・ネットワーク)、インターネット又は電話回線等からなり、14(1)等の各ユーザ端末は、一例として通信カラオケ装置からなる。ユーザ端末14(1)〜14(N)の構成は、互いに同一であり、代表としてユーザ端末14(1)の一構成例を図2に示す。
【0024】
図2に示すユーザ端末14(1)において、基準音声データ記憶部20は、複数曲のうちの各曲毎に基準歌唱音データからなる基準音声データを記憶したもので、基準音声データ記憶部20から読出されるべき基準音声データは、入力操作部30からの曲選択データSにより選択されるようになっている。基準音声データ記憶部20から読出された基準音声データSは、音響特徴分析部22及び音声再生・記録部24に供給される。
【0025】
音声再生・記録部24は、基準音声データSに基づいて基準音声信号として基準歌唱音信号(アナログ信号)を再生し、この信号は、スピーカSPにより基準歌唱音に変換される。ユーザは、自分で歌う前に基準歌唱音を聴くことができる。音声再生・記録部24は、マイクロホンMCを介して入力される実歌唱音信号からなる音声信号をディジタル音声データに変換して磁気ディスク等に記録可能なもので、記録した実歌唱音データは、基準音声データに関して前述したと同様にしてスピーカSPを介して実歌唱音として再生可能である。ユーザは、自分で歌った実歌唱音を再生して聴取することにより採点を行なうことができる。マイクロホンMCから入力された実歌唱音信号に基づく実歌唱音データ(磁気ディスク等から読出したものでも可)からなる音声データSは、音響特徴分析部26に供給される。
【0026】
音響特徴分析部22は、基準歌唱音データからなる基準音声データSに基づいて基準音声信号の音響特徴を分析し、抽出するもので、抽出に係る音響特徴を表わす分析データSを分析データ比較部28に一方の比較入力として供給する。音響特徴分析部26は、ユーザの実歌唱音データからなる音声データSに基づいてユーザの実歌唱音の音響特徴を分析し、抽出するもので、抽出に係る音響特徴を表わす分析データSを分析データ比較部28に他方の比較入力として供給する。音響特徴分析部22,26のいずれにおいても、音響特徴としては、ピッチ(音高)、発音タイミング、音量、音色(例えば周波数スペクトル又はフォルマント)等の経時的変化を分析し、抽出することができる。分析データ比較部28では、分析データS,Sを互いに比較して両者の差異を表わす比較結果データ(例えば差分データ)Sを送出する。
【0027】
入力操作部30は、曲選択データS、採点結果データS等を発生するもので、その一構成例を図3に示す。入力操作部30において、テンキー部K10には、数字1〜10に対応した10個又はそれ以上の数のキーが設けられている。選曲スイッチK11は、歌唱者が所望の曲を選択する際に操作されるものであり、採点スイッチK12は、入力した歌唱音について歌唱者又は同伴者等の評価者が採点を行なう(採点結果を入力する)際に操作されものである。
【0028】
図2に示す表示部32は、例えば液晶表示パネル等の表示パネルを有するものである。表示部32には、選曲スイッチK11の押圧に応じて複数の候補曲の曲番号及び曲名が表示される。この状態で、歌唱者がテンキー部K10でのキー操作により所望の曲の曲番号を指定すると、指定に係る曲番号を表わす曲選択データSが基準音声データ記憶部20に供給される。そして、曲選択データSにより選択された基準歌唱の再生が開始される。歌い終わって採点を行なう際には、テンキー部K10でのキー操作により所望の点数を入力すると、採点結果を表わす採点結果データSが送出される。
【0029】
図2に示す端末データ作成部34は、サーバ18に送信すべき端末データSを作成するものである。端末データSとしては、図4に示すように1回の歌唱につき第1端末データA11及び第2端末データA12の2つのデータが作成される。第1端末データA11は、識別情報S及び比較結果データSを含むものである。識別情報Sは、ユーザ端末番号及び曲選択データSからなっている。第2端末データA12は、第1端末データA11と同じ識別情報Sと、採点結果データSとからなっている。
【0030】
図4において、A21…An1(nは2より大きい整数)は、いずれも第1端末データA11と同様のフォーマットを有する第1端末データであり、A22…An2は、いずれも第2端末データA12と同様のフォーマットを有する第2端末データである。第1端末データA11及び第2端末データA12が図2のユーザ端末14(1)から送出されたものとすると、第1端末データA21及び第2端末データA22は、ユーザ端末14(1)から送出されることもあれば、他のユーザ端末(例えば図1の14(N))から送出されることもある。このことは、An1,An2等の他の第1,第2端末データについても同様である。第1端末データA11〜An1及び第2端末データA12〜An2は、いずれもサーバ18に送信される。
【0031】
図5は、サーバ18の一構成例を示すものである。サーバ18は、評価学習部38A及び評価部44Aを備え、評価学習部38Aには、端末データ記憶部40A及び修正情報作成部42Aが設けられている。端末データ記憶部40Aには、曲毎に図4に示した第1及び第2端末データが記憶される。曲は、図4に示した識別情報S中の曲選択データSにより識別可能である。
【0032】
評価部44Aでは、端末データ記憶部40Aに記憶された第1端末データ中の比較結果データSに基づいて評価処理により第1の採点結果(機械的採点結果)が求められる。評価処理としては、(イ)比較結果データが表わす個々の比較結果パラメータ(ピッチ、発音タイミング、音量、音色等の差の時間的変化(積算値又は平均値))を多項式の多数項にそれぞれ割り当てて採点結果を算出する方式、(ロ)入力層に比較結果データを入力して出力層から採点結果を導出するニューラルネット方式、(ハ)比較結果パラメータ数分のパラメータ−得点変換テーブルを用い、これらの変換テーブルから得られる得点に基づいて採点結果を算出する方式等が公知であり、いずれかの方式を用いて自動的に採点を行なうことができる。
【0033】
評価部44Aからは、第1の採点結果を表わす採点結果データSが送出され、比較結果データSの送信があったユーザ端末に送信される。ここで、比較結果データSの送信があったユーザ端末は、例えば図4の第1端末データA11の識別情報S中のユーザ端末番号により識別可能である。一例として、ユーザ端末14(1)において曲を選択し、歌ったのであれば、ユーザ端末14(1)の表示部32に採点結果データSが供給され、表示部32に第1の採点結果(機械的採点結果)が表示される。
【0034】
次に、ユーザ端末14(1)において、ユーザ等の評価者が記録に係る歌唱を聴いて入力操作部30で採点結果を入力すると、その採点結果を表わす採点結果データSを含む第2端末データ(例えば図4のA12)が端末データ記憶部40Aに記憶される。これと同様にして、端末データ記憶部40Aには、ユーザ端末14(1)からの複数回の採点結果やユーザ端末14(2)〜14(N)からの1又は複数回の採点結果が記憶される。修正情報作成部42Aは、ある曲の採点結果データSが端末データ記憶部40Aに記憶されると、該採点結果データSを含めて該曲に関してそれまで記憶されている複数(又は多数)の採点結果データSに基づいて例えば該複数(又は多数)の採点結果データSの表わす採点結果を平均するなどして目標採点結果を求める。ここで、複数の採点結果データSが同一曲に関するものか否かは、第2端末データの識別情報S中の曲番号を参照すれば判明する。修正情報作成部42Aは、目標採点結果に近づくように評価部44Aの評価処理を修正するための修正情報S10を作成して評価部44Aに供給する。修正情報S10としては、前述した(イ)の多項式による算出方式を用いる場合は、多項式の多数項の係数を表わす情報を作成し、前述した(ロ)のニューラルネット方式を用いる場合は、ニューラルネットの構成情報と各ノードのパラメータセットとを作成し、前述した(ハ)の変換テーブル方式を用いる場合は、既存の変換テーブルの代りに用いるべき新たな変換テーブルを作成する。
【0035】
評価部44Aでは、修正情報作成部42Aからの修正情報S10に基づいて評価処理を修正することによりユーザ主観を含む目標採点結果に近い第2の採点結果(客観的採点結果)を求める。この第2の採点結果を表わす採点結果データSは、採点結果データSの送信があったユーザ端末に送信される。ここで、採点結果データSの送信があったユーザ端末は、例えば図4の第2端末データA12の識別情報S中のユーザ端末番号により識別可能である。一例として、ユーザ端末14(1)において採点を行なったのであれば、ユーザ端末14(1)の表示部32に採点結果データSが供給され、表示部32に第2の採点結果(目標採点結果に近い客観的採点結果)が表示される。
【0036】
上記した説明では、主としてユーザ端末14(1)から比較結果及び採点結果がサーバ18に送信されたときのサーバ18の構成及び動作を述べたが、このような構成及び動作は、14(2)等の他のユーザ端末から比較結果及び採点結果がサーバ18に送信されたときも同様である。上記した実施形態によれば、ユーザは、ユーザ端末に歌唱音を入力することで第1の採点結果(機械的採点結果)を知ることができると共に、ユーザ端末に自己の主観的採点結果を入力することで第2の採点結果(客観的採点結果)を知ることができる。また、自己の主観的採点結果が第2の採点結果からどの程度乖離しているか知ることができると共に、第1の採点結果が第2の採点結果によりどの程度修正されたか知ることができる。
【0037】
なお、上記した実施形態では、マイクロホンMCを介して歌唱音信号を入力する例を示したが、ユーザ端末間で通信ネットワーク10を介して歌唱音データを授受することによりあるユーザ端末で入力した歌唱音データについて他のユーザ端末で採点を行なうことも可能である。また、上記した実施形態では、入力音毎に第1の採点結果(機械的採点結果)を求め、表示するようにしたが、次回の入力音に対応する第1の採点結果には今回の入力音に対応する修正情報S10を反映させるようにしてもよい。このためには、今回の入力音に関して第2の採点結果(客観的採点結果)を得るために作成された修正情報S10(前述の(イ)の場合は多項式の係数、前述の(ロ)の場合はニューラルネットワークの構成情報及びパラメータセット、前述の(ハ)の場合は変換テーブル)をメモリ等の保存手段(図示せず)に保存しておき、次回の入力音に対応する第1の採点結果を求める際には該保存手段に保存された修正情報S10を参照して第1の採点結果を求めるようにすればよい。このようにすると、次回の第1の採点結果としては、今回の第2の採点結果(客観的採点結果)を反映した採点結果が求められ、表示されるので、過去の学習結果が生かされることになる。
【0038】
図6は、入力操作部30の他の構成例を示すもので、図3と同様の部分には同様の符号を付して詳細な説明を省略する。図6の構成例の特徴は、評価者の属する国、地方又は年齢層を評価区分として入力可能にすると共に、評価をなすべき国、地方又は年齢層を評価区分として指定可能にしたことである。すなわち、評価者スイッチK21及び評価区分スイッチK22が並設されると共に、これらのスイッチK21,K22に共通に使用可能なように「日本」,「韓国」…等に対応する国別スイッチKa1,Ka2…と、「関東」,「関西」…等に対応する地方別スイッチKb1,Kb2…と、「10代」,「20代」…等に対応する年齢層別スイッチKc1,Kc2…とが設けられている。
【0039】
採点スイッチK12及びテンキー部K10を用いてユーザ等の評価者が採点を行なう際には、評価者スイッチK21を押した後、国別スイッチKa1,Ka2…のいずれかと、地方別スイッチKb1,Kb2…のいずれかと、年齢層別スイッチKc1,Kc2…のいずれかとを押して評価者の属する国、地方及び年齢層を評価区分として入力可能である。この場合、国、地方及び年齢層のすべてを入力してもよいが、そのうちの1又は複数を入力してもよい。このようにして入力された評価区分データは、図2において破線S11で示すように端末データ作成部34に供給され、図4に示すように第2端末データA12において採点結果データSと組をなすように採点結果データSに評価区分データS11が付加される。これと同様にして、他の第2端末データA22…An2にも、採点を行なったユーザ端末にて評価区分データS11が付加される。
【0040】
また、ユーザ等の評価者が採点を行なう際には、評価区分スイッチK22を押した後、評価をなすべきいずれかの評価区分のスイッチ(「国別」「地方別」又は「年齢層別」のいずれかに属するスイッチ)を押す。例えばスイッチKa2を押すと、評価区分として韓国が指定され、スイッチKb2を押すと、評価区分として関西地方が指定され、スイッチKc2を押すと、評価区分として20代が指定される。このときに押すのは、国別、地方別及び年齢層別のうちのいずれか1種類のスイッチとする。1種類のスイッチを押した後、他の種類のスイッチを押すとき(評価区分の種類を変更するとき)は、その前に評価区分スイッチK22を押すものとする。入力操作部30からは、図2に示すように指定に係る評価区分を表わす評価区分指定データS12が送出され、サーバ18に送信される。このときに送信される評価区分指定データS12には、図4に示した識別情報Sと同様の識別情報が付加される。
【0041】
図7は、図6の入力操作部30を用いる場合におけるサーバ18の構成例を示すものである。図7に示すサーバ18において、修正情報作成部42B及び評価部44Bは、図5に示した修正情報作成部42A及び評価部44Aとそれぞれ同様のものであるが、端末データ記憶部40Bに関してサーチ部46を設けた点が図5のサーバ18とは異なる。
【0042】
端末データ記憶部40Bには、端末データ記憶部40Aについて前述したと同様に曲毎に図4に示した第1及び第2端末データが記憶される。あるユーザ端末から比較結果データSを含む第1端末データがサーバ18に送信され、端末データ記憶部40Bに記憶されると、評価部44Aについて前述したと同様に評価部44Bが比較結果データSに基づいて評価処理により第1の採点結果(機械的採点結果)を求める。この第1の採点結果を表わす採点結果データSは、比較結果データSの送信があったユーザ端末に送信され、データSの表わす第1の採点結果が表示される。
【0043】
端末データ記憶部40Bには、端末データ記憶部40Aについて前述したと同様に1又は複数のユーザ端末から送信された第2の端末データが記憶される。この場合、各第2端末データには、前述したように評価区分データS11が採点結果データSと組をなした状態で含まれている。サーチ部46は、端末データ記憶部40Bから読出した評価区分データS11と、ユーザ端末から送信されてくる評価区分指定データS12とを比較して評価区分指定データS12の表わす評価区分と同一の評価区分を表わす評価区分データS11を複数サーチするものである。サーチ部46が複数の評価区分データS11をサーチすると、該複数の評価区分データS11とそれぞれ組をなす複数の採点結果データSが端末データ記憶部40Bから読出されて修正情報作成部42Bに供給される。ここで、評価区分データS11と採点結果データSとが組をなすか否かは第2端末データの識別情報Sを参照すれば判明する。例えば、上記のように第1の採点結果が表示されたユーザ端末からユーザ等の評価者の採点結果と評価区分とが入力されると共に評価をなすべき評価区分が指定されると、サーチ部46は、評価区分指定データS12と同一の評価区分(例えば「日本」)を表わす評価区分データS11を複数サーチすると共に、サーチに係る複数の評価区分データS11とそれぞれ組をなす複数の採点結果データSを修正情報作成部42Bに供給する。
【0044】
修正情報作成部42Bは、修正情報作成部42Aに関して前述したと同様に端末データ記憶部40Bからの複数の採点結果データSに基づいて指定に係る評価区分内の目標採点結果(例えば「日本」の客観的採点結果)を求め、この目標採点結果に近づくように評価処理を修正するための修正情報S10を作成して評価部44Bに供給する。評価部44Bは、評価部44Aに関して前述したと同様に修正情報作成部42Bからの修正情報S10に基づいて評価処理を修正して目標採点結果に近い第2の採点結果を求め、この第2の採点結果を表わす採点結果データSを採点結果データS、評価区分データS11及び評価区分指定データS12の送信があったユーザ端末に送信する。送信を受けたユーザ端末では、採点結果データSに基づいて第2の採点結果が表示される。
【0045】
この後、図6の入力操作部30において、スイッチK22,Ka2の操作により評価をなすべき評価区分の指定を例えば「日本」から「韓国」に変更すると、上記したと同様にサーチ、修正情報作成及び評価の処理が行なわれる。そして、評価区分の指定を行なったユーザ端末では、採点結果データSに基づいて第2の採点結果として「韓国」の客観的採点結果が表示される。このような評価区分の変更は、国別評価区分に限らず、地方別評価区分又は年齢層別評価区分についても同様にして行なうことができる。
【0046】
図6,7に関して上記した実施形態によれば、ユーザが歌唱音を入力することで第1の採点結果(機械的採点結果)が表示されると共に、ユーザが主観的採点結果及び評価区分を入力し且つ評価区分を指定することで第2の採点結果として指定に係る評価区分内でユーザ主観を含む客観的採点結果を表示することができる。従って、ユーザは、自己の主観的採点結果が指定に係る評価区分内の第2の採点結果からどの程度乖離しているか知ることができると共に、第1の採点結果が指定に係る評価区分内の第2の採点結果によりどの程度修正されたか知ることができる。また、第2の採点結果の表示は、指定に係る評価区分毎に行なわれるので、評価区分の指定を変更することで多様な採点結果を利用することができる。
【0047】
図8は、ユーザ端末14(1)の他の構成例を示し、図9は、図8のユーザ端末を用いる場合におけるサーバ18の構成例を示すものである。図8,9に示す構成において、図2,5と同様の部分には同様の符号を付して詳細な説明を省略する。図8,9の構成例の特徴は、基準音に関する音響特徴の分析・抽出を予め行なって抽出に係る音響特徴を表わす基準音声分析データをサーバ18の基準音声分析データ記憶部54に記憶しておき、サーバ18に設けた分析データ比較部28でユーザ端末からの音声分析データと基準音声データとの比較を行なうようにしたことである。
【0048】
ユーザ端末14(1)において、端末データ作成部50では、第1端末データを次のようにして作成する。すなわち、このとき作成する第1端末データは、図4に示す端末データA11において、比較結果データSの代りに、音響特徴分析部26からの分析データ(抽出に係る音響特徴を表わすデータ)Sを配置したものに相当する。識別情報Sは、ユーザ端末番号及び曲選択データSからなっている。端末データ作成部50では、図4に関して前述したと同様にして第2端末データ(採点結果データSを含むデータ)も作成される。第1端末データ又は第2端末データからなる端末データS20は、図9のサーバ18に送信され、端末データ記憶部52に記憶される。
【0049】
あるユーザ端末から送信された第1端末データが端末データ記憶部52に記憶されると、第1端末データ中の分析データSは、分析データ比較部28に一方の比較入力として供給される。また、第1端末データ中の曲選択データSは、 基準音声分析データ記憶部54に供給され、選択曲に対応する基準音声分析データSを読出するのに用いられる。基準音声分析データ記憶部54からの分析データSは、分析データ比較部28に他方の比較入力として供給される。分析データ比較部28では、図2に関して前述したと同様に分析データS,Sを互いに比較して両者の差異を表わす比較結果データSを送出する。
【0050】
評価部44Aは、分析データ比較部28からの比較結果データSに基づいて第1の採点結果(機械的採点結果)を求める。この第1の採点結果を表わす採点結果データSは、歌唱音の入力がなされたユーザ端末に送信され、このユーザ端末ではデータSに応じた第1の採点結果が表示される。
【0051】
修正情報作成部42Aは、図5に関して前述したと同様に端末データ記憶部52からの複数の採点結果データSに基づいて目標採点結果を求め、この目標採点結果に近づくように評価処理を修正するための修正情報S10を作成する。評価部44Aでは、修正情報作成部42Aからの修正情報S10に基づいて評価処理を修正することにより目標採点結果に近い第2の採点結果(客観的採点結果)を求める。この第2の採点結果を表わす採点結果データSは、採点結果データSの送信があったユーザ端末に送信され、このユーザ端末ではデータSに応じた第2の採点結果が表示される。
【0052】
図8,9に関して上記した音評価システムによれば、予め基準音の音響特徴を分析・抽出して基準音声分析データ記憶部54に記憶しておくので、構成又は処理が簡単となり、処理効率が向上する。なお、図8,9に示した構成は、図6,7の実施形態でも採用可能である。
【0053】
この発明は上記した実施形態に限定されるものではなく、種々の改変形態で実施可能なものである。例えば、次のような変更が可能である。
【0054】
(a)上記した実施形態では、通信カラオケシステムにこの発明を適用する例を示したが、この発明は、歌唱音に限らず、楽器演奏音又はスピーチ音(例えば英会話等の会話練習音)等の評価にも適用可能である。特に、図6,7に関して前述した構成は、例えば英会話の練習に用いる場合、英語を使用する点では同じであっても、発音が微妙に異なるアメリカ人、イギリス人又はオーストラリア人等について別々に評価を受けることができ、好都合である。
【0055】
(b)上記した実施形態では、図5のサーバ又は図7のサーバのいずれか一方を設ける例を示したが、図5,7のサーバを並設し、いずれか一方をユーザが選択して使用する構成にしてもよい。この場合、評価部は、評価学習部38A,38Bに共通に1つだけ設けることができる。
【0056】
(c)上記した実施形態では、サーバ側に評価部を設けた例を示したが、評価部は、ユーザ端末に設けてもよい。
【0057】
(d)上記した実施形態では、基準音(基準歌唱音)を予めユーザに聴かせる例を示したが、基準音の聴取は、例えば有名な歌手の曲でユーザが曲内容を十分に知っているようなときは省略してもよい。
【0058】
(e)上記した実施形態では、ユーザ等の評価者が採点結果を入力する前にシステム側の採点結果を表示する例を示したが、システム側の採点結果は、評価者が採点結果を入力すると同時又は入力した後に表示するようにしてもよい。
【0059】
(f)上記した実施形態では、ユーザ端末からサーバに評価者の採点結果を送信するたびに修正に係る採点結果を表示する例を示したが、端末データ記憶部に所定の複数の採点結果データが記憶されることを条件として修正に係る採点結果を表示するようにしてもよい。
【0060】
(g)上記した実施形態では、音響特徴分析部26をユーザ端末に設けたが、サーバに設けるようにしてもよい。
【0061】
(h)上記した実施形態では、図6の入力操作部30から評価者の属する国、地方、年齢層等の評価区分を入力する構成にしたが、各ユーザ端末毎に該ユーザ端末に対応する評価区分データをメモリ等の記憶手段(図示せず)から読出すなどして自動的に生成するようにしてもよい。
【0062】
(i)上記した実施形態では、評価結果を点数で表示する例を示したが、評価結果は、A,B,C…、甲,乙,丙…等のように段階的に表示することもできる。
【図面の簡単な説明】
【0063】
【図1】この発明の一実施形態に係る音評価システムの構成を示すブロック図である。
【図2】ユーザ端末の一構成例を示すブロック図である。
【図3】入力操作部の一構成例を示す平面図である。
【図4】端末データのフォーマットを示す図である。
【図5】サーバの一構成例を示すブロック図である。
【図6】入力操作部の他の構成例を示す平面図である。
【図7】図6の入力操作部を用いる場合におけるサーバの構成例を示すブロック図である。
【図8】ユーザ端末の他の構成例を示すブロック図である。
【図9】図8のユーザ端末を用いる場合におけるサーバの構成例を示すブロック図である。
【符号の説明】
【0064】
10:通信ネットワーク、12(1)〜12(N),16:通信インターフェース、14(1)〜14(N):ユーザ端末、18:サーバ、20:基準音声データ記憶部、22,26:音響特徴分析部、24:音声再生・記録部、28:分析データ比較部、30:入力操作部、32:表示部、34,50:端末データ作成部、38A,38B:評価学習部、40A,40B,52:端末データ記憶部、42A,42B:修正情報作成部、44A,44B:評価部、46:サーチ部、54:基準音声分析データ記憶部。

【特許請求の範囲】
【請求項1】
複数のユーザ端末とサーバとを通信ネットワークを介して接続した音評価システムであって、
各ユーザ端末又は前記サーバに設けられ、評価されるべき入力音の音響特徴を抽出する抽出手段と、
各ユーザ端末又は前記サーバに設けられ、基準音の音響特徴を発生する発生手段と、
各ユーザ端末又は前記サーバに設けられ、前記入力音の音響特徴と前記基準音の音響特徴とを比較して両者の差異を表わす比較結果データを送出する比較手段と、
各ユーザ端末又は前記サーバに設けられ、前記比較結果データに基づいて評価処理により第1の評価結果を求める評価手段と、
各ユーザ端末に設けられた表示手段と、
各ユーザ端末に設けられ、前記入力音の評価結果を入力する入力手段であって、入力に係る評価結果を表わす評価結果データを送出するものと、
前記サーバに設けられ、各ユーザ端末の入力手段からの評価結果データを記憶する記憶手段と、
前記サーバに設けられ、前記記憶手段に記憶された複数の評価結果データに基づいて目標評価結果を決定する決定手段と、
前記サーバに設けられ、前記目標評価結果に近づくように前記評価処理を修正して前記評価手段から第2の評価結果を得る修正手段と
を備え、いずれかのユーザ端末における評価結果の入力に基づいて該ユーザ端末の表示手段に前記第2の評価結果を表示させる構成にした音評価システム。
【請求項2】
複数のユーザ端末とサーバとを通信ネットワークを介して接続した音評価システムであって、
各ユーザ端末又は前記サーバに設けられ、評価されるべき入力音の音響特徴を抽出する抽出手段と、
各ユーザ端末又は前記サーバに設けられ、基準音の音響特徴を発生する発生手段と、
各ユーザ端末又は前記サーバに設けられ、前記入力音の音響特徴と前記基準音の音響特徴とを比較して両者の差異を表わす比較結果データを送出する比較手段と、
各ユーザ端末又は前記サーバに設けられ、前記比較結果データに基づいて評価処理により第1の評価結果を求める評価手段と、
各ユーザ端末に設けられた表示手段と、
各ユーザ端末に設けられ、前記入力音の評価結果を入力する第1の入力手段であって、入力に係る評価結果を表わす評価結果データを送出するものと、
各ユーザ端末に設けられ、所定の複数の評価区分のうち前記入力音の評価者の属する評価区分を入力する第2の入力手段であって、入力に係る評価区分を表わす評価区分データを送出するものと、
前記サーバに設けられ、各ユーザ端末の第1の入力手段からの評価結果データと、該ユーザ端末の第2の入力手段からの評価区分データとを組にして記憶する記憶手段と、
各ユーザ端末に設けられ、前記複数の評価区分のうち前記入力音に関して評価をなすべき所望の評価区分を指定する指定手段と、
前記サーバに設けられたサーチ手段であって、前記記憶手段に記憶された評価区分データのうち前記指定手段での指定に係る評価区分と同一の評価区分を表わす複数の評価区分データをサーチするものと、
前記サーバに設けられ、目標評価結果を決定する決定手段であって、前記サーチ手段でサーチされた複数の評価区分データとそれぞれ組をなす複数の評価結果データに基づいて前記目標評価結果の決定を行なうものと、
前記サーバに設けられ、前記目標評価結果に近づくように前記評価処理を修正して前記評価手段から第2の評価結果を得る修正手段と
を備え、いずれかのユーザ端末における評価区分の指定に基づいて該ユーザ端末の表示手段に前記第2の評価結果を表示させる構成にした音評価システム。
【請求項3】
複数のユーザ端末とサーバとを通信ネットワークを介して接続した音評価システムであって、
各ユーザ端末又は前記サーバに設けられ、評価されるべき入力音の音響特徴を抽出する抽出手段と、
各ユーザ端末又は前記サーバに設けられ、基準音の音響特徴を発生する発生手段と、
各ユーザ端末又は前記サーバに設けられ、前記入力音の音響特徴と前記基準音の音響特徴とを比較して両者の差異を表わす比較結果データを送出する比較手段と、
各ユーザ端末又は前記サーバに設けられ、前記比較結果データに基づいて評価処理により第1の評価結果を求める評価手段と、
各ユーザ端末に設けられた表示手段と、
各ユーザ端末に設けられ、前記入力音の評価結果を入力する入力手段であって、入力に係る評価結果を表わす評価結果データを送出するものと、
各ユーザ端末に設けられ、所定の複数の評価区分のうち該ユーザ端末に対応する評価区分を表わす評価区分データを生成する生成手段と、
前記サーバに設けられ、各ユーザ端末の入力手段からの評価結果データと、該ユーザ端末の生成手段からの評価区分データとを組にして記憶する記憶手段と、
各ユーザ端末に設けられ、前記複数の評価区分のうち前記入力音に関して評価をなすべき所望の評価区分を指定する指定手段と、
前記サーバに設けられたサーチ手段であって、前記記憶手段に記憶された評価区分データのうち前記指定手段での指定に係る評価区分と同一の評価区分を表わす複数の評価区分データをサーチするものと、
前記サーバに設けられ、目標評価結果を決定する決定手段であって、前記サーチ手段でサーチされた複数の評価区分データとそれぞれ組をなす複数の評価結果データに基づいて前記目標評価結果の決定を行なうものと、
前記サーバに設けられ、前記目標評価結果に近づくように前記評価処理を修正して前記評価手段から第2の評価結果を得る修正手段と
を備え、いずれかのユーザ端末における評価区分の指定に基づいて該ユーザ端末の表示手段に前記第2の評価結果を表示させる構成にした音評価システム。
【請求項4】
いずれかのユーザ端末における前記第2の評価結果の表示に関連して該ユーザ端末の表示手段に前記第1の評価結果を表示させる構成にした請求項1〜3のいずれかに記載の音評価システム。
【請求項5】
前記修正手段が前記評価処理を修正するために今回用いた修正情報を保存する保存手段を前記サーバに設け、前記評価手段で次回に第1の評価結果を求める際には前記保存手段に保存された修正情報を参照して該第1の評価結果を求める構成にした請求項1〜3のいずれかに記載の音評価システム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2007−241015(P2007−241015A)
【公開日】平成19年9月20日(2007.9.20)
【国際特許分類】
【出願番号】特願2006−65175(P2006−65175)
【出願日】平成18年3月10日(2006.3.10)
【出願人】(000004075)ヤマハ株式会社 (5,930)
【Fターム(参考)】