説明

カラオケ装置、制御方法およびプログラム

【課題】練習者の歌唱(または演奏)とお手本の歌唱(または演奏)との違いを練習者が把握できる技術を提供する。
【解決手段】カラオケ装置1のCPU11は、模範音声データに対して音声分析処理を行って、ピッチ、パワー、スペクトルを音声データから算出する。そして、CPU11は、伴奏データと模範音声データとの対応関係を検出し、この対応関係とピッチ、パワー、スペクトルに基づいて、その音声データにおいて歌唱技法が用いられている区間を検出し、検出した区間を示す区間情報とその歌唱技法を示す種別情報とを対応付けた模範技法データを生成して記憶部14に記憶する。また、CPU11は、練習者の音声データに対しても同様の処理を行って練習者音声データを生成する。CPU11は、模範技法データと練習者技法データとを比較して、その相違箇所を表示させることによって練習者に報知する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、手本となる歌唱(または演奏)と、練習者の歌唱(または演奏)との違いを練習者に示す技術に関する。
【背景技術】
【0002】
カラオケ装置においては、歌唱者の歌唱の巧拙を採点するための方法が種々提案されている。例えば、特許文献1においては、歌唱とそのお手本となるリファレンスを比較するにあたって、歌唱のタイミングとリファレンスのタイミングがずれている場合には、歌唱音声データとリファレンスデータを時間軸方向にずらして相互相関を求め、相互相関の最も高い位置で各音符について採点する方法が提案されている。この方法によれば、歌唱者が「ため」や「ルバート」の歌唱技法を用いて歌唱した場合でも、歌唱タイミングをリファレンスのタイミングに合わせて比較して採点することができる。
【特許文献1】特開2005−107330号公報
【発明の開示】
【発明が解決しようとする課題】
【0003】
ところで、歌唱者が楽譜に沿って機械的に歌を歌うことはほとんどなく、歌唱者の多くは、歌い始めや歌い終わりを意図的にずらしたり、ビブラートやこぶし等の歌唱技法を用いたりして歌のなかに感情の盛り上がり等を表現する。カラオケ装置の利用者のなかには、このような歌唱者の意図的なタイミングのずれや歌唱技法を真似て歌いたいという要望をもつ者もいる。これは楽器演奏についても同様である。
【0004】
特許文献1に記載の技術は、歌唱タイミングをずらして採点を行うものであり、すなわち用いられた歌唱技法を相殺して採点を行うものであるから、手本となる歌唱(または演奏)で用いられている技法と、自分が用いている技法がどのように違っているかを知ることはできない。
本発明は上述した背景の下になされたものであり、練習者の歌唱(または演奏)とお手本の歌唱(または演奏)との違いを練習者が把握できる技術を提供することを目的とする。
【課題を解決するための手段】
【0005】
上記課題を解決するため、本発明は、伴奏データを再生して伴奏演奏信号を生成するとともに、歌唱者の音声を増幅して出力するカラオケ装置において、模範音声において特定の技法が用いられている区間を示す模範技法データを記憶する記憶手段と、入力される歌唱者の音声を練習者音声データとして出力する音声入力手段と、前記練習者音声データから音声のピッチを算出するピッチ算出手段と、前記ピッチ算出手段により算出されたピッチの時間的な変化のパターンを解析して、この解析結果が予め定められたパターンに対応するか否かを判定し、対応する場合には当該パターンに対応する区間を特定の技法が用いられている区間として特定する特定手段と、前記特定手段により特定された区間を示す練習者技法データを生成する生成手段と、前記生成手段により生成された練習者技法データと、前記記憶手段に記憶された模範技法データとを比較して、それらが所定量以上隔たっていた場合に、予め決められた評価区間毎に相違箇所として特定する相違箇所特定手段と、前記相違箇所特定手段により特定された相違箇所を報知する報知手段とを備えることを特徴とするカラオケ装置を提供する。
また、本発明は、伴奏データを再生して伴奏演奏信号を生成するとともに、歌唱者の音声を増幅して出力するカラオケ装置において、模範音声において特定の技法が用いられている区間を示す模範技法データを記憶する記憶手段と、入力される歌唱者の音声を練習者音声データとして出力する音声入力手段と、前記練習者音声データから当該練習者音声データのスペクトルを算出するスペクトル算出手段と、前記スペクトル算出手段により算出されたスペクトルの時間的な変化のパターンを解析して、この解析結果が予め定められたパターンに対応するか否かを判定し、対応する場合には当該パターンに対応する区間を特定の技法が用いられている区間として特定する特定手段と、前記特定手段により特定された区間を示す練習者技法データを生成する生成手段と、前記生成手段により生成された練習者技法データと、前記記憶手段に記憶された模範技法データとを比較して、それらが所定量以上隔たっていた場合に、予め決められた評価区間毎に相違箇所として特定する相違箇所特定手段と、前記相違箇所特定手段により特定された相違箇所を報知する報知手段とを備えることを特徴とするカラオケ装置を提供する。
また、本発明は、伴奏データを再生して伴奏演奏信号を生成するとともに、歌唱者の音声を増幅して出力するカラオケ装置において、模範音声において特定の技法が用いられている区間を示す模範技法データを記憶する記憶手段と、入力される歌唱者の音声を練習者音声データとして出力する音声入力手段と、前記練習者音声データから当該練習者音声データのパワーを算出するパワー算出手段と、前記パワー算出手段により算出されたパワーの時間的な変化のパターンを解析して、この解析結果が予め定められたパターンに対応するか否かを判定し、対応する場合には当該パターンに対応する区間を特定の技法が用いられている区間として特定する特定手段と、前記特定手段により特定された区間を示す練習者技法データを生成する生成手段と、前記生成手段により生成された練習者技法データと、前記記憶手段に記憶された模範技法データとを比較して、それらが所定量以上隔たっていた場合に、予め決められた評価区間毎に相違箇所として特定する相違箇所特定手段と、前記相違箇所特定手段により特定された相違箇所を報知する報知手段とを備えることを特徴とするカラオケ装置を提供する。
【0006】
本発明の好ましい態様においては、前記予め決められた評価区間は、所定数の小節毎の区間、音符毎の区間、発音単位毎の区間または歌詞の文字単位毎の区間のいずれかであることを特徴とする。
また、本発明の好ましい態様においては、前記特定の技法は予め複数種類設定され、前記特定手段は区間を特定するとともに、当該区間において用いられている技法も特定し、前記記憶手段に記憶される模範技法データは区間と技法を示すデータであり、前記生成手段は特定された区間と技法を示す練習者技法データを生成し、前記相違箇所特定手段は前記技法の種類毎に相違箇所を特定し、前記報知手段は技法の種類毎にことなる態様で報知を行うことを特徴とする。
【0007】
また、本発明の好ましい態様においては、前記特定手段は、前記ピッチ算出手段によって算出されたピッチの時間的な変化のパターンを解析して、中心となる周波数の上下に所定の範囲内でピッチが連続的に変動している区間を特定することを特徴とする。
本発明の別の好ましい態様においては、前記特定手段は、前記ピッチ算出手段によって算出されたピッチの時間的な変化のパターンを解析して、低いピッチから高いピッチに連続的に変化する区間を特定することを特徴とする。
本発明の別の好ましい態様においては、前記特定手段は、前記スペクトル算出手段によって算出されたスペクトルの時間的な変化のパターンを解析して、スペクトル特性の変化の態様が短時間に多様に切り替わる区間を特定することを特徴とする。
本発明の別の好ましい態様においては、前記特定手段は、前記スペクトル算出手段によって算出されたスペクトルの時間的な変化のパターンを解析して、スペクトル特性が予め決められた変化状態に急激に遷移している区間を特定することを特徴とする。
本発明の別の好ましい態様においては、音声データから音声のピッチを算出するピッチ算出手段を設け、前記特定手段は、前記ピッチ算出手段が算出したピッチが所定の領域にあるときに、前記スペクトル算出手段によって算出されたスペクトルの時間的な変化のパターンを解析して、スペクトル特性が予め決められた変化状態に急激に遷移している区間を特定することを特徴とする。
本発明の別の好ましい態様においては、伴奏データと前記音声データとを所定のフレーム単位で解析し、両者の時間的な対応関係を検出する対応関係検出手段を備え、前記特定手段は、前記対応関係検出手段によって検出された対応関係と、前記ピッチ算出手段によって算出されたピッチとに基づいて、前記音声データに含まれる音の開始時刻と当該音に対応する前記伴奏データの音の開始時刻とが異なる区間を特定することを特徴とする。
また、本発明の別の好ましい態様においては、伴奏データと前記音声データとを所定のフレーム単位で解析し、両者の時間的な対応関係を検出する対応関係検出手段を備え、前記特定手段は、前記パワー算出手段によって算出されたパワーと、前記対応関係検出手段によって検出された対応関係とに基づいて、伴奏データが有音である区間であって音声データのパワーの値が閾値よりも小さい区間を特定することを特徴とする。
【0008】
また、本発明の好ましい態様においては、模範音声データから音声のピッチを算出する模範音声ピッチ算出手段と、前記模範音声ピッチ算出手段により算出されたピッチの時間的な変化のパターンを解析して、この解析結果が予め定められたパターンに対応するか否かを判定し、対応する場合には当該パターンに対応する区間を特定の技法が用いられている区間として特定する模範音声特定手段と、前記模範音声特定手段により特定された区間を示す模範技法データを生成して、生成した模範技法データを前記記憶手段に記憶させる模範技法データ生成手段とを備えることを特徴とする。
本発明の別の好ましい態様においては、模範音声データから当該模範音声データのスペクトルを算出する模範音声スペクトル算出手段と、前記模範音声スペクトル算出手段により算出されたスペクトルの時間的な変化のパターンを解析して、この解析結果が予め定められたパターンに対応するか否かを判定し、対応する場合には当該パターンに対応する区間を特定の技法が用いられている区間として特定する模範音声特定手段と、前記模範音声特定手段により特定された区間を示す模範技法データを生成して、生成した模範技法データを前記記憶手段に記憶させる模範技法データ生成手段とを備えることを特徴とする。
本発明の別の好ましい態様においては、模範音声データから当該模範音声データのパワーを算出する模範音声パワー算出手段と、前記模範音声パワー算出手段により算出されたパワーの時間的な変化のパターンを解析して、この解析結果が予め定められたパターンに対応するか否かを判定し、対応する場合には当該パターンに対応する区間を特定の技法が用いられている区間として特定する模範音声特定手段と、前記模範音声特定手段により特定された区間を示す模範技法データを生成して、生成した模範技法データを前記記憶手段に記憶させる模範技法データ生成手段とを備えることを特徴とする。
また、本発明の更に好ましい態様においては、前記報知手段は、前記特定手段により特定された区間を報知するとともに、前記相違箇所特定手段により特定された相違箇所を報知することを特徴とする。
【発明の効果】
【0009】
本発明によれば、練習者の歌唱(または演奏)とお手本の歌唱(または演奏)との違いを練習者が把握することができる。
【発明を実施するための最良の形態】
【0010】
<A:構成>
図1は、この発明の一実施形態であるカラオケ装置1のハードウェア構成を例示したブロック図である。このカラオケ装置1は、伴奏データを再生して伴奏演奏信号を再生するとともに、歌唱者の音声を増幅して出力する。図において、11はCPU(Central Processing Unit)である。12はROM(Read Only Memory)である。13はRAM(Random Access Memory)である。14は例えばハードディスクなどの大容量記憶装置で構成された記憶部である。CPU11は、ROM12または記憶部14に記憶されているコンピュータプログラムを読み出して実行することにより、バス15を介してカラオケ装置1の各部を制御する。16は例えば液晶ディスプレイなどで構成される表示部であり、CPU11の制御の下、文字列や各種メッセージ、カラオケ装置1を操作するためのメニュー画面等を表示する。17はキーボード等の入力装置を備える操作部であり、キーの押下等に応じて操作内容に対応した信号をCPU11へ出力する。18は音声を収音するマイクロフォンであり、19は音声処理部である。マイクロフォン18は音声処理部19に接続されており、音声処理部19は、マイクロフォン18から入力される練習者(歌唱者)の音声を練習者音声データとしてCPU11に出力する。20は、音声処理部19に接続されたスピーカであり、音声処理部19から出力される信号に対応した音を出力する。
【0011】
カラオケ装置1の記憶部14は、図1に示すように、伴奏データ記憶領域14aと、模範音声データ記憶領域14bと、模範技法データ記憶領域14cと、歌詞データ記憶領域14dと、練習者音声データ記憶領域14eと、練習者技法データ記憶領域14fとを有している。伴奏データ記憶領域14aには、例えばMIDI(Musical Instruments Digital Interface)形式の伴奏データであってその曲の伴奏を行う各種楽器の音程(ピッチ)を示す情報が楽曲の進行に伴って記された伴奏データが記憶されている。次に、模範音声データ記憶領域14bには、例えばWAVE形式やMP3(MPEG Audio Layer-3)形式などの音声データであって、伴奏データの表す伴奏に沿って手本となる歌唱者が歌った歌を表す音声データ(以下、「模範音声データ」)が記憶されている。また、歌詞データ記憶領域14dには、模範音声データと対応する歌詞を示す歌詞データが記憶されている。
【0012】
記憶部14の模範技法データ記憶領域14cには、模範音声データ記憶領域14bに記憶された模範音声データの表す模範音声において特定の歌唱技法が用いられている区間とその歌唱技法とを示すデータ(以下、「模範技法データ」)が記憶される。
図2は、模範技法データの内容の一例を示す図である。図示のように、模範技法データは、「区間情報」と「種別情報」との各項目が互いに関連付けられている。これらの項目のうち、「区間情報」の項目には、模範音声データにおいて歌唱技法が用いられた区間を示す情報が記憶される。なお、この区間情報が示す区間は、開始時刻情報と終了時刻情報とによって表される時間幅を有した区間であってもよく、またはある1点の時刻を示すものであってもよい。
「種別情報」の項目には、予め複数種類設定された歌唱技法を識別する情報が記憶される。この「種別情報」は、例えば「ビブラート」、「しゃくり」、「こぶし」、「ファルセット」、「つっこみ」、「ため」、「息継ぎ」などの歌唱技法を識別する情報である。「ビブラート」は、音の高さをほんのわずかに連続的に上下させ、震えるような音色を出す技法を示す。「しゃくり」は、目的の音より低い音から発音し、音程を滑らかに目的の音に近づけていく技法を示す。「こぶし」は、装飾的に加えるうねるような節回しを行う技法を示す。「ファルセット」は、いわゆる「裏声」で歌う技法を示す。「つっこみ」は、歌い出しを本来のタイミングよりも早いタイミングにする技法を示す。「ため」は、歌い出しを本来のタイミングよりも遅いタイミングにする技法を示す。「息継ぎ」は、歌唱者が息継ぎをするタイミングを示すものである。
【0013】
次に、記憶部14の練習者音声データ記憶領域14eには、マイクロフォン18で収音される練習者の音声を表す音声データ(「以下、練習者音声データ」)が記憶される。また、練習者技法データ記憶領域14fには、練習者音声データで用いられている歌唱技法を示すデータ(以下、「練習者技法データ」)が記憶される。この練習者技法データの構成は、上述した模範技法データの構成と同様であり、「区間情報」と「種別情報」との各項目が互いに関連付けられて構成されている。
なお、以下の説明においては、説明の便宜上、「模範音声データ」と「練習者音声データ」とを各々区別する必要がない場合には、これらを「音声データ」と称することとする。また、「模範技法データ」と「練習者技法データ」とを各々区別する必要がない場合には、これらを「技法データ」と称して説明する。
【0014】
次に、カラオケ装置1のCPU11がROM12または記憶部14に記憶されたコンピュータプログラムを実行することによって実現する歌唱技法比較機能について説明する。
図3は、カラオケ装置1の歌唱技法比較機能に係るソフトウェア構成を示す図である。なお、図において、基礎分析部111、技法分析部112、対応箇所検出部113および比較・指導生成部114は、CPU11がROM12または記憶部14に記憶されたコンピュータプログラムを読み出して実行することによって実現される。なお、図中の矢印は、データの流れを概略的に示したものである。
図において、基礎分析部111は、音声データ(模範音声データまたは練習者音声データ)を音声分析して、時刻に対応したピッチ、パワー(音量)、スペクトルを当該音声データから算出する処理を行う。
技法分析部112は、基礎分析部111によって算出されたピッチ、パワーおよびスペクトルの時間的な変化のパターンを解析して、この解析結果が予め定められたパターンに対応するか否かを判定し、対応する場合には当該パターンに対応する区間を特定の歌唱技法が用いられている区間として特定し、特定した区間を示す技法データ(模範技法データまたは練習者技法データ)を生成する処理を行う。
対応箇所検出部113は、模範音声データと練習者音声データとの両者の波形を直接対比して、例えばDTW(Dynamic Time Warping)等により、模範音声データと練習者音声データとの時間的な対応付けをフレーム毎に行って対応箇所を検出する。
比較・指導生成部114は、模範技法データと練習者技法データとのタイミングを比較して、それらが所定量以上隔たっていた場合に、予め決められた評価区間毎に相違箇所として特定する処理を行う。
【0015】
<B:動作>
次に、この実施形態の動作について、図4に示すフローチャートを参照しつつ以下に説明する。
まず、練習者は、カラオケ装置1の操作部17を操作して、歌唱技法比較処理の開始を指示する旨の指示情報を入力する。カラオケ装置1のCPU11は、指示情報が入力されたことを検知すると、模範音声データを記憶部14から読み出し、読み出した模範音声データに対して音声分析処理を行い、時刻に対応したピッチ、パワー、スペクトルを模範音声データから算出する(ステップSA1)。続けて、CPU11は、模範音声データと伴奏データとを所定のフレーム単位で解析し、模範音声データと伴奏データとの時間的な対応関係を検出する(ステップSA2)。
次に、CPU11は、模範音声データから算出されたピッチ、パワーおよびスペクトルの時間的な変化のパターンを解析して、この解析結果が予め定められたパターンに対応するか否かを判定し、対応する場合には当該パターンに対応する区間を特定の歌唱技法が用いられている区間として特定する。そして、CPU11は、特定した区間の区間情報を、その歌唱技法を示す種別情報と関連付けて記憶部14の模範技法データ記憶領域14cに記憶する(ステップSA3)。
【0016】
ここで、ステップSA3に示す、各歌唱技法が用いられている区間の特定処理について以下に説明する。本実施形態においては、CPU11は、「ビブラート」、「しゃくり」、「こぶし」、「ファルセット」、「つっこみ」、「ため」および「息継ぎ」の各歌唱技法が用いられている区間を特定(検出)する。これらのうち、「ビブラート」および「しゃくり」は模範音声データから算出されたピッチに基づいて検出する。また、「こぶし」および「ファルセット」は模範音声データから算出されたスペクトルに基づいて検出する。また、「ため」および「つっこみ」は、模範音声データから算出されたピッチと伴奏データとに基づいて検出する。また、「息継ぎ」は、模範音声データから算出されたパワーと伴奏データとに基づいて検出する。
【0017】
CPU11は、模範音声データと伴奏データとの対応関係と、模範音声データから算出されたピッチとに基づいて、模範音声データに含まれる音の開始時刻と当該音に対応する伴奏データの音の開始時刻とが異なる区間を特定する。ここで、CPU11は、模範音声データのピッチの変化タイミングが伴奏データのピッチの変化タイミングよりも早く現れている区間、すなわち模範音声データに含まれる音の開始時刻が当該音に対応する伴奏データの音の開始時刻よりも早い区間については、この区間を「つっこみ」の歌唱技法が用いられている区間であると特定する。CPU11は、特定した区間の区間情報を、「つっこみ」を示す識別情報と関連付けて記憶部14の模範技法データ記憶領域14cに記憶する。
逆に、CPU11は、模範音声データと伴奏データとの対応関係と、模範音声データから算出されたピッチとに基づいて、模範音声データのピッチの変化タイミングが伴奏データのピッチの変化タイミングよりも遅れて現れている区間、すなわち模範音声データに含まれる音の開始時刻が当該音に対応する伴奏データの音の開始時刻よりも遅い区間を検出し、検出した区間を「ため」の歌唱技法が用いられている区間であると特定する。
【0018】
また、CPU11は、模範音声データから算出したピッチの時間的な変化のパターンを解析して、中心となる周波数の上下に所定の範囲内でピッチが連続的に変動している区間を検出し、検出した区間を「ビブラート」の歌唱技法が用いられている区間であると特定する。
【0019】
また、CPU11は、模範音声データから算出したピッチの時間的な変化のパターンを解析して、低いピッチから高いピッチに連続的にピッチが変化する区間を検出し、検出した区間を「しゃくり」の歌唱技法が用いられている区間であると特定する。なお、この処理は、伴奏データとの対応関係に基づいて行うようにしてもよい。すなわち、CPU11は、模範音声データと伴奏データとの対応関係に基づいて、模範音声データのピッチが、低いピッチから連続的に伴奏データのピッチに近づいている区間を検出すればよい。
【0020】
また、CPU11は、模範音声データと伴奏データとの対応関係と、模範音声データから算出されたパワーとに基づいて、伴奏データが有音である区間であって模範音声データのパワー値が所定の閾値よりも小さい区間を検出し、検出した箇所を「息継ぎ」の区間であると特定する。
【0021】
また、CPU11は、模範音声データから算出されたスペクトルの時間的な変化パターンを解析して、スペクトル特性がその予め決められた変化状態に急激に遷移している区間を検出し、検出した区間を「ファルセット」の歌唱技法が用いられている区間であると特定する。ここで、予め決められた変化状態とは、スペクトル特性の高調波成分が極端に少なくなる状態である。例えば、図5に示すように、地声の場合は沢山の高調波成分が含まれるが(同図(a)参照)、ファルセットになると高調波成分の大きさが極端に小さくなる(同図(b)参照)。なお、この場合、CPU11は、ピッチが大幅に上方に変化したかどうかも参照してもよい。ファルセットは地声と同一のピッチを発生する場合でも用いられることもあるが、一般には地声では発声できない高音を発声するときに使われる技法だからである。したがって、音声データのピッチが所定音高以上の場合に限って「ファルセット」の検出をするように構成してもよい。また、男声と女声とでは一般にファルセットを用いる音高の領域が異なるので、音声データの音域や、音声データから検出されるフォルマントによって性別検出を行い、この結果を踏まえてファルセット検出の音高領域を設定してもよい。
また、CPU11は、スペクトル特性の変化の態様が短時間に多様に切り替わる区間を検出し、検出した部分を「こぶし」の歌唱技法が用いられている部分であると特定する。「こぶし」の場合は、短い区間において声色や発声方法を変えて唸るような味わいを付加する歌唱技法であるため、この技法が用いられている区間においてはスペクトル特性が多様に変化するからである。
以上のようにして、CPU11は、模範音声データから各歌唱技法が用いられている区間を検出し、検出した区間を示す区間情報をその歌唱技法を示す種別情報と関連付けて記憶部14の模範技法データ記憶領域14cに記憶する。
【0022】
図4の説明に戻る。カラオケ装置1のCPU11は、模範技法データの生成処理を終える(ステップSA3)と、伴奏データを読み出して、読み出した伴奏データを音声処理部19に供給し、音声処理部19は、供給された伴奏データをアナログ信号に変換して伴奏データの表す音声をスピーカ20から発音させる。なお、このとき、CPU11が表示部16を制御して、例えば「伴奏に合わせて歌唱してください」といった、歌唱を促すメッセージを表示するようにしてもよい。
【0023】
練習者は、スピーカ20から発音される伴奏に併せて歌唱を行う。練習者によって歌唱が行われると、練習者の音声がマイクロフォン18によって音声信号に変換され、変換された信号が音声処理部19へ出力される。音声処理部19は、マイクロフォン18から出力された音声信号をデジタルデータに変換して練習者音声データとする(ステップSA4)。この練習者音声データは、音声処理部19から出力されて記憶部14の練習者音声データ記憶領域14eに記憶される。
【0024】
伴奏データの再生が終了すると、カラオケ装置1のCPU11は、練習者音声データ記憶領域14eに記憶された練習者音声データに対して基礎分析処理を行って、ピッチ、パワー、スペクトルを算出する(ステップSA5)。また、カラオケ装置1のCPU11は、練習者音声データと伴奏データとを所定のフレーム単位で解析し、練習者音声データと伴奏データとの時間的な対応関係を検出する(ステップSA6)。続けて、CPU11は、練習者音声データから練習者技法データを生成する(ステップSA7)。これらのステップSA5〜SA7に示した処理と、上述したステップSA2〜SA4に示した処理が異なる点は、処理対象となる音声データが異なる点である。すなわち、ステップSA2〜ステップSA4では模範音声データに対して処理を行い、ステップSA5〜SA7では練習者音声データに対して処理が行われるものの、その処理内容については同様であるため、ステップSA5〜ステップSA7についてはその詳細な説明を省略する。
【0025】
次に、カラオケ装置1のCPU11は、模範音声データと練習者音声データとの両者の波形同士を直接対比して、例えばDTW等により、模範音声データと、練習者音声データとの時間的な対応付けをフレーム毎に行い、両者の対応箇所を検出する(ステップSA8)。
【0026】
続けて、カラオケ装置1のCPU11は、ステップSA8で検出した対応箇所に基づいて、生成された練習者技法データと記憶部14の模範技法データ記憶領域14cに記憶された模範技法データとを比較して、それらが所定量以上隔たっていた場合に、予め定められた評価区間毎に相違箇所として特定する。(ステップSA9)。具体的には、例えば、CPU11は、記憶部14の模範技法データ記憶領域14cに記憶された模範技法データをひとつずつ読み出して、読み出した模範技法データと対応する練習者技法データを練習者技法データ記憶領域14fから検索し、歌詞の文字単位毎の区間を評価区間として、模範技法データの区間情報と練習者技法データの区間情報とが所定量以上隔たっている評価区間を相違箇所として特定する。このようにして相違箇所を特定することによって、模範音声で歌唱技法が用いられている区間と練習者音声で歌唱技法が用いられている区間とに時間的なずれがある相違箇所を特定することができ、また、模範音声で歌唱技法が用いられている区間であって練習者音声で歌唱技法が用いられていない区間についても、この区間を相違箇所として特定することができる。
【0027】
相違箇所を特定すると、カラオケ装置1のCPU11は、特定した相違箇所を示す相違箇所情報を表示部16に供給して、特定した相違箇所を表示部16に表示させることによって、練習者に相違箇所を報知する(ステップSA10)。
図6は、カラオケ装置1の表示部16に表示される画面の一例を示す図である。カラオケ装置1のCPU11は、記憶部14の歌詞データ記憶領域14dに記憶された歌詞データに基づいて歌詞A1を表示させる。また、CPU11は、模範技法データの種別情報と区間情報とに基づいて、模範音声において各歌唱技法が用いられている区間と対応する歌詞の文字の近傍に、当該種別情報と対応する歌唱技法を示すアイコンI1〜I3を表示させる。また、CPU11は、ステップSA9において特定した相違箇所(評価区間)に対応する歌詞の文字の色や太さを他の文字と異ならせる等、相違箇所に対応する文字の表示態様を他の文字と異ならせて表示させることによって、相違箇所を報知する。図6に示す例においては、画面に表示された「ぽ」と「い」の文字が、他の文字よりも太く表示されており、これらの文字と対応する区間が模範音声と相違していることを示している。
【0028】
図6に示す画面において、練習者は、操作部17を操作して、相違箇所についての詳細を表示する旨を指示することができる。この処理は、例えば、CPU11が、図6に示す画面にボタンB1を表示させ、このボタンB1が操作部17のマウス等によりクリックされることによって指示されるようにすればよい。
指示情報が入力されたことを検知すると、カラオケ装置1のCPU11は、例えば図7に示すような、相違箇所についての詳細を示す画面を表示部16に表示させる。
図7において、カラオケ装置1のCPU11は、記憶部14に記憶された歌詞データに基づいて歌詞A2を表示させ、また、模範音声データに基づいて、歌詞A2に対応する模範音声データのピッチの時間的変化を示すグラフA3を表示させる。また、CPU11は、練習者音声データに基づいて、当該練習者音声データのピッチの時間的変化を示すグラフA4を表示させる。また、図7に示す例においては、グラフA3,A4において特定した相違箇所と対応する部分に丸印A51,A52を表示させることによって、相違箇所を報知している。なお、図7に示す例においては、相違箇所以外についても、模範音声と練習者音声とのそれぞれで用いられている歌唱技法が一致している箇所についても、丸印A53を表示させている。なお、この場合は、相違箇所とそれ以外の箇所とを例えば異なる色で表示させる等して区別するようにすればよい。
【0029】
このように本実施形態においては、模範技法データと練習者技法データとを比較して、模範音声の歌唱技法と練習者音声の歌唱技法との相違箇所を表示するから、練習者は、模範音声と自分の音声との歌唱技法の違いを視覚的に把握することができる。これにより、練習者は、どのタイミングで歌唱技法を用いればいいかといった歌唱ポイントを把握することができるとともに、自分の歌唱をどのように修正すればよいか(例えば、ビブラートをもう少し長く用いる、等)を、視覚的に把握することができる。
【0030】
<C:変形例>
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限定されることなく、他の様々な形態で実施可能である。以下にその一例を示す。
(1)上述した実施形態においては、模範音声データから歌唱技法が用いられている区間を検出して模範技法データを生成するようにした。これに代えて、模範音声データそのものは記憶させておかずに、模範技法データを予め記憶部に記憶させておき、記憶された模範技法データを用いて比較処理を行うようにしてもよい。この場合は、模範技法データの生成処理(図4のステップSA1〜ステップSA3の処理)を行う必要はない。この場合は、練習者によって歌唱が行われると、CPU11は、上述した実施形態と同様に、練習者歌唱データから練習者技法データを生成し、練習者技法データと記憶部に記憶された模範技法データとを比較して、予め決められた評価区間毎に相違箇所を特定する。
【0031】
または、模範音声データそのものは記憶させておかずに、基礎分析データ(ピッチ、パワー、スペクトル)を予め記憶部に記憶させておくようにしてもよい。この場合は、記憶された基礎分析データから模範技法データを生成すればよく、模範音声データの音声分析処理(図4のステップSA1の処理)を行う必要はない。
【0032】
(2)上述した実施形態においては、音声データ(模範音声データまたは練習者音声データ)から歌唱技法が用いられている区間を検出して技法データ(模範技法データまたは練習者技法データ)を生成するようにしたが、本発明における音声データは、歌唱者の音声を表す音声データに限定されるものではなく、楽器の演奏を表す音声データにも適用することができる。この場合も、カラオケ装置のCPUが、楽器の演奏データから演奏技法(例えば、ビブラート、息継ぎ、ため等)が用いられている区間を、上述した実施形態と同様の方法で検出して、検出した区間を示す技法データを生成するようにすればよい。すなわち、音声データは、人の歌声を表す音声データであってもよく、楽器の演奏音を表す音声データであってもよい。また、技法データ(模範技法データおよび練習者技法データ)は、歌唱における技法を表す技法データであってもよく、または、楽器の演奏技法を表す技法データであってもよい。
【0033】
(3)上述した実施形態においては、歌詞データを予め記憶部に記憶させておくようにしたが、これに代えて、カラオケ装置のCPUが、音声データに対して音声認識処理を施して、音声データから歌詞データを自動的に生成するようにしてもよい。この場合は、CPUが、伴奏データと、音声データから抽出したピッチとを照合させて、どの歌詞がどのタイミングで歌われているかを自動的に割り付けるようにすればよい。
【0034】
(4)上述した実施形態においては、記憶部14の模範音声データ記憶領域14bに記憶される音声データはWAVE形式やMP3形式のデータとしたが、データの形式はこれに限定されるものではなく、音声を示すデータであればどのような形式のデータであってもよい。
また、上述した実施形態においては、模範音声データを記憶部14に記憶させて、カラオケ装置1のCPU11が記憶部14から模範音声データを読み出すようにしたが、これに代えて、通信ネットワークを介して音声データを受信するようにしてもよい。要するに、模範音声データをCPU11に入力するようにすればよい。このようにすれば、所望の歌手の音声データをダウンロードして用いることができるから、練習者は、その歌手の歌唱技法と自身の歌唱技法とを比較することができ、所望の歌手の歌唱技法を真似て歌唱することが容易になる。
【0035】
(5)上述した実施形態においては、歌唱技法として「ビブラート」や「ため」等を検出するようにしたが、検出する歌唱技法(または演奏技法)は上述した実施形態において示したものに限定されるものではなく、例えば、スタッカートやクレッシェンド(デクレッシェンド)等であってもよい。具体的には、音声データから検出したパワーがある短い一定期間の間だけ強く現れる区間をスタッカートとして検出するようにしてもよい。また、パワーデータ値が連続的に徐々に大きくなる(小さくなる)区間をクレッシェンド(デクレッシェンド)として検出するようにしてもよい。要するに、音声データから算出されたピッチやスペクトル、パワーの時間的な変化のパターンを解析して、この解析結果が予め定められたパターンに対応するか否かを判定し、対応する場合には当該パターンに対応する区間を特定の技法が用いられている区間として特定すればよい。
【0036】
(6)上述した実施形態においては、練習者が歌唱した後で、練習者の歌唱技法と模範音声の歌唱技法とを比較して、両者の相違箇所を報知するようにしたが、模範音声で用いられている歌唱技法(または演奏技法)を、練習者が歌唱する際にリアルタイムで表示しておくようにしてもよい。この場合に表示される画面の一例を図8に示す。図8に示す例においては、カラオケ装置のCPUは、記憶部に記憶された歌詞データA11に基づいて歌詞を表示させるとともに、模範技法データに基づいて、模範音声において各歌唱技法が用いられている区間と対応する文字の近傍に、その歌唱技法を示すアイコンI4〜I7を表示させる。
このようにすれば、練習者は、歌唱する前に(または歌唱している最中に)模範音声で用いている歌唱技法(ビブラート、ため等)を視覚的に把握することができるから、お手本の歌唱技法を真似て歌いやすくなる。
【0037】
(7)上述した実施形態においては、歌詞の文字単位毎の区間毎に相違箇所を特定するようにした。この相違箇所を特定する評価区間は、歌詞の文字単位毎の区間に限定されるものではなく、例えば、所定数の小節毎の区間や、音符毎の区間、発音単位毎の区間などであってもよい。または、楽曲の冒頭からの絶対時刻の相違箇所を特定するようにしてもよい。
【0038】
(8)上述した実施形態においては、特定した相違箇所と対応する文字の表示態様を他の文字と異ならせて表示させることによって、相違箇所を報知するようにした。相違箇所の報知方法はこれに限定されるものではなく、例えば相違箇所と対応する歌詞の近傍にアイコンを表示させるようにしてもよい。または、例えば図6に示した歌唱技法を示すアイコンI1〜I3の表示態様を異ならせることによって相違箇所を報知するようにしてもよい。また、小節毎の区間を評価区間とする場合は、相違箇所と対応する小節の表示態様を他の小節の表示態様と異ならせて表示するようにしてもよく、または、相違箇所と対応する小節のみを表示するようにしてもよい。要するに、練習者に相違箇所を報知できる方法であればどのようなものであってもよい。
【0039】
(9)上述した実施形態においては、「ビブラート」や「ため」等の複数種類の技法が予め設定され、CPU11は、区間を特定するとともに、当該区間において用いられている技法も特定し、技法データ(模範音声データおよび練習者音声データ)は区間と技法を示すデータであり、また、CPU11は、技法の種類毎に相違箇所を特定し、技法の種類毎にことなる態様(アイコン)で報知を行うようになっていた。複数種類の技法を予め設定する必要はなく、1種類の技法についてのみ比較を行うようにしてもよい。この場合は、技法データは、区間を示すデータのみでよい。
【0040】
(10)上述した実施形態では、カラオケ装置1が、本実施形態に係る技法データ生成処理や、相違箇所特定処理等を行うようになっていた。これに対し、通信ネットワークで接続された2以上の装置が上記実施形態に係る機能を分担するようにし、それら複数の装置を備えるシステムが同実施形態のカラオケ装置1を実現するようにしてもよい。例えば、マイクロフォンやスピーカ、表示装置および入力装置等を備えるコンピュータ装置と、技法データ生成処理や相違箇所特定処理を実行するサーバ装置とが通信ネットワークで接続されたシステムとして構成されていてもよい。この場合は、コンピュータ装置が、マイクロフォンから入力された音声を音声データに変換してサーバ装置に送信し、サーバ装置が、受信した音声データと模範音声データとの比較処理を行って相違箇所を特定し、相違箇所を示す相違箇所情報をコンピュータ装置に送信するようにすればよい。
【0041】
(11)上述した実施形態におけるカラオケ装置1のCPU11によって実行されるプログラムは、磁気テープ、磁気ディスク、フロッピー(登録商標)ディスク、光記録媒体、光磁気記録媒体、CD(Compact Disk)−ROM、DVD(Digital Versatile Disk)、RAMなどの記録媒体に記憶した状態で提供し得る。また、インターネットのようなネットワーク経由でカラオケ装置1にダウンロードさせることも可能である。
【図面の簡単な説明】
【0042】
【図1】カラオケ装置のハードウェア構成の一例を示すブロック図である。
【図2】模範技法データの内容の一例を示す図である。
【図3】カラオケ装置のソフトウェア構造の一例を示すブロック図である。
【図4】カラオケ装置の制御部が行う処理の流れを示すフローチャートである。
【図5】ファルセットの検出処理を説明するための図である。
【図6】カラオケ装置の表示部に表示される画面の一例を示す図である。
【図7】カラオケ装置の表示部に表示される画面の一例を示す図である。
【図8】カラオケ装置の表示部に表示される画面の一例を示す図である。
【符号の説明】
【0043】
1…カラオケ装置、11…CPU、12…ROM、13…RAM、14…記憶部、15…バス、16…表示部、17…操作部、18…マイクロフォン、19…音声処理部、20…スピーカ、111…基礎分析部、112…技法分析部、113…対応箇所検出部、114…比較・指導生成部。

【特許請求の範囲】
【請求項1】
伴奏データを再生して伴奏演奏信号を生成するとともに、歌唱者の音声を増幅して出力するカラオケ装置において、
模範音声において特定の技法が用いられている区間を示す模範技法データを記憶する記憶手段と、
入力される歌唱者の音声を練習者音声データとして出力する音声入力手段と、
前記練習者音声データから音声のピッチを算出するピッチ算出手段と、
前記ピッチ算出手段により算出されたピッチの時間的な変化のパターンを解析して、この解析結果が予め定められたパターンに対応するか否かを判定し、対応する場合には当該パターンに対応する区間を特定の技法が用いられている区間として特定する特定手段と、
前記特定手段により特定された区間を示す練習者技法データを生成する生成手段と、
前記生成手段により生成された練習者技法データと、前記記憶手段に記憶された模範技法データとを比較して、それらが所定量以上隔たっていた場合に、予め決められた評価区間毎に相違箇所として特定する相違箇所特定手段と、
前記相違箇所特定手段により特定された相違箇所を報知する報知手段と
を備えることを特徴とするカラオケ装置。
【請求項2】
伴奏データを再生して伴奏演奏信号を生成するとともに、歌唱者の音声を増幅して出力するカラオケ装置において、
模範音声において特定の技法が用いられている区間を示す模範技法データを記憶する記憶手段と、
入力される歌唱者の音声を練習者音声データとして出力する音声入力手段と、
前記練習者音声データから当該練習者音声データのスペクトルを算出するスペクトル算出手段と、
前記スペクトル算出手段により算出されたスペクトルの時間的な変化のパターンを解析して、この解析結果が予め定められたパターンに対応するか否かを判定し、対応する場合には当該パターンに対応する区間を特定の技法が用いられている区間として特定する特定手段と、
前記特定手段により特定された区間を示す練習者技法データを生成する生成手段と、
前記生成手段により生成された練習者技法データと、前記記憶手段に記憶された模範技法データとを比較して、それらが所定量以上隔たっていた場合に、予め決められた評価区間毎に相違箇所として特定する相違箇所特定手段と、
前記相違箇所特定手段により特定された相違箇所を報知する報知手段と
を備えることを特徴とするカラオケ装置。
【請求項3】
伴奏データを再生して伴奏演奏信号を生成するとともに、歌唱者の音声を増幅して出力するカラオケ装置において、
模範音声において特定の技法が用いられている区間を示す模範技法データを記憶する記憶手段と、
入力される歌唱者の音声を練習者音声データとして出力する音声入力手段と、
前記練習者音声データから当該練習者音声データのパワーを算出するパワー算出手段と、
前記パワー算出手段により算出されたパワーの時間的な変化のパターンを解析して、この解析結果が予め定められたパターンに対応するか否かを判定し、対応する場合には当該パターンに対応する区間を特定の技法が用いられている区間として特定する特定手段と、
前記特定手段により特定された区間を示す練習者技法データを生成する生成手段と、
前記生成手段により生成された練習者技法データと、前記記憶手段に記憶された模範技法データとを比較して、それらが所定量以上隔たっていた場合に、予め決められた評価区間毎に相違箇所として特定する相違箇所特定手段と、
前記相違箇所特定手段により特定された相違箇所を報知する報知手段と
を備えることを特徴とするカラオケ装置。
【請求項4】
前記予め決められた評価区間は、所定数の小節毎の区間、音符毎の区間、発音単位毎の区間または歌詞の文字単位毎の区間のいずれかであることを特徴とする請求項1乃至3のいずれかに記載のカラオケ装置。
【請求項5】
前記特定の技法は予め複数種類設定され、前記特定手段は区間を特定するとともに、当該区間において用いられている技法も特定し、前記記憶手段に記憶される模範技法データは区間と技法を示すデータであり、前記生成手段は特定された区間と技法を示す練習者技法データを生成し、前記相違箇所特定手段は前記技法の種類毎に相違箇所を特定し、前記報知手段は技法の種類毎にことなる態様で報知を行うことを特徴とする請求項1乃至3のいずれかに記載のカラオケ装置。
【請求項6】
前記特定手段は、前記ピッチ算出手段によって算出されたピッチの時間的な変化のパターンを解析して、中心となる周波数の上下に所定の範囲内でピッチが連続的に変動している区間を特定する
ことを特徴とする請求項1に記載のカラオケ装置。
【請求項7】
前記特定手段は、前記ピッチ算出手段によって算出されたピッチの時間的な変化のパターンを解析して、低いピッチから高いピッチに連続的に変化する区間を特定する
ことを特徴とする請求項1に記載のカラオケ装置。
【請求項8】
前記特定手段は、前記スペクトル算出手段によって算出されたスペクトルの時間的な変化のパターンを解析して、スペクトル特性の変化の態様が短時間に多様に切り替わる区間を特定する
ことを特徴とする請求項2に記載のカラオケ装置。
【請求項9】
前記特定手段は、前記スペクトル算出手段によって算出されたスペクトルの時間的な変化のパターンを解析して、スペクトル特性が予め決められた変化状態に急激に遷移している区間を特定する
ことを特徴とする請求項2に記載のカラオケ装置。
【請求項10】
音声データから音声のピッチを算出するピッチ算出手段を設け、前記特定手段は、前記ピッチ算出手段が算出したピッチが所定の領域にあるときに、前記スペクトル算出手段によって算出されたスペクトルの時間的な変化のパターンを解析して、スペクトル特性が予め決められた変化状態に急激に遷移している区間を特定する
ことを特徴とする請求項2に記載のカラオケ装置。
【請求項11】
伴奏データと前記音声データとを所定のフレーム単位で解析し、両者の時間的な対応関係を検出する対応関係検出手段を備え、
前記特定手段は、前記対応関係検出手段によって検出された対応関係と、前記ピッチ算出手段によって算出されたピッチとに基づいて、前記音声データに含まれる音の開始時刻と当該音に対応する前記伴奏データの音の開始時刻とが異なる区間を特定する
ことを特徴とする請求項1に記載のカラオケ装置。
【請求項12】
伴奏データと前記音声データとを所定のフレーム単位で解析し、両者の時間的な対応関係を検出する対応関係検出手段を備え、
前記特定手段は、前記パワー算出手段によって算出されたパワーと、前記対応関係検出手段によって検出された対応関係とに基づいて、伴奏データが有音である区間であって音声データのパワーの値が閾値よりも小さい区間を特定する
ことを特徴とする請求項3に記載のカラオケ装置。
【請求項13】
模範音声データから音声のピッチを算出する模範音声ピッチ算出手段と、
前記模範音声ピッチ算出手段により算出されたピッチの時間的な変化のパターンを解析して、この解析結果が予め定められたパターンに対応するか否かを判定し、対応する場合には当該パターンに対応する区間を特定の技法が用いられている区間として特定する模範音声特定手段と、
前記模範音声特定手段により特定された区間を示す模範技法データを生成して、生成した模範技法データを前記記憶手段に記憶させる模範技法データ生成手段と
を備えることを特徴とする請求項1に記載のカラオケ装置。
【請求項14】
模範音声データから当該模範音声データのスペクトルを算出する模範音声スペクトル算出手段と、
前記模範音声スペクトル算出手段により算出されたスペクトルの時間的な変化のパターンを解析して、この解析結果が予め定められたパターンに対応するか否かを判定し、対応する場合には当該パターンに対応する区間を特定の技法が用いられている区間として特定する模範音声特定手段と、
前記模範音声特定手段により特定された区間を示す模範技法データを生成して、生成した模範技法データを前記記憶手段に記憶させる模範技法データ生成手段と
を備えることを特徴とする請求項2に記載のカラオケ装置。
【請求項15】
模範音声データから当該模範音声データのパワーを算出する模範音声パワー算出手段と、
前記模範音声パワー算出手段により算出されたパワーの時間的な変化のパターンを解析して、この解析結果が予め定められたパターンに対応するか否かを判定し、対応する場合には当該パターンに対応する区間を特定の技法が用いられている区間として特定する模範音声特定手段と、
前記模範音声特定手段により特定された区間を示す模範技法データを生成して、生成した模範技法データを前記記憶手段に記憶させる模範技法データ生成手段と
を備えることを特徴とする請求項3に記載のカラオケ装置。
【請求項16】
前記報知手段は、前記特定手段により特定された区間を報知するとともに、前記相違箇所特定手段により特定された相違箇所を報知する
ことを特徴とする請求項1乃至15のいずれかに記載のカラオケ装置。
【請求項17】
模範音声において特定の技法が用いられている区間を示す模範技法データを記憶する記憶手段と、制御手段とを備え、伴奏データを再生して伴奏演奏信号を生成するとともに、歌唱者の音声を増幅して出力するカラオケ装置の制御方法であって、
前記制御手段が、練習者の音声を表す練習者音声データから音声のピッチを算出するステップと、
前記制御手段が、算出されたピッチの時間的な変化のパターンを解析して、この解析結果が予め定められたパターンに対応するか否かを判定し、対応する場合には当該パターンに対応する区間を特定の技法が用いられている区間として特定するステップと、
前記制御手段が、特定された区間を示す練習者技法データを生成するステップと、
前記制御手段が、生成された練習者技法データと前記記憶手段に記憶された模範技法データとを比較して、それらが所定量以上隔たっていた場合に、予め決められた評価区間毎に相違箇所として特定するステップと、
前記制御手段が、特定された相違箇所を示す相違箇所情報を出力するステップと
を備えることを特徴とする制御方法。
【請求項18】
模範音声において特定の技法が用いられている区間を示す模範技法データを記憶する記憶手段と、制御手段とを備え、伴奏データを再生して伴奏演奏信号を生成するとともに、歌唱者の音声を増幅して出力するカラオケ装置の制御方法であって、
前記制御手段が、練習者の音声を表す練習者音声データから当該練習者音声データのスペクトルを算出するステップと、
前記制御手段が、算出されたスペクトルの時間的な変化のパターンを解析して、この解析結果が予め定められたパターンに対応するか否かを判定し、対応する場合には当該パターンに対応する区間を特定の技法が用いられている区間として特定するステップと、
前記制御手段が、特定された区間を示す練習者技法データを生成するステップと、
前記制御手段が、生成された練習者技法データと前記記憶手段に記憶された模範技法データとを比較して、それらが所定量以上隔たっていた場合に、予め決められた評価区間毎に相違箇所として特定するステップと、
前記制御手段が、特定された相違箇所を示す相違箇所情報を出力するステップと
を備えることを特徴とする制御方法。
【請求項19】
模範音声において特定の技法が用いられている区間を示す模範技法データを記憶する記憶手段と、制御手段とを備え、伴奏データを再生して伴奏演奏信号を生成するとともに、歌唱者の音声を増幅して出力するカラオケ装置の制御方法であって、
前記制御手段が、練習者の音声を表す練習者音声データから当該練習者音声データのパワーを算出するステップと、
前記制御手段が、算出されたパワーの時間的な変化のパターンを解析して、この解析結果が予め定められたパターンに対応するか否かを判定し、対応する場合には当該パターンに対応する区間を特定の技法が用いられている区間として特定するステップと、
前記制御手段が、特定された区間を示す練習者技法データを生成するステップと、
前記制御手段が、生成された練習者技法データと前記記憶手段に記憶された模範技法データとを比較して、それらが所定量以上隔たっていた場合に、予め決められた評価区間毎に相違箇所として特定するステップと、
前記制御手段が、特定された相違箇所を示す相違箇所情報を出力するステップと
を備えることを特徴とする制御方法。
【請求項20】
模範音声において特定の技法が用いられている区間を示す模範技法データを記憶する記憶手段を備え、伴奏データを再生して伴奏演奏信号を生成するとともに、歌唱者の音声を増幅して出力するカラオケ装置に、
練習者の音声を表す練習者音声データから音声のピッチを算出するピッチ算出機能と、
前記ピッチ算出機能により算出されたピッチの時間的な変化のパターンを解析して、この解析結果が予め定められたパターンに対応するか否かを判定し、対応する場合には当該パターンに対応する区間を特定の技法が用いられている区間として特定する特定機能と、
前記特定機能により特定された区間を示す練習者技法データを生成する生成機能と、
前記生成機能により生成された練習者技法データと前記記憶手段に記憶された模範技法データとを比較して、それらが所定量以上隔たっていた場合に、予め決められた評価区間毎に相違箇所として特定する相違箇所特定機能と、
前記相違箇所特定機能により特定された相違箇所を示す相違箇所情報を出力する出力機能と
を実現させるプログラム。
【請求項21】
模範音声において特定の技法が用いられている区間を示す模範技法データを記憶する記憶手段を備え、伴奏データを再生して伴奏演奏信号を生成するとともに、歌唱者の音声を増幅して出力するカラオケ装置に、
練習者の音声を表す練習者音声データから当該練習者音声データのスペクトルを算出するスペクトル算出機能と、
前記スペクトル算出機能により算出されたスペクトルの時間的な変化のパターンを解析して、この解析結果が予め定められたパターンに対応するか否かを判定し、対応する場合には当該パターンに対応する区間を特定の技法が用いられている区間として特定する特定機能と、
前記特定機能により特定された区間を示す練習者技法データを生成する生成機能と、
前記生成機能により生成された練習者技法データと前記記憶手段に記憶された模範技法データとを比較して、それらが所定量以上隔たっていた場合に、予め決められた評価区間毎に相違箇所として特定する相違箇所特定機能と、
前記相違箇所特定機能により特定された相違箇所を示す相違箇所情報を出力する出力機能と
を実現させるプログラム。
【請求項22】
模範音声において特定の技法が用いられている区間を示す模範技法データを記憶する記憶手段を備え、伴奏データを再生して伴奏演奏信号を生成するとともに、歌唱者の音声を増幅して出力するカラオケ装置に、
練習者の音声を表す練習者音声データから当該練習者音声データのパワーを算出するパワー算出機能と、
前記パワー算出機能により算出されたパワーの時間的な変化のパターンを解析して、この解析結果が予め定められたパターンに対応するか否かを判定し、対応する場合には当該パターンに対応する区間を特定の技法が用いられている区間として特定する特定機能と、
前記特定機能により特定された区間を示す練習者技法データを生成する生成機能と、
前記生成機能により生成された練習者技法データと前記記憶手段に記憶された模範技法データとを比較して、それらが所定量以上隔たっていた場合に、予め決められた評価区間毎に相違箇所として特定する相違箇所特定機能と、
前記相違箇所特定機能により特定された相違箇所を示す相違箇所情報を出力する出力機能と
を実現させるプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2007−232750(P2007−232750A)
【公開日】平成19年9月13日(2007.9.13)
【国際特許分類】
【出願番号】特願2006−50507(P2006−50507)
【出願日】平成18年2月27日(2006.2.27)
【出願人】(000004075)ヤマハ株式会社 (5,930)
【Fターム(参考)】