カラオケ装置

【課題】カラオケ歌唱される歌詞の音声認識に関し、スピーカからカラオケ演奏音が放音されても、適切な音声認識を得られるようにする。
【解決手段】歌詞用信号生成部Ｍ７０は、カラオケ演奏音の音信号と歌唱音声信号とを比較し、歌唱音声信号からカラオケ演奏音の音信号を減じた音声認識用信号を生成するので、スピーカＭ２０から放音されたカラオケ演奏音に対応する音信号が減じられる。そして、音声認識部Ｍ７６は、歌詞用信号生成部Ｍ７０によって生成された音声認識用信号に基づいてカラオケ歌唱の歌詞を認識するので、適切な音声認識結果を得ることができる。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、カラオケ装置におけるカラオケ歌唱に関し、特にカラオケ歌唱される歌詞の音声認識技術に関する。
【背景技術】
【０００２】
従来、カラオケ装置の付帯機能として採点機能が知られている。この採点機能は、次のような機能である。すなわち、マイクロフォンから入力された歌唱者の音声信号をサンプリングすることで歌唱者が発声した音高や声量あるいはテンポなどの歌唱状態を示す歌唱データを生成する。次に、この歌唱データとカラオケデータ中の主旋律パートデータなどの採点基準データとを比較し、その比較結果に基づいて所定の得点を付与して採点データを生成する。そして、歌唱パートが終了するとこの採点データ中の得点を集計して総合得点を算出する。総合得点はそのままの得点をスコアボードやディスプレイに表示したり、所定のメッセージや所定の表現内容を含む映像など総合得点を反映した映像をディスプレイに出力したりする（例えば特許文献１参照）。
【０００３】
また、デュエット曲など複数人が歌唱する場合に、各人の歌唱音声について採点する採点機能を有するカラオケ装置（例えば特許文献２参照）や２系統のマイクロフォンからの音声信号の入力頻度に基づいて男女を判定し別々に採点する歌唱採点方式のようなカラオケ装置（例えば特許文献３参照）がある。
【０００４】
そして、上述のような採点機能を有するカラオケ装置では、歌唱者が発声した音高や声量あるいはテンポなどの歌唱状態を示す歌唱データに基づいてカラオケ歌唱力を採点するものであった。
【０００５】
ところが、カラオケ歌唱において、カラオケ歌唱される歌詞を音声認識するようなカラオケ装置はなかった。
なお、カラオケ装置の技術分野に限らなければ、制御用の音声指令の他に、騒音や、オーディオ機器の出力音等が存在する環境下でも十分に音声認識を可能とする騒音除去装置のような音声認識する装置（例えば特許文献４参照）がある。
【特許文献１】特許第３２６１９９０号公報
【特許文献２】特開２０００−３３０５８０号公報
【特許文献３】特開平１１−２８２４７８号公報
【特許文献４】特開平５−７３０９１号公報
【発明の開示】
【発明が解決しようとする課題】
【０００６】
しかし、近年、カラオケ装置を使ってカラオケ歌唱の歌詞を間違えないで歌唱できるかを競うゲームが登場してきた。このゲームにおいては、審査員などがカラオケ歌唱の歌詞を間違えないで歌唱したか否か判断していた。すなわち、審査員などの耳を通して、カラオケ歌唱された歌詞を聴いて歌詞を認識し、カラオケ歌唱されたカラオケ演奏曲の歌詞とを比較してカラオケ歌唱の歌詞を間違えないで歌唱したか否かを判断していた。
【０００７】
したがって、１人でカラオケ装置を使ってカラオケ歌唱する場合には、このゲームを楽しむことができなかった。また、多人数でカラオケ歌唱する場合でも、例えば１人の利用者がカラオケ歌唱した歌詞を聴いて歌詞を認識し、カラオケ歌唱されたカラオケ演奏曲の歌詞とを比較してカラオケ歌唱の歌詞を間違えないで歌唱したか否かを判断する同伴者にとっては、カラオケ演奏を十分に楽しむことができなかった。
【０００８】
また、カラオケ歌唱の歌詞の中から歌唱してはいけない歌詞（以下、ＮＧワードと称す）を予め決めておいて、カラオケ歌唱中にＮＧワ−ドを歌唱したか否かを競うゲームも登場してきた。このゲームにおいても、審査員などがカラオケ歌唱中にＮＧワ−ドを歌唱したか否かを判断していた。
【０００９】
これらのゲームにおいて、「歌唱採点」と同様に審査員などの人手に頼らずに自動化することが求められている。
しかし、カラオケ歌唱される歌詞を音声認識する場合においては、カラオケ演奏音がカラオケ装置から放音されるため、マイクロフォンには歌詞をカラオケ歌唱する音声とともにカラオケ演奏音も入力される。したがって、カラオケ歌唱する音声以外のカラオケ演奏音自体が騒音となって、音声認識する認識率が低くなるという課題があった。
【００１０】
周囲騒音が大きな場所で音声認識する従来技術として、車のエンジン音や室内のダクト音などの周囲音を抽出して消去する技術がある。なお、このような周囲音は音量や周波数が一定な騒音であり、周期も短いため周囲音を抽出するまでの時間（以下、タイムラグとも称する）が短い。そのため、タイムラグがあったとしても、タイムラグの時間経過以降は周囲音の抽出ができる。
【００１１】
しかし、カラオケ装置の場合には、カラオケ演奏音の１周期は、１楽曲のうちの１パートであるため、前記車のエンジン音や室内のダクト音などの周囲音に比べて周期が非常に長い。また、前記カラオケ演奏音の周波数や楽曲演奏の強弱（例えばフォルテシモやピアニシモなど）による音量も不規則に変化するため、カラオケ演奏音を周囲音として抽出するための時間が長くなる。したがって、カラオケ演奏音を周囲音として消去するのが難しかった。また、カラオケ歌唱の音声は、日常会話の音声とは異なり、カラオケ演奏音（周囲音）と合うように発音するので、音声とカラオケ演奏音（周囲音）とを区別してカラオケ歌唱する歌詞を音声認識するのが難しかった。
【課題を解決するための手段】
【００１２】
上述した問題点を解決するためになされた本発明のカラオケ装置（１：なお、この欄においては、発明に対する理解を容易にするため、必要に応じて「発明を実施するための最良の形態」欄において説明した構成要素を括弧内に示すが、この記載によって特許請求の範囲を限定することを意味するものではない。）は、カラオケ歌唱の音声信号を入力するための音声信号入力手段（Ｍ２）と、カラオケ曲の楽曲データを記憶する楽曲データ記憶手段（Ｍ１０）と、楽曲データ記憶手段が記憶する前記楽曲データを音信号として再生し、且つ再生した音信号と前記音声信号入力手段から入力されたカラオケ歌唱の音声信号とをスピーカ（Ｍ２０）へ出力するカラオケ演奏再生手段（Ｍ１４）と、カラオケ演奏再生手段から出力された音信号に対応する第１の信号と音声信号入力手段から入力されたカラオケ歌唱の音声信号に対応する第２の信号とを比較し、第２の信号から第１の信号を減じた音声認識用信号を生成する第１の生成手段（Ｍ７０）と、第１の生成手段によって生成された音声認識用信号に基づいて、前記第１の生成手段が第２の信号から第１の信号を減じるための利得を設定する第１の利得設定手段（Ｍ７２）と、第１の生成手段によって生成された音声認識用信号に基づいてカラオケ歌唱の歌詞を認識する音声認識手段（Ｍ７６）と、を備える。
【００１３】
上述のように、本発明のカラオケ装置は、スピーカからカラオケ演奏音が放音された場合でも、スピーカから放音されたカラオケ演奏音に対応する音信号を減じて生成された音声認識用信号に基づいてカラオケ歌唱の歌詞を認識されるので適切な音声認識結果を得ることができる。具体的には、カラオケ演奏再生手段から出力された音信号に対応する第１の信号は、カラオケ演奏音の演奏信号であり、スピーカからカラオケ演奏音が放音される。よって、音声認識する場合にもマイクロフォンへは歌唱者の音声とは別にスピーカから放音されたカラオケ演奏音も入力されることになる。つまり、音声信号入力手段から入力されたカラオケ歌唱の音声信号に対応する第２の信号には、歌唱者の音声とは別にスピーカから放音されたカラオケ演奏音も入力されることになる。しかしながら、第１の生成手段（Ｍ７０）は、第１の信号と第２の信号とを比較し、第２の信号から第１の信号を減じた音声認識用信号を生成するので、スピーカから放音されたカラオケ演奏音に対応する音信号が減じられる。そして、音声認識手段（Ｍ７６）は、第１の生成手段によって生成された音声認識用信号に基づいてカラオケ歌唱の歌詞を認識するので、適切な音声認識結果を得ることができる。
【００１４】
また、請求項２に記載するように、請求項１に記載のカラオケ装置の音声認識手段によって認識されたカラオケ歌唱の歌詞データに基づいてカラオケ歌唱の歌詞を採点するとよい。
【００１５】
すなわち、請求項１に記載のカラオケ装置において、楽曲データ記憶手段は、カラオケ曲の歌詞データを含む楽曲データを記憶し、音声認識手段によって認識されたカラオケ歌唱の歌詞データと楽曲データ記憶手段が記憶する前記カラオケ曲の歌詞データとを比較して、相違する歌詞データの数量を抽出し、抽出された数量と前記カラオケ曲の歌詞データの数量とに基づいてカラオケ歌唱の歌詞を採点する歌詞採点手段（１２）を備えるとよい。
【００１６】
このように構成されたカラオケ装置によれば、音声認識手段によって認識されたカラオケ歌唱の歌詞データと楽曲データ記憶手段が記憶する前記カラオケ曲の歌詞データとを比較して、カラオケ歌唱の歌詞を採点することができる。具体的には、音声認識手段によって認識されたカラオケ歌唱の歌詞データ、例えばカラオケ歌唱された複数の単語と、楽曲データ記憶手段が記憶する前記カラオケ曲の歌詞データ上の複数の単語と、を比較する。そして、相違する歌詞データの数量、例えば複数の単語中から相違した単語の数量を抽出し、抽出された単語の数量と前記カラオケ曲の歌詞データが有する単語の数量とに基づいてカラオケ歌唱の歌詞を採点する。より具体的には、例えば相違した単語の数量が５個あり、カラオケ曲の歌詞データが有する単語の数量が１００個あるとすれば、（１００個−５個）／１００個＝０．９５となり、１００点満点中の９５点と歌詞採点することができる。
【００１７】
さらに、歌詞採点のゲーム性を高めるために、請求項３に記載のように、カラオケ装置の音声認識手段によって認識されたカラオケ歌唱の歌詞が所定数以上誤っていたらカラオケ演奏を中止することも考えられる。
【００１８】
すなわち、請求項１に記載のカラオケ装置において、楽曲データ記憶手段は、カラオケ曲の歌詞データを含む楽曲データを記憶し、音声認識手段によって認識されたカラオケ歌唱の歌詞データと楽曲データ記憶手段が記憶する前記カラオケ曲の歌詞データとを比較して、相違する歌詞データの数量を抽出し、抽出された数量が所定数以上あると判定した場合には、カラオケ演奏再生手段を制御して、カラオケ演奏の再生を停止させる制御手段（１２）を備える。
【００１９】
このように構成されたカラオケ装置によれば、カラオケ歌唱の最中であっても、歌詞を所定数誤って歌唱した場合には、カラオケ演奏が中止されるのでよりゲーム性を高めることができる。なお、所定数とは、例えばカラオケ歌唱の熟練者では「１」としたり、中級者では「３」としたり、初心者では「５」としたり、それぞれのカラオケ歌唱者のレベルに応じて設定される数値である。
【００２０】
また、請求項４に記載のように、カラオケ歌唱の歌詞の中から歌唱してはいけないＮＧワードを予め表示しておいて、カラオケ歌唱中にＮＧワ−ドを歌唱した場合には、カラオケ演奏を中止することも考えられる。
【００２１】
すなわち、請求項１に記載のカラオケ装置において、カラオケ曲の歌詞データを表示可能な表示手段（Ｍ２６）を備える。
また、楽曲データ記憶手段は、カラオケ曲の歌詞データを含む楽曲データを記憶する。
【００２２】
そして、楽曲データ記憶手段が記憶している楽曲データから特定の歌詞データを抽出して、表示手段を制御して、前記抽出した歌詞データを表示させるとともに、音声認識手段によって認識されたカラオケ歌唱の歌詞データと前記抽出した歌詞データとを比較して、同じ歌詞データがあると判定した場合には、カラオケ演奏再生手段を制御して、カラオケ演奏の再生を停止させる制御手段（１２）を備える。
【００２３】
このように構成されたカラオケ装置によれば、カラオケ歌唱中にＮＧワ−ドを歌唱したか否かを競うゲームを楽しむことができる。
なお、請求項２に記載のカラオケ装置において、歌詞採点するための条件として、請求項５に記載するように、歌唱採点結果が所定値以上に限るとよい。
【００２４】
すなわち、請求項２に記載のカラオケ装置において、さらに音声認識手段によって認識されたカラオケ歌唱の歌詞データを記憶する音声認識記憶手段（Ｍ１０）と、カラオケ演奏再生手段から出力された音信号に対応する第１の信号と音声信号入力手段から入力されたカラオケ歌唱の音声信号に対応する第２の信号とを比較し、第２の信号から第１の信号を減じた採点用信号を生成する第２の生成手段（Ｍ３０）と、第２の生成手段によって生成された採点用信号から音高データを抽出する音高抽出手段（Ｍ６）と、第２の生成手段によって生成された採点用信号に基づいて、第２の生成手段が第２の信号から第１の信号を減じるための利得を設定する第２の利得設定手段（Ｍ３２）と、楽曲データ記憶手段が記憶する前記カラオケ曲の歌唱旋律の音高データと音高抽出手段によって抽出された前記採点用信号の音高データとの音高差を算出し、算出した音高差に基づいて所定区間ごとにカラオケ歌唱の歌唱を採点する歌唱採点手段（Ｍ２４）と、を備える。
【００２５】
そして、歌詞採点手段は、所定区間ごとに歌唱採点手段によるカラオケ歌唱の歌唱採点結果が所定値以上あるか否かを判定し、所定値以上あると判定した場合には、音声認識記憶手段に記憶されたカラオケ歌唱の歌詞データを読み出し、読み出されたカラオケ歌唱の歌詞データと楽曲データ記憶手段が記憶する前記カラオケ曲の歌詞データとを比較して、相違する歌詞データの数量を抽出し、抽出された数量と前記カラオケ曲の歌詞データの数量とに基づいてカラオケ歌唱の歌詞を採点するとよい。
【００２６】
このように構成されたカラオケ装置によれば、歌詞採点するための条件として、歌唱採点結果が所定値以上例えば８０点以上に限ることで、音声認識の認識率の低下を防止できる。つまり、例えばあまりにもタイミングがずれていたり、音量レベルが小さかったり、音高レベルが大きかったりして歌唱採点が所定値以上例えば８０点以上でない場合には、音声認識の認識率も低下すると考えられるからである。
【００２７】
また、請求項３に記載のカラオケ装置においても、歌詞を誤るとカラオケ演奏が中止されるゲームをするための条件として、請求項６に記載するように、歌唱採点結果が所定値以上に限るとよい。
【００２８】
すなわち、請求項３に記載のカラオケ装置において、さらに音声認識手段によって認識されたカラオケ歌唱の歌詞データを記憶する音声認識記憶手段（Ｍ１０）と、カラオケ演奏再生手段から出力された音信号に対応する第１の信号と音声信号入力手段から入力されたカラオケ歌唱の音声信号に対応する第２の信号とを比較し、第２の信号から第１の信号を減じた採点用信号を生成する第２の生成手段（Ｍ３０）と、第２の生成手段によって生成された採点用信号から音高データを抽出する音高抽出手段（Ｍ６）と、第２の生成手段によって生成された採点用信号に基づいて、第２の生成手段が第２の信号から第１の信号を減じるための利得を設定する第２の利得設定手段（Ｍ３２）と、楽曲データ記憶手段が記憶する前記カラオケ曲の歌唱旋律の音高データと音高抽出手段によって抽出された前記採点用信号の音高データとの音高差を算出し、算出した音高差に基づいて所定区間ごとにカラオケ歌唱の歌唱を採点する歌唱採点手段（Ｍ２４）と、を備える。
【００２９】
そして、制御手段は、所定区間ごとに歌唱採点手段によるカラオケ歌唱の歌唱採点結果が所定値以上あるか否かを判定し、所定値以上あると判定した場合には、音声認識記憶手段に記憶されたカラオケ歌唱の歌詞データを読み出し、読み出されたカラオケ歌唱の歌詞データと楽曲データ記憶手段が記憶する前記カラオケ曲の歌詞データとを比較して、相違する歌詞データの数量を抽出し、抽出された数量が所定数以上あると判定した場合には、カラオケ演奏再生手段を制御して、カラオケ演奏の再生を停止させるとよい。
【００３０】
このように構成されたカラオケ装置によれば、歌詞を誤るとカラオケ演奏が中止されるゲームをするための条件として、歌唱採点結果が所定値以上例えば８０点以上に限ることで、より難易度の高いゲームでの音声認識の認識率の低下を防止できる。
【００３１】
また、請求項４に記載のカラオケ装置においても、カラオケ歌唱中にＮＧワ−ドを歌唱したか否かを競うゲームをするための条件として、請求項７に記載するように、歌唱採点結果が所定値以上に限るとよい。
【００３２】
すなわち、請求項４に記載のカラオケ装置において、さらに音声認識手段によって認識されたカラオケ歌唱の歌詞データを記憶する音声認識記憶手段（Ｍ１０）と、カラオケ演奏再生手段から出力された音信号に対応する第１の信号と音声信号入力手段から入力されたカラオケ歌唱の音声信号に対応する第２の信号とを比較し、第２の信号から第１の信号を減じた採点用信号を生成する第２の生成手段（Ｍ３０）と、第２の生成手段によって生成された採点用信号から音高データを抽出する音高抽出手段（Ｍ６）と、第２の生成手段によって生成された採点用信号に基づいて、第２の生成手段が第２の信号から第１の信号を減じるための利得を設定する第２の利得設定手段（Ｍ３２）と、楽曲データ記憶手段が記憶する前記カラオケ曲の歌唱旋律の音高データと音高抽出手段によって抽出された前記採点用信号の音高データとの音高差を算出し、算出した音高差に基づいて所定区間ごとにカラオケ歌唱の歌唱を採点する歌唱採点手段（Ｍ２４）と、を備える。
【００３３】
そして、制御手段は、楽曲データ記憶手段が記憶している楽曲データから特定の歌詞データを抽出して、表示手段を制御して、前記抽出した歌詞データを表示させるとともに、所定区間ごとに歌唱採点手段によるカラオケ歌唱の歌唱採点結果が所定値以上あるか否かを判定し、所定値以上あると判定した場合には、音声認識記憶手段に記憶されたカラオケ歌唱の歌詞データを読み出し、読み出されたカラオケ歌唱の歌詞データと前記抽出した歌詞データとを比較して、同じ歌詞データがあると判定した場合には、カラオケ演奏再生手段を制御して、カラオケ演奏の再生を停止させるとよい。
【００３４】
このように構成されたカラオケ装置によれば、カラオケ歌唱中にＮＧワ−ドを歌唱したか否かを競うゲームをするための条件として、歌唱採点結果が所定値以上例えば８０点以上に限ることで、より競技性の高いゲームでの音声認識の認識率の低下を防止できる。
【発明を実施するための最良の形態】
【００３５】
以下に本発明の実施形態を図面とともに説明する。
［カラオケ装置の機能概略構成の説明］
図１はカラオケ装置の機能を中心とした概略構成を示す図である。なお、図１に示した機能の内、データ抽出部Ｍ６、歌唱用比較部Ｍ８、シーケンサＭ１４、採点部Ｍ２４、歌唱用差分抽出部Ｍ３４、スイッチ制御部Ｍ３６、歌唱用調整部Ｍ３７、音声認識部Ｍ７６、歌詞用差分抽出部Ｍ７４、歌詞用調整部Ｍ７７及び判定部Ｍ８０については、主としてＣＰＵ及びソフトウェアで実現している。
【００３６】
まず、カラオケ装置は採点機能を備えており、カラオケ歌唱の音声信号をディジタル化して取り込み、歌唱旋律であるガイドメロディの音高と比較することによってその歌唱の正確さを判定する。
【００３７】
また、カラオケ装置は音声認識機能を備えており、カラオケ歌唱の音声信号をディジタル化して取り込み、歌詞を認識する。
次に、図１に示すように歌唱者がカラオケ歌唱の音声を入力するためのマイクロフォンＭ２（以下、マイクロフォンをマイクと略記する）は、アンプＭ１８に接続されるとともにＡ／ＤコンバータＭ４に接続されている。また、カラオケ演奏用データ、ガイドメロディデータ、歌詞データを含む楽曲データがデータ格納部Ｍ１０に記憶されている。楽曲データのうち、カラオケ歌唱者に選択された１曲分が実行メモリＭ１２に読み出され、演奏時にはシーケンサＭ１４によって順次読み出される。シーケンサＭ１４によって読み出されたカラオケ演奏用データは楽音発生部Ｍ１６に入力される。また、シーケンサＭ１４により順次読み出されたガイドメロディデータは歌唱用比較部Ｍ８に入力される。楽音発生部Ｍ１６は入力されたカラオケ演奏用データに基づいてカラオケ曲の演奏信号を発生し、この演奏信号はアンプＭ１８に入力される。アンプＭ１８はカラオケ演奏信号およびマイクＭ２から入力された歌唱音声信号を増幅してスピーカＭ２０に出力する。
【００３８】
なお、このガイドメロディデータは、カラオケ曲の歌唱旋律に対応するものであるため、いわゆるガイドメロディ機能として、伴奏楽音と共にスピーカＭ２０から出力される機能を実現する場合にも用いられる。このガイドメロディ機能についてはユーザ（カラオケ歌唱者）がその機能のオン／オフを切り替え可能であり、その機能が必要であると考えたユーザが図示しない操作パネルやリモコンなどを操作することによって機能オンとすれば、カラオケ伴奏だけでなく歌唱旋律がガイドメロディとしてスピーカＭ２０から出力され、それを参考にして歌唱することができる。一方、機能オフとすれば、ガイドメロディがスピーカＭ２０から出力されることはなく、ガイドメロディデータは、採点のためにのみ用いられることとなる。
【００３９】
なお、以下の説明においては、ガイドメロディ機能をオンの状態であることを前提とする。したがって、マイクＭ２から入力された歌唱音声信号には、カラオケ曲の演奏信号とガイドメロディ信号とが加わっている。また、以下の説明において、単に「歌唱音声信号」という場合はカラオケ曲の演奏信号とガイドメロディの音信号とが加わっている歌唱音声信号を指し、単に「歌唱音声」という場合はカラオケ曲の演奏音とガイドメロディとが加わっている歌唱音声を指すこととする。
【００４０】
一方、Ａ／Ｄコンバータ（ＡＤＣ）Ｍ４に入力された歌唱音声信号はディジタル信号に変換されたのち、歌唱用信号生成部Ｍ３０及び歌詞用信号生成部Ｍ７０へ入力される。また、上述した楽音発生部Ｍ１６は入力されるカラオケ演奏用データとガイドメロディデータとに基づいてカラオケ曲の演奏信号とガイドメロディの音信号を発生し、このカラオケ曲の演奏信号とガイドメロディの音信号は歌唱用可変利得アンプＭ３２及び歌詞用可変利得アンプＭ７２へ入力される。
【００４１】
そして、歌唱用可変利得アンプＭ３２へ入力されるカラオケ曲の演奏信号とガイドメロディの音信号は歌唱用可変利得アンプＭ３２によって増幅されて歌唱用信号生成部Ｍ３０へ入力される。歌唱用信号生成部Ｍ３０はＡ／Ｄコンバータ（ＡＤＣ）Ｍ４から入力されたディジタル信号に変換された歌唱音声信号と歌唱用可変利得アンプＭ３２から入力されたカラオケ曲の演奏信号とガイドメロディの音信号とから採点用信号を生成し、データ抽出部Ｍ６へ入力するとともに歌唱用差分抽出部Ｍ３４へ入力する。歌唱用差分抽出部Ｍ３４へ入力された採点用信号はスイッチ制御部Ｍ３６によって、接続状態（以下、単にオンともいう）か切断状態（以下、単にオフともいう）かを制御されるスイッチＭ３８を介して歌唱用調整部Ｍ３７へ入力される。そして、歌唱用調整部Ｍ３７は、歌唱用調整部Ｍ３７へ入力された採点用信号の信号レベルが最小になるよう歌唱用可変利得アンプＭ３２へ利得を指示する。
【００４２】
また、歌詞用可変利得アンプＭ７２へ入力されるカラオケ曲の演奏信号とガイドメロディの音信号は歌詞用可変利得アンプＭ７２によって増幅されて歌詞用信号生成部Ｍ７０へ入力される。歌詞用信号生成部Ｍ７０はＡ／Ｄコンバータ（ＡＤＣ）Ｍ４から入力されたディジタル信号に変換された歌唱音声信号と歌詞用可変利得アンプＭ７２から入力されたカラオケ曲の演奏信号とガイドメロディの音信号とから音声認識用信号を生成し、音声認識部Ｍ７６へ入力するとともに歌詞用差分抽出部Ｍ７４へ入力する。歌詞用差分抽出部Ｍ７４へ入力された音声認識用信号はスイッチ制御部Ｍ３６によって、接続状態（以下、単にオンともいう）か切断状態（以下、単にオフともいう）かを制御されるスイッチＭ７８を介して歌詞用調整部Ｍ７７へ入力される。そして、歌詞用調整部Ｍ７７は、歌詞用調整部Ｍ７７へ入力された音声認識用信号の信号レベルが最小になるよう歌詞用可変利得アンプＭ７２へ利得を指示する。また、シーケンサＭ１４によって読み出されたカラオケ演奏用データは、スイッチ制御部Ｍ３６によって、接続状態か切断状態かを制御されるスイッチＭ４０を介して楽音発生部Ｍ１６に入力される。
【００４３】
ここで、スイッチ制御部Ｍ３６はシーケンサＭ１４によって読み出された楽曲データから歌唱期間か否かを判断して、スイッチＭ３８、スイッチＭ４０及びスイッチＭ７８を制御する。
【００４４】
そして、図２は、カラオケ演奏以前、カラオケ演奏期間、カラオケ演奏終了以後の経過時間に対するスイッチＭ４０、スイッチＭ３８及びスイッチＭ７８のオン／オフの変化と、歌唱用可変利得アンプＭ３２及び歌詞用可変利得アンプＭ７２からの出力信号レベルの変化と、を示す説明図である。カラオケ演奏以前には、スイッチＭ４０、スイッチＭ３８及びスイッチＭ７８はオフされているが、シーケンサＭ１４が楽曲データを読み出し、カラオケ演奏期間に入ると、スイッチ制御部Ｍ３６がスイッチＭ４０を制御してオン状態にさせ、カラオケ演奏終了までオンの状態を保たせ、カラオケ演奏終了するとオフ状態にさせる。そして、スイッチ制御部Ｍ３６はシーケンサＭ１４によって読み出された楽曲データから歌唱期間か否かを判断して、歌唱期間ではないと判断した場合、すなわち前奏期間または間奏期間と判断した場合には、スイッチＭ３８及びスイッチＭ７８を制御してオン状態にさせ、歌唱期間であると判断した場合には、スイッチＭ３８及びスイッチＭ７８を制御してオフ状態にさせる。ここで、上述した「スイッチ制御部Ｍ３６はシーケンサＭ１４によって読み出された楽曲データから歌唱期間か否かを判断して」とは、［音声制御部２４のＮＧ単語ゲーム処理の説明］にて後述するように「カラオケ演奏を実行するシーケンスプログラムから受け渡される制御データトラックに記憶されているカラオケ曲の歌唱区間の開始点を示す区間分割データによって前奏期間または間奏期間の歌唱されない期間か否かを判断する」ことを指す。
【００４５】
そして、歌唱期間ではないと判断した場合、すなわち前奏期間または間奏期間と判断した場合には、スイッチＭ３８を制御してオン状態にさせ、歌唱用差分抽出部Ｍ３４から歌唱用調整部Ｍ３７へ入力された採点用信号の信号レベルが最小になるように歌唱用調整部Ｍ３７は、歌唱用可変利得アンプＭ３２へ利得を指示する（図２参照）。したがって、楽曲データから歌唱期間ではないと判断した場合、すなわち前奏期間または間奏期間には、採点用信号の信号レベルが最小になるように調整される。
【００４６】
一方、歌唱期間であると判断した場合には、スイッチＭ３８を制御してオフ状態にさせるので、歌唱用可変利得アンプＭ３２は、歌唱用調整部Ｍ３７によって利得を指示されず、歌唱用可変利得アンプＭ３２からの出力信号レベルは固定される（図２参照）。そして、歌唱用信号生成部Ｍ３０によって生成された採点用信号を入力されたデータ抽出部Ｍ６は例えば５０ｍｓ毎にこのディジタル化された採点用信号から音高を割り出し、音高データとして歌唱用比較部Ｍ８に入力する。歌唱用比較部Ｍ８では、データ抽出部Ｍ６から入力される採点用信号の音高データとシーケンサＭ１４から入力されるガイドメロディの音高データ（以下、単にリファレンスともいう）とをリアルタイムに比較する。なお、５０ｍｓは１２０のメトロノームテンポで３２分音符に相当し、歌唱の特徴を抽出するために十分な分解能である。
【００４７】
歌唱用比較部Ｍ８では、採点用信号が入力されるタイミングにあわせて５０ｍｓ毎に採点用信号とリファレンスとの差を算出する。これはリアルタイムの差分データ（音高差分データ）として採点部Ｍ２４へ出力される。採点部Ｍ２４では、この音高差分データをカラオケ曲の区間毎に集計しデータ格納部Ｍ１０へ記憶する。そして採点部Ｍ２４では、各区間の差分データの集計を行って採点結果を求める。
【００４８】
また、歌唱期間ではないと判断した場合、すなわち前奏期間または間奏期間と判断した場合には、スイッチＭ７８を制御してオン状態にさせ、歌詞用差分抽出部Ｍ７４から歌詞用調整部Ｍ７７へ入力された音声認識用信号の信号レベルが最小になるように歌詞用調整部Ｍ７７は、歌詞用可変利得アンプＭ７２へ利得を指示する（図２参照）。したがって、楽曲データから歌唱期間ではないと判断した場合、すなわち前奏期間または間奏期間には、音声認識用信号の信号レベルが最小になるように調整される。
【００４９】
一方、歌唱期間であると判断した場合には、スイッチＭ７８を制御してオフ状態にさせるので、歌詞用可変利得アンプＭ７２は、歌詞用調整部Ｍ７７によって利得を指示されず、歌詞用可変利得アンプＭ７２からの出力信号レベルは固定される（図２参照）。そして、歌詞用信号生成部Ｍ７０によって生成された音声認識用信号を入力された音声認識部Ｍ７６は歌詞を音声認識し、歌詞データとしてデータ格納部Ｍ１０へ記憶される。判定部Ｍ８０は、データ格納部Ｍ１０へ記憶されている楽曲データから選曲された楽曲の特定歌詞データを抽出して表示部Ｍ２６へ表示し、所定区間ごとにデータ格納部Ｍ１０へ記憶されている採点結果が所定値例えば８０点以上あると判定した場合には、データ格納部Ｍ１０へ記憶されている音声認識された歌詞データを読み出し、読み出された音声認識された歌詞データと前記抽出された歌詞データとを比較して、同じ歌詞データがあると判定した場合には、シーケンサＭ１４を制御してカラオケ演奏を停止させる。
【００５０】
なお、カラオケ装置の機能を中心とした概略構成を示す図１においては、マイクＭ２が「音声信号入力手段」に相当し、データ格納部Ｍ１０が「楽曲データ記憶手段」及び「音声認識記憶手段」に相当する。また、シーケンサＭ１４が「カラオケ演奏再生手段」に相当し、歌唱用信号生成部Ｍ３０が「第２の生成手段」に相当し、データ抽出部Ｍ６が「音高抽出手段」に相当する。そして、スイッチ制御部Ｍ３６と、スイッチＭ３８と、スイッチＭ４０と、歌唱用差分抽出部Ｍ３４と、可変利得アンプＭ３２と、歌唱用調整部Ｍ３７と、が「第２の利得設定手段」に相当する。また、採点部Ｍ２４が「歌唱採点手段」に相当する。また、スピーカＭ２０が「スピーカ」に相当し、表示部Ｍ２６が「表示手段」に相当する。
【００５１】
また、歌詞用信号生成部Ｍ７０が「第１の生成手段」に相当し、音声認識部Ｍ７６が「音声認識手段」に相当する。そして、スイッチ制御部Ｍ３６と、スイッチＭ７８と、スイッチＭ４０と、歌詞用差分抽出部Ｍ７４と、歌詞用可変利得アンプＭ７２と、歌詞用調整部Ｍ７７と、が「第１の利得設定手段」に相当する。また、判定部Ｍ８０が「制御手段」に相当する。
【００５２】
次に、図３を参照して、採点用信号、リファレンスについて説明する。図３に例示する点線はリファレンスであるガイドメロディを音高データ化したものであり、一般的なガイドメロディのデータは機械的に非常に正確なものである。これに対して、図３に例示する実線は採点用信号を音高データ化したものを示している。採点用信号の音高データはガイドメロディの音高データが示す値から上下に変動しており、前奏及び間奏においては採点用信号の音高データはない。
【００５３】
図１ではカラオケ装置の機能を中心とした概略構成を示したが、図４は同カラオケ装置の具体的なハード構成を示すブロック図である。
［カラオケ装置１の構成の説明］
図４は、カラオケ装置１の構成を示すブロック図である。カラオケ装置１は、図４に示すように、カラオケ装置１全体の動作を制御する制御部１２、カラオケ装置１をネットワーク１００に接続するためのインタフェース部１４、演奏楽曲の伴奏内容および歌詞を示す楽曲データや映像データなどを記憶するハードディスク（ＨＤＤ）１６、複数のキー・スイッチからなる操作部１８、リモコン端末２や携帯電話からの赤外線信号を赤外線通信によって受信するための赤外線通信部２０、操作部１８からの信号を処理する操作処理部２２、ハードディスク１６に記憶された楽曲データから演奏楽曲のオーディオ信号（音響，音声に関する信号）を生成し、生成されたオーディオ信号及びマイク２５から入力されたオーディオ信号を増幅してスピーカ２８へ出力する音声制御部２４、音声認識部１０、
ＭＩＤＩ音源３０、映像情報を一時的に記憶するビデオＲＡＭ３２、映像データに基づく映像の再生を制御する映像再生部３４、ビデオＲＡＭ３２に記憶された映像情報および映像再生部３４により再生される映像の表示部３６での表示を制御する映像制御部３８などを備えている。
【００５４】
そして、制御部１２、インタフェース部１４、ＨＤＤ１６、赤外線通信部２０、操作処理部２２、ビデオＲＡＭ３２、映像再生部３４、映像制御部３８は、各々バス３９によって接続されている。また、制御部１２と音声制御部２４とはＵＳＢ４０によって接続されている。なお、制御部１２及び音声制御部２４は、後述する各種処理を実行する。
【００５５】
このうち、ＨＤＤ１６には、図５（ａ）に例示するように、楽曲データを記憶する楽曲データメモリ領域５０、楽曲データから抽出した単語データを記憶する単語データメモリ領域５２及び音高差のデータに応じた採点情報を記憶する採点情報メモリ領域５４が設けられている。楽曲データメモリ領域５０に記憶されている楽曲データは、図６（ａ）に例示するようにヘッダ情報、ＭＩＤＩデータ、タイトルデータ及び歌詞で使用されている単語データを有している。そして、ヘッダ情報は、ＭＩＤＩデータサイズ、タイトルデータサイズ及び単語データサイズを有している。また、歌詞で使用されている単語データのデータ構造は、登録単語数、１番目の単語サイズ、１番目の単語、２番目単語サイズ、２番目の単語と続き、ｎ番目の単語サイズ、ｎ番目の単語へと続いているデータ構造となっている。一例を挙げると、図６（ｂ）に例示するように、登録単語数に対応する「３単語」を示すデータ、１番目の単語サイズに対応する「８ｂｙｔｅ」を示すデータ、１番目の単語に対応する「あいどる」を示すデータ、２番目単語サイズに対応する「６ｂｙｔｅ」を示すデータ、２番目の単語に対応する「すてき」を示すデータ、３番目の単語サイズに対応する「１０ｂｙｔｅ」を示すデータ、３番目の単語に対応する「あいしてる」へと続くデータ構造となっている。
【００５６】
また、楽曲データが有するＭＩＤＩデータは、図５（ｂ）に例示するように、楽曲トラック、ガイドメロディトラック及び制御データトラックを有している。楽曲トラックには、メロディトラック、リズムトラックを初めとして種々のパートのトラックが形成されている。ガイドメロディトラックには、カラオケ曲の旋律すなわち歌唱者が歌うべき旋律のシーケンスデータを記憶している。制御データトラックには、カラオケ曲の歌唱区間の開始点を示す区間分割データを記憶している。
【００５７】
採点情報メモリ領域５４に記憶されている音高差のデータに応じた採点情報は、図１５に例示するように音高差のデータと採点とを関連付けたデータ構造を有している。一例を挙げると、音高差のデータとしての「０セミトーン」に対して、採点としての「１００点」を関連付けている。
【００５８】
また、音声制御部２４が内蔵するＲＯＭ（図示なし）には、図５（ｃ）に例示するように、カラオケ歌唱の歌詞記録エリア６０、ガイドメロディバッファ６２、リファレンスデータレジスタ６４及び差分データ記憶エリア６６が設けられている。カラオケ歌唱の歌詞記録エリア６０には、音声認識された歌詞を記憶する。ガイドメロディバッファ６２には、読み出されたガイドメロディデータを一時記憶する。リファレンスデータレジスタ６４には、このガイドメロディデータから抽出されたリファレンス（つまり、ガイドメロディの音高データ）を記憶する。差分データ記憶エリア６６には、リファレンスと歌唱音声との差分データを記憶する。なお、リファレンスデータレジスタ６４は音高データレジスタからなっており、差分データ記憶エリア６６は音高差データ記憶エリアからなっている。
【００５９】
なお、本実施形態においては、マイク２５が「音声信号入力手段」に相当し、ＨＤＤ１６が「楽曲データ記憶手段」に相当し、音声制御部２４が内蔵するＲＯＭが「音声認識記憶手段」に相当する。また、音声制御部２４が「カラオケ演奏再生手段」、「第１の生成手段」、「第２の生成手段」、「音高抽出手段」、「第１の利得設定手段」及び「第２の利得設定手段」に相当し、制御部１２が「制御手段」、「歌唱採点手段」に相当する。また、スピーカ２８が「スピーカ」に相当し、音声認識部１０が「音声認識手段」に相当し、表示部３６が「表示手段」に相当する。
【００６０】
［制御部１２のＮＧ単語ゲーム処理の説明］
以下に、カラオケ装置１の制御部１２が実行する「制御部１２のＮＧ単語ゲーム処理」の手順を図７、図８のフローチャートに基づいて説明する。
【００６１】
なお、以下の説明においては、ユーザ（カラオケ歌唱者）によってカラオケ曲が選曲されている状態とする。具体的には、操作部１８で受け付けたカラオケ曲の選曲番号のデータは操作処理部２２によって制御部１２へ送信されるのであるが、制御部１２は、選曲番号のデータを受信し、その選曲番号のデータを音声制御部２４へ送信している状態とする。
【００６２】
操作部１８で受け付けたゲーム開始指示のデータは操作処理部２２によって制御部１２へ送信されるのであるが、制御部１２は、ゲーム開始指示のデータを受信したか否かを判断する（Ｓ１１０）。そして、操作処理部２２から送信されたゲーム開始指示のデータを受信すると（Ｓ１１０：ＹＥＳ）、選曲されているカラオケ曲の選曲番号に対応する楽曲データをＨＤＤ１６に設けられている図５（ａ）に例示する楽曲データメモリ領域５０から読み出す（Ｓ１１４）。そして、読み出された楽曲データから図６（ａ）に例示するタイトルデータと歌詞で使用されている単語データを読み出し、読み出された前記単語データを単語データメモリ領域５２へ記憶する（Ｓ１１４）。Ｓ１１４の処理が終了したらＳ１１６の処理を実行する。
【００６３】
Ｓ１１６の処理においては、Ｓ１１４の処理において読み出されたタイトルを表示部３６へ表示する。具体的には、図１６（ａ）に例示するように、Ｓ１１４の処理において読み出されたタイトルに対応する「赤な女子」などを表示部３６へ表示するように映像制御部３８を制御する。次に、ＮＧ単語を表示部３６へ表示し、ＮＧ単語データを音声制御部２４へ送信する（Ｓ１１８）。具体的には、Ｓ１１４の処理において単語データメモリ領域５２へ記憶された単語データからＮＧ単語データを選定し、図１６（ｂ）に例示するように、選定されたＮＧ単語に対応する「あいしてる」などを表示部３６へ表示するように映像制御部３８を制御する。そして、ＮＧ単語データを音声制御部２４へ送信する。Ｓ１１８の処理が終了したらＳ１２０の処理を実行する。
【００６４】
Ｓ１２０の処理においては、カラオケ演奏開始信号を音声制御部２４へ送信する。そして、音声認識開始信号を音声制御部２４へ送信する（Ｓ１２２）。さらに、区間歌唱採点開始信号を音声制御部２４へ送信する（Ｓ１２４、図８参照）。Ｓ１２４の処理が終了したらＳ１２６の処理を実行する。
【００６５】
さて、比較結果のデータは音声制御部２４から制御部１２へ送信される（この送信処理については後述する）のであるが、制御部１２は、比較結果のデータを受信したか否かを判断する（Ｓ１２６）。そして、音声制御部２４から比較結果を受信した場合には（Ｓ１２６：ＹＥＳ）、Ｓ１２８の処理を実行する。一方、音声制御部２４から比較結果を受信しない場合には（Ｓ１２６：ＮＯ）、Ｓ１３８の処理を実行する。
【００６６】
Ｓ１２８の処理においては、ＮＧ単語を歌唱していたか否かを判断する。この判断基準は、例えばカラオケ歌唱の歌詞データ中のＮＧ単語データの数量が１つ以上あれば、ＮＧ単語を歌唱していたとする。そして、ＮＧ単語を歌唱していたと判断した場合には（Ｓ１２８：ＹＥＳ）、カラオケ演奏停止信号を音声制御部２４へ送信する（Ｓ１３０）。Ｓ１３０の処理が終了したらＳ１３２の処理を実行する。一方、ＮＧ単語を歌唱していないと判断した場合には（Ｓ１２８：ＮＯ）、Ｓ１３８の処理を実行する。
【００６７】
Ｓ１３２の処理においては、音声認識終了信号を音声制御部２４へ送信する。
また、ＮＧ単語歌詞画面のデータは音声制御部２４から制御部１２へ送信される（この送信処理については後述する）のであるが、制御部１２は、ＮＧ単語歌詞のデータを受信したか否かを判断する（Ｓ１３４）。そして、ＮＧ単語歌詞のデータを受信すると（Ｓ１３４：ＹＥＳ）、ＮＧ単語歌詞画面を表示部３６へ表示する（Ｓ１３６）。具体的には、図１６（ｃ）に例示するようにＮＧ単語を歌唱した直前までの歌詞に対応する「わたしのことを見た」などを表示部３６へ表示し、さらに図１６（ｅ）に例示するように「まだまだ！残念」などを表示部３６へ表示するように映像制御部３８を制御する。
【００６８】
そして、Ｓ１３６の処理が終了したら、本「制御部１２の採点処理」は終了する。
Ｓ１３８の処理においては、音声制御部２４からカラオケ演奏終了信号を受信したか否かを判断する。そして、音声制御部２４からカラオケ演奏終了信号を受信しない場合には（Ｓ１３８：ＮＯ）、Ｓ１２４の処理へ戻り、上述した処理を実行する。一方、音声制御部２４からカラオケ演奏終了信号を受信した場合には（Ｓ１３８：ＹＥＳ）
音声認識終了信号を音声制御部２４へ送信する（Ｓ１４０）。そして、完唱結果を表示部３６へ表示する（Ｓ１４２）。具体的には、図１６（ｄ）に例示するように「やった！おめでとう」などを表示部３６へ表示するように映像制御部３８を制御する。
【００６９】
そして、Ｓ１４２の処理が終了したら、本「制御部１２の採点処理」は終了する。
［音声制御部２４のＮＧ単語ゲーム処理の説明］
次に、カラオケ装置１の音声制御部２４が実行する「音声制御部２４のＮＧ単語ゲーム処理」の手順を図９〜図１４のフローチャートに基づいて説明する。このＮＧ単語ゲーム処理に関する動作プログラムは、カラオケ演奏を実行するシーケンスプログラムと並行して実行され、シーケンスプログラムとのデータの交換も行われる。なお、以下の説明においては、制御部１２からカラオケ曲の選曲番号のデータを受信している状態とする。
【００７０】
まず、音声制御部２４は制御部１２から送信されたＮＧ単語データを受信したか否かを判断する（Ｓ２１０）。そして、ＮＧ単語データを受信すると（Ｓ２１０：ＹＥＳ）、受信したＮＧ単語データを音声制御部２４が有するメモリ（図示せず）へ記憶し、Ｓ２１１の処理を実行する。
【００７１】
Ｓ２１１の処理においては、音声制御部２４は制御部１２から送信されたカラオケ演奏開始信号を受信したか否かを判断する。そして、カラオケ演奏開始信号を受信すると（Ｓ２１１：ＹＥＳ）、カラオケ曲の選曲番号に対応する楽曲データを再生し、カラオケ演奏を開始する（Ｓ２１２）。
【００７２】
次に、音声制御部２４は制御部１２から送信された音声認識開始信号を受信したか否かを判断する（Ｓ２１４）。そして、音声認識開始信号を受信すると（Ｓ２１４：ＹＥＳ）、カラオケ歌唱の歌詞の音声認識を開始する（Ｓ２１６）。具体的には、音声制御部２４が音声認識部１０を制御してカラオケ歌唱の歌詞を音声認識させる。そして、音声認識させたカラオケ歌唱の歌詞を音声制御部２４が内蔵するＲＯＭに設けられているカラオケ歌唱の歌詞記録エリア６０へ記憶する。
【００７３】
そして、音声制御部２４は制御部１２から送信された区間歌唱採点開始信号を受信したか否かを判断する（Ｓ２１８）。そして、区間歌唱採点開始信号を受信すると（Ｓ２１８：ＹＥＳ）、リファレンスカウンタ（全体）の初期化を行なう（Ｓ２２０）。
【００７４】
次に、前奏期間または間奏期間の歌唱されない期間か否かを判断する（Ｓ２２２、図１０参照）。このＳ２２２の判断は、カラオケ演奏を実行するシーケンスプログラムから受け渡される制御データトラックに記憶されているカラオケ曲の前奏期間、歌唱期間、及び間奏期間の開始点を示す区間分割データによって前奏期間または間奏期間、すなわち歌唱されない期間か否かを判断する。そして、前奏期間または間奏期間でない場合、すなわち歌唱期間の場合（Ｓ２２２：ＮＯ）には、後述する歌唱採点の比較処理を実行する（Ｓ２２４）。一方、前奏期間または間奏期間の場合（Ｓ２２２：ＹＥＳ）には、後述する歌唱採点の調整処理を実行する（Ｓ２２６）とともに、後述する音声認識の調整処理を実行する（Ｓ２２８）。そして、歌唱採点の比較処理を実行した場合（Ｓ２２４）、歌唱採点の調整処理を実行した場合（Ｓ２２６）、もしくは音声認識の調整処理を実行した場合（Ｓ２２８）には、区間歌唱採点が終了したか否かを判断する（Ｓ２３０）。そして、区間歌唱採点が終了していない場合（Ｓ２３０：ＮＯ）には、Ｓ２２２へ戻り、上述した処理を実行する。
【００７５】
一方、区間歌唱採点が終了した場合（Ｓ２３０：ＹＥＳ）には、後述する歌唱採点の比較処理によって音声制御部２４が内蔵するＲＯＭ（図示なし）の差分データ記憶エリア６６へ記憶された音高差データから全体の音高差分データを取り出し（Ｓ２３２）、全体の音高差分データの合計をリファレンスカウンタ値で割って音高差分データを平均化する（Ｓ２３４）。そして、ＨＤＤ１６の採点情報メモリ領域５４に記憶されている音高差のデータに応じた歌唱採点情報（図１５参照）を用いて音高差のデータに応じて歌唱採点する（Ｓ２３６）。Ｓ２３６の処理が終了したらＳ２３８（図１１参照）の処理を実行する。
【００７６】
Ｓ２３８の処理においては、歌唱採点の結果が８０点以上か否かを判断する。この歌唱採点の結果を判断する点数は、この「８０点」には限らない。音声認識の認識率の低下を防止できる点数に設定するとよい。そして、歌唱採点の結果が８０点以上でない場合には（Ｓ２３８：ＮＯ）、Ｓ２５４の処理を実行する。一方、歌唱採点の結果が８０点以上である場合には（Ｓ２３８：ＹＥＳ）、Ｓ２４０の処理を実行する。
【００７７】
Ｓ２４０の処理においては、音声認識した歌詞データとＮＧ単語データとを比較する。具体的には、音声制御部２４が内蔵するＲＯＭに設けられているカラオケ歌唱の歌詞記録エリア６０へ記憶されている音声認識させたカラオケ歌唱の歌詞データを読み出す。また、音声制御部２４が有するメモリ（図示せず）へ記憶されているＮＧ単語データを読み出す。そして、読み出されたカラオケ歌唱の歌詞データとＮＧ単語データとを比較する。そして、その比較結果例えばカラオケ歌唱の歌詞データ中のＮＧ単語データの数量を制御部１２へ送信する（Ｓ２４２）。Ｓ２４２の処理が終了したらＳ２４４の処理を実行する。
【００７８】
そして、音声制御部２４は制御部１２から送信されたカラオケ演奏停止信号を受信したか否かを判断する（Ｓ２４４）。そして、カラオケ演奏が終了しない場合には（Ｓ２４４：ＮＯ）、Ｓ２１８（図９参照）へ戻り、上述した処理を実行する。一方、カラオケ演奏停止信号を受信すると（Ｓ２４４：ＹＥＳ）、カラオケ演奏を停止する（Ｓ２４６）。Ｓ２４６の処理が終了したらＳ２４８の処理を実行する。
【００７９】
次に、音声制御部２４は制御部１２から送信された音声認識終了信号を受信したか否かを判断する（Ｓ２４８）。そして、音声認識終了信号を受信すると（Ｓ２４８：ＹＥＳ）、カラオケ歌唱の歌詞の音声認識を終了する（Ｓ２５０）。そして、Ｓ２５０の処理が終了したらＳ２５２の処理を実行する。
【００８０】
Ｓ２５２の処理においては、ＮＧ単語歌唱のデータを制御部１２へ送信する。
そして、Ｓ２５２の処理が終了したら、本「音声制御部２４のＮＧ単語ゲーム処理」は終了する。
【００８１】
Ｓ２５４の処理においては、カラオケ演奏が終了したか否かを判断する。そして、カラオケ演奏が終了しない場合には（Ｓ２５４：ＮＯ）、Ｓ２１８（図９参照）へ戻り、上述した処理を実行する。一方、カラオケ演奏が終了した場合には（Ｓ２５４：ＹＥＳ）、カラオケ演奏終了信号を制御部１２へ送信する（Ｓ２５６）。
【００８２】
次に、音声制御部２４は制御部１２から送信された音声認識終了信号を受信したか否かを判断する（Ｓ２５８）。そして、音声認識終了信号を受信すると（Ｓ２５８：ＹＥＳ）、カラオケ歌唱の歌詞の音声認識を終了する（Ｓ２６０）。
【００８３】
そして、Ｓ２６０の処理が終了したら、本「音声制御部２４のＮＧ単語ゲーム処理」は終了する。
以上の採点では、音高データの比較を行って歌唱巧拙を判断している。つまり、音量の大小を得点に反映させていない。これは、音量は発声する語彙、性別、年齢などによってばらつきが大きいため実際の歌唱の巧拙とかけ離れた得点が出る場合があることを考慮したためである。また、音量を採点に使わないことによってアルゴリズムを簡略化でき、短時間で歌唱の正確さを判定することができる。
【００８４】
（１）歌唱採点の比較処理の説明
図１２はデータの取り込み処理を示すフローチャートである。
まず、図１２（ａ）はマイク２５および音声制御部２４で実行されるデータの取り込み処理の手順を示している。
【００８５】
歌唱音声が入力されたマイク２５から出力されたアナログ形式の音声信号をディジタル形式の音声信号に変換し、その音声信号より、カラオケ演奏によって再生された楽曲データの再生信号を差し引いて採点用信号を生成する（Ｓ２２４０）。そして音声制御部２４は、この採点用信号を用いて、５０ｍｓのフレーム単位で周波数のカウント（Ｓ２２４２）を行う。この算出された周波数カウント値は５０ｍｓ毎に読み取られる。なお、この点については、図１３の歌唱採点の比較処理を示すフローチャートを用いて後述する。
【００８６】
また、図１２（ｂ）は音声制御部２４で実行されるガイドメロディデータの取り込み処理の手順を示すフローチャートである。この処理はカラオケ演奏を実行するシーケンスプログラムからガイドメロディトラックのイベントデータが受け渡されたときに実行される。まず、シーケンスプログラムから渡されたガイドメロディデータを音声制御部２４が内蔵するＲＯＭ（図示なし）のガイドメロディバッファ６２に取り込む（Ｓ２２４４）。そのガイドメロディデータから音高データ（つまり、リファレンス）を抽出する（Ｓ２２４６）。そして、このようにして抽出した音高データで音声制御部２４が内蔵するＲＯＭ（図示なし）のリファレンスデータレジスタ６４を更新する（Ｓ２２４８）。したがって、リファレンスデータレジスタ６４は新たなガイドメロディデータが入力される毎に更新される。
【００８７】
次に、図１３は音声制御部２４が実行する「音声制御部２４のＮＧ単語ゲーム処理」の歌唱採点の比較処理（図１０のＳ２２４）の詳細を示すフローチャートである。この処理は、採点用信号の周波数カウント値を取り込んで採点用信号の音高データ、周波数データに変換し、図１２（ｂ）のリファレンスデータ入力動作で求められたリファレンスデータの音高データと比較して差分データを求める動作である。なお、本歌唱採点の比較動作は、歌唱音声信号の１フレーム時間である５０ｍｓ毎に実行される。
【００８８】
まず、リファレンスが更新されたかどうかが判断され（Ｓ２２５０）、リファレンスが更新されない場合（Ｓ２２５０：ＮＯ）はリターンされる。リファレンスが更新された場合（Ｓ２２５０：ＹＥＳ）はリファレンスカウンタ（全体）をインクリメントする（Ｓ２２５２）。そして、上述した周波数カウント値を読み取り（Ｓ２２５４）、この周波数カウント値に基づいて音高データを生成する（Ｓ２２５６）。次に、採点用信号およびリファレンスの音高データを比較してその差を算出し（Ｓ２２５８）、この算出した差を、音高差分データとして差分データ記憶エリア６６の現在の区間に対応する記憶エリアに記憶する（Ｓ２２５９）。
【００８９】
（２）歌唱採点の調整処理の説明
次に、上述した歌唱採点の調整処理（図１０のＳ２２６）の詳細を図１４（ａ）のフローチャートに基づいて説明する。
【００９０】
まず、歌唱音声が入力されたマイク２５から出力されたアナログ形式の音声信号をディジタル形式の音声信号に変換し、その音声信号より、カラオケ演奏によって再生された楽曲データの再生信号を差し引いて採点用信号を生成する（Ｓ２２６０）。そして音声制御部２４は、この採点用信号の信号レベルを検出する（Ｓ２２６２）。次に、この採点用信号の信号レベルが規定値以上か否かを判断する（Ｓ２２６４）。そして、この採点用信号の信号レベルが規定値以上の場合（Ｓ２２６４：ＹＥＳ）には、カラオケ演奏によって再生された楽曲データの再生信号を増幅する（Ｓ２２６６）。具体的には、図１にて例示したように歌唱用可変利得アンプＭ３２へ利得を指示して、採点用信号の信号レベルが規定値以下になるように調整する。
【００９１】
一方、この採点用信号の信号レベルが規定値以上でない場合（Ｓ２２６４：ＮＯ）には、リターンされる。なお、本歌唱採点の調整処理は、歌唱音声信号の１フレーム時間である５０ｍｓ毎に実行される。したがって、５０ｍｓ毎に採点用信号の信号レベルが規定値以下になるように制御される。
【００９２】
（３）音声認識の調整処理の説明
次に、上述した音声認識の調整処理（図１０のＳ２２８）の詳細を図１４（ｂ）のフローチャートに基づいて説明する。
【００９３】
まず、歌唱音声が入力されたマイク２５から出力されたアナログ形式の音声信号をディジタル形式の音声信号に変換し、その音声信号より、カラオケ演奏によって再生された楽曲データの再生信号を差し引いて音声認識用信号を生成する（Ｓ２２８０）。そして音声制御部２４は、この音声認識用信号の信号レベルを検出する（Ｓ２２８２）。次に、この音声認識用信号の信号レベルが規定値以上か否かを判断する（Ｓ２２８４）。そして、この音声認識用信号の信号レベルが規定値以上の場合（Ｓ２２８４：ＹＥＳ）には、カラオケ演奏によって再生された楽曲データの再生信号を増幅する（Ｓ２２８６）。具体的には、図１にて例示したように歌詞用可変利得アンプＭ７２へ利得を指示して、音声認識用信号の信号レベルが規定値以下になるように調整する。
【００９４】
一方、この音声認識用信号の信号レベルが規定値以上でない場合（Ｓ２２８４：ＮＯ）には、リターンされる。なお、本音声認識の調整処理は、歌唱音声信号の１フレーム時間である５０ｍｓ毎に実行される。したがって、５０ｍｓ毎に音声認識用信号の信号レベルが規定値以下になるように制御される。
【００９５】
[効果の説明]
（１）従来のカラオケ装置においてカラオケ歌唱される歌詞を音声認識する場合には、カラオケ演奏音がカラオケ装置から放音されるため、マイクロフォンには歌詞をカラオケ歌唱する音声とともにカラオケ演奏音も入力されるため、カラオケ歌唱する音声以外のカラオケ演奏音自体が騒音となって、音声認識する認識率が低くなるという課題があった。
【００９６】
それに対して本実施形態のカラオケ装置１によれば、歌詞用信号生成部Ｍ７０は、カラオケ演奏音の音信号と歌唱音声信号とを比較し、歌唱音声信号からカラオケ演奏音の音信号を減じた音声認識用信号を生成するので、スピーカＭ２０から放音されたカラオケ演奏音に対応する音信号が減じられる。そして、音声認識部Ｍ７６は、歌詞用信号生成部Ｍ７０によって生成された音声認識用信号に基づいてカラオケ歌唱の歌詞を認識するので、適切な音声認識結果を得ることができる。
【００９７】
（２）また、本実施形態のカラオケ装置１によれば、ＨＤＤ１６が記憶している楽曲データからＮＧ単語データを選定して、映像制御部３８を制御して、前記選定したＮＧ単語データを表示部３６へ表示させるとともに、音声認識部１０によって認識されたカラオケ歌唱の歌詞データと前記選定したＮＧ単語データとを比較して、同じ歌詞データがあると判定した場合には、音声制御部２４を制御して、カラオケ演奏の再生を停止させる。
【００９８】
したがって、このようなカラオケ装置１によれば、カラオケ歌唱中にＮＧ単語を歌唱したか否かを競うＮＧ単語ゲームを楽しむことができる。
（３）また、本実施形態のカラオケ装置１によれば、区間歌唱採点が所定値例えば８０点以上ある場合に、音声認識部１０によって認識されたカラオケ歌唱の歌詞データと前記選定したＮＧ単語データとを比較する。
【００９９】
したがって、このようなカラオケ装置１によれば、カラオケ歌唱中にＮＧ単語を歌唱したか否かを競うＮＧ単語ゲームをするための条件として、歌唱採点結果が所定値以上例えば８０点以上に限ることで、より競技性の高いゲームでの音声認識の認識率の低下を防止できる。
【０１００】
[他の実施形態]
以上、本発明の実施形態について説明したが、本発明は上記実施形態に限定されるものではなく、以下のような様々な態様にて実施することが可能である。
【０１０１】
（１）上記実施形態では、区間歌唱採点ごとに、区間歌唱採点が所定値例えば８０点以上ある場合に、音声認識部１０によって認識されたカラオケ歌唱の歌詞データと前記選定したＮＧ単語データとを比較して、ＮＧ単語を歌唱した場合には、カラオケ演奏を停止するゲームであったが、これには限らない。区間歌唱採点ごとに、区間歌唱採点が所定値例えば８０点以上ある場合に、カラオケ演奏終了まで音声認識部１０によって認識されたカラオケ歌唱の歌詞データとＨＤＤ１６に設けられている単語データメモリ領域５２へ記憶されている単語データとを比較して、相違する歌詞データの数量と前記単語データとに基づいて歌詞採点してもよい。
【０１０２】
以下に、カラオケ装置１の制御部１２が実行する「制御部１２の歌詞採点処理」及びカラオケ装置１の音声制御部２４が実行する「音声制御部２４の歌詞採点処理」を順に説明する。
【０１０３】
［制御部１２の歌詞採点処理の説明］
以下に、カラオケ装置１の制御部１２が実行する「制御部１２の歌詞採点処理」の手順を図１７、図１８のフローチャートに基づいて説明する。
【０１０４】
なお、以下の説明においては、ユーザ（カラオケ歌唱者）によってカラオケ曲が選曲されている状態とする。具体的には、操作部１８で受け付けたカラオケ曲の選曲番号のデータは操作処理部２２によって制御部１２へ送信されるのであるが、制御部１２は、選曲番号のデータを受信し、その選曲番号のデータを音声制御部２４へ送信している状態とする。
【０１０５】
操作部１８で受け付けた歌詞採点指示のデータは操作処理部２２によって制御部１２へ送信されるのであるが、制御部１２は、歌詞採点指示のデータを受信したか否かを判断する（Ｓ３１０）。そして、操作処理部２２から送信された歌詞採点指示のデータを受信すると（Ｓ３１０：ＹＥＳ）、選曲されているカラオケ曲の選曲番号に対応する楽曲データをＨＤＤ１６に設けられている図５（ａ）に例示する楽曲データメモリ領域５０から読み出す（Ｓ３１２）。そして、読み出された楽曲データから図６（ａ）に例示する歌詞で使用されている単語データを読み出し、読み出された前記単語データを単語データメモリ領域５２へ記憶する（Ｓ３１４）。Ｓ３１４の処理が終了したらＳ３２０の処理を実行する。
【０１０６】
Ｓ３２０の処理においては、カラオケ演奏開始信号を音声制御部２４へ送信する。そして、音声認識開始信号を音声制御部２４へ送信する（Ｓ３２２）。さらに、区間歌唱採点開始信号を音声制御部２４へ送信する（Ｓ３２４、図１８参照）。Ｓ３２４の処理が終了したらＳ３２６の処理を実行する。
【０１０７】
さて、音声認識された歌詞データは音声制御部２４から制御部１２へ送信される（この送信処理については後述する）のであるが、制御部１２は、音声認識された歌詞データを受信したか否かを判断する（Ｓ３２６）。そして、音声制御部２４から音声認識された歌詞データを受信した場合には（Ｓ３２６：ＹＥＳ）、Ｓ３２８の処理を実行する。一方、音声制御部２４から音声認識された歌詞データを受信しない場合には（Ｓ３２６：ＮＯ）、Ｓ３３８の処理を実行する。
【０１０８】
Ｓ３２８の処理においては、音声認識された歌詞データと単語データとを比較する。具体的には、前記単語データメモリ領域５２へ記憶されている単語データを読み出し、読み出された単語データと音声認識された歌詞データとから相違する歌詞データの数量を抽出する。そして、比較結果に基づいて歌詞採点する（Ｓ３３２）。具体的には、Ｓ３２８の処理において抽出された相違する歌詞データの数量と前記単語データの数量とに基づいてカラオケ歌唱の歌詞を採点する。より具体的には、例えば相違した歌詞データの数量が５個あり、単語データの数量が１００個あるとすれば、（１００個−５個）／１００個＝０．９５となり、１００点満点中の９５点と歌詞採点することができる。さらに、総合歌詞採点する（Ｓ３３２）。具体的には、区間歌唱採点ごとの歌詞採点を加重平均して総合歌詞採点する。より具体的には、例えば１回目の区間歌唱採点において相違した歌詞データの数量が５個あり、単語データの数量が１００個あるとし、２回目の区間歌唱採点において相違した歌詞データの数量が３個あり、単語データの数量が１００個あるとすれば、相違した歌詞データの数量の合計は８個であり、単語データの数量の合計は２００個である。したがって、１回目と２回目とを加重平均すると、（２００個−８個）／２００個＝０．９６となり、１００点満点中の９６点と総合歌詞採点することができる。Ｓ３３２の処理が終了したらＳ３３８の処理を実行する。
【０１０９】
Ｓ３３８の処理においては、カラオケ演奏終了信号は音声制御部２４から制御部１２へ送信される（この送信処理については後述する）のであるが、制御部１２は、カラオケ演奏終了信号を受信したか否かを判断する。そして、カラオケ演奏終了信号を
受信しない場合には（Ｓ３３８：ＮＯ）、Ｓ３２４へ戻り、上述した処理を実行する。一方、カラオケ演奏終了信号を受信した場合には（Ｓ３３８：ＹＥＳ）、音声認識終了信号を音声制御部２４へ送信する（Ｓ３４０）。Ｓ３４０の処理が終了したらＳ３４２の処理を実行する。
【０１１０】
Ｓ３４２の処理においては、総合歌詞採点結果を表示部３６へ表示する。具体的には、
例えば「総合歌詞採点：９６点」などを表示部３６へ表示するように映像制御部３８を制御する。
【０１１１】
そして、Ｓ３４２の処理が終了したら、本「制御部１２の歌詞採点処理」は終了する。
［音声制御部２４の歌詞採点処理の説明］
次に、カラオケ装置１の音声制御部２４が実行する「音声制御部２４の歌詞採点処理」の手順を図１９〜図２１のフローチャートに基づいて説明する。この歌詞採点処理に関する動作プログラムは、カラオケ演奏を実行するシーケンスプログラムと並行して実行され、シーケンスプログラムとのデータの交換も行われる。なお、以下の説明においては、制御部１２からカラオケ曲の選曲番号のデータを受信している状態とする。
【０１１２】
まず、音声制御部２４は制御部１２から送信されたカラオケ演奏開始信号を受信したか否かを判断する（Ｓ４１０）。そして、カラオケ演奏開始信号を受信すると（Ｓ４１０：ＹＥＳ）、カラオケ曲の選曲番号に対応する楽曲データを再生し、カラオケ演奏を開始する（Ｓ４１２）。
【０１１３】
次に、音声制御部２４は制御部１２から送信された音声認識開始信号を受信したか否かを判断する（Ｓ４１４）。そして、音声認識開始信号を受信すると（Ｓ４１４：ＹＥＳ）、カラオケ歌唱の歌詞の音声認識を開始する（Ｓ４１６）。具体的には、音声制御部２４が音声認識部１０を制御してカラオケ歌唱の歌詞を音声認識させる。そして、音声認識させたカラオケ歌唱の歌詞データを音声制御部２４が内蔵するＲＯＭに設けられているカラオケ歌唱の歌詞記録エリア６０へ記憶する。
【０１１４】
そして、音声制御部２４は制御部１２から送信された区間歌唱採点開始信号を受信したか否かを判断する（Ｓ４１８）。そして、区間歌唱採点開始信号を受信すると（Ｓ４１８：ＹＥＳ）、リファレンスカウンタ（全体）の初期化を行なう（Ｓ４２０）。
【０１１５】
次に、前奏期間または間奏期間の歌唱されない期間か否かを判断する（Ｓ４２２、図２０参照）。このＳ４２２の判断は、カラオケ演奏を実行するシーケンスプログラムから受け渡される制御データトラックに記憶されているカラオケ曲の前奏期間、歌唱期間、及び間奏期間の開始点を示す区間分割データによって前奏期間または間奏期間、すなわち歌唱されない期間か否かを判断する。そして、前奏期間または間奏期間でない場合、すなわち歌唱期間の場合（Ｓ４２２：ＮＯ）には、歌唱採点の比較処理を実行する（Ｓ４２４）。具体的には、上記実施形態の「（１）歌唱採点の比較処理の説明」で説明した処理を実行する。一方、前奏期間または間奏期間の場合（Ｓ４２２：ＹＥＳ）には、歌唱採点の調整処理を実行する（Ｓ４２６）とともに、音声認識の調整処理を実行する（Ｓ４２８）。具体的には、上記実施形態の「（２）歌唱採点の調整処理の説明」で説明した処理を実行するとともに、上記実施形態の「（３）音声認識の調整処理の説明」で説明した処理を実行する。そして、歌唱採点の比較処理を実行した場合（Ｓ４２４）、歌唱採点の調整処理を実行した場合（Ｓ４２６）、もしくは音声認識の調整処理を実行した場合（Ｓ４２８）には、区間歌唱採点が終了したか否かを判断する（Ｓ４３０）。そして、区間歌唱採点が終了していない場合（Ｓ４３０：ＮＯ）には、Ｓ４２２へ戻り、上述した処理を実行する。
【０１１６】
一方、区間歌唱採点が終了した場合（Ｓ４３０：ＹＥＳ）には、上記実施形態の「（１）歌唱採点の比較処理の説明」で説明した歌唱採点の比較処理によって音声制御部２４が内蔵するＲＯＭ（図示なし）の差分データ記憶エリア６６へ記憶された音高差データから全体の音高差分データを取り出し（Ｓ４３２）、全体の音高差分データの合計をリファレンスカウンタ値で割って音高差分データを平均化する（Ｓ４３４）。そして、ＨＤＤ１６の採点情報メモリ領域５４に記憶されている音高差のデータに応じた歌唱採点情報（図１５参照）を用いて音高差のデータに応じて歌唱採点する（Ｓ４３６）。Ｓ４３６の処理が終了したらＳ４３８（図２１参照）の処理を実行する。
【０１１７】
Ｓ４３８の処理においては、歌唱採点の結果が８０点以上か否かを判断する。この歌唱採点の結果を判断する点数は、この「８０点」には限らない。音声認識の認識率の低下を防止できる点数に設定するとよい。そして、歌唱採点の結果が８０点以上でない場合には（Ｓ４３８：ＮＯ）、Ｓ４４４の処理を実行する。一方、歌唱採点の結果が８０点以上である場合には（Ｓ４３８：ＹＥＳ）、Ｓ４４２の処理を実行する。
【０１１８】
Ｓ４４２の処理においては、音声認識した歌詞データを制御部１２へ送信する。具体的には、音声制御部２４が内蔵するＲＯＭに設けられているカラオケ歌唱の歌詞記録エリア６０へ記憶されているカラオケ歌唱の歌詞データを読み出し、読み出したカラオケ歌唱の歌詞データを制御部１２へ送信する。
Ｓ４４２の処理が終了したらＳ４４４の処理を実行する。
【０１１９】
Ｓ４４４の処理においては、カラオケ演奏が終了したか否かを判断する。そして、カラオケ演奏が終了しない場合には（Ｓ４４４：ＮＯ）、Ｓ４１８（図１９参照）へ戻り、上述した処理を実行する。一方、カラオケ演奏が終了した場合には（Ｓ４４４：ＹＥＳ）、カラオケ演奏終了信号を制御部１２へ送信する（Ｓ４４６）。
【０１２０】
次に、音声制御部２４は制御部１２から送信された音声認識終了信号を受信したか否かを判断する（Ｓ４４８）。そして、音声認識終了信号を受信すると（Ｓ４４８：ＹＥＳ）、カラオケ歌唱の歌詞の音声認識を終了する（Ｓ４５０）。
【０１２１】
そして、Ｓ４５０の処理が終了したら、本「音声制御部２４の歌詞採点処理」は終了する。
このような、カラオケ装置１の制御部１２が実行する「制御部１２の歌詞採点処理」及びカラオケ装置１の音声制御部２４が実行する「音声制御部２４の歌詞採点処理」を実行することにより、カラオケ演奏終了まで音声認識部１０によって認識されたカラオケ歌唱の歌詞データとＨＤＤ１６に設けられている単語データメモリ領域５２へ記憶されている単語データとを比較して、相違する歌詞データの数量と前記単語データとに基づいてカラオケ歌唱の歌詞を採点することができる。
【０１２２】
また、本実施形態のカラオケ装置１によれば、区間歌唱採点が所定値例えば８０点以上ある場合に、音声認識部１０によって認識されたカラオケ歌唱の歌詞データと前記単語データとを比較する。
【０１２３】
したがって、このようなカラオケ装置１によれば、カラオケ歌唱の歌詞を採点するための条件として、歌唱採点結果が所定値以上例えば８０点以上に限ることで、歌詞採点における音声認識の認識率の低下を防止できる。
【０１２４】
（２）また、区間歌唱採点ごとに、区間歌唱採点が所定値例えば８０点以上ある場合に、カラオケ演奏終了まで音声認識部１０によって認識されたカラオケ歌唱の歌詞データとＨＤＤ１６に設けられている単語データメモリ領域５２へ記憶されている単語データとを比較して、相違する歌詞データの数量が所定数以上あると判定した場合には、カラオケ演奏を停止するゲームとしてもよい。
【０１２５】
以下に、カラオケ装置１の制御部１２が実行する「制御部１２の歌詞誤りゲーム処理」及びカラオケ装置１の音声制御部２４が実行する「音声制御部２４の歌詞誤りゲーム処理」を順に説明する。
【０１２６】
［制御部１２の歌詞誤りゲーム処理の説明］
以下に、カラオケ装置１の制御部１２が実行する「制御部１２の歌詞誤りゲーム処理」の手順を図２２、図２３のフローチャートに基づいて説明する。
【０１２７】
なお、以下の説明においては、ユーザ（カラオケ歌唱者）によってカラオケ曲が選曲されている状態とする。具体的には、操作部１８で受け付けたカラオケ曲の選曲番号のデータは操作処理部２２によって制御部１２へ送信されるのであるが、制御部１２は、選曲番号のデータを受信し、その選曲番号のデータを音声制御部２４へ送信している状態とする。
【０１２８】
操作部１８で受け付けたゲーム開始指示のデータは操作処理部２２によって制御部１２へ送信されるのであるが、制御部１２は、ゲーム開始指示のデータを受信したか否かを判断する（Ｓ５１０）。そして、操作処理部２２から送信されたゲーム開始指示のデータを受信すると（Ｓ５１０：ＹＥＳ）、制御部１２が有する歌詞誤り数カウンタ（図示せず）へ数式「ｎ＝０」を記憶する（Ｓ５１１）。Ｓ５１１の処理が終了したらＳ５１２の処理うぃ実行する。
【０１２９】
Ｓ５１２の処理においては、選曲されているカラオケ曲の選曲番号に対応する楽曲データをＨＤＤ１６に設けられている図５（ａ）に例示する楽曲データメモリ領域５０から読み出す。そして、読み出された楽曲データから図６（ａ）に例示する歌詞で使用されている単語データを読み出し、読み出された前記単語データを単語データメモリ領域５２へ記憶する（Ｓ５１４）。Ｓ５１４の処理が終了したらＳ５２０の処理を実行する。
【０１３０】
Ｓ５２０の処理においては、カラオケ演奏開始信号を音声制御部２４へ送信する。そして、音声認識開始信号を音声制御部２４へ送信する（Ｓ５２２）。さらに、区間歌唱採点開始信号を音声制御部２４へ送信する（Ｓ５２４、図２３参照）。Ｓ５２４の処理が終了したらＳ５２６の処理を実行する。
【０１３１】
さて、音声認識された歌詞データは音声制御部２４から制御部１２へ送信される（この送信処理については後述する）のであるが、制御部１２は、音声認識された歌詞データを受信したか否かを判断する（Ｓ５２６）。そして、音声制御部２４から音声認識された歌詞データを受信した場合には（Ｓ５２６：ＹＥＳ）、Ｓ５２８の処理を実行する。一方、音声制御部２４から音声認識された歌詞データを受信しない場合には（Ｓ５２６：ＮＯ）、Ｓ５３８の処理を実行する。
【０１３２】
Ｓ５２８の処理においては、歌詞誤り数カウンタが所定数を超えたか否かを判断する。ここで、所定数とは、例えばカラオケ歌唱の熟練者では「１」としたり、中級者では「３」としたり、初心者では「５」としたり、それぞれのカラオケ歌唱者のレベルに応じて設定される数値である。そして、歌詞誤り数カウンタが所定数を超えない場合には（Ｓ５２８：ＮＯ）、Ｓ５３７の処理を実行する。一方、歌詞誤り数カウンタが所定数を超えた場合には（Ｓ５２８：ＹＥＳ）、カラオケ演奏停止信号を音声制御部２４へ送信する（Ｓ５３０）。Ｓ５３０の処理が終了したらＳ５３２の処理を実行する。
【０１３３】
Ｓ５３２の処理においては、音声認識終了信号を音声制御部２４へ送信する。そして、歌詞誤り数の結果を表示部３６へ表示する（Ｓ５３６）。具体的には、例えば歌詞誤り数の結果に対応する「歌詞誤り数：５件」などを表示部３６へ表示し、さらに図１６（ｅ）に例示するように「まだまだ！残念」などを表示部３６へ表示するように映像制御部３８を制御する。
【０１３４】
そして、Ｓ５３６の処理が終了したら、本「制御部１２の採点処理」は終了する。
Ｓ５３７の処理においては、制御部１２が有する歌詞誤り数カウンタ（図示せず）が記憶する数式「ｎ＝０」に数値「１」を加算して数式「ｎ＝１」とし、制御部１２が有するメモリ（図示せず）へ数式「ｎ＝１」を記憶する（Ｓ５３７）。Ｓ５３７の処理が終了したらＳ５３８の処理を実行する。
【０１３５】
Ｓ５３８の処理においては、音声制御部２４からカラオケ演奏終了信号を受信したか否かを判断する。そして、音声制御部２４からカラオケ演奏終了信号を受信しない場合には（Ｓ５３８：ＮＯ）、Ｓ５２４の処理へ戻り、上述した処理を実行する。一方、音声制御部２４からカラオケ演奏終了信号を受信した場合には（Ｓ５３８：ＹＥＳ）
音声認識終了信号を音声制御部２４へ送信する（Ｓ５４０）。そして、歌詞誤り数の結果を表示部３６へ表示する（Ｓ５４２）。具体的には、例えば歌詞誤り数の結果に対応する「歌詞誤り数：０件」などを表示部３６へ表示し、さらに図１６（ｄ）に例示するように「やった！おめでとう」などを表示部３６へ表示するように映像制御部３８を制御する。
【０１３６】
そして、Ｓ５４２の処理が終了したら、本「制御部１２の採点処理」は終了する。
［音声制御部２４の歌詞誤りゲーム処理の説明］
次に、カラオケ装置１の音声制御部２４が実行する「音声制御部２４の歌詞誤りゲーム処理」の手順を図２４〜図２６のフローチャートに基づいて説明する。この歌詞誤りゲーム処理に関する動作プログラムは、カラオケ演奏を実行するシーケンスプログラムと並行して実行され、シーケンスプログラムとのデータの交換も行われる。なお、以下の説明においては、制御部１２からカラオケ曲の選曲番号のデータを受信している状態とする。
【０１３７】
まず、音声制御部２４は制御部１２から送信されたカラオケ演奏開始信号を受信したか否かを判断する（Ｓ６１０）。そして、カラオケ演奏開始信号を受信すると（Ｓ６１０：ＹＥＳ）、カラオケ曲の選曲番号に対応する楽曲データを再生し、カラオケ演奏を開始する（Ｓ６１２）。
【０１３８】
次に、音声制御部２４は制御部１２から送信された音声認識開始信号を受信したか否かを判断する（Ｓ６１４）。そして、音声認識開始信号を受信すると（Ｓ６１４：ＹＥＳ）、カラオケ歌唱の歌詞の音声認識を開始する（Ｓ６１６）。具体的には、音声制御部２４が音声認識部１０を制御してカラオケ歌唱の歌詞を音声認識させる。そして、音声認識させたカラオケ歌唱の歌詞を音声制御部２４が内蔵するＲＯＭに設けられているカラオケ歌唱の歌詞記録エリア６０へ記憶する。
【０１３９】
そして、音声制御部２４は制御部１２から送信された区間歌唱採点開始信号を受信したか否かを判断する（Ｓ６１８）。そして、区間歌唱採点開始信号を受信すると（Ｓ６１８：ＹＥＳ）、リファレンスカウンタ（全体）の初期化を行なう（Ｓ６２０）。
【０１４０】
次に、前奏期間または間奏期間の歌唱されない期間か否かを判断する（Ｓ６２２、図２５参照）。このＳ６２２の判断は、カラオケ演奏を実行するシーケンスプログラムから受け渡される制御データトラックに記憶されているカラオケ曲の前奏期間、歌唱期間、及び間奏期間の開始点を示す区間分割データによって前奏期間または間奏期間、すなわち歌唱されない期間か否かを判断する。そして、前奏期間または間奏期間でない場合、すなわち歌唱期間の場合（Ｓ６２２：ＮＯ）には、歌唱採点の比較処理を実行する（Ｓ６２４）。具体的には、上記実施形態の「（１）歌唱採点の比較処理の説明」で説明した処理を実行する。一方、前奏期間または間奏期間の場合（Ｓ６２２：ＹＥＳ）には、歌唱採点の調整処理を実行する（Ｓ６２６）とともに、音声認識の調整処理を実行する（Ｓ６２８）。具体的には、上記実施形態の「（２）歌唱採点の調整処理の説明」で説明した処理を実行するとともに、上記実施形態の「（３）音声認識の調整処理の説明」で説明した処理を実行する。そして、歌唱採点の比較処理を実行した場合（Ｓ６２４）、歌唱採点の調整処理を実行した場合（Ｓ６２６）、もしくは音声認識の調整処理を実行した場合（Ｓ６２８）には、区間歌唱採点が終了したか否かを判断する（Ｓ６３０）。そして、区間歌唱採点が終了していない場合（Ｓ６３０：ＮＯ）には、Ｓ６２２へ戻り、上述した処理を実行する。
【０１４１】
一方、区間歌唱採点が終了した場合（Ｓ６３０：ＹＥＳ）には、上記実施形態の「（１）歌唱採点の比較処理の説明」で説明した歌唱採点の比較処理によって音声制御部２４が内蔵するＲＯＭ（図示なし）の差分データ記憶エリア６６へ記憶された音高差データから全体の音高差分データを取り出し（Ｓ６３２）、全体の音高差分データの合計をリファレンスカウンタ値で割って音高差分データを平均化する（Ｓ６３４）。そして、ＨＤＤ１６の採点情報メモリ領域５４に記憶されている音高差のデータに応じた歌唱採点情報（図１５参照）を用いて音高差のデータに応じて歌唱採点する（Ｓ６３６）。Ｓ６３６の処理が終了したらＳ６３８（図２６参照）の処理を実行する。
【０１４２】
Ｓ６３８の処理においては、歌唱採点の結果が８０点以上か否かを判断する。この歌唱採点の結果を判断する点数は、この「８０点」には限らない。音声認識の認識率の低下を防止できる点数に設定するとよい。そして、歌唱採点の結果が８０点以上でない場合には（Ｓ６３８：ＮＯ）、Ｓ６５４の処理を実行する。一方、歌唱採点の結果が８０点以上である場合には（Ｓ６３８：ＹＥＳ）、Ｓ６４２の処理を実行する。
【０１４３】
Ｓ６４２の処理においては、音声認識した歌詞データを制御部１２へ送信する。Ｓ６４２の処理が終了したらＳ６４４の処理を実行する。
そして、音声制御部２４は制御部１２から送信されたカラオケ演奏停止信号を受信したか否かを判断する（Ｓ６４４）。そして、カラオケ演奏が終了しない場合には（Ｓ６４４：ＮＯ）、Ｓ６１８（図２４参照）へ戻り、上述した処理を実行する。一方、カラオケ演奏停止信号を受信すると（Ｓ６４４：ＹＥＳ）、カラオケ演奏を停止する（Ｓ６４６）。Ｓ６４６の処理が終了したらＳ６４８の処理を実行する。
【０１４４】
次に、音声制御部２４は制御部１２から送信された音声認識終了信号を受信したか否かを判断する（Ｓ６４８）。そして、音声認識終了信号を受信すると（Ｓ６４８：ＹＥＳ）、カラオケ歌唱の歌詞の音声認識を終了する（Ｓ６５０）。
【０１４５】
そして、Ｓ６５０の処理が終了したら、本「音声制御部２４の歌詞誤りゲーム処理」は終了する。
Ｓ６５４の処理においては、カラオケ演奏が終了したか否かを判断する。そして、カラオケ演奏が終了しない場合には（Ｓ６５４：ＮＯ）、Ｓ６１８（図２４参照）へ戻り、上述した処理を実行する。一方、カラオケ演奏が終了した場合には（Ｓ６５４：ＹＥＳ）、カラオケ演奏終了信号を制御部１２へ送信する（Ｓ６５６）。
【０１４６】
次に、音声制御部２４は制御部１２から送信された音声認識終了信号を受信したか否かを判断する（Ｓ６５８）。そして、音声認識終了信号を受信すると（Ｓ６５８：ＹＥＳ）、カラオケ歌唱の歌詞の音声認識を終了する（Ｓ６６０）。
【０１４７】
そして、Ｓ６６０の処理が終了したら、本「音声制御部２４の歌詞誤りゲーム処理」は終了する。
このような、カラオケ装置１の制御部１２が実行する「制御部１２の歌詞誤りゲーム処理」及びカラオケ装置１の音声制御部２４が実行する「音声制御部２４の歌詞誤りゲーム処理」を実行することにより、カラオケ歌唱の最中であっても、歌詞を所定数誤って歌唱した場合には、カラオケ演奏が中止されるのでよりゲーム性を高めることができる。
【０１４８】
また、本実施形態のカラオケ装置１によれば、区間歌唱採点が所定値例えば８０点以上ある場合に、音声認識部１０によって認識されたカラオケ歌唱の歌詞誤り数が所定数以上かを判断する。
【０１４９】
したがって、このようなカラオケ装置１によれば、歌詞を誤るとカラオケ演奏が中止されるゲームをするための条件として、歌唱採点結果が所定値以上例えば８０点以上に限ることで、より難易度の高いゲームでの音声認識の認識率の低下を防止できる。
【図面の簡単な説明】
【０１５０】
【図１】カラオケ装置の機能を中心とした概略構成を示す図である。
【図２】カラオケ演奏以前、カラオケ演奏期間、カラオケ演奏終了以後の経過時間に対するスイッチＭ４０、スイッチＭ３８及びスイッチＭ７８のオン／オフの変化と、歌唱用可変利得アンプＭ３２及び歌詞用可変利得アンプＭ７２からの出力信号レベルの変化と、を示す説明図である。
【図３】楽曲データベースのガイドメロディデータの音高データと採点用信号の音高データを示す説明図である。
【図４】カラオケ装置１の構成を示すブロック図である。
【図５】（ａ）はＨＤＤ１６に設けられたメモリ領域を示す説明図であり、（ｂ）はＭＩＤＩデータの構造を示す説明図であり、（ｃ）は音声制御部２４が内蔵するＲＯＭ（図示なし）に設けられたカラオケ歌唱の歌詞記録エリア６０、ガイドメロディバッファ６２、リファレンスデータレジスタ６４及び差分データ記憶エリア６６を示す説明図である。
【図６】（ａ）は楽曲データフォーマットを示す説明図であり、（ｂ）は歌詞で使用されている単語データの例を示す説明図である。
【図７】制御部１２が実行する「制御部１２のＮＧ単語ゲーム処理」の手順の一部を示すフローチャートである。
【図８】制御部１２が実行する「制御部１２のＮＧ単語ゲーム処理」の手順の一部を示すフローチャートである。
【図９】音声制御部２４が実行する「音声制御部２４のＮＧ単語ゲーム処理」の手順の一部を示すフローチャートである。
【図１０】音声制御部２４が実行する「音声制御部２４のＮＧ単語ゲーム処理」の手順の一部を示すフローチャートである。
【図１１】音声制御部２４が実行する「音声制御部２４のＮＧ単語ゲーム処理」の手順の一部を示すフローチャートである。
【図１２】（ａ）は音声制御部２４が実行する「音声制御部２４の歌唱採点」の［比較処理］において実行されるデータの取り込み処理の手順を示すフローチャートであり、（ｂ）は音声制御部２４が実行する「音声制御部２４の歌唱採点」の［比較処理］において実行されるガイドメロディデータの取り込み処理の手順を示すフローチャートである。
【図１３】音声制御部２４が実行する「音声制御部２４のＮＧ単語ゲーム処理」の歌唱採点の比較処理の詳細を示すフローチャートである。
【図１４】（ａ）は音声制御部２４が実行する「音声制御部２４のＮＧ単語ゲーム処理」の歌唱採点の調整処理の詳細を示すフローチャートであり、（ｂ）は音声制御部２４が実行する「音声制御部２４のＮＧ単語ゲーム処理」の歌唱採点の調整処理の詳細を示すフローチャートである。
【図１５】音高差のデータに応じた採点情報を示す説明図である。
【図１６】（ａ）はタイトルを表示部３６へ表示させた例を示す説明図であり、（ｂ）はＮＧ単語を表示部３６へ表示させた例を示す説明図であり、（ｃ）はＮＧ単語歌詞画面をを表示部３６へ表示させた例を示す説明図であり、（ｄ）はおめでとう画面を表示部３６へ表示させた例を示す説明図であり、（ｅ）は残念画面を表示部３６へ表示させた例を示す説明図である。
【図１７】制御部１２が実行する「制御部１２の歌詞採点処理」の手順の一部を示すフローチャートである。
【図１８】制御部１２が実行する「制御部１２の歌詞採点処理」の手順の一部を示すフローチャートである。
【図１９】音声制御部２４が実行する「音声制御部２４の歌詞採点処理」の手順の一部を示すフローチャートである。
【図２０】音声制御部２４が実行する「音声制御部２４の歌詞採点処理」の手順の一部を示すフローチャートである。
【図２１】音声制御部２４が実行する「音声制御部２４の歌詞採点処理」の手順の一部を示すフローチャートである。
【図２２】制御部１２が実行する「制御部１２の歌詞誤りゲーム処理」の手順の一部を示すフローチャートである。
【図２３】制御部１２が実行する「制御部１２の歌詞誤りゲーム処理」の手順の一部を示すフローチャートである。
【図２４】音声制御部２４が実行する「音声制御部２４の歌詞誤りゲーム処理」の手順の一部を示すフローチャートである。
【図２５】音声制御部２４が実行する「音声制御部２４の歌詞誤りゲーム処理」の手順の一部を示すフローチャートである。
【図２６】音声制御部２４が実行する「音声制御部２４の歌詞誤りゲーム処理」の手順の一部を示すフローチャートである。
【符号の説明】
【０１５１】
１…カラオケ装置、２…リモコン端末、１０…音声認識部、１２…制御部、１４…インタフェース部、１６…ハードディスク（ＨＤＤ）、１８…操作部、２０…赤外線通信部、２２…操作処理部、２４…音声制御部、２５…マイク、２８…スピーカ、３０…ＭＩＤＩ音源、３２…ビデオＲＡＭ、３４…映像再生部、３６…表示部、３８…映像制御部、３９…バス、４０…ＵＳＢ、５０…楽曲データメモリ領域、５２…単語データメモリ領域、５４…採点情報メモリ領域、６０…カラオケ歌唱の歌詞記憶エリア、６２…ガイドメロディバッファ、６４…リファレンスデータレジスタ、６６…差分データ記憶エリア、１００…ネットワーク。

【特許請求の範囲】
【請求項１】
カラオケ歌唱の音声信号を入力するための音声信号入力手段と、
カラオケ曲の楽曲データを記憶する楽曲データ記憶手段と、
前記楽曲データ記憶手段が記憶する前記楽曲データを音信号として再生し、且つ再生した音信号と前記音声信号入力手段から入力されたカラオケ歌唱の音声信号とをスピーカへ出力するカラオケ演奏再生手段と、
前記カラオケ演奏再生手段から出力された音信号に対応する第１の信号と前記音声信号入力手段から入力されたカラオケ歌唱の音声信号に対応する第２の信号とを比較し、第２の信号から第１の信号を減じた音声認識用信号を生成する第１の生成手段と、
前記第１の生成手段によって生成された音声認識用信号に基づいて、前記第１の生成手段が第２の信号から第１の信号を減じるための利得を設定する第１の利得設定手段と、
前記第１の生成手段によって生成された音声認識用信号に基づいてカラオケ歌唱の歌詞を認識する音声認識手段と、
を備えたことを特徴とするカラオケ装置。
【請求項２】
請求項１に記載のカラオケ装置において、
前記楽曲データ記憶手段は、カラオケ曲の歌詞データを含む楽曲データを記憶し、
前記音声認識手段によって認識されたカラオケ歌唱の歌詞データと前記楽曲データ記憶手段が記憶する前記カラオケ曲の歌詞データとを比較して、相違する歌詞データの数量を抽出し、抽出された数量と前記カラオケ曲の歌詞データの数量とに基づいてカラオケ歌唱の歌詞を採点する歌詞採点手段を備えることを特徴とするカラオケ装置。
【請求項３】
請求項１に記載のカラオケ装置において、
前記楽曲データ記憶手段は、カラオケ曲の歌詞データを含む楽曲データを記憶し、
前記音声認識手段によって認識されたカラオケ歌唱の歌詞データと前記楽曲データ記憶手段が記憶する前記カラオケ曲の歌詞データとを比較して、相違する歌詞データの数量を抽出し、抽出された数量が所定数以上あると判定した場合には、前記カラオケ演奏再生手段を制御して、カラオケ演奏の再生を停止させる制御手段を備えることを特徴とするカラオケ装置。
【請求項４】
請求項１に記載のカラオケ装置において、
カラオケ曲の歌詞データを表示可能な表示手段を備え、
前記楽曲データ記憶手段は、カラオケ曲の歌詞データを含む楽曲データを記憶し、
前記楽曲データ記憶手段が記憶している楽曲データから特定の歌詞データを抽出して、前記表示手段を制御して、前記抽出した歌詞データを表示させるとともに、前記音声認識手段によって認識されたカラオケ歌唱の歌詞データと前記抽出した歌詞データとを比較して、同じ歌詞データがあると判定した場合には、前記カラオケ演奏再生手段を制御して、カラオケ演奏の再生を停止させる制御手段を備えることを特徴とするカラオケ装置。
【請求項５】
請求項２に記載のカラオケ装置において、さらに
前記音声認識手段によって認識されたカラオケ歌唱の歌詞データを記憶する音声認識記憶手段と、
前記カラオケ演奏再生手段から出力された音信号に対応する第１の信号と前記音声信号入力手段から入力されたカラオケ歌唱の音声信号に対応する第２の信号とを比較し、第２の信号から第１の信号を減じた採点用信号を生成する第２の生成手段と、
前記第２の生成手段によって生成された採点用信号から音高データを抽出する音高抽出手段と、
前記第２の生成手段によって生成された採点用信号に基づいて、前記第２の生成手段が第２の信号から第１の信号を減じるための利得を設定する第２の利得設定手段と、
前記楽曲データ記憶手段が記憶する前記カラオケ曲の歌唱旋律の音高データと前記音高抽出手段によって抽出された前記採点用信号の音高データとの音高差を算出し、算出した音高差に基づいて所定区間ごとにカラオケ歌唱の歌唱を採点する歌唱採点手段と、
を備え、
前記歌詞採点手段は、所定区間ごとに前記歌唱採点手段によるカラオケ歌唱の歌唱採点結果が所定値以上あるか否かを判定し、所定値以上あると判定した場合には、前記音声認識記憶手段に記憶されたカラオケ歌唱の歌詞データを読み出し、読み出されたカラオケ歌唱の歌詞データと前記楽曲データ記憶手段が記憶する前記カラオケ曲の歌詞データとを比較して、相違する歌詞データの数量を抽出し、抽出された数量と前記カラオケ曲の歌詞データの数量とに基づいてカラオケ歌唱の歌詞を採点することを特徴とするカラオケ装置。
【請求項６】
請求項３に記載のカラオケ装置において、さらに
前記音声認識手段によって認識されたカラオケ歌唱の歌詞データを記憶する音声認識記憶手段と、
前記カラオケ演奏再生手段から出力された音信号に対応する第１の信号と前記音声信号入力手段から入力されたカラオケ歌唱の音声信号に対応する第２の信号とを比較し、第２の信号から第１の信号を減じた採点用信号を生成する第２の生成手段と、
前記第２の生成手段によって生成された採点用信号から音高データを抽出する音高抽出手段と、
前記第２の生成手段によって生成された採点用信号に基づいて、前記第２の生成手段が第２の信号から第１の信号を減じるための利得を設定する第２の利得設定手段と、
前記楽曲データ記憶手段が記憶する前記カラオケ曲の歌唱旋律の音高データと前記音高抽出手段によって抽出された前記採点用信号の音高データとの音高差を算出し、算出した音高差に基づいて所定区間ごとにカラオケ歌唱の歌唱を採点する歌唱採点手段と、
を備え、
前記制御手段は、所定区間ごとに前記歌唱採点手段によるカラオケ歌唱の歌唱採点結果が所定値以上あるか否かを判定し、所定値以上あると判定した場合には、前記音声認識記憶手段に記憶されたカラオケ歌唱の歌詞データを読み出し、読み出されたカラオケ歌唱の歌詞データと前記楽曲データ記憶手段が記憶する前記カラオケ曲の歌詞データとを比較して、相違する歌詞データの数量を抽出し、抽出された数量が所定数以上あると判定した場合には、前記カラオケ演奏再生手段を制御して、カラオケ演奏の再生を停止させることを特徴とするカラオケ装置。
【請求項７】
請求項４に記載のカラオケ装置において、さらに
前記音声認識手段によって認識されたカラオケ歌唱の歌詞データを記憶する音声認識記憶手段と、
前記カラオケ演奏再生手段から出力された音信号に対応する第１の信号と前記音声信号入力手段から入力されたカラオケ歌唱の音声信号に対応する第２の信号とを比較し、第２の信号から第１の信号を減じた採点用信号を生成する第２の生成手段と、
前記第２の生成手段によって生成された採点用信号から音高データを抽出する音高抽出手段と、
前記第２の生成手段によって生成された採点用信号に基づいて、前記第２の生成手段が第２の信号から第１の信号を減じるための利得を設定する第２の利得設定手段と、
前記楽曲データ記憶手段が記憶する前記カラオケ曲の歌唱旋律の音高データと前記音高抽出手段によって抽出された前記採点用信号の音高データとの音高差を算出し、算出した音高差に基づいて所定区間ごとにカラオケ歌唱の歌唱を採点する歌唱採点手段と、
を備え、
前記制御手段は、前記楽曲データ記憶手段が記憶している楽曲データから特定の歌詞データを抽出して、前記表示手段を制御して、前記抽出した歌詞データを表示させるとともに、所定区間ごとに前記歌唱採点手段によるカラオケ歌唱の歌唱採点結果が所定値以上あるか否かを判定し、所定値以上あると判定した場合には、前記音声認識記憶手段に記憶されたカラオケ歌唱の歌詞データを読み出し、読み出されたカラオケ歌唱の歌詞データと前記抽出した歌詞データとを比較して、同じ歌詞データがあると判定した場合には、前記カラオケ演奏再生手段を制御して、カラオケ演奏の再生を停止させることを特徴とするカラオケ装置。

【図２】