歌唱力評価方法及びカラオケ装置

【課題】マイクから入力された音声が、伴奏情報なのか人間の歌声なのかを判定して歌声部分のみを採点する歌唱力評価方法及びカラオケ装置を提供すること。
【解決手段】カラオケ装置１に内臓されている採点処理部１２は、マイク２から入力された音声信号がカラオケの伴奏なのか？人間の歌声なのか？を判定する伴奏・歌声判定部２１を備える。伴奏・歌声判別部２１は、マイク２から入力された音声信号に周波数分析を行いスペクトルを算出し、スペクトルのエネルギーが高周波数帯域に集中していることが検出されたときに『入力音声信号は伴奏情報である』と判定する。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、歌唱力評価方法及びカラオケ装置に関する。
【背景技術】
【０００２】
現在市販されている殆ど全てのカラオケ装置には、カラオケ採点機能が付いている。従来のカラオケ採点装置として、例えば特許文献１に示すようなマイクから入力された歌唱者の歌声から抽出した音程（ピッチ）とガイドメロディの音程を比較して、その一致度に基づき得点を算出するというものが知られている。
【特許文献１】特許第２９２５７５９号公報
【０００３】
これらのカラオケ採点装置では、マイクから入力された歌唱者の歌声からピッチを検出し、ピッチに基づいて歌唱者の歌の採点を行う。しかし、マイクにはいつも歌唱者の歌声が入力されるとは限らない。例えばカラオケＢＯＸなどに設置されたカラオケ装置の場合、マイクには歌唱者の歌声と伴奏情報が混ざりあった音声信号が入力される場合が多い。歌唱者がマイクを口元から離して歌っている場合、歌唱者の声が小さい場合、伴奏の音量が大きい場合などは、カラオケ伴奏が歌唱者の持つマイクに回り込み、カラオケ採点結果に影響を与える場合がある（図１３参照）。
【発明の開示】
【発明が解決しようとする課題】
【０００４】
本発明は、上記問題を解決するためになされたものであり、音声信号入力手段から入力された音声信号が歌唱者の歌声情報か伴奏情報かを判定することのできる歌唱力評価方法及び歌唱力評価機能を有するカラオケ装置を提供することを目的とする。
【課題を解決するための手段】
【０００５】
上記目的を達成するために、本発明の請求項１に記載の歌唱力評価方法は、コンピュータに、音声信号入力手段から入力された入力音声信号に周波数分析を行いスペクトルを算出させるスペクトル算出ステップと、当該スペクトル算出ステップを実行して得られたスペクトルをスペクトル記憶手段に記憶するスペクトル記憶ステップと、前記スペクトル記憶手段より読み出されたスペクトルのエネルギーが高周波数帯域に集中していることが検出されたときに入力音声信号は伴奏情報であると判定する伴奏・歌声判定ステップとを実行させることを特徴とする。
【０００６】
また、本発明の請求項２に記載の歌唱力評価方法は、請求項１に記載の発明の構成に加え、前記伴奏・歌声判定ステップでは、前記スペクトル記憶手段より読み出されたスペクトルからピッチを算出させ、当該ピッチが一定しきい値より高いときに入力音声信号は伴奏情報であると判定することを特徴とする。
【０００７】
また、本発明の請求項３に記載の歌唱力評価方法は、請求項１に記載の発明の構成に加え、前記伴奏・歌声判定ステップでは、前記スペクトル記憶手段より読み出されたスペクトルからスペクトルの傾きを算出させ、算出されたスペクトルの傾きが一定しきい値より大きいときに入力音声信号は伴奏情報であると判定することを特徴とする。
【０００８】
また、本発明の請求項４に記載の歌唱力評価方法は、請求項１乃至３の何れかに記載の歌唱力評価方法であって、前記伴奏・歌声判定ステップでは、さらに前記スペクトル記憶手段より読み出されたスペクトルから、スペクトルに含まれる倍音の量を測定し、当該倍音の量が一定しきい値より多いときに入力音声信号は伴奏情報であると判定することを特徴とする。
【０００９】
また、本発明の請求項５に記載の歌唱力評価方法は、請求項１乃至３の何れかに記載の歌唱力評価方法であって、前記伴奏・歌声判定ステップでは、さらに前記スペクトル記憶手段より読み出されたスペクトルから、スペクトルに含まれる極値の数を数え、当該極値の数が一定しきい値より多いときに入力音声信号は伴奏情報であると判定することを特徴とする。
【００１０】
また、本発明の請求項６に記載の歌唱力評価機能を搭載したカラオケ装置は、音声信号入力手段から入力された入力音声信号に周波数分析を行いスペクトルを算出するスペクトル算出手段と、当該スペクトル算出手段により得られたスペクトルを記憶するスペクトル記憶手段と、前記スペクトル記憶手段により読み出されたスペクトルのエネルギーが高周波数帯域に集中していることが検出されたときに入力音声信号は伴奏情報であると判定する伴奏・歌声判定手段とを備えたことを特徴とする。
【００１１】
また、本発明の請求項７に記載の歌唱力評価機能を搭載したカラオケ装置は、請求項６に記載の発明の構成に加え、前記伴奏・歌声判定手段は、前記スペクトル記憶手段により読み出されたスペクトルからピッチを算出し、当該ピッチが一定しきい値より高いときに入力音声信号は伴奏情報であると判定することを特徴とする。
【００１２】
また、本発明の請求項８に記載の歌唱力評価機能を搭載したカラオケ装置は、請求項６に記載の発明の構成に加え、前記伴奏・歌声判定手段は、前記スペクトル記憶手段により読み出されたスペクトルからスペクトルの傾きを算出し、算出されたスペクトルの傾きが一定しきい値より大きいときに入力音声信号は伴奏情報であると判定することを特徴とする。
【００１３】
また、本発明の請求項９に記載の歌唱力評価機能を搭載したカラオケ装置は、請求項６乃至８の何れかに記載のカラオケ装置であって、前記伴奏・歌声判定手段は、さらに前記スペクトル記憶手段により読み出されたスペクトルから、スペクトルに含まれる倍音の量を測定し、当該倍音の量が一定しきい値より多いときに入力音声信号は伴奏情報であると判定することを特徴とする。
【００１４】
また、本発明の請求項１０に記載の歌唱力評価機能を搭載したカラオケ装置は、請求項６乃至８の何れかに記載のカラオケ装置であって、前記伴奏・歌声判定手段は、さらに前記スペクトル記憶手段により読み出されたスペクトルから、スペクトルに含まれる極値の数を数え、当該極値の数が一定しきい値より多いときに入力音声信号は伴奏情報であると判定することを特徴とする。
【発明の効果】
【００１５】
本発明の請求項１に記載の歌唱力評価方法は、入力音声信号より算出されたスペクトルの周波数特性を用いて入力音声信号が伴奏情報なのか、歌声情報なのかを判定することができる。本発明によれば、マイク等から入力された伴奏情報を歌声情報と誤って採点してしまうのを防ぐことができるため、高精度な歌唱力評価が可能となる。
【００１６】
また、本発明の請求項２に記載の歌唱力評価方法は、入力音声信号より算出されたピッチを用いて入力音声信号が伴奏情報なのか、歌声情報なのかを判定することができる。本発明によれば、マイク等から入力された伴奏情報を歌声情報と誤って採点してしまうのを防ぐことができるため、高精度な歌唱力評価が可能となる。
【００１７】
また、本発明の請求項３に記載の歌唱力評価方法は、入力音声信号より算出されたスペクトルの傾き用いて入力音声信号が伴奏情報なのか、歌声情報なのかを判定することができる。本発明によれば、マイク等から入力された伴奏情報を歌声情報と誤って採点してしまうのを防ぐことができるため、高精度な歌唱力評価が可能となる。
【００１８】
また、本発明の請求項４に記載の歌唱力評価方法は、請求項１乃至３の何れかに記載の発明の効果に加え、さらにスペクトルに含まれる倍音の量を利用して伴奏・歌声判定を行うことで、より高精度な歌唱力評価が可能となる。
【００１９】
また、本発明の請求項５に記載の歌唱力評価方法は、請求項１乃至３の何れかに記載の発明の効果に加え、さらにスペクトルの極値の数を利用して伴奏・歌声判定を行うことで、より高精度な歌唱力評価が可能となる。
【００２０】
また、本発明の請求項６に記載の歌唱力評価機能を搭載したカラオケ装置は、入力音声信号より算出されたスペクトルの周波数特性を用いて入力音声信号が伴奏情報なのか、歌声情報なのかを判定することができる。カラオケＢＯＸなどにおいて、マイクに回りこんできた伴奏情報を歌声情報と誤って採点してしまう不具合を防ぐことができるため、高精度な歌唱力評価機能を提供できる。
【００２１】
また、本発明の請求項７に記載の歌唱力評価機能を搭載したカラオケ装置は、入力音声信号より算出されたピッチを用いて入力音声信号が伴奏情報なのか、歌声情報なのかを判定することができる。カラオケＢＯＸなどにおいて、マイクに回りこんできた伴奏情報を歌声情報と誤って採点してしまう不具合を防ぐことができるため、高精度な歌唱力評価機能を提供できる。
【００２２】
また、本発明の請求項８に記載の歌唱力評価機能を搭載したカラオケ装置は、入力音声信号より算出されたスペクトルの傾きを用いて入力音声信号が伴奏情報なのか、歌声情報なのかを判定することができる。カラオケＢＯＸなどにおいて、マイクに回りこんできた伴奏情報を歌声情報と誤って採点してしまう不具合を防ぐことができるため、高精度な歌唱力評価機能を提供できる。
【００２３】
また、本発明の請求項９に記載の歌唱力評価機能を搭載したカラオケ装置は、請求項６乃至８の何れかに記載の発明の効果に加え、さらにスペクトルに含まれる倍音の量を利用して伴奏・歌声判定を行うため、より高精度な歌唱力評価機能を提供できる。
【００２４】
また、本発明の請求項１０に記載の歌唱力評価機能を搭載したカラオケ装置は、請求項６乃至８の何れかに記載の発明の効果に加え、さらにスペクトルの極値の数を利用して伴奏・歌声判定を行うため、より高精度な歌唱力評価機能を提供できる。
【発明を実施するための最良の形態】
【００２５】
次に本発明を適用した実施の形態について図面を参照して詳しく説明する。本発明の実施形態として、歌唱力評価装置を搭載したカラオケ装置について説明する。図１は本実施形態におけるカラオケ採点装置の外観である。図１に示すように、カラオケ装置１にはマイク２、ディスプレイ３、ＡＭＰ４が接続されており、ＡＭＰ４にはスピーカ５が接続されている。
【００２６】
図２は、カラオケ装置１の内部構造について説明したブロック図である。図２に示すように、カラオケ装置はＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）１９を中心にした電子回路で構成される。ＣＰＵ１９はＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）１８、ビデオコントローラ６、ミキサ７、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）９、採点処理部１２に接続され、各機器の動作を制御する。マイク２は、カラオケ装置１内部のＡ／Ｄ変換部１７に接続される。Ａ／Ｄ変換部１７は、ＲＡＭ９とミキサ７に接続される。ミキサ７は演奏装置８に接続されており、ミキサ７の出力を演奏装置８を経由して外部のＡＭＰ４に伝える。ＲＡＭ９には、Ａ／Ｄ変換部１７、採点処理部１２、ＣＰＵ１９が接続されている。ＲＡＭ９にはＡ／Ｄ変換部１７によりＡ／Ｄ変換された音声信号、採点処理部１２により算出されたカラオケ採点結果などが記録される。
【００２７】
採点処理部１２は、ピッチ抽出部１３、ビブラート検出部１４、得点算出部１５から構成され、ピッチ抽出部１３とビブラート検出部１４の出力を基に、得点算出部１５で得点算出を行う構造になっている。
【００２８】
ＨＤＤ１８には、多数のカラオケ曲の背景映像、演奏データ、歌詞テロップ、その他の情報が蓄えられている。操作部１６は、パネルスイッチや、リモコン受信回路から成り、ユーザによる操作信号をＣＰＵ１９に伝える。歌い手が多数のカラオケ曲から特定の曲を選択し操作部１６より入力すると、ＣＰＵ１９は、その信号を受けてＨＤＤ１８より該当するカラオケ曲の演奏データを読み出し、ミキサに出力する。
【００２９】
一方、マイク２より入力された歌唱者の歌声は、Ａ／Ｄ変換部１７でサンプリングされ、ミキサ７に送られる。ミキサ７はマイク２から入力された歌唱者の歌声とＨＤＤ１８より読み出された演奏データを合成し、演奏装置８に出力する。合成された演奏データはＡＭＰ４を経由してスピーカ５から出力される。同時に、ＣＰＵ１９は背景映像および歌詞テロップをビデオコントローラ６に送る。歌詞テロップは、演奏と同期してディスプレイ３に表示され、現在演奏されている歌詞テロップの色が変化していく。歌唱者は歌詞テロップを見ながら伴奏に従って歌を歌う。この一連の動作制御はＣＰＵ１９が担当している。なお、ビデオコントローラ６が請求項に言う「表示制御手段」に相当し、ディスプレイ３が請求項に言う「表示手段」に相当する。
【００３０】
次に、採点処理部１２の動作について説明する。カラオケ装置に付属するカラオケ採点機能を使用するかどうかは歌唱者の意思に委ねられる。カラオケ採点を希望する歌唱者は操作部１６を操作して、採点機能をＯＮにする。歌唱者のカラオケ歌唱が始まると、ＣＰＵ１９は採点処理部１２に採点開始指示を与える。採点開始指示を与えられた採点処理部１２はカラオケ採点を開始する。カラオケ採点が開始されると、ＣＰＵ１９はＨＤＤ１８から歌唱者が歌うカラオケ曲データを読み出し、読み出された曲データに含まれているガイドメロディをＲＡＭ９に書き込み始める。一方、マイク２より入力された歌唱者の歌声は、Ａ／Ｄ変換部１７によりサンプリングされ、ＤＭＡ（ＤｉｒｅｃｔＭｅｍｏｒｙＡｃｃｅｓｓ）によりＲＡＭ９に音声信号として記録される。ピッチ抽出部１３はＲＡＭ９から音声信号を読み出し、ピッチを算出する。同時に、ビブラート検出部１４はＲＡＭ９から音声信号を読み出し、ビブラートを検出する。得点算出部１５はピッチ抽出部１３より検出されたピッチ情報とＲＡＭ９より読み出されたガイドメロディを比較し、この比較結果にビブラート検出部１４より検出されたビブラート情報と伴奏・歌声判定部２１より出力された伴奏／歌声の判定結果を加味して得点を算出する。算出された得点は、採点結果としてＲＡＭ９に書き込まれる。なお、このＡ／Ｄ変換部１７が請求項に言う音声信号入力手段に相当する。
【００３１】
演奏終了後、ＣＰＵ１９が採点終了指示を採点処理部１２に与えると、カラオケ採点処理は終了する。ＣＰＵ１９はＲＡＭ９から読み出した採点結果をビデオコントローラ６に送る。採点結果はディスプレイ３に表示され、歌唱者は歌の採点結果を確認し一喜一憂する。なお、本実施形態では演奏終了後に得点をディスプレイ３に表示しているが、これに限らず歌唱者が歌い始めてから現時点までの中間得点を順次ディスプレイに表示していき歌唱者が歌いながら得点を確認できる構造にしても良い。
【００３２】
採点処理部１２は、ＤＳＰ（ＤｉｇｉｔａｌＳｉｇｎａｌＰｒｏｃｅｓｓｏｒ）と採点処理を行う採点専用ファームウェアによって構成される。通常のカラオケ採点装置ではＤＳＰはピッチ算出のみに用いられ、採点処理はＣＰＵが行う構成が多かったが、本実施形態では採点に関わる殆ど全ての処理をＤＳＰ（採点処理部）が担当する。この構成により、採点回路設計の自由度が格段に向上すると共に非常に詳細な分析が可能となる。
【００３３】
次に、ＲＡＭ９に設定される記憶領域について、図３を参照して説明する。音声信号記憶メモリ９Ａは、Ａ／Ｄ変換部１７によりＡ／Ｄ変換された音声信号を記憶する領域である。自己相関関数記憶メモリ９Ｂは、採点処理部１２内部にあるピッチ抽出部１３で算出される自己相関関数を記憶する領域である。フーリエ級数記憶メモリ９Ｃは採点処理部１２内部にあるピッチ抽出部１３で算出されるフーリエ級数を記憶する領域である。有声・無声判定結果記憶メモリ９Ｄは、ＲＡＭ９より読み出された切り出し音声フレームが有声音か？無声音か？判定した結果を記憶する領域である。伴奏・歌声判定結果記憶メモリ９Ｅは、ＲＡＭ９より読み出された切り出し音声フレームが歌声情報か？伴奏情報か？判定した結果を記憶する領域である。ピッチ記憶メモリ９Ｆは、ピッチ抽出部１３で算出されるピッチを記憶する領域である。ピッチ変化量記憶メモリ９Ｇは、ビブラート検出部１４により算出されたピッチ変化量を記憶する領域である。ビブラート情報記憶メモリ９Ｈは、ビブラート検出部１４により算出されたビブラート情報を記憶する領域である。瞬時得点記憶メモリ９Ｉは、得点算出部１５により算出された瞬時得点を記憶する領域である。累積得点記憶メモリ９Ｊは、得点算出部１５により算出された累積得点を記憶する領域である。ワークメモリ９Ｗは、採点処理部が、採点処理の一時記憶などに使用する領域である。なお、この自己相関関数記憶メモリ９Ｂ及びフーリエ級数記憶メモリ９Ｃが請求項に言う「スペクトル記憶手段」に相当する。
【００３４】
図４は、採点処理部１２で行われる採点動作手順について説明したフローチャートである。採点処理部１２の動作について、図３、図４を参照して説明する。採点処理部１２は、ピッチ抽出部１３、ビブラート検出部１４、伴奏・歌声判定部２１、得点算出部１５より構成される。
【００３５】
まず、ピッチ抽出部１３の動作について図４に示すフローチャートを参照して説明する。ピッチ抽出処理では、まずＲＡＭ９の音声信号記憶メモリ９Ａより読み出された音声信号を基に自己相関関数を算出し、ＲＡＭ９の自己相関関数記憶メモリ９Ｂに書き込む（Ｓ１０）。次に、ＲＡＭ９の音声信号記憶メモリ９Ａより読み出された音声信号に対して高速フーリエ変換を行い、得られたフーリエ級数をＲＡＭ９のフーリエ級数記憶メモリ９Ｃに書き込む（Ｓ１１）。次に、ＲＡＭ９の自己相関関数記憶メモリ９Ｂから読み出された自己相関関数を基に「入力音声が有声音か無声音か？」の判定を行い、判定結果をＲＡＭ９の有声・無声判定結果記憶領域９Ｄに書き込む（Ｓ１２）。次に、ＲＡＭ９の自己相関関数記憶メモリ９ＢとＲＡＭ９のフーリエ級数記憶メモリ９Ｃから、自己相関関数とフーリエ級数を読み出し、これらを基に伴奏・歌声判定を行い、得られた伴奏・歌声判定結果をＲＡＭ９の伴奏・歌声判定結果記憶メモリ９Ｅに書き込む（Ｓ１３）。次に、ＲＡＭ９の自己相関関数記憶メモリ９ＢとＲＡＭ９のフーリエ級数記憶メモリ９Ｃから、自己相関関数とフーリエ級数を読み出し、これらを基にピッチ抽出を行い、検出されたピッチをＲＡＭ９のピッチ記憶メモリ９Ｆに書き込む（Ｓ１４）。上述Ｓ１０〜Ｓ１４までの処理をピッチ抽出部１３が担当する。なお、上記Ｓ１０及びＳ１１の処理が請求項に言う「スペクトル算出ステップ」及び「スペクトル記憶ステップ」に相当し、Ｓ１０及びＳ１１の処理を実行する採点処理部（ＤＳＰ）１２が「スペクトル算出手段」に相当する。また、上記Ｓ１３の処理が請求項に言う「伴奏・歌声判定ステップ」に相当し、Ｓ１０及びＳ１１の処理を実行する採点処理部（ＤＳＰ）１２が「伴奏・歌声判定手段」に相当する。
【００３６】
次に、ビブラート検出部１４の処理について説明する。ビブラート検出部１４では、ＲＡＭ９のピッチ記憶メモリ９Ｆより読み出されたピッチを基にピッチ変化量を算出しＲＡＭ９のピッチ変化量記憶メモリ９Ｇに書き込む（Ｓ１５）。次に、ＲＡＭ９のピッチ変化量記憶メモリ９Ｇより読み出されたピッチ変化量を基にビブラート検出を行い、ビブラート検出結果をＲＡＭ９のビブラート情報記憶メモリに書き込む（Ｓ１６）。上述Ｓ１５〜Ｓ１６までの処理をビブラート検出部１４が担当する。
【００３７】
得点算出部１５は、ＲＡＭ９のピッチ記憶メモリ９Ｆ、ガイドメロディ記憶メモリ９Ｍ、有声・無声判定結果記憶メモリ９Ｄ、伴奏・歌声判定結果記憶メモリ９Ｅ、ピッチ変化量記憶メモリ９Ｇ、ビブラート情報記憶メモリ９Ｈより、それぞれピッチ、ガイドメロディ、有声・無声判定結果、伴奏・歌声判定結果、ピッチ変化量、ビブラート検出結果を読み出し、これらを基に得点算出を行う（Ｓ１７）。処理Ｓ１７により得られた得点算出結果は、ＲＡＭ９の瞬時得点記憶メモリ９Ｉ、累積得点記憶メモリ９Ｊに書き込まれる。ＲＡＭ９の瞬時得点記憶メモリ９Ｉには、短時間について分析した瞬時得点が記録され、ＲＡＭ９の累積得点記憶メモリ９Ｊには、採点を始めてから現在に至るまで瞬時得点を累積して平均をとった平均得点が記録される。
【００３８】
なお、上記瞬時得点は上記ガイドメロディとピッチの比較を行い、その類似度を得点としている。ただし、有声・無声判定結果記憶メモリ９Ｄより読み出された判定結果が"無声音"と判定されている無声区間については得点算出を行わない。また、伴奏・歌声判定結果記憶メモリ９Ｅより読み出された判定結果が"伴奏情報"と判定されている伴奏区間については、得点算出を行わない。また、ピッチ変化量記憶メモリ９Ｇより読み出されたピッチ変化量が激しい区間についても得点算出を行わない。また、ビブラート情報記憶メモリ９Ｈより読み出された情報より、"ビブラート区間"と判定された区間については、ビブラートの美しさを算出し得点とする構成になっている。これら一連の採点処理は、ＣＰＵ１９から採点終了指示を受ける（Ｓ１８）ことで終了する。累積得点記憶メモリ９Ｊに書き込まれた平均得点が歌唱者の歌の得点となる。
【００３９】
以下、ピッチ抽出部１３、ビブラート検出部１４、得点算出部１５の動作について詳細に説明する。ピッチ抽出部１３では、前処理として、入力音声に自己相関分析を行い、自己相関関数を求める。本実施形態では、マイク２より入力された歌唱音声は、Ａ／Ｄ変換器１７によりサンプリング周波数４８［ｋＨｚ］でサンプリングされ、ＲＡＭ９の音声信号記憶メモリ９Ａに書き込まれる。採点処理部１２は、ＲＡＭ９の音声信号記憶メモリ９Ａから、１回の分析につき１４４０［ｐｏｉｎｔ］の分析フレームを切り出し分析を行う。自己相関関数法では、『分析フレーム：Ｆ_０＝｛ｘ（１），ｘ（２），…，ｘ（Ｎ）｝』と『分析フレームをｉ［ｐｏｉｎｔ］ずらしたもの：Ｆ_ｉ＝｛ｘ（ｉ），ｘ（１＋ｉ），…，ｘ（Ｎ＋ｉ）｝』の相関を求める。相関値Ｒ（０，ｉ）を計算する式の一例を数式１に示す。
【数１】

【００４０】
自己相関関数法では、Ｆ_０とＦ_ｉのずれ量ｉを１〜Ｎ［ｐｏｉｎｔ］まで変化させ、相関値（類似度）Ｒ（０，ｉ）を順次算出していく。このようにして算出された自己相関関数Ｒ（０，ｉ）は、メモリ９の自己相関関数記憶メモリ９Ｂに書き込まれる。
【００４１】
自己相関関数を用いたピッチ抽出法では、ピッチ（基本周波数）ｆは相関値Ｒ（０，ｉ）を利用して数式２により算出される。数式２は、ずれ量ｉを順次変化させていったときの相関値Ｒ（０，ｉ）が最大になるずれ量ａｒｇｍａｘ_ｉ｛Ｒ（０，ｉ）｝を音声信号の基本周期として検出し、サンプリング周波数４８０００［Ｈｚ］を基本周期で割ったものをピッチとして算出するという意味である。このようにして抽出されたピッチは、ＲＡＭ９のピッチ記憶メモリ９Ｆに書き込まれる。
【数２】

【００４２】
ここで、歌唱者の歌声が有声音か無声音か判別する方法について簡単に説明する。人間の声には有声音と無声音があるが、一般的に無声音からはピッチを算出することはできないことが知られている。このため、ピッチを算出する前に有声音・無声音判定を行う必要がある。有声・無声は、数式１で使用する自己相関関数の比Ｒ（０，ｉ_ｍａｘ）／Ｒ（０，０）を用いて簡単に判定できる。Ｒ（０，ｉ_ｍａｘ）／Ｒ（０，０）が一定しきい値より大きければ有声音、一定しきい値より小さければ無声音と判定する。本実施の形態では、無声音はピッチの信頼度が低いため歌唱力評価には用いない。また、有声・無声判定法としては、自己相関関数の比に限らずゼロクロス法などの他の公知な有声・無声判定技術を用いることもできる。
【００４３】
なお、本実施形態では自己相関関数を利用したピッチ抽出と高速フーリエ変換（ＦＦＴ）を利用したピッチ抽出を併用することにより、より信頼性の高いピッチ抽出を実現する。高速フーリエ変換を用いたピッチ抽出では、メモリ９の音声信号記憶メモリから読み出された音声信号に対し、高速フーリエ変換を用いてＦＦＴスペクトルを算出し、フーリエ級数記憶メモリ９Ｃに書き込む。ピッチは、ＦＦＴスペクトルが最大値をとるときの周波数として検出する。自己相関関数を利用したピッチ抽出法は男性低音系の歌声からのピッチ抽出に有効で、高速フーリエ変換を用いたピッチ抽出法は女性高音系の歌声からのピッチ抽出に有効である。採点処理に用いるピッチｆは、自己相関関数より算出したピッチｆ１と高速フーリエ変換により算出したピッチｆ２から、例えば表１に示す選択基準によって選択する。ｆ１とｆ２が一定しきい値ＦＴＨより大きいときはｆ＝ｆ２を選択し、それ以外のときはｆ＝ｆ１を選択する。この方法により、信頼性の高いピッチｆを選択することができる。ＦＴＨは、高音と低音を判断する予め設定されたしきい値である。ここでは、例えばＦＴＨ＝４００［Ｈｚ］とする。
【表１】

【００４４】
次に、ビブラート検出部１４の動作について説明する。ビブラート検出部１４では、まずピッチ変化量を算出する。ピッチ変化量Ｄ（ｉ）は、ＲＡＭ９のピッチ記憶メモリ９Ｆより読み出された現在のピッチｆ_ｉ＋１と一分析フレーム過去のピッチｆ_ｉを用いて、数式３により算出される。算出されたピッチ変化量Ｄ（ｉ）は、ピッチ変化量記憶メモリ９Ｇに書き込まれる。
【数３】

【００４５】
ＲＡＭ９のピッチ変化量記憶メモリ９Ｇには、数式３で算出されたピッチの変化量信号が例えば５００［ｍｓ］分バッファリングされている。フレームシフトを１０［ｍｓ］とすると５００［ｍｓ］は、５０フレーム分に相当するので、Ｎ＝５０ポイント分のピッチ変化量信号をバッファリングされていることになる。５０ポイントのピッチの変化量信号Ｄ（ｉ）に対して、数式４で示される自己相関関数ｅ（τ）を算出する。自己相関関数は信号の周期性を調べるのに適している関数である。自己相関関数ｅ（τ）が一定しきい値を超えた場合、ピッチ変化量信号にある程度の周期性があると考えられるため、入力音声信号にビブラートがかかっていると判定することができる。このようにして判定されたビブラート判定結果は、ビブラート情報記憶メモリ９Ｈに書き込まれる。
【数４】

【００４６】
次に、得点算出部１５の動作について詳細に説明する。得点算出部１５では、入力音声信号を表２に示す（ｉ）〜（ｉｖ）の４つの区間に分類する。（ｉ）無声区間と（ｉｉｉ）ピッチの変化が激しい区間（音程変化量が大きい区間）は得点算出には用いず、（ｉｉ）ビブラート区間と（ｉｖ）通常歌唱区間について得点算出を行う。なお、伴奏・歌声判定部２１により伴奏情報と判定された区間は（ｉ）の無声区間に分類され、得点算出に用いられない。（ｉｖ）通常歌唱区間では、入力音声信号から抽出されたピッチとガイドメロディを比較し、その類似度に比例した得点を算出する。（ｉｉ）ビブラート区間の得点は、例えば数式４で算出される相関の強さｅ（τ）の最大値に予め設定された定数を乗じて算出する。ビブラートはｅ（τ）の値が大きければ大きいほど周期性が強く、美しいと考えられる。従って、例えばｅ（τ）の最大値に予め設定された定数を乗ずることによりビブラート区間の得点を算出する。最終的な得点は（ｉｉ）ビブラート区間の得点と（ｉｖ）通常歌唱区間の得点の合計として算出される。
【表２】

【００４７】
図５は、得点算出部１５のブロック図である。信頼性算出モジュール１５１は、ＲＡＭ９の有声・無声判定結果記憶メモリ９Ｄと伴奏・歌声判定結果メモリ９Ｅ及びピッチ変化量記憶メモリ９Ｇよりそれぞれ有声・無声判定結果、伴奏・歌声判定結果、ピッチ変化量を読み出し、これらを基にピッチの信頼性を算出し、算出されたピッチの信頼性をＲＡＭ９のワーク領域９Ｗに書き込む。瞬時得点算出モジュール１５２は、ＲＡＭ９のピッチ記憶メモリ９Ｆ、ビブラート情報記憶メモリ９Ｈ、ガイドメロディ記憶メモリ９Ｍ、ワーク領域９Ｗよりそれぞれピッチ、ビブラート判定結果、ガイドメロディ、ピッチの信頼性を読み出し、歌唱者の歌声１分析フレーム分の瞬時得点を算出し、算出した瞬時得点をＲＡＭ９の瞬時得点記憶メモリ９Ｉに書き込む。得点累積モジュール１５３は、ＲＡＭ９の瞬時得点記憶メモリ９Ｉより読み出された瞬時得点を累積し、カラオケ採点が始まってから現在に至るまでの累積得点を算出し、ＲＡＭ９の累積得点記憶メモリ９Ｊに記録する。
【００４８】
カラオケ採点終了後、累積得点記憶メモリ９Ｊに記録された累積得点は、ＲＡＭ９より読み出され、ビデオコントローラ６を経由して、ディスプレイ３に表示される。歌唱者は、ディスプレイ３に表示された採点結果を見て一喜一憂する。なお、得点は累積得点をそのままディスプレイに表示しても良いし、得点変換関数や変換テーブルを通して変換をかけたものを表示しても良い。これらの変換テーブルや変換関数は事前に得点分布の統計調査を行った上で、例えば１００点が算出される確率が全体の５％以下になるように設計した変換テーブルや変換関数を用いる。
【００４９】
次に、伴奏・歌声判定部２１の動作について詳細に説明する。まず、カラオケ装置に接続されているダイナミックマイクから入力された音声がカラオケの伴奏なのか、人間の歌声なのかを判定する回路を設計するために、ダイナミックマイクの周波数特性について考察する。
【００５０】
図６は、一般的なカラオケ装置に接続されるダイナミックマイクの周波数特性を示したものである。ダイナミックマイクは、歌唱者の口元からマイクまでの距離により周波数特性が変わる特性を持つ。例えば、（ａ）音源とマイクの距離が２５ｍｍ場合、２００［Ｈｚ］付近の低音が最も強調され、１０００［Ｈｚ］以上の高音は弱めになる低域強調特性となる。（ｂ）音源とマイクの距離が５０ｍｍの場合、特性はフラットに近いものとなる。（ｃ）音源がマイクから６００ｍｍ離れた場合では、１００［Ｈｚ］付近の低音はほとんど入らず、１０００［Ｈｚ］以上の高音が強調される右肩上がりのグラフ（高域強調特性）となる。
【００５１】
このマイク周波数特性をさらに分かり易い例を用いて説明したものが図７である。例えばソプラノ歌手が離れたところから歌った場合でも、ダイナミックマイクは歌声を拾うことができる。ソプラノ歌手の高い声は１〜２［ｍ］離れていても拾う。マイクが遠くても、高い音なら拾う。一方、ベースボーカルの低い声は、１０［ｃｍ］離したら拾わない。
【００５２】
上述のダイナミックマイクの性質により、マイクを持っている歌唱者より遠くにあるスピーカからカラオケ伴奏がマイクに回り込む場合、マイクに入ってくる伴奏はスピーカから出た伴奏に高域強調をかけたものとなる。つまり、マイクに回り込んできた音はＢＡＳＳライン（低音）の比重が小さく、ドラムのハイハットの音や、エレキギターの音（高音）の比重が大きな伴奏となる（図８参照）。従って、ダイナミックマイクから入力された伴奏情報に対して周波数分析を行い、スペクトルを算出すると、スペクトルのエネルギーは高周波数帯域に集中する傾向が現れる。
【００５３】
この性質を利用して、伴奏情報と人間の声を判別することができる。スペクトルのエネルギーが高周波数帯域に集中する特徴を検出する１つの方法としてピッチ抽出を利用する方法がある。歌い手より遠くにあるスピーカから回り込んできた伴奏からピッチを抽出すると、人間の歌声よりも高い周波数となることが多い（但し女性の高音：８００Ｈｚ付近以上では帯域が重なることもある）。以下、伴奏・歌声の判別方法について説明する。
【００５４】
本発明の実施形態では、先ず、ピッチ検出部１３で人間の声より高い帯域を考慮してピッチを計算する。具体的には、図４の自己相関関数算出（Ｓ１０）とフーリエ級数算出（Ｓ１１）における分析帯域を人間の歌唱帯域（７０Ｈｚ〜１２００Ｈｚ）より高めに設定して例えば７０Ｈｚ〜７０００Ｈｚとする。７０Ｈｚ〜７０００Ｈｚの分析帯域をもつ自己相関関数及びフーリエ級数からピッチを抽出する。この構成で１２００Ｈｚ以上のピッチが検出された場合は、その部分は伴奏情報とみなし得点算出に用いない。この方法では、例えば高音域を得意とする一部の女性歌手が歌った場合、歌声の一部が伴奏と見なされる場合がある。ただし、常に１２００Ｈｚ（Ｄ６）以上の音程で歌い続ける歌唱者はいないため、カラオケ採点においては、実用上は問題ない。まず、上述の方法により判定された伴奏・歌声判定結果が、伴奏・歌声判定結果記憶メモリ９Ｅに書き込まれる。
【００５５】
ただし、８００Ｈｚ帯域付近の伴奏情報がマイクから入力されることもあるため、上述の判定法のみでは完全に伴奏情報を除去できない問題がある。次に、８００Ｈｚ帯域付近の女性の声なのか伴奏情報なのか判定し難い（ある程度高い）帯域のピッチが検出された場合に、自己相関関数の特徴を用いて伴奏を判定する方法を説明する。例えば、女性が８００Ｈｚ付近の高音で歌った場合、その歌声から抽出した自己相関関数は、図９に示すように比較的滑らかな波形となることが多い（倍音が少ない）。一方、伴奏情報から算出した自己相関関数は図１０に示すようにスペクトルに含まれる極値（ローカルピーク）の数が極端に多い（倍音が多い）。男性低音系の歌声は倍音は多いが、検出されるピッチは低い周波数となる。
【００５６】
この特徴を用いて、例えば４８０Ｈｚ〜１２００Ｈｚの『女性の歌声か伴奏情報か判定し難いピッチ』が検出された場合でも、自己相関関数などのスペクトルのローカルピーク（極値）が例えば１００以上ある（倍音が異常に多い）ときは、その部分は伴奏またはノイズと判定することができる。本発明の実施形態では、上述の方法を利用してＲＡＭ９の自己相関関数記憶メモリ９Ｂより自己相関関数が持つローカルピーク（極値）の数を数える。ローカルピークの数が予め設定されたしきい値ＴＨ（例えば１００）より大きい場合は入力音声は人間の歌声では無く伴奏情報（またはノイズ）と判定する。この方法により判定された伴奏・歌声判定結果はＲＡＭ９の伴奏・歌声判定結果記憶メモリ９Ｅに記録される。
【００５７】
また、倍音が異常に多いことを検出する方法は、この他にも様々な方法がある。例えば、スペクトルの隣り合う要素を結んだ長さＬを算出し、この尺度Ｌが一定しきい値より大きいとき『倍音が異常に多い』と判定することも可能である。例えば、数式１により算出された自己相関関数Ｒ（０，ｉ）を「スペクトル」とした場合、このスペクトルから数式５や数式６を用いて長さＬを算出することができる。数式５と数式６は本質的に同じものであり、どちらを用いても『倍音の多さ』を測定（定量化）することができる。このように、例えば４８０Ｈｚ〜１２００Ｈｚの『女性の歌声か伴奏情報か判定し難いピッチ』が検出された場合でも、Ｌが一定閾値より大きいときは、その部分は伴奏またはノイズと判定することができる。また、スペクトルとして自己相関関数の変わりにＦＦＴスペクトルやその他のスペクトルを利用できることは言うまでも無い。
【数５】

【数６】

【００５８】
なお、本実施形態では、上述の自己相関関数を利用した伴奏・歌声判定に加え、さらにメモリ９のフーリエ級数記憶メモリ９Ｃに記憶されたフーリエ級数（ＦＦＴスペクトル）を用いて歌声・伴奏判別を行うことで、さらに伴奏・歌声判定の信頼度を高める。以下、フーリエ級数を用いた伴奏・歌声判定方法について説明する。図１１（ａ）はマイクから採取された歌声に高速フーリエ変換をかけ得られたＦＦＴスペクトル、図１１（ｂ）はマイクに回り込んできた伴奏から得られたＦＦＴスペクトルである。ピッチは、例えば、ＦＦＴスペクトルが最大値をとるときの周波数として検出することができる。歌声から抽出したピッチは、４００［Ｈｚ］付近、マイクに回りこんできた伴奏のＦＦＴスペクトルは１５００［Ｈｚ］付近に分布している。例えば、１２００［Ｈｚ］以上のピッチが検出された場合は、その部分は伴奏情報とみなし得点算出に用いない構成とすることにより、カラオケ採点の精度を高めることができる。この方法により判定された伴奏・歌声判定結果はＲＡＭ９の伴奏・歌声判定結果記憶メモリ９Ｅに記録される。
【００５９】
最後に、本発明の実施形態では上述の伴奏・歌声判定に加え、メモリ９のフーリエ級数記憶メモリ９Ｃより読み出したＦＦＴスペクトル（フーリエ級数）の傾きから歌声・伴奏判定を行う。以下、スペクトルの傾きから伴奏・歌声判定を行う方法について説明する。２００［Ｈｚ］〜７０００［Ｈｚ］区間スペクトルを切り出し、最小２乗法によりスペクトルを直線近似したときのスペクトルの傾きを算出する。直線の傾きが予め設定された一定しきい値ＴＨより大きいとき、『入力音声は伴奏情報である』と判定する。この方法により判定された伴奏・歌声判定結果はＲＡＭ９の伴奏・歌声判定結果記憶メモリ９Ｅに記録される。
【００６０】
図１２（ａ）はマイクから入力された歌声に高速フーリエ変換をかけて求めたＦＦＴスペクトルの傾き、図１２（ｂ）はマイクに回り込んできた伴奏に高速フーリエ変換をかけて求めたＦＦＴスペクトルの傾きである。歌声から算出したＦＦＴスペクトルの傾きは大きくなり、伴奏から算出したＦＦＴスペクトルの傾きは小さくなることが観察できる。この特徴を用いて歌声とマイクから回りこんできた伴奏を判別することは容易である。このように『歌唱者より遠くにある音源から入ってくる音は、ダイナミックマイクの高域強調特性により高域強調される』という特徴を用いて伴奏・歌声の判定をすることが可能である。
【００６１】
なお、本実施形態では、ピッチ検出法として自己相関関数法及びフーリエ変換法を用いているが、これに限らず、ピッチ検出法として例えば相互相関法、ケプストラム法、平方根・４乗根スペクトルの自己相関法、対数スペクトルの自己相関法、線形予測法など他の公知のピッチ検出法を用いることもできる。本発明は、人間の声である可能性が少ない高音ピッチが検出されたときに入力音声を伴奏情報として判定するというもので、ピッチ検出法は特に限定しない。また、伴奏判別に用いるスペクトルとしては、例えば線形予測分析によって得られたＬＰＣスペクトル、相互相関関数、ケプストラム、ＬＰＣケプストラム、平方根・４乗根スペクトルなどを用いることもできることは言うまでもない。
【００６２】
また、直線の傾きを求めるのに使う周波数特徴としてはＬＰＣスペクトル、群遅延スペクトル、ＬＰＣケプストラム、ケプストラム、自己相関関数、相互相関関数など、他の公知の周波数特徴を用いることができる。
【００６３】
例えば、入力音声に高速フーリエ変換をかけ、ＦＦＴスペクトルを求める。次に、ＦＦＴスペクトルに高速逆フーリエ変換をかけるとケプストラムと呼ばれる特徴量が求まる。このケプストラムの高次の係数を０に置き換えて、さらに高速フーリエ変換をかけると、平滑化されたスペクトルが求まる。この平滑化されたスペクトルにおいて、例えば６００［Ｈｚ］以上の高次のスペクトル係数の平均値ＡＨと６００［Ｈｚ］未満の低次の係数の平均値ＡＬを算出する。例えば、数式７により高次のスペクトル係数と低次のスペクトル係数の比ＲＡＴＥを求め、ＲＡＴＥが一定しきい値より大きい場合、入力音声は伴奏情報であると判定することもできる。
【数７】

【００６４】
なお、上述の例では、逆フーリエ変換を行った後のケプストラムを用いて平滑化スペクトルを求めたが、これに限らず、平滑化を行わないフーリエ変換係数からＡＨ、ＡＬ、ＲＡＴＥを算出し、高次の係数と低次の係数の比：ＲＡＴＥを算出しても良い。さらに、比ＲＡＴＥや直線の傾きを求めるのに使う周波数特徴としてはＬＰＣスペクトル、群遅延スペクトル、ＬＰＣケプストラム、ケプストラム、自己相関関数、相互相関関数など、他の公知の周波数特徴を用いることができることは言うまでもない。
【００６５】
また、本実施形態では、歌唱者の歌声から抽出したピッチとガイドメロディとを比較してその類似度より得点を算出する例を示した。しかし、これに限らずガイドメロディを参照しない採点システムを構築することも可能である。例えば、歌唱者の歌声から抽出したピッチと当該ピッチの最近傍にある平均率音階上（または純正率音階上）の音程との最小距離を算出し、当該最小距離が小さいほど高い得点を算出する採点アルゴリズムを搭載した採点システムとしても良い。また、人の歌声に含まれる倍音の量を測定し、倍音が多いほど高い得点を算出する採点システムを構築しても良い。また、ガイドメロディと調和音の関係にある音程（不協和音にならない音程）を推定し、歌唱者の歌声が調和音と一致したときに高得点を加算するアルゴリズムを採用しても良い。
【産業上の利用可能性】
【００６６】
本発明は、カラオケ装置に搭載されるカラオケ採点装置、及び歌唱力評価装置に利用することができる。
【図面の簡単な説明】
【００６７】
【図１】本発明の第一実施形態におけるカラオケ装置の外観である。
【図２】本発明の第一実施形態におけるカラオケ装置のブロック図である。
【図３】ＲＡＭ９に確保される記憶領域を示す図である。
【図４】同カラオケ装置の採点処理部の動作を示すフローチャートである。
【図５】本発明の実施形態における得点算出手順を示すブロック図である。
【図６】ダイナミックマイクの周波数特性を示す図である。
【図７】ダイナミックマイクの周波数特性により引き起こされる現象を具体的に説明した図である。
【図８】カラオケでマイクに回り込む伴奏情報の性質について説明した図である。
【図９】女性が歌う８８０［Ｈｚ］の歌声から算出した自己相関関数（ローカルピーク１６個）を示した図である。
【図１０】伴奏情報から算出した自己相関関数を示した図である。
【図１１】歌声から抽出したＦＦＴスペクトルと伴奏から抽出したＦＦＴスペクトルを示す図である。
【図１２】歌声から算出したスペクトルの傾きとマイクに回り込んだ伴奏から算出したスペクトルの傾きを比較した図である。
【図１３】カラオケ採点における伴奏の回り込みを説明する図である。
【符号の説明】
【００６８】
１カラオケ装置
２マイク
３ディスプレイ
４ＡＭＰ
５スピーカ
６ビデオコントローラ
７ミキサ（エフェクタ）
８演奏装置
９ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）
１２採点処理部（採点ＤＳＰ）
１３ピッチ抽出部
１４ビブラート検出部
１５得点算出部
１６操作部
１７Ａ／Ｄ変換部
１８ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）
１９ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）
２１伴奏・歌声判定部
１５１信頼性算出モジュール
１５２瞬時得点算出モジュール
１５３得点累積モジュール

【特許請求の範囲】
【請求項１】
コンピュータに、
音声信号入力手段から入力された入力音声信号に周波数分析を行いスペクトルを算出させるスペクトル算出ステップと、
当該スペクトル算出ステップを実行して得られたスペクトルをスペクトル記憶手段に記憶するスペクトル記憶ステップと、
前記スペクトル記憶手段より読み出されたスペクトルのエネルギーが高周波数帯域に集中していることが検出されたときに入力音声信号は伴奏情報であると判定する伴奏・歌声判定ステップとを実行させることを特徴とする歌唱力評価方法。
【請求項２】
前記伴奏・歌声判定ステップでは、
前記スペクトル記憶手段より読み出されたスペクトルからピッチを算出させ、
当該ピッチが一定しきい値より高いときに入力音声信号は伴奏情報であると判定することを特徴とする請求項１に記載の歌唱力評価方法。
【請求項３】
前記伴奏・歌声判定ステップでは、
前記スペクトル記憶手段より読み出されたスペクトルからスペクトルの傾きを算出させ、
算出されたスペクトルの傾きが一定しきい値より大きいときに入力音声信号は伴奏情報であると判定することを特徴とする請求項１に記載の歌唱力評価方法。
【請求項４】
請求項１乃至３の何れかに記載の歌唱力評価方法であって、
前記伴奏・歌声判定ステップでは、さらに前記スペクトル記憶手段より読み出されたスペクトルから、スペクトルに含まれる倍音の量を測定し、
当該倍音の量が一定しきい値より多いときに入力音声信号は伴奏情報であると判定することを特徴とする歌唱力評価方法。
【請求項５】
請求項１乃至３の何れかに記載の歌唱力評価方法であって、
前記伴奏・歌声判定ステップでは、さらに前記スペクトル記憶手段より読み出されたスペクトルから、スペクトルに含まれる極値の数を数え、
当該極値の数が一定しきい値より多いときに入力音声信号は伴奏情報であると判定することを特徴とする歌唱力評価方法。
【請求項６】
音声信号入力手段から入力された入力音声信号に周波数分析を行いスペクトルを算出するスペクトル算出手段と、
当該スペクトル算出手段により得られたスペクトルを記憶するスペクトル記憶手段と、
前記スペクトル記憶手段により読み出されたスペクトルのエネルギーが高周波数帯域に集中していることが検出されたときに入力音声信号は伴奏情報であると判定する伴奏・歌声判定手段とを備えたことを特徴とする歌唱力評価機能を搭載したカラオケ装置。
【請求項７】
前記伴奏・歌声判定手段は、
前記スペクトル記憶手段により読み出されたスペクトルからピッチを算出し、
当該ピッチが一定しきい値より高いときに入力音声信号は伴奏情報であると判定することを特徴とする請求項６に記載の歌唱力評価機能を搭載したカラオケ装置。
【請求項８】
前記伴奏・歌声判定手段は、
前記スペクトル記憶手段により読み出されたスペクトルからスペクトルの傾きを算出し、
算出されたスペクトルの傾きが一定しきい値より大きいときに入力音声信号は伴奏情報であると判定することを特徴とする請求項６に記載の歌唱力評価機能を搭載したカラオケ装置。
【請求項９】
請求項６乃至８の何れかに記載のカラオケ装置であって、
前記伴奏・歌声判定手段は、さらに前記スペクトル記憶手段により読み出されたスペクトルから、スペクトルに含まれる倍音の量を測定し、
当該倍音の量が一定しきい値より多いときに入力音声信号は伴奏情報であると判定することを特徴とする歌唱力評価機能を搭載したカラオケ装置。
【請求項１０】
請求項６乃至８の何れかに記載のカラオケ装置であって、
前記伴奏・歌声判定手段は、さらに前記スペクトル記憶手段により読み出されたスペクトルから、スペクトルに含まれる極値の数を数え、
当該極値の数が一定しきい値より多いときに入力音声信号は伴奏情報であると判定することを特徴とする歌唱力評価機能を搭載したカラオケ装置。

【図１】