採点機能を有するカラオケ装置

【課題】精度の高い採点が可能なカラオケ装置を実現する。
【解決手段】音高ピッチ情報の取得に悪影響を及ぼす所定の楽器音が発音されていない期間を特定し、特定した期間に取得した音高ピッチ情報に基いて、歌唱者のピッチ周波数を決定する。決定されたピッチ周波数に対応するフィルタを用いて入力された音声をフィルタ処理し、フィルタ処理された入力音声信号を採点する。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、精度の高い採点が可能な採点機能を有するカラオケ装置に関する。
【背景技術】
【０００２】
従来、採点機能を有するカラオケ装置が広く知られている。マイクなどから入力されたカラオケ演奏中の歌唱者の音声を分析し、分析によって得られた特徴量を所定の手法で評価し、数値化して、その数値を採点結果として歌唱者に報知するものである。また、採点処理に用いられる特徴量としては、歌唱音声の音高を抽出した音高ピッチの周波数を特徴量とする情報（音高ピッチ情報）が一般的である。下記特許文献１においては、デュエット曲に対し、男女のパート毎に採点するものが開示されている。また、下記特許文献２においては、男女音声の周波数特性の違いを利用して入力音声の性別を判別するものが開示されている。
【特許文献１】特開平１１−２８２４７８号公報
【特許文献２】特開２００１−５６６９９号公報
【発明の開示】
【発明が解決しようとする課題】
【０００３】
ところで、カラオケ演奏中の入力歌唱音声を分析（採点）する場合、高精度の採点結果を得るためには、入力歌唱音声以外の音響信号を除去することが望ましい。しかしながら、歌唱者のマイクには、歌唱者の歌唱音声のみならず、楽音再生装置から出力されるカラオケ演奏中の楽曲音も一部入力されることになる。
【０００４】
そのため、従来、周波数帯域フィルタなどを利用したフィルタ処理によって上記楽曲音を除去する試みが行われているが、この場合、歌唱者の入力歌唱音声は除去せずに、楽曲音のみを除去するためのフィルタ処理を施す場合、入力歌唱音声には影響を及ぼさないようなフィルタ処理を行うよう留意する必要がある。
【０００５】
このとき、男声と女声とでは歌唱音声の周波数帯域が異なる（一般的に、男声を発する男性の音声は、女声を発する女性の音声よりも低い周波数帯域である。）ため、男声と女声に対して同じフィルタ処理を施すことは、高精度の分析結果を得る観点からは好ましくない。
【０００６】
この点について、ドラム音、女性、男声それぞれの周波数分布について図を用いて説明する。以下説明する図においては、横軸は対数周波数であり、縦軸はデシベルである。図１〜図３は、ドラム音の周波数分布の例を示すものである。ドラム音は、ドン、ドンという打音である。図１では、７０Ｈｚ付近に第１のピークがある。図２では、６０Ｈｚ付近に第１のピークがある。図３では、８０Ｈｚ付近にピークがある。これらの図によれば、一般的に、ドラム音は、１００Ｈｚ以下の帯域に、第１のピークが存在することがわかる。
【０００７】
図４〜図６は、女声の周波数分布の例を示すものである。図４では、３００Ｈｚ付近に第１のピークがある。図５では、４００Ｈｚ付近に第１のピークがある。図６では、５００Ｈｚ付近に第１のピークがある。
【０００８】
図７、図８は、男声の周波数分布の例を示すものである。図７では、８０Ｈｚ付近に第１のピークがある。図８では、１００〜２００Ｈｚの間に第１のピークがある。
【０００９】
これらの図によれば、女声の周波数帯域と男声の周波数帯域とで大きな差があることがわかる。また、低い声の男声の第１のピークは、ドラム音の第１のピークに近いことがわかる。
【００１０】
これらの図が示すとおり、男声に合わせてフィルタ（例えば、ローカットフィルタ）を設定し、そのフィルタをそのまま用いて女声に対しフィルタ処理した場合、ドラム音の帯域が除去できないため、女声の音高ピッチ情報の取得に悪影響を及ぼすことになる。また、女声に合わせてフィルタを設定し、そのフィルタをそのまま男声に対しをフィルタ処理した場合、男声自体にもフィルタ処理が施されてしまい、男声の音高ピッチ情報の取得に悪影響を及ぼす。
【００１１】
また、男声／女声でフィルタを切り替える場合、入力音声が男声であるか女声であるかを判別する必要がある。カラオケ演奏時に歌唱者に性別を選択させることもできるが、このような選択動作は歌唱者に負担を課すことになる。また、男声／女声の判別を装置が自動的に行う場合は、例えばセキュリティシステムに用いられるような精度の高い判別が必要となる。一般的に、精度の高い音声認識技術を、ワンチップＣＰＵ等を用いたカラオケ用採点装置で実行した場合は、認識処理に時間がかかるため、娯楽として用いられるカラオケ装置に採用しがたい面がある。
【００１２】
そこで、本発明は、上記問題点を解消し、歌唱者に何らの負担を課すことなく、楽曲演奏中に男声／女声を正確に、かつ、容易に判別し、男声女声別に適正なフィルタ処理を行うことによって、精度の高い採点処理ができるカラオケ用採点装置の実現を目的とする。
【００１３】
上記目的を達成するため、請求項１に係る発明は、歌唱者音声入力手段、楽曲再生手段、制御手段、記憶手段、採点手段を備えたカラオケ歌唱用採点装置において、上記記憶手段には、ピッチ周波数と周波数帯域フィルタとが関連付けられた関連データと、歌唱者音程情報、楽器音情報、及び、楽曲演奏進行情報とを含んだ楽曲データとが記憶されており、上記制御手段は、前記楽曲データに基く楽曲の演奏中に、上記楽器音情報及び楽曲演奏進行情報に基いて、設定された所定の楽器音が発音されていないかどうかを判断し、前記楽器音が発音されていない期間において上記歌唱者音声入力手段に入力された入力音声から歌唱者のピッチ周波数を特定し、特定されたピッチ周波数及び上記関連データに基いて、周波数帯域フィルタを特定し、特定した周波数帯域フィルタによって上記入力音声をフィルタ処理し、採点手段は、上記歌唱者音程情報を用いて前記フィルタ処理された後の入力音声を採点することを特徴とする。
【００１４】
請求項２に係る発明は、請求項１の採点機能を有するカラオケ装置において、蓄積手段をさらに有し、上記発音されていない期間において取得した上記入力音声の音高ピッチ情報は、上記蓄積手段に記憶され、所定時間分の音高ピッチ情報が蓄積されると平均処理によって上記歌唱者のピッチ周波数を特定することを特徴とする。
【００１５】
請求項３に係る発明は、請求項１または２の採点機能を有するカラオケ装置において、上記楽曲データには、上記所定の楽器音を特定可能にする情報が付されており、上記制御手段は、上記情報に基いて上記所定の楽器音を設定することを特徴とする。
【００１６】
請求項４に係る発明は、請求項１または２の採点機能を有するカラオケ装置において、上記所定の楽器音が予め定められていることを特徴とする。
【００１７】
請求項５に係る発明は、請求項１〜４いずれかの採点機能を有するカラオケ装置において、上記楽曲は、ＭＩＤＩデータを含む楽曲データに基いて演奏され、上記制御手段は、上記所定の楽器音を発音させるための命令が出力されてから一定の時間を、上記所定の楽器音が発音されていないと判断することを特徴とする。
【００１８】
請求項６に係る発明は、請求項４の採点機能を有するカラオケ装置において、上記制御手段は、上記楽曲の演奏開始後所定の時間内に上記一時メモリに所定時間分のピッチが蓄積されなかった場合に、所定の情報を利用者に報知することを特徴とする。
【発明の効果】
【００１９】
請求項１に係る発明によれば、所定の楽器音が発音されていない期間において入力された入力音声に基いて歌唱者のピッチ周波数を特定し、その結果に基いてフィルタを設定し、設定したフィルタを用いてフィルタ処理を行った音声に基いて採点を行うので、音高ピッチ情報の抽出に悪影響を及ぼす楽器を所定の楽器音として設定することにより、精度の高い採点処理を実現することができる。
【００２０】
請求項２に係る発明によれば、さらに、所定時間分の音高ピッチ情報を利用して、歌唱者のピッチ周波数を特定するので、特定したピッチ周波数の精度を高めることができる。
【００２１】
請求項３に係る発明によれば、さらに、上記所定の楽器音を特定可能にする情報が楽曲データに付されているから、楽曲ごとに、音高ピッチ情報の取得に悪影響を及ぼす楽器音を特定することが可能となるため、音高ピッチ情報の取得のための適切な区間を決定することできる。
【００２２】
請求項４に係る発明によれば、さらに、上記所定の楽器音が予め定められているから、既存の楽曲データを利用して精度の高い採点処理を行うことができる。
【００２３】
請求項５に係る発明によれば、さらに、上記所定の楽器音を発音させるための命令が出力されてから一定の時間を上記所定の楽器音が発音されていない期間と判断するので、上記所定の楽器音を発音させるための命令が出力されたタイミングを利用した簡易な処理で上記所定の楽器音が発音されていない期間を決定することができる。
【００２４】
請求項６に係る発明によれば、さらに、楽曲の演奏開始後所定の時間内に所定時間分のピッチが蓄積できなかった場合にその旨を報知するので、男声／女声判別が正しく行われたか否かを演奏中の早い段階で歌唱者に報知することができる。
【発明を実施するための最良の形態】
【００２５】
［第１実施形態］
本発明の第１実施形態に係るカラオケ装置について、図面を参照しつつ詳細に説明する。
【００２６】
図９は、カラオケ装置における制御装置の内部構成、及び、その周辺機器を示すブロック図である。
【００２７】
制御装置１０は、通信回線を介してホストコンピュータ（図示せず）に接続されており、通信回線を介して楽曲データを通信Ｉ／Ｆ１５を介して受信する。受信されたカラオケ曲データは、記憶装置１２に記憶される。
【００２８】
ここで、楽曲データには、楽曲の再生用データに加えて、カラオケ曲のタイトルデータ、カラオケ曲に対応する映像データ等が含まれることもある。
【００２９】
コントローラ１１は、制御装置１０全体の制御を行う。また、種々のプログラムを実行する。
記憶装置１２は、楽曲データ等を記憶する。また、記憶装置１２は、動的記憶媒体（ＨＤＤ等）で構成される。また、必要に応じて静的記憶媒体で構成してもよい。
【００３０】
操作パネル１３は、操作者が選曲番号等の各種情報を入力するために用いられる。また、リモコン１３ａを介して各種の情報を入力してもよい。
【００３１】
ＲＡＭ１４は、種々の制御に必要な情報が記憶される一時記憶メモリである。ＲＡＭ１４は、マルチスレッドプロセスにおいては、共有メモリとして機能する。なお、本発明における共有メモリとしての使用方法については、後述する。
【００３２】
通信Ｉ／Ｆ１５は、図示しないホストコンピュータとの通信を、通信回線を介して行う。ここで、通信回線は、有線無線を問わない。
【００３３】
採点回路１６は、マイク１７より入力された音声の採点を行う。また、本実施形態においては、採点の対象となる音声は、後述するフィルタ処理が施されている。なお、図９においては、マイクの数は２つであるが、マイクの数はいくつでもよい。なお、図９においては、コントローラ１１と採点回路１６を別個の構成として図示しているが、コントローラ１１が、フィルタ処理及び採点処理を行ってもよい。また、フィルタ処理を別の回路が行ってもよい。
【００３４】
音源１８は、アンプ１９に接続されている。楽曲データは、音源１８を介して音声信号に変換され、アンプ１９で増幅された後、スピーカ２０によって音声出力される。なお、本実施形態においては、音源１８は、ＭＩＤＩ音源である。また、アンプ１９は、マイク１７より入力された音声についても増幅する。
【００３５】
映像制御回路２１は、モニタ２２に接続されている。記憶装置１２または通信回線より取得した映像データと、楽曲データに含まれた歌詞情報とを、映像制御回路２１を介して楽曲のカラオケ再生時の背景映像と歌詞として、モニタ２２に表示する。また、映像データが、符号化されている場合は、復号処理を映像制御回路２１で行ってもよい。
【００３６】
なお、上述した内部構成は、本発明の説明に必要なものを主に記載したものであり、上述した構成以外にも、種々の回路や要素が含まれることはもちろんである。
【００３７】
なお、本実施形態におけるカラオケ装置の外観は、本発明において何ら限定されるものではない。また、本発明においては、上述したカラオケ装置の内部構成として示した一部の要素を、外部に備えてよい。一部の構成要素の機能を、ネットワークに接続されたサーバで実現することも可能である。
【００３８】
本実施形態で用いる楽曲データは、楽器音情報、楽曲演奏進行情報、歌唱者音程情報等を有するものである。代表的なものとしてＭＩＤＩデータを挙げることができるが、本発明は、ＭＩＤＩデータに限定されるものではなく、本発明を実施可能な限度においてその他のデータであってもよい。また、ＭＩＤＩデータにおいては、チャネル番号によって楽器音が指定され、楽器音の発音のオン／オフは、例えば、ノートオン／ノートオフ信号で制御される。また、歌唱者音程情報は、ボーカルトラックのノートナンバを用いることができる。
【００３９】
図１０は、共有メモリの内部構成を示す図である。この図が示すとおり、共有メモリには、所定の楽器音（楽器トラック）におけるノートオン信号が出力された時刻が記憶される領域と、ボーカルトラックのノートナンバが記憶される領域とからなる。なお、図１０は、所定の楽器音としてドラム音源を指定した場合の共有メモリの内容を示している。
【００４０】
次に、本実施形態におけるカラオケ装置の処理の流れについて図を参照しつつ説明する。図１１は、本実施形態におけるカラオケ装置の採点用プロセスのフローチャートであり、図１２は、本実施形態におけるカラオケ装置の演奏用プロセスのフローチャートである。ここで、採点用プロセスと演奏用プロセスとは、マルチスレッドとして処理される。すなわち、上記両プロセスは、並列で処理される。マルチスレッド処理については公知であるので説明を省略する。
【００４１】
上記両プロセスは、実行中に共有メモリにアクセスすることによって、両プロセス間で情報のやり取りが可能となっている。
【００４２】
［採点用プロセス］
まず、採点用プロセスについて図１１を参照にしつつ説明する。楽曲の再生がスタートすると、採点用プロセスは実行開始される。
Ｓ１において、取得ピッチ保持エリアを初期化する。取得ピッチ保持エリアは、ＲＡＭ１４内に形成される。
【００４３】
Ｓ２において、ローカットフィルタをオフにする。なお、本実施形態においては、フィルタとしてローカットフィルタを用いる例を説明するが、バンドパスフィルタ等を用いても本発明は実現可能であることはもちろんである。また、フィルタをデジタルフィルタで構成してもよいし、アナログフィルタで構成してもよい。
【００４４】
Ｓ３において、取得ピッチ保持エリア内に音高ピッチ情報がＦＵＬＬになったか否かを判断する。取得ピッチ保持エリアに記憶する音高ピッチ情報の量は適宜設定可能であり、入力音声のピッチ周波数を正確に算出できる量とする。音高情報ピッチ情報がＦＵＬＬになっていないと判断した場合は（Ｓ３：ＮＯ）、Ｓ４に進む。
【００４５】
Ｓ４において、楽曲の演奏が終了したか否かを判別する。演奏が終了したと判断された場合（Ｓ４：ＹＥＳ）は、Ｓ１１に進む。演奏が終了していないと判断された場合（Ｓ４：ＮＯ）は、Ｓ５に進む。
【００４６】
Ｓ５において、演奏開始から一定時間が経過したか否かを判断する。一定時間が経過したと判断した場合は（Ｓ５：ＹＥＳ）、Ｓ１１に進む。この一定時間は、適宜設定可能である。一定時間が経過したとの判断は、音高ピッチ情報が所定時間内に所定量取得できなかったと判断したことを意味する。
【００４７】
Ｓ１１において、楽曲の演奏を終了し、採点ができなかった旨をモニタ２２に表示する。また、Ｓ５及びＳ１１における処理は、必要に応じ省略してもよい。
【００４８】
Ｓ５において、演奏開始から一定時間が経過していない場合は（Ｓ５：ＮＯ）は、Ｓ６に進む。
Ｓ６において、音高ピッチ情報が取得できたか否かを判断する。音高ピッチ情報が取得できないと判断した場合は（Ｓ６：ＮＯ）、Ｓ３に戻る。音高ピッチ情報が取得できたと判断した場合は（Ｓ６：ＹＥＳ）、Ｓ７に進む。なお、音高ピッチ情報の取得の手法については、公知の種々の技術を採用することができる。
【００４９】
Ｓ７において、Ｓ６で取得した音高ピッチ情報の取得タイミングにおける入力音量が所定以上であるか否かを判断する。入力音量が所定以上でない場合は（Ｓ７：ＮＯ）、当該タイミングにおいてマイク１７により音声が入力されていなかったと判断してＳ３に戻る。入力音量が所定以上である場合は（Ｓ７：ＹＥＳ）、Ｓ８に進む。
【００５０】
Ｓ８においては、現在時刻を取得する。この現在時刻は、Ｓ６で取得した音高ピッチ情報を取得した時刻を表すものである。その後、Ｓ９に進み、Ｓ８で取得した時刻と、共有メモリに記憶されている時刻との時間差を算出する。Ｓ８で取得した時刻が、共有メモリに記憶されている時刻を基点として所定時間以上経過していない場合（Ｓ９：ＹＥＳ）は、Ｓ３に戻る。所定時間以上経過している場合は（Ｓ９：ＮＯ）は、Ｓ１０に進む。なお、共有メモリに書き込まれている時刻は、後述する演奏用プロセスにおいて書き込まれた所定の楽器音（本実施形態においてはドラム音源）のノートオン信号が出力された時刻である。
【００５１】
Ｓ９における処理について具体的に説明する。Ｓ９では、ドラム音源が発音されてからの所定時間は、マイク１７に入力された音声にドラム音が含まれていると判断し、当該所定時間内に取得した音高ピッチ情報は、ピッチ算出には用いない。通常の音源は、ノートオン信号によって発音した後は、ノートオフ信号を受信するまで発音が続く。しかしながら、ドラムやパーカッション音源は、ノートオン信号を受信すると同時に発音し、ノートオフ信号の有無に関わらず音色の最後まで達したときに消音される。そのため、上記所定の楽器音として、ドラム音源を指定している場合は、ノートオン信号が出力されてから消音されるまでの時間を所定の時間として管理しておき、上記ノートオン信号が出力されてから上記所定の時間を発音されている区間として判断できるのである。すなわち、ノートオフ信号が出力されたか否かを判断する必要がない。
【００５２】
Ｓ１０においては、Ｓ６で取得した音高ピッチ情報を取得ピッチ保持エリアに書き込む。そして、Ｓ３に戻る。
【００５３】
Ｓ３において、取得ピッチ保持エリアがＦＵＬＬになっていると判断した場合は（Ｓ３：ＹＥＳ）は、Ｓ１２に進む。
Ｓ１２において、取得ピッチ保持エリア内の全データの平均値を算出し、平均ピッチ情報を入力音声のピッチ周波数として取得する。その後、Ｓ１３に進む。
【００５４】
Ｓ１３において、算出したピッチ周波数が、所定ピッチ以下であるか否かを判別する。ピッチ周波数が所定ピッチ以下である場合（Ｓ１３：ＹＥＳ）は、マイク１７に入力された音声は男声であると判断して、Ｓ１４に進む。
Ｓ１４において、ローカットフィルタを男声用に設定する。
【００５５】
ピッチ周波数が所定ピッチ量以下ではない場合（Ｓ１３：ＮＯ）は、マイク１７に入力された音声は女声であると判断して、Ｓ１５に進む。
Ｓ１５において、ローカットフィルタを女声用に設定する。
【００５６】
なお、Ｓ１３〜Ｓ１５の処理においては、マイク１７に入力された音声のピッチ情報を２つのピッチ周波数（男声・女声）に分類し、それぞれのピッチ周波数に対してフィルタを設定したが、ピッチ周波数を３つ以上に分類して、それぞれの周波数に対しフィルタを設定してもよい。また、周波数と設定されるフィルタとの関係は、予めデータテーブルとして有してもよいし、プログラム上で処理（すなわち、ＩＦ／ＴＨＥＮ処理）してもよい。また、男声と判断した場合は、フィルタ処理をしないように構成してもよい。
【００５７】
Ｓ１６において、採点値を初期化する。なお、本実施形態においては、減点法によって処理を行うため、初期値として例えば１０００点を設定できるが、加点法や、その他周知の採点値設定法を適宜適用可能であることはいうまでもない。なお、その場合は、初期値は１０００点ではなく異なる値となることはいうまでもない。また、減点法以外の採点手法を採用する場合は、以下に説明するＳ２２の処理が異なる点はいうまでもない。
【００５８】
Ｓ１７において、楽曲の演奏が終了したか否かを判断する。楽曲の演奏が終了したと場合は（Ｓ１７：ＹＥＳ）、Ｓ１８に進み、採点結果をモニタ２２に表示する。なお、楽曲の演奏中においても、適宜採点結果（途中結果）を表示するよう構成してもよい。楽曲の演奏が終了していない場合は（Ｓ１７：ＮＯ）、Ｓ１９に進む。
【００５９】
Ｓ１９において、音高ピッチ情報を取得できたか否かを判断する。音高ピッチ情報が取得できなかった場合は（Ｓ１９：ＮＯ）、Ｓ１７に戻る。音高ピッチ情報が取得できたと判断した場合は（Ｓ１９：ＹＥＳ）、Ｓ２０に進む。
【００６０】
Ｓ２０において、Ｓ１９で取得した音高ピッチ情報の取得タイミングにおける入力音量が所定以上であるか否かを判断する。入力音量が所定以上でない場合は（Ｓ２０：ＮＯ）、当該タイミングにおいてマイク１７により音声が入力されていなかったと判断してＳ１７に戻る。入力音量が所定以上である場合は（Ｓ２０：ＹＥＳ）、Ｓ２１に進む。
【００６１】
Ｓ２１において、Ｓ１９で取得した音高ピッチ情報と、共有メモリに記憶されているＭＩＤＩデータにおけるボーカルトラックのノートナンバとの差分を算出する。本実施形態においては、ＭＩＤＩデータにおけるボーカルトラックのノートナンバを採点の基準としている。また、ＭＩＤＩデータにおけるボーカルトラックは、歌唱時において、ガイドメロディとしても利用される。共有メモリへの書き込みについては、演奏用プロセスにおいて詳細に説明する。その後、Ｓ２２に進む。
【００６２】
Ｓ２２において、現在の採点値からＳ２１で求めた差分の絶対値を減算する。ここで、マイクから入力された音高ピッチ情報が共有メモリに記憶されているノートナンバが示すピッチ情報と同じであれば、マイク１７から入力された音声信号の音高ピッチ情報は正しいものなので、減算されないことになる。
【００６３】
なお、Ｓ２１及びＳ２２における採点手法においては、歌唱音声がガイドメロディに対して時間方向にずれている場合にも採点値に影響を及ぼす。そこで、所定時間分のガイドメロディ（ボーカルトラック）のノートナンバー（ピッチ情報）を共有メモリに記憶しておき、入力音声における音高ピッチ情報とＤＰマッチング等を利用して採点処理を行うことにより、時間方向のずれが採点値に影響を及ぼすことを低減できる。
【００６４】
［演奏用プロセス］
次に、演奏用プロセスについて図１２を参照しつつ説明する。楽曲の再生がスタートすると、演奏用プロセスは実行開始される。演奏用プロセスでは、楽曲データであるＭＩＤＩデータが有する複数のトラックのうち、ドラムトラック及びボーカルトラックが処理対象となる。そのため、楽曲データに含まれる複数のトラックから、ドラムトラック及びボーカルトラックを特定する必要がある。
【００６５】
Ｓ３１において、取得したトラックのデータがドラムトラックであるか否かを判断する。なお、本実施形態においては、ドラムトラックを音高ピッチ情報の取得に影響を及ぼす所定の楽器音としている。ドラムトラックでない場合は（Ｓ３１：ＮＯ）、他のトラックを処理の対象とするため、当該トラックに対しては処理を行なわず、Ｓ３５に進む。
【００６６】
ドラムトラックである場合は（Ｓ３１：ＹＥＳ）、Ｓ３２に進む。
Ｓ３２において、Ｓ３１で取得したデータにノートオン情報が存在するか否かを判断する。ノートオン指示情報が含まれていない場合は（Ｓ３２：ＮＯ）、ドラム音源の発音開始タイミングではないと判断してＳ３５に進む。
ノートオン指示情報が含まれている場合は（Ｓ３２：ＹＥＳ）、ドラム音源の発音開始タイミングであると判断し、Ｓ３３に進む。
【００６７】
Ｓ３３において、現在時刻を取得する。この現在時刻は、ドラム音源の発音開始時刻を意味するものである。なお、この現在時刻としては、システム起動からの時間を利用することができるが、その他の時刻情報でもよい。その後、Ｓ３４に進む。
【００６８】
Ｓ３４において、Ｓ３３で取得した現在時刻を時刻設定用共有メモリにセットする。この時刻設定用共有メモリの内容は、Ｓ３３で現在時刻が取得される度に更新されるものである。
【００６９】
Ｓ３５において、取得したトラックのデータがボーカルトラックであるか否かを判断する。ボーカルトラックでない場合は（Ｓ３５：ＮＯ）は、他のトラックを処理の対象とするため、当該トラックに対しては処理を行わずＳ４０に進む。
【００７０】
ボーカルトラックである場合は（Ｓ３５：ＹＥＳ）は、Ｓ３５で取得したデータにノートオン指示情報が存在するか否かを判断する。ノートオン指示情報が含まれていない場合は（Ｓ３６：ＮＯ）、ボーカル発声開始タイミングではないと判断してＳ３８に進む。ノートオン情報が含まれている場合は（Ｓ３６：ＹＥＳ）、ボーカル発声開始タイミングであると判断して、Ｓ３７に進む。
【００７１】
Ｓ３７において、ノートナンバをノートナンバ用共有メモリにセットする。この内容は、採点用プロセスにおいて、採点の基準として用いられる。
【００７２】
Ｓ３８において、Ｓ３５で取得したデータにノートオフ指示情報が存在するか否かを判断する。ノートオフ指示情報が含まれていない場合は（Ｓ３８：ＮＯ）、Ｓ４０に進む。ノートオフ指示情報が含まれている場合は（Ｓ３８：ＹＥＳ）、Ｓ３９に進む。
Ｓ３９において、ノートナンバ用共有メモリをクリアする。これにより、ボーカル発声期間のみ、ノートナンバ用共有メモリに情報が記憶されることになる。
【００７３】
Ｓ４０において、ＭＩＤＩデータを音源に送出する。これにより、楽音データに基いて演奏が制御されることになる。
【００７４】
上記処理においては、ドラムトラック及びボーカルトラックに対する処理の後にＭＩＤＩデータを音源に送出するよう構成したが、先にＭＩＤＩデータを音源に送出し、その後ドラムトラック及びボーカルトラックに対する処理を行うよう構成してもよい。
【００７５】
なお、採点用プロセス及び演奏用プロセスとして説明した上記フローチャートは単なる一例であり、上記処理と同等の結果を得ることできる処理であれば、他のフローチャートによって処理を実現してもよい。
【００７６】
次に、上述した採点用プロセス及び演奏用プロセス実行時における、音高ピッチ情報が取得される様子を、図を用いて説明する。
図１３は、ドラムトラックのノートオン、ノートオフのタイミング、システム起動からの時間、取得したピッチ情報の関係を示す。なお、横軸は時間軸である。
【００７７】
図１３においては、ドラム音源の発音開始から、２０ｍｓをピッチ無視時間として、図１１のＳ５における一定時間として設定しているが、この時間間隔は適宜設定可能である。システム時間８００１０（単位であるｍｓは省略する。以下同じ。）の時点でドラム音源がノートオンされたので、８００１０から８００３０までに取得された音高ピッチ情報は破棄される。そのため、ピッチ情報１は、取得ピッチ保持エリアに記憶されることなく破棄される。
【００７８】
また、ピッチ情報２、３は、８００３０以降に取得され、また、次のドラム音源の発音開始前であるので、取得ピッチ保持エリアに書き込まれることになる。以下同様にして、ピッチ情報４、８は破棄され、ピッチ情報５〜７、９〜１１は取得ピッチ保持エリアに書き込まれる。なお、図１３においては、ドラムトラックのノートオフ指示情報は、上述したとおり利用していない。取得ピッチ保持エリアに所定時間分のピッチ情報が蓄積されると、ピッチ周波数が算出されることになる。
【００７９】
上述したとおり、本実施形態においては、演奏開始後、ドラム音源が演奏されていない期間で取得した音高ピッチ情報に基いて男声／女声を判断し、判断した性別に応じたフィルタを設定し、設定されたフィルタを用いて入力音声をフィルタ処理し、フィルタ処理された音声を採点対象とするので、精度の高い採点を行うことができる。また、楽曲の演奏開始が所定時間内に所定量の音高ピッチ情報が取得できなかった場合は、その旨演奏の早い段階で報知することができる。
【００８０】
なお、上記処理においては、共有メモリを利用してメモリ内のボーカルトラックの情報を随時変更していたが、共有メモリを用いることなく処理することもできる。すなわち、採点用プロセスにおいて、直接楽曲データに含まれるボーカルトラックのノートナンバをアクセスするよう構成してもよい。
【００８１】
［第２実施形態］
第１実施形態においては、男声／女声の判断を行い、フィルタが決定されるまでにマイク１７に入力された音声は採点処理の対象としなかったが、この期間の音声信号をバッファ等に蓄えておき、フィルタ決定後にこれら入力音声をフィルタ処理して採点結果に反映させることもできる。
【００８２】
図１４は、バッファに上記期間の入力音声を記憶しておき、フィルタ決定後に用いる処理（以下、「一時記憶用プロセス」という。）のフローチャートを示すものである。
【００８３】
一時記憶用プロセスは、採点用プロセス及び演奏用プロセスと並列して処理される。一時記憶用プロセスは、楽曲の開始がスタートすると実行開始される。
【００８４】
Ｓ５１において、楽曲の演奏が終了したか否かを判断する。楽曲の演奏が終了した場合は（Ｓ５１：ＹＥＳ）、一時記憶用プロセスを終了する。楽曲の演奏が終了していない場合は（Ｓ５１：ＮＯ）、Ｓ５２に進む。
【００８５】
Ｓ５２において、採点用プロセスにおいてフィルタが設定されたか否かを判断する。フィルタが設定された場合は（Ｓ５４：ＹＥＳ）、Ｓ５４に進む。フィルタが設定されていない場合は（Ｓ５４：ＮＯ）、Ｓ５３に進む。
【００８６】
Ｓ５３において、マイク１７に入力された音声信号を、バッファに書き込む。Ｓ５１〜Ｓ５３の処理を繰り返すことにより、採点用プロセスにおいてフィルタが設定されるまでの入力音声は、バッファに書き込まれることになる。
【００８７】
Ｓ５４において、バッファに記憶した入力音声信号を順次読み出す。その後、Ｓ５５に進む。
Ｓ５５において、読み出した入力音声信号に対し採点用プロセスにおいて設定されたフィルタを利用してフィルタ処理を行う。その後、Ｓ５６に進む。
【００８８】
Ｓ５６において、フィルタ処理された音声信号に対し、採点処理を行う。この採点処理自体は、採点用プロセスで行われるものと同じであるので説明を省略する。
なお、Ｓ５４〜Ｓ５６の処理は、互いに並列に行ってもよい。すなわち、バッファから読み出した音声をフィルタ処理している最中に、次の入力音声をバッファから読み出してもよい。
【００８９】
Ｓ５７において、本プロセスで算出した採点値を、採点用プロセスにおける採点結果に反映させる。なお、反映させるタイミングは適宜設定可能である。
【００９０】
上述した本実施形態においては、フィルタが設定されるまでにマイク１７に入力された音声についても採点結果に反映されることができる。なお、上記フローチャートは単なる一例であり、上記処理と同等の結果を得ることできる処理であれば、他のフローチャートによって処理を実現してもよい。
【００９１】
［所定の楽器音の設定において］
上述した第１及び第２実施形態においては、ドラム音源を所定の楽器音としていた。所定の楽器音の設定方法としては、図１５に示すように、楽曲データに所定の楽器音を示すための情報を含ませてもよい。このような構成を採れば、楽曲データ作成時に、楽曲データ作成者側で、予め楽曲ごとに音高ピッチ情報取得に悪影響を及ぼす楽器音を特定することができるので、前記楽曲データを用いたカラオケ用採点装置は、歌唱者に何らの負担を課すことなく、楽曲演奏中の楽器音種類と時間的流れとに応じて、男声／女声を正確に、かつ、容易に判別できるようになり、男声女声別に適正なフィルタ処理を行えるので、楽曲ごとに精度の高い採点ができる。なお、図１５に示す楽曲データのデータ構造は単なる一例である。
【００９２】
例えば、図１５の楽曲データに含まれる除外トラック指定情報を参照することにより、音高ピッチ情報取得に悪影響を及ぼす楽器音（設定する楽器音）のトラックを特定することが可能となる。
【００９３】
ここで、除外トラックとは、どの楽器音が音高ピッチ情報取得に悪影響を及ぼすかを特定するものである。除外トラックにドラムトラックが指定されていれば、図１２（Ｓ３１，Ｓ３２）で示した処理と同様の処理が可能となる。また、例えば、除外トラックにトラックＮｏ．１０が設定されていれば、トラックＮｏ．１０のノートオンタイミングからピッチ無視時間（例えば、２０ｍＳ）内に取得されたピッチ情報は破棄される。この場合、トラックＮｏ．１０に指定されている楽器音を、音高ピッチ情報取得に悪影響を及ぼす楽器音（設定する楽器音）として特定することになる。
【００９４】
また、ＭＩＤＩにおけるプログラム・チェンジコマンドを利用することにより、任意の楽器音のトラックを上記所定の楽器音のトラックとして指定することもできる。ドラム音源を上記所定の楽器音としている場合に、任意の楽器音トラックのＭＩＤＩデータ中に、ドラム音源に切り替えるためのプログラム・チェンジコマンドが挿入されていると、そのプログラム・チェンジコマンド実行後においては、その任意の楽器音のトラックは、ドラムトラックとして機能することになる。これにより、除外トラック指定情報によって上記所定の楽器音を直接指定しなくても、ＭＩＤＩコマンドによって上記所定の楽器音を特定することができる。
【００９５】
また、カラオケ装置において予め所定の楽器音を決定しておいてもよい。この場合は、既存の楽曲データを何ら加工することなく、本発明を実現できる。この場合、楽曲によっては、音高ピッチ情報が正しく取得できないことも想定されるが、上述した採点用プロセスにおいては、楽曲の演奏開始後所定時間内に所定時間分の音高ピッチ情報が取得できなかった旨を報知するので、利用者は、演奏中に採点が正しく行われなかったことを把握することができる。
【００９６】
本発明は上述した実施形態に限定されるものではなく、本発明の要旨を逸脱しない範囲内で種々の改良、変形が可能であることは勿論である。また、上述した処理を実行するためのカラオケ装置における採点方法としても本発明は実現可能である。さらに、当該カラオケ装置における採点方法をコンピュータで実行させるためのプログラム、及び、そのプログラムが記録された記録媒体としても本発明は実現可能である。

【図面の簡単な説明】
【００９７】
【図１】ドラム音源の周波数分布の一例を示した図である。
【図２】ドラム音源の周波数分布の一例を示した図である。
【図３】ドラム音源の周波数分布の一例を示した図である。
【図４】女声の周波数分布の一例を示した図である。
【図５】女声の周波数分布の一例を示した図である。
【図６】女声の周波数分布の一例を示した図である。
【図７】男声の周波数分布の一例を示した図である。
【図８】男声の周波数分布の一例を示した図である。
【図９】本発明の実施形態に係る採点機能を有するカラオケ装置の制御装置の内部構成及びその周辺要素を示した図である。
【図１０】本発明の実施形態に係るカラオケ用装置の共有メモリの内部構造を示した図である。
【図１１】本発明の実施形態に係る採点用プロセスのフローチャートである。
【図１２】本発明の実施形態に係る演奏用プロセスのフローチャートである。
【図１３】本発明における、ドラム音源の発音タイミング、システム起動からの時間、取得された音高ピッチ情報を示したタイミング図である。
【図１４】本発明の第２実施形態に係る一時記憶用プロセスのフローチャートである。
【図１５】本発明における楽曲データの構成の一例を示した図である。
【符号の説明】
【００９８】
１０制御装置
１１コントローラ
１２記憶装置
１３操作パネル
１３ａリモコン
１４ＲＡＭ
１５通信Ｉ／Ｆ
１６採点回路
１７マイク
１８音源
１９アンプ
２０スピーカ
２１映像制御回路
２２モニタ

【特許請求の範囲】
【請求項１】
歌唱者音声入力手段、楽曲再生手段、制御手段、記憶手段、採点手段を備えた採点機能を有するカラオケ装置において、
上記記憶手段には、
ピッチ周波数と周波数帯域フィルタとが関連付けられた関連データと、歌唱者音程情報、楽器音情報、及び、楽曲演奏進行情報とを含んだ楽曲データとが記憶されており、
上記制御手段は、前記楽曲データに基く楽曲の演奏中に、
上記楽器音情報及び楽曲演奏進行情報に基いて、設定された所定の楽器音が発音されていないかどうかを判断し、
上記楽器音が発音されていない期間において上記歌唱者音声入力手段に入力された入力音声から歌唱者のピッチ周波数を特定し、
特定されたピッチ周波数及び上記関連データに基いて、周波数帯域フィルタを特定し、
特定した周波数帯域フィルタによって上記入力音声をフィルタ処理し、
上記採点手段は、上記歌唱者音程情報を用いて前記フィルタ処理された後の入力音声を採点する、
ことを特徴とする採点機能を有するカラオケ装置。
【請求項２】
蓄積手段をさらに有し、
上記発音されていない期間において取得した上記入力音声の音高ピッチ情報は、上記蓄積手段に記憶され、
所定時間分の音高ピッチ情報が蓄積されると平均処理によって上記歌唱者のピッチ周波数を特定する、
ことを特徴とする請求項１の採点機能を有するカラオケ装置。
【請求項３】
上記楽曲データには、上記所定の楽器音を特定可能にする情報が付されており、
上記制御手段は、上記情報に基いて上記所定の楽器音を設定する、
ことを特徴とする請求項１または２の採点機能を有するカラオケ装置。
【請求項４】
上記所定の楽器音が予め定められている、
ことを特徴とする請求項１または２の採点機能を有するカラオケ装置。
【請求項５】
上記楽曲は、ＭＩＤＩデータを含む楽曲データに基いて演奏され、
上記制御手段は、上記所定の楽器音を発音させるための命令が出力されてから一定の時間を、上記所定の楽器音が発音されていない期間と判断する、
ことを特徴とする請求項１〜４いずれかの採点機能を有するカラオケ装置。
【請求項６】
上記制御手段は、上記楽曲の演奏開始後所定の時間内に上記一時メモリに所定時間分のピッチが蓄積されなかった場合に、所定の情報を利用者に報知する、
ことを特徴とする請求項４の採点機能を有するカラオケ装置。

【図１】