説明

カラオケ装置

【課題】 歌唱者による歌唱表現を損なわないように、その音声の補正を行えるカラオケ装置を提供する。
【解決手段】 カラオケ・シーケンサ部301は、ストレージ・デバイス20に格納された曲データを処理することにより、楽曲の自動演奏、及び歌詞の表示を行う。音程補正部304は、ADC10から入力した音声データの音高である原音高を検出し、その音高を補正した補正音声データを出力する。MIX比制御部305は、シーケンサ部301から入力するメロディのMIDIデータから、発音させるべき音声の基準音高を特定し、その基準音高が、定めた音高範囲外であり、且つ音高範囲から見て、原音高が基準音高の外側にすれていれば、それらの間の音高差に応じたMIX比をミキサ306に設定して、ADC10からの音声データを補正音声データとを混合させる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、歌唱者が歌唱するための楽曲の自動演奏が可能なカラオケ装置に関する。
【背景技術】
【0002】
カラオケは、手軽に楽しめる娯楽として広く楽しまれている。カラオケ装置は、そのカラオケを行うためのものであり、通常、選択された楽曲の自動演奏の実行や歌詞の表示等を行えるようになっている。
【0003】
カラオケを楽しむ人の歌唱力は様々である。このことから、従来のカラオケ装置のなかには、上手に歌えない人を主に対象にして、その人が歌唱することで入力された音声信号の音高を適切な音高に補正し、その補正によって得られた補正音声信号を出力できるようにしたものがある。そのような補正音声信号を出力することにより、より上手に歌唱していると聞こえるようにすることができる。
【0004】
そのようなカラオケ装置としては、例えば特許文献1に記載されたものがある。それに記載された従来のカラオケ装置では、入力された音声信号の音高(実音高)と、自動演奏から特定される基準音高(自動演奏される主旋律の音高)との間の音高差から、音声信号と補正音声信号の混合比を決定し、その混合比でそれらを混合させることで得られた混合音声信号を出力するようになっている。そのように混合比を決定することにより、上手に歌えた箇所、下手に唄った箇所を認識できるようにしつつ、より上手に歌唱していると聞こえるようにしている。
【0005】
補正音声信号のみ、或いは混合音声信号を出力することにより、歌唱者が正確な音高で歌唱してようになる。しかし、楽曲を歌唱する場合、感情を込めて歌うことにより、基準音高から外れた音高で音声を発音させることも多いのが実情である。例えばグライドやビブラートといった音響効果を付加するような形の歌唱表現で歌唱することも多い。そのような形で行う歌唱では、音声の補正によって、出力される音声が単調な感じになってしまうことになる。このようなことから、音声の補正、つまり補正音声信号の出力は、歌唱者による歌唱表現を損なわないように行うことも重要と考えられる。
【特許文献1】特開平11−65579号公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
本発明の課題は、歌唱者による歌唱表現を損なわないように、その音声の補正を行えるカラオケ装置を提供することにある。
【課題を解決するための手段】
【0007】
本発明の第1、及び第2の態様のカラオケ装置は共に、歌唱者が歌唱するための楽曲の自動演奏が可能なことを前提とし、それぞれ以下の手段を具備する。
第1の態様のカラオケ装置は、歌唱により歌唱者が発音させた音声の音声信号を入力するための音声入力手段と、音声入力手段により入力した音声信号の音高を補正した補正音声信号を生成する音声生成手段と、自動演奏から特定される基準音高が定めた音高範囲外か否か判定する音高判定手段と、基準音高が音高範囲外と音高判定手段が判定した場合に、音声生成手段が生成した補正音声信号を出力させる音声出力制御手段と、を具備する。
【0008】
なお、上記第1の構成のカラオケ装置では、音声信号と補正音声信号の混合が可能な音声混合手段、を備え、上記音声出力制御手段は、音声信号の音高が、基準音高と音高範囲の間に存在した場合にのみ、音声混合手段により該音声信号と変更音声信号を混合させて、該変更音声信号を出力させる、ことが望ましい。
【0009】
第2の態様のカラオケ装置は、歌唱により歌唱者が発音させた音声の音声信号を入力するための音声入力手段と、音声入力手段により入力した音声信号の音高を補正した補正音声信号を生成する音声生成手段と、自動演奏から特定される基準音高、及び該基準音高と音声信号の音高との間の音高差を基に、補正音声信号を出力させる音声出力制御手段と、を具備する。
【発明の効果】
【0010】
本発明は、自動演奏から特定される基準音高が、定めた音高範囲外か否か判定を行い、その基準音高が音高範囲外と判定した場合に、歌唱により歌唱者が発音させた音声の音声信号の音高を補正して生成される補正音声信号を出力させる。そのようにして、例えば自動演奏から特定される基準音高、及びその基準音高と音声信号の音高との間の音高差を基に、補正音声信号を出力させる条件を限定する。このため、その条件の限定により、補正音声信号の出力が望ましくない状況下(例えば歌唱表現が容易に行える音域での歌唱)での出力を回避させることができる。この結果、歌唱者による歌唱表現を損なわないように、その音声の補正を行えるようになる。
【発明を実施するための最良の形態】
【0011】
以下、本発明の実施の形態について、図面を参照しながら詳細に説明する。
図1は、本実施の形態によるカラオケ装置の構成を説明する図である。
その楽音発生装置は、図1に示すように、マイクMから出力された音声信号をA/D変換するADコンバータ(以下「ADC」)10と、カラオケ用の曲データを記憶したストレージ・デバイス20と、ADC10から入力した、デジタル化された音声信号(音声データ)を対象とする音声処理や、その曲データを処理することによる自動演奏や映像出力を行う音声処理部30と、その音声処理部30から出力された音声データをD/A変換してアナログのオーディオ(Audio)信号を出力するDAコンバータ(DAC)40と、その音声処理部30から出力されたビデオ(映像)データをエンコードしてビデオ信号を出力するビデオ(Video)エンコーダ50と、を備えた構成となっている。
【0012】
オーディオ信号は、搭載、或いは接続されたスピーカに入力される。それにより、自動演奏による楽音、或いは音声が出力される。ビデオ信号は、搭載、或いは接続された表示装置に入力される。それにより、選曲された楽曲の歌詞が少なくとも表示される。
【0013】
音声処理部30は、カラオケ・シーケンサ部301、音源システム302、ビデオシステム303、音程補正部304、MIX(混合)比制御部305、及び2つのミキサ(Mixer)306、及び307を備えた構成となっている。それにより、以下のような処理を行う。
【0014】
ストレージ・デバイス20に格納された曲データは、例えば自動演奏用の自動演奏データ、及び歌詞データを少なくとも含むものである。カラオケ・シーケンサ部301は、ユーザーが選曲した楽曲に対応する曲データをストレージ・デバイス20から読み出し、それを構成する自動演奏データによる自動演奏を行い、歌詞の表示を行う。そのストレージ・デバイス20は、例えばハードディスク装置、フラッシュメモリ、或いはDVDなどの光ディスクにアクセス可能な装置である。
【0015】
その自動演奏データは、例えばスタンダードMIDIファイル(SMF)の形で格納されたものである。その場合の自動演奏は、SMFを構成するMIDIデータをそれに付加された時間データに従って順次、処理していくことで行われる。音源システム302がMIDIデータを処理して発音させるべき楽音の波形データを生成するものであった場合、カラオケ・シーケンサ部301は、例えばその時間データから処理すべきタイミングと判定したMIDIデータを音源システム302に出力する。それにより、発音させるべき楽音の波形データを音源システム302に生成させる。その音源システム302が生成した波形データはミキサ(Mixer)307に出力される。そのミキサ307は、例えば予め定められたMIX比で、音源システム302から入力した波形データと、ミキサ306から入力した音声データとを混合して出力する。
【0016】
ストレージ・デバイス20には、歌詞の背景として表示させる動画データが複数、格納されている。カラオケ・シーケンサ部301は、例えば選曲された楽曲に対応する動画データを併せて読み出し、それを歌詞データと共にビデオシステム303に出力する。その出力は、自動演奏の進行に合わせる形で行う。
【0017】
ビデオシステム303は、カラオケ・シーケンサ部301から入力した動画データから表示用のイメージデータを生成し、そのイメージデータ上に、歌詞データから生成した歌詞表示用のイメージデータを重ねる形で合成する。そのような合成を行って得られるイメージデータをビデオデータとしてビデオエンコーダ50に出力することにより、自動演奏の進行に合わせて、歌詞(カラオケ字幕)が動画と共に表示される。
【0018】
周知のように、MIDIデータはチャンネル毎に用意される。カラオケ・シーケンサ部301は、主旋律(メロディ)に対応するチャンネルのMIDIデータは、処理すべきタイミングとなると、音源システム302の他に、音程補正部、及びMIX(混合)比制御部305に出力する。そのMIDIデータによって発音が指示される楽音の音高は、歌唱者が発音させるべき音声の音高として基準となる基準音高として扱われる。
【0019】
ADC10から出力された音声データ(以降「原音声データ」)は、ミキサ(Mixer)306、及び音程補正部304にそれぞれ入力される。音程補正部304は、入力された原音声データの音高(原音高)を検出し、その音高が基準音高となるように原音声データを補正し、その補正によって得られた音声データ(補正音声データ)をミキサ306に出力する。また、検出した原音高はMIX比制御部305に通知する。
【0020】
上述したように、ミキサ306には原音声データ、及び補正音声データが入力される。MIX比制御部305は、それらのMIX比を設定し、設定したMIX比でミキサ306に混合を行わせる。そのMIX比の設定は、以下のようにして行う。原音声データ、及び補正音声データによりそれぞれ発音される音声については以降、原音、補正音と呼ぶことにする。
【0021】
MIX比制御部305は、歌唱者が発音可能とする音高範囲を自動的、或いはユーザーの指示により設定する。自動的な設定は、過去に歌唱した際に検出された音高から行い、ユーザーの指示による設定は、ユーザーに下限、上限の各音高を指定させることで行う。それにより、音高範囲を考慮したMIX比の設定を行っている。そのMIX比は、ここでは全体を100として、原音:補正音で表現する。その前提により、原音声データのみを出力させる場合、MIX比は100:0となる。
【0022】
設定した音高範囲は、基本的に歌唱者が歌唱可能な音域とすべきものである。そのような音域では、歌唱者は所望の歌唱表現を必要に応じて行うことができる。これは、原音高と基準音高との間の差があったとしても、その差を意図して生じさせた可能性があることを意味する。これに対し、歌唱が不可能、或いは困難な音域では、所望の歌唱表現を行う余裕はかなり小さいと思われる。たとえ歌唱表現を行おうとしても、意図したような形では行えないことが多いと思われる。このようなことから、基準音高が設定した音高範囲内であれば、MIX比は100:0に固定とし、その範囲外でのみ、それ以外のMIX比を設定するようにしている。それにより、意図した歌唱表現を損なうようなことは確実に回避させるようにしている。
【0023】
設定した音高範囲外の音高の音声を歌唱者が発音させる可能性は存在する。上手な歌唱により偶然、発音できたようなことも考えられるが、歌唱力の向上によって、そのような音高の音声を発音できるようになることも考えられる。このことから、発音させた音声の音高が、音高範囲と基準音高の間であれば、基準音高で音声を発音させることが困難なためと考えられるが、そうでなければ、つまり音高範囲を超えた基準音高の更に外側に位置するのであれば(音高範囲の高音側に位置する基準音高ではより高い音高、音高範囲の低音側に位置する基準音高ではより低い音高)、たとえ一時的であったとしても、歌唱者の音域がより広がったと考えることもできる。歌唱者の音域がより広がったのであれば、基準音高が音高領域外であっても、所望の歌唱表現を適切に行った結果として、音高が基準音高の外側に位置した可能性がある。このようなことから、音高が基準音高の外側に位置している場合には、MIX比は100:0として、補正音声データは出力させないようにしている。それにより、基準音高が音高範囲外であっても、意図した歌唱表現を損なうようなことは確実に回避させるようにしている。
【0024】
図3は、原音高と基準音高の音高差によって設定されるMIX比を説明する図である。図3に示すようにMIX比制御部305は、その音高差が0セントのときにはMIX比として100:0を設定し、以下同様に、音高差が51セントのときには75:25、音高差が101セントのときには50:50、音高差が151セントのときには25:75、及び音高差が201セントのときには0:100、をそれぞれ設定するようにしている。図3に示すような音高差とMIX比の関係は例えばテーブルとして格納されているか、或いは取得するようにしている。それにより、それら以外の音高差のときには補間によりMIX比を求め、設定するようにしている。そのようにMIX比を音高差によって変化させることにより、実際に発音された音声からその音高差を認識できるようにさせている。
【0025】
上記音声処理部30を構成するカラオケ・シーケンサ部301、MIX比制御部305、ミキサ306、及び307は、例えばCPUがメモリをワーク用にしてプログラムを実行することで実現される。そのプログラムは、例えばストレージ・デバイス20に格納されたものであり、MIX比制御部305は、そのプログラムを構成するサブ・プログラムを実行することで実現される。図2は、そのサブ・プログラムの実行により実現されるMIX比制御処理のフローチャートである。以降は、図2を参照して、MIX比制御部305を実現させるために実行されるMIX比制御処理について詳細に説明する。そのMIX比制御処理は、例えば原音声データのサンプリング間隔で実行される。
【0026】
先ず、ステップSB1では、対象となる基準音高(図中「対象音階」と表記)が存在するか否か判定する。カラオケ・シーケンサ部301から入力したMIDIデータにより発音中の楽音(メロディを構成する楽音)が存在する場合、判定はYESとなってステップSB2に移行する。そうでない場合には、判定はNOとなってステップSB16に移行し、音程補正部304から通知された原音高により特定した原音高を示す値(図中「音程評価値」と表記。以降、その表記を用いる)、その特定用に通知を取り込んだ回数である取込み回数をそれぞれクリアした後、一連の処理を終了する。音程評価値、及び取込み回数は共に、それ用の変数に代入される値である。取込み回数による原音高を複数回、取込むのは、実際に検出される原音高に含まれる誤差等の影響を軽減するためである。
【0027】
ステップSB2では、音程補正部304から通知される原音高を取込む。次のステップSB3では、取込み回数をインクリメントする。その次に移行するステップSB4では、対象となる基準音高が上限音高以上か否か判定する。基準音高が、定めた音高領域の上限となる音高(上限音高)以上であった場合、判定はYESとなってステップSB5に移行し、そうでない場合には、判定はNOとなってステップSB10に移行する。
【0028】
ステップSB5では、音程補正部304から通知された原音高を所定回数分、取込んだか否か判定する。上記取込み回数が所定回数以上の値であった場合、判定はYESとなってステップSB6に移行する。そうでない場合には、判定はNOとなり、ここで一連の処理を終了する。
【0029】
ステップSB6では、所定回数分の原音高から音程評価値を求める。それは、その平均を求めることで行う。続くステップSB7では、音程評価値と基準音高のずれ(音高差)がフラット方向か否か判定する。そのずれがフラット方向、即ち音程評価値が基準音高から低音側に位置していた場合、判定はYESとなり、ステップSB8で音高差に応じてMIX比を決定(設定)し(図3)、更にステップSB9で音程評価値、及び取込み回数をそれぞれクリアした後、一連の処理を終了する。
【0030】
このようにして、基準音高が音高範囲の高音側に位置する場合には、原音高が基準音高以下の音高となっていることを条件にして、それらの間の音高差に応じて原音声データと補正音声データの混合をミキサ305により行うようにしている。それにより、歌唱表現を確実に損なわせないようにしつつ、歌唱者が発音できないような高音の音声の発音を支援するようにしている。
【0031】
上記ステップSB4の判定がNOとなって移行するステップSB10では、対象となる基準音高が下限音高以下か否か判定する。基準音高が、定めた音高領域の下限となる音高(下限音高)以下であった場合、判定はYESとなってステップSB11に移行し、そうでない場合には、判定はNOとなって上記ステップSB16に移行する。
【0032】
ステップSB11〜SB15では、基準音高が音高範囲の低音側に位置する場合を想定して、原音高が基準音高以上の音高となっていることを条件に、即ち音程評価値と基準音高のずれ(音高差)がシャープ方向となっていることを条件に、それらの間の音高差に応じて原音声データと補正音声データの混合をミキサ305により行わせるための処理が行われる。それにより、歌唱表現を確実に損なわせないようにしつつ、歌唱者が発音できないような低音の音声の発音を支援するようにしている。各ステップで実行される処理の内容、及びその流れは、想定するケースが異なることによる相違がある以外、基本的に上記ステップSB5〜SB9と同じであるため、詳細な説明は省略する。
【0033】
なお、本実施の形態では、音高範囲の設定は上限、下限の両方で行うようにしているが、そのうちの一方のみを設定するようにしても良い。また、MIX比は基準音高と原音高の音高差に応じて変化させるようにしているが、固定(一定)としても良い。MIX比の決定には様々な方法を採用することができる。
【0034】
音高範囲に加えて、基準音高と原音高の音高差を考慮することにより、補正音声データを出力させるためのMIX比の設定は、基準音高、及びその基準音高と原音高の間の音高差(基準音高を基準としてその音高差が発生している方向)に応じて制御する形となっている。そのような制御は、例えば楽曲のメロディを構成する楽音から特定される音高範囲のなかに1つ以上の下位の音高範囲を設定し、下位の音高範囲毎に行うようにしても良い。
【0035】
基準音高、原音高の他に音高範囲を考慮してMIX比を決定(設定)するMIX比制御部305は、図2に示すMIX比制御処理を実現させるようなプログラム(サブ・プログラム)をCPUに実行させることで得ることができる。そのようなMIX比制御部305を搭載させることにより、従来のカラオケ装置に本発明を適用させることが可能である。このことから、そのようなプログラムは、CD−ROM、DVD、或いは着脱自在なフラッシュメモリ等の記録媒体に記録させて配布しても良い。公衆網等の通信ネットワークを介して、そのプログラムの一部、若しくは全部を配信するようにしても良い。それにより、記録媒体は、プログラムを配信する装置がアクセスできるものであっても良い。
【図面の簡単な説明】
【0036】
【図1】本実施の形態によるカラオケ装置の構成を説明する図である。
【図2】MIX比制御処理のフローチャートである。
【図3】原音高と基準音高の音高差によって設定されるMIX比を説明する図である。
【符号の説明】
【0037】
10 ADC
20 ストレージ・デバイス
30 音声処理部
40 DAC
50 ビデオエンコーダ
301 カラオケ・シーケンサ部
302 音源システム
303 ビデオシステム
304 音程補正部
305 MIX比制御部
306、307 ミキサ
M マイク

【特許請求の範囲】
【請求項1】
歌唱者が歌唱するための楽曲の自動演奏が可能なカラオケ装置において、
前記歌唱により歌唱者が発音させた音声の音声信号を入力するための音声入力手段と、
前記音声入力手段により入力した音声信号の音高を補正した補正音声信号を生成する音声生成手段と、
前記自動演奏から特定される基準音高が定めた音高範囲外か否か判定する音高判定手段と、
前記基準音高が前記音高範囲外と前記音高判定手段が判定した場合に、前記音声生成手段が生成した補正音声信号を出力させる音声出力制御手段と、
を具備することを特徴とするカラオケ装置。
【請求項2】
前記音声信号と前記補正音声信号の混合が可能な音声混合手段、を備え、
前記音声出力制御手段は、前記音声信号の音高が、前記基準音高と前記音高範囲の間に存在した場合にのみ、前記音声混合手段により該音声信号と前記変更音声信号を混合させて、該変更音声信号を出力させる、
ことを特徴とする請求項1記載のカラオケ装置。
【請求項3】
歌唱者が歌唱するための楽曲の自動演奏が可能なカラオケ装置において、
前記歌唱により歌唱者が発音させた音声の音声信号を入力するための音声入力手段と、
前記音声入力手段により入力した音声信号の音高を補正した補正音声信号を生成する音声生成手段と、
前記自動演奏から特定される基準音高、及び該基準音高と前記音声信号の音高との間の音高差を基に、前記補正音声信号を出力させる音声出力制御手段と、
を具備することを特徴とするカラオケ装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate