説明

オーディオアンプ

【課題】歌唱者の声を歌唱者が希望する声質に変更して出力することができるカラオケアンプを提供する。
【解決手段】歌唱者の声の特徴である声質データを記憶した音声データベース16、歌唱音声信号を所望の声質に加工するためのルールを記憶した声質加工ルールデータベース17、声質加工ルールに基づいて歌唱音声信号を加工する声質加工部24を備える。声質加工部24は、歌唱者の声質データおよび歌唱者が希望する声質の声質加工ルールに基づいて、入力された歌唱音声信号の声質を加工して出力する。

【発明の詳細な説明】
【技術分野】
【0001】
入力された音声信号、特にカラオケの歌唱音声信号の声質を加工できるオーディオアンプに関する。
【背景技術】
【0002】
カラオケ楽曲を再生するカラオケ端末に接続されているカラオケ装置用のオーディオアンプアンプ(カラオケアンプ)は、カラオケ演奏音および歌唱音声信号を増幅し、これらをミキシングして出力する。カラオケアンプは、歌唱音声信号をよい音質で聴かせるために周波数特性を調整するイコライザや残響によって音質を改善するエコー機能等を有している(特許文献1参照)。
【0003】
【特許文献1】特開平10−069281号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
上記のように従来のカラオケアンプは、音響としての音質を調整するためのイコライザやエコー機能等は備えているが、歌唱者が自分の声を望みの声質、たとえば澄んだ声、透りのよい声などに加工するような声質加工機能を備えていなかった。
【0005】
この発明は、歌唱者の声を歌唱者が希望する声質に変更して出力することができるオーディオアンプを提供することを目的とする。
【課題を解決するための手段】
【0006】
請求項1の発明は、歌唱者の歌唱音声信号の特徴である声質データを記憶した音声データベースと、歌唱音声信号を所望の声質に加工するためのルールを記憶した声質加工ルールデータベースと、前記声質加工ルールに基づいて歌唱音声信号を加工する声質加工部と、希望の声質の指定入力を受け付ける声質指定手段と、歌唱者を認証する歌唱者認証手段と、を備え、前記声質加工部は、前記歌唱者認証手段で認証された歌唱者の声質データ、および、前記声質指定手段で指定された声質に加工するための声質加工ルールを読み出し、読み出された歌唱者の声質を前記指定された声質に加工する音声信号処理を実行することを特徴とする。
【0007】
請求項2の発明は、上記発明において、前記音声データベースは、歌唱者を音声で認証するための認証基準データをさらに記憶し、歌唱者認証手段は、入力された音声信号を前記認証基準データと対比することにより歌唱者を認証することを特徴とする。
【0008】
請求項3の発明は、上記発明において、前記音質加工部は、前記歌唱音声信号の周波数成分のうち特定の成分のみを通過させるフィルタ、前記歌唱音声信号に特定の周波数成分を付加するエンハンサの一方または両方を組み合わせて歌唱音声信号の声質を加工することを特徴とする。
【発明の効果】
【0009】
この発明によれば、歌唱者の歌唱音声信号が歌唱者の声質データと声質加工ルールに基づいて加工されるため、歌唱者の声を歌唱者が望む声質に変換して出力し、さもその声質で歌唱しているように聴かせることが可能になる。
【発明を実施するための最良の形態】
【0010】
図1はこの発明の実施形態であるカラオケアンプのブロック図である。カラオケアンプ1は、カラオケ演奏音(伴奏音)を再生するカラオケ端末(不図示)に接続されるアンプであり、カラオケ端末から入力されたカラオケ演奏音およびマイク13から入力される歌唱音声信号をミキシング・増幅してスピーカに出力する装置である。また、このカラオケアンプ1は、ユーザインタフェース部12を備えており、ユーザ(歌唱者)による選曲操作を受け付けて、その選曲情報などをカラオケ端末に送信する。
【0011】
さらに、このカラオケアンプ1は、マイク13から入力された音声信号に基づいて、歌唱者を認証し、その歌唱者の歌唱音声を歌唱者が希望する音質に加工して出力する。こ ため、カラオケアンプ1は、歌唱者をデータベースに登録する登録モード、歌唱者を認証する認証モード、歌唱音声信号を加工して出力する歌唱モードの3つのモードで動作する。
【0012】
カラオケアンプ1は、上記の機能を実現するため、制御部10、音声信号処理部11、ユーザインタフェース部12、マイク13、マイク入力部14、アナログ出力部15、歌唱者データベース16および声質加工ルールデータベース17を備えている。歌唱者データベース16は、歌唱者の声でその歌唱者を認証するための登録認証データおよびその 唱者の声の特徴を示す声質データを記憶している。また、声質加工ルールデータベースは、歌唱音声信号を歌唱者が所望する声質に加工するためのルールを複数の声質について記憶している。なお、歌唱者データベース16は、カラオケアンプ1内部でなく、カラオケ端末、センタ等の外部に設けてもよい。
【0013】
音声信号処理部11は、たとえばDSP等のデジタル信号処理装置を有しており、マイクロプログラムにより、音声分析部21、キーコントロール部22、演奏音イコライザ23、声質加工部24、歌唱音イコライザ25およびミキシング部26が機能的に実現される。
【0014】
ユーザインタフェース部12は、赤外線リモコンを含み、歌唱者からの曲番号の入力等を受け付ける回路である。マイク入力部14は、マイクアンプ、A/Dコンバータ等を含み、マイク13が収音した音声をデジタル音声信号に変換して音声信号処理部11に入力する。マイク入力部14から入力されたデジタル音声信号は、音声信号処理部11において、音声分析部21および声質加工部24に入力される。
【0015】
音声分析部21は、入力された音声信号の特徴を分析する。このカラオケアンプ1に 唱者を登録する登録モードでは、音声分析部21は、歌唱者がマイク13に入力した認証基準音声の特徴量を分析して歌唱者データベース16に認証基準データとして登録する。さらに、登録モードでは、歌唱者がマイク13に入力した声質分析用音声を分析して歌唱者の声域や声の特徴を割り出し、これのデータを声質データとして上記認証基準データと対応づけて歌唱者データベース16に登録する。登録モードの詳細は後述する。
【0016】
また、カラオケアンプ1に歌唱者を認証させる認証モードでは、音声分析部21は、歌唱者がマイク13に入力した認証音声の特徴量を分析し、歌唱者データベース16に先に登録されている認証基準データと対比することによって、どの歌唱者であるか認証する。認証された歌唱者の声質データは声質加工部24に読み出される。
【0017】
声質加工部24は、マイク入力部14から入力された歌唱者の音声信号(歌唱音声信号)の声質を加工して歌唱音イコライザ25に出力する。この声質の加工は声質加工ルールデータベース17に記憶されている声質加工ルールおよび歌唱者データベース16から読み出された歌唱者の声質データに基づいて行われる。この声質の加工の詳細は後述する。
【0018】
声質加工部24で加工された歌唱音声信号は歌唱音イコライザ25に入力される。歌 音イコライザ25は、この歌唱音声信号の音質を調整する。この音質の調整は、歌唱音声の声質の加工ではなく音声信号としての音質(Soft,Brilliant等)の調整である。
【0019】
キーコントロール部22はカラオケ端末から入力されたカラオケ演奏音のキー(調) 歌唱者の声域に合うように変換(移調)する機能部である。移調量は、歌唱者データベース16から読み出された声質データに含まれる歌唱者の声域データとカラオケ曲の歌唱 域データとを対比して決定される。なお、歌唱者がユーザインタフェース部12を介して曲のキーを指定する操作を行った場合、制御部10は、音声信号処理部11に対して、曲のキーを指定されたキーに変更するように指示し、キーコントロール部10は、指示されたキーに曲のキーを変更する。なお、歌唱者が曲のキーを指定した場合、そのキーを歌唱者データベース16に登録しておき、次回、この歌唱者がこのカラオケ曲を選曲した場合には、この登録されたキーにキーコントロールするようにしてもよい。
【0020】
キーコントロール部22でキーが変換されたカラオケ演奏音は演奏音イコライザ23 入力される。演奏音イコライザ23は、カラオケ演奏音の音質を調整する機能部である。歌唱音イコライザ25で音質が調整された歌唱音声信号、演奏音イコライザ23で音質が調整されたカラオケカラオケ演奏音は、ミキシング部26に入力される。ミキシング部26は、これら歌唱音声信号・カラオケ演奏音を適当な比率でミキシングしてアナログ出力部15に出力する。アナログ出力部15は、D/Aコンバータおよび電力増幅回路を含み、音声信号処理部11から入力されたデジタルの音声信号をアナログ信号に変換したのち電力増幅し、スピーカに出力する。
【0021】
ここで、登録モードについて説明する。登録モードは、カラオケアンプ1に歌唱者の声に関するデータを登録する動作モードである。登録モードは、ユーザインタフェース部12の操作等で設定される。登録モードでは、マイク13から2種類の音声が入力される。第1は、歌唱者を認証するための認証基準音声である。この認証基準音声としてはたとえば「カラオケ」というような簡単な単語を用いればよい。第2は、歌唱者の声域を判定するとともに、声の特徴を抽出するための声質判定用音声であり、「ド、レ、ミ、ファ、・・・」等の歌唱者が発声できる最低音から最高音にわたって発声される音声が用いられる。
【0022】
認証基準音声が入力されると、音声分析部21は、その音声を分析して特徴量を抽出し、その分析結果を認証基準データとして歌唱者データベース16に登録する。特徴量としては、たとえば、ケプストラムパラメータ等が用いられる。認証用音声が上記「カラオケ」の4音である場合には各音ごとの4つの特徴量を抽出して記憶すればよい。
【0023】
また、声質判定用音声が入力されると、音声分析部21は、入力された声質判定用音声に基づいて歌唱者の声域を判定するとともに、その声の特徴を抽出する。声の特徴としては、周波数成分の分布であるスペクトラムを用いればよい。これら声域、声の特徴のデータは声質データとして上記認証基準データと対応づけて歌唱者データベース16に登録される。
【0024】
次に認証モードについて説明する。認証モードは、カラオケアンプ1に歌唱者を認証させる動作モードである。認証モードデータは、マイク13から認証音声が入力される。認証音声は、登録モード時に認証基準音声として入力されたものと同じ言葉が入力される。ここでは「カラオケ」の語が入力される。音声分析部21は、入力された認証音声から特徴量データを抽出し、この特徴量データを歌唱者データベース16に蓄積されている認証基準データと対比して、この歌唱者が誰であるかを認証する。
【0025】
歌唱者が認証されると、その歌唱者の声質データが歌唱者データベース16から音声信号処理部11に読み込まれる。音質データのうち声域のデータはキーコントロール部22にセットされ、声の特徴データ(狭義の声質データ)は、声質加工部24にセットされる。
【0026】
ここで、歌唱者は、ユーザインタフェース部12(リモコンを含む)を操作してカラオケ曲を選曲するとともに、希望の声質を選択する。選択可能な声質としては、たとえば 澄んだ声、透りのよい声、男らしい声、・・・声等である。音声加工部24は、選択された希望声質への加工ルールを声質加工ルールデータベース17から読み出し、歌唱者の声質が目標となる希望声質になるように音声加工ルールを調整してフィルタやエンハンサ等を設定する。
【0027】
歌唱者による選曲、声質の選択ののち、制御部10がカラオケ端末に選曲情報を送信 て演奏スタートを指示することにより、カラオケ曲の演奏がスタートする。
【0028】
ここで、図2〜図4を参照して声質加工ルール、声質加工部24の構成例について説明する。
【0029】
図2は澄んだ声に加工するルールと音声加工部24の構成を示す図である。澄んだ声とは、正弦波に近く、基本波に若干の2次倍音が加わった程度のスペクトルを示す波形の声である。そこで、声質を澄んだ声に加工する声質加工ルールは、「入力された歌唱音声 号のうち基本波と2倍倍音を強調し、それ以外の周波数成分を大きく減衰させる。」という内容である。
【0030】
このような声質加工ルールで歌唱音声信号を加工するため、音声加工部24は、同図(A)に示すように構成される。同図(A)において、オリジナルの歌唱音声信号は、アッテネータでレベルを減衰させる。このアッテネータと並行に、基本周波数のみに鋭いピークを有するフィルタ(基本波フィルタ)と2次倍音周波数のみに鋭いピークを有するフィルタ(2次倍音フィルタ)を設け、オリジナルの歌唱音声信号の基本波および2次倍音のみを通過させる。基本波フィルタのピークレベルを0dBとし、2次倍音フィルタのピ クのレベル、アッテネータの減衰レベルは、歌唱者データベース16から読み出された歌唱者の声質の特徴データに基づいて決定する。なお、歌唱音声信号の基本波の周波数(音高)は刻々変化するため、基本周波数検出部がこれを検出し、基本波フィルタ、2次倍音フィルタのピーク周波数を動的に制御する。
【0031】
これらフィルタ、アッテネータの出力信号を合成した音声信号を「加工された歌唱音 信号」として出力する。上記構成によって同図(B)に示すようなフィルタリング特性が実現される。なお、オリジナルの歌唱音声信号に2倍音の成分が含まれていない場合には、その周波数成分を合成して補強する。
【0032】
同図(C)は、入力された歌唱音声信号の周波数特性の例を示す図である。また、同図(D)は、同図(C)の歌唱音声信号を上記構成の音声加工部24で加工した場合の周波数特性の例を示す図である。このように、収音された歌唱音声信号は、同図(C)に示すようにノイズ的な周波数成分を含んだ濁った声質であるが、上記構成の音声加工部24で加工することにより、殆ど基本波成分と2次倍音のみで構成される澄んだ声に加工される。
【0033】
図3は透りのよい声に加工するルールと音声加工部24の構成を示す図である。透りのよい声とは、整数次倍音を適度に含んだ明るい声である。そこで、声質を透りのよい声に加工する声質加工ルールは、「入力された歌唱音声信号のうち基本波,2倍倍音,3倍 音,4倍倍音等の整数次倍音を強調し、それ以外の周波数成分を適度に減衰させる。」という内容である。
【0034】
このような声質加工ルールで歌唱音声信号を加工するため、音声加工部は同図(A)に示すように構成される。同図(A)において、オリジナルの歌唱音声信号は、アッテネータでレベルを減衰させる。このアッテネータと並行に、基本周波数とその整数次倍音にピークを有する櫛形フィルタとこの櫛形フィルタの各ピークレベルを調整するイコライジングフィルタを直列に設ける。また、オリジナルの歌唱音声信号に高次倍音の成分が含まれていない場合には、その周波数成分を合成して補強するエンハンサを設ける。同図の例では、オリジナルの歌唱音声信号に4次倍音が殆ど含まれていないため、4次倍音を補強するエンハンサが設けられている。
【0035】
エンハンサの設定、イコライジングフィルタの濾波特性波形、および、アッテネータ 減衰レベルは、歌唱者データベース16から読み出された歌唱者の声質の特徴データに基づいて決定する。なお、歌唱音声信号の基本波の周波数(音高)は刻々変化するため、基本周波数検出部がこれを検出し、櫛形フィルタのピーク周波数を動的に制御する。
【0036】
これらフィルタ、アッテネータの出力信号を合成した音声信号を「加工された歌唱音 信号」として出力する。上記構成によって同図(B)に示すようなフィルタリング特性が実現される。
【0037】
同図(C)は、入力された歌唱音声信号の周波数特性の例を示す図である。また、同図(D)は、同図(C)の歌唱音声信号を上記構成の音声加工部24で加工した場合の周波数特性の例を示す図である。このように、収音された歌唱音声信号は、同図(C)に示すようにノイズ的な周波数成分を含んだ濁った声質であるが、上記構成の音声加工部24で加工することにより、整数次倍音を適度に含んだ透りのよい声に加工される。
【0038】
図4は男らしい声に加工するルールと音声加工部24の構成を示す図である。男らしい声とは、低周波成分が胸部で共鳴し、且つ若干の低周波ノイズを含んだ(ドスの効いた)声である。そこで、声質を男らしい声に加工する声質加工ルールは、「低音を強調して短い残響を付加するとともに、低周波のノイズで変調する。」という内容である。
【0039】
このような声質加工ルールで歌唱音声信号を加工するため、音声加工部は同図(A)に示すように構成される。同図(A)において、ローパスフィルタ、残響付加部、変調部を直列に接続し、この回路にオリジナルの歌唱音声信号を通過させる。変調部には低周波のノイズ信号が入力されており、このノイズ信号で歌唱音声信号が変調される。
【0040】
ローパスフィルタのカットオフ、残響の長さは、歌唱者データベースから読み出され 歌唱者の声質の特徴データに基づいて決定する。上記構成によって同図(B)に示すようなフィルタリング特性が実現される。
【0041】
同図(C)は、収音された歌唱音声信号の周波数特性の例を示す図である。また、同図(D)は、同図(C)の歌唱音声信号を上記構成の音声加工部24で加工した場合の周波数特性の例を示す図である。このように、収音された歌唱音声信号は、同図(C)に示すように高い周波数成分まで含んだ声質であるが、上記構成の音声加工部24で加工することにより、低音の周波数成分が厚い男らしい声に加工される。
【0042】
図5は、制御部10および音声信号処理部11の動作を示すフローチャートである。同図(A)は登録モードの動作を示し、同図(B)は認証モードの動作を示し、同図(C)は歌唱モードの動作を示している。
【0043】
同図(A)において、ユーザの操作によって登録モードが選択されるとこの動作が実行される。まず認証基準音声が入力される(S1)。この音声はたとえば「カラオケ」等の音声である。この音声から特徴量を抽出し(S2)、この特徴量データを認証基準データとして歌唱者データベース16に記憶する(S3)。続いて、声質判定用音声が入力される(S4)。この音声から声域を測定するとともに、声の特徴である周波数成分を分析し(S5)、これらのデータを声質データとして上記認証基準データに対応づけて記憶する(S6)。
【0044】
同図(B)において、ユーザの操作によって認証モードが選択されるとこの動作が実行される。「カラオケ」等の認証音声が入力されると(S10)、この音声の特徴量を抽出する(S11)。そして歌唱者データベース16の認証基準データを検索して、該当する歌唱者を認証する(S12)。そして、この歌唱者の声質データを読み出し(S13)、キーコントロール部22および声質加工部24にセットする(S14)。
このデータに基づき音声加工ルールを設定する。
【0045】
同図(C)において、歌唱者により登録モード、認証モードが選択されていないときは歌唱モードである。歌唱モードにおいて、曲番号等の選曲入力が行われると(S20)、その曲データを読み出すようカラオケ端末に指示する(S21)。認証モードにおいてセットされている声域データに基づいてそのカラオケ曲のキーを変換するよう設定する(S22)。次に歌唱者から希望の声質を選択する入力が行われる(S23)。すると、この歌唱音声信号をこの声質に変換するための声質加工ルールを声質加工ルールデータベース17から読み出して声質加工部24に設定する。声質加工部24は、この声質加工ルールと声質データに基づいて声質加工機能を設定する。こののちカラオケ曲の演奏をスタートするようカラオケ端末に指示する(S25)。
【0046】
上記実施形態では、カラオケ端末に接続されるカラオケアンプを例にあげて説明したが、本発明はカラオケアンプに限定されず、音声信号(特に人の歌唱音声信号)を増幅するオーディオアンプ全般に適用可能なものである。
【図面の簡単な説明】
【0047】
【図1】この発明の実施形態であるカラオケアンプのブロック図
【図2】声質加工ルールの一例を示す図
【図3】声質加工ルールの一例を示す図
【図4】声質加工ルールの一例を示す図
【図5】同カラオケアンプの動作を示すフローチャート
【符号の説明】
【0048】
11…音声信号処理部
16…歌唱者データベース
17…声質加工ルールデータベース
21…音声分析部
24…声質加工部

【特許請求の範囲】
【請求項1】
歌唱者の歌唱音声信号の特徴である声質データを記憶した音声データベースと、
歌唱音声信号を所望の声質に加工するためのルールを記憶した声質加工ルールデータベースと、
前記声質加工ルールに基づいて歌唱音声信号を加工する声質加工部と、
希望の声質の指定入力を受け付ける声質指定手段と、
歌唱者を認証する歌唱者認証手段と、
を備え、前記声質加工部は、前記歌唱者認証手段で認証された歌唱者の声質データ、および、前記声質指定手段で指定された声質に加工するための声質加工ルールを読み出し、読み出された歌唱者の声質を前記指定された声質に加工する音声信号処理を実行するオーディオアンプ。
【請求項2】
前記音声データベースは、歌唱者を音声で認証するための認証基準データをさらに記憶し、
歌唱者認証手段は、入力された音声信号を前記認証基準データと対比することにより歌唱者を認証する請求項1に記載のオーディオアンプ。
【請求項3】
前記音質加工部は、前記歌唱音声信号の周波数成分のうち特定の成分のみを通過させるフィルタ、前記歌唱音声信号に特定の周波数成分を付加するエンハンサの一方または両方を組み合わせて歌唱音声信号の声質を加工する請求項1または請求項2に記載のオーディオアンプ。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公開番号】特開2010−60947(P2010−60947A)
【公開日】平成22年3月18日(2010.3.18)
【国際特許分類】
【出願番号】特願2008−227695(P2008−227695)
【出願日】平成20年9月5日(2008.9.5)
【出願人】(000004075)ヤマハ株式会社 (5,930)
【Fターム(参考)】