説明

音信号処理装置

【課題】主要音に、不要音(例えば、かぶり音や残響音)が混ざった混合音から、主要音を好適に抽出し得る音信号処理装置を提供すること。
【解決手段】本発明の音信号処理装置によれば、第1の音と第2の音とを含む混合音の時間領域の信号である混合音信号と、少なくとも第2の音に相当する音を含む音の時間領域の信号である対象音信号とからなる2つの信号であって、全てまたは一部が時間的な相関関係を有する前記2つの信号をそれぞれ複数の周波数帯域に分割し、各周波数毎に算出した2つの信号のレベル比に基づき、混合音信号に含まれている第1の音の信号を抽出する。これは、周波数特性やレベル比に注目して、混合音から第1の音を抽出するものであるので、擬似的に生成した波形の時間軸上での差し引きや、逆相波との空間合成による打ち消しを伴わず、第1の音を容易に良好な音質で抽出できる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音信号処理装置に関し、特に、主要音に不要音が混ざった混合音から、主要音を好適に抽出し得る音信号処理装置に関するものである。
【背景技術】
【0002】
ライブなどで1つの楽曲を演奏する複数の楽器の演奏音を楽器毎に独立して収録した場合に、各楽器の収録音は、対象とする楽器の演奏音に、「かぶり音」と呼ばれる他の楽器の演奏音が混ざった混合音となる。各楽器の収録音を加工処理(例えば、ディレイ)する場合に、かぶり音の存在が問題になることがあり、かぶり音を収録音から除去することが望まれている。
【0003】
また、マイクなどで収録された音には、原音と、その残響成分(残響音)が含まれていることが一般的である。従来、原音に残響音が混合した混合音から残響音を除く技術としては、残響音に相当する擬似残響音の波形を生成し、その擬似残響音の波形を、時間軸上で元の混合音から差し引く方法(例えば、特許文献1)や、混合音から残響音の逆相波を生成して補助スピーカから出力して混合音と空間合成することにより、該残響音を打ち消す方法(例えば、特許文献2)などの方法が提案されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開平07−154306号公報
【特許文献2】特開平06−062499号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、残響音の除去については、上記の先行技術があるものの、特許文献1に記載される技術の場合、擬似残響音の波形を正確に生成しなければ、残響音を除去した後の音質が悪く、特許文献2に記載される技術の場合、残響音を除去できる聴衆位置が限定的であるという問題点がある。また、かぶり音を除去するために、残響音を除去するための上記の先行技術を取り入れたとしても、上述した問題点が同様に生じると考えられる。
【0006】
ところで、本出願人は、複数の楽音が混合してなる混合音の信号から、その周波数領域の信号のレベルに基づき、複数の定位に位置する楽音を抽出する未公知技術を提案している(例えば、特願2009−277054(未公知))。
【0007】
本発明は、上述した事情等を鑑みてなされたものであり、上記技術を応用することにより、主要音に不要音(例えば、かぶり音や残響音)が混ざった混合音から、主要音を好適に抽出し得る音信号処理装置を提供することを目的としている。
【課題を解決するための手段および発明の効果】
【0008】
この目的を達成するために、請求項1記載の音信号処理装置によれば、第1の音と第2の音とを含む混合音の時間領域の信号である混合音信号と、少なくとも第2の音に相当する音を含む音の時間領域の信号である対象音信号とからなる2つの信号であって、全てまたは一部が時間的な相関関係を有する前記2つの信号をそれぞれ複数の周波数帯域に分割し、各周波数毎に、2つの信号のレベル比を算出する。このレベル比は、混合音信号と対象音信号との相違の度合いの表す指標となる。そして、この指標に基づくことにより、混合音信号には含まれ、対象音信号には含まれない第1の音の信号を、第2の音の信号に対して区別することができる。よって、第1の音を示すレベル比の範囲を周波数帯域毎に予め設定しておくことにより、レベル比算出手段により算出されたレベル比が、設定された範囲内にあると判定手段により判定された周波数帯域の信号を、前記混合音信号に対応する信号から抽出手段によって抽出することにより、混合音信号に含まれている第1の音の信号を抽出できる。従って、第1の音としての主要音に、第2の音としての不要音(例えば、かぶり音や、テープの劣化により移り込んだ音や、残響音など)が混ざった混合音から、第1の音である主要音を抽出することができる。
【0009】
かかる第1の音の抽出は、信号の周波数特性やレベル比に注目して、混合音から第1の音を抽出する(換言すれば、第2の音を除く)ものであり、擬似的に生成した波形の時間軸上での差し引きを伴うものではないので、第1の音を容易に良好な音質で抽出できる。また、逆相波による音像空間における打ち消しを伴わないので、聴衆位置が限定的になることなく良好な音質の第1の音を抽出することができる。よって、請求項1記載の音信号処理装置によれば、主要音に、不要音が混ざった混合音から、主要音を好適に抽出し得るという効果がある。
【0010】
請求項2記載の音処理装置によれば、請求項1が奏する効果に加え、混合音に含まれる第1の音及び第2の音のそれぞれの発音タイミングの差に基づき生じる時間差が、調整手段によって調整される。具体的には、第1入力手段から入力された信号(混合音信号)又は第2入力手段から入力された信号(対象音信号)のいずれかの信号を、時間軸上で、該時間差に応じた調整量に応じて遅延させることによって調整する。上記の時間差は、混合音信号における第2の音の信号と、対象音信号における第2の音の信号との時間差であるので、上記調整手段による調整により、混合音信号における第2の音の信号と、対象音信号における第2の音の信号とを時間軸上で相対的に合わせることができる。
【0011】
なお、この請求項2における「前記混合音に含まれる第1の音及び第2の音のそれぞれの発音タイミングの差に基づき生じる時間差」としては、例えば、第1の音を出力する第1の出力源と収音手段との間の音場空間の特性と、第2の音を出力する第2の出力源と該収音手段との間の音場空間の特性との差に基づいて生じる時間差や、演奏音が録音されたカセットテープが劣化し、テープの巻きによる重なり部分において、ある時刻に演奏されて録音された第1の音の信号に、時系列的に異なる第2の音の信号(例えば、時系列的に前に演奏された第2の音の信号)が移りこんだことによって生じる時間差、などがある。また、請求項2における「時間差」としては、必ずしも時間差がある場合に限らず、時間差がない場合(即ち、時間差がゼロである場合)も含むことを意図している。また、請求項2における「時間差に応じた調整量」もまた、ゼロを含むことを意図している。
【0012】
よって、請求項2記載の音信号処理装置によれば、主要音に、不要音(例えば、かぶり音や、テープの劣化により移り込んだ音など)が混ざった混合音から、主要音を好適に抽出し得るという効果がある。
【0013】
請求項3記載の音信号処理装置によれば、請求項2が奏する効果に加え、第2の抽出手段は、調整信号又は元信号のうち、混合音信号に対応する信号から、レベル比が予め設定された範囲外であると判定手段により判定された周波数帯域の信号を抽出するので、混合音中に含まれる第2の音に相当する音の信号を抽出して出力できるという効果がある。混合音中に含まれる第2の音に相当する音の信号を抽出して出力することにより、混合音からどのような音が除去されるかをユーザに聴かせることができ、第1の音を適切に抽出させるための感覚的な情報を与えることができる。
【0014】
請求項4記載の音信号処理装置によれば、請求項2又は3が奏する効果に加え、マルチトラックデータの中から、所定のトラックに録音されている第1の音を抽出できるという効果がある。よって、ライブなどで1つの楽曲を演奏する複数の楽器の演奏音を楽器毎に独立して収録したマルチトラックデータから、所望の楽器の音や音声が録音されたトラックに録音されている音の信号を第1入力手段に入力し、そのトラックに録音されている音に含まれる所望の楽器の音または音声以外の音が録音された他のトラックに録音されている音の信号を第2入力手段に入力することにより、かぶり音を除去した所望の楽器の音又は音声を抽出できる。
【0015】
請求項5記載の音信号処理装置によれば、請求項2から4のいずれかが奏する効果に加え、第2の出力源の位置に応じた調整量としての遅延時間と、第2の出力源の数とに基づいて、調整信号を生成するので、混合音信号における第2の音の信号と、対象音信号における第2の音の信号とを精度良く合わせることができ、第1の音を良好な音質で抽出できるという効果がある。
【0016】
請求項6記載の音信号処理装置によれば、所定の出力源から出力された第1の音と、その第1の音に基づいて音場空間において生じた第2の音とを1つの収音手段により収音して得られた混合音の時間領域の信号が混合音信号として入力手段から入力される場合に、所定の出力源から出力された第1の音が収音手段により収音されるタイミングと、第2の音(第1の音に基づいて生じた音)が同じ収音手段により収音されるタイミングとの時間差に応じた調整量に応じて、擬似信号生成手段によって、混合音信号が、時間軸上で遅延され、それにより、該混合音の信号から、対象音信号としての第2の音の信号が擬似的に生成される。
【0017】
よって、請求項6記載の音信号処理装置によれば、主要音に、不要音(例えば、残響音など)が混ざった混合音から、主要音(例えば、原音)を好適に抽出し得るという効果がある。
【0018】
請求項7記載の音信号処理装置によれば、請求項6が奏する効果に加え、入力手段から入力された、原音である第1の音と残響音(第2の音)との混合音から、原音を抽出できるという効果がある。
【0019】
請求項8記載の音信号処理装置によれば、請求項7が奏する効果に加え、音場空間における残響特性に応じて生じる、第1の音が収音手段により収音されてから、その第1の音に基づいて生じた残響音が該収音手段により収音されるまでの遅延時間を調整量とする。そして、かかる調整量としての遅延時間と、該音場空間において第1の音を反射する反射位置として設定した数とに基づいて、擬似的な第2の音の信号としての初期反射音の信号を生成するので、初期反射音の信号を精度よく模倣することができ、原音(第1の音)を良好な音質で抽出できるという効果がある。
【0020】
請求項9記載の音信号処理装置によれば、請求項6から8のいずれかが奏する効果に加え、擬似的な第2の音の信号における今回のレベルを、前回のレベルと比較し、今回のレベルが、前回のレベルに所定の減衰率をかけたレベルより小さい場合に、レベル補正手段により、レベル比算出手段に使用する擬似的な第2の音の信号のレベルが、前回のレベルに所定の減衰率をかけたレベルに補正されるので、擬似的な第2の音の信号のレベルの急激な減衰を鈍らせることができる。よって、レベル比算出手段により算出されるレベル比の急激な変化を抑制することができ、その結果、大音量後の反射音が到達した後に続く比較的レベルの低い反射音を捕らえることができるという効果がある。
【0021】
請求項10記載の音信号処理装置によれば、請求項6から9のいずれかが奏する効果に加え、混合音の信号のレベルが小さい程、擬似的な第2の音の信号のレベルに対する、混合音の信号のレベルの比が小さくなるように、レベル比算出手段により算出されたレベル比が、レベル比補正手段によって補正されるので、小さいレベルの混合音の信号を、より第2の音として判定され易いようにすることができ、それにより、後部残響音を捕らえることができるという効果がある。
【図面の簡単な説明】
【0022】
【図1】本発明の一実施形態であるエフェクタ(音信号処理装置の一例)の構成を示すブロック図である。
【図2】DSPの機能を示す機能ブロック図である。
【図3】マルチトラック再生部の機能を示す機能ブロック図である。
【図4】(a)は、遅延部の機能を示す機能ブロック図であり、(b)は、(a)に示した遅延部において、入力信号に対して畳み込まれるインパルス応答を示す模式図である。
【図5】第1処理部を構成する各部で実行される処理を、機能ブロックを用いて模式的に示す図である。
【図6】表示装置の表示画面に表示されたユーザインターフェイス画面の一例を示す模式図である。
【図7】第2実施形態のエフェクタの構成を示すブロック図である。
【図8】第2実施形態のDSPの機能を示す機能ブロック図である。
【図9】(a)は、Lch初期反射成分生成部の機能を示すブロック図であり、(b)は、(a)に示したLch初期反射成分生成部において、入力信号に対して畳み込まれるインパルス応答を示す模式図である。
【図10】Lch成分選別部で実行される処理を、機能ブロックを用いて模式的に示す図である。
【図11】ある周波数fにおいて、|POL_1L[f]の動径|を一定にしたときの、|POL_2L[f]の動径|の減衰を鈍らせない場合と、鈍らせた場合とを比較するための説明図である。
【図12】表示装置の表示画面に表示されたユーザインターフェイス画面の一例を示す模式図である。
【図13】信号表示部に設定される範囲の変形例を示す図である。
【図14】オールパスフィルタの構成を示すブロック図である。
【発明を実施するための形態】
【0023】
以下、本発明の好ましい実施例について、添付図面を参照して説明する。まず、図1から図6を参照して本発明の第1実施形態について説明する。図1は、本発明における第1実施形態のエフェクタ1(音信号処理装置の一例)の構成を示すブロック図である。第1実施形態のエフェクタ1は、1つの楽曲を演奏する複数の楽器の演奏音を楽器毎にマルチトラック録音した場合に、各楽器を録音したトラックの収録音に含まれるかぶり音を除去できるものである。なお、本明細書に記載される用語「楽器」としては、ボーカルを含むことを意図している。
【0024】
エフェクタ1は、CPU11と、ROM12と、RAM13と、デジタルシグナルプロセッサ(以下、「DSP」と称す)14と、Lch用D/A15Lと、Rch用D/A15Rと、表示装置用I/F16と、入力装置用I/F17と、HDD_I/F18と、バスライン19とを有している。なお、「D/A」とは、デジタルアナログコンバータである。各部11〜14,15L,15R,16〜18は、バスライン19を介して互いに電気的に接続されている。
【0025】
CPU11は、ROM12等に記憶される固定値や制御プログラムに従って、バスライン19を介して接続されている各部を制御する中央制御装置である。ROM12は、エフェクタ1で実行される制御プログラム12aなどを格納した書換不能なメモリである。制御プログラム12aには、図2〜図5を参照して後述するDSP14により実行される各処理の制御プログラムが含まれている。RAM13は、各種のデータを一時的に記憶するためのメモリである。
【0026】
DSP14は、デジタル信号を処理するための演算装置である。詳細は後述するが、本実施形態におけるDSP14は、HDD21に記憶されているマルチトラックデータ21aをマルチトラック再生し、ユーザ指定された楽器の演奏音が録音されているトラックの収録音の信号から、そのトラックへの録音を意図した音(即ち、ユーザ指定された楽器の演奏音であり、この音を以下では「主要音」と称することがある)の信号と、その主要音に混ざって録音されたかぶり音の信号とを選別し、選別された主要音の信号を「かぶり取り音」の信号として抽出して、Lch用D/A15LおよびRch用D/A15Rへ出力する処理を実行する。
【0027】
Lch用D/A15Lは、DSP14にて信号処理が施された左チャンネル信号を、デジタル信号からアナログ信号へ変換するコンバータであり、変換後のアナログ信号はOUT_L端子から出力される。Rch用D/A15Rは、DSP14にて信号処理が施された右チャンネル信号を、デジタル信号からアナログ信号へ変換するコンバータであり、変換後のアナログ信号はOUT_R端子から出力される。
【0028】
表示装置用I/F16は、表示装置22を接続するためのインターフェイスである。エフェクタ1には、この表示装置用I/F16を介して表示装置22が接続される。表示装置22は、LCD等によって構成される表示画面を有する装置であり、本実施形態では、この表示装置22の表示画面に、図6を参照して後述するユーザインターフェイス画面30が表示される。なお、以下では、ユーザインターフェイス画面を「UI画面」と称す。
【0029】
入力装置用I/F17は、入力装置23を接続するためのインターフェイスである。エフェクタ1には、この入力装置用I/F17を介して入力装置23が接続される。入力装置23は、エフェクタ1に供給する各種実行指示を入力するための装置であり、例えば、マウスやタブレットやキーボードなどで構成される。本実施形態では、表示装置22の表示画面に表示されたUI画面30(図6参照)に対し、入力装置23を適宜操作することにより、ユーザ指定された楽器の演奏音が録音されているトラックの収録音からかぶり取り音を抽出するための各種実行指示を入力する。なお、入力装置23を、表示装置22の表示画面上になされた操作を感知するタッチパネルとして構成してもよい。
【0030】
HDD_I/F18は、外付けのハードディスクドライブであるHDD21を接続するためのインターフェイスである。本実施形態では、HDD21には、1又は複数のマルチトラックデータ21aが記憶されており、ユーザにより選択された1つのマルチトラックデータ21aが、処理のためにHDD_I/F18を介してDSP14へ入力される。マルチトラックデータ21aは、トラック単位でマルチトラック録音されたオーディオデータである。
【0031】
次に、図2を参照して、DSP14の機能について説明する。図2は、DSP14の機能を示す機能ブロック図である。DSP14に形成される機能ブロックは、マルチトラック再生部100と、遅延部200と、第1処理部300と、第2処理部400とから構成される。
【0032】
マルチトラック再生部100は、HDD21に記憶されているマルチトラックデータ21aをマルチトラック再生し、ユーザ指定された楽器の演奏音が録音されているトラックの収録音に基づく再生信号であるIN_P[t]を、第1処理部300の第1周波数分析部310と、第2処理部400の第1周波数分析部410とにそれぞれ入力する。なお、本明細書中において、[t]は、その信号が時間領域の信号であることを示す。また、マルチトラック再生部100は、ユーザ指定されたトラック以外のトラックに録音されている演奏音に基づく再生信号であるIN_B[t]を、遅延部200に入力する。なお、マルチトラック再生部100の詳細については、図3を参照して後述する。
【0033】
遅延部200は、マルチトラック再生部100から供給されたIN_B[t]を、ユーザ設定に応じた遅延時間だけ遅延し、所定のレベル係数(1.0以下の正数)を乗算する。そして、ユーザにより設定された遅延時間とレベル係数との組が複数組ある場合には、その全てを加算する。これにより得られた遅延信号であるIN_Bd[t]を、第1処理部300の第2周波数分析部320と、第2処理部400の第2周波数分析部420とにそれぞれ入力する。なお、遅延部200の機能の詳細については、図4を参照して後述する。
【0034】
第1処理部300および第2処理部400は、マルチトラック再生部100から供給されたIN_P[t]と、遅延部200から供給されたIN_Bd[t]に対し、同一の処理をそれぞれ所定時間毎に繰り返して実行することにより、かぶり取り音の信号であるP[t]又はかぶり音の信号であるB[t]のいずれかを出力する。第1処理部300および第2処理部400のそれぞれから出力されたP[t]又はB[t]は、クロスフェードで合成されて、OUT_P[t]又はOUT_B[t]として出力される。具体的には、第1処理部300および第2処理部400からP[t]が出力された場合には、その合成信号であるOUT_P[t]がDSP14から出力される。一方で、第1処理部300および第2処理部400からB[t]が出力された場合には、その合成信号であるOUT_B[t]がDSP14から出力される。DSP14から出力されたOUT_P[t]又はOUT_B[t]は分配されて、Lch用D/A15LとRch用D/A15Rとにそれぞれ入力される。
【0035】
より詳細には、第1処理部300は、第1周波数分析部310と、第2周波数分析部320と、成分選別部330と、第1周波数合成部340と、第2周波数合成部350と、セレクタ部360とから構成される。
【0036】
第1周波数分析部310は、マルチトラック再生部100から供給されたIN_P[t]を、周波数領域の信号に変換すると共に、直交座標系から極座標系に変換し、極座標系で表される周波数領域の信号であるPOL_1[f]を、成分選別部330へ出力する。第2周波数分析部320は、遅延部200から供給されたIN_Bd[t]を、周波数領域の信号への変換と極座標系への変換とを行った後、極座標系で表される周波数領域の信号であるPOL_2[f]を、成分選別部330へ出力する。
【0037】
成分選別部330は、第1周波数分析部310から供給されたPOL_1[f]の動径の絶対値と、第2周波数分析部320から供給されたPOL_2[f]の動径の絶対値との比(以下、この比を「レベル比」と称す)を、周波数f毎に、その周波数fに対して予め設定されているレベル比の範囲と比較し、その比較結果に応じて設定されたPOL_3[f]およびPOL_4[f]を、それぞれ、第1周波数合成部340および第2周波数合成部350へ出力する。
【0038】
第1周波数合成部340は、成分選別部330から供給されたPOL_3[f]を、極座標系から直交座標系へ変換すると共に時間領域の信号に変換し、得られた直交座標系で表される時間領域の信号であるP[t]を、セレクタ部360へ出力する。第2周波数合成部350は、成分選別部330から供給されたPOL_4[f]を、極座標系から直交座標系へ変換すると共に時間領域の信号に変換し、得られた直交座標系で表される時間領域の信号であるB[t]を、セレクタ部360へ出力する。セレクタ部360は、ユーザの指定に基づき、第1周波数合成部340から供給されたP[t]か、第2周波数合成部350から供給されたB[t]のいずれかを出力する。
【0039】
詳細は後述するが、P[t]は、ユーザ指定された楽器音が録音されているトラックの収録音から不要音であるかぶり音を除いた音、即ち、かぶり取り音の信号であり、B[t]は、かぶり音の信号である。つまり、第1処理部300は、ユーザの所望に応じて、かぶり取り音の信号であるP[t]か、かぶり音の信号であるB[t]のいずれかを抽出して出力することができる。
【0040】
なお、第1処理部300を構成する各部310〜360において実行される詳細な処理については、図5を参照して後述する。
【0041】
第2処理部400は、第1周波数分析部410と、第2周波数分析部420と、成分選別部430と、第1周波数合成部440と、第2周波数合成部450と、セレクタ部460とから構成される。
【0042】
第2処理部400を構成する各部410〜460は、それぞれ、第1処理部300を構成する各部310〜360と同様に機能し、同じ信号を出力する。即ち、第1周波数分析部410は、第1周波数分析310と同様に機能してPOL_1[f]を出力する。第2周波数分析部420は、第2周波数分析320と同様に機能してPOL_2[f]を出力する。成分選別部430は、成分選別部330と同様に機能してPOL_3[f]およびPOL_4[f]を出力する。第1周波数分析部440は、第1周波数分析部340と同様に機能してP[t]を出力する。第2周波数分析部450は、第2周波数分析部350と同様に機能してB[t]を出力する。セレクタ部460は、セレクタ部360と同様に機能してP[t]またはB[t]のいずれかを出力する。
【0043】
この第2処理部400で実行される処理の実行間隔は、第1処理部300で実行される処理の実行間隔と同じであるが、第2処理部400で実行される処理は、第1処理部300における処理の実行開始から所定時間だけ遅れて開始される。これにより、第2処理部400で実行される処理は、第1処理部300における処理の実行終了から実行開始までのつなぎ目を補い、その一方で、第1処理部300で実行される処理は、第2処理部400における処理の実行終了から実行開始までのつなぎ目を補う。よって、第1処理部300から出力された信号と、第2処理部400から出力された信号とが合成された信号(即ち、DSP14から出力されるOUT_P[t]又はOUT_B[t])に不連続が生じることを防止できる。
【0044】
なお、本実施形態では、第1処理部300及び第2処理部400は、その処理を0.1秒毎に実行するものとし、第2処理部400で実行される処理は、第1処理部300における処理の実行開始から0.05秒後(半周期後)に実行開始されるものとする。しかし、第1処理部300及び第2処理部400の実行間隔や、第1処理部300における処理の実行開始から第2処理部400における処理の実行開始までの遅延時間は、上記例示した0.1秒及び0.05秒に限定されず、サンプリング周波数と楽音信号の数とに応じた値を適宜使用できる。
【0045】
次に、図3を参照して、上述したマルチトラック再生部100の機能について説明する。図3は、マルチトラック再生部100の機能を示す機能ブロック図である。マルチトラック再生部100は、第1〜第nトラック再生部101−1〜101−nと、n個の第1の乗算器102a−1〜102a−nと、n個の第2の乗算器102b−1〜102b−nと、第1の加算器103aと、第2の加算器103bとから構成される。なお、nは、1以上の整数である。
【0046】
第1〜第nトラック再生部101−1〜101−nは、マルチトラックデータ21aを構成するシングルトラックデータを同期して再生するマルチトラック再生を実行する。なお、「シングルトラックデータ」とは、1つのトラックに録音されたオーディオデータである。
【0047】
各トラック再生部101−1〜101−nは、マルチトラックデータ21aを構成するシングルトラックデータのうち、1つの楽器の演奏音が録音された1又は複数のシングルトラックデータの同期した再生を行い、その楽器の演奏音のモノラル再生信号を出力する。つまり、1つのトラック再生部が、1つのシングルトラックデータを再生するとは限らず、例えば、1つの楽器の演奏音が、複数のトラックにステレオ録音されている場合には、それら複数のトラックにそれぞれ対応するシングルトラックデータの再生音を混合してモノラルの再生信号として出力する。これらの第1〜第nトラック再生部101−1〜101−nは、それぞれ、再生により生じたモノラルの再生信号を、対応する第1の乗算器102a−1〜102a−nと、第2の乗算器102b−1〜102b−nとに出力する。
【0048】
第1の乗算器102a−1〜102a−nは、それぞれ、係数S1〜係数Snを、対応するトラック再生部101−1〜101−nから入力された再生信号に乗算し、第1の加算器103aへ出力する。係数S1〜係数Snは、いずれも、1以下の正数である。第2の乗算器102b−1〜102b−nは、それぞれ、係数(1−S1)〜係数(1−Sn)を、対応するトラック再生部101−1〜101−nから入力された再生信号に乗算し、第2の加算器103bへ出力する。
【0049】
第1の加算器103aは、第1の乗算器102a−1〜102a−nから出力された信号を全て加算し、それにより得られた信号であるIN_P[t]を、第1処理部300の第1周波数分析部310と、第2処理部400の第1周波数分析部410とにそれぞれ入力する。第2の加算器103bは、第2の乗算器102b−1〜102b−nから出力された信号を全て加算し、それにより得られた信号であるIN_B[t]を、遅延部200に入力する。
【0050】
本実施形態では、第1の乗算器102a−1〜102a−nで使用する係数S1〜係数Snの値は、対応するトラック再生部101−1〜101−nにより再生される楽器の音が、後述するUI画面30(図6参照)において、ユーザがかぶり取り音として抽出したい1つの楽器の音として指定した楽器の音であるか否かに応じて規定されるように構成されている。具体的に、かぶり取り音として指定された楽器の音を主要音として含むトラック再生部101−1〜101−nに対応する係数S1〜係数Snの値は1.0に設定され、それ以外のトラック再生部に対応する係数S1〜係数Snの値は0.0に設定される。
【0051】
一方、第2の乗算器102a−1〜102a−nでそれぞれ使用する係数は、対応する係数S1〜係数Snの値に応じて決まり、第1の乗算器102a−1〜102a−nで使用する係数S1〜係数Snが1.0であれば、対応する第2の乗算器102b−1〜102b−nで使用する係数(1−S1)〜係数(1−Sn)は0.0に設定される。また、係数S1〜係数Snが0.0であれば、対応する係数(1−S1)〜係数(1−Sn)は1.0に設定される。
【0052】
つまり、マルチトラック再生部100は、かぶり取り音として指定された楽器の音を主要音として含むトラック再生部101−1〜101−nから出力された再生信号を、IN_P[t]として、第1周波数分析部310,410へ出力する。他のトラック再生部から出力された再生信号は、IN_P[t]には含まれない。その一方で、マルチトラック再生部100は、かぶり取り音として指定された楽器の音以外の楽器の音を主要音として含むトラック再生部から出力された再生信号を、IN_B[t]として、遅延部200へ出力する。かぶり取り音として指定されたトラック再生部101−1〜101−nから出力された再生信号は、IN_B[t]には含まれない。
【0053】
ここで、例えば、ボーカル音(ボーカリストの声)がかぶり取り音としてユーザにより指定された場合、マルチトラック再生部100から第1周波数分析部310,410へ出力されるIN_P[t]は、主要音としてのボーカル音の信号(Vo[t])と、不要音(主要音にかぶるかぶり音)となる他の楽器の音の合成音の信号であるB[t]が音場空間の特性Ga[t]により変化された信号との混合音となる。つまり、『IN_P[t]=Vo[t]+Ga[B[t]]』である。
【0054】
一方、マルチトラック再生部100から遅延部200へ出力されるIN_B[t]は、不要音の信号(B[t])である。例えば、B[t]が、ギターの演奏音の信号(Gtr[t])と、キーボードの演奏音の信号(Kbd[t])と、ドラムの演奏音の信号(Drum[t])などを含む混合音であるとすると、IN_B[t]は、各楽器の音の信号の和となる。つまり、『IN_B[t]=Gtr[t]+Kbd[t]+Drum[t]+・・・』である。
【0055】
次に、図4を参照して、上述した遅延部200の機能について説明する。図4(a)は、遅延部200の機能を示す機能ブロック図である。遅延部200は、FIRフィルタであり、第1〜第N遅延素子201−1〜201−Nと、N個の乗算器202−1〜202−Nと、加算器203とから構成される。なお、Nは、1以上の整数である。
【0056】
遅延素子201−1〜201−Nは、入力信号であるIN_B[t]を、各遅延素子に対して規定された遅延時間T1〜TNだけ遅延する素子である。これらの遅延素子201−1〜201−Nは、それぞれ、遅延時間T1〜TNだけ遅延させることにより得られた信号を、対応する乗算器202−1〜202−Nへ出力する。
【0057】
乗算器202−1〜202−Nは、それぞれ、レベル係数C1〜CN(いずれも1.0以下の正数)を、対応する遅延素子201−1〜201−Nから供給された信号に乗算し、加算器203へ出力する。加算器203は、乗算器202−1〜202−Nから出力された信号を全て加算し、それにより得られた信号であるIN_Bd[t]を、第1処理部300の第2周波数分析部320と、第2処理部400の第2周波数分析部420とにそれぞれ入力する。
【0058】
遅延部200における遅延素子201−1〜201−Nの数(即ち、N)、遅延時間T1〜TN、及びレベル係数C1〜CNは、後述するUI画面30(図6参照)における遅延時間設定部34をユーザが操作することによって適宜設定される。なお、遅延時間T1〜TNのうち、少なくとも1つの遅延時間がゼロ(即ち、遅延しない)であってもよい。遅延素子201−1〜201−Nの数を、かぶり音の出力源の数に設定し、各遅延素子に対して遅延時間T1〜TNとレベル係数C1〜CNを設定することにより、図4(b)に示すようなインパルス応答Ir1〜IrNが得られ、これらのインパルス応答Ir1〜IrNを、IN_B[t]に対して畳み込むことにより、IN_Bd[t]が生成される。なお、かぶり音の出力源としては、あるトラックに録音する演奏音を収音する収音装置(マイクなど)に、そのトラックの録音対象となる楽器の音(即ち、主要音)以外に収音される音の出力源がその対象となり、例えば、スピーカや、ドラムなどの楽器が例示される。
【0059】
ここで、N箇所のかぶり音の出力源がある場合、遅延部200において生成されるIN_Bd[t]は、『IN_Bd[t]=IN_B[t]×C1×Z−m1+IN_B[t]×C2×Z−m2+・・・+IN_B[t]×CN×Z−mN』と表すことができる。なお、Zは、Z変換の伝達関数であり、その伝達関数Zの指数(−m1,−m2,・・・,−mN)は、遅延時間T1〜TNに応じて決定される。具体的に、例えば、ボーカル以外の楽器音による伴奏を事前にマルチトラック(遅延時間がゼロ)で収録し、収録した伴奏をマルチトラック再生して、その再生音をステレオスピーカから出力しながらボーカルトラックの収録を行う場合には、かぶり音の出力源は、左右のスピーカの2箇所(即ち、N=2)となり、遅延時間は、それぞれのスピーカからボーカルマイクまでの距離に基づいて決まる。
【0060】
図4(b)は、図4(a)に示した遅延部200において、入力信号(即ち、IN_B[t])に対して畳み込まれるインパルス応答を示す模式図である。なお、図4(b)において、横軸は時刻に対応し、縦軸はレベルに対応する。第1のインパルス応答Ir1は、遅延時間T1におけるレベルC1のインパルス応答であり、第2のインパルス応答Ir2は、遅延時間T2におけるレベルC2のインパルス応答である。そして、第Nのインパルス応答IrNは、遅延時間TNにおけるレベルCNのインパルス応答である。
【0061】
各インパルス応答Ir1,Ir2,…IrNには、N個のかぶり音の出力源と主要音を収音する収音装置とのそれぞれの距離や、その各かぶり音の出力源から出力された音の混入具合(例えば、混入された音の音量)などが反映されている。つまり、各インパルス応答Ir1,Ir2,…IrNは、音場空間の特性を表すGa[t]を反映する。上述した通り、これらのインパルス応答Ir1〜IrNは、遅延素子の数N、遅延時間T1〜TN、レベル係数C1〜CNを、UI画面30を用いて設定することにより得ることができるので、これらのインパルス応答Ir1〜IrNを適切に設定し、入力信号であるIN_B[t]を畳み込むことにより、IN_B[t]から、IN_P[t]に含まれるかぶり音成分(Ga[B[t]])を適切に模倣したIN_Bd[t]を生成し、出力することができる。
【0062】
次に、図5を参照して、上述した第1処理部300の機能について説明する。図5は、第1処理部300を構成する各部310〜360で実行される処理を、機能ブロックを用いて模式的に示す図である。なお、図示も説明も省略するが、第2処理部400の各部410〜460においても、図5に示す各部310〜360と同様の処理が実行される。
【0063】
第1周波数分析部310では、マルチトラック再生部100から供給されたIN_P[t]に対して窓関数をかける処理を実行する(S311)。本実施形態では、窓関数としてハニング窓を使用する。
【0064】
次いで、窓関数をかけたIN_P[t]に対して高速フーリエ変換(FFT)を行う(S312)。この高速フーリエ変換により、IN_P[t]は、IN_P[f]へ変換され、フーリエ変換された各周波数fを横軸とするスペクトル信号となる。IN_P[f]は、実数部(Re[f])と虚数部(jIm[f])とを有する複素数である(即ち、IN_P[f]=Re[f]+jIm[f])。
【0065】
S312の処理後、周波数f毎に、IN_P[f]を極座標系に変換する(S313)。つまり、各周波数fのRe[f]+jIm[f]を、r[f](cos(arg[f])+jr[f](sin(arg[f])に変換する。第1周波数分析部310から成分選別部330へ出力されるPOL_1[f]は、S313の処理により得られたr[f](cos(arg[f])+jr[f](sin(arg[f])である。
【0066】
なお、r[f]は、動径であり、IN_P[f]の実数部を2乗した値と虚数部を2乗した値との和の平方根により算出される。即ち、r[f]={(Re[f])+(Im[f])1/2である。また、arg[f]は、位相であり、IN_P[f]の虚数部を実数部で除した値のアークタンジェントをとることにより算出される。即ち、arg[f]=tan−1(Im[f]/Re[f])である。
【0067】
第2周波数分析部320では、遅延部200から供給されたIN_Bd[t]に対して、窓関数処理を実行し(S321)、FFT処理を実行し(S322)、極座標系への変換を実行する(S323)。第2周波数分析部320で実行されるS321〜S323の処理の処理内容は、処理対象がIN_P[t]からIN_Bd[t]に変わること以外、上述したS311〜S313の処理と同様であるので、これらの処理についての詳細な説明は省略する。なお、第2周波数分析部320からの出力信号は、処理対象がIN_Bd[t]に変わったことにより、POL_2[f]となる。
【0068】
成分選別部330では、まず、各周波数fについて、POL_1[f]の動径とPOL_2[f]の動径とを比較し、動径の絶対値の大きい方をLv[f]に設定する(S331)。S331により設定されたLv[f]は、CPU11に供給され、後述するUI画面30(図6参照)の信号表示部36の表示を制御するために使用される。
【0069】
S331の処理後、各周波数fにおけるPOL_3[f]およびPOL_4[f]をゼロに初期化する(S332)。次いで、周波数f毎に、相違度[f]=|(POL_1[f]の動径|/|POL_2[f]の動径|を算出する(S333)。このように、相違度[f]とは、POL_1[f]のレベルとPOL_2[f]のレベルとの比に応じて規定される値である。即ち、相違度[f]とは、POL_1[f]に対応する入力信号(IN_P[t])と、POL_2[f]に対応する入力信号(IN_B[t]の遅延信号であるIN_Bd[t])との相違の度合いを示す値である。なお、S333において、相違度[f]は、0.0〜2.0の範囲に制限する。つまり、|(POL_1[f]の動径|/|POL_2[f]の動径|が2.0を超える場合には、相違度[f]=2.0とする。また、POL_2[f]の動径が0.0である場合もまた、相違度[f]=2.0とする。S333により算出された相違度[f]は、S334以降の処理に使用すると共に、CPU11に供給されて、後述するUI画面30(図6参照)の信号表示部36の表示を制御するために使用される。
【0070】
次に、相違度[f]が、その周波数fにおける設定範囲内かを、周波数f毎に判定する(S334)。なお、「その周波数fにおける設定範囲」は、後述するUI画面30(図6参照)を用いてユーザにより設定された、ある周波数fにおいて、かぶり取り音(又は、P[t]として抽出すべき音)とする相違度[f]の範囲である。よって、ある周波数fにおける設定範囲内にある相違度[f]は、その周波数fでのPOL_1[f]がかぶり取り音の信号であることを示す。
【0071】
S334の判定が肯定される場合には(S334:Yes)、POL_3[f]をPOL_1[f]とし(S335)、否定される場合には(S334:No)、POL_4[f]をPOL_1[f]とする(S336)。よって、POL_3[f]は、POL_1[f]から抽出されたかぶり取り音に相当する信号である。その一方で、POL_4[f]は、POL_1[f]から抽出されたかぶり音に相当する信号である。
【0072】
S335又はS336の処理後、各周波数fのPOL_3[f]を、第1周波数合成部340へ出力すると共に、各周波数fのPOL_4[f]を、第2周波数合成部350へ出力する(S337)。
【0073】
なお、S334の判定が肯定されてS335の処理が実行された周波数fでは、S337の処理により、POL_3[f]として、POL_1[f]が第1周波数合成部340へ出力されると共に、POL_4[f]として、0.0が第2周波数合成部350へ出力される。一方で、S334の判定が否定されてS336の処理が実行された周波数fでは、S337の処理により、POL_3[f]として、0.0が第1周波数合成部340へ出力されると共に、POL_4[f]として、POL_1[f]が第2周波数合成部350へ出力される。上述したS331からS337の処理を、フーリエ変換された周波数fの範囲で繰り返し実行する。
【0074】
第1周波数合成部340では、まず、周波数f毎に、成分選別部330から供給されたPOL_3[f]を直交座標系に変換する(S341)。つまり、各周波数fのr[f](cos(arg[f])+jr[f](sin(arg[f])を、Re[f]+jIm[f]に変換する。具体的には、r[f](cos(arg[f])をRe[f]とし、jr[f](sin(arg[f])をjIm[f]とすることによって変換する。つまり、Re[f]=r[f](cos(arg[f])であり、jIm[f]=jr[f](sin(arg[f])である。
【0075】
次いで、S341により得られた直交座標系の信号(即ち、複素数の信号)に対して逆高速フーリエ変換(逆FFT)を行うことにより、時間領域の信号を得(S342)、得られた信号に、上述した周波数分析部310のS311の処理で使用した窓関数と同一の窓関数をかける処理を実行し(S343)、得られた信号をP[t]として、セレクタ部360へ出力する。なお、本実施形態では、S311の処理においてハニング窓を使用したので、S343の処理でもハニング窓を使用する。
【0076】
第2周波数合成部350は、周波数f毎に、成分選別部330から供給されたPOL_4[f]を直交座標系に変換し(S351)、逆FFT処理を実行し(S352)、窓関数処理(S353)を実行する。第2周波数合成部350で実行されるS351〜S353の処理の処理内容は、成分選別部330から供給される信号がPOL_3[f]からPOL_4[f]に変わること以外、上述したS341〜S343の処理と同様であるので、これらの処理についての詳細な説明は省略する。なお、第2周波数合成部350からの出力信号は、成分選別部330から供給される信号がPOL_4[f]に変わったことにより、P[t]ではなく、B[t]となる。
【0077】
上述した通り、POL_3[f]は、POL_1[f]から抽出されたかぶり取り音に相当する信号であるので、第1周波数合成部340からセレクタ部360へ出力されるP[t]は、かぶり取り音の時間領域の信号である。その一方で、POL_4[f]は、POL_1[f]から抽出されたかぶり音に相当する信号であるので、第2周波数合成部350からセレクタ部360へ出力されるB[t]は、かぶり音の時間領域の信号である。
【0078】
セレクタ部360は、第1周波数合成部340から供給されたP[t]、又は第2周波数合成部350から供給されたB[t]のいずれかを、ユーザの指定に応じて出力する。このユーザ指定は、図6を参照して後述するUI画面30において行われる。
【0079】
第1処理部300のセレクタ部360から出力された信号(P[t]又はB[t]のいずれか)は、第2処理部400のセレクタ部460から出力された信号(P[t]又はB[t]のいずれかであって、セレクタ部360と同じ種類の信号)と合成され、その合成信号がD/A15L,15Rへ出力される。
【0080】
上述した通り、P[t]はかぶり取り音の信号であり、B[t]はかぶり音の信号であるので、本実施形態のエフェクタ1は、ユーザが所望する1つの楽器の音を主要音として録音したトラックから、かぶり音を除去した音をかぶり取り音として放音することができる。また、ユーザによる指定状況によっては、その場合のかぶり音に相当する音を放音することもできる。
【0081】
図6は、表示装置22の表示画面に表示されたUI画面30の一例を示す模式図である。UI画面30は、トラック表示部31と、選択ボタン32と、トランスポートボタン33と、遅延時間設定部34と、切り替えボタン35と、信号表示部36とを有している。
【0082】
トラック表示部31は、ユーザにより選択されて処理対象となった1つのマルチトラックデータ21aに含まれる各シングルトラックデータに録音されているオーディオ波形を表示する画面であり、1つのシングルトラックデータ毎にオーディオ波形が表示される。図6に示す例では、5つの表示部31a〜31eが表示されている。表示部31a,31b,31eは、それぞれ、ボーカル音、ギター音、及びドラム音を主要音としてモノラル録音されたトラックのオーディオ波形を表示する画面である。表示部31c,31dは、ステレオ録音されたキーボード音の左右チャンネルの音をそれぞれ表示する画面である。なお、各表示部31a〜31eは、いずれも、横軸が時刻に対応し、縦軸が振幅に対応する。
【0083】
選択ボタン32は、かぶり取り音として抽出する楽器の音を指定するためのボタンであり、マルチトラックデータ21aを構成する各シングルトラックデータの主要音を発する楽器単位で設けられている。図6に示す例では、4つの選択ボタン32が設けられている。即ち、ボーカル音(ボーカリスト)に対応する選択ボタン32aと、ギター音(ギター)に対応する選択ボタン32bと、キーボード音(キーボード)に対応する選択ボタン32cと、ドラム音(ドラム)に対応する選択ボタン32dとが設けられている。
【0084】
この選択ボタン32は、ユーザが、入力装置23(例えば、マウス)を用いて操作することができ、1つの選択ボタンに対して所定の操作(例えば、クリック)を行うと、その選択ボタンが選択状態となり、選択状態となった選択ボタンに対応する楽器が、かぶり取り音の対象になる楽器として選択されると共に、その選択に連動して、残りの選択ボタンに対応する楽器が、かぶり音の対象になる楽器として選択される。このとき、マルチトラック再生部100にて使用される係数S1〜Snのうち、かぶり取り音の対象として選択された楽器に対応する係数が1.0に設定され、残りの係数が0.0に設定される。図6に示す例では、選択ボタン32aが選択状態(「かぶり取り音」の文字表示、選択されていることを示すボタン色)であり、ボーカル音がかぶり取り音の対象として選択されていることを示す。一方で、その他の選択ボタン32b〜32dは、非選択状態(「かぶり音」の文字表示、選択されていないことを示すボタン色)であり、かぶり音の対象として、ギター音、キーボード音、及びドラム音が選択されていることを示す。
【0085】
トランスポートボタン33は、処理対象のマルチトラックデータ21aを操作するためのボタン群である。トランスポートボタン33としては、例えば、マルチトラックデータ21aをマルチトラック再生させるための再生ボタンや、再生を停止するための停止ボタンや、再生音又はデータを早送りするための早送りボタンや、再生音又はデータを巻き戻すための巻き戻しボタン等が含まれる。トランスポートボタン33は、ユーザが、入力装置23(例えば、マウス)を用いて操作することができる。即ち、トランスポートボタン33に含まれるボタン群のうち、所望の1つのボタンに対して所定の操作(例えば、クリック)を行うことにより操作することができる。
【0086】
遅延時間設定部34は、遅延部200においてIN_B[t]を遅延させるためのパラメータを設定する画面であり、横軸が時刻に対応し、縦軸がレベルに対応する。この遅延時間設定部34には、ユーザが入力装置23を操作して設定したバー34aが表示される。
【0087】
バー34aの数は、かぶり音の出力源の数Nに相当し、ユーザが、入力装置23(例えば、マウス)を用いて所定の操作(例えば、右ボタンをクリックすることにより表示されたメニューからの選択)を行うことにより、適宜、追加又は消去することができる。図6に示す例では、3本のバー34aが表示されているので、かぶり音の出力源の数Nとして「3」が設定されている。また、1本のバー34aは、横軸方向における時刻0(ゼロ)からの位置により、遅延時間Tx(x=1〜Nのいずれか)が設定され、縦軸方向におけるレベル0(ゼロ)からの高さにより、レベル係数Cx(x=1〜Nのいずれか)が設定される。各バー34aの横軸方向への移動(即ち、遅延時間Txの変更)、及び、縦軸方向の高さの変更(即ち、レベル係数Cxの変更)は、いずれも、入力装置23による所定の操作により行うことができる。例えば、変更を所望するバー34aの上にカーソルを置いた状態で、マウスの左ボタンを押しながら横軸方向へ移動させたり、縦軸方向へ移動させたりすることにより、位置および高さを変更することができる。
【0088】
切り替えボタン35は、セレクタ部360,460から出力する信号を、かぶり取り音の信号(P[t])とするか、かぶり音の信号(B[t])とするかを指定するためのボタンである。ボタン35aは、かぶり取り音の信号(P[t])を指定するボタンであり、ボタン35bは、かぶり音の信号(B[t])を指定するボタンである。
【0089】
この切り替えボタン35は、ユーザが、入力装置23(例えば、マウス)を用いて操作することができ、ボタン35a又はボタン35bに対して所定の操作(例えば、クリック)を行うと、クリックされたボタンが選択状態となり、そのボタンに対応する信号がセレクタ部360,460から出力する信号として指定される。図6に示す例では、ボタン35aが選択状態(選択されていることを示すボタン色)であり、セレクタ部360,460から出力する信号として、かぶり取り音の信号(P[t])が指定(選択)されていることを示す。一方で、ボタン35bは、非選択状態(選択されていないことを示すボタン色)である。
【0090】
信号表示部36は、エフェクタ1への入力信号(即ち、マルチトラックデータ21aからの入力信号)を、周波数f−相違度[f]の平面に可視化するための画面である。なお、相違度[f]とは、上述した通り、IN_[P(t)]と、IN_B[t]の遅延信号であるIN_Bd[t]との相違の度合いを示す値である。信号表示部36の横軸は、周波数fに対応し、向かって右へ行くほど周波数が高く、向かって左へ行くほど周波数が低いことを示す。一方で、縦軸は、相違度[f]に対応し、上へ行くほど相違度が大きく、下へ行くほど相違度が小さいことを示す。縦軸には、相違度[f]の大きさを色で表すカラーバー36aが添えられている。このカラーバー36aは、相違度[f]が大きくなるに従い、濃紫(相違度[f]=0.0のとき)→紫→藍→青→緑→黄→橙→赤→濃赤(相違度[f]=2.0のとき)の順で変化するグラデーションで着色されている。
【0091】
信号表示部36には、入力信号の周波数fと相違度[f]に応じた点を中心とする円36bが表示される。この座標(周波数f,相違度[f])は、成分選別部330のS333の処理により算出された値に基づき、CPU11により算出される。円36bの色は、その中心の座標が示す相違度[f]に対するカラーバー36aの色が着色される。また、円36bの半径は、その周波数fの入力信号のLv[f]を表し、Lv[f]が大きい程、大きな半径となる。なお、Lv[f]は、S331の処理(成分選別部330)により算出された値である。よって、ユーザは、信号表示部36に表示された円36bの色と大きさ(半径)とから、感覚的に、相違度[f]とLv[f]とを認識することができる。
【0092】
信号表示部36に表示される複数の指定点36cは、成分選別部330のS334の判定に使用する設定範囲を規定するための点であり、境界線36dは、隣接する指定点36cを結ぶ直線であり、該設定範囲の境界を規定する線である。境界線36dと、信号表示部36の上辺(即ち、相違度[f]の最大値)とにより囲まれた範囲36eが、成分選別部330のS334の判定に使用する設定範囲となる。
【0093】
指定点36cの数および各位置の初期値はROM12に予め格納されている。ユーザは、入力装置23を用いて、指定点36cの数を増減させたり、位置を変更することにより、最適な設定範囲を設定することができる。例えば、入力装置23がマウスであれば、指定点36cを増加させたい付近の境界線36dの上にカーソルを置き、左ボタンを押すことにより、指定点36cを追加することができる。このとき、指定点36cは選択状態にあるので、左ボタンを押したまま、マウスを移動させることにより、適切な位置に移動させることができる。また、削除したい指定点36cの上にカーソルを置き、右ボタンをクリックすることにより表示されたメニューから削除を選択することにより、指定点36cを削除することができる。また、移動したい指定点36cの上にカーソルを置き、左ボタンを押すと、その指定点36cが選択状態になるので、左ボタンを押したままでマウスを移動させることにより、適切な位置に移動させることができる。なお、選択状態は、左ボタンを離すことによって解除される。
【0094】
信号表示部36に表示される円36bのうち、その中心が範囲36eの内部(境界を含む)に含まれる円36b1に対応する信号が、成分選別部330のS334の判定において、相違度[f]がその周波数fにおける設定範囲内にある信号であると判定される。一方で、その中心が範囲36eから外れる円36b2に対応する信号が、成分選別部330のS334の判定において、設定範囲外にある信号であると判定される。
【0095】
以上、説明した通り、本実施形態のエフェクタ1によれば、マルチトラックデータ21aにおける、ユーザ指定された楽器の演奏音が録音されているトラック以外のトラックの再生信号であるIN_B[t]を、遅延部200により遅延させることにより、ユーザ指定された楽器の演奏音が録音されているトラックのデータIN_P[t]に含まれるG[B[t]]、即ち、音場空間の特性G[t]により変化されたかぶり音の信号B[t]を模倣した信号であるIN_Bd[t]を得ることができる。このIN_Bd[t]と、IN_P[t]とをそれぞれ周波数分析した信号の、周波数f毎のレベル比(|POL_1[f]の動径|/|POL_2[f]の動径|)は、そのレベル比が高い程、IN_Bd[t]に含まれていない信号成分(つまり、IN_P[t]に含まれるかぶり取り音の信号P[t])が多いことを示すので、このレベル比を、IN_P[t]に含まれるかぶり取り音の信号(P[t])と、かぶり音の信号B[t]とを区別する指標とすることができる。よって、このレベル比に応じて、IN_P[t]から、かぶり取り音の信号P[t]を抽出することができる。
【0096】
かかるP[t]の抽出は、周波数特性やレベル比に注目して行っており、擬似的に生成した波形の時間軸上での差し引きを伴うものではないので、容易であるとともに、良好な音質で抽出できる。また、逆相波による、音像空間におけるB[t]の打ち消しを伴うものでもないので、聴衆位置が限定的になることもない。
【0097】
また、本実施形態のエフェクタ1によれば、IN_P[t]から、かぶり音(B[t])を抽出することができるので、IN_P[t]からどのような音が除去されるかをユーザに聴かせることができ、P[t]を適切に抽出させるための感覚的な情報を与えることができる。
【0098】
次に、図7から図12を参照して本発明の第2実施形態について説明する。上述した第1実施形態では、エフェクタ1が、1つの楽器の演奏音が主要音として録音されているトラックからの収録音から、かぶり音を除去したかぶり取り音を抽出できるものであった。これに対し、第2実施形態のエフェクタ1(図7参照)は、1つの収音装置(例えば、マイク)により収音された音から、残響音を除去することができるものである。なお、この第2実施形態において、上述した第1実施形態と同一の部分には同一の符号を付して、その説明は省略する。
【0099】
図7は、第2実施形態のエフェクタ1の構成を示すブロック図である。第2実施形態のエフェクタ1は、CPU11と、ROM12と、RAM13と、DSP14と、Lch用A/D20Lと、Rch用A/D20Rと、Lch用D/A15Lと、Rch用D/A15Rと、表示装置用I/F16と、入力装置用I/F17と、バスライン19とを有している。なお、「A/D」とは、アナログデジタルコンバータである。各部11〜14,15L,15R,16,17,20L,20Rは、バスライン19を介して互いに電気的に接続されている。
【0100】
第2実施形態のエフェクタ1において、ROM12に格納される制御プログラム12aには、図8〜10を参照して後述するDSP14により実行される各処理の制御プログラムが含まれている。Lch用A/D20Lは、IN_L端子から入力された左チャンネル信号を、アナログ信号からデジタル信号へ変換するコンバータであり、Rch用A/D20Rは、IN_R端子から入力された右チャンネル信号を、アナログ信号からデジタル信号へ変換するコンバータである。
【0101】
次に、図8を参照して、第2実施形態のエフェクタ1におけるDSP14の機能について説明する。図8は、第2実施形態のDSP14の機能を示す機能ブロック図である。この第2実施形態におけるDSP14は、Lch用A/D20LおよびRch用A/D20Rを介して1つの収音装置(例えば、マイク)から入力された左右2チャンネルの入力信号から、原音の信号と、音場空間での反射により生じた残響音の信号をと選別し、選別された原音又は残響音の信号のいずれかを抽出して、Lch用D/A15LおよびRch用D/A15Rへ出力する処理を実行する。
【0102】
本実施形態のDSP14に形成される機能ブロックは、Lch初期反射成分生成部500Lと、Rch初期反射成分生成部500Rと、第1処理部600と、第2処理部700とから構成される。
【0103】
Lch初期反射成分生成部500Lは、Lch用A/D20Lからの入力信号であるIN_PL[t]から、左チャンネルの音に含まれる初期反射音の擬似的な信号であるIN_BL[t]を生成して、第1処理部600の第2Lch周波数分析部620Lと、第2処理部700の第2Lch周波数分析部720Lとにそれぞれ入力する。なお、Lch初期反射成分生成部500Lの機能の詳細については、図9を参照して後述する。
【0104】
Rch初期反射成分生成部500Rは、Rch用A/D20Rからの入力信号であるIN_PR[t]から、右チャンネルの音に含まれる初期反射音の擬似的な信号であるIN_BR[t]を生成して、第1処理部600の第2Rch周波数分析部620Rと、第2処理部700の第2Rch周波数分析部720Rとにそれぞれ入力する。このRch初期反射成分生成部500Rの機能は、上述したLch初期反射成分生成部500Lと同様であるので、その詳細な説明は、図9を参照して後述するLch初期反射成分生成部500Lの機能の説明に代えるものとする。
【0105】
第1処理部600および第2処理部700は、Lch用A/D20Lからの入力信号であるIN_PL[t]と、Lch初期反射成分生成部500Lから供給されたIN_BL[t]とに対し、ならびに、Rch用A/D20Rからの入力信号であるIN_PR[t]と、Rch初期反射成分生成部500Rから供給されたIN_BR[t]とに対し、同一の処理をそれぞれ所定時間毎に繰り返して実行することにより、両チャンネルの原音の信号OrL[t],OrR[t]、又は、残響音の信号BL[t],BR[t]のいずれかを出力する。第1処理部600および第2処理部700のそれぞれから出力されたOrL[t],OrR[t]、又は、BL[t],BR[t]は、チャンネル毎にクロスフェードで合成されて、OUT_OrL[t],OUT_OrR[t]、又は、OUT_BL[t],OUT_BR[t]として出力される。DSP14から、OUT_OrL[t]とOUT_OrR[t]とが出力された場合には、これらの信号は、それぞれ、Lch用D/A15LとRch用D/A15Rとに入力される。一方で、DSP14から、OUT_BL[t]とOUT_BR[t]とが出力された場合には、これらの信号は、それぞれ、Lch用D/A15LとRch用D/A15Rとに入力される。
【0106】
より詳細には、第1処理部600は、Lch用A/D20Lから入力された左チャンネルの入力信号(IN_PL[t])を処理するための機能として、第1Lch周波数分析部610Lと、第2Lch周波数分析部620Lと、Lch成分選別部630Lと、第1Lch周波数合成部640Lと、第2Lch周波数合成部650Lと、Lchセレクタ部660Lとを有している。
【0107】
第1Lch周波数分析部610Lは、Lch用A/D20Lから入力されたIN_PL[t]に対し、窓関数としてハニング窓をかけ、高速フーリエ変換処理(FFT処理)に供して周波数領域の信号に変換した後、極座標系に変換し、その変換により得られた極座標系で表される周波数領域の左チャンネル信号であるPOL_1L[f]を、Lch成分選別部630Lへ出力する。第1Lch周波数分析部610Lで実行される各処理内容は、入力がIN_PL[t]に変わり、それに伴い、出力がPOL_1L[f]に変わること以外、上述した第1実施形態におけるS311〜S313の処理と同様であるので、その詳細な説明は省略する。
【0108】
第2Lch周波数分析部620Lは、Lch初期反射成分生成部500Lから供給されたIN_BL[t]に対し、窓関数としてハニング窓をかけ、FFT処理に供して周波数領域の信号に変換した後、極座標系に変換し、その変換により得られた極座標系で表される周波数領域の左チャンネル信号であるPOL_2L[f]を、Lch成分選別部630Lへ出力する。第2Lch周波数分析部620Lで実行される各処理内容は、入力がIN_BL[t]に変わり、に変わり、それに伴い、出力がPOL_2L[f]に変わること以外、上述した第1実施形態におけるS321〜S323の処理と同様であるので、その詳細な説明は省略する。
【0109】
Lch成分選別部630Lは、第1Lch周波数分析部610Lから供給されたPOL_1L[f]の動径の絶対値と、第2Lch周波数分析部620Lから供給されたPOL_2L[f]の動径の絶対値との比(即ち、レベル比)に基づき、極座標系で表される周波数領域の原音の左チャンネル信号を、POL_3L[f]として、第1Lch周波数合成部640Lへ出力すると共に、極座標系で表される周波数領域の残響音の左チャンネル信号を、POL_4L[f]として、第2Lch周波数合成部650Lへ出力する。なお、このLch成分選別部630Lで実行される詳細な処理については、図10を参照して後述する。
【0110】
第1Lch周波数合成部640Lは、Lch成分選別部630Lから供給されたPOL_3L[f]を、極座標系から直交座標系へ変換した後、逆高速フーリエ変換処理(逆FFT処理)に供し、第1Lch周波数分析部610Lでかけたものと同じ窓関数(本実施形態では、ハニング窓)をかけ、それにより得られた直交座標系で表される時間領域の原音の左チャンネル信号であるOrL[t]を、Lchセレクタ部660Lへ出力する。第1Lch周波数合成部640Lで実行される各処理内容は、入力がPOL_3L[f]に変わり、それに伴い、出力がOrL[t]に変わること以外、上述した第1実施形態におけるS341〜S343の処理と同様であるので、その詳細な説明は省略する。
【0111】
第2Lch周波数合成部650Lは、Lch成分選別部630Lから供給されたPOL_4L[f]を、極座標系から直交座標系へ変換した後、逆FFT処理に供し、第2Lch周波数分析部620Lでかけたものと同じ窓関数(本実施形態では、ハニング窓)をかけ、それにより得られた直交座標系で表される時間領域の残響音の左チャンネル信号であるBL[t]を、Lchセレクタ部660Lへ出力する。第2Lch周波数合成部650Lで実行される各処理内容は、入力がPOL_4L[f]に変わり、それに伴い、出力がBL[t]に変わること以外、上述した第1実施形態におけるS351〜S353の処理と同様であるので、その詳細な説明は省略する。
【0112】
Lchセレクタ部660Lは、ユーザの指定に基づき、第1Lch周波数合成部640Lから供給されたOrL[t]か、第2Lch周波数合成部650Lから供給されたBL[t]のいずれかを出力する。つまり、Lchセレクタ部660Lからは、原音の左チャンネル信号であるOrL[t]、又は、残響音の左チャンネル信号であるBL[t]のいずれかが、ユーザの指定に応じて出力される。
【0113】
また、第1処理部600は、右チャンネルの信号を処理するための機能として、第1Rch周波数分析部610Rと、第2Rch周波数分析部620Rと、Rch成分選別部630Rと、第1Rch周波数合成部640Rと、第2Rch周波数合成部650Rと、Rchセレクタ部660Rとを有している。
【0114】
第1Rch周波数分析部610Rは、Rch用A/D20Rから入力されたIN_PR[t]に対し、窓関数としてハニング窓をかけ、FFT処理に供して周波数領域の信号に変換した後、極座標系に変換し、その変換により得られた極座標系で表される周波数領域の右チャンネル信号であるPOL_1R[f]を、Rch成分選別部630Rへ出力する。第1Rch周波数分析部610Rで実行される各処理内容は、入力がIN_PR[t]に変わり、それに伴い、出力がPOL_1R[f]に変わること以外、上述した第1実施形態におけるS311〜S313の処理と同様であるので、その詳細な説明は省略する。
【0115】
第2Rch周波数分析部620Rは、Rch初期反射成分生成部500Rから供給されたIN_BR[t]に対し、窓関数としてハニング窓をかけ、FFT処理に供して周波数領域の信号に変換した後、極座標系に変換し、その変換により得られた極座標系で表される周波数領域の右チャンネル信号であるPOL_2R[f]を、Rch成分選別部630Rへ出力する。第2Rch周波数分析部620Rで実行される各処理内容は、入力がIN_BR[t]に変わり、に変わり、それに伴い、出力がPOL_2R[f]に変わること以外、上述した第1実施形態におけるS321〜S323の処理と同様であるので、その詳細な説明は省略する。
【0116】
Rch成分選別部630Rは、第1Rch周波数分析部610Rから供給されたPOL_1R[f]の動径の絶対値と、第2Rch周波数分析部620Rから供給されたPOL_2R[f]の動径の絶対値との比(レベル比)に基づき、極座標系で表される周波数領域の原音の右チャンネル信号を、POL_3R[f]として、第1Rch周波数合成部640Rへ出力すると共に、極座標系で表される周波数領域の残響音の右チャンネル信号を、POL_4R[f]として、第2Rch周波数合成部650Rへ出力する。なお、このRch成分選別部630Rで実行される各処理内容は、入力が、右チャンネルの信号であるPOL_1R[f]及びPOL_2R[f]に変わり、それに伴い、出力が、右チャンネルの信号であるPOL_3R[f]及びPOL_3R[f]に変わること以外、上述したLch成分選別部630Lと同様である。よって、その詳細な説明は、図10を参照して後述するLch成分選別部630Lで実行される処理の説明に代えるものとする。
【0117】
第1Rch周波数合成部640Rは、Rch成分選別部630Rから供給されたPOL_3R[f]を、極座標系から直交座標系へ変換した後、逆FFT処理に供し、第1Rch周波数分析部610Rでかけたものと同じ窓関数(本実施形態では、ハニング窓)をかけ、それにより得られた直交座標系で表される時間領域の原音の右チャンネル信号であるOrR[t]を、Rchセレクタ部660Rへ出力する。第1Rch周波数合成部640Rで実行される各処理内容は、入力がPOL_3R[f]に変わり、それに伴い、出力がOrR[t]に変わること以外、上述した第1実施形態におけるS341〜S343の処理と同様であるので、その詳細な説明は省略する。
【0118】
第2Rch周波数合成部650Rは、Rch成分選別部630Rから供給されたPOL_4R[f]を、極座標系から直交座標系へ変換した後、逆FFT処理に供し、第2Rch周波数分析部620Rでかけたものと同じ窓関数(本実施形態では、ハニング窓)をかけ、それにより得られた直交座標系で表される時間領域の残響音の右チャンネル信号であるBR[t]を、Rchセレクタ部660Rへ出力する。第2Rch周波数合成部650Rで実行される各処理内容は、処理対象がPOL_4R[f]に変わり、それに伴い、出力信号がBR[t]に変わること以外、上述した第1実施形態におけるS351〜S353の処理と同様であるので、その詳細な説明は省略する。
【0119】
Rchセレクタ部660Rは、ユーザの指定に基づき、第1Rch周波数合成部640Rから供給されたOrR[t]か、第2Rch周波数合成部650Rから供給されたBR[t]のいずれかを出力する。つまり、Rchセレクタ部660Rからは、原音の右チャンネル信号であるOrR[t]、又は、残響音の右チャンネル信号であるBR[t]のいずれかが、ユーザの指定に応じて出力される。
【0120】
このように、第1処理部600は、LchA/D20L及びRchA/D20Rから入力された左右チャンネルの入力信号(IN_PL[t],IN_PR[t])から、原音の左右チャンネル信号(OrL[t],OrR[t])、又は、残響音の左右チャンネル信号(BL[t],BR[t])を、ユーザの所望に応じて出力することができる。
【0121】
第2処理部700は、Lch用A/D20Lから入力された左チャンネルの入力信号(IN_PL[t])を処理するための機能として、第1Lch周波数分析部710Lと、第2Lch周波数分析部720Lと、Lch成分選別部730Lと、第1Lch周波数合成部740Lと、第2Lch周波数合成部750Lと、Lchセレクタ部760Lとを有している。これらの各部710L〜760Lは、それぞれ、第1処理部600の各部610L〜660Lと同様に機能し、同じ信号を出力する。
【0122】
即ち、Lch第1周波数分析部710Lは、Lch第1周波数分析610Lと同様に機能してPOL_1L[f]を出力する。Lch第2周波数分析部720Lは、Lch第2周波数分析620Lと同様に機能してPOL_2L[f]を出力する。Lch成分選別部730Lは、Lch成分選別部630Lと同様に機能してPOL_3L[f]およびPOL_4L[f]を出力する。Lch第1周波数分析部740Lは、Lch第1周波数分析部640Lと同様に機能してOrL[t]を出力する。Lch第2周波数分析部750Lは、Lch第2周波数分析部650Lと同様に機能してBL[t]を出力する。Lchセレクタ部760Lは、Lchセレクタ部660Lと同様に機能してOrL[t]またはBL[t]のいずれかを出力する。
【0123】
また、第2処理部700は、Rch用A/D20Rから入力された右チャンネルの入力信号(IN_PR[t])を処理するための機能として、第1Rch周波数分析部710Rと、第2Rch周波数分析部720Rと、Rch成分選別部730Rと、第1Rch周波数合成部740Rと、第2Rch周波数合成部750Rと、Rchセレクタ部760Rとを有している。これらの各部710R〜760Rは、それぞれ、第1処理部600の各部610R〜660Rと同様に機能し、同じ信号を出力する。
【0124】
即ち、Rch第1周波数分析部710Rは、Rch第1周波数分析610Rと同様に機能してPOL_1R[f]を出力する。Rch第2周波数分析部720Rは、Rch第2周波数分析620Rと同様に機能してPOL_2R[f]を出力する。Rch成分選別部730Rは、Rch成分選別部630Rと同様に機能してPOL_3R[f]およびPOL_4R[f]を出力する。Rch第1周波数分析部740Rは、Rch第1周波数分析部640Rと同様に機能してOrR[t]を出力する。Rch第2周波数分析部750Rは、Rch第2周波数分析部650Rと同様に機能してBR[t]を出力する。Rchセレクタ部760Rは、Rchセレクタ部660Rと同様に機能してOrR[t]またはBR[t]のいずれかを出力する。
【0125】
第1処理部600で実行される処理の実行間隔と、第2処理部700で実行される処理の実行間隔とは同じであり、本実施形態では、この実行間隔は0.1秒である。また、第2処理部700で実行される処理は、第1処理部600における処理の実行開始から所定時間(本実施形態では、半周期後である0.05秒)だけ遅れて開始される。なお、第1処理部600及び第2処理部700の実行間隔や、第1処理部600における処理の実行開始から第2処理部700における処理の実行開始までの遅延時間は、サンプリング周波数と楽音信号の数とに応じた値を適宜使用できる。
【0126】
次に、図9を参照して、上述したLch初期反射成分生成部500Lの機能について説明する。図9(a)は、Lch初期反射成分生成部500Lの機能を示すブロック図である。Lch初期反射成分生成部500Lは、FIRフィルタであり、第1〜第N遅延素子501L−1〜501L−Nと、N個の乗算器502L−1〜502L−Nと、加算器503Lとから構成される。なお、Nは、1以上の整数である。
【0127】
遅延素子501L−1〜501L−Nは、Lch用A/D20Lから入力された左チャンネルの入力信号であるIN_PL[t]を、各遅延素子に対して規定された遅延時間TL1〜TLNだけ遅延する素子である。これらの遅延素子501L−1〜501L−Nは、それぞれ、遅延時間TL1〜TLNだけ遅延させることにより得られた信号を、対応する乗算器502L−1〜502L−Nへ出力する。
【0128】
乗算器502L−1〜502L−Nは、それぞれ、レベル係数CL1〜CLN(いずれも1.0以下の正数)を、対応する遅延素子501L−1〜501L−Nから供給された信号に乗算し、加算器503Lへ出力する。加算器503Lは、乗算器502L−1〜502L−Nから出力された信号を全て加算し、それにより得られた信号であるIN_BL[t]を、第1処理部600の第2Lch周波数分析部620Lと、第2処理部700の第2Lch周波数分析部720Lとにそれぞれ入力する。
【0129】
Lch初期反射成分生成部500Lにおける遅延素子501L−1〜501L−Nの数(即ち、N)、遅延時間TL1〜TLN、及びレベル係数CL1〜CLNは、後述するUI画面40(図12参照)におけるLch初期反射パターン設定部41Lをユーザが操作することによって適宜設定される。遅延素子501L−1〜501L−Nの数を、音場空間における反射位置の数に設定し、各遅延素子に対して遅延時間TL1〜TLNとレベル係数CL1〜CLNを設定することにより、図9(b)に示すようなインパルス応答IrL1〜IrLNが得られ、これらのインパルス応答IrL1〜IrLNを、IN_PL[t]に対して畳み込むことにより、IN_BL[t]が生成される。
【0130】
ここで、N箇所の反射位置がある場合、Lch初期反射成分生成部500Lにおいて生成されるIN_BL[t]は、『IN_BL[t]=IN_PL[t]×CL1×Z−m1+IN_PL[t]×CL2×Z−m2+・・・+IN_PL[t]×CLN×Z−mN』と表すことができる。なお、Zは、Z変換の伝達関数であり、その伝達関数Zの指数(−m1,−m2,・・・,−mN)は、それぞれ、遅延時間TL1〜TLNに応じて決定される。
【0131】
図9(b)は、図9(a)に示したLch初期反射成分生成部500Lにおいて、入力信号(即ち、IN_PL[t])に対して畳み込まれるインパルス応答を示す模式図である。なお、図9(b)において、横軸は時刻に対応し、縦軸はレベルに対応する。第1のインパルス応答IrL1は、遅延時間TL1におけるレベルCL1のインパルス応答であり、第2のインパルス応答IrL2は、遅延時間TL2におけるレベルCL2のインパルス応答である。そして、第Nのインパルス応答IrLNは、遅延時間TLNにおけるレベルCLNのインパルス応答である。
【0132】
各インパルス応答IrL1,IrL2,…IrLNは、音場空間の残響特性Gb[t]を反映する。一方で、一般的に、マイクなどの収音装置により収音された音(即ち、Lch用A/D20Lから入力された音)の左チャンネルの信号であるIN_PL[t]は、原音の左チャンネル信号(OrL[t])と、原音の左チャンネル信号OrL[t]が音場空間の残響特性Gb[t]により変化された残響音の信号との混合音となる。つまり、『IN_PL[t]=OrL[t]+Gb[OrL[t]]』である。上述した通り、インパルス応答IrL1〜IrLNは、遅延素子の数N、遅延時間TL1〜TLN、及びレベル係数CL1〜CLNを、UI画面40を用いて設定することにより得ることができる。よって、これらのインパルス応答IrL1〜IrLNを適切に設定し、左チャンネルの入力信号であるIN_PL[t]を畳み込むことにより、IN_PL[t]から、左チャンネルの残響音成分(Gb[OrL[t]]を適切に模倣したIN_BL[t]を生成し、出力することができる。
【0133】
一方、図示はしないが、Rch初期反射成分生成部500Rも、上述したLch初期反射成分生成部500Lと同様のFIRフィルタとして構成される。このRch初期反射成分生成部500Rには、右チャンネルの信号であるIN_PR[t]が入力され、出力信号としてIN_BR[t]が第2Rch周波数分析部620R,720Rに出力される。
【0134】
ただし、本実施形態では、Rch初期反射成分生成部500Rに含まれる遅延素子の数N’は、Lch初期反射成分生成部500Lに含まれる遅延素子501L−1〜501L−Nの数(即ち、N)とは独立して設定できるように構成されている。また、Rch初期反射成分生成部500Rの各遅延素子の遅延時間TR1〜TRN’や、各遅延素子からの出力に乗算するレベル係数CR1〜CRN’についても、Lch初期反射成分生成部500Lの設定(TL1〜TLN,CL1〜CLN)とは独立して設定できるように構成されている。なお、遅延素子の数N’、遅延時間TR1〜TRN’、及びレベル係数CR1〜CRN’は、後述するUI画面40(図12参照)におけるRch初期反射パターン設定部41Rをユーザが操作することによって適宜設定される。
【0135】
Rch初期反射成分生成部500Rにおいて生成されるIN_BR[t]は、『IN_BR[t]=IN_PR[t]×CR1×Z−m’1+IN_PR[t]×CR2×Z−m’2+・・・+IN_PR[t]×CRN’×Z−m’N’』と表すことができる。Zは、Z変換の伝達関数であり、その伝達関数Zの指数(−m’1,−m’2,・・・,−m’N’)は、それぞれ、遅延時間TR1〜TRN’に応じて決定される。そして、遅延素子の数N’、遅延時間TR1〜TRN’、及びレベル係数CR1〜CRN’を適切に設定することにより、右チャンネルの入力信号であるIN_PR[t]から、右チャンネルの残響音成分(Gb’[OrR[t]])を適切に模倣したIN_BR[t]を生成することができる。
【0136】
次に、図10を参照して、上述したLch成分選別部630Lの機能について説明する。図10は、Lch成分選別部630Lで実行される処理を、機能ブロックを用いて模式的に示す図である。なお、図示を省略するが、第2処理部700のLch成分選別部730Lにおいても、図10に示す各処理と同様の処理が実行される。
【0137】
Lch成分選別部630Lでは、まず、各周波数fについて、POL_1L[f]の動径とPOL_2L[f]の動径とを比較し、動径の絶対値の大きい方をLv[f]に設定する(S631)。S631により設定されたLv[f]は、CPU11に供給されて、後述するUI画面40(図12参照)の信号表示部45の表示を制御するために使用される。S631の処理後、各周波数fにおけるPOL_3L[f]およびPOL_4L[f]をゼロに初期化する(S632)。
【0138】
S632の処理後、各周波数fに対する|POL_2L[f]の動径|の減衰を鈍らせるためにS633の処理を実行する。具体的に、S633の処理では、まず、周波数f毎に、wk_L[f]=wk’_L[f]×減衰量Eに基づき、wk_L[f]を算出する。なお、wk_L[f]は、今回の相違度[f]の算出(後述するS634の処理)において|POL_1L[f]の動径|と比較するために使用する値であり、補正後の(即ち、鈍らせた後の)|POL_2L[f]の動径|である。また、wk’_L[f]は、前回の相違度[f]の算出に使用したwk_L[f]であり、前回の処理時にRAM13内の所定領域に記憶された値である。また、減衰量Eは、ユーザがUI画面40(図12参照)により設定する値である。
【0139】
つまり、前回の相違度[f]の算出に使用したwk’_L[f]に減衰量Eをかけることにより、wk_L[f]を算出する。ただし、初回のPOL_2L[f]については、wk_L[t]=|POL_2L[f]の動径|である。
【0140】
次に、上記のように算出したwk_L[f]を、Lch成分選別部630Lに供給された今回のPOL_2L[f]の動径の絶対値(即ち、補正する前の|POL_2L[f]の動径|)と比較する。
【0141】
この比較の結果、wk_L[f]<|POL_2L[f]の動径|であれば、wk_L[f]=|POL_2L[f]の動径|とする。一方で、wk_L[f]≧|POL_2L[f]の動径|であれば、wk_L[f]=wk_L[f]、即ち、wk’_L[f]×減衰量Eにより得られた値をwk_L[f]とする。ただし、wk_L[f]の値は0.0以上に制限される。そして、比較の結果として設定されたwk_L[f]の値を、次回のPOL_2L[f]に対する処理に使用するために、wk’_L[f]としてRAM13内の所定領域に記憶しておく。
【0142】
よって、S663の処理によれば、Lch成分選別部630Lに供給された今回のPOL_2L[f]の動径の絶対値が、前回の相違度[f]の算出に使用した値(wk’_L[f])から、所定量以上に減衰した場合には、前回の相違度[f]の算出に使用した値に減衰量Eをかけた値が、wk_L[f]として採用され、前回からの減衰が所定の範囲内であれば、今回、実際に供給されたPOL_2L[f]の動径の絶対値が、wk_L[f]として採用される。その結果、初期反射成分の信号のレベル(即ち、POL_2L[f]の動径)の減衰が鈍らされ、その減衰を緩やかにすることができる。これにより、大音量後の反射音が到達した後に続く比較的レベルの低い残響音を捕らえることができる。その説明については、図11を参照して後述する。
【0143】
S633の処理後、周波数f毎に、その周波数fにおける相違度[f]として、補正後のPOL_2[f](即ち、wk_L[t])のレベルに対するPOL_1L[f]のレベルの比(レベル比)を算出する(S634)。つまり、S634では、相違度[f]=|(POL_1[f]の動径|/wk_L[f])を算出する。このように、相違度[f]とは、POL_1L[f]のレベルとwk_L[t]とのレベル比に応じて規定される値であり、POL_1L[f]に対応する入力信号(IN_PL[t])と、POL_2[f]に対応する入力信号(IN_PL[t]の初期反射成分の信号であるIN_BL[t])との相違の度合いを示す値である。なお、S634において、相違度[f]は、0.0〜2.0の範囲に制限する。また、wk_L[f]が0.0である場合もまた、相違度[f]=2.0とする。S634により算出された相違度[f]は、S635以降の処理に使用すると共に、CPU11に供給されて、後述するUI画面40(図12参照)の信号表示部45の表示を制御するために使用される。
【0144】
次いで、S634の処理により得られた相違度[f]を、POL_1L[f]の大きさ(|POL_1L[f]の動径|)に応じて操作するためにS635の処理を実行する。具体的に、S635の処理では、まず、周波数f毎に、|POL_1L[f]の動径|を、予め決められている定数(例えば、50.0)で除すことにより、大きさXを算出する(S635)。ただし、大きさXの値は、0.0〜1.0に制限する(即ち、0.0≦大きさX≦1.0)。
【0145】
大きさXを算出した後、S634の処理により得られた相違度[f]から、(1.0−大きさX)に操作量Fをかけたものを差し引くことにより、相違度[f]の操作を行う。なお、操作量Fは、ユーザがUI画面40(図12参照)により設定する値である。
【0146】
ここで、POL_1L[f]の大きさ(即ち、|POL_1L[f]の動径|)が小さい程、(1.0−大きさX)の値は大きくなる。よって、POL_1L[f]が小さいもの程、S634の処理により得られた相違度[f]から差し引かれる値が大きくなるので、S635の処理により得られる相違度[f]は小さくなる。よって、ある程度の小ささのPOL_1L[f]については、次のS636の判定で残響音であると判定させることができる。このS635の処理により、後部残響音を捕らえることができる。
【0147】
S635の処理後、相違度[f]が、その周波数fにおける設定範囲内かを、周波数f毎に判定する(S636)。なお、「その周波数fにおける設定範囲」は、後述するUI画面40(図12参照)を用いてユーザにより設定された、ある周波数fにおいて、原音とする相違度[f]の範囲である。よって、ある周波数fにおける設定範囲内にある相違度[f]は、その周波数fでのPOL_1L[f]が原音の信号であることを示す。上述したS631からS639の処理を、フーリエ変換された周波数fの範囲で繰り返し実行する。
【0148】
S636の判定が肯定される場合には(S636:Yes)、POL_3L[f]をPOL_1L[f]とし(S637)、否定される場合には(S636:No)、POL_4L[f]をPOL_1L[f]とする(S637)。よって、POL_3L[f]は、POL_1L[f]から抽出された原音に相当する信号である。その一方で、POL_4L[f]は、POL_1L[f]から抽出された残響音に相当する信号である。
【0149】
S637又はS638の処理後、各周波数fのPOL_3L[f]を、第1Lch周波数合成部640Lへ出力すると共に、各周波数fのPOL_4L[f]を、第2周波数合成部650Lへ出力する(S639)。よって、S636の判定が肯定されてS637の処理が実行された周波数fでは、S639の処理により、POL_3L[f]として、POL_1L[f]が第1Lch周波数合成部640Lへ出力されると共に、POL_4L[f]として、0.0が第2Lch周波数合成部650Lへ出力される。一方で、S636の判定が否定されてS638の処理が実行された周波数fでは、S639の処理により、POL_3L[f]として、0.0が第1Lch周波数合成部650Lへ出力されると共に、POL_4L[f]として、POL_1L[f]が第2Lch周波数合成部350Lへ出力される。
【0150】
なお、図10に示す処理を、第2処理部700のLch成分選別部730Lに適用する場合には、POL_3L[f]を、第1Lch周波数合成部740Lへ出力し、POL_4L[f]を、第2Lch周波数合成部750Lへ出力する。
【0151】
また、図示を省略するが、右チャンネル信号に対して行うRch成分選別部630R,730Rは、入力信号が右チャンネル信号であるPOL_1R[f]及びPOL_2R[f]に変わり、出力信号が、POL_1R[f]から抽出された原音に相当する信号であるPOL_3R[f]と、POL_1R[f]から抽出された残響音に相当する信号であるPOL_4R[f]とに変わり、その出力信号が、第2Rch周波数合成部650R(Rch成分選別部630Rの場合)、又は、第2Rch周波数合成部750R(Rch成分選別部730Rの場合)に出力されること以外は、図10に示した各処理と同様の処理が実行される。
【0152】
次に、図11を参照して、上述したS633の処理による効果について説明する。図11は、ある周波数fにおいて、|POL_1L[f]の動径|を一定にしたときの、|POL_2L[f]の動径|の減衰を鈍らせない場合(即ち、S633の処理の実行前)と、鈍らせた場合(即ち、S633の処理の実行後)とを比較するための説明図である。なお、図11では、左チャンネル信号を例示して説明するが、右チャンネル信号についても同様である。
【0153】
図11において、横軸は時刻に対応し、向かって右へ行くほど、時刻が進んでいることを示す。する。一方で、向かって左側の縦軸は|POL_2L[f]の動径|に対応し、向かって右側の縦軸は相違度[f]に対応し、どちらの縦軸も上へ行くほど、その値が大きくなる。
【0154】
ソリッドのハッチングがなされたバー(以下、「ソリッドのバー」と称す)は、|POL_2L[f]の動径|の減衰を鈍らせない場合(即ち、S633の処理の実行前)の動径を、縦軸方向の高さにより表したものである。一方、斜線のハッチングがなされたバー(以下、「斜線のバー」と称す)は、S633の処理が実行されて|POL_2L[f]の動径|の減衰を鈍らせた後の動径を縦軸方向の高さにより表したものである。
【0155】
なお、時刻t1と時刻t8では、斜線のバーが表示されていないが、これらの時刻t1,t8では、S633の処理の前後で|POL_2L[f]の動径|が等しいために、ソリッドのバーと斜線のバーとは高さが等しく互いに重なっているからである。つまり、時刻t1は、初回のPOL_2L[f]であり、時刻t8では、前回の動径からの減衰が所定の範囲内であったことを示す。
【0156】
一方、時刻t2〜t7では、ソリッドのバーの高さより、斜線のバーの高さの方が高くなっている。つまり、これらの時刻t2〜t7では、前回の動径からの減衰が所定量以上であったために、wk’_L[f]に減衰量Eをかけた値に補正され、それにより、|POL_2L[f]の動径|の減衰が緩やかにされている。
【0157】
また、各時刻t1〜t12に対して引かれた一点鎖線D1〜D12は、|POL_2L[f]の動径|の減衰を鈍らせなかった場合に算出される相違度[f]を示す。なお、D1,D8は、それぞれ、太線D1’,D’8に重なっている。一方で、太線D’1〜D’12は、|POL_2L[f]の動径|の減衰を鈍らせた場合に算出される相違度[f]を示す。
【0158】
例えば、時刻t1において大音量後の反射音が到達した場合、時刻t2におけるソリッドバーの高さが、時刻t1におけるソリッドバーの高さに比較して急激に低くなり、それに伴い、相違度[f]が、一点鎖線D1から一点鎖線D2へと急激に増加する。相違度[f]が急激に大きくなったことにより、S636において原音の信号であると判断されてしまい、大音量後の反射音が到達した後に続く比較的レベルの低い残響音を捕らえることができない可能性がある。
【0159】
これに対し、本実施形態のエフェクタ1では、|POL_2L[f]の動径|の減衰を鈍らせる(即ち、減衰を緩やかにした)ことにより、上記のような相違度[f]の急激な増加を抑制することができるので、大音量後の反射音が到達した後に続く比較的レベルの低い残響音を捕らえることができる。
【0160】
図12は、表示装置22の表示画面に表示されたUI画面40の一例を示す模式図である。UI画面40は、Lch初期反射パターン設定部41Lと、Rch初期反射パターン設定部41Rと、減衰量設定部42と、操作量設定部43と、切り替えボタン44と、信号表示部45とを有している。
【0161】
Lch初期反射パターン設定部41Lは、Lch初期反射成分生成部500Lにおいて、入力信号(IN_PL[t])から、擬似的な初期反射音の左チャンネル信号(IN_BL[t])を生成するためのパラメータを設定するための画面であり、横軸が時刻に対応し、縦軸がレベルに対応する。このLch初期反射パターン設定部41Lには、ユーザが入力装置23を操作して設定したバー41Laが表示される。
【0162】
バー41Laの数は、音場空間における左チャンネル信号の反射位置の数Nに相当する。なお、図12に示す例では、4本のバー41Laが表示されているので、Nとして「4」が設定されている。また各バー41Laの横軸方向の位置、及び、縦軸方向の高さは、それぞれ、遅延時間TLxおよびレベル係数CLx(いずれも、x=1〜Nのいずれか)に相当する。バー41Laの数、横軸方向の位置、及び縦軸方向の高さは、上述した第1実施形態におけるバー34aの場合と同様、入力装置23による所定の操作により行うことができる。
【0163】
Rch初期反射パターン設定部41Rは、Rch初期反射成分生成部500Rにおいて、入力信号(IN_PR[t])から、擬似的な初期反射音の右チャンネル信号(IN_BR[t])を生成するためのパラメータを設定するための画面であり、横軸が時刻に対応し、縦軸がレベルに対応する。このRch初期反射パターン設定部41Rには、ユーザが入力装置23を操作して設定したバー41Raが表示される。
【0164】
バー41Raの数は、音場空間における右チャンネル信号の反射位置の数N’に相当する。なお、図12に示す例では、4本のバー41Laが表示されており、N’として「4」が設定されている。また各バー41Raの横軸方向の位置、及び、縦軸方向の高さは、それぞれ、遅延時間TRxおよびレベル係数CRx(いずれも、x=1〜N’のいずれか)に相当する。バー41Raの数、横軸方向の位置、及び縦軸方向の高さは、上述した第1実施形態におけるバー34aの場合と同様、入力装置23による所定の操作により行うことができる。
【0165】
減衰量設定部42は、Lch成分選別部630L,730L及びRch成分選別部630R,730Rにおいて、|POL_2L[f]の動径|の減衰、又は|POL_2R[f]の動径|の減衰を鈍らせる場合に使用する減衰量Eを設定するための操作子である。この減衰量設定部42により、減衰量Eを0.0から1.0までの範囲で設定できる。減衰量設定部42は、ユーザが、入力装置23(例えば、マウス)を用いて操作することができる。例えば、入力装置23がマウスであれば、減衰量設定部42の上にカーソルを置き、左ボタンを押しながらマウスを上に移動させると、減衰量Eが増え、下へ移動させると、減衰量Eが減る。
【0166】
操作量設定部43は、Lch成分選別部630L,730L及びRch成分選別部630R,730Rにおいて、POL_1L[f]又はPOL_1R[f]の大きさに応じて相違度[f]の値を操作する場合に使用する操作量Fを設定するための操作子である。この操作量設定部43により、操作量Fを0.0から1.0までの範囲で設定できる。操作量設定部43は、ユーザが、入力装置23(例えば、マウス)を用いて操作することができる。例えば、入力装置23がマウスであれば、操作量設定部43の上にカーソルを置き、左ボタンを押しながらマウスを上に移動させると、操作量Fが増え、下へ移動させると、操作量Fが減る。
【0167】
切り替えボタン44は、Lchセレクタ部660L,670L及びRchセレクタ部660R,670LRから出力する信号を、原音の信号(OrL[t],OrR[t])とするか、残響音の信号(BL[t],BR[t])とするかを指定するためのボタンである。ボタン44aは、出力する信号として、原音の信号(OrL[t],OrR[t])を指定するボタンであり、ボタン44bは、出力する信号として、残響音の信号(BL[t],BR[t])を指定するボタンである。
【0168】
この切り替えボタン44は、ユーザが、入力装置23(例えば、マウス)を用いて操作することができ、ボタン44a又はボタン44bに対して所定の操作(例えば、クリック)を行うと、クリックされたボタンが選択状態となり、そのボタンに対応する信号が、Lchセレクタ部660L,670L及びRchセレクタ部660R,670LRから出力する信号として指定される。図12に示す例では、ボタン44aが選択状態(選択されていることを示すボタン色)であり、Lchセレクタ部660L,670L及びRchセレクタ部660R,670LRから出力する信号として、原音の信号(OrL[t],OrR[t]が指定(選択)されていることを示す。一方で、ボタン44bは、非選択状態(選択されていないことを示すボタン色)である。
【0169】
信号表示部45は、エフェクタ1への入力信号(即ち、マイクなどの収音装置から、Lch用A/D20L及びRch用A/D20Lを介して入力された信号)を、周波数f−相違度[f]の平面に可視化するための画面である。信号表示部45の横軸は、周波数fに対応し、向かって右へ行くほど周波数が高く、向かって左へ行くほど周波数が低いことを示す。一方で、縦軸は、相違度[f]に対応し、上へ行くほど相違度が大きく、下へ行くほど相違度が小さいことを示す。縦軸には、UI画面30(図6参照)のカラーバー36aと同様に、相違度[f]の大きさに応じたグラデーションで着色されたカラーバー45aが添えられている。
【0170】
信号表示部45には、入力信号の周波数fと相違度[f]に応じた点を中心とする円45bが表示される。この座標(周波数f,相違度[f])は、例えば、Lch成分選別部630LのS634の処理により算出された値に基づき、CPU11により算出される。円45bの色は、その中心の座標が示す相違度[f]に対するカラーバー45aの色が着色される。また、円45bの半径は、その周波数fの入力信号のLv[f]を表し、Lv[f]が大きい程、大きな半径となる。なお、Lv[f]は、例えば、Lch成分選別部630LのS634の処理により算出された値である。
【0171】
信号表示部45に表示される複数の指定点45cは、例えば、Lch成分選別部630LのS636の判定に使用する設定範囲を規定するための点であり、境界線45dは、隣接する指定点45cを結ぶ直線であり、該設定範囲の境界を規定する線である。境界線45dと、信号表示部45の上辺(即ち、相違度[f]の最大値)とにより囲まれた範囲45eが、S636の判定に使用する設定範囲となる。
【0172】
指定点45cの数および各位置の初期値はROM12に予め格納されている。指定点45cの数の増減や移動は、入力装置23を用いて、上述した第1実施形態における指定点36cの場合と同様の操作で行うことができる。
【0173】
信号表示部45に表示される円45bのうち、その中心が範囲45eの内部(境界を含む)に含まれる円45b1に対応する信号が、例えば、成分選別部630LのS636の判定において、相違度[f]がその周波数fにおける設定範囲内にある信号であると判定される。一方で、その中心が範囲45eから外れる円45b2に対応する信号が、例えば、Lch成分選別部630LのS636の判定において、設定範囲外にある信号であると判定される。
【0174】
なお、図12では、境界線45dと、信号表示部45の上辺とにより囲まれた範囲を範囲45eとしたが、ある周波数fにおける大きい方の相違度[f]の閾値は、信号表示部45の上辺(即ち、相違度[f]の最大値)とは限らない。ここで、図13は、信号表示部45に設定される範囲45eの変形例を示す図である。変形例としては、例えば、図13(a)に示すように、閉じた境界線45eにより囲まれた範囲を範囲45eとしてもよい。
【0175】
また、図13(b)に示すように、低域における相違度の大きな円45b、例えば、円45b3を範囲外とするように範囲45eを設定してもよい。低域における相違度の大きな円45b3が、範囲45eの外となるように、指定点45cおよび境界線45dを設定することにより、ポップノイズ(マイクに息が吹き付けられたときに出るノイズ)を除去することができる。
【0176】
以上、説明した通り、第2実施形態のエフェクタ1によれば、入力信号を遅延させることにより、入力信号に含まれる残響音の初期反射成分を擬似的に生成することができるので、この擬似的な初期反射成分の信号(例えば、IN_BL[t])と入力信号(例えば、IN_PL[t])とをそれぞれ周波数分析した信号の、周波数f毎のレベル比(例えば、|POL_1L[f]の動径|/|POL_2L[f]の動径|)は、そのレベル比が高い程、IN_BL[t]に含まれていない信号成分(例えば、IN_PL[t]に含まれる原音の信号OrL[t])が多いことを示すので、このレベル比を、入力信号に含まれる原音の信号と、残響音の信号とを区別する指標とすることができる。よって、このレベル比に応じて、入力信号から、原音の信号又は残響音の信号を区別して抽出することができる。
【0177】
かかる原音の信号又は残響音の信号の抽出は、周波数特性やレベル比に注目して行っており、擬似的に生成した波形の時間軸上での差し引きを伴うものではないので、容易であるとともに、良好な音質で抽出できる。また、逆相波による、音像空間における残響音の打ち消しを伴うものでもないので、聴衆位置が限定的になることもない。
【0178】
以上、各実施形態に基づき本発明を説明したが、本発明は上記実施形態に何ら限定されるものではなく、本発明の趣旨を逸脱しない範囲内で種々の変形改良が可能であることは容易に推察できるものである。
【0179】
例えば、上記第1実施形態では、マルチトラック再生部100から出力されたIN_B[t]を遅延部200により遅延させる構成としたが、マルチトラック再生部100と第1周波数分析部310との間、および、マルチトラック再生部100と第1周波数分析部410との間に遅延部200と同様の遅延部を設け、この遅延部によって遅延させたIN_P[t]を第1周波数分析部310,410に入力する構成としてもよい。このように、IN_P[t]をIN_B[t]に対して遅延させることにより、IN_B[t]がIN_P[t]に先行する場合にも、IN_P[t]からかぶり取り音を抽出すること(換言すれば、かぶり音を除去すること)ができる。なお、IN_B[t]がIN_P[t]に先行する場合としては、例えば、演奏音が録音されたカセットテープが劣化し、テープの巻きによる重なり部分において、ある時刻の演奏によって録音された音(P[t])に、時系列的に前の演奏音(B[t])が移りこんだ場合などが挙げられる。
【0180】
上記第1実施形態では、ユーザ指定されたトラック以外のトラックの再生信号であるIN_B[t]に対して、1つの遅延器200を配置する構成としたが、トラック毎に遅延器を配置し、トラック毎(又は、楽器単位毎)に遅延させる構成としてもよい。具体的には、例えば、ライブ会場などで、ボーカルとその他の楽器を同時に演奏してマルチトラックで収録する場合には、それぞれの楽器はそれぞれの位置(ギターアンプ、ベースアンプ、キーボードアンプ、アコースティックドラムの位置、など)から発音される。各楽器の音は、各トラックに遅延時間ゼロで収録されると共に、各楽器の発音位置からボーカルマイクまでの距離に応じた遅延時間でもってボーカルマイクに到達し、ボーカルトラックにかぶり音(不要音)として収録される。その場合、各楽器(各トラック)毎に、遅延時間を設定する必要が生じる。
【0181】
上記第1実施形態では、ユーザ指定されたトラック以外の全てのトラックに録音されている音信号をIN_B[t]としたが、ユーザ指定されたトラック以外のトラックのうち、一部のトラックに録音されている音信号をIN_B[t]としてもよい。
【0182】
上記第1実施形態では、モノラルの入力信号(IN_P[t],IN_B[t])に対して処理を行う構成としたが、複数チャンネル(例えば、左右チャンネル)の入力信号に対し、第2実施形態と同様に、チャンネル毎に主要音(かぶり取り音)と不要音(かぶり音)を選別して抽出する処理を行うように構成してもよい。
【0183】
上記第1実施形態では、マルチトラック再生部100では、一律に、かぶり取り音として指定した場合のレベル係数S1〜Snを1.0としたが、トラック再生部101−1〜101−nのそれぞれに対し、楽器の音の混入具合に応じて、かぶり取り音として指定した場合のレベル係数を異ならせるように構成してもよい。例えば、ドラムの音の音量が他の楽器の音の音量に比べてかなり大きい場合に、ドラムについて、かぶり取り音として指定した場合のレベル係数を1.0より小さくするようにしてもよい。
【0184】
上記第1実施形態では、楽器単位で、かぶり取り音とかぶり音とを設定する構成としたが、トラック単位で、かぶり取り音とかぶり音とを設定する構成としてもよい。また、楽器の種類に応じて、楽器単位で、かぶり取り音とかぶり音とを設定するものと、トラック単位で、かぶり取り音とかぶり音とを設定するものとを分けておく構成であってもよい。
【0185】
上記第1実施形態では、録音データであるマルチトラックデータ21aを用いて、かぶり取り音の信号を抽出する構成としたが、少なくとも2つの入力チャンネルを設け、各入力チャンネルにはそれぞれ1つの収音装置から音が入力されるように構成することにより、特定の1つの入力チャンネルから入力された信号をIN_P[t]とし、他の入力チャンネルから入力された信号の合成信号をIN_B[t]として、IN_P[t]からかぶり取り音の信号を抽出する構成としてもよい。
【0186】
上記第1実施形態では、境界線36dと、信号表示部36の上辺とにより囲まれた範囲を範囲36eとしたが、ある周波数fにおける大きい方の相違度[f]の閾値は、信号表示部36の上辺(即ち、相違度[f]の最大値)とは限らず、図13(a)に示した例と同様に、閉じた境界線により囲まれた範囲を範囲36eとしてもよい。
【0187】
上記第1実施形態では、外付けのHDD21に記憶したマルチトラックデータ21aを用いる構成としたが、マルチトラックデータ21aは、各種メディアに記憶されていてもよい。また、マルチトラックデータ21aを、エフェクタ1に内蔵されるフラッシュメモリなどのメモリに記憶させて使用してもよい。
【0188】
上記第2実施形態では、Lch用A/D20LおよびRch用A/D20Rから入力された信号を処理して、原音と残響音とを選別する構成としたが、ハードディスクドライブなどに録音されていた録音データを処理し、原音と残響音とを選別する構成としてもよい。
【0189】
上記第2実施形態では、Lch用A/D20Lから入力された左チャンネル信号と、Rch用A/D20Rから入力された右チャンネル信号とで、それぞれ、別々に処理する構成としたが、Lch用A/D20Lから入力された左チャンネル信号とRch用A/D20Rから入力された右チャンネル信号とをモノラル信号に合成し、モノラル信号で処理する構成としてもよい。なお、この場合には、チャンネル毎のD/A(即ち、Lch用D/A15L,Rch用D/A15R)は設けずに、1つのD/Aとしてもよい。
【0190】
上記第2実施形態では、左右2チャンネルの信号をそれぞれ処理し、原音と残響音とを選別する構成としたが、2チャンネル以上の信号について、各チャンネルをそれぞれ処理して原音と残響音とを選別するように構成してもよい。もちろん、モノラル信号を処理して原音と残響音とを選別するように構成してもよい。
【0191】
上記第2実施形態では、Lch初期反射成分生成部500Lにおいて生成されるIN_BL[t]は、左チャンネルの入力信号(IN_PL[t])と、左チャンネルの信号に対して設定されたパラメータ(N,TL1〜TLN,CL1〜CLN)に基づいてのみ決定されるものとしたが、右チャンネルの入力信号(IN_PR[t])と、右チャンネル信号に対するパラメータ(N’,TR1〜TRN’,CR1〜CRN’)とを考慮するようにしてもよい。
【0192】
即ち、上記第2実施形態では、『IN_BL[t]=IN_PL[t]×CL1×Z−m1+IN_PL[t]×CL2×Z−m2+・・・+IN_PL[t]×CLN×Z−mN』としたが、『IN_BL[t]=(IN_PL[t]×CL1×Z−m1+IN_PL[t]×CL2×Z−m2+・・・+IN_PL[t]×CLN×Z−mN)+(IN_PR[t]×CR1×Z−m’1+IN_PR[t]×CR2×Z−m’2+・・・+IN_PR[t]×CRN’×Z−m’N’)』としてもよい。同様に、Rch初期反射成分生成部500Rにおいて生成されるIN_BR[t]についても、『IN_BR[t]=(IN_PR[t]×CR1×Z−m’1+IN_PR[t]×CR2×Z−m’2+・・・+IN_PR[t]×CRN’×Z−m’N’)+(IN_PL[t]×CL1×Z−m1+IN_PL[t]×CL2×Z−m2+・・・+IN_PL[t]×CLN×Z−mN)』としてもよい。
【0193】
上記第2実施形態では、Lch初期反射成分生成部500LにおいてIN_BL[t]を生成する場合に用いるパラメータ(N,TL1〜TLN,CL1〜CLN)と、Rch初期反射成分生成部500RにおいてIN_BR[t]を生成する場合に用いるパラメータ(N’,TR1〜TRN’,CR1〜CRN’)とは、それぞれ独立して設定して使用する構成としたが、互いに共通のパラメータを設定して使用する構成としてもよい。かかる場合には、UI画面40において、Lch初期反射パターン設定部41Lと、Rch初期反射パターン設定部41Rとを、1つの初期反射パターン設定部として構成してもよい。
【0194】
上記第2実施形態では、初期反射成分生成部500L,500Rを、FIRフィルタとして構成したが、遅延素子501L−1〜501L−N,501R−1〜501R−N’を、それぞれ、図14に示すようなオールパスフィルタ50に換えてもよい。図14は、オールパスフィルタ50の構成を示すブロック図である。
【0195】
オールパスフィルタ50は、入力される音の周波数特性は変更せず、位相を変更するフィルタで、入力信号(IN_PL[t]又はIN_PR[t])と乗算器52の出力とを加算して出力する加算器55と、その加算器55の出力に係数として減衰量−E(なお、Eは、減衰量設定部42により設定される値である)を乗算する乗算器53と、遅延素子51と、遅延素子51により遅延された信号に減衰量Eを乗算する乗算器52と、乗算器53の出力と遅延素子51の出力とを加算して出力する加算器54とから構成される。このオールパスフィルタ50を用いた場合には、|POL_2L[f]の動径|又は|POL_2R[f]の動径|の減衰を鈍らせる処理(例えば、上述したS633の処理)を省略してもよい。
【0196】
上記各実施形態では、信号のレベル比(信号の動径の比)を相違度[f]としたが、信号のパワーの比を用いる構成としてもよい。つまり、上記各実施形態では、IN_P[f]やIN_B[f]の実数部を2乗した値と、虚数部を2乗した値との和を取り、その和の平方根を取った値(即ち、信号のレベル)を使用して相違度[f]を算出したが、IN_P[f]やIN_B[f]の実数部を2乗した値と、虚数部を2乗した値との和(即ち、信号のパワー)を使用して相違度[f]を算出してもよい。
【0197】
上記第1実施形態では、相違度[f]を、|(POL_1[f]の動径|/|POL_2[f]の動径|とした。つまり、POL_2[f]のレベルに対するPOL_1[f]のレベル比を相違度[f]として算出した。これに換えて、POL_1[f]のレベルに対するPOL_2[f]のレベル比を、相違度[f]に変わるパラメータとして使用する構成としてもよい。なお、第2実施形態についても同様である。
【0198】
上記各実施形態では、窓関数としてハニング窓を用いたが、ハミング窓やブラックマン窓の各種窓関数を用いてもよい。
【0199】
上記各実施形態では、UI画面30,40の信号表示部36,45に設定する範囲36e,45eは、1つの曲の演奏時刻に関係なく1つの範囲を設定したが、1つの曲に複数の範囲36e,45eを設定してもよい。即ち、1つの曲の演奏時刻に応じて異なる範囲36e,45eを設定してもよい。かかる場合には、範囲36e,45eが変更される毎に、演奏時刻と範囲とを対応づけてRAM13に記憶する。1つの曲の中でも演奏時刻に応じて異なる範囲36e,45eを設定することにより、目的音(かぶり取り音や原音など)をより適切に抽出することができる。
【0200】
上記実施形態では、信号表示部36,45において、境界線45dを、隣接する指定点45cを結ぶ直線としたが、複数の指定点45cにより決まるスプライン曲線を用いる構成としてもよい。
【0201】
上記各実施形態では、UI画面30,40の信号表示部36,45では、信号を円36b,45bで表す構成としたが、その形状は円に限定されず、種々の図形を使用してもよい。
【0202】
また、信号表示部36,45に表示される各円36b,45bは、その大きさ(半径の長さ)によって信号のレベルを表す構成としたが、レベルの軸を第3の軸として、三次元座標系により表示してもよい。
【0203】
上記各実施形態では、表示装置21及び入力装置22を、エフェクタ1とは別体としたが、表示画面及び入力部を有するエフェクタであってもよい。かかる場合には、表示装置21に表示させた内容をエフェクタ内の表示画面に表示させ、入力装置22から受け付けた入力情報をエフェクタの入力部から受け付けるようにすればよい。
【0204】
上記第2実施形態では、第1処理部600に、Lchセレクタ部660L及びRchセレクタ部660Rを設け、第2処理部700に、Lchセレクタ部760L及びRchセレクタ部760Rを設ける構成としたが(図8参照)、これらのセレクタ部660L,660R,760L,760Rを設けず、各処理部600,700から出力された原音と残響音とをそれぞれ左右チャンネル毎にクロスフェード合成して、それぞれをD/A変換して出力する構成としてもよい。つまり、第1に、第1Lch周波数合成部640L,740Lからそれぞれ出力されるOrL[t]をクロスフェード合成して、左チャンネルの原音出力用に設けたD/Aに入力し、第2に、第1Rch周波数合成部640R,740Rからそれぞれ出力されるOrR[t]をクロスフェード合成して、右チャンネルの原音出力用に設けたD/Aに入力し、第3に、第2Lch周波数合成部650L,750Lからそれぞれ出力されるBL[t]をクロスフェード合成して、左チャンネルの残響音出力用に設けたD/Aに入力し、第4に、第2Rch周波数合成部650R,750Rからそれぞれ出力されるBR[t]をクロスフェード合成して、右チャンネルの残響音出力用に設けたD/Aに入力するように構成してもよい。この場合、例えば、左右チャンネルの原音を前部に配置したステレオスピーカから放音し、左右チャンネルの残響音を後部に配置したステレオスピーカから放音することにより、臨場感溢れる音響効果を得ることができる。
【0205】
上記第1実施形態では、各周波数合成部340,350,440,450により周波数合成を行った後で、かぶり取り音の時間領域の信号又はかぶり音の時間領域の信号のいずれかをセレクタ部360,460により選択して出力する構成としたが、セレクタによりPOL_3[f]又はPOL_4[f]のいずれかを選択した後、選択された信号を周波数合成して時間領域の信号に変換する構成としてもよい。上記第2実施形態についても同様に、セレクタによって、POL_3L[f]及びPOL_3R[f]の組、又は、POL_4L[f]及びPOL_4R[f]の組のいずれかを選択した後、選択された信号を周波数合成して時間領域の信号に変換する構成としてもよい。
【符号の説明】
【0206】
1 エフェクタ(音信号処理装置)
15L.15R D/A(出力手段)
18 HDD_I/F(第1入力手段、第2入力手段)
20L,20R A/D(入力手段)
100 マルチトラック再生部(再生手段)
200 遅延部(調整手段)
310,410 第1周波数分析部(分割手段)
320,420 第2周波数分析部(分割手段)
340,440 第1周波数合成部(出力信号生成手段)
350,450 第2周波数合成部(出力信号生成手段)
500L,500R 初期反射成分生成部(擬似信号生成手段)
610L,710L 第1Lch周波数分析部(分割手段)
610R,710R 第1Rch周波数分析部(分割手段)
620L,720L 第2Lch周波数分析部(分割手段)
620R,720R 第2Rch周波数分析部(分割手段)
640L,740L 第1Lch周波数合成部(出力信号生成手段)
640R,740R 第1Rch周波数合成部(出力信号生成手段)
650L,750L 第2Lch周波数合成部(出力信号生成手段)
650R,750R 第2Rch周波数合成部(出力信号生成手段)
S333 レベル比算出手段
S334 判定手段
S335 抽出手段
S336 第2の抽出手段
S633 レベル補正手段
S634 レベル比算出手段
S635 レベル比補正手段
S636 判定手段
S637 抽出手段

【特許請求の範囲】
【請求項1】
第1の音と第2の音とを含む混合音の時間領域の信号である混合音信号と、少なくとも第2の音に相当する音を含む音の時間領域の信号である対象音信号とからなる2つの信号であって、全てまたは一部が時間的な相関関係を有する前記2つの信号を、それぞれ、複数の周波数帯域に分割する分割手段と、
その分割手段により分割された周波数帯域毎に、前記2つの信号のレベル比を算出するレベル比算出手段と、
周波数帯域毎に、前記レベル比算出手段により算出されたレベル比が、その周波数帯域に対して、前記第1の音を示すレベル比の範囲として予め設定された範囲内にあるか否かを判定する判定手段と、
前記混合音信号から、前記レベル比が前記予め設定された範囲内であると前記判定手段により判定された周波数帯域の信号を抽出する抽出手段と、
その抽出手段により抽出された信号を時間領域の信号に変換して出力信号を生成する出力信号生成手段と、
その出力信号生成手段により生成された時間領域の信号を出力する出力手段と、を備えていることを特徴とする音信号処理装置。
【請求項2】
第1の出力源から出力された第1の音と、1つ又は複数の第2の出力源から出力された第2の音とを含む混合音の時間領域の信号を前記混合音信号として入力する第1入力手段と、
前記1つ又は複数の第2の出力源から出力された第2の音の時間領域の信号を前記対象音信号として入力する第2入力手段と、
前記混合音信号又は前記対象音信号のいずれかを、時間軸上で、前記混合音に含まれる第1の音及び第2の音のそれぞれの発音タイミングの差に基づき生じる時間差であって、前記混合音信号における第2の音の信号と、前記対象音信号における第2の音の信号との前記時間差に応じた調整量に応じて遅延し、調整信号を得る調整手段とを備え、
前記分割手段は、前記調整手段により得られた調整信号と、前記混合音信号又は前記対象音信号のうち、前記調整手段による調整がされない信号である元信号とを、それぞれ、複数の周波数帯域に分割するものであることを特徴とする請求項1記載の音信号処理装置。
【請求項3】
前記調整信号又は前記元信号のうち、前記混合音信号に対応する信号から、前記レベル比が前記予め設定された範囲外であると前記判定手段により判定された周波数帯域の信号を抽出する第2の抽出手段と、
その第2の抽出手段により抽出された信号を時間領域の信号に変換して出力信号を生成する第2の出力信号生成手段と、
その第2の出力信号生成手段により生成された時間領域の信号を出力する第2の出力手段と、を備えていることを特徴とする請求項2記載の音信号処理装置。
【請求項4】
複数のトラックに録音されている音の信号をマルチトラック再生する再生手段を備え、
前記第1入力手段からは、前記再生手段により再生された前記複数のトラックの信号のうち、前記第1の音の信号が主に録音されているトラックの信号が入力され、
前記第2入力手段からは、前記再生手段により再生された前記複数のトラックの信号のうち、前記第2の音の信号が録音されている、前記第1の音の信号が主に録音されているトラック以外の少なくとも1つのトラックの信号が入力されることを特徴とする請求項2又は3に記載の音信号処理装置。
【請求項5】
前記調整量手段は、前記第2の出力源から前記混合音を収音した収音手段までの音場空間の特性に応じて生じる前記時間差を調整するための遅延時間を、前記調整量として、前記第2の出力源の数だけ用い、その調整量毎に、前記混合音信号又は対象音信号の時間上での調整と各調整量に対して設定されている係数の乗算とを施して得られた信号を全て加算して、前記調整信号を得るものである請求項2から4のいずれかに記載の音信号処理装置。
【請求項6】
所定の出力源から出力された第1の音と、音場空間において前記第1の音に基づいて生じた第2の音とを1つの収音手段により収音して得られた混合音の時間領域の信号を前記混合音信号として入力する入力手段と、
前記入力手段から入力された混合音の信号を、時間軸上で、前記所定の出力源から出力された第1の音が前記収音手段により収音されるタイミングと前記第1の音に基づいて生じた第2の音が前記収音手段により収音されるタイミングとの時間差に応じた調整量に応じて遅延させることにより、該混合音の信号から、前記対象音信号としての前記第2の音の信号を擬似的に生成する擬似信号生成手段とを備え、
前記分割手段は、前記混合音信号と、前記擬似信号生成手段により前記対象音信号として生成された擬似的な第2の音の信号とを、それぞれ、複数の周波数帯域に分割するものであることを特徴とする請求項1記載の音信号処理装置。
【請求項7】
前記混合音は、前記所定の出力源から出力された第1の音と、音場空間において前記第1の音に基づいて生じた前記第2の音としての残響音とを1つの収音手段により収音して得られたものであり、
前記擬似信号生成手段は、前記混合音信号を、時間軸上で、前記調整量に応じて遅延させることにより、前記残響音における初期反射音の信号を前記擬似的な第2の音の信号として生成するものであり、
前記判定手段は、周波数帯域毎に、前記レベル比算出手段により算出されたレベル比が、その周波数帯域に対して、前記第1の音を示すレベル比の範囲として予め設定された範囲内にあるか否かを判定するものであることを特徴とする請求項6記載の音信号処理装置。
【請求項8】
前記調整手段は、音場空間における残響特性に応じて生じる、前記第1の音が前記収音手段により収音されてから、その第1の音に基づいて生じた残響音が該収音手段により収音されるまでの遅延時間を、前記調整量として、該音場空間において前記第1の音を反射する反射位置に応じて設定される数だけ用い、その調整量毎に、前記混合音信号の時間上での調整と各調整量に対して設定されている係数の乗算とを施して得られた信号を全て加算して、前記第2の音の信号を擬似的に生成するものであることを特徴とする請求項7記載の音信号処理装置。
【請求項9】
周波数帯域毎に、前記擬似的な第2の音の信号における今回のレベルを、前回のレベルとを比較し、前記今回のレベルが、前記前回のレベルに所定の減衰率をかけたレベルより小さい場合に、前記レベル比算出手段に使用する前記擬似的な第2の音の信号のレベルを、前記前回のレベルに所定の減衰率をかけたレベルに補正するレベル補正手段を備えていることを特徴とする請求項6から8のいずれかに記載の音信号処理装置。
【請求項10】
周波数帯域毎に、前記混合音信号のレベルが小さい程、前記擬似的な第2の音の信号のレベルに対する前記混合音信号のレベルの比が小さくなるように、前記レベル比算出手段により算出されたレベル比を補正するレベル比補正手段を備え、
前記判定手段は、前記レベル比補正手段により補正されたレベル比を用いて、予め設定された範囲内であるか否かの判定を行うものであることを特徴とする請求項6から9のいずれかに記載の音信号処理装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate


【公開番号】特開2012−78422(P2012−78422A)
【公開日】平成24年4月19日(2012.4.19)
【国際特許分類】
【出願番号】特願2010−221216(P2010−221216)
【出願日】平成22年9月30日(2010.9.30)
【出願人】(000116068)ローランド株式会社 (175)