音声信号処理装置および音声信号処理方法
【課題】複数の音源の音声信号が含まれている2系統の音声信号から、特定の音源の音声信号を良好に除去することができる音声信号処理装置を提供する。
【解決手段】2系統の音声信号のそれぞれを複数個の周波数帯域に分割する分割手段11,12と、分割された複数個の周波数帯域の各々における前記2系統の音声信号のレベル比またはレベル差を算出するレベル比較手段13と、レベル比較手段で算出されたレベル比またはレベル差が予め定めた値およびその近傍となる周波数帯域の成分を、前記分割手段11,12の少なくとも一方から除去する出力制御手段とを設ける。
【解決手段】2系統の音声信号のそれぞれを複数個の周波数帯域に分割する分割手段11,12と、分割された複数個の周波数帯域の各々における前記2系統の音声信号のレベル比またはレベル差を算出するレベル比較手段13と、レベル比較手段で算出されたレベル比またはレベル差が予め定めた値およびその近傍となる周波数帯域の成分を、前記分割手段11,12の少なくとも一方から除去する出力制御手段とを設ける。
【発明の詳細な説明】
【技術分野】
【0001】
この発明は、それぞれ複数の音源からの音声信号により構成される2系統の入力音声時系列信号から、特定の音源の音声信号を除去するようにする音声信号処理装置および方法に関する。
【背景技術】
【0002】
レコードやコンパクトディスク等に記録された左右2チャンネルのステレオ音楽信号の各チャンネルの音声信号には、複数の音源からの音声信号により構成されるものが多数存在する。このようなステレオ音声信号では、2個のスピーカで再生した場合に、前記複数個の音源のそれぞれがスピーカ間に音像として定位するように、レベル差を付加してそれぞれのチャンネルに記録する場合が多い。
【0003】
例えば、5個の音源1〜5の信号をS1〜S5とし、これを左右2チャンネルの音声信号SL,SRとして記録する場合に、
SL=S1+0.9S2+0.7S3+0.4S4
SR=S5+0.4S2+0.7S3+0.9S4
のように、各音源1〜5の信号S1〜S5は、左右2チャンネルにおいてレベル差を付けて、それぞれのチャンネルの音声信号中に加算混合するようにする。
【0004】
以上のような一般的な2チャンネルステレオ音声信号が歌手のボーカル音声とオーケストラの音楽とからなる場合に、ボーカルの音声のみを除去することができれば、いわゆるカラオケ装置に適用することができる。
【0005】
図18は、このボーカル除去処理装置の構成例を示すブロック図である。この図18の例のボーカル除去処理装置は、通常は、ステレオ音声において、ボーカル音声が左右チャンネルの音声の中央に定位するようにされていることから、左右チャンネルの音声信号を互いに減算することによりボーカル音声を、ステレオ音声出力から除去することができることを利用している。
【0006】
図18の例においては、ボーカル音声帯域のみに上記の原理を適用するように構成されており、左右チャンネルの音声信号SL,SRのそれぞれは、減算回路1に供給されると共に、ボーカル音声帯域(例えば300Hz〜5kHz)の周波数成分を除去する帯域除去フィルタ2および3に供給される。そして、減算回路1からの左右チャンネルの音声信号の減算出力は、ボーカル音声帯域の周波数成分を抽出する帯域通過フィルタ(バンドパスフィルタ)4に供給される。
【0007】
そして、帯域除去フィルタ2の出力信号と、バンドパスフィルタ4の出力信号とを加算回路5で加算して、この加算回路5からボーカル音声成分を除去した出力左チャンネル音声信号SOLを得る。また、帯域除去フィルタ3の出力信号と、バンドパスフィルタ4の出力信号とを加算回路6で加算して、この加算回路6からボーカル音声成分を除去した出力右チャンネル音声信号SORを得る。
【0008】
参考となる特許文献は、次の通りである。
【特許文献1】特開2000−354299号公報
【発明の開示】
【発明が解決しようとする課題】
【0009】
しかしながら、上述のようなボーカル音源除去方法の場合には、ボーカル音声帯域では、モノーラル信号となり、ステレオ感が低減してしまうという欠点がある。また、ボーカル除去が十分には行われないという欠点があった。
【0010】
この発明は、以上の点にかんがみ、複数の音源の音声信号が含まれている2系統の音声信号から、例えば上述のボーカルの音源などのような特定の音源の音声信号を良好に除去することができる音声信号処理装置および方法を提供することを目的とする。
【課題を解決するための手段】
【0011】
上記の課題を解決するために、この発明による音声信号処理装置は、
2系統の音声信号のそれぞれを複数個の周波数帯域に分割する分割手段と、
前記分割手段からの前記分割された複数個の周波数帯域の各々における前記2系統の音声信号のレベル比またはレベル差を算出するレベル比較手段と、
前記レベル比較手段で算出された前記レベル比または前記レベル差が予め定めた値およびその近傍となる周波数帯域の成分を、前記分割手段からの前記2系統の音声信号の少なくとも一方から除去する出力制御手段と、
を備えることを特徴とする。
【0012】
この発明においては、各音源の音声信号は、所定のレベル比あるいはレベル差で、2系統の音声信号に混合されていることを利用する。請求項1の発明においては、2系統の音声信号のそれぞれを、複数個の周波数帯域に分割する。そして、各周波数帯域ごとに2系統の音声信号のレベル比またはレベル差が算出され、そのレベル比またはレベル差が、予め定めた値およびその近傍となる周波数帯域の信号成分が、2系統の音声信号の少なくとも一方から除去される。
【0013】
前記予め定めたレベル比あるいはレベル差が、特定の音源の音声信号が前記2系統の音声信号に混合されているレベル比あるいはレベル差に設定されていれば、当該特定の音源の音声信号を構成する周波数成分が少なくとも2系統の音声信号の少なくとも一方から除去される。つまり、特定の音源の音声信号が除去される。
【0014】
請求項2の発明は、
2系統の入力音声時系列信号を、それぞれ周波数領域信号に変換する第1および第2の直交変換手段と、
前記第1の直交変換手段と前記第2の直交変換手段からの対応する周波数分割スペクトル同士のレベル比またはレベル差を比較する周波数分割スペクトル比較手段と、
前記周波数分割スペクトル比較手段における比較結果に基づいて、前記第1の直交変換手段と前記第2の直交変換手段の少なくとも一方から得られる周波数分割スペクトルのレベルを制御して、前記レベル比または前記レベル差が予め定めた値およびその近傍となる周波数成分を、前記2系統の音声信号の少なくとも一方から除去する周波数分割スペクトル制御手段と、
前記周波数分割スペクトル制御手段からの前記周波数領域信号を、時系列信号に戻す逆直交変換手段と、
を備えることを特徴とする。
【0015】
この請求項2の発明においては、2系統の入力音声時系列信号は、それぞれ第1および第2の直交変換手段により周波数領域信号に変換されて、それぞれ複数個の周波数分割スペクトルからなる成分に変換される。
【0016】
そして、請求項2では、第1の直交変換手段と第2の直交変換手段からの対応する周波数分割スペクトル同士のレベル比またはレベル差が比較され、その比較結果に基づいて、第1の直交変換手段と第2の直交変換手段の少なくとも一方から得られる周波数分割スペクトルのレベルを制御して、前記レベル比または前記レベル差が予め定めた値およびその近傍となる周波数成分を除去する。そして、除去後の周波数領域信号が時系列信号に戻される。
【0017】
予め定めたレベル比あるいはレベル差が、特定の音源の音声信号が前記2系統の音声信号に混合されているレベル比あるいはレベル差に設定されていれば、当該特定の音源の音声信号を構成する周波数領域成分が少なくとも2系統の音声信号の少なくとも一方から除去される。つまり、特定の音源の音声信号が除去される。
【0018】
請求項3の発明は、
2系統の入力音声時系列信号を、それぞれ周波数領域信号に変換する第1および第2の直交変換手段と、
前記第1の直交変換手段と前記第2の直交変換手段からの、対応する周波数分割スペクトル同士の位相差を算出する位相差算出手段と、
前記位相差算出手段で算出された前記位相差に基づいて、前記第1の直交変換手段と前記第2の直交変換手段の少なくとも一方の周波数分割スペクトルのレベルを制御して、前記位相差が予め定めた値およびその近傍となる周波数成分を、前記2系統の音声信号の少なくとも一方から除去する周波数分割スペクトル制御手段と、
前記周波数分割スペクトル制御手段からの前記周波数領域信号を、時系列信号に戻す逆直交変換手段と、
を備えることを特徴とする。
【0019】
請求項3の発明においては、2系統の入力音声時系列信号は、それぞれ第1および第2の直交変換手段により周波数領域信号に変換されて、それぞれ複数個の周波数分割スペクトルからなる成分に変換される。
【0020】
そして、請求項3では、第1の直交変換手段と第2の直交変換手段からの対応する周波数分割スペクトル同士の位相差が算出され、その算出結果に基づいて、第1の直交変換手段と第2の直交変換手段の少なくとも一方から得られる周波数分割スペクトルのレベルを制御して、前記位相差が予め定めた値およびその近傍となる周波数成分を除去する。そして、除去後の周波数領域信号が時系列信号に戻される。
【0021】
予め定めた位相差が、特定の音源の音声信号が前記2系統の音声信号に混合されている位相差に設定されていれば、当該特定の音源の音声信号を構成する周波数領域成分が少なくとも2系統の音声信号の少なくとも一方から除去される。つまり、特定の音源の音声信号が除去される。
【発明の効果】
【0022】
この発明によれば、2系統の音声信号に対して、所定のレベル比あるいはレベル差、または、所定の位相差をもって、混合された音源の音声信号は、前記2系統の音声信号の少なくとも一方から良好に除去される。
【発明を実施するための最良の形態】
【0023】
以下、この発明による音声信号処理装置および方法の実施形態を、図を参照しながら説明する。
【0024】
以下の説明においては、前述もした左チャンネル音声信号SLと、右チャンネル音声信号SRとからなるステレオ音声信号から、音源除去する場合について説明する。
【0025】
例えば、左チャンネル音声信号SLと、右チャンネル音声信号SRとに、音源1〜5の音声信号S1〜S5が、次の(式1)および(式2)に示すような割合で、レベル差が付けられて振り分けられて混合されているものとする。
【0026】
SL=S1+0.9S2+0.7S3+0.4S4 ・・・(式1)
SR=S5+0.4S2+0.7S3+0.9S4 ・・・(式2)
【0027】
この(式1)および(式2)を比べると、各音源1〜5の音声信号S1〜S5は、上記のようにレベル差を持って、左チャンネル音声信号SLと右チャンネル音声信号SRとに分配されているので、この分配比率によって、音源を再度、左チャンネル音声信号SLおよび/または右チャンネル音声信号SRとから振り分けることができれば、元の音源は分離できるので、除去できる。
【0028】
以下の実施形態においては、各音源が一般的には異なるスペクトラム成分を有していることを利用して、左右2チャンネルステレオ音声信号のそれぞれを十分な解像度を有するFFT処理により周波数領域に変換して、多数個の周波数分割スペクトル成分に分割する。そして、それぞれのチャンネルの音声信号についての、対応する各周波数分割スペクトル同士のレベル比またはレベル差を求め、(式1),(式2)において、分離したい音源の音声信号についての分配比に対応するレベル比またはレベル差となっている周波数分割スペクトルを検出して、当該検出した周波数分割スペクトル成分を分離することにより、他の音源からの影響の少ない音源分離を可能にしている。
【0029】
図2は、この発明の第1の実施形態の音声信号処理装置を含むカラオケ装置の構成例を示す図である。この例のカラオケ装置においては、先ず、オーケストラをバックにして歌う歌手のボーカル音声信号が、左右2チャンネルに同レベルで混合されているステレオ音声信号から、第1の実施形態の音声信号処理装置において、前記歌手のボーカル音声信号を除去するようにする。そして、第1の実施形態の音声信号処理装置からのボーカル音声信号の除去されたバックのオーケストラの音楽信号のみからなる音声信号に、ユーザの歌声信号を混合してスピーカから出力するようにする。
【0030】
すなわち、図2に示すように、左右2チャンネルの音声信号SLおよびSRは、後で詳述する第1の実施形態の音声信号処理装置10に供給されて、歌手のボーカル音声信号が除去される。この音声信号処理装置10からのボーカル音声信号が除去された左右チャンネルの音声信号SOL,SORは、それぞれD/A変換器11L,11Rに供給されて、アナログ音声信号に戻された後、ミキシング回路12を構成する加算回路121,122にそれぞれ供給される。
【0031】
一方、マイクロホン13によりユーザの歌声音声が収音され、このマイクロホン13からの歌声音声信号がアンプ14を通じて加算回路121,122のそれぞれに供給され、この混合回路121,122において、D/A変換器11L,11Rからのオーケストラの音楽信号と混合される。
【0032】
そして、混合回路121,122からの混合出力音声信号は、それぞれアンプ15L,15Rを通じて、それぞれ左チャンネル用スピーカ16L,右チャンネル用スピーカ16Rに供給されて、音響出力される。なお、17は、リスナである。
【0033】
[第1の実施形態の音声信号処理装置の構成]
図1は、第1の実施形態の音声信号処理装置を示すブロック図である。2チャンネルステレオ信号のうちの右チャンネル音声信号SRは、直交変換手段の例としてのFFT(Fast Fourier Transform;高速フーリエ変換)部101に供給されて、信号SRがアナログ信号の時にはデジタル信号に変換された後、FFT処理(高速フーリエ変換)されて、時系列音声信号が周波数領域データに変換される。なお、信号SRがデジタル信号であるときには、FFT部101でのアナログ−デジタル変換は不要であることはいうまでもない。
【0034】
一方、2チャンネルステレオ信号のうちの左チャンネル音声信号SLは、直交変換手段の例としてのFFT部102に供給されて、信号SLがアナログ信号のときにはデジタル信号に変換された後、FFT処理(高速フーリエ変換)されて、時系列音声信号が周波数領域データに変換される。なお、信号SLがデジタル信号であるときには、FFT部102でのアナログ−デジタル変換は不要であることはいうまでもない。
【0035】
この例のFFT部101および102は、同様の構成を備え、各時系列信号SR,SLを、互いに異なる複数個の周波数の周波数分割スペクトル成分に分割する。ここで、周波数分割スペクトルとして得る周波数分割数は、音源の分離度の精度に応じた多数とされ、例えば500以上、好ましくは4000以上の周波数分割数とされる。この周波数分割数は、FFT部におけるタップ数に相当する。
【0036】
各FFT部101およびFFT部102からの周波数分割スペクトル出力F1およびF2は、それぞれ周波数分割スペクトル比較処理部103と、周波数分割スペクトル制御処理部104とに供給される。
【0037】
周波数分割スペクトル比較処理部103は、FFT部101およびFFT部102からの周波数分割スペクトル成分F1,F2の、同じ周波数同士のレベル比を算出し、算出したレベル比を周波数分割スペクトル制御処理部104に出力する。
【0038】
周波数分割スペクトル制御処理部104は、周波数分割スペクトル比較処理部103からのレベル比の情報を受けて、当該レベル比が所定のものとなっている周波数分割スペクトル成分のみを、FFT部101およびFFT部102の出力から除去し、その除去結果出力FexRおよびFexLを、それぞれ逆FFT部105および106に出力する。
【0039】
周波数分割スペクトル制御処理部104では、予め、使用者により、除去すべき音源に応じて、どのようなレベル比の周波数分割スペクトル成分を抽出するかが設定されている。したがって、周波数分割スペクトル制御処理部104からは、使用者が除去したいとして設定されたレベル比で左右2チャンネルに振り分けられている音源の音声信号の周波数分割スペクトル成分のみが抽出されることになる。
【0040】
逆FFT部105,106は、周波数分割スペクトル制御処理部104からの除去結果出力FexR,FexLの周波数分割スペクトル成分を元の時系列信号に変換し、その変換出力信号を、使用者が除去したいとして設定した音源の音声信号が除去された出力SOR,SOLとして出力する。
【0041】
[第1の実施形態における周波数分割スペクトル比較処理部103の構成]
周波数分割スペクトル比較処理部103は、この例では、機能的には、図1において、破線で囲まれた範囲に示すような構成を備える。すなわち、周波数分割スペクトル比較処理部103は、レベル検出部21,22と、レベル比算出部23,24と、セレクタ25とからなる。
【0042】
レベル検出部21は、FFT部101からの周波数分割スペクトル成分F1のそれぞれの周波数成分のレベルを検出し、その検出出力D1を出力する。また、レベル検出部22は、FFT部102からの周波数分割スペクトル成分F2のそれぞれの周波数成分のレベルを検出し、その検出出力D2を出力する。この例では、各周波数分割スペクトルのレベルは、振幅スペクトルを検出する。なお、各周波数分割スペクトルのレベルとして、パワースペクトルを検出するようにしてもよい。
【0043】
そして、レベル比算出部23は、レベル比D1/D2を算出する。また、レベル比算出部24は、その逆数のレベル比D2/D1を算出する。レベル比算出部23およびレベル比算出部24で算出されたレベル比は、セレクタ25に供給され、このセレクタ25からは、レベル比D1/D2とレベル比D2/D1の一方のレベル比が、出力レベル比rとして取り出される。
【0044】
セレクタ25には、除去すべきものとして使用者により設定された音源およびそのレベル比に応じて、レベル比算出部23の出力と、レベル比算出部24の出力のいずれを選択すべきかを選択制御するための選択制御信号SELが供給される。このセレクタ25から得られる出力レベル比rは、周波数分割スペクトル制御処理部104に供給される。
【0045】
この例においては、周波数分割スペクトル制御処理部104において、除去すべき音源のレベル比として用いられる値は、常に、レベル比≦1とされている。つまり、周波数分割スペクトル制御処理部104に入力されるレベル比rは、レベルの小さい方の周波数分割スペクトルのレベルを、レベルが大きい方の周波数分割スペクトルのレベルで割ったものとされている。
【0046】
このため、周波数分割スペクトル制御処理部104では、右チャンネルの音声信号SRの方に、より多く含まれるように分配されている音源の信号を除去する場合には、レベル比算出部23からのレベル比算出出力が使用され、逆に、左チャンネルの音声信号SLの方に、より多く含まれるように分配されている音源の信号を除去する場合には、レベル比算出部24からのレベル比算出出力が使用される。
【0047】
例えば、使用者が、除去すべき音源のレベル比として、左チャンネルおよび右チャンネルの信号の分配率の値PL,PR(PL,PRは1以下の値)をそれぞれ設定入力するように定められているものとしたとき、設定された分配率の値PL,PRが、PL/PR≦1であるときには、選択制御信号SELは、セレクタ25からレベル比算出部23の出力(D2/D1)を、出力レベル比rとして選択する選択制御信号とされ、設定された分配率の値PL,PRが、PL/PR>1であるときには、選択制御信号SELは、セレクタ25からレベル比算出部24の出力(D1/D2)を、出力レベル比rとして選択する選択制御信号とされる。
【0048】
なお、使用者により設定された分配率の値PR,PLが互いに等しい(レベル比r=1)ときには、セレクタ25では、レベル比算出部23の出力とレベル比算出部24の出力とのいずれを選択してもよい。
【0049】
[第1の実施形態における周波数分割スペクトル制御処理部104の構成]
周波数分割スペクトル制御処理部104は、この例では、機能的には、図1において、破線で囲んで示すような構成を備える。すなわち、周波数分割スペクトル制御処理部104は、乗算係数発生部としての除去係数発生部31と、右チャンネル用の乗算部32Rおよび左チャンネル用の乗算部32Lとからなる。
【0050】
乗算部32Rには、FFT部101からの周波数分割スペクトル成分F1が供給されると共に、除去係数発生部31からの除去係数(乗算係数)wが供給され、両者の乗算結果が、周波数分割スペクトル制御処理部104の右チャンネル用スペクトル出力FexRとされる。
【0051】
また、乗算部32には、FFT部102からの周波数分割スペクトル成分F2が供給されると共に、除去係数発生部31Lからの除去係数wが供給され、両者の乗算結果が、周波数分割スペクトル制御処理部104の左チャンネル用スペクトル出力FexRとされる。
【0052】
乗算係数発生部31は、周波数分割スペクトル比較処理部103のセレクタ25からの出力レベル比rを受けて、当該レベル比rに応じた除去係数wを発生する。この除去係数発生部31は、例えば、レベル比rを変数とした乗算係数wに関する関数発生回路により構成される。除去係数発生部31に使用する関数として、どのような関数が選ばれるかは、除去すべき音源に応じて使用者により設定された分配率の値PL,PRによる。
【0053】
除去係数発生部31に供給されるレベル比rは、周波数分割スペクトルの各周波数成分単位で変化するものであるので、除去係数発生部31からの除去係数wも、周波数分割スペクトルの各周波数成分単位で変化することになる。
【0054】
したがって、乗算部32Rでは、FFT部101からの各周波数分割スペクトルのレベルが、除去係数wにより制御され、また、乗算部32Lでは、FFT部102からの各周波数分割スペクトルのレベルが、乗算係数wにより制御される。
【0055】
図3に、乗算係数発生部31Rおよび31Lとしての関数発生回路に用いられる関数の例を示す。この例においては、前記(式1)および(式2)で示された左右2チャンネルの音声信号SLおよびSRから、左右チャンネルの音像間の中央に定位するボーカル音声の音源の音声信号S3を除去するようにするので、除去係数発生部31としては、図3(a)または図3(b)に示されるような特性の関数発生回路が用いられる。
【0056】
図3(a)および図3(b)の関数の特性は、左右チャンネルのレベル比rが1、あるいは1に近い場合、つまり、左右チャンネルが同レベルあるいは同レベルに近い周波数分割スペクトル成分では、除去係数wは0あるいは0近傍となり、その他のレベル比rの領域では、乗算係数wは1となっている。
【0057】
ただし、図3(a)の関数の特性の場合には、左右チャンネルのレベル比rが約0.6以下の領域(r<0.6)では、除去係数wは1となり、約0.6以上、約0.8以下の領域(0.6<r<0.8)では、除去係数は、0と1との間で線形に変化するものとなる。また、図3(b)の関数の特性の場合には、左右チャンネルのレベル比rが、約0.8を境にして、約0.8以下の領域(r<0.8)では、除去係数wは1となり、約0.8以上の領域(0.8≦r)では、除去係数wは、0となっている。
【0058】
したがって、セレクタ25からのレベル比rが1、または1近傍となっている周波数分割スペクトル成分に対する乗算係数wは0、あるいは0に近い値となるので、乗算部32Rおよび32Lからは、当該周波数分割スペクトル成分は、出力されなくなる。
【0059】
一方、セレクタ25からのレベル比rが、約0.6以下の値となっている周波数分割スペクトル成分に対する乗算係数wは1となるので、乗算部32Rおよび32Lからは、当該周波数分割スペクトル成分は、そのままのレベルで出力される。
【0060】
すなわち、乗算部32Rおよび32Lからは、多数個の周波数分割スペクトル成分のうち、左右同レベルおよびその近傍となっている周波数分割スペクトル成分(ボーカルの周波数分割スペクトル成分)は、除去されて出力されなくなり、左右チャンネルでレベル差がある周波数分割スペクトル成分は、ほぼそのままのレベルで出力される。
【0061】
この結果、左右2チャンネルの音声信号SL,SRに同レベルで分配された音源の音声信号S3の周波数分割スペクトル成分が除去された周波数分割スペクトル成分が、周波数分割スペクトル制御処理部104の出力FexR、FexLとして、乗算部32Rおよび32Lから逆FFT部105,106に出力される。
【0062】
そして、この逆FFT部105,106で、周波数領域の周波数分割スペクトル成分が時間領域のデジタルオーディオ信号に変換され、出力信号SOR,SOLとして出力される。
【0063】
以上のようにして、この実施形態の音声信号処理装置10においては、左右2チャンネルに同レベルで分配された歌手のボーカル音声が除去された左右2チャンネルステレオ信号SOR,SOLが得られる。
【0064】
この場合に、この実施形態の音声信号処理装置10によれば、左右2チャンネルの信号SL,SRのそれぞれから、ボーカル音声の成分を除去するようにするので、従来のようにステレオ感を損なうことはない。また、除去目的の音源としてのボーカルの除去を十分に行なうことができる。
【0065】
上述の第1の実施形態の説明は、カラオケ装置にこの発明の音声信号処理装置を適用した場合であるので、除去係数発生部31は、左右チャンネルに同レベルで分配された音源の音声成分を除去する除去係数を発生するようにしたが、この除去係数発生部31に設定する関数発生回路を、変更することにより、左右2チャンネルに任意のレベル比あるいはレベル差で分配した音源の音声成分を除去するようにすることができる。
【0066】
例えば、前記(式1)および(式2)で示された左右2チャンネルの音声信号SLおよびSRから、左右チャンネルに所定のレベル差を持って配分されている音源の音声信号S2またはS4を分離する場合には、除去係数発生部31としては、図3(c)に示されるような特性の関数発生回路が用いられる。
【0067】
すなわち、音声信号S2は、D1/D2(=SR/SL)=0.4/0.9=0.44のレベル比で、左右チャンネルに分配されている。また、音声信号S4は、D2/D1(=SL/SR)=0.4/0.9=0.44のレベル比で、左右チャンネルに分配されている。
【0068】
この場合において、この実施形態においては、音声信号S2を分離する場合には、使用者は、除去する音源に対する左右分配率PL:PR=0.9:0.4を設定入力する。あるいは、PL=0.9、PR=0.4のように設定入力する。このように使用者が設定すると、PR/PL<1であるので、セレクタ25には、レベル比算出部24からのレベル比を選択するように制御する選択制御信号SELが与えられる。
【0069】
一方、音声信号S4を分離する場合には、使用者は、分離する音源に対する左右分配率PL:PR=0.4:0.9を設定入力する。あるいは、PL=0.4、PR=0.9のように設定入力する。このように使用者が設定すると、PR/PL>1であるので、セレクタ25には、レベル比算出部23からのレベル比を選択するように制御する選択制御信号SELが与えられる。
【0070】
図3(c)の関数の特性は、左右チャンネルのレベル比rが、D1/D2(=PR/PL)=0.4/0.9=0.44、あるいはレベル比rが0.44に近い周波数分割スペクトル成分では、除去係数wは0あるいは0近傍となり、左右チャンネルのレベル比rが約0.44近傍以外の領域では、除去係数wは1となっている。
【0071】
したがって、セレクタ25からのレベル比rが0.44、または0.44近傍となっている周波数分割スペクトル成分に対する乗算係数wは0、あるいは0に近い値となるので、乗算部32Rおよび32Lからは、当該周波数分割スペクトル成分が、出力レベルが0とされて、出力されなくなる。一方、セレクタ25からのレベル比rが、約0.44近傍以下の値および約0.44近傍以上の値となっている周波数分割スペクトル成分に対する除去係数wは1となるので、乗算部32Rおよび32Lからは、当該周波数分割スペクトル成分は、出力レベルが1とされて、ほぼそのままのレベルで出力される。
【0072】
すなわち、乗算部32Rおよび32Lからは、多数個の周波数分割スペクトル成分のうち、左右チャンネルのレベル比が0.44またはその近傍となっている周波数分割スペクトル成分は、出力レベルが0とされて出力されなくなり、左右チャンネルのレベル比rが、約0.44近傍以下の値および約0.44近傍以上の値となっている周波数分割スペクトル成分は、ほぼそのままのレベルで出力される。
【0073】
この結果、左右2チャンネルの音声信号SL,SRに、レベル比が0.44で分配された音源の音声信号S2またはS4の周波数分割スペクトル成分が、除去された出力信号が得られることになる。
【0074】
以上のようにして、この実施形態によれば、左右2チャンネルに、所定の分配比率で分配された音源の音声信号を、その分配比率に基づいて、当該2チャンネルの音声信号から除去することができる。
【0075】
なお、上述の実施形態では、除去したい音源の音声信号は、2チャンネルの音声信号の両方から抽出するようにしたが、必ずしも両チャンネルから除去する必要はなく、一方のチャンネルのみから除去するようにしてもよい。
【0076】
また、上述の実施形態では、2系統の音声信号に対して分配された音源の信号のレベル比に基づいて、当該2系統の音声信号から前記音源の信号を除去するようにしたが、前記音源の信号の、2系統の音声信号に対するレベル差に基づいて、当該音源の信号を当該2系統の音声信号の少なくとも一方から除去するようにすることもできる。
【0077】
なお、以上の説明では、各音源が(式1)、(式2)に従って左右チャンネルに分配された左右2チャンネルステレオ信号を例にして説明したが、意図的に分配されない通常のステレオ音楽信号においても、図3に示したものと同様に、除去したい音源のレベル比やレベル差に応じた除去関数を用いることにより、対応する音源を除去することができる。
【0078】
なお、除去対象の音源が同じであっても、例えば、除去関数の特性を変更することにより、除去するレベル比範囲を変える、広くする、狭くするなど、異なる音源選択性を持たせることもできる。例えば、図3(d)の除去関数は、図3(c)に示した前述例の除去関数において、除去するレベル比範囲を変える場合の例を示したものである。
【0079】
また、音源のスペクトラム構成に関しても、多くのステレオ音楽信号は異なるスペクトラムを持つ音源から構成されるが、それらの音源についても、上述と同様にして除去することが可能となる。
【0080】
また、スペクトラム重複部が多い音源同士に関しても、FFT部101,12における周波数分解能を上げることにより、例えば4000タップ以上のFFT回路を用いることにより、音源除去品質を更に向上させることができる。
【0081】
[音声信号処理装置の第2の実施形態]
この第2の実施形態では、FFT部101および102からの周波数分割スペクトル成分F1およびF2から除去したい音源の音声成分を抽出し、当該抽出した音源の音声成分を、前記FFT部101および102からの周波数分割スペクトル成分F1およびF2から減算することにより、目的とする音源の音声成分を除去するようにする。
【0082】
図4は、この第2の実施形態の音声信号処理装置の構成例を示すブロック図である。この第2の実施形態においては、除去係数発生部31に代えて乗算係数発生部33を用いると共に、乗算部32Rおよび32Lと、逆FFT部105および106との間に、減算部107および108を設ける。
【0083】
そして、乗算部32Rおよび32Lの出力FexRが減算部107および108に供給されると共に、減算部107および108にはFFT部101の出力F1およびFFT部102の出力F2が供給される。減算部107では、出力F1から乗算部32Rの出力FexRが減算され、その減算出力が逆FFT部105に供給される。また、減算部108では、出力F2から乗算部32Lの出力FexLが減算され、その減算出力が逆FFT部106に供給される。
【0084】
セレクタ25からのレベル比rは、乗算係数発生部33に供給され、乗算係数発生部33からの乗算係数wが乗算部32Rおよび32Lに供給される。乗算係数発生部33は、除去係数ではなく、除去したい音源の成分を抽出するための乗算係数wを発生する。
【0085】
図5は、この乗算係数発生部33に設定する関数発生回路の関数の特性を示すもので、例えば、除去対象が、前述した音源MS3の音声信号S3である場合には、乗算係数発生部33には、図5(a)あるいは図5(b)のような特性の関数発生回路が設定される。
【0086】
図5(a)あるいは図5(b)の関数の特性は、左右チャンネルのレベル比rが1、あるいは1に近い場合、つまり、左右チャンネルが同レベルあるいは同レベルに近い周波数分割スペクトル成分では、乗算係数wは1あるいは1近傍となり、左右チャンネルのレベル比rが1あるいはその近傍以外の領域では、乗算係数wは0となっている。
【0087】
したがって、セレクタ25からのレベル比rが1、または1近傍となっている周波数分割スペクトル成分に対する乗算係数wは1、あるいは1に近い値となるので、乗算部33および34からは、当該周波数分割スペクトル成分は、ほぼそのままのレベルで出力される。一方、セレクタ25からのレベル比rが、1あるいはその近傍以外の値となっている周波数分割スペクトル成分に対する乗算係数wは0となるので、乗算部32Rおよび32Lからは、当該周波数分割スペクトル成分は、出力レベルが0とされて、出力されなくなる。
【0088】
すなわち、乗算部32Rおよび32Lからは、多数個の周波数分割スペクトル成分のうち、左右同レベルおよびその近傍となっている周波数分割スペクトル成分は、ほぼそのままのレベルで出力され、左右チャンネルのレベル差が大きい周波数分割スペクトル成分は、出力レベルが0とされて出力されなくなる。この結果、左右2チャンネルの音声信号SL,SRに同レベルで分配された音源MS3の音声信号S3の周波数分割スペクトル成分のみが乗算部32R、32Lから得られることになる。
【0089】
したがって、減算部107では、音源MS3の音声信号S3の成分が、出力F1から減算されて除去された出力が得られ、逆FTT部105に供給される。また、減算部108では、音源MS3の音声信号S3の成分が、出力F2から減算されて除去された出力が得られ、逆FTT部106に供給される。
【0090】
以上のようにして、この第2の実施形態においても、使用者が希望する音源の成分が、2チャンネルの音声信号SR、SLのそれぞれから独立に除去されて得られる。
【0091】
[音声信号処理装置の第3の実施形態]
上述の第1の実施形態の音声信号処理装置は、左右2チャンネルの音声信号SL,SRから、同一の音源の音声成分を除去するようにした場合であるが、2チャンネルの音声信号SLおよびSRにおいて、それぞれ各チャンネル独立に、別々の音源の音声成分を除去するようにすることもできる。第2の実施形態の音声信号処理装置は、その場合の例である。
【0092】
図6は、この第2の実施形態の音声信号処理装置の構成例を示すブロック図である。この図6の例において、前述した図1の第1の実施形態の各部と対応する部分には、同一符号を付してある。
【0093】
[第3の実施形態における周波数分割スペクトル制御処理部104の構成]
この第3の実施形態における周波数分割スペクトル比較処理部103は、レベル検出部21,22、レベル比算出部23,24、セレクタ25に加えて、セレクタ26が設けられる。そして、この第3の実施形態の場合には、セレクタ25は、右チャンネルにおいて、除去する音源に対応するレベル比rRを出力するものとされ、また、セレクタ26は、右チャンネルにおいて、除去する音源に対応するレベル比rRを出力するものとされる。
【0094】
すなわち、レベル比算出部23およびレベル比算出部24で算出されたレベル比は、セレクタ25,26に供給され、このセレクタ25,26からは、レベル比D1/D2とレベル比D2/D1の一方のレベル比が、出力レベル比rR,rLとして取り出される。
【0095】
この例の音声信号処理装置10は、左チャンネルの音声信号から除去する音源と、右チャンネルの音声信号から除去する音源とを別々に設定できるようにするために、2個のセレクタ25,26を設けて、右チャンネル用と、左チャンネル用の出力レベル比rR,rLを得るようにしている。
【0096】
セレクタ25,26には、除去すべきものとして使用者により、左、右の各チャンネル毎に設定された音源およびそのレベル比に応じて、レベル比算出部23の出力と、レベル比算出部24の出力のいずれを選択すべきかを選択制御するための選択制御信号SELR,SELLが供給される。このセレクタ25,26から得られる出力レベル比rR,rLは、周波数分割スペクトル制御処理部104に供給される。
【0097】
例えば、使用者が、除去すべき音源のレベル比として、左チャンネルおよび右チャンネルの信号の分配率の値PL,PR(PL,PRは1以下の値)をそれぞれ設定入力するように定められているものとしたとき、設定された分配率の値PL,PRが、PL/PR≦1であるときには、選択制御信号SELR,SELLは、セレクタ25,26からレベル比算出部23の出力(D2/D1)を、出力レベル比rR,rLとして選択する選択制御信号とされ、設定された分配率の値PL,PRが、PL/PR>1であるときには、選択制御信号SELR,SELLは、セレクタ25,26からレベル比算出部24の出力(D1/D2)を、出力レベル比rR,rLとして選択する選択制御信号とされる。
【0098】
なお、使用者により設定された分配率の値PR,PLが互いに等しい(レベル比rR,rL=1)ときには、セレクタ25,26では、レベル比算出部23の出力とレベル比算出部24の出力とのいずれを選択してもよい。
【0099】
[第3の実施形態における周波数分割スペクトル制御処理部104の構成]
周波数分割スペクトル制御処理部104は、この例では、右チャンネル用の除去係数発生部31Rおよび乗算部32Rと、左チャンネル用の除去係数発生部31Lおよび乗算部32Lとからなる。
【0100】
乗算部32Rには、FFT部101からの周波数分割スペクトル成分F1が供給されると共に、除去係数発生部31Rからの除去係数wRが供給され、両者の乗算結果が、周波数分割スペクトル制御処理部104の右チャンネル用スペクトル出力FexRとされる。
【0101】
また、乗算部32Lには、FFT部102からの周波数分割スペクトル成分F2が供給されると共に、除去係数発生部31Lからの除去係数wLが供給され、両者の乗算結果が、周波数分割スペクトル制御処理部104の左チャンネル用スペクトル出力FexRとされる。
【0102】
除去係数発生部31Rは、周波数分割スペクトル比較処理部103のセレクタ25からの出力レベル比rRを受けて、当該レベル比rRに応じた除去係数wRを発生する。また、除去係数発生部31Lは、周波数分割スペクトル比較処理部103のセレクタ26からの出力レベル比rLを受けて、当該レベル比rLに応じた除去係数wLを発生する。
【0103】
除去係数発生部31Rおよび31Lは、例えば、レベル比rRまたはrLを変数とした除去係数wRまたはwLに関する関数発生回路により構成される。除去係数発生部31Rおよび31Lに使用する関数として、どのような関数が選ばれるかは、分離すべき音源に応じて使用者により設定された分配率の値PL,PRによる。
【0104】
除去係数発生部31Rおよび31Lに供給されるレベル比rRおよびrLは、周波数分割スペクトルの各周波数成分単位で変化するものであるので、除去係数発生部31Rおよび31Lからの除去係数wRおよびwLも、周波数分割スペクトルの各周波数成分単位で変化することになる。
【0105】
したがって、乗算部32Rでは、FFT部101からの各周波数分割スペクトルのレベルが、除去係数wRにより制御され、また、乗算部32Lでは、FFT部102からの各周波数分割スペクトルのレベルが、除去係数wLにより制御される。
【0106】
例えば、セレクタ25からはレベル比算出部23からのレベル比をレベル比出力rRとして選択し、除去係数発生部31Rに図3(a)に示したような特性の関数発生回路を設定したときには、乗算部32Rからは、ボーカル成分である音声信号S3が除去された右チャンネル音声信号成分が得られる。
【0107】
そして、このとき、例えば、セレクタ26からはレベル比算出部24からのレベル比をレベル比出力rLとして選択し、除去係数発生部31Lに図3(c)に示したような特性の関数発生回路を設定したときには、乗算部32Rからは、音声信号S4が除去された左チャンネル音声信号成分が得られる。
【0108】
もちろん、セレクタ25,26から同じレベル比算出部からのレベル比をレベル比出力rR,rLとして得ると共に、除去係数発生部31R、31Lに同じ特性の関数発生回路を設定するようにすることもでき、その場合には、図1の場合と全く同様の作用効果を奏するものとなる。
【0109】
以上のようにして、この第2の実施形態の音声信号処理装置10においては、左右2チャンネルの、それぞれのチャンネルの音声信号SR、SLから、独立に設定した音源の音声信号を除去することができる。
【0110】
この第3の実施形態においても、第1の実施形態に対する第2の実施形態の関係のように、除去係数発生部31R、31Lに代えて、除去目的の音源の音声成分を抽出するための乗算係数を発生する乗算係数発生部を用いると共に、乗算部32Rおよび32Lと、逆FFT部105および106との間に、減算部を設け、周波数分割スペクトル制御処理部104で抽出した音源の音声成分を、各チャンネル毎に、出力F1,F2から減算するようにすることにより、上述した第3の実施形態と同様にして、目的とする音源の音声成分を各チャンネルの音声信号SR、SLから除去することができる。
【0111】
[音声信号処理装置の第4の実施形態]
この第4の実施形態は、2チャンネルの音声信号から使用者が除去したい音源を動的に変更することができるようにした場合である。
【0112】
すなわち、この第4の実施形態は、第3の実施形態に適用した場合で、2チャンネルの音声信号SL,SRのそれぞれから別々の音源(同じ音源でもよい)の音声信号を除去するようにする場合において、それぞれ除去する音源を使用者が動的に選択変更できるようにした場合である。
【0113】
図7は、この第4の実施形態の構成例を示すブロック図である。この第4の実施形態においては、周波数分割スペクトル制御処理部104は、右チャンネル用の除去係数発生部として、複数個の除去係数発生部31R1,31R2,・・・,31Rnを設けると共に、それら複数個の除去係数発生部31R1,31R2,・・・,31Rnのいずれか一つからの除去係数を選択して、当該選択した除去係数を、除去係数wRとして乗算部32Rに供給するスイッチ回路34Rを備える。
【0114】
また、同様にして、周波数分割スペクトル制御処理部104は、左チャンネル用の除去係数発生部として、複数個の除去係数発生部31L1,31L2,・・・,31Lnを設けると共に、それら複数個の除去係数発生部31L1,31L2,・・・,31Lnのいずれか一つからの除去係数を選択して、当該選択した除去係数を、除去係数wLとして乗算部32Lに供給するスイッチ回路34Lを備える。
【0115】
複数個の除去係数発生部31L1,31L2,・・・,31Lnおよび31R1,31R2,・・・,31Rnのそれぞれには、例えば、左右チャンネルのレベル比が種々の値となる音源を分離するために用いるレベル比対除去係数の関数が、設定される。
【0116】
また、周波数分割スペクトル比較処理部13には、レベル比算出部23,24のレベル比算出出力を受けて、いずれか一方のレベル比算出出力を、除去係数発生部31L1,31L2,・・・,31Ln,31R1,31R2,・・・,31Rnのそれぞれに供給する選択分配回路27が設けられる。
【0117】
そして、この第3の実施形態においては、除去音源選択信号発生部109が設けられる。この除去音源選択信号発生部109は、後述するように、選択操作手段を通じた、使用者による、除去する音源の選択操作に応じた信号Maを受けて、選択分配回路27に供給する選択信号SELTを発生すると共に、スイッチ回路34Lをスイッチ制御する信号SWLおよびスイッチ回路34Rをスイッチ制御する信号SWRを発生する。
【0118】
図示は省略するが、この例の音声信号処理装置は、例えば選択操作つまみやボタン、タッチパネル付きLCDなどの表示部を通じたグラフィカル・ユーザ・インターフェースを通じて、使用者からの除去する音源の選択操作を受け付けるようにする。このとき、選択操作対象となるのは、除去係数発生部31L1,31L2,・・・,31Ln,31R1,31R2,・・・,31Rnに設定された関数により分離可能な複数個の音源である。
【0119】
例えば、除去可能な複数の音源としては、左チャンネルの音像定位位置から右チャンネルの音像定位位置の間において、音像定位位置を徐々に変更するようなものとすることができる。
【0120】
この場合において、使用者は、左チャンネルおよび右チャンネルのそれぞれについて、独立に除去する音源を指定することができるようにされている。
【0121】
例えば、左チャンネルの除去係数発生部31L1からの除去係数によって左チャンネルの音声信号SLから分離可能な音源が、使用者によって、前記選択操作つまみやボタン、あるいはグラフィカル・ユーザ・インターフェースを通じて選択されたときには、その選択操作に応じた信号Maを受けた除去音源選択信号発生部109は、当該信号Maに対応したスイッチ制御信号SWLおよび選択信号SELTを発生する。
【0122】
そして、このとき、スイッチ回路34Lは、除去音源選択信号発生部109からのスイッチ制御信号SWLにより、除去係数発生部31L1を選択する状態に切り換えられ、また、選択分配回路27は、選択信号SELTにより、レベル比算出部23,24の一方(レベル比が1以下になる方)が選択されて、除去係数発生部31L1に供給される。
【0123】
これにより、乗算部32Lからは、選択指定された通りの音源の周波数分割スペクトル成分が除去された出力FexLが得られ、これが逆FFT部106により、元の時系列の音声信号に戻されて出力SOLとして出力される。
【0124】
右チャンネルにおいても、同様にして、使用者により選択設定された、除去したい音源の音声信号が除去される。
【0125】
なお、図7の第3の実施形態は、2チャンネルの音声信号のそれぞれから、所定の音源の音声信号をそれぞれ分離抽出する場合(第2の実施形態に適用した場合)であるが、第3の実施形態は、第1の実施形態や後述する実施形態にも適用可能であることは言うまでもない。
【0126】
すなわち、例えば第1の実施形態に適用する場合には、図1において、除去係数発生部31の代わりに複数個の除去係数発生部を設けると共に、それらの複数個の除去係数発生部と、音源分離部32との間に、複数個の除去係数発生部の1つからの除去係数を音源分離部32に供給するようにするスイッチ回路を設ける。さらに、使用者の選択操作信号Maを受け付け、スイッチ回路をスイッチ制御すると共に、除去係数発生部にレベル比算出部23,24の出力のうちの適切な方のレベルを供給するように制御する信号を発生する分離音源選択信号発生部を設けるようにする。
【0127】
この第4の実施形態においても、第1の実施形態に対する第2の実施形態の関係のように、除去係数発生部31R、31Lに代えて、除去目的の音源の音声成分を抽出するための乗算係数を発生する乗算係数発生部を用いると共に、乗算部32Rおよび32Lと、逆FFT部105および106との間に、減算部を設け、周波数分割スペクトル制御処理部104で抽出した音源の音声成分を、各チャンネル毎に、出力F1,F2から減算するようにすることにより、上述した第4の実施形態と同様にして、目的とする音源の音声成分を各チャンネルの音声信号SR、SLから除去することができる。
【0128】
[音声信号処理装置の第5の実施形態]
上述の実施形態の場合、左右2チャンネルの音声信号に対して、同じレベル比あるいはレベル差で、分配されて混合されている音源の音声信号が複数個存在している場合、それらは共に除去されてしまう。第5の実施形態は、このようにレベル比あるいはレベル差だけでは除去できない複数個の音源が存在する場合に、できるだけ、特定の音源の音声成分のみを除去できるように改善する第1の例である。
【0129】
この第5の実施形態は、レベル比あるいはレベル差だけでは除去できない複数個の音源のそれぞれの主たる周波数帯域が異なる場合、当該周波数帯域の違いを考慮して、上記の目的を達成したものである。
【0130】
図8は、この第5の実施形態の構成例を示すブロック図で、前述の実施形態の各部と対応する部分には同一符号を付してある。この第5の実施形態においては、FFT部101およびFFT部102の出力側に、除去したい音源の音声成分が主として含まれる周波数帯域の信号成分を抽出する帯域通過フィルタ110および111を設けると共に、除去したい音源の音声成分が主として含まれる周波数以外の帯域の信号成分を抽出する低域高域通過フィルタ112および113を設ける。
【0131】
また、周波数分割スペクトル制御処理部104の乗算部32Rおよび32Lと逆FFT部105および106との間に、それぞれ、加算部114および115を設ける。
【0132】
そして、FFT部101の出力である周波数分割スペクトル出力F1は、帯域通過フィルタ110および低域高域通過フィルタ112に供給される。そして、帯域通過フィルタ110から得られる、除去したい音源の音声成分が主として含まれる周波数帯域の信号成分は周波数分割スペクトル比較処理部103のレベル検出部21に供給されると共に、周波数分割スペクトル制御処理部104の乗算部32Rに供給される。
【0133】
また、低域高域通過フィルタ112から得られる、除去したい音源の音声成分が主として含まれる周波数以外の帯域の信号成分は、加算部114に供給される。加算部114には、また、周波数分割スペクトル制御処理部104の出力FexRが供給される。そして、加算部114からの加算出力が逆FFT部105に供給される。
【0134】
また、FFT部102の出力である周波数分割スペクトル出力F2は、帯域通過フィルタ111および低域高域通過フィルタ113に供給される。そして、帯域通過フィルタ111から得られる、除去したい音源の音声成分が主として含まれる周波数帯域の信号成分は周波数分割スペクトル比較処理部103のレベル検出部22に供給されると共に、周波数分割スペクトル制御処理部104の乗算部32Lに供給される。
【0135】
また、低域高域通過フィルタ113から得られる、除去したい音源の音声成分が主として含まれる周波数以外の帯域の信号成分は、加算部115に供給される。加算部115には、また、周波数分割スペクトル制御処理部104の出力FexLが供給される。そして、加算部115からの加算出力が逆FFT部106に供給される。
【0136】
以上のような構成の実施形態においては、第4の周波数分割スペクトル比較処理部103および周波数分割スペクトル制御処理部104では、除去したい音源の音声成分が主として含まれる周波数以外の帯域の信号成分についてのみ、上述の実施形態で説明したような音源成分除去動作がなされる。そして、当該音源成分除去がなされた結果としての出力FexRおよびFexLに、音源除去処理対象とならなかった周波数帯域の成分が加算部114および115でそれぞれ加算されて、逆FFT部105および106に供給される。
【0137】
したがって、同じレベル比あるいはレベル差を持って、2チャンネル音声信号に分配された複数個の音源成分が存在している場合であっても、それらの音源の音声成分が占める主たる周波数帯域が異なる場合には、この第4の実施形態を用いることにより、目的とする音源の音声成分のみを、2チャンネル音声信号のそれぞれのチャンネルの信号から除去することができる。
【0138】
この第5の実施形態においても、第1の実施形態に対する第2の実施形態の関係のように、除去係数発生部31R、31Lに代えて、除去目的の音源の音声成分を抽出するための乗算係数を発生する乗算係数発生部を用いると共に、乗算部32Rおよび32Lと、加算部114,115との間に、減算部を設け、周波数分割スペクトル制御処理部104で抽出した音源の音声成分を、各チャンネル毎に、帯域通過フィルタ110,111の出力から減算するようにすることにより、上述した第5の実施形態と同様にして、目的とする音源の音声成分を各チャンネルの音声信号SR、SLから除去することができる。
【0139】
[音声信号処理装置の第6の実施形態]
この第6の実施形態は、左右2チャンネルの音声信号に対して、同じレベル比あるいはレベル差で、分配されて混合されている音源の音声信号が複数個存在している場合の問題点を改善する第2の例である。
【0140】
以上の実施形態においては、2チャンネルの音声信号に、各音源の音声信号が分配されるときの位相は、2チャンネルで同相としたが、逆相で音源の音声信号が分配される場合もある。一例として、次の(式3)および(式4)のように、6個の音源MS1〜MS6からの音声信号S1〜S6が左右2チャンネルに分配されたステレオ音声信号SL,SRを考える。
【0141】
SL=S1+0.9S2+0.7S3+0.4S4+0.7S6 ・・・(式3)
SR=S5+0.4S2+0.7S3+0.9S4−0.7S6 ・・・(式4)
【0142】
すなわち、音源MS3の音声信号S3と、音源MS6の音声信号S6とは、左右チャンネルに、それぞれ同レベルで分配されているが、音源MS3の音声信号S3は、左右チャンネルに同相で分配されているのに対して、MS6の音声信号S6は、左右チャンネルに逆相で分配されている。
【0143】
上述の実施の形態と同様にして、位相を考慮せず、レベル比あるいはレベル差のみを用いて音源MS3の音声信号S3または音源MS6の音声信号S6のいずれかを除去しようとしても、音声信号S3とS6とは、同レベルで左右チャンネルに分配されているので、いずれか一方を除去することはできない。
【0144】
そこで、この第6の実施形態では、2チャンネル間におけるレベル比あるいはレベル差を用いて音源成分を分離した後、位相差を用いて更なる分離することにより、除去対象の音源の音声成分を分離し、当該分離した音源の音声成分を、FFT部101,102からの出力F1、F2から減算することにより、目的とする音源の音声成分の除去を行なうようにする。
【0145】
図9は、この第6の実施形態の音声信号処理装置の構成例を示すブロック図である。この第6の実施形態の音声信号処理装置における周波数分割スペクトル比較処理部103は、レベル比較処理部1031と、位相比較処理部1032とを備える。
【0146】
また、この第6の実施形態における周波数分割スペクトル制御処理部104は、第1周波数分割スペクトル制御処理部1041と、位相差に基づいた音源分離処理を実行するための第2の周波数分割スペクトル制御処理部1042とを備える。
【0147】
図10は、この第6の実施形態における周波数分割スペクトル比較処理部103と、周波数分割スペクトル制御処理部104の部分の詳細構成例を示すブロック図である。すなわち、周波数分割スペクトル比較処理部103のレベル比較処理部1031は、前述した第1の実施形態の周波数分割スペクトル比較処理部13と同様の構成の備え、レベル検出部21,22と、レベル比算出部23,24と、セレクタ25とからなる。
【0148】
そして、周波数分割スペクトル制御処理部104の第1周波数分割スペクトル制御処理部1041は、前述の第2の実施形態の周波数分割スペクトル制御処理部とほぼ同様の構成を備え、乗算係数発生部301と、乗算部302および303とからなる音源分離部の構成とされている。
【0149】
そして、図9および図10に示すように、レベル比較処理部1031からのレベル比出力rは、第1の実施形態と全く同様にして、第1周波数分割スペクトル制御処理部1041の乗算係数発生部301に供給され、この乗算係数発生部301から当該乗算係数発生部301に設定された関数に応じた乗算係数wrが発生し、乗算部302,303に供給される。
【0150】
乗算部302には、FFT部101からの周波数分割スペクトル成分F1が供給されており、当該周波数分割スペクトル成分と乗算係数wrとの乗算結果が、この乗算部302から得られる。また、乗算部303には、FFT部102からの周波数分割スペクトル成分F2が供給されており、当該周波数分割スペクトル成分と乗算係数wrとの乗算結果が、この乗算部303から得られる。
【0151】
すなわち、乗算部302,303からは、FFT部101,102からの周波数分割スペクトル成分F1,F2のそれぞれが、乗算係数発生部31からの乗算係数wrに応じてレベル制御された状態の出力が得られる。
【0152】
前述の第2の実施形態と同様に、乗算係数発生部301は、レベル比rを変数とした乗算係数wrに関する関数発生回路により構成される。乗算係数発生部301に使用する関数として、どのような関数が選ばれるかは、分離抽出すべき音源の左右2チャンネルの音声信号への分配率による。
【0153】
前述したように、乗算係数発生部301には、図5に示したような特性の、乗算係数wrのレベル比に関する関数が設定される。例えば、左右2チャンネルに同レベルで分配される音源の音声信号を分離抽出する場合には、前述したように、図5(a)に示した特定の関数が、乗算係数発生部301に設定される。
【0154】
この第6の実施形態では、乗算部302,303の出力は、それぞれ周波数分割スペクトル比較処理部103の位相比較処理部1032に供給されると共に、周波数分割スペクトル制御処理部104の第2周波数分割スペクトル制御処理部1042に供給される。
【0155】
位相比較処理部1032は、図10に示すように、乗算部302,303の出力の位相差φを検出する位相差検出部28からなり、その位相差φの情報を第2周波数分割スペクトル制御処理部1042に供給する。
【0156】
第2周波数分割スペクトル制御処理部1042は、乗算係数発生部304と、乗算部305および乗算部306と、減算部307および308とからなる。
【0157】
そして、乗算部305には、第1周波数分割スペクトル制御処理部1041の乗算部302の出力が供給されると共に、乗算係数発生部304からの乗算係数wpが供給され、両者の乗算結果が、この乗算部305から減算部307に供給される。この減算部307には、FFT部101の出力F1が供給されており、乗算部305の出力が出力F1から減算され、その減算結果が、周波数分割スペクトル制御処理部104の第1の出力(右チャンネル用出力)FexRとされる。
【0158】
また、乗算部306には、第1周波数分割スペクトル制御処理部1041の乗算部303の出力が供給されると共に、乗算係数発生部304からの乗算係数wpが供給され、両者の乗算結果が、この乗算部306から減算部308に供給される。この減算部308には、FFT部102の出力F2が供給されており、乗算部306の出力が出力F2から減算され、その減算結果が、周波数分割スペクトル制御処理部104の第2の出力(左チャンネル用出力)FexLとされる。
【0159】
乗算係数発生部304は、位相差検出部28からの位相差φの情報を受けて、当該位相差φに応じた乗算係数wpを発生する。乗算係数発生部304は、位相差φを変数とした乗算係数wpに関する関数発生回路により構成される。乗算係数発生部304に使用する関数として、どのような関数が選ばれるかは、分離すべき音源の前記2チャンネルに対する位相差に応じて、使用者により設定される。
【0160】
乗算係数発生部304に供給される位相差φは、周波数分割スペクトルの各周波数成分単位で変化するものであるので、乗算係数発生部304からの乗算係数wpも、周波数分割スペクトルの各周波数成分単位で変化することになる。したがって、乗算部305および乗算部306では、乗算部302および乗算部303からの各周波数分割スペクトルのレベルが、乗算係数wpにより制御される。
【0161】
図11に、乗算係数発生部304としての関数発生回路に用いられる関数の例を示す。
【0162】
図11(a)の関数の特性は、左右チャンネルの位相差φが0、あるいは0に近い場合、つまり、左右チャンネルが同相あるいは同相に近い周波数分割スペクトル成分では、乗算係数wpは1あるいは1近傍となり、左右チャンネルの位相差φが約π/4以上の領域では、乗算係数wpは0となっている。
【0163】
例えば乗算係数発生部304に、この図11(a)の特性の関数が設定されている場合において、位相差検出部28からの位相差φが0、または0近傍となっている周波数分割スペクトル成分に対する乗算係数wpは1、あるいは1に近い値となるので、乗算部305、306からは、当該周波数分割スペクトル成分は、ほぼそのままのレベルで出力される。一方、位相差検出部28からの位相差φが、約π/4以上の値となっている周波数分割スペクトル成分に対する乗算係数wpは0となるので、乗算部305,306からは、当該周波数分割スペクトル成分は、出力レベルが0とされて、出力されなくなる。
【0164】
すなわち、乗算部305,306からは、多数個の周波数分割スペクトル成分のうち、左右同相およびその近傍の位相差となっている周波数分割スペクトル成分は、ほぼそのままのレベルで出力され、左右チャンネルの位相差が大きい周波数分割スペクトル成分は、出力レベルが0とされて出力されなくなる。この結果、左右2チャンネルの音声信号SL,SRに同相で分配された音源の音声信号の周波数分割スペクトル成分のみが乗算部305,306から得られることになる。
【0165】
つまり、この図11(a)の特性の関数は、左右2チャンネルに同相で分配されている音源の信号を抽出する際に用いられる。
【0166】
また、図11(b)の関数の特性は、左右チャンネルの位相差φがπ、あるいはπに近い場合、つまり、左右チャンネルが逆相あるいは逆相に近い周波数分割スペクトル成分では、乗算係数wpは1あるいは1近傍となり、左右チャンネルの位相差φが約3π/4以下の領域では、乗算係数wpは0となっている。
【0167】
例えば乗算係数発生部301に、この図11(b)の特性の関数が設定されている場合において、位相差検出部28からの位相差φがπ、またはπ近傍となっている周波数分割スペクトル成分に対する乗算係数wpは1、あるいは1に近い値となるので、乗算部305、306からは、当該周波数分割スペクトル成分は、ほぼそのままのレベルで出力される。一方、位相差検出部28からの位相差φが、約3π/4以下の値となっている周波数分割スペクトル成分に対する乗算係数wpは0となるので、乗算部305,306からは、当該周波数分割スペクトル成分は、出力レベルが0とされて、出力されなくなる。
【0168】
すなわち、乗算部305,306からは、多数個の周波数分割スペクトル成分のうち、左右逆相およびその近傍の位相差となっている周波数分割スペクトル成分は、ほぼそのままのレベルで出力され、左右チャンネルの位相差が小さい周波数分割スペクトル成分は、出力レベルが0とされて出力されなくなる。この結果、左右2チャンネルの音声信号SL,SRに逆相で分配された音源の音声信号の周波数分割スペクトル成分のみが乗算部305,306から得られることになる。
【0169】
つまり、この図11(b)の特性の関数は、左右2チャンネルに逆相で分配されている音源の信号を抽出する際に用いられる。
【0170】
同様にして、図11(c)の特性の関数は、左右チャンネルの位相差φが約π/2、あるいは約π/2に近い場合の周波数分割スペクトル成分では、乗算係数wpは1あるいは1近傍となり、その他の位相差φの領域では、乗算係数wpは0となっている。したがって、この図11(c)の特性の関数は、左右2チャンネルに、互いに約π/2だけ異なる位相で分配されている音源の信号を抽出する際に用いられる。
【0171】
その他、乗算係数発生部305および306には、分離する音源の音声信号の2チャンネルへ分配する際の位相差に応じて、図11(d)や(e)に示すような特性の関数を設定することもできる。
【0172】
この第6の実施形態において、例えば、前記(式3)および(式4)で示された左右2チャンネルの音声信号SLおよびSRから、同レベルであるが、同相で左右チャンネルに分配された音源MS3の音声信号S3と、逆相で左右チャンネルに分配された音源MS6の音声信号S6との内、例えば音源MS3の音声信号S3を、左右チャンネルから除去する場合には、第1周波数分割スペクトル制御処理部1041の乗算係数発生部301には、図5(a)に示したような特性の関数が設定される。また、第2周波数分割スペクトル制御処理部1042の乗算係数発生部304には、図11(b)に示すような特性となる関数が設定される。
【0173】
すると、図9および図10に示すように、周波数分割スペクトル制御処理部104の第1周波数分割スペクトル制御処理部1041の乗算部302からは、右チャンネルの音声信号SRをFFTした信号(周波数分割スペクトル)F1のうちの、(S3−S6)なる周波数分割スペクトル成分が得られ、また、乗算部303からは、左チャンネルの音声信号SLをFFTした信号(周波数分割スペクトル)F2のうちの、(S3+S6)なる周波数分割スペクトル成分が得られる。つまり、信号S3とS6とは、左右チャンネルに同レベルで分配されているので、第1周波数分割スペクトル制御処理部1041では、分離できずに出力されることになる。
【0174】
しかし、この第6の実施形態では、信号S3とS6とが逆相で左右チャンネルに分配されていることを利用して、次のようにして、当該信号S3と、S6とが分離される。
【0175】
すなわち、乗算部302および303の出力は、周波数分割スペクトル比較処理部103の位相比較処理部1032を構成する位相差検出部28に供給されて、両出力の位相差φが検出される。そして、この位相差検出部28で検出された位相差φの情報は、乗算係数発生部304に供給される。
【0176】
乗算係数発生部304では、図11(a)に示すような特性の関数が設定されていることから、乗算部305,306では、左右チャンネルに同相で分配されている音源の音声信号S3を抽出する。すなわち、周波数分割スペクトル成分(S3+S6)と、周波数分割スペクトル成分(S3−S6)のうちの、同相関係にある音源MS3の音声信号S3の周波数分割スペクトル成分のみが乗算部305および306のそれぞれから得られ、減算部307および308に供給される。
【0177】
したがって、減算部307からは、出力F1から音源MS3の音声信号S3の周波数分割スペクトル成分が除去された出力信号FexRが導出され、逆FFT部105に供給される。また、減算部308からは、出力F2から音源MS3の音声信号S3の周波数分割スペクトル成分が除去された出力信号FexLが導出され、逆FFT部106に供給される。そして、逆FFT部105および106で時系列信号に戻され、出力信号SORおよびSOLとして出力される。
【0178】
なお、図9および図10に示した実施形態では、第2周波数分割スペクトル制御処理部1042では、第1周波数分割スペクトル制御処理部1041においてレベル比を用いては分離できない2つの信号、上述の例では、同相の信号S3と、逆相の信号S6とを、それぞれ乗算係数および乗算部を用いて、それぞれ分離するようにしたが、それらレベル比を用いては分離できない2つの信号の一方を、位相差φと乗算係数を用いて、分離したら、当該分離した信号を、第1周波数分割スペクトル制御処理部1041からの信号の和(乗算部302の出力と乗算部303の出力を加算した信号)から減算することにより、前記2つの信号の他方の信号を、分離するようにすることもできる。
【0179】
[音声信号処理装置の第7の実施形態]
第7の実施形態は、2系統の周波数分割スペクトルについての位相差に基づいて、所望の音源分離を行なうようにする場合である。図12に、この第7の実施形態の音声信号処理装置の構成例のブロック図を示す。
【0180】
この第7の実施形態においては、周波数分割スペクトル比較処理部103は、位相差検出部29で構成され、FFT部101の出力F1およびFFT部102の出力F2が、この位相差検出部29に供給されると共に、周波数分割スペクトル制御処理部104に供給される。周波数分割スペクトル制御処理部104は、図1の場合と同様に、除去係数発生部35と、乗算部32R,32Lとからなるが、除去係数発生部35が、位相差を入力として除去係数wpを出力する点が図1とは異なる。
【0181】
この第7の実施形態は、第6の実施形態における位相比較処理部1032と第2周波数分割スペクトル制御処理部1042とにおいて、乗算係数発生部に代えて除去係数発生部を設けたときの動作と全く同様の動作となる。
【0182】
すなわち、除去係数発生部35には、除去目的の音源の音声成分が左右2チャンネルに対して分配されるときの位相差φのときに、除去係数wpが0、その他の位相差の時に除去係数wpが1となるような特性の関数発生回路が設定される。例えば、前記(式3)および(式4)に示したような信号SL,SRの場合に、除去係数発生部35に、図11(b)に示すような特性の関数発生回路を設定したときには、周波数分割スペクトル制御処理部104からは、逆相で2チャンネルに分配された音源MS6の音声信号S6が、それぞれのチャンネルの信号から除去されたものが得られる。
【0183】
なお、この第7の実施形態においても、第2の実施形態と同様に、除去係数発生部35を、出力F1,F2から特定の音源の音声成分を分離抽出するための乗算係数発生部に置き換え、周波数分割スペクトル制御処理部104と逆FFT部105および106との間に、出力F1,F2から周波数分割スペクトル制御処理部104の乗算部32R,32Lの出力を減算する減算部を設ける構成を変形例とすることができる。
【0184】
[音声信号処理装置の第8の実施形態]
図13は、第8の実施形態の音声信号処理装置の構成例を示すブロック図である。この図13の例においては、左右2チャンネルの音声信号SL、SRの一方、図の例では、左チャンネルの音声信号SLから、デジタルフィルタを用いて、左右チャンネルに所定のレベル比あるいはレベル差で分配された音源の音声信号を、左チャンネル信号から除去するようにする。
【0185】
すなわち、左チャンネルの音声信号(この例ではデジタル信号)SLは、タイミング調整用の遅延部41を通じてデジタルフィルタ42に供給される。このデジタルフィルタ42には、後述するようにして、除去したい音源の音声信号の、左右チャンネルに対するレベル比に基づいて形成されるフィルタ係数(除去係数に対応)が供給されて、信号SLから前記除去したい音源の音声信号が除去された信号SOL、このデジタルフィルタ42から出力されるようにされる。
【0186】
前記フィルタ係数は、次のようにして形成される。先ず、左右チャンネルの音声信号SLおよびSR(デジタル信号)は、FFT部43およびFFT部44にそれぞれに供給されて、FFT処理されて時系列音声信号が周波数領域データに変換され、FFT部43およびFFT部44のそれぞれから、周波数が互いに異なる多数個の周波数分割スペクトル成分F1,F2が出力される。
【0187】
FFT部43および44のそれぞれからの周波数分割スペクトル成分のそれぞれは、レベル検出部45,46に供給されて、その振幅スペクトルあるいはパワースペクトルが検出されることにより、そのレベルが検出される。そして、レベル検出部45,46の各々で検出されたレベル値D1,D2は、レベル比算出部47に供給され、そのレベル比D1/D2またはD2/D1の一方が算出される。
【0188】
このレベル比算出部47で算出されたレベル比の値は、重み付け係数発生部48に供給される。この重み付け係数発生部48は、前述の実施形態の除去係数発生部に対応するものであり、除去したい音源の音声信号の、左右2チャンネルの音声信号に対する混合レベル比およびその近傍のレベル比では0あるいは非常に小さい値の重み付け係数を出力し、その他のレベル比では1あるいは大きな値の重み付け係数を出力する。この重み付け係数は、FFT部43,44の出力である周波数分割スペクトル成分の各周波数ごとに得られる。
【0189】
この重み付け係数発生部48からの周波数領域の重み付け係数は、フィルタ係数生成部49に供給され、時間軸領域のフィルタ係数に変換される。このフィルタ係数生成部49は、周波数領域の重み付け係数を、逆FFTを行なうことにより、デジタルフィルタ42に供給するフィルタ係数を得る。
【0190】
そして、このフィルタ係数生成部49からのフィルタ係数が、デジタルフィルタ42に供給されて、デジタルフィルタ42から、重み付け係数発生部48に設定された関数に応じた音源の音声信号成分が除去されて、出力SOLとされる。なお、遅延部41は、音声信号SLに対して、デジタルフィルタ42に供給されるフィルタ係数が生成されるまでの処理遅延時間を調整するためのものである。
【0191】
図13は、左チャンネル信号SLについてのみ説明したが、右チャンネル信号SRについても、遅延部を介して当該右チャンネルの信号が供給されるデジタルフィルタの系を設け、フィルタ係数発生部49からのフィルタ係数を当該右チャンネル用のデジタルフィルタにも供給することにより、全く同様にして、右チャンネルについても特定の音源の音声成分の除去をすることができる。
【0192】
図13の例は、レベル比のみを考慮したものであるが、位相差のみ、またレベル比と位相差を合わせて考慮する構成とすることもできる。すなわち、例えばレベル比と位相差とを合わせて考慮する場合には、図示は省略するが、FFT部43および44の出力を位相差検出部にも供給すると共に、検出した位相差をも、重み付け係数発生部に供給する。この例の場合の重み付け係数発生部は、除去する音源の左右2チャンネルの音声信号に対するレベル差のみではなく、位相差をも変数として重み付け係数を発生する関数発生回路の構成とされる。
【0193】
つまり、この場合の重み付け係数発生部は、除去しようとする音源の音声信号の、左右2チャンネルにおけるレベル比およびその近傍のレベル比のときであって、前記、除去しようとする音源の音声信号の、左右2チャンネルにおける位相差およびその近傍の位相差のときには、大きい重み付け係数を発生し、その他では小さい係数を発生するような関数に設定される。
【0194】
そして、その重み付け係数発生部からの重み付け係数が逆FFTされることにより、デジタルフィルタ42のフィルタ係数とされるものである。
【0195】
[その他の実施形態の音声信号処理装置]
上述の実施形態において、入力音声信号をFFTする場合、楽音のように長い時系列信号をそのままFFT処理することは困難なので、所定分析区間に区分けして、当該分析区間ごとの区分データを得ることによりFFT処理を行なう。
【0196】
しかしながら、時系列データを単純に一定の長さだけ取り出し、音源分離処理を行った後、逆FFT変換して結合した場合、その結合点において波形の不連続点を発生し、音として聞いた場合、ノイズを発生すると言う問題がある。
【0197】
そこで、第9の実施形態では、区分データを取り出すのに、図14に示すように、区間1、区間2、区間3、区間4、・・・の長さを、それぞれ同じ長さの単位区間とするが、隣り合う区間では、前記単位区間の長さの例えば1/2の区間分を、互いに重複するように各区間を設定して、各区間の区分データを取り出すようにする。なお、図14において、x1、x2、x3、・・・、xnは、デジタル音声信号のサンプルデータを示している。
【0198】
このようにして処理すると、上述の実施形態のようにして音源分離処理され、逆FFT 変換された時系列データも、図15に示す出力区分データ1,2のように、重複区間を持つことになる。
【0199】
そして、この第9の実施形態では、図15に示すように、重複区間を持って隣り合う出力区分データ、例えば出力区分データ1,2の重複区間に対して、図15に示すような三角窓の特性となる窓関数1、2の処理を行ない、各出力区分データ1,2の重複区間における同時刻データ同士を加算することにより、図15に示すような出力合成データを得るようにする。これにより、波形の不連続点の無い、すなわちノイズの無い、分離された出力音声信号が得られる。
【0200】
さらに、第10の実施形態では、区分データを取り出すのに、図16に示すように、隣り合う区分データの一定区間として、区間1、区間2、区間3、区間4のように、互いに重複して取り出すようにすると同時に、これらの各区間の区分データを、FFT処理する前に、図16に示すような三角窓の窓関数1,2,3,4の、窓関数処理を行なう。
【0201】
そして、この図16に示すような窓関数処理を行なった後、FFT変換処理を行なうようにする。そして、しかるべき音源分離処理された信号を、逆FFT変換すると、図17に示すような出力区分データ1、2が得られる。この出力区分データは、既に重複部において窓関数処理されたデータになっているので、出力部では、各重複区分データ部を加算するだけで、波形の不連続点のないノイズの無い、分離された音声信号を得ることが可能となる。
【0202】
なお、上述の窓関数としては、三角窓の他、ハニング窓またはハミング窓、あるいはブラックマン窓、などを用いることができる。
【0203】
また、上述の実施形態では、時間離散信号を直交変換することにより、周波数領域の信号に変換し、ステレオチャンネル間の周波数分割スペクトルを比較するようにしたが、原理的には時間領域で信号を多数のバンドバスフィルタにより細分化し、各周波数バンドについて同様の処理を行なうように構成するようにしてもよい。ただし、上述の実施形態のように、FFT処理をする方が、周波数分解能を上げることが容易であり、分離する音源の分離度を向上させることができるので、実用性が大きい。
【0204】
なお、上述の実施形態では、この発明が適用される2系統の音声信号として、2チャンネルステレオ信号について説明したが、この発明は、音源の音声信号が所定のレベル比あるいはレベル差で分配される2つの音声信号であれば、どのような2系統の音声信号であっても適用可能である。位相差についても同様である。
【0205】
また、上述の実施形態では、2系統の音声信号についての周波数分割スペクトルのレベル比を求め、除去係数発生部あるいは乗算係数発生部は、レベル比対乗算係数の関数を用いるようにしたが、2系統の音声信号についての周波数分割スペクトルのレベル差を求め、除去係数発生部あるいは乗算係数発生部は、当該レベル差対乗算係数の関数を用いるようにしてもよい。
【0206】
また、時系列信号を周波数領域の信号に変換する直交変換手段としては、FFT処理手段に限られるものではなく、周波数分割スペクトルのレベルや位相を比較することができるものであれば、どのようなものであってもよい。
【図面の簡単な説明】
【0207】
【図1】この発明による音声信号処理装置の第1の実施形態の構成例を示すブロック図である。
【図2】第1の実施形態の音声信号処理装置が適用されたカラオケ装置の構成例を示すブロック図である。
【図3】図1において、周波数分割スペクトル制御処理部の除去係数発生部31に設定される関数の幾つかの例を示す図である。
【図4】この発明による音声信号処理装置の第2の実施形態の構成例を示すブロック図である。
【図5】図4において、周波数分割スペクトル制御処理部の乗算係数発生部33に設定される関数の幾つかの例を示す図である。
【図6】この発明による音声信号処理装置の第3の実施形態の構成例を示すブロック図である。
【図7】この発明による音声信号処理装置の第4の実施形態の構成例を示すブロック図である。
【図8】この発明による音声信号処理装置の第5の実施形態の構成例を示すブロック図である。
【図9】この発明による音声信号処理装置の第6の実施形態の構成例を示すブロック図である。
【図10】図9の第6の実施形態の要部の構成例を示すブロック図である。
【図11】図10の乗算係数発生部304に設定される関数の幾つかの例を示す図である。
【図12】この発明による音声信号処理装置の第7の実施形態の構成例を示すブロック図である。
【図13】この発明による音声信号処理装置の第8の実施形態の構成例を示すブロック図である。
【図14】この発明による音声信号処理装置の第9の実施形態の構成例を説明するための図である。
【図15】この発明による音声信号処理装置の第9の実施形態の構成例を説明するための図である。
【図16】この発明による音声信号処理装置の第10の実施形態の構成例を説明するための図である。
【図17】この発明による音声信号処理装置の第10の実施形態の構成例を説明するための図である。
【図18】従来のボーカル除去方法を説明するためのブロック図である。
【符号の説明】
【0208】
10…音声信号処理装置、101,102…FFT部、103…周波数分割スペクトル比較処理部、104…周波数分割スペクトル制御処理部、105,106…逆FFT部、21,22…レベル検出部、23,24…レベル比算出部、25,26…セレクタ、31…除去係数発生部、32R,32L…乗算部、33…乗算係数発生部、28,29…位相差検出部
【技術分野】
【0001】
この発明は、それぞれ複数の音源からの音声信号により構成される2系統の入力音声時系列信号から、特定の音源の音声信号を除去するようにする音声信号処理装置および方法に関する。
【背景技術】
【0002】
レコードやコンパクトディスク等に記録された左右2チャンネルのステレオ音楽信号の各チャンネルの音声信号には、複数の音源からの音声信号により構成されるものが多数存在する。このようなステレオ音声信号では、2個のスピーカで再生した場合に、前記複数個の音源のそれぞれがスピーカ間に音像として定位するように、レベル差を付加してそれぞれのチャンネルに記録する場合が多い。
【0003】
例えば、5個の音源1〜5の信号をS1〜S5とし、これを左右2チャンネルの音声信号SL,SRとして記録する場合に、
SL=S1+0.9S2+0.7S3+0.4S4
SR=S5+0.4S2+0.7S3+0.9S4
のように、各音源1〜5の信号S1〜S5は、左右2チャンネルにおいてレベル差を付けて、それぞれのチャンネルの音声信号中に加算混合するようにする。
【0004】
以上のような一般的な2チャンネルステレオ音声信号が歌手のボーカル音声とオーケストラの音楽とからなる場合に、ボーカルの音声のみを除去することができれば、いわゆるカラオケ装置に適用することができる。
【0005】
図18は、このボーカル除去処理装置の構成例を示すブロック図である。この図18の例のボーカル除去処理装置は、通常は、ステレオ音声において、ボーカル音声が左右チャンネルの音声の中央に定位するようにされていることから、左右チャンネルの音声信号を互いに減算することによりボーカル音声を、ステレオ音声出力から除去することができることを利用している。
【0006】
図18の例においては、ボーカル音声帯域のみに上記の原理を適用するように構成されており、左右チャンネルの音声信号SL,SRのそれぞれは、減算回路1に供給されると共に、ボーカル音声帯域(例えば300Hz〜5kHz)の周波数成分を除去する帯域除去フィルタ2および3に供給される。そして、減算回路1からの左右チャンネルの音声信号の減算出力は、ボーカル音声帯域の周波数成分を抽出する帯域通過フィルタ(バンドパスフィルタ)4に供給される。
【0007】
そして、帯域除去フィルタ2の出力信号と、バンドパスフィルタ4の出力信号とを加算回路5で加算して、この加算回路5からボーカル音声成分を除去した出力左チャンネル音声信号SOLを得る。また、帯域除去フィルタ3の出力信号と、バンドパスフィルタ4の出力信号とを加算回路6で加算して、この加算回路6からボーカル音声成分を除去した出力右チャンネル音声信号SORを得る。
【0008】
参考となる特許文献は、次の通りである。
【特許文献1】特開2000−354299号公報
【発明の開示】
【発明が解決しようとする課題】
【0009】
しかしながら、上述のようなボーカル音源除去方法の場合には、ボーカル音声帯域では、モノーラル信号となり、ステレオ感が低減してしまうという欠点がある。また、ボーカル除去が十分には行われないという欠点があった。
【0010】
この発明は、以上の点にかんがみ、複数の音源の音声信号が含まれている2系統の音声信号から、例えば上述のボーカルの音源などのような特定の音源の音声信号を良好に除去することができる音声信号処理装置および方法を提供することを目的とする。
【課題を解決するための手段】
【0011】
上記の課題を解決するために、この発明による音声信号処理装置は、
2系統の音声信号のそれぞれを複数個の周波数帯域に分割する分割手段と、
前記分割手段からの前記分割された複数個の周波数帯域の各々における前記2系統の音声信号のレベル比またはレベル差を算出するレベル比較手段と、
前記レベル比較手段で算出された前記レベル比または前記レベル差が予め定めた値およびその近傍となる周波数帯域の成分を、前記分割手段からの前記2系統の音声信号の少なくとも一方から除去する出力制御手段と、
を備えることを特徴とする。
【0012】
この発明においては、各音源の音声信号は、所定のレベル比あるいはレベル差で、2系統の音声信号に混合されていることを利用する。請求項1の発明においては、2系統の音声信号のそれぞれを、複数個の周波数帯域に分割する。そして、各周波数帯域ごとに2系統の音声信号のレベル比またはレベル差が算出され、そのレベル比またはレベル差が、予め定めた値およびその近傍となる周波数帯域の信号成分が、2系統の音声信号の少なくとも一方から除去される。
【0013】
前記予め定めたレベル比あるいはレベル差が、特定の音源の音声信号が前記2系統の音声信号に混合されているレベル比あるいはレベル差に設定されていれば、当該特定の音源の音声信号を構成する周波数成分が少なくとも2系統の音声信号の少なくとも一方から除去される。つまり、特定の音源の音声信号が除去される。
【0014】
請求項2の発明は、
2系統の入力音声時系列信号を、それぞれ周波数領域信号に変換する第1および第2の直交変換手段と、
前記第1の直交変換手段と前記第2の直交変換手段からの対応する周波数分割スペクトル同士のレベル比またはレベル差を比較する周波数分割スペクトル比較手段と、
前記周波数分割スペクトル比較手段における比較結果に基づいて、前記第1の直交変換手段と前記第2の直交変換手段の少なくとも一方から得られる周波数分割スペクトルのレベルを制御して、前記レベル比または前記レベル差が予め定めた値およびその近傍となる周波数成分を、前記2系統の音声信号の少なくとも一方から除去する周波数分割スペクトル制御手段と、
前記周波数分割スペクトル制御手段からの前記周波数領域信号を、時系列信号に戻す逆直交変換手段と、
を備えることを特徴とする。
【0015】
この請求項2の発明においては、2系統の入力音声時系列信号は、それぞれ第1および第2の直交変換手段により周波数領域信号に変換されて、それぞれ複数個の周波数分割スペクトルからなる成分に変換される。
【0016】
そして、請求項2では、第1の直交変換手段と第2の直交変換手段からの対応する周波数分割スペクトル同士のレベル比またはレベル差が比較され、その比較結果に基づいて、第1の直交変換手段と第2の直交変換手段の少なくとも一方から得られる周波数分割スペクトルのレベルを制御して、前記レベル比または前記レベル差が予め定めた値およびその近傍となる周波数成分を除去する。そして、除去後の周波数領域信号が時系列信号に戻される。
【0017】
予め定めたレベル比あるいはレベル差が、特定の音源の音声信号が前記2系統の音声信号に混合されているレベル比あるいはレベル差に設定されていれば、当該特定の音源の音声信号を構成する周波数領域成分が少なくとも2系統の音声信号の少なくとも一方から除去される。つまり、特定の音源の音声信号が除去される。
【0018】
請求項3の発明は、
2系統の入力音声時系列信号を、それぞれ周波数領域信号に変換する第1および第2の直交変換手段と、
前記第1の直交変換手段と前記第2の直交変換手段からの、対応する周波数分割スペクトル同士の位相差を算出する位相差算出手段と、
前記位相差算出手段で算出された前記位相差に基づいて、前記第1の直交変換手段と前記第2の直交変換手段の少なくとも一方の周波数分割スペクトルのレベルを制御して、前記位相差が予め定めた値およびその近傍となる周波数成分を、前記2系統の音声信号の少なくとも一方から除去する周波数分割スペクトル制御手段と、
前記周波数分割スペクトル制御手段からの前記周波数領域信号を、時系列信号に戻す逆直交変換手段と、
を備えることを特徴とする。
【0019】
請求項3の発明においては、2系統の入力音声時系列信号は、それぞれ第1および第2の直交変換手段により周波数領域信号に変換されて、それぞれ複数個の周波数分割スペクトルからなる成分に変換される。
【0020】
そして、請求項3では、第1の直交変換手段と第2の直交変換手段からの対応する周波数分割スペクトル同士の位相差が算出され、その算出結果に基づいて、第1の直交変換手段と第2の直交変換手段の少なくとも一方から得られる周波数分割スペクトルのレベルを制御して、前記位相差が予め定めた値およびその近傍となる周波数成分を除去する。そして、除去後の周波数領域信号が時系列信号に戻される。
【0021】
予め定めた位相差が、特定の音源の音声信号が前記2系統の音声信号に混合されている位相差に設定されていれば、当該特定の音源の音声信号を構成する周波数領域成分が少なくとも2系統の音声信号の少なくとも一方から除去される。つまり、特定の音源の音声信号が除去される。
【発明の効果】
【0022】
この発明によれば、2系統の音声信号に対して、所定のレベル比あるいはレベル差、または、所定の位相差をもって、混合された音源の音声信号は、前記2系統の音声信号の少なくとも一方から良好に除去される。
【発明を実施するための最良の形態】
【0023】
以下、この発明による音声信号処理装置および方法の実施形態を、図を参照しながら説明する。
【0024】
以下の説明においては、前述もした左チャンネル音声信号SLと、右チャンネル音声信号SRとからなるステレオ音声信号から、音源除去する場合について説明する。
【0025】
例えば、左チャンネル音声信号SLと、右チャンネル音声信号SRとに、音源1〜5の音声信号S1〜S5が、次の(式1)および(式2)に示すような割合で、レベル差が付けられて振り分けられて混合されているものとする。
【0026】
SL=S1+0.9S2+0.7S3+0.4S4 ・・・(式1)
SR=S5+0.4S2+0.7S3+0.9S4 ・・・(式2)
【0027】
この(式1)および(式2)を比べると、各音源1〜5の音声信号S1〜S5は、上記のようにレベル差を持って、左チャンネル音声信号SLと右チャンネル音声信号SRとに分配されているので、この分配比率によって、音源を再度、左チャンネル音声信号SLおよび/または右チャンネル音声信号SRとから振り分けることができれば、元の音源は分離できるので、除去できる。
【0028】
以下の実施形態においては、各音源が一般的には異なるスペクトラム成分を有していることを利用して、左右2チャンネルステレオ音声信号のそれぞれを十分な解像度を有するFFT処理により周波数領域に変換して、多数個の周波数分割スペクトル成分に分割する。そして、それぞれのチャンネルの音声信号についての、対応する各周波数分割スペクトル同士のレベル比またはレベル差を求め、(式1),(式2)において、分離したい音源の音声信号についての分配比に対応するレベル比またはレベル差となっている周波数分割スペクトルを検出して、当該検出した周波数分割スペクトル成分を分離することにより、他の音源からの影響の少ない音源分離を可能にしている。
【0029】
図2は、この発明の第1の実施形態の音声信号処理装置を含むカラオケ装置の構成例を示す図である。この例のカラオケ装置においては、先ず、オーケストラをバックにして歌う歌手のボーカル音声信号が、左右2チャンネルに同レベルで混合されているステレオ音声信号から、第1の実施形態の音声信号処理装置において、前記歌手のボーカル音声信号を除去するようにする。そして、第1の実施形態の音声信号処理装置からのボーカル音声信号の除去されたバックのオーケストラの音楽信号のみからなる音声信号に、ユーザの歌声信号を混合してスピーカから出力するようにする。
【0030】
すなわち、図2に示すように、左右2チャンネルの音声信号SLおよびSRは、後で詳述する第1の実施形態の音声信号処理装置10に供給されて、歌手のボーカル音声信号が除去される。この音声信号処理装置10からのボーカル音声信号が除去された左右チャンネルの音声信号SOL,SORは、それぞれD/A変換器11L,11Rに供給されて、アナログ音声信号に戻された後、ミキシング回路12を構成する加算回路121,122にそれぞれ供給される。
【0031】
一方、マイクロホン13によりユーザの歌声音声が収音され、このマイクロホン13からの歌声音声信号がアンプ14を通じて加算回路121,122のそれぞれに供給され、この混合回路121,122において、D/A変換器11L,11Rからのオーケストラの音楽信号と混合される。
【0032】
そして、混合回路121,122からの混合出力音声信号は、それぞれアンプ15L,15Rを通じて、それぞれ左チャンネル用スピーカ16L,右チャンネル用スピーカ16Rに供給されて、音響出力される。なお、17は、リスナである。
【0033】
[第1の実施形態の音声信号処理装置の構成]
図1は、第1の実施形態の音声信号処理装置を示すブロック図である。2チャンネルステレオ信号のうちの右チャンネル音声信号SRは、直交変換手段の例としてのFFT(Fast Fourier Transform;高速フーリエ変換)部101に供給されて、信号SRがアナログ信号の時にはデジタル信号に変換された後、FFT処理(高速フーリエ変換)されて、時系列音声信号が周波数領域データに変換される。なお、信号SRがデジタル信号であるときには、FFT部101でのアナログ−デジタル変換は不要であることはいうまでもない。
【0034】
一方、2チャンネルステレオ信号のうちの左チャンネル音声信号SLは、直交変換手段の例としてのFFT部102に供給されて、信号SLがアナログ信号のときにはデジタル信号に変換された後、FFT処理(高速フーリエ変換)されて、時系列音声信号が周波数領域データに変換される。なお、信号SLがデジタル信号であるときには、FFT部102でのアナログ−デジタル変換は不要であることはいうまでもない。
【0035】
この例のFFT部101および102は、同様の構成を備え、各時系列信号SR,SLを、互いに異なる複数個の周波数の周波数分割スペクトル成分に分割する。ここで、周波数分割スペクトルとして得る周波数分割数は、音源の分離度の精度に応じた多数とされ、例えば500以上、好ましくは4000以上の周波数分割数とされる。この周波数分割数は、FFT部におけるタップ数に相当する。
【0036】
各FFT部101およびFFT部102からの周波数分割スペクトル出力F1およびF2は、それぞれ周波数分割スペクトル比較処理部103と、周波数分割スペクトル制御処理部104とに供給される。
【0037】
周波数分割スペクトル比較処理部103は、FFT部101およびFFT部102からの周波数分割スペクトル成分F1,F2の、同じ周波数同士のレベル比を算出し、算出したレベル比を周波数分割スペクトル制御処理部104に出力する。
【0038】
周波数分割スペクトル制御処理部104は、周波数分割スペクトル比較処理部103からのレベル比の情報を受けて、当該レベル比が所定のものとなっている周波数分割スペクトル成分のみを、FFT部101およびFFT部102の出力から除去し、その除去結果出力FexRおよびFexLを、それぞれ逆FFT部105および106に出力する。
【0039】
周波数分割スペクトル制御処理部104では、予め、使用者により、除去すべき音源に応じて、どのようなレベル比の周波数分割スペクトル成分を抽出するかが設定されている。したがって、周波数分割スペクトル制御処理部104からは、使用者が除去したいとして設定されたレベル比で左右2チャンネルに振り分けられている音源の音声信号の周波数分割スペクトル成分のみが抽出されることになる。
【0040】
逆FFT部105,106は、周波数分割スペクトル制御処理部104からの除去結果出力FexR,FexLの周波数分割スペクトル成分を元の時系列信号に変換し、その変換出力信号を、使用者が除去したいとして設定した音源の音声信号が除去された出力SOR,SOLとして出力する。
【0041】
[第1の実施形態における周波数分割スペクトル比較処理部103の構成]
周波数分割スペクトル比較処理部103は、この例では、機能的には、図1において、破線で囲まれた範囲に示すような構成を備える。すなわち、周波数分割スペクトル比較処理部103は、レベル検出部21,22と、レベル比算出部23,24と、セレクタ25とからなる。
【0042】
レベル検出部21は、FFT部101からの周波数分割スペクトル成分F1のそれぞれの周波数成分のレベルを検出し、その検出出力D1を出力する。また、レベル検出部22は、FFT部102からの周波数分割スペクトル成分F2のそれぞれの周波数成分のレベルを検出し、その検出出力D2を出力する。この例では、各周波数分割スペクトルのレベルは、振幅スペクトルを検出する。なお、各周波数分割スペクトルのレベルとして、パワースペクトルを検出するようにしてもよい。
【0043】
そして、レベル比算出部23は、レベル比D1/D2を算出する。また、レベル比算出部24は、その逆数のレベル比D2/D1を算出する。レベル比算出部23およびレベル比算出部24で算出されたレベル比は、セレクタ25に供給され、このセレクタ25からは、レベル比D1/D2とレベル比D2/D1の一方のレベル比が、出力レベル比rとして取り出される。
【0044】
セレクタ25には、除去すべきものとして使用者により設定された音源およびそのレベル比に応じて、レベル比算出部23の出力と、レベル比算出部24の出力のいずれを選択すべきかを選択制御するための選択制御信号SELが供給される。このセレクタ25から得られる出力レベル比rは、周波数分割スペクトル制御処理部104に供給される。
【0045】
この例においては、周波数分割スペクトル制御処理部104において、除去すべき音源のレベル比として用いられる値は、常に、レベル比≦1とされている。つまり、周波数分割スペクトル制御処理部104に入力されるレベル比rは、レベルの小さい方の周波数分割スペクトルのレベルを、レベルが大きい方の周波数分割スペクトルのレベルで割ったものとされている。
【0046】
このため、周波数分割スペクトル制御処理部104では、右チャンネルの音声信号SRの方に、より多く含まれるように分配されている音源の信号を除去する場合には、レベル比算出部23からのレベル比算出出力が使用され、逆に、左チャンネルの音声信号SLの方に、より多く含まれるように分配されている音源の信号を除去する場合には、レベル比算出部24からのレベル比算出出力が使用される。
【0047】
例えば、使用者が、除去すべき音源のレベル比として、左チャンネルおよび右チャンネルの信号の分配率の値PL,PR(PL,PRは1以下の値)をそれぞれ設定入力するように定められているものとしたとき、設定された分配率の値PL,PRが、PL/PR≦1であるときには、選択制御信号SELは、セレクタ25からレベル比算出部23の出力(D2/D1)を、出力レベル比rとして選択する選択制御信号とされ、設定された分配率の値PL,PRが、PL/PR>1であるときには、選択制御信号SELは、セレクタ25からレベル比算出部24の出力(D1/D2)を、出力レベル比rとして選択する選択制御信号とされる。
【0048】
なお、使用者により設定された分配率の値PR,PLが互いに等しい(レベル比r=1)ときには、セレクタ25では、レベル比算出部23の出力とレベル比算出部24の出力とのいずれを選択してもよい。
【0049】
[第1の実施形態における周波数分割スペクトル制御処理部104の構成]
周波数分割スペクトル制御処理部104は、この例では、機能的には、図1において、破線で囲んで示すような構成を備える。すなわち、周波数分割スペクトル制御処理部104は、乗算係数発生部としての除去係数発生部31と、右チャンネル用の乗算部32Rおよび左チャンネル用の乗算部32Lとからなる。
【0050】
乗算部32Rには、FFT部101からの周波数分割スペクトル成分F1が供給されると共に、除去係数発生部31からの除去係数(乗算係数)wが供給され、両者の乗算結果が、周波数分割スペクトル制御処理部104の右チャンネル用スペクトル出力FexRとされる。
【0051】
また、乗算部32には、FFT部102からの周波数分割スペクトル成分F2が供給されると共に、除去係数発生部31Lからの除去係数wが供給され、両者の乗算結果が、周波数分割スペクトル制御処理部104の左チャンネル用スペクトル出力FexRとされる。
【0052】
乗算係数発生部31は、周波数分割スペクトル比較処理部103のセレクタ25からの出力レベル比rを受けて、当該レベル比rに応じた除去係数wを発生する。この除去係数発生部31は、例えば、レベル比rを変数とした乗算係数wに関する関数発生回路により構成される。除去係数発生部31に使用する関数として、どのような関数が選ばれるかは、除去すべき音源に応じて使用者により設定された分配率の値PL,PRによる。
【0053】
除去係数発生部31に供給されるレベル比rは、周波数分割スペクトルの各周波数成分単位で変化するものであるので、除去係数発生部31からの除去係数wも、周波数分割スペクトルの各周波数成分単位で変化することになる。
【0054】
したがって、乗算部32Rでは、FFT部101からの各周波数分割スペクトルのレベルが、除去係数wにより制御され、また、乗算部32Lでは、FFT部102からの各周波数分割スペクトルのレベルが、乗算係数wにより制御される。
【0055】
図3に、乗算係数発生部31Rおよび31Lとしての関数発生回路に用いられる関数の例を示す。この例においては、前記(式1)および(式2)で示された左右2チャンネルの音声信号SLおよびSRから、左右チャンネルの音像間の中央に定位するボーカル音声の音源の音声信号S3を除去するようにするので、除去係数発生部31としては、図3(a)または図3(b)に示されるような特性の関数発生回路が用いられる。
【0056】
図3(a)および図3(b)の関数の特性は、左右チャンネルのレベル比rが1、あるいは1に近い場合、つまり、左右チャンネルが同レベルあるいは同レベルに近い周波数分割スペクトル成分では、除去係数wは0あるいは0近傍となり、その他のレベル比rの領域では、乗算係数wは1となっている。
【0057】
ただし、図3(a)の関数の特性の場合には、左右チャンネルのレベル比rが約0.6以下の領域(r<0.6)では、除去係数wは1となり、約0.6以上、約0.8以下の領域(0.6<r<0.8)では、除去係数は、0と1との間で線形に変化するものとなる。また、図3(b)の関数の特性の場合には、左右チャンネルのレベル比rが、約0.8を境にして、約0.8以下の領域(r<0.8)では、除去係数wは1となり、約0.8以上の領域(0.8≦r)では、除去係数wは、0となっている。
【0058】
したがって、セレクタ25からのレベル比rが1、または1近傍となっている周波数分割スペクトル成分に対する乗算係数wは0、あるいは0に近い値となるので、乗算部32Rおよび32Lからは、当該周波数分割スペクトル成分は、出力されなくなる。
【0059】
一方、セレクタ25からのレベル比rが、約0.6以下の値となっている周波数分割スペクトル成分に対する乗算係数wは1となるので、乗算部32Rおよび32Lからは、当該周波数分割スペクトル成分は、そのままのレベルで出力される。
【0060】
すなわち、乗算部32Rおよび32Lからは、多数個の周波数分割スペクトル成分のうち、左右同レベルおよびその近傍となっている周波数分割スペクトル成分(ボーカルの周波数分割スペクトル成分)は、除去されて出力されなくなり、左右チャンネルでレベル差がある周波数分割スペクトル成分は、ほぼそのままのレベルで出力される。
【0061】
この結果、左右2チャンネルの音声信号SL,SRに同レベルで分配された音源の音声信号S3の周波数分割スペクトル成分が除去された周波数分割スペクトル成分が、周波数分割スペクトル制御処理部104の出力FexR、FexLとして、乗算部32Rおよび32Lから逆FFT部105,106に出力される。
【0062】
そして、この逆FFT部105,106で、周波数領域の周波数分割スペクトル成分が時間領域のデジタルオーディオ信号に変換され、出力信号SOR,SOLとして出力される。
【0063】
以上のようにして、この実施形態の音声信号処理装置10においては、左右2チャンネルに同レベルで分配された歌手のボーカル音声が除去された左右2チャンネルステレオ信号SOR,SOLが得られる。
【0064】
この場合に、この実施形態の音声信号処理装置10によれば、左右2チャンネルの信号SL,SRのそれぞれから、ボーカル音声の成分を除去するようにするので、従来のようにステレオ感を損なうことはない。また、除去目的の音源としてのボーカルの除去を十分に行なうことができる。
【0065】
上述の第1の実施形態の説明は、カラオケ装置にこの発明の音声信号処理装置を適用した場合であるので、除去係数発生部31は、左右チャンネルに同レベルで分配された音源の音声成分を除去する除去係数を発生するようにしたが、この除去係数発生部31に設定する関数発生回路を、変更することにより、左右2チャンネルに任意のレベル比あるいはレベル差で分配した音源の音声成分を除去するようにすることができる。
【0066】
例えば、前記(式1)および(式2)で示された左右2チャンネルの音声信号SLおよびSRから、左右チャンネルに所定のレベル差を持って配分されている音源の音声信号S2またはS4を分離する場合には、除去係数発生部31としては、図3(c)に示されるような特性の関数発生回路が用いられる。
【0067】
すなわち、音声信号S2は、D1/D2(=SR/SL)=0.4/0.9=0.44のレベル比で、左右チャンネルに分配されている。また、音声信号S4は、D2/D1(=SL/SR)=0.4/0.9=0.44のレベル比で、左右チャンネルに分配されている。
【0068】
この場合において、この実施形態においては、音声信号S2を分離する場合には、使用者は、除去する音源に対する左右分配率PL:PR=0.9:0.4を設定入力する。あるいは、PL=0.9、PR=0.4のように設定入力する。このように使用者が設定すると、PR/PL<1であるので、セレクタ25には、レベル比算出部24からのレベル比を選択するように制御する選択制御信号SELが与えられる。
【0069】
一方、音声信号S4を分離する場合には、使用者は、分離する音源に対する左右分配率PL:PR=0.4:0.9を設定入力する。あるいは、PL=0.4、PR=0.9のように設定入力する。このように使用者が設定すると、PR/PL>1であるので、セレクタ25には、レベル比算出部23からのレベル比を選択するように制御する選択制御信号SELが与えられる。
【0070】
図3(c)の関数の特性は、左右チャンネルのレベル比rが、D1/D2(=PR/PL)=0.4/0.9=0.44、あるいはレベル比rが0.44に近い周波数分割スペクトル成分では、除去係数wは0あるいは0近傍となり、左右チャンネルのレベル比rが約0.44近傍以外の領域では、除去係数wは1となっている。
【0071】
したがって、セレクタ25からのレベル比rが0.44、または0.44近傍となっている周波数分割スペクトル成分に対する乗算係数wは0、あるいは0に近い値となるので、乗算部32Rおよび32Lからは、当該周波数分割スペクトル成分が、出力レベルが0とされて、出力されなくなる。一方、セレクタ25からのレベル比rが、約0.44近傍以下の値および約0.44近傍以上の値となっている周波数分割スペクトル成分に対する除去係数wは1となるので、乗算部32Rおよび32Lからは、当該周波数分割スペクトル成分は、出力レベルが1とされて、ほぼそのままのレベルで出力される。
【0072】
すなわち、乗算部32Rおよび32Lからは、多数個の周波数分割スペクトル成分のうち、左右チャンネルのレベル比が0.44またはその近傍となっている周波数分割スペクトル成分は、出力レベルが0とされて出力されなくなり、左右チャンネルのレベル比rが、約0.44近傍以下の値および約0.44近傍以上の値となっている周波数分割スペクトル成分は、ほぼそのままのレベルで出力される。
【0073】
この結果、左右2チャンネルの音声信号SL,SRに、レベル比が0.44で分配された音源の音声信号S2またはS4の周波数分割スペクトル成分が、除去された出力信号が得られることになる。
【0074】
以上のようにして、この実施形態によれば、左右2チャンネルに、所定の分配比率で分配された音源の音声信号を、その分配比率に基づいて、当該2チャンネルの音声信号から除去することができる。
【0075】
なお、上述の実施形態では、除去したい音源の音声信号は、2チャンネルの音声信号の両方から抽出するようにしたが、必ずしも両チャンネルから除去する必要はなく、一方のチャンネルのみから除去するようにしてもよい。
【0076】
また、上述の実施形態では、2系統の音声信号に対して分配された音源の信号のレベル比に基づいて、当該2系統の音声信号から前記音源の信号を除去するようにしたが、前記音源の信号の、2系統の音声信号に対するレベル差に基づいて、当該音源の信号を当該2系統の音声信号の少なくとも一方から除去するようにすることもできる。
【0077】
なお、以上の説明では、各音源が(式1)、(式2)に従って左右チャンネルに分配された左右2チャンネルステレオ信号を例にして説明したが、意図的に分配されない通常のステレオ音楽信号においても、図3に示したものと同様に、除去したい音源のレベル比やレベル差に応じた除去関数を用いることにより、対応する音源を除去することができる。
【0078】
なお、除去対象の音源が同じであっても、例えば、除去関数の特性を変更することにより、除去するレベル比範囲を変える、広くする、狭くするなど、異なる音源選択性を持たせることもできる。例えば、図3(d)の除去関数は、図3(c)に示した前述例の除去関数において、除去するレベル比範囲を変える場合の例を示したものである。
【0079】
また、音源のスペクトラム構成に関しても、多くのステレオ音楽信号は異なるスペクトラムを持つ音源から構成されるが、それらの音源についても、上述と同様にして除去することが可能となる。
【0080】
また、スペクトラム重複部が多い音源同士に関しても、FFT部101,12における周波数分解能を上げることにより、例えば4000タップ以上のFFT回路を用いることにより、音源除去品質を更に向上させることができる。
【0081】
[音声信号処理装置の第2の実施形態]
この第2の実施形態では、FFT部101および102からの周波数分割スペクトル成分F1およびF2から除去したい音源の音声成分を抽出し、当該抽出した音源の音声成分を、前記FFT部101および102からの周波数分割スペクトル成分F1およびF2から減算することにより、目的とする音源の音声成分を除去するようにする。
【0082】
図4は、この第2の実施形態の音声信号処理装置の構成例を示すブロック図である。この第2の実施形態においては、除去係数発生部31に代えて乗算係数発生部33を用いると共に、乗算部32Rおよび32Lと、逆FFT部105および106との間に、減算部107および108を設ける。
【0083】
そして、乗算部32Rおよび32Lの出力FexRが減算部107および108に供給されると共に、減算部107および108にはFFT部101の出力F1およびFFT部102の出力F2が供給される。減算部107では、出力F1から乗算部32Rの出力FexRが減算され、その減算出力が逆FFT部105に供給される。また、減算部108では、出力F2から乗算部32Lの出力FexLが減算され、その減算出力が逆FFT部106に供給される。
【0084】
セレクタ25からのレベル比rは、乗算係数発生部33に供給され、乗算係数発生部33からの乗算係数wが乗算部32Rおよび32Lに供給される。乗算係数発生部33は、除去係数ではなく、除去したい音源の成分を抽出するための乗算係数wを発生する。
【0085】
図5は、この乗算係数発生部33に設定する関数発生回路の関数の特性を示すもので、例えば、除去対象が、前述した音源MS3の音声信号S3である場合には、乗算係数発生部33には、図5(a)あるいは図5(b)のような特性の関数発生回路が設定される。
【0086】
図5(a)あるいは図5(b)の関数の特性は、左右チャンネルのレベル比rが1、あるいは1に近い場合、つまり、左右チャンネルが同レベルあるいは同レベルに近い周波数分割スペクトル成分では、乗算係数wは1あるいは1近傍となり、左右チャンネルのレベル比rが1あるいはその近傍以外の領域では、乗算係数wは0となっている。
【0087】
したがって、セレクタ25からのレベル比rが1、または1近傍となっている周波数分割スペクトル成分に対する乗算係数wは1、あるいは1に近い値となるので、乗算部33および34からは、当該周波数分割スペクトル成分は、ほぼそのままのレベルで出力される。一方、セレクタ25からのレベル比rが、1あるいはその近傍以外の値となっている周波数分割スペクトル成分に対する乗算係数wは0となるので、乗算部32Rおよび32Lからは、当該周波数分割スペクトル成分は、出力レベルが0とされて、出力されなくなる。
【0088】
すなわち、乗算部32Rおよび32Lからは、多数個の周波数分割スペクトル成分のうち、左右同レベルおよびその近傍となっている周波数分割スペクトル成分は、ほぼそのままのレベルで出力され、左右チャンネルのレベル差が大きい周波数分割スペクトル成分は、出力レベルが0とされて出力されなくなる。この結果、左右2チャンネルの音声信号SL,SRに同レベルで分配された音源MS3の音声信号S3の周波数分割スペクトル成分のみが乗算部32R、32Lから得られることになる。
【0089】
したがって、減算部107では、音源MS3の音声信号S3の成分が、出力F1から減算されて除去された出力が得られ、逆FTT部105に供給される。また、減算部108では、音源MS3の音声信号S3の成分が、出力F2から減算されて除去された出力が得られ、逆FTT部106に供給される。
【0090】
以上のようにして、この第2の実施形態においても、使用者が希望する音源の成分が、2チャンネルの音声信号SR、SLのそれぞれから独立に除去されて得られる。
【0091】
[音声信号処理装置の第3の実施形態]
上述の第1の実施形態の音声信号処理装置は、左右2チャンネルの音声信号SL,SRから、同一の音源の音声成分を除去するようにした場合であるが、2チャンネルの音声信号SLおよびSRにおいて、それぞれ各チャンネル独立に、別々の音源の音声成分を除去するようにすることもできる。第2の実施形態の音声信号処理装置は、その場合の例である。
【0092】
図6は、この第2の実施形態の音声信号処理装置の構成例を示すブロック図である。この図6の例において、前述した図1の第1の実施形態の各部と対応する部分には、同一符号を付してある。
【0093】
[第3の実施形態における周波数分割スペクトル制御処理部104の構成]
この第3の実施形態における周波数分割スペクトル比較処理部103は、レベル検出部21,22、レベル比算出部23,24、セレクタ25に加えて、セレクタ26が設けられる。そして、この第3の実施形態の場合には、セレクタ25は、右チャンネルにおいて、除去する音源に対応するレベル比rRを出力するものとされ、また、セレクタ26は、右チャンネルにおいて、除去する音源に対応するレベル比rRを出力するものとされる。
【0094】
すなわち、レベル比算出部23およびレベル比算出部24で算出されたレベル比は、セレクタ25,26に供給され、このセレクタ25,26からは、レベル比D1/D2とレベル比D2/D1の一方のレベル比が、出力レベル比rR,rLとして取り出される。
【0095】
この例の音声信号処理装置10は、左チャンネルの音声信号から除去する音源と、右チャンネルの音声信号から除去する音源とを別々に設定できるようにするために、2個のセレクタ25,26を設けて、右チャンネル用と、左チャンネル用の出力レベル比rR,rLを得るようにしている。
【0096】
セレクタ25,26には、除去すべきものとして使用者により、左、右の各チャンネル毎に設定された音源およびそのレベル比に応じて、レベル比算出部23の出力と、レベル比算出部24の出力のいずれを選択すべきかを選択制御するための選択制御信号SELR,SELLが供給される。このセレクタ25,26から得られる出力レベル比rR,rLは、周波数分割スペクトル制御処理部104に供給される。
【0097】
例えば、使用者が、除去すべき音源のレベル比として、左チャンネルおよび右チャンネルの信号の分配率の値PL,PR(PL,PRは1以下の値)をそれぞれ設定入力するように定められているものとしたとき、設定された分配率の値PL,PRが、PL/PR≦1であるときには、選択制御信号SELR,SELLは、セレクタ25,26からレベル比算出部23の出力(D2/D1)を、出力レベル比rR,rLとして選択する選択制御信号とされ、設定された分配率の値PL,PRが、PL/PR>1であるときには、選択制御信号SELR,SELLは、セレクタ25,26からレベル比算出部24の出力(D1/D2)を、出力レベル比rR,rLとして選択する選択制御信号とされる。
【0098】
なお、使用者により設定された分配率の値PR,PLが互いに等しい(レベル比rR,rL=1)ときには、セレクタ25,26では、レベル比算出部23の出力とレベル比算出部24の出力とのいずれを選択してもよい。
【0099】
[第3の実施形態における周波数分割スペクトル制御処理部104の構成]
周波数分割スペクトル制御処理部104は、この例では、右チャンネル用の除去係数発生部31Rおよび乗算部32Rと、左チャンネル用の除去係数発生部31Lおよび乗算部32Lとからなる。
【0100】
乗算部32Rには、FFT部101からの周波数分割スペクトル成分F1が供給されると共に、除去係数発生部31Rからの除去係数wRが供給され、両者の乗算結果が、周波数分割スペクトル制御処理部104の右チャンネル用スペクトル出力FexRとされる。
【0101】
また、乗算部32Lには、FFT部102からの周波数分割スペクトル成分F2が供給されると共に、除去係数発生部31Lからの除去係数wLが供給され、両者の乗算結果が、周波数分割スペクトル制御処理部104の左チャンネル用スペクトル出力FexRとされる。
【0102】
除去係数発生部31Rは、周波数分割スペクトル比較処理部103のセレクタ25からの出力レベル比rRを受けて、当該レベル比rRに応じた除去係数wRを発生する。また、除去係数発生部31Lは、周波数分割スペクトル比較処理部103のセレクタ26からの出力レベル比rLを受けて、当該レベル比rLに応じた除去係数wLを発生する。
【0103】
除去係数発生部31Rおよび31Lは、例えば、レベル比rRまたはrLを変数とした除去係数wRまたはwLに関する関数発生回路により構成される。除去係数発生部31Rおよび31Lに使用する関数として、どのような関数が選ばれるかは、分離すべき音源に応じて使用者により設定された分配率の値PL,PRによる。
【0104】
除去係数発生部31Rおよび31Lに供給されるレベル比rRおよびrLは、周波数分割スペクトルの各周波数成分単位で変化するものであるので、除去係数発生部31Rおよび31Lからの除去係数wRおよびwLも、周波数分割スペクトルの各周波数成分単位で変化することになる。
【0105】
したがって、乗算部32Rでは、FFT部101からの各周波数分割スペクトルのレベルが、除去係数wRにより制御され、また、乗算部32Lでは、FFT部102からの各周波数分割スペクトルのレベルが、除去係数wLにより制御される。
【0106】
例えば、セレクタ25からはレベル比算出部23からのレベル比をレベル比出力rRとして選択し、除去係数発生部31Rに図3(a)に示したような特性の関数発生回路を設定したときには、乗算部32Rからは、ボーカル成分である音声信号S3が除去された右チャンネル音声信号成分が得られる。
【0107】
そして、このとき、例えば、セレクタ26からはレベル比算出部24からのレベル比をレベル比出力rLとして選択し、除去係数発生部31Lに図3(c)に示したような特性の関数発生回路を設定したときには、乗算部32Rからは、音声信号S4が除去された左チャンネル音声信号成分が得られる。
【0108】
もちろん、セレクタ25,26から同じレベル比算出部からのレベル比をレベル比出力rR,rLとして得ると共に、除去係数発生部31R、31Lに同じ特性の関数発生回路を設定するようにすることもでき、その場合には、図1の場合と全く同様の作用効果を奏するものとなる。
【0109】
以上のようにして、この第2の実施形態の音声信号処理装置10においては、左右2チャンネルの、それぞれのチャンネルの音声信号SR、SLから、独立に設定した音源の音声信号を除去することができる。
【0110】
この第3の実施形態においても、第1の実施形態に対する第2の実施形態の関係のように、除去係数発生部31R、31Lに代えて、除去目的の音源の音声成分を抽出するための乗算係数を発生する乗算係数発生部を用いると共に、乗算部32Rおよび32Lと、逆FFT部105および106との間に、減算部を設け、周波数分割スペクトル制御処理部104で抽出した音源の音声成分を、各チャンネル毎に、出力F1,F2から減算するようにすることにより、上述した第3の実施形態と同様にして、目的とする音源の音声成分を各チャンネルの音声信号SR、SLから除去することができる。
【0111】
[音声信号処理装置の第4の実施形態]
この第4の実施形態は、2チャンネルの音声信号から使用者が除去したい音源を動的に変更することができるようにした場合である。
【0112】
すなわち、この第4の実施形態は、第3の実施形態に適用した場合で、2チャンネルの音声信号SL,SRのそれぞれから別々の音源(同じ音源でもよい)の音声信号を除去するようにする場合において、それぞれ除去する音源を使用者が動的に選択変更できるようにした場合である。
【0113】
図7は、この第4の実施形態の構成例を示すブロック図である。この第4の実施形態においては、周波数分割スペクトル制御処理部104は、右チャンネル用の除去係数発生部として、複数個の除去係数発生部31R1,31R2,・・・,31Rnを設けると共に、それら複数個の除去係数発生部31R1,31R2,・・・,31Rnのいずれか一つからの除去係数を選択して、当該選択した除去係数を、除去係数wRとして乗算部32Rに供給するスイッチ回路34Rを備える。
【0114】
また、同様にして、周波数分割スペクトル制御処理部104は、左チャンネル用の除去係数発生部として、複数個の除去係数発生部31L1,31L2,・・・,31Lnを設けると共に、それら複数個の除去係数発生部31L1,31L2,・・・,31Lnのいずれか一つからの除去係数を選択して、当該選択した除去係数を、除去係数wLとして乗算部32Lに供給するスイッチ回路34Lを備える。
【0115】
複数個の除去係数発生部31L1,31L2,・・・,31Lnおよび31R1,31R2,・・・,31Rnのそれぞれには、例えば、左右チャンネルのレベル比が種々の値となる音源を分離するために用いるレベル比対除去係数の関数が、設定される。
【0116】
また、周波数分割スペクトル比較処理部13には、レベル比算出部23,24のレベル比算出出力を受けて、いずれか一方のレベル比算出出力を、除去係数発生部31L1,31L2,・・・,31Ln,31R1,31R2,・・・,31Rnのそれぞれに供給する選択分配回路27が設けられる。
【0117】
そして、この第3の実施形態においては、除去音源選択信号発生部109が設けられる。この除去音源選択信号発生部109は、後述するように、選択操作手段を通じた、使用者による、除去する音源の選択操作に応じた信号Maを受けて、選択分配回路27に供給する選択信号SELTを発生すると共に、スイッチ回路34Lをスイッチ制御する信号SWLおよびスイッチ回路34Rをスイッチ制御する信号SWRを発生する。
【0118】
図示は省略するが、この例の音声信号処理装置は、例えば選択操作つまみやボタン、タッチパネル付きLCDなどの表示部を通じたグラフィカル・ユーザ・インターフェースを通じて、使用者からの除去する音源の選択操作を受け付けるようにする。このとき、選択操作対象となるのは、除去係数発生部31L1,31L2,・・・,31Ln,31R1,31R2,・・・,31Rnに設定された関数により分離可能な複数個の音源である。
【0119】
例えば、除去可能な複数の音源としては、左チャンネルの音像定位位置から右チャンネルの音像定位位置の間において、音像定位位置を徐々に変更するようなものとすることができる。
【0120】
この場合において、使用者は、左チャンネルおよび右チャンネルのそれぞれについて、独立に除去する音源を指定することができるようにされている。
【0121】
例えば、左チャンネルの除去係数発生部31L1からの除去係数によって左チャンネルの音声信号SLから分離可能な音源が、使用者によって、前記選択操作つまみやボタン、あるいはグラフィカル・ユーザ・インターフェースを通じて選択されたときには、その選択操作に応じた信号Maを受けた除去音源選択信号発生部109は、当該信号Maに対応したスイッチ制御信号SWLおよび選択信号SELTを発生する。
【0122】
そして、このとき、スイッチ回路34Lは、除去音源選択信号発生部109からのスイッチ制御信号SWLにより、除去係数発生部31L1を選択する状態に切り換えられ、また、選択分配回路27は、選択信号SELTにより、レベル比算出部23,24の一方(レベル比が1以下になる方)が選択されて、除去係数発生部31L1に供給される。
【0123】
これにより、乗算部32Lからは、選択指定された通りの音源の周波数分割スペクトル成分が除去された出力FexLが得られ、これが逆FFT部106により、元の時系列の音声信号に戻されて出力SOLとして出力される。
【0124】
右チャンネルにおいても、同様にして、使用者により選択設定された、除去したい音源の音声信号が除去される。
【0125】
なお、図7の第3の実施形態は、2チャンネルの音声信号のそれぞれから、所定の音源の音声信号をそれぞれ分離抽出する場合(第2の実施形態に適用した場合)であるが、第3の実施形態は、第1の実施形態や後述する実施形態にも適用可能であることは言うまでもない。
【0126】
すなわち、例えば第1の実施形態に適用する場合には、図1において、除去係数発生部31の代わりに複数個の除去係数発生部を設けると共に、それらの複数個の除去係数発生部と、音源分離部32との間に、複数個の除去係数発生部の1つからの除去係数を音源分離部32に供給するようにするスイッチ回路を設ける。さらに、使用者の選択操作信号Maを受け付け、スイッチ回路をスイッチ制御すると共に、除去係数発生部にレベル比算出部23,24の出力のうちの適切な方のレベルを供給するように制御する信号を発生する分離音源選択信号発生部を設けるようにする。
【0127】
この第4の実施形態においても、第1の実施形態に対する第2の実施形態の関係のように、除去係数発生部31R、31Lに代えて、除去目的の音源の音声成分を抽出するための乗算係数を発生する乗算係数発生部を用いると共に、乗算部32Rおよび32Lと、逆FFT部105および106との間に、減算部を設け、周波数分割スペクトル制御処理部104で抽出した音源の音声成分を、各チャンネル毎に、出力F1,F2から減算するようにすることにより、上述した第4の実施形態と同様にして、目的とする音源の音声成分を各チャンネルの音声信号SR、SLから除去することができる。
【0128】
[音声信号処理装置の第5の実施形態]
上述の実施形態の場合、左右2チャンネルの音声信号に対して、同じレベル比あるいはレベル差で、分配されて混合されている音源の音声信号が複数個存在している場合、それらは共に除去されてしまう。第5の実施形態は、このようにレベル比あるいはレベル差だけでは除去できない複数個の音源が存在する場合に、できるだけ、特定の音源の音声成分のみを除去できるように改善する第1の例である。
【0129】
この第5の実施形態は、レベル比あるいはレベル差だけでは除去できない複数個の音源のそれぞれの主たる周波数帯域が異なる場合、当該周波数帯域の違いを考慮して、上記の目的を達成したものである。
【0130】
図8は、この第5の実施形態の構成例を示すブロック図で、前述の実施形態の各部と対応する部分には同一符号を付してある。この第5の実施形態においては、FFT部101およびFFT部102の出力側に、除去したい音源の音声成分が主として含まれる周波数帯域の信号成分を抽出する帯域通過フィルタ110および111を設けると共に、除去したい音源の音声成分が主として含まれる周波数以外の帯域の信号成分を抽出する低域高域通過フィルタ112および113を設ける。
【0131】
また、周波数分割スペクトル制御処理部104の乗算部32Rおよび32Lと逆FFT部105および106との間に、それぞれ、加算部114および115を設ける。
【0132】
そして、FFT部101の出力である周波数分割スペクトル出力F1は、帯域通過フィルタ110および低域高域通過フィルタ112に供給される。そして、帯域通過フィルタ110から得られる、除去したい音源の音声成分が主として含まれる周波数帯域の信号成分は周波数分割スペクトル比較処理部103のレベル検出部21に供給されると共に、周波数分割スペクトル制御処理部104の乗算部32Rに供給される。
【0133】
また、低域高域通過フィルタ112から得られる、除去したい音源の音声成分が主として含まれる周波数以外の帯域の信号成分は、加算部114に供給される。加算部114には、また、周波数分割スペクトル制御処理部104の出力FexRが供給される。そして、加算部114からの加算出力が逆FFT部105に供給される。
【0134】
また、FFT部102の出力である周波数分割スペクトル出力F2は、帯域通過フィルタ111および低域高域通過フィルタ113に供給される。そして、帯域通過フィルタ111から得られる、除去したい音源の音声成分が主として含まれる周波数帯域の信号成分は周波数分割スペクトル比較処理部103のレベル検出部22に供給されると共に、周波数分割スペクトル制御処理部104の乗算部32Lに供給される。
【0135】
また、低域高域通過フィルタ113から得られる、除去したい音源の音声成分が主として含まれる周波数以外の帯域の信号成分は、加算部115に供給される。加算部115には、また、周波数分割スペクトル制御処理部104の出力FexLが供給される。そして、加算部115からの加算出力が逆FFT部106に供給される。
【0136】
以上のような構成の実施形態においては、第4の周波数分割スペクトル比較処理部103および周波数分割スペクトル制御処理部104では、除去したい音源の音声成分が主として含まれる周波数以外の帯域の信号成分についてのみ、上述の実施形態で説明したような音源成分除去動作がなされる。そして、当該音源成分除去がなされた結果としての出力FexRおよびFexLに、音源除去処理対象とならなかった周波数帯域の成分が加算部114および115でそれぞれ加算されて、逆FFT部105および106に供給される。
【0137】
したがって、同じレベル比あるいはレベル差を持って、2チャンネル音声信号に分配された複数個の音源成分が存在している場合であっても、それらの音源の音声成分が占める主たる周波数帯域が異なる場合には、この第4の実施形態を用いることにより、目的とする音源の音声成分のみを、2チャンネル音声信号のそれぞれのチャンネルの信号から除去することができる。
【0138】
この第5の実施形態においても、第1の実施形態に対する第2の実施形態の関係のように、除去係数発生部31R、31Lに代えて、除去目的の音源の音声成分を抽出するための乗算係数を発生する乗算係数発生部を用いると共に、乗算部32Rおよび32Lと、加算部114,115との間に、減算部を設け、周波数分割スペクトル制御処理部104で抽出した音源の音声成分を、各チャンネル毎に、帯域通過フィルタ110,111の出力から減算するようにすることにより、上述した第5の実施形態と同様にして、目的とする音源の音声成分を各チャンネルの音声信号SR、SLから除去することができる。
【0139】
[音声信号処理装置の第6の実施形態]
この第6の実施形態は、左右2チャンネルの音声信号に対して、同じレベル比あるいはレベル差で、分配されて混合されている音源の音声信号が複数個存在している場合の問題点を改善する第2の例である。
【0140】
以上の実施形態においては、2チャンネルの音声信号に、各音源の音声信号が分配されるときの位相は、2チャンネルで同相としたが、逆相で音源の音声信号が分配される場合もある。一例として、次の(式3)および(式4)のように、6個の音源MS1〜MS6からの音声信号S1〜S6が左右2チャンネルに分配されたステレオ音声信号SL,SRを考える。
【0141】
SL=S1+0.9S2+0.7S3+0.4S4+0.7S6 ・・・(式3)
SR=S5+0.4S2+0.7S3+0.9S4−0.7S6 ・・・(式4)
【0142】
すなわち、音源MS3の音声信号S3と、音源MS6の音声信号S6とは、左右チャンネルに、それぞれ同レベルで分配されているが、音源MS3の音声信号S3は、左右チャンネルに同相で分配されているのに対して、MS6の音声信号S6は、左右チャンネルに逆相で分配されている。
【0143】
上述の実施の形態と同様にして、位相を考慮せず、レベル比あるいはレベル差のみを用いて音源MS3の音声信号S3または音源MS6の音声信号S6のいずれかを除去しようとしても、音声信号S3とS6とは、同レベルで左右チャンネルに分配されているので、いずれか一方を除去することはできない。
【0144】
そこで、この第6の実施形態では、2チャンネル間におけるレベル比あるいはレベル差を用いて音源成分を分離した後、位相差を用いて更なる分離することにより、除去対象の音源の音声成分を分離し、当該分離した音源の音声成分を、FFT部101,102からの出力F1、F2から減算することにより、目的とする音源の音声成分の除去を行なうようにする。
【0145】
図9は、この第6の実施形態の音声信号処理装置の構成例を示すブロック図である。この第6の実施形態の音声信号処理装置における周波数分割スペクトル比較処理部103は、レベル比較処理部1031と、位相比較処理部1032とを備える。
【0146】
また、この第6の実施形態における周波数分割スペクトル制御処理部104は、第1周波数分割スペクトル制御処理部1041と、位相差に基づいた音源分離処理を実行するための第2の周波数分割スペクトル制御処理部1042とを備える。
【0147】
図10は、この第6の実施形態における周波数分割スペクトル比較処理部103と、周波数分割スペクトル制御処理部104の部分の詳細構成例を示すブロック図である。すなわち、周波数分割スペクトル比較処理部103のレベル比較処理部1031は、前述した第1の実施形態の周波数分割スペクトル比較処理部13と同様の構成の備え、レベル検出部21,22と、レベル比算出部23,24と、セレクタ25とからなる。
【0148】
そして、周波数分割スペクトル制御処理部104の第1周波数分割スペクトル制御処理部1041は、前述の第2の実施形態の周波数分割スペクトル制御処理部とほぼ同様の構成を備え、乗算係数発生部301と、乗算部302および303とからなる音源分離部の構成とされている。
【0149】
そして、図9および図10に示すように、レベル比較処理部1031からのレベル比出力rは、第1の実施形態と全く同様にして、第1周波数分割スペクトル制御処理部1041の乗算係数発生部301に供給され、この乗算係数発生部301から当該乗算係数発生部301に設定された関数に応じた乗算係数wrが発生し、乗算部302,303に供給される。
【0150】
乗算部302には、FFT部101からの周波数分割スペクトル成分F1が供給されており、当該周波数分割スペクトル成分と乗算係数wrとの乗算結果が、この乗算部302から得られる。また、乗算部303には、FFT部102からの周波数分割スペクトル成分F2が供給されており、当該周波数分割スペクトル成分と乗算係数wrとの乗算結果が、この乗算部303から得られる。
【0151】
すなわち、乗算部302,303からは、FFT部101,102からの周波数分割スペクトル成分F1,F2のそれぞれが、乗算係数発生部31からの乗算係数wrに応じてレベル制御された状態の出力が得られる。
【0152】
前述の第2の実施形態と同様に、乗算係数発生部301は、レベル比rを変数とした乗算係数wrに関する関数発生回路により構成される。乗算係数発生部301に使用する関数として、どのような関数が選ばれるかは、分離抽出すべき音源の左右2チャンネルの音声信号への分配率による。
【0153】
前述したように、乗算係数発生部301には、図5に示したような特性の、乗算係数wrのレベル比に関する関数が設定される。例えば、左右2チャンネルに同レベルで分配される音源の音声信号を分離抽出する場合には、前述したように、図5(a)に示した特定の関数が、乗算係数発生部301に設定される。
【0154】
この第6の実施形態では、乗算部302,303の出力は、それぞれ周波数分割スペクトル比較処理部103の位相比較処理部1032に供給されると共に、周波数分割スペクトル制御処理部104の第2周波数分割スペクトル制御処理部1042に供給される。
【0155】
位相比較処理部1032は、図10に示すように、乗算部302,303の出力の位相差φを検出する位相差検出部28からなり、その位相差φの情報を第2周波数分割スペクトル制御処理部1042に供給する。
【0156】
第2周波数分割スペクトル制御処理部1042は、乗算係数発生部304と、乗算部305および乗算部306と、減算部307および308とからなる。
【0157】
そして、乗算部305には、第1周波数分割スペクトル制御処理部1041の乗算部302の出力が供給されると共に、乗算係数発生部304からの乗算係数wpが供給され、両者の乗算結果が、この乗算部305から減算部307に供給される。この減算部307には、FFT部101の出力F1が供給されており、乗算部305の出力が出力F1から減算され、その減算結果が、周波数分割スペクトル制御処理部104の第1の出力(右チャンネル用出力)FexRとされる。
【0158】
また、乗算部306には、第1周波数分割スペクトル制御処理部1041の乗算部303の出力が供給されると共に、乗算係数発生部304からの乗算係数wpが供給され、両者の乗算結果が、この乗算部306から減算部308に供給される。この減算部308には、FFT部102の出力F2が供給されており、乗算部306の出力が出力F2から減算され、その減算結果が、周波数分割スペクトル制御処理部104の第2の出力(左チャンネル用出力)FexLとされる。
【0159】
乗算係数発生部304は、位相差検出部28からの位相差φの情報を受けて、当該位相差φに応じた乗算係数wpを発生する。乗算係数発生部304は、位相差φを変数とした乗算係数wpに関する関数発生回路により構成される。乗算係数発生部304に使用する関数として、どのような関数が選ばれるかは、分離すべき音源の前記2チャンネルに対する位相差に応じて、使用者により設定される。
【0160】
乗算係数発生部304に供給される位相差φは、周波数分割スペクトルの各周波数成分単位で変化するものであるので、乗算係数発生部304からの乗算係数wpも、周波数分割スペクトルの各周波数成分単位で変化することになる。したがって、乗算部305および乗算部306では、乗算部302および乗算部303からの各周波数分割スペクトルのレベルが、乗算係数wpにより制御される。
【0161】
図11に、乗算係数発生部304としての関数発生回路に用いられる関数の例を示す。
【0162】
図11(a)の関数の特性は、左右チャンネルの位相差φが0、あるいは0に近い場合、つまり、左右チャンネルが同相あるいは同相に近い周波数分割スペクトル成分では、乗算係数wpは1あるいは1近傍となり、左右チャンネルの位相差φが約π/4以上の領域では、乗算係数wpは0となっている。
【0163】
例えば乗算係数発生部304に、この図11(a)の特性の関数が設定されている場合において、位相差検出部28からの位相差φが0、または0近傍となっている周波数分割スペクトル成分に対する乗算係数wpは1、あるいは1に近い値となるので、乗算部305、306からは、当該周波数分割スペクトル成分は、ほぼそのままのレベルで出力される。一方、位相差検出部28からの位相差φが、約π/4以上の値となっている周波数分割スペクトル成分に対する乗算係数wpは0となるので、乗算部305,306からは、当該周波数分割スペクトル成分は、出力レベルが0とされて、出力されなくなる。
【0164】
すなわち、乗算部305,306からは、多数個の周波数分割スペクトル成分のうち、左右同相およびその近傍の位相差となっている周波数分割スペクトル成分は、ほぼそのままのレベルで出力され、左右チャンネルの位相差が大きい周波数分割スペクトル成分は、出力レベルが0とされて出力されなくなる。この結果、左右2チャンネルの音声信号SL,SRに同相で分配された音源の音声信号の周波数分割スペクトル成分のみが乗算部305,306から得られることになる。
【0165】
つまり、この図11(a)の特性の関数は、左右2チャンネルに同相で分配されている音源の信号を抽出する際に用いられる。
【0166】
また、図11(b)の関数の特性は、左右チャンネルの位相差φがπ、あるいはπに近い場合、つまり、左右チャンネルが逆相あるいは逆相に近い周波数分割スペクトル成分では、乗算係数wpは1あるいは1近傍となり、左右チャンネルの位相差φが約3π/4以下の領域では、乗算係数wpは0となっている。
【0167】
例えば乗算係数発生部301に、この図11(b)の特性の関数が設定されている場合において、位相差検出部28からの位相差φがπ、またはπ近傍となっている周波数分割スペクトル成分に対する乗算係数wpは1、あるいは1に近い値となるので、乗算部305、306からは、当該周波数分割スペクトル成分は、ほぼそのままのレベルで出力される。一方、位相差検出部28からの位相差φが、約3π/4以下の値となっている周波数分割スペクトル成分に対する乗算係数wpは0となるので、乗算部305,306からは、当該周波数分割スペクトル成分は、出力レベルが0とされて、出力されなくなる。
【0168】
すなわち、乗算部305,306からは、多数個の周波数分割スペクトル成分のうち、左右逆相およびその近傍の位相差となっている周波数分割スペクトル成分は、ほぼそのままのレベルで出力され、左右チャンネルの位相差が小さい周波数分割スペクトル成分は、出力レベルが0とされて出力されなくなる。この結果、左右2チャンネルの音声信号SL,SRに逆相で分配された音源の音声信号の周波数分割スペクトル成分のみが乗算部305,306から得られることになる。
【0169】
つまり、この図11(b)の特性の関数は、左右2チャンネルに逆相で分配されている音源の信号を抽出する際に用いられる。
【0170】
同様にして、図11(c)の特性の関数は、左右チャンネルの位相差φが約π/2、あるいは約π/2に近い場合の周波数分割スペクトル成分では、乗算係数wpは1あるいは1近傍となり、その他の位相差φの領域では、乗算係数wpは0となっている。したがって、この図11(c)の特性の関数は、左右2チャンネルに、互いに約π/2だけ異なる位相で分配されている音源の信号を抽出する際に用いられる。
【0171】
その他、乗算係数発生部305および306には、分離する音源の音声信号の2チャンネルへ分配する際の位相差に応じて、図11(d)や(e)に示すような特性の関数を設定することもできる。
【0172】
この第6の実施形態において、例えば、前記(式3)および(式4)で示された左右2チャンネルの音声信号SLおよびSRから、同レベルであるが、同相で左右チャンネルに分配された音源MS3の音声信号S3と、逆相で左右チャンネルに分配された音源MS6の音声信号S6との内、例えば音源MS3の音声信号S3を、左右チャンネルから除去する場合には、第1周波数分割スペクトル制御処理部1041の乗算係数発生部301には、図5(a)に示したような特性の関数が設定される。また、第2周波数分割スペクトル制御処理部1042の乗算係数発生部304には、図11(b)に示すような特性となる関数が設定される。
【0173】
すると、図9および図10に示すように、周波数分割スペクトル制御処理部104の第1周波数分割スペクトル制御処理部1041の乗算部302からは、右チャンネルの音声信号SRをFFTした信号(周波数分割スペクトル)F1のうちの、(S3−S6)なる周波数分割スペクトル成分が得られ、また、乗算部303からは、左チャンネルの音声信号SLをFFTした信号(周波数分割スペクトル)F2のうちの、(S3+S6)なる周波数分割スペクトル成分が得られる。つまり、信号S3とS6とは、左右チャンネルに同レベルで分配されているので、第1周波数分割スペクトル制御処理部1041では、分離できずに出力されることになる。
【0174】
しかし、この第6の実施形態では、信号S3とS6とが逆相で左右チャンネルに分配されていることを利用して、次のようにして、当該信号S3と、S6とが分離される。
【0175】
すなわち、乗算部302および303の出力は、周波数分割スペクトル比較処理部103の位相比較処理部1032を構成する位相差検出部28に供給されて、両出力の位相差φが検出される。そして、この位相差検出部28で検出された位相差φの情報は、乗算係数発生部304に供給される。
【0176】
乗算係数発生部304では、図11(a)に示すような特性の関数が設定されていることから、乗算部305,306では、左右チャンネルに同相で分配されている音源の音声信号S3を抽出する。すなわち、周波数分割スペクトル成分(S3+S6)と、周波数分割スペクトル成分(S3−S6)のうちの、同相関係にある音源MS3の音声信号S3の周波数分割スペクトル成分のみが乗算部305および306のそれぞれから得られ、減算部307および308に供給される。
【0177】
したがって、減算部307からは、出力F1から音源MS3の音声信号S3の周波数分割スペクトル成分が除去された出力信号FexRが導出され、逆FFT部105に供給される。また、減算部308からは、出力F2から音源MS3の音声信号S3の周波数分割スペクトル成分が除去された出力信号FexLが導出され、逆FFT部106に供給される。そして、逆FFT部105および106で時系列信号に戻され、出力信号SORおよびSOLとして出力される。
【0178】
なお、図9および図10に示した実施形態では、第2周波数分割スペクトル制御処理部1042では、第1周波数分割スペクトル制御処理部1041においてレベル比を用いては分離できない2つの信号、上述の例では、同相の信号S3と、逆相の信号S6とを、それぞれ乗算係数および乗算部を用いて、それぞれ分離するようにしたが、それらレベル比を用いては分離できない2つの信号の一方を、位相差φと乗算係数を用いて、分離したら、当該分離した信号を、第1周波数分割スペクトル制御処理部1041からの信号の和(乗算部302の出力と乗算部303の出力を加算した信号)から減算することにより、前記2つの信号の他方の信号を、分離するようにすることもできる。
【0179】
[音声信号処理装置の第7の実施形態]
第7の実施形態は、2系統の周波数分割スペクトルについての位相差に基づいて、所望の音源分離を行なうようにする場合である。図12に、この第7の実施形態の音声信号処理装置の構成例のブロック図を示す。
【0180】
この第7の実施形態においては、周波数分割スペクトル比較処理部103は、位相差検出部29で構成され、FFT部101の出力F1およびFFT部102の出力F2が、この位相差検出部29に供給されると共に、周波数分割スペクトル制御処理部104に供給される。周波数分割スペクトル制御処理部104は、図1の場合と同様に、除去係数発生部35と、乗算部32R,32Lとからなるが、除去係数発生部35が、位相差を入力として除去係数wpを出力する点が図1とは異なる。
【0181】
この第7の実施形態は、第6の実施形態における位相比較処理部1032と第2周波数分割スペクトル制御処理部1042とにおいて、乗算係数発生部に代えて除去係数発生部を設けたときの動作と全く同様の動作となる。
【0182】
すなわち、除去係数発生部35には、除去目的の音源の音声成分が左右2チャンネルに対して分配されるときの位相差φのときに、除去係数wpが0、その他の位相差の時に除去係数wpが1となるような特性の関数発生回路が設定される。例えば、前記(式3)および(式4)に示したような信号SL,SRの場合に、除去係数発生部35に、図11(b)に示すような特性の関数発生回路を設定したときには、周波数分割スペクトル制御処理部104からは、逆相で2チャンネルに分配された音源MS6の音声信号S6が、それぞれのチャンネルの信号から除去されたものが得られる。
【0183】
なお、この第7の実施形態においても、第2の実施形態と同様に、除去係数発生部35を、出力F1,F2から特定の音源の音声成分を分離抽出するための乗算係数発生部に置き換え、周波数分割スペクトル制御処理部104と逆FFT部105および106との間に、出力F1,F2から周波数分割スペクトル制御処理部104の乗算部32R,32Lの出力を減算する減算部を設ける構成を変形例とすることができる。
【0184】
[音声信号処理装置の第8の実施形態]
図13は、第8の実施形態の音声信号処理装置の構成例を示すブロック図である。この図13の例においては、左右2チャンネルの音声信号SL、SRの一方、図の例では、左チャンネルの音声信号SLから、デジタルフィルタを用いて、左右チャンネルに所定のレベル比あるいはレベル差で分配された音源の音声信号を、左チャンネル信号から除去するようにする。
【0185】
すなわち、左チャンネルの音声信号(この例ではデジタル信号)SLは、タイミング調整用の遅延部41を通じてデジタルフィルタ42に供給される。このデジタルフィルタ42には、後述するようにして、除去したい音源の音声信号の、左右チャンネルに対するレベル比に基づいて形成されるフィルタ係数(除去係数に対応)が供給されて、信号SLから前記除去したい音源の音声信号が除去された信号SOL、このデジタルフィルタ42から出力されるようにされる。
【0186】
前記フィルタ係数は、次のようにして形成される。先ず、左右チャンネルの音声信号SLおよびSR(デジタル信号)は、FFT部43およびFFT部44にそれぞれに供給されて、FFT処理されて時系列音声信号が周波数領域データに変換され、FFT部43およびFFT部44のそれぞれから、周波数が互いに異なる多数個の周波数分割スペクトル成分F1,F2が出力される。
【0187】
FFT部43および44のそれぞれからの周波数分割スペクトル成分のそれぞれは、レベル検出部45,46に供給されて、その振幅スペクトルあるいはパワースペクトルが検出されることにより、そのレベルが検出される。そして、レベル検出部45,46の各々で検出されたレベル値D1,D2は、レベル比算出部47に供給され、そのレベル比D1/D2またはD2/D1の一方が算出される。
【0188】
このレベル比算出部47で算出されたレベル比の値は、重み付け係数発生部48に供給される。この重み付け係数発生部48は、前述の実施形態の除去係数発生部に対応するものであり、除去したい音源の音声信号の、左右2チャンネルの音声信号に対する混合レベル比およびその近傍のレベル比では0あるいは非常に小さい値の重み付け係数を出力し、その他のレベル比では1あるいは大きな値の重み付け係数を出力する。この重み付け係数は、FFT部43,44の出力である周波数分割スペクトル成分の各周波数ごとに得られる。
【0189】
この重み付け係数発生部48からの周波数領域の重み付け係数は、フィルタ係数生成部49に供給され、時間軸領域のフィルタ係数に変換される。このフィルタ係数生成部49は、周波数領域の重み付け係数を、逆FFTを行なうことにより、デジタルフィルタ42に供給するフィルタ係数を得る。
【0190】
そして、このフィルタ係数生成部49からのフィルタ係数が、デジタルフィルタ42に供給されて、デジタルフィルタ42から、重み付け係数発生部48に設定された関数に応じた音源の音声信号成分が除去されて、出力SOLとされる。なお、遅延部41は、音声信号SLに対して、デジタルフィルタ42に供給されるフィルタ係数が生成されるまでの処理遅延時間を調整するためのものである。
【0191】
図13は、左チャンネル信号SLについてのみ説明したが、右チャンネル信号SRについても、遅延部を介して当該右チャンネルの信号が供給されるデジタルフィルタの系を設け、フィルタ係数発生部49からのフィルタ係数を当該右チャンネル用のデジタルフィルタにも供給することにより、全く同様にして、右チャンネルについても特定の音源の音声成分の除去をすることができる。
【0192】
図13の例は、レベル比のみを考慮したものであるが、位相差のみ、またレベル比と位相差を合わせて考慮する構成とすることもできる。すなわち、例えばレベル比と位相差とを合わせて考慮する場合には、図示は省略するが、FFT部43および44の出力を位相差検出部にも供給すると共に、検出した位相差をも、重み付け係数発生部に供給する。この例の場合の重み付け係数発生部は、除去する音源の左右2チャンネルの音声信号に対するレベル差のみではなく、位相差をも変数として重み付け係数を発生する関数発生回路の構成とされる。
【0193】
つまり、この場合の重み付け係数発生部は、除去しようとする音源の音声信号の、左右2チャンネルにおけるレベル比およびその近傍のレベル比のときであって、前記、除去しようとする音源の音声信号の、左右2チャンネルにおける位相差およびその近傍の位相差のときには、大きい重み付け係数を発生し、その他では小さい係数を発生するような関数に設定される。
【0194】
そして、その重み付け係数発生部からの重み付け係数が逆FFTされることにより、デジタルフィルタ42のフィルタ係数とされるものである。
【0195】
[その他の実施形態の音声信号処理装置]
上述の実施形態において、入力音声信号をFFTする場合、楽音のように長い時系列信号をそのままFFT処理することは困難なので、所定分析区間に区分けして、当該分析区間ごとの区分データを得ることによりFFT処理を行なう。
【0196】
しかしながら、時系列データを単純に一定の長さだけ取り出し、音源分離処理を行った後、逆FFT変換して結合した場合、その結合点において波形の不連続点を発生し、音として聞いた場合、ノイズを発生すると言う問題がある。
【0197】
そこで、第9の実施形態では、区分データを取り出すのに、図14に示すように、区間1、区間2、区間3、区間4、・・・の長さを、それぞれ同じ長さの単位区間とするが、隣り合う区間では、前記単位区間の長さの例えば1/2の区間分を、互いに重複するように各区間を設定して、各区間の区分データを取り出すようにする。なお、図14において、x1、x2、x3、・・・、xnは、デジタル音声信号のサンプルデータを示している。
【0198】
このようにして処理すると、上述の実施形態のようにして音源分離処理され、逆FFT 変換された時系列データも、図15に示す出力区分データ1,2のように、重複区間を持つことになる。
【0199】
そして、この第9の実施形態では、図15に示すように、重複区間を持って隣り合う出力区分データ、例えば出力区分データ1,2の重複区間に対して、図15に示すような三角窓の特性となる窓関数1、2の処理を行ない、各出力区分データ1,2の重複区間における同時刻データ同士を加算することにより、図15に示すような出力合成データを得るようにする。これにより、波形の不連続点の無い、すなわちノイズの無い、分離された出力音声信号が得られる。
【0200】
さらに、第10の実施形態では、区分データを取り出すのに、図16に示すように、隣り合う区分データの一定区間として、区間1、区間2、区間3、区間4のように、互いに重複して取り出すようにすると同時に、これらの各区間の区分データを、FFT処理する前に、図16に示すような三角窓の窓関数1,2,3,4の、窓関数処理を行なう。
【0201】
そして、この図16に示すような窓関数処理を行なった後、FFT変換処理を行なうようにする。そして、しかるべき音源分離処理された信号を、逆FFT変換すると、図17に示すような出力区分データ1、2が得られる。この出力区分データは、既に重複部において窓関数処理されたデータになっているので、出力部では、各重複区分データ部を加算するだけで、波形の不連続点のないノイズの無い、分離された音声信号を得ることが可能となる。
【0202】
なお、上述の窓関数としては、三角窓の他、ハニング窓またはハミング窓、あるいはブラックマン窓、などを用いることができる。
【0203】
また、上述の実施形態では、時間離散信号を直交変換することにより、周波数領域の信号に変換し、ステレオチャンネル間の周波数分割スペクトルを比較するようにしたが、原理的には時間領域で信号を多数のバンドバスフィルタにより細分化し、各周波数バンドについて同様の処理を行なうように構成するようにしてもよい。ただし、上述の実施形態のように、FFT処理をする方が、周波数分解能を上げることが容易であり、分離する音源の分離度を向上させることができるので、実用性が大きい。
【0204】
なお、上述の実施形態では、この発明が適用される2系統の音声信号として、2チャンネルステレオ信号について説明したが、この発明は、音源の音声信号が所定のレベル比あるいはレベル差で分配される2つの音声信号であれば、どのような2系統の音声信号であっても適用可能である。位相差についても同様である。
【0205】
また、上述の実施形態では、2系統の音声信号についての周波数分割スペクトルのレベル比を求め、除去係数発生部あるいは乗算係数発生部は、レベル比対乗算係数の関数を用いるようにしたが、2系統の音声信号についての周波数分割スペクトルのレベル差を求め、除去係数発生部あるいは乗算係数発生部は、当該レベル差対乗算係数の関数を用いるようにしてもよい。
【0206】
また、時系列信号を周波数領域の信号に変換する直交変換手段としては、FFT処理手段に限られるものではなく、周波数分割スペクトルのレベルや位相を比較することができるものであれば、どのようなものであってもよい。
【図面の簡単な説明】
【0207】
【図1】この発明による音声信号処理装置の第1の実施形態の構成例を示すブロック図である。
【図2】第1の実施形態の音声信号処理装置が適用されたカラオケ装置の構成例を示すブロック図である。
【図3】図1において、周波数分割スペクトル制御処理部の除去係数発生部31に設定される関数の幾つかの例を示す図である。
【図4】この発明による音声信号処理装置の第2の実施形態の構成例を示すブロック図である。
【図5】図4において、周波数分割スペクトル制御処理部の乗算係数発生部33に設定される関数の幾つかの例を示す図である。
【図6】この発明による音声信号処理装置の第3の実施形態の構成例を示すブロック図である。
【図7】この発明による音声信号処理装置の第4の実施形態の構成例を示すブロック図である。
【図8】この発明による音声信号処理装置の第5の実施形態の構成例を示すブロック図である。
【図9】この発明による音声信号処理装置の第6の実施形態の構成例を示すブロック図である。
【図10】図9の第6の実施形態の要部の構成例を示すブロック図である。
【図11】図10の乗算係数発生部304に設定される関数の幾つかの例を示す図である。
【図12】この発明による音声信号処理装置の第7の実施形態の構成例を示すブロック図である。
【図13】この発明による音声信号処理装置の第8の実施形態の構成例を示すブロック図である。
【図14】この発明による音声信号処理装置の第9の実施形態の構成例を説明するための図である。
【図15】この発明による音声信号処理装置の第9の実施形態の構成例を説明するための図である。
【図16】この発明による音声信号処理装置の第10の実施形態の構成例を説明するための図である。
【図17】この発明による音声信号処理装置の第10の実施形態の構成例を説明するための図である。
【図18】従来のボーカル除去方法を説明するためのブロック図である。
【符号の説明】
【0208】
10…音声信号処理装置、101,102…FFT部、103…周波数分割スペクトル比較処理部、104…周波数分割スペクトル制御処理部、105,106…逆FFT部、21,22…レベル検出部、23,24…レベル比算出部、25,26…セレクタ、31…除去係数発生部、32R,32L…乗算部、33…乗算係数発生部、28,29…位相差検出部
【特許請求の範囲】
【請求項1】
2系統の音声信号のそれぞれを複数個の周波数帯域に分割する分割手段と、
前記分割手段からの前記分割された複数個の周波数帯域の各々における前記2系統の音声信号のレベル比またはレベル差を算出するレベル比較手段と、
前記レベル比較手段で算出された前記レベル比または前記レベル差が予め定めた値およびその近傍となる周波数帯域の成分を、前記分割手段からの前記2系統の音声信号の少なくとも一方から除去する出力制御手段と、
を備える音声信号処理装置。
【請求項2】
2系統の入力音声時系列信号を、それぞれ周波数領域信号に変換する第1および第2の直交変換手段と、
前記第1の直交変換手段と前記第2の直交変換手段からの対応する周波数分割スペクトル同士のレベル比またはレベル差を比較する周波数分割スペクトル比較手段と、
前記周波数分割スペクトル比較手段における比較結果に基づいて、前記第1の直交変換手段と前記第2の直交変換手段の少なくとも一方から得られる周波数分割スペクトルのレベルを制御して、前記レベル比または前記レベル差が予め定めた値およびその近傍となる周波数成分を、前記2系統の音声信号の少なくとも一方から除去する周波数分割スペクトル制御手段と、
前記周波数分割スペクトル制御手段からの前記周波数領域信号を、時系列信号に戻す逆直交変換手段と、
を備えることを特徴とする音声信号処理装置。
【請求項3】
2系統の入力音声時系列信号を、それぞれ周波数領域信号に変換する第1および第2の直交変換手段と、
前記第1の直交変換手段と前記第2の直交変換手段からの、対応する周波数分割スペクトル同士の位相差を算出する位相差算出手段と、
前記位相差算出手段で算出された前記位相差に基づいて、前記第1の直交変換手段と前記第2の直交変換手段の少なくとも一方の周波数分割スペクトルのレベルを制御して、前記位相差が予め定めた値およびその近傍となる周波数成分を、前記2系統の音声信号の少なくとも一方から除去する周波数分割スペクトル制御手段と、
前記周波数分割スペクトル制御手段からの前記周波数領域信号を、時系列信号に戻す逆直交変換手段と、
を備えることを特徴とする音声信号処理装置。
【請求項4】
請求項2に記載の音声信号処理装置において、
前記周波数分割スペクトル比較手段は、
前記第1の直交変換手段と前記第2の直交変換手段からの対応する周波数分割スペクトル同士のレベル比、またはレベル差を算出し、
前記周波数分割スペクトル制御手段は、
前記算出されたレベル比またはレベル差の関数として設定された乗算係数の発生手段を備えると共に、前記乗算係数の発生手段からの前記乗算係数を、前記第1の直交変換手段と前記第2の直交変換手段の少なくとも一方から得られる周波数分割スペクトルに乗算してその出力レベルを決定するものである
ことを特徴とする音声信号処理装置。
【請求項5】
請求項3に記載の音声信号処理装置において、
前記周波数分割スペクトル制御手段は、
前記算出された位相差の関数として設定された乗算係数の発生手段を備えると共に、前記乗算係数の発生手段からの前記乗算係数を、前記第1の直交変換手段と前記第2の直交変換手段の少なくとも一方の周波数分割スペクトルに乗算してその出力レベルを決定するものである
ことを特徴とする音声信号処理装置。
【請求項6】
請求項2に記載の音声信号処理装置において、
前記周波数分割スペクトル比較手段は、
前記第1の直交変換手段と前記第2の直交変換手段からの対応する周波数分割スペクトル同士のレベル比またはレベル差を算出すると共に位相差を算出し、
前記周波数分割スペクトル制御手段は、
前記算出されたレベル比またはレベル差の関数として設定された第1の乗算係数の発生手段と、前記算出された位相差の関数として設定された第2の乗算係数の発生手段とを備えると共に、
前記第1の乗算係数の発生手段からの前記第1の乗算係数を、前記第1の直交変換手段と前記第2の直交変換手段の少なくとも一方の周波数分割スペクトルに乗算してその出力レベルを決定する第1の手段と、
前記第1の手段の出力に対して、前記第2の乗算係数の発生手段からの前記第2の乗算係数を乗算してその出力レベルを決定する第2の手段とを備え、
前記第2の手段の出力を前記逆直交変換手段に入力する
ことを特徴とする音声信号処理装置。
【請求項7】
請求項2に記載の音声信号処理装置において、
前記周波数分割スペクトル比較手段は、
前記第1の直交変換手段と前記第2の直交変換手段からの対応する周波数分割スペクトル同士のレベル比、またはレベル差を算出し、
前記周波数分割スペクトル制御手段は、
前記算出されたレベル比またはレベル差の関数として設定された乗算係数の発生手段を複数個備えると共に、前記複数個の乗算係数の発生手段からの前記乗算係数のそれぞれを、前記第1の直交変換手段と前記第2の直交変換手段の少なくとも一方の周波数分割スペクトルに乗算してその出力レベルを決定する音源分離手段の複数個とを備え、
前記逆直交変換手段は、
前記音源分離部の複数個からのそれぞれの出力を、それぞれ逆直交変換する複数個の逆直交変換部を備える
ことを特徴とする音声信号処理装置。
【請求項8】
請求項2に記載の音声信号処理装置において、
前記周波数分割スペクトル比較手段は、
前記第1の直交変換手段と前記第2の直交変換手段からの対応する周波数分割スペクトル同士のレベル比、またはレベル差を算出し、
前記周波数分割スペクトル制御手段は、
前記算出されたレベル比またはレベル差の関数として設定された乗算係数の発生手段を複数個備えると共に、前記複数個の乗算係数の発生手段からの前記乗算係数のうちの一つを選択する選択手段と、
前記選択手段からの前記乗算係数を、前記第1の直交変換手段と前記第2の直交変換手段の少なくとも一方の周波数分割スペクトルに乗算してその出力レベルを決定する音源分離手段とを備える
ことを特徴とする音声信号処理装置。
【請求項9】
請求項2または請求項3に記載の音声信号処理装置において、
2系統の入力音声時系列信号は、所定分析区間に区分けして区分データを得ると同時に、所定区分区間はオーバラップして取り出し、出力時系列信号は窓関数処理し、同時刻の時系列データ同士を加算して出力する
ことを特徴とする音声信号処理装置。
【請求項10】
請求項2または請求項3に記載の音声信号処理装置において、
2系統の入力音声時系列信号は、所定分析区間に区分けして区分データを得ると同時に、所定区分区間はオーバラップして取り出し、窓関数処理した後、直交変換し、出力時系列信号は、逆直交変換して時系列データに変換後、連続する分析区間の同時刻の時系列データ同士を加算して出力する
ことを特徴とする音声信号処理装置。
【請求項11】
分割された複数個の周波数帯域の各々における2系統の音声信号のレベル比またはレベル差を算出するレベル比較工程と、
前記レベル比較工程で算出された前記レベル比または前記レベル差が予め定めた値およびその近傍となる周波数帯域の成分を、前記2系統の音声信号の少なくとも一方から除去して出力する出力制御工程と、
を備える音声信号処理方法。
【請求項12】
2系統の入力音声時系列信号のそれぞれを周波数領域信号に変換して、2系統の周波数分割スペクトルを得る直交変換工程と、
前記直交変換工程で得られる前記2系統の周波数分割スペクトルの、対応する周波数分割スペクトル同士のレベル比またはレベル差を比較する周波数分割スペクトル比較工程と、
前記周波数分割スペクトル比較工程における比較結果に基づいて、前記直交変換工程で得られた前記2系統の周波数分割スペクトルの少なくとも一方の周波数分割スペクトルのレベルを制御することにより、前記レベル比または前記レベル差が予め定めた値およびその近傍となる周波数分割スペクトル成分を前記2系統の周波数分割スペクトルの少なくとも一方から除去する周波数分割スペクトル制御工程と、
前記周波数分割スペクトル制御工程で得られる前記周波数領域信号を、時系列信号に戻す逆直交変換工程と、
を備えることを特徴とする音声信号処理方法。
【請求項13】
2系統の入力音声時系列信号を、周波数領域信号に変換する直交変換工程と、
前記直交変換工程で得られる前記2系統の入力音声時系列信号についての周波数分割スペクトルの、対応する周波数分割スペクトル同士の位相差を算出する位相差算出工程と、
前記位相差算出工程で算出された前記位相差に基づいて、前記直交変換工程で得られた2系統の周波数分割スペクトルの少なくとも一方の周波数分割スペクトルのレベルを制御することにより、前記位相差が予め定めた値およびその近傍となる周波数分割スペクトル成分を、前記2系統の周波数分割スペクトルの少なくとも一方から除去する周波数分割スペクトル制御工程と、
前記周波数分割スペクトル制御工程で得られる前記周波数領域信号を、時系列信号に戻す逆直交変換工程と、
を備えることを特徴とする音声信号処理方法。
【特許請求の範囲】
【請求項1】
2系統の音声信号のそれぞれを複数個の周波数帯域に分割する分割手段と、
前記分割手段からの前記分割された複数個の周波数帯域の各々における前記2系統の音声信号のレベル比またはレベル差を算出するレベル比較手段と、
前記レベル比較手段で算出された前記レベル比または前記レベル差が予め定めた値およびその近傍となる周波数帯域の成分を、前記分割手段からの前記2系統の音声信号の少なくとも一方から除去する出力制御手段と、
を備える音声信号処理装置。
【請求項2】
2系統の時系列音声信号を、それぞれ周波数領域信号に変換する第1および第2の直交変換手段と、
前記第1の直交変換手段と前記第2の直交変換手段からの対応する周波数分割スペクトル同士のレベル比またはレベル差を算出するレベル算出手段と、
前記レベル算出手段における算出結果に基づいて、前記第1の直交変換手段と前記第2の直交変換手段の少なくとも一方から得られる周波数分割スペクトルのレベルを制御して、前記レベル比または前記レベル差が予め定めた値およびその近傍となる周波数成分を、前記2系統の周波数領域信号の少なくとも一方から除去する出力制御手段と、
前記出力制御手段からの前記周波数領域信号を、時系列信号に変換する逆直交変換手段と、
を備えることを特徴とする音声信号処理装置。
【請求項3】
2系統の時系列音声信号を、それぞれ周波数領域信号に変換する第1および第2の直交変換手段と、
前記第1の直交変換手段と前記第2の直交変換手段からの、対応する周波数分割スペクトル同士の位相差を算出する位相差算出手段と、
前記位相差算出手段で算出された前記位相差に基づいて、前記第1の直交変換手段と前記第2の直交変換手段の少なくとも一方の周波数分割スペクトルのレベルを制御して、前記位相差が予め定めた値およびその近傍となる周波数成分を、前記2系統の周波数領域信号の少なくとも一方から除去する出力制御手段と、
前記出力制御手段からの前記周波数領域信号を、時系列信号に変換する逆直交変換手段と、
を備えることを特徴とする音声信号処理装置。
【請求項4】
請求項2に記載の音声信号処理装置において、
前記出力制御手段は、
前記レベル算出手段で算出されたレベル比またはレベル差の関数として設定された乗算係数の発生部と、前記乗算係数の発生部からの前記乗算係数を、前記第1の直交変換手段と前記第2の直交変換手段の少なくとも一方から得られる周波数分割スペクトルに乗算してその出力レベルを決定する乗算部とを備える
ことを特徴とする音声信号処理装置。
【請求項5】
請求項3に記載の音声信号処理装置において、
前記出力制御手段は、
前記位相差算出手段で算出された位相差の関数として設定された乗算係数の発生部と、前記乗算係数の発生部からの前記乗算係数を、前記第1の直交変換手段と前記第2の直交変換手段の少なくとも一方から得られる周波数分割スペクトルに乗算してその出力レベルを決定する乗算部とを備える
ことを特徴とする音声信号処理装置。
【請求項6】
請求項2に記載の音声信号処理装置において、
前記レベル算出手段は、
前記第1の直交変換手段と前記第2の直交変換手段からの対応する周波数分割スペクトル同士のレベル比またはレベル差を算出すると共に位相差を算出し、
前記出力制御手段は、
前記算出されたレベル比またはレベル差の関数として設定された第1の乗算係数の発生手段と、前記算出された位相差の関数として設定された第2の乗算係数の発生手段とを備えると共に、
前記第1の乗算係数の発生手段からの前記第1の乗算係数を、前記第1の直交変換手段と前記第2の直交変換手段の少なくとも一方の周波数分割スペクトルに乗算してその出力レベルを決定する第1の手段と、
前記第1の手段の出力に対して、前記第2の乗算係数の発生手段からの前記第2の乗算係数を乗算してその出力レベルを決定する第2の手段とを備え、
前記第2の手段の出力を前記逆直交変換手段に入力する
ことを特徴とする音声信号処理装置。
【請求項7】
請求項2に記載の音声信号処理装置において、
前記出力制御手段は、
前記レベル算出手段で算出されたレベル比またはレベル差の関数として設定された乗算係数の発生部を複数個備えると共に、前記複数個の乗算係数の発生部からの前記乗算係数のそれぞれを、前記第1の直交変換手段と前記第2の直交変換手段の少なくとも一方から得られる周波数分割スペクトルに乗算してその出力レベルを決定する乗算部の複数個とを備え、
前記逆直交変換手段は、
前記複数の乗算部からのそれぞれの出力を、それぞれ時系列信号に変換する複数個の逆直交変換部を備える
ことを特徴とする音声信号処理装置。
【請求項8】
請求項2に記載の音声信号処理装置において、
前記出力制御手段は、
前記レベル算出手段で算出されたレベル比またはレベル差の関数として設定された乗算係数の発生部を複数個備えると共に、前記複数個の乗算係数の発生部からの前記乗算係数のうちの一つを選択する選択部と、
前記選択部からの前記乗算係数を、前記第1の直交変換手段と前記第2の直交変換手段の少なくとも一方から得られる周波数分割スペクトルに乗算してその出力レベルを決定する乗算部とを備える
ことを特徴とする音声信号処理装置。
【請求項9】
請求項2または請求項3に記載の音声信号処理装置において、
2系統の時系列音声信号を、所定区間に区分けして区分データとすると共に、隣り合う区分データは一部の区間はオーバラップさせて、前記区分データを前記第1および第2の直交変換手段に供給する区分化手段と、
前記逆直交変換手段からの、各区分データに対応する出力時系列信号を窓関数処理し、同時刻の時系列信号同士を加算して出力する出力手段と
を備えることを特徴とする音声信号処理装置。
【請求項10】
請求項2または請求項3に記載の音声信号処理装置において、
2系統の時系列音声信号を、所定区間に区分けして区分データとすると共に、隣り合う区分データは一部の区間はオーバラップさせて、窓関数処理して、前記区分データを前記第1および第2の直交変換手段に供給する区分化手段と、
前記直交逆変換手段からの出力時系列信号を、同時刻の時系列信号同士を加算して出力する出力手段と
を備えることを特徴とする音声信号処理装置。
【請求項11】
2系統の音声信号のそれぞれを複数個の周波数帯域に分割する分割工程と、
前記分割された複数個の周波数帯域の各々における2系統の音声信号のレベル比またはレベル差を算出するレベル比較工程と、
前記レベル比較工程で算出された前記レベル比または前記レベル差が予め定めた値およびその近傍となる周波数帯域の成分を、前記2系統の音声信号の少なくとも一方から除去して出力する出力制御工程と、
を備える音声信号処理方法。
【請求項12】
2系統の時系列音声信号のそれぞれを周波数領域信号に変換して、2系統の周波数分割スペクトルを得る直交変換工程と、
前記直交変換工程で得られる前記2系統の周波数分割スペクトルの、対応する周波数分割スペクトル同士のレベル比またはレベル差を算出するレベル算出工程と、
前記レベル算出工程における算出結果に基づいて、前記直交変換工程で得られた前記2系統の周波数分割スペクトルの少なくとも一方の周波数分割スペクトルのレベルを制御することにより、前記レベル比または前記レベル差が予め定めた値およびその近傍となる周波数分割スペクトル成分を前記2系統の周波数分割スペクトルの少なくとも一方から除去する出力制御工程と、
前記出力制御工程で得られる前記周波数領域信号を、時系列信号に変換する逆直交変換工程と、
を備えることを特徴とする音声信号処理方法。
【請求項13】
2系統の時系列音声信号を、周波数領域信号に変換する直交変換工程と、
前記直交変換工程で得られる前記2系統の時系列音声信号についての周波数分割スペクトルの、対応する周波数分割スペクトル同士の位相差を算出する位相差算出工程と、
前記位相差算出工程で算出された前記位相差に基づいて、前記直交変換工程で得られた2系統の周波数分割スペクトルの少なくとも一方の周波数分割スペクトルのレベルを制御することにより、前記位相差が予め定めた値およびその近傍となる周波数分割スペクトル成分を、前記2系統の周波数分割スペクトルの少なくとも一方から除去する出力制御工程と、
前記出力制御工程で得られる前記周波数領域信号を、時系列信号に変換する逆直交変換工程と、
を備えることを特徴とする音声信号処理方法。
【請求項1】
2系統の音声信号のそれぞれを複数個の周波数帯域に分割する分割手段と、
前記分割手段からの前記分割された複数個の周波数帯域の各々における前記2系統の音声信号のレベル比またはレベル差を算出するレベル比較手段と、
前記レベル比較手段で算出された前記レベル比または前記レベル差が予め定めた値およびその近傍となる周波数帯域の成分を、前記分割手段からの前記2系統の音声信号の少なくとも一方から除去する出力制御手段と、
を備える音声信号処理装置。
【請求項2】
2系統の入力音声時系列信号を、それぞれ周波数領域信号に変換する第1および第2の直交変換手段と、
前記第1の直交変換手段と前記第2の直交変換手段からの対応する周波数分割スペクトル同士のレベル比またはレベル差を比較する周波数分割スペクトル比較手段と、
前記周波数分割スペクトル比較手段における比較結果に基づいて、前記第1の直交変換手段と前記第2の直交変換手段の少なくとも一方から得られる周波数分割スペクトルのレベルを制御して、前記レベル比または前記レベル差が予め定めた値およびその近傍となる周波数成分を、前記2系統の音声信号の少なくとも一方から除去する周波数分割スペクトル制御手段と、
前記周波数分割スペクトル制御手段からの前記周波数領域信号を、時系列信号に戻す逆直交変換手段と、
を備えることを特徴とする音声信号処理装置。
【請求項3】
2系統の入力音声時系列信号を、それぞれ周波数領域信号に変換する第1および第2の直交変換手段と、
前記第1の直交変換手段と前記第2の直交変換手段からの、対応する周波数分割スペクトル同士の位相差を算出する位相差算出手段と、
前記位相差算出手段で算出された前記位相差に基づいて、前記第1の直交変換手段と前記第2の直交変換手段の少なくとも一方の周波数分割スペクトルのレベルを制御して、前記位相差が予め定めた値およびその近傍となる周波数成分を、前記2系統の音声信号の少なくとも一方から除去する周波数分割スペクトル制御手段と、
前記周波数分割スペクトル制御手段からの前記周波数領域信号を、時系列信号に戻す逆直交変換手段と、
を備えることを特徴とする音声信号処理装置。
【請求項4】
請求項2に記載の音声信号処理装置において、
前記周波数分割スペクトル比較手段は、
前記第1の直交変換手段と前記第2の直交変換手段からの対応する周波数分割スペクトル同士のレベル比、またはレベル差を算出し、
前記周波数分割スペクトル制御手段は、
前記算出されたレベル比またはレベル差の関数として設定された乗算係数の発生手段を備えると共に、前記乗算係数の発生手段からの前記乗算係数を、前記第1の直交変換手段と前記第2の直交変換手段の少なくとも一方から得られる周波数分割スペクトルに乗算してその出力レベルを決定するものである
ことを特徴とする音声信号処理装置。
【請求項5】
請求項3に記載の音声信号処理装置において、
前記周波数分割スペクトル制御手段は、
前記算出された位相差の関数として設定された乗算係数の発生手段を備えると共に、前記乗算係数の発生手段からの前記乗算係数を、前記第1の直交変換手段と前記第2の直交変換手段の少なくとも一方の周波数分割スペクトルに乗算してその出力レベルを決定するものである
ことを特徴とする音声信号処理装置。
【請求項6】
請求項2に記載の音声信号処理装置において、
前記周波数分割スペクトル比較手段は、
前記第1の直交変換手段と前記第2の直交変換手段からの対応する周波数分割スペクトル同士のレベル比またはレベル差を算出すると共に位相差を算出し、
前記周波数分割スペクトル制御手段は、
前記算出されたレベル比またはレベル差の関数として設定された第1の乗算係数の発生手段と、前記算出された位相差の関数として設定された第2の乗算係数の発生手段とを備えると共に、
前記第1の乗算係数の発生手段からの前記第1の乗算係数を、前記第1の直交変換手段と前記第2の直交変換手段の少なくとも一方の周波数分割スペクトルに乗算してその出力レベルを決定する第1の手段と、
前記第1の手段の出力に対して、前記第2の乗算係数の発生手段からの前記第2の乗算係数を乗算してその出力レベルを決定する第2の手段とを備え、
前記第2の手段の出力を前記逆直交変換手段に入力する
ことを特徴とする音声信号処理装置。
【請求項7】
請求項2に記載の音声信号処理装置において、
前記周波数分割スペクトル比較手段は、
前記第1の直交変換手段と前記第2の直交変換手段からの対応する周波数分割スペクトル同士のレベル比、またはレベル差を算出し、
前記周波数分割スペクトル制御手段は、
前記算出されたレベル比またはレベル差の関数として設定された乗算係数の発生手段を複数個備えると共に、前記複数個の乗算係数の発生手段からの前記乗算係数のそれぞれを、前記第1の直交変換手段と前記第2の直交変換手段の少なくとも一方の周波数分割スペクトルに乗算してその出力レベルを決定する音源分離手段の複数個とを備え、
前記逆直交変換手段は、
前記音源分離部の複数個からのそれぞれの出力を、それぞれ逆直交変換する複数個の逆直交変換部を備える
ことを特徴とする音声信号処理装置。
【請求項8】
請求項2に記載の音声信号処理装置において、
前記周波数分割スペクトル比較手段は、
前記第1の直交変換手段と前記第2の直交変換手段からの対応する周波数分割スペクトル同士のレベル比、またはレベル差を算出し、
前記周波数分割スペクトル制御手段は、
前記算出されたレベル比またはレベル差の関数として設定された乗算係数の発生手段を複数個備えると共に、前記複数個の乗算係数の発生手段からの前記乗算係数のうちの一つを選択する選択手段と、
前記選択手段からの前記乗算係数を、前記第1の直交変換手段と前記第2の直交変換手段の少なくとも一方の周波数分割スペクトルに乗算してその出力レベルを決定する音源分離手段とを備える
ことを特徴とする音声信号処理装置。
【請求項9】
請求項2または請求項3に記載の音声信号処理装置において、
2系統の入力音声時系列信号は、所定分析区間に区分けして区分データを得ると同時に、所定区分区間はオーバラップして取り出し、出力時系列信号は窓関数処理し、同時刻の時系列データ同士を加算して出力する
ことを特徴とする音声信号処理装置。
【請求項10】
請求項2または請求項3に記載の音声信号処理装置において、
2系統の入力音声時系列信号は、所定分析区間に区分けして区分データを得ると同時に、所定区分区間はオーバラップして取り出し、窓関数処理した後、直交変換し、出力時系列信号は、逆直交変換して時系列データに変換後、連続する分析区間の同時刻の時系列データ同士を加算して出力する
ことを特徴とする音声信号処理装置。
【請求項11】
分割された複数個の周波数帯域の各々における2系統の音声信号のレベル比またはレベル差を算出するレベル比較工程と、
前記レベル比較工程で算出された前記レベル比または前記レベル差が予め定めた値およびその近傍となる周波数帯域の成分を、前記2系統の音声信号の少なくとも一方から除去して出力する出力制御工程と、
を備える音声信号処理方法。
【請求項12】
2系統の入力音声時系列信号のそれぞれを周波数領域信号に変換して、2系統の周波数分割スペクトルを得る直交変換工程と、
前記直交変換工程で得られる前記2系統の周波数分割スペクトルの、対応する周波数分割スペクトル同士のレベル比またはレベル差を比較する周波数分割スペクトル比較工程と、
前記周波数分割スペクトル比較工程における比較結果に基づいて、前記直交変換工程で得られた前記2系統の周波数分割スペクトルの少なくとも一方の周波数分割スペクトルのレベルを制御することにより、前記レベル比または前記レベル差が予め定めた値およびその近傍となる周波数分割スペクトル成分を前記2系統の周波数分割スペクトルの少なくとも一方から除去する周波数分割スペクトル制御工程と、
前記周波数分割スペクトル制御工程で得られる前記周波数領域信号を、時系列信号に戻す逆直交変換工程と、
を備えることを特徴とする音声信号処理方法。
【請求項13】
2系統の入力音声時系列信号を、周波数領域信号に変換する直交変換工程と、
前記直交変換工程で得られる前記2系統の入力音声時系列信号についての周波数分割スペクトルの、対応する周波数分割スペクトル同士の位相差を算出する位相差算出工程と、
前記位相差算出工程で算出された前記位相差に基づいて、前記直交変換工程で得られた2系統の周波数分割スペクトルの少なくとも一方の周波数分割スペクトルのレベルを制御することにより、前記位相差が予め定めた値およびその近傍となる周波数分割スペクトル成分を、前記2系統の周波数分割スペクトルの少なくとも一方から除去する周波数分割スペクトル制御工程と、
前記周波数分割スペクトル制御工程で得られる前記周波数領域信号を、時系列信号に戻す逆直交変換工程と、
を備えることを特徴とする音声信号処理方法。
【特許請求の範囲】
【請求項1】
2系統の音声信号のそれぞれを複数個の周波数帯域に分割する分割手段と、
前記分割手段からの前記分割された複数個の周波数帯域の各々における前記2系統の音声信号のレベル比またはレベル差を算出するレベル比較手段と、
前記レベル比較手段で算出された前記レベル比または前記レベル差が予め定めた値およびその近傍となる周波数帯域の成分を、前記分割手段からの前記2系統の音声信号の少なくとも一方から除去する出力制御手段と、
を備える音声信号処理装置。
【請求項2】
2系統の時系列音声信号を、それぞれ周波数領域信号に変換する第1および第2の直交変換手段と、
前記第1の直交変換手段と前記第2の直交変換手段からの対応する周波数分割スペクトル同士のレベル比またはレベル差を算出するレベル算出手段と、
前記レベル算出手段における算出結果に基づいて、前記第1の直交変換手段と前記第2の直交変換手段の少なくとも一方から得られる周波数分割スペクトルのレベルを制御して、前記レベル比または前記レベル差が予め定めた値およびその近傍となる周波数成分を、前記2系統の周波数領域信号の少なくとも一方から除去する出力制御手段と、
前記出力制御手段からの前記周波数領域信号を、時系列信号に変換する逆直交変換手段と、
を備えることを特徴とする音声信号処理装置。
【請求項3】
2系統の時系列音声信号を、それぞれ周波数領域信号に変換する第1および第2の直交変換手段と、
前記第1の直交変換手段と前記第2の直交変換手段からの、対応する周波数分割スペクトル同士の位相差を算出する位相差算出手段と、
前記位相差算出手段で算出された前記位相差に基づいて、前記第1の直交変換手段と前記第2の直交変換手段の少なくとも一方の周波数分割スペクトルのレベルを制御して、前記位相差が予め定めた値およびその近傍となる周波数成分を、前記2系統の周波数領域信号の少なくとも一方から除去する出力制御手段と、
前記出力制御手段からの前記周波数領域信号を、時系列信号に変換する逆直交変換手段と、
を備えることを特徴とする音声信号処理装置。
【請求項4】
請求項2に記載の音声信号処理装置において、
前記出力制御手段は、
前記レベル算出手段で算出されたレベル比またはレベル差の関数として設定された乗算係数の発生部と、前記乗算係数の発生部からの前記乗算係数を、前記第1の直交変換手段と前記第2の直交変換手段の少なくとも一方から得られる周波数分割スペクトルに乗算してその出力レベルを決定する乗算部とを備える
ことを特徴とする音声信号処理装置。
【請求項5】
請求項3に記載の音声信号処理装置において、
前記出力制御手段は、
前記位相差算出手段で算出された位相差の関数として設定された乗算係数の発生部と、前記乗算係数の発生部からの前記乗算係数を、前記第1の直交変換手段と前記第2の直交変換手段の少なくとも一方から得られる周波数分割スペクトルに乗算してその出力レベルを決定する乗算部とを備える
ことを特徴とする音声信号処理装置。
【請求項6】
請求項2に記載の音声信号処理装置において、
前記レベル算出手段は、
前記第1の直交変換手段と前記第2の直交変換手段からの対応する周波数分割スペクトル同士のレベル比またはレベル差を算出すると共に位相差を算出し、
前記出力制御手段は、
前記算出されたレベル比またはレベル差の関数として設定された第1の乗算係数の発生手段と、前記算出された位相差の関数として設定された第2の乗算係数の発生手段とを備えると共に、
前記第1の乗算係数の発生手段からの前記第1の乗算係数を、前記第1の直交変換手段と前記第2の直交変換手段の少なくとも一方の周波数分割スペクトルに乗算してその出力レベルを決定する第1の手段と、
前記第1の手段の出力に対して、前記第2の乗算係数の発生手段からの前記第2の乗算係数を乗算してその出力レベルを決定する第2の手段とを備え、
前記第2の手段の出力を前記逆直交変換手段に入力する
ことを特徴とする音声信号処理装置。
【請求項7】
請求項2に記載の音声信号処理装置において、
前記出力制御手段は、
前記レベル算出手段で算出されたレベル比またはレベル差の関数として設定された乗算係数の発生部を複数個備えると共に、前記複数個の乗算係数の発生部からの前記乗算係数のそれぞれを、前記第1の直交変換手段と前記第2の直交変換手段の少なくとも一方から得られる周波数分割スペクトルに乗算してその出力レベルを決定する乗算部の複数個とを備え、
前記逆直交変換手段は、
前記複数の乗算部からのそれぞれの出力を、それぞれ時系列信号に変換する複数個の逆直交変換部を備える
ことを特徴とする音声信号処理装置。
【請求項8】
請求項2に記載の音声信号処理装置において、
前記出力制御手段は、
前記レベル算出手段で算出されたレベル比またはレベル差の関数として設定された乗算係数の発生部を複数個備えると共に、前記複数個の乗算係数の発生部からの前記乗算係数のうちの一つを選択する選択部と、
前記選択部からの前記乗算係数を、前記第1の直交変換手段と前記第2の直交変換手段の少なくとも一方から得られる周波数分割スペクトルに乗算してその出力レベルを決定する乗算部とを備える
ことを特徴とする音声信号処理装置。
【請求項9】
請求項2または請求項3に記載の音声信号処理装置において、
2系統の時系列音声信号を、所定区間に区分けして区分データとすると共に、隣り合う区分データは一部の区間はオーバラップさせて、前記区分データを前記第1および第2の直交変換手段に供給する区分化手段と、
前記逆直交変換手段からの、各区分データに対応する出力時系列信号を窓関数処理し、同時刻の時系列信号同士を加算して出力する出力手段と
を備えることを特徴とする音声信号処理装置。
【請求項10】
請求項2または請求項3に記載の音声信号処理装置において、
2系統の時系列音声信号を、所定区間に区分けして区分データとすると共に、隣り合う区分データは一部の区間はオーバラップさせて、窓関数処理して、前記区分データを前記第1および第2の直交変換手段に供給する区分化手段と、
前記直交逆変換手段からの出力時系列信号を、同時刻の時系列信号同士を加算して出力する出力手段と
を備えることを特徴とする音声信号処理装置。
【請求項11】
2系統の音声信号のそれぞれを複数個の周波数帯域に分割する分割工程と、
前記分割された複数個の周波数帯域の各々における2系統の音声信号のレベル比またはレベル差を算出するレベル比較工程と、
前記レベル比較工程で算出された前記レベル比または前記レベル差が予め定めた値およびその近傍となる周波数帯域の成分を、前記2系統の音声信号の少なくとも一方から除去して出力する出力制御工程と、
を備える音声信号処理方法。
【請求項12】
2系統の時系列音声信号のそれぞれを周波数領域信号に変換して、2系統の周波数分割スペクトルを得る直交変換工程と、
前記直交変換工程で得られる前記2系統の周波数分割スペクトルの、対応する周波数分割スペクトル同士のレベル比またはレベル差を算出するレベル算出工程と、
前記レベル算出工程における算出結果に基づいて、前記直交変換工程で得られた前記2系統の周波数分割スペクトルの少なくとも一方の周波数分割スペクトルのレベルを制御することにより、前記レベル比または前記レベル差が予め定めた値およびその近傍となる周波数分割スペクトル成分を前記2系統の周波数分割スペクトルの少なくとも一方から除去する出力制御工程と、
前記出力制御工程で得られる前記周波数領域信号を、時系列信号に変換する逆直交変換工程と、
を備えることを特徴とする音声信号処理方法。
【請求項13】
2系統の時系列音声信号を、周波数領域信号に変換する直交変換工程と、
前記直交変換工程で得られる前記2系統の時系列音声信号についての周波数分割スペクトルの、対応する周波数分割スペクトル同士の位相差を算出する位相差算出工程と、
前記位相差算出工程で算出された前記位相差に基づいて、前記直交変換工程で得られた2系統の周波数分割スペクトルの少なくとも一方の周波数分割スペクトルのレベルを制御することにより、前記位相差が予め定めた値およびその近傍となる周波数分割スペクトル成分を、前記2系統の周波数分割スペクトルの少なくとも一方から除去する出力制御工程と、
前記出力制御工程で得られる前記周波数領域信号を、時系列信号に変換する逆直交変換工程と、
を備えることを特徴とする音声信号処理方法。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【公開番号】特開2006−100869(P2006−100869A)
【公開日】平成18年4月13日(2006.4.13)
【国際特許分類】
【出願番号】特願2004−280820(P2004−280820)
【出願日】平成16年9月28日(2004.9.28)
【出願人】(000002185)ソニー株式会社 (34,172)
【Fターム(参考)】
【公開日】平成18年4月13日(2006.4.13)
【国際特許分類】
【出願日】平成16年9月28日(2004.9.28)
【出願人】(000002185)ソニー株式会社 (34,172)
【Fターム(参考)】
[ Back to top ]