雑音抑圧装置およびプログラム
【課題】計算量を抑えて高品質な雑音抑圧音声を得ることができる雑音抑圧装置およびプログラムを提供する。
【解決手段】雑音混入音声y(t)を入力として、スペクトルサブトラクションにより雑音抑圧音声x'(t)を出力として得る雑音抑圧装置であって、雑音混入スペクトルYm(ω)から推定雑音スペクトルD'(ω)を減算する倍率α(ω)、および、減算されたスペクトルの下限を決めるパラメータβ(ω)を設定する際に、パラメータβ(ω)を倍率α(ω)に依存した値とすることを特徴とする。
【解決手段】雑音混入音声y(t)を入力として、スペクトルサブトラクションにより雑音抑圧音声x'(t)を出力として得る雑音抑圧装置であって、雑音混入スペクトルYm(ω)から推定雑音スペクトルD'(ω)を減算する倍率α(ω)、および、減算されたスペクトルの下限を決めるパラメータβ(ω)を設定する際に、パラメータβ(ω)を倍率α(ω)に依存した値とすることを特徴とする。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、雑音抑圧装置およびプログラムに関し、特に、音声に付加された雑音成分を抑圧する雑音抑圧装置およびプログラムに関する。
【背景技術】
【0002】
生中継を含むテレビやラジオなど放送用の音声の収録は、必ずしも音声素材の収録に適した環境で行われるとは限らず、様々な雑音も同時に収録されることとなる。そのような環境下においても放送に耐えうる明瞭な音声を得るには、混入した雑音を高品質に抑圧する技術が必要である。
【0003】
従来から、音声に付加された雑音成分を抑圧する方法としては様々なものが提案されており、例えばスペクトルサブトラクションがよく知られている。以下に、スペクトルサブトラクションの原理を説明する。
【0004】
tを時刻として、雑音混入音声y(t)が、入力音声x(t)と加法性雑音d(t)との和で[数1]のように構成されるとする。ここで、雑音混入音声y(t)は予め適切なサンプリング周波数でサンプリングされているとする。
【数1】
【0005】
その離散フーリエ変換による周波数表現は、ωを離散角周波数として、[数2]のように表わされる。
【数2】
【0006】
雑音混入音声y(t)の周波数スペクトルY(ω)を極座標形式で表現すると、[数3]のように表わされる。以降では、|Y(ω)|、φy(ω)をそれぞれ雑音混入音声y(t)の振幅スペクトル、位相スペクトルと呼ぶ。
【数3】
【0007】
雑音d(t)の周波数スペクトルD(ω)も同様に振幅スペクトル、位相スペクトルを用いて、[数4]のように表わされる。
【数4】
【0008】
実際には雑音の振幅スペクトル|D(ω)|は未知だが、非音声区間から推定した値|Dest(ω)|で置換できる。また、位相成分は音声の知覚への影響が少ないので、雑音の位相スペクトルφd(ω)を雑音混入音声の位相スペクトルφy(ω)で置換できる。
【0009】
すると、雑音抑圧音声の周波数スペクトルX'(ω)は、例えば[数5]のように表わされる(例えば、特許文献1参照)。雑音抑圧音声x'(t)はX'(ω)を逆フーリエ変換することで求めることができる。ここで、α(ω)は雑音を減算する倍率(over-estimation factor)(以下、減算倍率と記す)であり、β(ω)はスペクトルの下限を決めるパラメータ(flooring factor)(以下、下限パラメータと記す)である。なお、Max{A,B}はAとBのうち大きい方を示す関数である。このような関数を用いるのは、振幅スペクトルが負の値を取り得ないためである。
【数5】
【先行技術文献】
【特許文献】
【0010】
【特許文献1】特許第3693022号明細書
【発明の概要】
【発明が解決しようとする課題】
【0011】
特許文献1に開示された従来の方法では、雑音のスペクトル包絡を求め、これに依存した減算倍率α(ω)、下限パラメータβ(ω)を算出している。しかしながら、この方法では、スペクトル包絡を算出するために、雑音の周波数スペクトルD(ω)に対してさらにフーリエ変換および逆フーリエ変換を行う必要があり、計算量が非常に多くなるという問題がある。
【0012】
本発明は、このような従来の課題を解決するためになされたものであって、計算量を抑えて高品質な雑音抑圧音声を得ることができる雑音抑圧装置およびプログラムを提供することを目的とする。
【課題を解決するための手段】
【0013】
本発明の雑音抑圧装置は、雑音混入音声を入力として、スペクトルサブトラクションにより雑音抑圧音声を出力として得る雑音抑圧装置であって、前記雑音混入音声の周波数スペクトルを求める周波数解析手段と、前記雑音混入音声の非音声区間の周波数スペクトルから雑音の周波数スペクトルを推定する雑音スペクトル推定手段と、前記雑音混入音声の周波数スペクトルと前記雑音の周波数スペクトルの離散角周波数ごとの大小関係に応じて、雑音抑圧スペクトルを算出する雑音抑圧スペクトル算出手段と、を備え、前記雑音抑圧スペクトル算出手段が、離散角周波数の関数である第1の係数を設定する第1の係数設定手段と、前記第1の係数に依存する第2の係数を設定する第2の係数設定手段と、前記雑音混入音声の周波数スペクトルから、前記雑音の周波数スペクトルに前記第1の係数を乗じた周波数スペクトルを減算する減算手段と、前記雑音混入音声の周波数スペクトルに前記第2の係数を乗じた周波数スペクトルを算出する乗算手段と、前記減算手段が出力する周波数スペクトルと前記乗算手段が出力する周波数スペクトルを比較して、離散角周波数ごとに大きい方を出力する比較手段と、を備える構成を有している。
【0014】
この構成により、スペクトル包絡を計算することなく減算倍率(第1の係数)を算出し、さらに下限パラメータ(第2の係数)を減算倍率に基づいて算出するため、計算量を抑えて高品質な雑音抑圧音声を得ることができる。
【0015】
また、本発明の雑音抑圧装置は、前記第2の係数設定手段が、前記第2の係数が前記第1の係数に対して単調減少するように前記第2の係数を設定する構成を有していてもよい。
また、本発明の雑音抑圧装置は、前記第2の係数β(ω)が、以下の式(1)に示される前記第1の係数α(ω)の関数であってもよい。
【数6】
【0016】
また、本発明の雑音抑圧装置は、前記第1の係数が、前記雑音の周波数スペクトルに対する前記雑音混入音声の周波数スペクトルの比に依存するものであってもよい。
【発明の効果】
【0017】
本発明は、スペクトル包絡を計算することなく減算倍率を算出し、さらに下限パラメータを減算倍率に基づいて算出することにより、計算量を抑えて高品質な雑音抑圧音声を得ることができる雑音抑圧装置およびプログラムを提供するものである。
【図面の簡単な説明】
【0018】
【図1】本発明に係る雑音抑圧装置の構成を示すブロック図
【図2】本発明に係る雑音抑圧装置の雑音抑圧スペクトル算出手段の構成を示すブロック図
【図3】本発明に係る雑音抑圧装置のハードウエア構成を示すブロック図
【図4】本発明に係る雑音抑圧装置のDSPが実行する雑音抑圧プログラムのフローチャート
【図5】雑音混入音声と分析フレームとの対応関係を示す模式的なグラフ
【図6】音声区間の雑音混入スペクトルの振幅スペクトル、および、推定雑音スペクトルの振幅スペクトルを示すグラフ
【図7】雑音抑圧プログラムの雑音抑圧スペクトル算出処理のフローチャート
【図8】事後SN比の算出結果を示すグラフ
【図9】傾きaが−1のときの切片bの決定方法を説明するためのグラフ
【図10】切片bが−3のときの傾きaの決定方法を説明するためのグラフ
【図11】減算倍率および下限パラメータの算出結果を示すグラフ
【図12】推定雑音スペクトルの振幅スペクトルに減算倍率を乗じたスペクトル、雑音混入スペクトルの振幅スペクトルに下限パラメータを乗じたスペクトル、および、雑音抑圧スペクトルの振幅スペクトルの算出結果を示すグラフ
【図13】雑音混入音声、および、雑音抑圧音声の算出結果を示すグラフ
【発明を実施するための形態】
【0019】
以下、本発明に係る雑音抑圧装置およびプログラムの実施形態を図面を用いて説明する。
【0020】
図1、2は本実施形態の雑音抑圧装置の構成を示すブロック図である。即ち、図1に示すように、本実施形態の雑音抑圧装置は、入力された雑音混入音声y(t)を複数の分析フレームFm(mは自然数)に対応させて切り出す音声波形切り出し手段1と、音声波形切り出し手段1によって切り出された雑音混入音声ym(t)の周波数スペクトルYm(ω)(以下、雑音混入スペクトルと記す)を求める周波数解析手段2と、雑音混入音声y(t)から非音声区間を検出するとともに、各分析フレームFmに対応した雑音混入音声ym(t)が非音声区間に属するものであるか否かを判定する非音声区間検出手段3と、非音声区間に属する雑音混入音声ym(t)の雑音混入スペクトルYm(ω)から雑音の周波数スペクトルD'(ω)(以下、推定雑音スペクトルと記す)を推定する雑音スペクトル推定手段4と、雑音混入スペクトルYm(ω)と推定雑音スペクトルD'(ω)の離散角周波数ωごとの大小関係に応じて、雑音抑圧スペクトルX'(ω)を算出する雑音抑圧スペクトル算出手段5と、を備える。
【0021】
図2に示すように、雑音抑圧スペクトル算出手段5は、離散角周波数ωの関数である減算倍率(第1の係数)α(ω)を設定する第1の係数設定手段50と、減算倍率α(ω)に依存する下限パラメータ(第2の係数)β(ω)を設定する第2の係数設定手段53と、雑音混入スペクトルYm(ω)から、推定雑音スペクトルD'(ω)に減算倍率α(ω)を乗じた周波数スペクトルを減算する減算手段54と、雑音混入スペクトルYm(ω)に下限パラメータβ(ω)を乗じた周波数スペクトルを算出する乗算手段55と、減算手段54が出力する周波数スペクトルと乗算手段55が出力する周波数スペクトルを比較して、離散角周波数ωごとに大きい方を出力する比較手段56と、を備える。第1の係数設定手段50は、事後SN比算出手段51と、減算倍率α(ω)を算出する減算倍率算出手段52と、を備える。
【0022】
本実施形態の雑音抑圧装置は、図1に示すように、雑音抑圧スペクトルX'(ω)に基づいて雑音抑圧音声x'(t)を出力する雑音抑圧音声出力手段6をさらに備える。
【0023】
図3は、本実施形態の雑音抑圧装置のハードウエア構成を示すブロック図である。図3に示すように、本実施形態の雑音抑圧装置は、表示パネル71、キーボード72、およびマウス73等のインターフェイスと、パーソナルコンピュータ等の演算装置74と、を含む。
【0024】
演算装置74は、サンプリング周波数48kHz、量子化ビット数16bitで雑音混入音声y(t)をデジタル音声信号に変換するAD変換部75、雑音抑圧音声x'(t)をアナログ音声信号として出力するDA変換部76、CPU(Central Processing Unit)77、CPU77の制御指令に基づいて周波数解析等の処理を実行するDSP(Digital Signal Processor)78、メモリ79、ハードディスク(HDD)80、および周辺機器I/F81がバス82を介して相互に結合された構成を有する。表示パネル71、キーボード72、およびマウス73等のインターフェイスは周辺機器I/F81に接続される。
【0025】
AD変換部75およびDA変換部76とDSP78とはそれぞれ専用のバス83、84で接続されている。なお、雑音混入音声y(t)が予めAD変換されている場合は、雑音混入音声y(t)を直接DSP78に入力すればよい。また、雑音抑圧音声x'(t)をDA変換せずデジタル音声信号のままDSP78から出力する構成としてもよい。
【0026】
なお、音声波形切り出し手段1、周波数解析手段2、非音声区間検出手段3、雑音スペクトル推定手段4、雑音抑圧スペクトル算出手段5、および雑音抑圧音声出力手段6は、メモリ79にプログラムをインストールすることにより、演算装置74内にソフトウエア的に構成される。
【0027】
図4は、CPU77の制御指令に基づいてDSP78が実行する雑音抑圧プログラムのフローチャートである。図4(a)に示すように、DSP78は、音声波形切り出し手段1に対応する音声波形切り出し処理(ステップS100)と、周波数解析手段2に対応する高速フーリエ変換(FFT)処理(ステップS101)と、雑音抑圧スペクトル算出手段5に対応する雑音抑圧スペクトル算出処理(ステップS102)と、雑音抑圧音声出力手段6に対応する逆高速フーリエ変換(IFFT)処理(ステップS103)および音声波形重ね合わせ処理(ステップS104)と、を実行するようになっている。
【0028】
さらに、図4(b)に示すように、DSP78は、非音声区間検出手段3に対応する非音声区間検出処理(ステップS105)と、雑音スペクトル推定手段4に対応する雑音スペクトル推定処理(ステップS106)と、を実行するようになっている。
【0029】
図5は、雑音混入音声y(t)と分析フレームFmとの対応関係を示す模式的なグラフである。ここで、雑音混入音声y(t)はサンプリング周波数48kHz、量子化ビット数16bitでAD変換されているものとする。
【0030】
DSP78は、雑音抑圧プログラムの音声波形切り出し処理(ステップS100)において、例えば、1つの分析フレームFmの窓幅Nが1024サンプル(約20ms)、シフト幅N/2が半分の512サンプル(約10ms)となるように、雑音混入音声y(t)を分割する。なお、このように分割された雑音混入音声をym(n)(1≦n≦N)と記す。ここで、nはm番目の分析フレームFmに含まれるサンプル番号を示すインデックスである。
【0031】
次に、雑音抑圧プログラムのFFT処理(ステップS101)の詳細について説明する。DSP78は、m番目の分析フレームFmに対応する雑音混入音声ym(n)(1≦n≦N)を読み込み、音声の声道特性の高域における減衰を補正するため、雑音混入音声ym(n)(1≦n≦N)に[数7]で表わされるフィルタ(H(z))でプリエンファシスを施す。
【数7】
【0032】
次に、DSP78は、プリエンファシスが施された雑音混入音声ym(n)(1≦n≦N)に適切な窓関数(例えば[数8]で表わされるハミング窓whamm(n))を乗じる。
【数8】
【0033】
そして、DSP78は、窓関数が乗じられた雑音混入音声ym(n)(1≦n≦N)に離散フーリエ変換(FFT)を施し、[数9]に示すような雑音混入音声ym(n)(1≦n≦N)の雑音混入スペクトルYm(ω)を出力する。ここで、|Ym(ω)|は振幅スペクトル、φm(ω)は位相スペクトルである。
【数9】
【0034】
次に、雑音抑圧プログラムの非音声区間検出処理(ステップS105)の詳細について説明する。DSP78は、非音声区間検出処理(ステップS105)において、公知の方法で雑音混入音声y(t)から非音声区間を検出するようになっている。例えば、入力される雑音混入音声y(t)に対して、予め音声区間とする音量レベルの閾値を設定し、音量レベルがその閾値以上である雑音混入音声ym(n)(1≦n≦N)を音声区間とし、閾値未満であるym(n)(1≦n≦N)を非音声区間とする方法がある。
【0035】
即ち、DSP78は、各分析フレームFmに対応した雑音混入音声ym(n)(1≦n≦N)が非音声区間に属するものであるか否かを判定し、非音声区間に属する雑音混入音声ym(n)(1≦n≦N)、または、非音声区間に属する雑音混入音声ym(n)(1≦n≦N)の分析フレームFmのインデックスmを出力する。
【0036】
なお、この非音声区間検出処理(ステップS105)は、FFT処理(ステップS101)で求められた雑音混入スペクトルYm(ω)を用いて非音声区間を検出するものであってもよい。
【0037】
次に、雑音抑圧プログラムの雑音スペクトル推定処理(ステップS106)の詳細について説明する。DSP78は、FFT処理(ステップS101)で求められた雑音混入スペクトルYm(ω)の振幅スペクトル|Ym(ω)|を分析フレームFmごとに順次読み込む。
【0038】
次に、DSP78は、雑音抑圧プログラムの非音声区間検出処理(ステップS105)の処理結果に基づいて、非音声区間の振幅スペクトル|Ym(ω)|のみに対して、[数10]より推定雑音スペクトルD'(ω)の振幅スペクトル|D'(ω)|を算出する。ここでは、M0個の非音声区間の振幅スペクトル|Ym(ω)|に対して平均化処理を行っている。
【数10】
【0039】
図6(a)に音声区間の雑音混入スペクトルYm(ω)の振幅スペクトル|Ym(ω)|、図6(b)に推定雑音スペクトルD'(ω)の振幅スペクトル|D'(ω)|のスペクトル例を示す。
【0040】
なお、雑音スペクトル推定処理(ステップS106)においては、非音声区間検出処理(ステップS105)において新たな非音声区間の分析フレームFmを1つ検出するたびに、[数10]の平均化処理において用いるM0個の非音声区間の|Ym(ω)|を1つずつ新しいものに入れ替えてもよい。あるいは、音声区間検出方法を利用せず、手動で設定した区間で適宜[数10]のような計算を行うことにより|D'(ω)|を推定してもよい。
【0041】
次に、雑音抑圧プログラムの雑音抑圧スペクトル算出処理(ステップS102)の詳細について図7のフローチャートに沿って説明する。なお、ステップS110の処理は事後SN比算出手段51、ステップS111の処理は減算倍率算出手段52、ステップS112の処理は第2の係数設定手段53、ステップS113の処理は減算手段54、乗算手段55、および比較手段56に相当している。
【0042】
まず、DSP78は、推定雑音スペクトルD'(ω)の振幅スペクトル|D'(ω)|に対する雑音混入スペクトルYm(ω)の振幅スペクトル|Ym(ω)|の比である、[数11]で表わされる事後SN比ρ(ω)[dB]を算出する(ステップS110)。図8に算出した事後SN比ρ(ω)の例を示す。
【数11】
【0043】
次に、DSP78は、ステップS110で算出した事後SN比ρ(ω)を用いて、例えば、[数12]により減算倍率α(ω)を算出する(ステップS111)。
【数12】
【0044】
ここで、maxρ(ω)およびminρ(ω)は、それぞれ1つの分析フレームFmに対応するρ(ω)の最大値と最小値である。R(ω)は、ρ(ω)を正規化したものであり、−1≦R(ω)≦0である。なお、減算倍率α(ω)は、[数12]のように離散角周波数ωに依存しない予め定められた固定値であってもよい。あるいは、減算倍率α(ω)は、離散角周波数ωに依存する周波数域、および、離散角周波数ωに依存しない周波数域の関数であってもよい。上記の固定値は、例えば、表示パネル71、キーボード72、およびマウス73等のインターフェイスを介してユーザにより手動で入力されてもよい。
【0045】
次に、DSP78は、例えば[数13]に示すように、減算倍率α(ω)の対数を独立変数とする一次関数の従属変数となる下限パラメータβ(ω)を算出する(ステップS112)。
【数13】
【0046】
[数13]において、a、bは一次関数の傾きと切片を決める定数とし、例えばa=−1、b=−3dBとする。傾きa、切片bは以下に示す客観音質評価実験の結果に基づいて定めた値である。
【0047】
図9に、クリーンな音声と雑音をSNR=0dBでミックスした雑音混入音声を対象に、減算倍率α=3dB(周波数に依存しない固定値)、一次関数の傾きa=−1の時に、切片bを0,−3,−6dBに変化させた場合の雑音抑圧音声に対して、クリーンな音声と雑音抑圧音声の間のケプストラム距離、および、セグメンタルSNRを求めたものを示す。ケプストラム距離の値が小さいほど雑音混入音声がクリーンな音声に近く、セグメンタルSNRの値が大きいほど雑音が抑圧されていることを意味する。
【0048】
図10に、クリーンな音声と雑音をSNR=0dBでミックスした雑音混入音声を対象に、減算倍率α=3dB(周波数に依存しない固定値)、一次関数の切片b=−3の時に、傾きa=−0.5,−1,−2に変化させた場合の雑音抑圧音声に対して、クリーンな音声と雑音抑圧音声の間のケプストラム距離、および、セグメンタルSNRを求めたものを示す。
【0049】
図9、図10に示したいずれの場合においてもケプストラム距離とセグメンタルSNRはトレードオフの関係にあることがわかる。従って、これらの実験結果に基づいて、a=−1およびb=−3を最適な値とした。図11に、[数13]においてa=−1、b=−3dBとしたときの減算倍率α(ω)および下限パラメータβ(ω)の例を示す。
【0050】
次に、DSP78は、[数14]に従って雑音抑圧スペクトルX'm(ω)を算出する(ステップS113)。なお、位相スペクトルは音声の知覚への影響が少ないので、雑音抑圧スペクトルX'm(ω)の位相スペクトルとして雑音混入スペクトルYm(ω)の位相スペクトルφm(ω)を利用している。
【数14】
【0051】
図12(a)に推定雑音スペクトルD'(ω)の振幅スペクトル|D'(ω)|に減算倍率α(ω)を乗じた周波数スペクトル、図12(b)に雑音混入スペクトルYm(ω)の振幅スペクトル|Ym(ω)|に下限パラメータβ(ω)を乗じた周波数スペクトル、図12(c)に[数14]より求められる雑音抑圧スペクトルX'm(ω)の振幅スペクトル|X'm(ω)|の例を示す。
【0052】
なお、DSP78は、ステップS112において、上記の[数13]の代わりに下記の[数15]に示すように、減算倍率α(ω)の逆数に比例するような下限パラメータβ(ω)を算出してもよい。なお、δは調整用の定数である。
【数15】
【0053】
次に、雑音抑圧プログラムのIFFT処理(ステップS103)の詳細について説明する。DSP78は、分析フレームFmに対応する雑音抑圧スペクトルX'm(ω)を読み込み、読み込んだ雑音抑圧スペクトルX'm(ω)に対して逆高速フーリエ変換(IFFT)を施すことにより、音声波形x'm(n)(1≦n≦N)を算出する。
【0054】
次に、DSP78は、音声波形x'm(n)(1≦n≦N)をハミング窓whamm(n)で除して、プリエンファシスの逆フィルタ(1/H(z))でディエンファシスを施す。
【0055】
次に、雑音抑圧プログラムの音声波形重ね合わせ処理(ステップS104)の詳細について説明する。DSP78は、IFFT処理(ステップS103)においてディエンファシスを施した音声波形x'm(n)(1≦n≦N)に適切な窓関数(例えば[数16]で表わされるハニング窓whann(n))を乗じる。
【数16】
【0056】
そして、DSP78は、適切な窓関数を乗じた音声波形x'm(n)(1≦n≦N)と、一つ前の分析フレームFm-1に対応する音声波形x'm-1(n)(1≦n≦N)と、をシフト幅(N/2)分ずらして重ね合わせることにより、雑音抑圧音声x'(m−1,m)を得る。ここで、雑音抑圧音声x'(m−1,m)とは、最終的に得られる雑音抑圧音声x'(t)のうち、分析フレームFm-1と分析フレームFmの重なり部分に相当する区間のデータを示している。
【0057】
即ち、DSP78は、全ての分析フレームに対して上記の音声波形重ね合わせ処理を行うことにより、雑音抑圧音声x'(t)を出力することができる。図13(a)に雑音混入音声y(t)、図13(b)にその雑音抑圧音声x'(t)の例を示す。
【産業上の利用可能性】
【0058】
以上説明したように、本発明に係る雑音抑圧装置およびプログラムは、スペクトル包絡を計算することなく減算倍率を算出し、さらに下限パラメータを減算倍率に基づいて算出することにより、計算量を抑えて高品質な雑音抑圧音声を得ることができるという効果を有し、収録される音声に対してリアルタイムで雑音を抑制することが可能な雑音抑圧装置およびプログラムとして有用である。
【符号の説明】
【0059】
1 音声波形切り出し手段
2 周波数解析手段
3 非音声区間検出手段
4 雑音スペクトル推定手段
5 雑音抑圧スペクトル算出手段
6 雑音抑圧音声出力手段
50 第1の係数設定手段
51 事後SN比算出手段
52 減算倍率算出手段
53 第2の係数設定手段
54 減算手段
55 乗算手段
56 比較手段
【技術分野】
【0001】
本発明は、雑音抑圧装置およびプログラムに関し、特に、音声に付加された雑音成分を抑圧する雑音抑圧装置およびプログラムに関する。
【背景技術】
【0002】
生中継を含むテレビやラジオなど放送用の音声の収録は、必ずしも音声素材の収録に適した環境で行われるとは限らず、様々な雑音も同時に収録されることとなる。そのような環境下においても放送に耐えうる明瞭な音声を得るには、混入した雑音を高品質に抑圧する技術が必要である。
【0003】
従来から、音声に付加された雑音成分を抑圧する方法としては様々なものが提案されており、例えばスペクトルサブトラクションがよく知られている。以下に、スペクトルサブトラクションの原理を説明する。
【0004】
tを時刻として、雑音混入音声y(t)が、入力音声x(t)と加法性雑音d(t)との和で[数1]のように構成されるとする。ここで、雑音混入音声y(t)は予め適切なサンプリング周波数でサンプリングされているとする。
【数1】
【0005】
その離散フーリエ変換による周波数表現は、ωを離散角周波数として、[数2]のように表わされる。
【数2】
【0006】
雑音混入音声y(t)の周波数スペクトルY(ω)を極座標形式で表現すると、[数3]のように表わされる。以降では、|Y(ω)|、φy(ω)をそれぞれ雑音混入音声y(t)の振幅スペクトル、位相スペクトルと呼ぶ。
【数3】
【0007】
雑音d(t)の周波数スペクトルD(ω)も同様に振幅スペクトル、位相スペクトルを用いて、[数4]のように表わされる。
【数4】
【0008】
実際には雑音の振幅スペクトル|D(ω)|は未知だが、非音声区間から推定した値|Dest(ω)|で置換できる。また、位相成分は音声の知覚への影響が少ないので、雑音の位相スペクトルφd(ω)を雑音混入音声の位相スペクトルφy(ω)で置換できる。
【0009】
すると、雑音抑圧音声の周波数スペクトルX'(ω)は、例えば[数5]のように表わされる(例えば、特許文献1参照)。雑音抑圧音声x'(t)はX'(ω)を逆フーリエ変換することで求めることができる。ここで、α(ω)は雑音を減算する倍率(over-estimation factor)(以下、減算倍率と記す)であり、β(ω)はスペクトルの下限を決めるパラメータ(flooring factor)(以下、下限パラメータと記す)である。なお、Max{A,B}はAとBのうち大きい方を示す関数である。このような関数を用いるのは、振幅スペクトルが負の値を取り得ないためである。
【数5】
【先行技術文献】
【特許文献】
【0010】
【特許文献1】特許第3693022号明細書
【発明の概要】
【発明が解決しようとする課題】
【0011】
特許文献1に開示された従来の方法では、雑音のスペクトル包絡を求め、これに依存した減算倍率α(ω)、下限パラメータβ(ω)を算出している。しかしながら、この方法では、スペクトル包絡を算出するために、雑音の周波数スペクトルD(ω)に対してさらにフーリエ変換および逆フーリエ変換を行う必要があり、計算量が非常に多くなるという問題がある。
【0012】
本発明は、このような従来の課題を解決するためになされたものであって、計算量を抑えて高品質な雑音抑圧音声を得ることができる雑音抑圧装置およびプログラムを提供することを目的とする。
【課題を解決するための手段】
【0013】
本発明の雑音抑圧装置は、雑音混入音声を入力として、スペクトルサブトラクションにより雑音抑圧音声を出力として得る雑音抑圧装置であって、前記雑音混入音声の周波数スペクトルを求める周波数解析手段と、前記雑音混入音声の非音声区間の周波数スペクトルから雑音の周波数スペクトルを推定する雑音スペクトル推定手段と、前記雑音混入音声の周波数スペクトルと前記雑音の周波数スペクトルの離散角周波数ごとの大小関係に応じて、雑音抑圧スペクトルを算出する雑音抑圧スペクトル算出手段と、を備え、前記雑音抑圧スペクトル算出手段が、離散角周波数の関数である第1の係数を設定する第1の係数設定手段と、前記第1の係数に依存する第2の係数を設定する第2の係数設定手段と、前記雑音混入音声の周波数スペクトルから、前記雑音の周波数スペクトルに前記第1の係数を乗じた周波数スペクトルを減算する減算手段と、前記雑音混入音声の周波数スペクトルに前記第2の係数を乗じた周波数スペクトルを算出する乗算手段と、前記減算手段が出力する周波数スペクトルと前記乗算手段が出力する周波数スペクトルを比較して、離散角周波数ごとに大きい方を出力する比較手段と、を備える構成を有している。
【0014】
この構成により、スペクトル包絡を計算することなく減算倍率(第1の係数)を算出し、さらに下限パラメータ(第2の係数)を減算倍率に基づいて算出するため、計算量を抑えて高品質な雑音抑圧音声を得ることができる。
【0015】
また、本発明の雑音抑圧装置は、前記第2の係数設定手段が、前記第2の係数が前記第1の係数に対して単調減少するように前記第2の係数を設定する構成を有していてもよい。
また、本発明の雑音抑圧装置は、前記第2の係数β(ω)が、以下の式(1)に示される前記第1の係数α(ω)の関数であってもよい。
【数6】
【0016】
また、本発明の雑音抑圧装置は、前記第1の係数が、前記雑音の周波数スペクトルに対する前記雑音混入音声の周波数スペクトルの比に依存するものであってもよい。
【発明の効果】
【0017】
本発明は、スペクトル包絡を計算することなく減算倍率を算出し、さらに下限パラメータを減算倍率に基づいて算出することにより、計算量を抑えて高品質な雑音抑圧音声を得ることができる雑音抑圧装置およびプログラムを提供するものである。
【図面の簡単な説明】
【0018】
【図1】本発明に係る雑音抑圧装置の構成を示すブロック図
【図2】本発明に係る雑音抑圧装置の雑音抑圧スペクトル算出手段の構成を示すブロック図
【図3】本発明に係る雑音抑圧装置のハードウエア構成を示すブロック図
【図4】本発明に係る雑音抑圧装置のDSPが実行する雑音抑圧プログラムのフローチャート
【図5】雑音混入音声と分析フレームとの対応関係を示す模式的なグラフ
【図6】音声区間の雑音混入スペクトルの振幅スペクトル、および、推定雑音スペクトルの振幅スペクトルを示すグラフ
【図7】雑音抑圧プログラムの雑音抑圧スペクトル算出処理のフローチャート
【図8】事後SN比の算出結果を示すグラフ
【図9】傾きaが−1のときの切片bの決定方法を説明するためのグラフ
【図10】切片bが−3のときの傾きaの決定方法を説明するためのグラフ
【図11】減算倍率および下限パラメータの算出結果を示すグラフ
【図12】推定雑音スペクトルの振幅スペクトルに減算倍率を乗じたスペクトル、雑音混入スペクトルの振幅スペクトルに下限パラメータを乗じたスペクトル、および、雑音抑圧スペクトルの振幅スペクトルの算出結果を示すグラフ
【図13】雑音混入音声、および、雑音抑圧音声の算出結果を示すグラフ
【発明を実施するための形態】
【0019】
以下、本発明に係る雑音抑圧装置およびプログラムの実施形態を図面を用いて説明する。
【0020】
図1、2は本実施形態の雑音抑圧装置の構成を示すブロック図である。即ち、図1に示すように、本実施形態の雑音抑圧装置は、入力された雑音混入音声y(t)を複数の分析フレームFm(mは自然数)に対応させて切り出す音声波形切り出し手段1と、音声波形切り出し手段1によって切り出された雑音混入音声ym(t)の周波数スペクトルYm(ω)(以下、雑音混入スペクトルと記す)を求める周波数解析手段2と、雑音混入音声y(t)から非音声区間を検出するとともに、各分析フレームFmに対応した雑音混入音声ym(t)が非音声区間に属するものであるか否かを判定する非音声区間検出手段3と、非音声区間に属する雑音混入音声ym(t)の雑音混入スペクトルYm(ω)から雑音の周波数スペクトルD'(ω)(以下、推定雑音スペクトルと記す)を推定する雑音スペクトル推定手段4と、雑音混入スペクトルYm(ω)と推定雑音スペクトルD'(ω)の離散角周波数ωごとの大小関係に応じて、雑音抑圧スペクトルX'(ω)を算出する雑音抑圧スペクトル算出手段5と、を備える。
【0021】
図2に示すように、雑音抑圧スペクトル算出手段5は、離散角周波数ωの関数である減算倍率(第1の係数)α(ω)を設定する第1の係数設定手段50と、減算倍率α(ω)に依存する下限パラメータ(第2の係数)β(ω)を設定する第2の係数設定手段53と、雑音混入スペクトルYm(ω)から、推定雑音スペクトルD'(ω)に減算倍率α(ω)を乗じた周波数スペクトルを減算する減算手段54と、雑音混入スペクトルYm(ω)に下限パラメータβ(ω)を乗じた周波数スペクトルを算出する乗算手段55と、減算手段54が出力する周波数スペクトルと乗算手段55が出力する周波数スペクトルを比較して、離散角周波数ωごとに大きい方を出力する比較手段56と、を備える。第1の係数設定手段50は、事後SN比算出手段51と、減算倍率α(ω)を算出する減算倍率算出手段52と、を備える。
【0022】
本実施形態の雑音抑圧装置は、図1に示すように、雑音抑圧スペクトルX'(ω)に基づいて雑音抑圧音声x'(t)を出力する雑音抑圧音声出力手段6をさらに備える。
【0023】
図3は、本実施形態の雑音抑圧装置のハードウエア構成を示すブロック図である。図3に示すように、本実施形態の雑音抑圧装置は、表示パネル71、キーボード72、およびマウス73等のインターフェイスと、パーソナルコンピュータ等の演算装置74と、を含む。
【0024】
演算装置74は、サンプリング周波数48kHz、量子化ビット数16bitで雑音混入音声y(t)をデジタル音声信号に変換するAD変換部75、雑音抑圧音声x'(t)をアナログ音声信号として出力するDA変換部76、CPU(Central Processing Unit)77、CPU77の制御指令に基づいて周波数解析等の処理を実行するDSP(Digital Signal Processor)78、メモリ79、ハードディスク(HDD)80、および周辺機器I/F81がバス82を介して相互に結合された構成を有する。表示パネル71、キーボード72、およびマウス73等のインターフェイスは周辺機器I/F81に接続される。
【0025】
AD変換部75およびDA変換部76とDSP78とはそれぞれ専用のバス83、84で接続されている。なお、雑音混入音声y(t)が予めAD変換されている場合は、雑音混入音声y(t)を直接DSP78に入力すればよい。また、雑音抑圧音声x'(t)をDA変換せずデジタル音声信号のままDSP78から出力する構成としてもよい。
【0026】
なお、音声波形切り出し手段1、周波数解析手段2、非音声区間検出手段3、雑音スペクトル推定手段4、雑音抑圧スペクトル算出手段5、および雑音抑圧音声出力手段6は、メモリ79にプログラムをインストールすることにより、演算装置74内にソフトウエア的に構成される。
【0027】
図4は、CPU77の制御指令に基づいてDSP78が実行する雑音抑圧プログラムのフローチャートである。図4(a)に示すように、DSP78は、音声波形切り出し手段1に対応する音声波形切り出し処理(ステップS100)と、周波数解析手段2に対応する高速フーリエ変換(FFT)処理(ステップS101)と、雑音抑圧スペクトル算出手段5に対応する雑音抑圧スペクトル算出処理(ステップS102)と、雑音抑圧音声出力手段6に対応する逆高速フーリエ変換(IFFT)処理(ステップS103)および音声波形重ね合わせ処理(ステップS104)と、を実行するようになっている。
【0028】
さらに、図4(b)に示すように、DSP78は、非音声区間検出手段3に対応する非音声区間検出処理(ステップS105)と、雑音スペクトル推定手段4に対応する雑音スペクトル推定処理(ステップS106)と、を実行するようになっている。
【0029】
図5は、雑音混入音声y(t)と分析フレームFmとの対応関係を示す模式的なグラフである。ここで、雑音混入音声y(t)はサンプリング周波数48kHz、量子化ビット数16bitでAD変換されているものとする。
【0030】
DSP78は、雑音抑圧プログラムの音声波形切り出し処理(ステップS100)において、例えば、1つの分析フレームFmの窓幅Nが1024サンプル(約20ms)、シフト幅N/2が半分の512サンプル(約10ms)となるように、雑音混入音声y(t)を分割する。なお、このように分割された雑音混入音声をym(n)(1≦n≦N)と記す。ここで、nはm番目の分析フレームFmに含まれるサンプル番号を示すインデックスである。
【0031】
次に、雑音抑圧プログラムのFFT処理(ステップS101)の詳細について説明する。DSP78は、m番目の分析フレームFmに対応する雑音混入音声ym(n)(1≦n≦N)を読み込み、音声の声道特性の高域における減衰を補正するため、雑音混入音声ym(n)(1≦n≦N)に[数7]で表わされるフィルタ(H(z))でプリエンファシスを施す。
【数7】
【0032】
次に、DSP78は、プリエンファシスが施された雑音混入音声ym(n)(1≦n≦N)に適切な窓関数(例えば[数8]で表わされるハミング窓whamm(n))を乗じる。
【数8】
【0033】
そして、DSP78は、窓関数が乗じられた雑音混入音声ym(n)(1≦n≦N)に離散フーリエ変換(FFT)を施し、[数9]に示すような雑音混入音声ym(n)(1≦n≦N)の雑音混入スペクトルYm(ω)を出力する。ここで、|Ym(ω)|は振幅スペクトル、φm(ω)は位相スペクトルである。
【数9】
【0034】
次に、雑音抑圧プログラムの非音声区間検出処理(ステップS105)の詳細について説明する。DSP78は、非音声区間検出処理(ステップS105)において、公知の方法で雑音混入音声y(t)から非音声区間を検出するようになっている。例えば、入力される雑音混入音声y(t)に対して、予め音声区間とする音量レベルの閾値を設定し、音量レベルがその閾値以上である雑音混入音声ym(n)(1≦n≦N)を音声区間とし、閾値未満であるym(n)(1≦n≦N)を非音声区間とする方法がある。
【0035】
即ち、DSP78は、各分析フレームFmに対応した雑音混入音声ym(n)(1≦n≦N)が非音声区間に属するものであるか否かを判定し、非音声区間に属する雑音混入音声ym(n)(1≦n≦N)、または、非音声区間に属する雑音混入音声ym(n)(1≦n≦N)の分析フレームFmのインデックスmを出力する。
【0036】
なお、この非音声区間検出処理(ステップS105)は、FFT処理(ステップS101)で求められた雑音混入スペクトルYm(ω)を用いて非音声区間を検出するものであってもよい。
【0037】
次に、雑音抑圧プログラムの雑音スペクトル推定処理(ステップS106)の詳細について説明する。DSP78は、FFT処理(ステップS101)で求められた雑音混入スペクトルYm(ω)の振幅スペクトル|Ym(ω)|を分析フレームFmごとに順次読み込む。
【0038】
次に、DSP78は、雑音抑圧プログラムの非音声区間検出処理(ステップS105)の処理結果に基づいて、非音声区間の振幅スペクトル|Ym(ω)|のみに対して、[数10]より推定雑音スペクトルD'(ω)の振幅スペクトル|D'(ω)|を算出する。ここでは、M0個の非音声区間の振幅スペクトル|Ym(ω)|に対して平均化処理を行っている。
【数10】
【0039】
図6(a)に音声区間の雑音混入スペクトルYm(ω)の振幅スペクトル|Ym(ω)|、図6(b)に推定雑音スペクトルD'(ω)の振幅スペクトル|D'(ω)|のスペクトル例を示す。
【0040】
なお、雑音スペクトル推定処理(ステップS106)においては、非音声区間検出処理(ステップS105)において新たな非音声区間の分析フレームFmを1つ検出するたびに、[数10]の平均化処理において用いるM0個の非音声区間の|Ym(ω)|を1つずつ新しいものに入れ替えてもよい。あるいは、音声区間検出方法を利用せず、手動で設定した区間で適宜[数10]のような計算を行うことにより|D'(ω)|を推定してもよい。
【0041】
次に、雑音抑圧プログラムの雑音抑圧スペクトル算出処理(ステップS102)の詳細について図7のフローチャートに沿って説明する。なお、ステップS110の処理は事後SN比算出手段51、ステップS111の処理は減算倍率算出手段52、ステップS112の処理は第2の係数設定手段53、ステップS113の処理は減算手段54、乗算手段55、および比較手段56に相当している。
【0042】
まず、DSP78は、推定雑音スペクトルD'(ω)の振幅スペクトル|D'(ω)|に対する雑音混入スペクトルYm(ω)の振幅スペクトル|Ym(ω)|の比である、[数11]で表わされる事後SN比ρ(ω)[dB]を算出する(ステップS110)。図8に算出した事後SN比ρ(ω)の例を示す。
【数11】
【0043】
次に、DSP78は、ステップS110で算出した事後SN比ρ(ω)を用いて、例えば、[数12]により減算倍率α(ω)を算出する(ステップS111)。
【数12】
【0044】
ここで、maxρ(ω)およびminρ(ω)は、それぞれ1つの分析フレームFmに対応するρ(ω)の最大値と最小値である。R(ω)は、ρ(ω)を正規化したものであり、−1≦R(ω)≦0である。なお、減算倍率α(ω)は、[数12]のように離散角周波数ωに依存しない予め定められた固定値であってもよい。あるいは、減算倍率α(ω)は、離散角周波数ωに依存する周波数域、および、離散角周波数ωに依存しない周波数域の関数であってもよい。上記の固定値は、例えば、表示パネル71、キーボード72、およびマウス73等のインターフェイスを介してユーザにより手動で入力されてもよい。
【0045】
次に、DSP78は、例えば[数13]に示すように、減算倍率α(ω)の対数を独立変数とする一次関数の従属変数となる下限パラメータβ(ω)を算出する(ステップS112)。
【数13】
【0046】
[数13]において、a、bは一次関数の傾きと切片を決める定数とし、例えばa=−1、b=−3dBとする。傾きa、切片bは以下に示す客観音質評価実験の結果に基づいて定めた値である。
【0047】
図9に、クリーンな音声と雑音をSNR=0dBでミックスした雑音混入音声を対象に、減算倍率α=3dB(周波数に依存しない固定値)、一次関数の傾きa=−1の時に、切片bを0,−3,−6dBに変化させた場合の雑音抑圧音声に対して、クリーンな音声と雑音抑圧音声の間のケプストラム距離、および、セグメンタルSNRを求めたものを示す。ケプストラム距離の値が小さいほど雑音混入音声がクリーンな音声に近く、セグメンタルSNRの値が大きいほど雑音が抑圧されていることを意味する。
【0048】
図10に、クリーンな音声と雑音をSNR=0dBでミックスした雑音混入音声を対象に、減算倍率α=3dB(周波数に依存しない固定値)、一次関数の切片b=−3の時に、傾きa=−0.5,−1,−2に変化させた場合の雑音抑圧音声に対して、クリーンな音声と雑音抑圧音声の間のケプストラム距離、および、セグメンタルSNRを求めたものを示す。
【0049】
図9、図10に示したいずれの場合においてもケプストラム距離とセグメンタルSNRはトレードオフの関係にあることがわかる。従って、これらの実験結果に基づいて、a=−1およびb=−3を最適な値とした。図11に、[数13]においてa=−1、b=−3dBとしたときの減算倍率α(ω)および下限パラメータβ(ω)の例を示す。
【0050】
次に、DSP78は、[数14]に従って雑音抑圧スペクトルX'm(ω)を算出する(ステップS113)。なお、位相スペクトルは音声の知覚への影響が少ないので、雑音抑圧スペクトルX'm(ω)の位相スペクトルとして雑音混入スペクトルYm(ω)の位相スペクトルφm(ω)を利用している。
【数14】
【0051】
図12(a)に推定雑音スペクトルD'(ω)の振幅スペクトル|D'(ω)|に減算倍率α(ω)を乗じた周波数スペクトル、図12(b)に雑音混入スペクトルYm(ω)の振幅スペクトル|Ym(ω)|に下限パラメータβ(ω)を乗じた周波数スペクトル、図12(c)に[数14]より求められる雑音抑圧スペクトルX'm(ω)の振幅スペクトル|X'm(ω)|の例を示す。
【0052】
なお、DSP78は、ステップS112において、上記の[数13]の代わりに下記の[数15]に示すように、減算倍率α(ω)の逆数に比例するような下限パラメータβ(ω)を算出してもよい。なお、δは調整用の定数である。
【数15】
【0053】
次に、雑音抑圧プログラムのIFFT処理(ステップS103)の詳細について説明する。DSP78は、分析フレームFmに対応する雑音抑圧スペクトルX'm(ω)を読み込み、読み込んだ雑音抑圧スペクトルX'm(ω)に対して逆高速フーリエ変換(IFFT)を施すことにより、音声波形x'm(n)(1≦n≦N)を算出する。
【0054】
次に、DSP78は、音声波形x'm(n)(1≦n≦N)をハミング窓whamm(n)で除して、プリエンファシスの逆フィルタ(1/H(z))でディエンファシスを施す。
【0055】
次に、雑音抑圧プログラムの音声波形重ね合わせ処理(ステップS104)の詳細について説明する。DSP78は、IFFT処理(ステップS103)においてディエンファシスを施した音声波形x'm(n)(1≦n≦N)に適切な窓関数(例えば[数16]で表わされるハニング窓whann(n))を乗じる。
【数16】
【0056】
そして、DSP78は、適切な窓関数を乗じた音声波形x'm(n)(1≦n≦N)と、一つ前の分析フレームFm-1に対応する音声波形x'm-1(n)(1≦n≦N)と、をシフト幅(N/2)分ずらして重ね合わせることにより、雑音抑圧音声x'(m−1,m)を得る。ここで、雑音抑圧音声x'(m−1,m)とは、最終的に得られる雑音抑圧音声x'(t)のうち、分析フレームFm-1と分析フレームFmの重なり部分に相当する区間のデータを示している。
【0057】
即ち、DSP78は、全ての分析フレームに対して上記の音声波形重ね合わせ処理を行うことにより、雑音抑圧音声x'(t)を出力することができる。図13(a)に雑音混入音声y(t)、図13(b)にその雑音抑圧音声x'(t)の例を示す。
【産業上の利用可能性】
【0058】
以上説明したように、本発明に係る雑音抑圧装置およびプログラムは、スペクトル包絡を計算することなく減算倍率を算出し、さらに下限パラメータを減算倍率に基づいて算出することにより、計算量を抑えて高品質な雑音抑圧音声を得ることができるという効果を有し、収録される音声に対してリアルタイムで雑音を抑制することが可能な雑音抑圧装置およびプログラムとして有用である。
【符号の説明】
【0059】
1 音声波形切り出し手段
2 周波数解析手段
3 非音声区間検出手段
4 雑音スペクトル推定手段
5 雑音抑圧スペクトル算出手段
6 雑音抑圧音声出力手段
50 第1の係数設定手段
51 事後SN比算出手段
52 減算倍率算出手段
53 第2の係数設定手段
54 減算手段
55 乗算手段
56 比較手段
【特許請求の範囲】
【請求項1】
雑音混入音声を入力として、スペクトルサブトラクションにより雑音抑圧音声を出力として得る雑音抑圧装置であって、
前記雑音混入音声の周波数スペクトルを求める周波数解析手段と、
前記雑音混入音声の非音声区間の周波数スペクトルから雑音の周波数スペクトルを推定する雑音スペクトル推定手段と、
前記雑音混入音声の周波数スペクトルと前記雑音の周波数スペクトルの離散角周波数ごとの大小関係に応じて、雑音抑圧スペクトルを算出する雑音抑圧スペクトル算出手段と、を備え、
前記雑音抑圧スペクトル算出手段が、
離散角周波数の関数である第1の係数を設定する第1の係数設定手段と、
前記第1の係数に依存する第2の係数を設定する第2の係数設定手段と、
前記雑音混入音声の周波数スペクトルから、前記雑音の周波数スペクトルに前記第1の係数を乗じた周波数スペクトルを減算する減算手段と、
前記雑音混入音声の周波数スペクトルに前記第2の係数を乗じた周波数スペクトルを算出する乗算手段と、
前記減算手段が出力する周波数スペクトルと前記乗算手段が出力する周波数スペクトルを比較して、離散角周波数ごとに大きい方を出力する比較手段と、を備えることを特徴とする雑音抑圧装置。
【請求項2】
前記第2の係数設定手段が、前記第2の係数が前記第1の係数に対して単調減少するように前記第2の係数を設定する請求項1に記載の雑音抑圧装置。
【請求項3】
前記第2の係数β(ω)が、以下の式(1)に示される前記第1の係数α(ω)の関数である請求項1または請求項2に記載の雑音抑圧装置。
【数17】
【請求項4】
前記第1の係数が、前記雑音の周波数スペクトルに対する前記雑音混入音声の周波数スペクトルの比に依存する第1の係数を設定するものである請求項1から請求項3のいずれか一項に記載の雑音抑圧装置。
【請求項5】
コンピュータを、雑音混入音声を入力として、スペクトルサブトラクションにより雑音抑圧音声を出力として得る雑音抑圧装置として機能させるプログラムであって、
コンピュータに、
前記雑音混入音声の周波数スペクトルを求める周波数解析手段と、
前記雑音混入音声の非音声区間の周波数スペクトルから雑音の周波数スペクトルを推定する雑音スペクトル推定手段と、
前記雑音混入音声の周波数スペクトルと前記雑音の周波数スペクトルの周波数ごとの大小関係に応じて、雑音抑圧スペクトルを算出する雑音抑圧スペクトル算出手段と、を実現させ、
前記雑音抑圧スペクトル算出手段が、
離散角周波数の関数である第1の係数を設定する第1の係数設定手段と、
前記第1の係数に依存する第2の係数を設定する第2の係数設定手段と、
前記雑音混入音声の周波数スペクトルから、前記雑音の周波数スペクトルに前記第1の係数を乗じた周波数スペクトルを減算する減算手段と、
前記雑音混入音声の周波数スペクトルに前記第2の係数を乗じた周波数スペクトルを算出する乗算手段と、
前記減算手段が出力する周波数スペクトルと前記乗算手段が出力する周波数スペクトルを比較して、離散角周波数ごとに大きい方を出力する比較手段と、を含むことを特徴とするプログラム。
【請求項1】
雑音混入音声を入力として、スペクトルサブトラクションにより雑音抑圧音声を出力として得る雑音抑圧装置であって、
前記雑音混入音声の周波数スペクトルを求める周波数解析手段と、
前記雑音混入音声の非音声区間の周波数スペクトルから雑音の周波数スペクトルを推定する雑音スペクトル推定手段と、
前記雑音混入音声の周波数スペクトルと前記雑音の周波数スペクトルの離散角周波数ごとの大小関係に応じて、雑音抑圧スペクトルを算出する雑音抑圧スペクトル算出手段と、を備え、
前記雑音抑圧スペクトル算出手段が、
離散角周波数の関数である第1の係数を設定する第1の係数設定手段と、
前記第1の係数に依存する第2の係数を設定する第2の係数設定手段と、
前記雑音混入音声の周波数スペクトルから、前記雑音の周波数スペクトルに前記第1の係数を乗じた周波数スペクトルを減算する減算手段と、
前記雑音混入音声の周波数スペクトルに前記第2の係数を乗じた周波数スペクトルを算出する乗算手段と、
前記減算手段が出力する周波数スペクトルと前記乗算手段が出力する周波数スペクトルを比較して、離散角周波数ごとに大きい方を出力する比較手段と、を備えることを特徴とする雑音抑圧装置。
【請求項2】
前記第2の係数設定手段が、前記第2の係数が前記第1の係数に対して単調減少するように前記第2の係数を設定する請求項1に記載の雑音抑圧装置。
【請求項3】
前記第2の係数β(ω)が、以下の式(1)に示される前記第1の係数α(ω)の関数である請求項1または請求項2に記載の雑音抑圧装置。
【数17】
【請求項4】
前記第1の係数が、前記雑音の周波数スペクトルに対する前記雑音混入音声の周波数スペクトルの比に依存する第1の係数を設定するものである請求項1から請求項3のいずれか一項に記載の雑音抑圧装置。
【請求項5】
コンピュータを、雑音混入音声を入力として、スペクトルサブトラクションにより雑音抑圧音声を出力として得る雑音抑圧装置として機能させるプログラムであって、
コンピュータに、
前記雑音混入音声の周波数スペクトルを求める周波数解析手段と、
前記雑音混入音声の非音声区間の周波数スペクトルから雑音の周波数スペクトルを推定する雑音スペクトル推定手段と、
前記雑音混入音声の周波数スペクトルと前記雑音の周波数スペクトルの周波数ごとの大小関係に応じて、雑音抑圧スペクトルを算出する雑音抑圧スペクトル算出手段と、を実現させ、
前記雑音抑圧スペクトル算出手段が、
離散角周波数の関数である第1の係数を設定する第1の係数設定手段と、
前記第1の係数に依存する第2の係数を設定する第2の係数設定手段と、
前記雑音混入音声の周波数スペクトルから、前記雑音の周波数スペクトルに前記第1の係数を乗じた周波数スペクトルを減算する減算手段と、
前記雑音混入音声の周波数スペクトルに前記第2の係数を乗じた周波数スペクトルを算出する乗算手段と、
前記減算手段が出力する周波数スペクトルと前記乗算手段が出力する周波数スペクトルを比較して、離散角周波数ごとに大きい方を出力する比較手段と、を含むことを特徴とするプログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【公開番号】特開2011−257643(P2011−257643A)
【公開日】平成23年12月22日(2011.12.22)
【国際特許分類】
【出願番号】特願2010−133098(P2010−133098)
【出願日】平成22年6月10日(2010.6.10)
【出願人】(000004352)日本放送協会 (2,206)
【出願人】(591053926)財団法人エヌエイチケイエンジニアリングサービス (169)
【公開日】平成23年12月22日(2011.12.22)
【国際特許分類】
【出願日】平成22年6月10日(2010.6.10)
【出願人】(000004352)日本放送協会 (2,206)
【出願人】(591053926)財団法人エヌエイチケイエンジニアリングサービス (169)
[ Back to top ]