雑音抑圧装置およびプログラム

【課題】計算量を抑えて高品質な雑音抑圧音声を得ることができる雑音抑圧装置およびプログラムを提供する。
【解決手段】雑音混入音声ｙ（ｔ）を入力として、スペクトルサブトラクションにより雑音抑圧音声ｘ'（ｔ）を出力として得る雑音抑圧装置であって、雑音混入スペクトルＹ_m（ω）から推定雑音スペクトルＤ'（ω）を減算する倍率α（ω）、および、減算されたスペクトルの下限を決めるパラメータβ（ω）を設定する際に、パラメータβ（ω）を倍率α（ω）に依存した値とすることを特徴とする。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、雑音抑圧装置およびプログラムに関し、特に、音声に付加された雑音成分を抑圧する雑音抑圧装置およびプログラムに関する。
【背景技術】
【０００２】
生中継を含むテレビやラジオなど放送用の音声の収録は、必ずしも音声素材の収録に適した環境で行われるとは限らず、様々な雑音も同時に収録されることとなる。そのような環境下においても放送に耐えうる明瞭な音声を得るには、混入した雑音を高品質に抑圧する技術が必要である。
【０００３】
従来から、音声に付加された雑音成分を抑圧する方法としては様々なものが提案されており、例えばスペクトルサブトラクションがよく知られている。以下に、スペクトルサブトラクションの原理を説明する。
【０００４】
ｔを時刻として、雑音混入音声ｙ（ｔ）が、入力音声ｘ（ｔ）と加法性雑音ｄ（ｔ）との和で［数１］のように構成されるとする。ここで、雑音混入音声ｙ（ｔ）は予め適切なサンプリング周波数でサンプリングされているとする。
【数１】

【０００５】
その離散フーリエ変換による周波数表現は、ωを離散角周波数として、［数２］のように表わされる。
【数２】

【０００６】
雑音混入音声ｙ（ｔ）の周波数スペクトルＹ（ω）を極座標形式で表現すると、［数３］のように表わされる。以降では、｜Ｙ（ω）｜、φ_y（ω）をそれぞれ雑音混入音声ｙ（ｔ）の振幅スペクトル、位相スペクトルと呼ぶ。
【数３】

【０００７】
雑音ｄ（ｔ）の周波数スペクトルＤ（ω）も同様に振幅スペクトル、位相スペクトルを用いて、［数４］のように表わされる。
【数４】

【０００８】
実際には雑音の振幅スペクトル｜Ｄ（ω）｜は未知だが、非音声区間から推定した値｜Ｄ_est（ω）｜で置換できる。また、位相成分は音声の知覚への影響が少ないので、雑音の位相スペクトルφ_d（ω）を雑音混入音声の位相スペクトルφ_y（ω）で置換できる。
【０００９】
すると、雑音抑圧音声の周波数スペクトルＸ'（ω）は、例えば［数５］のように表わされる（例えば、特許文献１参照）。雑音抑圧音声ｘ'（ｔ）はＸ'（ω）を逆フーリエ変換することで求めることができる。ここで、α（ω）は雑音を減算する倍率（over-estimation factor）（以下、減算倍率と記す）であり、β（ω）はスペクトルの下限を決めるパラメータ（flooring factor）（以下、下限パラメータと記す）である。なお、Ｍａｘ｛Ａ，Ｂ｝はＡとＢのうち大きい方を示す関数である。このような関数を用いるのは、振幅スペクトルが負の値を取り得ないためである。
【数５】

【先行技術文献】
【特許文献】
【００１０】
【特許文献１】特許第３６９３０２２号明細書
【発明の概要】
【発明が解決しようとする課題】
【００１１】
特許文献１に開示された従来の方法では、雑音のスペクトル包絡を求め、これに依存した減算倍率α（ω）、下限パラメータβ（ω）を算出している。しかしながら、この方法では、スペクトル包絡を算出するために、雑音の周波数スペクトルＤ（ω）に対してさらにフーリエ変換および逆フーリエ変換を行う必要があり、計算量が非常に多くなるという問題がある。
【００１２】
本発明は、このような従来の課題を解決するためになされたものであって、計算量を抑えて高品質な雑音抑圧音声を得ることができる雑音抑圧装置およびプログラムを提供することを目的とする。
【課題を解決するための手段】
【００１３】
本発明の雑音抑圧装置は、雑音混入音声を入力として、スペクトルサブトラクションにより雑音抑圧音声を出力として得る雑音抑圧装置であって、前記雑音混入音声の周波数スペクトルを求める周波数解析手段と、前記雑音混入音声の非音声区間の周波数スペクトルから雑音の周波数スペクトルを推定する雑音スペクトル推定手段と、前記雑音混入音声の周波数スペクトルと前記雑音の周波数スペクトルの離散角周波数ごとの大小関係に応じて、雑音抑圧スペクトルを算出する雑音抑圧スペクトル算出手段と、を備え、前記雑音抑圧スペクトル算出手段が、離散角周波数の関数である第１の係数を設定する第１の係数設定手段と、前記第１の係数に依存する第２の係数を設定する第２の係数設定手段と、前記雑音混入音声の周波数スペクトルから、前記雑音の周波数スペクトルに前記第１の係数を乗じた周波数スペクトルを減算する減算手段と、前記雑音混入音声の周波数スペクトルに前記第２の係数を乗じた周波数スペクトルを算出する乗算手段と、前記減算手段が出力する周波数スペクトルと前記乗算手段が出力する周波数スペクトルを比較して、離散角周波数ごとに大きい方を出力する比較手段と、を備える構成を有している。
【００１４】
この構成により、スペクトル包絡を計算することなく減算倍率（第１の係数）を算出し、さらに下限パラメータ（第２の係数）を減算倍率に基づいて算出するため、計算量を抑えて高品質な雑音抑圧音声を得ることができる。
【００１５】
また、本発明の雑音抑圧装置は、前記第２の係数設定手段が、前記第２の係数が前記第１の係数に対して単調減少するように前記第２の係数を設定する構成を有していてもよい。
また、本発明の雑音抑圧装置は、前記第２の係数β（ω）が、以下の式（１）に示される前記第１の係数α（ω）の関数であってもよい。
【数６】

【００１６】
また、本発明の雑音抑圧装置は、前記第１の係数が、前記雑音の周波数スペクトルに対する前記雑音混入音声の周波数スペクトルの比に依存するものであってもよい。
【発明の効果】
【００１７】
本発明は、スペクトル包絡を計算することなく減算倍率を算出し、さらに下限パラメータを減算倍率に基づいて算出することにより、計算量を抑えて高品質な雑音抑圧音声を得ることができる雑音抑圧装置およびプログラムを提供するものである。
【図面の簡単な説明】
【００１８】
【図１】本発明に係る雑音抑圧装置の構成を示すブロック図
【図２】本発明に係る雑音抑圧装置の雑音抑圧スペクトル算出手段の構成を示すブロック図
【図３】本発明に係る雑音抑圧装置のハードウエア構成を示すブロック図
【図４】本発明に係る雑音抑圧装置のＤＳＰが実行する雑音抑圧プログラムのフローチャート
【図５】雑音混入音声と分析フレームとの対応関係を示す模式的なグラフ
【図６】音声区間の雑音混入スペクトルの振幅スペクトル、および、推定雑音スペクトルの振幅スペクトルを示すグラフ
【図７】雑音抑圧プログラムの雑音抑圧スペクトル算出処理のフローチャート
【図８】事後ＳＮ比の算出結果を示すグラフ
【図９】傾きａが−１のときの切片ｂの決定方法を説明するためのグラフ
【図１０】切片ｂが−３のときの傾きａの決定方法を説明するためのグラフ
【図１１】減算倍率および下限パラメータの算出結果を示すグラフ
【図１２】推定雑音スペクトルの振幅スペクトルに減算倍率を乗じたスペクトル、雑音混入スペクトルの振幅スペクトルに下限パラメータを乗じたスペクトル、および、雑音抑圧スペクトルの振幅スペクトルの算出結果を示すグラフ
【図１３】雑音混入音声、および、雑音抑圧音声の算出結果を示すグラフ
【発明を実施するための形態】
【００１９】
以下、本発明に係る雑音抑圧装置およびプログラムの実施形態を図面を用いて説明する。
【００２０】
図１、２は本実施形態の雑音抑圧装置の構成を示すブロック図である。即ち、図１に示すように、本実施形態の雑音抑圧装置は、入力された雑音混入音声ｙ（ｔ）を複数の分析フレームＦ_m（ｍは自然数）に対応させて切り出す音声波形切り出し手段１と、音声波形切り出し手段１によって切り出された雑音混入音声ｙ_m（ｔ）の周波数スペクトルＹ_m（ω）（以下、雑音混入スペクトルと記す）を求める周波数解析手段２と、雑音混入音声ｙ（ｔ）から非音声区間を検出するとともに、各分析フレームＦ_mに対応した雑音混入音声ｙ_m（ｔ）が非音声区間に属するものであるか否かを判定する非音声区間検出手段３と、非音声区間に属する雑音混入音声ｙ_m（ｔ）の雑音混入スペクトルＹ_m（ω）から雑音の周波数スペクトルＤ'（ω）（以下、推定雑音スペクトルと記す）を推定する雑音スペクトル推定手段４と、雑音混入スペクトルＹ_m（ω）と推定雑音スペクトルＤ'（ω）の離散角周波数ωごとの大小関係に応じて、雑音抑圧スペクトルＸ'（ω）を算出する雑音抑圧スペクトル算出手段５と、を備える。
【００２１】
図２に示すように、雑音抑圧スペクトル算出手段５は、離散角周波数ωの関数である減算倍率（第１の係数）α（ω）を設定する第１の係数設定手段５０と、減算倍率α（ω）に依存する下限パラメータ（第２の係数）β（ω）を設定する第２の係数設定手段５３と、雑音混入スペクトルＹ_m（ω）から、推定雑音スペクトルＤ'（ω）に減算倍率α（ω）を乗じた周波数スペクトルを減算する減算手段５４と、雑音混入スペクトルＹ_m（ω）に下限パラメータβ（ω）を乗じた周波数スペクトルを算出する乗算手段５５と、減算手段５４が出力する周波数スペクトルと乗算手段５５が出力する周波数スペクトルを比較して、離散角周波数ωごとに大きい方を出力する比較手段５６と、を備える。第１の係数設定手段５０は、事後ＳＮ比算出手段５１と、減算倍率α（ω）を算出する減算倍率算出手段５２と、を備える。
【００２２】
本実施形態の雑音抑圧装置は、図１に示すように、雑音抑圧スペクトルＸ'（ω）に基づいて雑音抑圧音声ｘ'（ｔ）を出力する雑音抑圧音声出力手段６をさらに備える。
【００２３】
図３は、本実施形態の雑音抑圧装置のハードウエア構成を示すブロック図である。図３に示すように、本実施形態の雑音抑圧装置は、表示パネル７１、キーボード７２、およびマウス７３等のインターフェイスと、パーソナルコンピュータ等の演算装置７４と、を含む。
【００２４】
演算装置７４は、サンプリング周波数４８ｋＨｚ、量子化ビット数１６ｂｉｔで雑音混入音声ｙ（ｔ）をデジタル音声信号に変換するＡＤ変換部７５、雑音抑圧音声ｘ'（ｔ）をアナログ音声信号として出力するＤＡ変換部７６、ＣＰＵ（Central Processing Unit）７７、ＣＰＵ７７の制御指令に基づいて周波数解析等の処理を実行するＤＳＰ（Digital Signal Processor）７８、メモリ７９、ハードディスク（ＨＤＤ）８０、および周辺機器Ｉ／Ｆ８１がバス８２を介して相互に結合された構成を有する。表示パネル７１、キーボード７２、およびマウス７３等のインターフェイスは周辺機器Ｉ／Ｆ８１に接続される。
【００２５】
ＡＤ変換部７５およびＤＡ変換部７６とＤＳＰ７８とはそれぞれ専用のバス８３、８４で接続されている。なお、雑音混入音声ｙ（ｔ）が予めＡＤ変換されている場合は、雑音混入音声ｙ（ｔ）を直接ＤＳＰ７８に入力すればよい。また、雑音抑圧音声ｘ'（ｔ）をＤＡ変換せずデジタル音声信号のままＤＳＰ７８から出力する構成としてもよい。
【００２６】
なお、音声波形切り出し手段１、周波数解析手段２、非音声区間検出手段３、雑音スペクトル推定手段４、雑音抑圧スペクトル算出手段５、および雑音抑圧音声出力手段６は、メモリ７９にプログラムをインストールすることにより、演算装置７４内にソフトウエア的に構成される。
【００２７】
図４は、ＣＰＵ７７の制御指令に基づいてＤＳＰ７８が実行する雑音抑圧プログラムのフローチャートである。図４（ａ）に示すように、ＤＳＰ７８は、音声波形切り出し手段１に対応する音声波形切り出し処理（ステップＳ１００）と、周波数解析手段２に対応する高速フーリエ変換（ＦＦＴ）処理（ステップＳ１０１）と、雑音抑圧スペクトル算出手段５に対応する雑音抑圧スペクトル算出処理（ステップＳ１０２）と、雑音抑圧音声出力手段６に対応する逆高速フーリエ変換（ＩＦＦＴ）処理（ステップＳ１０３）および音声波形重ね合わせ処理（ステップＳ１０４）と、を実行するようになっている。
【００２８】
さらに、図４（ｂ）に示すように、ＤＳＰ７８は、非音声区間検出手段３に対応する非音声区間検出処理（ステップＳ１０５）と、雑音スペクトル推定手段４に対応する雑音スペクトル推定処理（ステップＳ１０６）と、を実行するようになっている。
【００２９】
図５は、雑音混入音声ｙ（ｔ）と分析フレームＦ_mとの対応関係を示す模式的なグラフである。ここで、雑音混入音声ｙ（ｔ）はサンプリング周波数４８ｋＨｚ、量子化ビット数１６ｂｉｔでＡＤ変換されているものとする。
【００３０】
ＤＳＰ７８は、雑音抑圧プログラムの音声波形切り出し処理（ステップＳ１００）において、例えば、１つの分析フレームＦ_mの窓幅Ｎが１０２４サンプル（約２０ｍｓ）、シフト幅Ｎ／２が半分の５１２サンプル（約１０ｍｓ）となるように、雑音混入音声ｙ（ｔ）を分割する。なお、このように分割された雑音混入音声をｙ_m（ｎ）（１≦ｎ≦Ｎ）と記す。ここで、ｎはｍ番目の分析フレームＦ_mに含まれるサンプル番号を示すインデックスである。
【００３１】
次に、雑音抑圧プログラムのＦＦＴ処理（ステップＳ１０１）の詳細について説明する。ＤＳＰ７８は、ｍ番目の分析フレームＦ_mに対応する雑音混入音声ｙ_m（ｎ）（１≦ｎ≦Ｎ）を読み込み、音声の声道特性の高域における減衰を補正するため、雑音混入音声ｙ_m（ｎ）（１≦ｎ≦Ｎ）に［数７］で表わされるフィルタ（Ｈ（ｚ））でプリエンファシスを施す。
【数７】

【００３２】
次に、ＤＳＰ７８は、プリエンファシスが施された雑音混入音声ｙ_m（ｎ）（１≦ｎ≦Ｎ）に適切な窓関数（例えば［数８］で表わされるハミング窓ｗ_hamm（ｎ））を乗じる。
【数８】

【００３３】
そして、ＤＳＰ７８は、窓関数が乗じられた雑音混入音声ｙ_m（ｎ）（１≦ｎ≦Ｎ）に離散フーリエ変換（ＦＦＴ）を施し、［数９］に示すような雑音混入音声ｙ_m（ｎ）（１≦ｎ≦Ｎ）の雑音混入スペクトルＹ_m（ω）を出力する。ここで、｜Ｙ_m（ω）｜は振幅スペクトル、φ_m（ω）は位相スペクトルである。
【数９】

【００３４】
次に、雑音抑圧プログラムの非音声区間検出処理（ステップＳ１０５）の詳細について説明する。ＤＳＰ７８は、非音声区間検出処理（ステップＳ１０５）において、公知の方法で雑音混入音声ｙ（ｔ）から非音声区間を検出するようになっている。例えば、入力される雑音混入音声ｙ（ｔ）に対して、予め音声区間とする音量レベルの閾値を設定し、音量レベルがその閾値以上である雑音混入音声ｙ_m（ｎ）（１≦ｎ≦Ｎ）を音声区間とし、閾値未満であるｙ_m（ｎ）（１≦ｎ≦Ｎ）を非音声区間とする方法がある。
【００３５】
即ち、ＤＳＰ７８は、各分析フレームＦ_mに対応した雑音混入音声ｙ_m（ｎ）（１≦ｎ≦Ｎ）が非音声区間に属するものであるか否かを判定し、非音声区間に属する雑音混入音声ｙ_m（ｎ）（１≦ｎ≦Ｎ）、または、非音声区間に属する雑音混入音声ｙ_m（ｎ）（１≦ｎ≦Ｎ）の分析フレームＦ_mのインデックスｍを出力する。
【００３６】
なお、この非音声区間検出処理（ステップＳ１０５）は、ＦＦＴ処理（ステップＳ１０１）で求められた雑音混入スペクトルＹ_m（ω）を用いて非音声区間を検出するものであってもよい。
【００３７】
次に、雑音抑圧プログラムの雑音スペクトル推定処理（ステップＳ１０６）の詳細について説明する。ＤＳＰ７８は、ＦＦＴ処理（ステップＳ１０１）で求められた雑音混入スペクトルＹ_m（ω）の振幅スペクトル｜Ｙ_m（ω）｜を分析フレームＦ_mごとに順次読み込む。
【００３８】
次に、ＤＳＰ７８は、雑音抑圧プログラムの非音声区間検出処理（ステップＳ１０５）の処理結果に基づいて、非音声区間の振幅スペクトル｜Ｙ_m（ω）｜のみに対して、［数１０］より推定雑音スペクトルＤ'（ω）の振幅スペクトル｜Ｄ'（ω）｜を算出する。ここでは、Ｍ₀個の非音声区間の振幅スペクトル｜Ｙ_m（ω）｜に対して平均化処理を行っている。
【数１０】

【００３９】
図６（ａ）に音声区間の雑音混入スペクトルＹ_m（ω）の振幅スペクトル｜Ｙ_m（ω）｜、図６（ｂ）に推定雑音スペクトルＤ'（ω）の振幅スペクトル｜Ｄ'（ω）｜のスペクトル例を示す。
【００４０】
なお、雑音スペクトル推定処理（ステップＳ１０６）においては、非音声区間検出処理（ステップＳ１０５）において新たな非音声区間の分析フレームＦ_mを１つ検出するたびに、［数１０］の平均化処理において用いるＭ₀個の非音声区間の｜Ｙ_m（ω）｜を１つずつ新しいものに入れ替えてもよい。あるいは、音声区間検出方法を利用せず、手動で設定した区間で適宜［数１０］のような計算を行うことにより｜Ｄ'（ω）｜を推定してもよい。
【００４１】
次に、雑音抑圧プログラムの雑音抑圧スペクトル算出処理（ステップＳ１０２）の詳細について図７のフローチャートに沿って説明する。なお、ステップＳ１１０の処理は事後ＳＮ比算出手段５１、ステップＳ１１１の処理は減算倍率算出手段５２、ステップＳ１１２の処理は第２の係数設定手段５３、ステップＳ１１３の処理は減算手段５４、乗算手段５５、および比較手段５６に相当している。
【００４２】
まず、ＤＳＰ７８は、推定雑音スペクトルＤ'（ω）の振幅スペクトル｜Ｄ'（ω）｜に対する雑音混入スペクトルＹ_m（ω）の振幅スペクトル｜Ｙ_m（ω）｜の比である、［数１１］で表わされる事後ＳＮ比ρ（ω）［ｄＢ］を算出する（ステップＳ１１０）。図８に算出した事後ＳＮ比ρ（ω）の例を示す。
【数１１】

【００４３】
次に、ＤＳＰ７８は、ステップＳ１１０で算出した事後ＳＮ比ρ（ω）を用いて、例えば、［数１２］により減算倍率α（ω）を算出する（ステップＳ１１１）。
【数１２】

【００４４】
ここで、ｍａｘρ（ω）およびｍｉｎρ（ω）は、それぞれ１つの分析フレームＦ_mに対応するρ（ω）の最大値と最小値である。Ｒ（ω）は、ρ（ω）を正規化したものであり、−１≦Ｒ（ω）≦０である。なお、減算倍率α（ω）は、［数１２］のように離散角周波数ωに依存しない予め定められた固定値であってもよい。あるいは、減算倍率α（ω）は、離散角周波数ωに依存する周波数域、および、離散角周波数ωに依存しない周波数域の関数であってもよい。上記の固定値は、例えば、表示パネル７１、キーボード７２、およびマウス７３等のインターフェイスを介してユーザにより手動で入力されてもよい。
【００４５】
次に、ＤＳＰ７８は、例えば［数１３］に示すように、減算倍率α（ω）の対数を独立変数とする一次関数の従属変数となる下限パラメータβ（ω）を算出する（ステップＳ１１２）。
【数１３】

【００４６】
［数１３］において、ａ、ｂは一次関数の傾きと切片を決める定数とし、例えばａ＝−１、ｂ＝−３ｄＢとする。傾きａ、切片ｂは以下に示す客観音質評価実験の結果に基づいて定めた値である。
【００４７】
図９に、クリーンな音声と雑音をＳＮＲ＝０ｄＢでミックスした雑音混入音声を対象に、減算倍率α＝３ｄＢ（周波数に依存しない固定値）、一次関数の傾きａ＝−１の時に、切片ｂを０，−３，−６ｄＢに変化させた場合の雑音抑圧音声に対して、クリーンな音声と雑音抑圧音声の間のケプストラム距離、および、セグメンタルＳＮＲを求めたものを示す。ケプストラム距離の値が小さいほど雑音混入音声がクリーンな音声に近く、セグメンタルＳＮＲの値が大きいほど雑音が抑圧されていることを意味する。
【００４８】
図１０に、クリーンな音声と雑音をＳＮＲ＝０ｄＢでミックスした雑音混入音声を対象に、減算倍率α＝３ｄＢ（周波数に依存しない固定値）、一次関数の切片ｂ＝−３の時に、傾きａ＝−０．５，−１，−２に変化させた場合の雑音抑圧音声に対して、クリーンな音声と雑音抑圧音声の間のケプストラム距離、および、セグメンタルＳＮＲを求めたものを示す。
【００４９】
図９、図１０に示したいずれの場合においてもケプストラム距離とセグメンタルＳＮＲはトレードオフの関係にあることがわかる。従って、これらの実験結果に基づいて、ａ＝−１およびｂ＝−３を最適な値とした。図１１に、［数１３］においてａ＝−１、ｂ＝−３ｄＢとしたときの減算倍率α（ω）および下限パラメータβ（ω）の例を示す。
【００５０】
次に、ＤＳＰ７８は、［数１４］に従って雑音抑圧スペクトルＸ'_m（ω）を算出する（ステップＳ１１３）。なお、位相スペクトルは音声の知覚への影響が少ないので、雑音抑圧スペクトルＸ'_m（ω）の位相スペクトルとして雑音混入スペクトルＹ_m（ω）の位相スペクトルφ_m（ω）を利用している。
【数１４】

【００５１】
図１２（ａ）に推定雑音スペクトルＤ'（ω）の振幅スペクトル｜Ｄ'（ω）｜に減算倍率α（ω）を乗じた周波数スペクトル、図１２（ｂ）に雑音混入スペクトルＹ_m（ω）の振幅スペクトル｜Ｙ_m（ω）｜に下限パラメータβ（ω）を乗じた周波数スペクトル、図１２（ｃ）に［数１４］より求められる雑音抑圧スペクトルＸ'_m（ω）の振幅スペクトル｜Ｘ'_m（ω）｜の例を示す。
【００５２】
なお、ＤＳＰ７８は、ステップＳ１１２において、上記の［数１３］の代わりに下記の［数１５］に示すように、減算倍率α（ω）の逆数に比例するような下限パラメータβ（ω）を算出してもよい。なお、δは調整用の定数である。
【数１５】

【００５３】
次に、雑音抑圧プログラムのＩＦＦＴ処理（ステップＳ１０３）の詳細について説明する。ＤＳＰ７８は、分析フレームＦ_mに対応する雑音抑圧スペクトルＸ'_m（ω）を読み込み、読み込んだ雑音抑圧スペクトルＸ'_m（ω）に対して逆高速フーリエ変換（ＩＦＦＴ）を施すことにより、音声波形ｘ'_m（ｎ）（１≦ｎ≦Ｎ）を算出する。
【００５４】
次に、ＤＳＰ７８は、音声波形ｘ'_m（ｎ）（１≦ｎ≦Ｎ）をハミング窓ｗ_hamm（ｎ）で除して、プリエンファシスの逆フィルタ（１／Ｈ（ｚ））でディエンファシスを施す。
【００５５】
次に、雑音抑圧プログラムの音声波形重ね合わせ処理（ステップＳ１０４）の詳細について説明する。ＤＳＰ７８は、ＩＦＦＴ処理（ステップＳ１０３）においてディエンファシスを施した音声波形ｘ'_m（ｎ）（１≦ｎ≦Ｎ）に適切な窓関数（例えば［数１６］で表わされるハニング窓ｗ_hann（ｎ））を乗じる。
【数１６】

【００５６】
そして、ＤＳＰ７８は、適切な窓関数を乗じた音声波形ｘ'_m（ｎ）（１≦ｎ≦Ｎ）と、一つ前の分析フレームＦ_m-1に対応する音声波形ｘ'_m-1（ｎ）（１≦ｎ≦Ｎ）と、をシフト幅（Ｎ／２）分ずらして重ね合わせることにより、雑音抑圧音声ｘ'（ｍ−１，ｍ）を得る。ここで、雑音抑圧音声ｘ'（ｍ−１，ｍ）とは、最終的に得られる雑音抑圧音声ｘ'（ｔ）のうち、分析フレームＦ_m-1と分析フレームＦ_mの重なり部分に相当する区間のデータを示している。
【００５７】
即ち、ＤＳＰ７８は、全ての分析フレームに対して上記の音声波形重ね合わせ処理を行うことにより、雑音抑圧音声ｘ'（ｔ）を出力することができる。図１３（ａ）に雑音混入音声ｙ（ｔ）、図１３（ｂ）にその雑音抑圧音声ｘ'（ｔ）の例を示す。
【産業上の利用可能性】
【００５８】
以上説明したように、本発明に係る雑音抑圧装置およびプログラムは、スペクトル包絡を計算することなく減算倍率を算出し、さらに下限パラメータを減算倍率に基づいて算出することにより、計算量を抑えて高品質な雑音抑圧音声を得ることができるという効果を有し、収録される音声に対してリアルタイムで雑音を抑制することが可能な雑音抑圧装置およびプログラムとして有用である。
【符号の説明】
【００５９】
１音声波形切り出し手段
２周波数解析手段
３非音声区間検出手段
４雑音スペクトル推定手段
５雑音抑圧スペクトル算出手段
６雑音抑圧音声出力手段
５０第１の係数設定手段
５１事後ＳＮ比算出手段
５２減算倍率算出手段
５３第２の係数設定手段
５４減算手段
５５乗算手段
５６比較手段

【特許請求の範囲】
【請求項１】
雑音混入音声を入力として、スペクトルサブトラクションにより雑音抑圧音声を出力として得る雑音抑圧装置であって、
前記雑音混入音声の周波数スペクトルを求める周波数解析手段と、
前記雑音混入音声の非音声区間の周波数スペクトルから雑音の周波数スペクトルを推定する雑音スペクトル推定手段と、
前記雑音混入音声の周波数スペクトルと前記雑音の周波数スペクトルの離散角周波数ごとの大小関係に応じて、雑音抑圧スペクトルを算出する雑音抑圧スペクトル算出手段と、を備え、
前記雑音抑圧スペクトル算出手段が、
離散角周波数の関数である第１の係数を設定する第１の係数設定手段と、
前記第１の係数に依存する第２の係数を設定する第２の係数設定手段と、
前記雑音混入音声の周波数スペクトルから、前記雑音の周波数スペクトルに前記第１の係数を乗じた周波数スペクトルを減算する減算手段と、
前記雑音混入音声の周波数スペクトルに前記第２の係数を乗じた周波数スペクトルを算出する乗算手段と、
前記減算手段が出力する周波数スペクトルと前記乗算手段が出力する周波数スペクトルを比較して、離散角周波数ごとに大きい方を出力する比較手段と、を備えることを特徴とする雑音抑圧装置。
【請求項２】
前記第２の係数設定手段が、前記第２の係数が前記第１の係数に対して単調減少するように前記第２の係数を設定する請求項１に記載の雑音抑圧装置。
【請求項３】
前記第２の係数β（ω）が、以下の式（１）に示される前記第１の係数α（ω）の関数である請求項１または請求項２に記載の雑音抑圧装置。
【数１７】

【請求項４】
前記第１の係数が、前記雑音の周波数スペクトルに対する前記雑音混入音声の周波数スペクトルの比に依存する第１の係数を設定するものである請求項１から請求項３のいずれか一項に記載の雑音抑圧装置。
【請求項５】
コンピュータを、雑音混入音声を入力として、スペクトルサブトラクションにより雑音抑圧音声を出力として得る雑音抑圧装置として機能させるプログラムであって、
コンピュータに、
前記雑音混入音声の周波数スペクトルを求める周波数解析手段と、
前記雑音混入音声の非音声区間の周波数スペクトルから雑音の周波数スペクトルを推定する雑音スペクトル推定手段と、
前記雑音混入音声の周波数スペクトルと前記雑音の周波数スペクトルの周波数ごとの大小関係に応じて、雑音抑圧スペクトルを算出する雑音抑圧スペクトル算出手段と、を実現させ、
前記雑音抑圧スペクトル算出手段が、
離散角周波数の関数である第１の係数を設定する第１の係数設定手段と、
前記第１の係数に依存する第２の係数を設定する第２の係数設定手段と、
前記雑音混入音声の周波数スペクトルから、前記雑音の周波数スペクトルに前記第１の係数を乗じた周波数スペクトルを減算する減算手段と、
前記雑音混入音声の周波数スペクトルに前記第２の係数を乗じた周波数スペクトルを算出する乗算手段と、
前記減算手段が出力する周波数スペクトルと前記乗算手段が出力する周波数スペクトルを比較して、離散角周波数ごとに大きい方を出力する比較手段と、を含むことを特徴とするプログラム。

【図１】