雑音抑圧用係数設定装置および雑音抑圧装置
【課題】ミュージカルノイズの発生を有効に抑制可能な雑音抑圧を実現する。
【解決手段】特性値算定部42は、音響信号x(t)の強度分布の形状に応じた形状母数α0を算定する。第1係数設定部44は、音響信号x(t)の強度分布の尖度Kが雑音抑圧処理の前後で変化しない場合における当該音響信号x(t)の形状母数α0と雑音抑圧処理のフロアリング処理に適用されるフロアリング係数ηとの関係を規定する関係式を満たすように、特性値算定部42が算定した形状母数α0に応じてフロアリング係数ηを可変に設定する。雑音抑圧部36は、第1係数設定部44が設定したフロアリング係数ηを適用したフロアリング処理を含む雑音抑圧処理を音響信号x(t)に対して実行する。
【解決手段】特性値算定部42は、音響信号x(t)の強度分布の形状に応じた形状母数α0を算定する。第1係数設定部44は、音響信号x(t)の強度分布の尖度Kが雑音抑圧処理の前後で変化しない場合における当該音響信号x(t)の形状母数α0と雑音抑圧処理のフロアリング処理に適用されるフロアリング係数ηとの関係を規定する関係式を満たすように、特性値算定部42が算定した形状母数α0に応じてフロアリング係数ηを可変に設定する。雑音抑圧部36は、第1係数設定部44が設定したフロアリング係数ηを適用したフロアリング処理を含む雑音抑圧処理を音響信号x(t)に対して実行する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音響信号から雑音成分を抑圧する技術に関する。
【背景技術】
【0002】
周波数領域で音響信号から雑音成分を抑圧する雑音抑圧技術では、雑音抑圧処理に起因して発生する耳障りなミュージカルノイズの発生が問題となる。特許文献1には、音響信号の強度分布の尖度に応じた雑音指標値をミュージカルノイズの発生度合の指標として算定し、雑音抑圧処理に適用される抑圧係数やフロアリング係数を雑音指標値に応じて可変に設定する技術が開示されている。また、非特許文献1には、雑音抑圧処理の前後にわたる音響信号の強度分布の尖度比や雑音抑圧処理による雑音抑圧率を定式化し得ることが開示されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2010−020012号公報
【非特許文献】
【0004】
【非特許文献1】T. Inoue, et al., "Theoretical analysis of iterative weak spectral subtraction via higher-order statistics", Proc. MLSP2010, p.220-225, 2010
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかし、特許文献1や非特許文献1の技術のもとでも、実際にはミュージカルノイズの発生を有効に抑制し得る最適な係数を選定することは必ずしも容易ではなかった。以上の事情を考慮して、本発明は、ミュージカルノイズの発生を有効に抑制し得る雑音抑圧の実現を目的とする。
【課題を解決するための手段】
【0006】
本発明の雑音抑圧用係数設定装置は、入力音響信号(例えば音響信号x(t))の強度分布の形状に応じた雑音特性値を算定する特性値算定手段と、音響信号の強度分布の尖度が雑音抑圧処理の前後で変化しない場合における当該音響信号の雑音特性値(例えば形状母数α0)と雑音抑圧処理のフロアリング処理に適用されるフロアリング係数(例えばフロアリング係数η)との関係を規定する関係式(例えば数式(24))を満たすように、特性値算定手段が算定した雑音特性値に応じてフロアリング係数を可変に設定する第1係数設定手段とを具備する。
【0007】
以上の構成では、雑音抑圧処理の前後で強度分布の尖度が変化しないという条件(第1条件)を満たすようにフロアリング係数が雑音特性値に応じて可変に設定される。したがって、ミュージカルノイズの発生を有効に抑制(理想的には完全に防止)しながら雑音成分を抑圧することが可能である。
【0008】
本発明の好適な態様において、第1係数設定手段は、雑音抑圧処理による雑音抑圧率が正数となるようにフロアリング係数を設定する。以上の態様では、雑音抑圧率が正数であるという条件(第2条件)を満たすようにフロアリング係数が設定される。例えば、雑音特性値とフロアリング係数との関係式を満たす複数のフロアリング係数から雑音抑圧率が正数となるフロアリング係数が選択される。したがって、雑音抑圧を有効に実現し得る有意なフロアリング係数を雑音抑圧処理に適用することが可能である。
【0009】
本発明の好適な態様の雑音抑圧用係数設定装置は、雑音抑圧強度を制御するための抑圧係数(例えば抑圧係数β)を、特性値算定手段が算定した雑音特性値に応じて可変に設定する第2係数設定手段を具備する。例えば、雑音抑圧処理による雑音抑圧率が最大となる抑圧係数や雑音抑圧率が目標値を上回る抑圧係数が設定される。以上の態様では、雑音抑圧処理(減算処理)に適用されて雑音抑圧強度を制御する抑圧係数が、入力音響信号の雑音特性値に応じて可変に設定されるから、抑圧係数を所定値に固定した構成と比較して適切な雑音抑圧が実現される。なお、以上の態様の具体例は例えば第2実施形態として後述される。
【0010】
本発明の好適な態様の雑音抑圧用係数設定装置は、各雑音抑圧処理による雑音抑圧率の累算値が目標値を上回るように、特性値算定手段が算定した雑音特性値と第1係数設定手段が設定したフロアリング係数とに応じて雑音抑圧処理の反復回数(例えば反復回数Q)を可変に設定する反復回数設定手段を具備する。以上の態様では、雑音抑圧率の累算値が目標値を上回るように雑音抑圧処理の反復回数が可変に設定されるから、反復回数を所定値に固定した構成と比較して雑音抑圧処理の過不足を抑制することが可能である。なお、以上の態様の具体例は例えば第3実施形態として後述される。また、雑音抑圧処理は入力音響信号に対して累積的に反復される。雑音抑圧処理の累積的な反復とは、音響信号の一の区間に対して雑音抑圧処理を反復する(すなわち、各雑音抑圧処理の実行後の音響信号を次回の雑音抑圧処理の対象とする)ことを意味する。
【0011】
本発明は、以上の各態様に係る雑音抑圧用係数設定装置を具備する雑音抑圧装置としても実現される。本発明の第1態様に係る雑音抑圧装置は、以上の各態様に係る雑音抑圧用係数設定装置と、雑音抑圧用係数設定装置が設定した係数を適用した雑音抑圧処理を入力音響信号に対して実行する雑音抑圧手段とを具備する。雑音抑圧手段は、例えば、第1係数設定手段が設定したフロアリング係数を適用したフロアリング処理を含む雑音抑圧処理を入力音響信号に対して実行する要素や、第1係数設定手段が設定したフロアリング係数と第2係数設定手段が設定した抑圧係数とを適用した雑音抑圧処理を入力音響信号に対して実行する要素や、反復回数設定手段が設定した反復回数にわたり雑音抑圧処理を入力音響信号に対して累積的に反復する要素である。以上の雑音抑圧装置によれば、本発明の雑音抑圧用係数設定装置について前述した作用および効果が実現される。
【0012】
本発明の第2態様に係る雑音抑圧装置は、相互に離間して配置された収音機器が生成するD(Dは2以上の自然数)チャネルの音響信号を順次に処理するQ段の単位処理手段と、
Q段のうち最終段の単位処理手段による処理後のDチャネルの音響信号の遅延加算で特定の音源方向の目的音成分を強調する出力処理手段とを具備し、Q段の単位処理手段の各々は、当該単位処理手段に供給されるDチャネルの音響信号に対する独立成分分析で推定雑音成分を生成する雑音推定手段と、推定雑音成分の雑音特性値に応じたフロアリング係数をチャネル毎に可変に設定する前述の各態様の雑音抑圧用係数設定装置と、雑音抑圧用係数設定装置がチャネル毎に設定したフロアリング係数を適用した雑音抑圧処理を当該チャネルの音響信号に実行して出力する雑音抑圧手段とを含む。第2態様においても第1態様の雑音抑圧装置と同様の効果が実現される。また、雑音成分の特性が経時的に変動する場合でも高精度な雑音抑圧を実現できるという利点もある。なお、第2態様の雑音抑圧装置は、例えば第4実施形態として後述される。
【0013】
以上の各態様に係る雑音抑圧用係数設定装置は、雑音成分の抑圧に専用されるDSP(Digital Signal Processor)などのハードウェア(電子回路)によって実現されるほか、CPU(Central Processing Unit)などの汎用の演算処理装置とプログラム(ソフトウェア)との協働によっても実現される。本発明のプログラムは、入力音響信号の強度分布の形状に応じた雑音特性値を算定する特性値算定処理と、音響信号の強度分布の尖度が雑音抑圧処理の前後で変化しない場合における当該音響信号の雑音特性値と雑音抑圧処理のフロアリング処理に適用されるフロアリング係数との関係を規定する関係式を満たすように、特性値算定処理で算定した雑音特性値に応じてフロアリング係数を可変に設定する第1係数設定処理とをコンピュータに実行させる。以上のプログラムによれば、本発明の雑音抑圧用係数設定装置と同様の作用および効果が実現される。本発明のプログラムは、コンピュータが読取可能な記録媒体に格納された形態で提供されてコンピュータにインストールされるほか、通信網を介した配信の形態で提供されてコンピュータにインストールされる。
【図面の簡単な説明】
【0014】
【図1】第1実施形態に係る雑音抑圧装置のブロック図である。
【図2】雑音抑圧率と尖度比との関係を示すグラフである。
【図3】実施形態の効果を示すグラフである。
【図4】実施形態の効果を示すグラフである。
【図5】第2実施形態に係る雑音抑圧装置のブロック図である。
【図6】係数テーブルの模式図である。
【図7】第3実施形態に係る雑音抑圧装置のブロック図である。
【図8】第4実施形態に係る雑音抑圧装置のブロック図である。
【図9】単位処理部のブロック図である。
【図10】第4実施形態の効果を示すグラフである。
【図11】第4実施形態の効果を示すグラフである。
【図12】第4実施形態の効果を示すグラフである。
【発明を実施するための形態】
【0015】
<第1実施形態>
図1は、本発明の第1実施形態に係る雑音抑圧装置100Aのブロック図である。雑音抑圧装置100Aには、信号供給装置12と放音装置14とが接続される。信号供給装置12は、音響信号x(t)を雑音抑圧装置100Aに供給する。音響信号x(t)は、目的音成分(例えば音声や楽音等の音響)と雑音成分(空調設備の動作音や雑踏音等の環境音)との混合音の波形を表す時間領域の信号である(t:時間)。周囲の音響を収音して音響信号x(t)を生成する収音機器や、可搬型または内蔵型の記録媒体から音響信号x(t)を取得して雑音抑圧装置100Aに供給する再生装置や、通信網から音響信号x(t)を受信して雑音抑圧装置100Aに供給する通信装置が信号供給装置12として採用され得る。
【0016】
雑音抑圧装置100Aは、信号供給装置12が供給する音響信号x(t)から音響信号y(t)を生成する音響処理装置である。音響信号y(t)は、音響信号x(t)から雑音成分を抑圧した音響(目的音成分を強調した音響)の波形を表す時間領域の信号である。放音装置14(例えばスピーカやヘッドホン)は、雑音抑圧装置100Aが生成した音響信号y(t)に応じた音波を再生する。なお、音響信号y(t)をデジタルからアナログに変換するD/A変換器の図示は便宜的に省略されている。
【0017】
図1に示すように、雑音抑圧装置100Aは、演算処理装置22と記憶装置24とを具備するコンピュータシステムで実現される。記憶装置24は、演算処理装置22が実行するプログラムPGMや演算処理装置22が使用する各種のデータを記憶する。半導体記録媒体や磁気記録媒体などの公知の記録媒体や複数種の記録媒体の組合せが記憶装置24として任意に採用され得る。音響信号x(t)を記憶装置24に記憶した構成(したがって信号供給装置12は省略される)も好適である。
【0018】
演算処理装置22は、記憶装置24に格納されたプログラムPGMを実行することで、音響信号x(t)から音響信号y(t)を生成するための複数の機能(周波数分析部32,雑音推定部34,雑音抑圧部36,波形合成部38,特性値算定部42,第1係数設定部44)を実現する。なお、演算処理装置22の各機能を複数の集積回路に分散した構成や、専用の電子回路(DSP)が各機能を実現する構成も採用され得る。
【0019】
周波数分析部32は、音響信号x(t)のスペクトル(複素スペクトル)X(f,τ)を時間軸上のフレーム毎に順次に生成する。スペクトルX(f,τ)の生成には、短時間フーリエ変換等の公知の周波数分析が任意に採用され得る。記号τはフレームを指定する変数であり、記号fは周波数を指定する変数である。なお、通過帯域が相違する複数の帯域通過フィルタで構成されるフィルタバンクも周波数分析部32として採用され得る。
【0020】
雑音推定部34は、音響信号x(t)に含まれると推定される雑音成分(以下「推定雑音成分」という)n(t)のスペクトル(複素スペクトル)N(f,τ)を生成する。推定雑音成分n(t)のスペクトルN(f,τ)の生成には公知の技術が任意に採用され得る。例えば、雑音推定部34は、目的音成分が存在する目的音区間と目的音成分が存在しない雑音区間とに音響信号x(t)を時間軸上で区分し、雑音区間内の各フレームのスペクトルX(f,τ)を推定雑音成分n(t)のスペクトルN(f,τ)として特定する。目的音区間と雑音区間との区分には公知の音声検出技術(VAD:Voice Activity Detection)が任意に採用される。
【0021】
雑音抑圧部36は、目的音区間および雑音区間の各フレームの音響信号x(t)のスペクトルX(f,τ)に対する反復型の雑音抑圧で音響信号y(t)のスペクトル(複素スペクトル)Y(f,τ)をフレーム毎に順次に生成する。反復型の雑音抑圧は、音響信号x(t)のスペクトルX(f,τ)に対する雑音抑圧処理を所定の反復回数Q(Qは自然数)にわたり累積的に反復する信号処理である。雑音抑圧部36が生成するスペクトルY(f,τ)は、以下の数式(1)で表現される。
【数1】
数式(1)の記号jは虚数単位を意味し、記号θx(f,τ)は音響信号x(t)の位相スペクトルを意味する。また、数式(1)の記号|YQ(f,τ)|は、音響信号x(t)のスペクトルX(f,τ)に対して反復回数Qの雑音抑圧処理を実行した時点の振幅スペクトルである。各回の雑音抑圧処理では、数式(2A)で表現される減算処理と数式(2B)で表現されるフロアリング処理とが周波数f毎に択一的に実行される。
【数2】
【0022】
数式(2A)および数式(2B)の振幅スペクトル|Yi(f,τ)|は、第i回目の雑音抑圧処理が完了した時点での振幅スペクトルを意味する。音響信号x(t)の振幅スペクトル|X(f,τ)|が振幅スペクトル|Yi(f,τ)|の初期値|Y0(f,τ)|として第1回目の雑音抑圧処理(振幅スペクトル|Y1(f,τ)|の生成)に適用される。数式(2A)の記号Eτ[|Ni-1(f,τ)|2]は、複数のフレームにわたる推定雑音成分n(t)のパワー|Ni-1(f,τ)|2の時間平均を意味する。なお、振幅スペクトル|Yi(f,τ)|の算定(数式(2A))には、雑音区間について第(i-1)回目の雑音抑圧処理で算定された振幅スペクトル|Yi-1(f,τ)|が推定雑音成分n(t)の振幅スペクトル|Ni-1(f,τ)|として適用される。すなわち、推定雑音成分n(t)は雑音抑圧処理毎に更新される。
【0023】
数式(2A)から理解されるように、減算処理は、推定雑音成分n(t)のパワースペクトル|Ni-1(f,τ)|2の時間平均(すなわち推定雑音)と抑圧係数βとの乗算値を、直前(第(i-1)回目)の雑音抑圧処理後のパワースペクトル|Yi-1(f,τ)|2から減算して振幅スペクトル|Yi(f,τ)|を算定する処理である。したがって、抑圧係数(減算係数)βは、雑音成分の抑圧強度を制御するための変数として機能する。第1実施形態では、抑圧係数βは所定値(例えば2または4)に固定される。
【0024】
他方、数式(2A)の減算後の数値が負数となる場合に実行される数式(2B)のフロアリング処理は、直前(第(i-1)回目)の雑音抑圧処理後の振幅スペクトル|Yi-1(f,τ)|とフロアリング係数ηとを乗算することで振幅スペクトル|Yi(f,τ)|を算定する処理である。すなわち、フロアリング係数ηは、振幅スペクトル|Yi(f,τ)|の下限値を規定する変数として機能する。数式(1)で説明したように、第Q回目の雑音抑圧処理の完了後の振幅スペクトル|YQ(f,τ)|に音響信号x(t)の位相スペクトルθx(f,τ)を付加したスペクトルY[f,t]がフレーム毎に波形合成部38に供給される。
【0025】
図1の波形合成部38は、雑音抑圧部36がフレーム毎に生成するスペクトルY(f,τ)から時間領域の音響信号y(t)を生成する。具体的には、波形合成部38は、各フレームのスペクトルY(f,τ)を逆フーリエ変換で時間領域の信号に変換するとともに前後のフレームを相互に連結することで音響信号y(t)を生成する。波形合成部38が生成した音響信号y(t)が放音装置14に供給されて音波として再生される。
【0026】
図1の特性値算定部42は、音響信号x(t)内の雑音成分(推定雑音成分n(t))の特性に応じた形状母数(shape parameter)α0を音響信号x(t)から算定する。形状母数α0は、雑音区間内の複数のフレームにわたる音響信号x(t)のパワー|X(f,τ)|2(すなわち推定雑音成分n(t)のパワー|N(f,τ)|2)の度数分布(以下「強度分布」という)の形状に応じて変化する変数である。第1実施形態の特性値算定部42は、音響信号x(t)の強度分布を近似する確率分布の形状母数α0を算定する。確率分布の典型例はガウス分布である。音響信号x(t)のパワーx(x=|X(f,τ)|2)を確率変数として音響信号x(t)の強度分布を近似するガンマ分布の確率密度関数P(x)は以下の数式(3)で表現される。
【数3】
【0027】
数式(3)の形状母数αは以下の数式(4A)および数式(4B)で定義され、数式(3)の尺度母数(scaling parameter)θは以下の数式(5)で定義される。また、数式(3)の記号Γ(α)は、以下の数式(6)で定義されるガンマ関数を意味する。なお、記号E[ ]は平均値(期待値)を意味する。図1の特性値算定部42は、雑音区間内の音響信号x(t)のパワー|X(f,τ)|2を数式(4B)の確率変数xに適用して数式(4A)で算定される形状母数αを、最初の雑音抑圧処理の実行前の音響信号x(t)の形状母数α0として算定する。
【数4】
【数5】
【数6】
【0028】
図1の第1係数設定部44は、雑音抑圧部36が数式(2B)のフロアリング処理に適用するフロアリング係数ηを、特性値算定部42が算定した形状母数α0に応じて可変に設定する。具体的には、雑音抑圧処理に起因した音響信号y(t)のミュージカルノイズが最小化され、かつ、雑音抑圧処理により雑音成分が確かに抑圧されるように、フロアリング係数ηは算定される。
【0029】
フロアリング係数ηが満たすべき条件を特定するために、1回の雑音抑圧処理に便宜的に着目して、ミュージカルノイズの発生の度合と雑音成分の抑圧の度合との関係を検討する。まず、雑音抑圧処理に起因したミュージカルノイズが非ガウス性の雑音であることを考慮し、強度分布(確率密度関数)のガウス性の指標となる尖度(kurtosis)を、雑音抑圧処理に起因したミュージカルノイズの発生量の定量的な指標として利用する。具体的には、雑音抑圧処理の前後にわたる尖度の変化が大きいほどミュージカルノイズが顕在化するという傾向を考慮して、雑音抑圧処理の実行前の尖度KAに対する実行後の尖度KBの相対比(以下「尖度比」という)κをミュージカルノイズの発生量の指標として利用する(κ=KB/KA)。尖度比κが大きいほどミュージカルノイズが多く、尖度比κが1である場合(雑音抑圧処理の実行の前後で尖度が変化しない場合)にはミュージカルノイズは発生していないと評価できる。なお、尖度(尖度比κ)とミュージカルノイズとの相関については特許文献1にも詳述されている。
【0030】
確率密度関数P(x)の尖度Kは以下の数式(7)で表現される。
【数7】
数式(7)の記号μm(μ2,μ4)は、確率密度関数P(x)の原点回りのm次モーメントを意味し、以下の数式(8)で定義される。
【数8】
【0031】
非特許文献1の記載から理解されるように、雑音抑圧処理後のm次モーメントμmは以下の数式(9)で表現される。数式(9)の関数M(α,β,η,m)は、数式(10)で定義される。
【数9】
【数10】
【0032】
数式(10)の記号Γ(b,a)は、以下の数式(11)で定義される第1種不完全ガンマ関数であり、数式(10)の記号γ(b,a)は、以下の数式(12)で定義される第2種不完全ガンマ関数である。
【数11】
【数12】
【0033】
数式(7)および数式(9)から、雑音抑圧処理の実行後の尖度Kを示す以下の数式(13)が導出される。また、雑音抑圧処理の実行前の尖度Kは、数式(13)において抑圧係数βおよびフロアリング係数ηを0とした以下の数式(14)で表現される。
【数13】
【数14】
したがって、雑音抑圧処理の前後にわたる尖度比κは、以下の数式(15)で表現される。
【数15】
【0034】
他方、雑音抑圧処理による雑音成分の抑圧度合の指標値として雑音抑圧率(Noise Reduction Rate)Rを導入する。非特許文献1から理解されるように、雑音抑圧率Rは、音響信号x(t)の強度分布の形状母数αと数式(10)の関数M(α,β,η,m)とを含む以下の数式(16)で表現される。数式(16)の雑音抑圧率Rは、雑音抑圧処理の実行後のSN(Signal to Noise)比と雑音抑圧処理の実行前のSN比との差分(デシベル値)を意味し、1回の雑音抑圧処理における雑音成分の抑圧量の指標として機能する。
【数16】
【0035】
図2は、数式(15)の尖度比κ(縦軸)と数式(16)の雑音抑圧率R(横軸)との関係を示すグラフである。図2では、雑音成分の形状母数αが1.0(白色ガウス雑音)である場合を想定し、フロアリング係数ηを0.0に設定した場合(破線)と1.0に設定した場合(実線)との各々について抑圧係数βを変化させたときの尖度比κと雑音抑圧率Rとの相関が図示されている。図2の矢印は、抑圧係数βが増加する方向を意味する。
【0036】
フロアリング係数ηを0.0に設定した場合、抑圧係数βの増加とともに尖度比κおよび雑音抑圧率Rの双方が単調に増加する。したがって、雑音抑圧の効果が増加する一方でミュージカルノイズが増大する。他方、フロアリング係数ηを1.0に設定した場合、尖度比κと雑音抑圧率Rとの関係は、抑圧係数βの変化に対してヒステリシスループを描き、雑音抑圧率Rが0となる地点(雑音成分が抑圧されない場合)以外で尖度比κが1となる特定点pが存在する。尖度比κが1に維持される(すなわち雑音抑圧処理の前後で尖度Kが変化しない)ということは、雑音抑圧処理の前後で論理的にはミュージカルノイズが発生しないことを意味する。すなわち、ミュージカルノイズを発生させることなく雑音成分を有効に抑制できる抑圧係数βとフロアリング係数ηとの組合せが存在するという事実が図2から確認できる。抑圧係数βを所定値に固定した場合を想定すると、フロアリング係数ηを適切な数値に設定することで、ミュージカルノイズを発生させることなく雑音成分を抑圧することが可能である。
【0037】
以上の知見を踏まえて、ミュージカルノイズを発生させないための第1条件と、雑音成分を抑圧するための第2条件との双方を成立させることを検討する。第1条件は、雑音抑圧処理の前後で尖度Kが変化しないという条件であり、第2条件は、雑音抑圧処理による雑音抑圧率Rが正数であるという条件である。第1条件および第2条件の各々について以下に詳述する。
【0038】
[第1条件]
第i回目(i=0,1,2,……)の雑音抑圧処理の実行後の尖度K(αi,β,η)の強度分布の形状母数αを第(i+1)回目の雑音抑圧処理の対象となる強度分布の形状母数αi+1とする場合、尖度K(αi,β,η)と形状母数αi+1との間には以下の数式(17)が成立する。数式(17)の導出については非特許文献1に詳述されている。
【数17】
【0039】
最初(i=0)の雑音抑圧処理の実行前の強度分布(すなわち音響信号x(t)の強度分布)の尖度K(α0,0,0)は、以下の数式(18)で表現される。
【数18】
【0040】
第1条件が成立する場合、以下の数式(19)で表現されるように、任意の時点の尖度K(αi,β,η)が雑音抑圧処理前の尖度K(α0,0,0)と同等となる。
【数19】
【0041】
数式(10)の関数M(α,β,η,m)を、以下の数式(20)に示すように、フロアリング係数ηを含まない関数S(α,β,m)および関数F(α,β,m)で便宜的に簡略化すると、最初の雑音抑圧処理の直後の尖度K(α0,β,η)は数式(21)で表現される。
【数20】
【数21】
【0042】
数式(19)と数式(21)とから、第1条件を表現する以下の数式(22)が導出される。
【数22】
フロアリング係数ηの4乗を変数Hで置換すると、数式(22)は以下の数式(23)に変形される。
【数23】
【0043】
数式(23)を変数Hについて整理することで、第1条件を満たすフロアリング係数η(η=H1/4)を規定する以下の数式(24)が導出される。
【数24】
第1実施形態では抑圧係数βは所定値に固定される。したがって、数式(24)は、音響信号x(t)の強度分布の尖度が雑音抑圧処理(1回の雑音抑圧処理およびQ回にわたる雑音抑圧処理の反復)の前後で変化しない場合における形状母数αとフロアリング係数ηとの関係を規定する関係式として利用可能である。
【0044】
[第2条件]
第2条件は、1回の雑音抑圧処理での雑音成分の抑圧量を意味する数式(16)の雑音抑圧率Rが正数であるという条件である。したがって、前述の関数S(α,β,m)および関数F(α,β,m)を利用することで、第2条件を表現する数式(25)が導出される。
【数25】
【0045】
フロアリング係数ηが正数であることを加味すると、第2条件を満たすフロアリング係数ηの範囲を規定する以下の数式(26)が導出される。
【数26】
【0046】
図1の第1係数設定部44は、数式(24)および数式(26)を満たすように、特性値算定部42が算定した形状母数α0に応じたフロアリング係数ηを算定する。具体的には、第1係数設定部44は、形状母数α0について数式(24)の演算を実行することで変数Hを算定するとともに変数Hの4乗根をフロアリング係数η(η=H1/4)として算定する。数式(24)からは複数のフロアリング係数ηが算定される。第1係数設定部44は、複数のフロアリング係数ηのうち数式(26)を満たす1個のフロアリング係数ηを選択する。第1係数設定部44が設定したフロアリング係数ηが雑音抑圧部36による雑音抑圧処理(数式(2B)のフロアリング処理)に適用される。
【0047】
以上に説明したように第1実施形態では、雑音抑圧処理の前後で尖度Kが変化しないという第1条件(数式(24))を満たすようにフロアリング係数ηが推定雑音成分n(t)の形状母数α0に応じて可変に設定される。したがって、以下に詳述するように、ミュージカルノイズの発生を有効に抑制(理想的には完全に防止)しながら音響信号x(t)の雑音成分を抑圧することが可能である。
【0048】
図3は、雑音抑圧処理の前後の尖度比κを示すグラフであり、図4は、雑音抑圧処理の実行後の音響信号y(t)のケプストラム歪dを示すグラフである。ケプストラム歪dは、目的音成分のケプストラムと雑音抑圧処理後の音響信号y(t)のケプストラムとの誤差を示す指標値である。すなわち、ケプストラム歪dが小さいほど雑音抑圧性能が高い(すなわち目的音成分のスペクトル包絡が忠実に再現される)と評価できる。
【0049】
図3および図4では、フロアリング係数ηを所定値に固定して1回だけ雑音抑圧処理を実行した場合(対比例1/One-Shot SS)と、ウィーナフィルタを適用した雑音抑圧処理を実行した場合(対比例2/Wiener filtering)と、MMSE-STSA(Minimum Mean-Square Error - Short-Time Spectral Amplitude)を利用した雑音抑圧処理を実行した場合(対比例3/MMSE-STSA)と、第1実施形態とが対比的に併記されている。図3および図4では、白色ガウス雑音(α0=0.97)を音響信号x(t)の雑音成分とした場合(White Gaussian Noise)と会話音(α0=0.21)を音響信号x(t)の雑音成分とした場合とが想定されている。
【0050】
図4から理解されるように、第1実施形態によれば、雑音成分が会話音である場合には対比例1から対比例3を上回る雑音抑圧性能が実現される。また、雑音成分が白色ガウス雑音である場合には、対比例1および対比例2を上回るとともに対比例3に匹敵する雑音抑圧性能が実現される。そして、図3から理解されるように、第1実施形態によれば、雑音成分が白色ガウス雑音および会話音の何れの場合でも、対比例1から対比例3と比較して、雑音抑圧の前後にわたる尖度比κは1に近い数値に低減される。すなわち、対比例1から対比例3の何れと比較した場合でも、第1実施形態によればミュージカルノイズを有効に低減できることが理解される。以上に説明したように、第1実施形態によれば、ミュージカルノイズを有効に低減しながら高度な雑音抑圧を実現することが可能である。
【0051】
<第2実施形態>
本発明の第2実施形態を以下に説明する。なお、以下に例示する各形態において作用や機能が第1実施形態と同等である要素については、第1実施形態の説明で参照した符号を流用して各々の詳細な説明を適宜に省略する。
【0052】
図5は、第2実施形態に係る雑音抑圧装置100Bのブロック図である。図5に示すように、第2実施形態の雑音抑圧装置100Bは、第1実施形態の雑音抑圧装置100Aに第2係数設定部46を追加した構成である。第2係数設定部46は、特性値算定部42が算定した形状母数α0と第1係数設定部44が設定したフロアリング係数ηとに応じて、各雑音抑圧処理の減算処理(数式(2A))に適用される抑圧係数βを可変に設定する。抑圧係数βの設定には、記憶装置24に事前に記憶された図6の係数テーブルTBLが使用される。
【0053】
図6の係数テーブルTBLは、形状母数α0の各数値(α0_1,α0_2,……)とフロアリング係数ηの各数値(η_1,η_2,……)との組合せに対して抑圧係数βの数値(β11,β12,……)を対応させたデータテーブルである。形状母数α0およびフロアリング係数ηの組合せに対応する抑圧係数βの数値は、その形状母数α0およびフロアリング係数ηのもとで高い雑音抑圧性能が実現されるように事前に選定される。
【0054】
数式(16)の雑音抑圧率Rは、雑音抑圧処理の前後のパワー比の対数値であるから、雑音抑圧処理毎に累算(加算)される。したがって、第(i+1)回目の雑音抑圧処理を実行した時点の雑音抑圧率R(αi+1,β,η)は以下の数式(27)で表現される。
【数27】
係数テーブルTBLのうち各形状母数α0とフロアリング係数ηとの組合せに対応する抑圧係数βは、その形状母数α0およびフロアリング係数ηのもとで反復回数Qにわたる雑音抑圧処理を実行した場合の数式(27)の雑音抑圧率R(αQ,β,η)に応じて設定される。具体的には、抑圧係数βは、雑音抑圧率R(αQ,β,η)が最大となる数値や雑音抑圧率R(αQ,β,η)が所定の目標値Rtarを上回る数値に設定される。目標値Rtarは、例えば入力装置(図示略)に対する利用者からの指示に応じて可変に設定される。
【0055】
第2係数設定部46は、特性値算定部42が算定した形状母数α0と第1係数設定部44が設定したフロアリング係数ηとの組合せに対応する抑圧係数βを係数テーブルTBLから検索および取得して雑音抑圧部36に指示する。雑音抑圧部36は、第1係数設定部44から指示されるフロアリング係数ηと第2係数設定部46から指示される抑圧係数βとを適用した雑音抑圧処理を所定の反復回数Qにわたり反復することでスペクトルY(f,τ)を生成する。
【0056】
第2実施形態においても第1実施形態と同様の効果が実現される。また、第2実施形態では、特性値算定部42が算定した形状母数α0と第1係数設定部44が設定したフロアリング係数ηとに応じて抑圧係数βが可変に設定されるから、抑圧係数βを所定値に固定した構成と比較して雑音抑圧性能(雑音抑圧率R)を向上することが可能である。
【0057】
なお、以上の説明では係数テーブルTBLから抑圧係数βを取得したが、抑圧係数βを設定する方法は適宜に変更される。例えば、第2係数設定部46が、抑圧係数βの複数の候補値bの各々を形状母数α0およびフロアリング係数ηとともに数式(27)に適用して候補値b毎に雑音抑圧率R(αQ,β,η)を算定し、雑音抑圧率R(αQ,β,η)が最大となる候補値bを抑圧係数βとして選択することも可能である。また、係数テーブルTBLと数式(27)の演算とを併用する構成も採用され得る。例えば第2係数設定部46は、形状母数α0およびフロアリング係数ηの組合せに対応する抑圧係数βを係数テーブルTBLから取得し、その抑圧係数βを含む所定の範囲内の複数の候補値bの各々について数式(27)の演算で雑音抑圧率R(αQ,β,η)を算定する。そして、雑音抑圧率R(αQ,β,η)が最大となる候補値bを抑圧係数βとして選択する。
【0058】
<第3実施形態>
図7は、第3実施形態に係る雑音抑圧装置100Cのブロック図である。図7に示すように、第3実施形態の雑音抑圧装置100Cは、第1実施形態の雑音抑圧装置100Aに反復回数設定部48を追加した構成である。反復回数設定部48は、特性値算定部42が算定した形状母数α0と第1係数設定部44が設定したフロアリング係数ηとに応じて雑音抑圧部36による雑音抑圧処理の反復回数Qを可変に設定する。
【0059】
具体的には、反復回数設定部48は、反復回数Qの複数の候補値qの各々について、特性値算定部42が算定した形状母数α0と第1係数設定部44が設定したフロアリング係数ηと所定の抑圧係数βとのもとでその候補値qの回数だけ雑音抑圧処理を反復した場合の雑音抑圧率R(αq,β,η)を数式(27)の演算で算定し、雑音抑圧率R(αq,β,η)が目標値Rtarを上回る最小の候補値qを反復回数Qとして確定する。目標値Rtarは、例えば入力装置(図示略)に対する利用者からの指示に応じて可変に設定される。雑音抑圧部36は、反復回数設定部48が設定した反復回数Qにわたり雑音抑圧処理を反復する。
【0060】
第3実施形態においても第1実施形態と同様の効果が実現される。また、第3実施形態では、特性値算定部42が算定した形状母数α0と第1係数設定部44が設定したフロアリング係数ηとに応じて雑音抑圧処理の反復回数Qが可変に設定されるから、雑音抑圧処理の過不足を防止することが可能である。具体的には、雑音抑圧処理の不足を防止して目標値Rtarを確実に達成するとともに雑音抑圧処理の過剰を防止して演算処理装置22の演算量を削減できるという利点がある。
【0061】
なお、以上の説明では数式(27)の演算で反復回数Qを設定したが、事前に用意されたテーブルを利用して反復回数Qを設定することも可能である。例えば、形状母数α0の各数値とフロアリング係数ηの各数値との組合せ毎に目標値Rtarを達成し得る反復回数Qを設定したテーブルを記憶装置24に事前に格納し、特性値算定部42が算定した形状母数α0と第1係数設定部44が設定したフロアリング係数ηとに対応する反復回数Qを反復回数設定部48がテーブルから検索して雑音抑圧部36に指示する。
【0062】
<第4実施形態>
図8は、第4実施形態に係る雑音抑圧装置100Dのブロック図である。図8に示すように、第4実施形態の雑音抑圧装置100Dは、収音部50と周波数分析部52と信号処理部54と出力処理部56と波形合成部58とを具備する。収音部50は、相互に離間して配置されたD個(Dは2以上の自然数)の収音機器51で構成されるマイクロホンアレイであり、各収音機器51が生成したDチャネルの音響信号x1(t)〜xD(t)を周波数分析部52に供給する。各音響信号xd(t)(d=1〜D)は、目的音成分と雑音成分との混合音の波形を示す時間領域信号である。目的音成分は、特定の音源方向から到来する音響成分である。雑音抑圧装置100Dは、音響信号x1(t)〜xD(t)から雑音成分を抑圧した音響信号y(t)を生成する。
【0063】
周波数分析部52は、Dチャネルの音響信号x1(t)〜xD(t)の各々のスペクトルXd[0](f,τ)(X1[0](f,τ)〜XD[0](f,τ))をフレーム毎に順次に生成する。図8に示すように、スペクトルX1[0](f,τ)〜XD[0](f,τ)を要素とするD次元のベクトル(以下「観測ベクトル」という)V[0](f,τ)が周波数分析部52から出力される(V[0](f,τ)=[X1[0](f,τ),X2[0](f,τ),……,XD[0](f,τ)]T)。記号Tは行列の転置を意味する。
【0064】
信号処理部54は、周波数分析部52が生成したDチャネルのスペクトルX1[0](f,τ)〜XD[0](f,τ)(観測ベクトルV[0](f,τ))からDチャネルのスペクトルY1(f,τ)〜YD(f,τ)を生成する。スペクトルYd(f,τ)は、スペクトルXd[0](f,τ)から雑音成分を抑圧したスペクトルである。図8に示すように、信号処理部54は、相互に縦続に接続されてDチャネルの音響信号x1(t)〜xD(t)(X1[0](f,τ)〜XD[0](f,τ))を順次に処理するQ段の単位処理部U[1]〜U[Q]を含んで構成される。
【0065】
図9は、信号処理部54の第q段目(q=1〜Q)の単位処理部U[q]のブロック図である。各単位処理部U[q]は、前段(第(q-1)段)から供給される観測ベクトルV[q-1](f,τ)に対する雑音抑圧処理で観測ベクトルV[q](f,τ)を生成する。第1段目の単位処理部U[1]には周波数分析部52が生成した観測ベクトルV[0](f,τ)が供給される。第Q段目(最終段)の単位処理部U[Q]が生成した観測ベクトルV[Q](f,τ)がDチャネルのスペクトルY1(f,τ)〜YD(f,τ)に相当する(V[Q](f,τ)=[Y1(f,τ),Y2(f,τ),……,YD(f,τ)]T)。
【0066】
図9に示すように、各単位処理部U[q]は、雑音推定部62と雑音抑圧用係数設定部64と雑音抑圧部66とを具備する。雑音推定部62は、観測ベクトルV[q-1](f,τ)に対する独立成分分析で推定雑音成分の推定雑音ベクトルZ[q](f,τ)を生成する。第4実施形態の雑音推定部62は、独立成分分析部622と逆射影部624とを含んで構成される。
【0067】
独立成分分析部622は、周波数領域での独立成分分析(FD-ICA:Frequency Domain-Independent Component Analysis)を利用した音源分離を観測ベクトルV[q-1](f,τ)に対して実行することで分離ベクトルG[q](f,τ)を生成する。分離ベクトルG[q](f,τ)は、D個の要素g1[q](f,τ)〜gD[q](f,τ)で構成され、以下の数式(28)で表現される。
【数28】
数式(28)の記号W[q](f)は分離行列を意味し、公知の更新式の演算を累積的に反復することで算定される。
【0068】
独立成分分析部622が生成した分離ベクトルG[q](f,τ)のうち目的音成分に相当する要素(gs[q](f,τ))をゼロに置換した分離ベクトルG(noise)[q](f,τ)が逆射影部624に供給される。すなわち、分離ベクトルG(noise)[q](f,τ)は、以下の数式(29)で表現される。要素gs[q](f,τ)は、独立成分分析で推定された目的音成分である。
【数29】
【0069】
逆射影部624は、独立成分分析のスケーリング問題を解決するための逆射影(projection back)を分離ベクトルG(noise)[q](f,τ)に適用することで推定雑音ベクトルZ[q](f,τ)を生成する。具体的には、推定雑音ベクトルZ[q](f,τ)は以下の数式(30)の演算で生成される。
【数30】
推定雑音ベクトルZ[q](f,τ)は、各チャネルに対応するD個の推定雑音成分z1[q](f,τ)〜zD[q](f,τ)を要素とするベクトルである(Z[q](f,τ)=[z1[q](f,τ),z2[q](f,τ),……,zD[q](f,τ)]T)。
【0070】
図9の雑音抑圧用係数設定部64は、各チャネルのフロアリング係数η[1]〜η[D]を設定する要素であり、特性値算定部642と第1係数設定部644とを含んで構成される。特性値算定部642は、推定雑音ベクトルZ[q](f,τ)から各チャネルの形状母数α0[1]〜α0[D]を算定する。形状母数α0[d]は、推定雑音ベクトルZ[q](f,τ)の推定雑音成分zd[q](f,τ)の強度分布に応じた変数である。特性値算定部642が推定雑音成分zd[q](f,τ)から形状母数α0[d]を算定する方法は、第1実施形態の特性値算定部42が推定雑音成分n(t)から形状母数α0を算定する方法と同様である。
【0071】
第1係数設定部644は、特性値算定部642が算定した形状母数α0[1]〜α0[D]からチャネル毎のフロアリング係数η[1]〜η[D]を算定する。具体的には、第1係数設定部644は、第1実施形態の第1係数設定部44と同様に、第1条件を表現する数式(24)と第2条件を表現する数式(26)とを満たすように、形状母数α0[d]に応じたフロアリング係数η[d]を算定する。
【0072】
図9の雑音抑圧部66は、第1係数設定部644が算定したフロアリング係数η[1]〜η[D]を適用した雑音抑圧処理を観測ベクトルV[q-1](f,τ)に対して実行することで観測ベクトルV[q](f,τ)を生成する。雑音抑圧処理はチャネル毎に個別に実行される。すなわち、雑音抑圧部66は、フロアリング係数η[d]を適用した雑音抑圧処理を音響信号xd(t)のスペクトルXd[q-1](f,τ)に対して実行することでスペクトルXd[q](f,τ)を生成する。具体的には、雑音抑圧部66は、以下の数式(31A)で表現される減算処理と数式(31B)で表現されるフロアリング処理とを周波数f毎に択一的に実行する。すなわち、第4実施形態の信号処理部54では、周波数分析部52が生成したスペクトルXd[0](f,τ)に対してQ回の雑音抑圧処理が累積的に反復される。
【数31】
【0073】
図8の出力処理部56は、信号処理部54(第Q段目の単位処理部U[Q])が生成したDチャネルのスペクトルY1(f,τ)〜YD(f,τ)から音響信号y(t)のスペクトルY(f,τ)をフレーム毎に生成する。具体的には、出力処理部56は、目的音成分の方向に収音のビーム(感度が高い領域)を形成する遅延加算型ビームフォーマであり、遅延部562と加算部562とを含んで構成される。
【0074】
遅延部562は、スペクトルY1(f,τ)〜YD(f,τ)の各々を目的音成分の音源方向φに応じた遅延量だけ遅延させる。音源方向φは、信号処理部54のQ個の単位処理部U[1]〜U[Q]から選択された1個の単位処理部U[q](例えば最終段の単位処理部U[Q])における独立成分分析部622が推定した分離行列W[q](f)から特定される。
【0075】
加算部564は、遅延部562による遅延後のDチャネルのスペクトルY1(f,τ)〜YD(f,τ)を加算することで音響信号y(t)のスペクトルY(f,τ)を生成する。以上の説明から理解されるように、出力処理部56が生成するスペクトルY(f,τ)は、音源方向φの目的音成分を強調した信号となる。
【0076】
図8の波形合成部58は、第1実施形態の波形合成部38と同様に、出力処理部56がフレーム毎に生成するスペクトルY(f,τ)から時間領域の音響信号y(t)を生成する。音響信号y(t)は、例えば放音装置(図示略)に供給されて音波として再生される。
【0077】
以上に説明した第4実施形態においても第1実施形態と同様の効果が実現される。また、第4実施形態では、雑音抑圧処理毎(単位処理部U[q]毎)に独立成分分析で推定雑音成分zd[q](f,τ)が推定されるから、音響信号xd(t)の途中の時点で雑音成分の特性が変動した場合でも高精度な雑音抑圧を実現できるという利点がある。また、DチャネルのスペクトルY1(f,τ)〜YD(f,τ)が出力処理部56にて加算されるから、各スペクトルYd(f,τ)にミュージカルノイズが仮に発生した場合でも音響信号y(t)では知覚され難くすることが可能である。
【0078】
図10から図12は雑音抑圧の評価結果を示すグラフである。第4実施形態での雑音抑圧の評価結果と公知のBSSA(Blind Spacial Subtraction Array)を利用した雑音抑圧(以下「対比例4」という)の評価結果とが対比的に図示されている。図10は、雑音抑圧の前後の尖度比κを示すグラフであり、図11は、雑音抑圧後の音響信号y(t)のケプストラム歪dを示すグラフである。図10および図11では、所定の音声にインパルス応答を畳込んだ音響を目的音成分とし、駅構内で収録された雑音成分(駅雑音)および人混みで収録された雑音成分(人混音)を目的音成分に付加した各場合について尖度比κおよびケプストラム歪dが図示されている。また、図12は、雑音抑圧後の音響信号y(t)の音質の主観評価の結果である。具体的には、第4実施形態による雑音抑圧の結果が高音質であると評価した被験者と対比例4の結果が高音質であると評価した被験者との比率が図12では図示されている。
【0079】
図10に示すように、第4実施形態では、雑音抑圧の前後にわたる尖度比κが対比例4と比較して1に近い数値に低減されるから、ミュージカルノイズを有効に抑制できることが理解される。他方、第4実施形態の処理後の音響信号y(t)のスペクトル歪dは対比例4と比較して大きいという傾向が図11から把握される。しかし、図12の主観評価によれば、第4実施形態による処理後の音響信号y(t)のほうが対比例4と比較して高音質であると90%程度の被験者が評価している。すなわち、第4実施形態によれば、受聴者が知覚する音質を高い水準に維持しながら雑音抑圧を実現できるという効果が実現される。
【0080】
<変形例>
以上の各形態は多様に変形される。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様は適宜に併合され得る。
【0081】
(1)前述の各形態の減算処理では、第(i-1)回目の雑音抑圧後のパワースペクトル|Yi-1(f,τ)|2から推定雑音成分n(t)のパワースペクトル|Ni-1(f,τ)|2を減算したが、以下の数式(2A')に示すように、減算処理における振幅スペクトル|Yi-1(f,τ)|および振幅スペクトル|Ni-1(f,τ)|の冪指数は任意の正数Kとして一般化され得る。減算処理における冪指数Kの一般化については、例えば井上等,“一般化スペクトル減算法におけるミュージカルノイズ発生量の数理解析,日本音響学会講演論文集,3-5-4,p.759−762,2010年3月(以下「非特許文献2」という)にも詳述されている。
【数32】
【0082】
非特許文献2によれば、冪指数Kを小さい数値に設定したほうが聴感的に自然な音響信号y(t)を生成できる。したがって、理想的には、演算処理装置22の演算処理の範囲内(例えば、演算処理装置22が演算可能な浮動小数点数のもとでアンダーフローを回避して有意な数値が得られる限度内)で最小の数値に冪指数Kは設定される。具体的には、冪指数Kを1以下の数値(更に好適には0.5を下回る数値)に設定することが可能である。
【0083】
(2)雑音抑圧処理の具体的な内容は前述の数式(2A)(または数式(2A'))および数式(2B)に限定されない。例えば、以下の数式(32A)および数式(32B)で表現されるウィーナフィルタを1回の雑音抑圧処理にて周波数f毎に択一的に実行することも可能である。
【数33】
【0084】
数式(32A)および数式(32B)の雑音抑圧処理の実行後のm次モーメントμmは、例えばT. Inoue, et al., "Theoretical analysis of musical noise in Wiener filtering family via higher-order statistics", Proc. ICASSP2011, p.5076-5079, 2011に開示される通り、以下の数式(33)で表現される。数式(33)の関数MWF(α,β,η,m)は、数式(34)で定義される。
【数34】
したがって、前述の数式(24)および数式(26)と同様に、第1条件および第2条件の双方を満たす(すなわち理論的にはミュージカルノイズを発生させない)フロアリング係数ηを算定することが可能である。
【0085】
(3)第4実施形態では、各単位処理部U[q]の雑音推定部62がチャネル毎に推定雑音成分z1[q](f,τ)〜zD[q](f,τ)を生成したが、Dチャネルについて共通の推定雑音成分を雑音推定部62が独立成分分析で生成することも可能である。雑音抑圧部66は、Dチャネルの各々のスペクトルX1[q-1](f,τ)〜XD[q-1](f,τ)(観測ベクトルV[q-1](f,τ))から共通の推定雑音成分を抑圧する雑音抑圧処理を実行する。
【0086】
(4)前述の各形態では、第1係数設定部44が数式(24)の演算でフロアリング係数ηを算定したが、形状母数α0や抑圧係数βの各数値にフロアリング係数ηを対応付けた係数テーブルを参照することで第1係数設定部44がフロアリング係数ηを設定する構成も採用され得る。フロアリング係数ηの設定用の係数テーブルでは、数式(24)の関係(第1条件)が成立するように、形状母数α0および抑圧係数βの組合せとフロアリング係数ηとが対応付けられる。以上の説明から理解されるように、第1係数設定部44は、第1条件を規定する関係式を満たすように形状母数α0に応じてフロアリング係数ηを可変に設定する要素として包括され、フロアリング係数ηを実際の演算で算定するか係数テーブルから取得するかは不問である。
【0087】
(5)前述の各形態では雑音抑圧部36が反復型の雑音抑圧を実行したが、音響信号x(t)の各フレームについて雑音抑圧部36が雑音抑圧処理を1回だけ実行する構成にも本発明は適用される。すなわち、雑音抑圧処理の反復は本発明において必須ではない。雑音抑圧処理を各フレームにつき1回だけ実行する構成でも、第1条件および第2条件を満たすようにフロアリング係数ηを設定することで、フロアリング係数ηを所定値に固定した構成と比較すれば、ミュージカルノイズの発生を抑制しながら音響信号x(t)の雑音成分を抑圧できるという所期の効果は実現される。
【0088】
(6)第2実施形態の第2係数設定部46と第3実施形態の反復回数設定部48との双方を具備する構成も採用され得る。反復回数設定部48は、反復回数Qの複数の候補値qの各々について、第1係数設定部44が設定したフロアリング係数ηと第2係数設定部46が設定した抑圧係数βとを適用した雑音抑圧処理をその回数qだけ反復した場合の雑音抑圧率R(αq,β,η)を数式(27)の演算で算定し、雑音抑圧率R(αq,β,η)が目標値Rtarを上回る最小の候補値qを反復回数Qとして確定する。
【0089】
(7)第2実施形態では、形状母数α0およびフロアリング係数ηの双方に応じて抑圧係数βを設定したが、抑圧係数βを制御する方法は以上の例示に限定されない。例えば、形状母数α0に応じて抑圧係数β(フロアリング係数ηには依存しない数値)を設定することも可能である。
【0090】
(8)前述の各形態では、音響信号x(t)の強度分布を近似する確率密度関数P(x)の形状母数α0を推定雑音成分n(t)の特性の指標(雑音特性値)として例示したが、雑音特性値は形状母数α0に限定されない。例えば、音響信号x(t)の強度分布から直接に算定される統計量(例えば尖度等の高次統計量)や、音響信号x(t)の振幅|X(f,τ)|の度数分布に応じた統計量(例えば振幅|X(f,τ)|の度数分布を近似する確率密度関数の形状母数)を雑音特性値として利用することも可能である。すなわち、雑音特性値は、音響信号x(t)の特性(特に推定雑音成分n(t)の特性)に応じて変化する数値(典型的には強度分布の形状に応じた数値)として包括される。
【0091】
(9)前述の各形態では、雑音抑圧部36を具備する雑音抑圧装置100(100A,100B,100C)を例示したが、雑音抑圧に適用される変数(例えばフロアリング係数η,抑圧係数β,反復回数Q)を可変に設定する装置(以下「雑音抑圧用係数設定装置」という)としても本発明は実現され得る。雑音抑圧用係数設定装置に雑音抑圧部36や雑音推定部34を追加することで雑音抑圧装置100が実現される。例えば第1実施形態に対応する雑音抑圧用係数設定装置は、前述の各形態における特性値算定部42および第1係数設定部44を含んで構成される。また、第4実施形態の雑音抑圧用係数設定部64は、本発明の各態様に係る雑音抑圧用係数設定装置に相当する。雑音抑圧用係数設定装置には、第2実施形態の第2係数設定部46や第3実施形態の反復回数設定部48が適宜に追加され得る。
【符号の説明】
【0092】
100A,100B,100C、100D……雑音抑圧装置、12……信号供給装置、14……放音装置、22……演算処理装置、24……記憶装置、32,52……周波数分析部、34,62……雑音推定部、36,66……雑音抑圧部、38,58……波形合成部、42……特性値算定部、44……第1係数設定部、46……第2係数設定部、48……反復回数設定部、50……収音部、51……収音機器、54……信号処理部、U[q](U[1]〜U[Q])……単位処理部、56……出力処理部。
【技術分野】
【0001】
本発明は、音響信号から雑音成分を抑圧する技術に関する。
【背景技術】
【0002】
周波数領域で音響信号から雑音成分を抑圧する雑音抑圧技術では、雑音抑圧処理に起因して発生する耳障りなミュージカルノイズの発生が問題となる。特許文献1には、音響信号の強度分布の尖度に応じた雑音指標値をミュージカルノイズの発生度合の指標として算定し、雑音抑圧処理に適用される抑圧係数やフロアリング係数を雑音指標値に応じて可変に設定する技術が開示されている。また、非特許文献1には、雑音抑圧処理の前後にわたる音響信号の強度分布の尖度比や雑音抑圧処理による雑音抑圧率を定式化し得ることが開示されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2010−020012号公報
【非特許文献】
【0004】
【非特許文献1】T. Inoue, et al., "Theoretical analysis of iterative weak spectral subtraction via higher-order statistics", Proc. MLSP2010, p.220-225, 2010
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかし、特許文献1や非特許文献1の技術のもとでも、実際にはミュージカルノイズの発生を有効に抑制し得る最適な係数を選定することは必ずしも容易ではなかった。以上の事情を考慮して、本発明は、ミュージカルノイズの発生を有効に抑制し得る雑音抑圧の実現を目的とする。
【課題を解決するための手段】
【0006】
本発明の雑音抑圧用係数設定装置は、入力音響信号(例えば音響信号x(t))の強度分布の形状に応じた雑音特性値を算定する特性値算定手段と、音響信号の強度分布の尖度が雑音抑圧処理の前後で変化しない場合における当該音響信号の雑音特性値(例えば形状母数α0)と雑音抑圧処理のフロアリング処理に適用されるフロアリング係数(例えばフロアリング係数η)との関係を規定する関係式(例えば数式(24))を満たすように、特性値算定手段が算定した雑音特性値に応じてフロアリング係数を可変に設定する第1係数設定手段とを具備する。
【0007】
以上の構成では、雑音抑圧処理の前後で強度分布の尖度が変化しないという条件(第1条件)を満たすようにフロアリング係数が雑音特性値に応じて可変に設定される。したがって、ミュージカルノイズの発生を有効に抑制(理想的には完全に防止)しながら雑音成分を抑圧することが可能である。
【0008】
本発明の好適な態様において、第1係数設定手段は、雑音抑圧処理による雑音抑圧率が正数となるようにフロアリング係数を設定する。以上の態様では、雑音抑圧率が正数であるという条件(第2条件)を満たすようにフロアリング係数が設定される。例えば、雑音特性値とフロアリング係数との関係式を満たす複数のフロアリング係数から雑音抑圧率が正数となるフロアリング係数が選択される。したがって、雑音抑圧を有効に実現し得る有意なフロアリング係数を雑音抑圧処理に適用することが可能である。
【0009】
本発明の好適な態様の雑音抑圧用係数設定装置は、雑音抑圧強度を制御するための抑圧係数(例えば抑圧係数β)を、特性値算定手段が算定した雑音特性値に応じて可変に設定する第2係数設定手段を具備する。例えば、雑音抑圧処理による雑音抑圧率が最大となる抑圧係数や雑音抑圧率が目標値を上回る抑圧係数が設定される。以上の態様では、雑音抑圧処理(減算処理)に適用されて雑音抑圧強度を制御する抑圧係数が、入力音響信号の雑音特性値に応じて可変に設定されるから、抑圧係数を所定値に固定した構成と比較して適切な雑音抑圧が実現される。なお、以上の態様の具体例は例えば第2実施形態として後述される。
【0010】
本発明の好適な態様の雑音抑圧用係数設定装置は、各雑音抑圧処理による雑音抑圧率の累算値が目標値を上回るように、特性値算定手段が算定した雑音特性値と第1係数設定手段が設定したフロアリング係数とに応じて雑音抑圧処理の反復回数(例えば反復回数Q)を可変に設定する反復回数設定手段を具備する。以上の態様では、雑音抑圧率の累算値が目標値を上回るように雑音抑圧処理の反復回数が可変に設定されるから、反復回数を所定値に固定した構成と比較して雑音抑圧処理の過不足を抑制することが可能である。なお、以上の態様の具体例は例えば第3実施形態として後述される。また、雑音抑圧処理は入力音響信号に対して累積的に反復される。雑音抑圧処理の累積的な反復とは、音響信号の一の区間に対して雑音抑圧処理を反復する(すなわち、各雑音抑圧処理の実行後の音響信号を次回の雑音抑圧処理の対象とする)ことを意味する。
【0011】
本発明は、以上の各態様に係る雑音抑圧用係数設定装置を具備する雑音抑圧装置としても実現される。本発明の第1態様に係る雑音抑圧装置は、以上の各態様に係る雑音抑圧用係数設定装置と、雑音抑圧用係数設定装置が設定した係数を適用した雑音抑圧処理を入力音響信号に対して実行する雑音抑圧手段とを具備する。雑音抑圧手段は、例えば、第1係数設定手段が設定したフロアリング係数を適用したフロアリング処理を含む雑音抑圧処理を入力音響信号に対して実行する要素や、第1係数設定手段が設定したフロアリング係数と第2係数設定手段が設定した抑圧係数とを適用した雑音抑圧処理を入力音響信号に対して実行する要素や、反復回数設定手段が設定した反復回数にわたり雑音抑圧処理を入力音響信号に対して累積的に反復する要素である。以上の雑音抑圧装置によれば、本発明の雑音抑圧用係数設定装置について前述した作用および効果が実現される。
【0012】
本発明の第2態様に係る雑音抑圧装置は、相互に離間して配置された収音機器が生成するD(Dは2以上の自然数)チャネルの音響信号を順次に処理するQ段の単位処理手段と、
Q段のうち最終段の単位処理手段による処理後のDチャネルの音響信号の遅延加算で特定の音源方向の目的音成分を強調する出力処理手段とを具備し、Q段の単位処理手段の各々は、当該単位処理手段に供給されるDチャネルの音響信号に対する独立成分分析で推定雑音成分を生成する雑音推定手段と、推定雑音成分の雑音特性値に応じたフロアリング係数をチャネル毎に可変に設定する前述の各態様の雑音抑圧用係数設定装置と、雑音抑圧用係数設定装置がチャネル毎に設定したフロアリング係数を適用した雑音抑圧処理を当該チャネルの音響信号に実行して出力する雑音抑圧手段とを含む。第2態様においても第1態様の雑音抑圧装置と同様の効果が実現される。また、雑音成分の特性が経時的に変動する場合でも高精度な雑音抑圧を実現できるという利点もある。なお、第2態様の雑音抑圧装置は、例えば第4実施形態として後述される。
【0013】
以上の各態様に係る雑音抑圧用係数設定装置は、雑音成分の抑圧に専用されるDSP(Digital Signal Processor)などのハードウェア(電子回路)によって実現されるほか、CPU(Central Processing Unit)などの汎用の演算処理装置とプログラム(ソフトウェア)との協働によっても実現される。本発明のプログラムは、入力音響信号の強度分布の形状に応じた雑音特性値を算定する特性値算定処理と、音響信号の強度分布の尖度が雑音抑圧処理の前後で変化しない場合における当該音響信号の雑音特性値と雑音抑圧処理のフロアリング処理に適用されるフロアリング係数との関係を規定する関係式を満たすように、特性値算定処理で算定した雑音特性値に応じてフロアリング係数を可変に設定する第1係数設定処理とをコンピュータに実行させる。以上のプログラムによれば、本発明の雑音抑圧用係数設定装置と同様の作用および効果が実現される。本発明のプログラムは、コンピュータが読取可能な記録媒体に格納された形態で提供されてコンピュータにインストールされるほか、通信網を介した配信の形態で提供されてコンピュータにインストールされる。
【図面の簡単な説明】
【0014】
【図1】第1実施形態に係る雑音抑圧装置のブロック図である。
【図2】雑音抑圧率と尖度比との関係を示すグラフである。
【図3】実施形態の効果を示すグラフである。
【図4】実施形態の効果を示すグラフである。
【図5】第2実施形態に係る雑音抑圧装置のブロック図である。
【図6】係数テーブルの模式図である。
【図7】第3実施形態に係る雑音抑圧装置のブロック図である。
【図8】第4実施形態に係る雑音抑圧装置のブロック図である。
【図9】単位処理部のブロック図である。
【図10】第4実施形態の効果を示すグラフである。
【図11】第4実施形態の効果を示すグラフである。
【図12】第4実施形態の効果を示すグラフである。
【発明を実施するための形態】
【0015】
<第1実施形態>
図1は、本発明の第1実施形態に係る雑音抑圧装置100Aのブロック図である。雑音抑圧装置100Aには、信号供給装置12と放音装置14とが接続される。信号供給装置12は、音響信号x(t)を雑音抑圧装置100Aに供給する。音響信号x(t)は、目的音成分(例えば音声や楽音等の音響)と雑音成分(空調設備の動作音や雑踏音等の環境音)との混合音の波形を表す時間領域の信号である(t:時間)。周囲の音響を収音して音響信号x(t)を生成する収音機器や、可搬型または内蔵型の記録媒体から音響信号x(t)を取得して雑音抑圧装置100Aに供給する再生装置や、通信網から音響信号x(t)を受信して雑音抑圧装置100Aに供給する通信装置が信号供給装置12として採用され得る。
【0016】
雑音抑圧装置100Aは、信号供給装置12が供給する音響信号x(t)から音響信号y(t)を生成する音響処理装置である。音響信号y(t)は、音響信号x(t)から雑音成分を抑圧した音響(目的音成分を強調した音響)の波形を表す時間領域の信号である。放音装置14(例えばスピーカやヘッドホン)は、雑音抑圧装置100Aが生成した音響信号y(t)に応じた音波を再生する。なお、音響信号y(t)をデジタルからアナログに変換するD/A変換器の図示は便宜的に省略されている。
【0017】
図1に示すように、雑音抑圧装置100Aは、演算処理装置22と記憶装置24とを具備するコンピュータシステムで実現される。記憶装置24は、演算処理装置22が実行するプログラムPGMや演算処理装置22が使用する各種のデータを記憶する。半導体記録媒体や磁気記録媒体などの公知の記録媒体や複数種の記録媒体の組合せが記憶装置24として任意に採用され得る。音響信号x(t)を記憶装置24に記憶した構成(したがって信号供給装置12は省略される)も好適である。
【0018】
演算処理装置22は、記憶装置24に格納されたプログラムPGMを実行することで、音響信号x(t)から音響信号y(t)を生成するための複数の機能(周波数分析部32,雑音推定部34,雑音抑圧部36,波形合成部38,特性値算定部42,第1係数設定部44)を実現する。なお、演算処理装置22の各機能を複数の集積回路に分散した構成や、専用の電子回路(DSP)が各機能を実現する構成も採用され得る。
【0019】
周波数分析部32は、音響信号x(t)のスペクトル(複素スペクトル)X(f,τ)を時間軸上のフレーム毎に順次に生成する。スペクトルX(f,τ)の生成には、短時間フーリエ変換等の公知の周波数分析が任意に採用され得る。記号τはフレームを指定する変数であり、記号fは周波数を指定する変数である。なお、通過帯域が相違する複数の帯域通過フィルタで構成されるフィルタバンクも周波数分析部32として採用され得る。
【0020】
雑音推定部34は、音響信号x(t)に含まれると推定される雑音成分(以下「推定雑音成分」という)n(t)のスペクトル(複素スペクトル)N(f,τ)を生成する。推定雑音成分n(t)のスペクトルN(f,τ)の生成には公知の技術が任意に採用され得る。例えば、雑音推定部34は、目的音成分が存在する目的音区間と目的音成分が存在しない雑音区間とに音響信号x(t)を時間軸上で区分し、雑音区間内の各フレームのスペクトルX(f,τ)を推定雑音成分n(t)のスペクトルN(f,τ)として特定する。目的音区間と雑音区間との区分には公知の音声検出技術(VAD:Voice Activity Detection)が任意に採用される。
【0021】
雑音抑圧部36は、目的音区間および雑音区間の各フレームの音響信号x(t)のスペクトルX(f,τ)に対する反復型の雑音抑圧で音響信号y(t)のスペクトル(複素スペクトル)Y(f,τ)をフレーム毎に順次に生成する。反復型の雑音抑圧は、音響信号x(t)のスペクトルX(f,τ)に対する雑音抑圧処理を所定の反復回数Q(Qは自然数)にわたり累積的に反復する信号処理である。雑音抑圧部36が生成するスペクトルY(f,τ)は、以下の数式(1)で表現される。
【数1】
数式(1)の記号jは虚数単位を意味し、記号θx(f,τ)は音響信号x(t)の位相スペクトルを意味する。また、数式(1)の記号|YQ(f,τ)|は、音響信号x(t)のスペクトルX(f,τ)に対して反復回数Qの雑音抑圧処理を実行した時点の振幅スペクトルである。各回の雑音抑圧処理では、数式(2A)で表現される減算処理と数式(2B)で表現されるフロアリング処理とが周波数f毎に択一的に実行される。
【数2】
【0022】
数式(2A)および数式(2B)の振幅スペクトル|Yi(f,τ)|は、第i回目の雑音抑圧処理が完了した時点での振幅スペクトルを意味する。音響信号x(t)の振幅スペクトル|X(f,τ)|が振幅スペクトル|Yi(f,τ)|の初期値|Y0(f,τ)|として第1回目の雑音抑圧処理(振幅スペクトル|Y1(f,τ)|の生成)に適用される。数式(2A)の記号Eτ[|Ni-1(f,τ)|2]は、複数のフレームにわたる推定雑音成分n(t)のパワー|Ni-1(f,τ)|2の時間平均を意味する。なお、振幅スペクトル|Yi(f,τ)|の算定(数式(2A))には、雑音区間について第(i-1)回目の雑音抑圧処理で算定された振幅スペクトル|Yi-1(f,τ)|が推定雑音成分n(t)の振幅スペクトル|Ni-1(f,τ)|として適用される。すなわち、推定雑音成分n(t)は雑音抑圧処理毎に更新される。
【0023】
数式(2A)から理解されるように、減算処理は、推定雑音成分n(t)のパワースペクトル|Ni-1(f,τ)|2の時間平均(すなわち推定雑音)と抑圧係数βとの乗算値を、直前(第(i-1)回目)の雑音抑圧処理後のパワースペクトル|Yi-1(f,τ)|2から減算して振幅スペクトル|Yi(f,τ)|を算定する処理である。したがって、抑圧係数(減算係数)βは、雑音成分の抑圧強度を制御するための変数として機能する。第1実施形態では、抑圧係数βは所定値(例えば2または4)に固定される。
【0024】
他方、数式(2A)の減算後の数値が負数となる場合に実行される数式(2B)のフロアリング処理は、直前(第(i-1)回目)の雑音抑圧処理後の振幅スペクトル|Yi-1(f,τ)|とフロアリング係数ηとを乗算することで振幅スペクトル|Yi(f,τ)|を算定する処理である。すなわち、フロアリング係数ηは、振幅スペクトル|Yi(f,τ)|の下限値を規定する変数として機能する。数式(1)で説明したように、第Q回目の雑音抑圧処理の完了後の振幅スペクトル|YQ(f,τ)|に音響信号x(t)の位相スペクトルθx(f,τ)を付加したスペクトルY[f,t]がフレーム毎に波形合成部38に供給される。
【0025】
図1の波形合成部38は、雑音抑圧部36がフレーム毎に生成するスペクトルY(f,τ)から時間領域の音響信号y(t)を生成する。具体的には、波形合成部38は、各フレームのスペクトルY(f,τ)を逆フーリエ変換で時間領域の信号に変換するとともに前後のフレームを相互に連結することで音響信号y(t)を生成する。波形合成部38が生成した音響信号y(t)が放音装置14に供給されて音波として再生される。
【0026】
図1の特性値算定部42は、音響信号x(t)内の雑音成分(推定雑音成分n(t))の特性に応じた形状母数(shape parameter)α0を音響信号x(t)から算定する。形状母数α0は、雑音区間内の複数のフレームにわたる音響信号x(t)のパワー|X(f,τ)|2(すなわち推定雑音成分n(t)のパワー|N(f,τ)|2)の度数分布(以下「強度分布」という)の形状に応じて変化する変数である。第1実施形態の特性値算定部42は、音響信号x(t)の強度分布を近似する確率分布の形状母数α0を算定する。確率分布の典型例はガウス分布である。音響信号x(t)のパワーx(x=|X(f,τ)|2)を確率変数として音響信号x(t)の強度分布を近似するガンマ分布の確率密度関数P(x)は以下の数式(3)で表現される。
【数3】
【0027】
数式(3)の形状母数αは以下の数式(4A)および数式(4B)で定義され、数式(3)の尺度母数(scaling parameter)θは以下の数式(5)で定義される。また、数式(3)の記号Γ(α)は、以下の数式(6)で定義されるガンマ関数を意味する。なお、記号E[ ]は平均値(期待値)を意味する。図1の特性値算定部42は、雑音区間内の音響信号x(t)のパワー|X(f,τ)|2を数式(4B)の確率変数xに適用して数式(4A)で算定される形状母数αを、最初の雑音抑圧処理の実行前の音響信号x(t)の形状母数α0として算定する。
【数4】
【数5】
【数6】
【0028】
図1の第1係数設定部44は、雑音抑圧部36が数式(2B)のフロアリング処理に適用するフロアリング係数ηを、特性値算定部42が算定した形状母数α0に応じて可変に設定する。具体的には、雑音抑圧処理に起因した音響信号y(t)のミュージカルノイズが最小化され、かつ、雑音抑圧処理により雑音成分が確かに抑圧されるように、フロアリング係数ηは算定される。
【0029】
フロアリング係数ηが満たすべき条件を特定するために、1回の雑音抑圧処理に便宜的に着目して、ミュージカルノイズの発生の度合と雑音成分の抑圧の度合との関係を検討する。まず、雑音抑圧処理に起因したミュージカルノイズが非ガウス性の雑音であることを考慮し、強度分布(確率密度関数)のガウス性の指標となる尖度(kurtosis)を、雑音抑圧処理に起因したミュージカルノイズの発生量の定量的な指標として利用する。具体的には、雑音抑圧処理の前後にわたる尖度の変化が大きいほどミュージカルノイズが顕在化するという傾向を考慮して、雑音抑圧処理の実行前の尖度KAに対する実行後の尖度KBの相対比(以下「尖度比」という)κをミュージカルノイズの発生量の指標として利用する(κ=KB/KA)。尖度比κが大きいほどミュージカルノイズが多く、尖度比κが1である場合(雑音抑圧処理の実行の前後で尖度が変化しない場合)にはミュージカルノイズは発生していないと評価できる。なお、尖度(尖度比κ)とミュージカルノイズとの相関については特許文献1にも詳述されている。
【0030】
確率密度関数P(x)の尖度Kは以下の数式(7)で表現される。
【数7】
数式(7)の記号μm(μ2,μ4)は、確率密度関数P(x)の原点回りのm次モーメントを意味し、以下の数式(8)で定義される。
【数8】
【0031】
非特許文献1の記載から理解されるように、雑音抑圧処理後のm次モーメントμmは以下の数式(9)で表現される。数式(9)の関数M(α,β,η,m)は、数式(10)で定義される。
【数9】
【数10】
【0032】
数式(10)の記号Γ(b,a)は、以下の数式(11)で定義される第1種不完全ガンマ関数であり、数式(10)の記号γ(b,a)は、以下の数式(12)で定義される第2種不完全ガンマ関数である。
【数11】
【数12】
【0033】
数式(7)および数式(9)から、雑音抑圧処理の実行後の尖度Kを示す以下の数式(13)が導出される。また、雑音抑圧処理の実行前の尖度Kは、数式(13)において抑圧係数βおよびフロアリング係数ηを0とした以下の数式(14)で表現される。
【数13】
【数14】
したがって、雑音抑圧処理の前後にわたる尖度比κは、以下の数式(15)で表現される。
【数15】
【0034】
他方、雑音抑圧処理による雑音成分の抑圧度合の指標値として雑音抑圧率(Noise Reduction Rate)Rを導入する。非特許文献1から理解されるように、雑音抑圧率Rは、音響信号x(t)の強度分布の形状母数αと数式(10)の関数M(α,β,η,m)とを含む以下の数式(16)で表現される。数式(16)の雑音抑圧率Rは、雑音抑圧処理の実行後のSN(Signal to Noise)比と雑音抑圧処理の実行前のSN比との差分(デシベル値)を意味し、1回の雑音抑圧処理における雑音成分の抑圧量の指標として機能する。
【数16】
【0035】
図2は、数式(15)の尖度比κ(縦軸)と数式(16)の雑音抑圧率R(横軸)との関係を示すグラフである。図2では、雑音成分の形状母数αが1.0(白色ガウス雑音)である場合を想定し、フロアリング係数ηを0.0に設定した場合(破線)と1.0に設定した場合(実線)との各々について抑圧係数βを変化させたときの尖度比κと雑音抑圧率Rとの相関が図示されている。図2の矢印は、抑圧係数βが増加する方向を意味する。
【0036】
フロアリング係数ηを0.0に設定した場合、抑圧係数βの増加とともに尖度比κおよび雑音抑圧率Rの双方が単調に増加する。したがって、雑音抑圧の効果が増加する一方でミュージカルノイズが増大する。他方、フロアリング係数ηを1.0に設定した場合、尖度比κと雑音抑圧率Rとの関係は、抑圧係数βの変化に対してヒステリシスループを描き、雑音抑圧率Rが0となる地点(雑音成分が抑圧されない場合)以外で尖度比κが1となる特定点pが存在する。尖度比κが1に維持される(すなわち雑音抑圧処理の前後で尖度Kが変化しない)ということは、雑音抑圧処理の前後で論理的にはミュージカルノイズが発生しないことを意味する。すなわち、ミュージカルノイズを発生させることなく雑音成分を有効に抑制できる抑圧係数βとフロアリング係数ηとの組合せが存在するという事実が図2から確認できる。抑圧係数βを所定値に固定した場合を想定すると、フロアリング係数ηを適切な数値に設定することで、ミュージカルノイズを発生させることなく雑音成分を抑圧することが可能である。
【0037】
以上の知見を踏まえて、ミュージカルノイズを発生させないための第1条件と、雑音成分を抑圧するための第2条件との双方を成立させることを検討する。第1条件は、雑音抑圧処理の前後で尖度Kが変化しないという条件であり、第2条件は、雑音抑圧処理による雑音抑圧率Rが正数であるという条件である。第1条件および第2条件の各々について以下に詳述する。
【0038】
[第1条件]
第i回目(i=0,1,2,……)の雑音抑圧処理の実行後の尖度K(αi,β,η)の強度分布の形状母数αを第(i+1)回目の雑音抑圧処理の対象となる強度分布の形状母数αi+1とする場合、尖度K(αi,β,η)と形状母数αi+1との間には以下の数式(17)が成立する。数式(17)の導出については非特許文献1に詳述されている。
【数17】
【0039】
最初(i=0)の雑音抑圧処理の実行前の強度分布(すなわち音響信号x(t)の強度分布)の尖度K(α0,0,0)は、以下の数式(18)で表現される。
【数18】
【0040】
第1条件が成立する場合、以下の数式(19)で表現されるように、任意の時点の尖度K(αi,β,η)が雑音抑圧処理前の尖度K(α0,0,0)と同等となる。
【数19】
【0041】
数式(10)の関数M(α,β,η,m)を、以下の数式(20)に示すように、フロアリング係数ηを含まない関数S(α,β,m)および関数F(α,β,m)で便宜的に簡略化すると、最初の雑音抑圧処理の直後の尖度K(α0,β,η)は数式(21)で表現される。
【数20】
【数21】
【0042】
数式(19)と数式(21)とから、第1条件を表現する以下の数式(22)が導出される。
【数22】
フロアリング係数ηの4乗を変数Hで置換すると、数式(22)は以下の数式(23)に変形される。
【数23】
【0043】
数式(23)を変数Hについて整理することで、第1条件を満たすフロアリング係数η(η=H1/4)を規定する以下の数式(24)が導出される。
【数24】
第1実施形態では抑圧係数βは所定値に固定される。したがって、数式(24)は、音響信号x(t)の強度分布の尖度が雑音抑圧処理(1回の雑音抑圧処理およびQ回にわたる雑音抑圧処理の反復)の前後で変化しない場合における形状母数αとフロアリング係数ηとの関係を規定する関係式として利用可能である。
【0044】
[第2条件]
第2条件は、1回の雑音抑圧処理での雑音成分の抑圧量を意味する数式(16)の雑音抑圧率Rが正数であるという条件である。したがって、前述の関数S(α,β,m)および関数F(α,β,m)を利用することで、第2条件を表現する数式(25)が導出される。
【数25】
【0045】
フロアリング係数ηが正数であることを加味すると、第2条件を満たすフロアリング係数ηの範囲を規定する以下の数式(26)が導出される。
【数26】
【0046】
図1の第1係数設定部44は、数式(24)および数式(26)を満たすように、特性値算定部42が算定した形状母数α0に応じたフロアリング係数ηを算定する。具体的には、第1係数設定部44は、形状母数α0について数式(24)の演算を実行することで変数Hを算定するとともに変数Hの4乗根をフロアリング係数η(η=H1/4)として算定する。数式(24)からは複数のフロアリング係数ηが算定される。第1係数設定部44は、複数のフロアリング係数ηのうち数式(26)を満たす1個のフロアリング係数ηを選択する。第1係数設定部44が設定したフロアリング係数ηが雑音抑圧部36による雑音抑圧処理(数式(2B)のフロアリング処理)に適用される。
【0047】
以上に説明したように第1実施形態では、雑音抑圧処理の前後で尖度Kが変化しないという第1条件(数式(24))を満たすようにフロアリング係数ηが推定雑音成分n(t)の形状母数α0に応じて可変に設定される。したがって、以下に詳述するように、ミュージカルノイズの発生を有効に抑制(理想的には完全に防止)しながら音響信号x(t)の雑音成分を抑圧することが可能である。
【0048】
図3は、雑音抑圧処理の前後の尖度比κを示すグラフであり、図4は、雑音抑圧処理の実行後の音響信号y(t)のケプストラム歪dを示すグラフである。ケプストラム歪dは、目的音成分のケプストラムと雑音抑圧処理後の音響信号y(t)のケプストラムとの誤差を示す指標値である。すなわち、ケプストラム歪dが小さいほど雑音抑圧性能が高い(すなわち目的音成分のスペクトル包絡が忠実に再現される)と評価できる。
【0049】
図3および図4では、フロアリング係数ηを所定値に固定して1回だけ雑音抑圧処理を実行した場合(対比例1/One-Shot SS)と、ウィーナフィルタを適用した雑音抑圧処理を実行した場合(対比例2/Wiener filtering)と、MMSE-STSA(Minimum Mean-Square Error - Short-Time Spectral Amplitude)を利用した雑音抑圧処理を実行した場合(対比例3/MMSE-STSA)と、第1実施形態とが対比的に併記されている。図3および図4では、白色ガウス雑音(α0=0.97)を音響信号x(t)の雑音成分とした場合(White Gaussian Noise)と会話音(α0=0.21)を音響信号x(t)の雑音成分とした場合とが想定されている。
【0050】
図4から理解されるように、第1実施形態によれば、雑音成分が会話音である場合には対比例1から対比例3を上回る雑音抑圧性能が実現される。また、雑音成分が白色ガウス雑音である場合には、対比例1および対比例2を上回るとともに対比例3に匹敵する雑音抑圧性能が実現される。そして、図3から理解されるように、第1実施形態によれば、雑音成分が白色ガウス雑音および会話音の何れの場合でも、対比例1から対比例3と比較して、雑音抑圧の前後にわたる尖度比κは1に近い数値に低減される。すなわち、対比例1から対比例3の何れと比較した場合でも、第1実施形態によればミュージカルノイズを有効に低減できることが理解される。以上に説明したように、第1実施形態によれば、ミュージカルノイズを有効に低減しながら高度な雑音抑圧を実現することが可能である。
【0051】
<第2実施形態>
本発明の第2実施形態を以下に説明する。なお、以下に例示する各形態において作用や機能が第1実施形態と同等である要素については、第1実施形態の説明で参照した符号を流用して各々の詳細な説明を適宜に省略する。
【0052】
図5は、第2実施形態に係る雑音抑圧装置100Bのブロック図である。図5に示すように、第2実施形態の雑音抑圧装置100Bは、第1実施形態の雑音抑圧装置100Aに第2係数設定部46を追加した構成である。第2係数設定部46は、特性値算定部42が算定した形状母数α0と第1係数設定部44が設定したフロアリング係数ηとに応じて、各雑音抑圧処理の減算処理(数式(2A))に適用される抑圧係数βを可変に設定する。抑圧係数βの設定には、記憶装置24に事前に記憶された図6の係数テーブルTBLが使用される。
【0053】
図6の係数テーブルTBLは、形状母数α0の各数値(α0_1,α0_2,……)とフロアリング係数ηの各数値(η_1,η_2,……)との組合せに対して抑圧係数βの数値(β11,β12,……)を対応させたデータテーブルである。形状母数α0およびフロアリング係数ηの組合せに対応する抑圧係数βの数値は、その形状母数α0およびフロアリング係数ηのもとで高い雑音抑圧性能が実現されるように事前に選定される。
【0054】
数式(16)の雑音抑圧率Rは、雑音抑圧処理の前後のパワー比の対数値であるから、雑音抑圧処理毎に累算(加算)される。したがって、第(i+1)回目の雑音抑圧処理を実行した時点の雑音抑圧率R(αi+1,β,η)は以下の数式(27)で表現される。
【数27】
係数テーブルTBLのうち各形状母数α0とフロアリング係数ηとの組合せに対応する抑圧係数βは、その形状母数α0およびフロアリング係数ηのもとで反復回数Qにわたる雑音抑圧処理を実行した場合の数式(27)の雑音抑圧率R(αQ,β,η)に応じて設定される。具体的には、抑圧係数βは、雑音抑圧率R(αQ,β,η)が最大となる数値や雑音抑圧率R(αQ,β,η)が所定の目標値Rtarを上回る数値に設定される。目標値Rtarは、例えば入力装置(図示略)に対する利用者からの指示に応じて可変に設定される。
【0055】
第2係数設定部46は、特性値算定部42が算定した形状母数α0と第1係数設定部44が設定したフロアリング係数ηとの組合せに対応する抑圧係数βを係数テーブルTBLから検索および取得して雑音抑圧部36に指示する。雑音抑圧部36は、第1係数設定部44から指示されるフロアリング係数ηと第2係数設定部46から指示される抑圧係数βとを適用した雑音抑圧処理を所定の反復回数Qにわたり反復することでスペクトルY(f,τ)を生成する。
【0056】
第2実施形態においても第1実施形態と同様の効果が実現される。また、第2実施形態では、特性値算定部42が算定した形状母数α0と第1係数設定部44が設定したフロアリング係数ηとに応じて抑圧係数βが可変に設定されるから、抑圧係数βを所定値に固定した構成と比較して雑音抑圧性能(雑音抑圧率R)を向上することが可能である。
【0057】
なお、以上の説明では係数テーブルTBLから抑圧係数βを取得したが、抑圧係数βを設定する方法は適宜に変更される。例えば、第2係数設定部46が、抑圧係数βの複数の候補値bの各々を形状母数α0およびフロアリング係数ηとともに数式(27)に適用して候補値b毎に雑音抑圧率R(αQ,β,η)を算定し、雑音抑圧率R(αQ,β,η)が最大となる候補値bを抑圧係数βとして選択することも可能である。また、係数テーブルTBLと数式(27)の演算とを併用する構成も採用され得る。例えば第2係数設定部46は、形状母数α0およびフロアリング係数ηの組合せに対応する抑圧係数βを係数テーブルTBLから取得し、その抑圧係数βを含む所定の範囲内の複数の候補値bの各々について数式(27)の演算で雑音抑圧率R(αQ,β,η)を算定する。そして、雑音抑圧率R(αQ,β,η)が最大となる候補値bを抑圧係数βとして選択する。
【0058】
<第3実施形態>
図7は、第3実施形態に係る雑音抑圧装置100Cのブロック図である。図7に示すように、第3実施形態の雑音抑圧装置100Cは、第1実施形態の雑音抑圧装置100Aに反復回数設定部48を追加した構成である。反復回数設定部48は、特性値算定部42が算定した形状母数α0と第1係数設定部44が設定したフロアリング係数ηとに応じて雑音抑圧部36による雑音抑圧処理の反復回数Qを可変に設定する。
【0059】
具体的には、反復回数設定部48は、反復回数Qの複数の候補値qの各々について、特性値算定部42が算定した形状母数α0と第1係数設定部44が設定したフロアリング係数ηと所定の抑圧係数βとのもとでその候補値qの回数だけ雑音抑圧処理を反復した場合の雑音抑圧率R(αq,β,η)を数式(27)の演算で算定し、雑音抑圧率R(αq,β,η)が目標値Rtarを上回る最小の候補値qを反復回数Qとして確定する。目標値Rtarは、例えば入力装置(図示略)に対する利用者からの指示に応じて可変に設定される。雑音抑圧部36は、反復回数設定部48が設定した反復回数Qにわたり雑音抑圧処理を反復する。
【0060】
第3実施形態においても第1実施形態と同様の効果が実現される。また、第3実施形態では、特性値算定部42が算定した形状母数α0と第1係数設定部44が設定したフロアリング係数ηとに応じて雑音抑圧処理の反復回数Qが可変に設定されるから、雑音抑圧処理の過不足を防止することが可能である。具体的には、雑音抑圧処理の不足を防止して目標値Rtarを確実に達成するとともに雑音抑圧処理の過剰を防止して演算処理装置22の演算量を削減できるという利点がある。
【0061】
なお、以上の説明では数式(27)の演算で反復回数Qを設定したが、事前に用意されたテーブルを利用して反復回数Qを設定することも可能である。例えば、形状母数α0の各数値とフロアリング係数ηの各数値との組合せ毎に目標値Rtarを達成し得る反復回数Qを設定したテーブルを記憶装置24に事前に格納し、特性値算定部42が算定した形状母数α0と第1係数設定部44が設定したフロアリング係数ηとに対応する反復回数Qを反復回数設定部48がテーブルから検索して雑音抑圧部36に指示する。
【0062】
<第4実施形態>
図8は、第4実施形態に係る雑音抑圧装置100Dのブロック図である。図8に示すように、第4実施形態の雑音抑圧装置100Dは、収音部50と周波数分析部52と信号処理部54と出力処理部56と波形合成部58とを具備する。収音部50は、相互に離間して配置されたD個(Dは2以上の自然数)の収音機器51で構成されるマイクロホンアレイであり、各収音機器51が生成したDチャネルの音響信号x1(t)〜xD(t)を周波数分析部52に供給する。各音響信号xd(t)(d=1〜D)は、目的音成分と雑音成分との混合音の波形を示す時間領域信号である。目的音成分は、特定の音源方向から到来する音響成分である。雑音抑圧装置100Dは、音響信号x1(t)〜xD(t)から雑音成分を抑圧した音響信号y(t)を生成する。
【0063】
周波数分析部52は、Dチャネルの音響信号x1(t)〜xD(t)の各々のスペクトルXd[0](f,τ)(X1[0](f,τ)〜XD[0](f,τ))をフレーム毎に順次に生成する。図8に示すように、スペクトルX1[0](f,τ)〜XD[0](f,τ)を要素とするD次元のベクトル(以下「観測ベクトル」という)V[0](f,τ)が周波数分析部52から出力される(V[0](f,τ)=[X1[0](f,τ),X2[0](f,τ),……,XD[0](f,τ)]T)。記号Tは行列の転置を意味する。
【0064】
信号処理部54は、周波数分析部52が生成したDチャネルのスペクトルX1[0](f,τ)〜XD[0](f,τ)(観測ベクトルV[0](f,τ))からDチャネルのスペクトルY1(f,τ)〜YD(f,τ)を生成する。スペクトルYd(f,τ)は、スペクトルXd[0](f,τ)から雑音成分を抑圧したスペクトルである。図8に示すように、信号処理部54は、相互に縦続に接続されてDチャネルの音響信号x1(t)〜xD(t)(X1[0](f,τ)〜XD[0](f,τ))を順次に処理するQ段の単位処理部U[1]〜U[Q]を含んで構成される。
【0065】
図9は、信号処理部54の第q段目(q=1〜Q)の単位処理部U[q]のブロック図である。各単位処理部U[q]は、前段(第(q-1)段)から供給される観測ベクトルV[q-1](f,τ)に対する雑音抑圧処理で観測ベクトルV[q](f,τ)を生成する。第1段目の単位処理部U[1]には周波数分析部52が生成した観測ベクトルV[0](f,τ)が供給される。第Q段目(最終段)の単位処理部U[Q]が生成した観測ベクトルV[Q](f,τ)がDチャネルのスペクトルY1(f,τ)〜YD(f,τ)に相当する(V[Q](f,τ)=[Y1(f,τ),Y2(f,τ),……,YD(f,τ)]T)。
【0066】
図9に示すように、各単位処理部U[q]は、雑音推定部62と雑音抑圧用係数設定部64と雑音抑圧部66とを具備する。雑音推定部62は、観測ベクトルV[q-1](f,τ)に対する独立成分分析で推定雑音成分の推定雑音ベクトルZ[q](f,τ)を生成する。第4実施形態の雑音推定部62は、独立成分分析部622と逆射影部624とを含んで構成される。
【0067】
独立成分分析部622は、周波数領域での独立成分分析(FD-ICA:Frequency Domain-Independent Component Analysis)を利用した音源分離を観測ベクトルV[q-1](f,τ)に対して実行することで分離ベクトルG[q](f,τ)を生成する。分離ベクトルG[q](f,τ)は、D個の要素g1[q](f,τ)〜gD[q](f,τ)で構成され、以下の数式(28)で表現される。
【数28】
数式(28)の記号W[q](f)は分離行列を意味し、公知の更新式の演算を累積的に反復することで算定される。
【0068】
独立成分分析部622が生成した分離ベクトルG[q](f,τ)のうち目的音成分に相当する要素(gs[q](f,τ))をゼロに置換した分離ベクトルG(noise)[q](f,τ)が逆射影部624に供給される。すなわち、分離ベクトルG(noise)[q](f,τ)は、以下の数式(29)で表現される。要素gs[q](f,τ)は、独立成分分析で推定された目的音成分である。
【数29】
【0069】
逆射影部624は、独立成分分析のスケーリング問題を解決するための逆射影(projection back)を分離ベクトルG(noise)[q](f,τ)に適用することで推定雑音ベクトルZ[q](f,τ)を生成する。具体的には、推定雑音ベクトルZ[q](f,τ)は以下の数式(30)の演算で生成される。
【数30】
推定雑音ベクトルZ[q](f,τ)は、各チャネルに対応するD個の推定雑音成分z1[q](f,τ)〜zD[q](f,τ)を要素とするベクトルである(Z[q](f,τ)=[z1[q](f,τ),z2[q](f,τ),……,zD[q](f,τ)]T)。
【0070】
図9の雑音抑圧用係数設定部64は、各チャネルのフロアリング係数η[1]〜η[D]を設定する要素であり、特性値算定部642と第1係数設定部644とを含んで構成される。特性値算定部642は、推定雑音ベクトルZ[q](f,τ)から各チャネルの形状母数α0[1]〜α0[D]を算定する。形状母数α0[d]は、推定雑音ベクトルZ[q](f,τ)の推定雑音成分zd[q](f,τ)の強度分布に応じた変数である。特性値算定部642が推定雑音成分zd[q](f,τ)から形状母数α0[d]を算定する方法は、第1実施形態の特性値算定部42が推定雑音成分n(t)から形状母数α0を算定する方法と同様である。
【0071】
第1係数設定部644は、特性値算定部642が算定した形状母数α0[1]〜α0[D]からチャネル毎のフロアリング係数η[1]〜η[D]を算定する。具体的には、第1係数設定部644は、第1実施形態の第1係数設定部44と同様に、第1条件を表現する数式(24)と第2条件を表現する数式(26)とを満たすように、形状母数α0[d]に応じたフロアリング係数η[d]を算定する。
【0072】
図9の雑音抑圧部66は、第1係数設定部644が算定したフロアリング係数η[1]〜η[D]を適用した雑音抑圧処理を観測ベクトルV[q-1](f,τ)に対して実行することで観測ベクトルV[q](f,τ)を生成する。雑音抑圧処理はチャネル毎に個別に実行される。すなわち、雑音抑圧部66は、フロアリング係数η[d]を適用した雑音抑圧処理を音響信号xd(t)のスペクトルXd[q-1](f,τ)に対して実行することでスペクトルXd[q](f,τ)を生成する。具体的には、雑音抑圧部66は、以下の数式(31A)で表現される減算処理と数式(31B)で表現されるフロアリング処理とを周波数f毎に択一的に実行する。すなわち、第4実施形態の信号処理部54では、周波数分析部52が生成したスペクトルXd[0](f,τ)に対してQ回の雑音抑圧処理が累積的に反復される。
【数31】
【0073】
図8の出力処理部56は、信号処理部54(第Q段目の単位処理部U[Q])が生成したDチャネルのスペクトルY1(f,τ)〜YD(f,τ)から音響信号y(t)のスペクトルY(f,τ)をフレーム毎に生成する。具体的には、出力処理部56は、目的音成分の方向に収音のビーム(感度が高い領域)を形成する遅延加算型ビームフォーマであり、遅延部562と加算部562とを含んで構成される。
【0074】
遅延部562は、スペクトルY1(f,τ)〜YD(f,τ)の各々を目的音成分の音源方向φに応じた遅延量だけ遅延させる。音源方向φは、信号処理部54のQ個の単位処理部U[1]〜U[Q]から選択された1個の単位処理部U[q](例えば最終段の単位処理部U[Q])における独立成分分析部622が推定した分離行列W[q](f)から特定される。
【0075】
加算部564は、遅延部562による遅延後のDチャネルのスペクトルY1(f,τ)〜YD(f,τ)を加算することで音響信号y(t)のスペクトルY(f,τ)を生成する。以上の説明から理解されるように、出力処理部56が生成するスペクトルY(f,τ)は、音源方向φの目的音成分を強調した信号となる。
【0076】
図8の波形合成部58は、第1実施形態の波形合成部38と同様に、出力処理部56がフレーム毎に生成するスペクトルY(f,τ)から時間領域の音響信号y(t)を生成する。音響信号y(t)は、例えば放音装置(図示略)に供給されて音波として再生される。
【0077】
以上に説明した第4実施形態においても第1実施形態と同様の効果が実現される。また、第4実施形態では、雑音抑圧処理毎(単位処理部U[q]毎)に独立成分分析で推定雑音成分zd[q](f,τ)が推定されるから、音響信号xd(t)の途中の時点で雑音成分の特性が変動した場合でも高精度な雑音抑圧を実現できるという利点がある。また、DチャネルのスペクトルY1(f,τ)〜YD(f,τ)が出力処理部56にて加算されるから、各スペクトルYd(f,τ)にミュージカルノイズが仮に発生した場合でも音響信号y(t)では知覚され難くすることが可能である。
【0078】
図10から図12は雑音抑圧の評価結果を示すグラフである。第4実施形態での雑音抑圧の評価結果と公知のBSSA(Blind Spacial Subtraction Array)を利用した雑音抑圧(以下「対比例4」という)の評価結果とが対比的に図示されている。図10は、雑音抑圧の前後の尖度比κを示すグラフであり、図11は、雑音抑圧後の音響信号y(t)のケプストラム歪dを示すグラフである。図10および図11では、所定の音声にインパルス応答を畳込んだ音響を目的音成分とし、駅構内で収録された雑音成分(駅雑音)および人混みで収録された雑音成分(人混音)を目的音成分に付加した各場合について尖度比κおよびケプストラム歪dが図示されている。また、図12は、雑音抑圧後の音響信号y(t)の音質の主観評価の結果である。具体的には、第4実施形態による雑音抑圧の結果が高音質であると評価した被験者と対比例4の結果が高音質であると評価した被験者との比率が図12では図示されている。
【0079】
図10に示すように、第4実施形態では、雑音抑圧の前後にわたる尖度比κが対比例4と比較して1に近い数値に低減されるから、ミュージカルノイズを有効に抑制できることが理解される。他方、第4実施形態の処理後の音響信号y(t)のスペクトル歪dは対比例4と比較して大きいという傾向が図11から把握される。しかし、図12の主観評価によれば、第4実施形態による処理後の音響信号y(t)のほうが対比例4と比較して高音質であると90%程度の被験者が評価している。すなわち、第4実施形態によれば、受聴者が知覚する音質を高い水準に維持しながら雑音抑圧を実現できるという効果が実現される。
【0080】
<変形例>
以上の各形態は多様に変形される。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様は適宜に併合され得る。
【0081】
(1)前述の各形態の減算処理では、第(i-1)回目の雑音抑圧後のパワースペクトル|Yi-1(f,τ)|2から推定雑音成分n(t)のパワースペクトル|Ni-1(f,τ)|2を減算したが、以下の数式(2A')に示すように、減算処理における振幅スペクトル|Yi-1(f,τ)|および振幅スペクトル|Ni-1(f,τ)|の冪指数は任意の正数Kとして一般化され得る。減算処理における冪指数Kの一般化については、例えば井上等,“一般化スペクトル減算法におけるミュージカルノイズ発生量の数理解析,日本音響学会講演論文集,3-5-4,p.759−762,2010年3月(以下「非特許文献2」という)にも詳述されている。
【数32】
【0082】
非特許文献2によれば、冪指数Kを小さい数値に設定したほうが聴感的に自然な音響信号y(t)を生成できる。したがって、理想的には、演算処理装置22の演算処理の範囲内(例えば、演算処理装置22が演算可能な浮動小数点数のもとでアンダーフローを回避して有意な数値が得られる限度内)で最小の数値に冪指数Kは設定される。具体的には、冪指数Kを1以下の数値(更に好適には0.5を下回る数値)に設定することが可能である。
【0083】
(2)雑音抑圧処理の具体的な内容は前述の数式(2A)(または数式(2A'))および数式(2B)に限定されない。例えば、以下の数式(32A)および数式(32B)で表現されるウィーナフィルタを1回の雑音抑圧処理にて周波数f毎に択一的に実行することも可能である。
【数33】
【0084】
数式(32A)および数式(32B)の雑音抑圧処理の実行後のm次モーメントμmは、例えばT. Inoue, et al., "Theoretical analysis of musical noise in Wiener filtering family via higher-order statistics", Proc. ICASSP2011, p.5076-5079, 2011に開示される通り、以下の数式(33)で表現される。数式(33)の関数MWF(α,β,η,m)は、数式(34)で定義される。
【数34】
したがって、前述の数式(24)および数式(26)と同様に、第1条件および第2条件の双方を満たす(すなわち理論的にはミュージカルノイズを発生させない)フロアリング係数ηを算定することが可能である。
【0085】
(3)第4実施形態では、各単位処理部U[q]の雑音推定部62がチャネル毎に推定雑音成分z1[q](f,τ)〜zD[q](f,τ)を生成したが、Dチャネルについて共通の推定雑音成分を雑音推定部62が独立成分分析で生成することも可能である。雑音抑圧部66は、Dチャネルの各々のスペクトルX1[q-1](f,τ)〜XD[q-1](f,τ)(観測ベクトルV[q-1](f,τ))から共通の推定雑音成分を抑圧する雑音抑圧処理を実行する。
【0086】
(4)前述の各形態では、第1係数設定部44が数式(24)の演算でフロアリング係数ηを算定したが、形状母数α0や抑圧係数βの各数値にフロアリング係数ηを対応付けた係数テーブルを参照することで第1係数設定部44がフロアリング係数ηを設定する構成も採用され得る。フロアリング係数ηの設定用の係数テーブルでは、数式(24)の関係(第1条件)が成立するように、形状母数α0および抑圧係数βの組合せとフロアリング係数ηとが対応付けられる。以上の説明から理解されるように、第1係数設定部44は、第1条件を規定する関係式を満たすように形状母数α0に応じてフロアリング係数ηを可変に設定する要素として包括され、フロアリング係数ηを実際の演算で算定するか係数テーブルから取得するかは不問である。
【0087】
(5)前述の各形態では雑音抑圧部36が反復型の雑音抑圧を実行したが、音響信号x(t)の各フレームについて雑音抑圧部36が雑音抑圧処理を1回だけ実行する構成にも本発明は適用される。すなわち、雑音抑圧処理の反復は本発明において必須ではない。雑音抑圧処理を各フレームにつき1回だけ実行する構成でも、第1条件および第2条件を満たすようにフロアリング係数ηを設定することで、フロアリング係数ηを所定値に固定した構成と比較すれば、ミュージカルノイズの発生を抑制しながら音響信号x(t)の雑音成分を抑圧できるという所期の効果は実現される。
【0088】
(6)第2実施形態の第2係数設定部46と第3実施形態の反復回数設定部48との双方を具備する構成も採用され得る。反復回数設定部48は、反復回数Qの複数の候補値qの各々について、第1係数設定部44が設定したフロアリング係数ηと第2係数設定部46が設定した抑圧係数βとを適用した雑音抑圧処理をその回数qだけ反復した場合の雑音抑圧率R(αq,β,η)を数式(27)の演算で算定し、雑音抑圧率R(αq,β,η)が目標値Rtarを上回る最小の候補値qを反復回数Qとして確定する。
【0089】
(7)第2実施形態では、形状母数α0およびフロアリング係数ηの双方に応じて抑圧係数βを設定したが、抑圧係数βを制御する方法は以上の例示に限定されない。例えば、形状母数α0に応じて抑圧係数β(フロアリング係数ηには依存しない数値)を設定することも可能である。
【0090】
(8)前述の各形態では、音響信号x(t)の強度分布を近似する確率密度関数P(x)の形状母数α0を推定雑音成分n(t)の特性の指標(雑音特性値)として例示したが、雑音特性値は形状母数α0に限定されない。例えば、音響信号x(t)の強度分布から直接に算定される統計量(例えば尖度等の高次統計量)や、音響信号x(t)の振幅|X(f,τ)|の度数分布に応じた統計量(例えば振幅|X(f,τ)|の度数分布を近似する確率密度関数の形状母数)を雑音特性値として利用することも可能である。すなわち、雑音特性値は、音響信号x(t)の特性(特に推定雑音成分n(t)の特性)に応じて変化する数値(典型的には強度分布の形状に応じた数値)として包括される。
【0091】
(9)前述の各形態では、雑音抑圧部36を具備する雑音抑圧装置100(100A,100B,100C)を例示したが、雑音抑圧に適用される変数(例えばフロアリング係数η,抑圧係数β,反復回数Q)を可変に設定する装置(以下「雑音抑圧用係数設定装置」という)としても本発明は実現され得る。雑音抑圧用係数設定装置に雑音抑圧部36や雑音推定部34を追加することで雑音抑圧装置100が実現される。例えば第1実施形態に対応する雑音抑圧用係数設定装置は、前述の各形態における特性値算定部42および第1係数設定部44を含んで構成される。また、第4実施形態の雑音抑圧用係数設定部64は、本発明の各態様に係る雑音抑圧用係数設定装置に相当する。雑音抑圧用係数設定装置には、第2実施形態の第2係数設定部46や第3実施形態の反復回数設定部48が適宜に追加され得る。
【符号の説明】
【0092】
100A,100B,100C、100D……雑音抑圧装置、12……信号供給装置、14……放音装置、22……演算処理装置、24……記憶装置、32,52……周波数分析部、34,62……雑音推定部、36,66……雑音抑圧部、38,58……波形合成部、42……特性値算定部、44……第1係数設定部、46……第2係数設定部、48……反復回数設定部、50……収音部、51……収音機器、54……信号処理部、U[q](U[1]〜U[Q])……単位処理部、56……出力処理部。
【特許請求の範囲】
【請求項1】
入力音響信号の強度分布の形状に応じた雑音特性値を算定する特性値算定手段と、
音響信号の強度分布の尖度が雑音抑圧処理の前後で変化しない場合における当該音響信号の雑音特性値と雑音抑圧処理のフロアリング処理に適用されるフロアリング係数との関係を規定する関係式を満たすように、前記特性値算定手段が算定した雑音特性値に応じてフロアリング係数を可変に設定する第1係数設定手段と
を具備する雑音抑圧用係数設定装置。
【請求項2】
前記第1係数設定手段は、前記雑音抑圧処理による雑音抑圧率が正数となるように前記フロアリング係数を設定する
請求項1の雑音抑圧用係数設定装置。
【請求項3】
雑音抑圧強度を制御するための抑圧係数を、前記特性値算定手段が算定した雑音特性値に応じて可変に設定する第2係数設定手段
を具備する請求項1または請求項2の雑音抑圧用係数設定装置。
【請求項4】
各雑音抑圧処理による雑音抑圧率の累算値が目標値を上回るように、前記特性値算定手段が算定した雑音特性値と前記第1係数設定手段が設定したフロアリング係数とに応じて前記雑音抑圧処理の反復回数を可変に設定する反復回数設定手段
を具備する請求項1から請求項3の何れかの雑音抑圧用係数設定装置。
【請求項5】
請求項1から請求項4の何れかの雑音抑圧用係数設定装置と、
前記雑音抑圧用係数設定装置が設定した係数を適用した雑音抑圧処理を入力音響信号に対して実行する雑音抑圧手段と
を具備する雑音抑圧装置。
【請求項6】
相互に離間して配置された収音機器が生成するD(Dは2以上の自然数)チャネルの音響信号を順次に処理するQ段の単位処理手段と、
前記Q段のうち最終段の単位処理手段による処理後のDチャネルの音響信号の遅延加算で特定の音源方向の目的音成分を強調する出力処理手段とを具備し、
前記Q段の単位処理手段の各々は、
当該単位処理手段に供給されるDチャネルの音響信号に対する独立成分分析で推定雑音成分を生成する雑音推定手段と、
前記推定雑音成分の雑音特性値に応じたフロアリング係数をチャネル毎に可変に設定する請求項1から請求項4の何れかの雑音抑圧用係数設定装置と、
前記雑音抑圧用係数設定装置がチャネル毎に設定したフロアリング係数を適用した雑音抑圧処理を当該チャネルの音響信号に実行して出力する雑音抑圧手段とを含む
雑音抑圧装置。
【請求項1】
入力音響信号の強度分布の形状に応じた雑音特性値を算定する特性値算定手段と、
音響信号の強度分布の尖度が雑音抑圧処理の前後で変化しない場合における当該音響信号の雑音特性値と雑音抑圧処理のフロアリング処理に適用されるフロアリング係数との関係を規定する関係式を満たすように、前記特性値算定手段が算定した雑音特性値に応じてフロアリング係数を可変に設定する第1係数設定手段と
を具備する雑音抑圧用係数設定装置。
【請求項2】
前記第1係数設定手段は、前記雑音抑圧処理による雑音抑圧率が正数となるように前記フロアリング係数を設定する
請求項1の雑音抑圧用係数設定装置。
【請求項3】
雑音抑圧強度を制御するための抑圧係数を、前記特性値算定手段が算定した雑音特性値に応じて可変に設定する第2係数設定手段
を具備する請求項1または請求項2の雑音抑圧用係数設定装置。
【請求項4】
各雑音抑圧処理による雑音抑圧率の累算値が目標値を上回るように、前記特性値算定手段が算定した雑音特性値と前記第1係数設定手段が設定したフロアリング係数とに応じて前記雑音抑圧処理の反復回数を可変に設定する反復回数設定手段
を具備する請求項1から請求項3の何れかの雑音抑圧用係数設定装置。
【請求項5】
請求項1から請求項4の何れかの雑音抑圧用係数設定装置と、
前記雑音抑圧用係数設定装置が設定した係数を適用した雑音抑圧処理を入力音響信号に対して実行する雑音抑圧手段と
を具備する雑音抑圧装置。
【請求項6】
相互に離間して配置された収音機器が生成するD(Dは2以上の自然数)チャネルの音響信号を順次に処理するQ段の単位処理手段と、
前記Q段のうち最終段の単位処理手段による処理後のDチャネルの音響信号の遅延加算で特定の音源方向の目的音成分を強調する出力処理手段とを具備し、
前記Q段の単位処理手段の各々は、
当該単位処理手段に供給されるDチャネルの音響信号に対する独立成分分析で推定雑音成分を生成する雑音推定手段と、
前記推定雑音成分の雑音特性値に応じたフロアリング係数をチャネル毎に可変に設定する請求項1から請求項4の何れかの雑音抑圧用係数設定装置と、
前記雑音抑圧用係数設定装置がチャネル毎に設定したフロアリング係数を適用した雑音抑圧処理を当該チャネルの音響信号に実行して出力する雑音抑圧手段とを含む
雑音抑圧装置。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【公開番号】特開2013−68919(P2013−68919A)
【公開日】平成25年4月18日(2013.4.18)
【国際特許分類】
【出願番号】特願2011−245206(P2011−245206)
【出願日】平成23年11月9日(2011.11.9)
【出願人】(504143441)国立大学法人 奈良先端科学技術大学院大学 (226)
【出願人】(000004075)ヤマハ株式会社 (5,930)
【公開日】平成25年4月18日(2013.4.18)
【国際特許分類】
【出願日】平成23年11月9日(2011.11.9)
【出願人】(504143441)国立大学法人 奈良先端科学技術大学院大学 (226)
【出願人】(000004075)ヤマハ株式会社 (5,930)
[ Back to top ]