説明

音響処理装置

【課題】音響信号の雑音成分を高精度に抑圧する。
【解決手段】行列分解部42は、並列に収音された音響信号s1および音響信号s2の各々について、当該音響信号siの周波数毎の成分値xi[fm,tn]の時系列を要素とする観測行列Viの非負行列因子分解で、複数の基底Ci[1]〜Ci[K]を含む基底行列Wiと複数の重み系列Ei[1]〜Ei[K]を含む係数行列Hiとを生成する。雑音特定部44は、音響信号s1の基底行列W1の複数の基底C1[1]〜C1[K]のうち音響信号s2の基底行列W2の基底C2[k]との相関が高い基底C1[k]を、音響信号s1の雑音成分(風雑音)に対応する雑音基底C1_noiseとして特定する。係数列生成部46は、基底行列W1のうち雑音基底C1_noise以外の各基底C1[k]と係数行列H1のうち当該各基底C1[k]に対応する重み系列E1[k]とに応じて、音響信号s1の雑音成分が抑圧されるように周波数毎の係数値g1[fm,tn]が設定された処理係数列G1を生成する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音響信号に含まれる雑音成分を抑圧する技術に関する。
【背景技術】
【0002】
目的音成分と雑音成分との混合音の音響信号から雑音成分を抑圧する技術が従来から提案されている。例えば特許文献1には、複数の音響信号の各々における低域成分と各低域成分の平均成分とのうち強度が最小となる成分を選択して各音響信号の高域成分と合成することで、風雑音が抑圧された雑音抑圧信号を生成する技術が開示されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特許第4356670号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかし、特許文献1の技術では、雑音抑圧信号の生成に利用される成分が強度のみを基準として選択されるから、例えば風雑音と比較して目的音成分の強度が小さい場合には目的音成分が除去される可能性がある。また、複数の音響信号の平均成分が雑音抑圧信号の低域成分として選択された場合には、雑音抑圧信号の生成の過程で目的音成分の波形が大幅に変化するから、目的音成分が忠実に再現されないという問題もある。以上の事情を考慮して、本発明は、音響信号の雑音成分を高精度に抑圧することを目的とする。
【課題を解決するための手段】
【0005】
以上の課題を解決するために、本発明の第1態様に係る音響処理装置は、並列に収音された第1音響信号および第2音響信号の各々について、当該音響信号の周波数毎の成分値の時系列を要素とする観測行列(例えば図2の観測行列Vi)の非負行列因子分解で、当該音響信号の相異なる成分の周波数毎の成分値を示す複数の基底(例えば図4の基底Ci[1]〜Ci[K])を含む基底行列(例えば図4の基底行列Wi)と、各基底の重み値の時系列を各々が示す複数の重み系列(例えば図5の重み系列Ei[1]〜Ei[K])を含む係数行列(例えば図5の係数行列Hi)とを生成する行列分解手段と、第1音響信号の基底行列の複数の基底のうち第2音響信号の基底行列の基底との相関が高い基底を、第1音響信号の雑音成分に対応する雑音基底(例えば図4の雑音基底Ci_noise)として特定する雑音特定手段と、第1音響信号の基底行列のうち雑音基底以外の各基底と第1音響信号の係数行列のうち当該各基底に対応する重み系列とに応じて、第1音響信号の雑音成分が抑圧されるように周波数毎の係数値が設定された処理係数列(例えば図1の処理係数列Gi)を生成する係数列生成手段と、第1音響信号に処理係数列を作用させる雑音抑圧手段とを具備する。
【0006】
以上の構成では、第1音響信号および第2音響信号の各々の観測行列が基底行列と係数行列とに分解され、第1音響信号の基底行列の複数の基底のうち第2音響信号の基底行列の基底との相関が高い雑音基底が除外されたうえで処理係数列が生成される。したがって、第1音響信号の目的音成分の強度が雑音成分と比較して低い場合でも雑音成分を高精度に抑圧することが可能である。また、基底行列のうち雑音基底以外の基底は維持されるから、目的音成分の波形を忠実に維持しながら雑音成分を抑圧できるという利点もある。
【0007】
本発明の第1態様の好適例において、行列分解手段は、第1音響信号のうち第1帯域(例えば図2の帯域BL)の成分について基底行列と係数行列とを生成し、雑音抑圧手段は、第1音響信号のうち第1帯域の成分に処理係数列を作用させ、雑音抑圧手段による処理後の成分と、第1音響信号のうち第1帯域と比較して高域側の第2帯域(例えば図2の帯域BH)内の成分とを合成する波形合成手段を具備する。以上の態様では、第1音響信号の第1帯域の成分について処理係数列が生成および適用され、雑音抑圧手段による処理後に第2帯域内の成分と合成される。したがって、第1音響信号の全帯域を対象として処理係数列の生成や適用を実行する構成と比較して処理の負荷を軽減することが可能である。また、雑音成分の周波数を包含するように第1帯域を設定することで、雑音成分を高精度に抑圧可能な処理係数列を生成できるという利点もある。
【0008】
本発明の第1態様の好適例に係る音響処理装置は、第1音響信号と第2音響信号との位相差(例えば図6の位相差ΔP[tn])を算定する位相差算定手段を具備し、係数列生成手段は、処理係数列の各係数値を、第1音響信号と第2音響信号との位相差に応じて可変に設定する。例えば、第1音響信号と第2音響信号との位相差が大きい(雑音成分が優勢である)ほど処理係数列による雑音抑圧の効果が増加するように、処理係数列の各係数値が可変に設定される。以上の形態によれば、第1音響信号と第2音響信号との位相差が処理係数列に反映されるから、処理係数列に位相差を反映させない構成と比較して雑音成分を充分に抑圧できるという利点がある。
【0009】
本発明の第1態様の好適例に係る音響処理装置は、第1音響信号と第2音響信号との強度差(振幅差やパワー差)を算定する強度差算定手段を具備し、係数列生成手段は、処理係数列の各係数値を、第1音響信号と第2音響信号との強度差(例えば図6の強度差ΔA[tn])に応じて可変に設定する。例えば、第1音響信号と第2音響信号との強度差が大きい(雑音成分が優勢である)ほど処理係数列による雑音抑圧の効果が増加するように、処理係数列の各係数値が可変に設定される。以上の形態によれば、第1音響信号と第2音響信号との強度差が処理係数列に反映されるから、処理係数列に強度差を反映させない構成と比較して雑音成分を充分に抑圧できるという利点がある。
【0010】
本発明の第2態様に係る音響処理装置は、並列に収音された第1音響信号および第2音響信号の各々について、当該音響信号の周波数毎の成分値の時系列を要素とする観測行列(例えば図2の観測行列Vi)の非負行列因子分解で、当該音響信号の相異なる成分の周波数毎の成分値を示す複数の基底(例えば図4の基底Ci[1]〜Ci[K])を含む基底行列(例えば図4の基底行列Wi)と、各基底の重み値の時系列を各々が示す複数の重み系列(例えば図5の重み系列Ei[1]〜Ei[K])を含む係数行列(例えば図5の係数行列Hi)とを生成する行列分解手段(例えば図7の行列分解部42)と、第1音響信号の基底行列の複数の基底のうち第2音響信号の基底行列の基底との相関が高い基底を、第1音響信号の雑音成分に対応する雑音基底(例えば図4の雑音基底Ci_noise)として特定する雑音特定手段(例えば図7の雑音特定部44)と、第1音響信号の基底行列のうち雑音基底以外の各基底と第1音響信号の係数行列のうち当該各基底に対応する重み系列との乗算で、前記第1音響信号の雑音成分が抑圧された音響信号を生成する抑圧処理手段(例えば図7の抑圧処理部48)とを具備する。以上の構成でも第1態様と同様の効果が実現される。また、処理係数列の生成や適用が省略されるから、第1態様と比較して音響処理装置の構成や処理が簡素化されるという利点もある。
【0011】
なお、本発明(第1態様,第2態様)の適用の範囲は、2系統の音響信号を処理する構成に限定されない。すなわち、3系統以上の音響信号を処理する構成でも、特定の2系統の音響信号に着目したときに本発明の要件を充足する構成は、本発明の範囲に当然に包含される。
【0012】
以上の各態様に係る音響処理装置は、音響信号の処理に専用されるDSP(Digital Signal Processor)などのハードウェア(電子回路)によって実現されるほか、CPU(Central Processing Unit)などの汎用の演算処理装置とプログラムとの協働によっても実現される。以下に例示する本発明のプログラムは、コンピュータが読取可能な記録媒体に格納された形態で利用者に提供されてコンピュータにインストールされるほか、通信網を介した配信の形態でサーバ装置から提供されてコンピュータにインストールされる。
【0013】
本発明の第1態様に係るプログラムは、並列に収音された第1音響信号および第2音響信号の各々について、当該音響信号の周波数毎の成分値の時系列を要素とする観測行列の非負行列因子分解で、当該音響信号の相異なる成分の周波数毎の成分値を示す複数の基底を含む基底行列と、各基底の重み値の時系列を各々が示す複数の重み系列を含む係数行列とを生成する行列分解処理と、第1音響信号の基底行列の複数の基底のうち第2音響信号の基底行列の基底との相関が高い基底を、第1音響信号の雑音成分に対応する雑音基底として特定する雑音特定処理と、第1音響信号の基底行列のうち雑音基底以外の各基底と第1音響信号の係数行列のうち当該各基底に対応する重み系列とに応じて、第1音響信号の雑音成分が抑圧されるように周波数毎の係数値が設定された処理係数列を生成する係数列生成処理と、第1音響信号に処理係数列を作用させる雑音抑圧処理とをコンピュータに実行させる。以上のプログラムによれば、本発明の第1態様に係る音響処理装置と同様の作用および効果が実現される。
【0014】
本発明の第2態様に係るプログラムは、並列に収音された第1音響信号および第2音響信号の各々について、当該音響信号の周波数毎の成分値の時系列を要素とする観測行列(例えば図2の観測行列Vi)の非負行列因子分解で、当該音響信号の相異なる成分の周波数毎の成分値を示す複数の基底(例えば図4の基底Ci[1]〜Ci[K])を含む基底行列(例えば図4の基底行列Wi)と、各基底の重み値の時系列を各々が示す複数の重み系列(例えば図5の重み系列Ei[1]〜Ei[K])を含む係数行列(例えば図5の係数行列Hi)とを生成する行列分解処理と、第1音響信号の基底行列の複数の基底のうち第2音響信号の基底行列の基底との相関が高い基底を、第1音響信号の雑音成分に対応する雑音基底(例えば図4の雑音基底Ci_noise)として特定する雑音特定処理と、第1音響信号の基底行列のうち雑音基底以外の各基底と第1音響信号の係数行列のうち当該各基底に対応する重み系列との乗算で、前記第1音響信号の雑音成分が抑圧された音響信号を生成する抑圧処理とをコンピュータに実行させる。以上のプログラムによれば、本発明の第2態様に係る音響処理装置と同様の作用および効果が実現される。
【図面の簡単な説明】
【0015】
【図1】本発明の第1実施形態に係る音響処理装置のブロック図である。
【図2】観測行列の説明図である。
【図3】特性解析部のブロック図である。
【図4】基底行列の説明図である。
【図5】係数行列の説明図である。
【図6】第2実施形態における特性解析部のブロック図である。
【図7】第3実施形態における雑音抑圧部のブロック図である。
【発明を実施するための形態】
【0016】
<A:第1実施形態>
図1は、本発明の第1実施形態に係る音響処理装置100のブロック図である。図1に示すように、音響処理装置100には信号供給装置12と放音装置14とが接続される。
【0017】
信号供給装置12は、相異なる位置で並列(同時)に収音されたステレオ形式の音響信号s1および音響信号s2を音響処理装置100に供給する。各音響信号si(i=1,2)は、目的音成分と雑音成分との混合音の音圧波形を表す時間領域の信号である。図1では、相互に離間して配置された複数の収音機器(例えば無指向性のステレオマイク)122が信号供給装置12として例示されている。ただし、可搬型または内蔵型の記録媒体から各音響信号siを読出して音響処理装置100に供給する再生装置や、各音響信号siを通信網から受信して音響処理装置100に供給する通信装置を、信号供給装置12として採用することも可能である。
【0018】
音響処理装置100は、音響信号s1および音響信号s2からステレオ形式の音響信号q1および音響信号q2を生成する。各音響信号qiは、音響信号siから雑音成分を抑圧(目的音成分を強調)した時間領域の信号である。放音装置14(例えばステレオスピーカやステレオヘッドホン)は、音響処理装置100が生成した音響信号q1および音響信号q2に応じた音波を放射する。なお、音響信号siをアナログからデジタルに変換するA/D変換器や音響信号qiをデジタルからアナログに変換するD/A変換器の図示は便宜的に省略されている。
【0019】
図1に示すように、音響処理装置100は、演算処理装置22と記憶装置24とを具備するコンピュータシステムで実現される。記憶装置24は、演算処理装置22が実行するプログラムPGや演算処理装置22が使用する各種のデータを記憶する。半導体記録媒体や磁気記録媒体等の公知の記録媒体や複数種の記録媒体の組合せが記憶装置24として任意に採用され得る。音響信号s1および音響信号s2を記憶装置24に記憶した構成(したがって信号供給装置12は省略され得る)も好適である。
【0020】
演算処理装置22は、記憶装置24に格納されたプログラムPGの実行で、音響信号siから音響信号qiを生成するための複数の機能(周波数分析部32,特性解析部34A,雑音抑圧部36,波形合成部38)を実現する。なお、演算処理装置22の各機能を複数の集積回路に分散した構成や、専用の電子回路(DSP)が各機能を実現する構成も採用され得る。
【0021】
図1の周波数分析部32は、音響信号s1のスペクトルS1と音響信号s2のスペクトルS2とを時間軸上の単位期間(フレーム)毎に順次に生成する。図2に示すように、各スペクトルSiは、周波数軸上の相異なる周波数(f1,f2,……,fM,……)に対応する複数の成分値(パワー)xiを配列したパワースペクトルである。スペクトルXiの生成には、短時間フーリエ変換等の公知の周波数分析が任意に採用され得る。
【0022】
各音響信号siのスペクトルSiは、帯域BL内のスペクトルXiと帯域BH内のスペクトルXHiとに区分される。帯域BLは、雑音成分の周波数を包含するように設定される。本実施形態では風雑音を雑音成分として想定する。風雑音は、空気自体が流動して収音機器122の振動板に直接に衝突することで発生する雑音成分である。空気の衝突に起因した振動板の振動の周波数は、空気の振動(音圧変化)として振動板に伝播する音波の周波数と比較して低い。具体的には、風雑音の周波数は、例えば1.5kHz以下の低周波成分が支配的となる。以上の傾向を考慮して、帯域BLは、M個(Mは自然数)の周波数f1〜fMを含む1.5kHz以下の周波数帯域に設定される。帯域BHは、帯域BLと比較して高域側(例えば1.5kHz以上)の周波数帯域である。
【0023】
図2に示すように、周波数分析部32が生成したスペクトルSiの時系列(すなわちスペクトログラム)は、N個の単位期間t1〜tNで構成される解析期間TA毎に時間軸上で区分される。解析期間TAは、例えば数十秒程度の長時間に設定される。帯域BL内のスペクトルXiのM個の成分値xi[f1,tn]〜xi[fM,tn]を解析期間TA内のN個の単位期間t1〜tNについて時系列に配列したM行×N列の観測行列Viが解析期間TA毎に規定される。すなわち、観測行列Viの第n列(n=1〜N)は、解析期間TA内の第n番目の単位期間tnにおけるスペクトルXiのM個の成分値xi[f1,tn]〜xi[fM,tn]の系列に相当し、観測行列Viの第m行(m=1〜M)は、解析期間TA内のN個の単位期間t1〜tNにわたる周波数fmでの成分値xi[fm,t1]〜xi[fm,tN]の時系列に相当する。スペクトルXiの成分値xi[fm,tn]はパワー(非負値)に相当するから、観測行列Viは非負行列(負数を含まない行列)である。
【0024】
図1の特性解析部34Aは、観測行列Viを解析することで処理期間TA毎に処理係数列Gi(G1,G2)を生成する。処理係数列Giは、係数値gi[f1,t1]〜gi[fM,tN]を配列したM行×N列の行列である。係数値gi[fm,tn]は、単位期間tnのスペクトルXiのうち周波数fmでの成分値xi[fm,tn]に対する利得(スペクトルゲイン)に相当し、0以上かつ1以下の範囲内で音響信号siの特性(風雑音の強度)に応じて可変に設定される。具体的には、単位期間tn内の音響信号siのうち周波数fmの成分において風雑音が優勢であるほど係数値gi[fm,tn]は小さい数値に設定される。
【0025】
雑音抑圧部36は、特性解析部34Aが生成した処理係数列Giを音響信号siの観測行列Viに作用させることで、N個の単位期間t1〜tNの各々に対応するN個のスペクトルYiの時系列(解析期間TA内のスペクトログラム)を解析期間TA毎に順次に生成する。単位期間tnに対応するスペクトルYiは、相異なる周波数fmに対応するM個の成分値(パワー)yi[f1,tn]〜yi[fM,tn]を配列したパワースペクトルである。
【0026】
単位期間tnのスペクトルYiのうち周波数fmでの成分値yi[fm,tn]は、処理係数列Giのうち当該成分値yi[fm,tn]に対応する係数値gi[fm,tn]と観測行列Viのうち当該成分値yi[fm,tn]に対応する成分値xi[fm,tn]との乗算値に設定される(yi[fm,tn]=gi[fm,tn]×xi[fm,tn])。前述のように風雑音が優勢であるほど係数値gi[fm,tn]は小さい数値に設定されるから、雑音抑圧部36による処理後のスペクトルYiは、音響信号siのスペクトルXiから風雑音を抑圧したスペクトル(音響信号qiの帯域BLの成分のスペクトル)に相当する。すなわち、雑音抑圧部36は、音響信号s1および音響信号s2の各々から風雑音を抑圧する要素として機能する。
【0027】
図1の波形合成部38は、雑音抑圧部36が単位期間tn毎に生成したスペクトルYi(帯域BL)と周波数分析部32が生成したスペクトルXHi(帯域BH)とから時間領域の音響信号qiを生成する。具体的には、波形合成部38は、帯域BLのスペクトルYiと帯域BHのスペクトルXHiとの合成(加算)で単位期間tn毎にスペクトルQiを生成し、スペクトルQiに対応する振幅スペクトルと音響信号siの位相スペクトルとを適用したフーリエ逆変換で時間領域の信号を生成するとともに前後の単位期間tnで相互に連結して音響信号qiを生成する。
【0028】
図3は、特性解析部34Aのブロック図である。図3に示すように、第1実施形態の特性解析部34Aは、行列分解部42と雑音特定部44と係数列生成部46とを含んで構成される。行列分解部42は、音響信号s1の観測行列V1および音響信号s2の観測行列V2の各々について、当該観測行列Viの非負行列因子分解(NMF:Non-negative Matrix Factorization)で基底行列Wi(W1,W2)と係数行列Hi(H1,H2)とを生成する。基底行列Wi(図4)は、成分値wi[f1,1]〜wi[fM,K]を配列したM行×K列の非負行列であり、係数行列Hi(図5)は、重み値hi[1,t1]〜hi[K,tN]を配列したK行×N列の非負行列である(Kは自然数)。基底行列Wiと係数行列Hiとの積が観測行列Viと近似する(Vi≒WiHi)ように基底行列Wiと係数行列Hiとが算定される。
【0029】
図4に示すように、基底行列Wiは、K個の基底(codebook)Ci[1]〜Ci[K]で構成される。基底行列Wiの第k列目(k=1〜K)の基底Ci[k]は、解析期間TA内の音響信号siを構成すると推定されるK種類の成分のうち第k番目の成分の周波数f1〜fMでの成分値wi[f1,k]〜wi[fM,k]の系列(パワースペクトル)に相当する。他方、係数行列Hiは、図5に示すように、K個の重み系列(excitation)Ei[1]〜Ei[K]で構成される。係数行列Hiの第k行目の重み系列Ei[k]は、基底行列Wiの基底Ci[k]で表現される成分に対する単位期間tn毎の重み値hi[k,t1]〜hi[k,tN]の時系列(基底Ci[k]の各成分値wi[fm,k]の時間変化)に相当する。以上の定義から理解されるように、単位期間tnのスペクトルXiは、係数行列Hiのうち単位期間tnに対応するK個の重み値hi[1,tn]〜hi[K,tn]を適用したK個の基底Ci[1]〜Ci[K]の加重和で近似される(Xi≒hi[1,tn]×Ci[1]+hi[2,tn]×Ci[2]+……+hi[K,tn]×Ci[K])。
【0030】
観測行列Viの非負行列因子分解には公知の方法が任意に採用される。例えば、基底行列Wiおよび係数行列Hiの積と観測行列Viとの相違(例えば距離)が最小化するように基底行列Wiと係数行列Hiとを逐次的に更新(反復演算)する方法が好適に採用される。反復演算に適用される基底行列Wiの初期値(成分値wi[fm,k]の初期値)は、例えば乱数に設定される。なお、例えば風雑音のスペクトル(高域ほど減衰する周波数特性)を模擬するように各基底Ci[k]のM個の成分値wi[f1,k]〜wi[fM,k]の初期値を設定した構成も好適である。
【0031】
図3の雑音特定部44は、音響信号s1の基底行列W1および音響信号s2の基底行列W2の各々について、当該基底行列WiのK個の基底Ci[1]〜Ci[K]のうち風雑音に対応する1個の基底(以下「雑音基底」という)Ci_noiseを特定する。風雑音は、収音機器122に衝突する空気の乱流に起因して発生するから、相異なる位置で収音された音響信号s1および音響信号s2の各々に含まれる風雑音の瞬時的な周波数特性は相互に統計的に独立する。ただし、風雑音の長期的な周波数特性は、音声等と比較すると、収音の位置に関わらず同様の特性に維持され易い。すなわち、解析期間TAのような長期間にわたる風雑音の周波数特性は音響信号s1と音響信号s2とで類似するという傾向がある。
【0032】
以上の傾向を考慮して、雑音特定部44は、音響信号s1の基底行列W1(基底C1[1]〜C1[K])と音響信号s2の基底行列W2(基底C2[1]〜C2[K])との間で相互に相関が高い各基底Ci[k](C1[k1],C2[k2])を雑音基底Ci_noiseとして基底行列W1および基底行列W2の各々から特定する。例えば、基底行列W1の1個の基底C1[k]と基底行列W2の1個の基底C2[k]とを選択する全通りの組合せについて基底C1[k]と基底C2[k]との相関の度合を示す指標(相関指標)を算定し、相関指標が示す相関の度合が最大となる組合せの基底C1[k1]と基底C2[k2]との各々(変数k1と変数k2との数値の異同は不問)を雑音基底Ci_noise(C1_noise,C2_noise)として抽出する。基底C1[k]と基底C2[k]との相関指標としては、例えば距離(ユークリッド距離)や内積が好適に採用される。
【0033】
図3の係数列生成部46は、音響信号s1および音響信号s2の各々について、図4に示すように当該音響信号siの基底行列Wiから雑音基底Ci_noiseを除外したM行×(K-1)列の行列WAiと、図5に示すように雑音基底Ci_noiseに対応する重み系列Ei_noiseを係数行列Hiから除外した(K-1)行×N列の行列HAiとから処理係数列Gi(G1,G2)を生成する。
【0034】
第1に、係数列生成部46は、雑音基底Ci_noiseの除外後の行列WAi(M行×(K-1)列)と重み系列Ei_noiseの除外後の行列HAi((K-1)行×N列)との乗算で行列VAiを算定する。行列VAiは、要素値va[f1,t1]〜va[fM,tN]を配列したM行×N列の行列である。行列VAiの第n列に位置するM個の要素値va[f1,tn]〜va[fM,tn]の系列は、単位期間tnのスペクトルXiから風雑音を抑圧したパワースペクトルに相当する。
【0035】
第2に、係数列生成部46は、以下の数式(A)の演算で処理係数列Giの係数値gi[fm,tn]を算定する。数式(A)の記号v[fm,tn]は、雑音基底Ci_noiseの除外前の基底行列Wiと重み系列Ei_noiseの除外前の係数行列Hiとを乗算したM行×N列の行列における第m行第n列の要素値を意味し、スペクトルXiの成分値xi[fm,tn]の推定値に相当する。
gi[fm,tn]=va[fm,tn]/v[fm,tn] ……(A)
数式(A)で要素値va[fm,tn]を要素値v[fm,tn]で除算しているのは、係数値gi[fm,tn]を0以上かつ1以下の範囲内の数値に制限するためである。以上の手順で生成された処理係数列G1および処理係数列G2が、図1の雑音抑圧部36による風雑音の抑圧に適用される。
【0036】
以上の説明から理解されるように、単位期間tn内の音響信号siのうち周波数fmの成分に風雑音が優勢であるほど要素値va[fm,tn]は要素値v[fm,tn]に対して減少するから、係数値gi[fm,tn]は小さい数値となる。他方、音響信号siの周波数fmの成分が風雑音を含まない場合、要素値va[fm,tn]は要素値v[fm,tn]と略同値となる(雑音基底Ci_noiseの除外に影響されない)から、係数値gi[fm,tn]は1に近い数値となる。したがって、前述のように雑音抑圧部36が処理係数列Giを観測行列Viに作用させることで、音響信号siから風雑音を抑圧した音響信号qiが生成される。
【0037】
以上に説明したように、第1実施形態では、音響信号siの観測行列Viが基底行列Wiと係数行列Hiとに分解され、雑音基底Ci_noiseを基底行列Wiから除外した行列WAiと重み系列Ei_noiseを係数行列Hiから除外した行列HAiとを利用して処理係数列Giが生成される。したがって、音響信号siの目的音成分の強度が風雑音と比較して低い場合でも、高精度に風雑音を抑圧することが可能である。また、基底行列Wiのうち雑音基底Ci_noise以外の各基底Ci[k]と係数行列Hiのうち重み系列Ei_noise以外の各重み系列Ei[k]とは維持されるから、音響信号siの目的音成分の波形が忠実に維持された音響信号qiを生成できるという利点もある。
【0038】
なお、基底行列Wiから雑音基底Ci_noiseを特定する方法としては、例えば、風雑音の周波数特性を模擬するように事前に作成されたモデルを基底行列Wiの各基底Ci[k]と比較する構成も採用され得る。しかし、風雑音のモデルを利用する構成では、事前に用意されたモデルとは周波数特性が相違する風雑音を充分に抑圧できない可能性がある。他方、第1実施形態では、基底行列W1と基底行列W2との間で相関が高い各基底Ci[k]が雑音基底Ci_noiseとして特定されるから、風雑音のモデルを利用する構成と比較して、多様な特性の風雑音を充分に抑圧できるという利点がある。
【0039】
また、風雑音を含む帯域BLについて選択的に処理係数列Giの生成や適用が実行される(帯域BHについては省略される)から、音響信号siの全帯域を処理の対象とする場合と比較して、風雑音の抑圧の精度を維持しながら、演算処理装置22の処理の負荷を軽減できるという利点もある。
【0040】
<B:第2実施形態>
次に、本発明の第2実施形態について説明する。なお、以下の各例示において作用や機能が第1実施形態と同等である要素については、以上の説明で参照した符号を流用して各々の詳細な説明を適宜に省略する。
【0041】
信号供給装置12の2個の収音機器122に対して正面方向から到来する目的音成分は、位相差を殆ど発生させずに略同等の強度(振幅)で各収音機器122に到達する。他方、風雑音は前述のように空気の乱流に起因するから、同位相かつ同振幅で各収音機器122に到達する可能性は低い。したがって、音響信号s1や音響信号s2にて風雑音が優勢となるほど両者間の位相差や強度差が増加するという傾向がある。以上の傾向を考慮して、本実施形態では、音響信号s1と音響信号s2との位相差や強度差に応じて処理係数列Giの各係数値gi[fm,tn]を補正する。
【0042】
第2実施形態の音響処理装置100は、第1実施形態の特性解析部34Aを図6の特性解析部34Bに置換した構成である。図6に示すように、特性解析部34Bは、特性解析部34Aと同様の要素(行列分解部42,雑音特定部44,係数列生成部46)に加えて位相差算定部52と強度差算定部54とを含んで構成される。各音響信号si(s1,s2)の帯域BMの成分が位相差算定部52および強度差算定部54に供給される。帯域BMは、風雑音の周波数と主要な目的音成分の周波数とを包含するように設定される。例えば、帯域BMは4kHz以下の周波数帯域(すなわち帯域BLを含む帯域)に設定される。
【0043】
位相差算定部52は、音響信号s1と音響信号s2との位相差ΔP[tn]を単位期間tn毎に算定する。位相差ΔP[tn]は、例えば、帯域BM内の各周波数での位相差の代表値(例えば平均値)である。同様に、強度差算定部54は、音響信号s1と音響信号s2との強度差(例えば振幅差やパワー差)ΔA[tn]を単位期間tn毎に算定する。
【0044】
係数列生成部46は、第1実施形態の係数値gi[fm,tn]と同様の方法で算定した係数値γi[fm,tn](第1実施形態の係数値gi[fm,tn]に相当する)を、位相差算定部52が算定した位相差ΔP[tn]と強度差算定部54が算定した強度差ΔA[tn]とに応じて補正することで処理係数列Giの係数値gi[fm,tn]を算定する。
【0045】
第1に、係数列生成部46は、位相差算定部52が算定した位相差ΔP[tn]に応じて単位期間tn毎に係数値ξp[tn]を設定する。具体的には、位相差ΔP[tn]が大きい(すなわち単位期間tnにて風雑音が優勢である)ほど係数値ξp[tn]が小さい数値となるように、係数値ξp[tn]は0以上かつ1以下の範囲内で可変に設定される。第2に、係数列生成部46は、強度差算定部54が算定した強度差ΔA[tn]に応じて単位期間tn毎に係数値ξa[tn]を設定する。具体的には、強度差ΔA[tn]が大きい(すなわち単位期間tnにて風雑音が優勢である)ほど係数値ξa[tn]が小さい数値となるように、係数値ξa[tn]は0以上かつ1以下の範囲内で可変に設定される。
【0046】
第3に、係数列生成部46は、数式(A)の演算で算定した係数値γi[fm,tn]を係数値ξp[tn]と係数値ξa[tn]に応じて調整することで処理係数列Giの各係数値gi[fm,tn](gi[f1,t1]〜gi[fM,tN])を算定する。例えば、係数列生成部46は、係数値γi[fm,tn]と係数値ξp[tn]と係数値ξa[tn]との乗算値を係数値gi[fm,tn]として算定する(gi[fm,tn]=γi[fm,tn]×ξp[tn]×ξa[tn])。以上の説明から理解されるように、係数値ξp[tn]や係数値ξa[tn]が小さい(すなわち単位期間tnにて風雑音が優勢である)ほど係数値gi[gm,tn]は小さい数値となる。したがって、第2実施形態によれば、第1実施形態と比較して風雑音を充分に抑圧できるという利点がある。
【0047】
なお、以上の例示では単位期間tn毎に位相差ΔP[tn]および強度差ΔA[tn]を算定したが、周波数fm毎の位相差ΔP[fm,tn]と周波数fm毎の強度差ΔA[fm,tn]とを各単位期間tnについて算定する構成も好適である。係数列生成部46は、周波数fmと単位期間tnとの組合せ毎に、位相差ΔP[fm,tn]に応じた係数値ξp[fm,tn]と強度差ΔA[fm,tn]に応じた係数値ξa[fm,tn]とを算定する。処理係数列Giの係数値gi[fm,tn]は、例えば係数値γi[fm,tn]と係数値ξp[fm,tn]と係数値ξa[fm,tn]との乗算値として算定される。
【0048】
<C:第3実施形態>
次に、本発明の第3実施形態を説明する。第1実施形態では、雑音基底Ci_noiseの除外後の行列VAiに応じた処理係数列Gi(G1,G2)を音響信号siの観測行列Viに作用させることでスペクトルYiの時系列を生成した。前述の通り、行列VAiの第n列に位置するM個の要素値va[f1,tn]〜va[fM,tn]の系列は、単位期間tnのスペクトルXiから風雑音を抑圧したパワースペクトルに相当する。そこで、第3実施形態では、雑音基底Ci_noiseの除外後の行列VAiをスペクトルYiの時系列として利用する。すなわち、処理係数列Giの生成や観測行列Viに対する適用は省略される。
【0049】
第3実施形態の音響処理装置100は、第1実施形態の特性解析部34Aおよび雑音抑圧部36を図7の雑音抑圧部60に置換した構成である。図7に示すように、雑音抑圧部60は、行列分解部42と雑音特定部44と抑圧処理部48とを含んで構成される。行列分解部42および雑音特定部44は、第1実施形態と同様である。すなわち、行列分解部42は、各観測行列Viの非負行列因子分解で基底行列Wi(W1,W2)と係数行列Hi(H1,H2)とを生成し、雑音特定部44は、基底行列W1内の雑音基底C1_noiseと基底行列W2内の雑音基底C2_noiseとを特定する。
【0050】
抑圧処理部48は、音響信号s1および音響信号s2の各々について、当該音響信号siの基底行列Wiから雑音基底Ci_noiseを除外したM行×(K-1)列の行列WAiと、雑音基底Ci_noiseに対応する重み系列Ei_noiseを係数行列Hiから除外した(K-1)行×N列の行列HAiとの乗算で算定されるM行×N列の行列VAiを、風雑音の抑圧後のスペクトルYiの時系列(スペクトログラム)として解析期間TA毎に順次に生成する。すなわち、行列VAiの第n列に位置するM個の要素値va[f1,tn]〜va[fM,tn]の系列が単位期間tnのスペクトルYiとして波形合成部38に供給される。他の動作は第1実施形態と同様である。
【0051】
第3実施形態では、雑音基底Ci_noiseを基底行列Wiから除外した行列WAiと重み系列Ei_noiseを係数行列Hiから除外した行列HAiとの乗算でスペクトルYiの時系列(行列VAi)が生成される。したがって、第1実施形態と同様の効果が実現される。また、処理係数列Giの算定(数式(A))や観測行列Viに対する適用が省略されるから、第1実施形態と比較して音響処理装置100の構成や処理が簡素化されるという利点もある。
【0052】
<D:変形例>
以上の各形態には多様に変形され得る。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様は適宜に併合され得る。
【0053】
(1)変形例1
以上の各形態では、音響信号siを帯域BLと帯域BHとに分割したが、音響信号siの帯域分割は省略され得る。例えば、音響信号siの全帯域を特性解析部34(34A,34B)や雑音抑圧部36による処理の対象とした構成も採用される。もっとも、風雑音の強度は高域側の帯域(例えば帯域BH)で低下するから、音響信号siの帯域分割を省略した構成では、風雑音の独立した基底Ci[k]を非負行列因子分解で高精度に抽出することが困難となる。したがって、抑圧の対象となる雑音成分の周波数帯域が事前に判明している場合には、雑音成分を包含する周波数帯域(帯域BL)のみを特性解析部34(34A,34B)や雑音抑圧部36による処理の対象とした前述の構成が格別に好適である。
【0054】
(2)変形例2
以上の各形態では、音響信号siの解析期間TA毎に処理係数列Giを生成したが、解析期間TAの区切は省略される。例えば、音響信号siの全区間にわたる単位期間tn毎のスペクトルXiの時系列を1個の観測行列Viとして処理係数列Giを生成する構成も採用され得る。
【0055】
(3)変形例3
以上の各形態では、スペクトルSiをパワースペクトルとした構成を例示したが、スペクトルSiを振幅スペクトルとした構成も採用され得る。前掲の数式(A)で算定される係数値gi[fm,tn]はパワーに対するゲインであるから、スペクトルSiを振幅スペクトルとした構成では、数式(A)の右辺の平方根(va[fm,tn]/v[fm,tn])1/2が係数値gi[fm,tn]として算定される。
【0056】
(4)変形例4
以上の各形態では、処理係数列Giの各係数値gi[fm,tn]を音響信号siの各成分値xi[fm,tn]に乗算することで音響信号qiを生成したが、処理係数列Giを音響信号siに作用させる方法は適宜に変更される。例えば、音響信号siの各成分値xi[fm,tn]に係数値gi[fm,tn]を加算する構成も採用され得る。また、以上の各形態での例示とは反対に、風雑音が優勢であるほど係数値gi[fm,tn]が大きい数値となるように処理係数列Giを生成する構成では、成分値xi[fm,tn]を係数値gi[fm,tn]で除算または減算する構成が採用され得る。
【0057】
(5)変形例5
以上の各形態では、2系統の音響信号qi(q1,q2)を生成したが、1系統(モノラル形式)の音響信号q1のみを生成する場合にも以上の各形態が同様に適用され得る。例えば、観測行列V1に応じた1個の処理係数列G1のみを係数列生成部46が生成し、雑音抑圧部36は観測行列V1に対する処理係数列G1の適用でスペクトルY1の時系列のみを生成する。以上の構成では、音響信号s1の基底行列W1から雑音基底C1_noiseを特定するために音響信号s2が利用される。
【0058】
(6)変形例6
演算処理装置22の処理(処理係数列Giの生成や適用)は、音響信号s1および音響信号s2の供給に並行して実時間的に実行され、各処理毎に逐次的に各音響信号qiが再生され得る。ただし、事前に用意された音響信号s1および音響信号s2に対する処理係数列Giの生成や適用が完了してから音響信号qiの生成を開始する構成(バッチ処理)も好適である。
【符号の説明】
【0059】
100……音響処理装置、12……信号供給装置、14……放音装置、22……演算処理装置、24……記憶装置、32……周波数分析部、34A,34B……特性解析部、36……雑音抑圧部、38……波形合成部、42……行列分解部、44……雑音特定部、46……係数列生成部、52……位相差算定部、54……強度差算定部。


【特許請求の範囲】
【請求項1】
並列に収音された第1音響信号および第2音響信号の各々について、当該音響信号の周波数毎の成分値の時系列を要素とする観測行列の非負行列因子分解で、当該音響信号の相異なる成分の周波数毎の成分値を示す複数の基底を含む基底行列と、前記各基底の重み値の時系列を各々が示す複数の重み系列を含む係数行列とを生成する行列分解手段と、
前記第1音響信号の前記基底行列の前記複数の基底のうち前記第2音響信号の前記基底行列の基底との相関が高い基底を、前記第1音響信号の雑音成分に対応する雑音基底として特定する雑音特定手段と、
前記第1音響信号の前記基底行列のうち前記雑音基底以外の各基底と前記第1音響信号の前記係数行列のうち当該各基底に対応する重み系列とに応じて、前記第1音響信号の前記雑音成分が抑圧されるように周波数毎の係数値が設定された処理係数列を生成する係数列生成手段と、
前記第1音響信号に前記処理係数列を作用させる雑音抑圧手段と
を具備する音響処理装置。
【請求項2】
前記行列分解手段は、前記第1音響信号のうち第1帯域の成分について前記基底行列と前記係数行列とを生成し、
前記雑音抑圧手段は、前記第1音響信号のうち前記第1帯域の成分に前記処理係数列を作用させ、
前記雑音抑圧手段による処理後の成分と、前記第1音響信号のうち前記第1帯域と比較して高域側の第2帯域内の成分とを合成する波形合成手段を具備する
請求項1の音響処理装置。
【請求項3】
前記第1音響信号と前記第2音響信号との位相差を算定する位相差算定手段を具備し、
前記係数列生成手段は、前記処理係数列の各係数値を、前記第1音響信号と前記第2音響信号との位相差に応じて可変に設定する
請求項2の音響処理装置。
【請求項4】
前記第1音響信号と前記第2音響信号との強度差を算定する強度差算定手段を具備し、
前記係数列生成手段は、前記処理係数列の各係数値を、前記第1音響信号と前記第2音響信号との強度差に応じて可変に設定する
請求項2または請求項3の音響処理装置。


【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2011−227417(P2011−227417A)
【公開日】平成23年11月10日(2011.11.10)
【国際特許分類】
【出願番号】特願2010−99488(P2010−99488)
【出願日】平成22年4月23日(2010.4.23)
【出願人】(000004075)ヤマハ株式会社 (5,930)