説明

ノイズ低減装置およびノイズ低減方法

【課題】目標とするSN比やノイズレベルに応じて適切にノイズを低減する。
【解決手段】ノイズ低減装置100は、第1のマイク160で収音して電気信号に変換した音声信号と、第2のマイク162で収音して電気信号に変換した参照信号とに基づいて、音声信号に含まれたノイズ成分を低減する第1低減部126と、ノイズ成分が低減された音声信号のSN比を導出するSN比導出部130と、SN比の指令値であるSN指令値を取得する指令取得部132と、導出されたSN比と、取得されたSN指令値を比較し、導出されたSN比を取得されたSN指令値以上とするのに不足しているノイズの抑制量であるノイズ抑制量を導出する抑制量導出部134と、ノイズ成分が低減された音声信号について、導出されたノイズ抑制量分、ノイズ成分を抑制する第2低減部136と、を備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声信号に含まれるノイズを適切に低減するノイズ低減装置およびノイズ低減方法に関する。
【背景技術】
【0002】
従来、主として雑音(ノイズ)を収音するためのマイクによって収音された参照信号を空間特性フィルタに通すことによって擬似的にノイズ信号を生成し、主として話者の声などの目的の音声を収音するためのマイクによって収音された音声信号から差し引く事で、ノイズを低減する適応フィルタ(LMS:Least Mean Square)方式がある。
【0003】
また、音声信号をリアルタイムに解析し、周波数領域上の信号を調整する事によってノイズ成分を低減する周波数差し引き法もある。周波数差し引き法では、音声信号を周波数変換し、分割した周波数スペクトルを基に、ノイズの周波数スペクトルを推定して差し引くことで、音声信号の聞き難さを改善できる。
【0004】
近年、この二種類のノイズ低減方式を組み合わせた方式が提案されている。例えば、主マイクとは別に副マイクを配し、それぞれのマイクで収音された音声信号から目的音の信号とノイズ信号を生成し、ノイズ信号の周波数スペクトルをノイズレベルが小さいほど大きな圧縮比で圧縮し、目的音の信号の周波数スペクトルから圧縮したノイズ信号の周波数スペクトルを減算する技術が提案されている(例えば、特許文献1)。また、音声信号に含まれるエコーを推定してエコーのキャンセル信号を音声信号から差し引き、抑制しきれなかったエコーを、後段のエコーサプレッサで抑制する技術が提示されている(例えば、特許文献2、3)。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2009−134102号公報
【特許文献2】特開2006−33802号公報
【特許文献3】特開2003−101445号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
上述した特許文献1の技術では、目的音の信号とノイズ信号とを正確に分離するためには、ノイズ源に対するマイクの配置も制限され、目的音以外のノイズを主に収音するマイクの設置数も増やさなければならない。そのため、例えば、配置制限の厳しい小型の携帯端末への実装は困難である。さらに、分離後のノイズ信号のノイズレベル(ノイズフロア)だけでは、実際に、目的音の信号からどこまでノイズが除去されているかを正確に把握できず、例えば、目標として出力信号のSN比やノイズレベルが設定されていても、その目標を確実に達成することは困難であった。
【0007】
また、エコーについては、その生成元となる信号を取得可能であり、発生するメカニズムやタイミング、装置自体の伝達特性が既知であるため、精度がよいキャンセル信号を容易に生成することができる。しかし、装置外部から混入されるノイズに対して、特許文献2、3のような従来技術では十分にノイズを低減できない。さらに、装置自体が発生する出力信号によって生じるハウリングを防止するハウリングサプレッサも、エコーを低減する装置と同様、装置外部から混入されるノイズに対しては効果が低い。
【0008】
そこで本発明は、このような課題に鑑み、目標とするSN比やノイズレベルに応じて適切にノイズを低減することが可能な、ノイズ低減装置およびノイズ低減方法を提供することを目的としている。
【課題を解決するための手段】
【0009】
上記課題を解決するために、本発明のノイズ低減装置は、第1のマイクで収音して電気信号に変換した音声信号と、第2のマイクで収音して電気信号に変換した参照信号とに基づいて、音声信号に含まれたノイズ成分を低減する第1低減部と、ノイズ成分が低減された音声信号のSN比を導出するSN比導出部と、SN比の指令値であるSN指令値を取得する指令取得部と、導出されたSN比と、取得されたSN指令値を比較し、導出されたSN比を取得されたSN指令値以上とするのに不足しているノイズの抑制量であるノイズ抑制量を導出する抑制量導出部と、ノイズ成分が低減された音声信号について、導出されたノイズ抑制量分、ノイズ成分を抑制する第2低減部と、を備えることを特徴とする。
【0010】
音声信号が、音声区間であるか非音声区間であるかを示す音声区間情報を生成する区間判定部と、音声区間の音声信号の信号レベルである音声レベルを保持する保持部と、をさらに備え、SN比導出部は、音声区間情報が非音声区間を示す場合、保持部に保持された音声区間の音声信号の音声レベルを用いて、SN比を導出してもよい。
【0011】
音声信号が、音声区間であるか非音声区間であるかを示す音声区間情報を生成する区間判定部と、非音声区間の音声信号の信号レベルであるノイズレベルを保持する保持部と、をさらに備え、SN比導出部は、音声区間情報が音声区間を示す場合、保持部に保持された非音声区間の音声信号のノイズレベルを用いて、SN比を導出してもよい。
【0012】
上記課題を解決するために、本発明の他のノイズ低減装置は、第1のマイクで収音して電気信号に変換した音声信号と、第2のマイクで収音して電気信号に変換した参照信号とに基づいて、音声信号に含まれたノイズ成分を低減する第1低減部と、ノイズ成分が低減された音声信号のノイズレベルを導出する低減量導出部と、ノイズレベルの指令値であるノイズ指令値を取得する指令取得部と、導出されたノイズレベルと、取得されたノイズ指令値を比較し、ノイズレベルをノイズ指令値未満とするのに不足しているノイズの抑制量であるノイズ抑制量を導出する抑制量導出部と、ノイズ成分が低減された音声信号について、導出されたノイズ抑制量分、ノイズ成分を抑制する第2低減部と、を備えることを特徴とする。
【0013】
音声信号が、音声区間であるか非音声区間であるかを示す音声区間情報を生成する区間判定部と、非音声区間の音声信号の信号レベルであるノイズレベルを保持する保持部と、をさらに備え、抑制量導出部は、音声区間情報が音声区間を示す場合、保持部に保持された、過去の非音声区間における音声信号のノイズレベルを用いて、ノイズ抑制量を導出してもよい。
【0014】
第1低減部は、適応フィルタで構成され、第1のマイクで収音して電気信号に変換した音声信号と、第2のマイクで収音して電気信号に変換した参照信号とに基づいて、フィルタ係数を補正してもよい。
【0015】
第2低減部は、周波数差し引き法によってノイズ成分を抑制し、ノイズ低減装置は、周波数差し引き法における周波数変換ブロック長に相当する分、遅延処理を行う遅延部と、導出されたSN比がSN指令値以上の場合、または、導出されたノイズレベルがノイズ指令値未満の場合、第1低減部がノイズ成分を低減した音声信号の出力先を、第2低減部から遅延部に切り換える切換部と、をさらに備えてもよい。
【0016】
上記課題を解決するために、本発明のノイズ低減方法は、第1のマイクで収音して電気信号に変換した音声信号と、第2のマイクで収音して電気信号に変換した参照信号とに基づいて、音声信号に含まれたノイズ成分を低減し、ノイズ成分が低減された音声信号のSN比を導出し、SN比の指令値であるSN指令値を取得し、導出したSN比と、取得したSN指令値を比較し、導出されたSN比を取得されたSN指令値以上とするのに不足しているノイズの抑制量であるノイズ抑制量を導出し、ノイズ成分が低減された音声信号について、導出したノイズ抑制量分、ノイズ成分を抑制することを特徴とする。
【発明の効果】
【0017】
以上説明したように本発明では、目標とするSN比やノイズレベルに応じて適切にノイズを低減することが可能となる。
【図面の簡単な説明】
【0018】
【図1】第1の実施形態におけるノイズ低減装置の概略的な機能を示した機能ブロック図である。
【図2】第1低減部の処理を説明するための回路図である。
【図3】第1低減部を通過する前の音声信号と音声区間情報を示す時間波形図である。
【図4】第1低減部を通過した後の音声信号と音声区間情報を示す時間波形図である。
【図5】第1の実施形態におけるノイズ低減方法の処理の流れを示すフローチャートである。
【図6】第2の実施形態におけるノイズ低減装置の概略的な機能を示した機能ブロック図である。
【図7】第2の実施形態におけるノイズ低減方法の処理の流れを示すフローチャートである。
【発明を実施するための形態】
【0019】
以下に添付図面を参照しながら、本発明の好適な実施形態について詳細に説明する。かかる実施形態に示す寸法、材料、その他具体的な数値等は、発明の理解を容易とするための例示にすぎず、特に断る場合を除き、本発明を限定するものではない。なお、本明細書及び図面において、実質的に同一の機能、構成を有する要素については、同一の符号を付することにより重複説明を省略し、また本発明に直接関係のない要素は図示を省略する。
【0020】
例えば、携帯電話やトランシーバのような携帯端末を用いた屋外での通話において、収音した信号である音声信号に対してノイズ低減処理が施されることが想定される。このような携帯端末では電波の帯域を効率的に利用するため、1つの通信に割り当てられる帯域は最低限のものである。そのため、携帯端末では、音声信号の符号化に際し、人間の声の性質を利用した高圧縮で低レートの符号化方式が用いられている。
【0021】
具体的に、携帯電話に用いられる符号化方式では、約10kbps前後の符号化レートであるCELP(Code Excited Linear Prediction)が普及し、トランシーバに用いられる符号化方式では、約4kbps前後の符号化レートであるVocoderが普及している。いずれも、人の声道が作り出すスペクトルエンベロープを生成モデルとして数式化し、音声信号の源となる駆動音源をその声道モデルに通すことによって音声信号を復元する。また、有声音・無声音の特徴や基本周期、さらにはノイズ分析に従って音声信号をテーブル化する等の手段で低レートかつ高品質な音声信号の符号化を実現する。
【0022】
しかし、上述のような符号化方式は、人間の声道から発声される音声を収音して電気信号に変換した音声信号の符号化を想定しており、音声信号に目的の音声ではないノイズが混入すると、信号モデルの生成に誤りが生じノイズが増大してしまい、場合によっては、復号した信号が音声信号として意味を成さない破綻状態を招く可能性がある。
【0023】
このような事態を回避するため、ノイズ低減装置から出力するノイズ低減処理後の信号は、後段の符号化処理における符号化方式の符号化レートに応じたSN比やノイズレベル(ノイズフロア)を維持する必要がある。
【0024】
ところで、従来、適応フィルタ方式でノイズを除去し、その除去処理で残留したノイズ(以下、残留ノイズと称す)を周波数差し引き法で抑制する、2段構成のノイズ低減装置は提案されている。しかし、エコーやハウリング以外の多様なノイズについて、適応フィルタや音源分離フィルタ(BSS:Blind Signal Separation)でノイズを十分に除去することは困難であった。
【0025】
また、その適応フィルタ方式のノイズの除去効果は、使用環境によって大きく変化するため、後段の周波数差し引き法によるノイズ低減処理で、一律にノイズを低減しようとすると、過度なノイズ低減処理となり、音質に悪影響を及ぼす副作用的なノイズ(量子化雑音またはミュージカルノイズ)を発生させてしまう場合がある。さらに、逆に、ノイズ低減処理が不足し、後段の符号化方式の符号化レートに応じたSN比やノイズレベルを維持できず破錠状態を招く可能性がある。そこで、本実施形態では、符号化方式の符号化レートに基づいて設定された、目標とするSN比やノイズレベルに応じて適切にノイズを低減することができるノイズ低減装置について詳述し、続いて、そのノイズ低減装置を用いたノイズ低減方法について説明する。
【0026】
(ノイズ低減装置100)
図1は、第1の実施形態におけるノイズ低減装置100の概略的な機能を示した機能ブロック図である。ノイズ低減装置100は、音声信号取得部120と、参照信号取得部122と、区間判定部124と、第1低減部126と、保持部128と、SN比導出部130と、指令取得部132と、抑制量導出部134と、第2低減部136と、遅延部138と、切換部140とを含んで構成される。
【0027】
音声信号取得部120は、音声を収音することを目的とした第1のマイク160で収音して電気信号に変換した音声信号を取得する。参照信号取得部122は、音声以外の音を収音することを目的とした1または複数の第2のマイク162で収音して電気信号に変換した参照信号を取得する。
【0028】
区間判定部124は、音声信号取得部120が取得した音声信号が、音声区間(音声が含まれる区間)であるか非音声区間(音声が含まれない区間)であるかを示す音声区間情報を生成する。ノイズ成分が主である非音声区間の信号に対し、音声成分を含む音声区間の信号は、エネルギーの単位時間あたりの変化量が大きい。このことから、区間判定部124は、例えば、音声信号の所定時間毎のエネルギーを導出し、その変化量が所定の閾値を超えると音声区間と判定し、所定の閾値以下であると非音声区間と判定する。
【0029】
第1低減部126は、例えば、LMSを用いた適応フィルタやBSSで構成され、第1のマイク160で変換された音声信号と、第2のマイク162で変換された参照信号とに基づいて、音声信号に含まれたノイズを低減する。第1のマイク160は話者の声などの目的の音声を収音することを目的として目的の音声を収音しやすい位置に配置される。第2のマイク162は目的の音声以外の例えばノイズを収音しやすい位置に配置される。
【0030】
図2は、第1低減部126の処理を説明するための回路図である。特に、図2(a)は、適応フィルタを用いた例を示し、図2(b)は、BSSを用いた例を示す。
【0031】
適応フィルタの場合、図2(a)に示すように、第1低減部126は、適応フィルタ126aとしてFIR(Finite Impulse Response)を用い、参照信号を適応フィルタ126aに通すことで音声信号に混入したノイズの量を推定し、減算器126bで音声信号から減算することで、音声信号に含まれるノイズ成分を低減する。このとき、第1低減部126は、区間判定部124が音声信号を非音声区間と判定した場合、推定したノイズの量と目標とする本来のノイズの量(非音声区間の音声信号レベル)との差から誤差量を導出し、その誤差量に応じてフィルタ係数(FIR係数)を逐次更新する。また、区間判定部124が音声信号を音声区間と判定した場合、その音声信号についてはフィルタ係数の更新は行わないか、係数更新に関わる影響度を軽微なものとする。かかるフィルタ係数を適時補正する構成により、第1低減部126は、環境のノイズに応じて適応的にノイズを低減できる。
【0032】
また、BSSの場合、図2(b)に示すように、第1低減部126において、音声信号と参照信号が音源分離フィルタ126cに通され、ノイズ成分が低減された音声信号と音声成分が低減された参照信号に分離される。そして、独立判定部126dは、分離された音声信号と参照信号の独立性に基づいて、音源分離フィルタ126cのフィルタ係数を逐次更新する。さらに、音源分離フィルタ126cの代わりに、図示しない乗算部が、音声信号と参照信号に音源分離行列を乗算してもよい。この場合、独立判定部126dは、音源分離行列の行列要素を逐次更新する。
【0033】
図3は、第1低減部126を通過する前の音声信号と音声区間情報を示す時間波形図であり、図4は、その音声信号に対応する第1低減部126を通過した後の音声信号と音声区間情報を示す時間波形図である。図3(a)と図4(a)には音声信号の時間波形図を、図3(b)と図4(b)には音声区間情報を示す。ここでは、音声区間情報は、0が非音声区間、1が音声区間を示す。
【0034】
第1低減部126は、図3、4に示すような、音声信号が音声区間ではない非音声区間の場合(音声区間情報が0の場合)、積極的にノイズを打ち消す処理を行い、音声区間の場合(音声区間情報が1の場合)、音声の回り込みの影響や音声成分による適応誤差量の把握が困難なため、ノイズを打ち消す処理を抑える。
【0035】
保持部128は、RAM(Random Access Memory)、EEPROM(Electrically Erasable and Programmable Read Only Memory)、フラッシュメモリ等の記憶媒体で構成され、音声レベルおよびノイズレベルを保持する。ここで、音声レベルは、音声区間の音声信号の信号レベルであり、ノイズレベルは、非音声区間の音声信号の信号レベルである。
【0036】
SN比導出部130は、ノイズ成分が低減された音声信号のSN比を導出する。具体的に、SN比導出部130は、音声区間情報が非音声区間を示す場合、ノイズレベルを保持部128に保持させる。一方、音声区間情報が音声区間を示す場合、SN比導出部130は、音声レベルを保持部128に保持させる。
【0037】
そして、SN比導出部130は、音声区間情報が非音声区間を示す場合、その音声信号のノイズレベルと、保持部128に保持された、最も新しい音声レベルとによって、SN比を導出する。
【0038】
このように、保持部128に、音声レベルを保持する構成により、対象の区間が音声区間でなくとも、保持部128に保持された音声レベルを用いてノイズ抑制量を導出でき、導出されたノイズ抑制量に基づいて、第2低減部136において適切なノイズ抑制処理を実行することが可能となる。
【0039】
一方、音声区間情報が音声区間を示す場合、SN比導出部130は、その音声信号の音声レベルと、保持部128に保持された、最も新しいノイズレベルとによって、SN比を導出する。
【0040】
保持部128に、ノイズレベルを保持する構成により、対象の区間が非音声区間でなくとも、保持部128に保持されたノイズレベルを用いてノイズ抑制量を導出でき、導出されたノイズ抑制量に基づいて、第2低減部136において適切なノイズ抑制処理を実行できる。
【0041】
また、SN比導出部130は、SN比の導出に際し、ノイズレベルについて、所定の時間分のノイズレベルの平均値を用いてもよい。かかる構成により、ノイズレベルの突発的な変位によるSN比への影響を抑制することができる。
【0042】
指令取得部132は、SN比の指令値であるSN指令値を取得する。本実施形態において、SN指令値は、例えば、後段の符号化処理の符号化方式の符号化レートに応じ、上述した破綻状態とならないように設定された値が外部から取得されるものとするが、ノイズ低減装置100に、予め設定されていてもよい。抑制量導出部134は、SN比導出部130が導出したSN比と、指令取得部132が取得したSN指令値を比較し、SN比をSN指令値以上とするのに不足しているノイズの抑制量であるノイズ抑制量を導出する。
【0043】
第1低減部126のノイズ除去処理で除去できなかった残留ノイズについては、ランダム性が高まり、そのノイズ特性を利用した除去や適応フィルタのように空間特性から疑似的にノイズ信号を作り出して除去することは難しい。このような残留ノイズのノイズ抑制処理には、周波数領域上で音声スペクトルを抽出し非音声成分の影響を抑えるような周波数差し引き法が適している。
【0044】
第2低減部136は、ノイズ成分が低減された音声信号について、導出されたノイズ抑制量分、周波数差し引き法によってノイズ成分を抑制する。第2低減部136は、差し引くノイズの周波数スペクトルの強さをノイズ抑制量に応じて制御する。
【0045】
遅延部138は、周波数差し引き法における周波数変換ブロック長に相当する分、遅延処理を行う。切換部140は、SN比導出部130が導出したSN比がSN指令値以上の場合、第1低減部126に切換信号を送信し、第1低減部126は、切換信号を受けて、ノイズ成分を低減した音声信号の出力先を、第2低減部136から遅延部138に切り換える。また、切換部140は、SN比導出部130が導出したSN比がSN指令値未満の場合、第1低減部126に切換信号を送信し、第1低減部126は、切換信号を受けて、ノイズ成分を低減した音声信号の出力先を、遅延部138から第2低減部136に切り換える。
【0046】
第1低減部126が指定値に対してノイズを十分に抑制している場合、第2低減部136は何らノイズ抑制処理を行わないで済む。しかし、単に第2低減部136を切断すると、第2低減部136によって周波数変換ブロック長に相当する遅延が生じていたのが、元に戻り、遅延分の歪みが生じる。かかる切換部140を備える構成により、第2低減部136がノイズ抑制処理を実行しない場合であっても、遅延量を等しく維持することができる。
【0047】
上述したように、例えば、ノイズ低減装置100から出力された出力信号がその後段で符号化される際の符号化方式の符号化レートに応じて、SN比の指令値が設定される。第2低減部136は、第1低減部126のノイズ除去量に応じ、設定された指令値に到達するようにノイズ低減量を制御する。こうして、本実施形態のノイズ低減装置100は、前段の第1低減部126におけるノイズの除去効果が高い場合、第2低減部136における過度なノイズ抑制処理を抑制できる。また、ノイズ低減装置100は、前段の第1低減部126におけるノイズの除去効果が低い場合、第2低減部136におけるノイズ抑制処理を適切に設定して指定値まで確実にノイズを抑制することができる。そのため、ノイズ低減装置100は、例えば、第2低減部136が周波数差し引き法を用いたノイズサプレッサである場合、音質に悪影響を及ぼす副作用的なノイズの発生を最低限に抑制でき、出力する出力信号の音質を向上することが可能となる。
【0048】
(ノイズ低減方法)
次に、上述したノイズ低減装置100を用いて音声信号のノイズを低減するノイズ低減方法を説明する。図5は、第1の実施形態におけるノイズ低減方法の処理の流れを示すフローチャートである。
【0049】
音声信号取得部120が音声信号を、参照信号取得部122が参照信号を取得すると(S200におけるYES)、区間判定部124は、音声信号取得部120が取得した音声信号が音声区間か否かを示す音声区間情報を生成する(S202)。第1低減部126は、音声信号と参照信号とに基づいて、音声信号に含まれたノイズを低減する(S204)。ここでのノイズ低減処理は、参照信号に基づいてノイズを擬似的に生成し、音声信号に混入したノイズを除去する適応フィルタやBSSを用いる。
【0050】
そして、第1低減部126は、区間判定部124が生成した音声区間情報が音声区間を示すか否かを判定する(S206)。音声区間を示す場合(S206におけるYES)、SN比導出部130は、その音声信号の音声レベルを保持部128に保持させる(S208)。続いてSN比導出部130は、保持部128に保持されている最も新しいノイズレベルを取得する(S210)。
【0051】
SN比導出部130は、その音声信号の音声レベルと、保持部128から取得した、最も新しいノイズレベルとを用いて、SN比を導出する(S212)。
【0052】
一方、音声区間情報が音声区間を示さない場合、すなわち、非音声区間を示す場合(S206におけるNO)、その音声信号のノイズレベルを保持部128に保持させる(S214)。続いてSN比導出部130は、保持部128に保持された、最も新しい音声レベルを取得する(S216)。
【0053】
続いてSN比導出部130は、その音声信号のノイズレベルと、保持部128から取得した、最も新しい音声レベルとを用いて、SN比を導出する(S218)。
【0054】
このように、音声区間の場合、音声信号の成分は音声成分が支配的なことから、音声信号をノイズではない音声による音声信号とみなすことができ、SN比導出部130は、その音声信号の音声レベルを保持部128に保持させておくと共に、音声成分の影響で正確なノイズレベルの取得が困難なことから、保持部128に保持された最も新しいノイズレベルを取得する。
【0055】
一方、非音声区間の場合、音声信号の成分はノイズ成分が支配的なことから、音声信号をノイズによる音声信号とみなすことができ、SN比導出部130は、その音声信号のノイズレベルを保持部128に保持させておくと共に、非音声区間では音声レベルの取得はできないため、保持部128に保持された最も新しい音声レベルを取得する。
【0056】
指令取得部132は、SN比の指令値であるSN指令値を取得する(S220)。抑制量導出部134は、SN比導出部130が導出したSN比と、指令取得部132が取得したSN指令値を比較し、SN比をSN指令値以上とするのに不足しているノイズの抑制量であるノイズ抑制量を導出する(S222)。不足していなかった場合は、抑制量導出部134は、何ら処理を行わない。
【0057】
切換部140は、SN比導出部130が導出したSN比がSN指令値以上であるか否かを判定する(S224)。SN比がSN指令値以上である場合(S224におけるYES)、切換部140は、第1低減部126がノイズ成分を低減した音声信号の出力先が遅延部138か否かを判定する(S226)。遅延部138ではない場合(S226におけるNO)、切換部140は、第1低減部126に切換信号を送信し、第1低減部126は、切換信号を受けて、ノイズ成分を低減した音声信号の出力先を、第2低減部136から遅延部138に切り換える(S228)。すでに出力先が遅延部138の場合(S226におけるYES)、何ら処理は行わない。そして、遅延部138は、周波数差し引き法における周波数変換ブロック長に相当する分、遅延処理を行う(S230)。
【0058】
SN比導出部130が導出したSN比がSN指令値未満である場合(S224におけるNO)、切換部140は、第1低減部126がノイズ成分を低減した音声信号の出力先が第2低減部136か否かを判定する(S232)。第2低減部136ではない場合(S232におけるNO)、切換部140は、第1低減部126に切換信号を送信し、第1低減部126は、切換信号を受けて、ノイズ成分を低減した音声信号の出力先を、遅延部138から第2低減部136に切り換える(S234)。すでに出力先が第2低減部136の場合(S232におけるYES)、何ら処理は行わない。そして、第2低減部136は、ノイズ成分が低減された音声信号について、導出されたノイズ抑制量分、ノイズ成分を抑制する(S236)。ここでは、第2低減部136は、例えば、周波数差し引き法によってノイズ成分を抑制する。
【0059】
そして、第2低減部136または遅延部138は、ノイズ低減(抑制)処理後の出力信号を外部装置に出力する(S238)。そして、信号取得判定ステップS200に戻る。
【0060】
以上説明したノイズ低減方法によっても、目標とするSN比やノイズレベルに応じて適切にノイズを低減することが可能となる。
【0061】
(第2の実施形態)
上述した第1の実施形態では、SN比に基づいてノイズ抑制量を導出していた。第2の実施形態では、ノイズレベルによってノイズ抑制量を導出するノイズ低減装置300について説明する。なお、上述した第1の実施形態と実質的に等しい構成要素については、同一の符号を付して説明を省略する。
【0062】
(ノイズ低減装置300)
図6は、第2の実施形態におけるノイズ低減装置300の概略的な構成を示した機能ブロック図である。ノイズ低減装置300は、音声信号取得部120と、参照信号取得部122と、区間判定部124と、第1低減部126と、保持部128と、低減量導出部330と、指令取得部332と、抑制量導出部334と、第2低減部136と、遅延部138と、切換部340とを含んで構成される。
【0063】
第1の実施形態における構成要素として既に述べた、音声信号取得部120、参照信号取得部122、区間判定部124、第1低減部126、保持部128、第2低減部136、遅延部138、実質的に機能が等しいので重複説明を省略し、ここでは構成が相違する低減量導出部330、指令取得部332、抑制量導出部334、切換部340を主に説明する。
【0064】
低減量導出部330は、ノイズ成分が低減された音声信号のノイズレベルを導出する。指令取得部332は、ノイズレベルの指令値であるノイズ指令値を取得する。抑制量導出部334は、低減量導出部330が導出したノイズレベルと、指令取得部332が取得したノイズ指令値を比較し、ノイズレベルをノイズ指令値未満とするのに不足しているノイズの抑制量であるノイズ抑制量を導出する。
【0065】
ただし、抑制量導出部334は、音声区間情報が音声区間を示す場合、保持部128に保持された、過去の非音声区間における最も新しいノイズレベルを用いて、ノイズ抑制量を導出する。
【0066】
保持部128に、例えば、最も新しいノイズレベルを保持する構成により、対象の区間が非音声区間でなくとも、保持部128に保持されたノイズレベルを用いてノイズ抑制量を導出でき、導出されたノイズ抑制量に基づいて、第2低減部136において適切なノイズ抑制処理を実行できる。
【0067】
さらに、抑制量導出部334は、第1低減部126でノイズが低減された音声信号のノイズレベルに基づいて、区間判定部124による音声区間判定処理の正確性を評価してもよい。ノイズレベルが低ければ、第1低減部126によるノイズ低減処理の効果が高いと予測され、音声区間判定処理も正確に実行されたと推定できる。この場合、音声成分は第1低減部126を通った後もほとんど変化せずに保存されていると考えられる。そのため、抑制量導出部334は、第2低減部136に対し、対象とするすべての周波数領域に一様にノイズ抑制量分のノイズ抑制処理を施すよう制御信号を送信する。
【0068】
一方、ノイズレベルが高い場合、第1低減部126によるノイズ低減処理の効果が低いと予測され、音声区間判定処理も正確性に欠けていたと推定できる。この場合、音声成分はノイズ成分に埋没しており、例えば、母音のような特徴的な成分のみが保存されていると考えられる。そのため、抑制量導出部334は、より音声スペクトルと非音声スペクトルとのレベル差を明確にしてノイズ抑制処理を施すよう第2低減部136に制御信号を送信する。かかる構成により、後段の符号化処理において少なくとも母音に対する符号化効率を上げることが可能となり、音声の明瞭性を確保できる。
【0069】
第2低減部136における周波数差し引き法では、スペクトル単位でレベル調整を行う。第1低減部126でノイズが低減された音声信号のノイズレベルに応じて、音声スペクトルおよび非音声スペクトルの判定基準であるレベル差を制御することで、より効果的にノイズ抑制処理を施すことができる。
【0070】
ノイズ抑制処理において必要となる、音声スペクトルの候補および非音声スペクトルの候補の抽出は、区間判定部124または第2低減部136に含まれる周波数変換部で行う。そして、最終的に、第2低減部136が、音声スペクトルおよび非音声スペクトルを判定する際、第1低減部126でノイズが低減された音声信号のノイズレベルに基づき、音声スペクトルと非音声スペクトルを決定する。
【0071】
切換部340は、低減量導出部330が導出したノイズレベルがノイズ指令値未満の場合、第1低減部126に切換信号を送信し、第1低減部126は、切換信号を受けて、ノイズ成分を低減した音声信号の出力先を、第2低減部136から遅延部138に切り換える。また、切換部340は、低減量導出部330が導出したノイズレベルがノイズ指令値以上の場合、第1低減部126に切換信号を送信し、第1低減部126は、切換信号を受けて、ノイズ成分を低減した音声信号の出力先を、遅延部138から第2低減部136に切り換える。
【0072】
上述したように、例えば、ノイズ低減装置300から出力された出力信号がその後段で符号化される際の符号化方式の符号化レートに応じて、ノイズ指令値が設定される。第2低減部136は、第1低減部126から出力された音声信号のノイズレベルに応じ、設定されたノイズ指令値を超えないようにノイズ抑制量を制御する。こうして、本実施形態のノイズ低減装置300は、前段の第1低減部126におけるノイズの除去効果が高い場合、第2低減部136における過度なノイズ抑制処理を抑制できる。また、第1低減部126におけるノイズの除去効果が低い場合、ノイズ低減装置300は、第2低減部136におけるノイズ抑制処理を適切に設定して指定値まで確実にノイズを抑制することができる。
【0073】
(ノイズ低減方法)
次に、上述したノイズ低減装置300を用いて音声信号のノイズを低減するノイズ低減方法を説明する。図7は、第2の実施形態におけるノイズ低減方法の処理の流れを示すフローチャートである。
【0074】
信号取得ステップS200から音声区間判定ステップS206までの処理は、第1の実施形態で説明したフローチャートと実質的に等しいので説明を省略する。音声区間情報判定ステップS206において、音声区間情報が音声区間を示す場合(S206におけるYES)、低減量導出部330は、保持部128に保持された、最も新しいノイズレベルを取得する(S210)また、音声区間情報が非音声区間を示す場合(S206におけるNO)、その音声信号のノイズレベルを保持部128に保持させる(S214)。
【0075】
続いて、指令取得部332は、ノイズレベルの指令値であるノイズ指令値を取得する(S420)。抑制量導出部334は、低減量導出部330が導出したノイズレベル、または保持部128から取得したノイズレベルと、指令取得部332が取得したノイズ指令値を比較し、ノイズレベルをノイズ指令値未満とするのに不足しているノイズの抑制量であるノイズ抑制量を導出する(S422)。
【0076】
そして、切換部340は、低減量導出部330が導出したノイズレベルがノイズ指令値未満であるか否かを判定する(S424)。以下、遅延部出力判定ステップS226から出力ステップS238までの処理は、第1の実施形態で説明したフローチャートと実質的に等しいので説明を省略する。
【0077】
以上説明したノイズ低減方法によっても、目標とするSN比やノイズレベルに応じて適切にノイズを低減することが可能となる。
【0078】
以上、添付図面を参照しながら本発明の好適な実施形態について説明したが、本発明はかかる実施形態に限定されないことは言うまでもない。当業者であれば、特許請求の範囲に記載された範疇において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
【0079】
なお、本明細書のノイズ低減方法における各工程は、必ずしもフローチャートとして記載された順序に沿って時系列に処理する必要はなく、並列的あるいはサブルーチンによる処理を含んでもよい。
【産業上の利用可能性】
【0080】
本発明は、音声信号に含まれるノイズを適切に低減するノイズ低減装置およびノイズ低減方法に利用することができる。
【符号の説明】
【0081】
100、300 …ノイズ低減装置
124 …区間判定部
126 …第1低減部
128 …保持部
130 …SN比導出部
132、332 …指令取得部
134、334 …抑制量導出部
136 …第2低減部
138 …遅延部
330 …低減量導出部
140、340 …切換部
160 …第1のマイク
162 …第2のマイク

【特許請求の範囲】
【請求項1】
第1のマイクで収音して電気信号に変換した音声信号と、第2のマイクで収音して電気信号に変換した参照信号とに基づいて、前記音声信号に含まれたノイズ成分を低減する第1低減部と、
ノイズ成分が低減された前記音声信号のSN比を導出するSN比導出部と、
SN比の指令値であるSN指令値を取得する指令取得部と、
導出された前記SN比と、取得された前記SN指令値を比較し、前記導出されたSN比を前記取得されたSN指令値以上とするのに不足しているノイズの抑制量であるノイズ抑制量を導出する抑制量導出部と、
前記ノイズ成分が低減された音声信号について、導出された前記ノイズ抑制量分、ノイズ成分を抑制する第2低減部と、
を備えることを特徴とするノイズ低減装置。
【請求項2】
前記音声信号が、音声区間であるか非音声区間であるかを示す音声区間情報を生成する区間判定部と、
音声区間の前記音声信号の信号レベルである音声レベルを保持する保持部と、
をさらに備え、
前記SN比導出部は、前記音声区間情報が非音声区間を示す場合、前記保持部に保持された音声区間の前記音声信号の音声レベルを用いて、前記SN比を導出することを特徴とする請求項1に記載のノイズ低減装置。
【請求項3】
前記音声信号が、音声区間であるか非音声区間であるかを示す音声区間情報を生成する区間判定部と、
非音声区間の前記音声信号の信号レベルであるノイズレベルを保持する保持部と、
をさらに備え、
前記SN比導出部は、前記音声区間情報が音声区間を示す場合、前記保持部に保持された非音声区間の前記音声信号のノイズレベルを用いて、前記SN比を導出することを特徴とする請求項1または2のいずれかに記載のノイズ低減装置。
【請求項4】
第1のマイクで収音して電気信号に変換した音声信号と、第2のマイクで収音して電気信号に変換した参照信号とに基づいて、前記音声信号に含まれたノイズ成分を低減する第1低減部と、
ノイズ成分が低減された前記音声信号のノイズレベルを導出する低減量導出部と、
ノイズレベルの指令値であるノイズ指令値を取得する指令取得部と、
導出された前記ノイズレベルと、取得された前記ノイズ指令値を比較し、ノイズレベルを前記ノイズ指令値未満とするのに不足しているノイズの抑制量であるノイズ抑制量を導出する抑制量導出部と、
前記ノイズ成分が低減された音声信号について、導出された前記ノイズ抑制量分、ノイズ成分を抑制する第2低減部と、
を備えることを特徴とするノイズ低減装置。
【請求項5】
前記音声信号が、音声区間であるか非音声区間であるかを示す音声区間情報を生成する区間判定部と、
非音声区間の前記音声信号の信号レベルであるノイズレベルを保持する保持部と、
をさらに備え、
前記抑制量導出部は、前記音声区間情報が音声区間を示す場合、前記保持部に保持された、過去の非音声区間における前記音声信号のノイズレベルを用いて、前記ノイズ抑制量を導出することを特徴とする請求項4に記載のノイズ低減装置。
【請求項6】
前記第1低減部は、適応フィルタで構成され、第1のマイクで収音して電気信号に変換した前記音声信号と、第2のマイクで収音して電気信号に変換した前記参照信号とに基づいて、フィルタ係数を補正することを特徴とする請求項1から5のいずれか1項に記載のノイズ低減装置。
【請求項7】
前記第2低減部は、周波数差し引き法によってノイズ成分を抑制し、
前記ノイズ低減装置は、
前記周波数差し引き法における周波数変換ブロック長に相当する分、遅延処理を行う遅延部と、
導出された前記SN比が前記SN指令値以上の場合、または、導出された前記ノイズレベルが前記ノイズ指令値未満の場合、前記第1低減部がノイズ成分を低減した音声信号の出力先を、前記第2低減部から前記遅延部に切り換える切換部と、
をさらに備えることを特徴とする請求項1から6のいずれか1項に記載のノイズ低減装置。
【請求項8】
第1のマイクで収音して電気信号に変換した音声信号と、第2のマイクで収音して電気信号に変換した参照信号とに基づいて、前記音声信号に含まれたノイズ成分を低減し、
ノイズ成分が低減された前記音声信号のSN比を導出し、
SN比の指令値であるSN指令値を取得し、
導出した前記SN比と、取得した前記SN指令値を比較し、導出されたSN比を前記取得されたSN指令値以上とするのに不足しているノイズの抑制量であるノイズ抑制量を導出し、
前記ノイズ成分が低減された音声信号について、導出した前記ノイズ抑制量分、ノイズ成分を抑制することを特徴とするノイズ低減方法。

【図1】
image rotate

【図2】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図3】
image rotate

【図4】
image rotate