撮像装置及び撮像装置のノイズ低減方法
【課題】音声等の目的音の劣化を招くことなく、ノイズを適切に低減することができる撮像装置及び撮像装置のノイズ低減方法を提供する。
【解決手段】本発明の撮像装置は、集音装置131と、前記集音装置131により集音された音情報から音声区間を検出する音声区間検出部134と、前記音声区間検出部134の検出結果に基づいて、異なるノイズ低減処理を行うノイズ低減処理部133と、を備えること、を特徴とする。
【解決手段】本発明の撮像装置は、集音装置131と、前記集音装置131により集音された音情報から音声区間を検出する音声区間検出部134と、前記音声区間検出部134の検出結果に基づいて、異なるノイズ低減処理を行うノイズ低減処理部133と、を備えること、を特徴とする。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、撮影時に入力される音情報からノイズを低減処理する撮像装置及び撮像装置のノイズ低減方法に関するものである。
【背景技術】
【0002】
動画撮影が可能な撮像装置において動画撮影時には、オートフォーカスレンズの駆動部の動作に伴い発生する動作音(以下、AFノイズという)等のノイズが、マイク等の集音装置により集音され、被写体の発する音声等の目的音に混入し、目的音の品質を損なうことがある。
このようなAFノイズを低減する方法として、AF駆動部の動作前に入力される音声信号のパワー値を取得し、この音声信号のパワー値に基づいてフロアリング係数を制御(変化)させることにより、ノイズを除去する方法が提案されている(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2008−252389号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかし、特許文献1によるノイズ低減処理の場合は、AFノイズを低減することができる反面、音声等の目的音を劣化する可能性が高いという問題があった。
【0005】
本発明の課題は、音声等の目的音の劣化を招くことなく、ノイズを適切に低減することができる撮像装置及び撮像装置のノイズ低減方法を提供することである。
【課題を解決するための手段】
【0006】
本発明は、以下のような解決手段により前記課題を解決する。なお、理解を容易にするために、本発明の実施形態に対応する符号を付して説明するが、これに限定されるものではない。
【0007】
請求項1に記載の発明は、集音装置(131)と、前記集音装置(131)により集音された音情報から音声区間を検出する音声区間検出部(134)と、前記音声区間検出部(134)の検出結果に基づいて、異なるノイズ低減処理を行うノイズ低減処理部(133)と、を備えること、を特徴とする撮像装置(100)である。
請求項2に記載の発明は、請求項1に記載の撮像装置(100)であって、該撮像装置(100)内の駆動部の動作情報から動作ノイズの発生タイミングを検出するノイズタイミング検出部(135)を備え、前記ノイズ低減処理部(133)は、前記ノイズタイミング検出部(135)の検出結果に基づいて、異なるノイズ低減処理を行うこと、を特徴とする撮像装置(100)である。
請求項3に記載の発明は、請求項1または2に記載の撮像装置(100)であって、前記ノイズ低減処理部(133)は、前記音声区間検出部(134)により音声区間と検出された場合、前記音声区間検出部(134)において非音声区間であると検出された場合よりも弱い低い第1のノイズ低減処理を行うこと、を特徴とする撮像装置(100)である。
請求項4に記載の発明は、請求項1から3のいずれか1項に記載の撮像装置(100)であって、前記ノイズ低減処理部(133)は、前記音声区間検出部(134)において非音声区間であると判定された場合の音情報からノイズを推定し、該推定されたノイズを、推定ノイズ減算前音情報から減算する第2のノイズ低減処理を行うこと、を特徴とする撮像装置(100)である。
請求項5に記載の発明は、請求項1から4のいずれか1項に記載の撮像装置(100)であって、前記ノイズ低減処理部(133)は、前記音声区間検出部(134)において非音声区間であると判定された場合の音情報からフロアリングスペクトルを求め、該フロアリングスペクトルを用いてフロアリング処理前音情報に対してフロアリング処理すること、を特徴とする撮像装置(100)である。
請求項6に記載の発明は、請求項1から5のいずれか1項に記載の撮像装置(100)であって、前記音声区間検出部(134)による音声区間の検出は、音声波形の一部を切り出して自己相関関数を求め、その求めた自己相関関数のピーク値を用いて検出すること、を特徴とする撮像装置(100)である。
請求項7に記載の発明は、集音された音情報から音声区間を検出し、音声区間の検出結果に基づいて、異なるノイズ低減処理を行うこと、を特徴とする撮像装置(100)のノイズ低減方法である。
請求項8に記載の発明は、請求項7に記載のノイズ低減方法であって、前記撮像装置(100)内の駆動部の動作情報から動作ノイズの発生タイミングを検出し、動作ノイズの発生タイミングの検出結果に基づいて、異なるノイズ低減処理を行うこと、を特徴とする撮像装置(100)のノイズ低減方法である。
請求項9に記載の発明は、請求項7または8に記載のノイズ低減方法であって、音声区間と検出された場合、非音声区間であると検出された場合よりも弱い第1のノイズ低減処理を行うこと、を特徴とする撮像装置(100)のノイズ低減方法である。
請求項10に記載の発明は、請求項7から9のいずれか1項に記載のノイズ低減方法であって、非音声区間であると判定された場合の音情報からノイズを推定し、該推定されたノイズを、推定ノイズ減算前音情報から減算する第2のノイズ低減処理を行うこと、を特徴とする撮像装置(100)のノイズ低減方法である。
請求項11に記載の発明は、請求項7から10のいずれか1項に記載のノイズ低減方法であって、非音声区間であると判定された場合の音情報からフロアリングスペクトルを求め、該フロアリングスペクトルを用いてフロアリング処理前音情報に対してフロアリング処理すること、を特徴とする撮像装置(100)のノイズ低減方法である。
請求項12に記載の発明は、請求項7から11のいずれか1項に記載のノイズ低減方法であって、音声区間の検出は、音声波形の一部を切り出して自己相関関数を求め、その求めた自己相関関数のピーク値を用いて検出すること、を特徴とする撮像装置(100)のノイズ低減方法である。
なお、符号を付して説明した構成は、適宜改良してもよく、また、少なくとも一部を他の構成物に代替してもよい。
【発明の効果】
【0008】
本発明によれば、音声等の目的音の劣化を招くことなく、ノイズを適切に低減することができる撮像装置及び撮像装置のノイズ低減方法を提供することができる。
【図面の簡単な説明】
【0009】
【図1】本発明の実施形態の撮像装置の構成を示すブロック図である。
【図2】音声波形図である。
【図3】音声波形の自己相関関数を説明する図である。
【図4】自己相関関数を利用して音声区間を検出する場合の一例であり、図4(A)は、マイクからの出力波形、図4(B)は自己相関関数のピークに閾値を設定して、閾値以上の部分をHighとして示した波形である。
【図5】ノイズタイミング検出部による動作ノイズの発生タイミング検出の詳細を説明する図である。
【図6】ノイズ低減処理動作のフローを示すフローチャートである。
【図7】ノイズ低減処理の対象となる第1の処理対象音の形態を説明する概略図である。
【図8】区間Aのスペクトルを示す図である。
【図9】区間Bのスペクトルを示す図である。
【図10】区間Cのスペクトルを示す図である。
【図11】推定ノイズスペクトルを示す図である。
【図12】区間Cのスペクトルからノイズを減算したスペクトルを示す図である。
【図13】フロアリングスペクトルAを使用したフロアリング後のスペクトルを示す図である。
【図14】フロアリングスペクトルAを示す図である。
【図15】フロアリングスペクトルBを示す図である。
【図16】フロアリングスペクトルBを使用したフロアリング後のスペクトルを示す図である。
【図17】ノイズ低減処理の対象となる第2の処理対象音の形態を説明する概略図である。
【図18】区間Eの背景音とノイズのスペクトルを示す図である。
【図19】区間Eのスペクトルを使用した推定ノイズを示す図である。
【図20】区間Fのスペクトルを示す図である。
【図21】区間Eの推定ノイズを使用してフロアリング処理した後のスペクトルを示す図である。
【図22】区間Fのスペクトルを使用した推定ノイズを示す図である。
【図23】区間Fの推定ノイズを使用してフロアリング処理した後のスペクトルを示す図である。
【発明を実施するための形態】
【0010】
以下、図面等を参照して、本発明の実施形態について説明する。図1は、本発明の実施形態の撮像装置の構成を示すブロック図である。
【0011】
図1に示すように、撮像装置100は、レンズ鏡筒110と、レンズ鏡筒110を通過した被写体像を撮像してA/D変換すると共に、画像処理して画像データを生成する画像処理部120と、集音された音情報をA/D変換すると共に、ノイズ低減処理する音情報処理部130と、画像処理部120で得られた画像データ及び音情報処理部130で得られた音声信号を記録する記録部140と、CPU150と、を備える。
【0012】
レンズ鏡筒110は、焦点調整レンズ(以下、AF(Auto Focus)レンズ、手振れ補正レンズ(以下、VR(Vibration Reduction)レンズ、ズームレンズ、ズームレンズ駆動部、ズームエンコーダ、像ぶれ補正部等を備えるVRユニット111と、AFエンコーダ112と、AF駆動用モータ113と、を備える。
【0013】
AFエンコーダ112は、光学系のAFレンズの位置を検出してCPU150に出力する。AF駆動用モータ113には、AFレンズの位置を制御するための駆動制御信号がCPU150から入力され、その駆動制御信号に応じて、AFレンズの位置が制御される。
【0014】
CPU150は、設定された撮像条件(例えば、絞り値、露出値等)に応じてレンズ鏡筒110を制御する。CPU150は、ズームレンズ駆動部及びAF駆動用モータ113を駆動する駆動制御信号を生成し、ズームレンズ駆動部及びAF駆動用モータ113に出力する。
【0015】
音情報処理部130は、集音装置であるマイク131と、集音されA/D変換された音情報を処理する音信号処理部132と、ノイズ低減処理部133と、を備える。
【0016】
音信号処理部132は、マイク131により集音した音情報から音声区間を検出する音声区間検出部134と、AF駆動用モータ113の動作情報から動作ノイズの発生するタイミングを検出するノイズタイミング検出部135と、を備える。
【0017】
音声区間検出部134は、マイク131により集音された音情報から、音声信号の含まれる区間(音声区間)とそれ以外の区間(非音声区間)とを、自己相関関数のピーク値に基づいて判別する。音声区間検出部134による音声区間検出の概要を説明すると、次のとおりである。
【0018】
図2は、音声波形である。この音声波形の任意の一部を切り出して自己相関関数を求めると、図3に示す波形となる。この音声波形は、音声、即ち、声帯の振動数に対応した基本周波数及びそれの倍音に対応した周波数帯域にピークが集中する性質(調波性)を有しており、この調波性を利用して自己相関関数のピーク値の大きさによって、音声であるか非音声であるかを区別することが可能である。
【0019】
図4は、自己相関関数を利用して音声区間を検出する場合の一例を示す。図4(A)は、マイク131からの出力波形であり、その前半部にAFノイズが発生し、後半部に音声とAFノイズとが発生している。図4(A)に示すような出力波形に対して自己相関関数を求め、この自己相関関数のピークに閾値を設定して、閾値以上の部分をHighとして示すと、図4(B)のような波形が得られる。これによって、出力波形の後半部に音声位置と一致した音声区間があることを検出できる。
【0020】
ノイズタイミング検出部135は、AF駆動用モータ113の動作情報から動作ノイズの発生するタイミングを検出する。このノイズタイミング検出部135による動作ノイズの発生タイミングは、CPU150にAF駆動用モータ113に対する駆動制御信号を出力するように指示するAF駆動コマンド及びAFエンコーダ112からの出力を用いて検出(推定)する。
【0021】
ノイズタイミング検出部135による動作ノイズの発生タイミング検出の詳細を説明すると、次のとおりである。
図5に示すように、AF駆動コマンドの出力によりAF駆動用モータ113が動作されると、AF駆動コマンドの出力時刻であるAF駆動用モータ113の動作開始時刻t1から動作終了時刻t3まで連続して動作ノイズは発生される。マイク131には、被写体の音声等の記録目的音に動作ノイズが重畳された音情報が集音され、その集音された音情報がマイク131から出力される。
【0022】
このとき、AFエンコーダ112からは、AF駆動系のギア列で起きるバックラッシュ等の影響でAF駆動用モータ113の動作開始時刻t1よりも遅れた時刻t2から出力されることがある。そこで、ノイズタイミング検出部135は、AF駆動コマンドの出力時刻t1からAFエンコーダ112の出力停止t3までを動作ノイズの発生タイミングとして検出し、それ以外を非ノイズタイミングとして検出する。
なお、AF動作時においてマイク131から実際に出力される信号は、目的音に動作ノイズが重畳した信号であるが、説明を簡略にするため、図5では、動作ノイズのみを示している。
【0023】
ノイズ低減処理部133は、図5に示す動作ノイズのうち、AF動作開始時及びAF動作終了時に発生する衝撃音ノイズを低減処理する。ノイズ低減処理部133は、図5に示す動作ノイズ発生前の窓Xの第1周波数スペクトルと、動作ノイズ発生後の窓Yの第2周波数スペクトルと、を取得する。取得した第1周波数スペクトルと第2周波数スペクトルとを比較し、比較の結果、第2周波数スペクトルが第1周波数スペクトルより大きい場合、第2周波数スペクトルを第1周波数スペクトルに置き換えることにより、第1のノイズの低減処理を行なう。
【0024】
ここで、音声区間検出部134により音声区間であると検出された場合、所定の周波数(例えば、4000Hz)までのスペクトルは置き換えずに保存し、また、非音声区間であると検出された場合、それよりも小さい所定の周波数(例えば、500Hz)までのスペクトルは置き換えずに保存する。すなわち、音声区間と検出された場合の保存する周波数の上限を、例えば、4000Hzとし、非音声区間と検出された場合の保存する周波数の上限を、例えば、500Hzとすることにより、音声区間であると検出された場合、非音声区間であると検出された場合よりも弱い第1の衝撃音ノイズ低減処理を行う。
【0025】
また、ノイズ低減処理部133は、音声区間検出部134において非音声区間であると検出されて強い衝撃音ノイズ低減処理が行われた場合の周波数スペクトルからノイズを推定し、推定ノイズを更新すると共に、その推定ノイズを用いて、第1の衝撃音ノイズ低減処理が行われた周波数スペクトルから減算して周波数スペクトルを生成するスペクトル減算処理(第2のノイズ低減処理)を行なう。
【0026】
上記した構成の他に、音情報処理部130には、マイク131から出力される音情報を予め決められた区間毎に分割して窓関数で重み付けする共に、この区間毎の音データをフーリエ変換(FFT:Fast Fourier Transform)して周波数領域に変換する処理部を有する。また、FFT処理により周波数領域の振幅情報と位相情報とに分けられ、周波数領域の振幅情報を利用してノイズ低減処理(スペクトル減算処理)が行われたスペクトルに対して、逆フーリエ変換(IFFT:Inverse Fast Fourier Transform)を行なうことにより、ノイズ低減処理後のスペクトル(音情報)を時間領域に変換する処理部を有する。これら処理部については、図示を省略する。
【0027】
更に、ノイズ低減処理部133は、第2のノイズ低減処理(スペクトル減算処理)により、スペクトルが著しく減少した場合やスペクトルが消失した場合においてスペクトルを補正するフロアリング機能を有する。このフロアリングは、ノイズタイミング検出部135により非ノイズタイミングであると検出され、且つ、音声区間検出部134により非音声区間であると検出された場合の音情報を基に生成されたフロアリングスペクトルと第2のノイズ低減処理において減算された後のスペクトルとを比較し、減算後のスペクトルがフロアリングスペクトルを下回っている(スペクトル強度が小さい)場合、フロワリングスペクトルを採用した音情報(スペクトル)を生成し、これをIFFT処理する。
ただし、減算後のスペクトルがフロアリングスペクトルを上回っている(スペクトル強度が大きい)場合は、フロアリング処理を行ってもよいし、また、行なわなくてもよい。
【0028】
また、フロアリング機能に用いるフロアリングスペクトルは、ノイズタイミング検出部135により非ノイズタイミングであると検出され、且つ、音声区間検出部134により非音声区間であると検出された場合の音情報を用いて更新する。これにより、フロアリングスペクトルには、動作ノイズスペクトル、音声スペクトルのいずれも含まず、背景音のみが含まれており、フロアリング処理時に音声スペクトルが付加され、ノイズ低減処理後の音情報に本来無い音声を生じることがないようにしている。
【0029】
次に、本実施形態の撮像装置100におけるノイズ低減処理動作(ノイズ低減方法)を、図面に基づいて説明する。図6は、ノイズ低減処理動作のフローを示すフローチャートである。図7は、ノイズ低減処理の対象となる第1の処理対象音の形態を説明する概略図である。
【0030】
(第1の処理対象音)
図7に示すように、第1の処理対象音は、区間Aが背景音のみ、区間Bが背景音と音声(目的音)、区間Cが背景音とAFノイズを発生している形態である。図7に示す第1の処理対象音の区間Cにおいてマイク131が集音し出力される音情報からAFノイズを低減処理する動作及びフロアリング更新について説明する。
【0031】
(ステップST1)
まず、ノイズタイミング検出部135により、マイク131から出力される音情報に基づいて、ノイズタイミングの検出が開始される。
このときのマイク31によって集音された音情報(スペクトル)を、区間Aについて図8、区間Bについて図9に示す。
【0032】
(ステップST2)
続いて、音声区間検出部134により、マイク131から出力される音情報に基づいて、音声区間の検出が開始される。
【0033】
(ステップST3)
マイク131から出力される音情報をFFT処理して、周波数領域の振幅情報と位相情報とに分けられる。
【0034】
(ステップST4)
次に、ノイズタイミング検出部135によって、動作ノイズの発生タイミングであるか非ノイズタイミングであるか(すなわちAF区間か否か)、が検出(判定)される。
【0035】
(ステップST4,YES)
ステップST4において、区間Cは動作ノイズの発生タイミングであると判定され(AF区間,YES)、ステップST5に進む。
(ステップST4,NO)
区間AおよびBは非ノイズタイミングであると判定され、ステップST11に進む。
【0036】
(ステップST5)
ステップST5においては、音声区間検出部134によって、音声区間であるか、非音声区間であるかが検出(判定)される。区間Cは、非音声区間であるので(NO)、ステップST7に進む。
(ステップST7)
ここでは、AF動作開始時及びAF動作終了時が含まれる場合、上限が所定の周波数(例えば、500Hz)までのスペクトルを置き換えずに保存するといった強い衝撃音ノイズ低減処理が行われ、区間Cについて図10のスペクトルを得る。
AF動作開始時及びAF動作終了時が含まれない場合は、衝撃音ノイズが含まれないと判断し、衝撃音ノイズ低減処理を行わない。
【0037】
(ステップST8)
次いで、ステップST7のノイズ低減処理により得られたスペクトル(図10)におけるノイズを推定し、図11に示すような推定ノイズスペクトルをステップST9に出力する。
【0038】
(ステップST9)
続いて、ステップST7の衝撃音ノイズ低減処理により得られたスペクトル(図10)からステップST8の推定により得られた推定ノイズスペクトル(図11)を減算するスペクトル減算処理(第2のノイズ低減処理)が行なわれ、図12に示すようなスペクトルが得られる。
【0039】
(ステップST10)
第2のノイズ低減処理(スペクトル減算処理)により、図12のスペクトルが著しく減少したり、消失したりする場合があるので、これに対応するため、図12のスペクトルを補正するフロアリングが行なわれる。
このフロアリングは、図12のスペクトルと基準となるフロアリングスペクトルと、の大きさを比較する。そして、比較の結果、強度の大きいスペクトルを採用して、図13に示すスペクトルを生成する。ここで用いたフロアリングスペクトルは、後述するが、区間Aから求めたフロアリングスペクトルである。
【0040】
(ステップST11)
ステップST11に戻り、ここでは、音声区間検出部134によって、音声区間であるか、非音声区間(背景音のみの区間)であるか、が検出(判定)される。その結果、区間Bは音声区間であると判定され(YES)、ノイズ低減処理、スペクトル減算、フロアリングを行わず、ステップST13に進む。区間Aは非音声区間であると判定され(NO)、ステップST12に進む。
【0041】
(ステップST12)
ステップST12においては、図8に示す背景音のみが発生している区間Aのスペクトルの各周波数における振幅を半減して、図14に示すようなフロアリングスペクトルを得る。このフロアリングスペクトル(図14)を、前述したようにステップST10のフロアリングに用いると共に、このフロアリングスペクトルに更新する。
仮に、区間Bの図9に示すスペクトルの各周波数における振幅を半減して求めた図15のフロアリングスペクトルを用いてフロアリングした場合、図16に示すようなスペクトルとなる。図16のスペクトルを区間Cのスペクトルとすると、区間B(図9)に含まれる音声のスペクトルの成分(特にf2,f4)も含まれることになり、正確な目的音を得ることができない。
しかし、本実施形態によると、フロアリングに用いるフロアリングスペクトル(図14)には、音声及び動作ノイズのスペクトルが含まれていない。このため、ステップST10のフロアリングにおいて、AFノイズや音声のスペクトルが付加されてノイズ低減処理後の音情報に本来ない動作ノイズや音声が生じることを防ぐことができる。
【0042】
(ステップST13)
最後のステップST13において、ステップST3において分けられた位相を用いてIFFT処理を行なうことにより、ノイズ低減処理後のスペクトルを時間領域に変換して記録部140に出力する。
【0043】
(第2の処理対象音)
次に、上述した第1の処理対象音と異なる形態を有する第2の処理対象音を用いた場合のノイズ低減処理動作(ノイズ低減方法)について説明する。なお、ノイズ低減処理動作フローの各ステップは、第1の処理対象音の場合は略同様であるため、主として各ステップにおける処理内容の相違点を中心に説明する。
【0044】
図17は、ノイズ低減処理の対象となる第2の処理対象音の形態を説明する概略図である。図17に示すように、処理対象音は、区間Dが背景音のみ、区間Eが背景音とAFノイズ、区間Fが背景音と音声とAFノイズを発生している形態である。図17に示す処理対象音の区間E及び区間Fにおいてマイク131が集音し出力される音情報からAFノイズを低減処理する動作及びフロアリング更新について説明する。
【0045】
ステップST1からST4までは上述の第1の処理対象音の区間Cと同様であるので省略する。
(ステップST5)
ステップST5において、区間Fは音声区間であると判定され(YES)、ステップST6に進む。
(ステップST6)
ステップST6においては、AF動作開始時及びAF動作終了時が含まれる場合、上限が所定の周波数(例えば、4000Hz)までのスペクトルを置き換えずに保存するといった弱い第1の衝撃音ノイズ低減処理が行なわれる。
AF動作開始時及びAF動作終了時が含まれない場合は、衝撃音ノイズが含まれないと判断し、衝撃音ノイズ低減処理を行わない。
【0046】
この第1の衝撃音ノイズ低減処理が行われたスペクトルは、音声スベクトル成分f2、f4を含む。このスペクトルは、推定ノイズ更新に使用されず、第2のノイズ低減処理であるスペクトル減算処理を行なうためのステップST9に進む。
第2の処理対象音の場合、動作ノイズの発生タイミングで且つ非音声区間である区間Eにおいては、図18に示すようなスペクトルが得られ、区間Fにおいては、図20に示すようなスペクトルが得られる。
【0047】
そこで、ステップST8においては、区間Eで得られたスペクトルからノイズを推定し更新する。更新後の推定ノイズは、図19に示すようなスペクトルとなる。
【0048】
そして、ステップST9において、区間Fにおけるスペクトル(図20)から推定ノイズスペクル(図19)を減算し、更に、ステップST10においてフロアリングすることにより、図21に示すようなスペクトルを生成する。
なお、第2の処理対象音の場合のフロアリングスペクトルは、背景音のみが発生している区間Dから得る。このフロアリングスペクトルは、第1の処理対象音の場合と同様図8を半減処理した図14のスペクトルを用いる。
【0049】
ここで、仮に区間Fのスペクトル(図20)に0.9を乗じた推定ノイズ図22をもとにスペクトル減算を行った場合、図23に示すスペクトルとなる。この場合、f2、f4で示される音声のスペクトルも減算され、正しい音情報を得ることができない。しかし本実施形態によると、図21に示すように音声スペクトルを現存させることができる。
【0050】
以上、本実施形態によると、以下の効果を有する。
(1)マイク131により集音された音情報から音声区間を検出し、音声区間と検出された場合、非音声区間であると検出された場合よりも、弱い第1のノイズ低減処理を行なう。そのため、音声区間、非音声区間の区別なしに、強いノイズ低減処理を行なう場合に比べて、音声及び背景音からなる目的音の特に音声部分の劣化を招くことなく、ノイズを適切に低減することができる。
(2)第1のノイズ低減処理後に、非音声区間であると判定された場合の音情報からノイズを推定し、この推定されたノイズを減算する第2のノイズ低減処理(スペクトルの減算処理)を行なう。そのため、非音声区間の音情報からノイズを求めているので音声自体を消去することなく、目的音に非常に近い処理音を得ることができる。
(3)撮像装置100内の駆動部の動作情報から動作ノイズの発生タイミングを検出し、ノイズ発生タイミングが検出された場合にノイズ低減処理に移行する。そのため、無駄なノイズ低減処理を行わず、必要な時のみ適切且つ合理的にノイズ低減処理を行なうことができる。
(4)第2のノイズ低減処理(スペクトル減算処理)後の音情報に対してフロアリングを行なうため、スペクトル減算により減少する、あるいは、消滅するおそれがあるスペクトルを補正することができる。これによって、ノイズを低減し過ぎてしまう事態を防ぎ、集音した音情報のうち、目的音に近い音を確保(記録)することができる。
【0051】
以上、説明した実施形態に限定されることなく、以下に示すような種々の変形や変更が可能であり、それらも本発明の範囲内である。
例え、本実施形態では、マイク131により集音された音情報に対して、リアルタイムにノイズ低減処理する構成で説明した。しかし、これに限らず、マイク131により集音された音情報を、バッファメモリ等に一時的に記憶させておき、必要に応じてバッファメモリ等から音情報を読み出してノイズ低減処理する構成であってもよい。この場合は、リアルタイムに処理する際に装置にかかる負荷を軽減することができる。
なお、実施形態及び変形形態は、適宜組み合わせて用いることもできるが、詳細な説明は省略する。また、本発明は以上説明した実施形態によって限定されることはない。
【符号の説明】
【0052】
100:撮像装置、131:マイク(集音装置)、133:ノイズ低減処理部、134:音声区間検出部、135:ノイズタイミング検出部、136:第1のノイズ低減処理部、137:第2のノイズ低減処理部
【技術分野】
【0001】
本発明は、撮影時に入力される音情報からノイズを低減処理する撮像装置及び撮像装置のノイズ低減方法に関するものである。
【背景技術】
【0002】
動画撮影が可能な撮像装置において動画撮影時には、オートフォーカスレンズの駆動部の動作に伴い発生する動作音(以下、AFノイズという)等のノイズが、マイク等の集音装置により集音され、被写体の発する音声等の目的音に混入し、目的音の品質を損なうことがある。
このようなAFノイズを低減する方法として、AF駆動部の動作前に入力される音声信号のパワー値を取得し、この音声信号のパワー値に基づいてフロアリング係数を制御(変化)させることにより、ノイズを除去する方法が提案されている(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2008−252389号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかし、特許文献1によるノイズ低減処理の場合は、AFノイズを低減することができる反面、音声等の目的音を劣化する可能性が高いという問題があった。
【0005】
本発明の課題は、音声等の目的音の劣化を招くことなく、ノイズを適切に低減することができる撮像装置及び撮像装置のノイズ低減方法を提供することである。
【課題を解決するための手段】
【0006】
本発明は、以下のような解決手段により前記課題を解決する。なお、理解を容易にするために、本発明の実施形態に対応する符号を付して説明するが、これに限定されるものではない。
【0007】
請求項1に記載の発明は、集音装置(131)と、前記集音装置(131)により集音された音情報から音声区間を検出する音声区間検出部(134)と、前記音声区間検出部(134)の検出結果に基づいて、異なるノイズ低減処理を行うノイズ低減処理部(133)と、を備えること、を特徴とする撮像装置(100)である。
請求項2に記載の発明は、請求項1に記載の撮像装置(100)であって、該撮像装置(100)内の駆動部の動作情報から動作ノイズの発生タイミングを検出するノイズタイミング検出部(135)を備え、前記ノイズ低減処理部(133)は、前記ノイズタイミング検出部(135)の検出結果に基づいて、異なるノイズ低減処理を行うこと、を特徴とする撮像装置(100)である。
請求項3に記載の発明は、請求項1または2に記載の撮像装置(100)であって、前記ノイズ低減処理部(133)は、前記音声区間検出部(134)により音声区間と検出された場合、前記音声区間検出部(134)において非音声区間であると検出された場合よりも弱い低い第1のノイズ低減処理を行うこと、を特徴とする撮像装置(100)である。
請求項4に記載の発明は、請求項1から3のいずれか1項に記載の撮像装置(100)であって、前記ノイズ低減処理部(133)は、前記音声区間検出部(134)において非音声区間であると判定された場合の音情報からノイズを推定し、該推定されたノイズを、推定ノイズ減算前音情報から減算する第2のノイズ低減処理を行うこと、を特徴とする撮像装置(100)である。
請求項5に記載の発明は、請求項1から4のいずれか1項に記載の撮像装置(100)であって、前記ノイズ低減処理部(133)は、前記音声区間検出部(134)において非音声区間であると判定された場合の音情報からフロアリングスペクトルを求め、該フロアリングスペクトルを用いてフロアリング処理前音情報に対してフロアリング処理すること、を特徴とする撮像装置(100)である。
請求項6に記載の発明は、請求項1から5のいずれか1項に記載の撮像装置(100)であって、前記音声区間検出部(134)による音声区間の検出は、音声波形の一部を切り出して自己相関関数を求め、その求めた自己相関関数のピーク値を用いて検出すること、を特徴とする撮像装置(100)である。
請求項7に記載の発明は、集音された音情報から音声区間を検出し、音声区間の検出結果に基づいて、異なるノイズ低減処理を行うこと、を特徴とする撮像装置(100)のノイズ低減方法である。
請求項8に記載の発明は、請求項7に記載のノイズ低減方法であって、前記撮像装置(100)内の駆動部の動作情報から動作ノイズの発生タイミングを検出し、動作ノイズの発生タイミングの検出結果に基づいて、異なるノイズ低減処理を行うこと、を特徴とする撮像装置(100)のノイズ低減方法である。
請求項9に記載の発明は、請求項7または8に記載のノイズ低減方法であって、音声区間と検出された場合、非音声区間であると検出された場合よりも弱い第1のノイズ低減処理を行うこと、を特徴とする撮像装置(100)のノイズ低減方法である。
請求項10に記載の発明は、請求項7から9のいずれか1項に記載のノイズ低減方法であって、非音声区間であると判定された場合の音情報からノイズを推定し、該推定されたノイズを、推定ノイズ減算前音情報から減算する第2のノイズ低減処理を行うこと、を特徴とする撮像装置(100)のノイズ低減方法である。
請求項11に記載の発明は、請求項7から10のいずれか1項に記載のノイズ低減方法であって、非音声区間であると判定された場合の音情報からフロアリングスペクトルを求め、該フロアリングスペクトルを用いてフロアリング処理前音情報に対してフロアリング処理すること、を特徴とする撮像装置(100)のノイズ低減方法である。
請求項12に記載の発明は、請求項7から11のいずれか1項に記載のノイズ低減方法であって、音声区間の検出は、音声波形の一部を切り出して自己相関関数を求め、その求めた自己相関関数のピーク値を用いて検出すること、を特徴とする撮像装置(100)のノイズ低減方法である。
なお、符号を付して説明した構成は、適宜改良してもよく、また、少なくとも一部を他の構成物に代替してもよい。
【発明の効果】
【0008】
本発明によれば、音声等の目的音の劣化を招くことなく、ノイズを適切に低減することができる撮像装置及び撮像装置のノイズ低減方法を提供することができる。
【図面の簡単な説明】
【0009】
【図1】本発明の実施形態の撮像装置の構成を示すブロック図である。
【図2】音声波形図である。
【図3】音声波形の自己相関関数を説明する図である。
【図4】自己相関関数を利用して音声区間を検出する場合の一例であり、図4(A)は、マイクからの出力波形、図4(B)は自己相関関数のピークに閾値を設定して、閾値以上の部分をHighとして示した波形である。
【図5】ノイズタイミング検出部による動作ノイズの発生タイミング検出の詳細を説明する図である。
【図6】ノイズ低減処理動作のフローを示すフローチャートである。
【図7】ノイズ低減処理の対象となる第1の処理対象音の形態を説明する概略図である。
【図8】区間Aのスペクトルを示す図である。
【図9】区間Bのスペクトルを示す図である。
【図10】区間Cのスペクトルを示す図である。
【図11】推定ノイズスペクトルを示す図である。
【図12】区間Cのスペクトルからノイズを減算したスペクトルを示す図である。
【図13】フロアリングスペクトルAを使用したフロアリング後のスペクトルを示す図である。
【図14】フロアリングスペクトルAを示す図である。
【図15】フロアリングスペクトルBを示す図である。
【図16】フロアリングスペクトルBを使用したフロアリング後のスペクトルを示す図である。
【図17】ノイズ低減処理の対象となる第2の処理対象音の形態を説明する概略図である。
【図18】区間Eの背景音とノイズのスペクトルを示す図である。
【図19】区間Eのスペクトルを使用した推定ノイズを示す図である。
【図20】区間Fのスペクトルを示す図である。
【図21】区間Eの推定ノイズを使用してフロアリング処理した後のスペクトルを示す図である。
【図22】区間Fのスペクトルを使用した推定ノイズを示す図である。
【図23】区間Fの推定ノイズを使用してフロアリング処理した後のスペクトルを示す図である。
【発明を実施するための形態】
【0010】
以下、図面等を参照して、本発明の実施形態について説明する。図1は、本発明の実施形態の撮像装置の構成を示すブロック図である。
【0011】
図1に示すように、撮像装置100は、レンズ鏡筒110と、レンズ鏡筒110を通過した被写体像を撮像してA/D変換すると共に、画像処理して画像データを生成する画像処理部120と、集音された音情報をA/D変換すると共に、ノイズ低減処理する音情報処理部130と、画像処理部120で得られた画像データ及び音情報処理部130で得られた音声信号を記録する記録部140と、CPU150と、を備える。
【0012】
レンズ鏡筒110は、焦点調整レンズ(以下、AF(Auto Focus)レンズ、手振れ補正レンズ(以下、VR(Vibration Reduction)レンズ、ズームレンズ、ズームレンズ駆動部、ズームエンコーダ、像ぶれ補正部等を備えるVRユニット111と、AFエンコーダ112と、AF駆動用モータ113と、を備える。
【0013】
AFエンコーダ112は、光学系のAFレンズの位置を検出してCPU150に出力する。AF駆動用モータ113には、AFレンズの位置を制御するための駆動制御信号がCPU150から入力され、その駆動制御信号に応じて、AFレンズの位置が制御される。
【0014】
CPU150は、設定された撮像条件(例えば、絞り値、露出値等)に応じてレンズ鏡筒110を制御する。CPU150は、ズームレンズ駆動部及びAF駆動用モータ113を駆動する駆動制御信号を生成し、ズームレンズ駆動部及びAF駆動用モータ113に出力する。
【0015】
音情報処理部130は、集音装置であるマイク131と、集音されA/D変換された音情報を処理する音信号処理部132と、ノイズ低減処理部133と、を備える。
【0016】
音信号処理部132は、マイク131により集音した音情報から音声区間を検出する音声区間検出部134と、AF駆動用モータ113の動作情報から動作ノイズの発生するタイミングを検出するノイズタイミング検出部135と、を備える。
【0017】
音声区間検出部134は、マイク131により集音された音情報から、音声信号の含まれる区間(音声区間)とそれ以外の区間(非音声区間)とを、自己相関関数のピーク値に基づいて判別する。音声区間検出部134による音声区間検出の概要を説明すると、次のとおりである。
【0018】
図2は、音声波形である。この音声波形の任意の一部を切り出して自己相関関数を求めると、図3に示す波形となる。この音声波形は、音声、即ち、声帯の振動数に対応した基本周波数及びそれの倍音に対応した周波数帯域にピークが集中する性質(調波性)を有しており、この調波性を利用して自己相関関数のピーク値の大きさによって、音声であるか非音声であるかを区別することが可能である。
【0019】
図4は、自己相関関数を利用して音声区間を検出する場合の一例を示す。図4(A)は、マイク131からの出力波形であり、その前半部にAFノイズが発生し、後半部に音声とAFノイズとが発生している。図4(A)に示すような出力波形に対して自己相関関数を求め、この自己相関関数のピークに閾値を設定して、閾値以上の部分をHighとして示すと、図4(B)のような波形が得られる。これによって、出力波形の後半部に音声位置と一致した音声区間があることを検出できる。
【0020】
ノイズタイミング検出部135は、AF駆動用モータ113の動作情報から動作ノイズの発生するタイミングを検出する。このノイズタイミング検出部135による動作ノイズの発生タイミングは、CPU150にAF駆動用モータ113に対する駆動制御信号を出力するように指示するAF駆動コマンド及びAFエンコーダ112からの出力を用いて検出(推定)する。
【0021】
ノイズタイミング検出部135による動作ノイズの発生タイミング検出の詳細を説明すると、次のとおりである。
図5に示すように、AF駆動コマンドの出力によりAF駆動用モータ113が動作されると、AF駆動コマンドの出力時刻であるAF駆動用モータ113の動作開始時刻t1から動作終了時刻t3まで連続して動作ノイズは発生される。マイク131には、被写体の音声等の記録目的音に動作ノイズが重畳された音情報が集音され、その集音された音情報がマイク131から出力される。
【0022】
このとき、AFエンコーダ112からは、AF駆動系のギア列で起きるバックラッシュ等の影響でAF駆動用モータ113の動作開始時刻t1よりも遅れた時刻t2から出力されることがある。そこで、ノイズタイミング検出部135は、AF駆動コマンドの出力時刻t1からAFエンコーダ112の出力停止t3までを動作ノイズの発生タイミングとして検出し、それ以外を非ノイズタイミングとして検出する。
なお、AF動作時においてマイク131から実際に出力される信号は、目的音に動作ノイズが重畳した信号であるが、説明を簡略にするため、図5では、動作ノイズのみを示している。
【0023】
ノイズ低減処理部133は、図5に示す動作ノイズのうち、AF動作開始時及びAF動作終了時に発生する衝撃音ノイズを低減処理する。ノイズ低減処理部133は、図5に示す動作ノイズ発生前の窓Xの第1周波数スペクトルと、動作ノイズ発生後の窓Yの第2周波数スペクトルと、を取得する。取得した第1周波数スペクトルと第2周波数スペクトルとを比較し、比較の結果、第2周波数スペクトルが第1周波数スペクトルより大きい場合、第2周波数スペクトルを第1周波数スペクトルに置き換えることにより、第1のノイズの低減処理を行なう。
【0024】
ここで、音声区間検出部134により音声区間であると検出された場合、所定の周波数(例えば、4000Hz)までのスペクトルは置き換えずに保存し、また、非音声区間であると検出された場合、それよりも小さい所定の周波数(例えば、500Hz)までのスペクトルは置き換えずに保存する。すなわち、音声区間と検出された場合の保存する周波数の上限を、例えば、4000Hzとし、非音声区間と検出された場合の保存する周波数の上限を、例えば、500Hzとすることにより、音声区間であると検出された場合、非音声区間であると検出された場合よりも弱い第1の衝撃音ノイズ低減処理を行う。
【0025】
また、ノイズ低減処理部133は、音声区間検出部134において非音声区間であると検出されて強い衝撃音ノイズ低減処理が行われた場合の周波数スペクトルからノイズを推定し、推定ノイズを更新すると共に、その推定ノイズを用いて、第1の衝撃音ノイズ低減処理が行われた周波数スペクトルから減算して周波数スペクトルを生成するスペクトル減算処理(第2のノイズ低減処理)を行なう。
【0026】
上記した構成の他に、音情報処理部130には、マイク131から出力される音情報を予め決められた区間毎に分割して窓関数で重み付けする共に、この区間毎の音データをフーリエ変換(FFT:Fast Fourier Transform)して周波数領域に変換する処理部を有する。また、FFT処理により周波数領域の振幅情報と位相情報とに分けられ、周波数領域の振幅情報を利用してノイズ低減処理(スペクトル減算処理)が行われたスペクトルに対して、逆フーリエ変換(IFFT:Inverse Fast Fourier Transform)を行なうことにより、ノイズ低減処理後のスペクトル(音情報)を時間領域に変換する処理部を有する。これら処理部については、図示を省略する。
【0027】
更に、ノイズ低減処理部133は、第2のノイズ低減処理(スペクトル減算処理)により、スペクトルが著しく減少した場合やスペクトルが消失した場合においてスペクトルを補正するフロアリング機能を有する。このフロアリングは、ノイズタイミング検出部135により非ノイズタイミングであると検出され、且つ、音声区間検出部134により非音声区間であると検出された場合の音情報を基に生成されたフロアリングスペクトルと第2のノイズ低減処理において減算された後のスペクトルとを比較し、減算後のスペクトルがフロアリングスペクトルを下回っている(スペクトル強度が小さい)場合、フロワリングスペクトルを採用した音情報(スペクトル)を生成し、これをIFFT処理する。
ただし、減算後のスペクトルがフロアリングスペクトルを上回っている(スペクトル強度が大きい)場合は、フロアリング処理を行ってもよいし、また、行なわなくてもよい。
【0028】
また、フロアリング機能に用いるフロアリングスペクトルは、ノイズタイミング検出部135により非ノイズタイミングであると検出され、且つ、音声区間検出部134により非音声区間であると検出された場合の音情報を用いて更新する。これにより、フロアリングスペクトルには、動作ノイズスペクトル、音声スペクトルのいずれも含まず、背景音のみが含まれており、フロアリング処理時に音声スペクトルが付加され、ノイズ低減処理後の音情報に本来無い音声を生じることがないようにしている。
【0029】
次に、本実施形態の撮像装置100におけるノイズ低減処理動作(ノイズ低減方法)を、図面に基づいて説明する。図6は、ノイズ低減処理動作のフローを示すフローチャートである。図7は、ノイズ低減処理の対象となる第1の処理対象音の形態を説明する概略図である。
【0030】
(第1の処理対象音)
図7に示すように、第1の処理対象音は、区間Aが背景音のみ、区間Bが背景音と音声(目的音)、区間Cが背景音とAFノイズを発生している形態である。図7に示す第1の処理対象音の区間Cにおいてマイク131が集音し出力される音情報からAFノイズを低減処理する動作及びフロアリング更新について説明する。
【0031】
(ステップST1)
まず、ノイズタイミング検出部135により、マイク131から出力される音情報に基づいて、ノイズタイミングの検出が開始される。
このときのマイク31によって集音された音情報(スペクトル)を、区間Aについて図8、区間Bについて図9に示す。
【0032】
(ステップST2)
続いて、音声区間検出部134により、マイク131から出力される音情報に基づいて、音声区間の検出が開始される。
【0033】
(ステップST3)
マイク131から出力される音情報をFFT処理して、周波数領域の振幅情報と位相情報とに分けられる。
【0034】
(ステップST4)
次に、ノイズタイミング検出部135によって、動作ノイズの発生タイミングであるか非ノイズタイミングであるか(すなわちAF区間か否か)、が検出(判定)される。
【0035】
(ステップST4,YES)
ステップST4において、区間Cは動作ノイズの発生タイミングであると判定され(AF区間,YES)、ステップST5に進む。
(ステップST4,NO)
区間AおよびBは非ノイズタイミングであると判定され、ステップST11に進む。
【0036】
(ステップST5)
ステップST5においては、音声区間検出部134によって、音声区間であるか、非音声区間であるかが検出(判定)される。区間Cは、非音声区間であるので(NO)、ステップST7に進む。
(ステップST7)
ここでは、AF動作開始時及びAF動作終了時が含まれる場合、上限が所定の周波数(例えば、500Hz)までのスペクトルを置き換えずに保存するといった強い衝撃音ノイズ低減処理が行われ、区間Cについて図10のスペクトルを得る。
AF動作開始時及びAF動作終了時が含まれない場合は、衝撃音ノイズが含まれないと判断し、衝撃音ノイズ低減処理を行わない。
【0037】
(ステップST8)
次いで、ステップST7のノイズ低減処理により得られたスペクトル(図10)におけるノイズを推定し、図11に示すような推定ノイズスペクトルをステップST9に出力する。
【0038】
(ステップST9)
続いて、ステップST7の衝撃音ノイズ低減処理により得られたスペクトル(図10)からステップST8の推定により得られた推定ノイズスペクトル(図11)を減算するスペクトル減算処理(第2のノイズ低減処理)が行なわれ、図12に示すようなスペクトルが得られる。
【0039】
(ステップST10)
第2のノイズ低減処理(スペクトル減算処理)により、図12のスペクトルが著しく減少したり、消失したりする場合があるので、これに対応するため、図12のスペクトルを補正するフロアリングが行なわれる。
このフロアリングは、図12のスペクトルと基準となるフロアリングスペクトルと、の大きさを比較する。そして、比較の結果、強度の大きいスペクトルを採用して、図13に示すスペクトルを生成する。ここで用いたフロアリングスペクトルは、後述するが、区間Aから求めたフロアリングスペクトルである。
【0040】
(ステップST11)
ステップST11に戻り、ここでは、音声区間検出部134によって、音声区間であるか、非音声区間(背景音のみの区間)であるか、が検出(判定)される。その結果、区間Bは音声区間であると判定され(YES)、ノイズ低減処理、スペクトル減算、フロアリングを行わず、ステップST13に進む。区間Aは非音声区間であると判定され(NO)、ステップST12に進む。
【0041】
(ステップST12)
ステップST12においては、図8に示す背景音のみが発生している区間Aのスペクトルの各周波数における振幅を半減して、図14に示すようなフロアリングスペクトルを得る。このフロアリングスペクトル(図14)を、前述したようにステップST10のフロアリングに用いると共に、このフロアリングスペクトルに更新する。
仮に、区間Bの図9に示すスペクトルの各周波数における振幅を半減して求めた図15のフロアリングスペクトルを用いてフロアリングした場合、図16に示すようなスペクトルとなる。図16のスペクトルを区間Cのスペクトルとすると、区間B(図9)に含まれる音声のスペクトルの成分(特にf2,f4)も含まれることになり、正確な目的音を得ることができない。
しかし、本実施形態によると、フロアリングに用いるフロアリングスペクトル(図14)には、音声及び動作ノイズのスペクトルが含まれていない。このため、ステップST10のフロアリングにおいて、AFノイズや音声のスペクトルが付加されてノイズ低減処理後の音情報に本来ない動作ノイズや音声が生じることを防ぐことができる。
【0042】
(ステップST13)
最後のステップST13において、ステップST3において分けられた位相を用いてIFFT処理を行なうことにより、ノイズ低減処理後のスペクトルを時間領域に変換して記録部140に出力する。
【0043】
(第2の処理対象音)
次に、上述した第1の処理対象音と異なる形態を有する第2の処理対象音を用いた場合のノイズ低減処理動作(ノイズ低減方法)について説明する。なお、ノイズ低減処理動作フローの各ステップは、第1の処理対象音の場合は略同様であるため、主として各ステップにおける処理内容の相違点を中心に説明する。
【0044】
図17は、ノイズ低減処理の対象となる第2の処理対象音の形態を説明する概略図である。図17に示すように、処理対象音は、区間Dが背景音のみ、区間Eが背景音とAFノイズ、区間Fが背景音と音声とAFノイズを発生している形態である。図17に示す処理対象音の区間E及び区間Fにおいてマイク131が集音し出力される音情報からAFノイズを低減処理する動作及びフロアリング更新について説明する。
【0045】
ステップST1からST4までは上述の第1の処理対象音の区間Cと同様であるので省略する。
(ステップST5)
ステップST5において、区間Fは音声区間であると判定され(YES)、ステップST6に進む。
(ステップST6)
ステップST6においては、AF動作開始時及びAF動作終了時が含まれる場合、上限が所定の周波数(例えば、4000Hz)までのスペクトルを置き換えずに保存するといった弱い第1の衝撃音ノイズ低減処理が行なわれる。
AF動作開始時及びAF動作終了時が含まれない場合は、衝撃音ノイズが含まれないと判断し、衝撃音ノイズ低減処理を行わない。
【0046】
この第1の衝撃音ノイズ低減処理が行われたスペクトルは、音声スベクトル成分f2、f4を含む。このスペクトルは、推定ノイズ更新に使用されず、第2のノイズ低減処理であるスペクトル減算処理を行なうためのステップST9に進む。
第2の処理対象音の場合、動作ノイズの発生タイミングで且つ非音声区間である区間Eにおいては、図18に示すようなスペクトルが得られ、区間Fにおいては、図20に示すようなスペクトルが得られる。
【0047】
そこで、ステップST8においては、区間Eで得られたスペクトルからノイズを推定し更新する。更新後の推定ノイズは、図19に示すようなスペクトルとなる。
【0048】
そして、ステップST9において、区間Fにおけるスペクトル(図20)から推定ノイズスペクル(図19)を減算し、更に、ステップST10においてフロアリングすることにより、図21に示すようなスペクトルを生成する。
なお、第2の処理対象音の場合のフロアリングスペクトルは、背景音のみが発生している区間Dから得る。このフロアリングスペクトルは、第1の処理対象音の場合と同様図8を半減処理した図14のスペクトルを用いる。
【0049】
ここで、仮に区間Fのスペクトル(図20)に0.9を乗じた推定ノイズ図22をもとにスペクトル減算を行った場合、図23に示すスペクトルとなる。この場合、f2、f4で示される音声のスペクトルも減算され、正しい音情報を得ることができない。しかし本実施形態によると、図21に示すように音声スペクトルを現存させることができる。
【0050】
以上、本実施形態によると、以下の効果を有する。
(1)マイク131により集音された音情報から音声区間を検出し、音声区間と検出された場合、非音声区間であると検出された場合よりも、弱い第1のノイズ低減処理を行なう。そのため、音声区間、非音声区間の区別なしに、強いノイズ低減処理を行なう場合に比べて、音声及び背景音からなる目的音の特に音声部分の劣化を招くことなく、ノイズを適切に低減することができる。
(2)第1のノイズ低減処理後に、非音声区間であると判定された場合の音情報からノイズを推定し、この推定されたノイズを減算する第2のノイズ低減処理(スペクトルの減算処理)を行なう。そのため、非音声区間の音情報からノイズを求めているので音声自体を消去することなく、目的音に非常に近い処理音を得ることができる。
(3)撮像装置100内の駆動部の動作情報から動作ノイズの発生タイミングを検出し、ノイズ発生タイミングが検出された場合にノイズ低減処理に移行する。そのため、無駄なノイズ低減処理を行わず、必要な時のみ適切且つ合理的にノイズ低減処理を行なうことができる。
(4)第2のノイズ低減処理(スペクトル減算処理)後の音情報に対してフロアリングを行なうため、スペクトル減算により減少する、あるいは、消滅するおそれがあるスペクトルを補正することができる。これによって、ノイズを低減し過ぎてしまう事態を防ぎ、集音した音情報のうち、目的音に近い音を確保(記録)することができる。
【0051】
以上、説明した実施形態に限定されることなく、以下に示すような種々の変形や変更が可能であり、それらも本発明の範囲内である。
例え、本実施形態では、マイク131により集音された音情報に対して、リアルタイムにノイズ低減処理する構成で説明した。しかし、これに限らず、マイク131により集音された音情報を、バッファメモリ等に一時的に記憶させておき、必要に応じてバッファメモリ等から音情報を読み出してノイズ低減処理する構成であってもよい。この場合は、リアルタイムに処理する際に装置にかかる負荷を軽減することができる。
なお、実施形態及び変形形態は、適宜組み合わせて用いることもできるが、詳細な説明は省略する。また、本発明は以上説明した実施形態によって限定されることはない。
【符号の説明】
【0052】
100:撮像装置、131:マイク(集音装置)、133:ノイズ低減処理部、134:音声区間検出部、135:ノイズタイミング検出部、136:第1のノイズ低減処理部、137:第2のノイズ低減処理部
【特許請求の範囲】
【請求項1】
集音装置と、
前記集音装置により集音された音情報から音声区間を検出する音声区間検出部と、
前記音声区間検出部の検出結果に基づいて、異なるノイズ低減処理を行うノイズ低減処理部と、を備えること、
を特徴とする撮像装置。
【請求項2】
請求項1に記載の撮像装置であって、
該撮像装置内の駆動部の動作情報から動作ノイズの発生タイミングを検出するノイズタイミング検出部を備え、
前記ノイズ低減処理部は、前記ノイズタイミング検出部の検出結果に基づいて、異なるノイズ低減処理を行うこと、
を特徴とする撮像装置。
【請求項3】
請求項1または2に記載の撮像装置であって、
前記ノイズ低減処理部は、
前記音声区間検出部により音声区間と検出された場合、前記音声区間検出部において非音声区間であると検出された場合よりも弱い低い第1のノイズ低減処理を行うこと、
を特徴とする撮像装置。
【請求項4】
請求項1から3のいずれか1項に記載の撮像装置であって、
前記ノイズ低減処理部は、
前記音声区間検出部において非音声区間であると判定された場合の音情報からノイズを推定し、該推定されたノイズを、推定ノイズ減算前音情報から減算する第2のノイズ低減処理を行うこと、
を特徴とする撮像装置。
【請求項5】
請求項1から4のいずれか1項に記載の撮像装置であって、
前記ノイズ低減処理部は、
前記音声区間検出部において非音声区間であると判定された場合の音情報からフロアリングスペクトルを求め、該フロアリングスペクトルを用いてフロアリング処理前音情報に対してフロアリング処理すること、
を特徴とする撮像装置。
【請求項6】
請求項1から5のいずれか1項に記載の撮像装置であって、
前記音声区間検出部による音声区間の検出は、音声波形の一部を切り出して自己相関関数を求め、その求めた自己相関関数のピーク値を用いて検出すること、
を特徴とする撮像装置。
【請求項7】
集音された音情報から音声区間を検出し、
音声区間の検出結果に基づいて、異なるノイズ低減処理を行うこと、
を特徴とする撮像装置のノイズ低減方法。
【請求項8】
請求項7に記載のノイズ低減方法であって、
前記撮像装置内の駆動部の動作情報から動作ノイズの発生タイミングを検出し、
動作ノイズの発生タイミングの検出結果に基づいて、異なるノイズ低減処理を行うこと、
を特徴とする撮像装置のノイズ低減方法。
【請求項9】
請求項7または8に記載のノイズ低減方法であって、
音声区間と検出された場合、非音声区間であると検出された場合よりも弱い第1のノイズ低減処理を行うこと、
を特徴とする撮像装置のノイズ低減方法。
【請求項10】
請求項7から9のいずれか1項に記載の撮像装置のノイズ低減方法であって、
非音声区間であると判定された場合の音情報からノイズを推定し、該推定されたノイズを、推定ノイズ減算前音情報から減算する第2のノイズ低減処理を行うこと、
を特徴とする撮像装置のノイズ低減方法。
【請求項11】
請求項7から10のいずれか1項に記載のノイズ低減方法であって、
非音声区間であると判定された場合の音情報からフロアリングスペクトルを求め、該フロアリングスペクトルを用いてフロアリング処理前音情報に対してフロアリング処理すること、
を特徴とする撮像装置のノイズ低減方法。
【請求項12】
請求項7から11のいずれか1項に記載のノイズ低減方法であって、
音声区間の検出は、音声波形の一部を切り出して自己相関関数を求め、その求めた自己相関関数のピーク値を用いて検出すること、
を特徴とする撮像装置のノイズ低減方法。
【請求項1】
集音装置と、
前記集音装置により集音された音情報から音声区間を検出する音声区間検出部と、
前記音声区間検出部の検出結果に基づいて、異なるノイズ低減処理を行うノイズ低減処理部と、を備えること、
を特徴とする撮像装置。
【請求項2】
請求項1に記載の撮像装置であって、
該撮像装置内の駆動部の動作情報から動作ノイズの発生タイミングを検出するノイズタイミング検出部を備え、
前記ノイズ低減処理部は、前記ノイズタイミング検出部の検出結果に基づいて、異なるノイズ低減処理を行うこと、
を特徴とする撮像装置。
【請求項3】
請求項1または2に記載の撮像装置であって、
前記ノイズ低減処理部は、
前記音声区間検出部により音声区間と検出された場合、前記音声区間検出部において非音声区間であると検出された場合よりも弱い低い第1のノイズ低減処理を行うこと、
を特徴とする撮像装置。
【請求項4】
請求項1から3のいずれか1項に記載の撮像装置であって、
前記ノイズ低減処理部は、
前記音声区間検出部において非音声区間であると判定された場合の音情報からノイズを推定し、該推定されたノイズを、推定ノイズ減算前音情報から減算する第2のノイズ低減処理を行うこと、
を特徴とする撮像装置。
【請求項5】
請求項1から4のいずれか1項に記載の撮像装置であって、
前記ノイズ低減処理部は、
前記音声区間検出部において非音声区間であると判定された場合の音情報からフロアリングスペクトルを求め、該フロアリングスペクトルを用いてフロアリング処理前音情報に対してフロアリング処理すること、
を特徴とする撮像装置。
【請求項6】
請求項1から5のいずれか1項に記載の撮像装置であって、
前記音声区間検出部による音声区間の検出は、音声波形の一部を切り出して自己相関関数を求め、その求めた自己相関関数のピーク値を用いて検出すること、
を特徴とする撮像装置。
【請求項7】
集音された音情報から音声区間を検出し、
音声区間の検出結果に基づいて、異なるノイズ低減処理を行うこと、
を特徴とする撮像装置のノイズ低減方法。
【請求項8】
請求項7に記載のノイズ低減方法であって、
前記撮像装置内の駆動部の動作情報から動作ノイズの発生タイミングを検出し、
動作ノイズの発生タイミングの検出結果に基づいて、異なるノイズ低減処理を行うこと、
を特徴とする撮像装置のノイズ低減方法。
【請求項9】
請求項7または8に記載のノイズ低減方法であって、
音声区間と検出された場合、非音声区間であると検出された場合よりも弱い第1のノイズ低減処理を行うこと、
を特徴とする撮像装置のノイズ低減方法。
【請求項10】
請求項7から9のいずれか1項に記載の撮像装置のノイズ低減方法であって、
非音声区間であると判定された場合の音情報からノイズを推定し、該推定されたノイズを、推定ノイズ減算前音情報から減算する第2のノイズ低減処理を行うこと、
を特徴とする撮像装置のノイズ低減方法。
【請求項11】
請求項7から10のいずれか1項に記載のノイズ低減方法であって、
非音声区間であると判定された場合の音情報からフロアリングスペクトルを求め、該フロアリングスペクトルを用いてフロアリング処理前音情報に対してフロアリング処理すること、
を特徴とする撮像装置のノイズ低減方法。
【請求項12】
請求項7から11のいずれか1項に記載のノイズ低減方法であって、
音声区間の検出は、音声波形の一部を切り出して自己相関関数を求め、その求めた自己相関関数のピーク値を用いて検出すること、
を特徴とする撮像装置のノイズ低減方法。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図21】
【図22】
【図23】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図21】
【図22】
【図23】
【公開番号】特開2012−173371(P2012−173371A)
【公開日】平成24年9月10日(2012.9.10)
【国際特許分類】
【出願番号】特願2011−32786(P2011−32786)
【出願日】平成23年2月18日(2011.2.18)
【出願人】(000004112)株式会社ニコン (12,601)
【Fターム(参考)】
【公開日】平成24年9月10日(2012.9.10)
【国際特許分類】
【出願日】平成23年2月18日(2011.2.18)
【出願人】(000004112)株式会社ニコン (12,601)
【Fターム(参考)】
[ Back to top ]