説明

ノイズ推定装置、信号処理装置、撮像装置、及びプログラム

【課題】音信号に重畳しているノイズを適切に低減する。
【解決手段】ノイズ推定装置(150)は、入力された音信号の周波数スペクトルと、ノイズの周波数スペクトルとに基づいて、音信号とノイズとの類似の度合いを示すノイズ類似度を算出する算出部(232)と、算出部(232)により算出されたノイズ類似度に基づいて、音信号に含まれる推定ノイズを推定するノイズ推定部(233)とを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ノイズ推定装置、信号処理装置、撮像装置、及びプログラムに関する。
【背景技術】
【0002】
音信号に重畳しているノイズを低減する技術が知られている(例えば、特許文献1を参照)。非特許文献1に記載されている技術では、音信号に重畳している定常ノイズを、予め定められている推定ノイズによって低減する。
【先行技術文献】
【非特許文献】
【0003】
【非特許文献1】BOLL, S. F. "Suppression of Acoustic Noise in Speech Using Spectral Subtraction." IEEE TRANSACTION ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, vol. ASSP-27, pp. 113-120, APRIL, 1979.
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、非特許文献1に記載されている技術では、例えば、大きさが非定常なノイズを低減するような場合、音信号に実際に混入しているノイズと推定ノイズとの間に差が生じ、ノイズの過大減算あるいは過小減算により、音の劣化もしくは雑音の残存が発生することがある。また、例えば、間欠的に発生するノイズを低減するような場合、ノイズが混入していない箇所では、ノイズを過大に減算してしまい、音の劣化が発生することがある。
つまり、非特許文献1に記載されている技術では、音信号に重畳しているノイズを適切に低減できないという問題がある。
【0005】
本発明は、上記問題を解決すべくなされたもので、その目的は、音信号に重畳しているノイズを適切に低減することができるノイズ推定装置、信号処理装置、撮像装置、及びプログラムを提供することにある。
【課題を解決するための手段】
【0006】
上記問題を解決するために、本発明は、入力された音信号の周波数スペクトルと、ノイズの周波数スペクトルとに基づいて、前記音信号と前記ノイズとの類似の度合いを示すノイズ類似度を算出する算出部と、前記算出部により算出された前記ノイズ類似度に基づいて、前記音信号に含まれる推定ノイズを推定するノイズ推定部とを備えることを特徴とするノイズ推定装置である。
【0007】
また、本発明は、上記のノイズ推定装置と、前記ノイズ推定装置によって推定された前記推定ノイズに基づいて、前記音信号に含まれるノイズを低減するノイズ低減処理部と、を備えることを特徴とする信号処理装置である。
【0008】
また、本発明は、上記の信号処理装置を備えることを特徴とする撮像装置である。
【0009】
また、本発明は、ノイズ推定装置としてのコンピュータに、算出部が、入力された音信号の周波数スペクトルと、ノイズの周波数スペクトルとに基づいて、前記音信号と前記ノイズとの類似の度合いを示すノイズ類似度を算出する算出手順と、ノイズ推定部が、前記算出手順により算出された前記ノイズ類似度に基づいて、前記音信号に含まれる推定ノイズを推定するノイズ推定手順とを実行させるためのプログラムである。
【発明の効果】
【0010】
本発明によれば、音信号に重畳しているノイズを適切に低減することができる。
【図面の簡単な説明】
【0011】
【図1】本実施形態による撮像装置を示す概略ブロック図である。
【図2】同実施形態における信号処理装置を示す概略ブロック図である。
【図3】同実施形態における入力周波数特徴ベクトルとノイズ周波数特徴ベクトルの一例を示す概念図である。
【図4】同実施形態におけるノイズ低減処理の動作を示すフローチャートである。
【図5】同実施形態におけるノイズが重畳した音信号の例を示す説明図である。
【図6】同実施形態におけるノイズの周波数スペクトルの生成方法の一例を説明する説明図である。
【発明を実施するための形態】
【0012】
以下、本発明の一実施形態による信号処理装置及び撮像装置について図面を参照して説明する。
図1は、本実施形態による撮像装置1を示す概略ブロック図である。
この図において、本実施形態による撮像装置1は、撮像部10、バッファメモリ部30、画像処理部40、表示部50、記憶部60、通信部70、操作部80、CPU(Central Processing Unit)90、マイク21、A/D(Analog/Digital)変換部22、音信号処理部23、及びバス300を備えている。この撮像装置1が備える構成のうち、例えば、音信号処理部23と、記憶部60の一部とが、信号処理装置100に対応する。また、例えば、音信号処理部23の一部と、記憶部60の一部とが、ノイズ推定装置150に対応する。
【0013】
撮像部10は、光学系11と、撮像素子19と、A/D変換部20とを含み、設定された撮像条件(例えば絞り値、露出値等)に従ってCPU90により制御され、光学系11による光学像を撮像素子19に結像させて、A/D変換部20によってデジタル信号に変換された当該光学像に基づく画像データを生成する。
【0014】
光学系11は、焦点調整レンズ(以下、AF(Auto Focus)レンズという)12と、手振れ防止用レンズ(以下、VR(Vibration Reduction)レンズという)13と、ズームレンズ14と、ズームエンコーダ15と、レンズ駆動部16と、AFエンコーダ17と、手振れ防止部18とを備えている。
この光学系11は、ズームレンズ14、VRレンズ13、及びAFレンズ12を通過した光学像を撮像素子19の受光面に導く。
【0015】
レンズ駆動部16は、後述するCPU90から入力される駆動制御信号に基づいて、ズームレンズ14又はAFエンコーダ17の位置を制御する。
手振れ防止部18は、後述するCPU90から入力される駆動制御信号に基づいて、VRレンズ13の位置を制御する。この手振れ防止部18は、VRレンズ13の位置を検出していてもよい。
【0016】
ズームエンコーダ15は、ズームレンズ14の位置を表わすズームポジションを検出し、検出したズームポジションをCPU90に出力する。
AFエンコーダ17は、AFレンズ12の位置を表わすフォーカスポジションを検出し、検出したズームポジション及びフォーカスポジションをCPU90に出力する。
【0017】
なお、上述した光学系11は、撮像装置1に取り付けられて一体とされていてもよいし、撮像装置1に着脱可能に取り付けられてもよい。
【0018】
撮像素子19は、例えば、受光面に結像した光学像を電気信号に変換して、A/D変換部20に出力する。
また、撮像素子19は、操作部80を介して撮影指示を受け付けた際に得られる画像データを、撮影された静止画の撮影画像データとして、A/D変換部20や画像処理部40を介して、記憶媒体200に記憶させる。
【0019】
一方、撮像素子19は、例えば、操作部80を介して撮像指示を受け付けていない状態において、連続的に得られる画像データをスルー画データとして、A/D変換部20や画像処理部40を介して、CPU90及び表示部50に出力する。
【0020】
A/D変換部20は、撮像素子19によって変換された電子信号をアナログ/デジタル変換し、この変換したデジタル信号である画像データを出力する。
【0021】
バッファメモリ部30は、撮像部10によって撮像された画像データや、音信号処理部23により変換された音信号等を、一時的に記憶する。
画像処理部40は、記憶部60に記憶されている画像処理条件を参照して、バッファメモリ部30、又は、記憶媒体200に記録されている画像データに対して画像処理をする。
【0022】
表示部50は、例えば、液晶ディスプレイであって、撮像部10によって得られた画像データや、操作画面等を表示する。
【0023】
記憶部60は、CPU90によってシーン判定の際に参照される判定条件や、撮像条件等を記憶する。また、記憶部60は、後述する音信号処理部23において音信号のノイズを低減するノイズ低減処理に使用する情報を記憶する。ここで、ノイズ低減処理に使用する情報とは、例えば、後述するノイズ周波数特徴ベクトル等である。
また、記憶部60は、ノイズ周波数特徴ベクトル記憶部61を備えている。
【0024】
ノイズ周波数特徴ベクトル記憶部61は、後述するノイズ周波数特徴ベクトルを記憶する。ノイズ周波数特徴ベクトルは、例えば、撮像装置1の製造又は出荷検査の際に、予め記憶されている。また、ノイズ周波数特徴ベクトル記憶部61は、対応するノイズの種類に応じて、複数のノイズ周波数特徴ベクトルを記憶していてもよい。例えば、ズームレンズ14、VRレンズ13、及びAFレンズ12の機構音のうちのいずれか1つによるノイズ(雑音)に対応するノイズ周波数特徴ベクトルが、それぞれノイズ周波数特徴ベクトル記憶部61に記憶されていてもよい。
【0025】
マイク21は、音を収音し、収音した音に応じた音信号を出力する。この音信号は、アナログ信号である。
A/D変換部22は、マイク21から入力されたアナログ信号である音信号を、デジタル信号である音信号に、アナログデジタル変換する。
【0026】
音信号処理部23は、A/D変換部22によりデジタル信号に変換された音信号に対して、例えば、ノイズを低減するなどの音信号処理を実行し、この音信号処理した音信号を記憶媒体200に記憶させる。音信号処理部23は、ノイズ低減処理部24、周波数特徴ベクトル生成部231、内積算出部232、及びノイズ推定部233を備えている。この音信号処理部23の詳細については、後述する。
なお、音信号処理部23により音信号処理された音信号が記憶媒体200に記憶される場合、撮像素子19により撮像された画像データと、時間的に関係付けられて記憶されてもよいし、音信号を含む動画として記憶されてもよい。
【0027】
通信部70は、カードメモリ等の取り外しが可能な記憶媒体200と接続され、この記憶媒体200への情報の書込み、読み出し、あるいは消去を行う。
操作部80は、例えば、電源スイッチやシャッターボタン、その他の操作キーを含み、ユーザによって操作されることでユーザの操作入力を受け付け、CPU90に出力する。
【0028】
記憶媒体200は、撮像装置1に対して着脱可能に接続される記憶部であって、例えば、撮像部10によって生成された(撮影された)画像データや、音信号処理部23により音信号処理された音信号を記憶する。
【0029】
CPU90は、撮像装置1全体を制御するが、一例としては、ズームエンコーダ15から入力されるズームポジション、及び、AFエンコーダ17から入力されるフォーカスポジションと、操作部80から入力される操作入力とに基づいて、ズームエンコーダ15及びAFエンコーダ17の位置を制御する駆動制御信号を生成する。CPU90は、この駆動制御信号に基づいて、レンズ駆動部16を介してズームエンコーダ15及びAFエンコーダ17の位置を制御する。
【0030】
バス300は、撮像部10と、音信号処理部23と、バッファメモリ部30と、画像処理部40と、表示部50と、記憶部60と、通信部70と、操作部80と、CPU90とに接続され、各部から出力されたデータ等を転送する。
【0031】
次に、図2を参照して、図1の構成のうち、信号処理装置100及び音信号処理部23の詳細な構成について説明する。
図2は、本実施形態における信号処理装置100を示す概略ブロック図である。
この図において、信号処理装置100は、音信号処理部23とノイズ周波数特徴ベクトル記憶部61とを備えている。なお、ノイズ周波数特徴ベクトル記憶部61は、例えば、記憶部60に備えられ、記憶部60の一部である。また、信号処理装置100は、ノイズ推定装置150を備えており、信号処理装置100の構成のうち、例えば、周波数特徴ベクトル生成部231、内積算出部232、ノイズ推定部233、及びノイズ周波数特徴ベクトル記憶部61が、このノイズ推定装置150に対応する。
【0032】
音信号処理部23は、A/D変換部22によりデジタル信号に変換された音信号に対して、例えば、ノイズを低減するなどの音信号処理を実行し、この音信号処理した音信号を記憶媒体200に記憶させる。なお、本実施形態において、「ノイズ」とは、動作部による動作によって発生し、音信号に含まれる(すなわち、音信号に重畳している)ノイズ信号のことである。すなわち、「ノイズ」とは、非定常ノイズである。
【0033】
ここでいう動作部とは、機構部とも呼び、一例としては、上述したズームレンズ14、VRレンズ13、AFレンズ12、又は操作部80のことである。この動作部とは、撮像装置1が備えている構成のうち、動作することにより、又は、動作されることにより、音が生じる(又は、音が生じる可能性がある)構成である。
また、この動作部とは、撮像装置1が備えている構成のうち、動作することにより生じた音、又は、動作されることにより生じた音が、マイク21により収音される(又は、収音される可能性のある)構成である。
【0034】
また、音信号処理部23は、CPU90から供給される制御信号に基づいて、ノイズを低減するなどの音信号処理を実行する。
音信号処理部23は、周波数特徴ベクトル生成部231、内積算出部232、ノイズ推定部233、及びノイズ低減処理部24を備えている。
【0035】
周波数特徴ベクトル生成部231は、A/D変換部22によりデジタル信号に変換された音信号を、フレーム単位でフーリエ変換(例えば、FFT(Fast Fourier Transform)変換)して周波数スペクトルに変換する。なお、フレームとは、音信号を分割した区間のことである。ここでは、例えば、予め定められた期間を2分の1期間ずつずらした区間をフレームをとした場合について説明する。
【0036】
そして、周波数特徴ベクトル生成部231は、変換した音信号の周波数スペクトルに基づいて入力周波数特徴ベクトルを生成する。つまり、周波数特徴ベクトル生成部231は、音信号を周波数スペクトルに変換し、変換した音信号の周波数スペクトルに基づいて、入力周波数特徴ベクトルを生成する。
【0037】
なお、入力周波数特徴ベクトルは、音信号の周波数スペクトルにおける各周波数成分(周波数ビン)に対応する強度(例えば、絶対値)を要素として生成されたベクトルである。この入力周波数特徴ベクトルについての詳細は、図3を参照して後述する。
【0038】
さらに、周波数特徴ベクトル生成部231は、生成した入力周波数特徴ベクトルを内積算出部232及びノイズ低減処理部24に供給する。
【0039】
内積算出部232(算出部)は、周波数特徴ベクトル生成部231から供給された入力周波数特徴ベクトルと、ノイズ周波数特徴ベクトル記憶部61から読み出したノイズ周波数特徴ベクトルとの内積値に基づいて、ノイズ類似度を算出する。一例として、内積算出部232(算出部)は、この入力周波数特徴ベクトルと、ノイズ周波数特徴ベクトルとの内積値を、ノイズ類似度として算出する。このノイズ類似度とは、音信号とノイズとの類似の度合いを示す情報である。すなわち、ノイズ類似度とは、音信号にノイズがどの程度含まれて(混入されて)いるかを示す値である。内積算出部232は、算出したノイズ類似度をノイズ推定部233に供給する。
【0040】
ここで、ノイズ周波数特徴ベクトルとは、ノイズの周波数スペクトルに基づいて生成されたノイズの特徴を示すベクトルであり、ノイズ周波数特徴ベクトル記憶部61に予め記憶されている。また、このノイズ周波数特徴ベクトルは、ノイズの周波数スペクトルにおける各周波数成分(周波数ビン)に対応する強度(例えば、絶対値)を要素として生成される。
【0041】
つまり、ノイズ周波数特徴ベクトルは、ノイズの周波数スペクトルに基づいて生成され、入力周波数特徴ベクトルは、音信号の周波数スペクトルに基づいて生成される。そのため、言いかえると、内積算出部232は、周波数スペクトルとノイズの周波数スペクトルとに基づいて、上述のノイズ類似度を算出する。
【0042】
また、ノイズ周波数特徴ベクトルは、例えば、正規化した単位ベクトルでもよい。つまり、正規化前のノイズ周波数特徴ベクトルをnとすると、正規化されたノイズ周波数特徴ベクトルnは、式(1)として示される。
【0043】
【数1】

【0044】
ノイズ推定部233は、内積算出部232により算出されたノイズ類似度に基づいて、音信号に含まれる推定ノイズを推定する。つまり、本実施形態では、ノイズ推定部233は、入力周波数特徴ベクトルと、ノイズ周波数特徴ベクトルnとの内積値に基づいて、推定ノイズを推定する。ここで推定ノイズ(ベクトル)は、式(2)として示される。なお、ここで、記号“”は推定値を表し、本文中の“”は直後の文字の真上に付けられた記号を表すこととする。
【0045】
【数2】

【0046】
ここで、kは、フレーム番号を示し、ベクトルXは、k番目のフレームにおける入力周波数ベクトルを示す。
ノイズ推定部233は、式(2)によって算出した推定ノイズ(ベクトル)をノイズ低減処理部24に供給する。
【0047】
ノイズ低減処理部24は、周波数特徴ベクトル生成部231によって生成された入力周波数特徴ベクトルと、ノイズ推定部233によって推定された推定ノイズ(ベクトル)とに基づいて、音信号に含まれるノイズを低減する処理を実行する。つまり、ノイズ低減処理部24は、ノイズ推定装置150によって推定された推定ノイズに基づいて、音信号に含まれるノイズを低減する。そして、ノイズ低減処理部24は、このノイズを低減する処理を実行した音信号を記憶媒体200に記憶させる。
また、ノイズ低減処理部24は、ノイズ減算部234及び逆変換部235を備えている。
【0048】
ノイズ減算部234は、周波数特徴ベクトル生成部231によって生成された入力周波数特徴ベクトルXと、ノイズ推定部233によって推定された推定ノイズ(ベクトル)とに基づいて、音信号に含まれるノイズを減算して、ノイズを減算した目的音の推定周波数特徴ベクトルを算出する。ノイズ減算部234は、式(3)に示される関係式によって、目的音の推定周波数特徴ベクトルを算出する。なお、ここで目的音とは、使用者が、撮像装置1のマイク21によって収音しようとしている目的の音(録音対象の音)である。
【0049】
【数3】

【0050】
ノイズ減算部234は、算出した目的音の推定周波数特徴ベクトルを、逆変換部235に供給する。
【0051】
逆変換部235は、ノイズ減算部234によって算出された目的音の推定周波数特徴ベクトルを周波数スペクトルに戻す。そして、逆変換部235は、ノイズが混入した音信号の位相情報に基づいて時間波形に逆フーリエ変換(例えば、逆FFT変換)し、ノイズを低減した目的音の音信号を合成する。さらに、逆変換部235は、通信部70を介して、生成した音信号を記憶媒体200に記憶させる。
なお、逆変換部235は、推定周波数特徴ベクトルを変換した周波数スペクトルに負の値が含まれる場合には、その負の値を“0”に置き換えて、逆フーリエ変換する。
【0052】
次に、図3を参照して、ノイズ推定装置150が音信号に含まれるノイズを推定する概念を詳細に説明する。
図3は、本実施形態における入力周波数特徴ベクトルとノイズ周波数特徴ベクトルの一例を示す概念図である。ここでは、本実施形態における概念を説明するために、周波数成分数(周波数ビン数)が2つの場合について説明する。
【0053】
図3(a)は、ノイズの周波数スペクトルと音信号の周波数スペクトルの一例を示している。この図において、各グラフは、横軸が周波数成分(周波数ビンB1及びB2)を示し、縦軸が強度(例えば、PSD(Power Spectrum Density)など)を示している。
【0054】
また、この図において、周波数スペクトルW1は、ノイズの周波数スペクトルを示している。また、周波数スペクトルW2は、入力音信号(音信号)x1の周波数スペクトルを示し、周波数スペクトルW3は、入力音信号(音信号)x2の周波数スペクトルを示している。
【0055】
図3(b)は、図3(a)に示したノイズの周波数スペクトルと音信号の周波数スペクトルとを周波数特徴ベクトルに変換したベクトル空間を示している。この図において、横軸は、周波数ビンB1の強度を示し、縦軸は、周波数ビンB2の強度を示している。
【0056】
また、この図において、ベクトルnは、ノイズの周波数スペクトルW1に対応するノイズ周波数特徴ベクトル(正規化したノイズ周波数特徴ベクトル)を示している。なお、この正規化したノイズ周波数特徴ベクトルnは、上述した式(1)によって算出され、ノイズ周波数特徴ベクトル記憶部61に予め記憶されている。
【0057】
また、この図において、ベクトルX1は、音信号x1の周波数スペクトルW2に対応する入力周波数特徴ベクトルを示し、ベクトルX2は、音信号x2の周波数スペクトルW3に対応する入力周波数特徴ベクトルを示している。
なお、音信号x1の周波数スペクトルW2、音信号x2の周波数スペクトルW3、入力周波数特徴ベクトルX1、及び入力周波数特徴ベクトルX2は、周波数特徴ベクトル生成部231によって生成される。
【0058】
また、この図において、内積値Iは、入力周波数特徴ベクトルX1とノイズ周波数特徴ベクトルnとの内積値を示し、内積値Iは、入力周波数特徴ベクトルX2とノイズ周波数特徴ベクトルnとの内積値を示している。
【0059】
本実施形態では、ノイズ推定部233が、内積算出部232により算出された内積値に基づいて、音信号に含まれるノイズ(推定ノイズ)を推定する。
ここで、音信号x2は、内積値Iが内積値Iに比べて大きい。このことは、入力周波数特徴ベクトルX2の方向とノイズ周波数特徴ベクトルnの方向が近いことを示している。そのため、音信号x2の大部分がノイズであると推定される。
これに対して、音信号x1は、内積値Iが内積値Iに比べて小さい。このことは、入力周波数特徴ベクトルX2の方向とノイズ周波数特徴ベクトルnの方向が遠いことを示している。そのため、音信号x1のノイズ量が、音信号x2に比べて少ないと推定される。
つまり、ノイズ推定部233は、音信号に含まれる(重畳している)ノイズを適切に推定することができる。
【0060】
本実施形態におけるノイズ推定装置150は、上述のノイズの推定方法に基づいて、ノイズ推定部233が推定ノイズを推定し、推定した推定ノイズを上述したノイズ低減処理部24に供給する。なお、図3では、本実施形態における概念を説明するために、周波数ビン数が2つの場合を図示したが、内積算出部232は、実際にはより多数の要素を持ったベクトルの内積を算出することになる。例えば、1フレームのサンプル数が4096サンプルである場合、内積算出部232は、4096個の要素を持ったベクトルの内積を算出することになる。
【0061】
次に、本実施形態における撮像装置1及び信号処理装置100の動作について説明する。
【0062】
まず、撮像装置1の撮像動作について説明する。
撮像装置1において、CPU90は、例えば、操作部80を介して撮像指示を受け付けた際に、撮像部10を介して得られる画像データを、記憶媒体200に記憶させる。この際に、CPU90は、レンズ駆動部16及び手振れ防止部18を制御して、ズームレンズ14、VRレンズ13、又はAFレンズ12を駆動させる。
【0063】
なお、使用者が動画を撮像する場合には、マイク21により音信号が収音され、収音された音信号が、A/D変換部22及び音信号処理部23を介して、音信号が記憶媒体200に記憶される。この場合に、ズームレンズ14、VRレンズ13、又はAFレンズ12の駆動や操作部80の操作により、マイク21により収音された音信号にノイズが重畳されることがある。本実施形態における撮像装置1では、音信号処理部23を含む信号処理装置100を備えており、この信号処理装置100によって、音信号に重畳されたノイズを低減するノイズ低減処理を実行する。
【0064】
次に、信号処理装置100におけるノイズ低減処理に関する動作を説明する。
図4は、本実施形態におけるノイズ低減処理の動作を示すフローチャートである。
【0065】
この図において、まず、信号処理装置100は、入力された音信号をフレーム単位でフーリエ変換する(ステップS101)。つまり、音信号処理部23の周波数特徴ベクトル生成部231は、A/D変換部22によりデジタル信号に変換された音信号をフレーム単位で音信号の周波数スペクトルに変換する。なお、周波数特徴ベクトル生成部231は、フーリエ変換する際に、例えば、ハミング窓を窓関数として使用する。
次に、周波数特徴ベクトル生成部231は、フレーム単位に変換した周波数スペクトルに基づいて入力周波数特徴ベクトル(X)を生成する(ステップS102)。
【0066】
次に、信号処理装置100は、入力周波数特徴ベクトルとノイズ周波数特徴ベクトルとの内積値を算出する(ステップS103)。つまり、内積算出部232は、周波数特徴ベクトル生成部231から供給された入力周波数特徴ベクトル(X)と、ノイズ周波数特徴ベクトル記憶部61から読み出したノイズ周波数特徴ベクトル(n)との内積値をノイズ類似度として算出する。
【0067】
次に、信号処理装置100は、推定ノイズを推定する(ステップS104)。つまり、ノイズ推定部233は、内積算出部232により算出されたノイズ類似度(内積値<X,n>)に基づいて、音信号に含まれる推定ノイズ(ベクトル)を推定する。ノイズ推定部233は、例えば、上述した式(2)によって、この推定ノイズ(ベクトル)を算出する。
【0068】
次に、信号処理装置100は、推定ノイズによってノイズを減算する(ステップS105)。つまり、ノイズ低減処理部24のノイズ減算部234は、入力周波数特徴ベクトル(X)と、推定ノイズ(ベクトル)とに基づいて、音信号に含まれるノイズを減算して、ノイズを減算した目的音の推定周波数特徴ベクトル()を算出する。ノイズ減算部234は、例えば、上述した式(3)によって、この目的音の推定周波数特徴ベクトル()を算出する。
【0069】
次に、信号処理装置100は、逆フーリエ変換して、音信号を合成する(ステップS106)。つまり、逆変換部235は、まず、ノイズ減算部234によって算出された目的音の推定周波数特徴ベクトル()を周波数スペクトルに戻す。そして、逆変換部235は、ノイズが混入した音信号の位相情報に基づいて時間波形に変換し、ノイズを低減した目的音の音信号を合成する。さらに、逆変換部235は、通信部70を介して、生成した音信号を記憶媒体200に記憶させて、1フレームにおけるノイズ低減処理を終了させる。
【0070】
なお、ステップS101〜ステップS106の処理は、CPU90から制御信号によるノイズ低減処理の終了指示がされるまで繰り返し実行される。
【0071】
以上のように、ノイズ推定装置150は、内積算出部232が、入力された音信号の周波数スペクトルと、ノイズの周波数スペクトルとに基づいて、音信号とノイズとの類似の度合いを示すノイズ類似度(内積値)を算出する。そして、ノイズ推定部233は、内積算出部232により算出されたノイズ類似度に基づいて、音信号に含まれる推定ノイズを推定する。
【0072】
これにより、ノイズ推定装置150は、音信号に含まれる推定ノイズを適切に推定することができる。また、信号処理装置100は、ノイズ低減処理部24がノイズ推定装置150によって推定された推定ノイズに基づいて、音信号に含まれるノイズを低減する。そのため、ノイズ推定装置150及び信号処理装置100は、例えば、大きさが非定常なノイズを低減するような場合であっても、ノイズの過大減算あるいは過小減算により、音の劣化もしくは雑音の残存が発生することを低減できる。
【0073】
また、ノイズ推定装置150及び信号処理装置100は、例えば、間欠的に発生するノイズを低減するような場合であっても、ノイズを過大に減算してしまうことを防止でき、音の劣化が発生することを低減できる。したがって、ノイズ推定装置150及び信号処理装置100は、音信号に重畳しているノイズを適切に低減することができる。
また、ノイズ推定装置150及び信号処理装置100は、非定常ノイズの推定ノイズを得るために、1チャンネルの音信号に対して、複数のマイクを必要としない。そのため、少数のマイクによって、非定常ノイズを適切に低減することができる。
【0074】
また、本実施形態において、内積算出部232は、音信号の周波数スペクトルに基づいて生成された入力周波数特徴ベクトルと、ノイズの周波数スペクトルに基づいて生成されたノイズの特徴を示すノイズ周波数特徴ベクトルとの内積値に基づいて、ノイズ類似度を算出する。ここで、ノイズ周波数特徴ベクトルは、ノイズの周波数スペクトルにおける各周波数成分(各周波数ビン)に対応する強度を要素として生成されたベクトルである。また、入力周波数特徴ベクトルは、音信号の周波数スペクトルにおける各周波数成分に対応する強度を要素として生成されたベクトルである。
【0075】
入力周波数特徴ベクトルとノイズ周波数特徴ベクトルとの内積値は、図3に示されるように、入力周波数特徴ベクトルの方向とノイズ周波数特徴ベクトルの方向との近さの度合いを示している。そのため、ノイズ推定装置150は、入力周波数特徴ベクトルとノイズ周波数特徴ベクトルとの内積値に基づいて、適切に推定ノイズを推定することができる。よって、ノイズ推定装置150及び信号処理装置100は、音信号に重畳しているノイズを適切に低減することができる。
【0076】
また、本実施形態において、ノイズ周波数特徴ベクトルは、単位ベクトルである。
これにより、内積算出部232によって算出される内積値が、極端に大きな値になることを防止し、この内積値を制限することができる。
【0077】
なお、本実施形態では、内積算出部232によって内積する際に、ノイズ周波数特徴ベクトルとして単位ベクトル(n)を用いる形態を説明したが、正規化していないノイズ周波数特徴ベクトル(n)を用いる形態でもよい。また、この場合、ノイズ推定部233は、式(4)に示すように、ノイズ類似度(例えば、内積値)に応じて定められる係数αを、ノイズ周波数特徴ベクトルに乗算して、推定ノイズを推定してもよい。ここで係数αは、例えば、AFレンズ12のノイズであれば、“0.5”、ズームレンズ14のノイズであれば、“0.1”というように、ノイズを発生する動作部(機構部)に応じて変更してもよい。
【0078】
【数4】

【0079】
この場合、ノイズ減算部234は、式(5)に示される関係式によって、目的音の推定周波数特徴ベクトルを算出する。
【0080】
【数5】

【0081】
これにより、ノイズ周波数特徴ベクトルを正規化する必要がなく、ノイズ周波数特徴ベクトルの生成処理を簡略化することができる。また、必要に応じて、係数αによって、ノイズの削減量を補正できるため、ノイズ推定装置150及び信号処理装置100は、音信号に重畳しているノイズを適切に低減することができる。
【0082】
次に、本実施形態におけるノイズ周波数特徴ベクトルの生成方法について説明する。
ノイズ周波数特徴ベクトルは、撮像装置1の製造又は出荷検査の際に、例えば、校正装置によって予め生成され、ノイズ周波数特徴ベクトル記憶部61に記憶される。
校正装置は、静かな環境(フロアノイズの低い環境)において、AFレンズ12などの動作部(機構部)を動作させて、撮像装置1のマイク21によって収音されたノイズの音信号を取得する。校正装置は、このノイズの音信号をフレーム単位でフーリエ変換して、ノイズの周波数スペクトルを生成する。
【0083】
そして、校正装置は、ノイズの周波数スペクトルにおける各周波数成分(各周波数ビン)に対応する強度を要素として、ノイズ周波数特徴ベクトルを生成する。なお、ノイズ周波数特徴ベクトルは、上述したように、正規化したベクトル(n)でもよいし、正規化していないベクトル(n)でもよい。校正装置は、生成したノイズ周波数特徴ベクトルをノイズ周波数特徴ベクトル記憶部61に記憶させる。
すなわち、ノイズ周波数特徴ベクトルは、ノイズを発生する動作部(機構部)を動作させた際に得られる音信号に基づいて予め生成される。
【0084】
これにより、本実施形態におけるノイズ推定装置150は、適切なノイズ周波数特徴ベクトルを得ることができるため、音信号に含まれるノイズを適切に推定することができる。したがって、ノイズ推定装置150及び信号処理装置100は、音信号に重畳しているノイズを適切に低減することができる。
【0085】
なお、校正装置は、ノイズの音信号の所定の区間に対し、所定の時間で区切られた複数のフレームにおける周波数特徴ベクトルを算出し、ノイズ周波数特徴ベクトルの各周波数成分として、それらの最小値、平均値、中間値、最大値のいずれかを適用してもよい。
例えば、ノイズ低減を優先したい場合には、複数のフレームにおける周波数特徴ベクトルにおける最大値を適用する。また、例えば、目的音の劣化を抑えたい場合には、複数のフレームにおける周波数特徴ベクトルにおける最小値を適用する。また、例えば、ノイズ低減と目的音の劣化とをバランスよく、適切にノイズ低減したい場合には、複数のフレームにおける周波数特徴ベクトルにおける平均値又は中間値を適用する。
【0086】
次に、本実施形態におけるノイズ周波数特徴ベクトルの生成方法における別の一例について説明する。
図5は、本実施形態におけるノイズが重畳した音信号の例を示す説明図である。
この図において、横軸は、時間tを示す。図5(A)は、動作部の動作状態を示すグラフであり、H(ハイ)状態である場合に、動作部が動作している状態を示し、L(ロウ)状態である場合に、動作部が停止している状態を示す。図5(A)において、波形W4は、時刻T1において、動作部が動作を開始したことを示している。
【0087】
次に、図5(B)は、音信号を分割するフレームの一例を示している。図5(B)において、予め定められた期間を2分の1期間ずつずらした区間を1つのフレームをとして、フレームF1からフレームF7に分割される例を示している。
【0088】
図5(C)は、マイク21により収音された音信号の波形を示すグラフである。図5(C)において、波形W5は、時刻T1までの期間(ノイズが発生する前の期間)の音信号を示し、波形W6は、時刻T1以降の期間(ノイズが発生した後の期間)の音信号を示している。波形W6に示すように、時刻T1以降の期間において、上述の動作部の動作(ズームレンズ14、VRレンズ13、又はAFレンズ12の駆動や操作部80の操作)により、音信号にノイズが重畳される。
【0089】
本実施形態では、校正装置は、まず、図5に示されるような音信号(波形W5及び波形W6)を撮像装置1のマイク21によって取得する。そして、校正装置は、このように取得した音信号に基づいて、図6に示すように、ノイズの周波数スペクトル(W9)を算出する。
【0090】
図6は、本実施形態におけるノイズの周波数スペクトルの生成方法の一例を説明する説明図である。この図において、周波数スペクトルW7は、ノイズ発生前(時刻T1以前、例えば、フレームF1)の周波数スペクトルを示し、周波数スペクトルW8は、ノイズ発生後(時刻T1以降、例えば、フレームF4)の周波数スペクトルを示している。なお、周波数スペクトルW7は、音信号に定常ノイズとして含まれる背景ノイズ(フロアノイズ)の成分を示している。また、周波数スペクトルW9は、周波数スペクトルW8から周波数スペクトルW7を減算した(フレームF4からフレームF1を減算した)、ノイズの周波数スペクトルを示している。
【0091】
つまり、校正装置は、図6に示すようにノイズの周波数スペクトルを算出し、算出したノイズの周波数スペクトルに基づいて、ノイズ周波数特徴ベクトルを生成する。すなわち、ノイズ周波数特徴ベクトルは、機構部を動作させた際に、音信号に定常ノイズとして含まれる背景ノイズの成分を、音信号から減算して生成される。校正装置は、生成したノイズ周波数特徴ベクトルをノイズ周波数特徴ベクトル記憶部61に記憶させる。
【0092】
これにより、ノイズ周波数特徴ベクトルから音信号に定常ノイズとして含まれる背景ノイズ(フロアノイズ)の成分が低減されるので、背景ノイズ(フロアノイズ)によって、入力周波数特徴ベクトルとノイズ周波数特徴ベクトルとの内積値が大きな値になることを防止することができる。そのため、本実施形態におけるノイズ推定装置150は、音信号に含まれるノイズを適切に推定することができる。したがって、ノイズ推定装置150及び信号処理装置100は、音信号に重畳しているノイズを適切に低減することができる。
【0093】
なお、上記の背景ノイズを減算してノイズ周波数特徴ベクトルする場合においても、上述した複数のフレームにおける周波数特徴ベクトルの最小値、平均値、中間値、最大値のいずれかを使用する手法を適用してもよい。
【0094】
なお、本発明の実施形態によれば、撮像装置1は、上述の信号処理装置100を備える。
これにより、撮像装置1は、信号処理装置100と同様の効果が期待でき、音信号に重畳しているノイズを適切に低減することができる。
【0095】
また、本発明の実施形態によれば、ノイズ推定装置150としてのコンピュータに、内積算出部232が、入力された音信号の周波数スペクトルと、ノイズの周波数スペクトルとに基づいて、音信号とノイズとの類似の度合いを示すノイズ類似度を算出する算出手順(ステップS103)と、ノイズ推定部233が、算出手順により算出されたノイズ類似度に基づいて、音信号に含まれる推定ノイズを推定するノイズ推定手順(ステップS104)とを実行させるためのプログラムである。
これにより、プログラムは、ノイズ推定装置150と同様の効果が期待でき、音信号に重畳しているノイズを適切に低減することができる。
【0096】
なお、本発明は、上記の各実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で変更可能である。
上記の各実施形態において、ノイズ推定部233は、ノイズ類似度として算出された、入力周波数特徴ベクトルとノイズ周波数特徴ベクトルとの内積値に基づいて推定ノイズを推定する形態を説明したが、これに限定されるものではない。例えば、ノイズ類似度を算出する算出部が、音信号の周波数スペクトルと、ノイズの周波数スペクトルとの相関係数に基づいて、ノイズ類似度を算出し、ノイズ推定部233が、この相関係数に基づいて推定ノイズを推定する形態でもよい。この場合、ノイズ類似度を算出する算出部は、音信号の周波数スペクトルとノイズの周波数スペクトルとの各周波数成分(各周波数ビン)に対応する各組による相関係数を算出する。
【0097】
これにより、内積値に基づいて推定ノイズを推定する形態と同様に、ノイズ推定装置150及び信号処理装置100は、音信号に重畳しているノイズを適切に低減することができる。
また、ノイズ類似度は、例えば、マハラノビス距離に基づいて算出される形態でもよいし、他の形態でもよい。
【0098】
また、上記の各実施形態において、ノイズの周波数スペクトルの強度及び音信号の周波数スペクトルの強度として、絶対値を使用する形態を説明したが、虚数部も含めた複素数やパワーを使用する形態でもよい。
【0099】
また、上記の各実施形態において、信号処理装置100は、動作部(機構部)のノイズの発生タイミングを検出する検出部を備え、この検出部によって検出した発生タイミングに基づいて、ノイズを低減する処理を行うか否かを判定してもよい。つまり、信号処理装置100は、検出部によって検出した発生タイミングに基づいて、ノイズが発生していると判定された場合に、ノイズを低減する処理を実行する形態でもよい。
【0100】
また、ノイズ推定装置150は、この検出部によって検出した発生タイミングに基づいて、ノイズ周波数特徴ベクトル記憶部61に複数記憶されているノイズ周波数特徴ベクトルのうちの1つ又は複数を選択して使用する形態でもよい。例えば、ノイズ推定装置150は、この検出部によってズームレンズ14、VRレンズ13、及びAFレンズ12の機構音のうちのいずれか1つが動作していることを検出し、検出結果に応じて、ズームレンズ14、VRレンズ13、及びAFレンズ12のうちのいずれか1つに対応するノイズ周波数特徴ベクトルを選択してもよい。
【0101】
また、上記の実施形態において、ノイズ減算部234は、ノイズ推定部233によって推定された推定ノイズに基づいて、目的音の推定周波数特徴ベクトルを推定する形態を説明したが、さらに、重み付け係数を付加して算出する形態でもよい。例えば、推定ノイズに対するノイズ発生前の音信号の周波数スペクトルの比であるSNR(signal-noise ratio)やトーン度などを算出し、その算出値に基づいて重み付け係数を乗算して、推定ノイズ量を補正してもよい。
【0102】
また、上記の各実施形態において、ノイズ周波数特徴ベクトルを校正装置が生成して、ノイズ周波数特徴ベクトル記憶部61に記憶させる形態を説明したが、撮像装置1、信号処理装置100、又はノイズ推定装置150が、ノイズ周波数特徴ベクトルを生成する生成部を備える形態でもよい。また、校正装置が、既に予め生成されているノイズ周波数特徴ベクトルをノイズ周波数特徴ベクトル記憶部61に記憶させる形態でもよい。
また、上記の各実施形態において、ノイズ周波数特徴ベクトル記憶部61は、ノイズ周波数特徴ベクトルを記憶する形態を説明したが、ノイズ周波数特徴ベクトル記憶部61は、ノイズの周波数スペクトルを記憶し、ノイズ推定装置150によって、ノイズ周波数特徴ベクトルが生成される形態でもよい。例えば、内積算出部232が、ノイズの周波数スペクトルに基づいて、ノイズ周波数特徴ベクトルを生成する形態でもよい。
【0103】
また、上記の各実施形態において、信号処理装置100を撮像装置1に適用する形態を説明したが、これに限定されるものではない。例えば、レコーダなどの録音装置や電話機などのキー操作による音がノイズとして目的音である音信号に重畳されるような装置に適用してもよい。
また、上記の各実施形態において、フーリエ変換としてFFTを用いる形態を説明したが、DFT(Discrete Fourier Transform)を用いる形態でもよいし、他の方式を用いる形態でもよい。
【0104】
上述のノイズ推定装置150及び信号処理装置100は内部に、コンピュータシステムを有している。そして、上述したノイズ推定装置150及び信号処理装置100の処理過程は、プログラムの形式でコンピュータ読み取り可能な記録媒体に記憶されており、このプログラムをコンピュータが読み出して実行することによって、上記処理が行われる。ここで、コンピュータ読み取り可能な記録媒体とは、磁気ディスク、光磁気ディスク、CD−ROM、DVD−ROM、半導体メモリ等をいう。また、このコンピュータプログラムを通信回線によってコンピュータに配信し、この配信を受けたコンピュータが当該プログラムを実行するようにしてもよい。
【符号の説明】
【0105】
1…撮像装置、24…ノイズ低減処理部、61…ノイズ周波数特徴ベクトル記憶部、100…信号処理装置、150…ノイズ推定装置、231…周波数特徴ベクトル生成部、232…内積算出部、233…ノイズ推定部

【特許請求の範囲】
【請求項1】
入力された音信号の周波数スペクトルと、ノイズの周波数スペクトルとに基づいて、前記音信号と前記ノイズとの類似の度合いを示すノイズ類似度を算出する算出部と、
前記算出部により算出された前記ノイズ類似度に基づいて、前記音信号に含まれる推定ノイズを推定するノイズ推定部と
を備えることを特徴とするノイズ推定装置。
【請求項2】
前記算出部は、
前記音信号の周波数スペクトルに基づいて生成された入力周波数特徴ベクトルと、前記ノイズの周波数スペクトルに基づいて生成された前記ノイズの特徴を示すノイズ周波数特徴ベクトルとの内積値に基づいて、前記ノイズ類似度を算出し、
前記ノイズ周波数特徴ベクトルは、前記ノイズの周波数スペクトルにおける各周波数成分に対応する強度を要素として生成されたベクトルであり、
前記入力周波数特徴ベクトルは、前記音信号の周波数スペクトルにおける各周波数成分に対応する強度を要素として生成されたベクトルである
ことを特徴とする請求項1に記載のノイズ推定装置。
【請求項3】
前記ノイズ周波数特徴ベクトルは、単位ベクトルである
ことを特徴とする請求項2に記載のノイズ推定装置。
【請求項4】
前記ノイズ推定部は、
前記ノイズ類似度に応じて定められる係数を、前記ノイズ周波数特徴ベクトルに乗算して、前記推定ノイズを推定する
ことを特徴とする請求項2から請求項3のいずれか1項に記載のノイズ推定装置。
【請求項5】
前記ノイズ周波数特徴ベクトルが予め記憶されている記憶部と、
前記音信号を周波数スペクトルに変換し、変換した前記音信号の周波数スペクトルに基づいて、前記入力周波数特徴ベクトルを生成する周波数特徴ベクトル生成部と
を備えることを特徴とする請求項2から請求項4のいずれか1項に記載のノイズ推定装置。
【請求項6】
前記ノイズ周波数特徴ベクトルは、前記ノイズを発生する機構部を動作させた際に得られる音信号に基づいて、予め生成されている
ことを特徴とする請求項2から請求項5のいずれか1項に記載のノイズ推定装置。
【請求項7】
前記ノイズ周波数特徴ベクトルは、前記機構部を動作させた際に、前記音信号に定常ノイズとして含まれる背景ノイズの成分を、前記音信号から減算して生成される
ことを特徴とする請求項6に記載のノイズ推定装置。
【請求項8】
前記算出部は、
前記音信号の周波数スペクトルと、前記ノイズの周波数スペクトルとの相関係数に基づいて、前記ノイズ類似度を算出する
ことを特徴とする請求項1に記載のノイズ推定装置。
【請求項9】
請求項1から請求項8のいずれか1項に記載のノイズ推定装置と、
前記ノイズ推定装置によって推定された前記推定ノイズに基づいて、前記音信号に含まれるノイズを低減するノイズ低減処理部と、
を備えることを特徴とする信号処理装置。
【請求項10】
請求項9に記載の信号処理装置を備えることを特徴とする撮像装置。
【請求項11】
ノイズ推定装置としてのコンピュータに、
算出部が、入力された音信号の周波数スペクトルと、ノイズの周波数スペクトルとに基づいて、前記音信号と前記ノイズとの類似の度合いを示すノイズ類似度を算出する算出手順と、
ノイズ推定部が、前記算出手順により算出された前記ノイズ類似度に基づいて、前記音信号に含まれる推定ノイズを推定するノイズ推定手順と
を実行させるためのプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate