説明

撮像装置及び情報処理装置、これらの制御方法並びに雑音除去方法及びプログラム

【課題】
録音時のALC増幅率を記録せずに記録後に音声信号の駆動雑音を低減する。
【解決手段】
レンズ(102)は駆動時に駆動雑音を発生する。カメラ制御部(119)はレンズ(102)の駆動時にスピーカ(120)から可聴音でない一定音圧の基準音を発生させる。マイク(115)は周囲音を取り込み、音声信号処理回路(137)はALC回路によりマイク(115)の出力音声信号を音圧レベルに応じた増幅率で増幅する。増幅された音声信号はメモリ手段(134)に記録される。カメラ制御部(119)はメモリ手段(134)から音声信号を読み出し、含まれる基準音の音圧により記録時の増幅率を算定する。カメラ制御部(119)は、別途記憶する駆動雑音信号を算定増幅率で増幅し、メモリ手段(134)からの音声信号から減算する。減算の前後でFFT(フーリエ変換)と逆FFTを適用する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、撮像装置及び情報処理装置、これらの制御方法並びに雑音除去方法及びプログラムに関する。
【背景技術】
【0002】
静止画撮影のほかに音声信号記録を伴う動画撮影を行う機能を有するデジタルカメラが登場してきている。しかし、動画撮影時にフォーカスレンズの駆動や手振れ防振機構など撮像装置駆動部の動作が行われると、記録すべき音声信号にこれら駆動部の発生する駆動音が雑音として混入してしまう。
【0003】
このような駆動雑音を低減する様々な技術が知られている。特許文献1には、スペクトルサブトラクション法(SS法)と呼ばれる手法で駆動雑音を低減することが記載されている。予め撮影動作に伴う駆動雑音を周波数変換したデータを記憶しておく。動画撮影時には、駆動部へ駆動命令を発し駆動雑音が発生した区間の音声信号をフーリエ変換で周波数領域に変換する。周波数領域に変換した雑音混入信号から、予め記憶した対応する周波数領域の駆動雑音データに一定の係数をかけて減算し、逆フーリエ変換により時間領域の信号に戻す。マイクから取得した音声信号を一定長のフレームごとに区切った信号に対し、これを繰り返して行くことで、駆動雑音の低減を行っている。
【0004】
スペクトルサブトラクション法(SS法)では、雑音成分に乗じる係数が適正値よりも小さいと、減算する雑音成分が不足し、十分な雑音低減ができない。一方、雑音成分に乗じる係数が適正値よりも大きい場合、雑音減算処理後の音声信号にミュージカルノイズと呼ばれる歪みが生じ、音質が低下する。つまり、スペクトルサブトラクション法(SS法)では、雑音成分に乗じる係数が適正でないと、雑音除去性能が低下してしまう。
【0005】
一方、撮像装置の音声処理回路には、一般的にALC(Auto-Level Control)と呼ばれる自動音圧レベル制御機能が搭載されている。これは、被写体音声の音圧レベルが小さいときはマイクからの信号レベルを上げ、被写体音声の音圧レベルが大きいときは信号レベルを下げる機能である。これにより、被写体の音声を常に適切な音声レベルで録音することが出来る。
【0006】
しかし、ALC機能により音圧レベルの利得が変動する撮像装置において、音声信号に駆動雑音が混入した場合、駆動雑音の音圧レベルもALCの増幅率によって変動する。このような音声信号に対してSS法による雑音除去処理を適用すると、雑音成分の音圧レベルの変動により、雑音成分を減算しすぎたり、減算量が不足したりする。特許文献2には、ALCの音圧レベル増幅率を常時取得し、SS法による減算処理にALCの音圧レベル増幅率を加味して減算することが記載されている。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特開2006−279185号公報
【特許文献2】特開2008−058343号公報
【発明の概要】
【発明が解決しようとする課題】
【0008】
ALC機能を使用する撮像装置で、SS法による駆動雑音除去処理を組み合わせると、以下のような問題点がある。
【0009】
SS法は音声信号に対しフーリエ変換により周波数領域に変換し、さらに雑音成分の減算を行ったあと逆フーリエ変換により時間領域の信号に変換する。回路構成にもよるが、一般的にフーリエ変換及び逆フーリエ変換は演算負荷が高く、SS法のように音声信号に対し区切ったフレーム分だけ処理を繰り返すことは大きな演算量となる。
【0010】
実際の動画撮影において、取得される音声信号に対し随時フレームごとにSS法の処理をして音声記録部に書き込んでいくことは、現状の撮像装置の演算処理装置では困難である。また、取得される音声信号に対し随時フレームごとにSS法の処理をする際にALC制御量を常に監視し取得することは、演算処理装置への更なる負荷となる。
【0011】
動画撮影時には音声信号に対しSS法による駆動雑音除去処理を行わずにそののままの音声信号を記録し、撮影終了後(録音終了後)に適用することが考えられる。状況によっては、外部の処理能力の高い演算処理装置を利用することも可能になる。しかし、記録された音声信号にSS法による雑音除去処理で適切な結果を得るには、ALCの音圧レベル増幅率を知る必要がある。しかし、音圧レベル増幅率を動画撮影時に音声信号に同期して記録すると、音圧レベル増幅率を記録する為に特殊な動画記録のフォーマットが必要になるだけでなく、記録データ量が増大する。
【0012】
本発明は、ALCの増幅率を記憶すること無しに、音声信号から駆動雑音を適切に低減できる撮像装置及び情報処理装置、これらの制御方法並びに雑音除去方法及びプログラムを提示することを目的とする。
【課題を解決するための手段】
【0013】
上記目的を達成するために、本発明に係る撮像装置は、被写体像を結像する撮像光学系と、前記撮像光学系から導かれる被写体像を撮像する撮像素子と、前記撮像光学系を調整する際に駆動雑音を発生する撮像光学系駆動手段と、基準音を発生する基準音発生手段と、音声信号を取得する音声入力手段と、前記音声入力手段により取得される音声信号を、前記音声信号の音圧レベルに応じた増幅率で増幅する音声増幅手段と、前記音声増幅手段で増幅された音声信号を記録媒体に記録する録音手段と、前記記録媒体に記録された音声信号に重畳する前記基準音に基づいて前記音声増幅手段の前記増幅率を算出する増幅率算出手段と、前記撮像光学系駆動手段から発生する駆動雑音の周波数領域での雑音成分を記憶する駆動雑音記憶手段と、前記記録媒体に記録された音声信号を周波数領域に変換する周波数変換手段と、前記周波数変換手段の変換結果から、前記駆動雑音記憶手段に記憶される前記雑音成分に前記増幅率算出手段で算出される前記増幅率に相当する調整を施した結果を減算する減算手段と、前記減算手段の減算結果を時間領域に変換する時間領域変換手段とを有することを特徴とする。
【発明の効果】
【0014】
本発明によれば、記録された音声信号から、記録時に混入した雑音を効果的に低減することができる。
【図面の簡単な説明】
【0015】
【図1】本発明の一実施例の中央断面図である。
【図2】第1実施例の概略構成ブロック図である。
【図3】音声信号及び音圧レベル増幅率の変化例を示す模式図である。
【図4】一定区間の音声信号のスペクトラム図である。
【図5】一定区間の音声信号のスペクトラム図である。
【図7】雑音除去手段の概略構成ブロック図である。
【図6】第1実施例における録音動作のフローチャートである。
【図8】第1実施例における雑音除去処理のフローチャートである。
【図9】第1実施例における音声信号及び音圧レベル増幅率の変化例の模式図である。
【図10】第1の実施例における音声信号のスペクトラム例である。
【図11】第2実施例における録音動作のフローチャートである。
【図12】第2実施例における雑音除去処理のフローチャートである。
【図13】第2実施例における音声信号及び音圧レベル増幅率の変化例の模式図である。
【図14】第2実施例における音声信号のスペクトラム例である。
【図15】第3実施例におけるデジタル一眼レフカメラ及び情報処理装置の全体構成図である。
【図16】第3実施例の概略構成ブロック図である。
【図17】第3実施例における雑音除去処理のフローチャートである。
【図18】メモリカードで音声データを転送する変更構成のシステム全体図である。
【発明を実施するための形態】
【0016】
以下、図面を参照して、本発明の実施例を詳細に説明する。
【実施例1】
【0017】
図1は、本発明に係る撮像装置の一実施例であるデジタル一眼レフカメラの中央断面図を示し、図2は、本実施例の概略構成ブロック図を示す。
【0018】
100は本発明の一実施例であるデジタル一眼レフカメラを示す。101はデジタル一眼レフカメラ100のカメラボディを示す。102は撮影レンズを示す。撮影レンズ102は、レンズ鏡筒103内に光軸105を有する撮像光学系104を有する。撮像光学系104は、フォーカスレンズ群、手ブレ補正レンズユニット及び絞り機構、これらを駆動する光学系駆動部(撮像光学系駆動手段)106、並びに光学系駆動部106を制御するレンズ制御部107を有する。撮像光学系104は、レンズマウント接点108でカメラボディ101と電気的に接続する。撮影レンズ102は取り外し可能であり、焦点距離又はF値などの光学定数の異なるものに交換できる。
【0019】
撮影レンズ102の前方から入射する被写体光学像は、光軸105を通ってカメラボディ101に入射する。入射光の一部は、ハーフミラーで構成された主ミラー110で反射され、フォーカルスクリーン117上に結像する。ユーザ又は撮影者は、フォーカルスクリーン117上に結象した光学象を、ペンタプリズム111を通して接眼窓112から視認出来る。これらは、光学ビューファインダ構成となる。
【0020】
測光センサ116は、フォーカルスクリーン117上に結像した光学象の明るさを検出する。また、主ミラー110を透過した被写体光学像は、サブミラー113で反射され、焦点検出部114に入射する。焦点検出部114の出力は、被写体像の焦点検出演算に用いられる。測光センサ116は、フォーカルスクリーン117の全体、若しくは、1又は複数の所定部分の露光量を検出する。
【0021】
カメラボディ101内にある不図示のレリーズボタンが操作され、撮影開始命令が発せられると、主ミラー110及びサブミラー113は、被写体光学像が撮像素子118に入射するように撮影光路から退避する。
【0022】
焦点検出部114及び測光センサ116の検出出力、並びに撮像素子118の出力は、カメラ制御部119に供給される。カメラ制御部119は、これらの信号に従い、カメラ100の全体を制御する。
【0023】
動画撮影時には、音声入力手段であるマイク115が、外部の音声を取り込み、音声信号に変換してカメラ制御部119に供給する。この音声信号は、撮像素子118から出力される画像信号と同期して、記録処理される。
【0024】
スピーカ120は、撮影動画の再生時に再生音声信号を出力するためと、撮影者に警告などを発するための警告音等を出力する。スピーカ120は、詳細は後述するが、録音された音声信号から録音時のALC増幅率を検出するための一定音圧の基準音を発生する基準音発生手段としても機能する。
【0025】
図2を参照してカメラ100の構成と基本動作を説明する。カメラ100は、撮像系、画像処理系、音声処理系、記録再生系及び制御系を有する。撮像系は、撮像光学系104及び撮像素子118を含む。画像処理系は、A/D変換器131及び画像処理回路132を含む。音声処理系は、マイク115と、音声増幅手段としてのALC回路を有する音声信号処理回路137を含む。記録再生系は、記録処理装置133及びメモリ134を含む。メモリ134には、駆動雑音周波数成分が予め記録されている。制御系は、光学系駆動部106、レンズ制御部107、カメラ制御部119、焦点検出部114、測光センサ116及び操作検出部135を含む。光学系駆動部106は、焦点レンズ駆動部106a、ブレ補正駆動部106b及び絞り駆動部106cなどから構成されている。
【0026】
カメラ制御部119は、駆動雑音除去のために、音声信号を周波数領域に変換する手段、周波数領域の音声信号を時間領域に変換する手段及び駆動雑音成分減算手段を有する。カメラ制御部119上で動作する雑音除去プログラムが、これら手段にそれぞれ対応する周波数領域変換機能、時間領域変換機能及び雑音除去機能をカメラ制御部119に実現させる。カメラ制御部119はまた、レンズ102の光学要素(ズーム、絞り、フォーカス)毎の駆動雑音を可聴音帯域の周波数成分に分解して記憶する駆動雑音記憶手段を内蔵する。
【0027】
撮像系は、被写体などの物体からの光を撮像光学系104により撮像素子118の撮像面に結像する光学処理系である。エイミングなどの撮影予備動作中は、主ミラー110に設けられたミラーを介して、焦点検出部114にも光束の一部が導かれる。後述するように、制御系が適切に撮像光学系を調整することで、適切な光量の物体光が撮像素子118に入射するとともに、撮像素子118の近傍で被写体像が結像する。
【0028】
A/D変換器131は、撮像素子118の出力画像信号をデジタル化して、画像処理回路132に入力する。画像処理回路132は、A/D変換器131からの画像データを処理する回路であり、ホワイトバランス回路、ガンマ補正回路、及び、補間演算による高解像度化を行う補間演算回路等を有する。
【0029】
音声処理系では、音声信号処理回路137が、マイク115の出力信号をALC回路により自動で適切な音圧レベルに調節する。なお、ALC回路は、マイクからの音声信号の大きさによって音圧レベル増幅率Gtを最小増幅率Gminから最大増幅率Gmaxの範囲で変化させる。例えば、被写体音声がほとんどなく無音に近い状態が続くと、音圧レベル増幅率Gtは最大増幅率Gmaxとなり、逆に音声信号の量子化可能な範囲を越える大きな音が続いている場合、最小増幅率Gminとなる。音声信号処理回路137は更に、不要な低周波成分及び高周波成分をカットし、録音用音声信号を生成する。録音用生成信号は、後述する記録処理部により画像データとリンクして記録処理される。
【0030】
記録処理装置133は、メモリ134に画像データを出力するとともに、画像表示装置136に出力すべき画像の画像データを生成し保存する。また、記録処理装置133は、所定の方法で画像データ、動画データ及び音声データをデータ圧縮し、記録媒体に記録する。
【0031】
カメラ制御部119は、撮像の際のタイミング信号などを生成して出力する。焦点検出部114は、被写体のピント状態を検出し、露出検出部としての測光センサ116は、被写体の輝度を検出する。レンズ制御部107は、カメラ制御部119からの制御信号に応じて、撮像光学系104の焦点、ズーム及び絞りを調整する。
【0032】
制御系は、外部操作に連動して撮像系、画像処理系及び記録再生系をそれぞれ制御する。例えば、操作検出部135は、不図示のシャッタレリーズ釦の押下を検出する。カメラ制御部119は、この検出出力に応じて、撮像素子118の駆動、画像処理回路132の動作、及び記録処理装置133の圧縮処理などを制御する。カメラ制御部119はまた、画像表示装置136を構成する光学ファインダ及び/又は液晶モニタ等による情報表示を行う情報表示装置の各セグメントを制御する。
【0033】
撮像光学系の調整動作を説明する。カメラ制御部119は、焦点検出部114及び測光センサ116の検出出力に従い、適切な焦点位置と絞り位置を決定し、その位置への制御を示す制御信号をレンズ制御部107に供給する。レンズ制御部107は、カメラ制御部119からの制御信号に従い、焦点レンズ駆動部106a及び絞り駆動部106cにそれぞれ焦点レンズ及び絞りを駆動させる。
【0034】
レンズ制御部107には、不図示の手ブレ検出センサが接続する。手ぶれ補正モードでは、レンズ制御部107は、手ブレ検出センサの検出出力に従いブレ補正駆動部106bを制御して手ブレを軽減させる。
【0035】
動画撮影時には、主ミラー110及びサブミラー113が光軸105から撮像素子118に入射する光路から退避するので、焦点検出部114及び測光センサ116には、被写体光学像が入射しない。このとき、カメラ制御部119は、焦点レンズ駆動部106aの駆動量と撮像素子118から出力される連続的な画像信号を用いて、いわゆる山登り方式と呼ばれる焦点検出方法で撮像光学系のピント状態を調節する。また、カメラ制御部119は、撮像素子118から出力される画像信号を用いて、被写体の輝度を算出し、絞りを調節する。
【0036】
図3を参照して、音声信号処理回路137のALC回路の動作を説明する。図3(a)は、レンズ駆動による雑音(駆動雑音)が混入した音声信号を時間領域で示す。横軸は時間を示し、縦軸は、音声信号の振幅を示す。図3(b)は、図3(a)に示す音声信号に同期した制御されるALC回路の音圧レベル増幅率Gtを示す。マイク115から取得される音声信号が小さいときは徐々に音圧レベル増幅率を上げ、区間203のように大きな音声信号が入力されたときは急激に音圧レベル増幅率を下げる。図3(a)に示す音声信号は、約5秒間に及び被写体たる人物が話しているものであるが、その間に何度もALC回路による音圧レベル増幅率の変動が発生している。
【0037】
本実施例の雑音除去処理又は雑音低減処理を詳細に説明する。図4は、図3に示す音声信号の区間201の周波数特性例を示す。横軸は周波数を示し、縦軸は音声レベル(dB)を示す。図4(a)は、被写体音に駆動雑音201bが混入した音声信号201aの周波数特特性を示す。音声信号201aは、ALCの増幅率G1で増幅されている。図4(b)に示す音声信号201cは、予め取得している駆動雑音成分に増幅率G1に相当する係数を乗算した、調整された駆動雑音(調整駆動雑音という)を示す。図4(c)に示す音声信号201dは、駆動雑音成分を含まれない被写体音のみからなる音声信号を示す。すなわち、音声信号201aは、音声信号201dに駆動雑音の音声信号201bを加算したものからなる。駆動雑音の音声信号201bは調整駆動雑音201cにほぼ一致する。従って、ALC後の音声信号201aから調整駆動雑音201cを減算することで、被写体音のみからなる音声信号201dを抽出できる。
【0038】
図5は、図3に示す音声信号の区間202の周波数特性例を示す。横軸は周波数を示し、縦軸は音声レベル(dB)を示す。図5(a)は、被写体音に駆動雑音202bが混入した音声信号202aの周波数特特性を示す。音声信号202aは、ALCの増幅率G2で増幅されている。図5(b)に示す音声信号202cは、予め取得している駆動雑音成分に増幅率G2に相当する係数を乗算した調整駆動雑音を示す。調整駆動雑音202cの周波数特性は、調整駆動雑音201cに対して音声レベルが異なるのみであり、調整駆動雑音201cをG2/G1倍すると、駆動調整雑音202cに一致するレベルとなる。図5(c)に示す音声信号202dは、駆動雑音成分を含まれない被写体音のみからなる音声信号を示す。すなわち、音声信号202aは、音声信号202dに駆動雑音の音声信号202bを加算したものからなる。駆動雑音の音声信号202bは調整駆動雑音202cにほぼ一致する。従って、ALC後の音声信号202aから調整駆動雑音202cを減算することで、被写体音のみからなる音声信号202dを抽出できる。
【0039】
本実施例は、録音を伴う撮影時には、レンズ駆動時にスピーカ120から所定周波数の基準音を生成させ、被写体音声と共にこの基準音を記録する。図6は、録音中のレンズ駆動の制御フローチャートを示す。なお、カメラ制御部119は、撮影準備中又は撮影中に、撮影者によるレンズ102の光学系調整操作、及び合焦制御動作に従い、レンズ102のレンズ制御部107にレンズ駆動命令を供給する。
【0040】
録音動作が開始されると、ステップS1001で、カメラ制御部119は、レンズ制御部107にレンズ駆動命令を供給すべきイベントが発生したか否かを判別する。そのようなイベントが発生すると、カメラ制御部119は、ステップS1002で、スピーカ120から基準音を発生させる。基準音は、例えば被写体音に含まれると予想される周波数帯域とは異なる周波数を持つ、発生音圧が一定な単波長音である。基準音の周波数は、音声信号処理回路137で量子化に使用されるサンプリング周波数の半分以下であり、人間の可聴帯域外であることが望ましい。例えば、音声信号処理回路137のサンプリング周波数が44.1kHである場合、人の可聴帯域を考慮して、基準音は約10kHz以上(で22kHz以下)の単波長音と設定すればよい。本実施例では、サンプリング周波数44.1kHzとし、基準音を18kHzの単波長音とする。単波長音の周波数はこれに限られるものではなく、所定の周波数であればよい。
【0041】
ステップS1003は、カメラ制御部119は、実際に、レンズ102にレンズ駆動命令を供給して、レンズ102の指定の光学要素の駆動を開始させる。光学系の調整が完了してレンズ駆動が終了すると(S1004)、カメラ制御部119は、基準音の発生を終了する(S1005)。
【0042】
S1006で録音スイッチのオフが検出されるまで(S1006)、カメラ制御部119は、ステップS1001に戻り、上記処理を繰り返す。ステップS1006で録音スイッチのオフが検出されたら、カメラ制御部119は、録音動作を終了する。
【0043】
録音動作が終了するまでの間に取得された音声信号は、順次、音声信号処理回路137により処理されて、メモリ手段134に記録される。
【0044】
図7は、カメラ制御部119内の雑音除去手段の概略構成ブロック図を示す。図8は駆動雑音除去処理の動作フローチャートを示す。図9は、記録された音声信号波形、ALCの音圧レベル増幅率の変化及び基準音波形の一例を示す。
【0045】
カメラ制御部119は、メモリ手段134に記録された音声データ301を読み出して、高速フーリエ変換装置(FFT)302とバンドパスフィルタ303に供給する。FFT302は、音声データ301をフーリエ変換により周波数領域に変換する周波数変換手段として機能し、周波数変換ステップ又は周波数変換機能を実現する。バンドパスフィルタ303の透過周波数は、基準音の周波数に一致する。バンドパスフィルタ303は、音声データ301から基準音を抽出する。バンドパスフィルタ303の出力レベルは、録音時のALCによる音圧レベル増幅率を示し、この点で、バンドパスフィルタ303は録音時の増幅率を算出する増幅率算出手段として機能する。増幅率算出手段に相当する増幅率算出ステップ及び増幅率算出機能が、カメラ制御部119上で実現される。
【0046】
カメラ制御部119はまた、駆動雑音の周波数成分304を減残量調整手段305に供給する。減残量調整手段305は、バンドパスフィルタ303の出力レベルに応じて、駆動雑音の周波数成分304のレベルを調整する。具体的には、減残量調整手段305は、録音時のALCによる音圧レベル増幅率に相当する増幅率で、駆動雑音の各周波数成分304を増幅する利得可変増幅器である。
【0047】
減算器306は、FFT302の出力から、減残量調整手段305の対応する周波数成分の出力を減算する。逆フーリエ変換装置(IFFT)307は、減算器306の出力を逆フーリエ変換して、周波数領域から時間領域に戻す。減算器306に相当する減算ステップ及び減算機能が、カメラ制御部119上で実現される。
【0048】
基準音がレンズ駆動タイミングと同期していることから、バンドパスフィルタ303は駆動雑音発生タイミングを検出する検出手段と評価することができる。減残量調整手段305、減算器306及びIFFT307は、この検出手段の検出結果に基づいて駆動雑音を低減又は除去する駆動雑音除去手段とも言える。この駆動雑音除去手段に相当する駆動雑音除去ステップと駆動雑音除去機能が、カメラ制御部119により実現される。
【0049】
図9(a)は、マイク115及び音声信号処理回路137を介して録音される音声信号の波形例を示す。横軸は時間を示し、縦軸は音声信号レベルを示す。図9(b)は、図9(a)に対応するALC回路における音圧レベル増幅率Gtの変動を示す。レンズ駆動命令が発せられると、図9(a)の区間204に示すように、被写体音にレンズ駆動雑音と基準音が重畳する。区間204では、ALC回路の音圧レベル増幅率Gtも変動する。
【0050】
図8を参照して、メモリ手段134に記録された音声信号に対する雑音除去処理を説明する。図8は、本実施例の雑音除去処理動作のフローチャートである。
【0051】
ステップS1101で、カメラ制御部119は、メモリ手段134に記録された音声信号を読み込む。ステップS1102で、カメラ制御部119は、基準音を抽出するために、読み込んだ音声信号に基準音の周波数帯域を通過させる帯域通過フィルタ(バンドパスフィルタ)を適用する。本実施例では18kHzの基準音を発生させるので、18kHzの帯域を通過させる急峻なバンドパスフィルタを採用する。図10(d)は、適用するバンドパスフィルタの通過帯域205eを示す。
【0052】
ステップS1103で、カメラ制御部119は、バンドパスフィルタにより抽出された基準音信号の音圧変化からALCの音圧レベル増幅率Gtを算出する。図9(c)は、ステップS1102で抽出された基準音信号の波形例を示す。抽出された基準音信号の音圧変化から、図9(b)に示すALC回路の音圧レベル増幅率Gtを算出できる。
【0053】
ステップS1104で、カメラ制御部119は、ステップS1101で読み込んだ音声データを一定フレーム長に分割し、各分割フレームに対し高速フーリエ変換(FFT)を適用して周波数領域に変換する。FFT処理では分割フレームごとに随時、周波数領域への変換を行っていくが、以下では、図9(a)に示すフレーム区間205における音声信号の処理例を説明する。
【0054】
図10は、サンプリング周波数44.1kHzの音声信号を次数512点でFFT処理し、周波数領域で表現したもの及びバンドパスフィルタの特性を示す。横軸は周波数を示し、縦軸は各周波数における音圧レベル(dB)を示す。図10(a)のスペクトル205aは、図9(a)のフレーム区間205における音声信号を周波数領域で表現したものである。スペクトル205bは、フレーム区間205における駆動雑音と基準音のみからなる音声信号の周波数領域変換の結果を示す。図10(b)は、駆動雑音のみのスペクトル205cを示し、図10(c)は、基準音のみのスペクトル205dを示す。
【0055】
図10(a)に示すように、記録された音声信号のスペクトル205aでは、基準音の周波数である周波数帯域206で基準音成分を示すピークが出現する。ステップS1104では、この基準音周波数成分を抽出する為に、図10(d)に示す透過特性のバンドパスフィルタを用いている。音圧レベル増幅率をGminとしたときのフレーム区間205のスペクトル205c及び205dに相当するデータが予め取得され、メモリ手段134又はカメラ制御部119に記憶されている。
【0056】
ステップS1105で、カメラ制御部119は、予め記憶された駆動雑音及び基準音の周波数成分をステップS1103で求めた音圧レベル増幅率Gtに応じて調整する。そして、その調整結果をステップS1104で算出した周波数領域の変換結果から減算する。すなわち、
SS(f,n)=S(f,n)-NM(f,n)×Gt(n)/Gmin×α (1)
Sは取得(記録)された音声信号を示す。NMは予め記憶された駆動雑音及び基準音を示す。SSは雑音除去処理された音声信号を示す。各信号S,NM,SSは周波数領域で表現され、括弧内のfはFFT処理で分割し表現される周波数、nはFFT処理時の分割フレーム番を表す。Gtは各フレームにおける音圧レベル増幅率である。αはSS手法において雑音成分を減算する際に掛けるサブトラクト係数と呼ばれるもので、雑音成分を減算する重みzを決定する。αは1としても良いが、減算する雑音成分によって調整を行った方が、雑音除去性能が向上する。本実施例では、αを固定値とするが、SS処理結果に対し評価関数を設け、その評価結果によりαの値をフィードバックして変更しても良い。
【0057】
ステップS1105では結局、カメラ制御部119は、雑音成分の重畳したスペクトル205aから駆動雑音成分及び基準音成分のスペクトル205c,205dを減算することに相当する処理を実行する。これにより、雑音除去処理された音声信号スペクトルが算出される。
【0058】
本実施例では、記録された音声信号に駆動雑音が混入したタイミングが分からなくても良い。駆動雑音が混入していない区間では、図9(c)に示すように、抽出された基準音の音圧レベルが、音圧レベル増幅率Gminのときのそれよりも明らかに低くなっているからである。調整後の駆動雑音が極小になるので、減算によっても、被写体音声から雑音成分を減算しすぎることはない。
【0059】
ステップS1106で、カメラ制御部119は、雑音成分の減算結果に逆高速フーリエ変換(IFFT)を適用して時間領域の音声信号に戻す。すなわち、時間領域変換ステップ又は時間領域変換機能が、カメラ制御部119で実現される。得られた音声信号は、駆動雑音及び基準音を除去されたものになっている。
【0060】
ステップS1107で、カメラ制御部119は、雑音除去処理を行った音声信号を、メモリ手段134に先に記録されていた駆動雑音及び基準音の重畳した音声信号に対し上書きして記録する。
【0061】
このように、メモリ手段134に暫定的に記録した音声信号に順次、雑音除去処理を適用し、雑音除去処理した音声信号に変更する。勿論、雑音除去処理後の音声信号を、雑音除去処理前の音声信号とは別にメモリ手段134に記録しても良い。
【0062】
以上説明したように、本実施例では、レンズ駆動時に音圧及び周波数が定常な基準音を発してその音声信号を被写体音と一緒に記録し、動画撮影終了後に雑音除去処理を行う。雑音除去処理では、基準音の音圧レベルから録音時の音圧レベル増幅率を検出し、駆動雑音レベルを調整して雑音除去処理を行っている。これにより、ALC回路による音圧レベル変動を考慮した雑音除去が可能になる。また、暫定記録後の雑音除去になるので、演算負荷の高いSS法を利用できる。ALC回路による音圧レベル増幅率に相当する情報を記録するための特別なフォーマットを採用しなくて良いので、汎用性がある。動画撮影時にALCの音圧レベル増幅率の変化を常に監視及び取得しなくても良いので、動画撮影時の演算負荷の低減にも繋がる。
【0063】
また、基準音の単波長音を可聴帯域に対して18kHzと高周波に設定しているので、撮影者にとって撮影中にあまり耳障りではない。特に、人間の可聴特性にはA特性と呼ばれる4kHzよりも高周波な音は周波数が上がるにつれて聞き取りにくくなる特性がある。よって、図10(c)のスペクトラム205aでしめすように基準音の周波数成分が大きくても人間の耳には聞こえることは少ない。
【0064】
また、ALC回路の音圧レベル増幅率はマイク115から取得される音声信号の音圧レベルによって決定されるので、基準音は音圧レベル増幅率を決定するのに影響のない音圧レベル以下でスピーカ120より発しなければいけない。しかし、ALCの音圧レベル増幅率を決定する際に、音声信号に対しA特性を掛けた信号により音圧レベルを決定することにより、基準音の音圧レベルがある程度大きくても、音圧レベル増幅率の決定には影響を与えないようにできる。
【0065】
基準音の周波数帯域を通常のサンプリング周波数の半分より大きく、かつ完全に可聴帯域より大きい例えば22kHzなどに設定し、基準音の発生時にのみサンプリング周波数を基準音の周波数帯域の2倍以上に変更して記録しても良い。
【0066】
本実施例では、音圧レベル増幅率の変動を検出するのに、基準音の含まれた音声信号を基準音の周波数帯域を通過させるバンドパスフィルタに通して、フィルタ通過後の音声信号の音圧レベル変動を算出した。バンドパスフィルタを用いずに、FFTの結果から基準音の音圧を決定し、音圧レベル増幅率を算出しても良い。この場合、音圧レベル増幅率が最小(Gmin)となる基準音の周波数成分の値を記憶し、各フレームのスペクトラムの基準音の周波数成分の値を相互に比較することで、音圧レベル増幅率を算出できる。
【0067】
雑音周波数成分による減算を、音声信号に対して駆動雑音が混入したタイミング以外の区間で行うと、音声信号を劣化させてしまう。つまり、すでに録音された信号に対してSS手法で雑音除去処理をしようとしても、駆動雑音の混入区間がわからないと、適正な雑音除去処理が出来ない。また、雑音混入のタイミングを記録しようとする音声信号に付加しようとすると、特殊な記録フォーマットが必要であったり、記録データ量の増大に繋がる。
【0068】
本実施例では、基準音の音圧レベルを算出したプロセスで、駆動雑音が混入していない区間では明らかに音圧レベルが小さくなる。そして、音圧レベル増幅率を用いて雑音成分レベルを調整する際にその区間の調整量は極く小さいものとなるので、音声信号にほとんど影響は与えない。つまり、雑音混入のタイミングがわからない音声信号に対しても適切な雑音除去処理が可能である。
【0069】
本実施例では、記録された基準音から雑音混入のタイミング、すなわち駆動雑音発生タイミングを検出できる。この駆動雑音発生タイミング検出機能は、その他の雑音除去処理にも有効である。例えば、雑音混入区間前後の音声信号から雑音混入区間の音声信号を予測補間するという、いわゆる予測処理による雑音除去処理手法が知られている。予測処理では、雑音混入区間がわからないと雑音去処理を行うことはできないので、記録された音声信号から事後的に雑音除去処理することは困難である。また、予測処理は高精度な予測補間を行おうとすると演算負荷が大きくなり、動画撮影時に雑音除去処理を行うことが困難になる。しかし、本実施例のように、基準音を同時に記録した音声信号から当該基準音を抽出することで雑音混入区間を検出することにより、適切なタイミングで雑音除去処理が可能である。よって、記録後に、演算負荷の大きな高精度な雑音除去処理を利用できる。また、予測処理以外のフィルタ処理による雑音除去においても、雑音混入区間が検出できれば、雑音混入区間にだけフィルタ処理を行えばよいので、他の区間の音声信号に影響を与えることがなくなる。
【実施例2】
【0070】
レンズ駆動雑音に含まれる特定の周波数に着目し、その特定周波数の音声信号を、駆動雑音の混入タイミング及びALCの音圧レベル増幅率の決定に利用する実施例を説明する。ここでは、被写体の音声信号に動画撮影時に駆動する手振れ防振機構の駆動音が混入した場合における雑音除去処理を説明する。手振れ防振機構は、動画撮影が開始されると同時に手振れ防振駆動を開始され、動画撮影が終了するまで常時駆動されているとする。また、手振れ防振機構はクロック数16kHzでのPWM制御(Pulse Width Modulation)により駆動されているとする。手振れ防振機構は、駆動時に機構が摺動等に伴う音を発生させる以外に、PWM制御の原理上、クロック周波数の帯域をもつ単波長音を発生する。この音は、手振れ状態に関係なく常に一定の音圧レベルを持つ。第2実施例では、PWM制御に伴うクロック周波数の単波長音を基準音として用いて、音圧レベル増幅率の変動を検出する。
【0071】
図11は、本実施例における動画撮影時の録音動作のフローチャートを示す。図11を参照して、本実施例の録音動作を説明する。
【0072】
動画撮影が開始されるとフローがスタートし、ステップS2001で、PWM制御により手振れ防振機構の動作が開始される。手振れ防振動作が開始されると、PWM制御のクロック周波数の単波長音を含む駆動雑音が発生する。
【0073】
ステップS2002で、カメラ制御部119は、録音動作を開始する。すなわち、音声信号処理回路137のALC回路がマイク115の出力音声信号をその音圧レベルに応じて増幅し、増幅後の音声信号がメモリ手段134に記録される。
【0074】
ステップS2003でカメラ制御部119が撮影スイッチのオフを検出するまで、カメラ制御部119は、手振れ防振機構を駆動し続けると共に、ステップS2002に戻り、録音動作を続行する。
【0075】
ステップS2003で撮影スイッチのオフが検出されると、カメラ制御部119は、ステップS2004で録音動作を終了する。そして、ステップS2005で、カメラ制御部119は手振れ防振駆動を終了し、フローを終了する。
【0076】
図13は、手振れ防振機構が駆動している際の信号波形例を示す。図13(a)は音声信号処理回路137により音圧レベル調整されメモリ手段134に記録される音声信号の波形例を示す。横軸は時間を示し、建井軸は音声信号レベルを示す。図13(b)は、音声信号処理回路137のALC回路の音圧レベル増幅率を示す。横軸は時間を示し、縦軸は音圧レベル増幅率を示す。
【0077】
図12を参照して、録音された音声信号に対する雑音除去処理動作を説明する。図12は、第2実施例の雑音除去処理動作を示すフローチャートである。
【0078】
ステップS2101で、カメラ制御部119は、メモリ手段134に記録された音声信号を読み込む。ステップS2102で、カメラ制御部119は、PWM制御のクロック周波数である基準音を抽出するために、読み込んだ音声信号に対しクロック周波数の帯域を通過させる帯域通過フィルタ(バンドパスフィルタ)を適用する。図14(c)は、このバンドパスフィルタの通過帯域207cを示す。
【0079】
ステップS2103で、カメラ制御部119は、バンドパスフィルタで抽出されたクロック周波数音信号の音圧変化からALCの音圧レベル増幅率Gtを算出する。図13(c)は、ステップS2102で抽出された音声信号の波形例を示す。カメラ制御部119は、この音声信号の音圧変化を算出することで、図13(b)に示すALC回路の音圧レベル増幅率Gtを算出出来る。
【0080】
ステップS2104からステップS2107の動作は、第1の実施例のステップS1104からステップS1107と同様のため、説明を省略する。図14はサンプリング周波数44.1kHzの音声信号を次数512点でFFT処理した場合のスペクトルを示す。横軸は周波数を示し、縦軸は音圧レベル(dB)を示す。図14(a)のスペクトル207aは、図13(a)のフレーム区間207における音声信号のフーリエ変換結果を示す。図14(a),(b)のスペクトル207bは、フレーム区間207における駆動雑音のみの音声信号のフーリエ変換結果であり、スペクトル207aに駆動雑音が重畳していることを表している。周波数208において駆動雑音に大きなピークが存在しており、これがPWM制御のクロック周波数音である。
【0081】
ステップS2102において、カメラ制御部119は、駆動雑音のクロック周波数音成分を図14(c)に示すような急峻な透過特性のバンドパスフィルタにより抽出する。なお、メモリ手段134には、音圧レベル増幅率Gminの時の図14(b)のスペクトル207bのような、駆動雑音の各周波数成分が予め格納されている。
【0082】
ステップS2107で、雑音除去処理後の音声が書き込まれると、フローを終了する。
【0083】
本実施例では、手振れ防振駆動のPWM制御に伴うクロック周波数音を基準音として利用し、動画撮影終了後にSS法による雑音除去処理を行う。雑音除去処理時には、クロック周波数音の周波数帯域のみを帯域通過フィルタで抽出し、音圧レベル増幅率の変動を検出し、その結果を用いて雑音成分の減算量を調整して雑音除去処理を行う。駆動雑音内に基準音となるクロック周波数音が重畳しているので、スピーカから基準音を発することなくALCの音圧レベル増幅率を検出することができ、高精度な雑音除去処理を行うことが出来る。
【0084】
本実施例では、手振れ防振駆動のPWM制御に伴うクロック周波数音を基準音として利用した。しかし、その他のレンズ駆動音においても被写体音が含まれない周波数帯域でクロック周波数音のようにある程度の音圧をもった駆動音の周波数帯域であれば、それを、ALCの音圧レベル増幅率を検出するための基準音又はパイロット信号とすることができる。
【0085】
第2の実施例でも、第1の実施例で述べたのと同様に、記録されたクロック周波数音から雑音混入のタイミングを検出することは、その他の雑音除去処理を行う際にも有効である。
【実施例3】
【0086】
図15〜図17を参照して第3実施例を説明する。撮影終了後に録音した音声信号の雑音除去処理を同じ機器上で行ったのでは、録音時間が長い場合に、次の撮影に移行できない。第3実施例では、録音した音声信号を撮像装置とは別体の、雑音除去装置を具備する情報処理装置に転送し、当該情報処理装置上で雑音を除去する。これにより、動画撮影時の操作に制限を設けることなく、演算負荷の高いSS手法による雑音除去処理を行うことが出来る。また、撮像装置内にSS手法による雑音除去処理機能を持たない場合においても、記録音声信号に対し雑音除去処理を行うことが出来る。
【0087】
図15は、第3実施例の概略構成図を示す。デジタル一眼レフカメラ100aと情報処理装置170が通信ケーブル151によって接続する。図16は、図15に示すシステムの機能ブロック図を示す。カメラ100aのカメラボディ101aに外部装置との通信を行う通信コネクタ141を設け、カメラ制御部119aは、通信コネクタ141を介して外部機器と通信する機能を具備し、メモリ手段134を外部機器にマスストレージとしてマウントさせる。通信コネクタ141は、通信ケーブル151で情報処理装置170の外部演算装置通信コネクタ174と電気的に接続する。図15及び図16において第1実施例と同じ機能を有する物には同一の符号を付し、その説明を省略する。
【0088】
情報処理装置170は、制御部171、音声信号処理回路172、メモリ装置173、操作入力部175、音声再生装置176及び画像表示装置177を有する。制御部171は、通信コネクタ174を介してメモリ手段134に記録された音声信号を含む動画記録データを受信する。音声信号処理回路172は、メモリ手段134からの音声信号に雑音除去処理を施して、メモリ装置173に記録する。また、メモリ装置173には、予め複数の撮影レンズごとの駆動雑音成分及びPWM制御のクロック周波数音の情報が記憶されている。これは、一般に、駆動雑音成分及びPWM制御のクロック周波数音が撮影レンズ毎に異なるからである。
【0089】
第3実施例の動作を説明する。カメラ100aにおける録音動作は、第2実施例と同様であるので、説明を省略する。なお、一般的な撮像装置において、撮影した動画データには画像信号及び音声信号の他に、撮影時刻及び撮影に使用された撮影レンズ102の情報等が記録される。
【0090】
図17を参照して、音声信号の雑音除去処理を説明する。図17は、第3実施例における雑音除去動作のフローチャートを示す。図15に示すように、カメラ100aに通信ケーブル151で情報処理装置170を接続する。そして、操作者が情報処理装置170の雑音除去処理アプリケーションによる雑音除去動作を選択すると、図17に示すフローが開始する。
【0091】
ステップS3101では、情報処理装置170が通信ケーブル151を通じカメラ100aとの通信を開始する。ステップ3102で、制御部171は、カメラ100のメモリ手段134に記録された雑音除去処理を行うべき動画データの動画撮影時の撮影レンズ情報を読み込む。ステップS3103で、制御部171は、取得した撮影レンズ情報に対応する駆動雑音成分及びPWM制御のクロック周波数音の情報をメモリ装置173から読み込む。
【0092】
ステップS3104で、制御部171は、メモリ手段134から雑音除去処理の対象となる音声信号を読み込む。ステップS3105で、制御部171は、ステップS3104で読み込んだ音声信号にステップS3103で読み込んだクロック周波数音帯域を通過させるバンドパスフィルタを適用し、基準音となるクロック周波数音の音声信号を抽出する。ステップS3106で、制御部171は、抽出したクロック周波数音の音声信号の音圧変化を検出し、音圧レベル増幅率を算出する。
【0093】
ステップS3107で、制御部171は、ステップS3104で読み込んだ音声信号をFFT処理により周波数領域に変換する。ステップS3108で、制御部171は、ステップS3103で読み込んだ雑音成分をステップS3106で算出した音圧レベル増幅率でレベル調整し、その結果をステップS3107で周波数領域に変換した結果から減算する。これにより、動画撮影時の撮影レンズの駆動雑音に合わせた適切な雑音除去処理が出来る。
【0094】
ステップS3109で、制御部171は、雑音減算結果の音声信号を逆FFT処理により時間領域の音声信号に変換する。ステップS3110で、制御部171は、以上の処理により雑音除去処理された音声信号を、メモリ手段134の雑音除去処理前の音声信号に上書き記録する。これと同時に、カメラ100aから読み出した動画データを雑音除去処理後の音声信号と共にメモリ装置173に記録しても良い。ステップS3110の動作が完了すると、フローを終了する。
【0095】
本実施例では、動画撮影時に基準音としてPWM制御のクロック周波数音を被写体音に重畳して記録しておき、撮影後に情報処理装置に記録音声信号を読み込んで雑音除去する。手振れ防振駆動のPWM制御に伴うクロック周波数音を基準音として用いて音圧レベル増幅率を検出するので、撮影後に撮像装置とは別体の情報処理装置で雑音除去処理が可能である。また、動画データに記録されたレンズ情報を用いてクロック周波数音情報と駆動雑音成分情報を決定するので、動画撮影時の撮影レンズに対応した駆動雑音除去が可能となる。基準音発生手段としてスピーカを持たない撮像装置で撮影した音声信号についても、撮影後に雑音除去処理が可能となる。
【0096】
第1実施例と同様に、記録されたクロック周波数音から雑音混入のタイミングを検出することは、その他の雑音除去処理を行う際にも有効である。
【0097】
通信ケーブル151を介してデジタル一眼レフカメラ100aから情報処理装置170に所望のデータを転送したが、着脱可能な記録媒体を使っても良いことは明らかである。図18は、そのような変更構成の概略構成図を示す。図18に示す構成では、カメラ100のメモリ手段134が、メモリカード134aとしてカメラボディ101から取り外し可能である。取り外したメモリカード134aを情報処理装置170に接続するメモリカードリーダ152に接続する。情報処理装置170は、図17を参照して説明したのと同様の手順で、メモリカード134aに記録される動画データ及びレンズ情報を読み込み、音声信号を雑音除去する。
【0098】
本発明は、その一部又は全部をソフトウエア処理によって実現することができる。例えば、上述した実施例の機能を実現するソフトウエア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給する。そして、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する。

【特許請求の範囲】
【請求項1】
被写体像を結像する撮像光学系と、
前記撮像光学系から導かれる被写体像を撮像する撮像素子と、
前記撮像光学系を調整する際に駆動雑音を発生する撮像光学系駆動手段と、
基準音を発生する基準音発生手段と、
音声信号を取得する音声入力手段と、
前記音声入力手段により取得される音声信号を、前記音声信号の音圧レベルに応じた増幅率で増幅する音声増幅手段と、
前記音声増幅手段で増幅された音声信号を記録媒体に記録する録音手段と、
前記記録媒体に記録された音声信号に重畳する前記基準音に基づいて前記音声増幅手段の前記増幅率を算出する増幅率算出手段と、
前記撮像光学系駆動手段から発生する駆動雑音の周波数領域での雑音成分を記憶する駆動雑音記憶手段と、
前記記録媒体に記録された音声信号を周波数領域に変換する周波数変換手段と、
前記周波数変換手段の変換結果から、前記駆動雑音記憶手段に記憶される前記雑音成分に前記増幅率算出手段で算出される前記増幅率に相当する調整を施した結果を減算する減算手段と、
前記減算手段の減算結果を時間領域に変換する時間領域変換手段
とを有することを特徴とする撮像装置。
【請求項2】
前記増幅率算出手段が、前記記録媒体に記録された音声信号から前記基準音の帯域を通過する帯域通過フィルタを具備し、前記帯域通過フィルタの出力から前記増幅率を算出することを特徴とする請求項1に記載の撮像装置。
【請求項3】
前記基準音の周波数帯域が前記音声入力手段のサンプリング周波数の半分以下であることを特徴とする請求項1に記載の撮像装置。
【請求項4】
前記基準音の周波数帯域が人の可聴帯域外であることを特徴とする請求項1に記載の撮像装置。
【請求項5】
前記基準音の周波数帯域が10kHz以上であることを特徴とする請求項1に記載の撮像装置。
【請求項6】
前記基準音発生手段が基準音を発生するときのみ、前記音声入力手段のサンプリング周波数を前記基準音の周波数帯域の2倍以上に設定することを特徴とする請求項1に記載の撮像装置。
【請求項7】
被写体像を結像する撮像光学系と、
前記撮像光学系から導かれる被写体像を撮像する撮像素子と、
前記撮像光学系を調整する際に駆動雑音を発生する撮像光学系駆動手段と、
基準音を発生する基準音発生手段と、
音声信号を取得する音声入力手段と、
前記音声入力手段により取得される音声信号を記録媒体に記録する録音手段と、
前記記録媒体に記録された音声信号に重畳する前記基準音に基づいて前記撮像光学系駆動手段の駆動雑音発生タイミングを検出する検出手段と、
前記検出手段の検出結果に基づいて、前記記録媒体に記録された音声信号に重畳する前記駆動雑音を低減する駆動雑音除去手段
とを有することを特徴とする撮像装置。
【請求項8】
被写体像を結像する撮像光学系と、
前記撮像光学系から導かれる被写体像を撮像する撮像素子と、
前記撮像光学系をPWM制御により駆動する撮像光学系駆動手段であって、前記PWM制御に伴うクロック周波数音を含む駆動雑音を発生する撮像光学系駆動手段と、
音声信号を取得する音声入力手段と、
前記音声入力手段により取得される音声信号を、前記音声信号の音圧レベルに応じた増幅率で増幅する音声増幅手段と、
前記音声増幅手段で増幅された音声信号を記録媒体に記録する録音手段と、
前記記録媒体に記録された音声信号に重畳する前記クロック周波数音から前記音声増幅手段の前記増幅率を算出する増幅率算出手段と、
前記撮像光学系駆動手段から発生する駆動雑音の周波数領域での雑音成分を記憶する駆動雑音記憶手段と、
前記記録媒体に記録された音声信号を周波数領域に変換する周波数変換手段と、
前記周波数変換手段の変換結果から、前記駆動雑音記憶手段に記憶される前記雑音成分に前記増幅率算出手段で算出される前記増幅率に相当する調整を施した結果を減算する減算手段と、
前記減算手段の減算結果を時間領域に変換する時間領域変換手段
とを有することを特徴とする撮像装置。
【請求項9】
被写体像を結像する撮像光学系と、
前記撮像光学系から導かれる被写体像を撮像する撮像素子と、
前記撮像光学系をPWM制御により駆動する撮像光学系駆動手段であって、前記PWM制御に伴うクロック周波数音を含む駆動雑音を発生する撮像光学系駆動手段と、
音声信号を取得する音声入力手段と、
前記音声入力手段により取得される音声信号を記録媒体に記録する録音手段と、
前記記録媒体に記録された音声信号に重畳する前記クロック周波数音に基づいて前記撮像光学系駆動手段の駆動雑音発生タイミングを検出する検出手段と、
前記検出手段の検出結果に基づいて、前記記録媒体に記録された音声信号に重畳する前記駆動雑音を低減する駆動雑音除去手段
とを有することを特徴とする撮像装置。
【請求項10】
被写体像を結像する撮像光学系と、
前記撮像光学系から導かれる被写体像を撮像する撮像素子と、
前記撮像光学系をPWM制御により駆動する撮像光学系駆動手段であって、前記PWM制御に伴うクロック周波数音を含む駆動雑音を発生する撮像光学系駆動手段と、
音声信号を取得する音声入力手段と、
前記音声入力手段により取得される音声信号を、前記音声信号の音圧レベルに応じた増幅率で増幅する音声増幅手段と、
前記音声増幅手段で増幅された音声信号を記録媒体に記録する録音手段
とを具備する撮像装置により前記記録媒体に記録された前記音声信号の雑音を低減する情報処理装置であって、
前記記録媒体に記録された音声信号に重畳する前記クロック周波数音から前記音声増幅手段の前記増幅率を算出する増幅率算出手段と、
前記撮像光学系駆動手段から発生する駆動雑音の周波数領域での雑音成分を記憶する駆動雑音記憶手段と、
前記記録媒体に記録された音声信号を周波数領域に変換する周波数変換手段と、
前記周波数変換手段の変換結果から、前記駆動雑音記憶手段に記憶される前記雑音成分に前記増幅率算出手段で算出される前記増幅率に相当する調整を施した結果を減算する減算手段と、
前記減算手段の減算結果を時間領域に変換する時間領域変換手段
とを有することを特徴とする情報処理装置。
【請求項11】
被写体像を結像する撮像光学系と、
前記撮像光学系から導かれる被写体像を撮像する撮像素子と、
前記撮像光学系をPWM制御により駆動する撮像光学系駆動手段であって、前記PWM制御に伴うクロック周波数音を含む駆動雑音を発生する撮像光学系駆動手段と、
音声信号を取得する音声入力手段と、
前記音声入力手段により取得される音声信号を記録媒体に記録する録音手段
とを具備する撮像装置により前記記録媒体に記録された前記音声信号の雑音を低減する情報処理装置であって、
前記記録媒体に記録された音声信号に重畳する前記クロック周波数音に基づいて前記撮像光学系駆動手段の駆動雑音発生タイミングを検出する検出手段と、
前記検出手段の検出結果に基づいて、前記記録媒体に記録された音声信号に重畳する前記駆動雑音を低減する駆動雑音除去手段
とを有することを特徴とする情報処理装置。
【請求項12】
被写体像を結像する撮像光学系と、
前記撮像光学系から導かれる被写体像を撮像する撮像素子と、
前記撮像光学系を調整する際に駆動雑音を発生する撮像光学系駆動手段と、
基準音を発生する基準音発生手段と、
音声信号を取得する音声入力手段と、
前記音声入力手段により取得される音声信号を、前記音声信号の音圧レベルに応じた増幅率で増幅する音声増幅手段と、
前記音声増幅手段で増幅された音声信号を記録媒体に記録する録音手段
とを有する撮像装置の制御方法であって、
前記記録媒体に記録された音声信号に重畳する前記基準音に基づいて前記音声増幅手段の前記増幅率を算出する増幅率算出ステップと、
前記撮像光学系駆動手段から発生する駆動雑音の周波数領域での雑音成分を記憶する駆動雑音記憶手段から前記駆動雑音の周波数領域での雑音成分を読み出すステップと、
前記記録媒体に記録された音声信号を周波数領域に変換する周波数変換ステップと、
前記周波数変換ステップの変換結果から、前記駆動雑音記憶手段から読み出された前記雑音成分に前記増幅率算出ステップで算出される前記増幅率に相当する調整を施した結果を減算する減算ステップと、
前記減算ステップの減算結果を時間領域に変換する時間領域変換ステップ
とを有することを特徴とする撮像装置の制御方法。
【請求項13】
被写体像を結像する撮像光学系と、
前記撮像光学系から導かれる被写体像を撮像する撮像素子と、
前記撮像光学系を調整する際に駆動雑音を発生する撮像光学系駆動手段と、
基準音を発生する基準音発生手段と、
音声信号を取得する音声入力手段と、
前記音声入力手段により取得される音声信号を記録媒体に記録する録音手段
とを有する撮像装置の制御方法であって、
前記記録媒体に記録された音声信号に重畳する前記基準音に基づいて前記撮像光学系駆動手段の駆動雑音発生タイミングを検出する検出ステップと、
前記検出ステップの検出結果に基づいて、前記記録媒体に記録された音声信号に重畳する前記駆動雑音を低減する駆動雑音除去ステップ
とを有することを特徴とする撮像装置の制御方法。
【請求項14】
被写体像を結像する撮像光学系と、
前記撮像光学系から導かれる被写体像を撮像する撮像素子と、
前記撮像光学系をPWM制御により駆動する撮像光学系駆動手段であって、前記PWM制御に伴うクロック周波数音を含む駆動雑音を発生する撮像光学系駆動手段と、
音声信号を取得する音声入力手段と、
前記音声入力手段により取得される音声信号を、前記音声信号の音圧レベルに応じた増幅率で増幅する音声増幅手段と、
前記音声増幅手段で増幅された音声信号を記録媒体に記録する録音手段
とを有する撮像装置の制御方法であって、
前記記録媒体に記録された音声信号に重畳する前記クロック周波数音から前記音声増幅手段の前記増幅率を算出する増幅率算出ステップと、
前記撮像光学系駆動手段から発生する駆動雑音の周波数領域での雑音成分を記憶する駆動雑音記憶手段から前記駆動雑音の周波数領域での雑音成分を読み出すステップと、
前記記録媒体に記録された音声信号を周波数領域に変換する周波数変換ステップと、
前記周波数変換ステップの変換結果から、前記駆動雑音記憶手段から読み出した前記雑音成分に前記増幅率算出ステップで算出される前記増幅率に相当する調整を施した結果を減算する減算ステップと、
前記減算ステップの減算結果を時間領域に変換する時間領域変換ステップ
とを有することを特徴とする撮像装置の制御方法。
【請求項15】
被写体像を結像する撮像光学系と、
前記撮像光学系から導かれる被写体像を撮像する撮像素子と、
前記撮像光学系をPWM制御により駆動する撮像光学系駆動手段であって、前記PWM制御に伴うクロック周波数音を含む駆動雑音を発生する撮像光学系駆動手段と、
音声信号を取得する音声入力手段と、
前記音声入力手段により取得される音声信号を記録媒体に記録する録音手段
とを有する撮像装置の制御方法であって、
前記記録媒体に記録された音声信号に重畳する前記クロック周波数音に基づいて前記撮像光学系駆動手段の駆動雑音発生タイミングを検出する検出ステップと、
前記検出ステップの検出結果に基づいて、前記記録媒体に記録された音声信号に重畳する前記駆動雑音を低減する駆動雑音除去ステップ
とを有することを特徴とする撮像装置の制御方法。
【請求項16】
被写体像を結像する撮像光学系と、
前記撮像光学系から導かれる被写体像を撮像する撮像素子と、
前記撮像光学系をPWM制御により駆動する撮像光学系駆動手段であって、前記PWM制御に伴うクロック周波数音を含む駆動雑音を発生する撮像光学系駆動手段と、
音声信号を取得する音声入力手段と、
前記音声入力手段により取得される音声信号を、前記音声信号の音圧レベルに応じた増幅率で増幅する音声増幅手段と、
前記音声増幅手段で増幅された音声信号を記録媒体に記録する録音手段
とを具備する撮像装置により前記記録媒体に記録された前記音声信号の雑音を低減する方法であって、
前記記録媒体に記録された音声信号に重畳する前記クロック周波数音から前記音声増幅手段の前記増幅率を算出する増幅率算出ステップと、
前記撮像光学系駆動手段から発生する駆動雑音の周波数領域での雑音成分を記憶する駆動雑音記憶手段から前記駆動雑音の周波数領域での雑音成分を読み出すステップと、
前記記録媒体に記録された音声信号を周波数領域に変換する周波数変換ステップと、
前記周波数変換ステップの変換結果から、前記駆動雑音記憶手段から読み出した前記雑音成分に前記増幅率算出ステップで算出される前記増幅率に相当する調整を施した結果を減算する減算ステップと、
前記減算ステップの減算結果を時間領域に変換する時間領域変換ステップ
とを有することを特徴とする雑音除去方法。
【請求項17】
被写体像を結像する撮像光学系と、
前記撮像光学系から導かれる被写体像を撮像する撮像素子と、
前記撮像光学系をPWM制御により駆動する撮像光学系駆動手段であって、前記PWM制御に伴うクロック周波数音を含む駆動雑音を発生する撮像光学系駆動手段と、
音声信号を取得する音声入力手段と、
前記音声入力手段により取得される音声信号を記録媒体に記録する録音手段
とを具備する撮像装置により前記記録媒体に記録された前記音声信号の雑音を低減する方法であって、
前記記録媒体に記録された音声信号に重畳する前記クロック周波数音に基づいて前記撮像光学系駆動手段の駆動雑音発生タイミングを検出する検出ステップと、
前記検出ステップの検出結果に基づいて、前記記録媒体に記録された音声信号に重畳する前記駆動雑音を低減する駆動雑音除去ステップ
とを有することを特徴とする雑音除去方法。
【請求項18】
被写体像を結像する撮像光学系と、
前記撮像光学系から導かれる被写体像を撮像する撮像素子と、
前記撮像光学系をPWM制御により駆動する撮像光学系駆動手段であって、前記PWM制御に伴うクロック周波数音を含む駆動雑音を発生する撮像光学系駆動手段と、
音声信号を取得する音声入力手段と、
前記音声入力手段により取得される音声信号を、前記音声信号の音圧レベルに応じた増幅率で増幅する音声増幅手段と、
前記音声増幅手段で増幅された音声信号を記録媒体に記録する録音手段
とを具備する撮像装置により前記記録媒体に記録された前記音声信号の雑音を低減する情報処理装置のプログラムであって、前記情報処理装置に、
前記記録媒体に記録された音声信号に重畳する前記クロック周波数音から前記音声増幅手段の前記増幅率を算出する増幅率算出機能と、
前記撮像光学系駆動手段から発生する駆動雑音の周波数領域での雑音成分を記憶する駆動雑音記憶手段から前記駆動雑音の周波数領域での雑音成分を読み出す機能と、
前記記録媒体に記録された音声信号を周波数領域に変換する周波数変換機能と、
前記周波数変換機能の変換結果から、前記駆動雑音記憶手段から読み出した前記雑音成分に前記増幅率算出機能で算出される前記増幅率に相当する調整を施した結果を減算する減算機能と、
前記減算機能の減算結果を時間領域に変換する時間領域変換機能
とを実現させることを特徴とする雑音除去プログラム。
【請求項19】
被写体像を結像する撮像光学系と、
前記撮像光学系から導かれる被写体像を撮像する撮像素子と、
前記撮像光学系をPWM制御により駆動する撮像光学系駆動手段であって、前記PWM制御に伴うクロック周波数音を含む駆動雑音を発生する撮像光学系駆動手段と、
音声信号を取得する音声入力手段と、
前記音声入力手段により取得される音声信号を記録媒体に記録する録音手段
とを具備する撮像装置により前記記録媒体に記録された前記音声信号の雑音を低減する情報処理装置のプログラムであって、前記情報処理装置に、
前記記録媒体に記録された音声信号に重畳する前記クロック周波数音に基づいて前記撮像光学系駆動手段の駆動雑音発生タイミングを検出する検出機能と、
前記検出機能の検出結果に基づいて、前記記録媒体に記録された音声信号に重畳する前記駆動雑音を低減する駆動雑音除去機能
とを実現させることを特徴とする雑音除去プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate