説明

撮像装置

【課題】 装置自体の姿勢が変化しても、適切な音声情報を取得する。
【解決手段】 被写界を撮像することで画像を取得する撮像部と、複数のマイクロホンを備え、被写界に含まれる発音体が発する音声を複数のマイクロホン毎に取得可能な集音部と、複数のマイクロホン毎に取得された音声を加算することで、発音体が発する音声を処理する音声処理部と、撮像部、集音部及び音声処理部を備えた装置本体と、装置本体の姿勢の変化量を検出する検出部と、検出部により検出される装置本体の姿勢の変化量に基づいて、音声処理部における処理の設定を変更する集音制御部と、を備えたことを特徴とする。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、被写体の発する音声を記録する撮像装置に関する。
【背景技術】
【0002】
マイクロホンにより取得した音声を画像とともに記録する撮像装置が種々提供されている。このような撮像装置の中には、被写界内で発する特定方向の音声を強調処理する、又は抑圧処理することが可能な撮像装置について提案されている(例えば特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2006−222618号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、特許文献1に記載された撮像装置においては、撮影時に装置自体の姿勢が変化した場合について考慮されておらず、単に音声が発する方向を特定方向と定義していることから、装置自体の姿勢が変化した場合には適切な音声情報を取得できない可能性がある。
【0005】
本発明は、装置自体の姿勢が変化しても適切な音声情報を取得することができる撮像装置を提供することを目的とする。
【課題を解決するための手段】
【0006】
上述した課題を解決するために、本発明の撮像装置は、被写界を撮像することで画像を取得する撮像部と、複数のマイクロホンを備え、前記被写界に含まれる発音体が発する音声を前記複数のマイクロホン毎に取得可能な集音部と、前記複数のマイクロホン毎に取得された音声を加算することで、前記発音体が発する音声を処理する音声処理部と、前記撮像部、前記集音部及び前記音声処理部を備えた装置本体と、前記装置本体の姿勢の変化量を検出する検出部と、前記検出部により検出される前記装置本体の姿勢の変化量に基づいて、前記音声処理部における処理の設定を変更する集音制御部と、を備えたことを特徴とする。
【0007】
また、前記撮像部により第1画像を取得する時に、前記集音部により取得された音声に基づいて、前記撮像範囲に含まれる前記発音体の領域を特定する特定部と、前記第1画像の取得から所定時間間隔を空けて取得された第2画像に対して、前記特定部により特定された前記発音体の領域を用いて、前記第2画像における前記発音体の位置を推定する推定部と、を備え、前記集音制御部は、前記推定部により推定される前記発音体の位置に基づいて、前記集音処理部における処理の設定を変更することを特徴とする。
【0008】
また、前記集音制御部は、前記複数のマイクロホンの集音特性を変更することが可能であり、前記特定部は、前記複数のマイクロホンの集音特性を変更することで得られる音声に基づいて、前記撮像範囲に含まれる前記発音体の領域を特定することを特徴とする。
【0009】
また、前記音声処理部は、前記複数のマイクロホンにより取得される音声のそれぞれに対して遅延制御を行う遅延回路と、前記遅延回路により遅延制御が行われた音声を加算する加算回路と、から構成されることを特徴とする。
【0010】
また、前記集音制御部は、前記遅延回路にて実行される前記遅延制御における遅延特性をマイクロホン毎に変更することを特徴とする。
【発明の効果】
【0011】
本発明によれば、装置自体の姿勢が変化しても適切な音声情報を取得することができる。
【図面の簡単な説明】
【0012】
【図1】本発明の撮像装置の電気的構成の一例を示す図である。
【図2】図2(a)は音声の伝播方向とマイクロホンの配置面とが直交する場合を示し、図2(b)は図2(a)の状態から筐体がY方向を中心に角度θ傾いた場合を示す図である。
【図3】音声を取得する処理の流れを示すフローチャートである。
【図4】被写体を追尾する場合の音声を取得する処理の流れを示すフローチャートである。
【発明を実施するための形態】
【0013】
以下、本発明を用いた撮像装置について説明する。図1に示すように、撮像装置10は、撮像光学系15と、撮像素子16と、レンズ駆動回路17と、撮像素子駆動回路18と、A/D変換器19と、画像メモリ20と、画像処理回路21と、圧縮/伸長回路22と、記録用I/F23と、表示制御回路25と、モニタ26と、振れ検出センサ27と、集音部31と、A/D変換器32と、集音処理回路33と、集音制御回路34と、音声メモリ35と、CPU39と、内蔵メモリ40と、レリーズボタン41と、操作部42とから構成される。
【0014】
なお、A/D変換部19、画像メモリ20、画像処理回路21、圧縮/伸長回路22、記録用I/F23、表示制御回路25、振れ検出センサ27、集音処理回路33、音声メモリ35、CPU39及び内蔵メモリ41は、バス43を介して電気的に接続される。
【0015】
この撮像装置10は、記録用I/F23を介して記憶媒体44を装着させることが可能である。この記憶媒体44としては、例えばメモリカード、小型ハードディスク、DVDなどの光ディスクなどが挙げられるが、例えば外付け用のハードディスクなど、撮像装置10の外部に設けられるものであってもよい。
【0016】
撮像光学系15は、複数のレンズから構成され、撮像素子16の撮像面上に被写体像を結像させる。この撮像光学系15は、不図示のフォーカスレンズとズームレンズとを含む。フォーカスレンズはレンズ駆動回路17により光軸(L)方向に進退駆動されることで、撮像光学系15におけるフォーカス調節が行われる。また、ズームレンズもレンズ駆動回路17により光軸(L)方向に進退駆動されることで、撮像光学系15のズーム調節が行われる。このレンズ駆動回路17は、CPU39から出力されるレンズ駆動指令に応じてレンズ駆動信号を発生し、発生したレンズ駆動信号で不図示のレンズ駆動機構を駆動することにより、撮像光学系15の各レンズを移動させる。
【0017】
この撮像光学系15は、さらに振れ検出センサ27の出力に基づいて、複数のレンズのうちの所定のレンズを、不図示の駆動機構を用いて、撮影光学系15の光軸(L)に対して垂直方向に駆動する。これにより、撮像素子16上に結像される被写体の位置をシフトさせる、所謂振れ補正を行うことができる。なお、上記のような複数のレンズのうちの所定のレンズを、撮像光学系15の光軸(L)に対して垂直方向に駆動する構成にかえて、可変頂角プリズムを用いて、撮像素子16上に結像される被写体の位置をシフトさせる構成としてもよい。また、上記のような複数のレンズのうちの所定のレンズを撮像光学系15の光軸(L)に対して垂直方向に駆動する構成にかえて、撮像素子16を撮像光学系15の光軸(L)に垂直な面内で駆動する構成としてもよい。
【0018】
撮像素子16は、静止画像の単写撮像とともに、静止画像の連続撮像、および動画像の撮像が可能である。撮像素子16は、例えばCCD撮像素子あるいはCMOS型撮像素子などによって構成される。撮像素子駆動回路18は、CPU39から出力される指令に応じて所定タイミングの駆動信号を発生し、発生した駆動信号を撮像素子16へ供給する。撮像素子16は、供給された駆動信号によって電荷蓄積(撮像)や蓄積電荷の読み出しが制御される。CPU39は、被写体の測光データを用いて被写界の明るさの情報を求め、この明るさの情報に基づいて撮像素子16の電荷蓄積時間、撮像光学系15における絞り、および撮像素子16より出力される画像信号の増幅度などを決定する。なお、被写界の明るさの情報は、撮像素子16から出力される信号から求める構成であっても、不図示の測光センサより出力される信号から求める構成であってもよい。この撮像素子16から読み出された画像信号は、A/D変換部19にて、アナログの画像信号からデジタルの画像信号に変換された後、画像メモリ20に書き込まれる。
【0019】
画像処理回路21は、CPU39からの指令に応じて入力信号に対して、色補間、ホワイトバランス、ガンマ変換等の画像処理を施す。この画像処理後のデータが画像データとなる。この画像処理回路21は、モニタ26に再生画像を表示させるために必要な解像度変換(画素数変換)処理を画像データに施し、解像度変換処理後の画像データを表示制御回路25へ出力する。なお、電子ズーム処理を行う際にも、画像処理回路21は画像データに対して解像度(画素数)変換処理を施す。
【0020】
圧縮/伸長回路22は、CPU39からの指令に応じて、画像処理回路21から入力される画像データに対して所定の形式で圧縮処理を施す。なお、操作部42で画像データの非圧縮での記録が指示された場合、圧縮/伸長回路22は圧縮処理を行わない。
【0021】
また、この撮像装置10においては、記憶媒体44に記録されている画像データによる再生画像をモニタ26に表示することが可能に構成されている。この場合、圧縮/伸長回路22は、CPU39からの指令に応じて記憶媒体44に記録されている画像データを読み出し、読み出したデータに対して復号化処理を施した上で復号化後のデータを画像処理回路21へ出力する。画像処理回路21は、圧縮/伸長回路22により復号化されたデータに対して解像度変換処理を施し、表示制御回路25へ出力することにより、再生画像がモニタ26に表示される。なお、記憶媒体44に記録されている非圧縮の画像データが読み出された場合には、圧縮処理の逆処理である復号化処理は行われない。なお、圧縮/伸長回路22は、可逆圧縮(いわゆるロスレス符号化)を行うことも可能な構成となっている。
【0022】
表示制御回路25は、CPU39からの指令に応じて、画像処理回路21から入力される画像データに所定の信号処理を施してモニタ26へ出力する。表示制御回路25は、さらに、上記画像データに撮影メニュー、カーソルなどのオーバーレイ画像データを重畳する処理を行う。これにより、オーバーレイ画像が重畳された被写体画像がモニタ26に表示される。なお、モニタ26としては、LCDやELディスプレイ、或いはCRTディスプレイなどが挙げられる。
【0023】
振れ検出センサ27は、例えば角速度センサ、ジャイロセンサ等で構成される。この振れ検出センサ27は、撮像装置10の筐体(装置本体)10aの内部に設けられ、筐体10aの振れや姿勢の変化を検出する。例えばレリーズボタン41の操作に基づいて、撮像装置10の筐体に振れが発生したときに、振れ検出センサ27は撮像装置10の筐体に発生する振れを検知する。そして、振れ検出センサ27は、振れ量データをCPU39に出力する。CPU39は、筐体10aの振れに伴う撮像素子16の撮像面上に結像される被写体像の移動が打ち消されるように、撮像光学系15に内蔵される手振れ補正光学系を、レンズ駆動回路17を介して駆動する。これによって所謂振れ補正が実現される。なお、上記の振れ補正は、スルー画像の撮像動作中、静止画像、動画像の撮像動作中に実行される。以下、撮像装置10の筐体10aの姿勢の変化を、筐体10aの姿勢の変化と称する。
【0024】
集音部31は、複数のマイクロホンから構成される。これら複数のマイクロホンは、撮像装置10の前面に配置される。なお、本実施形態では、3つのマイクロホン31a,31b,31cから集音部31が構成される場合について説明する。なお、これらマイクロホン31a,31b,31cには、例えば単一指向性のマイクロホンがそれぞれ用いられる。集音部31の各マイクロホン31a,31b,31cから出力される音声信号は、ノイズ除去及び増幅された後、A/D変換部32に入力される。A/D変換部32は、マイクロホン31a,31b,31cのそれぞれに対応して設けられる(図中符号32a、32b、32c)。これらA/D変換部32a,32b,32cは、各マイクロホン31a,31b,31cから出力される音声信号をデジタル変換し、集音処理回路33に出力する。
【0025】
集音処理回路33は、遅延回路45a,45b,45c及び加算回路46を備えている。遅延回路45a,45b,45cは、マイクロホン31a,31b,31cのそれぞれに対応して設けられる。これら遅延回路45a,45b,45cは、集音処理回路33に入力される音声信号を遅延処理する。各遅延回路45a,45b,45cから出力される音声信号は、被写体までの距離に応じて増幅された後、加算回路46に出力される。なお、被写体までの距離は、例えば撮影時に、図示を省略した測距センサなどを用いて求めることができる。
【0026】
加算回路46は、入力される音声信号を加算する。これにより、特定方向の音声を強調した音声データが生成される。この音声データは、音声メモリ35に格納される。この音声メモリ35に格納された音声データは圧縮された後、圧縮された画像データとともに音声付き画像ファイルとして記憶媒体44に記録される。
【0027】
集音制御回路34は、振れ検出センサ27により検出された筐体10aの姿勢が変化する方向や強調する音声の方向に基づいて、各遅延回路45a,45b,45cを遅延制御する。
【0028】
レリーズボタン41や操作部42は、その操作時に、操作内容に応じた操作信号をCPU39へ出力する。CPU39は、レリーズボタン41の押下操作に基づくレリーズ操作信号が入力されると、撮像素子16から読み出される画像信号の中で、撮像画面内に予め設定されているフォーカス検出領域に対応する信号を用いて公知のコントラスト方式のAF(オートフォーカス)動作を行う。
【0029】
具体的には、画像処理回路21によって画像処理された画像データのうち、フォーカス検出領域に対応するデータについての高周波数成分の積算値(いわゆる焦点評価値)を最大にするように、レンズ駆動指令(フォーカス調節信号)をレンズ駆動回路17へ送る。焦点評価値を最大にするフォーカスレンズの位置は、撮像素子16によって撮像される被写体像のエッジのぼけをなくし、画像のコントラストを最大にする(尖鋭度を高める)合焦位置である。なお、上記コントラスト方式のAF動作に加えて、公知の瞳分割方式による位相差AF動作を行うように構成してもよい。
【0030】
操作部42はズーム操作部を備えている。CPU39は、ズーム操作に基づくズーム操作信号が操作部42から入力されると、上述したレンズ駆動指令を発生し、レンズ駆動回路にズームレンズを進退駆動させる。これにより、撮像素子16の撮像面上に結像される被写体像が拡大もしくは縮小し、光学的にズーム調節される。
【0031】
CPU39はさらに、ズーム操作に基づくズーム操作信号が操作部42から入力されると画像処理回路21へ指令を出力し、画像データに対する解像度変換処理の変換比率を操作信号に応じて変化させる。これにより、モニタ26に表示される画像が拡大もしくは縮小し、電気的にズーム調節される(電子ズーム)。解像度変換比率は電子ズーム倍率に対応している。画像処理回路21が電子ズーム倍率を高める方向に解像度変換比率を変える場合、再生画像の一部が拡大されてモニタ26に表示される(拡大率が上がる反面、再生画像の表示範囲は狭くなる)。反対に、画像処理回路21が電子ズーム倍率を低くする方向に解像度変換比率を変える場合、モニタ26に表示される再生画像の拡大率が下がる反面、再生画像の表示範囲は広くなる。
【0032】
内蔵メモリ41は、CPU39によって実行される制御プログラムや該制御プログラムを実行したときに使用されるデータなどが記憶される。
【0033】
次に、筐体10aの姿勢が変化したときに取得される音声の遅延量について、図2を用いて説明する。以下では、被写体が撮像光学系15の光軸(L)上に位置するものとし、また、各マイクロホン31a,31b,31cはx方向に一定間隔を空けて配置されているものとして説明する。
【0034】
以下、被写体までの距離が遠く、被写体が発する音声が撮像装置10に設けられたマイクロホン31a,31b,31cに平行に入射する場合について説明する。図2(a)に示すように、例えば集音部31を構成するマイクロホン31a,31b,31cのそれぞれに到達する音波の伝播方向がマイクロホン31a,31b,31cの配置面P(図中二点鎖線)と直交する場合、ある瞬間に被写体の発する音声による音波は各マイクロホン31a,31b,31cに同時に到達する。
【0035】
図2(b)は、マイクロホン31a,31b,31cの配置面Pが図2中P’に示す位置まで、つまり撮像装置10の筐体10aがy方向を中心にして図中時計方向に角度θ傾いた場合を示している。この場合、各マイクロホン31a,31b,31cに到達する音声はマイクロホン31a,31b,31cの配置面Pと直交する方向に対して角度θ傾く。つまり、各マイクロホン31a,31b,31cに入射する音声は、各マイクロホン31a,31b,31cに到達するまでの距離(以下、伝播距離)に差が生じる。この伝播距離の差により、ある時刻において各マイクロホン31a,31b,31cにて取得される音声信号は、それぞれ異なる時刻に、被写体から発せられた音声によるものとなり、その出力レベルが異なる。
【0036】
例えば中央に位置するマイクロホン31bに到達する音声の伝播距離と図2中左方に位置するマイクロホン31aに到達する音声の伝播距離との差をAとし、これらマイクロホン31a,31bの間隔をDとすると、これらマイクロホン31a,31bに到達する音声の伝播距離の差Aは、A=D×sinθとなる。マイクロホン31a,31bに音声が到達する時間の差(遅延時間)ΔTは、ΔT=A/V=(D×sinθ)/V(V:音速)となる。なお、音声は、中央のマイクロホン31bよりも先に左側のマイクロホン31aに到達する。つまり、中央のマイクロホン31bを基準にして考えた場合、左方のマイクロホン31aにおける遅延時間は−ΔTとなる。
【0037】
また、中央のマイクロホン31bと右方のマイクロホン31cについて考えると、これらマイクロホン31b,31cの位置関係は、左方のマイクロホン31aと中央のマイクロホン31bとの位置関係と同一である。また、音声は、中央のマイクロホン31bに到達した後に、右方のマイクロホン31cに到達する。つまり、中央のマイクロホン31bを基準にした場合、右方のマイクロホン31cにおける遅延時間はΔTとなる。
【0038】
このように、遅延時間を算出し、算出された遅延時間に基づいて各マイクロホン31a,31b,31cにて得られる音声信号を遅延回路45a,45b,45cにて遅延処理することで、遅延回路45a,45b,45cの各出力で、同一時刻に被写体より発生された音声の信号を同時に得ることができ、各マイクロホン31a,31b,31cにて得られる音声信号の出力レベルが、同一の出力レベルになる。なお、角度θは、振れ検出センサ27の検出信号から取得することができる。
【0039】
なお、図2においては、中央のマイクロホン31bを基準にしているが、これに限定する必要はなく、左方のマイクロホン31a、又は右方のマイクロホン31cを基準にしてもよい。
【0040】
次に、音声を取得するときの処理の流れを、図3のフローチャートに基づいて説明する。このフローチャートでは、便宜上、撮像装置10の撮像光学系15の光軸(L)上に音声を発する被写体が位置している場合について説明する。
【0041】
ステップS101は、音声を取得する処理である。このステップS101を行うことで、被写体の発する音声が集音部31を構成する各マイクロホン31a,31b,31cによって取得され、マイクロホン31a,31b,31cから音声信号がそれぞれ出力される。
【0042】
ステップS102は、筐体の姿勢の変化があるか否かを判定する処理である。筐体10aの姿勢の変化は振れ検出センサ27によって検出され、その検出信号がCPU39に入力される。CPU39は、この振れ検出センサ27からの検出信号に基づいて筐体10aの姿勢の変化があったか否かを判定する。振れ検出センサ27からの検出信号がCPU39に入力される場合、又は、振れ検出センサ27からの検出信号が筐体10aの姿勢の変化があった旨を示す信号の場合、CPU39は、このステップS102の判定処理をYesとする。この場合、ステップS103に進む。一方、振れ検出センサ27からの検出信号がCPU39に入力されない場合、又は、振れ検出センサ27からの検出信号が、筐体10aの姿勢の変化がない旨を示す信号の場合、CPU39は、このステップS102の判定処理をNoとする。この場合、ステップS107に進む。
【0043】
ステップS103は、筐体の姿勢の変化量を算出する処理である。CPU39は、振れ検出センサ27からの検出信号を用いて、筐体10aの姿勢の変化量を示す角度θを算出する。CPU39は、算出した角度θを集音制御回路34に出力する。
【0044】
ステップS104は、マイクロホン毎の遅延時間を算出する処理である。例えば中央のマイクロホン31bを基準にした場合、集音制御回路34は、CPU39から入力される角度θを用いて、マイクロホン31a及びマイクロホン31cに到達する音声の遅延時間を算出する。
【0045】
ステップS105は、遅延時間に基づいた音声信号の遅延処理である。ステップS104にて、マイクロホン31a及びマイクロホン31cにより取得される音声の遅延時間が算出されているので、この遅延時間に基づいて、遅延回路45a,45b,45cを制御する。これにより、マイクロホン31a,31cにより取得された音声信号が遅延処理され、各マイクロホン31a,31b,31cにより取得される音声信号の出力レベルが同一となる。なお、マイクロホン31bを基準としていることから、マイクロホン31bにより取得される音声信号に対しては、遅延処理は実行されない。
【0046】
ステップS106は、遅延処理された音声信号を加算する処理である。ステップS107にて遅延処理された音声信号は、加算回路46に入力される。加算回路46は、これら音声信号を加算処理する。これにより、強調処理された音声データが生成される。なお、この加算回路46によって強調処理された音声データは、音声メモリ35に格納される。
【0047】
一方、ステップS102において、CPU39により筐体10aの姿勢の変化がないと判定された場合は、ステップS107に進む。
【0048】
ステップS107は、音声信号の加算処理である。このステップS107は、撮像装置10の筐体10aの姿勢に変化がないときに実行される。この場合、各マイクロホン31a,31b,31cに到達する音声の伝播方向は、各マイクロホン31a,31b,31cの配置面Pに直交していることから、音声は遅延せずに各マイクロホン31a,31b,31cに到達する。この場合には、各マイクロホン31a,31b,31cにて取得される音声信号は、そのまま加算処理される。これにより、強調処理された音声データが生成される。なお、このステップS107の処理が終了すると、リターンとなり、ステップS101の処理が引き続き実行される。
【0049】
このように、筐体10aの姿勢の変化が振れ検出センサ27により検出された場合には、姿勢の変化量である角度θが算出され、取得された音声信号に対する遅延時間が設定される。これにより、筐体10aの姿勢が変化した場合でも、音声信号を適切に取得することが可能となる。
【0050】
本実施形態では、姿勢10aの姿勢の変化に基づいて、取得される音声信号を遅延制御する基本的な例を説明している。近年の撮像装置10においては、撮像範囲内で移動する被写体を追尾する機能を有している撮像装置が提供されている。このような被写体を追尾している際に、筐体の姿勢が変化する場合の処理について、図4のフローチャートに基づいて説明する。以下、撮像装置の構成は、図1に示す撮像装置10の構成と同一の構成であることから、同一の符号を付して説明する。
【0051】
ステップS201は、レリーズボタンの半押し操作があるか否かを判定する処理である。撮影者によりレリーズボタン41が半押し操作されると、該半押し操作に基づく操作信号(以下、半押し操作信号)がCPU39に入力される。このステップS201において、CPU39は、半押し操作信号が入力されたか否かを判定する。半押し操作信号が入力された場合、CPU39は、ステップS201の判定処理をYesとし、ステップS202に進む。一方、半押し操作信号が入力されない場合には、CPU39は、ステップS201の判定処理をNoとし、半押し操作信号が入力されたと判定される(ステップS201の判定処理がYesとなる)まで、このステップS201の判定処理を繰り返す。
【0052】
ステップS202は、スルー画像を撮像する処理である。ステップS201により、半押し操作信号が入力されたと判定されていることから、CPU39は上述したAF動作を伴ったスルー画像の撮像処理を実行する。なお、スルー画像の撮像処理については、周知であることから、ここでは、説明を省略する。
【0053】
ステップS203は、音声を取得する処理である。集音部31の各マイクロホン31a,31b,31cにより被写界内に存在する音声が取得される。
【0054】
ステップS204は、音声を発する領域(被写体の存在領域)を特定する処理である。このステップS204では、集音制御回路34により集音部31の集音特性を変更させながら、被写界内で発する音声を取得する。なお、集音部31の集音特性とは、例えば集音部31を構成するマイクロホン全体の指向性(集音部31による集音方向)が挙げられる。遅延回路45a,45b,45cの遅延量の設定を変更することで、集音部31の集音指向性を変更することができる。先に説明した図2(b)の例では、遅延回路45cの遅延量を基準とした場合、遅延回路45bの遅延量を+ΔT、遅延回路45aの遅延量を+(2×ΔT)に設定することで、レンズ光軸Lより紙面上で左に角度θ傾いた方向に集音指向性を持たせることができる。
【0055】
一方、遅延回路45aの遅延量を基準として,遅延回路45bの遅延量を+ΔT、遅延回路45cの遅延量を+(2×ΔT)に設定することで、レンズ光軸Lより紙面上で右に角度θだけ傾いた方向に集音指向性を持たせることができる。上記において、ΔTの値を大きくすることで、角度θの値を大きくすることができる。
【0056】
CPU39は、遅延回路の遅延量の設定を順次変更して、被写界内の集音方向を変更しつつ,スルー画像の撮像を行い、CPU39は、取得される音声信号の出力レベルにより、音声が発する方向と集音部31による集音領域とから、撮影画面上で音声を発する領域を特定する。なお、音声を発する領域とは、音声を発する被写体が存在する領域である。以下、音声を発する領域にいては、被写体の存在領域と称する。この被写体の存在領域が特定されることで、スルー画像中の該領域の位置を示す情報が取得される。例えば撮像画面中(被写界中)で、一番大きな音声を発する被写体を特定するためには、CPU39は、遅延回路45a,45b,45cの遅延量を所定時間固定して、加算回路46の出力を用いて所定方向から到来する単位時間当たりの平均音量を求める。CPU39は、遅延回路45a,45b,45cの設定を変更し、撮像画面内の各領域の単位時間あたりの平均音量を求め、最も大きな音量の検出された領域を特定する。画像処理回路21は、当該領域に対応する被写体の存在領域を示すテンプレート画像を、スルー画像を用いて生成する。なお、予め被写体が発する音声の特徴量を取得している場合には、この音声の特徴量と略一致する音声を発する領域を被写体の存在領域として求めればよい。
【0057】
ステップS205は、所定時間経過したか否かを判定する処理である。CPU39は、ステップS202の処理を実行してからの経過時間を計時している。CPU39は、例えばスルー画像の取得時のフレームレートに基づいた時間が経過したときに、このステップS205の判定処理をYesとし、ステップS206に進む。スルー画像の取得時のフレームレートに基づいた時間が経過していないときには、CPU39は、ステップS205の処理をNoとする。この場合、スルー画像の取得時のフレームレートに基づいた時間が経過するまで、ステップS205の判定処理が繰り返し実行される。
【0058】
ステップS206は、スルー画像を撮像する処理である。このステップS206の処理は、ステップS202が実行されてから、スルー画像の取得時のフレームレートに基づいた時間経過したときに実行される。なお、このステップS206の処理は、ステップS202と同一である。
【0059】
ステップS207は、ステップS206の時点で撮像されたスルー画像上の被写体の存在領域を推定する処理である。ステップS204により、テンプレート画像が生成されているので、画像処理回路21は、ステップS206にて得られたスルー画像と、テンプレート画像とを用いたテンプレートマッチングの手法により、ステップS206で取得されたスルー画像上での被写体の存在領域を推定する。なお、ステップS204にて、スルー画像中における被写体の存在領域の位置を示す情報が取得されているので、被写体の存在領域の位置を示す情報を用いて、該領域の周辺部に対してのみテンプレートマッチングを行えばよい。これにより、被写体の存在領域が推定され、推定された被写体の存在領域の位置を示す情報が取得される。このような処理により、特定の音声を発する被写体を、各フレームおいて先に説明したような音声到来方向の分析を行うことなく、特定することができる。
【0060】
ステップS208は、筐体の姿勢の変化があるか否かを判定する処理である。このステップS208の処理は、ステップS102と同一の処理である。振れ検出センサ27からの検出信号がCPU39に入力される場合、又は、振れ検出センサ27からの検出信号が筐体10aの姿勢の変化があった旨を示す信号の場合、CPU39は、このステップS208の判定処理をYesとする。この場合、ステップS209に進む。一方、振れ検出センサ27からの検出信号がCPU39に入力されない場合、又は、振れ検出センサ27からの検出信号が、筐体10aの姿勢の変化がない旨を示す信号の場合、CPU39は、このステップS208の判定処理をNoとする。この場合、ステップS211に進む。
ステップS209は、筐体の姿勢の変化量を算出する処理である。このステップS209の処理は、ステップS103と同一である。CPU39は、算出された筐体10aの姿勢の変化量を示す情報を集音制御回路34に出力する。
【0061】
ステップS210は、被写体の存在領域の位置及び姿勢の変化量に基づいてマイクロホン毎の遅延時間を算出する処理である。CPU39は、ステップSS207の処理を実行することで、被写体の存在領域の位置が推定されているので、CPU39は、被写体の存在領域の位置、画像のサイズ、焦点距離及び被写体までの距離を示す情報を集音制御回路34に出力する。集音制御回路34は、ステップS209にて算出された筐体10aの姿勢の変化量と、このステップS210にて入力された被写体の存在領域の位置、画像のサイズ、焦点距離及び被写体までの距離を示す情報を用いて、各マイクロホン31a,31b,31cの遅延時間を算出する。
【0062】
ステップS211は、被写体の存在領域の位置に基づいてマイクロホン毎の遅延時間を算出する処理である。ステップS210と同様に、CPU39は、被写体の存在領域の位置、画像のサイズ、焦点距離及び被写体までの距離を示す情報を集音制御回路34に出力する。この場合には、筐体10aの姿勢は変化していないことから、集音制御回路34は、被写体の存在領域の位置、画像のサイズ、焦点距離及び被写体までの距離を示す情報を用いて、各マイクロホン31a,31b,31cの遅延時間を算出する。
【0063】
ステップS212は、レリーズボタンの全押し操作があるか否かを判定する処理である。撮影者によりレリーズボタン41が全押し操作されると、該全押し操作に基づく操作信号(以下、全押し操作信号)がCPU39に入力される。このステップS212において、CPU39は、全押し操作信号が入力されたか否かを判定する。全押し操作信号が入力された場合、CPU39は、ステップS212の判定処理をYesとし、ステップS213に進む。全押し操作信号が入力されない場合には、CPU39は、ステップS212の判定処理をNoとし、ステップS205に戻る。つまり、この場合には、レリーズボタン41の全押し操作が行われるまで、ステップS205〜ステップS211の処理が繰り返し実行される。
【0064】
ステップS213は、静止画像を撮像する処理である。CPU39は、レリーズボタン41からの全押し操作信号を検出すると、撮像素子駆動回路18へ指示を送り、静止画像の撮像動作を実行するための駆動信号を出力させる。撮像素子16は、静止画像の撮像動作のための駆動信号を受けて、露出演算結果に基づく電荷蓄積を行って蓄積電荷を出力する。静止画像の撮像動作時の露出条件は、直近で得られたスルー画像の信号値に基づく被写界の明るさ情報に基づいて決定される。画像処理回路21は入力された信号に上述した信号処理を施し、スルー画撮影時に比べて高解像度(高画素数)の画像データを生成する。そして、この画像データは圧縮/伸長回路22により、所定の圧縮形式で圧縮処理される。
画像処理回路21により解像度変換処理を施した画像データは表示制御回路25へ出力される。これにより、静止画像がモニタ26に表示される。
【0065】
ステップS214は、音声を取得する処理である。このステップS212の処理は、ステップS203と同一の処理である。
【0066】
ステップS215は、遅延時間に基づいた音声の遅延処理である。ステップS210の処理、又はステップS211の処理を実行することで、各マイクロホン31a,31b、31cにて取得される音声信号の遅延時間が算出される。集音制御回路34は、この遅延時間を用いて、各遅延回路45a,45b,45cを介して、各マイクロホン31a,31b、31cにて取得される音声信号を遅延処理する。
【0067】
ステップS216は、遅延処理された音声の加算処理である。ステップS215にて遅延処置された音声信号は、被写体までの距離に応じて増幅された後、加算回路46に出力される。加算回路46は、これら音声信号を加算処理する。これにより、強調処理された音声データが生成される。なお、この音声データは図示を省略した音声用の圧縮/伸長回路により圧縮され、音声メモリ35に格納される。
【0068】
ステップS217は、静止画像及び音声を記録する処理である。CPU39は、ステップS213にて得られた静止画像データと、ステップS216にて加算処理された音声データとを互いに関連付けて記憶媒体44に記憶する。
【0069】
このように、被写体を追尾する場合であっても、姿勢10aの姿勢の変化に基づいて、集音部31の各マイクロホン31a,31b,31cにて得られる音声信号に対して遅延処理を行うことができる。これにより、姿勢10aの姿勢の変化があっても、適切な音声信号を取得することができる。
【0070】
上述した実施形態では、静止画像を取得する際のスルー画像に含まれる被写体を追尾する場合について説明しているが、これに限定される必要はなく、動画像の撮影時も、本発明を実施することが可能である。
【0071】
上述した実施形態においては、被写体が撮像光学系15の光軸(L)上に位置している場合に、撮像装置10の筐体10aの姿勢がy方向を中心にして角度θ傾いた場合について説明しているが、これに限定されるものではなく、撮像装置10の筐体10aの姿勢がx方向を中心にして変化した場合や、これら組み合わせた方向を中心にして姿勢が変化する場合にも適用できる。この場合、x方向及びy方向にマトリクス状に、集音部31を構成するマイクロホンを複数配置してもよいし、3つのマイクロホンのそれぞれを、例えば撮像装置10の前面の4隅のうちの3箇所に配置してもよい。このような場合、x方向、y方向を中心として回転した場合の角度θx,角度θyをそれぞれ求め、求めた角度に基づいて各マイクロホンの遅延時間を算出すればよい。
【0072】
本実施形態では、振れ検出センサ27にて筐体10aの姿勢の変化量を算出し、算出された姿勢の変化量に基づいて取得される音声信号を遅延処理しているが、これに限定されるものではない。例えば撮像装置を所定の方向に回転させることが可能な回転装置に設置し、該回転装置によって撮像装置を回転させる場合には、該回転装置から撮像装置の回転角度を取得し、取得した回転角度に応じた遅延制御をすることが可能となる。
【符号の説明】
【0073】
10…撮像装置、15…撮像光学系、16…撮像素子、20…画像メモリ、21…画像処理回路、27…振れ検出センサ、31…集音部、31a,31b,31c…マイクロホン、32…A/D変換部、33…集音処理回路、34…集音制御回路、35…音声メモリ、39…CPU、45a,45b,45c…遅延回路、46…加算回路

【特許請求の範囲】
【請求項1】
被写界を撮像することで画像を取得する撮像部と、
複数のマイクロホンを備え、前記被写界に含まれる発音体が発する音声を前記複数のマイクロホン毎に取得可能な集音部と、
前記複数のマイクロホン毎に取得された音声を加算することで、前記発音体が発する音声を処理する集音処理部と、
前記撮像部、前記集音部及び前記集音処理部を備えた装置本体と、
前記装置本体の姿勢の変化量を検出する検出部と、
前記検出部により検出される前記装置本体の姿勢の変化量に基づいて、前記集音処理部における処理の設定を変更する集音制御部と、
を備えたことを特徴とする撮像装置。
【請求項2】
請求項1に記載の撮像装置において、
前記撮像部により第1画像を取得する時に、前記集音部により取得された音声に基づいて、前記撮像範囲に含まれる前記発音体の領域を特定する特定部と、
前記第1画像の取得から所定時間間隔を空けて取得された第2画像に対して、前記特定部により特定された前記発音体の領域を用いて、前記第2画像における前記発音体の位置を推定する推定部と、を備え、
前記集音制御部は、前記推定部により推定される前記発音体の位置に基づいて、前記集音処理部における処理の設定を変更することを特徴とする撮像装置。
【請求項3】
請求項2に記載の撮像装置において、
前記集音制御部は、前記複数のマイクロホンの集音特性を変更することが可能であり、
前記特定部は、前記複数のマイクロホンの集音特性を変更することで得られる音声に基づいて、前記撮影範囲に含まれる前記発音体の領域を特定することを特徴とする撮像装置。
【請求項4】
請求項1から請求項3のいずれか1項に記載の撮像装置において、
前記集音処理部は、
前記複数のマイクロホンにより取得される音声のそれぞれに対して遅延制御を行う遅延回路と、
前記遅延回路により遅延制御が行われた音声を加算する加算回路と、
から構成されることを特徴とする撮像装置。
【請求項5】
請求項4に記載の撮像装置において、
前記集音制御部は、前記遅延回路にて実行される前記遅延制御における遅延特性をマイクロホン毎に変更することを特徴とする撮像装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate


【公開番号】特開2012−23475(P2012−23475A)
【公開日】平成24年2月2日(2012.2.2)
【国際特許分類】
【出願番号】特願2010−158485(P2010−158485)
【出願日】平成22年7月13日(2010.7.13)
【出願人】(000004112)株式会社ニコン (12,601)
【Fターム(参考)】