説明

撮像装置

【課題】動画の観賞者が意識を集中すると考えられるタイミングにおいて、記録される音声信号に機械的な動作音等が混入することがない撮像装置を提供する。
【解決手段】動画撮影時において、マイク107を介してフィルタ回路109に入力された音声信号の解析が行われる。この解析の結果、所定時間の間、人の音声が検出されない場合に、NDフィルタ103の動作が許可される。人の音声が検出されている間は、NDフィルタ103の動作が禁止される。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声の記録機能を有する撮像装置に関する。
【背景技術】
【0002】
デジタルスチルカメラ(以下、単にカメラと言う)と一般に呼ばれている撮像装置は、静止画撮影機能を主機能としている。しかしながら、近年のカメラにおいては動画の撮影機能も搭載されるようになってきている。このような静止画と動画の両方が撮影可能なカメラにおいては、高品質、且つ、速写性が要求される静止画撮影に適した撮影機構を使用しながら、音声の記録を伴う動画を、高品位に撮影できるようにすることが要求されている。
【0003】
ここで、静止画撮影を主機能とするカメラにおいては、きれいなボケ味が表現できることが高品質な画像を撮影できる要件の一つとされている。そのため、このようなカメラでは、絞りに円形に近い開口を持つ多段式の羽絞りを用いたり、挿抜式の円形開口ND(Neutral Density)フィルタを用いたりして露光量を制御する方式が採用されている。また、レリーズタイムラグや連写性を重視するため、羽絞りやNDフィルタは高速な動作が可能なように設計されている。ところで、挿抜動作を伴うNDフィルタはその動作音が大きく、音声記録を伴う動画の撮影時にその音が不意に記録されてしまうと、その動画の再生時に耳障りとなる。
【0004】
従来、カメラの内部での動作音がノイズとして記録されてしまうことを防止するための技術として、例えば特許文献1や特許文献2の技術が知られている。特許文献1では、音声情報が記録されるモードが選択されているときは動作音(バッテリ残量の警告音や合焦音、シャッター音)の発生を禁止するようにしている。一方、露光時間が基準値より長い場合には、音声情報が記録されるモードであっても動作音の発生を許容するようにしている。また、特許文献2では、動作音の発生タイミングで音声信号のゲインを低下させたり、音声信号のサンプリングを一時的に粗くして動作音の振幅が0となる点でのみサンプリングした上で音を補間して連続した音声信号を作り出したりしている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開平10−4530号公報
【特許文献2】特開平8−9317号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
ここで、特許文献1では条件付きでの、特許文献2では動画の観賞者の予期しないタイミングでの動作音の発生を許容しており、再生時において動画の観賞者が意識を集中すると考えられるタイミングで、音声信号に雑音が混入されて記録が行われる可能性がある。また、特許文献2においては、音声信号においた動作音を抑圧するための処理を行っているが、このような処理を行ったとしても音声信号の品質は一時的に低下してしまう。
【0007】
本発明は、上記の事情に鑑みてなされたもので、動画の観賞者が意識を集中すると考えられるタイミングにおいて、記録される音声信号に機械的な動作音等が混入することがない撮像装置を提供することを目的とする。
【課題を解決するための手段】
【0008】
上記の目的を達成するために、本発明の一態様の撮像装置は、被写体から入射した光を画像信号に変換する画像取得部と、前記画像取得部に入射する光を機械的な動作により制御する光学素子と、音声を音声信号に変換する音声取得部と、前記被写体における人の音声を検出する人物音声検出部と、前記人物音声検出部により人の音声が検出されている間は、前記光学素子の動作を禁止した状態で前記画像取得部により得られた画像信号と前記音声取得部により得られた音声信号とを記録媒体に記録し、前記人物音声検出部により人の音声が検出されていない間は、前記光学素子の動作を許可した状態で前記画像取得部により得られた画像信号と前記音声取得部により得られた音声信号とを記録媒体に記録するように制御する制御部と、を具備することを特徴とする。
【発明の効果】
【0009】
本発明によれば、動画の観賞者が意識を集中すると考えられるタイミングにおいて、記録される音声信号に機械的な動作音等が混入することがない。
【図面の簡単な説明】
【0010】
【図1】本発明の一実施形態に係る撮像装置の一例としてのデジタルスチルカメラの構成を示すブロック図。
【図2】AGCアンプの動作について説明するための図。
【図3】フィルタ回路の動作について説明するための図。
【図4】フィルタ回路の内部構成について示す図。
【図5】本発明の一実施形態に係るカメラの音声記録動作について示す図。
【図6】声検出閾値の設定手法の例を示す図。
【図7】本発明の一実施形態のレンズ交換式カメラへの適用例を示す図。
【発明を実施するための形態】
【0011】
以下、図面を参照して本発明の実施形態を説明する。
図1は、本発明の一実施形態に係る撮像装置の一例としてのデジタルスチルカメラ(以下、カメラと言う)の構成を示すブロック図である。図1に示すカメラは、カメラ本体100を有している。このカメラ本体100内には、光学系と、撮像素子104と、画像処理部105と、表示部106と、マイクロホン(マイク)107と、ゲイン制御(AGC)アンプ108と、フィルタ回路109と、アンプ110と、記録部111と、制御部112と、が設けられている。
【0012】
光学系は、レンズ101と、絞り102と、NDフィルタ103と、を有している。レンズ101は、被写体からの光(被写体光)を撮像素子104に入射させる。図1に示すレンズ101は、フォーカスレンズを含む複数のレンズを有している。フォーカスレンズをレンズ101の光軸方向(図示破線方向)に沿って駆動することで、レンズ101の焦点位置を調整可能である。この他、レンズ101にズームレンズが含まれていても良い。絞り102は、制御部112の制御に従って開閉自在に構成されている。絞り102の開口量により、撮像素子104に入射される光の量を調整可能である。NDフィルタ103は、挿抜可能に構成された色に影響を与えずに光量を落とすフィルタである。NDフィルタ103を被写体光の光路上に進入させることにより、撮像素子104に入射される光の量が減じられる。このNDフィルタ103によっても撮像素子104に入射される光の量を調整可能である。
【0013】
画像取得部として機能する撮像素子104は、光学系を介して入射した被写体光を、その光量に応じた電気信号(画像信号)に変換する。また、撮像素子104は、A/D変換回路を有している。このA/D変換回路により、撮像素子104は、画像信号をデジタル信号に変換して画像処理部105に出力する。画像処理部105は、撮像素子104から入力された画像信号に対してホワイトバランス補正や階調補正、色補正等の種々の画像処理を施す。また、画像処理部105は、画像信号から輝度情報を抽出する処理、画像信号からコントラスト情報を抽出する処理も行う。輝度情報は、例えば制御部112による露出制御の際に用いられる。コントラスト情報は、例えば制御部112によるフォーカス制御の際に用いられる。さらに、画像処理部105は、画像信号を解析して、画像信号中の人物の顔部に相当する画像信号を検出する処理も行う。顔検出情報は、例えば後述するフィルタ回路109の声検出閾値設定の際に用いられる。表示部106は、例えば液晶ディスプレイであり、画像処理部105によって画像処理された画像信号に基づく画像を表示する。
【0014】
マイク107は、入力された音声を、電気信号(音声信号)に変換する。また、マイク107は、A/D変換回路を有している。このA/D変換回路により、マイク107は、音声信号をデジタル信号に変換してAGCアンプ108に出力する。利得制御部としての機能を有するAGCアンプ108は、マイク107で得られた音声信号の平均レベルに応じたゲインで、マイク107から入力された音声信号が略一定レベルとなるように、入力された音声信号の増幅を行う。図2は、ゲイン設定の例を示す図である。図2に示すように、AGCアンプ108は、入力された音声信号の平均レベルが低レベルの場合に、ゲインを高くして増幅を行い、入力された音声信号の平均レベルが高レベルの場合に、ゲインを低くして増幅を行う。このようなマイク107とAGCアンプ108とが音声取得部として機能する。
【0015】
制御部112とともに人物音声検出部として機能するフィルタ回路109は、AGCアンプ108から出力された音声信号に、人の音声が含まれているかを検出するための回路である。図3に示すように、被写体が人で、且つ、音声を発しているときには、AGCアンプ108からフィルタ回路109へは、環境音(背景音)に対応した略一定レベルで広帯域の音声信号に、人の音声に対応した音声信号が重畳された音声信号が入力される。ここで、人の音声は、ある周波数帯域B(通常は100〜300Hz程度)を有しており、フィルタ回路109はこのような周波数帯域Bの音声信号を検出する。図4にフィルタ回路109の構成を示す。図4に示すように、フィルタ回路109は、帯域フィルタ1091と、振幅検出回路1092と、合成回路1093と、を有している。帯域フィルタ1091は、入力された音声信号を、人の音声の周波数帯域Bの音声信号と、それ以外の周波数帯域Aの音声信号とに分離し、周波数帯域Bの音声信号を振幅検出回路1092に、周波数帯域Aの音声信号を合成回路1093に出力する。振幅検出回路1092は、制御部112との間で音声解析のための情報である音解析情報のやり取りを行う。本実施形態における音解析情報は、声検出閾値と声検出信号である。声検出閾値は、入力された音声信号の信号レベルを判定するための閾値である。また、声検出信号は、人の音声が検出されたか否かを示す信号である。このような構成の振幅検出回路1092は、周波数帯域Bの音声信号の振幅(信号レベル)が、制御部112から入力された声検出閾値以上である場合に、人の音声が検出された旨を示す声検出信号を制御部112に出力する。また、振幅検出回路1092は、周波数帯域Bの音声信号の振幅(信号レベル)が、制御部112から入力された声検出閾値未満である場合に、人の音声が検出されていない旨を示す声検出信号を制御部112に出力する。合成回路1093は、振幅検出回路1092から入力された周波数帯域Bの音声信号に、帯域フィルタ1091から入力された周波数帯域Aの音声信号を合成して、もとの音声信号を復元する。
【0016】
アンプ110は、制御部112によって設定されたゲインで、フィルタ回路109から入力された音声信号の増幅を行う。詳細は後述するが、アンプ110のゲインは、通常は一定値であり、カメラ本体100内でNDフィルタ103等の動作音が発せられる際に、低く設定される。
【0017】
記録部111は、例えばカメラ本体100に内蔵された記録媒体としてのメモリを有し、画像処理部105で処理された画像信号を記録する。また、記録部111は、動画撮影時等、必要に応じてアンプ110から出力された音声信号も記録する。
制御部112は、例えばCPUであり、画像処理部105で得られたコントラスト情報に従ってレンズ101のフォーカスレンズを合焦位置に駆動させるフォーカス制御や、画像処理部105で得られた輝度情報に従って撮影時における撮像素子104のシャッター速(露出時間)や感度(画像信号の増幅率)を設定したり、絞り102の開放量を設定したり、NDフィルタ103の挿抜を制御する露出制御等の、カメラ本体100内の各ブロックの動作を制御する。さらに、制御部112は、音声記録時においては、声検出閾値の設定をしたり、アンプ110のゲインを設定したりもする。
【0018】
以下、図1に示すカメラの動作について説明する。なお、以下の説明においては特に動画撮影時の動作について説明する。しかしながら、本実施形態のカメラは、静止画撮影も可能になされている。
動画記録中には、被写体の距離の変化や輝度の変化に追従した動画を記録できるように、フォーカス制御や露出制御がなされる。このフォーカス制御において、制御部112は、撮像素子104の連続動作によって画像処理部105から順次得られるコントラスト情報を評価しつつ、フォーカスレンズを駆動させる。コントラスト情報が最大となる位置にフォーカスレンズを駆動させることにより、レンズ101が合焦状態となる。
【0019】
また、露出制御において、制御部112は、画像処理部105で得られた輝度情報に従って、被写体の輝度を識別し、撮影時において被写体の輝度を適正露出量とするのに必要な、撮像素子104のシャッター速及び感度と、絞り102の開放量やNDフィルタ103の挿抜の要否を演算し、それぞれを制御する。この際、NDフィルタの動作が禁止されている場合は、撮像素子104のシャッター速及び感度と、絞り102の開放量によってNDフィルタ103による露出変化分を一時的に補い、適正露出を維持するように制御する。NDフィルタの動作が許可されると、NDフィルタ103の挿抜の要否に応じてNDフィルタを動作させ、撮像素子104のシャッター速及び感度と、絞り102の開放量を動画としてより好ましい制御状態に戻す。以上のようなフォーカス制御や露出制御と同時に、撮像素子104を介して得られた画像信号は、画像処理部105においてホワイトバランス補正や階調補正、色補正等の種々の画像処理が施される。
【0020】
さらに、以上のような動画像取得動作に伴って、制御部112は、マイク107を動作させる。この音声取得動作により、マイク107を介して得られた音声信号は、AGCアンプ108に入力される。以下、この後の処理について、図5を参照しながら説明する。
【0021】
AGCアンプ108では、入力された音声信号の出力レベルを略一定とするようにゲインが設定され、この設定されたゲインに従って音声信号が増幅される。これにより、入力された音声信号の平均レベルが低レベル(即ち小音量)の場合であっても、高レベル(即ち大音量)の場合であっても、音声の再生時に人が聞き易いレベルの信号を記録することが可能である。このような増幅がなされるのに伴って、AGCアンプ108から制御部112へは、AGCアンプ108において設定されたゲインの情報が入力される。
【0022】
AGCアンプ108で増幅された音声信号は、フィルタ回路109に入力される。フィルタ回路109の帯域フィルタ1091により、音声信号が、図5に示すように、周波数帯域Aの音声信号(人の音声の周波数帯域以外の音声信号)と、周波数帯域Bの音声信号(人の音声の周波数帯域の音声信号)と、に分離される。振幅検出回路1092では、帯域フィルタ1091より入力された周波数帯域Bの音声信号の振幅(信号レベル)と制御部112によって設定された声検出閾値とが比較される。声検出閾値の設定については後述する。
【0023】
周波数帯域Bの音声信号の振幅(信号レベル)が声検出閾値以上である場合には、人の音声が検出された旨を示す声検出信号(ハイレベルの声検出信号)が制御部112に出力される。また、周波数帯域Bの音声信号の振幅(信号レベル)が声検出閾値未満である場合には、人の音声が検出されていない旨を示す声検出信号(ローレベルの声検出信号)が制御部112に出力される。
【0024】
制御部112は、声検出信号の状態から、NDフィルタ103の動作を許可するための動作許可信号を発行する。NDフィルタ103は、挿抜時に大きな動作音を発するので、人の音声が検出されている間は、NDフィルタ103の動作を禁止し、人の音声が検出されていない期間のみ、NDフィルタ103の動作を許可する。ただし、人の音声は、息継ぎの間等によって不意に途切れることがあり得る。この度毎にNDフィルタ103の動作を許可してしまうと、人の音声が再び発された際にNDフィルタ103の動作音も記録されてしまうおそれがある。このため、人の音声が検出されなくなった直後からNDフィルタ103の動作を許可するのではなく、所定時間T(このTをカメラの操作者等が設定できるようにしても良い)の間、人の音声が検出されなくなってからNDフィルタ103の動作を許可することが望ましい。なお、NDフィルタ103の動作許可信号は、NDフィルタ103の動作を許可するための信号であって、この期間内に必ずNDフィルタ103を動作させるわけではない。NDフィルタ103を動作させるか否かは、上述した露出制御の際の輝度情報による判別に従って決定される。動作許可信号がハイレベルであり、且つ、NDフィルタ103を動作させる際には、図5に示すようにして、NDフィルタ103の動作音の信号レベルが環境音の信号レベルと同レベルとなるよう、アンプ110のゲインが設定される。アンプ110のゲインは、NDフィルタ103の動作音の出方(振幅変化、持続時間等)に応じて可変とすることが望ましい。このため、カメラの製造時等において、NDフィルタ103の動作音の出方を実測しておき、この実測した結果を制御部112に記録しておくことが望ましい。また、アンプ110のゲインは、環境音のレベルによっても可変とすることが望ましい。なお、動作許可信号がハイレベルではない場合、又はNDフィルタ103を動作させない場合には、アンプ110のゲインは固定値(例えば1倍)に設定しておく。
【0025】
フィルタ回路109の合成回路1093では、周波数帯域Aの音声信号(人の音声の周波数帯域以外の音声信号)と、周波数帯域Bの音声信号(人の音声の周波数帯域の音声信号)とが合成され、フィルタ回路109に入力された音声信号が復元される。この復元された音声信号はアンプ110に入力される。アンプ110により、制御部112によって設定されたゲインに従って音声信号が増幅される。
【0026】
記録部111では、画像処理部105で処理された画像信号とアンプ110から出力された音声信号とに対して所定の圧縮処理(例えばMPEG方式等)がなされる。この圧縮処理を経て得られた動画ファイルは、記録媒体としてのメモリに記録される。なお、圧縮処理は専用の圧縮処理回路において行うようにしても良い。
【0027】
図6は、声検出閾値の設定手法の例について示した図である。声検出閾値は、人の音声が検出されたか否かを判定するための閾値であるため、音声以外の人に関する情報が分かるときには、この情報に応じて声検出閾値を設定する。これにより、より撮影状況に適した判定を行うことが可能である。例えば、AGCアンプ108のゲインが高い場合には、マイク107を介して得られた音声信号の信号レベルが平均的に小さいことを意味している。この場合、フィルタ回路109に入力される音声信号は、人の声が含まれる帯域に対してそれ以外の帯域の成分が大きくなり、人の声が含まれる帯域にも環境音等の雑音成分が多く含まれてしまう。このような場合において人の音声を検出できるよう、声検出閾値を大きくして、主要な声(一番大きい声)に対して判定を行うようにする。逆に、AGCアンプ108のゲインが低い場合には、声検出閾値をAGCアンプ108のゲインが高い場合に比べて小さくする。
【0028】
また、画像処理部105による画像処理によって顔部に相当する画像信号が検出された場合には、その顔検出情報も声検出閾値の設定に利用する。例えば、複数の顔部が検出された場合には、そのときに発せられる音声は、複数の人の声が重なり合っていることがあるので、声検出閾値を大きくして、主要な声(一番大きい声)に対して判定を行うようにする。さらに、検出された顔部の大きさに応じて声検出閾値を変えるようにしても良い。例えば、検出された顔部が大きい場合には、アップで撮影しているということになり、その顔部に動画の観賞者の意識が集中すると考えられる。この場合、声検出閾値を小さくして判定の精度を高めることが望ましい。また、顔部が検出されなかった場合には、操作者のナレーション等が入ることを想定し、声検出閾値を小さくして判定の精度を高めることが望ましい。
【0029】
以上説明したように、本実施形態では、動画撮影時において、マイク107を介して得られる音声信号の解析を行い、この解析の結果、人の音声が検出されない期間にのみNDフィルタ103の動作を許可するようにしている。これにより、動画の観賞者が意識を集中すると考えられるタイミングにおいて、NDフィルタ103の動作音が記録される可能性を低減することが可能である。また、NDフィルタ103の動作音が発せられる期間では、アンプ110のゲインを低下させるようにしている。これによりNDフィルタ103の動作音がほぼ記録されないようにすることが可能である。なお、NDフィルタ103の動作音が発せられる期間では、多少の音質の低下が発生することになるが、この期間では人の音声が発せられていないため、音質の低下も許容されると考えられる。
【0030】
なお、上述の例では、光学素子としてのNDフィルタ103の動作音を記録しないようにした例を示しているが、本実施形態の技術は、音声の記録時において動作音が発せられる各種の光学素子を有するカメラに対して適用可能である。例えば、本実施形態の技術を適用できる光学素子としては、NDフィルタ103の他に、羽絞りや、撮影効果を表現するためのフィルタ(偏光フィルタやIRカットフィルタ等)等が考えられる。さらには、レンズ101についても適用可能である。
【0031】
また、本実施形態のマイク107は、カメラ本体100に内蔵のものを主として想定している。カメラ本体100の外部にマイクを装着して音声の記録を行う場合には、必ずしも本実施形態の技術を適用する必要はない。勿論、適用するようにしても良い。
また、上述の例では、フィルタ回路109による音声信号解析によって人の音声の有無を検出してNDフィルタ103の動作の許可と禁止を判別するようにしている。これに対し、例えば画像処理部105によって人の顔が検出された際にさらに顔の表情を解析するようにし、この解析結果に応じて人の音声の有無を検出するようにしても良い。例えば、検出した顔の口を検出し、この口が開いている場合には音声が発せられているとする。この場合、画像処理部105も人物音声検出部として機能することになる。
【0032】
さらに、上述した例は、レンズ一体型のカメラへの本実施形態の適用例を示している。これに対し、図7に示すようなレンズ交換式のカメラに対して本実施形態の技術を適用することも可能である。図7に示すカメラは、カメラ本体100と、交換レンズ200と、を有している。なお、図7の例において、カメラ本体100の構成は、図1で示した構成とほぼ同一である。ただし、交換レンズ200を装着するためのレンズマウント113がカメラ本体100に設けられている点と、交換レンズ200がカメラ本体100に装着された際に、制御部112が、交換レンズ200内のレンズ制御部206と通信自在に接続されている点と、が異なる。
【0033】
交換レンズ200は、光学系と、ドライバ204と、メモリ205と、レンズ制御部206と、を有している。
光学系は、レンズ201と、絞り202と、NDフィルタ203と、を有している。これらは、図1で示したレンズ101、絞り102、NDフィルタ103と同様の動作をするものである。その詳細については説明を省略する。ドライバ204は、モータやその駆動回路等を有しており、レンズ制御部206による制御に従って、レンズ201のフォーカスレンズ、絞り202、NDフィルタ203を駆動させる。メモリ205は、レンズ201の特性情報や、絞り202の特性情報、NDフィルタ203の特性情報といった各種のレンズ情報を記憶しておくためのメモリである。レンズ制御部206は、例えばCPUであって、カメラ本体100からの同期信号に同期してカメラ本体100から送信される制御コマンドに従って、交換レンズ200の各ブロックの動作を制御する。また、レンズ制御部206は、メモリ205に記憶されているレンズ情報を制御部112に送信することも行う。
【0034】
図7に示した構成のカメラであっても、図5で示したような動作を実現可能である。なお、図7の構成においては、図6で示した例に加えて、交換レンズ200から通信されたレンズ情報をさらに用いて、声検出閾値を設定することが望ましい。
以上実施形態に基づいて本発明を説明したが、本発明は上述した実施形態に限定されるものではなく、本発明の要旨の範囲内で種々の変形や応用が可能なことは勿論である。
【符号の説明】
【0035】
100…カメラ本体、101,201…レンズ、102,202…絞り、103,203…NDフィルタ、104…撮像素子、105…画像処理部、106…表示部、107…マイクロホン(マイク)、108…利得制御(AGC)アンプ、109…フィルタ回路、110…アンプ、111…記録部、112…制御部、113…レンズマウント、200…交換レンズ、204…ドライバ、205…メモリ、206…レンズ制御部

【特許請求の範囲】
【請求項1】
被写体から入射した光を画像信号に変換する画像取得部と、
前記画像取得部に入射する光を機械的な動作により制御する光学素子と、
音声を音声信号に変換する音声取得部と、
前記被写体における人の音声の有無を検出する人物音声検出部と、
前記人物音声検出部により人の音声が検出されている間は、前記光学素子の動作を禁止した状態で前記画像取得部により得られた画像信号と前記音声取得部により得られた音声信号とを記録媒体に記録し、前記人物音声検出部により人の音声が検出されていない間は、前記光学素子の動作を許可した状態で前記画像取得部により得られた画像信号と前記音声取得部により得られた音声信号とを記録媒体に記録するように制御する制御部と、
を具備することを特徴とする撮像装置。
【請求項2】
前記人物音声検出部は、前記音声取得部により得られた音声信号を解析することにより、前記人の音声を検出することを特徴とする請求項1に記載の撮像装置。
【請求項3】
前記人物音声検出部は、前記音声取得部により得られた音声信号における人の音声の周波数帯域の音声信号が所定の閾値以上の場合に、前記人の音声を検出することを特徴とする請求項2に記載の撮像装置。
【請求項4】
前記人物音声検出部は、前記画像取得部により得られた画像信号を解析することにより、前記閾値を変更することを特徴とする請求項3に記載の撮像装置。
【請求項5】
前記音声取得部で得られた音声信号の平均レベルに従ってゲインを設定し、該ゲインに従って前記音声信号を増幅する利得制御部をさらに具備し、
前記人物音声検出部は、前記利得制御部により設定されたゲインに応じて前記閾値を変更することを特徴とする請求項3に記載の撮像装置。
【請求項6】
前記画像信号は、動画信号であることを特徴とする請求項1乃至5の何れか1項に記載の撮像装置。
【請求項7】
被写体からの光を入射させるレンズと、
前記レンズによって入射された光を機械的な動作により制御する光学素子と、
前記レンズと前記光学素子との動作を制御するレンズ制御部と、
を有する交換レンズと、
前記レンズと前記光学素子とを介して入射した光を画像信号に変換する画像取得部と、
音声を音声信号に変換する音声取得部と、
前記被写体における人の音声を検出する人物音声検出部と、
前記人物音声検出部により人の音声が検出されている間は、前記光学素子の動作を禁止するための信号を前記レンズ制御部に送信して前記前記光学素子の動作を禁止した状態で前記画像取得部により得られた画像信号と前記音声取得部により得られた音声信号とを記録媒体に記録し、前記人物音声検出部により人の音声が検出されていない間は、前記光学素子の動作を許可するための信号を前記レンズ制御部に送信して前記光学素子の動作を許可した状態で前記画像取得部により得られた画像信号と前記音声取得部により得られた音声信号とを記録媒体に記録するように制御する制御部と、
を有する本体と、
を具備することを特徴とする撮像装置。
【請求項8】
前記人物音声検出部は、前記音声取得部により得られた音声信号を解析することにより、前記人の音声を検出することを特徴とする請求項7に記載の撮像装置。
【請求項9】
前記人物音声検出部は、前記音声取得部により得られた音声信号における人に対応した周波数成分が所定の閾値以上の場合に前記人の音声を検出することを特徴とする請求項8に記載の撮像装置。
【請求項10】
前記人物音声検出部は、前記画像取得部により得られた画像信号を解析することにより、前記閾値を変更することを特徴とする請求項9に記載の撮像装置。
【請求項11】
前記音声取得部で得られた音声信号の平均レベルに従ってゲインを設定し、該ゲインに従って前記音声信号を増幅する利得制御部をさらに具備し、
前記人物音声検出部は、前記利得制御部により設定されたゲインに応じて前記閾値を変更することを特徴とする請求項9に記載の撮像装置。
【請求項12】
前記交換レンズは、前記光学素子の動作に伴う音の強度レベルを示す情報を保持する記憶部がさらに有し、
前記人物音声検出部へは、前記記憶部からの前記音の強度レベルを示す情報を受けて、該光学素子の動作に伴う音の強度レベルを示す情報に応じて前記閾値を変更することを特徴とする請求項9に記載の撮像装置。
【請求項13】
前記画像信号は、動画信号であることを特徴とする請求項7乃至12の何れか1項に記載の撮像装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2012−70101(P2012−70101A)
【公開日】平成24年4月5日(2012.4.5)
【国際特許分類】
【出願番号】特願2010−211422(P2010−211422)
【出願日】平成22年9月21日(2010.9.21)
【出願人】(504371974)オリンパスイメージング株式会社 (2,647)
【Fターム(参考)】