撮像装置
【課題】 本発明は、画像と音声とを取得し得る撮像装置を提供することを目的とする。
【解決手段】 本発明は、画像を撮像する撮像部と、画像に対応する音声を指向性を変化させて取得可能な音声取得部と、画像に含まれる被写体を判定する判定部と、判定部の判定結果に応じて音声取得部の指向性が変化するように制御する制御部とを含む。
【解決手段】 本発明は、画像を撮像する撮像部と、画像に対応する音声を指向性を変化させて取得可能な音声取得部と、画像に含まれる被写体を判定する判定部と、判定部の判定結果に応じて音声取得部の指向性が変化するように制御する制御部とを含む。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像と音声とを取得することができる撮像装置に関する。
【背景技術】
【0002】
従来、デジタルカメラやビデオカメラ等において、動画撮像の際に画像と音声とを同時に記録することができるだけでなく、撮影状況に応じてマイクロフォンの指向性を制御する様々な技術が開発されている。
【0003】
例えば、特許文献1では、周囲音がある状況において、デジタルカメラやビデオカメラ等の動きに影響されることなく、選択した所望の被写体からの音声を強調又は抑圧して録音する技術が開示されている。
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、従来技術は、デジタルカメラ等が向けられた被写体までの撮影距離や焦点距離等の焦点情報に基づいて、マイクロフォンの指向性を被写体に向くように、また特許文献1は、選択された被写体を追跡するように制御することはできるが、被写体の対象(以後、「シーン」という)の種類や場面に応じてマイクロフォンの指向性を変化させることはできない。
【0005】
上記従来技術が有する問題に鑑み、本発明の目的は、画像と音声とを取得することができる撮像装置を提供することにある。
【課題を解決するための手段】
【0006】
上記課題を解決するために、本発明の撮像装置は、画像を撮像する撮像部と、画像に対応する音声を指向性を変化させて取得可能な音声取得部と、画像に含まれる被写体を判定する判定部と、判定部の判定結果に応じて音声取得部の指向性が変化するように制御する制御部とを含む。
【0007】
また、撮影者により操作可能な操作部と、操作部の状態に応じて撮影条件を変更する撮影条件変更部とを含み、制御部は、判定部の判定結果、及び、操作部の状態に基づいて制御を行っても良い。
【0008】
また、制御部は、操作部の状態よりも判定部の判定結果を優先して制御を行っても良い。
【0009】
また、判定部は、画像から求めた特徴量に基づいてパターン認識をすることにより、画像に含まれる被写体を判定しても良い
また、判定部は、あらかじめ複数の被写体についての複数の画像を用いて、複数の画像各々の特徴量と複数の被写体の各々の対象とを、各対象を特徴付けるパターンに基づいて関係付ける複数の統計パラメータを有し、複数の統計パラメータを用いた統計処理によって、撮像部によって撮像された画像における被写体の対象を特徴付けるパターンを認識しても良い。
【0010】
また、統計処理は、ニューラルネットであっても良い。
【0011】
また、音声取得部は、音声の指向性を変更するための指向性変更回路を含んでも良い。
【0012】
また、音声取得部は、それぞれ指向性の異なる複数のマイクロフォンを含み、制御部は、判定部の判定結果に応じて複数のマイクロフォンのゲインを制御しても良い。
【発明の効果】
【0013】
本発明によれば、画像と音声とを取得し得る撮像装置を提供することができる。
【図面の簡単な説明】
【0014】
【図1】本発明の第1の実施形態に係るデジタルカメラ1の構成例を示す模式図
【図2】本発明の第1の実施形態に係るデジタルカメラ1の被写体側から見た図と機能ブロック図
【図3】本発明の第1の実施形態に係るデジタルカメラ1における撮像処理の手順を示すフローチャート
【図4】本発明の第1の実施形態に係るデジタルカメラ1における階層型ニューラルネットの概念図
【図5】本発明の第2の実施形態に係るデジタルカメラ1における階層型ニューラルネットの概念図
【図6】本発明の第3の実施形態に係るデジタルカメラ50の構成例を示す模式図
【図7】本発明の第3の実施形態に係るデジタルカメラ50の被写体側から見た図と機能ブロック図
【図8】本発明の第4の実施形態に係るデジタルカメラ1の被写体側から見た図と機能ブロック図
【図9】本発明の第4の実施形態に係るデジタルカメラ1における撮像処理の手順を示すフローチャート
【図10】本発明の第5の実施形態に係るデジタルカメラ1の被写体側から見た図と機能ブロック図
【図11】本発明の第5の実施形態に係るデジタルカメラ1における撮像処理の手順を示すフローチャート
【発明を実施するための形態】
【0015】
以下、図面を用いて本発明の実施形態について説明する。以下の実施形態では、本発明のカメラの一例として、一眼レフタイプのデジタルカメラを用いて説明する。
≪第1の実施形態≫
図1は、本発明の第1の実施形態に係るデジタルカメラ1の構成を示す図である。図1に示すように、デジタルカメラ1は、カメラ本体1aと交換レンズ部1bとから構成される。
【0016】
交換レンズ部1bは、撮像レンズ2、絞り3、焦点距離検出部4、距離検出部5、絞り制御部6及びレンズ側CPU7から成る。一方、カメラ本体1aは、ペンタプリズム8、再結像レンズ9、測光センサ10、クイックリターンミラー11、サブミラー12、焦点板13、シャッタ14、接眼レンズ15、撮像素子16、表示部17、本体側CPU18、焦点検出部19、画像処理部20、シャッタ制御部21、記憶部22、マイクロフォン23a〜23bの各部を備える。デジタルカメラ1の各構成要素は、交換レンズ部1bのレンズ側CPU7又はカメラ本体1aの本体側CPU18と情報伝達可能に接続される。そして、レンズ側CPU7と本体側CPU18とは、接続点を介して接続されている。なお、図1はデジタルカメラ1の主要部分のみを示す。例えば、図1において、本体側CPU18の指令に従って、撮像素子16に撮影指示のタイミングパルスを発するタイミングジェネレータ等は省略されている。
【0017】
撮像レンズ2は、複数の光学レンズにより構成され、被写体からの光束を撮像素子16の受光面に結像する。
【0018】
測光センサ10は、図1に示すようにクイックリターンミラー11が下がった状態で、焦点板13に結像されるファインダ像の画面を細かく分割(例えば、5分割等)して、測光する測光センサであり、画面内の明るさや色等といった測光情報を検出する。測光センサ10は、撮像レンズ2からの光束に基づいて計測される輝度に基づいて、コントラスト方式による撮像レンズ2の焦点状態であるコントラストAF情報を検出するとともに、再結像レンズ9によって結像され、撮像素子16による被写体の撮像前の構図確認用で、表示部17に表示される低解像度画像(スルー画)を生成する。
【0019】
焦点検出部19は、例えば、位相差方式による焦点検出を行い、結像される被写体像の複数の測定点における、撮像レンズ2の焦点状態であるデフォーカス量を検出する。本体側CPU18は、取得したそのような焦点状態に基づいて、レンズ側CPU7を介して、撮像レンズ駆動部(不図示)や絞り制御部6に、撮像レンズ2及び絞り3をそれぞれ駆動させて、撮像素子16の受光面に被写体を結像させる。本体側CPU18は、その時の焦点距離、被写体までの撮像距離及び絞り値を、レンズ側CPU7を介して、焦点距離検出部4、距離検出部5及び絞り制御部6からそれぞれ取得する。なお、レンズ側CPU7及び本体側CPU18は、一般的なコンピュータのCPUを使用することができる。レンズ側CPU7及び本体側CPU18のそれぞれには、各不図示のメモリが備えられ、各構成要素を制御するためのプログラムがあらかじめ記録されているものとする。
【0020】
なお、位相差方式の焦点検出又はコントラスト方式の焦点検出のいずれかの焦点検出を行うかは、ユーザによる操作設定に応じて決めても良い。或いは、デジタルカメラ1は、位相差方式の焦点検出とコントラスト方式の焦点検出とを組み合わせて撮影レンズ2の焦点状態を検出する構成としても良い。
【0021】
クイックリターンミラー11は、撮影を行わない場合には、図1に示すように、撮影レンズ2および絞り3を通過してきた光束の方向に対して45°の角度に配置される。そして、撮影レンズ2および絞り3を通過した光束は、クイックリターンミラー11で反射され、焦点板13上に結像してファインダ像が投影される。その投影されたファインダ像は、ペンタプリズム8を介して、測光センサ10及び接眼レンズ15に導かれる。ユーザは、接眼レンズ15を介して被写体の像を目視することにより構図確認を行う。同時に、上述したように、再結像レンズ9を介して、測光センサ10の撮像面上にも再結像される。また、クイックリターンミラー11を透過した一部の光束は、サブミラー12を介して焦点検出部19に導かれる。
【0022】
一方、撮影時には、本体側CPU18の指示に基づいて、クイックリターンミラー11は、撮像レンズ2からの光束の光路から退避して、シャッタ制御部21によってシャッタ14が開放されると、撮影レンズ2からの光束は撮像素子16に導かれる。
【0023】
撮像素子16は、本体側CPU18の指令を受けて、タイミングジェネレータ(不図示)が発するタイミングパルスに基づいて動作し、前方に設けられた撮像レンズ2によって結像された被写体を撮像する。撮像素子16には、CCDやCMOSの半導体のイメージセンサ等を適宜選択して用いることができる。なお、本実施形態では、撮像素子16は、静止画像の場合には全画素による撮像を行い、動画の場合には間引き読み出しによる撮像を行うものとする。
【0024】
一方、デジタルカメラ1のカメラ本体1aには、静止画像や動画の撮像時における音声取得のためのマイクロフォン23a〜23bが設けられている。図2(a)は、デジタルカメラ1を被写体側から見た図である。なお、図1における構成要素と同じものには、同じ符号を付している。図2(a)に示されるように、マイクロフォン23a〜23bは、カメラ本体1aの全面の右上で水平に並んで設けられている。そして、本実施形態では、図2(b)に示すように、マイクロフォン23aは指向性の狭い特性を有し、マイクロフォン23bは広い指向性を有している。なお、図2(b)は、デジタルカメラ1の機能ブロック図である。マイクロフォン23a〜23bは、デジタルカメラ1による静止画像又は動画撮影時において、撮像される被写体のシーンに応じて、マイクロフォン23a〜23bのいずれか又はその両方を用いて、周囲音や所定の被写体からの音声を効果的に捉える。
【0025】
操作部材30は、ユーザによる部材操作の内容に応じた操作信号を本体側CPU18に出力する。操作部材30には、例えば、電源釦、撮影モード等のモード設定釦及びレリーズ釦等の操作部材を有する。なお、操作部材30は、表示部17の画面の前面に設けられるタッチパネル形式の釦であっても良い。また、表示部17には、液晶モニタ等を適宜選択して用いることができる。
【0026】
撮像素子16によって撮像された画像データは、A/D変換部(不図示)によってデジタル信号に変換されて画像処理部20に取り込まれる。図2(b)に示すように、画像処理部20は、画像データ処理部28と画像特徴量演算部29とから構成されるデジタルフロントエンド回路であって、転送されてきた画像データは画像データ処理部28と画像特徴量演算部29とに入力される。画像データ処理部28では、画像データに対して補間処理やホワイトバランス処理等の画像処理を施し、記憶部22に記録するとともに、表示部17に静止画像や動画等として表示する。
【0027】
一方、画像特徴量演算部29は、撮像された画像を、50×50又は100×100等の複数の領域に分割して、領域毎にR/G、B/G及び輝度等の画像特徴量の積算値を算出し、算出された各領域におけるそれらの画像特徴量から、それらの平均値や分散値等を求める。画像特徴量演算部29によって算出されたそれらの平均値や分散値等の画像特徴量は、本体側CPU18へ転送される。
【0028】
本体側CPU18は、画像特徴量演算部29によって求められた画像特徴量に基づいて、撮像された被写体のシーンを判定するシーン判定部26と、シーン判定部26によって判定されたシーンに応じて、マイクロフォン23a〜23bの指向性を制御する指向性制御部27とから構成される。なお、本実施形態では、上述したように、本体側CPU18に備えられたメモリ(不図示)に、各構成要素を制御するためのプログラムとともに、シーン判定部26によるシーン判定及び指向性制御部27による指向性制御を行うためのプログラムが、あらかじめ記録されているものとする。
【0029】
A/D変換部24a〜24bは、本実施形態において、増幅回路をアナログフロントエンドに備えたものであり、マイクロフォン23a〜23bから転送されてくるアナログの音声信号を、増幅してからデジタル信号に変換する。A/D変換部24a〜24bの増幅回路の増幅率は、本体側CPU18の指向性制御部27によって制御される。デジタル信号に変換されたマイクロフォン23a〜23bからの音声信号は、ミキサ25によって合成され、画像データ処理部28によって処理された画像と関連付けられて記憶部22に記録される。
【0030】
次に、本実施形態に係るデジタルカメラ1の撮像手順について、図3のフローチャートを参照しながら説明する。なお、以下の説明では、ユーザがデジタルカメラ1を用いて、動画を撮像するものとして説明する。即ち、ユーザによって、あらかじめ操作部材30のモード設定釦によって、動画モードが選択設定されているものとする。
【0031】
ユーザにより操作部材30の電源釦が押されると、レンズ側CPU7及び本体側CPU18は、それぞれの不図示のメモリに記憶されている制御プログラムを読み込み、デジタルカメラ1のカメラ本体1a及び交換レンズ部1bをそれぞれ初期化する。本体側CPU18は、レンズ側CPU7を介して、焦点検出部4、距離検出部5及び絞り制御部6から焦点距離、撮像距離及び絞り値をそれぞれ取得するとともに、測光センサ10及び焦点検出部19から撮像レンズ2の焦点状態を取得する。同時に、本体側CPU18は、動画の撮像でのシーンに応じて、マイクロフォン23a〜23bによる音声録音の指向性を制御するプログラム、シーン判定部26が撮像した画像に基づいてシーン判定するために用いる、ニューラルネットによる統計処理で必要な統計パラメータのデータ、及び各シーンに応じた各A/D変換部24a〜24bの増幅率である指向性データを、それぞれ記憶部22から読み込む。なお、本実施形態では、統計パラメータのデータ及び指向性データは、記憶部22にあらかじめ記録されているものとする。そして、ステップS10からの処理が行われる。
【0032】
ステップS10:本体側CPU18は、ユーザによって操作部材30のレリーズ釦が押されて撮像開始指示の信号を受信すると、タイミングジェネレータ(不図示)を介して、クイックリターンミラー11を、撮像レンズ2を通過してくる被写体からの光束の光路上から退避させて、シャッタ制御部21にシャッタ14を開放させるとともに、所定のフレームレート(例えば、30fps)で、撮像素子16に被写体を間引き読み出しによる動画撮像を開始させる。
【0033】
ステップS11:本体側CPU18は、上記フレームレートで取得された各フレームの画像を、撮像素子16に順次出力させて、A/D変換部(不図示)にアナログからデジタルの信号に変換させ、画像処理部20に転送する。画像処理部20は、転送されてきた画像を、画像データ処理部28及び画像特徴量演算部29に入力する。画像データ処理部28は、その画像に対して、補間処理やホワイトバランス処理等の画像処理を施す。一方、画像特徴量演算部29は、画像を、例えば、50×50の領域に分割して、各領域において複数の画像特徴量を算出し、各領域で求めた複数の画像特徴量を用いて、その画像における各画像特徴量の平均値と分散値とを算出する。画像特徴量演算部29は、算出したそれら画像特徴量の平均値と分散値とを、本体側CPU18のシーン判定部26へ転送する。
【0034】
なお、本実施形態における複数の画像特徴量とは、R/G、B/G、輝度、画像の水平走査線(X軸)方向の動きベクトルX及び画像の垂直走査線(Y軸)方向の動きベクトルYである。また、本実施形態における、動きベクトルX及び動きベクトルYの算出は、演算対象の画像とその1フレーム前の画像とを用い、分割した領域毎に相関を計算することによって求める。ただし、最初のフレームの画像に対しては、動きベクトルX及び動きベクトルYを求めることができないので、それらの平均値及び分散値は、例えば0と設定する。
【0035】
ステップS12:本体側CPU18のシーン判定部26は、ステップS11で画像特徴量演算部29が算出した複数の画像特徴量の平均値及び分散値と、あらかじめ読み込んだ統計パラメータのデータとを用いて、図4に示すような、ニューラルネットによる統計処理を行い、画像に撮像されているシーンが、ポートレート、風景、スナップ、スポーツ、舞台撮影又はその他等のいずれかを判定する。
【0036】
ここで、図4は、ニューラルネット、特に階層型ニューラルネットによる統計処理の概念図を示す。この階層型ニューラルネットにおいて、ステップS11で算出した各画像特徴量の平均値及び分散値を入力して、後述する統計パラメータを用いた重み付け処理によって、各シーンの適応度を示す値(例えば、ポートレート適応度=0.8、風景適応度=0.2及び他の適応度が全て0というような値)が算出される。そして、シーン判定部26は、その適応度の値の大きさに応じて、その画像のシーンが何であるかを判定する。なお、本実施形態では、適応度を示す値は、その合計が1になるように規格化された値を用いる。
【0037】
次に、統計パラメータのデータについて簡単に説明する。統計パラメータは、上述したように、入力される各画像特徴量の平均値及び分散値と各シーンとを、ニューラルネットという統計処理を介して、重ね合わせ処理よって求められる適応度に基づいて関係付けるために必要となるパラメータである。その統計パラメータを求めるためには、まず、あらかじめ複数の任意の被写体を撮像した画像を用意し、画像特徴量演算部29と同様の処理に基づいて、各画像におけるR/G等の画像特徴量の平均値と分散値とを求める。これと同時に、あらかじめ各画像に撮像されている被写体のシーンが何であるかを決定する(例えば、ある画像のシーンがポートレートであるならば、ポートレート適応度を1として、他のシーンの適応度を0とする。これを教師値という)。そして、それら複数の画像の各々の各画像特徴量の平均値及び分散値と、あらかじめ決められた統計パラメータの初期値とを、図4に示す階層型ニューラルネットに代入して、各画像に対する各シーンの適応度を求める。各画像において求めた各シーン適応度と上記教師値とを比較することによって、各画像におけるシーンの適応度の値が教師値に近づくように統計パラメータを調整(これを学習過程という)し、最適な統計パラメータのデータを求める。求められた統計パラメータのデータが、記憶部22に記録される。
【0038】
ステップS13:本体側CPU18の指向性制御部27は、ステップS12におけるシーン判定部26によるシーン判定が適正か否かを判定する。本実施形態では、指向性制御部27は、図4に示す各適応度の値のうち、一番大きい値が閾値0.5以上有り且つ2番目に大きな適応度の値との差が閾値0.2以上の場合、シーン判定部26によるシーン判定は適正であると判定し、ステップS14(YES側)へ移行する。一方、一番大きな適応度の値が閾値0.5より小さい又は2番目に大きな適応度の値との差が閾値0.2より小さい場合、シーン判定部26によるシーン判定は適正ではないとして「不定」と判定して、ステップS15(NO側)へ移行する。
【0039】
例えば、ステップS12において、フレームの画像に対するシーン判定部26の判定が、ポートレート適応度=0.8、風景適応度=0.1、スナップ適応度=0.1及びそれ以外の適応度が0の場合には、シーン判定部26は、被写体のシーンはポートレートであると判定し、指向性制御部27は、その判定が適正であると判定する。一方、ポートレート適応度=0.5、風景適応度=0.4、スナップ適応度=0.1及びそれ以外の適応度が0の場合には、シーン判定部26は、被写体のシーンはポートレートであると判定するが、指向性制御部27は、その判定は適正でないとして「不定」と判定する。
【0040】
ステップS14:指向性制御部27は、シーン判定部26によるシーン判定の結果と指向性データとに基づいて、マイクロフォン23a〜23bの各々における指向性を制御するための各A/D変換部24a〜24bの増幅率を決定する。
【0041】
ここで、指向性データは、各シーンに応じたマイクロフォン23a〜23bを制御するためのA/D変換部24a〜24bの各々に対する増幅率が一覧表として記載されたものである。例えば、ポートレートのシーンの場合には、被写体が人物であることから、A/D変換部24a及びA/D変換部24bの増幅率をそれぞれ100対0として、指向性の狭いマイクロフォン23aのみを用いて、その人物だけの音声を録音する。また、風景のシーンの場合には、A/D変換部24a及びA/D変換部24bの増幅率をそれぞれ0対100として、指向性の広いマイクロフォン23bを用いて周囲音を録音する。また、スポーツや演劇撮像のシーンの場合には、例えば、増幅率をそれぞれ70対30として、指向性の狭いマイクロフォン23aで競技者や演技者からの音声を主に録音するとともに、指向性の広いマイクロフォン23bで観客の音声も録音する。最後に、その他の場合には、例えば、増幅率をそれぞれ50対50として、特定の音声とともに、周囲音も録音する。
【0042】
ステップS15:指向性制御部27は、ステップS13において、シーン判定部26によるシーン判定の結果を「不定」と判定した場合には、A/D変換部24a〜24bの各々の増幅率を0対100として、指向性の広いマイクロフォン23bのみによる音声の録音を行う。
【0043】
ステップS16:指向性制御部27は、ステップS14又はステップS15で決定した増幅率を、各A/D変換部24a〜24bに設定し、マイクロフォン23a〜23bの指向性を制御して音声を録音する。
【0044】
ステップS17:本体側CPU18は、ステップS11で画像データ処理部28によって処理された画像と、ステップS16でマイクロフォン23a〜23bによって録音された音声データとを関連付けて、記憶部22に順次記録する。
【0045】
ステップS18:本体側CPU18は、ユーザが押していたレリーズ釦が元の位置に戻される、或いは、ユーザが再度レリーズ釦を押すことによって、動画撮像の終了指令の信号を受信したか否かを判定する。撮像終了指令の信号を受信したと判定した場合(YES側)には、本体側CPU18は、タイミングジェネレータ(不図示)を介して、シャッタ制御部21にシャッタ14を閉じるとともに、クイックリターンミラー11を、撮像レンズ2からの光束の光路上である元の位置に戻して、一連の動画撮像を終了する。一方、本体側CPU18が、動画撮像の終了指令が出されていないと判定した場合には、ステップS11へ移行して、次のフレームの画像を取得して、ステップS11〜ステップS17の処理をユーザによって終了指令が出されるまで行い、一連の動画撮像を終了する。
【0046】
このように本実施形態では、所定のフレームレートで撮像される動画の各フレームの画像毎に、撮影対象である被写体のシーンの種類や場面を判定し、その判定結果に応じてマイクロフォンの指向性を自動的に制御することで、シーンに応じて録音したい音声の方向が変化してしまう場合でも、最良な状態で音声を録音することができる。
≪第2の実施形態≫
本発明の第2の実施形態に係るデジタルカメラは、第1の実施形態に係るデジタルカメラ1と同じである。したがって、本実施形態におけるデジタルカメラとして、図1及び図2に示す第1の実施形態と同じデジタルカメラ1を用い、各構成要素についての詳細な説明は省略する。また、本実施形態に係るデジタルカメラ1の撮像手順についても、図3に示すステップS10〜ステップS18のフローチャートと同じである。
【0047】
しかしながら、本実施形態におけるデジタルカメラ1が、第1の実施形態のデジタルカメラと異なる点は、ステップS12における、階層型ニューラルネットによる統計処理において入力される画像特徴量のパラメータの数が増加する点にある。即ち、図5に示すように、入力される画像特徴量として、画像特徴量演算部29が画像から求めるR/G、B/G、輝度、動きベクトルX及び動きベクトルYの画像特徴量各々の平均値及び分散値の統計的な特徴量だけでなく、焦点検出部4による焦点距離、距離検出部5による撮影距離、焦点検出部19による複数の測定点における位相差方式によって検出された撮像レンズ2の焦点状態であるデフォーカス量(焦点検出値)の分散値、及び撮像された画像において顔検出された顔サイズのパラメータを、新たに追加して行われる。
【0048】
なお、これら画像特徴量の追加に伴って、記憶部22にあらかじめ記憶される統計パラメータのデータは、第1の実施形態における画像特徴量とともに、本実施形態で追加された焦点距離、撮影距離、焦点検出値の分散及び顔サイズを用いて行った、学習過程に基づいて算出されたものを使用する。また、焦点検出値として、位相差方式によって検出される値を用いたが、山登り方式によって検出される値を用いても良い。さらに、画像における顔検出の方法は、任意の公知の手法を使用して行うことができる。
【0049】
このように本実施形態では、所定のフレームレートで撮像される動画の各フレームの画像毎に、撮影対象である被写体のシーンの種類や場面を判定し、その判定結果に応じてマイクロフォンの指向性を自動的に制御することで、シーンに応じて録音したい音声の方向が変化してしまう場合でも、最良な状態で音声を録音することができる。
【0050】
また、階層型ニューラルネットにおいて入力される特徴量が増えることにより、シーン判定部26によるシーン判定をより正確に行うことができる。
≪第3の実施形態≫
本発明の第3の実施形態に係るデジタルカメラ50は、図6及び図7に示すように、第1又は第2の実施形態に係るデジタルカメラ1の構成と基本的には同じである。したがって、本実施形態におけるデジタルカメラ50の構成を示す図6及び図7において、第1又は第2の実施形態に係るデジタルカメラ1と同じ構成要素については詳細な説明を省略する。また、本実施形態に係るデジタルカメラ50の撮像手順についても、図3に示すステップS10〜ステップS18のフローチャートと同じであり、詳細な説明は省略する。
【0051】
ただし、本実施形態に係るデジタルカメラ50と第1の実施形態に係るデジタルカメラ1と異なる点は、図6及び図7に示すように、マイクロフォン23cが1つのみである。マイクロフォン23cには、不図示であるが、マイクロフォン23cが受信する音声の帯域を複数のバンドパスフィルタによって複数の帯域に分割して、その分割された各帯域のゲインを、指向性制御部27からの指示に基づいて調節することによって、マイクロフォン23cの指向性を変更する指向性変更回路が設けられている。したがって、本実施形態では、統計パラメータのデータとともに、各シーンに応じたA/D変換部24cの増幅率と指向性変更回路(不図示)によるマイクロフォン23cの各帯域に対応したバンドパスフィルタ毎のゲインとを一覧にした指向性データが、記憶部22にあらかじめ記録されているものとする。
【0052】
即ち、ステップS13において、シーン判定部26によるシーン判定が「不定」でないと判定された場合、ステップS14(NO側)において、指向性制御部27は、シーン判定部26によるシーン判定結果と記憶部22に記憶されている指向性データとに基づいて、A/D変換部24cの増幅率及び指向性変更回路(不図示)によるマイクロフォン23cの各帯域に対応するバンドパスフィルタ毎のゲインを設定して、マイクロフォン23cの指向性を制御する。一方、「不定」と判定された場合、ステップS15(YES側)において、指向性制御部27は、A/D変換部24cの増幅率とともに、指向性変更回路(不図示)にマイクロフォン23cの全ての帯域を用いるように各バンドパスフィルタのゲインを設定し、最も広い指向性となるように制御する。
【0053】
このように本実施形態では、所定のフレームレートで撮像される動画のフレーム画像毎に、撮影対象である被写体のシーンの種類や場面を判定し、その判定結果に応じてマイクロフォンの指向性を自動的に制御することで、シーンに応じて録音したい音声の方向が変化してしまう場合でも、最良な状態で音声を録音することができる。
【0054】
また、マイクロフォン23cが1つで済むことから、デジタルカメラ50の回路規模を小さくすることが可能となる。
≪第4の実施形態≫
本発明の第4の実施形態に係るデジタルカメラは、第1の実施形態に係るデジタルカメラ1と基本的に同じである。ただし、図8(b)に示すように、本実施形態におけるデジタルカメラ1における機能ブロックの構成が、図2(b)に示す第1の実施形態係るデジタルカメラ1の機能ブロックの構成と異なる。即ち、本実施形態に係るデジタルカメラ1では、ユーザが操作部材30のモード設定釦を用いて、ポートレートや風景等の撮像モードを選択設定することによって、指向性制御部27が、その設定された撮像モードに対応するシーンに応じた各A/D変換部24a〜24bの増幅率を指向性に基づいて決定し、マイクロフォン23a〜23bの指向性を制御する。これが、第1の実施形態のデジタルカメラと異なる点である。なお、本実施形態と第1の実施形態とのデジタルカメラ1において、同じ構成要素については、同じ符号を付し詳細な説明は省略する。
【0055】
次に、本実施形態に係るデジタルカメラ1の撮像手順について、図9のフローチャートを参照しながら説明する。なお、以下の説明では、ユーザがデジタルカメラ1を用いて、動画を撮像するものとして説明する。即ち、ユーザによって、あらかじめ操作部材30のモード設定釦によって、動画モードが選択設定されているものとする。
【0056】
ユーザにより操作部材30の電源釦が押されると、レンズ側CPU7及び本体側CPU18は、それぞれの不図示のメモリに記憶されている制御プログラムを読み込み、デジタルカメラ1のカメラ本体1a及び交換レンズ部1bをそれぞれ初期化する。本体側CPU18は、レンズ側CPU7を介して、焦点検出部4、距離検出部5及び絞り制御部6から焦点距離、撮像距離及び絞り値をそれぞれ取得するとともに、測光センサ10及び焦点検出部19から撮像レンズ2の焦点状態を取得する。同時に、本体側CPU18は、ユーザによる操作部材30のモード選択釦によって設定される撮像モードに応じて、マイクロフォン23a〜23bによる音声録音の指向性を制御するプログラムとともに、各シーンに応じた各A/D変換部24a〜24bの増幅率である指向性データを、記憶部22から読み込む。なお、本実施形態において、指向性データは、記憶部22にあらかじめ記録されているものとする。また、本実施形態における指向性データは、第1の実施形態及び第2の実施形態の指向性データと同じものである。そして、ステップS20からの処理が行われる。
【0057】
ステップS20:ユーザは、操作部材30のモード選択釦を用いて、撮像モードを選択設定する。
【0058】
ステップS21:本体側CPU18は、ユーザによって設定された撮像モードを識別し、本体側CPU18の指向性制御部27は、識別された撮像モードに対応するシーンに応じた各A/D変換部24a〜24bの増幅率を、指向性データに基づいて決定する。
【0059】
ステップS22:指向性制御部27は、ステップS21で決定した増幅率を、各A/D変換部24a〜24bの増幅回路に設定し、マイクロフォン23a〜23bの指向性を制御する。
【0060】
ステップS23:本体側CPU18は、ユーザによって操作部材30のレリーズ釦が押されて撮像開始指示の信号を受信すると、タイミングジェネレータ(不図示)を介して、クイックリターンミラー11を、撮像レンズ2を通過してくる被写体からの光束の光路上から退避させて、シャッタ制御部21にシャッタ14を開放させるとともに、所定のフレームレート(例えば、30fps)で、撮像素子16に被写体を間引き読み出しによる動画撮像を開始させる。
【0061】
ステップS24:本体側CPU18は、上記フレームレートで取得された各フレームの画像を、撮像素子16に順次出力させて、A/D変換部(不図示)にアナログからデジタルの信号に変換させ、画像処理部20に転送する。画像処理部20は、転送されてきた画像を、画像データ処理部28に入力して、その画像に対して、補間処理やホワイトバランス処理等の画像処理を施す。
【0062】
ステップS25:本体側CPU18は、ステップS24で画像データ処理部28によって処理された画像と、ステップS22で指向性が制御されたマイクロフォン23a〜23bによって録音された音声データとを関連付けて、記憶部22に順次記録する。
【0063】
ステップS26:本体側CPU18は、ユーザが押していたレリーズ釦が元の位置に戻される、或いは、ユーザが再度レリーズ釦を押すことによって、動画撮像の終了指令の信号を受信したか否かを判定する。撮像終了指令の信号を受信したと判定した場合(YES側)には、本体側CPU18は、タイミングジェネレータ(不図示)を介して、シャッタ制御部21にシャッタ14を閉じるとともに、クイックリターンミラー11を、撮像レンズ2からの光束の光路上である元の位置に戻して、一連の動画撮像を終了する。一方、本体側CPU18が、動画撮像の終了指令が出されていないと判定した場合には、ステップS24へ移行して、次のフレームの画像を取得して、ステップS24〜ステップS25の処理をユーザによって終了指令が出されるまで行い、一連の動画撮像を終了する。
【0064】
このように本実施形態では、あらかじめユーザによって操作部材30のモード選択釦で設定される撮像モードに対応する被写体のシーンに応じて、マイクロフォンの指向性を制御することにより、最良な状態で音声を録音することができる。
【0065】
また、操作部材30のモード選択釦による撮像モードによって、マイクロフォン23a〜23bの指向性の制御が行われることから、デジタルカメラ1の回路規模を小さくすることができる。
≪第5の実施形態≫
本発明の第5の実施形態に係るデジタルカメラは、基本的に、図1及び図2の第1の実施形態に係るデジタルカメラと、図8に示す第4の実施形態のデジタルカメラとを組み合わせたものであり、図10に示すような機能ブロックとなる。
【0066】
したがって、本実施形態に係るデジタルカメラ1は、最初に、ユーザが操作部材30のモード設定釦を用いて、ポートレートや風景等の撮像モードを選択設定することによって、その設定された撮像モードに対応するシーンに応じた各A/D変換部24a〜24bの増幅率が設定され、マイクロフォン23a〜23bの指向性が制御される。その後、デジタルカメラ1は、撮像される動画の各フレームの画像毎にシーン判定を行うことによって、その判定結果に応じて、A/D変換部24a〜24bの増幅率を適宜変更して、マイクロフォン23a〜23bの指向性を制御される。この点が、第1の実施形態及び第4の実施形態のデジタルカメラ1と異なる点である。なお、本実施形態と第1の実施形態とのデジタルカメラ1において、同じ構成要素については、同じ符号を付して詳細な説明は省略する。
【0067】
次に、本実施形態に係るデジタルカメラ1の撮像手順について、図11のフローチャートを参照しながら説明する。なお、以下の説明では、ユーザがデジタルカメラ1を用いて、動画を撮像するものとして説明する。即ち、ユーザによって、あらかじめ操作部材30のモード設定釦によって、動画モードが選択設定されているものとする。
【0068】
ユーザにより操作部材30の電源釦が押されると、レンズ側CPU7及び本体側CPU18は、それぞれの不図示のメモリに記憶されている制御プログラムを読み込み、デジタルカメラ1のカメラ本体1a及び交換レンズ部1bをそれぞれ初期化する。本体側CPU18は、レンズ側CPU7を介して、焦点検出部4、距離検出部5及び絞り制御部6から焦点距離、撮像距離及び絞り値をそれぞれ取得するとともに、測光センサ10及び焦点検出部19から撮像レンズ2の焦点状態を取得する。同時に、本体側CPU18は、ユーザによる操作部材30のモード選択釦によって設定される撮像モード、又はシーン判定部26によるシーン判定に応じて、マイクロフォン23a〜23bによる音声録音の指向性を制御するプログラム、シーン判定部26が撮像した画像に基づいてシーン判定するために用いる、ニューラルネットによる統計処理で必要な統計パラメータのデータ、及び各シーンに応じた各A/D変換部24a〜24bの増幅率である指向性データを、それぞれ記憶部22から読み込む。なお、本実施形態では、統計パラメータのデータ及び指向性データは、記憶部22にあらかじめ記録されているものとする。また、本実施形態における指向性データは、第1の実施形態、第2の実施形態及び第4の実施形態の指向性データと同じものである。そして、ステップS30からの処理が行われる。
【0069】
ステップS30:ユーザは、操作部材30のモード選択釦を用いて、撮像モードを選択設定する。
【0070】
ステップS31:本体側CPU18は、ユーザによって設定された撮像モードを識別し、本体側CPU18の指向性制御部27は、識別された撮像モードに対応するシーンに応じた各A/D変換部24a〜24bの増幅率を、指向性データに基づいて決定する。
【0071】
ステップS32:指向性制御部27は、ステップS31で決定した増幅率を、各A/D変換部24a〜24bの増幅回路に設定し、マイクロフォン23a〜23bの指向性を制御する。
【0072】
ステップS33:本体側CPU18は、ユーザによって操作部材30のレリーズ釦が押されて撮像開始指示の信号を受信すると、タイミングジェネレータ(不図示)を介して、クイックリターンミラー11を、撮像レンズ2を通過してくる被写体からの光束の光路上から退避させて、シャッタ制御部21にシャッタ14を開放させるとともに、所定のフレームレート(例えば、30fps)で、撮像素子16に被写体を間引き読み出しによる動画撮像を開始させる。
【0073】
ステップS34:本体側CPU18は、上記フレームレートで取得された各フレームの画像を、撮像素子16に順次出力させて、A/D変換部(不図示)にアナログからデジタルの信号に変換させ、画像処理部20に転送する。画像処理部20は、転送されてきた画像を、画像データ処理部28及び画像特徴量演算部29に入力する。画像データ処理部28は、その画像に対して、補間処理やホワイトバランス処理等の画像処理を施す。一方、画像特徴量演算部29は、画像を、例えば、50×50の領域に分割して、各領域においてR/G、B/G、輝度、動きベクトルX及び動きベクトルYの画像特徴量を算出し、各領域で求めたそれらの画像特徴量から、その画像における各画像特徴量の平均値と分散値とを算出する。画像特徴量演算部29は、それら画像特徴量の平均値と分散値とを、本体側CPU18のシーン判定部26へ転送する。
【0074】
ステップS35:本体側CPU18のシーン判定部26は、ステップS34で画像特徴量演算部29が算出した複数の画像特徴量の平均値及び分散値と、あらかじめ読み込んだ統計パラメータのデータとを用いて、図4に示すような、ニューラルネットによる統計処理を行い、画像に撮像されているシーンが、ポートレート、風景、スナップ、スポーツ、舞台撮影又はその他等のいずれかを判定する。
【0075】
ステップS36:本体側CPU18の指向性制御部27は、ステップS35におけるシーン判定部26によるシーン判定が適正か否かを判定する。本実施形態では、指向性制御部27は、図4に示す各適応度の値のうち、一番大きな適応度の値が閾値0.5以上有り且つ2番目に大きな適応度の値の3倍以上の値である場合、シーン判定部26によるシーン推定は適正であると判定し、ステップS37(YES側)へ移行する。一方、一番大きな適応度の値が閾値0.5より小さい又は2番目に大きな適応度の値の3倍より小さい値である場合、指向性制御部27は、シーン判定部26によるシーン判定が適正ではないとして「不定」と判定して、ステップS38(NO側)へ移行する。
【0076】
ステップS37:指向性制御部27は、シーン判定部26によるシーン判定の結果と指向性データに基づいて、マイクロフォン23a〜23bの各々における指向性を制御するためのA/D変換部24a〜24bの増幅率を決定する。
【0077】
ステップS38:指向性制御部27は、ステップS35において、シーン判定部26によるシーン判定の結果を「不定」と判定した場合には、ステップS32で設定された撮像モードに応じた増幅率を用いる決定を行う。
【0078】
ステップS39:指向性制御部27は、ステップS37又はステップS38で決定した増幅率を、各A/D変換部24a〜24bに設定して、マイクロフォン23a〜23bの指向性を制御して音声を録音する。
【0079】
ステップS40:本体側CPU18は、ステップS34で画像データ処理部28によって処理された画像と、ステップS39でマイクロフォン23a〜23bによって録音された音声データとを関連付けて、記憶部22に順次記録する。
【0080】
ステップS41:本体側CPU18は、ユーザが押していたレリーズ釦が元の位置に戻される、或いは、ユーザが再度レリーズ釦を押すことによって、動画撮像の終了指令の信号を受信したか否かを判定する。撮像終了指令の信号を受信したと判定した場合(YES側)には、本体側CPU18は、タイミングジェネレータ(不図示)を介して、シャッタ制御部21にシャッタ14を閉じるとともに、クイックリターンミラー11を、撮像レンズ2からの光束の光路上である元の位置に戻して、一連の動画撮像を終了する。一方、本体側CPU18が、動画撮像の終了指令が出されていないと判定した場合には、ステップS11へ移行して、次のフレームの画像を取得して、ステップS34〜ステップS40の処理をユーザによって終了指令が出されるまで行い、一連の動画撮像を終了する。
【0081】
このように本実施形態では、あらかじめユーザによって操作部材30のモード選択釦で設定される撮像モードによって決まるマイクロフォンの指向性、又は撮像される動画の各フレームの画像毎に、撮影対象である被写体のシーンの種類や場面の判定結果に応じて決まるマイクロフォンの指向性を選択しながら制御することによって、シーンに応じて録音したい音声の方向が変化してしまう場合でも、最良な状態で音声を録音することができる。
≪実施形態の補足事項≫
第1の実施形態、第2の実施形態、第4の実施形態及び第5の実施形態において、マイクロフォン23a〜23bの位置は、図2(a)、図8(a)及び図10(a)に示すように、被写体側から見た場合、カメラ本体1aの右上に2つ水平に並んで配置されたが、本発明はこれに限定されない。任意の位置にマイクロフォンを配置しても良い。
【0082】
なお、第1の実施形態、第2の実施形態、第4の実施形態及び第5の実施形態において、音声の録音は2つの指向性の異なるマイクロフォン23a〜23bで行ったが、本発明はこれに限定されず、3つ以上の指向性の異なるマイクロフォンを用いて行っても良い。
【0083】
なお、第1の実施形態、第2の実施形態、第4の実施形態及び第5の実施形態において、指向性データは、各シーンに応じたA/D変換部24a〜24bの各々に対する増幅率の一覧として、例えば、ポートレートのシーンの場合には、被写体が人物であることから、A/D変換部24a及びA/D変換部24bの増幅率をそれぞれ100対0等とするとしたが、本発明はこれに限定されず、各シーンに応じて、マイクロフォン23a〜23bの指向性を制御するための各A/D変換部24a〜24bの増幅率の組み合わせは、シーンに応じて適宜決めることが好ましい。
【0084】
なお、第1の実施形態、第2の実施形態及び第5の実施形態において、動画を撮像する場合について説明したが、本発明はこれに限定されず、静止画像の撮像の場合にも適用可能である。ただし、その場合には、静止画像を撮像する前に、マイクロフォン23a〜23bの指向性を制御するために、シーン判定部26によるシーン判定に応じたA/D変換部24a〜24bの増幅率をあらかじめ決めておくことが好ましい。即ち、例えば、測光センサ10によって撮像されるスルー画に基づいて、シーン判定部26がシーン判定を行い、その判定結果と記憶部22に記憶されている指向性データとに基づいて、指向性制御部27が、静止画像の撮像前に、A/D変換部24a〜24bの増幅率を決定する。
【0085】
なお、第1の実施形態ないし第3の実施形態及び第5の実施形態において、画像特徴量演算部29はフレーム画像を50×50の領域に分割して、画像特徴量を求める演算を行ったが、本発明はこれに限定されない。例えば、フレーム画像を100×100等の任意の数の領域に分割して演算を行っても良い。
【0086】
なお、第1の実施形態ないし第3の実施形態及び第5の実施形態において、図4又は図5の階層型ニューラルネットの出力結果である各シーンの適応度の値が、全て足した値が1になるように規格化した値を用いたが、本発明はこれに限定されない。例えば、各適応度の値を百分率で表しても良いし、規格化されていない値で表しても良い。
【0087】
なお、第1の実施形態ないし第3の実施形態及び第5の実施形態において、指向性制御部27によるシーン判定部26のシーン判定の可否を判定するために、基準となる閾値として0.5、0.2又は3倍の値を用いたが、本発明はこれに限定されず、任意の値を適宜選択して用いることが好ましい。
【0088】
なお、第1の実施形態ないし第3の実施形態及び第5の実施形態において、図4又は図5に示すような、入力パラメータが10個又は14個の階層型ニューラルネットに基づいて、シーン判定部26は画像のシーン判定をおこなったが、本発明はこれに限定されず、エッジ量等の他の画像特徴量を入力パラメータとして用いても良い。
【0089】
なお、第1の実施形態ないし第3の実施形態及び第5の実施形態において、各シーンの適応度として、ポートレート適応度、風景適応度、スナップ適応度、スポーツ適応度、舞台撮影適応度、その他適応度の6つを用いたが、本発明はこれに限定されず、他の任意のシーンの適応度を追加しても良い。
【0090】
なお、第3の実施形態及び第5の実施形態において、シーン判定部26は、10個の画像特徴量であるR/G、B/G、輝度、動きベクトルX及び動きベクトルYの各々の平均値及び分散値を入力パラメータとした、図4に示す階層型ニューラルネットによる統計処理に基づいて、画像のシーン判定を行ったが、本発明はこれに限定されない。例えば、シーン判定部26は、焦点検出部4による焦点距離、距離検出部5による撮影距離、焦点検出部19による複数の測定点における位相差方式によって検出された撮像レンズ2の焦点状態である焦点検出値の分散値、及びフレーム画像において顔検出された顔サイズを加えた、図5に示す14個の入力パラメータによる階層型ニューラルネットによる統計処理に基づいて、シーン判定を行っても良い。
【0091】
なお、第3の実施形態において、マイクロフォン23cの位置は、図7(a)に示すように、被写体側から見た場合、カメラ本体1aの右上に配置されたが、本発明はこれに限定されない。任意の位置にマイクロフォンを配置しても良い。
【0092】
なお、第3の実施形態において、各シーンに応じたA/D変換部24cの増幅率及び指向性変更回路(不図示)によるマイクロフォン23cの各帯域に対応するバンドパスフィルタのゲインの値の組み合わせは、シーンに応じて適宜決めることが好ましい。
【0093】
なお、第3の実施形態において、動画を撮像する場合について説明したが、本発明はこれに限定されず、静止画像の撮像の場合にも適用可能である。ただし、その場合には、静止画像を撮像する前に、マイクロフォン23cの指向性を制御するために、シーン判定部26によるシーン判定に応じたA/D変換部24cの増幅率及び指向性変更回路(不図示)によるマイクロフォン23cの各帯域に対応するバンドパスフィルタのゲインをあらかじめ決めておくことが好ましい。即ち、例えば、測光センサ10によって撮像されるスルー画に基づいて、シーン判定部26がシーン判定を行い、その判定結果と記憶部22に記憶されている指向性データとに基づいて、指向性制御部27が、静止画像の撮像前に、A/D変換部24cの増幅率及び指向性変更回路(不図示)によるマイクロフォン23cの各帯域に対応するバンドパスフィルタのゲインを決定する。
【0094】
なお、第4の実施形態において、動画を撮像する場合について説明したが、本発明はこれに限定されず、静止画像の撮像の場合にも適用可能である。
【0095】
なお、本発明は、スチルカメラ、ビデオカメラ、デジタルカメラが内蔵された携帯電話等に対しても適用可能である
本発明は、その精神またはその主要な特徴から逸脱することなく他の様々な形で実施することができる。そのため、上述した実施形態はあらゆる点で単なる例示に過ぎず、限定的に解釈されてはならない。さらに、特許請求の範囲の均等範囲に属する変形や変更は、全て本発明の範囲内である。
【符号の説明】
【0096】
1 デジタルカメラ、1a カメラ本体、1b 交換レンズ部1b、2 撮像レンズ、3絞り、4 焦点距離検出部、5 距離検出部、6 絞り制御部、7 レンズ側CPU、8 ペンタプリズム、9 再結像レンズ、10 測光センサ、11 クイックリターンミラー、12 サブミラー、13 焦点板、14 シャッタ、15 接眼レンズ、16 撮像素子、17 表示部、18 本体側CPU、19 焦点検出部、20 画像処理部、21 シャッタ制御部、22 記憶部、23a〜23b マイクロフォン
【先行技術文献】
【特許文献】
【0097】
【特許文献1】特開2006−222618号公報
【技術分野】
【0001】
本発明は、画像と音声とを取得することができる撮像装置に関する。
【背景技術】
【0002】
従来、デジタルカメラやビデオカメラ等において、動画撮像の際に画像と音声とを同時に記録することができるだけでなく、撮影状況に応じてマイクロフォンの指向性を制御する様々な技術が開発されている。
【0003】
例えば、特許文献1では、周囲音がある状況において、デジタルカメラやビデオカメラ等の動きに影響されることなく、選択した所望の被写体からの音声を強調又は抑圧して録音する技術が開示されている。
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、従来技術は、デジタルカメラ等が向けられた被写体までの撮影距離や焦点距離等の焦点情報に基づいて、マイクロフォンの指向性を被写体に向くように、また特許文献1は、選択された被写体を追跡するように制御することはできるが、被写体の対象(以後、「シーン」という)の種類や場面に応じてマイクロフォンの指向性を変化させることはできない。
【0005】
上記従来技術が有する問題に鑑み、本発明の目的は、画像と音声とを取得することができる撮像装置を提供することにある。
【課題を解決するための手段】
【0006】
上記課題を解決するために、本発明の撮像装置は、画像を撮像する撮像部と、画像に対応する音声を指向性を変化させて取得可能な音声取得部と、画像に含まれる被写体を判定する判定部と、判定部の判定結果に応じて音声取得部の指向性が変化するように制御する制御部とを含む。
【0007】
また、撮影者により操作可能な操作部と、操作部の状態に応じて撮影条件を変更する撮影条件変更部とを含み、制御部は、判定部の判定結果、及び、操作部の状態に基づいて制御を行っても良い。
【0008】
また、制御部は、操作部の状態よりも判定部の判定結果を優先して制御を行っても良い。
【0009】
また、判定部は、画像から求めた特徴量に基づいてパターン認識をすることにより、画像に含まれる被写体を判定しても良い
また、判定部は、あらかじめ複数の被写体についての複数の画像を用いて、複数の画像各々の特徴量と複数の被写体の各々の対象とを、各対象を特徴付けるパターンに基づいて関係付ける複数の統計パラメータを有し、複数の統計パラメータを用いた統計処理によって、撮像部によって撮像された画像における被写体の対象を特徴付けるパターンを認識しても良い。
【0010】
また、統計処理は、ニューラルネットであっても良い。
【0011】
また、音声取得部は、音声の指向性を変更するための指向性変更回路を含んでも良い。
【0012】
また、音声取得部は、それぞれ指向性の異なる複数のマイクロフォンを含み、制御部は、判定部の判定結果に応じて複数のマイクロフォンのゲインを制御しても良い。
【発明の効果】
【0013】
本発明によれば、画像と音声とを取得し得る撮像装置を提供することができる。
【図面の簡単な説明】
【0014】
【図1】本発明の第1の実施形態に係るデジタルカメラ1の構成例を示す模式図
【図2】本発明の第1の実施形態に係るデジタルカメラ1の被写体側から見た図と機能ブロック図
【図3】本発明の第1の実施形態に係るデジタルカメラ1における撮像処理の手順を示すフローチャート
【図4】本発明の第1の実施形態に係るデジタルカメラ1における階層型ニューラルネットの概念図
【図5】本発明の第2の実施形態に係るデジタルカメラ1における階層型ニューラルネットの概念図
【図6】本発明の第3の実施形態に係るデジタルカメラ50の構成例を示す模式図
【図7】本発明の第3の実施形態に係るデジタルカメラ50の被写体側から見た図と機能ブロック図
【図8】本発明の第4の実施形態に係るデジタルカメラ1の被写体側から見た図と機能ブロック図
【図9】本発明の第4の実施形態に係るデジタルカメラ1における撮像処理の手順を示すフローチャート
【図10】本発明の第5の実施形態に係るデジタルカメラ1の被写体側から見た図と機能ブロック図
【図11】本発明の第5の実施形態に係るデジタルカメラ1における撮像処理の手順を示すフローチャート
【発明を実施するための形態】
【0015】
以下、図面を用いて本発明の実施形態について説明する。以下の実施形態では、本発明のカメラの一例として、一眼レフタイプのデジタルカメラを用いて説明する。
≪第1の実施形態≫
図1は、本発明の第1の実施形態に係るデジタルカメラ1の構成を示す図である。図1に示すように、デジタルカメラ1は、カメラ本体1aと交換レンズ部1bとから構成される。
【0016】
交換レンズ部1bは、撮像レンズ2、絞り3、焦点距離検出部4、距離検出部5、絞り制御部6及びレンズ側CPU7から成る。一方、カメラ本体1aは、ペンタプリズム8、再結像レンズ9、測光センサ10、クイックリターンミラー11、サブミラー12、焦点板13、シャッタ14、接眼レンズ15、撮像素子16、表示部17、本体側CPU18、焦点検出部19、画像処理部20、シャッタ制御部21、記憶部22、マイクロフォン23a〜23bの各部を備える。デジタルカメラ1の各構成要素は、交換レンズ部1bのレンズ側CPU7又はカメラ本体1aの本体側CPU18と情報伝達可能に接続される。そして、レンズ側CPU7と本体側CPU18とは、接続点を介して接続されている。なお、図1はデジタルカメラ1の主要部分のみを示す。例えば、図1において、本体側CPU18の指令に従って、撮像素子16に撮影指示のタイミングパルスを発するタイミングジェネレータ等は省略されている。
【0017】
撮像レンズ2は、複数の光学レンズにより構成され、被写体からの光束を撮像素子16の受光面に結像する。
【0018】
測光センサ10は、図1に示すようにクイックリターンミラー11が下がった状態で、焦点板13に結像されるファインダ像の画面を細かく分割(例えば、5分割等)して、測光する測光センサであり、画面内の明るさや色等といった測光情報を検出する。測光センサ10は、撮像レンズ2からの光束に基づいて計測される輝度に基づいて、コントラスト方式による撮像レンズ2の焦点状態であるコントラストAF情報を検出するとともに、再結像レンズ9によって結像され、撮像素子16による被写体の撮像前の構図確認用で、表示部17に表示される低解像度画像(スルー画)を生成する。
【0019】
焦点検出部19は、例えば、位相差方式による焦点検出を行い、結像される被写体像の複数の測定点における、撮像レンズ2の焦点状態であるデフォーカス量を検出する。本体側CPU18は、取得したそのような焦点状態に基づいて、レンズ側CPU7を介して、撮像レンズ駆動部(不図示)や絞り制御部6に、撮像レンズ2及び絞り3をそれぞれ駆動させて、撮像素子16の受光面に被写体を結像させる。本体側CPU18は、その時の焦点距離、被写体までの撮像距離及び絞り値を、レンズ側CPU7を介して、焦点距離検出部4、距離検出部5及び絞り制御部6からそれぞれ取得する。なお、レンズ側CPU7及び本体側CPU18は、一般的なコンピュータのCPUを使用することができる。レンズ側CPU7及び本体側CPU18のそれぞれには、各不図示のメモリが備えられ、各構成要素を制御するためのプログラムがあらかじめ記録されているものとする。
【0020】
なお、位相差方式の焦点検出又はコントラスト方式の焦点検出のいずれかの焦点検出を行うかは、ユーザによる操作設定に応じて決めても良い。或いは、デジタルカメラ1は、位相差方式の焦点検出とコントラスト方式の焦点検出とを組み合わせて撮影レンズ2の焦点状態を検出する構成としても良い。
【0021】
クイックリターンミラー11は、撮影を行わない場合には、図1に示すように、撮影レンズ2および絞り3を通過してきた光束の方向に対して45°の角度に配置される。そして、撮影レンズ2および絞り3を通過した光束は、クイックリターンミラー11で反射され、焦点板13上に結像してファインダ像が投影される。その投影されたファインダ像は、ペンタプリズム8を介して、測光センサ10及び接眼レンズ15に導かれる。ユーザは、接眼レンズ15を介して被写体の像を目視することにより構図確認を行う。同時に、上述したように、再結像レンズ9を介して、測光センサ10の撮像面上にも再結像される。また、クイックリターンミラー11を透過した一部の光束は、サブミラー12を介して焦点検出部19に導かれる。
【0022】
一方、撮影時には、本体側CPU18の指示に基づいて、クイックリターンミラー11は、撮像レンズ2からの光束の光路から退避して、シャッタ制御部21によってシャッタ14が開放されると、撮影レンズ2からの光束は撮像素子16に導かれる。
【0023】
撮像素子16は、本体側CPU18の指令を受けて、タイミングジェネレータ(不図示)が発するタイミングパルスに基づいて動作し、前方に設けられた撮像レンズ2によって結像された被写体を撮像する。撮像素子16には、CCDやCMOSの半導体のイメージセンサ等を適宜選択して用いることができる。なお、本実施形態では、撮像素子16は、静止画像の場合には全画素による撮像を行い、動画の場合には間引き読み出しによる撮像を行うものとする。
【0024】
一方、デジタルカメラ1のカメラ本体1aには、静止画像や動画の撮像時における音声取得のためのマイクロフォン23a〜23bが設けられている。図2(a)は、デジタルカメラ1を被写体側から見た図である。なお、図1における構成要素と同じものには、同じ符号を付している。図2(a)に示されるように、マイクロフォン23a〜23bは、カメラ本体1aの全面の右上で水平に並んで設けられている。そして、本実施形態では、図2(b)に示すように、マイクロフォン23aは指向性の狭い特性を有し、マイクロフォン23bは広い指向性を有している。なお、図2(b)は、デジタルカメラ1の機能ブロック図である。マイクロフォン23a〜23bは、デジタルカメラ1による静止画像又は動画撮影時において、撮像される被写体のシーンに応じて、マイクロフォン23a〜23bのいずれか又はその両方を用いて、周囲音や所定の被写体からの音声を効果的に捉える。
【0025】
操作部材30は、ユーザによる部材操作の内容に応じた操作信号を本体側CPU18に出力する。操作部材30には、例えば、電源釦、撮影モード等のモード設定釦及びレリーズ釦等の操作部材を有する。なお、操作部材30は、表示部17の画面の前面に設けられるタッチパネル形式の釦であっても良い。また、表示部17には、液晶モニタ等を適宜選択して用いることができる。
【0026】
撮像素子16によって撮像された画像データは、A/D変換部(不図示)によってデジタル信号に変換されて画像処理部20に取り込まれる。図2(b)に示すように、画像処理部20は、画像データ処理部28と画像特徴量演算部29とから構成されるデジタルフロントエンド回路であって、転送されてきた画像データは画像データ処理部28と画像特徴量演算部29とに入力される。画像データ処理部28では、画像データに対して補間処理やホワイトバランス処理等の画像処理を施し、記憶部22に記録するとともに、表示部17に静止画像や動画等として表示する。
【0027】
一方、画像特徴量演算部29は、撮像された画像を、50×50又は100×100等の複数の領域に分割して、領域毎にR/G、B/G及び輝度等の画像特徴量の積算値を算出し、算出された各領域におけるそれらの画像特徴量から、それらの平均値や分散値等を求める。画像特徴量演算部29によって算出されたそれらの平均値や分散値等の画像特徴量は、本体側CPU18へ転送される。
【0028】
本体側CPU18は、画像特徴量演算部29によって求められた画像特徴量に基づいて、撮像された被写体のシーンを判定するシーン判定部26と、シーン判定部26によって判定されたシーンに応じて、マイクロフォン23a〜23bの指向性を制御する指向性制御部27とから構成される。なお、本実施形態では、上述したように、本体側CPU18に備えられたメモリ(不図示)に、各構成要素を制御するためのプログラムとともに、シーン判定部26によるシーン判定及び指向性制御部27による指向性制御を行うためのプログラムが、あらかじめ記録されているものとする。
【0029】
A/D変換部24a〜24bは、本実施形態において、増幅回路をアナログフロントエンドに備えたものであり、マイクロフォン23a〜23bから転送されてくるアナログの音声信号を、増幅してからデジタル信号に変換する。A/D変換部24a〜24bの増幅回路の増幅率は、本体側CPU18の指向性制御部27によって制御される。デジタル信号に変換されたマイクロフォン23a〜23bからの音声信号は、ミキサ25によって合成され、画像データ処理部28によって処理された画像と関連付けられて記憶部22に記録される。
【0030】
次に、本実施形態に係るデジタルカメラ1の撮像手順について、図3のフローチャートを参照しながら説明する。なお、以下の説明では、ユーザがデジタルカメラ1を用いて、動画を撮像するものとして説明する。即ち、ユーザによって、あらかじめ操作部材30のモード設定釦によって、動画モードが選択設定されているものとする。
【0031】
ユーザにより操作部材30の電源釦が押されると、レンズ側CPU7及び本体側CPU18は、それぞれの不図示のメモリに記憶されている制御プログラムを読み込み、デジタルカメラ1のカメラ本体1a及び交換レンズ部1bをそれぞれ初期化する。本体側CPU18は、レンズ側CPU7を介して、焦点検出部4、距離検出部5及び絞り制御部6から焦点距離、撮像距離及び絞り値をそれぞれ取得するとともに、測光センサ10及び焦点検出部19から撮像レンズ2の焦点状態を取得する。同時に、本体側CPU18は、動画の撮像でのシーンに応じて、マイクロフォン23a〜23bによる音声録音の指向性を制御するプログラム、シーン判定部26が撮像した画像に基づいてシーン判定するために用いる、ニューラルネットによる統計処理で必要な統計パラメータのデータ、及び各シーンに応じた各A/D変換部24a〜24bの増幅率である指向性データを、それぞれ記憶部22から読み込む。なお、本実施形態では、統計パラメータのデータ及び指向性データは、記憶部22にあらかじめ記録されているものとする。そして、ステップS10からの処理が行われる。
【0032】
ステップS10:本体側CPU18は、ユーザによって操作部材30のレリーズ釦が押されて撮像開始指示の信号を受信すると、タイミングジェネレータ(不図示)を介して、クイックリターンミラー11を、撮像レンズ2を通過してくる被写体からの光束の光路上から退避させて、シャッタ制御部21にシャッタ14を開放させるとともに、所定のフレームレート(例えば、30fps)で、撮像素子16に被写体を間引き読み出しによる動画撮像を開始させる。
【0033】
ステップS11:本体側CPU18は、上記フレームレートで取得された各フレームの画像を、撮像素子16に順次出力させて、A/D変換部(不図示)にアナログからデジタルの信号に変換させ、画像処理部20に転送する。画像処理部20は、転送されてきた画像を、画像データ処理部28及び画像特徴量演算部29に入力する。画像データ処理部28は、その画像に対して、補間処理やホワイトバランス処理等の画像処理を施す。一方、画像特徴量演算部29は、画像を、例えば、50×50の領域に分割して、各領域において複数の画像特徴量を算出し、各領域で求めた複数の画像特徴量を用いて、その画像における各画像特徴量の平均値と分散値とを算出する。画像特徴量演算部29は、算出したそれら画像特徴量の平均値と分散値とを、本体側CPU18のシーン判定部26へ転送する。
【0034】
なお、本実施形態における複数の画像特徴量とは、R/G、B/G、輝度、画像の水平走査線(X軸)方向の動きベクトルX及び画像の垂直走査線(Y軸)方向の動きベクトルYである。また、本実施形態における、動きベクトルX及び動きベクトルYの算出は、演算対象の画像とその1フレーム前の画像とを用い、分割した領域毎に相関を計算することによって求める。ただし、最初のフレームの画像に対しては、動きベクトルX及び動きベクトルYを求めることができないので、それらの平均値及び分散値は、例えば0と設定する。
【0035】
ステップS12:本体側CPU18のシーン判定部26は、ステップS11で画像特徴量演算部29が算出した複数の画像特徴量の平均値及び分散値と、あらかじめ読み込んだ統計パラメータのデータとを用いて、図4に示すような、ニューラルネットによる統計処理を行い、画像に撮像されているシーンが、ポートレート、風景、スナップ、スポーツ、舞台撮影又はその他等のいずれかを判定する。
【0036】
ここで、図4は、ニューラルネット、特に階層型ニューラルネットによる統計処理の概念図を示す。この階層型ニューラルネットにおいて、ステップS11で算出した各画像特徴量の平均値及び分散値を入力して、後述する統計パラメータを用いた重み付け処理によって、各シーンの適応度を示す値(例えば、ポートレート適応度=0.8、風景適応度=0.2及び他の適応度が全て0というような値)が算出される。そして、シーン判定部26は、その適応度の値の大きさに応じて、その画像のシーンが何であるかを判定する。なお、本実施形態では、適応度を示す値は、その合計が1になるように規格化された値を用いる。
【0037】
次に、統計パラメータのデータについて簡単に説明する。統計パラメータは、上述したように、入力される各画像特徴量の平均値及び分散値と各シーンとを、ニューラルネットという統計処理を介して、重ね合わせ処理よって求められる適応度に基づいて関係付けるために必要となるパラメータである。その統計パラメータを求めるためには、まず、あらかじめ複数の任意の被写体を撮像した画像を用意し、画像特徴量演算部29と同様の処理に基づいて、各画像におけるR/G等の画像特徴量の平均値と分散値とを求める。これと同時に、あらかじめ各画像に撮像されている被写体のシーンが何であるかを決定する(例えば、ある画像のシーンがポートレートであるならば、ポートレート適応度を1として、他のシーンの適応度を0とする。これを教師値という)。そして、それら複数の画像の各々の各画像特徴量の平均値及び分散値と、あらかじめ決められた統計パラメータの初期値とを、図4に示す階層型ニューラルネットに代入して、各画像に対する各シーンの適応度を求める。各画像において求めた各シーン適応度と上記教師値とを比較することによって、各画像におけるシーンの適応度の値が教師値に近づくように統計パラメータを調整(これを学習過程という)し、最適な統計パラメータのデータを求める。求められた統計パラメータのデータが、記憶部22に記録される。
【0038】
ステップS13:本体側CPU18の指向性制御部27は、ステップS12におけるシーン判定部26によるシーン判定が適正か否かを判定する。本実施形態では、指向性制御部27は、図4に示す各適応度の値のうち、一番大きい値が閾値0.5以上有り且つ2番目に大きな適応度の値との差が閾値0.2以上の場合、シーン判定部26によるシーン判定は適正であると判定し、ステップS14(YES側)へ移行する。一方、一番大きな適応度の値が閾値0.5より小さい又は2番目に大きな適応度の値との差が閾値0.2より小さい場合、シーン判定部26によるシーン判定は適正ではないとして「不定」と判定して、ステップS15(NO側)へ移行する。
【0039】
例えば、ステップS12において、フレームの画像に対するシーン判定部26の判定が、ポートレート適応度=0.8、風景適応度=0.1、スナップ適応度=0.1及びそれ以外の適応度が0の場合には、シーン判定部26は、被写体のシーンはポートレートであると判定し、指向性制御部27は、その判定が適正であると判定する。一方、ポートレート適応度=0.5、風景適応度=0.4、スナップ適応度=0.1及びそれ以外の適応度が0の場合には、シーン判定部26は、被写体のシーンはポートレートであると判定するが、指向性制御部27は、その判定は適正でないとして「不定」と判定する。
【0040】
ステップS14:指向性制御部27は、シーン判定部26によるシーン判定の結果と指向性データとに基づいて、マイクロフォン23a〜23bの各々における指向性を制御するための各A/D変換部24a〜24bの増幅率を決定する。
【0041】
ここで、指向性データは、各シーンに応じたマイクロフォン23a〜23bを制御するためのA/D変換部24a〜24bの各々に対する増幅率が一覧表として記載されたものである。例えば、ポートレートのシーンの場合には、被写体が人物であることから、A/D変換部24a及びA/D変換部24bの増幅率をそれぞれ100対0として、指向性の狭いマイクロフォン23aのみを用いて、その人物だけの音声を録音する。また、風景のシーンの場合には、A/D変換部24a及びA/D変換部24bの増幅率をそれぞれ0対100として、指向性の広いマイクロフォン23bを用いて周囲音を録音する。また、スポーツや演劇撮像のシーンの場合には、例えば、増幅率をそれぞれ70対30として、指向性の狭いマイクロフォン23aで競技者や演技者からの音声を主に録音するとともに、指向性の広いマイクロフォン23bで観客の音声も録音する。最後に、その他の場合には、例えば、増幅率をそれぞれ50対50として、特定の音声とともに、周囲音も録音する。
【0042】
ステップS15:指向性制御部27は、ステップS13において、シーン判定部26によるシーン判定の結果を「不定」と判定した場合には、A/D変換部24a〜24bの各々の増幅率を0対100として、指向性の広いマイクロフォン23bのみによる音声の録音を行う。
【0043】
ステップS16:指向性制御部27は、ステップS14又はステップS15で決定した増幅率を、各A/D変換部24a〜24bに設定し、マイクロフォン23a〜23bの指向性を制御して音声を録音する。
【0044】
ステップS17:本体側CPU18は、ステップS11で画像データ処理部28によって処理された画像と、ステップS16でマイクロフォン23a〜23bによって録音された音声データとを関連付けて、記憶部22に順次記録する。
【0045】
ステップS18:本体側CPU18は、ユーザが押していたレリーズ釦が元の位置に戻される、或いは、ユーザが再度レリーズ釦を押すことによって、動画撮像の終了指令の信号を受信したか否かを判定する。撮像終了指令の信号を受信したと判定した場合(YES側)には、本体側CPU18は、タイミングジェネレータ(不図示)を介して、シャッタ制御部21にシャッタ14を閉じるとともに、クイックリターンミラー11を、撮像レンズ2からの光束の光路上である元の位置に戻して、一連の動画撮像を終了する。一方、本体側CPU18が、動画撮像の終了指令が出されていないと判定した場合には、ステップS11へ移行して、次のフレームの画像を取得して、ステップS11〜ステップS17の処理をユーザによって終了指令が出されるまで行い、一連の動画撮像を終了する。
【0046】
このように本実施形態では、所定のフレームレートで撮像される動画の各フレームの画像毎に、撮影対象である被写体のシーンの種類や場面を判定し、その判定結果に応じてマイクロフォンの指向性を自動的に制御することで、シーンに応じて録音したい音声の方向が変化してしまう場合でも、最良な状態で音声を録音することができる。
≪第2の実施形態≫
本発明の第2の実施形態に係るデジタルカメラは、第1の実施形態に係るデジタルカメラ1と同じである。したがって、本実施形態におけるデジタルカメラとして、図1及び図2に示す第1の実施形態と同じデジタルカメラ1を用い、各構成要素についての詳細な説明は省略する。また、本実施形態に係るデジタルカメラ1の撮像手順についても、図3に示すステップS10〜ステップS18のフローチャートと同じである。
【0047】
しかしながら、本実施形態におけるデジタルカメラ1が、第1の実施形態のデジタルカメラと異なる点は、ステップS12における、階層型ニューラルネットによる統計処理において入力される画像特徴量のパラメータの数が増加する点にある。即ち、図5に示すように、入力される画像特徴量として、画像特徴量演算部29が画像から求めるR/G、B/G、輝度、動きベクトルX及び動きベクトルYの画像特徴量各々の平均値及び分散値の統計的な特徴量だけでなく、焦点検出部4による焦点距離、距離検出部5による撮影距離、焦点検出部19による複数の測定点における位相差方式によって検出された撮像レンズ2の焦点状態であるデフォーカス量(焦点検出値)の分散値、及び撮像された画像において顔検出された顔サイズのパラメータを、新たに追加して行われる。
【0048】
なお、これら画像特徴量の追加に伴って、記憶部22にあらかじめ記憶される統計パラメータのデータは、第1の実施形態における画像特徴量とともに、本実施形態で追加された焦点距離、撮影距離、焦点検出値の分散及び顔サイズを用いて行った、学習過程に基づいて算出されたものを使用する。また、焦点検出値として、位相差方式によって検出される値を用いたが、山登り方式によって検出される値を用いても良い。さらに、画像における顔検出の方法は、任意の公知の手法を使用して行うことができる。
【0049】
このように本実施形態では、所定のフレームレートで撮像される動画の各フレームの画像毎に、撮影対象である被写体のシーンの種類や場面を判定し、その判定結果に応じてマイクロフォンの指向性を自動的に制御することで、シーンに応じて録音したい音声の方向が変化してしまう場合でも、最良な状態で音声を録音することができる。
【0050】
また、階層型ニューラルネットにおいて入力される特徴量が増えることにより、シーン判定部26によるシーン判定をより正確に行うことができる。
≪第3の実施形態≫
本発明の第3の実施形態に係るデジタルカメラ50は、図6及び図7に示すように、第1又は第2の実施形態に係るデジタルカメラ1の構成と基本的には同じである。したがって、本実施形態におけるデジタルカメラ50の構成を示す図6及び図7において、第1又は第2の実施形態に係るデジタルカメラ1と同じ構成要素については詳細な説明を省略する。また、本実施形態に係るデジタルカメラ50の撮像手順についても、図3に示すステップS10〜ステップS18のフローチャートと同じであり、詳細な説明は省略する。
【0051】
ただし、本実施形態に係るデジタルカメラ50と第1の実施形態に係るデジタルカメラ1と異なる点は、図6及び図7に示すように、マイクロフォン23cが1つのみである。マイクロフォン23cには、不図示であるが、マイクロフォン23cが受信する音声の帯域を複数のバンドパスフィルタによって複数の帯域に分割して、その分割された各帯域のゲインを、指向性制御部27からの指示に基づいて調節することによって、マイクロフォン23cの指向性を変更する指向性変更回路が設けられている。したがって、本実施形態では、統計パラメータのデータとともに、各シーンに応じたA/D変換部24cの増幅率と指向性変更回路(不図示)によるマイクロフォン23cの各帯域に対応したバンドパスフィルタ毎のゲインとを一覧にした指向性データが、記憶部22にあらかじめ記録されているものとする。
【0052】
即ち、ステップS13において、シーン判定部26によるシーン判定が「不定」でないと判定された場合、ステップS14(NO側)において、指向性制御部27は、シーン判定部26によるシーン判定結果と記憶部22に記憶されている指向性データとに基づいて、A/D変換部24cの増幅率及び指向性変更回路(不図示)によるマイクロフォン23cの各帯域に対応するバンドパスフィルタ毎のゲインを設定して、マイクロフォン23cの指向性を制御する。一方、「不定」と判定された場合、ステップS15(YES側)において、指向性制御部27は、A/D変換部24cの増幅率とともに、指向性変更回路(不図示)にマイクロフォン23cの全ての帯域を用いるように各バンドパスフィルタのゲインを設定し、最も広い指向性となるように制御する。
【0053】
このように本実施形態では、所定のフレームレートで撮像される動画のフレーム画像毎に、撮影対象である被写体のシーンの種類や場面を判定し、その判定結果に応じてマイクロフォンの指向性を自動的に制御することで、シーンに応じて録音したい音声の方向が変化してしまう場合でも、最良な状態で音声を録音することができる。
【0054】
また、マイクロフォン23cが1つで済むことから、デジタルカメラ50の回路規模を小さくすることが可能となる。
≪第4の実施形態≫
本発明の第4の実施形態に係るデジタルカメラは、第1の実施形態に係るデジタルカメラ1と基本的に同じである。ただし、図8(b)に示すように、本実施形態におけるデジタルカメラ1における機能ブロックの構成が、図2(b)に示す第1の実施形態係るデジタルカメラ1の機能ブロックの構成と異なる。即ち、本実施形態に係るデジタルカメラ1では、ユーザが操作部材30のモード設定釦を用いて、ポートレートや風景等の撮像モードを選択設定することによって、指向性制御部27が、その設定された撮像モードに対応するシーンに応じた各A/D変換部24a〜24bの増幅率を指向性に基づいて決定し、マイクロフォン23a〜23bの指向性を制御する。これが、第1の実施形態のデジタルカメラと異なる点である。なお、本実施形態と第1の実施形態とのデジタルカメラ1において、同じ構成要素については、同じ符号を付し詳細な説明は省略する。
【0055】
次に、本実施形態に係るデジタルカメラ1の撮像手順について、図9のフローチャートを参照しながら説明する。なお、以下の説明では、ユーザがデジタルカメラ1を用いて、動画を撮像するものとして説明する。即ち、ユーザによって、あらかじめ操作部材30のモード設定釦によって、動画モードが選択設定されているものとする。
【0056】
ユーザにより操作部材30の電源釦が押されると、レンズ側CPU7及び本体側CPU18は、それぞれの不図示のメモリに記憶されている制御プログラムを読み込み、デジタルカメラ1のカメラ本体1a及び交換レンズ部1bをそれぞれ初期化する。本体側CPU18は、レンズ側CPU7を介して、焦点検出部4、距離検出部5及び絞り制御部6から焦点距離、撮像距離及び絞り値をそれぞれ取得するとともに、測光センサ10及び焦点検出部19から撮像レンズ2の焦点状態を取得する。同時に、本体側CPU18は、ユーザによる操作部材30のモード選択釦によって設定される撮像モードに応じて、マイクロフォン23a〜23bによる音声録音の指向性を制御するプログラムとともに、各シーンに応じた各A/D変換部24a〜24bの増幅率である指向性データを、記憶部22から読み込む。なお、本実施形態において、指向性データは、記憶部22にあらかじめ記録されているものとする。また、本実施形態における指向性データは、第1の実施形態及び第2の実施形態の指向性データと同じものである。そして、ステップS20からの処理が行われる。
【0057】
ステップS20:ユーザは、操作部材30のモード選択釦を用いて、撮像モードを選択設定する。
【0058】
ステップS21:本体側CPU18は、ユーザによって設定された撮像モードを識別し、本体側CPU18の指向性制御部27は、識別された撮像モードに対応するシーンに応じた各A/D変換部24a〜24bの増幅率を、指向性データに基づいて決定する。
【0059】
ステップS22:指向性制御部27は、ステップS21で決定した増幅率を、各A/D変換部24a〜24bの増幅回路に設定し、マイクロフォン23a〜23bの指向性を制御する。
【0060】
ステップS23:本体側CPU18は、ユーザによって操作部材30のレリーズ釦が押されて撮像開始指示の信号を受信すると、タイミングジェネレータ(不図示)を介して、クイックリターンミラー11を、撮像レンズ2を通過してくる被写体からの光束の光路上から退避させて、シャッタ制御部21にシャッタ14を開放させるとともに、所定のフレームレート(例えば、30fps)で、撮像素子16に被写体を間引き読み出しによる動画撮像を開始させる。
【0061】
ステップS24:本体側CPU18は、上記フレームレートで取得された各フレームの画像を、撮像素子16に順次出力させて、A/D変換部(不図示)にアナログからデジタルの信号に変換させ、画像処理部20に転送する。画像処理部20は、転送されてきた画像を、画像データ処理部28に入力して、その画像に対して、補間処理やホワイトバランス処理等の画像処理を施す。
【0062】
ステップS25:本体側CPU18は、ステップS24で画像データ処理部28によって処理された画像と、ステップS22で指向性が制御されたマイクロフォン23a〜23bによって録音された音声データとを関連付けて、記憶部22に順次記録する。
【0063】
ステップS26:本体側CPU18は、ユーザが押していたレリーズ釦が元の位置に戻される、或いは、ユーザが再度レリーズ釦を押すことによって、動画撮像の終了指令の信号を受信したか否かを判定する。撮像終了指令の信号を受信したと判定した場合(YES側)には、本体側CPU18は、タイミングジェネレータ(不図示)を介して、シャッタ制御部21にシャッタ14を閉じるとともに、クイックリターンミラー11を、撮像レンズ2からの光束の光路上である元の位置に戻して、一連の動画撮像を終了する。一方、本体側CPU18が、動画撮像の終了指令が出されていないと判定した場合には、ステップS24へ移行して、次のフレームの画像を取得して、ステップS24〜ステップS25の処理をユーザによって終了指令が出されるまで行い、一連の動画撮像を終了する。
【0064】
このように本実施形態では、あらかじめユーザによって操作部材30のモード選択釦で設定される撮像モードに対応する被写体のシーンに応じて、マイクロフォンの指向性を制御することにより、最良な状態で音声を録音することができる。
【0065】
また、操作部材30のモード選択釦による撮像モードによって、マイクロフォン23a〜23bの指向性の制御が行われることから、デジタルカメラ1の回路規模を小さくすることができる。
≪第5の実施形態≫
本発明の第5の実施形態に係るデジタルカメラは、基本的に、図1及び図2の第1の実施形態に係るデジタルカメラと、図8に示す第4の実施形態のデジタルカメラとを組み合わせたものであり、図10に示すような機能ブロックとなる。
【0066】
したがって、本実施形態に係るデジタルカメラ1は、最初に、ユーザが操作部材30のモード設定釦を用いて、ポートレートや風景等の撮像モードを選択設定することによって、その設定された撮像モードに対応するシーンに応じた各A/D変換部24a〜24bの増幅率が設定され、マイクロフォン23a〜23bの指向性が制御される。その後、デジタルカメラ1は、撮像される動画の各フレームの画像毎にシーン判定を行うことによって、その判定結果に応じて、A/D変換部24a〜24bの増幅率を適宜変更して、マイクロフォン23a〜23bの指向性を制御される。この点が、第1の実施形態及び第4の実施形態のデジタルカメラ1と異なる点である。なお、本実施形態と第1の実施形態とのデジタルカメラ1において、同じ構成要素については、同じ符号を付して詳細な説明は省略する。
【0067】
次に、本実施形態に係るデジタルカメラ1の撮像手順について、図11のフローチャートを参照しながら説明する。なお、以下の説明では、ユーザがデジタルカメラ1を用いて、動画を撮像するものとして説明する。即ち、ユーザによって、あらかじめ操作部材30のモード設定釦によって、動画モードが選択設定されているものとする。
【0068】
ユーザにより操作部材30の電源釦が押されると、レンズ側CPU7及び本体側CPU18は、それぞれの不図示のメモリに記憶されている制御プログラムを読み込み、デジタルカメラ1のカメラ本体1a及び交換レンズ部1bをそれぞれ初期化する。本体側CPU18は、レンズ側CPU7を介して、焦点検出部4、距離検出部5及び絞り制御部6から焦点距離、撮像距離及び絞り値をそれぞれ取得するとともに、測光センサ10及び焦点検出部19から撮像レンズ2の焦点状態を取得する。同時に、本体側CPU18は、ユーザによる操作部材30のモード選択釦によって設定される撮像モード、又はシーン判定部26によるシーン判定に応じて、マイクロフォン23a〜23bによる音声録音の指向性を制御するプログラム、シーン判定部26が撮像した画像に基づいてシーン判定するために用いる、ニューラルネットによる統計処理で必要な統計パラメータのデータ、及び各シーンに応じた各A/D変換部24a〜24bの増幅率である指向性データを、それぞれ記憶部22から読み込む。なお、本実施形態では、統計パラメータのデータ及び指向性データは、記憶部22にあらかじめ記録されているものとする。また、本実施形態における指向性データは、第1の実施形態、第2の実施形態及び第4の実施形態の指向性データと同じものである。そして、ステップS30からの処理が行われる。
【0069】
ステップS30:ユーザは、操作部材30のモード選択釦を用いて、撮像モードを選択設定する。
【0070】
ステップS31:本体側CPU18は、ユーザによって設定された撮像モードを識別し、本体側CPU18の指向性制御部27は、識別された撮像モードに対応するシーンに応じた各A/D変換部24a〜24bの増幅率を、指向性データに基づいて決定する。
【0071】
ステップS32:指向性制御部27は、ステップS31で決定した増幅率を、各A/D変換部24a〜24bの増幅回路に設定し、マイクロフォン23a〜23bの指向性を制御する。
【0072】
ステップS33:本体側CPU18は、ユーザによって操作部材30のレリーズ釦が押されて撮像開始指示の信号を受信すると、タイミングジェネレータ(不図示)を介して、クイックリターンミラー11を、撮像レンズ2を通過してくる被写体からの光束の光路上から退避させて、シャッタ制御部21にシャッタ14を開放させるとともに、所定のフレームレート(例えば、30fps)で、撮像素子16に被写体を間引き読み出しによる動画撮像を開始させる。
【0073】
ステップS34:本体側CPU18は、上記フレームレートで取得された各フレームの画像を、撮像素子16に順次出力させて、A/D変換部(不図示)にアナログからデジタルの信号に変換させ、画像処理部20に転送する。画像処理部20は、転送されてきた画像を、画像データ処理部28及び画像特徴量演算部29に入力する。画像データ処理部28は、その画像に対して、補間処理やホワイトバランス処理等の画像処理を施す。一方、画像特徴量演算部29は、画像を、例えば、50×50の領域に分割して、各領域においてR/G、B/G、輝度、動きベクトルX及び動きベクトルYの画像特徴量を算出し、各領域で求めたそれらの画像特徴量から、その画像における各画像特徴量の平均値と分散値とを算出する。画像特徴量演算部29は、それら画像特徴量の平均値と分散値とを、本体側CPU18のシーン判定部26へ転送する。
【0074】
ステップS35:本体側CPU18のシーン判定部26は、ステップS34で画像特徴量演算部29が算出した複数の画像特徴量の平均値及び分散値と、あらかじめ読み込んだ統計パラメータのデータとを用いて、図4に示すような、ニューラルネットによる統計処理を行い、画像に撮像されているシーンが、ポートレート、風景、スナップ、スポーツ、舞台撮影又はその他等のいずれかを判定する。
【0075】
ステップS36:本体側CPU18の指向性制御部27は、ステップS35におけるシーン判定部26によるシーン判定が適正か否かを判定する。本実施形態では、指向性制御部27は、図4に示す各適応度の値のうち、一番大きな適応度の値が閾値0.5以上有り且つ2番目に大きな適応度の値の3倍以上の値である場合、シーン判定部26によるシーン推定は適正であると判定し、ステップS37(YES側)へ移行する。一方、一番大きな適応度の値が閾値0.5より小さい又は2番目に大きな適応度の値の3倍より小さい値である場合、指向性制御部27は、シーン判定部26によるシーン判定が適正ではないとして「不定」と判定して、ステップS38(NO側)へ移行する。
【0076】
ステップS37:指向性制御部27は、シーン判定部26によるシーン判定の結果と指向性データに基づいて、マイクロフォン23a〜23bの各々における指向性を制御するためのA/D変換部24a〜24bの増幅率を決定する。
【0077】
ステップS38:指向性制御部27は、ステップS35において、シーン判定部26によるシーン判定の結果を「不定」と判定した場合には、ステップS32で設定された撮像モードに応じた増幅率を用いる決定を行う。
【0078】
ステップS39:指向性制御部27は、ステップS37又はステップS38で決定した増幅率を、各A/D変換部24a〜24bに設定して、マイクロフォン23a〜23bの指向性を制御して音声を録音する。
【0079】
ステップS40:本体側CPU18は、ステップS34で画像データ処理部28によって処理された画像と、ステップS39でマイクロフォン23a〜23bによって録音された音声データとを関連付けて、記憶部22に順次記録する。
【0080】
ステップS41:本体側CPU18は、ユーザが押していたレリーズ釦が元の位置に戻される、或いは、ユーザが再度レリーズ釦を押すことによって、動画撮像の終了指令の信号を受信したか否かを判定する。撮像終了指令の信号を受信したと判定した場合(YES側)には、本体側CPU18は、タイミングジェネレータ(不図示)を介して、シャッタ制御部21にシャッタ14を閉じるとともに、クイックリターンミラー11を、撮像レンズ2からの光束の光路上である元の位置に戻して、一連の動画撮像を終了する。一方、本体側CPU18が、動画撮像の終了指令が出されていないと判定した場合には、ステップS11へ移行して、次のフレームの画像を取得して、ステップS34〜ステップS40の処理をユーザによって終了指令が出されるまで行い、一連の動画撮像を終了する。
【0081】
このように本実施形態では、あらかじめユーザによって操作部材30のモード選択釦で設定される撮像モードによって決まるマイクロフォンの指向性、又は撮像される動画の各フレームの画像毎に、撮影対象である被写体のシーンの種類や場面の判定結果に応じて決まるマイクロフォンの指向性を選択しながら制御することによって、シーンに応じて録音したい音声の方向が変化してしまう場合でも、最良な状態で音声を録音することができる。
≪実施形態の補足事項≫
第1の実施形態、第2の実施形態、第4の実施形態及び第5の実施形態において、マイクロフォン23a〜23bの位置は、図2(a)、図8(a)及び図10(a)に示すように、被写体側から見た場合、カメラ本体1aの右上に2つ水平に並んで配置されたが、本発明はこれに限定されない。任意の位置にマイクロフォンを配置しても良い。
【0082】
なお、第1の実施形態、第2の実施形態、第4の実施形態及び第5の実施形態において、音声の録音は2つの指向性の異なるマイクロフォン23a〜23bで行ったが、本発明はこれに限定されず、3つ以上の指向性の異なるマイクロフォンを用いて行っても良い。
【0083】
なお、第1の実施形態、第2の実施形態、第4の実施形態及び第5の実施形態において、指向性データは、各シーンに応じたA/D変換部24a〜24bの各々に対する増幅率の一覧として、例えば、ポートレートのシーンの場合には、被写体が人物であることから、A/D変換部24a及びA/D変換部24bの増幅率をそれぞれ100対0等とするとしたが、本発明はこれに限定されず、各シーンに応じて、マイクロフォン23a〜23bの指向性を制御するための各A/D変換部24a〜24bの増幅率の組み合わせは、シーンに応じて適宜決めることが好ましい。
【0084】
なお、第1の実施形態、第2の実施形態及び第5の実施形態において、動画を撮像する場合について説明したが、本発明はこれに限定されず、静止画像の撮像の場合にも適用可能である。ただし、その場合には、静止画像を撮像する前に、マイクロフォン23a〜23bの指向性を制御するために、シーン判定部26によるシーン判定に応じたA/D変換部24a〜24bの増幅率をあらかじめ決めておくことが好ましい。即ち、例えば、測光センサ10によって撮像されるスルー画に基づいて、シーン判定部26がシーン判定を行い、その判定結果と記憶部22に記憶されている指向性データとに基づいて、指向性制御部27が、静止画像の撮像前に、A/D変換部24a〜24bの増幅率を決定する。
【0085】
なお、第1の実施形態ないし第3の実施形態及び第5の実施形態において、画像特徴量演算部29はフレーム画像を50×50の領域に分割して、画像特徴量を求める演算を行ったが、本発明はこれに限定されない。例えば、フレーム画像を100×100等の任意の数の領域に分割して演算を行っても良い。
【0086】
なお、第1の実施形態ないし第3の実施形態及び第5の実施形態において、図4又は図5の階層型ニューラルネットの出力結果である各シーンの適応度の値が、全て足した値が1になるように規格化した値を用いたが、本発明はこれに限定されない。例えば、各適応度の値を百分率で表しても良いし、規格化されていない値で表しても良い。
【0087】
なお、第1の実施形態ないし第3の実施形態及び第5の実施形態において、指向性制御部27によるシーン判定部26のシーン判定の可否を判定するために、基準となる閾値として0.5、0.2又は3倍の値を用いたが、本発明はこれに限定されず、任意の値を適宜選択して用いることが好ましい。
【0088】
なお、第1の実施形態ないし第3の実施形態及び第5の実施形態において、図4又は図5に示すような、入力パラメータが10個又は14個の階層型ニューラルネットに基づいて、シーン判定部26は画像のシーン判定をおこなったが、本発明はこれに限定されず、エッジ量等の他の画像特徴量を入力パラメータとして用いても良い。
【0089】
なお、第1の実施形態ないし第3の実施形態及び第5の実施形態において、各シーンの適応度として、ポートレート適応度、風景適応度、スナップ適応度、スポーツ適応度、舞台撮影適応度、その他適応度の6つを用いたが、本発明はこれに限定されず、他の任意のシーンの適応度を追加しても良い。
【0090】
なお、第3の実施形態及び第5の実施形態において、シーン判定部26は、10個の画像特徴量であるR/G、B/G、輝度、動きベクトルX及び動きベクトルYの各々の平均値及び分散値を入力パラメータとした、図4に示す階層型ニューラルネットによる統計処理に基づいて、画像のシーン判定を行ったが、本発明はこれに限定されない。例えば、シーン判定部26は、焦点検出部4による焦点距離、距離検出部5による撮影距離、焦点検出部19による複数の測定点における位相差方式によって検出された撮像レンズ2の焦点状態である焦点検出値の分散値、及びフレーム画像において顔検出された顔サイズを加えた、図5に示す14個の入力パラメータによる階層型ニューラルネットによる統計処理に基づいて、シーン判定を行っても良い。
【0091】
なお、第3の実施形態において、マイクロフォン23cの位置は、図7(a)に示すように、被写体側から見た場合、カメラ本体1aの右上に配置されたが、本発明はこれに限定されない。任意の位置にマイクロフォンを配置しても良い。
【0092】
なお、第3の実施形態において、各シーンに応じたA/D変換部24cの増幅率及び指向性変更回路(不図示)によるマイクロフォン23cの各帯域に対応するバンドパスフィルタのゲインの値の組み合わせは、シーンに応じて適宜決めることが好ましい。
【0093】
なお、第3の実施形態において、動画を撮像する場合について説明したが、本発明はこれに限定されず、静止画像の撮像の場合にも適用可能である。ただし、その場合には、静止画像を撮像する前に、マイクロフォン23cの指向性を制御するために、シーン判定部26によるシーン判定に応じたA/D変換部24cの増幅率及び指向性変更回路(不図示)によるマイクロフォン23cの各帯域に対応するバンドパスフィルタのゲインをあらかじめ決めておくことが好ましい。即ち、例えば、測光センサ10によって撮像されるスルー画に基づいて、シーン判定部26がシーン判定を行い、その判定結果と記憶部22に記憶されている指向性データとに基づいて、指向性制御部27が、静止画像の撮像前に、A/D変換部24cの増幅率及び指向性変更回路(不図示)によるマイクロフォン23cの各帯域に対応するバンドパスフィルタのゲインを決定する。
【0094】
なお、第4の実施形態において、動画を撮像する場合について説明したが、本発明はこれに限定されず、静止画像の撮像の場合にも適用可能である。
【0095】
なお、本発明は、スチルカメラ、ビデオカメラ、デジタルカメラが内蔵された携帯電話等に対しても適用可能である
本発明は、その精神またはその主要な特徴から逸脱することなく他の様々な形で実施することができる。そのため、上述した実施形態はあらゆる点で単なる例示に過ぎず、限定的に解釈されてはならない。さらに、特許請求の範囲の均等範囲に属する変形や変更は、全て本発明の範囲内である。
【符号の説明】
【0096】
1 デジタルカメラ、1a カメラ本体、1b 交換レンズ部1b、2 撮像レンズ、3絞り、4 焦点距離検出部、5 距離検出部、6 絞り制御部、7 レンズ側CPU、8 ペンタプリズム、9 再結像レンズ、10 測光センサ、11 クイックリターンミラー、12 サブミラー、13 焦点板、14 シャッタ、15 接眼レンズ、16 撮像素子、17 表示部、18 本体側CPU、19 焦点検出部、20 画像処理部、21 シャッタ制御部、22 記憶部、23a〜23b マイクロフォン
【先行技術文献】
【特許文献】
【0097】
【特許文献1】特開2006−222618号公報
【特許請求の範囲】
【請求項1】
画像を撮像する撮像部と、
前記画像に対応する音声を指向性を変化させて取得可能な音声取得部と、
前記画像に含まれる被写体を判定する判定部と、
前記判定部の判定結果に応じて前記音声取得部の指向性が変化するように制御する制御部とを含むことを特徴とする撮像装置。
【請求項2】
請求項1に記載された撮像装置であって、
撮影者により操作可能な操作部と、
前記操作部の状態に応じて撮影条件を変更する撮影条件変更部とを含み、
前記制御部は、前記判定部の判定結果、及び、前記操作部の状態に基づいて制御を行うことを特徴とする撮像装置。
【請求項3】
請求項2に記載された撮像装置であって、
前記制御部は、前記操作部の状態よりも前記判定部の判定結果を優先して制御を行うことを特徴とする撮像装置。
【請求項4】
請求項1から請求項3までの何れか1項に記載された撮像装置であって、
前記判定部は、前記画像から求めた特徴量に基づいてパターン認識をすることにより、前記画像に含まれる前記被写体を判定する
ことを特徴とする撮像装置。
【請求項5】
請求項4に記載された撮像装置であって、
前記判定部は、あらかじめ複数の被写体についての複数の画像を用いて、前記複数の画像各々の前記特徴量と前記複数の被写体の各々の対象とを、前記各対象を特徴付けるパターンに基づいて関係付ける複数の統計パラメータを有し、前記複数の統計パラメータを用いた統計処理によって、前記撮像部によって撮像された前記画像における前記被写体の対象を特徴付けるパターンを認識することを特徴とする撮像装置。
ことを特徴とする撮像装置。
【請求項6】
請求項5に記載された撮像装置であって、
前記統計処理は、ニューラルネットであることを特徴とする撮像装置。
【請求項7】
請求項1から請求項6までの何れか1項に記載された撮像装置であって、
前記音声取得部は、前記音声の指向性を変更するための指向性変更回路を含むことを特徴とする撮像装置。
【請求項8】
請求項1から請求項6までの何れか1項に記載された撮像装置であって、
前記音声取得部は、それぞれ指向性の異なる複数のマイクロフォンを含み、
前記制御部は、前記判定部の判定結果に応じて前記複数のマイクロフォンのゲインを制御することを特徴とする撮像装置。
【請求項1】
画像を撮像する撮像部と、
前記画像に対応する音声を指向性を変化させて取得可能な音声取得部と、
前記画像に含まれる被写体を判定する判定部と、
前記判定部の判定結果に応じて前記音声取得部の指向性が変化するように制御する制御部とを含むことを特徴とする撮像装置。
【請求項2】
請求項1に記載された撮像装置であって、
撮影者により操作可能な操作部と、
前記操作部の状態に応じて撮影条件を変更する撮影条件変更部とを含み、
前記制御部は、前記判定部の判定結果、及び、前記操作部の状態に基づいて制御を行うことを特徴とする撮像装置。
【請求項3】
請求項2に記載された撮像装置であって、
前記制御部は、前記操作部の状態よりも前記判定部の判定結果を優先して制御を行うことを特徴とする撮像装置。
【請求項4】
請求項1から請求項3までの何れか1項に記載された撮像装置であって、
前記判定部は、前記画像から求めた特徴量に基づいてパターン認識をすることにより、前記画像に含まれる前記被写体を判定する
ことを特徴とする撮像装置。
【請求項5】
請求項4に記載された撮像装置であって、
前記判定部は、あらかじめ複数の被写体についての複数の画像を用いて、前記複数の画像各々の前記特徴量と前記複数の被写体の各々の対象とを、前記各対象を特徴付けるパターンに基づいて関係付ける複数の統計パラメータを有し、前記複数の統計パラメータを用いた統計処理によって、前記撮像部によって撮像された前記画像における前記被写体の対象を特徴付けるパターンを認識することを特徴とする撮像装置。
ことを特徴とする撮像装置。
【請求項6】
請求項5に記載された撮像装置であって、
前記統計処理は、ニューラルネットであることを特徴とする撮像装置。
【請求項7】
請求項1から請求項6までの何れか1項に記載された撮像装置であって、
前記音声取得部は、前記音声の指向性を変更するための指向性変更回路を含むことを特徴とする撮像装置。
【請求項8】
請求項1から請求項6までの何れか1項に記載された撮像装置であって、
前記音声取得部は、それぞれ指向性の異なる複数のマイクロフォンを含み、
前記制御部は、前記判定部の判定結果に応じて前記複数のマイクロフォンのゲインを制御することを特徴とする撮像装置。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【公開番号】特開2010−183252(P2010−183252A)
【公開日】平成22年8月19日(2010.8.19)
【国際特許分類】
【出願番号】特願2009−23762(P2009−23762)
【出願日】平成21年2月4日(2009.2.4)
【出願人】(000004112)株式会社ニコン (12,601)
【Fターム(参考)】
【公開日】平成22年8月19日(2010.8.19)
【国際特許分類】
【出願日】平成21年2月4日(2009.2.4)
【出願人】(000004112)株式会社ニコン (12,601)
【Fターム(参考)】
[ Back to top ]