説明

撮像装置

【課題】複数の静止画像から得た1枚の静止画像に対して適切な音響信号を関連付ける。
【解決手段】撮影範囲331内の被写体を撮影することで1枚目の対象入力画像を取得した後、撮影方向を右方向へ変更し、撮影範囲332内の被写体を撮影することで2枚目の対象入力画像を取得する。2枚の対象入力画像をイメージモザイキングによって貼り合わせ合成することで目標合成画像を生成する。一方、複数のマイクロホンの出力音響信号に指向性制御を施すことにより、1枚目の対象入力画像の撮影時においては撮像装置の右方側(被写体321側)に指向軸を持った音響信号を生成し、2枚目の対象入力画像の撮影時においては撮像装置の左方側(被写体321側)に指向軸を持った音響信号を生成する。そして、生成した音響信号を時系列上に結合したリンク音響信号を目標合成画像に関連付けて記録する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、デジタルカメラ等の撮像装置に関する。
【背景技術】
【0002】
近年、音声付き静止画像(換言すれば音響信号付き静止画像)を生成する方法が提案されている。
【0003】
例えば、下記特許文献1には、静止画像の撮影時に所定時間分の音響信号を記録する方法が開示されている。また例えば、下記特許文献2には、記録済みの音響信号及び動画像から音声付き静止画像を抽出する方法が開示されている。また例えば、下記特許文献3には、1つの音響信号に対して複数の静止画像を関連付けておき、音響信号の再生時には再生音内容に応じた静止画像再生を行う方法が開示されている。
【0004】
また例えば、撮影画像から特定被写体の存在する切り出し画像を切り出す一方で、複数のマイクロホンの出力音響信号にステレオ化処理を実行することで特定被写体から発せられる音の成分を強調した音響信号を生成し、生成した音響信号を切り出し画像と共に記録媒体に記録する方法が、下記特許文献4にて提案されている。
【0005】
他方、複数の静止画像から1枚の静止画像を生成する方法も提案されている。例えば、撮影方向を変えながら静止画像撮影を複数回を行い、得られた複数の静止画像をイメージモザイキングによって貼り合わせ合成することで広画角を有するパノラマ画像を生成する方法が提案されている。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開平10−294919号公報
【特許文献2】特開2006−295575号公報
【特許文献3】特開2001−69453号公報
【特許文献4】特開2009−147727号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
音響信号に関わる上述の従来方法は、撮影された静止画像そのもの或いは静止画像の一部画像(切り出し画像)に音響信号を割り当てる方法であり、複数の静止画像から生成されるパノラマ画像等への適用は想定されていない。従って、複数の静止画像から生成されるパノラマ画像等に適切な音響信号を関連付ける技術の開発が要望される。
【0008】
また、特許文献4の方法は、記録される切り出し画像の画角に適応した音響信号を生成及び記録できるという点において高い付加価値を有する。しかしながら、この方法は、切り出し処理との関連において用いられる方法であって、動画像から抽出したフレーム画像そのものに対して適用される方法ではない。よって、動画像から抽出したフレーム画像に適切な音響信号を関連付けることのできる技術の開発が要望される。
【0009】
そこで本発明は、複数の静止画像から得た静止画像又は動画像から抽出された静止画像に対して適切な音響信号を関連付けることのできる撮像装置を提供することを目的とする。
【課題を解決するための手段】
【0010】
本発明に係る撮像装置は、撮影方向が互いに異なるm枚の入力画像を撮影する撮像部と(mは2以上の整数)、複数のマイクロホンから成るマイク部と、前記m枚の入力画像又は前記m枚の入力画像から抽出したm枚の抽出画像を合成することで出力画像を生成する画像合成部と、前記m枚の入力画像の撮影期間中における前記複数のマイクロホンの出力音響信号から指向性を有するリンク音響信号を生成する指向性制御部と、前記出力画像と前記リンク音響信号を関連付ける関連付け部と、を備えたことを特徴とする。
【0011】
具体的には例えば、前記出力画像は、特定の被写体の画像信号を有し、前記指向性制御部は、前記特定の被写体より到来する音の成分が強調されるように前記リンク音響信号を生成すると良い。
【0012】
これにより、特定の被写体からの音に注目したような、出力画像に適した音響信号を出力画像に関連付けることが可能となる。
【0013】
また例えば、前記撮像部は、前記m枚の入力画像を含むn枚の入力画像を撮影し(nは整数であって、n>m)、前記撮像装置に、前記n枚の入力画像の内の、互いに異なる入力画像間の動き量を検出する動き検出部と、前記動き検出部の検出結果に基づいて、前記n枚の入力画像の中から前記出力画像の元となる前記m枚の入力画像を選択する画像選択部と、を更に設けるようにしても良い。
【0014】
或いは例えば、前記撮像部は、前記m枚の入力画像を含むn枚の入力画像を撮影し(nは整数であって、n>m)、前記撮像装置に、前記複数のマイクロホンの出力音響信号に基づき、音源としての前記特定の被写体が位置する方向を推定する音源方向推定部と、前記音源方向推定部の推定結果に基づいて、前記n枚の入力画像の中から前記出力画像の元となる前記m枚の入力画像を選択する画像選択部と、を更に設けるようにしても良い。
【0015】
本発明に係る他の撮像装置は、複数のフレーム画像から成る動画像を撮影する撮像部と、複数のマイクロホンから成るマイク部と、前記動画像から特定のフレーム画像を対象静止画像として抽出する対象静止画像抽出部と、前記特定のフレーム画像の撮影時点を基準とする特定期間中における前記複数のマイクロホンの出力音響信号から、前記対象静止画像の画角に応じた指向性を有するリンク音響信号を生成する指向性制御部と、前記対象静止画像と前記リンク音響信号を関連付ける関連付け部と、を備えたことを特徴とする。
【0016】
具体的には例えば、前記指向性制御部は、前記対象静止画像の画角内に位置する被写体からの音の成分が強調されるように前記リンク音響信号を生成すると良い。
【0017】
これにより、対象静止画像上の被写体に注目したような、対象静止画像に適した音響信号を対象静止画像に関連付けることが可能となる。
【発明の効果】
【0018】
本発明によれば、複数の静止画像から得た静止画像又は動画像から抽出された静止画像に対して適切な音響信号を関連付けることのできる撮像装置を提供することができる。
【0019】
本発明の意義ないし効果は、以下に示す実施の形態の説明により更に明らかとなろう。ただし、以下の実施の形態は、あくまでも本発明の一つの実施形態であって、本発明ないし各構成要件の用語の意義は、以下の実施の形態に記載されたものに制限されるものではない。
【図面の簡単な説明】
【0020】
【図1】本発明の実施形態に係る撮像装置の全体ブロック図である。
【図2】図1に示される撮像部の内部構成図である。
【図3】図1に示されるマイク部及び音響信号処理部の概略内部ブロック図である。
【図4】図1に示される撮像装置の外観斜視図である。
【図5】図3のチャンネル音響信号生成部にて生成されるR信号及びL信号のポーラパターン例を示す図(a)及び(b)と、音源の角度を説明するための図(c)である。
【図6】本発明の第1実施例に係り、撮像装置の前方に広がる風景を示す図(a)と、1回目及び2回目のシャッタ操作時における撮影範囲を示す図(b)と、1回目及び2回目のシャッタ操作時における風景と撮像装置との関係イメージ図(c)である。
【図7】本発明の第1実施例に係る撮像装置の動作手順を示すフローチャートである。
【図8】本発明の第1実施例に係る2枚の対象入力画像を示す図である。
【図9】図8に示される2枚の対象入力画像から生成可能な目標合成画像を示す図である。
【図10】本発明の第1実施例に係り、各対象入力画像の撮影時刻を基準とした対象期間の設定方法を説明するための図である。
【図11】図8に示される2枚の対象入力画像から生成可能な他の目標合成画像を示す図である。
【図12】図11の目標合成画像の生成時に設定される切り出し枠を説明するための図である。
【図13】本発明の第1実施例に係り、対象合成画像に基づく動画像の構成を表す図である。
【図14】本発明の第2実施例に係り、1〜3回目のシャッタ操作時における風景と撮像装置との関係イメージ図(a)と、1〜3回目のシャッタ操作時における撮影範囲を示す図(b)である。
【図15】本発明の第2実施例に係る3枚の対象入力画像を示す図である。
【図16】図15に示される3枚の対象入力画像から生成可能な目標合成画像を示す図である。
【図17】本発明の第3実施例に係り、1回目及び2回目のシャッタ操作時における風景と撮像装置との関係イメージ図である。
【図18】本発明の第4実施例の動作に特に関与する部位のブロック図である。
【図19】本発明の第4実施例に係る入力画像列を示す図である。
【図20】本発明の第5実施例の動作に特に関与する部位のブロック図である。
【図21】本発明の第6実施例に係る強調対象エリアを説明するための図である。
【図22】本発明の第6実施例に係り、撮像装置の前方に広がる風景を示す図である。
【図23】本発明の第6実施例に係る動画像を示す図である。
【図24】本発明の第6実施例に係り、抽出期間の意義を説明するための図(a)と、抽出期間中の音響信号から強調音響信号が生成される様子を示す図(b)である。
【図25】2枚の対象入力画像から生成される目標合成画像と、該目標合成画像内に設定される強調対象画像領域を表す図である。
【発明を実施するための形態】
【0021】
以下、本発明の一実施形態につき、図面を参照して具体的に説明する。参照される各図において、同一の部分には同一の符号を付し、同一の部分に関する重複する説明を原則として省略する。
【0022】
図1は、本発明の実施形態に係る撮像装置1の全体ブロック図である。撮像装置1は、符号11〜28によって参照される各部位を有する。撮像装置1は、デジタルビデオカメラであり、動画像及び静止画像を撮影可能となっていると共に動画像撮影中に静止画像を同時に撮影することも可能となっている。撮像装置1内の各部位は、バス24又は25を介して、各部位間の信号(データ)のやり取りを行う。尚、表示部27及び/又はスピーカ28は撮像装置1の外部装置(不図示)に設けられたものである、と解釈することも可能である。
【0023】
撮像部11は、撮像素子を用いて被写体の撮影を行う。図2は、撮像部11の内部構成図である。撮像部11は、光学系35と、絞り32と、CCD(Charge Coupled Device)又はCMOS(Complementary Metal Oxide Semiconductor)イメージセンサなどから成る撮像素子(固体撮像素子)33と、光学系35や絞り32を駆動制御するためのドライバ34と、を有している。光学系35は、撮像部11の画角を調節するためのズームレンズ30及び焦点を合わせるためのフォーカスレンズ31を含む複数枚のレンズから形成される。ズームレンズ30及びフォーカスレンズ31は光軸方向に移動可能である。CPU23からの撮影制御信号に基づき、光学系35内におけるズームレンズ30及びフォーカスレンズ31の位置並びに絞り32の開度が制御される。
【0024】
撮像素子33は、水平及び垂直方向に複数の受光画素が配列されることによって形成される。撮像素子33の各受光画素は、光学系35及び絞り32を介して入射した被写体の光学像を光電変換し、該光電変換によって得られた電気信号をAFE12(Analog Front End)に出力する。
【0025】
AFE12は、撮像素子33(各受光画素)から出力されるアナログ信号を増幅し、増幅されたアナログ信号をデジタル信号に変換してから画像信号処理部13に出力する。AFE12における信号増幅の増幅度はCPU(Central Processing Unit)23によって制御される。画像信号処理部13は、AFE12の出力信号によって表される画像に対して必要な画像処理を施し、画像処理後の画像を表す画像信号を生成する。画像信号は、例えば、輝度信号及び色差信号を含む。マイク部14は、撮像装置1の周辺音をアナログの音響信号に変換し、音響信号処理部15は、このアナログの音響信号をデジタルの音響信号に変換する。
【0026】
圧縮処理部16は、画像信号処理部13からの画像信号及び音響信号処理部15からの音響信号を、所定の圧縮方式を用いて圧縮する。内部メモリ17は、DRAM(Dynamic Random Access Memory)などから成り、各種のデータを一時的に保存する。記録媒体としての外部メモリ18は、半導体メモリや磁気ディスクなどの不揮発性メモリであり、圧縮処理部16による圧縮後の画像信号及び音響信号などの各種信号を記録することができる。
【0027】
伸張処理部19は、外部メモリ18から読み出された圧縮された画像信号及び音響信号を伸張する。伸張処理部19による伸張後の画像信号又は画像信号処理部13からの画像信号は、表示処理部20を介して、液晶ディスプレイ等から成る表示部27に送られて画像として表示される。また、伸張処理部19による伸張後の音響信号は、音響信号出力回路21を介してスピーカ28に送られて音として出力される。
【0028】
TG(タイミングジェネレータ)22は、撮像装置1全体における各動作のタイミングを制御するためのタイミング制御信号を生成し、生成したタイミング制御信号を撮像装置1内の各部に与える。タイミング制御信号は、垂直同期信号Vsyncと水平同期信号Hsyncを含む。CPU23は、撮像装置1内の各部位の動作を統括的に制御する。操作部26は、動画像の撮影及び記録の開始/終了を指示するための録画ボタン26a、静止画像の撮影及び記録を指示するためのシャッタボタン26b、並びに、ズーム倍率を指定するためのズームボタン26c等を有し、ユーザによる各種操作を受け付ける。操作部26に対する操作内容はCPU23に伝達される。
【0029】
撮像装置1の動作モードには、画像(静止画像又は動画像)の撮影及び記録が可能な撮影モードと、外部メモリ18に記録された画像(静止画像又は動画像)を表示部27に再生表示する再生モードと、が含まれる。操作部26に対する操作に応じて、各モード間の遷移は実施される。撮影モードにおいて、撮像装置1は、所定のフレーム周期にて周期的に被写体の撮影を行って被写体の撮影画像を順次取得することができる。
【0030】
尚、本明細書では、或る画像の画像信号のことを単に画像と言うこともある。また、画像信号及び音響信号の圧縮及び伸張は、本発明の本質とは関係ないため、以下の説明では、特に必要のない限り、画像信号及び音響信号の圧縮及び伸張の存在を無視する。従って、或る画像についての圧縮された画像信号を記録することを、単に、画像信号を記録する又は画像を記録すると表現することがある(音響信号についても同様)。また、或る画像の大きさ又は画像領域の大きさを、画像サイズとも呼ぶ。注目画像又は注目画像領域の画像サイズを、注目画像を形成する画素の数又は注目画像領域に属する画素の数にて表現することができる。
【0031】
図3は、マイク部14及び音響信号処理部15の概略内部ブロック図である。図4は、撮像装置1の外観斜視図である。マイク部14は、撮像装置1の筐体上の互いに異なる位置に配置されたマイクロホン14L及び14Rを備える。マイクロホン14Lは撮像装置1の筐体の左側に配置され、マイクロホン14Rは撮像装置1の筐体の右側に配置されている。音響信号処理部15には、A/D変換器51L及び51Rと、チャンネル信号生成部52と、リンク音響信号生成部53と、が備えられている。
【0032】
マイクロホン14L及び14Rの夫々は、自身が収音した音をアナログの音響信号に変換して出力する。A/D変換器51L及び51Rは、夫々、マイクロホン14L及び14Rから出力されるアナログの音響信号を所定のサンプリング周期(例えば48キロヘルツ)にてデジタルの音響信号に変換して出力する。A/D変換器51Lの出力信号を特に左原信号と呼び、A/D変換器51Rの出力信号を特に右原信号と呼ぶ。チャンネル音響信号生成部52は、左原信号及び右原信号に基づいて、互いに異なる方向に指向軸を有するL信号及びR信号を生成する。
【0033】
図4に示す如く、撮像部11にて撮影可能な被写体が存在する方向を前方と定義し、その逆の方向を後方と定義する。前方及び後方は、撮像部11の光軸に沿った方向である。また、右及び左とは、後方側から前方側を見たときの右及び左を意味するものとする。
【0034】
マイクロホン14L及び14Rとして、指向性を有さない無指向性マイクロホンを採用することができる。マイクロホン14L及び14Rが無指向性マイクロホンである場合、左原信号及び右原信号は無指向性の音響信号(指向性を有さない音響信号)である。チャンネル音響信号生成部52は、公知の指向性制御(ステレオ化処理)を無指向性の左原信号及び右原信号に施すことでL信号及びR信号を生成することができる。
【0035】
無指向性の左原信号及び右原信号に対する指向性制御は、左原信号又は右原信号を遅延させる遅延処理と、左原信号又は右原信号を所定割合だけ減衰させる減衰処理と、遅延処理及び/又は減衰処理を経た左原信号及び右原信号の一方から他方を減算する減算処理と、によって実現される。具体的には例えば、指向性制御では、左原信号をマイクロホン14L及び14R間の距離に基づく時間だけ遅延させ且つ所定割合だけ減衰させることによって得た信号を、右原信号から減算することにより、左斜め後方45°の方向に死角を有するR信号を生成することができる。このR信号のポーラパターンは図5(a)の曲線310のようになり、R信号は右斜め前方45°の方向に指向軸を有するようになる。即ち、図5(a)に対応するR信号は、撮像装置1の右斜め前方45°に位置する音源から撮像装置1に到来した音の成分に最も高い指向性を持った音響信号となる。同様に、右原信号をマイクロホン14L及び14R間の距離に基づく時間だけ遅延させ且つ所定割合だけ減衰させることによって得た信号を、左原信号から減算することにより、右斜め後方45°の方向に死角を有するL信号を生成することができる。このL信号のポーラパターンは図5(b)の曲線311のようになり、L信号は左斜め前方45°の方向に指向軸を有するようになる。即ち、図5(b)に対応するL信号は、撮像装置1の左斜め前方45°に位置する音源から撮像装置1に到来した音の成分に最も高い指向性を持った音響信号となる。
【0036】
マイクロホン14L及び14Rとして、指向性を有する指向性マイクロホン(例えば、単一指向性マイクロホン)を採用することもできる。この場合、指向性マイクロホンとしてのマイクロホン14Lの指向軸の方向を左斜め前方45°の方向に向けておくと共に、指向性マイクロホンとしてのマイクロホン14Rの指向軸の方向を右斜め前方45°の方向に向けておく。これにより、左原信号そのものをL信号とし、右原信号そのものをR信号として生成することができる。尚、上述したL信号及びR信号の指向性の具体的内容は例示であり、それらを様々に変形可能であることは言うまでもない。
【0037】
また、図5(c)に示すような、X軸及びY軸を座標軸としたXY座標面(XY座標系)を定義する。X軸は、マイクロホン14Lの中心とマイクロホン14Rの中心とを通る軸であり、それらの中心の中間に原点Oが位置する。Y軸は、原点OにてX軸と直交する。Y軸に沿った方向は、撮像部11の光軸(撮像素子33にとっての光軸)の方向と一致する。X軸及びY軸は水平面と平行であるとする。原点Oからマイクロホン14Rに向かう方向(即ち、撮像装置1の右方向)がX軸の正方向であるとし、原点Oから撮像装置1の前方に向かう方向がY軸の正方向であるとする。線分313は、原点Oと任意の音源である音源SSとを結ぶ線分である。X軸と線分313との成す角度をθで表す。但し、角度θは、原点Oとマイクロホン14Rの中心とを結ぶ線分から反時計周り方向に線分313を見たときの、X軸及び線分313間の角度であるとする。反時計周り方向とは、原点Oからマイクロホン14Rの中心に伸びる線分を、撮像装置1の前方側に回転させる方向を指す。音源SSの角度θは、音源SSの位置する方向(即ち、音源SSについての音源方向)を表す。
【0038】
図3のリンク音響信号生成部53は、左原信号及び右原信号より或いはL信号及びR信号よりリンク音響信号を生成する(詳細は後述)。録画ボタン26aの押下操作に伴う通常の動画像の撮影時においては、L信号及びR信号が動画像の画像信号と共に外部メモリ18に記録される。但し、撮像装置1には音声付き静止画像(換言すれば音響信号付き静止画像)を生成する特殊機能が備えられており、この特殊機能が有効とされている場合、リンク音響信号が生成されて該リンク音響信号が特定の静止画像に関連付けられて外部メモリ18に記録されると共に、再生モードにおいては表示部27及びスピーカ28を用いて該特定の静止画像が該リンク音響信号と共に再生される。撮影モードの一種である、上記特殊機能が働く撮像装置1の動作モードを特殊撮影モードと呼ぶ。
【0039】
以下、特殊撮影モードにおける撮像装置1の動作及び構成例を第1〜第6実施例として説明する。矛盾なき限り、或る実施例について記載した事項を他の実施例に適用することも可能である。以下の説明は、特に記述なき限り、特殊撮影モードにおける撮像装置1の動作の説明である。
【0040】
<<第1実施例>>
第1実施例を説明する。図6(a)に、撮像装置1の前方に広がる風景を示す。符号320が付された実線枠内の絵が、撮像装置1の前方に広がる風景である。風景320の中央付近には人物である被写体321が存在しており、被写体321の背景に山が存在している。被写体321は、発声によって音を発生する音源としての機能も持つ。
【0041】
風景320の全体を同時に撮影画角内に収めることはできないが、ユーザが風景320の全体が写し出された画像の取得を希望していたとする。撮影画角とは、撮像部11の画角を指す。図7は、その希望画像の生成手順を表すフローチャートである。この場合、ユーザは、まず、風景320の左側部分のみを撮影範囲に収めた状態で1回目のシャッタ操作を成す(ステップS11)。図6(b)の符号331が付された破線矩形枠内の範囲が、1回目のシャッタ操作が成された時点における撮影範囲である。
【0042】
シャッタ操作とは、シャッタボタン26bを押下する操作である。但し、シャッタ操作は、シャッタボタン26bを押下する操作以外の操作(例えば所定のタッチパネル操作)であっても良い。撮影範囲とは、撮影画角内に収まる領域(実空間上の領域)を指し、該領域内に位置する各被写体の像が撮像素子33上に結像する。シャッタ操作が成されると、シャッタ操作が成された時点における撮影範囲内の各被写体が撮影される。即ち、シャッタ操作が成された時点において撮影範囲内に位置している各被写体の像を表す撮影画像が静止画像として得られ、第1実施例において、その撮影画像が対象入力画像として取り扱われる。尚、シャッタ操作の有無に関係なく撮像部11にて撮影された撮影画像を単に入力画像と呼ぶ(対象入力画像も入力画像の一種である)。
【0043】
1回目のシャッタ操作を成した後、ユーザは、撮像装置1の撮影方向(即ち、撮像部11の光軸の方向)を変更し(ステップS12)、風景320の右側部分のみを撮影範囲に収めた状態で2回目のシャッタ操作を成す(ステップS13)。図6(b)の符号332が付された破線矩形枠内の範囲が、2回目のシャッタ操作が成された時点における撮影範囲である。撮影範囲331及び332が互いに重複する範囲を有するように(換言すれば、撮影範囲331及び332に共通の被写体が含まれるように)、ユーザは撮影方向の調整を行う。2回目のシャッタ操作前において、このような調整を支援する表示(ガイドライン表示など)を表示部27にて行うようにしても良い。図6(b)に示す例では、被写体321が風景320の中央付近に位置しており、撮影範囲331及び332の双方に被写体321が収まっている。図6(c)は、1回目及び2回目のシャッタ操作時における風景320と撮像装置1との関係イメージ図である。図6(c)の下方に示された2つの実線四角枠は、1回目及び2回目のシャッタ操作時における撮像装置1の筐体を表し、それらから伸びる破線は撮像部11の視野の外縁を表している(後述する図14(a)及び図17についても同様)。
【0044】
図8(a)の符号341は、1回目のシャッタ操作により得られた1枚目の対象入力画像であり、図8(b)の符号342は、2回目のシャッタ操作により得られた2枚目の対象入力画像である。対象入力画像が必要枚数分だけ撮影されると、画像信号処理部13は、複数の対象入力画像から1枚の静止画像である目標合成画像を生成する画像合成処理を実行する(ステップS14)。第1実施例では、2枚の対象入力画像341及び342から、図9(a)に示す1枚の目標合成画像343が生成される。
【0045】
画像信号処理部13は、対象入力画像341及び342間の共通の被写体が重なり合うように対象入力画像341及び342を貼り合わせて合成することで目標合成画像343を生成する。このような合成は、一般にイメージモザイキングと呼ばれており、公知のイメージモザイキングの方法を画像信号処理部13の画像合成処理に利用することができる。
【0046】
画像信号処理部13が目標合成画像343を生成する一方で、音響信号処理部15は、各対象入力画像の撮影時刻周辺におけるマイクロホン14L及び14Rの出力信号に基づきリンク音響信号を生成する(ステップS15)。図9(b)は、生成されるリンク音響信号のイメージ図である。リンク音響信号の生成方法について説明する。
【0047】
特殊撮影モードでは、マイク部14及び音響信号処理部15により左原信号及び右原信号並びにL信号及びR信号の生成が継続的に成されていると共に、得られた左原信号及び右原信号又はL信号及びR信号は、必要分だけ一時的に内部メモリ17に保存される。対象入力画像を得るためのシャッタ操作が成された際、音響信号処理部15は、対象入力画像ごとに、シャッタ操作の成された時点を基準とする対象期間を設定する。第1実施例では、対象入力画像341に対応する第1対象期間と対象入力画像342に対応する第2対象期間が設定される。
【0048】
今、対象入力画像341及び342を得るためのシャッタ操作が成された時刻を、夫々、T1及びT2にて表す。対象入力画像341及び342の撮影時刻が、夫々、T1及びT2であると捉えても良い。或る画像の撮影時刻とは、より詳細には例えば、その画像の画像信号を取得するために撮像素子33で実施される露光の開始時刻、中間時刻又は終了時刻を指す。図10(a)に示す如く、第1対象期間の開始時刻及び終了時刻はそれぞれ時刻(T1−ΔTA)及び(T1+ΔTB)とされ、第2対象期間の開始時刻及び終了時刻はそれぞれ時刻(T2−ΔTA)及び(T2+ΔTB)とされる。ここで、ΔTA及びΔTBは、時間を単位とした所定の正の値を有し、それらの値をユーザが指定できるようにしておいても良い。時刻(T1−ΔTA)は、時刻T1より時間ΔTAだけ前の時刻を指し、時刻(T1+ΔTB)は、時刻T1より時間ΔTBだけ後の時刻を指す(時刻(T2−ΔTA)及び(T2+ΔTB)なども同様)。
【0049】
図10(a)に示す如く時刻(T1+ΔTB)が時刻(T2−ΔTA)よりも前の時刻になる場合、第1対象期間の終了時刻を後にずらすことによって或いは第2対象期間の開始時刻を前にずらすことによって或いはその双方によって、図10(b)に示す如く第1対象期間の終了時刻と第2対象期間の開始時刻を一致させるようにしてもよい。また、時刻(T1+ΔTB)が時刻(T2−ΔTA)よりも後の時刻になる場合には、図10(c)に示す如く、時刻T1及びT2間のちょうど中間の時刻が第1対象期間の終了時刻及び第2対象期間の開始時刻と一致するように第1及び第2対象期間の長さを縮小してもよい。また、上述のように定めた第1及び第2対象期間から無音期間を除去する修正を施し、その修正後の第1及び第2対象期間を最終的な第1及び第2対象期間として設定するようにしても良い。無音期間とは、左原信号及び右原信号の信号レベル又はL信号及びR信号の信号レベルが一定レベル以下となっている期間を指す。
【0050】
各対象期間の設定後、音響信号処理部15は、各対象期間中に生成された左原信号及び右原信号又はL信号及びR信号を内部メモリ17から読み出し、読み出した左原信号及び右原信号又はL信号及びR信号から、特定の対象方向に指向性を持つ(換言すれば、特定の対象方向に指向軸を持つ)リンク音響信号を生成する。
【0051】
対象方向とは、目標合成画像に存在している対象被写体と撮像装置1とを結ぶ、実空間上の方向である(但し、それ以外の方向を対象方向とすることも可能である)。対象被写体は音源としての機能も有している。図3のリンク音響信号生成部53は、画像空間上における対象被写体の位置に基づき対象方向を決定することもできる。今、この対象被写体が被写体321である場合を考える。この場合、音源SSとしての被写体321の角度θが定まれば対象方向は特定され(図5(c)参照)、被写体321の声の到来方向に指向軸を持ったリンク音響信号が生成される。リンク音響信号の生成方法の説明を交えつつ、対象方向の設定方法を幾つか例示する。
【0052】
――対象方向の第1設定方法――
対象方向の第1設定方法を説明する。第1設定方法において、撮像装置1は、画像処理を用いて対象被写体及び対象方向を設定する。具体的には例えば、対象入力画像の画像信号に基づき対象入力画像から人物の顔を検出する顔検出処理を実行できるように画像信号処理部13を形成しておき、画像信号処理部13が対象入力画像341及び342に顔検出処理を実行することで対象入力画像341及び342上における被写体321の位置(例えば、被写体321としての人物の顔領域又は胴体領域の中心位置)を検出する。
【0053】
リンク音響信号生成部53は、対象入力画像341上における被写体321の位置と時刻T1における焦点距離から、時刻T1における被写体321についての角度θ(以下、θ1で表す)を求め、対象入力画像342上における被写体321の位置と時刻T2における焦点距離から、時刻T2における被写体321の角度θ(以下、θ2で表す)を求める。時刻T1における角度θ1は、第1対象期間中における被写体321の角度θとして取り扱われ、時刻T2における角度θ2は、第2対象期間中における被写体321の角度θとして取り扱われる。尚、本明細書において、特に記述なき限り、焦点距離とは撮像部11の焦点距離を指す。
【0054】
リンク音響信号生成部53は、角度θ1に基づき、第1対象期間中のL信号及びR信号から第1対象期間中のリンク音響信号を生成することができる。具体的には、角度θ1に対応する音源(即ち被写体321)から撮像装置1に到来した音の成分が第1対象期間中のリンク音響信号において強調されるように、角度θ1に応じた混合比率にて第1対象期間中のL信号及びR信号を混合し、この混合によって得たモノラル信号を第1対象期間中のリンク音響信号とすることができる。例えば、θ1=45°である時には、L信号に係数kL45を乗じた信号とR信号に係数kR45を乗じた信号を足し合わせることで第1対象期間中のリンク音響信号を生成し、θ1=135°である時には、L信号に係数kL135を乗じた信号とR信号に係数kR135を乗じた信号を足し合わせることで第1対象期間中のリンク音響信号を生成する。ここで、0≦kL45<kR45、且つ、0≦kR135<kL135、であり、単純には例えば、kL45=0、kR45=1、kL135=1、kR135=0、とすることができる。第1実施例の想定下では、角度θ1は90°未満であって45°に近く、角度θ2は90°以上であって135°に近い(図5(c)及び図6(c)も参照)。
【0055】
同様にして、リンク音響信号生成部53は、角度θ2に基づき、第2対象期間中のL信号及びR信号から第2対象期間中のリンク音響信号を生成することができる。つまり、角度θ2に対応する音源(即ち被写体321)から撮像装置1に到来した音の成分が第2対象期間中のリンク音響信号において強調されるように、角度θ2に応じた混合比率にて第2対象期間中のL信号及びR信号を混合し、この混合によって得たモノラル信号を第2対象期間中のリンク音響信号とすることができる。混合の具体的方法例は、第1対象期間のそれと同様である。
【0056】
マイクロホン14L及び14Rが無指向性マイクロホンである場合には、無指向性の左原信号及び右原信号に対する指向性制御によってリンク音響信号を直接生成するようにしても良い。即ち、無指向性の左原信号及び右原信号から指向性を有するL信号及びR信号を生成するための指向性制御と同様の指向性制御を、第1対象期間中における無指向性の左原信号及び右原信号に施すことで第1対象期間中のリンク音響信号を生成するようにしても良く、同様に、第2対象期間中における無指向性の左原信号及び右原信号に施すことで第2対象期間中のリンク音響信号を生成するようにしても良い。これらの生成は、角度θiに対応する音源(即ち被写体321)から撮像装置1に到来した音の成分に最も高い指向性を持たせた音響信号が第i対象期間中のリンク音響信号となるように、対象期間ごとに角度θiに基づき実行される(ここで、iは1又は2)。この方法によっても、角度θiに対応する音源(即ち被写体321)から撮像装置1に到来した音の成分が第i対象期間中のリンク音響信号において強調されることとなる(iは1又は2)。
【0057】
――対象方向の第2設定方法――
対象方向の第2設定方法を説明する。第2設定方法では、複数の対象入力画像の位置関係から対象方向を決定する。以下、具体的に説明する。
【0058】
画像信号処理部13は、対象入力画像341及び342から目標合成画像343を生成する際、対象入力画像341及び342間における特徴点の対応付けを行う。つまり、対象入力画像341上の特徴点が対象入力画像342上のどの点に対応しているかを検出する(対応点同士が目標合成画像343上で重なり合うように対象入力画像341及び342を合成することで目標合成画像343が得られる)。第1入力画像上の特徴点の位置から、その特徴点に対応する第2入力画像上の点の位置へと向かう、画像空間上のベクトルを位置ずれベクトルと呼ぶ。ここで、第2入力画像は、第1入力画像の撮影よりも後の撮影によって得られた入力画像である。対象入力画像341及び342に関しては、対象入力画像341が第1入力画像に対応し、対象入力画像342が第2入力画像に対応する。第1及び第2入力画像の画像信号に基づき、代表点マッチング法、ブロックマッチング法、勾配法などを用いて第1及び第2入力画像間のオプティカルフローを算出し、該オプティカルフローを形成する複数の動きベクトルの平均ベクトルを、第1及び第2入力画像間の位置ずれベクトルとしてもよい。
【0059】
リンク音響信号生成部53は、対象入力画像341及び342間の位置ずれベクトルに基づき対象方向を決定する。本例において、対象入力画像341及び342間の位置ずれベクトルの向きは右向きである。従って、ユーザの注目する対象被写体は対象入力画像341上では右側よりに位置し、対象入力画像342上では左側よりに位置していると推定される。よって、対象入力画像341及び342間の位置ずれベクトルの向きが右向きであることに基づき“0°<θ1<90°<θ2<180°”を満たすように、角度θ1及びθ2を決定する。この際、時刻T1及びT2における焦点距離並びに位置ずれベクトルの大きさを用いてθ1及びθ2の具体的数値を決定しても良いし、或いは、位置ずれベクトルの向きが右向きであるという事実のみに基づき“0°<θ1<90°<θ2<180°”を満たす範囲でθ1及びθ2を予め定めておいた角度に設定するようにしても良い(例えば、θ1=45°且つθ2=135°とする)。角度θiの導出後に実行されるリンク音響信号の生成方法は、上述したものと同様である。
【0060】
尚、図8(a)及び(b)に示す状況には適合しないが、仮に、対象入力画像341及び342間の位置ずれベクトルの向きが左向きであったならば、“0°<θ2<90°<θ1<180°”を満たすように角度θ1及びθ2を決定すればよい。
【0061】
――対象方向の第3設定方法――
対象方向の第3設定方法を説明する。第3設定方法において、撮像装置1は、音響信号に基づく音源方向推定処理によって対象方向を設定する。音源方向推定処理では、無指向性の左原信号及び右原信号の位相差に基づき音源SSの角度θを検出する。第3設定方法において、リンク音響信号生成部53は、対象期間ごとに音源方向推定処理を実行する。従って、対象期間ごとに第i対象期間中における無指向性の左原信号及び右原信号の位相差から角度θiが検出される(iは1又は2)。複数の無指向性マイクロホンの出力信号の位相差から音源の位置する方向(角度θに相当)を推定する方法は周知であるため、その方法の詳細説明を割愛する。尚、各対象期間の全部又は一部において音源SSとしての被写体321が声を発していることを、第3設定方法は前提としている。角度θiの導出後に実行されるリンク音響信号の生成方法は、上述したものと同様である。
【0062】
――対象方向の第4設定方法――
対象方向の第4設定方法を説明する。第4設定方法では、ユーザが、マニュアル操作で対象被写体及び/又は対象方向を指定する。マニュアル操作は、ユーザによる操作部26に対する操作やタッチパネル操作である。このマニュアル操作に基づき、対象入力画像341及び342上の対象被写体の位置が指定される、或いは、対象入力画像341及び342における対象方向を表す角度θ1及びθ2が指定される。ユーザが、マニュアル操作で被写体321を対象被写体として指定した場合、対象入力画像341及び342上における被写体321の位置が定まるので、上述した方法により、その位置を用いて角度θ1及びθ2が決定される。角度θiの導出後に実行されるリンク音響信号の生成方法は、上述したものと同様である。
【0063】
[目標合成画像の生成方法の変形例]
尚、目標合成画像343は、対象入力画像341の全体と対象入力画像342の全体をイメージモザイキングによって合成して得たものであるが、対象入力画像341の一部と対象入力画像342の全体又は一部、或いは、対象入力画像341の全体又は一部と対象入力画像342の全体、或いは、対象入力画像341の一部と対象入力画像342の一部をイメージモザイキングによって合成することで目標合成画像を生成するようにしても良い。例として、対象入力画像341の一部と対象入力画像342の一部をイメージモザイキングによって合成することで得た目標合成画像343aを、図11に示す。
【0064】
目標合成画像343aは、対象入力画像341内に設定された切り出し枠341a内の画像と、対象入力画像342内に設定された切り出し枠342a内の画像を、イメージモザイキングによって合成することで得た画像である(図12(a)及び(b)参照)。切り出し枠341a内の画像の画像サイズは対象入力画像341の画像サイズよりも小さく、同様に、切り出し枠342a内の画像の画像サイズは対象入力画像342の画像サイズよりも小さい。
【0065】
画像信号処理部13は、上述の第1〜第4設定方法の何れかを利用して、切り出し枠341a及び342a内に共通の被写体(対象被写体としての被写体321)が含まれるように切り出し枠341a及び342aを設定した後、切り出し枠341a及び342a内の画像を対象入力画像341及び342から抽出し、抽出した2枚の画像から目標合成画像343aを生成する。切り出し枠341a内の画像と切り出し枠342a内の画像から目標合成画像343aを生成する方法は、対象入力画像341及び342から目標合成画像343を生成する方法と同様である。目標合成画像343aの画像サイズ及びアスペクト比が対象入力画像(341又は342)のそれらと同じとなるように、目標合成画像343aを生成しても良い。
【0066】
[リンク音響信号と目標合成画像との関連付け]
上述のようにして得られた各対象期間のリンク音響信号は時系列上に結合される。この結合によって得られたリンク音響信号を、便宜上、リンク音響信号αと呼ぶ。第1実施例では、対象期間が2つのため、第1及び第2対象期間のリンク音響信号を時系列上に結合したものがリンク音響信号αとなる。
【0067】
図1のCPU23は、目標合成画像の画像信号とリンク音響信号αの関連付けを行い、それらを関連付けた状態で外部メモリ18に記録する(図7のステップS16)。この記録の具体的方法として、以下の第1〜第4記録方法を含む様々な方法を採用することができる。
第1記録方法では、目標合成画像の画像信号とリンク音響信号αを互いに関連付けた状態で外部メモリ18に記録する。
第2記録方法では、目標合成画像の画像信号と、リンク音響信号αと、各対象期間中におけるL信号及びR信号を、互いに関連付けた状態で外部メモリ18に記録する。
第3記録方法では、目標合成画像の画像信号と、目標合成画像の元となる複数の対象入力画像(第1実施例において対象入力画像341及び342)の画像信号と、リンク音響信号αと、各対象期間中におけるL信号及びR信号を、互いに関連付けた状態で外部メモリ18に記録する。
第4記録方法では、目標合成画像に基づく動画像の画像信号と、動画像用音響信号に変換されたリンク音響信号αを、互いに関連付けた状態で外部メモリ18に記録する。
【0068】
目標合成画像に基づく動画像とは、図13に示す如く、1枚の目標合成画像を単純に時系列上に繰り返して並べた構成を有する動画像であり、動画像用音響信号に変換されたリンク音響信号αとは、リンク音響信号αをMP4(Moving Picture Experts Groupにて規定されたMP4)等の規格に従って動画像用の音響信号に変換したものを指す。一般に静止画像は音響信号と共に再生されることが想定されていないため、静止画像を音響信号と共に再生するためには特定の再生制御が必要となるが、第4記録方法を用いれば、目標合成画像を容易にリンク音響信号αと共に再生することが可能となる。
【0069】
尚、第1〜第4記録方法を複数個組み合わせて実施することも可能である。リンク音響信号αを記録する時に、音響信号を圧縮しても良いし、圧縮しなくても良い(後述の他の実施例においても同様)。
【0070】
外部メモリ18に共通のファイルを作成し、互いに関連付けられるべき画像信号及び音響信号を該共通のファイルに保存することで、それらの関連付けを行うことができる。或いは、互いに関連付けられるべき画像信号及び音響信号を別々のファイルに保存し、それらのファイル同士を互いに関連付けておくことで、画像信号及び音響信号の関連付けを行うこともできる。
【0071】
目標合成画像及びリンク音響信号αの記録後、再生モードにおいて、目標合成画像の再生が指示されると、目標合成画像が表示部27に表示されると同時に、目標合成画像に関連付けられたリンク音響信号αがスピーカ28を介して音として再生される(後述の他の実施例においても同様)。
【0072】
第1実施例によれば、複数の静止画像から音声付き静止画像としての目標合成画像を生成する際、目標合成画像に適した音響信号(目標合成画像上の特定音源に注目したような音響信号)が生成されるため、音声付き静止画像に付加価値を与えてユーザメリットを向上させることが可能となる。
【0073】
<<第2実施例>>
第2実施例を説明する。第1実施例では、2枚の対象入力画像から1枚の目標合成画像を生成しているが、3枚以上の対象入力画像から1枚の目標合成画像を生成するようにしても良い。ユーザの指示等に基づき、目標合成画像の元となる対象入力画像の枚数を予め定めておくことができる。また、全ての対象入力画像の取得が完了した旨を表す所定操作がユーザにより成されるまで対象入力画像の取得を続け、該所定操作が成された時点で対象入力画像の取得を終了するようにしても良い(この場合、該所定操作が成される時点まで、目標合成画像の元となる対象入力画像の枚数は確定しない)。
【0074】
例として、3枚の対象入力画像から1枚の目標合成画像を生成する方法を説明する。4枚以上の対象入力画像から1枚の目標合成画像を生成する方法も同様とされる。
【0075】
図14(a)は、1〜3回目のシャッタ操作時における風景320と撮像装置1との関係イメージ図である。図14(a)に示す例では、所謂流し撮りを行うが如く、撮像装置1の筐体を右方向に振るカメラ操作を交えながら風景320を3回に分けて撮影する。つまり、ユーザは、風景320の左側部分のみを撮影範囲に収めた状態で1回目のシャッタ操作を成し、その後、撮影装置1の撮影方向を変更してから、風景320の中央部分のみを撮影範囲に収めた状態で2回目のシャッタ操作を成し、その後、更に撮影装置1の撮影方向を変更してから、風景320の右側部分のみを撮影範囲に収めた状態で3回目のシャッタ操作を成す。図14(b)において符号401〜403が付された破線矩形枠内の範囲が、夫々、1回目〜3回目のシャッタ操作が成された時点における撮影範囲である。撮影範囲401及び402が互いに重複する範囲を有するように(換言すれば、撮影範囲401及び402に共通の被写体が含まれるように)、且つ、撮影範囲402及び403が互いに重複する範囲を有するように(換言すれば、撮影範囲402及び403に共通の被写体が含まれるように)、ユーザは撮影方向の調整を行う。2回目及び3回目のシャッタ操作前において、このような調整を支援する表示(ガイドライン表示など)を表示部27にて行うようにしても良い。
【0076】
図15(a)〜(c)の符号411〜413は、夫々、1回目〜3回目のシャッタ操作により得られた対象入力画像を表す。第2実施例において、画像信号処理部13は、3枚の対象入力画像411〜413に第1実施例で述べた画像合成処理を施すことで図16の目標合成画像420を生成する。つまり、イメージモザイキングを用い、対象入力画像411及び412間の共通の被写体が重なり合うように且つ対象入力画像412及び413間の共通の被写体が重なり合うように、対象入力画像411〜413を貼り合わせて合成することで目標合成画像420を生成する。図15(a)〜(c)に示す例では(図14(a)も参照)、対象入力画像411及び413間に共通の被写体が含まれていないが、対象入力画像411及び413間に共通の被写体が含まれている場合には、目標合成画像420の生成において、対象入力画像411及び413間の共通の被写体も重なり合うように合成が成される。尚、第1実施例でも述べたように、各対象入力画像に切り出し枠を設定して切り出し枠内の画像のみを用いて目標合成画像を生成するようにしてもよい。
【0077】
画像信号処理部13が目標合成画像420を生成する一方で、音響信号処理部15は、各対象入力画像の撮影時刻周辺におけるマイクロホン14L及び14Rの出力信号に基づきリンク音響信号を生成する。第1実施例と同様、時刻T1を内包する第1対象期間、時刻T2を内包する第2対象期間及び時刻T3を内包する第3対象期間を設定し、各対象期間中における左原信号及び右原信号又は各対象期間中におけるL信号及びR信号から、特定の対象方向に指向性を持つ(換言すれば、特定の対象方向に指向軸を持つ)リンク音響信号を生成する。第2実施例において、時刻T1〜T3は、夫々、1〜3回目のシャッタ操作が成された時刻(或いは対象入力画像411〜413の撮影時刻)である。
【0078】
第1実施例で述べた第1〜第4設定方法の何れかを用いて対象方向を設定し、その設定結果に基づき各対象期間のリンク音響信号を生成することができる。但し、図15(a)〜(c)に示す例では(図14(a)も参照)、幾つかの対象入力画像中に対象被写体となるべき被写体321が含まれていないため、第1設定方法を単体で使用することは不適である。
【0079】
例として、第2設定方法を利用するときの処理内容について説明する。対象方向に位置する対象被写体が被写体321であることを想定する。画像信号処理部13は、対象入力画像411及び412間の位置ずれベクトルVECA及び対象入力画像412及び413間の位置ずれベクトルVECBに基づき対象方向を決定する。本例において、それらの位置ずれベクトルは共に右向きである。従って、ユーザの注目する対象被写体は、対象入力画像411上では右側よりに位置し、対象入力画像412上では中央付近に位置し、対象入力画像413上では左側よりに位置していると推定される。よって、位置ずれベクトルVECA及びVECBの向きが右向きであることに基づき“0°<θ1<θ2<θ3<180°”を満たすように、角度θ1〜θ3を決定する。第2実施例において、角度θ1〜θ3は、夫々、第1〜第3対象期間における音源SSとしての対象被写体321の角度(又は、その角度の推定値)を表す。
【0080】
時刻T1〜T3における焦点距離並びに位置ずれベクトルVECA及びVECBの大きさを用いてθ1〜θ3の具体的数値を決定しても良いし、或いは、位置ずれベクトルVECA及びVECBの向きが右向きであるという事実のみに基づき“0°<θ1<θ2<θ3<180°”を満たす範囲でθ1〜θ3を予め定めておいた角度に設定するようにしても良い(例えば、θ1=45°、θ2=90°且つθ3=135°、とする)。
【0081】
また、対象被写体が含まれている対象入力画像の画像信号を用いて該対象入力画像上における対象被写体の位置を検出し、その検出位置から対象被写体が含まれている対象入力画像に対応する角度θを決定し、その後、他の対象入力画像に対応する角度θを決定するようにしても良い。即ち、本例では、対象入力画像412に対象被写体が含まれている(対象入力画像412に対象被写体の画像信号が存在している)ため、対象入力画像412の画像信号を用いて対象入力画像412上における対象被写体321の位置を検出し、その検出位置と時刻T2における焦点距離から時刻T2における角度θ2を求める。仮に、対象被写体321が対象入力画像412の中心に位置しているならば、θ2=90°、とされる。その後、求めた角度θ2と、時刻T1〜T3における焦点距離と、位置ずれベクトルVECA及びVECBの向き及び大きさを用いて、“0°<θ1<θ2<θ3<180°”を満たす範囲で角度θ1及びθ3の具体的数値を決定するようにしても良い。
【0082】
何れの方法によっても、音の強調方向が時間経過と共に撮像装置1の右側から左側に変化してゆくような、リンク音響信号の生成が成される。角度θiの導出後に実行されるリンク音響信号の生成方法は、第1実施例で述べたものと同様である。これにより、第1実施例と同様、角度θiに対応する音源(即ち被写体321)から撮像装置1に到来した音の成分に最も高い指向性を持たせた音響信号が、第i対象期間中のリンク音響信号として生成される。つまり、角度θiに対応する音源(即ち被写体321)から撮像装置1に到来した音の成分が第i対象期間中のリンク音響信号において強調されることとなる(iは、1、2又は3)。
【0083】
第1〜第3対象期間のリンク音響信号は時系列上に結合され、この結合によって得られたリンク音響信号が、第2実施例におけるリンク音響信号αとなる。リンク音響信号αと目標合成画像の関連付け及び記録方法は、第1実施例で述べたものと同様である。
【0084】
<<第3実施例>>
第3実施例を説明する。第1及び第2実施例では、対象入力画像の撮影間において撮像装置1の撮影方向を左右方向(水平方向)に変化させているが、対象入力画像の撮影間における撮影方向の変化方向は上下方向(垂直方向)であっても良い。
【0085】
この場合において、2枚の対象入力画像から目標合成画像を生成するならば、1枚目の対象入力画像の撮影後、撮像装置1の撮影方向を上方向又は下方向に変化させてから、2枚目の対象入力画像の撮影を行う。撮像装置1の撮影方向を上方向又は下方向に変化させることによって、撮像部11の光軸は鉛直面に沿って回転する。図17は、その2枚の対象入力画像を得る際における撮影方向変化のイメージ図であると共に、1回目及び2回目のシャッタ操作時における風景と撮像装置1との関係イメージ図である。
【0086】
対象入力画像の撮影間の撮影方向の変化方向が上下方向である場合においても、目標合成画像及びリンク音響信号の生成方法は第1又は第2実施例のそれと同様であり、第1又は第2実施例における左右を上下に置き換えて考えれば足る。但し、マイクロホン14L及び14Rとして無指向性マイクロホンが用いられる場合には、上下方向に対する指向性制御を可能とすべく、マイクロホン14L及び14Rを上下方向にずらして配置しておく必要がある。即ち、図5(c)のX軸を水平面に対して傾けておく必要がある(単純には例えば、X軸を水平面と直交させる)。
【0087】
更に、第1又は第2実施例と第3実施例を組み合わせて実施するようにしても良い。即ち、水平及び垂直方向に位置ずれを有する複数の対象入力画像を撮影し、その複数の対象入力画像から1枚の目標合成画像を生成するようにしても良い。この場合においても、対象方向に指向性を持ったリンク音響信号が生成されることに変わりはない。
【0088】
後述の第4及び第5実施例においても、対象入力画像の撮影間において撮像装置1の撮影方向が左右方向に変化していることを想定しているが、第3実施例で述べた事項を、後述の第4及び第5実施例に適用することも可能である。
【0089】
<<第4実施例>>
第4実施例を説明する。上述の第1〜第3実施例では、シャッタ操作に従って対象入力画像を取得するようにしているが、第4及び後述の第5実施例では、周期的に入力画像を撮像部11にて撮影させ、得られたn枚の入力画像の中から目標合成画像の元となるm枚の対象入力画像を画像選択処理によって抽出する。n及びmは2以上の整数である。画像選択処理によって結果的にn枚の入力画像の全てが対象入力画像として選択されることもあり、その場合は、n=mとなるが、以下の説明では、画像選択処理の存在意義を明確にするべく、n>mであることを想定する(第5実施例も同様)。更に、m=3であるとする(第5実施例も同様)。
【0090】
図18は、第4実施例の動作に特に関与する部位のブロック図である。フレームメモリ71及び対象入力画像メモリ74を内部メモリ17に設けておくことができ、動き検出部72、画像選択部73及び画像合成部75を画像信号処理部13に設けておくことができる。尚、対象入力画像の画像信号を保存しておく対象入力画像メモリ74及びm枚の対象入力画像から目標合成画像を生成する画像合成部75は、上述の第1〜第3実施例においても利用されうる。
【0091】
第4実施例に係る特殊撮影モードの動作が開始すると、撮像部11により所定のフレーム周期にて周期的に入力画像の撮影が成される。i番目に撮影された入力画像を記号INiにて表す(iは整数)。今、図19に示す入力画像IN1〜IN6を含む入力画像列が取得された場合を想定する。この入力画像列は、撮像装置1を右方向に非等速的に振りながら対象被写体としての被写体450を撮影した動画像である。従って、入力画像IN1〜IN6の撮影時において、対象被写体としての被写体450が撮影範囲に含められている。被写体450は音源としての機能も持つ人物である。
【0092】
最新の入力画像の画像信号が、AFE12を介して、フレームメモリ71、動き検出部72及び画像選択部73に与えられる。フレームメモリ71は、取得された最新の入力画像の画像信号を保存する。動き検出部72は、フレームメモリ71に保存された画像信号と、AFE12を介して与えられる最新の入力画像の画像信号に基づき、時間的に隣接する2枚の入力画像間の動き量を算出する。ここで算出される動き量は、上述の位置ずれベクトルである。入力画像INi〜INi+1間の動き量、即ち、入力画像INi〜INi+1間の位置ずれベクトルをVEC[i,i+1]にて表す。
【0093】
画像選択部73は、動き検出部72にて算出された位置ずれベクトルに基づいて各入力画像を対象入力画像として選択すべきか否かを判断し、対象入力画像として選択した入力画像の画像信号を対象入力画像メモリ74に保存する。画像選択部73による対象入力画像の選択方法について説明する。
【0094】
画像選択部73は、まず、1番目に取得される入力画像IN1を1枚目の対象入力画像として選択する。
【0095】
次に、2枚目の対象入力画像を選択するために、画像選択部73は、動き検出部72の算出結果を用いて1枚目の対象入力画像IN1を基準とした位置ずれベクトルVEC[1,j]を導出する。jは2以上の整数である。jが3以上の整数である場合、位置ずれベクトルVEC[1,j]は、位置ずれベクトルVEC[1,2]、[2,3]・・・、[j−1,j]の合成ベクトルである。
【0096】
画像選択部73は、変数jの値を2を起点として1ずつ増加させながら、位置ずれベクトルVEC[1,j]の大きさを所定の基準値VECTHと比較し(VECTH>0)、前者が後者未満であれば入力画像IN1及びINj間に対象被写体の動きはない或いは撮影方向に変化はないと判断して入力画像INjを対象入力画像から除外する一方、前者が後者以上であれば入力画像IN1及びINj間に対象被写体の動きがある或いは撮影方向に変化があると判断して入力画像INjを2枚目の対象入力画像として選択する。今、位置ずれベクトルVEC[1,2]及び[1,3]の大きさが基準値VECTH未満であって、且つ、位置ずれベクトルVEC[1,4]の大きさが基準値VECTH以上であるとする。そうすると、入力画像IN4が2枚目の対象入力画像として選択される(図19参照)。
【0097】
2枚目の対象入力画像の選択後、3枚目の対象入力画像を選択するために、画像選択部73は、動き検出部72の算出結果を用いて2枚目の対象入力画像IN4を基準とした位置ずれベクトルVEC[4,j]を導出する。位置ずれベクトルVEC[4,j]の導出時におけるjは5以上の整数であり、jが6以上の整数である場合、位置ずれベクトルVEC[4,j]は、位置ずれベクトルVEC[4,5]、[5,6]・・・、[j−1,j]の合成ベクトルである。
【0098】
2枚目の対象入力画像を選択した場合と同様、画像選択部73は、変数jの値を5を起点として1ずつ増加させながら、位置ずれベクトルVEC[4,j]の大きさを上記基準値VECTHと比較し、前者が後者未満であれば入力画像IN4及びINj間に対象被写体の動きはない或いは撮影方向に変化はないと判断して入力画像INjを対象入力画像から除外する一方、前者が後者以上であれば入力画像IN4及びINj間に対象被写体の動きがある或いは撮影方向に変化があると判断して入力画像INjを3枚目の対象入力画像として選択する。今、位置ずれベクトルVEC[4,5]の大きさが基準値VECTH未満であって、且つ、位置ずれベクトルVEC[4,6]の大きさが基準値VECTH以上であるとする。そうすると、入力画像IN6が3枚目の対象入力画像として選択される(図19参照)。
【0099】
本実施例では、m=3であることが想定されているため、3枚目の対象入力画像が選択された時点で対象入力画像の選択動作は完了するが、m>3である場合には、4枚目(及びそれ以降)の対象入力画像の選択動作が継続される。
【0100】
画像選択部73によって選択された各対象入力画像の画像信号は対象入力画像メモリ74に一時保存され、画像合成部75は、対象入力画像メモリ74の保存内容を用いて、m枚の対象入力画像(上述の具体例において入力画像IN1、IN4及びIN6)から目標合成画像を生成する。m枚の対象入力画像から目標合成画像を生成する方法は、上述してきたものと同様である。
【0101】
入力画像IN1〜IN6を含む入力画像列の撮影期間中における左原信号及び右原信号若しくはL信号及びR信号は、内部メモリ17に保存されており、m枚の対象入力画像の選択が成されると、音響信号処理部15は、対象入力画像ごとに対象入力画像の撮影時刻を基準とした対象期間を設定する。例えば、i枚目の対象入力画像の撮影時刻を上述の時刻Tiとみなして、時刻Tiを内包する第i対象期間を、第1又は第2実施例で述べた方法に従って設定すればよい。
【0102】
そして、第1又は第2実施例と同様にして、対象期間ごとに対象期間中における左原信号及び右原信号又はL信号及びR信号から特定の対象方向に指向性を持つ(換言すれば、特定の対象方向に指向軸を持つ)リンク音響信号を生成し、第1〜第3対象期間のリンク音響信号を時系列上に結合して得られるリンク音響信号αを目標合成画像の画像信号と関連付けて外部メモリ18に記録すると良い。
【0103】
尚、入力画像IN1〜IN6を含む入力画像列は、録画ボタン26aの押下操作に伴って撮影されたものであっても良く、この場合、入力画像列としての動画像の画像信号は、該動画像の撮影期間中における音響信号(左原信号及び右原信号、又は、L信号及びR信号)と共に外部メモリ18に記録される(後述の第5実施例においても同様)。従って、この場合は、外部メモリ18に記録された音響信号からリンク音響信号を生成することもできる(後述の第5実施例においても同様)。
【0104】
本実施例によれば、ユーザのシャッタ操作を必要とすることなく、第1及び第2実施例と同様の作用・効果を得ることができる。
【0105】
<<第5実施例>>
第5実施例を説明する。図20は、第5実施例の動作に特に関与する部位のブロック図である。対象入力画像メモリ74及び画像合成部75は、図18のそれらと同じものである。画像選択部73aを画像信号処理部13に設けておくことができ、音源方向推定部81を音響信号処理部15に設けておくことができる。第4実施例と同様、特殊撮影モードの動作開始後において、図19の入力画像IN1〜IN6を含む入力画像列が取得されたものとする。
【0106】
第5実施例では、マイクロホン14L及び14Rとして無指向性マイクロホンが用いられる。更に、各入力画像に存在している被写体450が対象被写体及び音源SSであることを想定し、且つ、被写体450が上記入力画像列の撮影期間中に声を発していることを想定する。
【0107】
音源方向推定部81は、上記入力画像列の撮影期間中における無指向性の左原信号及び右原信号の位相差に基づき、その撮影期間中の各時刻における音源SSの角度θ(即ち、被写体450を音源SSとして見立てたときの角度θ)を検出する。iを自然数とした場合、音源方向推定部81は、入力画像INiの撮影時刻を基準とする第i評価期間を設定し、第i評価期間中における左原信号及び右原信号の位相差から第i評価期間中における音源SSの角度θ[i]を検出する。入力画像INiの撮影時刻をT[i]にて表す。第i評価期間は、例えば、時刻(T[i]−ΔTC)から時刻(T[i]+ΔTC)までの期間である。ΔTCは時間を単位とした所定の正の値を有する。
【0108】
音源方向推定部81は、入力画像ごとに評価期間を設定して音源SSの角度θを検出し、その検出結果(θ[1]、θ[2]、θ[3]・・・)を画像選択部73aに与える。画像選択部73aは、音源SSの角度θの変化を音源SSとしての対象被写体450の動きとみなし、第4実施例の画像選択部73と同様の主旨による画像選択を行う。
【0109】
具体的には、画像選択部73aは、まず、1番目に取得される入力画像IN1を1枚目の対象入力画像として選択する。続いて、2枚目の対象入力画像を選択するために、画像選択部73aは、1枚目の対象入力画像を基準とした音源方向(音源SSの位置する方向)の変化量、即ち、入力画像IN1及びINjの撮影間における音源方向の変化量を求める。入力画像IN1及びINjの撮影間における音源方向の変化量は|θ[j]−θ[1]|にて表現される。上述したように、jは2以上の整数である。
【0110】
画像選択部73aは、変数jの値を2を起点として1ずつ増加させながら、音源方向の変化量|θ[j]−θ[1]|を所定の基準値θTHと比較し(θTH>0)、前者が後者未満であれば入力画像IN1及びINj間に対象被写体の動きはない或いは撮影方向に変化はない或いは音源方向に変化はないと判断して入力画像INjを対象入力画像から除外する一方、前者が後者以上であれば入力画像IN1及びINj間に対象被写体の動きがある或いは撮影方向に変化がある或いは音源方向に変化があると判断して入力画像INjを2枚目の対象入力画像として選択する。今、変化量|θ[2]−θ[1]|及び|θ[3]−θ[1]|が基準値θTH未満であって、且つ、変化量|θ[4]−θ[1]|が基準値θTH以上であるとする。そうすると、入力画像IN4が2枚目の対象入力画像として選択される(図19参照)。
【0111】
2枚目の対象入力画像の選択後、3枚目の対象入力画像を選択するために、画像選択部73aは、2枚目の対象入力画像を基準とした音源方向の変化量、即ち、入力画像IN4及びINjの撮影間における音源方向の変化量|θ[j]−θ[4]|を求める。変化量|θ[j]−θ[4]|の導出時におけるjは、5以上の整数である。
【0112】
2枚目の対象入力画像を選択した場合と同様、画像選択部73aは、変数jの値を5を起点として1ずつ増加させながら、音源方向の変化量|θ[j]−θ[4]|を上記基準値θTHと比較し、前者が後者未満であれば入力画像IN4及びINj間に対象被写体の動きはない或いは撮影方向に変化はない或いは音源方向に変化はないと判断して入力画像INjを対象入力画像から除外する一方、前者が後者以上であれば入力画像IN4及びINj間に対象被写体の動きがある或いは撮影方向に変化がある或いは音源方向に変化があると判断して入力画像INjを3枚目の対象入力画像として選択する。今、変化量|θ[5]−θ[4]|が基準値θTH未満であって、且つ、変化量|θ[6]−θ[4]|が基準値θTH以上であるとする。そうすると、入力画像IN6が3枚目の対象入力画像として選択される(図19参照)。
【0113】
本実施例では、m=3であることが想定されているため、3枚目の対象入力画像が選択された時点で対象入力画像の選択動作は完了するが、m>3である場合には、4枚目(及びそれ以降)の対象入力画像の選択動作が継続される。
【0114】
画像選択部73aによって選択された各対象入力画像の画像信号は対象入力画像メモリ74に一時保存され、画像合成部75は、対象入力画像メモリ74の保存内容を用いて、m枚の対象入力画像(上述の具体例において入力画像IN1、IN4及びIN6)から目標合成画像を生成する。m枚の対象入力画像から目標合成画像を生成する方法は、上述してきたものと同様である。音響信号処理部15は、第4実施例で述べた方法にて該目標合成画像に関連付けられるべきリンク音響信号αを生成する。目標合成画像及びリンク音響信号αは、互いに関連付けられて外部メモリ18に記録される。
【0115】
本実施例によっても、ユーザのシャッタ操作を必要とすることなく、第1及び第2実施例と同様の作用・効果を得ることができる。
【0116】
<<第6実施例>>
第6実施例を説明する。第6実施例では、動画像から抽出した入力画像としてのフレーム画像に対して最適な音響信号を光学ズーム倍率等に応じて生成し、抽出した静止画像に該最適な音響信号を関連付ける。この内容を詳細に説明する。
【0117】
まず、第6実施例の動作に関与するズーム機能について説明する。図2のドライバ34は、撮像部11の画角である撮影画角(換言すれば、入力画像の画角)がCPU23にて設定された光学ズーム倍率に従った画角となるようにズームレンズ30の位置を制御する。即ち、光学ズーム倍率に従ってズームレンズ30の位置を制御することにより、撮像素子33の有効画素領域上に結像する画像である入力画像の画角を決定する。光学ズーム倍率が或る倍率を起点としてk1倍になれば、入力画像の画角は、画像の水平及び垂直方向の夫々において1/k1倍となる(k1は正の数であって、例えば2倍)。光学ズーム倍率を記号ZOPTにて表す。以下の説明では、光学ズーム倍率ZOPTを、倍率ZOPTと表現したり単にZOPTと表現したりすることもある。
【0118】
第6実施例では、マイクロホン14L及び14Rとして、無指向性マイクロホンが用いられる。音響信号処理部15は、無指向性の左原信号及び右原信号に対して適切な指向性制御を施すことで、強調対象エリア内の音源から到来した音の成分が強調された強調音響信号を生成することができる。
【0119】
図21を参照して強調対象エリアARについて説明する。図21において、斜線で満たされたエリアが強調対象エリアARである。強調対象エリアARは、XY座標面上に定義されるエリアであって、破線で示された線分501及び502間に位置するエリアである。線分501及び502の夫々は、原点OからXY座標面の第1又は第2象限へと伸びる線分であり、線分501及び502とX軸との成す角度を夫々φA及びφBにて表す。但し、角度φAは、原点Oとマイクロホン14Rの中心とを結ぶ線分から反時計周り方向に線分501を見たときの、X軸及び線分501間の角度であり、角度φBは、原点Oとマイクロホン14Rの中心とを結ぶ線分から反時計周り方向に線分502を見たときの、X軸及び線分502間の角度である。更に、0°<φA<φB<180°であるとする。図21に示す例では、0°<φA<90°<φB<180°となっているが、0°<φA<φB≦90°となることもあるし、90°≦φA<φB<180°となることもある。
【0120】
音響信号処理部15は、強調対象エリアAR内に位置する音源(音源としての被写体)から到来する音の成分が強調された強調音響信号ESSを生成することができる。強調対象エリアAR内に位置する音源から到来する音の信号成分を指向性制御によって左原信号及び右原信号から必要成分として抽出し、抽出した必要成分そのものを強調音響信号ESSとすることができる。或いは、その必要成分を左原信号及び右原信号から抽出する一方で、必要成分以外の信号成分を左原信号及び右原信号から不必要成分として抽出した後、必要成分の混合比率が比較的大きくなるように必要成分と不必要成分を加重加算することで強調音響信号ESSを生成しても良い。つまり、0<kB<kAを満たす係数kA及びkBを設定し、必要成分に係数kAを乗じた信号と不必要成分に係数kBを乗じた信号とを足し合わせた信号を強調音響信号ESSとして生成しても良い。強調音響信号ESSに代表される強調音響信号の生成処理を、図3のリンク音響信号生成部53にて行うことができる。
【0121】
図22及び図23を参照して、第6実施例に係る撮像装置1の動作について説明する。
第6実施例に係る特殊な動作の実行に先立ち、録画ボタン26aに対する操作等に応じて動画像550が撮影され、動画像550の画像信号が動画像550の撮影期間中における無指向性の左原信号及び右原信号と共に外部メモリ18に記録されているものとする。通常は、動画像550の撮影期間中におけるL信号及びR信号も外部メモリ18に記録されている。図22には、動画像550の撮影時において撮像装置1の前方に広がる風景530が示され、図23には、動画像550の構成が示されている。風景530上には、2本の木及び人物である被写体560が存在している。
【0122】
動画像550は、複数のフレーム画像を時系列上に並べて構成され、その複数のフレーム画像にはフレーム画像551〜556が含まれている。フレーム画像551〜556の撮影時刻を、それぞれTA[1]〜TA[6]にて表し、フレーム画像551〜556の順番で撮影が成されたものとする。従って、時刻TA[i+1]は時刻TA[i]よりも後の時刻である。フレーム551〜556上には共通して被写体560が存在している。フレーム画像551は、時刻TA[1]での撮影によって得られた入力画像に相当する(他のフレーム画像も同様)。
【0123】
今、説明の簡略化上、動画像550の撮影期間中において撮像装置1の筐体及び被写体560を含む全被写体は静止しているものとする。但し、時刻TA[1]から時刻TA[4]に向かうにつれて倍率ZOPTが徐々に増大されていたものとする。時刻TA[i]における倍率ZOPTをZOPT[i]にて表す。ZOPT[1]<ZOPT[2]<ZOPT[3]<ZOPT[4]、である。図22において、符号531及び534が付された破線矩形内の範囲は、夫々、フレーム画像551及び554の撮影時における撮影範囲である。各フレーム画像の撮影時点における倍率ZOPT(即ち、ZOPT[i]の値)は、動画像550の画像信号と共に外部メモリ18に記録されているものとする。
【0124】
動画像550の撮影後、ユーザは、撮像装置1の動作モードを再生モードに変更させる。第6実施例における以下の説明は、再生モードにおける撮像装置1の動作の説明である。再生モードにおいて、ユーザは、動画像550の中から所望のフレーム画像を指定することができ、この指定が成された際、撮像装置1は、指定されたフレーム画像に基づく音声付き静止画像を生成することができる。例として、フレーム画像554が指定された場合における音声付き静止画像の生成方法を説明する。
【0125】
この場合、まず、音響信号処理部15(例えばリンク音響信号生成部53)は、図24(a)に示す如く、フレーム画像554の撮影時刻TA[4]を内包する抽出期間570を設定する。抽出期間570は、例えば、時刻(TA[4]−ΔTD)から時刻(TA[4]+ΔTD)までの期間である。ΔTDは時間を単位とした所定の正の値を有し、その値をユーザが指定できるようにしておいても良い。リンク音響信号生成部53は、抽出期間570における左原信号及び右原信号を外部メモリ18から読み出し、読み出した左原信号及び右原信号に指向性制御を施すことによって、フレーム画像554の画角内に位置する音源(換言すれば撮影範囲534内に位置する音源としての被写体)からの音の成分が強調された強調音響信号ESS554(図24(b)参照)を生成する。
【0126】
つまり、フレーム画像554の画角に応じた強調対象エリアAR554を設定し、強調対象エリアARに対応する強調音響信号ESSを生成する方法と同様の方法にて、抽出期間570における左原信号及び右原信号から強調対象エリアAR554に対応する強調音響信号ESS554を生成する。強調対象エリアAR554についての角度φA及びφBである角度φ554A及びφ554Bは、時刻TA[4]の撮影画角であるフレーム画像554の画角から決定され、フレーム画像554の画角は外部メモリ18に記録された倍率ZOPT[4]の値から算出される。具体的には、角度(φ554B−φ554A)がフレーム画像554の画角と一致し且つ“(180°−φ554B)=φ554A”が成立するように、φ554A及びφ554Bを決定する。これにより、強調音響信号ESS554は、フレーム画像554の画角に応じた指向性を持つようになる(例えば、強調対象エリアAR554内に位置する音源から到来する音の信号成分のみを有するようになる)。
【0127】
尚、フレーム画像554よりも前に撮影されたフレーム画像の画角が既に分かっている場合には、その既知の画角と、それらのフレーム画像間におけるオプティカルフローに基づいて、フレーム画像554の画角を推定することもできる。本例では、フレーム画像551及び552間のオプティカルフロー、フレーム画像552及び553間のオプティカルフロー並びにフレーム画像553及び554間のオプティカルフローから、フレーム画像551及び554間における画角の差異を推定することができるため、フレーム画像551の画角が既知ならば、それらのオプティカルフローとフレーム画像551の画角からフレーム画像554の画角を推定によって求めることもできる。この方法は、倍率ZOPT[4]が外部メモリ18に記録されていない場合に有益である。
【0128】
強調音響信号ESS554は、フレーム画像554に対するリンク音響信号として機能する。図1のCPU23は、第1実施例で述べた方法に従って、強調音響信号ESS554としてのリンク音響信号とフレーム画像554の画像信号との関連付けを行い、それらを関連付けた状態で外部メモリ18に記録することができる。その後、フレーム画像554の再生が指示されると、フレーム画像554が表示部27に表示されると同時に、フレーム画像554に関連付けられたリンク音響信号がスピーカ28を介して音として再生される。
【0129】
本実施例では、抽出期間中の記録音響信号を単に指定フレーム画像に関連付けるのではなく、指定フレーム画像の画角に応じた指向性を有する強調音響信号を生成し、それを指定フレーム画像に関連付けることで音声付き静止画像を生成する。このため、指定フレーム画像の画角に適応した音響信号(指定フレームの画角内に位置する音源に注目した音響信号)を、指定フレーム画像と共に再生することが可能となる。
【0130】
尚、上述の説明では、フレーム画像の画角を決定するズーム倍率が光学ズームによる光学ズーム倍率であることを想定したが、フレーム画像の画角を決定するズーム倍率は電子ズームによる電子ズーム倍率であっても良いし、光学ズーム倍率と電子ズーム倍率との組み合わせであっても良い。光学ズーム倍率と同様、電子ズーム倍率が或る倍率を起点としてk1倍になれば、フレーム画像としての入力画像の画角は、画像の水平及び垂直方向の夫々において1/k1倍となる(k1は正の数であって、例えば2倍)。
【0131】
<<変形等>>
上述の説明文中に示した具体的な数値は、単なる例示であって、当然の如く、それらを様々な数値に変更することができる。上述の実施形態に適用可能な注釈事項として、以下に、注釈1〜注釈6を記す。各注釈に記載した内容は、矛盾なき限り、任意に組み合わせることが可能である。
【0132】
[注釈1]
上述の説明では、画像間の動き量(位置ずれベクトル)の検出を画像信号に基づいて行っているが、撮像装置1の動きを検出する動きセンサ(不図示)を撮像装置1に設けておき、動き量の検出を該動きセンサの検出結果に基づいて行うようにしても良い。動きセンサは、例えば、撮像装置1の筐体及び撮像素子33の角速度を検出する角速度センサ、又は、撮像装置1の筐体及び撮像素子33の加速度を検出する加速度センサである。
【0133】
[注釈2]
上述の各実施例において、リンク音響信号の生成を任意の段階で行うことができる。即ち例えば、上述した幾つかの例(例えば、図7に示す例)においては、撮影モードにおいて左原信号及び右原信号又はL信号及びR信号から略リアルタイムにリンク音響信号が生成されているが、リンク音響信号の元となる左原信号及び右原信号(又はL信号及びR信号)を、一旦、内部メモリ17又は外部メモリ18に保存しておき、その保存後の任意のタイミングにおいて(例えば再生モードにおいて)、それらのメモリから左原信号及び右原信号又はL信号及びR信号を読み出すことでリンク音響信号を生成するようにしても良い。
【0134】
[注釈3]
第1実施例では、目標合成画像の元となる2枚の対象入力画像341及び342(図8(a)及び(b))を共通の撮像素子33を用いた2回の撮影によって得ているが、撮像部11に第1及び第2撮像素子から成る2つの撮像素子(不図示)を設け、該2つの撮像素子にて対象入力画像341及び342を得るようにしても良い。第1及び第2撮像素子の夫々は、撮像素子33と同等のものであるが、第1撮像素子を用いた撮影の撮影方向(第1撮像素子にとっての光軸の方向)と第2撮像素子を用いた撮影の撮影方向(第2撮像素子にとっての光軸の方向)は互いに異なる。
【0135】
同一時刻において第1撮像素子上には撮影範囲331内の各被写体の像が結像するように且つ第2撮像素子上には撮影範囲332内の各被写体の像が結像するように撮像部11の光学系を形成しておくことで(図6(b)参照)、第1及び第2撮像素子にて対象入力画像341及び342の画像信号を同時に取得することができ、得られた対象入力画像341及び342の画像信号から図25の目標合成画像600の画像信号を生成することができる。目標合成画像600は、図9(a)の目標合成画像343又は図11の目標合成画像343aと等価なものである。
【0136】
この際、第1及び第2撮像素子を用いた対象入力画像341及び342の撮影時刻を内包する期間を対象期間として設定し、対象期間中における左原信号及び右原信号を目標合成画像600に関連付けて目標合成信号600の画像信号と共に外部メモリ18に記録することもできる。目標合成画像600内に強調対象画像領域601を設定して、強調対象画像領域601に注目した強調音響信号ESS601を対象期間中における無指向性の左原信号及び右原信号から生成し、その強調音響信号ESS601をリンク音響信号として目標合成信号600の画像信号に関連付けて目標合成信号600の画像信号と共に外部メモリ18に記録するようにしても良い。強調対象画像領域601は、目標合成画像600の中央付近に配置された、目標合成画像600の全体画像領域の一部であり、対象入力画像341及び342間の共通の被写体の画像信号が存在する画像領域を内包する。従って、強調対象画像領域601には、対象被写体としての被写体321の画像信号が存在している。
【0137】
強調音響信号ESS601は、強調対象画像領域601の画角内に位置する音源(被写体)からの音の成分が強調された音響信号である。強調対象画像領域601の画角内に位置する音源を図21の強調対象エリアAR内に位置する音源と見立てた上で、対象期間中における無指向性の左原信号及び右原信号に第6実施例で述べた指向性制御を施すことにより、強調音響信号ESS601を生成することができる。
【0138】
[注釈4]
上述の説明では、撮像装置1に設けられたマイクロホンの個数は2であるが、3個以上のマイクロホンを撮像装置1に設け、3個以上のマイクロホンの出力信号からリンク音響信号を生成するようにしても良い。
【0139】
[注釈5]
図1の撮像装置1を、ハードウェア、或いは、ハードウェアとソフトウェアの組み合わせによって構成することができる。ソフトウェアを用いて撮像装置1を構成する場合、ソフトウェアにて実現される部位についてのブロック図は、その部位の機能ブロック図を表すことになる。ソフトウェアを用いて実現される機能をプログラムとして記述し、該プログラムをプログラム実行装置(例えばコンピュータ)上で実行することによって、その機能を実現するようにしてもよい
【0140】
[注釈6]
例えば、以下のように考えることができる。撮像装置1には、複数のマイクロホンの出力音響信号から指向性を有するリンク音響信号を生成する指向性制御部が備えられている。指向性制御部は、図3のリンク音響信号生成部53を備え、更にチャンネル音響信号生成部52を構成要素として含みうる。また、第6実施例に係る撮像装置1には、動画像550から指定フレーム画像(上述の具体例においてはフレーム画像554)を対象静止画像として抽出する対象静止画像抽出部が備えられ、その対象静止画像抽出部は図1のCPU23及び/又は画像信号処理部13によって実現される。また、撮像装置1には、出力画像(目標合成画像又は上記の対象静止画像)とリンク音響信号を関連付ける関連付け部が備えられ、該関連付け部は図1のCPU23によって実現される。
【符号の説明】
【0141】
1 撮像装置
11 撮像部
13 画像信号処理部
14 マイク部
15 音響信号処理部
33 撮像素子
52 チャンネル音響信号生成部
53 リンク音響信号生成部
14L、14R マイクロホン
SS 音源

【特許請求の範囲】
【請求項1】
撮影方向が互いに異なるm枚の入力画像を撮影する撮像部と(mは2以上の整数)、
複数のマイクロホンから成るマイク部と、
前記m枚の入力画像又は前記m枚の入力画像から抽出したm枚の抽出画像を合成することで出力画像を生成する画像合成部と、
前記m枚の入力画像の撮影期間中における前記複数のマイクロホンの出力音響信号から指向性を有するリンク音響信号を生成する指向性制御部と、
前記出力画像と前記リンク音響信号を関連付ける関連付け部と、を備えた
ことを特徴とする撮像装置。
【請求項2】
前記出力画像は、特定の被写体の画像信号を有し、
前記指向性制御部は、前記特定の被写体より到来する音の成分が強調されるように前記リンク音響信号を生成する
ことを特徴とする請求項1に記載の撮像装置。
【請求項3】
前記撮像部は、前記m枚の入力画像を含むn枚の入力画像を撮影し(nは整数であって、n>m)、
当該撮像装置は、
前記n枚の入力画像の内の、互いに異なる入力画像間の動き量を検出する動き検出部と、
前記動き検出部の検出結果に基づいて、前記n枚の入力画像の中から前記出力画像の元となる前記m枚の入力画像を選択する画像選択部と、を更に備えた
ことを特徴とする請求項1又は請求項2に記載の撮像装置。
【請求項4】
前記撮像部は、前記m枚の入力画像を含むn枚の入力画像を撮影し(nは整数であって、n>m)、
当該撮像装置は、
前記複数のマイクロホンの出力音響信号に基づき、音源としての前記特定の被写体が位置する方向を推定する音源方向推定部と、
前記音源方向推定部の推定結果に基づいて、前記n枚の入力画像の中から前記出力画像の元となる前記m枚の入力画像を選択する画像選択部と、を更に備えた
ことを特徴とする請求項2に記載の撮像装置。
【請求項5】
複数のフレーム画像から成る動画像を撮影する撮像部と、
複数のマイクロホンから成るマイク部と、
前記動画像から特定のフレーム画像を対象静止画像として抽出する対象静止画像抽出部と、
前記特定のフレーム画像の撮影時点を基準とする特定期間中における前記複数のマイクロホンの出力音響信号から、前記対象静止画像の画角に応じた指向性を有するリンク音響信号を生成する指向性制御部と、
前記対象静止画像と前記リンク音響信号を関連付ける関連付け部と、を備えた
ことを特徴とする撮像装置。
【請求項6】
前記指向性制御部は、前記対象静止画像の画角内に位置する被写体からの音の成分が強調されるように前記リンク音響信号を生成する
ことを特徴とする請求項5に記載の撮像装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate

【図24】
image rotate

【図25】
image rotate


【公開番号】特開2011−155580(P2011−155580A)
【公開日】平成23年8月11日(2011.8.11)
【国際特許分類】
【出願番号】特願2010−16799(P2010−16799)
【出願日】平成22年1月28日(2010.1.28)
【出願人】(000001889)三洋電機株式会社 (18,308)
【Fターム(参考)】