説明

画像編集装置、画像編集方法および画像編集プログラム

【課題】撮影者の意図を反映させた音を用いて、撮影時の背景や感情を強く共有することができる画像情報を生成することが可能な画像編集装置を提供する。
【解決手段】撮影した画像情報11に含まれる撮像対象情報に関連付けられた音情報を該画像情報11に付与する画像編集装置であって、撮影した画像情報11から撮像対象情報と構図情報とを撮像対象判別手段12により抽出し、前記撮像対象情報を基にして該撮像対象情報に関連付けられる音情報を音情報取得手段13により取得した後、音情報編集手段14により、撮像対象判別手段12からの前記構図情報に基づき、音情報取得手段13からの前記音情報を調整するための音調整パラメータを決定し、決定した該音調整パラメータに従って前記音情報を調整して調整後音情報として出力し、撮像・音情報統合手段15によって、前記画像情報と前記調整後音情報とを統合して画像・音統合情報16として出力する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像編集装置、画像編集方法および画像編集プログラムに関し、特に、画像撮影時における撮影者の背景や感情を共有することが可能な音情報を付与する画像編集装置、画像編集方法および画像編集プログラムに関する。
【背景技術】
【0002】
近年のデジタルカメラおよびデジタルカメラ機能を有する各種電子機器(以下、「デジタルカメラ」と総称する)の普及に伴い、デジタル形式の写真(以下、単に「写真」と呼ぶ)が広く利用されている。また、印刷やデジタルフォトフレームに加え、SNS(Social Network Service)や写真共有サイトを介して、個人が撮影した写真を多くの利用者に向けて発信する環境が整ってきている。
【0003】
また、単に撮影したままの写真を閲覧するだけでなく、写真に加工を施すことによる、新たな写真の楽しみ方も広まりつつある。具体的には、写真の撮影対象そのものに加工を施すもの、写真に別の画像を重ねるものなどがある。前者の一例には、写真の色味を変える、周辺を暗くする、指定した領域以外をぼかす、などが挙げられる。また、後者の一例には、フレームを追加する、文字を追加する、スタンプを追加する、などが挙げられる。
【0004】
さらに、写真情報に加え、音情報を複合的に活用することにより、写真情報に新たな楽しみ方を加えることも期待されている。視覚に加え、聴覚を介して得られた情報を伝えることによって、共感覚を呼び起こし、撮影者や撮影時にその場に居たユーザに加え、撮影時にその場に居なかったユーザとの間にも、撮影時の背景や感覚をより強く共有することができると考えられる。以上のような観点から、写真情報と音情報との複合的な活用方法について、検討がなされている。
【0005】
写真情報と音情報とを複合的に活用する手法の一実現例として、現在市販されているデジタルカメラの多くには、マイクが付いており、撮影時から数秒間の音データを写真と関連付けて保存する機能が搭載されている。
【0006】
また、撮影時の音を利用して、写真情報の加工に活用する手法も提案されている(例えば、特許文献1の特開2005−234074号公報「情報処理装置および情報処理方法、記録媒体、並びにプログラム」)。該特許文献1では、環境音情報から音源を推定し、音源に関連する情報を取得する画像編集装置、方法およびプログラムが開示されている。そして、該特許文献1には、本手法をデジタルカメラに取り込んだ例が記載されている。具体的には、撮影時に環境音情報を採取し、環境音から音源を取得する。そして、音源に関連する情報として、フレームや音源の状態情報などを取得し、撮影した写真に合成を施す。このように、音情報を基にして、音情報に関連する合成写真情報を取得することができる。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特開2005−234074号公報(第6−9頁)
【発明の開示】
【発明が解決しようとする課題】
【0008】
複数の人が写真を鑑賞する場合に、当該写真の撮影時の背景や感覚をより強く共有するためには、撮影者の意図を反映させた音を利用することが肝要と言える。写真には、画角、構図、フォーカス等を介して撮影時における撮影者の意図が反映されており、音にも同様に撮影者の意図が反映されていることが、撮影時の背景や感覚を共有するうえで肝要と考えられるためである。しかし、撮影時に録音された音から、撮影者の意図した音を取得することは一般的には困難である。以下、理由を説明する。
【0009】
第1に、音は写真とは異なり、特定の音源が発する音にフォーカスすることが困難な点が挙げられる。写真の場合は、画角、構図、フォーカスなどを利用して、撮影者の意図を反映させ易い。しかし、音の場合は、音波の伝播特性や、マイク設置の制約等の問題があり、撮影者の意図の反映が困難である。
【0010】
第2に、撮影者の意図した音が、撮影時に採取することができるとは限らない点が挙げられる。例えば、犬や猫、鳥、象などの動物を撮影するときに、動物の鳴き声も一緒に取得することができれば、より臨場感の高い写真にすることができる。しかし、撮影のタイミングに同期して動物が鳴いてくれるとは限らず、また、鳴いたタイミングで撮影者の意図した写真を撮影することができるとも限らない。また、一般に、屋外では雑踏、交通騒音、話し声、屋内では背景音楽、空調、テレビ音源といったノイズが発生している。すなわち、撮影者の意図した音を仮に採取することができたとしても、同時に、多量のノイズも採取されてしまう。
【0011】
また、近年は、携帯電話の多くが、デジタルカメラ機能を有している。携帯電話は常に持ち歩いて利用されるため、携帯電話のデジタルカメラ機能は頻繁に用いられている。さらに、携帯電話はネットワーク接続機能を有しているので、携帯電話にて撮影された写真を、他者と容易かつ簡便に共有することができる。このため、写真の撮影時の背景や感覚を共有する方法は、携帯電話においても適用可能な方法であることが望ましい。
【0012】
しかし、携帯電話に搭載されるカメラ機能の場合、一般に、カメラレンズはディスプレイで構図等を確認しながらの撮影を考慮した位置すなわちディスプレイ面からみて背面に設置されていることが多い。一方で、マイクは通話時に最適な位置すなわちディスプレイ面に設置されていることが多い。このため、携帯電話のマイクが、写真撮影時の録音に適しているとは言えない。
【0013】
第3に、人間は撮影時の周囲の音について、詳細を正確に記憶しているとは限らない。むしろ、撮影時には実際に鳴っていない音であっても、撮影時の心象や意図に沿った音を付与することによって、撮影時の背景や感覚に強く訴えることができる場合も多い。
【0014】
これは、写真における忠実色と記憶色との関係に類似している。忠実色とは、被写体の実際の色である。一方、記憶色とは、人間の心や記憶の中でイメージしている色あるいは人間にとって好ましいと感じる色である。記憶色の代表的な例としては、桜の花の色、青空の色、肌色などが挙げられる。いずれも、忠実色では、白っぽい色、くすんだ色として表現されるが、記憶色では、温かみのある色、鮮やかな色として表現される。そして、忠実色よりも記憶色のほうが、撮影者の意図した色に近く、撮影者・閲覧者にとってより好ましい色と感じられることが多い。写真撮影時の音についても、同様のことが言えると考えられる。
【0015】
以上のように、撮影と同時に録音した音を用いる手法については、今までの技術を用いている限り、撮影者が意図した撮影時の背景や感情を強く共有することができる情報を取得することが困難であった。
【0016】
(本発明の目的)
本発明は、かかる問題を解決すべくなされたものである。本発明の目的は、撮影者の意図を反映させた音を用いて、撮影時の背景や感情を強く共有することができる画像情報(写真)を生成することが可能な画像編集装置、画像編集方法および画像編集プログラムを提供することである。
【課題を解決するための手段】
【0017】
前述の課題を解決するため、本発明による画像編集装置、画像編集方法および画像編集プログラムは、主に、次のような特徴的な構成を採用している。
【0018】
(1)本発明による画像編集装置は、撮影した画像情報に含まれる撮像対象情報に関連付けられた音情報を該画像情報に付与する画像編集装置であって、前記画像情報から、前記撮像対象情報と構図情報とを抽出する撮像対象判別手段と、前記撮像対象情報を基にして、該撮像対象情報に関連付けられる音情報を取得する音情報取得手段と、前記構図情報に基づき、前記音情報を調整するための音調整パラメータを決定し、決定した該音調整パラメータに従って前記音情報を調整して調整後音情報として出力する音情報編集手段と、前記画像情報と前記調整後音情報とを統合する撮像・音情報統合手段と、を少なくとも備えることを特徴とする。
【0019】
(2)本発明による画像編集方法は、撮影した画像情報に含まれる撮像対象情報に関連付けられた音情報を該画像情報に付与する画像編集方法であって、前記画像情報から、前記撮像対象情報と構図情報とを抽出する撮像対象判別ステップと、前記撮像対象情報を基にして、該撮像対象情報に関連付けられる前記音情報を取得する音情報取得ステップと、前記構図情報に基づき、前記音情報を調整するための音調整パラメータを決定し、決定した該音調整パラメータに従って前記音情報を調整して調整後音情報として出力する音情報編集ステップと、前記画像情報と前記調整後音情報とを統合する撮像・音情報統合ステップと、を少なくとも有することを特徴とする。
【0020】
(3)本発明による画像編集プログラムは、コンピュータに、撮影した画像情報から、撮像対象情報と構図情報とを抽出する撮像対象判別機能と、前記撮像対象情報を基にして、該撮像対象情報に関連付けられる前記音情報を取得する音情報取得機能と、前記構図情報に基づき、前記音情報を調整するための音調整パラメータを決定し、決定した該音調整パラメータに従って前記音情報を調整して調整後音情報として出力する音情報編集機能と、前記画像情報と前記調整後音情報とを統合する撮像・音情報統合機能と、を少なくとも実行させるプログラムからなっていることを特徴とする。
【発明の効果】
【0021】
本発明の画像編集装置、画像編集方法および画像編集プログラムによれば、以下のような効果を奏することができる。
【0022】
すなわち、写真を撮影した撮影者の意図を反映させた音を取得し、写真の構図に基づいて適切に調整した後、写真に付与することによって、写真を鑑賞する人が、写真撮影時の背景や感情を強く共有することができる写真として生成することができる。
【図面の簡単な説明】
【0023】
【図1】本発明の第1の実施の形態における画像編集装置のブロック構成を示すブロック構成図である。
【図2】図1の画像編集装置における撮像対象判別手段の動作の一例を示すフローチャートである。
【図3】図1の画像編集装置における撮像対象判別手段の動作詳細を説明するための画像情報の一例を示す模式図である。
【図4】図1の画像編集装置における音情報取得手段の動作の一例を示すフローチャートである。
【図5】図1の画像編集装置における音情報取得手段にて参照される音情報を管理する音情報管理テーブルの一例を示すテーブルである。
【図6】図1の画像編集装置における音情報編集手段の動作の一例を示すフローチャートである。
【図7】図1の画像編集装置における撮像・音情報統合手段の動作の一例を示すフローチャートである。
【図8】本発明の第2の実施の形態における画像編集装置のブロック構成を示すブロック構成図である。
【図9】図8の画像編集装置における音情報編集手段の動作の一例を示すフローチャートである。
【図10(a)】図8の画像編集装置における音情報編集手段の動作詳細を説明するための画像情報の一例を示す模式図である。
【図10(b)】図8の画像編集装置における音情報編集手段の動作詳細を説明するための画像情報の一例を示す模式図である。
【図11】本発明の第3の実施の形態における画像編集装置のブロック構成を示すブロック構成図である。
【図12】図11の画像編集装置における背景音抽出手段の動作の一例を示すフローチャートである。
【図13】図11の画像編集装置における音情報編集手段の動作の一例を示すフローチャートである。
【発明を実施するための形態】
【0024】
以下、本発明による画像編集装置、画像編集方法および画像編集プログラムの好適な実施形態について添付図を参照して説明する。なお、本発明では、画像情報に音情報を統合したものを含め「画像」ないし「画像情報」と総称する。また、以下の説明においては、本発明による画像編集装置および画像編集方法について説明するが、かかる画像編集方法をコンピュータにより実行可能な画像編集プログラムとして実施するようにしても良いし、あるいは、画像編集プログラムをコンピュータにより読み取り可能な記録媒体に記録するようにしても良いことは言うまでもない。また、以下の実施の形態にて示した図面および具体的な数値および内容を、本発明の限定的な解釈に用いてはならない。また、実施の形態の中で説明されている特徴の組み合わせの全てが本発明に必須であるとは限らないことも言うまでもない。
【0025】
(本発明の特徴)
本発明の実施の形態の説明に先立って、本発明の特徴についてその概要をまず説明する。本発明は、撮影した画像情報に音情報を付与する画像編集装置であって、前記画像情報から、撮像対象情報と構図情報とを抽出する撮像対象判別手段と、前記撮像対象情報を基に、該撮像対象情報と関連付けられた音情報を取得する音情報取得手段と、前記構図情報に基づき、音調整パラメータを決定し、該音調整パラメータに従い前記音情報を調整した調整後音情報を生成する音情報編集手段と、前記画像情報と前記調整後音情報とを関連付けて統合する撮像・音情報統合手段と、を備えることを主要な特徴としている。
【0026】
ここで、前記撮像対象情報とは、前記画像情報中における被写体の領域の情報を指す。また、前記構図情報とは、撮像対象および背景からなる前記画像情報中における配置に関する情報を指す。また、前記画像情報および前記音情報は、それぞれ、画像信号および音信号そのものを指す。
【0027】
つまり、前記撮像対象判別手段は、撮影した画像情報を取得すると、該画像情報から撮像対象情報および構図情報を取得する。そして、該撮像対象情報は前記音情報取得手段に、該構図情報は前記音情報編集手段に、それぞれ渡される。
【0028】
前記音情報取得手段は、前記撮像対象取得手段から撮像対象情報を取得すると、該撮像対象情報に関連付けられた音情報を取得する。取得した音情報は前記音情報編集手段に渡される。
【0029】
前記音情報編集手段は、前記撮像対象取得手段から構図情報を、前記音情報取得手段から音情報をそれぞれ取得すると、該構図情報に含まれる撮像対象の位置および大きさといった音調整パラメータの情報を基に、該音情報の定位および音の大きさ(音量)を調整する。調整後の音情報は、調整後音情報として、前記撮像・音情報統合手段に渡される。
【0030】
前記撮像・音情報統合手段は、該調整後音情報を前記音情報編集手段から取得すると、対応する画像情報と調整後音情報とを関連付けて統合する。
【0031】
すなわち、本発明においては、撮像した画像情報に含まれる撮像対象およびその構図に撮影者の意図が反映されているものと看做して、撮像した画像情報から撮像対象情報および構図情報を抽出する。また、撮影時に録音された音情報ではなく、別途用意された、記憶色に相当する象徴的な音情報を利用する。そして、撮像対象および構図を基に音情報に調整を加え、画像情報の内容および撮影者の意図を反映させた音情報に変換し、画像情報と関連付けて統合する。
【0032】
[第1の実施の形態]
(画像編集装置の構成)
次に、本発明を実施するための最良の形態について、第1の実施の形態として、図1を参照しながら説明する。図1は、本発明の第1の実施の形態における画像編集装置のブロック構成を示すブロック構成図である。図1に示す画像編集装置1は、撮像対象判別手段12と、音情報取得手段13と、音情報編集手段14と、撮像・音情報統合手段15と、を少なくとも含んで構成される。
【0033】
撮像対象判別手段12は、入力された画像情報11から撮像対象情報および構図情報を取得し、撮像対象情報を音情報取得手段13へ、構図情報を音情報編集手段14へ、画像情報11を撮像・音情報統合手段15へ、それぞれ出力する。撮像対象情報を取得する方法としては、エッジ検出などが挙げられる。例えば、画像情報11中のピントの合っている箇所を検出し、所定の色パターンに基づいて撮像対象の内容を検出する。また、構図情報の具体的な一例としては、写真中における撮像対象の位置、撮像対象が画面全体に占める割合といった情報が挙げられる。
【0034】
音情報取得手段13は、撮像対象判別手段12から取得した撮像対象情報を基に、該撮像対象情報に関連付けられた音情報を取得する。取得した音情報は、音情報編集手段14へ出力する。
【0035】
音情報編集手段14は、撮像対象判別手段12から構図情報を、音情報取得手段13から音情報をそれぞれ取得し、取得した音情報を調整するための音調整パラメータとして、取得した構図情報に基づいて該音情報の定位および音量を決定して、決定した定位および音量に調整した該音情報を、調整後音情報として編集する。編集後の調整後音情報は、撮像・音情報統合手段15へ出力する。
【0036】
撮像・音情報統合手段15は、音情報編集手段14から取得した編集後の調整後音情報と、撮像対象判別手段12から取得した画像情報11とを関連付け、画像情報と調整後音情報とを統合した画像・音統合情報16を出力する。
【0037】
(画像編集装置の動作)
次に、以上のような構成を有する画像編集装置1の動作について図2のフローチャートを用いて説明する。図2は、図1の画像編集装置1における撮像対象判別手段12の動作の一例を示すフローチャートである。
【0038】
図2のフローチャートにおいて、撮像対象判別手段12が起動されると、画像情報11の取得待ちの状態になる(ステップS111)。画像情報11を取得すると(ステップS111のYes)、取得した画像情報11の解析を行い、画像情報11から撮像対象の識別を行う(ステップS112)。続けて、該画像情報11から撮像対象の構図に関する情報を識別する(ステップS113)。そして、識別結果である撮像対象情報を音情報取得手段13に、構図情報を音情報編集手段14に、また、画像情報11を撮像・音情報統合手段15に、それぞれ、出力する(ステップS114)。出力後は、ステップS111に移行して、再び画像情報11の取得待ちの状態に戻る。
【0039】
続いて、図3の模式図を用いて、撮像対象判別手段12における撮像対象および構図の識別方法の具体例について説明する。図3は、図1の画像編集装置1における撮像対象判別手段12の動作詳細を説明するための画像情報の一例を示す模式図である。撮像対象を識別する際に、まず、エッジ検出により、撮像対象の輪郭を抽出する。そして、該輪郭中における色種別、色の配置、特徴点などを用いて撮像対象の種別を判別する。特徴点としては、目・鼻・口・手足などの人間・動物に特有な点が挙げられる。
【0040】
図3の模式図の例においては、輪郭および目などの特徴点、色情報を基にして、撮像対象が犬であることを識別する。さらに、画像中における撮像対象の輪郭の位置および大きさを測定し、構図情報を取得する。図3の模式図の例においては、撮像対象が画像の中心より右側に位置していること、また、画像中に占める撮像対象の割合が30%と比較的大きいことを、構図情報として取得することができる。
【0041】
次に、図1の画像編集装置1における音情報取得手段13の動作について図4のフローチャートを用いてその一例を説明する。図4は、図1の画像編集装置1における音情報取得手段13の動作の一例を示すフローチャートである。
【0042】
図4のフローチャートにおいて、音情報取得手段13が起動されると、撮像対象判別手段12からの撮像対象情報の取得待ちの状態になる(ステップS121)。撮像対象情報を取得すると(ステップS121のYes)、該撮像対象情報に関連付けられている音情報を取得する(ステップS122)。該音情報の具体的な一例として、あらかじめ登録された音情報を利用する他、利用者があらかじめ理想環境下において録音した利用者にとっての象徴的な音情報を利用する、あるいは、ネットワークを介して他の利用者が登録した音情報を利用する、等が挙げられる。
【0043】
なお、図1の画像編集装置1には示していないが、画像編集装置1に利用者が音情報を登録するための手段をさらに備える構成としても良い。さらに、音情報と撮像対象情報との関連付けを利用者自身が行う構成としても良く、画像編集装置1に利用者がかくのごとき関連付けを行うための手段をさらに備える構成といても良い。また、音情報の保持および取得については、例えば、画像編集装置1があらかじめ保持しているものを取得しても良いし、あるいは、ネットワークを介して取得する構成としても良い。
【0044】
また、撮像対象情報と音情報との関連付けに関するより具体的な一例としては、図5の音情報管理テーブルに示すように、撮像対象と対応音(音情報)とを関連付けた登録内容を参照して、取得した撮像対象情報に関連付けられた対応音を取得するようにしても良い。図5は、図1の画像編集装置1における音情報取得手段13にて参照される音情報を管理する音情報管理テーブルの一例を示すテーブルであり、撮像画像欄131と対応音欄132とから構成され、撮像画像との関連付けがなされた音情報を対応付けてあらかじめ登録している。
【0045】
ステップS122において、撮像対象情報に関連付けられている音情報を取得すると、取得した音情報を音情報編集手段14に出力する(ステップS123)。出力後は、ステップS121に移行して、再び撮像対象情報の取得待ちの状態に戻る。
【0046】
次に、図1の画像編集装置1における音情報編集手段14の動作について図6のフローチャートを用いてその一例を説明する。図6は、図1の画像編集装置1における音情報編集手段14の動作の一例を示すフローチャートである。
【0047】
図6のフローチャートにおいて、音情報編集手段14が起動されると、撮像対象判別手段12からの構図情報および音情報取得手段13からの音情報の取得待ちの状態になる(ステップS131)。構図情報および音情報の双方を取得すると(ステップS131のYes)、音情報編集手段14は、まず、取得した構図情報を用いて音調整パラメータを決定し(ステップS132)、しかる後、決定した音調整パラメータに基づいて、取得した音情報を調整する(ステップS133)。
【0048】
音調整パラメータの具体的な一例としては、音情報の定位および大きさ(音量)が挙げられる。例えば、図3の模式図に示したように、撮像対象の犬が画像の中心より右側に位置し、かつ、画像中に占める撮像対象の割合が30%と比較的大きいという構図情報を取得した場合には、音の定位を右側にずらし、また、音量を許容範囲の30%に調整する。
【0049】
取得した音情報を調整すると、音の定位・音量の調整後の音情報を、調整後音情報として撮像・音情報統合手段15に出力する(ステップS134)。出力後は、ステップS131に移行して、再び構図情報および音情報の取得待ちの状態に戻る。
【0050】
次に、図1の画像編集装置1における撮像・音情報統合手段15の動作について図7のフローチャートを用いてその一例を説明する。図7は、図1の画像編集装置1における撮像・音情報統合手段15の動作の一例を示すフローチャートである。
【0051】
図7のフローチャートにおいて、撮像・音情報統合手段15が起動されると、画像編集装置1に入力される画像情報11の取得待ちの状態になる(ステップS141)。画像情報11を取得すると(ステップS141のYes)、撮像・音情報統合手段15は、続いて、音情報編集手段14からの、当該画像情報11に対応する調整後音情報の取得待ちの状態になる(ステップS142)。
【0052】
当該画像情報11に対応する調整後音情報を取得すると(ステップS142のYes)、撮像・音情報統合手段15は、取得した画像情報と調整後音情報とを関連付け、画像情報と調整後音情報とを統合した画像・音統合情報16として出力する(ステップS143)。出力後は、ステップS141に移行して、再び画像情報11の取得待ちの状態に戻る。
【0053】
以上のような構成および動作を採用することにより、画像編集装置1は、撮影者の意図を反映させた音を用いて、撮影時の背景や感覚を強く共有可能な写真を生成することができる。
【0054】
本第1の実施の形態の図1に示した画像編集装置1は、当該画像編集装置1に入力された画像情報11から得られた撮像対象情報および構図情報を利用して、画像情報11に付与すべき音情報を取得している。また、付与する音情報としては、撮影時に録音された音情報ではなく、別途用意された音情報を取得して、画像情報との関連付けを行っている。
【0055】
一般に、写真撮影においては、撮像対象と構図とを、撮影者が自由に決定し、そして、該撮影者の撮影意図を示す情報として撮影画像に反映させることができる。一方で、該撮影画像と関連付ける音情報に関しては、音の特性上、撮影時に録音された音情報を利用した場合には、撮影者の意図した音を録音することが一般的には困難である場合が多い。そこで、本第1の実施の形態においては、画像情報から得られた撮像対象情報および構図情報という、当該画像の撮影者の意図に相当する情報を取得し、取得した撮像対象情報および構図情報を基にして、別途用意された象徴的な音情報を取得および編集し、編集後の音情報を調整後音情報として画像情報に加えることによって、撮影のタイミングでは取得することが困難な、撮影者にとってより好ましい音情報を用いて、撮影時の背景や感覚を共有可能な写真として生成することができる。
【0056】
なお、本第1の実施の形態においては、撮影画像に関連付ける音情報について、1種類の音情報のみを抽出する場合を示したが、該撮影画像に例えば複数の撮像対象が識別されたような場合には、複数の音情報を取得、調整し、付与するようにしても良い。例えば、具体的な一例として、犬と人とが撮影画像中に含まれている場合には、どちらも撮像対象と見做し、それぞれに関連する音情報を取得、調整し、付与する等が挙げられる。つまり、一つの画像中に撮像対象が複数存在する場合の理由の多くは、撮影者の意図であると考えられる。よって、複数の音情報を取得、調整して付与することにより、撮影者の意図をより適切に反映させることが可能となる。
【0057】
またなお、撮像対象判別手段12は、画像情報から撮像対象のみならずさらに背景情報を抽出し、音情報取得手段13は、撮像対象に関連付けられる音情報のみならずさらに背景情報に関連付けられる音情報を取得し、音情報編集手段14は、撮像対象に関連付けられた音情報のみならずさらに背景情報に関連付けられた音情報を調整するようにしても良い。
【0058】
背景情報の抽出方法の具体的な一例としては、色情報の分布を利用する等が挙げられる。また、背景情報に関連付けられる音情報の一例としては、山や森であれば、木の葉が風でそよぐ音や鳥のさえずり、ビル群等の屋外であれば、雑踏などが挙げられる。背景情報に関連付けられる音情報を利用することによって、撮像対象情報と背景情報との双方の音情報を表現することができるので、撮影者の背景や感覚をより的確に表現することが可能となる。また、風景写真などの明確な撮像対象が存在しない写真においても、撮影した風景に応じた適切な音を付与することにより、撮影時の撮影者の感覚を表現することができる。
【0059】
またなお、画像情報そのものの他に、画像に付与される撮影時情報を利用することによって、撮像対象情報あるいは背景情報を取得するようにしても良い。ここで、撮影時情報とは、撮影時の設定情報、状態情報などを指す。撮影時情報には、撮影時刻、GPS(Global Positioning System)情報、撮影時の絞り、シャッタースピード、ISO(International Standardization Organization)値、ホワイトバランスなどを含む。撮影時情報の具体的な一例としては、EXIF(Exchangable Image File Format)情報等が挙げられる。
【0060】
ここで、撮影時情報を利用する具体的な一例としては、例えば、GPS情報を利用した背景情報の取得が挙げられる。すなわち、GPS情報を利用して、山、海、都心、川沿い、道路等といった、撮影時の位置における環境を推測し、推測された環境における象徴的な音情報を取得、調整して、付与することができる。
【0061】
撮影時情報を利用することによって、画像情報のみを利用している場合と比較して、より詳細な情報を取得することができる。したがって、撮影時の状況をより的確に反映した音情報を付与することにより、撮影時の撮影者の感覚をより的確に表現することができる。
【0062】
[第2の実施の形態]
(画像編集装置の構成)
次に、本発明を実施するための第2の実施の形態について、図8を用いて説明する。図8は、本発明の第2の実施の形態における画像編集装置のブロック構成を示すブロック構成図である。本第2の実施の形態の図8に示す画像編集装置1aは、撮像対象判別手段12と、音情報取得手段13と、音情報編集手段14aと、撮像・音情報統合手段15と、編集情報保持手段21とから構成され、連続する画像情報における構図変化に基づいて音情報の調整を行う場合について説明する。
【0063】
なお、本第2の実施の形態における図8の画像編集装置1aは、前述のように、第1の実施の形態における図1の画像編集装置1と同一の構成および動作については、同一の番号を用いて表示しており、図1の画像編集装置1を構成する各部位に加え、編集情報保持手段21をさらに備えている。また、図8の画像編集装置1aの音情報編集手段14aについては、図1の画像編集装置1の音情報編集手段14とは異なり、さらに、前後の画像における撮像対象および構図の類似性に基づき、音情報の調整を行う機能を有している。
【0064】
編集情報保持手段21は、音情報編集手段14aからの要求に基づき、構図情報および音調整パラメータの格納・保持および出力を行う。ここで、音調整パラメータとは、音情報の編集・調整を行うためのパラメータを指し示す情報であり、具体的な一例としては、定位情報、音量情報などが挙げられる。なお、編集情報保持手段21の具体的な実現手段の一例としては、RAM(Random Access Memory)などの記憶媒体が挙げられる。
【0065】
(画像編集装置の動作)
次に、以上のような構成を有する画像編集装置1aについて、第1の実施の形態における図1の画像編集装置1の音情報編集手段14の動作とは異なる動作を行う音情報編集手段14aの動作について図9のフローチャートを用いて説明する。
【0066】
図9は、図8の画像編集装置1aにおける音情報編集手段14aの動作の一例を示すフローチャートである。なお、図1の画像編集装置1における音情報編集手段14の動作の説明に用いた図6のフローチャートと同一の番号を付しているステップについては、第1の実施の形態の図6の場合と同一であるため、ここでの説明を省略する。
【0067】
図9のフローチャートにおいて、音情報編集手段14aが起動され、撮像対象判別手段12からの構図情報および音情報取得手段13からの音情報を取得すると、続いて、編集情報保持手段21に格納されている各種の構図情報および音調整パラメータのうち、画像情報11に対して時間的に一つ前の直近に撮影した直近画像情報から抽出された構図情報である直近構図情報、および、該直近画像情報に関連付けられた音情報を調整した際に適用された音調整パラメータである直近音調整パラメータを、該編集情報保持手段21から取得する(ステップS211)。
【0068】
しかる後、撮像対象判別手段12から新たに取得した構図情報と、編集情報保持手段21から取得した直近の構図情報とを比較し、あらかじめ定めた類似条件を満たしているかどうかを確認する。該類似条件としては、例えば、両者の撮像対象情報が同一であり、かつ、構図変化情報として示される構図情報の変化の程度があらかじめ定めた閾値以下であった場合としても良い。かかる場合には、まず、新たに取得した撮像対象情報と直近画像情報の撮像対象情報とが同一であるかどうかを確認する(ステップS212)。撮像対象の確認方法の具体的な一例としては、撮像対象位置における色情報および特徴情報の類似度を算出する等が挙げられる。
【0069】
撮像対象情報が同一と判断された場合は(ステップS212のYes)、次に、構図の変化の程度があらかじめ定めた所定の閾値以下であるかどうかを確認する(ステップS213)。該閾値の具体的な一例としては、撮像対象の大きさおよび位置の変化の程度が、一つ前の直近構図情報と比較して、それぞれ、例えば±30%以内であり、かつ、背景構図の変化の程度が例えば±10%以内であること、等が挙げられる。
【0070】
構図変化が所定の閾値以下と判断された場合には(ステップS213のYes)、今回取得した新たな画像情報と一つ前の直近画像情報との双方の画像は、前述の類似条件を満たし、時系列的な類似性が認められることから、構図情報の変化を基にして音情報の編集を行う動作を実施する。まず、編集情報保持手段21にて保持されている過去の構図情報すなわち直近構図情報と新たな画像情報における構図情報とを用いて、時系列での構図情報の変化を抽出する(ステップS214)。具体的な一例としては、撮像対象の位置変化および大きさの時系列的な変化を算出し、変化の方向が一方向性か、あるいは、ランダムかを判断して、構図情報の時系列変化情報として抽出する。そして、一つ前の直近音調整パラメータ、直近構図情報および今回抽出された最新の構図情報の時系列変化情報を基にして、音情報取得手段13から取得した音情報の定位および音量を調整して(ステップS215)、ステップS216に移行する。
【0071】
一方、ステップS212における撮像対象の同一性判定結果として、撮像対象が同一と認められなかった場合には(ステップS212のNo)、あるいは、ステップS213における構図の類似性判定結果として、構図変化の程度が所定の閾値以下と認められなかった場合には(ステップS213のNo)、第1の実施の形態における図6の場合と同様、音情報編集手段14aは、まず、撮像対象判別手段12から取得した構図情報を用いて、音調整パラメータ(音情報の定位および音量)を決定し(ステップS132)、しかる後、決定した音調整パラメータに基づいて、音情報取得手段13から取得した音情報の定位・音量を調整して(ステップS133)、ステップS216に移行する。
【0072】
ステップS216においては、撮像対象判別手段12から取得した構図情報、および、音情報取得手段13から取得した音情報の定位および音量の調整に用いた音調整パラメータを、対応付けて編集情報保持手段21に格納する(ステップS216)。そして、定位・音量が調整された調整後の音情報を、調整後音情報として撮像・音情報統合手段15に出力する(ステップS134)。出力後は、ステップS131に移行して、再び構図情報および音情報の取得待ちの状態に戻る。
【0073】
以上の音情報編集手段14aの動作について、図10(a)及び図10(b)の模式図を用いてより詳しく説明する。図10(a)及び図10(b)は、図8の画像編集装置1aにおける音情報編集手段14aの動作詳細を説明するための画像情報の一例を示す模式図であり、橋および橋の上空を飛ぶヘリコプターを撮影した画像情報である。図10(a)及び図10(b)においては、図10(a)の画像情報11、図10(b)の画像情報11aの順番に、2枚の画像を時系列的に連続して撮影した場合を示している。
【0074】
まず、図10(a)に示す画像情報11が画像編集装置1aに入力されると、撮像対象判別手段12にて、音情報を生成させる対象となる撮像対象としてヘリコプターが写っており、また、構図情報として、画像情報11中において撮像対象のヘリコプターが左上に存在していることを識別する。音情報取得手段13は、撮像対象判別手段12が識別した撮像対象情報に基づき、撮像対象のヘリコプターに関連付けられた音情報すなわちヘリコプター音を取得して、音情報編集手段14aに出力する。音情報編集手段14aは、撮像対象判別手段12が識別した構図情報に基づき音調整パラメータを取得して、音情報取得手段13から取得したヘリコプター音の音量・定位等を調整する。しかる後、音情報編集手段14aは、取得した構図情報と音調整パラメータとを対応付けて、編集情報保持手段21に格納する。
【0075】
続いて、図10(b)に示す画像情報11aが画像編集装置1aに入力されてくる。図10(b)に示す画像情報11aについても、図10(a)に示す画像情報11の場合と同様に、撮像対象判別手段12にて、音情報を生成させる対象となる撮像対象としてヘリコプターを識別する。さらに、撮像対象判別手段12は、構図情報として、図10(b)の画像情報11a中において、図10(a)の場合よりもより大きなヘリコプター(撮像対象)が中上の位置に存在していることを識別する。
【0076】
しかる後、音情報取得手段13は、図10(a)の画像情報11に関する撮像対象情報が入力されたときと同様に、撮像対象判別手段12が識別した撮像対象情報に基づいて、撮像対象のヘリコプターに関連付けられた音情報すなわちヘリコプター音を取得して、音情報編集手段14aに出力する。音情報編集手段14aは、撮像対象判別手段12からの構図情報および音情報取得手段13からの音情報を取得すると、まず、編集情報保持手段21から直近の画像情報に関わる直近構図情報および直近音調整パラメータ、つまり、図10(a)の画像情報11に関わる構図情報および音調整パラメータを取得する。
【0077】
続いて、音情報編集手段14aは、撮像対象判別手段12から新たに取得した構図情報と、編集情報保持手段21から取得した直近構図情報とを比較した結果に基づいて、撮像対象が双方ともヘリコプターであり同一であること、および、撮像対象判別手段12から新たに取得した構図情報と、編集情報保持手段21から取得した直近構図情報とを比較した結果に基づいて、構図情報として、背景の橋に変化がなく、また、撮像対象であるヘリコプターの位置および大きさの変化も所定の閾値の範囲内であることから、過去の直近音調整パラメータを利用する動作を行うシーケンスに遷移する。
【0078】
すなわち、図10(a)の画像情報11に関する構図情報と比較して、図10(b)の画像情報11aにおいては、撮像対象のヘリコプターがより近づいている点、および、ヘリコプターの進行方向である右側方向に移動して、画像中上に位置している点を、図10(a)の画像情報11に関する構図情報からの変化として抽出する。そして、抽出された構図情報の変化情報に基づき、音調整パラメータを決定して、音情報に反映させる。具体的な一例としては、撮像対象のヘリコプターが近づいている点を明確にすべく、ヘリコプター音の開始から終了に向けて音量を大きくし、また、撮像対象のヘリコプターの定位を左上から中上へ振り向けるよう、あるいは、定位の移動をより強調するために、右上側に振り向けるよう、ヘリコプター音の鳴動時間内で変化を付ける等が挙げられる。
【0079】
以上のように、構図情報の変化を音調整パラメータに正確に反映させても良いし、あるいは、構図情報の変化をより強調するために、構図情報における変化以上にオーバーな変化を音調整パラメータに与えるようにしても良い。
【0080】
以上のような構成および動作を採用することにより、画像編集装置1aは、撮影した画像情報の時系列的な変化を利用して、より撮影時の臨場感を反映させた音を取得して、画像情報に関連付けて付与することができる。連続した一連の画像に同一の撮像対象が登場する場合には、連写機能を用いて撮影しているなど、時間軸での連続性を意識して撮影していると考えられる。したがって、時系列的な変化をより強調するように、連写した画像情報それぞれに関連付ける音情報の調整を行うことによって、撮影者の意図をより強く反映させた、撮影時の臨場感を再現するかのような音を取得することが可能となる。
【0081】
なお、前記類似条件として、複数の画像情報の時間的な連続性を判断するために、画像の撮影時情報を利用しても良い。例えば、今回取得した画像情報と一つ前の直近の時刻にて取得していた直近画像情報との双方の撮影時間の差分を、撮影時情報に基づいて求め、該撮影時間の差分が、あらかじめ定めた所定の時間例えば1秒以内であった場合には、時間的に連続した画像である可能性が高いと見做すようにしても良い。
【0082】
またなお、本第2の実施の形態の以上の説明においては、画像編集装置1aへの入力として時系列的に連続する静止画像を想定して説明したが、静止画像ではなく、動画情報を入力するようにしても良い。動画情報は、静止画像情報の連続体と見做すことができ、その連続性が自明である。また、デジタルカメラや携帯電話を利用しての動画撮影も頻繁に行われており、動画撮影時においても、静止画像撮影時の場合と同様の課題が発生する。よって、本第2の実施の形態として前述したような画像編集方法を動画情報に対しても適用することによって、撮影者の意図をより適切に反映させた、撮影時の臨場感を再現するような音情報を取得・調整して、動画情報に重畳することが可能である。なお、本画像編集装置1aに入力した動画情報を画像情報11aに変換する手法、および取得した音情報を連結して動画情報に重畳する手法については、当業者には良く知られるところであるので、ここでの説明は省略する。
【0083】
さらに、本画像編集装置1aに動画情報を入力する場合には、音調整パラメータの時間的な変化を、動画情報のフレームレートに合わせるようにしても良い。これにより、動画情報の画像の時間的な変化と音の時間的な変化とを同期させることができ、より臨場感を高めることができる。
【0084】
[第3の実施の形態]
(画像編集装置の構成)
次に、本発明を実施するための第3の実施の形態について、図11を用いて説明する。図11は、本発明の第3の実施の形態における画像編集装置のブロック構成を示すブロック構成図である。本第3の実施の形態の図11に示す画像編集装置1bは、撮像対象判別手段12と、音情報取得手段13と、音情報編集手段14bと、撮像・音情報統合手段15と、背景音抽出手段32とから構成され、撮影時に録音された音の中から、背景音情報を抽出して、撮像対象に関連付けた音情報に重畳することを可能として、より臨場感を高めた画像情報を生成する場合について説明する。先に説明したように、撮影時に録音された音情報に関しては、一般に、撮像対象を表現するためには適していないが、背景音として用いることによって、撮影環境をより強く反映させると同時に、撮像対象を指し示す音をより引き立てることが可能となる。
【0085】
なお、本第3の実施の形態における図11の画像編集装置1bは、前述のように、第1の実施の形態における図1の画像編集装置1と同一の構成および動作については、同一の番号を用いて表示しており、図1の画像編集装置1を構成する各部位に加え、背景音抽出手段32をさらに備えている。また、図11の画像編集装置1bの音情報編集手段14bについては、図1の画像編集装置1の音情報編集手段14とは異なり、音情報取得手段13から取得した音情報に加え、背景音抽出手段32から取得した背景音情報を用いて、音量・定位の調整を行う機能を有している。なお、以降の説明においては、第1の実施の形態における図1の画像編集装置1を基にして、背景音抽出手段32により抽出した背景音を重畳する場合について説明するが、第2の実施の形態における図8の画像編集装置1aを基にしても全く同様に実現可能である。
【0086】
背景音抽出手段32は、入力した画像情報11の撮影時に録音した撮影時音情報31のうち、背景音と類推される時間領域の音情報を抽出して、音情報編集手段14bへ出力する。
【0087】
(画像編集装置の動作)
次に、以上のような構成を有する画像編集装置1bについて、本第3の実施の形態において新たに追加した背景音抽出手段32の動作と、第1の実施の形態における図1の画像編集装置1の音情報編集手段14の動作とは異なる動作を行う音情報編集手段14bの動作とについて、それぞれ、図12のフローチャートと図13のフローチャートとを用いて説明する。
【0088】
まず、図12は、図11の画像編集装置1bにおける背景音抽出手段32の動作の一例を示すフローチャートである。図12のフローチャートにおいて、背景音抽出手段32が起動されると、入力した画像情報11の撮影時に同時に録音した撮影時音情報31の取得待ちの状態になる(ステップS311)。撮影時音情報31を取得すると(ステップS311のYes)、該撮影時音情報31のうち、背景音抽出用としてあらかじめ定めた背景音抽出条件に基づいて、背景音情報と類推される撮影時音情報を、撮影時背景音情報として抽出する。背景音の類推方法すなわち背景音情報の抽出条件の具体的な一例としては、撮影時音情報31をあらかじめ定めた連続する所定の時間毎に分割したときに、分割した各撮影時音情報のうち、インパルス性ノイズが含まれていない時間領域における音情報を撮影時背景音情報として抽出する、あるいは、音圧の総和で前記撮影時音情報全体を並べ替えたときに上位から数えて所定の比率(より具体的には、中央値、最低値、下位5%の領域など)にある時間領域における音情報を撮影時背景音情報として抽出する、等が挙げられる。かくのごとき背景音抽出条件を適用して、撮影時音情報31のうち、背景音と類推される時間領域の音情報を撮影時背景音情報として抽出する(ステップS312)。
【0089】
そして、抽出された背景音と類推される時間領域の音情報を、撮影時背景音情報として、音情報編集手段14bに出力する(ステップS313)。出力後は、ステップS311に移行して、再び撮影時音情報31の取得待ちの状態に戻る。
【0090】
次に、図13は、図11の画像編集装置1bにおける音情報編集手段14bの動作の一例を示すフローチャートである。図13のフローチャートにおいて、音情報編集手段14aが起動されると、撮像対象判別手段12からの構図情報、音情報取得手段13からの音情報および背景音抽出手段32から撮影時背景音情報の取得待ちの状態になる(ステップS311)。
【0091】
音情報編集手段14bは、構図情報、音情報および撮影時背景音情報を取得すると(ステップS311のYes)、まず、取得した構図情報を用いて、音情報に関する音調整パラメータおよび撮影時背景音情報に関する音調整パラメータである背景音調整パラメータを決定し、しかる後、決定した音調整パラメータに基づいて、音情報の定位および音量を調整し、また、決定した背景音調整パラメータに基づいて、撮影時背景音情報の定位および音量を調整する。そして、調整後の撮影時背景音情報すなわち調整後背景音情報に対して、調整後の音情報すなわち調整後音情報を重畳する(ステップS322)。背景音情報の調整方法すなわち背景音調整パラメータの決定方法の一例として、背景音情報の定位は画像情報の中心の位置とし、背景音情報の音量は撮像対象に関連付けられた調整後の音情報よりも小さくなるように調整する等が考えられる。
【0092】
調整後の背景音情報に調整後の音情報を重畳すると、調整後の背景音情報に重畳した調整後の音情報を、新たな調整後音情報として撮像・音情報統合手段15に出力する(ステップS134)。出力後は、ステップS321に移行して、再び構図情報、音情報および背景音情報の取得待ちの状態に戻る。
【0093】
以上のような構成および動作を採用することにより、画像編集装置1bは、撮影時の背景音を利用して、撮影時の背景音を構図情報に基づいて適切に調整した調整後背景音情報に撮像対象に関連付けられた調整後音情報を重畳させることによって、撮影時における撮影者の状況や感覚をより強く反映させた音情報を生成することができる。
【0094】
なお、本第3の実施の形態の以上の説明においては、背景音抽出手段32を用いて撮影時背景音31から画像情報に統合する背景音に関する音情報を抽出する場合について示したが、かかる場合のみに限るものではない。例えば、撮像対象取得手段12が、入力される画像情報11から被写体を示す撮像対象情報、該画像の構図を示す構図情報の他に、画像情報11の背景を示す背景情報もさらに取得し、音情報取得手段13が、抽出された前記背景情報に関連付けられた背景音情報をさらに取得し、音情報編集手段14bが、背景音抽出手段32ではなく、音情報取得手段13から取得した背景音情報を調整するための背景音調整パラメータを決定し、決定した該背景音調整パラメータに従って該背景音情報を調整して、調整後背景音情報を生成し、しかる後に、調整した該調整後背景音情報に対して、調整後音情報をさらに重畳するように構成しても良い。あるいは、撮像対象取得手段12にて背景情報を取得していた場合には、音情報編集手段14bは背景音抽出手段32から取得した背景音情報を破棄し、音情報取得手段13から取得した背景音情報のみを用いて調整後背景音情報を生成するように構成しても良い。
【0095】
本第3の実施の形態においては、撮影時に録音した音情報のうち、背景音と類推される時間領域の音情報のみを背景音情報として抽出して、定位および音量を適切に調整した後、撮像対象を表現する調整後の音情報を調整後の背景音情報に重畳している。而して、撮影者の意図と撮影時の背景情報とを音という形でも融合することができるので、撮影時の環境や撮影者の記憶により強く訴えることが可能な音情報を生成することができる。
【0096】
以上、図1ないし図13の図面を参照しながら、本発明における第1ないし第3の実施の形態について詳しく説明してきたが、本発明に係る画像編集装置の具体的な構成は、前述のものに限るものではなく、本発明の要旨を逸脱しない範囲内において様々な設計変更等が可能である。例えば、第1ないし第3の実施の形態において前述した画像編集装置1,1a,1bについては、すべての部位を一つの装置内に収容しているが、1ないし複数の部位を複数の装置に分割して収容するように構成しても良い。
【0097】
例えば、音情報の取得・編集を行う部位(音情報取得手段13、音情報編集手段14,14a,14b、編集情報保持手段21、背景音抽出手段32等)を1つの装置で実現して、画像情報の解析と音情報との統合を行う部位(撮像対象判別手段12、撮像・音情報統合手段15等)を別の装置で実現して、撮像対象情報、構図情報および音情報等を、ネットワークを介して通知し合うように構成しても良い。
【0098】
また、前述したように、第1ないし第3の実施の形態において前述した画像編集装置1,1a,1bを構成する各部位の全部または一部の機能を、コンピュータにより実行可能なプログラム(画像編集プログラム)として実施するように構成しても良いし、さらには、各部位の全部または一部の機能を実現するためのプログラム(画像編集プログラム)として実施するようにしても良い。さらには、かくのごときプログラム(画像編集プログラム)をコンピュータにより読み取り可能な記録媒体に記録して、該記録媒体に記録されたプログラム(画像編集プログラム)をコンピュータシステムに読み込ませて、実行することにより各部位の機能を実現するように構成しても良い。ここで、「コンピュータシステム」とは、CPU(Central Processing Unit)のみならず、OS(Operating System)や周辺機器等のハードウェアをも含むものとする。
【0099】
なお、前記プログラム(画像編集プログラム)は、各部位が有する機能のうち、いずれか1ないし複数の部位の機能すべてではなく、いずれか1ないし複数の部位の機能の一部を実現するためのものであっても良い。さらに、かかるプログラムが実現する機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせによって実現することができるものであっても良い。
【0100】
また、「コンピュータにより読み取り可能な記録媒体」とは、光ディスク、光磁気ディスク、ROM(Read Only Memory)、不揮発性半導体メモリ等の可搬型の記録媒体、コンピュータシステムに内蔵されるハードディスク装置等の記憶装置のことを意味している。さらに、「コンピュータにより読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間の間プログラムを保持しているものも含むものとする。
【0101】
(付記)
以上に、本発明に係る実施の形態について、詳細に説明したことからも明らかなように、前述の各実施の形態の一部または全部は、以下の各付記のようにも記載することができる。しかし、本発明はかかる場合に限るものではないことは言うまでもない。
【0102】
(付記1)
撮影した画像情報に含まれる撮像対象情報に関連付けられた音情報を該画像情報に付与する画像編集装置であって、前記画像情報から、前記撮像対象情報と構図情報とを抽出する撮像対象判別手段と、前記撮像対象情報を基にして、該撮像対象情報に関連付けられる音情報を取得する音情報取得手段と、前記構図情報に基づき、前記音情報を調整するための音調整パラメータを決定し、決定した該音調整パラメータに従って前記音情報を調整して調整後音情報として出力する音情報編集手段と、前記画像情報と前記調整後音情報とを統合する撮像・音情報統合手段と、少なくとも備える画像編集装置。
【0103】
(付記2)
前記音調整パラメータは、前記音情報の定位と音量とを調整するためのパラメータを少なくとも含む前記付記1に記載の画像編集装置。
【0104】
(付記3)
過去に撮影した画像情報のうち前記画像情報に対して時間的に一つ前の直近に撮影した直近画像情報から抽出された前記構図情報である直近構図情報と、該直近画像情報における前記撮像対象情報に関連付けられた前記音情報を調整した際の前記音調整パラメータである直近音調整パラメータとを少なくとも保持する編集情報保持手段をさらに備え、前記音情報編集手段は、最新の前記構図情報と前記直近構図情報とを比較解析し、両者の構図情報が類似していることを示す条件としてあらかじめ定めた類似条件を満たしていた場合、前記直近構図情報から最新の前記構図情報への構図変化の程度を示す構図変化情報を抽出し、前記構図情報、前記直近音調整パラメータおよび前記構図変化情報に基づいて、前記音調整パラメータを決定する前記付記1または2に記載の画像編集装置。
【0105】
(付記4)
前記類似条件は、前記撮像対象情報が同一であり、かつ、前記構図変化情報が示す前記構図変化の程度があらかじめ定めた所定の閾値以下である含む前記付記3に記載の画像編集装置。
【0106】
(付記5)
前記類似条件は、最新の前記画像情報と前記直近画像情報との撮影時刻の差分が、あらかじめ定めた所定の時間以内であることを少なくとも含む前記付記3または4に記載の画像編集装置。
【0107】
(付記6)
前記撮像対象判別手段が、前記画像情報から背景情報をさらに抽出し、前記音情報取得手段は、前記撮像対象判別手段によって抽出された前記背景情報に関連付けられた背景音情報をさらに取得し、前記音情報編集手段は、前記背景音情報を調整するための背景音調整パラメータを決定し、決定した該背景音調整パラメータに従って該背景音情報を調整した調整後背景音情報に、前記調整後音情報をさらに重畳する前記付記1ないし5のいずれかに記載の画像編集装置。
【0108】
(付記7)
前記撮像対象判別手段は、前記画像情報から前記背景情報を抽出する際に、前記画像情報の撮影時情報を用いて前記背景情報を抽出する前記付記6に記載の画像編集装置。
【0109】
(付記8)
前記撮影画像の撮影時に録音された撮影時音情報から、背景音抽出用としてあらかじめ定めた抽出条件に基づいて、背景音情報と類推される撮影時音情報を撮影時背景音情報として抽出する背景音抽出手段をさらに備え、 前記音情報編集手段は、前記構図情報に基づいて、前記背景音抽出手段によって抽出された前記撮影時背景音情報を調整するための前記音調整パラメータである背景音調整パラメータを決定し、決定した該背景音調整パラメータに従って該撮影時背景音情報を調整して調整後背景音情報として生成した後、生成した該調整後背景音情報に前記調整後音情報をさらに重畳する前記付記1ないし7のいずれかに記載の画像編集装置。
【0110】
(付記9)
前記抽出条件は、前記撮影時音情報をあらかじめ定めた所定の時間ごとに分割したときに、分割された各撮影時音情報のうち、音圧の総和で前記撮影時音情報全体を並べ替えたときに上位から数えて所定の比率にある時間領域における音情報を前記撮影時背景音情報として選定する前記付記8に記載に画像編集装置。
【0111】
(付記10)
前記抽出条件は、前記撮影時音情報をあらかじめ定めた所定の時間ごとに分割したときに、分割された各撮影時音情報のうち、インパルス性ノイズが含まれていない時間領域における音情報を前記撮影時背景音情報として選定する前記付記8に記載に画像編集装置。
【0112】
(付記12)
撮影した画像情報に含まれる撮像対象情報に関連付けられた音情報を該画像情報に付与する画像編集方法であって、前記画像情報から、前記撮像対象情報と構図情報とを抽出する撮像対象判別ステップと、前記撮像対象情報を基にして、該撮像対象情報に関連付けられる前記音情報を取得する音情報取得ステップと、前記構図情報に基づき、前記音情報を調整するための音調整パラメータを決定し、決定した該音調整パラメータに従って前記音情報を調整して調整後音情報として出力する音情報編集ステップと、前記画像情報と前記調整後音情報とを統合する撮像・音情報統合ステップと、を少なくとも有する画像編集方法。
【0113】
(付記12)
コンピュータに、撮影した画像情報から、撮像対象情報と構図情報とを抽出する撮像対象判別機能と、前記撮像対象情報を基にして、該撮像対象情報に関連付けられる前記音情報を取得する音情報取得機能と、前記構図情報に基づき、前記音情報を調整するための音調整パラメータを決定し、決定した該音調整パラメータに従って前記音情報を調整して調整後音情報として出力する音情報編集機能と、前記画像情報と前記調整後音情報とを統合する撮像・音情報統合機能と、少なくとも実行させるプログラムからなっている画像編集プログラム。
【符号の説明】
【0114】
1 画像編集装置
1a 画像編集装置
11 画像情報
11a 画像情報
12 撮像対象判別手段
13 音情報取得手段
14 音情報編集手段
14a 音情報編集手段
14b 音情報編集手段
15 撮像・音情報統合手段
16 画像・音統合情報
21 編集情報保持手段
31 撮影時取得音
32 背景音抽出手段
131 撮像画像欄
132 対応音欄

【特許請求の範囲】
【請求項1】
撮影した画像情報に含まれる撮像対象情報に関連付けられた音情報を該画像情報に付与する画像編集装置であって、
前記画像情報から、前記撮像対象情報と構図情報とを抽出する撮像対象判別手段と、
前記撮像対象情報を基にして、該撮像対象情報に関連付けられる音情報を取得する音情報取得手段と、
前記構図情報に基づき、前記音情報を調整するための音調整パラメータを決定し、決定した該音調整パラメータに従って前記音情報を調整して調整後音情報として出力する音情報編集手段と、
前記画像情報と前記調整後音情報とを統合する撮像・音情報統合手段と、
を少なくとも備えることを特徴とする画像編集装置。
【請求項2】
前記音調整パラメータは、前記音情報の定位と音量とを調整するためのパラメータを少なくとも含む
ことを特徴とする請求項1に記載の画像編集装置。
【請求項3】
過去に撮影した画像情報のうち前記画像情報に対して時間的に一つ前の直近に撮影した直近画像情報から抽出された前記構図情報である直近構図情報と、該直近画像情報における前記撮像対象情報に関連付けられた前記音情報を調整した際の前記音調整パラメータである直近音調整パラメータとを少なくとも保持する編集情報保持手段をさらに備え、
前記音情報編集手段は、最新の前記構図情報と前記直近構図情報とを比較解析し、両者の構図情報が類似していることを示す条件としてあらかじめ定めた類似条件を満たしていた場合、前記直近構図情報から最新の前記構図情報への構図変化の程度を示す構図変化情報を抽出し、前記構図情報、前記直近音調整パラメータおよび前記構図変化情報に基づいて、前記音調整パラメータを決定する
ことを特徴とする請求項1または2に記載の画像編集装置。
【請求項4】
前記類似条件は、前記撮像対象情報が同一であり、かつ、前記構図変化情報が示す前記構図変化の程度があらかじめ定めた所定の閾値以下である
ことを少なくとも含むことを特徴とする請求項3に記載の画像編集装置。
【請求項5】
前記類似条件は、最新の前記画像情報と前記直近画像情報との撮影時刻の差分が、あらかじめ定めた所定の時間以内である
ことを少なくとも含むことを特徴とする請求項3または4に記載の画像編集装置。
【請求項6】
前記撮像対象判別手段が、前記画像情報から背景情報をさらに抽出し、
前記音情報取得手段は、前記撮像対象判別手段によって抽出された前記背景情報に関連付けられた背景音情報をさらに取得し、
前記音情報編集手段は、前記背景音情報を調整するための背景音調整パラメータを決定し、決定した該背景音調整パラメータに従って該背景音情報を調整した調整後背景音情報に、前記調整後音情報をさらに重畳する
ことを特徴とする請求項1ないし5のいずれかに記載の画像編集装置。
【請求項7】
前記撮像対象判別手段は、前記画像情報から前記背景情報を抽出する際に、前記画像情報の撮影時情報を用いて前記背景情報を抽出する
ことを特徴とする請求項6に記載の画像編集装置。
【請求項8】
前記撮影画像の撮影時に録音された撮影時音情報から、背景音抽出用としてあらかじめ定めた抽出条件に基づいて、背景音情報と類推される撮影時音情報を撮影時背景音情報として抽出する背景音抽出手段をさらに備え、
前記音情報編集手段は、前記構図情報に基づいて、前記背景音抽出手段によって抽出された前記撮影時背景音情報を調整するための前記音調整パラメータである背景音調整パラメータを決定し、決定した該背景音調整パラメータに従って該撮影時背景音情報を調整して調整後背景音情報として生成した後、生成した該調整後背景音情報に前記調整後音情報をさらに重畳する
ことを特徴とする請求項1ないし7のいずれかに記載の画像編集装置。
【請求項9】
撮影した画像情報に含まれる撮像対象情報に関連付けられた音情報を該画像情報に付与する画像編集方法であって、
前記画像情報から、前記撮像対象情報と構図情報とを抽出する撮像対象判別ステップと、
前記撮像対象情報を基にして、該撮像対象情報に関連付けられる前記音情報を取得する音情報取得ステップと、
前記構図情報に基づき、前記音情報を調整するための音調整パラメータを決定し、決定した該音調整パラメータに従って前記音情報を調整して調整後音情報として出力する音情報編集ステップと、
前記画像情報と前記調整後音情報とを統合する撮像・音情報統合ステップと、
を少なくとも有することを特徴とする画像編集方法。
【請求項10】
コンピュータに、
撮影した画像情報から、撮像対象情報と構図情報とを抽出する撮像対象判別機能と、
前記撮像対象情報を基にして、該撮像対象情報に関連付けられる前記音情報を取得する音情報取得機能と、
前記構図情報に基づき、前記音情報を調整するための音調整パラメータを決定し、決定した該音調整パラメータに従って前記音情報を調整して調整後音情報として出力する音情報編集機能と、
前記画像情報と前記調整後音情報とを統合する撮像・音情報統合機能と、
を少なくとも実行させるプログラムからなっていることを特徴とする画像編集プログラム。

【図1】
image rotate

【図2】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図3】
image rotate

【図10(a)】
image rotate

【図10(b)】
image rotate


【公開番号】特開2013−114236(P2013−114236A)
【公開日】平成25年6月10日(2013.6.10)
【国際特許分類】
【出願番号】特願2011−263216(P2011−263216)
【出願日】平成23年12月1日(2011.12.1)
【出願人】(000004237)日本電気株式会社 (19,353)
【Fターム(参考)】