説明

画像処理装置及び画像処理方法

【課題】動画又は静止画群から、位置情報を考慮に入れつつ最適な静止画を抽出することが可能な画像処理装置、画像処理方法及びプログラムを提供する。
【解決手段】撮像装置1aは、メインメモリ204等から読み出された複数の撮影ファイルのそれぞれから、所定の基準又はアルゴリズムにしたがって最適静止画を抽出する最適静止画抽出部401と、抽出された複数の各最適静止画から、当該最適静止画が撮影された際の撮影位置又は撮影方向の少なくとも何れか一方の情報を含む空間情報を抽出する空間情報抽出部402と、空間情報抽出部402が抽出した空間情報に基づいて、複数の最適静止画を1以上のグループにグループ化するグループ化部403とを有する。そして、最適静止画抽出部401は、グループ化部403がグループ化したグループに複数枚の最適静止画が含まれる場合は、当該グループ毎に一の最適静止画を再度抽出する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明はビデオカメラ及びデジタルビデオカメラ等の画像処理装置及び画像処理方法に関し、特に、動画像又は連写若しくは連続取得された静止画データ内から最適な静止画を抽出する画像処理装置及び画像処理方法に関する。
【背景技術】
【0002】
従来のビデオカメラ等の動画記録再生装置では、再生動画に対して、再生中又は再生一時停止中にシャッタボタンを押すことによって、そのピクチャを静止画として記録する(抽出する)ことができる。動画は静止画の連続体であり、大量の静止画の中からその動画の特徴的な静止画を選び出す作業は困難であった。そこで、動画データの中から、その動画を代表するような静止画を自動的に選び出し、静止画として抽出するような技術が存在する。
【0003】
例えば、特許文献1には、動画像から代表画像を抽出する際に、動画像中のシーンの数に応じて代表画像の枚数が決まってしまうことで動画像内容の一括参照の作業が非効率的になってしまうような状況を回避したり、あるいは,動画像内容を一括把握するための情報としては不十分な代表画像が抽出されることを回避したりすることを目的とした動画像中の代表画像の抽出方法が開示されている。
【0004】
また、特許文献2には、静止画像抽出手段は、撮像した画像を処理して得られた画像処理情報に含まれるフレーム間差分値がしきい値以上である期間を除いた中から静止画像を抽出するか、またはフレーム間差分値が小さいほど高い評価値を出力する静止画像抽出知識にもとづいて各画像についての評価値を求め、評価値が高い画像を抽出する静止画像抽出装置が開示されている。
【0005】
さらに、特許文献3には、動画像を撮影する際に撮影者がカメラを操作したカメラ操作情報を取り込むカメラ操作情報獲得手段と、撮像した画像を処理して得られた画像処理情報を取り込む画像処理情報獲得手段と、センサからの信号を処理して得られた撮影中の撮影状態情報を取り込む撮影状態情報獲得手段と、撮影者が撮影開始操作をしてから撮影終了操作をするまでの間に撮影された動画像の中から少なくとも1枚の静止画像を抽出する静止画像抽出手段を備え、画像処理情報獲得手段からの画像処理情報と撮影状態情報獲得手段からの撮影状態情報の少なくとも一つの情報とカメラ操作情報獲得手段からのカメラ操作情報をもとにして静止画像抽出手段で静止画像を抽出する静止画像抽出装置について開示されている。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特許3936666号公報
【特許文献2】特許3525493号公報
【特許文献3】特許3404803号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、従来の動画から最適な静止画を選び出す機能は、いずれも動画ファイル1つに対して、条件に適した1乃至複数の最適な静止画を切り出すものであり、例えば同一箇所で断続的に動画を撮影した場合、同じ場面で撮影した動画ファイルが複数個存在することになり、前述の従来の最適静止画選択機能を使っても、同じ場面の同じような静止画が複数個生成されてしまうことになる。このような静止画選択は、ユーザの希望に沿っているとは言い切れず、結局ユーザ自身の手でさらに選択し直す必要が生るという問題点がある。
【0008】
本発明は、このような問題点を解決するためになされたものであり、動画又は静止画群から、位置情報を考慮に入れつつ最適な静止画を抽出することが可能な画像処理装置、画像処理方法及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0009】
本発明に係る画像処理装置は、動画又は連写若しくは連続取得された静止画群の何れかから成る撮影ファイルを複数記憶する記憶部と、前記記憶部が記憶した前記複数の撮影ファイルそれぞれから、所定の基準又はアルゴリズムにしたがって最適静止画を抽出する最適静止画抽出部と、前記最適静止画抽出部が抽出した複数の各最適静止画から、当該最適静止画が撮影された際の撮影位置又は撮影方向の少なくとも何れか一方の情報を含む空間情報を抽出する空間情報抽出部と、前記空間情報抽出部が抽出した前記空間情報に基づいて、前記複数の最適静止画を1以上のグループにグループ化するグループ化部とを備え、前記最適静止画抽出部は、前記グループ化部がグループ化したグループに複数枚の最適静止画が含まれる場合は、当該グループ毎に一の最適静止画を再度抽出することを特徴とするものである。
【0010】
本発明に係る画像処理装置は、動画又は連写若しくは連続取得された静止画群の何れかから成る撮影ファイルを複数記憶する記憶部と、前記記憶部が記憶した前記複数の撮影ファイルそれぞれから、当該撮影ファイルが撮影された際の撮影位置又は撮影方向の少なくとも何れか一方の情報を含む空間情報を抽出する空間情報抽出部と、前記空間情報抽出部が抽出した前記空間情報に基づいて、前記複数の撮影ファイルを1以上のグループにするグループ化部とを備え、前記グループ化部がグループを複数生成した場合には、当該グループ毎に、所定の基準又はアルゴリズムにしたがって最適静止画を抽出する最適静止画抽出部とを備えることを特徴とするものである。
【0011】
また、前記空間情報抽出部は、前記動画を構成する各フレーム画像、又は前記連写若しくは連続取得された静止画群を構成する各静止画の少なくとも一部から、撮影位置又は撮影方向の少なくとも何れか一方の情報を含む空間情報を抽出することにより、フレーム画像又は静止画の空間情報を考慮してグループ化を実施することができる。
【0012】
さらに、前記記憶部は、N(Nは2以上の自然数)以上の撮影ファイルを記憶するものであって、前記グループ化部は、前記最適静止画抽出部が抽出した第n(nは、2以上、(N−1)以下の自然数)番目の撮影ファイルから抽出した最適静止画の空間情報と、第(n+1)番目の撮影ファイルから抽出した最適静止画の空間情報とに基づき、両最適静止画が同一グループに含まれるか否か判断することができ、各撮影ファイルの空間情報を順次比較していくことで、確実にグループ化を行うことができる。
【0013】
さらにまた、前記最適静止画抽出部は、前記グループ化部がグループを複数生成し、当該グループ毎に最適な静止画を再度抽出する際は、空間情報からなる第1の情報、及び前記所定の基準又はアルゴリズムで使用した基準値又は特徴量からなる第2の情報のいずれか1以上を使用して最適静止画を抽出することができ、最適静止画抽出部は、再度最適静止画を抽出する際には、既に算出する等している情報から最適静止画抽出処理を実施することができる。
【0014】
また、前記各撮影ファイルに含まれるフレーム画像又は静止画の少なくとも一部の前記空間情報の変化量を抽出し、当該空間情報の変化量の大きさに基づき、モードを判定するモード判定部を備え、前記空間情報の変化量が所定の閾値より大きい場合は、前記最適静止画抽出部より最適静止画を抽出した後前記グループ化部でグループ化し、必要に応じて前記最適静止画抽出部により再度最適静止画を抽出する第1のモードを選択し、前記空間情報の変化量が所定の閾値より小さい場合は、前記グループ化部によりグループ化した後前記最適静止画抽出部により最適静止画を抽出する第2のモードを選択することができ、空間情報の変化量の大きさに基づきモードを判定することで、特に変化量の大きさに適したモードに設定することができる。
【0015】
さらに、前記モード判定部は、前記空間情報の変化量の大きさに換えて、又は加えて、前記撮影ファイルの数及び全撮影ファイルに含まれるフレーム画像又は静止画の枚数のいずれか1以上の情報に基づき、前記第1又は第2のモードを選択することができ、モードの設定は、変化量の大きさだけでなく、全体の処理速度を考慮して設定することも可能である。
【0016】
さらにまた、前記モード判定部は、各撮影ファイル毎に、各撮影ファイルに含まれる各フレーム画像又は静止画における前記空間情報の変化量の平均値、最大値、及び最小値をそれぞれ算出し、当該平均値と最大値又は最小値との差のうち大きい方を代表値として求め、各撮影ファイル毎に算出された前記代表値が所定の閾値より大きい場合は、前記第1のモードを選択し、各撮影ファイル毎に算出された前記代表値が所定の閾値より小さい場合は、前記第2のモードを選択することができ、平均値と、最大値・最小値とからその撮影ファイルを代表する位置情報となる代表値を決定し、これに応じてモードを判定することができる。
【0017】
また、前記最適静止画抽出部は、前記動画を構成するフレーム画像、又は前記連写若しくは連続取得された静止画群を構成する静止画から得られる特徴量に基づき最適静止画を抽出することができ、最適静止画抽出処理は、特徴慮に基づく実施することができる。
【0018】
さらに、前記最適静止画抽出部は、前記所定の基準又はアルゴリズムにしたがって一のフレーム画像を抽出して前記最適静止画とするか、2以上のフレーム画像を抽出しこれらを合成して前記最適静止画を生成することができ、2以上のフレーム画像を合成して1枚の静止画を生成することで、フレーム画像に含まれる各種ノイズを低減することができる。
【0019】
本発明に係る画像処理方法は、動画又は連写若しくは連続取得された静止画群の何れかから成る撮影ファイルを複数記憶する記憶部が記憶した前記複数の撮影ファイルそれぞれから、所定の基準又はアルゴリズムにしたがって最適静止画を抽出する最適静止画抽出工程と、前記最適静止画抽出工程にて抽出された複数の各最適静止画から、当該最適静止画が撮影された際の撮影位置又は撮影方向の少なくとも何れか一方の情報を含む空間情報を抽出する空間情報抽出工程と、前記空間情報抽出工程にて抽出された前記空間情報に基づいて、前記複数の最適静止画を1以上のグループにグループ化するグループ化工程とを有し、前記最適静止画抽出工程では、前記グループ化工程にてグループ化されたグループに複数枚の最適静止画が含まれる場合は、当該グループ毎に一の最適静止画を再度抽出することを特徴とするものである。
【0020】
本発明に係る画像処理方法は、動画又は連写若しくは連続取得された静止画群の何れかから成る撮影ファイルを複数記憶する記憶部が記憶した前記複数の撮影ファイルそれぞれから、当該撮影ファイルが撮影された際の撮影位置又は撮影方向の少なくとも何れか一方の情報を含む空間情報を抽出する空間情報抽出工程と、前記空間情報抽出工程にて抽出された前記空間情報に基づいて、前記複数の撮影ファイルを1以上のグループにするグループ化工程とを有し、前記グループ化工程にてグループが複数生成された場合には、当該グループ毎に、所定の基準又はアルゴリズムにしたがって最適静止画を抽出する最適静止画抽出工程とを有することを特徴とするものである。
【0021】
本発明に係るプログラムは、上述の画像処理を、コンピュータに実行させるためのものである。
【発明の効果】
【0022】
本発明によれば、動画又は静止画群から、位置情報を考慮に入れつつ最適な静止画を抽出することが可能な画像処理装置、画像処理方法及びプログラムを提供することができる。
【図面の簡単な説明】
【0023】
【図1】本発明の実施の形態1に係る撮像装置1aの構成を示すブロック図である。
【図2】本発明の実施の形態1にかかる最適静止画抽出方法を示すフローチャートである。
【図3】本発明の実施の形態2にかかる最適静止画抽出方法を示すフローチャートである。
【図4】本発明の実施の形態3にかかる最適静止画抽出方法を示すフローチャートである。
【図5】本発明の実施の形態4に係る撮像装置1bの構成を示すブロック図である。
【図6】本発明の実施の形態4にかかる最適静止画抽出方法を示すフローチャートである。
【発明を実施するための形態】
【0024】
以下に図面を参照しながら、本発明に係る撮像装置及び撮像システムの好適な実施の形態について説明する。かかる実施の形態に示す寸法、材料、その他具体的な数値等は、発明の理解を容易とするための例示にすぎず、特に断る場合を除き、本発明を限定するものではない。なお、本明細書及び図面において、実質的に同一の機能、構成を有する要素については、同一の符号を付することにより重複説明を省略し、また本発明に直接関係のない要素は図示を省略する。
【0025】
本実施の形態にかかる撮像装置は、例えば、ビデオカメラやデジタルスチルカメラ等の画像処理装置であって、動画又は連写若しくは連続取得された静止画群から最適静止画を切り出す機能を有するものである。そして、動画又は静止画群1ファイルから単純に最適な静止画を切り出すのではなく、GPS機能等から取得した位置又は撮影方向等を含む空間情報を使用し、同一場面かつ同一方向で撮影している動画又は静止画群を1つの動画静止画群と判別してグループ化し、各グループの中から既存の方法、つまり所定の基準又はアルゴリズムにしたがって最適な静止画を選び出す。または、先ず、既存の方法でフィル毎に最適静止画を抽出し、抽出した最適静止画の空間情報を得て、一のファイルから得た最適静止画の空間情報と、他のファイルから同様に得た最適静止画の空間情報とを比較し、同一と判断できる場合は、いずれか一方を最適静止画として選び出す。以上の処理により、同じような状況(位置・方角)で取得された静止画を複数切り出してしまうようなことを防止し、特徴的な静止画だけを抽出させるものである。以下、本発明の実施の形態について説明する。
【0026】
<1>本発明の実施の形態1.
上述したように、本発明は、動画又は静止画群から同じような状況(位置・方角)で取得された静止画を複数抽出することを防止するものであり、空間的にも特徴ある静止画を抽出する点に特徴を有するものであるが、本発明の理解を容易とするため、ここでは、先ず、本発明の実施の形態にかかる撮像装置の全体構成について説明する。
【0027】
図1は、本発明の実施の形態1に係る撮像装置1aの全体構成を示すブロック図である。本実施の形態にかかる撮像装置1aは、動画及び静止画像を撮影することができる。なお、本発明は、動画を撮像できるものであれば、デジタルスチルカメラをはじめ、携帯電話、PHS(Personal Handyphone System)、PDA(Personal Digital Assistant)等、その他の電子機器においても採用することができる。
【0028】
撮像装置1aは、ズームレンズ101、フォーカスレンズ102、絞り103、及び撮像素子104を有する撮像部120を備える。ズームレンズ101は図示しないズームアクチュエータによって光軸LAに沿って移動する。同様に、フォーカスレンズ102は、図示しないフォーカスアクチュエータによって光軸LAに沿って移動する。絞り103は、図示しない絞りアクチュエータに駆動されて動作する。
【0029】
撮像装置1aを用いた撮影は以下の手順で行われる。撮像素子104はズームレンズ101、フォーカスレンズ102、及び絞り103を通過した光を光電変換して、被写体のアナログ画像信号を生成する。
【0030】
アナログ画像信号処理部105が、このアナログ画像信号を増幅した後、A/D変換部106が、その増幅された信号を画像デジタルデータに変換する。画像入力コントローラ107は、A/D変換部106から出力された画像デジタルデータを取り込んで、バス200を介してラインメモリ203及びメインメモリ204に格納する。
【0031】
動画像を撮像する場合は、A/D変換部106から出力されたデジタル画像データはバス200を介して、メインメモリ204に格納される。
【0032】
静止画を取得する場合は、撮像素子104で取得された動画から任意のタイミングで静止画フレーム(フレーム画像)を取得し、ラインメモリ203にそのフレーム画像の一部であるフレームデータを格納する。なお、例えば1秒間に60フレームからなる動画の60フレーム全部を静止画として取得する場合は、画像入力コントローラ107からの動画を順次ラインメモリ203に格納すればよく、静止画を任意のタイミングで取得するための構成(例えば静止画取得部)は不要である。また、ユーザの指示により任意のタイミングで静止画を取得する場合は、例えばユーザが撮像装置1aの図示しないシャッタボタンを押下したタイミングに基づき、動画像から所定枚数のフレーム画像を取得しそのフレームデータをラインメモリ203に入力できるようにスイッチ動作するスイッチ等により、静止画取得部を構成することができる。
【0033】
上記のように処理することで、撮像装置1が動画像と静止画像を同時に撮像する場合等に、静止画データが直接ラインメモリ203により圧縮処理されたのち、その圧縮後の静止画データがメインメモリ204に格納されるよう構成できるため、メインメモリ204へのデータの格納量を削減することができる。これにより、メインメモリ204のバス帯域を確保することができ、例えば、毎秒60枚取得される静止画フレーム等の圧縮後の静止画データのメインメモリ204への書き込みが可能となるのである。
【0034】
デジタル信号処理部108は、バス200を介して中央制御部100からの指令に基づき、メインメモリ204に格納された画像デジタルデータを取り込み、所定の信号処理を施して輝度信号と色差信号とからなるデータを生成する。
【0035】
デジタル信号処理部108はまた、オフセット処理、ホワイトバランス調整処理、ガンマ補正処理、RGB補完処理、ノイズ低減処理、輪郭補正処理、色調補正処理、光源種別判定処理等の各種デジタル補正を行う。
【0036】
多重化部112は、メインメモリ204に格納された画像デジタルデータ及び音声デジタルデータを多重化しストリームデータを生成する。
【0037】
圧縮・伸長処理部201は、バス200を介して中央制御部100からの指示に従い、メインメモリ204に格納されたデータに所定の圧縮処理を施し、圧縮データを生成する。また、中央制御部100からの指令に従い、カード型記録媒体302等に格納された圧縮データに所定形式の伸張処理を施し、非圧縮データを生成する。
【0038】
なお、本実施の形態の撮像装置1aでは、静止画に対してはJPEG規格に準拠した圧縮方式が、動画に対してはMPEG2規格やAVC/H.264規格に準拠した圧縮方式が採用される。
【0039】
音声・画像処理部202は、バス200を介して中央制御部100の指示に従い、メインメモリ204から読み出したデジタルデータに所定の画像処理を施す。例えばメニュー画像やOSD画像等、各種処理のための画像データを生成し、その画像データをメインメモリ204から読み出されたオリジナルの画像デジタルデータに重畳させて液晶モニタ304に出力する。この出力によって、液晶モニタ304に表示される画像は各種画像データが合成されたものとなる。
【0040】
フラッシュROM206は、ユーザの設定情報等、撮像装置1aの動作に関する各種設定情報を格納している。メインメモリ204は、中央制御部100の演算作業領域として使用されるとともに、画像データの一時記憶領域としても使用される。VRAM205は、表示用の画像データの一時記憶領域として使用される。
【0041】
メディア制御部207は、中央制御部100の指令に従い、カードI/F301を通じてカード型記録媒体302へのデータの書き込みやデータの読み出しを制御する。
【0042】
位置センサ208は、3以上のGPS(Global Positioning System)衛星(図示せず)が発信するGPS信号を復調して、発信元のGPS衛星がGPS信号を発信した時刻(発信時刻)と、それぞれのGPS衛星の位置とを取得する。そして、位置センサ208は、時計部210が取得した時刻情報に基づいて、GPS信号を受信した時刻(受信時刻)を抽出し、抽出した受信時刻と、取得した発信時刻とからそれぞれのGPS衛星と当該撮像装置1aとの相対距離を算出し、さらに、三点測位法に基づいて、GPS衛星のそれぞれの位置から算出した相対距離にある当該撮像装置1aの平面位置(緯度、経度情報)を導出する。
【0043】
ここで、本実施の形態にかかる位置センサ208はGPS信号を用いて撮像装置1aの平面位置を導出しているが、位置導出の方法としてはGPS信号を用いるものに限定されない。例えば、平面位置が固定されている少なくとも3つの電波塔からの距離を用い三点測位法に基づいて平面位置を導出したり、撮像装置1aに方位計と3軸の加速度計を搭載し加速度計の積分値を用いて内部的に平面位置を導出したり、既存の様々な平面位置の導出方法を適用することができる。
【0044】
方位角センサ209は、地磁気センサや複数のGPS素子等を用いて構成され、水平面上で撮像部120の光軸が向いている光軸方位角を検出する。
【0045】
位置センサ208が検出した平面位置及び方位センサ209が検出した光軸方位角に関する情報は、多重化部109が生成するストリーム内に付加的な情報として付与される。例えば、H.264/AVCでは、SEI(Supplemental Enhancement Information)内に当該情報を付与することができる。SEI内に当該情報を付与することで、各ピクチャ毎に当該情報を保有することができる。一方、当該情報はストリームとは別にメタデータとして付与してもよい。メタデータとして付与した場合は、ストリームをデコードしなくとも、各ピクチャ毎の情報を得られるというメリットがある。
【0046】
液晶モニタ304、スピーカ305、操作部306及び入出力端子307は入出力I/F303に接続されている。液晶モニタ304は、例えばメインメモリ204に一時記録された撮影画像や各種メニュー画像等、各種画像を表示する。スピーカ305は、例えばメインメモリ204に一時記録された音声を出力する。操作部306は、図示しないリレーズ・スイッチや電源スイッチを含む操作キー、十字キー、ジョイスティック、又は液晶モニタ304上に重畳されたタッチパネル等から構成されており、ユーザの撮像装置1aへの操作入力を受け付ける。
【0047】
入出力端子307は、図示しないテレビモニタやPC(Personal Computer)等に接続される。
【0048】
中央制御部100は、CPU(Central Processing Unit)、各種プログラムが格納されたROM、及びワークエリアとしてのRAM等を含む半導体集積回路により構成され、撮影、各種画像の表示、記録、及び後述する最適静止画の抽出処理等、撮像装置1a全体の動作を統括的に制御する。
【0049】
<1−1>最適静止画抽出装置の構成
次に、本実施の形態にかかる撮像装置1aにおける中央制御部100について詳細に説明する。本実施の形態にかかる中央制御部100は、最適静止画抽出部401、空間情報抽出部402、及びグループ化部403を有する。また、中央制御部100には、顔画像情報が登録された顔画像情報登録部404に接続されている。
【0050】
中央制御部100は、メインメモリ204やカードI/F301を介してカード型記録媒体302等に記憶されている複数の動画を撮影ファイルとして取得する。なお、本明細書においては、ユーザが一のファイルとして保存している動画データを動画ファイルといい、後述する、ユーザが一のファイルとして保存している連写若しくは連続取得された静止画群を静止画群ファイルといい、また、動画ファイル及び静止画群ファイルを総称して撮影ファイルという。本実施の形態においては、複数の撮影ファイル、特に動画ファイルから任意の枚数の最適静止画を抽出する方法について説明する。
【0051】
本実施の形態においては、先ず、最適静止画抽出部401は、上記のように取得した複数の撮影ファイルそれぞれから、所定の基準又はアルゴリズムにしたがって最適静止画を抽出する。最適静止画の抽出方法は、特に限定されない。例えば、ユーザが家族や友人の顔画像を顔画像情報登録部404に登録し、動画データを構成する各フレーム画像において、登録した顔画像に一致する顔画像が検出された場合はそれを抽出し、さらに複数抽出された場合は、検出された登録顔画像の数、当該顔画像の大きさ・画面における位置、画像のピント情報・明るさ情報、笑顔のレベル等の各情報の一部又は全部を使用し、最適と判断されるフレーム画像を、1ファイルにつき、1枚、最適静止画として抽出する。この場合、一のフレーム画像を抽出して最適静止画としてもよいし、2以上のフレーム画像を抽出しこれらを合成して最適静止画を生成するようにしてもよい。複数のフレーム画像から1枚の静止画を生成することで、フレーム画像に含まれる各種ノイズを取り除くことができる。
【0052】
また、本実施の形態においては、中央制御部100が顔画像検出を実施するものとして説明するが、図1に示すように、図示せぬ顔画像情報登録部を内蔵した顔画像検出部410を別途設け、この顔画像検出部410にて顔画像検出処理を実施し、検出結果を中央制御部100の最適静止画抽出部401に送るようにしてもよい。また、顔画像の検出のみならず、例えばペット等、他の対象物を登録して検出対象に加えるようにしてもよい。
【0053】
空間情報抽出部402は、最適静止画抽出部401が抽出した複数の各最適静止画から、当該最適静止画が撮影された際の撮影位置又は撮影方向の少なくとも何れか一方の情報を含む空間情報を抽出する。上述したように、本実施の形態にかかる撮像装置1aは、位置センサ208及び方位センサ209を有する。本実施の形態においては、位置センサ208により取得された位置情報及び方位センサ209により取得された方角情報を合わせて空間情報ということとする。
【0054】
ここで、本実施の形態においては、動画データを撮影する際に、各フレーム画像に対し、位置センサ208により取得された位置情報及び方位センサ209により取得された方角情報を付与するようにしておく。空間情報抽出部402は、これら付与された空間情報を読み出す。
【0055】
また、空間情報は、各フレーム毎ではなく、位置情報や方角情報を取得するタイミングで、1乃至複数枚のフレーム画像毎、又は1乃至複数のGOP毎等に付与するようにしてもよい。例えば各GOPの先頭フレーム画像に空間情報を付与した場合は、1番目のGOPに含まれる各フレーム画像の空間情報は、1番目及び2番目の先頭フレーム画像に付与された空間情報から変化分を時間平均するなどして求めればよい。また、最適静止画を抽出する際には、空間情報が付与されているフレーム画像のみを使用するようにしてもよい。
【0056】
次に、グループ化部403は、空間情報抽出部402が抽出した空間情報に基づいて、複数の動画ファイルから各1枚ずつ抽出した複数の最適静止画を1以上のグループにグループ化する。この場合、例えばグループ化部403は、空間情報として、緯度、経度、方角(角度)を取得していた場合、ある一定のエリア内に緯度・経度が存在し、かつ方角が所定角以内である場合に、同一のグループと判断する等とすることができる。ある一定のエリアは、得られる位置情報の精度に応じて単純に1〜数m毎に位置を区画してもよく、またエリアは長方形の区域であってもよい。
【0057】
方角に関しても、例えばある対象物を、角度を変えて撮影し、どのくらいの角度が異なれば、異なる静止画と判別してよいかの基準値を予め測定しておくかユーザが決定する等してもよい。また、例えば、動画ファイルが20個あり、そこから5枚の最適静止画を得たい場合は、20個の最適静止画を5つのグループにグループ化する必要があるが、ユーザが5枚の最適静止画を得たいという設定をすることで、グループ化部403が動的に上記エリアや角度の基準値を大きくし、又は小さくするなどして、所望の数のグループにグループ化するようにしてもよい。この場合、5つにグループ化された各グループの1以上には、複数のフレーム画像(最適静止画)が含まれることになる。
【0058】
グループ化部403は、具体的には、撮像装置1aに、N(Nは2以上の自然数)以上の撮影ファイルが記憶されている場合において、最適静止画抽出部401が抽出した第n(nは、2以上、かつ(N−1)以下の自然数)番目の撮影ファイルから抽出した最適静止像の空間情報と、第(n+1)番目の撮影ファイルから抽出した最適静止画の空間情報とに基づき、両最適静止画が同一グループに含まれるか否か判断することにより、全N個の撮影ファイルをグループ化することができる。
【0059】
そして、グループ化部403がグループ化したグループに複数枚の最適静止画が含まれる場合は、最適静止画抽出部401は、当該グループ毎に一の最適静止画を再度抽出する。この場合、最適静止画抽出部401は、上述と同様又は異なる既存の基準又はアルゴリズムにしたがって最適静止画を再抽出してもよい。この場合は、最適静止画抽出部401が最初の最適静止画抽出の際に求めた各フレーム画像の特徴量や基準値等(第2の情報)を使用することができる。又は、空間情報抽出部402により抽出された空間情報(第1の情報)を使用し、より最適と判断されるものを抽出するようにしてもよい。又は、これら第1及び第2の情報を合わせて使用し、最適静止画を再抽出するようにしてもよい。
【0060】
<1−2>最適静止画抽出方法
次に、本実施の形態にかかる撮像装置1aにおける最適静止画抽出方法について説明する。図2は、本実施の形態にかかる最適静止画抽出方法を示すフローチャートである。図2に示すように、先ず、中央制御部100は、メインメモリ204やカードI/F301を介してカード型記録媒体302等に記憶されている動画ファイルを読み込む(ステップS101)。この場合の動画ファイルは、通常は単一の動画ファイルであるが、ユーザによって1つのファイルとして指定されている複数の動画ファイルから成るものであってもよい。次に、最適静止画抽出部401により、対象物の検出等、既存の方法により、一の動画ファイルから一の最適静止画の抽出を行う(ステップS102)。上述したように、顔画像情報登録部404の登録情報を使用して、登録された顔画像の有無に応じて最適静止画か否かを判断するようにしてもよい。
【0061】
次に、空間情報抽出部402は、各動画ファイルにつき1枚抽出されたフレーム画像(最適静止画)の空間情報を取得する(ステップS103)。このとき、抽出された各最適静止画は、最適静止画抽出処理により使用した特徴量の情報を有する。この特徴量の情報と空間情報抽出部402が取得した空間情報とを合わせて、当該最適静止画の画像情報とする。これら最適静止画の画像情報は空間情報抽出部402に送られる。
【0062】
次に、中央制御部100内の図示せぬ記憶領域に、別動画ファイルからステップS101〜S103により抽出した最適静止画があるか否かをグループ化部403が判断する(ステップS104)。既に抽出されている最適静止画(以下、既存最適静止画ともいう。)が存在する場合(ステップS104:Yes)、グループ化部403は、既存最適静止画の画像情報と、現在の最適静止画の画像情報、すなわち、位置・方角情報(空間情報)、及び特徴量を比較する(ステップS105)。空間情報を比較する場合、先ず、位置情報を抽出して比較し、位置情報が同一とみなせる範囲(同一のグループ)内と見なせない場合は、他の空間情報を比較する必要がない。位置情報が一致した場合、次に方角情報を比較し、方角が同一のグループ内と見なせるか否かを判断すればよい。
【0063】
以上のようにし、既存最適静止画のいずれか1以上と現在の最適静止画との空間情報が同一のグループ内と判断される場合(ステップS106:Yes)、両者の特徴量を比較し、現在の最適静止画の方が特徴量が既存最適静止画の特徴量より大きい場合(ステップS108:Yes)、当該現在の最適静止画で、記憶領域にある既存最適静止画を上書きする(ステップS110)。
【0064】
なお、この場合、2以上の既存最適静止画より特徴量が大きいと判断されれば、2以上の既存最適静止画のデータを削除し、現在の最適静止画のデータで置き換える。そして、中央制御部100は、次の動画ファイルがあるか否かを判断し(ステップS111)、動画ファイルがある場合は、ステップS101からの処理を繰り返す。
【0065】
一方、記憶領域に別動画ファイルから抽出した最適静止画がない場合は次の動画ファイルの処理を実施する(ステップS111)。また、ステップS106で、比較した最適静止画において、両者の空間情報が同一の範囲内にあると判断されなかった場合は、新たに抽出した最適静止画も最適静止画として保存し(ステップS107)、新たな動画ファイルがある場合はステップS101からの処理を繰り返す(ステップS111)。また、ステップS108で特徴量を比較した結果、もともと記憶されていた最適静止画の方が特徴量が大きい場合は、現在処理中の最適静止画は不敵として削除す(ステップS109)、同様に新たな動画ファイルがある場合は、ステップS101からの処理を繰り返す(ステップS111)。
【0066】
以上、本発明の実施の形態1においては、既存の最適画像抽出方法により抽出した最適静止画について、空間情報抽出部402が空間情報を取得して、空間的に最適静止画が同様な状況で撮影されているか否かを判定する。したがって、同じようなアングルで動画ファイルを複数個作成した場合には、抽出した空間情報が所定の範囲で一致することとなり、これらはグループ化され、再度最適画像抽出処理によりより最適な静止画を抽出することができ、上述したような、同じような状況(位置・方角)で取得された静止画を複数切り出してしまうことを防止することができる。
【0067】
また、動画ファイル内で各フレーム画像の位置や方角情報が大きく変化している場合でも、最適静止画抽出部401により最適静止画を抜き出すため、最適静止画の位置情報は1つに決定される。このため、グループ化部403の空間情報の比較により確実に位置・方向が異なる最適静止画を抽出することができる。
【0068】
<2>本発明の実施の形態2.
次に、本発明の実施の形態2について説明する。上述の実施の形態1では、既存の方法で最適静止画を一旦抽出した後、空間情報でグループ化して再度最適静止画を抽出するものであったが、本実施の形態においては、最初に空間情報でグループ化してから最適静止画を抽出するものである。
【0069】
本実施の形態にかかる撮像装置の構成は、図1に示す撮像装置1aと同様であり、中央制御部100には、最適静止画抽出部401、空間情報抽出部402、及びグループ化部403を備える。詳細な説明は、実施の形態1と同様であり省略する。
【0070】
次に、本実施の形態にかかる静止画抽出方法について説明する。図3は、本実施の形態にかかる最適静止画抽出方法を示すフローチャートである。図3に示すように、先ず、ステップS101と同様に、中央制御部100は、メインメモリ204やカードI/F301を介してカード型記録媒体302等に記憶されている動画ファイルを1つ読み込む(ステップS201)。次に、空間情報抽出部402は、動画ファイルの位置情報及び方角情報を取得し、そこから特徴量Mを算出する(ステップS202)。
【0071】
ここで、各動画ファイルにおける空間情報については後述するが、簡単には、各動画ファイルの先頭、中央、又は最終フレーム画像における空間情報又はこれらの平均値などを使用することができる。もしくは、全フレーム画像の空間情報の平均値を算出してもよいし、上述のように、空間情報が特定の位置(特定のフレーム画像)にのみ付与されている場合は、それらのうちの1つ又は平均値等を使用してもよい。
【0072】
さらに、ここでの特徴量Mの決め方は特に規定しないが、特徴量Mとは、計算値が一定の範囲内にあるとき、その範囲内にある結果すべてがMとなるような値である。例えば、算出された計算値が1.5から2.4の範囲内にあるとき、四捨五入により得られる特徴量Mは2となる。すなわち、フレーム画像から算出された特徴量の値が1.5から2.4の範囲内にあれば、それらのフレーム画像の特徴量M=2と求まる。この特徴量に基づきグループ化する場合は、例えば特徴量Mの値毎にグループ化することもできるし、特徴量M=0〜5、6〜10、・・等というように、ある範囲毎にグループ化することも可能である。
【0073】
ここで特徴量Mの算出方法の一例について説明する。
(1)
特徴量Mは、5つの要素からなる配列m[5]とし、m[0]は緯度、m[1]は経度、m[2]は標高、m[3]は方角情報、m[4]は顔特徴量とする。緯度、経度、標高は、一般的なGPSで用いられるGPX形式で得られるものとし、精度は全て1/1000000単位まで得られる。方角は内蔵コンパスで得られるものとし、360度単位で得られるものとする。顔特徴量は、顔画像検出部410又は中央制御部100内に設けられた図示せぬ顔画像検出部から得られるものとし、各フレーム画像内で検出された顔の特徴量を現す。
【0074】
(2)
それぞれの値に対し、どこまでの誤差を同一の値とするかを規定する設定値をm'[5]とする。説明の簡単のため、緯度のみに対して数値例を示す。
【0075】
(3)
m'[5]にしたがってm[5]を丸めた値をM[5]とする。
m[0]とm'[0]から、M[0]を求める場合について説明する。
m[0]=35.427441
m'[0]=1/10000の場合、1/1000000の桁を四捨五入することでM[0]が得られる。すなわちM[0]=35.42744と求まる。
【0076】
(4)
同様に他の要素についてもMを求め、最終的に配列M[5]を出力する。
【0077】
以上により、特徴量Mを算出したら、この特徴量Mの値に応じてグループを決定する(ステップS203)。ここで、グループ化するグループの個数はユーザがその個数、又は個数の下限若しくは上限を指定してもよいし、特徴量Mの変化量が予め定められた範囲を超えた場合は別グループにするなどの基準を設けてもよい。特徴量Mの値に応じては、例えば10個の動画ファイルがそのまま10のグループとされることもあり、10未満のグループにグループ化されることもある。
【0078】
次に、グループ登録していない動画ファイルが存在する場合は(ステップS204:Yes)、ステップS201からの処理を繰り返す。すべての動画ファイルをグループ登録し終わったら、各グループを1つの動画ファイルとみなして、ステップS102と同様に、最適静止画抽出部401により、既存の最適静止画抽出方法にしたがって最適静止画抽出処理を行い、各グループにつき1つの最適静止画を抽出する(ステップS205)。上述したように、最適静止画抽出部401は、一のフレーム画像を抽出して最適静止画としてもよいし、2以上のフレーム画像を抽出しこれらを合成して最適静止画を生成するようにしてもよい。複数のフレーム画像から1枚の静止画を生成することで、フレーム画像に含まれる各種ノイズを取り除くことができる。
【0079】
以上、本発明の実施の形態2においては、空間情報抽出部402が空間情報を使用して、動画ファイルをグループ化する。つまり、従来は、単純に例えば10個の動画ファイルを10個のファイルとみなして最適静止画を抽出したいたのに対し、本実施の形態においては、10個の動画ファイルが空間的にも異なるファイルであるか否かを空間情報に応じて再度判定し、空間的にも異なる10個のファイルであるか否かを判定する。この結果、空間的に同一のファイルであると判定された場合は、それらをグループ化して1つのファイルとみなすため、実施の形態1と同様に、同じような状況(位置・方角)で取得された静止画を複数切り出してしまうことを防止することができる。
【0080】
また、実施の形態1においては、最適静止画抽出、グループ化、再度最適静止画抽出という3段階の処理であるのに対し、本実施の形態においては、グループ化して最適静止画抽出という2段階の処理となるため、実施の形態1と比べて、動画ファイルの個数、動画ファイルを構成するフレーム画像の枚数等にもよるが、最適静止画抽出処理全体の処理量が軽くなる場合がある。ただし、後述するように、移動しながら撮影した場合など、1つの動画ファイル内で空間情報が大きく変化している場合は、抽出された最適静止画の空間情報と、動画ファイルの代表的な空間情報とが異なる可能性があり、その場合は実施の形態1の方法により最適静止画を抽出する方がユーザにとって好ましい場合がありうる。
【0081】
<3>本発明の実施の形態3.
次に、本発明の実施の形態3について説明する。上述の実施の形態1及び2については、動画ファイルから最適な静止画を抽出する方法について説明したが、本実施の形態においては、動画ファイルではなく、高速で連写若しくは連続取得された静止画群を1つのファイルとみなして処理する場合について説明する。
【0082】
本実施の形態にかかる撮像装置の構成は、図1に示す撮像装置1aと同様であり、中央制御部100には、最適静止画抽出部401、空間情報抽出部402、及びグループ化部403を備える。詳細な説明は、実施の形態1と同様であり省略する。
【0083】
次に、本実施の形態にかかる静止画抽出方法について説明する。図4は、本実施の形態にかかる最適静止画抽出方法を示すフローチャートである。図4に示すように、先ず、ステップS101と同様に、中央制御部100は、メインメモリ204やカードI/F301を介してカード型記録媒体302等に記憶されている、1つのファイルとして保存されている、連写若しくは連続取得された静止画群を1つ読み込む(ステップS201)。
【0084】
次に、読みこんだ静止画群ファイルに対して、既存の最適静止画抽出処理を行って最適静止画を抽出する(ステップS302)。一の静止画群ファイルについて処理が終わったら、別の静止画群ファイルから抽出された最適静止画があるかどうかを判定する。
【0085】
次に、中央制御部100内の図示せぬ記憶領域に、別動画ファイルからステップS301、S302により抽出された最適静止画があるか否かをグループ化部403が判断する(ステップS303)。既に抽出されている最適静止画(以下、既存最適静止画ともいう。)が存在する場合(ステップS303:Yes)、グループ化部403は、既存最適静止画の画像情報と、現在の最適静止画の画像情報、すなわち、位置・方角情報(空間情報)、及び特徴量を比較する(ステップS304)。そして、既存最適静止画のいずれか1以上と現在の最適静止画との空間情報が同一の範囲内と判断される場合(ステップS305:Yes)、両者の特徴量を比較し、現在の最適静止画の方が、特徴量が既存最適静止画の特徴量より大きい場合(ステップS306:Yes)、当該現在の最適静止画で、記憶領域にある既存最適静止画を上書きする(ステップS307)。そして、中央制御部100は、次の静止画群ファイルがあるか否かを判断し(ステップS310)、静止画群ファイルがある場合は、ステップS301からの処理を繰り返す。
【0086】
また、記憶領域に別動画ファイルから抽出した最適静止画がない場合は次の静止画群ファイルの処理を実施する(ステップS310)。また、ステップS305で、比較した最適静止画において、両者の空間情報が同一の範囲内にあると判断されなかった場合は、新たに抽出した最適静止画も最適静止画として保存し(ステップS308)、新たな静止画群ファイルがある場合はステップS301からの処理を繰り返す(ステップS310)。さらに、ステップS306で特徴量を比較した結果、元々記憶されていた最適静止画の方が特徴量が大きい場合は、現在処理中の最適静止画は不敵として削除し(ステップS309)、同様に新たな静止画群ファイルがある場合は、ステップS301からの処理を繰り返す(ステップS310)。
【0087】
以上のステップS303〜ステップS310の処理は、図2に示す実施の形態1のステップS101〜ステップS111に対応する。最適静止画を抽出する撮影ファイルが動画か静止画群かが異なる点である。
【0088】
ここで、撮影ファイルが、本実施の形態のように、高速連写された連続静止画群の場合、動画から抽出する静止画(フレーム画像)とは異なり、静止画1枚毎に、予め位置情報や方角情報等の空間情報を付与することが可能である。本実施の形態においては、例えば、撮像部120が撮影したデータを圧縮・伸張処理部201により圧縮してメインメモリ204に保存する際に、位置センサ208から位置情報、方位センサ209から方角情報を取得し、各静止画1枚毎に付与しておく。これにより、動画の場合は、例えば空間情報が所定のフレーム間隔で付与される場合は、抽出した静止画(フレーム画像)の空間情報をそれらの空間情報に基づき算出して付与する必要が生じるが、撮影時に予め空間情報を付与しておくことで、抽出した静止画の空間情報を計算する必要がなくなる。
【0089】
なお、例えば撮影時には位置情報のみを付与しておき、必要に応じて、すなわち位置情報が一致した場合にその方向情報を取得し、比較するようにしてもよい。これにより、各静止画全てに方角情報を付与する処理が削減される。
【0090】
以上のように、本発明の実施の形態3においては、実施の形態1及び2と同様に、空間情報をも用いて最適静止画を抽出するため、同じような状況(位置・方角)で取得された静止画を複数切り出してしまうことを防止することができると共に、実施の形態1と同様に、連続静止画群ファイル内で各静止画の位置や方角情報が大きく変化している場合でも、確実に位置・方向が異なる最適静止画を抽出することができる。
【0091】
更に、静止画群に含まれる各静止画に空間情報が予め付与されているので、ステップS103のように、空間情報を取得し付与する処理が不要となり、ステップS304で空間情報を比較する際、空間情報抽出部402は、各静止画に付与されている空間情報を読み出し比較するのみでよく、空間情報抽出部402における処理を軽減することが可能となる。
【0092】
<4>本発明の実施の形態4.
次に、本発明の実施の形態4について説明する。上述の実施の形態1乃至3においては、基本的には、実施の形態1及び3のように、撮影ファイルから既存の最適静止画抽出処理により最適静止画を抽出してから空間情報でグループ化し、その後最適静止画を抽出する方法と、実施の形態2のように、撮影ファイルを空間情報で先ずグループ化し、その後既存の最適静止画抽出処理により最適静止画を抽出する方法との2つの方法を説明した。以下、この実施の形態1及び3の方法で最適静止画を抽出するモードを第1のモードといい、実施の形態2の方法で最適静止画を抽出する方法を第2のモードという。
【0093】
本実施の形態においては、この第1のモード又は第2のモードのいずれの方法を使用して最適静止画抽出を行うかを自動で判断するようにするものである。例えば、上述の実施の形態、特に実施の形態1及び2に示す動画ファイルから最適静止画を抽出する場合には、第1及び第2のモードのいずれのモードを使用して最適静止画抽出を行うかの判断のために、撮影ファイルの空間情報が一意に決定されるか否かの基準を用いることができる。
【0094】
<4−1>最適静止画抽出装置の構成
図5は、本発明の実施の形態4に係る撮像装置1bの構成を示すブロック図である。図5に示すように、本実施の形態にかかる撮像装置1bは、第1及び第2のモードのいずれのモードを使用するかを判断するために、中央制御部100に、新たにモード判定部405を有している点が実施の形態1と異なる点である。
【0095】
このモード判定部405は、各撮影ファイルに含まれるフレーム画像又は静止画の少なくとも一部の空間情報の変化量を抽出し、その空間情報の変化量が所定の閾値より大きい場合は、第1のモードを選択し、空間情報の変化量が所定の閾値より小さい場合は、第2のモードを選択する。
【0096】
このモード判定部405は、具体的には、各撮影ファイル毎に、各撮影ファイルに含まれる各フレーム画像又は静止画における空間情報の変化量の平均値、最大値、及び最小値をそれぞれ算出し、当該平均値と最大値又は最小値との差のうち大きい方を代表値Aとして求め、各撮影ファイル毎に算出された代表値Aが所定の閾値Tより大きい場合は、第1のモードを選択し、各撮影ファイル毎に算出された代表値Aが所定の閾値Tより小さい場合は、第2のモードを選択するものとすることができる。
【0097】
ここで、本実施の形態においては、モード判定部405は、空間情報の変化量の大きさに応じてモードを選択するものとして説明するが、この空間情報の変化量の大きさに換えて、又は加えて、撮影ファイルの数及び全撮影ファイルに含まれるフレーム画像又は静止画の総枚数のいずれか1以上の情報に基づき、第1又は第2のモードを選択ことも可能である。すなわち、第1のモードでは、抽出処理、グループ化、及び抽出処理の3段階の処理からなり、第2のモードでは、グループ化及び抽出処理の2段階の処理からなる。いずれの処理の総処理時間は、抽出処理においては抽出処理するフレーム画像又は静止画の枚数による。グループ化においては、グルーピングする対象のファイル数又はフレーム画像若しくは静止画の枚数による。これらの条件に応じて、処理時間の速さを判断し、これに基づき第1のモードか第2のモードかを選択するようにすることも可能である。
【0098】
<4−2>最適静止画抽出方法
次に、本実施の形態にかかる撮像装置1bにおける最適静止画抽出方法について説明する。図6は、本実施の形態にかかる最適静止画抽出方法を示すフローチャートである。本例においては、撮影ファイルが動画からなるものとして説明する。例えばGPS付撮像装置で動画を撮影した場合、単位時間あたりにGPS情報が更新され、動画ストリーム内に埋め込まれる。移動しながら動画を撮影した場合、GPS情報は同一動画(一の動画ファイル)内でも大きく変化することがある。そこで、図6に示すように、先ず、任意の空間情報変化量閾値Tを設定する(ステップS401)。この閾値Tは、予め実験等などして所望の値を求めておいてもよいし、第1のモードが推奨されるような場合は、閾値Tを小さくし、第2のモードが推奨されるような場合は閾値Tを大きくするなど動的に変化させてもよい。
【0099】
次に、全ての動画ファイルについて、各動画ファイルに含まれる全フレーム画像の一部又は全部の空間情報を全て参照し(ステップS402)、各動画ファイルについて、平均値と、最大値及び最小値とを求める。そして、平均値と、最大値及び最小値との差をそれぞれ求め、それらのうち大きい方の値を動画の代表位置情報を示す代表値Aとして決定する(ステップS403)。
【0100】
そして、全ての動画ファイルの代表値Aと閾値Tを比較する(ステップS404)。そして、全ての動画ファイルのうち、1つでも代表値A>閾値Tの場合、動画の代表値Aではグループ化できないと判断し、図2に示す第1のモード、すなわち、各動画ファイルから最適静止画を抽出した上で位置情報等の空間情報を使用してグループ化するモードにより最適静止画を抽出する(ステップS405)。一方、全ての動画ファイルの代表値A<閾値Tの場合、各動画ファイルの代表値Aとする(ステップS406)。そして、図3に示す第2のモードで最適静止画抽出を行う。すなわち、各動画ファイルの代表値Aでグループ化した後、最適静止画抽出を行うモードで最適静止画抽出を実施する(ステップS407)。
【0101】
以上、本発明の実施の形態4においては、各動画ファイルの位置情報の変化量の大きさに応じて、最適静止画を抽出するモードを動的に変更することができる。また、位置情報の変化量の情報として、代表値Aを算出するため、第2のモードと判断した場合には、そのままその代表値Aを使用してグルーピングすることができる。例えば、一動画ファイル内で位置情報が大きく変化している場合は、最適静止画の位置情報とその動画ファイルの代表的な位置情報とが異なる場合があり、同じような状況(位置・方角)で撮影されたか否かを正確に判断できない場合が起こりうるが、このように、位置情報の変化量を基準とすることで、最適静止画と動画ファイルの代表的な位置情報とを一致させることができ、同様な状況で撮影されてるか否かを正確に判断することができる。以上により、ユーザは任意の動画ファイル群内から自動的に場面毎の最適な静止画を抽出することができる。
【0102】
なお、本発明は上述した実施の形態のみに限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能であることは勿論である。
【0103】
例えば、上述の最適静止画抽出処理、空間情報抽出処理、グループ化処理、及びモード判定処理は、CPUにコンピュータプログラムを実行させることにより実現することが可能である。この場合、コンピュータプログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば光磁気ディスク)、CD−ROM(Read Only Memory)、CD−R、CD−R/W、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(random access memory))を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。
【符号の説明】
【0104】
1a 撮像装置
1b 撮像装置
100 中央制御部
120 撮像部
201 圧縮・伸張処理部
203 ラインメモリ
204 メインメモリ
206 フラッシュROM
208 位置センサ
209 方位センサ
301 カードI/F
302 カード型記録媒体
401 最適静止画抽出部
402 空間情報抽出部
403 グループ化部
404 顔画像情報登録部
405 モード判定部
410 顔画像検出部

【特許請求の範囲】
【請求項1】
動画又は連写若しくは連続取得された静止画群の何れかから成る撮影ファイルを複数記憶する記憶部と、
前記記憶部が記憶した前記複数の撮影ファイルそれぞれから、所定の基準又はアルゴリズムにしたがって最適静止画を抽出する最適静止画抽出部と、
前記最適静止画抽出部が抽出した複数の各最適静止画から、それら各最適静止画が撮影された際の撮影位置又は撮影方向の少なくとも何れか一方の情報を含む空間情報を抽出する空間情報抽出部と、
前記空間情報抽出部が抽出した前記空間情報に基づいて、前記複数の最適静止画を1以上のグループにグループ化するグループ化部とを備え、
前記最適静止画抽出部は、前記グループ化部がグループ化したグループに複数枚の最適静止画が含まれる場合は、当該グループ毎に一の最適静止画を再度抽出する
ことを特徴とする画像処理装置。
【請求項2】
動画又は連写若しくは連続取得された静止画群の何れかから成る撮影ファイルを複数記憶する記憶部と、
前記記憶部が記憶した前記複数の撮影ファイルそれぞれから、当該撮影ファイルが撮影された際の撮影位置又は撮影方向の少なくとも何れか一方の情報を含む空間情報を抽出する空間情報抽出部と、
前記空間情報抽出部が抽出した前記空間情報に基づいて、前記複数の撮影ファイルを1以上のグループにするグループ化部とを備え、
前記グループ化部がグループを複数生成した場合には、当該グループ毎に、所定の基準又はアルゴリズムにしたがって最適静止画を抽出する最適静止画抽出部とを備える
ことを特徴とする画像処理装置。
【請求項3】
前記空間情報抽出部は、前記動画を構成する各フレーム画像、又は前記連写若しくは連続取得された静止画群を構成する各静止画の少なくとも一部から、撮影位置又は撮影方向の少なくとも何れか一方の情報を含む空間情報を抽出する
ことを特徴とする請求項2に記載の画像処理装置。
【請求項4】
前記記憶部は、N(Nは2以上の自然数)以上の撮影ファイルを記憶するものであって、
前記グループ化部は、前記最適静止画抽出部が抽出した第n(nは、2以上、(N−1)以下の自然数)番目の撮影ファイルから抽出した最適静止画の空間情報と、第(n+1)番目の撮影ファイルから抽出した最適静止画の空間情報とに基づき、両最適静止画が同一グループに含まれるか否か判断する
ことを特徴とする請求項1に記載の画像処理装置。
【請求項5】
前記最適静止画抽出部は、前記グループ化部がグループを複数生成し、当該グループ毎に最適な静止画を再度抽出する際は、空間情報からなる第1の情報、及び前記所定の基準又はアルゴリズムで使用した基準値又は特徴量からなる第2の情報のいずれか1以上を使用して最適静止画を抽出する
ことを特徴とする請求項1記載の画像処理装置。
【請求項6】
前記各撮影ファイルに含まれるフレーム画像又は静止画の少なくとも一部の前記空間情報の変化量を抽出し、当該空間情報の変化量の大きさに基づき、モードを判定するモード判定部を備え、
前記空間情報の変化量が所定の閾値より大きい場合は、前記最適静止画抽出部より最適静止画を抽出した後前記グループ化部でグループ化し、必要に応じて前記最適静止画抽出部により再度最適静止画を抽出する第1のモードを選択し、
前記空間情報の変化量が所定の閾値より小さい場合は、前記グループ化部によりグループ化した後前記最適静止画抽出部により最適静止画を抽出する第2のモードを選択する
ことを特徴とする請求項1又は2記載の画像処理装置。
【請求項7】
前記モード判定部は、前記空間情報の変化量の大きさに換えて、又は加えて、前記撮影ファイルの数及び全撮影ファイルに含まれるフレーム画像又は静止画の枚数のいずれか1以上の情報に基づき、前記第1又は第2のモードを選択する
ことを特徴とする請求項6記載の画像処理装置。
【請求項8】
前記モード判定部は、各撮影ファイル毎に、各撮影ファイルに含まれる各フレーム画像又は静止画における前記空間情報の変化量の平均値、最大値、及び最小値をそれぞれ算出し、当該平均値と最大値又は最小値との差のうち大きい方を代表値として求め、各撮影ファイル毎に算出された前記代表値が所定の閾値より大きい場合は、前記第1のモードを選択し、各撮影ファイル毎に算出された前記代表値が所定の閾値より小さい場合は、前記第2のモードを選択する
ことを特徴とする請求項6記載の画像処理装置。
【請求項9】
動画又は連写若しくは連続取得された静止画群の何れかから成る撮影ファイルを複数記憶する記憶部が記憶した前記複数の撮影ファイルそれぞれから、所定の基準又はアルゴリズムにしたがって最適静止画を抽出する最適静止画抽出工程と、
前記最適静止画抽出工程にて抽出された複数の各最適静止画から、当該最適静止画が撮影された際の撮影位置又は撮影方向の少なくとも何れか一方の情報を含む空間情報を抽出する空間情報抽出工程と、
前記空間情報抽出工程にて抽出された前記空間情報に基づいて、前記複数の最適静止画を1以上のグループにグループ化するグループ化工程とを有し、
前記最適静止画抽出工程では、前記グループ化工程にてグループ化されたグループに複数枚の最適静止画が含まれる場合は、当該グループ毎に一の最適静止画を再度抽出する
ことを特徴とする画像処理方法。
【請求項10】
動画又は連写若しくは連続取得された静止画群の何れかから成る撮影ファイルを複数記憶する記憶部が記憶した前記複数の撮影ファイルそれぞれから、当該撮影ファイルが撮影された際の撮影位置又は撮影方向の少なくとも何れか一方の情報を含む空間情報を抽出する空間情報抽出工程と、
前記空間情報抽出工程にて抽出された前記空間情報に基づいて、前記複数の撮影ファイルを1以上のグループにするグループ化工程とを有し、
前記グループ化工程にてグループが複数生成された場合には、当該グループ毎に、所定の基準又はアルゴリズムにしたがって最適静止画を抽出する最適静止画抽出工程とを有する
ことを特徴とする画像処理方法。
【請求項11】
動画又は連写若しくは連続取得された静止画群の何れかから成る撮影ファイルを複数記憶する記憶部が記憶した前記複数の撮影ファイルそれぞれから、所定の基準又はアルゴリズムにしたがって最適静止画を抽出する最適静止画抽出処理と、
前記最適静止画抽出処理にて抽出された複数の各最適静止画から、当該最適静止画が撮影された際の撮影位置又は撮影方向の少なくとも何れか一方の情報を含む空間情報を抽出する空間情報抽出処理と、
前記空間情報抽出処理にて抽出された前記空間情報に基づいて、前記複数の最適静止画を1以上のグループにグループ化するグループ化処理とをコンピュータに実行させるプログラムであって、
前記最適静止画抽出処理では、前記グループ化処理にてグループ化されたグループに複数枚の最適静止画が含まれる場合は、当該グループ毎に一の最適静止画を再度抽出する
ことを特徴とするプログラム。
【請求項12】
動画又は連写若しくは連続取得された静止画群の何れかから成る撮影ファイルを複数記憶する記憶部が記憶した前記複数の撮影ファイルそれぞれから、当該撮影ファイルが撮影された際の撮影位置又は撮影方向の少なくとも何れか一方の情報を含む空間情報を抽出する空間情報抽出処理と、
前記空間情報抽出処理にて抽出された前記空間情報に基づいて、前記複数の撮影ファイルを1以上のグループにするグループ化処理とを有し、
前記グループ化処理にてグループが複数生成された場合には、当該グループ毎に、所定の基準又はアルゴリズムにしたがって最適静止画を抽出する最適静止画抽出処理とをコンピュータに実行させる
ことを特徴とするプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2012−213117(P2012−213117A)
【公開日】平成24年11月1日(2012.11.1)
【国際特許分類】
【出願番号】特願2011−78635(P2011−78635)
【出願日】平成23年3月31日(2011.3.31)
【出願人】(308036402)株式会社JVCケンウッド (1,152)
【Fターム(参考)】