説明

画像処理装置および画像処理プログラム

【課題】動画像の内容全体をより的確に把握可能な静止画像を作成する画像処理装置および画像処理プログラムを提供する。
【解決手段】複数のフレームにより構成される動画像から複数のフレームを選択するフレーム選択部11aと、選択された複数のフレームから所定のオブジェクトを認識し抽出するオブジェクト抽出部11bと、オブジェクト抽出部11bにより抽出された複数のオブジェクトを含む静止画像を作成する画像作成部11cと、を備える画像処理装置。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理装置および画像処理プログラムに関する。
【背景技術】
【0002】
記録媒体に記録されている複数の静止画像をいわゆるサムネイル表示し、記録媒体の内容の把握を容易にすることが一般的に行われている。同様のことを動画像に対して行う場合、動画像には通常多数のフレームが含まれるので、サムネイル画像として適切なフレームを選択しなければならない。例えば特許文献1には、1つの記録コンテンツから複数のサムネイルデータを作成するコンテンツ記録再生装置が記載されている。このコンテンツ記録再生装置は、作成した複数のサムネイルデータをサムネイル候補として画面に表示し、それらのうちユーザが選択した1つを代表サムネイルとする。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2008−294938号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1に記載されている技術を用いても、個々のサムネイル画像は1フレームに対応しているので、動画像の内容全体をサムネイル画像から把握することは困難である。
【課題を解決するための手段】
【0005】
請求項1に係る発明は、複数のフレームにより構成される動画像から複数のフレームを選択する選択手段と、選択された複数のフレームから所定の物体像を認識し抽出する抽出手段と、抽出手段により抽出された複数の物体像を含む静止画像を作成する画像作成手段と、を備えることを特徴とする画像処理装置である。
請求項5に係る発明は、複数のフレームにより構成される動画像から複数のフレームを選択する選択工程と、選択された複数のフレームから所定の物体像を認識し抽出する抽出工程と、抽出手段により抽出された複数の物体像を含む静止画像を作成する画像作成工程と、をコンピュータに実行させることを特徴とする画像処理プログラムである。
【発明の効果】
【0006】
本発明によれば、動画像の内容全体をより的確に把握可能な静止画像を作成することができる。
【図面の簡単な説明】
【0007】
【図1】第1の実施の形態における画像処理装置の回路構成を示すブロック図である。
【図2】オブジェクト合成処理によるサムネイル画像の作成手順を示す図である。
【図3】ベストショット合成処理によるサムネイル画像の作成手順を示す図である。
【図4】動画像ファイルから代表画像を作成する処理のフローチャートである。
【図5】オブジェクト認識処理のフローチャートである。
【図6】オブジェクト合成処理のフローチャートである。
【図7】ベストショット合成処理のフローチャートである。
【発明を実施するための形態】
【0008】
(第1の実施の形態)
図1は、本実施の形態における画像処理装置の回路構成を示すブロック図である。画像処理装置1は、制御回路11,フラッシュメモリ12,DRAM13,ハードディスクドライブ14(以下、HDD14と称する),外部機器インタフェース(I/F)15,入力装置16,および表示装置17を備える。フラッシュメモリ12は、制御回路11が実行する所定の制御プログラムが記憶されている、不揮発性の記憶装置である。DRAM13は、制御プログラムが使用するデータを一時的に格納するために使用される。HDD14は不揮発性の記憶装置であり、複数の動画像ファイルが格納されている。
【0009】
外部機器I/F15は、デジタルカメラなどの外部機器を接続するためのインタフェースである。画像処理装置1の利用者は、外部機器I/F15へデジタルカメラを接続し、デジタルカメラから動画像ファイルをHDD14へ取り込むことができる。入力装置16はキーボードやマウスなどの各種の入力装置であり、ユーザの操作に応じて制御回路11へ操作信号を出力する。表示装置17は液晶モニタなどの各種の表示装置である。
【0010】
制御回路11はフレーム選択部11a,オブジェクト抽出部11b,および画像作成部11cを有する。これらの機能部は、制御回路11がフラッシュメモリ12に記憶されている所定の制御プログラムを実行することにより実現される。
【0011】
次に、画像処理装置1による動画像ファイルの一覧表示機能について説明する。制御回路11は、HDD14に格納されている複数の動画像ファイルの一覧表示機能と、動画像ファイルの再生機能と、を有する。動画像ファイルの一覧表示機能は、各々の動画像ファイルに対応する静止画像(以下、代表画像と呼ぶ)をサムネイル表示する機能である。サムネイル表示された代表画像のうち、いずれか1つがユーザにより選択されると、制御回路11は選択された代表画像に対応する動画像ファイルの再生を開始する。
【0012】
本実施形態の画像処理装置は、オブジェクト合成処理と呼ぶ処理による代表画像の作成と、ベストショット合成処理と呼ぶ処理による代表画像の作成と、を行うことが可能である。動画像ファイルの一覧表示を行う際、制御回路11は、HDD14に格納されている各々の動画像ファイルに対して、これら2つの処理のうちいずれかの処理を実行する。
【0013】
図2は、オブジェクト合成処理によるサムネイル画像の作成手順を示す図である。図2(a)に、以下で説明するオブジェクト合成処理の対象となる動画像ファイル21を示す。この動画像ファイル21は、フレームF11〜F19から構成されている。
【0014】
オブジェクト合成処理では、まずフレーム選択部11aがオブジェクト合成処理の対象となるフレームをフレームF11〜F19から選択する。フレーム選択部11aは、例えば動画像ファイル21に含まれる全てのフレームを選択するようにしてもよいし、あるいは数フレーム毎に1フレームを選択するようにしてもよい。また、シーンチェンジの検出等を考慮してフレームを選択するようにしてもよい。ここでは、図2(b)に示す4つのフレームF12,F14,F16,F19がオブジェクト合成処理の対象として選択されたこととする。
【0015】
次にオブジェクト抽出部11bが、選択されたこれら4つのフレームからオブジェクトを認識する。オブジェクトとは、各フレームに含まれる所定の物体像である。オブジェクトの認識には、例えばパターンマッチングなど公知の技術を用いることができる。図2(b)に示した例では、フレームF12からは車のオブジェクトOA1が、フレームF14からは人のオブジェクトOB2および犬のオブジェクトOC1が、フレームF16からは人のオブジェクトOB2および犬のオブジェクトOC2が、フレームF19からは犬のオブジェクトOC3および家屋のオブジェクトOD1が、それぞれ認識される。
【0016】
オブジェクト抽出部11bはこれらのオブジェクトを認識した後、これらのオブジェクトの同一性を判定する。例えば毎秒30フレームを撮影して動画像ファイルを作成した場合、連続する複数のフレームにおいて同一の物体が繰り返し撮影されることになる。オブジェクト抽出部11bは、認識した複数のオブジェクトが、上記の例のように1つの物体に基づくオブジェクトか否かを判定する。オブジェクトの同一性の判定には公知の画像認識技術を用いる。例えば人のオブジェクトであれば公知の顔認識技術等を用いることが可能である。
【0017】
例えば図2(b)では、オブジェクト抽出部11bはフレームF14において認識された人のオブジェクトOB1とフレームF16において認識された人のオブジェクトOB2とが同一人物のオブジェクトであると判定する。図2(b)に示した4つのフレームからは、同様にオブジェクトOC1,OC2,OC3が同一の物体のオブジェクトであると判定される。
【0018】
続いてオブジェクト抽出部11bは、各フレームから認識した各オブジェクトの抽出を行う。ただし、同一性の判定の結果に基づき、同一の物体のオブジェクトは1つしか抽出しない。例えば、図2(b)に示した複数のフレームからオブジェクトOC1,OC2,OC3が同時に抽出されることはない。オブジェクト抽出部11bは、これらのオブジェクトの中からいずれか1つのオブジェクトのみを抽出することになる。
【0019】
オブジェクト抽出部11bが同一の物体のオブジェクトからいずれか1つを選択する基準は、動画像ファイル21におけるオブジェクトの出現順である。例えば図2(b)において、選択されたフレームの動画像ファイル21における時系列順は、フレームF12,フレームF14,フレームF16,フレームF19という順序になっている。従って、同一の物体のオブジェクトOC1,OC2,OC3のうち、出現順が最も早いオブジェクトは、動画像ファイル21内の時系列順で最も早いフレームF14から認識されたオブジェクトOC1である。オブジェクト抽出部11bはこのように、同一の物体のオブジェクトのうち最初に出現するオブジェクトを抽出する。
【0020】
最後に画像作成部11cが、オブジェクト抽出部11bにより抽出された複数のオブジェクトを並べて1つの静止画像を作成する。作成された静止画像の例を図2(c)に示す。図2(c)に示した静止画像P1には、オブジェクト抽出部11bにより抽出された4つのオブジェクトOA1,OB1,OC1,OD1が含まれている。これらのオブジェクトは、動画像ファイル21における出現順に左から右の順で並べられている。また、静止画像P1の背景は、背景色として選択された単色の塗り潰しとなっている。この静止画像P1が、オブジェクト合成処理により作成された動画像ファイル21の代表画像である。
【0021】
図3は、ベストショット合成処理によるサムネイル画像の作成手順を示す図である。図3(a)に、以下で説明するベストショット合成処理の対象となる動画像ファイル22を示す。この動画像ファイル22はフレームF21〜F29から構成されている。
【0022】
ベストショット合成処理においても、オブジェクト合成処理と同様にまずフレームの選択、オブジェクトの認識、同一性の判定が実行される。すなわち、まずフレーム選択部11aにより処理対象とするフレームが選択される。次にオブジェクト抽出部11bによりオブジェクトが認識されると共に、各オブジェクトが同一の物体のオブジェクトか否かが判定される。なお、フレーム選択部11aは、各フレームから視点の水平移動を検知し、パノラマ画像が作成可能となるようにフレームの選択を行う。
【0023】
その後オブジェクト抽出部11bは、認識したオブジェクトに対応する物体のうち出現頻度が最も高い1つを動画像ファイル22の主要被写体として選択する。そして、この主要被写体に対応するオブジェクトのうち、サイズが最も大きいオブジェクトを主要オブジェクトとして選択する。以下、主要オブジェクトが含まれるフレームを、主要被写体のベストショットと呼ぶ。
【0024】
画像作成部11cは、フレーム選択部11aが選択したフレームに基づくパノラマ画像を作成する。そして、このパノラマ画像を背景とし、且つ主要オブジェクト以外のオブジェクトを含まない静止画像を作成する。この静止画像が、動画像ファイル22の代表画像である。
【0025】
画像作成部11cが作成するパノラマ画像は、可能な限り主要オブジェクト以外のオブジェクトを含まないように作成される。例えば移動する物体を追跡して撮影された動画像の場合、あるフレームにおいてその物体の蔭となった背景であっても、その前後のフレームでは蔭となっていないことが考えられる。従って、そのようなフレームを利用すれば、背景のパノラマ画像を主要オブジェクト以外のオブジェクトを含まないように作成することができる。
【0026】
図4は、動画像ファイルから代表画像を作成する制御回路11の処理を示すフローチャートである。本フローチャートの処理を実行するためのプログラムはフラッシュメモリ12に格納されている。まずステップS10では、フレーム選択部11aが以降の処理の対象とするフレームを選択する。ステップS20では、オブジェクト抽出部11bが後述するオブジェクト認識処理を実行する。ステップS30では、制御回路11が代表画像の作成方法を判定する。例えば動画像ファイルの視点が水平方向にパンニングしていることを検出した場合には、代表画像をベストショット合成処理により作成すべきであると判定され、それ以外の場合には代表画像をオブジェクト合成処理により作成すべきであると判定される。
【0027】
ステップS30において、制御回路11が代表画像をオブジェクト合成処理により作成すべきであると判定した場合にはステップS40へ進む。ステップS40では、オブジェクト抽出部11bおよび画像作成部11cにより、後述するオブジェクト合成処理が実行される。他方、ステップS30で、制御回路11が代表画像をベストショット合成処理により作成すべきであると判定した場合にはステップS50へ進む。ステップS50では、オブジェクト抽出部11bおよび画像作成部11cにより、後述するベストショット合成処理が実行される。
【0028】
図5は、オブジェクト認識処理のフローチャートである。この処理は、図4に示したフローチャートのステップS20において呼び出される。オブジェクト認識処理では、図4のステップS10において選択された各フレームからの、オブジェクトの認識が行われる。ステップS21では、オブジェクト抽出部11bが、フレーム選択部11aにより選択されたフレームのうち未処理のフレームを1つ読み込む。ステップS22では、オブジェクト抽出部11bが、ステップS21で読み込んだフレームからオブジェクトの認識に必要な特徴量を算出する。ステップS23では、オブジェクト抽出部11bが、ステップS21で読み込んだフレームからオブジェクトの認識を行う。オブジェクトの認識には、ステップS22で算出した特徴量を使用する。
【0029】
なお、ステップS22における特徴量の算出と、ステップS23におけるオブジェクトの認識とは、共に公知の画像認識技術を利用する。例えばパターンマッチングを用いてオブジェクトの認識を行うのであれば、まずステップS22において、あらかじめ用意された複数のパターンの各々について、処理対象のフレームとの相関を表す特徴量を算出する。そして、ステップS23において、特徴量に基づき所定の基準を満たすパターンを選択する。
【0030】
ステップS24では、オブジェクト抽出部11bが、これまでに認識されたオブジェクトとステップS23において直近に認識されたオブジェクトとの同一性を判定する。ステップS25では、オブジェクト抽出部11bがステップS23で認識したオブジェクトからオブジェクト情報を作成する。オブジェクト情報はオブジェクトの抽出を行うための情報である。オブジェクト情報には、例えばオブジェクトへ割り当てられる一意な識別子、これまでに認識したオブジェクトと同一か否かを表す情報、オブジェクトに外接する矩形、オブジェクトが認識されたフレームを特定する為の情報、等が含まれる。ステップS26では、オブジェクト抽出部11bが、ステップS24で作成したオブジェクト情報をDRAM13へ記録する。ステップS27では、オブジェクト抽出部11bがフレーム選択部11aにより選択された全フレームに対して処理を完了したか否かを判定する。未処理のフレームが残っている場合にはステップS21へ戻る。他方、全てのフレームに対して処理を完了した場合にはオブジェクト認識処理を終了する。
【0031】
図6は、オブジェクト合成処理のフローチャートである。この処理は、図4に示したフローチャートのステップS40において呼び出される。ステップS41では、ステップS25でDRAM13に記録された全てのオブジェクト情報をオブジェクト抽出部11bが読み込む。ステップS42では、オブジェクト抽出部11bが、オブジェクト情報に含まれる全オブジェクトのうち未処理のオブジェクトを出現順に1つ選択する。
【0032】
ステップS43では、オブジェクト抽出部11bが、オブジェクト情報に含まれるオブジェクトの同一性に関する情報を確認し、ステップS42で選択したオブジェクトと同一のオブジェクトが既に抽出されているか否かを判定する。抽出済みであった場合にはステップS43により肯定判定がなされ、ステップS45へ進む。他方、否定判定がなされた場合にはステップS44へ進む。ステップS44では、オブジェクト抽出部11bが、オブジェクト情報に基づいて対応するフレームからオブジェクトを抽出する。ステップS45では、オブジェクト抽出部11bが、全てのオブジェクトについて処理が完了したか否かを判定する。未処理のオブジェクトが存在する場合には否定判定がなされ、ステップS42へ戻る。他方、ステップS45において肯定判定がなされた場合にはステップS46へ進む。ステップS46では、画像作成部11cが、ステップS44において抽出された全てのオブジェクトを含む静止画像を作成する。
【0033】
図7は、ベストショット合成処理のフローチャートである。この処理は、図4に示したフローチャートのステップS50において呼び出される。ステップS51では、ステップS25でDRAM13に記録された全てのオブジェクト情報をオブジェクト抽出部11bが読み込む。ステップS52では、オブジェクト抽出部11bが、各被写体ごとの出現頻度を集計する。ステップS53では、オブジェクト抽出部11bが、ステップS52で集計した出現頻度が最も多い被写体、すなわち主要被写体を選択する。ステップS54では、オブジェクト抽出部11bが、主要被写体に対応するオブジェクトのうちサイズが最も大きいオブジェクト、すなわち主要オブジェクトを、オブジェクト情報に基づいて対応するフレームから抽出する。ステップS55では、画像作成部11cが、最終的に作成される静止画像の背景画像となるパノラマ画像を作成する。ステップS56では、画像作成部11cが、ステップS55で作成したパノラマ画像を背景とし、且つ、ステップS54で抽出された主要オブジェクト以外のオブジェクトを含まない静止画像を作成する。
【0034】
上述した第1の実施の形態による画像処理装置によれば、次の作用効果が得られる。
(1)画像作成部11cは、オブジェクト抽出部11bにより抽出された複数のオブジェクトを含む静止画像を作成する。これにより、1つの静止画像から動画像ファイルの内容全体をより的確に把握することができる。
【0035】
(2)オブジェクト抽出部11bは、複数のフレームの各々から認識された複数のオブジェクトが同一の物体のオブジェクトであった場合、複数のオブジェクトのうちいずれか1つのオブジェクトのみを抽出する。これにより、繰り返し登場する物体が存在した場合であっても、動画像ファイルの内容全体を把握しやすい静止画像が作成される。
【0036】
(3)制御回路11は、オブジェクト合成処理とベストショット合成処理とを切り替えて静止画像を作成する。これにより、動画像の特性に合った適切な静止画像が作成される。
【0037】
(4)画像作成部11cは、パノラマ画像を静止画像の背景とする場合に、主要オブジェクト以外のオブジェクトが含まれないようなパノラマ画像を作成する。これにより、主要オブジェクトが何であるかを判断しやすい静止画像が作成される。
【0038】
次のような変形も本発明の範囲内であり、変形例の一つ、もしくは複数を上述の実施形態と組み合わせることも可能である。
【0039】
(変形例1)
代表画像の作成は、サムネイル表示を行う際に実行してもよいし、動画像ファイルを作成する際に実行してもよい。例えばビデオカメラに上述した代表画像の作成処理を実行させてもよい。また、作成された代表画像を、動画像ファイルに関連付けられた画像ファイルとして記録媒体に記録してもよい。
【0040】
(変形例2)
上述した実施の形態の説明では、オブジェクト合成処理とベストショット合成処理という2つの処理を切り替えて代表画像を作成していたが、これらのうち一方の処理のみを用いて代表画像を作成するように画像処理装置を構成してもよい。
【0041】
(変形例3)
オブジェクト抽出部11bが所定の数よりも多くのオブジェクトを認識した場合、それらのオブジェクトのうち一部のもののみを抽出するようにしてもよい。例えば、所定のサイズ以下のオブジェクトは抽出しないようにしてもよいし、オブジェクトの種類や形状に基づき抽出するオブジェクトを限定するようにしてもよい。また、例えば顔認識などの技術を用いて、特定の人物のみが抽出されるようにしてもよい。あるいは、オブジェクトの一覧を表示し、抽出するオブジェクトをユーザに選択させるようにしてもよい。
【0042】
(変形例4)
同一の物体のオブジェクトからいずれか1つを選択する基準として、オブジェクトの出現順以外の基準を用いてもよい。例えばサイズが最も大きいオブジェクトを選択してもよいし、コントラストが最も高いオブジェクトを選択するようにしてもよい。あるいは、所定の画像処理により算出された特徴量を用いてオブジェクトの選択を行うようにしてもよい。
【0043】
(変形例5)
静止画像に複数のオブジェクトを配置する手法は、出現順に左から右の順で並べる以外の手法であってもよい。例えばランダムに静止画像全体に配置するようにしてもよい。また、オブジェクトの数が多い場合には、一部または全部のオブジェクトを縮小して静止画像に納めるようにしてもよい。あるいは、静止画像のサイズを大きくしてもよい。
【0044】
(変形例6)
オブジェクト合成処理とベストショット合成処理との切り替えは、上述した実施の形態に限定されない。例えばユーザが手動でどちらの処理を用いるか選択できるようにしてもよいし、動画像ファイルに出現するオブジェクトの数が所定数より多い場合にはオブジェクト合成処理を用いるようにしてもよい。
【0045】
(変形例7)
画像作成部11cがオブジェクト合成処理において作成する静止画像は、何らかの背景を有するようにしてもよい。例えばフレーム選択部11aにより選択されたフレームのうちいずれかのフレームの背景を用いるようにしてもよいし、所定の背景画像を用いるようにしてもよい。
【0046】
(変形例8)
主要被写体および主要オブジェクトの選択方法は、上述した実施の形態に限定されない。例えば最も強いエッジが検出されたフレームをベストショットとし、このフレームに含まれるオブジェクトを主要オブジェクトとする、等の方法であってもよい。
【0047】
(変形例9)
1つの動画像から複数の静止画像を作成するようにしてもよい。また、これらの静止画像を縦横に連結した静止画像を代表画像としてもよい。
【0048】
本発明の特徴を損なわない限り、本発明は上記実施の形態に限定されるものではなく、本発明の技術的思想の範囲内で考えられるその他の形態についても、本発明の範囲内に含まれる。
【符号の説明】
【0049】
1 画像処理装置
11 制御回路
11a フレーム選択部
11b オブジェクト抽出部
11c 画像作成部

【特許請求の範囲】
【請求項1】
複数のフレームにより構成される動画像から複数のフレームを選択する選択手段と、
前記選択された複数のフレームから所定の物体像を認識し抽出する抽出手段と、
前記抽出手段により抽出された複数の物体像を含む静止画像を作成する画像作成手段と、
を備えることを特徴とする画像処理装置。
【請求項2】
請求項1に記載の画像処理装置において、
前記抽出手段は、複数のフレームの各々から認識された複数の物体像が同一の物体の像であった場合、該複数の物体像のうちいずれか1つの物体像のみを抽出することを特徴とする画像処理装置。
【請求項3】
請求項1または2に記載の画像処理装置において、
前記画像作成手段は、前記動画像の少なくとも一部のフレームに基づいて作成された背景画像を背景とする前記静止画像を作成するすることを特徴とする画像処理装置。
【請求項4】
請求項3に記載の画像処理装置において、
前記背景画像は、前記動画像に含まれる複数のフレームに基づいて作成されたパノラマ画像であることを特徴とする画像処理装置。
【請求項5】
複数のフレームにより構成される動画像から複数のフレームを選択する選択工程と、
前記選択された複数のフレームから所定の物体像を認識し抽出する抽出工程と、
前記抽出手段により抽出された複数の物体像を含む静止画像を作成する画像作成工程と、
をコンピュータに実行させることを特徴とする画像処理プログラム。
【請求項6】
請求項5に記載の画像処理プログラムにおいて、
前記抽出工程は、複数のフレームの各々から認識された複数の物体像が同一の物体の像であった場合、該複数の物体像のうちいずれか1つの物体像のみを抽出することを特徴とする画像処理プログラム。
【請求項7】
請求項5または6に記載の画像処理プログラムにおいて、
前記画像作成工程は、前記動画像の少なくとも一部のフレームに基づいて作成された背景画像を背景とする前記単一の静止画像を作成するすることを特徴とする画像処理プログラム。
【請求項8】
請求項7に記載の画像処理プログラムにおいて、
前記背景画像は、前記動画像に含まれる複数のフレームに基づいて作成されたパノラマ画像であることを特徴とする画像処理プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2011−44882(P2011−44882A)
【公開日】平成23年3月3日(2011.3.3)
【国際特許分類】
【出願番号】特願2009−191310(P2009−191310)
【出願日】平成21年8月20日(2009.8.20)
【出願人】(000004112)株式会社ニコン (12,601)
【Fターム(参考)】