説明

動画代表画像抽出方法、装置、及びコンピュータ・プログラム

【課題】オブジェクトの加速度に関係なく自動的に動画の画像から代表画像を抽出する方法等を提供すること。
【解決手段】シーン内特徴画像抽出部51は、画像データの一部分を占めるオブジェクトを抽出する。画像データ分析部52により抽出したオブジェクトを含む画像データの表示面積を算出し前記オブジェクトを含む画像データに対して算出したオブジェクトの占める面積比と、動き抽出部53によりオブジェクトの動きを抽出し算出したオブジェクトの動きを含む画像データ数と、動画データの全体の画像データ数と、からOS*iIF計算部54により代表画像データの決定に関する参照値を算出する。また、参照値に基づいて代表画像データを抽出する代表画像抽出部55を備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、動画代表画像抽出方法、装置、及びコンピュータ・プログラムに関する。より詳しくは、動画から代表画像を抽出する方法、動画から代表画像を抽出する装置、及びそのコンピュータ・プログラムに関する。
【背景技術】
【0002】
従来、DVD等のメディアに収められた動画には、シーンごとに分割して1つのまとまりとし、その1つを章とし、章ごとにその章の最初の画像もしくはメディア作成者が指定した場面の画像を表示するダイジェストを作成したものが存在する。そして、この作成されたダイジェストを、動画が収められたDVD等に動画にプラスして収録することによって、該当の章の動画の頭出しを可能にする等のユーザの使い勝手を良くした方法が用いられている。
【0003】
また、撮像された動画の中から、決定的瞬間等のユーザが鑑賞を欲する動画構成画像を抽出する方法が開示されている(例えば、特許文献1)。特許文献1は、連続する動画内のオブジェクトの位置の変化に基づいて、オブジェクトの加速度を算出し、算出された加速度が基準加速度より大きいタイミングを決定的瞬間等と捉え、代表画像とする画像抽出装置に関するものである。例えば、サッカーのシュート画像であれば、ゴールに向かって蹴られたサッカーボールをオブジェクトと捉えると、オブジェクトとして捉えたサッカーボールは、シュートをされたものであるため、かなり速い速度で蹴りだされている。そして、サッカーボールの加速度は、サッカーボールを蹴った人や背景よりも加速度が大きい。そのため、サッカーボールのオブジェクトは、シーンでの加速度が大きいものとなるため、代表画像として抽出できると考えられたものである。
【特許文献1】特開2006−279939号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
しかし、特許文献1は、スポーツ等動きの伴う特定の動画にしか利用できない。動画の代表画像として抽出したい特徴的な画像は、必ずしも対象オブジェクトの加速度が大きいとは限らないからである。そのため、スローテンポの動画の場合等、対象オブジェクトの加速度が大きくないものでは、適格な代表画像を抽出することができない。
【0005】
また、章の最初の画像では、特徴的な部分を表す画像ではないことが多く、その場合には、ダイジェストを作成する際の代表画像とすることはふさわしくない。さらに、メディア作成者が、いちいち特徴的な部分を表す画像を指定する作業は、煩雑である。
【0006】
そこで、本発明は、スローテンポの動画であっても、オブジェクトの加速度に関係なく自動的に動画の画像から代表画像を抽出する方法等を提供することを目的とする。
【課題を解決するための手段】
【0007】
上記目的のため、具体的には以下のようなものを提供する。
【0008】
(1) 複数の画像データにより構成される動画データから前記動画データの特徴的場面を表す代表画像データを抽出する動画代表画像抽出方法であって、
前記画像データの一部分を占めるオブジェクトを抽出するステップと、
前記オブジェクトを含む画像データの表示面積を算出し、前記オブジェクトを含む画像データに対して前記オブジェクトの占める面積比を算出するステップと、
前記オブジェクトの動きを抽出し、前記オブジェクトの動きを含む画像データ数を算出するステップと、
前記オブジェクトの動きを含む画像データ数と、前記動画データの全体の画像データ数と、から前記オブジェクトの出現比を算出し、前記オブジェクトの占める面積比と、前記オブジェクトの出現比と、から前記代表画像データの決定に関する参照値を算出するステップと、
前記参照値に基づいて前記代表画像データを抽出するステップと、を含み、
前記代表画像データを抽出するステップは、前記オブジェクトの出現比が低く、かつ、前記オブジェクトの占める面積比が高いものを抽出する、動画代表画像抽出方法。
【0009】
(1)の構成によれば、画像データの一部分を占めるオブジェクトを抽出し、抽出したオブジェクトを含む画像データの表示面積を算出し、前記オブジェクトを含む画像データに対して算出したオブジェクトの占める面積比と、オブジェクトの動きを抽出し算出したオブジェクトの動きを含む画像データ数と、動画データの全体の画像データ数と、から代表画像データの決定に関する参照値を算出し、参照値に基づいて代表画像データを抽出することができる。そして、参照値とは、オブジェクトの出現比が低く、オブジェクトの占める面積比が高いものを抽出可能なように特徴付けられた値である。
【0010】
よって、例えば参照値に基づいて、代表的なオブジェクトとして、面積比が高いもので、かつ、出現比が低いもの、を選択することができる。出現比が低いもの、とは、全体のコマ数(画像データ数)に比較してオブジェクトが出現するコマ数(画像データ数)が少ないものを指す。このようなオブジェクトを有する画像データは、動画データ全体において特徴部分であり、代表画像としてふさわしい。これにより、出現比の高い、例えば背景画像等の複数のコマ数(画像データ数)に出現するオブジェクトを取り除くことができる。また、代表的なオブジェクトが複数コマ(複数の画像データ)に渡って出現する場合にあっては、画像全体に占める面積比の高いもの、つまり、対象オブジェクトが画像の大多数を占めている画像データを抽出することができる。
【0011】
(2) 前記参照値を算出するステップは、
OS:前記オブジェクトの面積比
N:前記動画データの画像データ数
IF:前記オブジェクトの動きを含む画像データ数として、
【数1】

により、算出する、(1)記載の動画代表画像抽出方法。
【0012】
(2)の構成によれば、オブジェクトの面積比(OS)、動画データの画像データ数(N)、及びオブジェクトの動きを含む画像データ数(IF)を利用して算出することができる。
【0013】
よって、一定の算出式に代入するだけで、代表画像を抽出することができる。なお、logの底は常用対数(10)であっても自然対数(e)であってもよい。
【0014】
(3) 前記オブジェクトは、前記オブジェクトを含む画像データのエッジ処理により抽出され、
前記オブジェクトの占める面積比を算出するステップは、前記オブジェクトを含む画像データのエッジ処理により抽出された範囲を積分により前記オブジェクトの面積を算出し、前記画像データの全体の面積を法数として除算する、(1)又は(2)記載の動画代表画像抽出方法。
【0015】
(3)の構成によれば、エッジ処理により抽出され区分求積法により求めたオブジェクトの面積から、画像データの全体の面積を除算することにより、オブジェクトの占める面積比を算出することができる。
【0016】
(4) 前記オブジェクトの動きを含む画像データ数を算出するステップは、現在の画像データと前記現在の画像データより前に表示される画像データとから前記現在の画像データの動きを検出し、前記前に表示される画像データから前記現在の画像データの動きの量だけ移動して、動きを補償することにより算出する、(1)乃至(3)記載の動画代表画像抽出方法。
【0017】
(4)の構成によれば、現在の画像データと現在より前に表示される画像データとから現在の画像データの動きを検出し、前の画像データから現在の画像データの動きの量だけ移動して、動きを補償することにより、オブジェクトの動きを含む画像データ数を算出することができる。
【0018】
(5) 複数の画像データにより構成される動画データから前記動画データの特徴的場面を表す代表画像データを抽出する動画代表画像抽出装置であって、
前記画像データの一部分を占めるオブジェクトを抽出するオブジェクト抽出部と、
前記オブジェクトを含む画像データの表示面積を算出し、前記オブジェクトを含む画像データに対して前記オブジェクトの占める面積比を算出する画像データ分析部と、
前記オブジェクトの動きを抽出し、前記オブジェクトの動きを含む画像データ数を算出する動き抽出部と、
前記オブジェクトの動きを含む画像データ数と、前記動画データの全体の画像データ数と、から前記オブジェクトの出現比を算出し、前記オブジェクトの占める面積比と、前記オブジェクトの出現比と、から前記代表画像データの決定に関する参照値を算出するOS*iIF計算部と、
前記参照値に基づいて前記代表画像データを抽出する代表画像抽出部と、を備え、
前記代表画像抽出部は、前記オブジェクトの出現比が低く、かつ、前記オブジェクトの占める面積比が高いものを抽出する動画代表画像抽出装置。
【0019】
(5)の構成によれば、代表画像データを抽出する装置は、画像データの一部分を占めるオブジェクトを抽出するオブジェクト抽出部(シーン内特徴画像抽出部)と、抽出したオブジェクトを含む画像データの面積を算出しオブジェクトを含む画像データに対してオブジェクトの占める面積比を算出する画像データ分析部と、オブジェクトの動きを抽出しオブジェクトの動きを含む画像データ数を算出する動き抽出部と、オブジェクトの出現比と算出したオブジェクトの占める面積比とから代表画像データの決定に関する値を算出するOS*iIF計算部と、算出された代表画像データの決定に関する値に基づき代表画像データを抽出する代表画像抽出部と、を備える。
【0020】
よって、上記(1)と同様な作用・効果を有する装置を提供することができる。
【0021】
(6) 前記OS*iIF計算部は、
OS:前記オブジェクトの面積比
N:前記動画データの画像データ数
IF:前記オブジェクトの動きを含む画像データ数として、
【数2】

により、算出する、(5)記載の動画代表画像抽出装置。
【0022】
(6)の構成によれば、上記(2)と同様な作用・効果を有する装置を提供することができる。
【0023】
(7) 前記オブジェクトは、前記オブジェクトを含む画像データのエッジ処理により抽出され、
前記画像データ分析部は、前記オブジェクトを含む画像データのエッジ処理により抽出された範囲を積分により前記オブジェクトの面積を算出し、前記画像データの全体の面積を法数として除算する、(5)又は(6)記載の動画代表画像抽出装置。
【0024】
(7)の構成によれば、上記(3)と同様な作用・効果を有する装置を提供することができる。
【0025】
(8) 前記動き抽出部は、現在の画像データと前記現在の画像データより前に表示される画像データとから前記現在の画像データの動きを検出し、前記前に表示される画像データから前記現在の画像データの動きの量だけ移動して、動きを補償することにより算出する、(5)乃至(7)記載の動画代表画像抽出装置。
【0026】
(8)の構成によれば、上記(4)と同様な作用・効果を有する装置を提供することができる。
【0027】
(9) 複数の画像データにより構成される動画データから前記動画データの特徴的場面を表す代表画像データを抽出させるコンピュータ・プログラムであって、
前記画像データの一部分を占めるオブジェクトを抽出するステップと、
前記オブジェクトを含む画像データの表示面積を算出し、前記オブジェクトを含む画像データに対して前記オブジェクトの占める面積比を算出するステップと、
前記オブジェクトの動きを抽出し、前記オブジェクトの動きを含む画像データ数を算出するステップと、
前記オブジェクトの動きを含む画像データ数と、前記動画データの全体の画像データ数と、から前記オブジェクトの出現比を算出し、前記オブジェクトの占める面積比と、前記オブジェクトの出現比と、から前記代表画像データの決定に関する参照値を算出するステップと、
前記参照値に基づいて前記代表画像データを抽出するステップと、をコンピュータに実行させ、
前記代表画像データを抽出するステップにより、前記オブジェクトの出現比が低く、かつ、前記オブジェクトの占める面積比が高いものを抽出させるコンピュータ・プログラム。
【0028】
(9)の構成によれば、上記(1)と同様な作用・効果を有するコンピュータ・プログラムを提供することができる。
【0029】
(10) 前記参照値を算出するステップは、
OS:前記オブジェクトの面積比
N:前記動画データの画像データ数
IF:前記オブジェクトの動きを含む画像データ数として、
【数3】

により、算出する、(9)記載のコンピュータ・プログラム。
【0030】
(10)の構成によれば、上記(2)と同様な作用・効果を有するコンピュータ・プログラムを提供することができる。
【発明の効果】
【0031】
本発明によれば、オブジェクトの加速度に関係なく自動的に動画の画像から代表画像を抽出する方法等を提供することができる。
【発明を実施するための最良の形態】
【0032】
以下、本発明を実施するための最良の形態について図を参照しながら説明する。なお、これはあくまでも一例であって、本発明の技術的範囲はこれに限られるものではない。
【0033】
[動画代表画像抽出装置10の機能構成図]
図1は、本発明の好適な実施形態の一例に係る動画代表画像抽出装置10(以下、装置10ともいう)の機能構成を示すブロック図である。
【0034】
装置10は、少なくとも動画代表画像抽出装置として機能し、サーバ等のハードウェアにより実現される。ここで、装置10は、ハードウェアの数に制限はなく、必要に応じて1又は複数で構成してよい。また、装置10のハードウェアは、必要に応じてWebサーバ、DBサーバ、アプリケーションサーバを含んで構成してよく、1台のサーバで構成しても、それぞれ別のサーバで構成してもよい。
【0035】
装置10は、制御部50を有する。制御部50は、装置10全体を制御し、少なくともシーン内特徴画像抽出部51、画像データ分析部52、動き抽出部53、OS*iIF計算部54、及び代表画像抽出部55を備える。
【0036】
さらに、装置10は、記憶部60を有し、記憶部60は、少なくともデータベースである動画DB62、及び代表画像抽出DB64を含む。
【0037】
装置10は、動画データを構成する各画像データから、シーン内の特徴画像として、各部分画像を抽出し、抽出した部分画像の画像データを分析し、所定の計算処理をした上で代表画像を決定し、抽出する。
【0038】
[DBの構成]
図2及び図3は、本発明の好適な実施形態の一例に係る記憶部60に格納されたDBの一部を示したものである。図2は、動画DB62に格納されている動画テーブル70を示す。
【0039】
動画テーブル70は、コマID71、シーン内位置72、及びコンテンツ73の各項目からなる。コマID71は、動画データを構成する各画像データごとに、付与する一意の番号である。シーン内位置72は、各画像データが動画データの先頭を0秒00とし、当該シーンが出現するまでの時間を示す。また、コンテンツ73は、その各画像データそのものを示す。
【0040】
図2に示す例によれば、コマID71が「AAA」である画像データは、シーン内位置72が、動画データの先頭から5分23秒24経過時に表示されるものである。この画像データは、うさぎが標識の方向に向いている画像を示し、コンテンツ73に格納されている。また、コマID71が「AAA」の次のコマID71が「AAB」である画像データは、「AAA」から0秒02後に表示される画像を示し、うさぎが標識の方向に少し進んだ画像がコンテンツ73に格納されている。
【0041】
このように、動画テーブル70は、動画データを構成する全ての画像データについて、画像データごとにコマID71をキーとして、シーン内位置72と、コンテンツ73とを関連付けて格納している。
【0042】
図3は、代表画像抽出DB64に格納されている代表画像抽出テーブル80を示す。
【0043】
代表画像抽出テーブル80は、コマID81、シーン内位置82、画像内位置(座標)83、画像ID84、面積比85、及びOS*iIF値86の各項目からなる。コマID81、及びシーン内位置82は、動画テーブル70のコマID71、及びシーン内位置72と同様のものである。すなわち、動画データを構成する各画像データに、一意の番号としてコマID81を付与している。また、シーン内位置82は、各画像データが動画データの先頭から当該シーンが出現するまでの時間を示す。
【0044】
画像内位置(座標)83は、画像データの部分画像データであるオブジェクトの中心を表す位置を座標として表したものである。また、画像ID84は、画像データの部分画像データであるオブジェクトを一意に示したコードである。さらに、面積比85は、画像データ内で部分画像データであるオブジェクトの占める面積の比率を表したものである。
【0045】
また、OS*iIF値86は、下記の計算式により算出した値である。
【数4】

【0046】
OSが面積比85の値を指し、Nは、動画データが有する全画像データのコマ数(画像データ数)を示す。また、IFは、対象のオブジェクトである部分画像データが出現するコマ数(画像データ数)を示す。NとIFの値が等しい場合、すなわち、全画像データに表れる部分画像データが存在する場合には、真数が1となり、対数の値が0となるため、1を加算することにより、トータルでの計算結果が0にならないようにしている。面積比に関わらず、計算結果が0になってしまうからである。
【0047】
図3に示す例によれば、コマID81が「AAA」のもので、画像ID84が「324」の部分画像データ(図3の(1))は、図2のコンテンツ73の「うさぎ」を表している。この「うさぎ」の画像データが占める割合が、全体の画像データの約10.2%であり、面積比85には「0.102」との値が格納されている。また、OS*iIF値86が「1.56」である。この例の中で、(1)は、OS*iIF値86に格納された値の中で一番大きい値を示している。これは、「うさぎ」の登場シーンが、動画データ全体の中で比較的少なく、重要なオブジェクトを示す部分画像であることを表している。
【0048】
ところで、文字で構成されたテキストデータから特徴的な語であるキーワードを見つけるための手法の1つとして、TF*IDF法が用いられている。TF*IDF法は、語の出現頻度に基づいてキーワードを重みづける方法である。この方法を用いれば、その文書にしか出現せず、しかもその文書の中で多く出現する語を抽出することができるので、その文書の特徴を表したキーワードを見つけることができるものである。
【0049】
このTF*IDF法の考えを利用して見出されたOS*iIF値により、動画の画像から代表画像を見つけ出すことができるのである。
【0050】
ここで、OS*iIFとは、OS(Object Space)とiIF(inverse Image Frequency)とを乗じたものである。短時間に表示される面積比85の大きいオブジェクトは、OS*iIF値86が大きくなる。OS*iIF値86が大きいものは、背景画像のように各画像データに共通に出現しているものではなく、特徴的な画像と認定できる。従って、動画データに含まれる個々の部分画像データ(オブジェクト)のスコアリングを、OS*iIF値86が大きいものを高いスコアとなる本計算式を用いることにより、代表画像データを抽出することができる。
【0051】
[部分画像抽出例]
図4は、本発明の好適な実施形態の一例に係る画像データに基づき部分画像の抽出をした例を示す図である。
【0052】
図2の動画テーブル70のコマID71が「AAA」のコンテンツ73に格納されている画像データから、エッジ処理により、複数の部分画像データについて輪郭が抽出されている。図4の(1)はうさぎ、(2)は標識、(3)は背景、(4)は前景の部分画像データを抜き出したものである。この図4の(1)のうさぎは図3の(1)に、図4の(2)の標識は図3の(2)に、図4の(3)の背景は図3の(3)に、それぞれ対応付けられている。
【0053】
[処理フロー]
図5は、本発明の好適な実施形態の一例に係る代表画像抽出処理の処理フローである。
【0054】
まず、ステップS1において、制御部50は、動画DB62の動画テーブル70より、画像データを抽出する。その後、制御部50は、処理をステップS2に移す。
【0055】
ステップS2では、制御部50(シーン内特徴画像抽出部51)は、ステップS1の処理で抽出した画像データから、部分画像データをさらに抽出し、代表画像抽出DB64の代表画像抽出テーブル80に格納する。
【0056】
具体的には、動画テーブル70のコマID71とシーン内位置72と同じ値を、代表画像抽出テーブル80のコマID81とシーン内位置82に格納する。また、部分画像データであるオブジェクトの座標を、画像内位置(座標)83に格納する。また、オブジェクトの部分画像データに画像IDを付与し、画像ID84に格納する。この画像ID84は、同一オブジェクトに対しては、同一のIDを付与する。従って、図2の動画テーブル70のコンテンツ73に例示されている、うさぎの画像については、代表画像抽出テーブル80のコマID81が「AAA」と「AAB」とで異なっていても、同一の画像ID84である「324」が図3で付与されているのである。
【0057】
その後、制御部50は、処理をステップS3に移す。
【0058】
ステップS3では、制御部50(画像データ分析部52)は、ステップS2で抽出し、代表画像抽出DB64の代表画像抽出テーブル80に格納された部分画像データごとに、動画テーブル70のコンテンツ73に格納された画像データを用いて面積比を算出し、代表画像抽出テーブル80の面積比85に格納する。具体的には、コンテンツ73に格納された画像データの当該部分画像データについて、エッジ処理により物体の輪郭を取出し、その部分画像データの範囲を積分により算出する。また、算出された部分画像データの面積から、画像データ全体の面積を除算する。その後、制御部50は、処理をステップS4に移す。
【0059】
ステップS4では、制御部50は、ステップS2で抽出された全ての部分画像データについて、面積比を算出する処理を行ったか否かを判断する。制御部50が、全ての部分画像データについて、面積比の算出処理を行った場合(ステップS4の処理でYESが判断された場合)には、制御部50は、処理をステップS5に移す。他方、制御部50が、全ての部分画像データについて、面積比の算出処理を行っていない場合(ステップS4の処理でNOが判断された場合)には、制御部50は、処理をステップS3に移す。
【0060】
ステップS5では、制御部50(動き抽出部53)は、同一の部分画像データが連続した複数のコマ(画像データ)に存在した場合に、そのコマ数(画像データ数)をカウントする。その後、制御部50は、処理をステップS6に移す。
【0061】
ステップS6では、制御部50は、動画DB62の動画テーブル70に格納された全ての画像データについて処理を行ったか否かを判断する。全ての画像データについて処理を行った場合(ステップS6の処理でYESが判断された場合)には、制御部50は、処理をステップS7に移す。他方、全ての画像データについて処理を行っていない場合(ステップS6の処理でNOが判断された場合)には、制御部50は、処理をステップS1に移し、残りの画像データについて、引き続きステップS1からステップS5までの処理を行う。
【0062】
ステップS7では、制御部50(OS*iIF計算部54)は、代表画像抽出DB64に格納された代表画像抽出テーブル80についてOS*iIF値を算出し、OS*iIF値86に格納する。そして、算出し、代表画像抽出テーブル80に格納されたOS*iIF値86に基づいて、値の大きい順にランク付けをする。その後、制御部50は、処理をステップS8に移す。
【0063】
ステップS8では、制御部50(代表画像抽出部55)は、ステップS7でランク付けされたOS*iIF値の上位のデータを取得し、これを代表画像データとして抽出する。その後、制御部50は、本処理を終了する。
【0064】
上述の処理をすることにより、動画データから、代表画像データを抽出することができるのである。
【0065】
[装置10のハードウェア構成]
図6は、本発明の好適な実施形態の一例に係る装置10のハードウェア構成を示す図である。装置10は、シーン内特徴画像抽出部51、画像データ分析部52、動き抽出部53、OS*iIF計算部54、及び代表画像抽出部55を含む、制御部50を構成するCPU(Central Processing Unit)110(マルチプロセッサ構成ではCPU120等複数のCPUが追加されてもよい)、バスライン105、通信I/F140、メインメモリ150、BIOS(Basic Input Output System)160、USBポート190、I/Oコントローラ170、並びにキーボード及びマウス180等の入力手段や表示装置122を備える。
【0066】
I/Oコントローラ170には、テープドライブ172、ハードディスク174、光ディスクドライブ176、半導体メモリ178、等の記憶部60を構成する記憶手段を接続することができる。
【0067】
BIOS160は、装置10の起動時にCPU110が実行するブートプログラムや、装置10のハードウェアに依存するプログラム等を格納する。
【0068】
ハードディスク174は、装置10として機能するための各種プログラム及び本発明の機能を実行するプログラムを記憶しており、さらに必要に応じて各種データベースを構成可能である。
【0069】
光ディスクドライブ176としては、例えば、DVD−ROMドライブ、CD−ROMドライブ、DVD−RAMドライブ、CD−RAMドライブを使用することができる。この場合は各ドライブに対応した光ディスク177を使用する。光ディスク177から光ディスクドライブ176によりプログラム又はデータを読み取り、I/Oコントローラ170を介してメインメモリ150又はハードディスク174に提供することもできる。また、同様にテープドライブ172に対応したテープメディア171を主としてバックアップのために使用することもできる。
【0070】
装置10に提供されるプログラムは、ハードディスク174、光ディスク177、又はメモリーカード等の記録媒体に格納されて提供される。このプログラムは、I/Oコントローラ170を介して、記録媒体から読み出され、又は通信I/F140を介してダウンロードされることによって、装置10にインストールされ実行されてもよい。
【0071】
上述のプログラムは、内部又は外部の記憶媒体に格納されてもよい。ここで、動画DB62及び代表画像抽出DB64を含む記憶部60を構成する記憶媒体としては、ハードディスク174、光ディスク177、又はメモリーカードの他に、MD等の光磁気記録媒体、テープメディア171を用いることができる。また、専用通信回線やインターネット等の通信回線に接続されたサーバシステムに設けたハードディスク174又は光ディスクライブラリ等の記憶装置を記録媒体として使用し、通信回線を介してプログラムを装置10に提供してもよい。
【0072】
ここで、表示装置122は、装置10の管理者にデータの入力を受け付ける画面を表示したり、装置10による演算処理結果の画面を表示したりするものであり、ブラウン管表示装置(CRT)、液晶表示装置(LCD)等のディスプレイ装置を含む。
【0073】
ここで、入力手段は、装置10の管理者による入力の受け付けを行うものであり、キーボード及びマウス180等により構成してよい。
【0074】
また、通信I/F140は、装置10を専用ネットワーク又は公共ネットワークを介して端末と接続できるようにするためのネットワーク・アダプタである。通信I/F140は、モデム、ケーブル・モデム及びイーサネット(登録商標)・アダプタを含んでよい。
【0075】
以上の例は、装置10について主に説明したが、コンピュータに、プログラムをインストールして、そのコンピュータを装置10として動作させることにより上記で説明した機能を実現することもできる。従って、本発明において一実施形態として説明した装置10により実現される機能は、上述の方法を当該コンピュータにより実行することにより、あるいは、上述のプログラムを当該コンピュータに導入して実行することによっても実現可能である。
【0076】
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限るものではない。また、本発明の実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本発明の実施例に記載されたものに限定されるものではない。
【図面の簡単な説明】
【0077】
【図1】本発明の好適な実施形態の一例に係る動画代表画像抽出装置の機能構成を示すブロック図である。
【図2】本発明の好適な実施形態の一例に係る動画DBに格納されている動画テーブルを示す図である。
【図3】本発明の好適な実施形態の一例に係る代表画像抽出DBに格納されている代表画像抽出テーブルを示す図である。
【図4】本発明の好適な実施形態の一例に係る画像データに基づき部分画像の抽出をした例を示す図である。
【図5】本発明の好適な実施形態の一例に係る代表画像抽出処理の処理フローを示す図である。
【図6】本発明の好適な実施形態の一例に係る装置のハードウェア構成を示す図である。
【符号の説明】
【0078】
10 代表画像抽出装置
50 制御部
51 シーン内特徴画像抽出部
52 画像データ分析部
53 動き抽出部
54 OS*iIF計算部
55 代表画像抽出部
60 記憶部
62 動画DB
64 代表画像抽出DB
70 動画テーブル
80 代表画像抽出テーブル

【特許請求の範囲】
【請求項1】
複数の画像データにより構成される動画データから前記動画データの特徴的場面を表す代表画像データを抽出する動画代表画像抽出方法であって、
前記画像データの一部分を占めるオブジェクトを抽出するステップと、
前記オブジェクトを含む画像データの表示面積を算出し、前記オブジェクトを含む画像データに対して前記オブジェクトの占める面積比を算出するステップと、
前記オブジェクトの動きを抽出し、前記オブジェクトの動きを含む画像データ数を算出するステップと、
前記オブジェクトの動きを含む画像データ数と、前記動画データの全体の画像データ数と、から前記オブジェクトの出現比を算出し、前記オブジェクトの占める面積比と、前記オブジェクトの出現比と、から前記代表画像データの決定に関する参照値を算出するステップと、
前記参照値に基づいて前記代表画像データを抽出するステップと、を含み、
前記代表画像データを抽出するステップは、前記オブジェクトの出現比が低く、かつ、前記オブジェクトの占める面積比が高いものを抽出する、動画代表画像抽出方法。
【請求項2】
前記参照値を算出するステップは、
OS:前記オブジェクトの面積比
N:前記動画データの画像データ数
IF:前記オブジェクトの動きを含む画像データ数として、
【数1】

により、算出する、請求項1記載の動画代表画像抽出方法。
【請求項3】
前記オブジェクトは、前記オブジェクトを含む画像データのエッジ処理により抽出され、
前記オブジェクトの占める面積比を算出するステップは、前記オブジェクトを含む画像データのエッジ処理により抽出された範囲を積分により前記オブジェクトの面積を算出し、前記画像データの全体の面積を法数として除算する、請求項1又は2記載の動画代表画像抽出方法。
【請求項4】
前記オブジェクトの動きを含む画像データ数を算出するステップは、現在の画像データと前記現在の画像データより前に表示される画像データとから前記現在の画像データの動きを検出し、前記前に表示される画像データから前記現在の画像データの動きの量だけ移動して、動きを補償することにより算出する、請求項1乃至3記載の動画代表画像抽出方法。
【請求項5】
複数の画像データにより構成される動画データから前記動画データの特徴的場面を表す代表画像データを抽出する動画代表画像抽出装置であって、
前記画像データの一部分を占めるオブジェクトを抽出するオブジェクト抽出部と、
前記オブジェクトを含む画像データの表示面積を算出し、前記オブジェクトを含む画像データに対して前記オブジェクトの占める面積比を算出する画像データ分析部と、
前記オブジェクトの動きを抽出し、前記オブジェクトの動きを含む画像データ数を算出する動き抽出部と、
前記オブジェクトの動きを含む画像データ数と、前記動画データの全体の画像データ数と、から前記オブジェクトの出現比を算出し、前記オブジェクトの占める面積比と、前記オブジェクトの出現比と、から前記代表画像データの決定に関する参照値を算出するOS*iIF計算部と、
前記参照値に基づいて前記代表画像データを抽出する代表画像抽出部と、を備え、
前記代表画像抽出部は、前記オブジェクトの出現比が低く、かつ、前記オブジェクトの占める面積比が高いものを抽出する動画代表画像抽出装置。
【請求項6】
前記OS*iIF計算部は、
OS:前記オブジェクトの面積比
N:前記動画データの画像データ数
IF:前記オブジェクトの動きを含む画像データ数として、
【数2】

により、算出する、請求項5記載の動画代表画像抽出装置。
【請求項7】
前記オブジェクトは、前記オブジェクトを含む画像データのエッジ処理により抽出され、
前記画像データ分析部は、前記オブジェクトを含む画像データのエッジ処理により抽出された範囲を積分により前記オブジェクトの面積を算出し、前記画像データの全体の面積を法数として除算する、請求項5又は6記載の動画代表画像抽出装置。
【請求項8】
前記動き抽出部は、現在の画像データと前記現在の画像データより前に表示される画像データとから前記現在の画像データの動きを検出し、前記前に表示される画像データから前記現在の画像データの動きの量だけ移動して、動きを補償することにより算出する、請求項5乃至7記載の動画代表画像抽出装置。
【請求項9】
複数の画像データにより構成される動画データから前記動画データの特徴的場面を表す代表画像データを抽出させるコンピュータ・プログラムであって、
前記画像データの一部分を占めるオブジェクトを抽出するステップと、
前記オブジェクトを含む画像データの表示面積を算出し、前記オブジェクトを含む画像データに対して前記オブジェクトの占める面積比を算出するステップと、
前記オブジェクトの動きを抽出し、前記オブジェクトの動きを含む画像データ数を算出するステップと、
前記オブジェクトの動きを含む画像データ数と、前記動画データの全体の画像データ数と、から前記オブジェクトの出現比を算出し、前記オブジェクトの占める面積比と、前記オブジェクトの出現比と、から前記代表画像データの決定に関する参照値を算出するステップと、
前記参照値に基づいて前記代表画像データを抽出するステップと、をコンピュータに実行させ、
前記代表画像データを抽出するステップにより、前記オブジェクトの出現比が低く、かつ、前記オブジェクトの占める面積比が高いものを抽出させるコンピュータ・プログラム。
【請求項10】
前記参照値を算出するステップは、
OS:前記オブジェクトの面積比
N:前記動画データの画像データ数
IF:前記オブジェクトの動きを含む画像データ数として、
【数3】

により、算出する、請求項9記載のコンピュータ・プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2008−146460(P2008−146460A)
【公開日】平成20年6月26日(2008.6.26)
【国際特許分類】
【出願番号】特願2006−334556(P2006−334556)
【出願日】平成18年12月12日(2006.12.12)
【出願人】(500257300)ヤフー株式会社 (1,128)
【Fターム(参考)】