説明

映像処理装置、映像処理方法、および映像処理プログラム

【課題】ユーザが映像全体の内容を把握し易いダイジェストを作成する。
【解決手段】シーン内ダイジェスト区間数決定部16は、ダイジェスト区間として抽出する総カット数Acをダイジェスト作成対象シーンにおける各シーンに割り振り、特徴量検出部17は、抽出するダイジェスト区間の数が1以上とされたシーンであるカット抽出シーンに含まれるフレームの中から複数の代表フレームを選択し、各代表フレーム内に存在する被写体の顔の数、代表フレーム内における最大の顔の位置、および最大の顔の大きさのうちの少なくとも1つを各代表フレームの特徴量として検出し、重要度算出部20は、各代表フレームの特徴量に基づいて、各代表フレームの重要度を算出し、ダイジェスト区間選択部21は、各カット抽出シーンにおける代表フレームの特徴量および重要度に基づいて各カット抽出シーンから選択するダイジェスト区間を決定する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、映像データのダイジェストを作成する映像処理装置、映像処理方法、および映像処理プログラムに関する。
【背景技術】
【0002】
ユーザが機器に保存した多くの映像データから視聴したいものを見つけるために、例えば、映像の早送り再生により目的の映像を探すことができるが、これには多大な時間と労力とを要する。そこで、映像データのダイジェストを作成し、これを用いて所望の映像データを検索し易くする技術が提案されている。
【0003】
例えば、特許文献1では、ニュースやドラマ、歌番組といった番組のジャンルに合わせて、特徴的な区間、すなわち、その番組にとって重要な区間を適切に抽出してダイジェスト映像を作成して再生することができる映像情報記録再生装置が提案されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特許第4039873号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかし、特許文献1に記載の技術では、重要な区間と判断された部分が、映像全体の例えば序盤に集中した場合、その部分のみがダイジェストとして再生され、それ以降の部分は全く再生されないダイジェストが作成される。このようなダイジェストでは、ユーザが映像全体の内容を把握することは困難である。
【0006】
また、特許文献1では、シーンごとにそのシーンの特徴量を検出し、その特徴量によりシーンを評価し、シーン全体、あるいはシーンの中で予め定められた一部の区間をダイジェストとして選択している。
【0007】
しかし、この方法では、例えば全体が10分のうち見所となる重要な区間が1分だけであるシーンについて、このシーン全体をダイジェストとして選択した場合、9分間は特に見所のないシーンになってしまう。また、このシーンの一部をダイジェストとして選択する場合でも、見所のない9分間の中からダイジェストを選択してしまうおそれがある。
【0008】
本発明は上記に鑑みてなされたもので、ユーザが映像全体の内容を把握し易いダイジェストを作成することができる映像処理装置、映像処理方法、および映像処理プログラムを提供することを目的とする。
【課題を解決するための手段】
【0009】
本発明の一態様によれば、映像データにおける各シーンから抽出するダイジェスト区間の数を決定するシーン内ダイジェスト区間数決定部(16)と、前記シーン内ダイジェスト区間数決定部により前記ダイジェスト区間の数が1以上とされたシーンであるカット抽出シーンに含まれるフレームの中から複数の代表フレームを選択し、前記各代表フレーム内に存在する被写体の顔の数、前記各代表フレーム内における最大の顔の位置、および最大の顔の大きさのうちの少なくとも1つを前記各代表フレームの特徴量として検出する特徴量検出部(17)と、前記特徴量に基づいて、前記各代表フレームの重要度を算出する重要度算出部(20)と、前記特徴量および前記重要度に基づいて、前記カット抽出シーンから、前記シーン内ダイジェスト区間数決定部で決定された数のカットを前記ダイジェスト区間として選択するダイジェスト区間選択部(21)と、前記ダイジェスト区間選択部で選択された前記ダイジェスト区間を再生する再生部(23)とを備えることを特徴とする映像処理装置(10)が提供される。
【0010】
本発明の他の態様によれば、映像データにおける各シーンから抽出するダイジェスト区間の数を決定するステップと、前記ダイジェスト区間の数が1以上とされたシーンであるカット抽出シーンに含まれるフレームの中から複数の代表フレームを選択し、前記各代表フレーム内に存在する被写体の顔の数、前記各代表フレーム内における最大の顔の位置、および最大の顔の大きさのうちの少なくとも1つを前記各代表フレームの特徴量として検出するステップと、前記特徴量に基づいて、前記各代表フレームの重要度を算出するステップと、前記特徴量および前記重要度に基づいて、前記カット抽出シーンから、前記ダイジェスト区間の数を決定するステップで決定された数のカットを前記ダイジェスト区間として選択するステップと、前記ダイジェスト区間選択部で選択された前記ダイジェスト区間を再生するステップとを含むことを特徴とする映像処理方法が提供される。
【0011】
本発明の他の態様によれば、映像データにおける各シーンから抽出するダイジェスト区間の数を決定するステップと、前記ダイジェスト区間の数が1以上とされたシーンであるカット抽出シーンに含まれるフレームの中から複数の代表フレームを選択し、前記各代表フレーム内に存在する被写体の顔の数、前記各代表フレーム内における最大の顔の位置、および最大の顔の大きさのうちの少なくとも1つを前記各代表フレームの特徴量として検出するステップと、前記特徴量に基づいて、前記各代表フレームの重要度を算出するステップと、前記特徴量および前記重要度に基づいて、前記カット抽出シーンから、前記ダイジェスト区間の数を決定するステップで決定された数のカットを前記ダイジェスト区間として選択するステップと、前記ダイジェスト区間選択部で選択された前記ダイジェスト区間を再生するステップとをコンピュータに実行させるための映像処理プログラムが提供される。
【発明の効果】
【0012】
本発明によれば、ユーザが映像全体の内容を把握し易いダイジェストを作成することができる。
【図面の簡単な説明】
【0013】
【図1】本発明の実施の形態に係る映像処理装置の構成を示すブロック図である。
【図2】各シーンへ割り振るカット数を決定する手順を示すフローチャートである。
【図3】グループ分けの一例を示す図である。
【図4】カット抽出シーンのフレーム構成の一例を示す模式図である。
【図5】代表フレームの特徴量を説明する図である。
【図6】カット抽出シーンにおける各代表フレームの特徴量の一例を示す図である。
【図7】カット抽出シーンにおける各代表フレームの重要度の一例を示す図である。
【図8】カット抽出シーンにおける各代表フレームの重要度の他の例を示す図である。
【図9】ダイジェスト区間を決定する手順を示すフローチャートである。
【図10】ダイジェスト区間を示す模式図である。
【発明を実施するための形態】
【0014】
以下、本発明の実施の形態について、図面を参照して説明する。
【0015】
図1は、本発明の実施の形態に係る映像処理装置の構成を示すブロック図である。図1に示すように本実施の形態に係る映像処理装置10は、映像データ記憶部11と、ダイジェスト作成対象シーン指定部12と、総カット数決定部13と、グループ分け部14と、グループ内ダイジェスト区間数決定部15と、シーン内ダイジェスト区間数決定部16と、特徴量検出部17と、シーン分割部18と、シーン特徴判定部19と、重要度算出部20と、ダイジェスト区間選択部21と、ダイジェストデータ記憶部22と、再生部23とを備える。
【0016】
映像データ記憶部11は、ハードディスク、半導体記憶媒体等の不揮発性の記憶媒体を有し、ビデオカメラ等で記録された映像データを記憶している。映像データ記憶部11は、映像処理装置10から着脱可能な構成にしてもよい。
【0017】
映像データ記憶部11に記憶される映像データには、ビデオカメラ等の撮影機器で撮影された映像データにおける各シーンの撮影開始時刻、撮影終了時刻、撮影場所等を含む撮影情報が付されている。撮影情報は、撮影時に撮影機器で取得することができる。ここで、シーンとは、一連の撮影動作における撮影開始から撮影終了までの区切りのことを指すものとする。
【0018】
ダイジェスト作成対象シーン指定部12は、映像データ記憶部11に記憶されているシーンの中からダイジェスト作成対象となるシーンを指定する。ユーザによる操作入力部(図示せず)の操作に応じてダイジェスト作成対象シーンを1つずつ指定するようにしてもよいし、ユーザ操作により選択された2つのシーン間に撮影されたすべてのシーンをダイジェスト作成対象シーンとしてもよい。また、ユーザ操作に応じて日付を指定し、指定された日に撮影された全シーンをダイジェスト作成対象シーンとしてもよい。
【0019】
総カット数決定部13は、ダイジェスト作成対象シーン指定部12で指定されたダイジェスト作成対象シーンの全体から、ダイジェストとして再生される区間であるカット(ダイジェスト区間)の数である総カット数Acを決定する。
【0020】
総カット数Acは、ユーザ操作により指定できるようにしてもよいし、ユーザがダイジェストの長さを指定し、その値から総カット数Acを決定するようにしてもよい。
【0021】
このようにダイジェストの長さから総カット数Acを決定する場合、総カット数決定部13は、カットの平均時間の目安となる時間を予め設定しておき、その値を基に総カット数Acを算出する。
【0022】
例えば、カットの平均時間の目安を10秒と設定しているとき、ユーザがダイジェストの長さを180秒と指定したならば、Ac=180÷10=18より、総カット数Acは18カットとなる。
【0023】
なお、ダイジェストの長さから総カット数Acを算出する場合、ダイジェストの長さはユーザが操作入力するのではなく、ダイジェスト作成対象シーンの合計撮影時間等の情報から、自動的に算出するようにしてもよい。
【0024】
グループ分け部14は、シーン間の撮影間隔や撮影内容等に基づき、ダイジェスト作成対象シーンにおけるシーンのグループ分けを行う。例えば、特開2009−99120号公報に記載された方法によりグループ分けを行う。これにより、近い時刻や場所で撮影したシーン同士をまとめるグループ化や、同じような内容を撮影したシーン同士をまとめるグループ化が行われる。
【0025】
グループ内ダイジェスト区間数決定部15は、総カット数決定部13で決定した総カット数Acを各グループに割り振り、各グループから抽出するカット数を決定する。例えば、グループ内ダイジェスト区間数決定部15は、グループに属するシーン数や、グループに属するシーンの合計撮影時間に応じてカットを割り振る。
【0026】
シーン内ダイジェスト区間数決定部16は、グループ内ダイジェスト区間数決定部15で決定した各グループのカット数をグループ内の各シーンに割り振り、各シーンから選択するカット数を決定する。
【0027】
特徴量検出部17は、シーン内ダイジェスト区間数決定部16で1つ以上のカットを割り当てられたカット抽出シーンに含まれるフレームの中から複数の代表フレームを選択し、各代表フレームの特徴を示す特徴量を検出する。例えば、特徴量検出部17は、各代表フレーム内に存在する被写体の顔の数、代表フレーム内における最大の顔の位置、および最大の顔の大きさを、代表フレームの特徴量として検出する。
【0028】
シーン分割部18は、カットが2つ以上割り当てられたカット抽出シーンを、割り当てられたカット数と同数の分割シーンに分割する。例えば、シーン分割部18は、カットが2つ割り振られた1分のシーンを前半30秒、後半30秒の2つの分割シーンに等分するように、カット抽出シーンを割り当てられたカット数で等分する。
【0029】
シーン特徴判定部19は、各カット抽出シーンについて、代表フレームの特徴量等からシーンの特徴を判別する。シーン分割部18で分割されたカット抽出シーンについては、分割シーンごとにシーンの特徴を判別する。
【0030】
例えば、シーン特徴判定部19は、特徴量検出部17で検出した被写体の顔の数に基づいて、被写体が1人であるか複数人であるかをシーンの特徴として判定する。
【0031】
重要度算出部20は、各代表フレームの特徴量に基づいて各代表フレームの重要度を算出する。重要度算出部20は、シーンの特徴ごとに重要度算出法を記憶しており、シーン特徴判定部19で決定したカット抽出シーン(分割された場合は分割シーンごと)の特徴に応じた重要度算出法により、各代表フレームの特徴量から各代表フレームの重要度を算出する。
【0032】
ダイジェスト区間選択部21は、特徴量検出部17で検出した代表フレームの特徴量と、重要度算出部20で算出した代表フレームの重要度とに基づいて、各カット抽出シーンについてカット(ダイジェスト区間)として選択する区間を決定する。
【0033】
ダイジェストデータ記憶部22は、ハードディスク等の不揮発性の記憶媒体を有し、ダイジェスト区間選択部21で選択されたカットの情報を時系列順にダイジェストデータとして記憶する。ダイジェストデータは、各カットについてカットを抽出するシーンを識別するためのシーンIDと、カットの開始時刻および終了時刻の情報とを含む。シーンIDは、記録順に各シーンに割り振られた値としてもよいし、シーンを記録した映像ファイル名としてもよい。なお、映像データ記憶部11がダイジェストデータ記憶部22を兼ねていてもよい。
【0034】
再生部23は、ダイジェストデータ記憶部22に記憶されたダイジェストデータに基づき、映像データ記憶部11に記憶された映像データから、ダイジェスト区間選択部21で選択されたカット(ダイジェスト区間)を時系列順に再生することによりダイジェスト再生を行い、映像処理装置10に接続された表示装置(図示せず)にダイジェストの映像を表示させる。
【0035】
次に、映像処理装置10の動作について説明する。
【0036】
ユーザによりダイジェスト作成対象シーンを指定する操作が行われると、ダイジェスト作成対象シーン指定部12は、ユーザ操作に応じて、映像データ記憶部11に記憶されているシーンの中からダイジェスト作成対象シーンを指定する。また、総カット数決定部13は、ダイジェスト作成対象シーンの全体からダイジェスト区間として選択される総カット数Acを決定する。
【0037】
ダイジェスト作成対象シーンが指定され、総カット数Acが決定すると、映像処理装置10は、ダイジェスト作成対象シーンにおける各シーンへ割り振るカット数を決定する。この手順について、図2に示すフローチャートを参照して説明する。
【0038】
まず、ステップS10において、グループ分け部14は、ダイジェスト作成対象シーンにおける各シーンのグループ分けを行う。本実施の形態では、図3に示すように、ダイジェスト作成対象シーンがグループ1からグループgのg個のグループに分類されたものとして説明を行う。
【0039】
次いで、ステップS20において、グループ内ダイジェスト区間数決定部15は、総カット数Acを各グループに割り振り、各グループから抽出するカット数を決定する。シーン間の撮影間隔や撮影内容等に基づいて分類された各グループにカットを割り振ることにより、ダイジェストとして抽出される映像が偏ることなく、様々な場面の映像を満遍なくダイジェストに盛り込むことができる。
【0040】
本実施の形態では、グループ内ダイジェスト区間数決定部15は、以下の式(1)により、グループn(n=1,2,…)から抽出するカット数Gc(n)を算出する。
【数1】

【0041】
ここで、L(n)はグループnの合計撮影時間、N(n)はグループnに含まれるシーン数である。
【0042】
この式(1)により各グループにカットを割り当てることで、シーン数が多く、撮影時間の長いグループから多くのカットを選択することが可能となる。
【0043】
次いで、ステップS30において、シーン内ダイジェスト区間数決定部16は、グループの順番を示す変数nを1に設定する。
【0044】
次いで、ステップS40において、シーン内ダイジェスト区間数決定部16は、グループnの先頭シーンのカット数を1とする。
【0045】
次いで、ステップS50において、シーン内ダイジェスト区間数決定部16は、グループnに割り振られたカット数Gc(n)=1か否かを判断する。Gc(n)=1である場合(ステップS50:YES)、ステップS110に進み、Gc(n)=1でない場合(ステップS50:NO)、ステップS60に進む。
【0046】
ステップS60では、シーン内ダイジェスト区間数決定部16は、グループnに属するシーンのうち、まだカットが割り振られていないシーン(カット数が0のシーン)の中で、直前のシーンとの撮影間隔が最も長いシーンのカット数を1とする。
【0047】
次いで、ステップS70において、シーン内ダイジェスト区間数決定部16は、グループn内のシーンに割り振ったカット数の合計がGc(n)に達したか否かを判断する。Gc(n)に達した場合(ステップS70:YES)、ステップS110に進み、Gc(n)に達していない場合(ステップS70:NO)、ステップS80に進む。
【0048】
ステップS80では、シーン内ダイジェスト区間数決定部16は、グループn内の全シーンのカット数が1になったか否かを判断する。全シーンのカット数が1になった場合(ステップS80:YES)、ステップS90に進み、カット数が0のシーンがある場合(ステップS80:NO)、ステップS60に戻る。
【0049】
ステップS90では、シーン内ダイジェスト区間数決定部16は、グループnに属するシーンのうち、(撮影時間)÷(カット数)の値が最大であるシーンのカット数を1つ増やす。
【0050】
次いで、ステップS100において、シーン内ダイジェスト区間数決定部16は、グループn内のシーンに割り振ったカット数の合計がGc(n)に達したか否かを判断する。Gc(n)に達した場合(ステップS100:YES)、ステップS110に進み、Gc(n)に達していない場合(ステップS100:NO)、ステップS90に戻る。
【0051】
ステップS110では、シーン内ダイジェスト区間数決定部16は、変数nが最後のグループであることを示す値gであるか否かを判断する。n=gである場合(ステップS110:YES)、処理を終了し、n=gでない場合(ステップS110:NO)、ステップS120において、シーン内ダイジェスト区間数決定部16は、変数nを1つインクリメントし、その後、ステップS40に戻る。
【0052】
以上の処理により、グループ1からグループgまでのすべてのグループについて、グループ内の各シーンへのカットの割り振りが行われる。
【0053】
なお、各シーンへのカットの割り振りを行う方法は上記の処理に限らず、例えば、各シーンのカット数をユーザが指定するようにしてもよい。
【0054】
また、グループ内の撮影時間が長いシーンから順にカットを1つずつ割り振るようにしてもよい。この場合において、シーン数よりも総カット数Acの方が多いときは、撮影時間が長いシーンから順にカットをもう1つずつ割り振ることで、長いシーンからは複数のカットを選択できるようになる。
【0055】
また、シーン間の撮影間隔に基づいてカットを割り振るようにしてもよい。例えば、各シーン間の撮影間隔を算出し、グループ内において直前のシーンとの撮影間隔が長いシーンの順にカットを割り振るようにする。
【0056】
また、上記のような方法と撮影内容等によるシーンのグループ分けとを組み合わせてカットの割り振りを行ってもよい。
【0057】
シーン内ダイジェスト区間数決定部16により1つ以上のカット(ダイジェスト区間)が割り当てられたシーンをカット抽出シーンと呼ぶ。特徴量検出部17は、カット抽出シーンに含まれるフレームの中から所定時間ごとのフレームを代表フレームとして選択し、各代表フレームの特徴を示す特徴量を検出する。
【0058】
例えば、図4に示すような、フレームf(0)〜f(16)の17フレームから構成されるカット抽出シーンがあるとする。図4において、横軸は各フレームの記録時刻を示す。
【0059】
例えば1秒ごとのフレームを代表フレームとして選択する場合、特徴量検出部17は、先頭フレームf(0)と、撮影開始から1秒後に記録されたフレームf(5)と、その1秒後に記録されたフレームf(10)と、さらにその1秒後に記録されたフレームf(15)の4フレームを、それぞれ代表フレームF(0),F(1),F(2),F(3)とし、それぞれから特徴量を検出する。
【0060】
本実施の形態では、特徴量検出部17は、代表フレームF(i)(i=0,1,2,…)内に存在する被写体の顔の数Num(F(i))、代表フレームF(i)内における最大の顔の位置として、その最大の顔の中心からフレームの四隅のうち最も近いものまでの距離Dis(F(i))、および最大の顔の大きさSiz(F(i))を、代表フレームF(i)の特徴量として検出する。
【0061】
顔の画像の検出については、種々の手法が知られており、例えば、特許第4158153号公報に記載された技術を用いて顔の画像を検出することができるため、ここではその処理内容については説明を省略する。
【0062】
被写体の顔が存在するフレームの一例を図5に示す。図5に示すフレームにおいて最も大きく映っている顔は顔Aである。また、フレームの四隅のうち顔Aの中心と最も近いものは左上の隅であるため、顔Aの中心からフレームの左上隅までの距離をDis(F(i))とする。Siz(F(i))は、最も大きく映っている顔Aの縦の長さを取ることとする。また、図5に示すフレームには顔が3つ映っているため、Num(F(i))=3となる。
【0063】
これらの特徴量は、撮影時に撮影機器で取得し、ファイル等に記憶していたものを読み込んでもよいし、特徴量検出部17により映像データを解析して取得してもよい。
【0064】
シーン内ダイジェスト区間数決定部16によりカットが2つ以上割り当てられたカット抽出シーンがある場合、シーン分割部18は、そのカット抽出シーンを、割り当てられたカット数と同数の分割シーンに分割する。
【0065】
次いで、シーン特徴判定部19は、各カット抽出シーンについて、シーンの特徴を判定する。シーン分割部18で分割されたカット抽出シーンについては、分割シーンごとにシーンの特徴を判別する。本実施の形態では、シーン特徴判定部19は、特徴量検出部17で検出した代表フレームF(i)における被写体の顔の数Num(F(i))に基づいて、被写体が1人であるか複数人であるかをシーンの特徴として判定する。
【0066】
シーン特徴判定部19は、各カット抽出シーン(分割された場合は各分割シーン)について、当該シーン内の各代表フレームにおける被写体の顔の数が1つであるか2つ以上であるかを判別し、顔の数が1つである代表フレームの数と、顔の数が2つ以上である代表フレームの数とをカウントする。
【0067】
そして、顔の数が1つである代表フレームの数が、顔の数が2つ以上である代表フレームの数よりも多い場合、そのシーンの被写体は1人であるとする。一方、顔の数が2つ以上の代表フレームの数が、顔の数が1つである代表フレームの数よりも多い場合、そのシーンの被写体は複数人であるとする。また、全代表フレームで顔が1つも検出されなかった場合、そのシーンの被写体は1人とする。
【0068】
図6は、1分間のカット抽出シーンにおける各代表フレームのシーン開始からの経過時間および特徴量(Num(F(i)),Dis(F(i)),Siz(F(i)))を示したものである。図6のシーンを例に、カット抽出シーンに割り振られたカット数が1の場合と2の場合のそれぞれについて、シーン特徴判定部19におけるシーンの特徴の判定について説明する。
【0069】
(1)カット抽出シーンに割り振られたカット数が1の場合
カット抽出シーンの全代表フレームから、このシーンの特徴を判別する。
【0070】
図6において、全代表フレーム中、顔の数が1の代表フレームは28フレーム、顔の数が2以上の代表フレームは15フレームとなっている。よって、顔の数が1の代表フレームの方が顔の数が2以上の代表フレームよりも多いため、このシーンの特徴は「被写体が1人」となる。
【0071】
(2)カット抽出シーンに割り振られたカット数が2の場合
カット抽出シーンを00:00:00〜00:00:29と00:00:30〜00:00:59の2つの分割シーンに分割し、各分割シーンについて特徴を判別する。
【0072】
まず、00:00:00〜00:00:29の分割シーン(第1の分割シーン)において、顔の数が1の代表フレームは15フレームあるが、顔の数が2以上の代表フレームはない。よって、第1の分割シーンの特徴は「被写体が1人」となる。
【0073】
一方、00:00:30〜00:00:59の分割シーン(第2の分割シーン)においては、顔の数が1の代表フレームは13フレーム、顔の数が2以上の代表フレームは15フレームとなっている。よって、顔の数が2以上の代表フレームの方が顔の数が1の代表フレームよりも多いため、第2の分割シーンの特徴は「被写体が複数人」となる。
【0074】
シーン特徴判定部19で各カット抽出シーンの特徴が決定されると、重要度算出部20は、そのシーンの特徴に応じて、各代表フレームの特徴量から各代表フレームの重要度を算出する。
【0075】
重要度算出部20は、重要度を算出するにあたり、まず、カット抽出シーンにおけるNum(F(i)),Dis(F(i)),Siz(F(i))それぞれの最大値MaxNum,MaxDis,MaxSizを求める。シーン分割部18で分割されたカット抽出シーンについては、分割シーンごとにこれらの値を求める。
【0076】
上記の値を用いて、重要度算出部20は、特徴が「被写体が1人」であるシーンに含まれる代表フレームF(i)の重要度I(F(i))を以下の式(2)により算出する。
【数2】

【0077】
また、重要度算出部20は、特徴が「被写体が複数人」であるシーンに含まれる代表フレームF(i)の重要度I(F(i))は、以下の式(3)により算出する。
【数3】

【0078】
ここで、図6のシーンを例に、カット抽出シーンに割り振られたカット数が1の場合と2の場合のそれぞれについて、重要度I(F(i))の算出について説明する。
【0079】
(1)カット抽出シーンに割り振られたカット数が1の場合
この場合、シーン全体からNum(F(i)),Dis(F(i)),Siz(F(i))の最大値を求めるため、MaxNum=3、MaxDis=1000、MaxSiz=500となる。
【0080】
そして、これらの値を「被写体が1人」の場合の重要度算出式である式(2)に代入した以下の式(4)により各代表フレームの重要度I(F(i))を算出する。
【数4】

【0081】
以上のようにして算出された重要度I(F(i))を図7の表に示す。
【0082】
(2)カット抽出シーンに割り振られたカット数が2の場合
この場合、分割シーンごとに特徴量の最大値を求め、各代表フレームF(i)の重要度I(F(i))を算出する。
【0083】
まず、第1の分割シーン(00:00:00〜00:00:29)について、各代表フレームF(i)の重要度I(F(i))を算出する。
【0084】
図6より、第1の分割シーンの特徴量の最大値は、MaxNum=1、MaxDis=500、MaxSiz=300である。
【0085】
また、前述のように、シーン特徴判定部19において、第1の分割シーンの特徴は「被写体が1人」と判定されているため、上記最大値を式(2)に代入した以下の式(5)により重要度I(F(i))を算出する。
【数5】

【0086】
次いで、第2の分割シーン(00:00:30〜00:00:59)について、各代表フレームF(i)の重要度I(F(i))を算出する。
【0087】
図6より、第2の分割シーンの特徴量の最大値は、MaxNum=3、MaxDis=1000、MaxSiz=500である。
【0088】
また、前述のように、シーン特徴判定部19において、第2の分割シーンの特徴は「被写体が複数人」と判定されているため、上記最大値を「被写体が複数人」の場合の重要度算出式である式(3)に代入した以下の式(6)により重要度I(F(i))を算出する。
【数6】

【0089】
以上のようにして算出された重要度I(F(i))を図8の表に示す。
【0090】
上記のような重要度算出法により、被写体が1人のシーンについては、その被写体が大きくクローズアップされている部分の重要度が大きくなり、被写体が複数人のシーンについては、多くの人物が存在する部分の重要度が大きくなる。これにより、被写体が1人のシーンについては、その被写体が大きくクローズアップされている部分をダイジェストに含めることができ、被写体が複数人のシーンについては、できるだけ多くの人物が存在する部分をダイジェストに含めることが可能となる。
【0091】
このように重要度算出部20で算出した各代表フレームの重要度と、特徴量検出部17で検出した各代表フレームの特徴量とを用いて、ダイジェスト区間選択部21は、各カット抽出シーンについてダイジェスト区間として選択するカットの区間を決定する。この手順について、図9に示すフローチャートを参照して説明する。
【0092】
まず、ステップS210において、ダイジェスト区間選択部21は、カット区間を決定するための基準となるカット中心フレームを決定する。ここで、ダイジェスト区間選択部21は、カット抽出シーン内の代表フレームから重要度が最も高いものをカット中心フレームとして選択する。
【0093】
次いで、ステップS220において、ダイジェスト区間選択部21は、変数jを1に設定する。
【0094】
次いで、ステップS230において、ダイジェスト区間選択部21は、カット中心フレームとして選択した代表フレームF(i)の時系列的にj枚だけ前の代表フレームF(i−j)における特徴量の1つである顔の数Num(F(i−j))が0であるか否かを判断する。Num(F(i−j))が0である場合(ステップS230:YES)、ステップS240に進み、Num(F(i−j))が0でない場合(ステップS230:NO)、ステップS250に進む。
【0095】
ステップS240では、ダイジェスト区間選択部21は、代表フレームF(i−j+1)をダイジェスト区間として選択するカットの最初のフレームとなるカット開始フレームとする。その後、ステップS290に進む。
【0096】
ステップS250では、ダイジェスト区間選択部21は、代表フレームF(i−j)がカット抽出シーンの先頭代表フレームであるか否かを判断する。先頭代表フレームである場合(ステップS250:YES)、ステップS270に進み、先頭代表フレームでない場合(ステップS250:NO)、ステップS260に進む。
【0097】
ステップS260では、ダイジェスト区間選択部21は、変数jが第1の所定数j1であるか否かを判断する。j=j1である場合(ステップS260:YES)、ステップS270に進み、j=j1でない場合(ステップS260:NO)、ステップS280において、ダイジェスト区間選択部21は、変数jを1つインクリメントし、その後、ステップS230に戻る。
【0098】
ステップS270では、ダイジェスト区間選択部21は、代表フレームF(i−j)をカット開始フレームとする。
【0099】
ここまでの処理により、ダイジェスト区間選択部21は、カット中心フレームから最大で第1の所定数j1だけ時系列的に前の代表フレームまでさかのぼって順次各代表フレームの顔の数を判断し、最初に検出された顔の数が0の代表フレームに対して時系列的に1枚後の代表フレームをカット開始フレームとして決定する。カット中心フレームから第1の所定数j1だけ前の代表フレームまでのすべての代表フレームの顔の数が1以上である場合は、カット中心フレームから第1の所定数j1だけ前の代表フレームをカット開始フレームとして決定する。また、顔の数が0である代表フレームが検出される前に先頭代表フレームまでさかのぼった場合は、先頭代表フレームをカット開始フレームとする。
【0100】
カット開始フレームを決定すると、ダイジェスト区間として選択するカットの最後のフレームとなるカット終了フレームを決定するために、ステップS290において、ダイジェスト区間選択部21は、変数jを1に設定する。
【0101】
次いで、ステップS300において、ダイジェスト区間選択部21は、カット中心フレームとして選択した代表フレームF(i)の時系列的にj枚だけ後の代表フレームF(i+j)における顔の数Num(F(i+j))が0であるか否かを判断する。Num(F(i+j))が0である場合(ステップS300:YES)、ステップS340に進み、Num(F(i+j))が0でない場合(ステップS300:NO)、ステップS310に進む。
【0102】
ステップS310では、ダイジェスト区間選択部21は、代表フレームF(i+j)がカット抽出シーンの最終代表フレームであるか否かを判断する。最終代表フレームである場合(ステップS310:YES)、ステップS320に進み、最終代表フレームでない場合(ステップS310:NO)、ステップS330に進む。
【0103】
ステップS320では、ダイジェスト区間選択部21は、カット抽出シーンの最終フレームカット終了フレームとする。
【0104】
ステップS330では、ダイジェスト区間選択部21は、変数jが第2の所定数j2であるか否かを判断する。j=j2である場合(ステップS330:YES)、ステップS340に進み、j=j2でない場合(ステップS330:NO)、ステップS350において、ダイジェスト区間選択部21は、変数jを1つインクリメントし、その後、ステップS310に戻る。
【0105】
ステップS340では、ダイジェスト区間選択部21は、代表フレームF(i+j)をカット終了フレームとする。
【0106】
ステップS290以降の処理により、ダイジェスト区間選択部21は、カット中心フレームから最大で第2の所定数j2だけ時系列的に後の代表フレームまで順次各代表フレームの顔の数を判断し、最初に検出された顔の数が0の代表フレームをカット終了フレームとして決定する。カット中心フレームから第2の所定数j2だけ後の代表フレームまでのすべての代表フレームの顔の数が1以上である場合は、カット中心フレームから第2の所定数j2だけ後の代表フレームをカット終了フレームとして決定する。また、最終代表フレームまで顔の数が0である代表フレームが検出されなかった場合は、カット抽出シーンの最終フレームをカット終了フレームとする。
【0107】
以上の処理により、例えば図10に示すように、ダイジェスト作成対象シーンからダイジェスト区間が決定される。ダイジェスト区間は、各カット抽出シーン内で重要度が最も高い代表フレーム(カット中心フレーム)を含む、最大(j1+j2+1)枚の代表フレームを含んだ区間となる。なお、シーン分割部18で分割されたカット抽出シーンについては、分割シーンごとに上述の図9のフローチャートの処理によりダイジェスト区間を決定する。
【0108】
ここで、図6のシーンを例に、カット抽出シーンに割り振られたカット数が1の場合と2の場合のそれぞれについて、ダイジェスト区間決定の具体例を示す。ここでは、j1=5,j2=15とする。
【0109】
(1)カット抽出シーンに割り振られたカット数が1の場合
図7の表より、代表フレームF(47)の重要度が最も高くなっていることが分かる。そこで、代表フレームF(47)をカット中心フレームとする。
【0110】
次いで、カット開始フレームを決定する。図7の表より、カット中心フレームF(47)から、その5(=j1)秒前の代表フレームF(42)までは常に顔の数が1以上であるため、カット中心フレームの5秒前の代表フレームF(42)をカット開始フレームとする。
【0111】
次いで、カット終了フレームを決定する。図7の表より、カット中心フレームF(47)から最後の代表フレームF(59)までの間の全代表フレームにおいて顔の数が1以上であるため、シーンの最終フレームをカット終了フレームとする。
【0112】
以上より、図6のシーンから抽出されるダイジェスト区間は、代表フレームF(42)からシーンの終わりまで、つまり00:00:42〜シーン終了の区間となる。
【0113】
(2)カット抽出シーンに割り振られたカット数が2の場合
まず、第1の分割シーン(00:00:00〜00:00:29)について、ダイジェスト区間を決定する。図8の表より、第1の分割シーンにおいては、代表フレームF(8)の重要度が最も高くなっている。そこで、代表フレームF(8)をカット中心フレームとする。
【0114】
次いで、カット開始フレームを決定する。図8の表より、カット中心フレームF(8)から、その5秒前の代表フレームF(3)までは常に顔の数が1以上であるため、カット中心フレームF(8)の5秒前の代表フレームF(3)をカット開始フレームとする。
【0115】
次いで、カット終了フレームを決定する。図8の表より、カット中心フレームF(8)から、その8秒後の代表フレームF(16)までは顔の数が1以上であるが、9秒後の代表フレームF(17)では顔の数が0となっているため、代表フレームF(17)をカット終了フレームとする。
【0116】
よって、第1の分割シーンから抽出されるダイジェスト区間は、代表フレームF(3)〜F(17)間、つまり00:00:03〜00:00:17の区間となる。
【0117】
同様に、第2の分割シーンについて、ダイジェスト区間を決定する。図8の表より、第2の分割シーンにおいては、代表フレームF(43)の重要度が最も高くなっている。そこで、代表フレームF(43)をカット中心フレームとする。
【0118】
次いで、カット開始フレームを決定する。図8の表より、カット中心フレームF(43)から、その5秒前の代表フレームF(38)までは常に顔の数が1以上であるため、カット中心フレームF(43)の5秒前の代表フレームF(38)をカット開始フレームとする。
【0119】
次いで、カット終了フレームを決定する。図8の表より、カット中心フレームF(43)から、その15(=j2)秒後の代表フレームF(58)までは常に顔の数が1以上であるため、カット中心フレームF(43)の15秒後の代表フレームF(58)をカット終了フレームとする。
【0120】
よって、第2の分割シーンから抽出されるダイジェスト区間は、代表フレームF(38)〜F(58)間、つまり00:00:38〜00:00:58の区間となる。
【0121】
以上より、図6のシーンからは、00:00:03〜00:00:17の区間と、00:00:38〜00:00:58の区間との2区間がダイジェスト区間として抽出される。
【0122】
ダイジェスト区間選択部21は、上記のようにして選択したカットの情報を時系列順にダイジェストデータとしてダイジェストデータ記憶部22に保存する。
【0123】
そして、再生部23は、ダイジェストデータ記憶部22に記憶されたダイジェストデータに基づき、映像データ記憶部11に記憶された映像データからダイジェスト区間を時系列順に再生し、表示装置(図示せず)にダイジェストの映像を表示させる。
【0124】
上記説明のように本実施の形態によれば、ダイジェスト区間として抽出する総カット数Acをダイジェスト作成対象シーンにおける各シーンに割り振り、各カット抽出シーンにおける代表フレームの特徴量および重要度に基づいて各カット抽出シーンから選択するダイジェスト区間を決定するので、ダイジェスト作成対象シーン全体から偏りなく重要な部分をダイジェスト区間として選択し、ユーザがダイジェスト作成対象シーン全体の映像の内容を把握し易いダイジェストを作成することができる。
【0125】
また、カット抽出シーンの特徴を判別し、特徴ごとに定められた重要度算出法を用いて代表フレームの重要度を算出することにより、各カット抽出シーンの特徴に応じて、ダイジェスト区間としてふさわしい部分を抽出することができる。
【0126】
なお、特徴量として、各代表フレーム内に存在する被写体の顔の数、各代表フレーム内における最大の顔の位置、および最大の顔の大きさのうちの少なくとも1つを検出する構成でもよい。また、重要度の算出法も上記の方法に限定されることなく、各代表フレーム内に存在する被写体の顔の数、各代表フレーム内における最大の顔の位置、および最大の顔の大きさのうちの少なくとも1つの特徴量により重要度を算出する構成としてもよい。
【0127】
また、1つのカット抽出シーンからダイジェスト区間を2つ以上抽出する場合は、そのカット抽出シーンを分割し、分割シーンごとに特徴を判別し、各分割シーンの特徴に応じてダイジェスト区間を決定することで、満遍なく各シーンの特徴を反映したダイジェストを作成することができる。
【0128】
なお、グループ分け部14とグループ内ダイジェスト区間数決定部15とを省略し、ダイジェスト作成対象シーンのグループ分けを行わずに、シーン内ダイジェスト区間数決定部16において、総カット数Acをダイジェスト作成対象シーンにおける各シーンに割り振るようにしてもよい。
【0129】
また、特徴量検出部17で検出する代表フレームの特徴量として、色情報や輝度、動きベクトル、音声情報等を用いてもよい。
【0130】
また、シーン特徴判定部19で判別するシーンの特徴として、シーンの撮影時刻が午前か午後か、シーンの撮影時間が所定時間より長いか否か、背景が屋内か屋外か、人の声が記録されているか否か、拍手が行われているか否か、音声のレベルが一定の閾値以上か否か等を用い、重要度算出部20でそれらの特徴に応じた重要度算出法を用いるようにしてもよい。
【0131】
本実施の形態に係る映像処理装置10は、その装置構成の一部または全部をパーソナルコンピュータ等から構成することが可能である。この場合、上記で説明した装置各部は、コンピュータのハードウェアもしくはソフトウェアによりその機能を実現可能である。例えば、コンピュータに上記実施の形態で説明した動作の一部または全部を実行させるためのプログラムを、コンピュータのハードディスク、CD−ROM等の記憶媒体、もしくはダウンロードによりコンピュータのメモリ等に記憶させて使用してもよい。
【符号の説明】
【0132】
10 映像処理装置
11 映像データ記憶部
12 ダイジェスト作成対象シーン指定部
13 総カット数決定部
14 グループ分け部
15 グループ内ダイジェスト区間数決定部
16 シーン内ダイジェスト区間数決定部
17 特徴量検出部
18 シーン分割部
19 シーン特徴判定部
20 重要度算出部
21 ダイジェスト区間選択部
22 ダイジェストデータ記憶部
23 再生部

【特許請求の範囲】
【請求項1】
映像データにおける各シーンから抽出するダイジェスト区間の数を決定するシーン内ダイジェスト区間数決定部と、
前記シーン内ダイジェスト区間数決定部により前記ダイジェスト区間の数が1以上とされたシーンであるカット抽出シーンに含まれるフレームの中から複数の代表フレームを選択し、前記各代表フレーム内に存在する被写体の顔の数、前記各代表フレーム内における最大の顔の位置、および最大の顔の大きさのうちの少なくとも1つを前記各代表フレームの特徴量として検出する特徴量検出部と、
前記特徴量に基づいて、前記各代表フレームの重要度を算出する重要度算出部と、
前記特徴量および前記重要度に基づいて、前記カット抽出シーンから、前記シーン内ダイジェスト区間数決定部で決定された数のカットを前記ダイジェスト区間として選択するダイジェスト区間選択部と、
前記ダイジェスト区間選択部で選択された前記ダイジェスト区間を再生する再生部と
を備えることを特徴とする映像処理装置。
【請求項2】
前記特徴量に基づいて、前記カット抽出シーンにおける被写体が1人であるか複数人であるかを判定するシーン特徴判定部をさらに備え、
前記重要度算出部は、被写体が1人であるカット抽出シーンと、被写体が複数人であるカット抽出シーンとで、異なる重要度算出式を用いて前記重要度を算出することを特徴とする請求項1に記載の映像処理装置。
【請求項3】
映像データにおける各シーンから抽出するダイジェスト区間の数を決定するステップと、
前記ダイジェスト区間の数が1以上とされたシーンであるカット抽出シーンに含まれるフレームの中から複数の代表フレームを選択し、前記各代表フレーム内に存在する被写体の顔の数、前記各代表フレーム内における最大の顔の位置、および最大の顔の大きさのうちの少なくとも1つを前記各代表フレームの特徴量として検出するステップと、
前記特徴量に基づいて、前記各代表フレームの重要度を算出するステップと、
前記特徴量および前記重要度に基づいて、前記カット抽出シーンから、前記ダイジェスト区間の数を決定するステップで決定された数のカットを前記ダイジェスト区間として選択するステップと、
前記ダイジェスト区間選択部で選択された前記ダイジェスト区間を再生するステップと
を含むことを特徴とする映像処理方法。
【請求項4】
前記特徴量に基づいて、前記カット抽出シーンにおける被写体が1人であるか複数人であるかを判定するステップをさらに含み、
前記重要度を算出するステップは、被写体が1人であるカット抽出シーンと、被写体が複数人であるカット抽出シーンとで、異なる重要度算出式を用いて前記重要度を算出するステップであることを特徴とする請求項3に記載の映像処理方法。
【請求項5】
映像データにおける各シーンから抽出するダイジェスト区間の数を決定するステップと、
前記ダイジェスト区間の数が1以上とされたシーンであるカット抽出シーンに含まれるフレームの中から複数の代表フレームを選択し、前記各代表フレーム内に存在する被写体の顔の数、前記各代表フレーム内における最大の顔の位置、および最大の顔の大きさのうちの少なくとも1つを前記各代表フレームの特徴量として検出するステップと、
前記特徴量に基づいて、前記各代表フレームの重要度を算出するステップと、
前記特徴量および前記重要度に基づいて、前記カット抽出シーンから、前記ダイジェスト区間の数を決定するステップで決定された数のカットを前記ダイジェスト区間として選択するステップと、
前記ダイジェスト区間選択部で選択された前記ダイジェスト区間を再生するステップと
をコンピュータに実行させるための映像処理プログラム。
【請求項6】
前記特徴量に基づいて、前記カット抽出シーンにおける被写体が1人であるか複数人であるかを判定するステップをさらにコンピュータに実行させ、
前記重要度を算出するステップは、被写体が1人であるカット抽出シーンと、被写体が複数人であるカット抽出シーンとで、異なる重要度算出式を用いて前記重要度を算出するステップであることを特徴とする請求項5に記載の映像処理プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate


【公開番号】特開2011−124979(P2011−124979A)
【公開日】平成23年6月23日(2011.6.23)
【国際特許分類】
【出願番号】特願2010−221104(P2010−221104)
【出願日】平成22年9月30日(2010.9.30)
【出願人】(308036402)JVC・ケンウッド・ホールディングス株式会社 (1,152)
【Fターム(参考)】