説明

動画像処理装置、動画像処理方法およびプログラム

【課題】動画像の構成を容易に把握できる構成画像を生成可能な、動画像処理装置、動画像処理方法およびプログラムを提供する。
【解決手段】複数のカットを含む動画像MPからカット間の遷移を検出し、複数のカットを相異なる特徴量Sを有する複数のカットグループに区分し、相異なるカットグループに属する2以上の連続するカットからなるカットペアであり、動画像中で繰返される複数のカットペアを特定し、複数のカットペアから2以上の数Nのカットペアを選択し、選択されたカットペア中の全てのカットの代表画像Iを一定率で縮小して並べたカット構成画像CIを、予め定められた範囲の表示領域Adに表示する場合の表示占有率Roを算出し、表示領域に対する表示占有率を最大化するように、選択するカットペアの数Noptを調整し、調整されたカットペアの数を満たすカット構成画像を生成する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、動画像処理装置、動画像処理方法およびプログラムに関する。
【背景技術】
【0002】
映像(または動画像)は、一般に多数のカットから構成されている。映像表現では、制作者の意図に応じて、一連の相異なるカットを繰返す(カットの切返しとも称する。)等、カット構成に工夫を凝らす場合がある。ところで、映像を鑑賞する者または映像を他の映像等の素材として利用する者には、映像の対象がどのように捉えられているか、換言すれば映像の時間的コンテクストに関して映像がどのように表現されているか、という情報が重要となる場合がある。
【発明の概要】
【発明が解決しようとする課題】
【0003】
このため、動画像から一連の相異なるカットとして繰返されるカットペアを特定し、カットペア間の境界を明示しつつ各カットの代表画像をカット遷移の順序に従って並べたカット構成画像を生成することが提案される。
【0004】
しかし、カットの切返し頻度が高くなりカットペアの数が多くなると、カット構成画像が表示される表示領域に対してカット構成画像が大きくなってしまう場合がある。そして、カット構成の一覧性を確保するためにカット構成画像を一度に表示しようとすると、代表画像を高い率で縮小して表示することになり、カット構成画像の視認性が低下してしまう場合がある。また、カット構成画像の視認性を確保するためにカット構成画像を部分的に表示しようとすると、カット構成画像を分割して表示することになり、カット構成の一覧性が低下してしまう場合がある。よって、いずれの場合も、ユーザは、カット構成画像を通じて動画像のカット構成を容易に把握することができなくなる。
【0005】
そこで、本発明は、動画像のカット構成を容易に把握できるカット構成画像を生成可能な、動画像処理装置、動画像処理方法およびプログラムを提供しようとするものである。
【課題を解決するための手段】
【0006】
本発明のある観点によれば、複数のカットを含む動画像からカット間の遷移を検出するカット遷移検出部と、複数のカットを相異なる特徴量を有する複数のカットグループに区分し、相異なるカットグループに属する2以上の連続するカットからなるカットペアであり、動画像中で繰返される複数のカットペアを特定するカットペア特定部と、複数のカットペアから2以上の数のカットペアを選択し、選択されたカットペア中の全てのカットの代表画像を一定率で縮小して並べたカット構成画像を、予め定められた範囲の表示領域に表示する場合の表示占有率を算出し、表示領域に対する表示占有率を最大化するように、選択するカットペアの数を調整する表示最適化部と、調整されたカットペアの数を満たすカット構成画像を生成するカット構成画像生成部とを備える動画像処理装置が提供される。
【0007】
上記表示最適化部は、カットペア数Nに対応する第1の表示占有率と、カットペア数N+1に対応する第2の表示占有率を算出し、第2の表示占有率が第1の表示占有率よりも小さい場合に、カットペア数Nによりカット構成配列を最適化してもよい。
【0008】
上記カット構成画像生成部は、動画像中でのカットペアの出現順序および各カットペア中でのカットの出現順序に基づき、各カットの代表画像を行列状に並べたカット構成画像を生成してもよい。
【0009】
上記カット構成画像生成部は、選択されたカットペア中の全てのカットの代表画像を所定の縮小率よりも低い一定率で縮小して並べたカット構成画像を生成してもよい。
【0010】
また、本発明の別の観点によれば、複数のカットを含む動画像からカット間の遷移を検出し、複数のカットを相異なる特徴量を有する複数のカットグループに区分し、相異なるカットグループに属する2以上の連続するカットからなるカットペアであり、動画像中で繰返される複数のカットペアを特定し、複数のカットペアから2以上の数のカットペアを選択し、選択されたカットペア中の全てのカットの代表画像を一定率で縮小して並べたカット構成画像を、予め定められた範囲の表示領域に表示する場合の表示占有率を算出し、表示領域に対する表示占有率を最大化するように、選択するカットペアの数を調整し、調整されたカットペアの数を満たすカット構成画像を生成することを含む動画像処理方法が提供される。
【0011】
また、本発明の別の観点によれば、上記動画像処理方法をコンピュータに実行させるためのプログラムが提供される。ここで、プログラムは、コンピュータ読取り可能な記録媒体を用いて提供されてもよく、通信手段等を介して提供されてもよい。
【発明の効果】
【0012】
以上説明したように本発明によれば、動画像のカット構成を容易に把握できるカット構成画像を生成可能な、動画像処理装置、動画像処理方法およびプログラムを提供することができる。
【図面の簡単な説明】
【0013】
【図1】本発明の実施形態に係る動画像処理方法の手順を示すフロー図である。
【図2】動画像処理装置の構成を示すブロック図である。
【図3】動画像処理装置の全体的な動作手順を示すフロー図である。
【図4】カット構成の一例を示す図である。
【図5】カットペアの特定手順を示すフロー図である。
【図6】カットペアの特定結果の一例を示す図である。
【図7】カット構成配列の一例を示す図である。
【図8】カット構成の表示最適化手順を示すフロー図である。
【図9A】カット構成の表示最適化手順を示す図(1/3)である。
【図9B】カット構成の表示最適化手順を示す図(2/3)である。
【図9C】カット構成の表示最適化手順を示す図(3/3)である。
【図10】カットペアの生成手順を示すフロー図である。
【図11】カットペアの2つの生成手順を示す図である。
【図12】カットペアの生成条件の一例を示す図である。
【図13】第1の生成手順でカットペアのフレーム数に基づきカットペアを生成する手順の一例を示す図である。
【図14】第1の生成手順でカットのフレーム数に基づきカットペアを生成する手順の一例を示す図である。
【図15】第1の生成手順でカット間の音量変動に基づきカットペアを生成する手順の一例を示す図である。
【図16】第2の生成手順でカットペアのフレーム数に基づきカットペアを生成する手順の一例を示す図である。
【図17】第2の生成手順でカットのフレーム数に基づきカットペアを生成する手順の一例を示す図である。
【図18】第2の生成手順でカット間の音量変動に基づきカットペアを生成する手順の一例を示す図である。
【図19】第2の生成手順でカット間の画像輝度ヒストグラムに基づきカットペアを生成する手順の一例を示す図である。
【図20】カット間での特徴量の類似度の算出結果の一例を示す図である。
【図21】類似度行列の内積に基づくカットペアの生成手順の一例を示す図(1/2)である。
【図22】類似度行列の内積に基づくカットペアの生成手順の一例を示す図(2/2)である。
【図23】類似度行列のスカラー値に基づくカットペアの生成手順の一例を示す図である。
【図24】カット構成画像の一例を示す図である。
【図25】隠蔽率に基づくカット構成画像の修正を示す図である。
【発明を実施するための形態】
【0014】
以下に添付図面を参照しながら、本発明の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
【0015】
[1.動画像処理方法の概要]
まず、図1を参照して、本発明の実施形態に係る動画像処理方法の概要について説明する。図1には、本発明の実施形態に係る動画像処理方法の手順が示されている。
【0016】
図1に示すように、本発明の実施形態に係る動画像処理方法では、まず、複数のカットを含む動画像MPからカット間の遷移が検出される(ステップS1)。つぎに、複数のカットが相異なる特徴量S(カットグループの特徴量の総称)を有する複数のカットグループに区分され、相異なるカットグループに属する2以上の連続するカットからなるカットペアであり、動画像MP中で繰返される複数のカットペアが特定される(ステップS3)。
【0017】
つぎに、複数のカットペアから2以上の数Nのカットペアが選択される(ステップS5)。つぎに、選択されたカットペア中の全てのカットの代表画像I(代表画像の総称)を一定率で縮小して並べたカット構成画像CIを、予め定められた範囲の表示領域Adに表示する場合の表示占有率Roが算出される(ステップS6)。そして、表示領域Adに対する表示占有率Roを最大化するように、選択するカットペアの数Nが調整される(ステップS7)。さらに、調整されたカットペアの数Nを満たすカット構成画像CIが生成される(ステップS9)。
【0018】
これにより、表示領域Adに対する表示占有率Roを最大化するようにカットペアの数Nを調整し、調整されたカットペアの数Nを満たすカット構成画像CIを生成することで、カット構成の一覧性およびカット構成画像CIの視認性を確保可能なカット構成画像CIを生成することができる。そして、ユーザは、このように生成されたカット構成画像CIを通じて動画像MPのカット構成を容易に把握することができる。
【0019】
[2.動画像処理装置1]
つぎに、図2を参照して、本発明の実施形態に係る動画像処理装置1について説明する。図2には、動画像処理装置1の主要な機能構成が示されている。図2に示すように、動画像処理装置1は、データ取得部11、カット遷移検出部13、カットペア特定部15、表示最適化部17、カットペア生成部19、メタ情報生成部21、カット構成画像生成部23、カット構成画像出力部25、カット構成情報出力部27、データ記憶部29を含んで構成される。
【0020】
データ取得部11は、複数のカットを含む動画像データMPを取得し、カット遷移検出部13、カットペア特定部15、カットペア生成部19、メタ情報生成部21、およびカット構成画像生成部23に供給する。動画像データMPは、一般にフレーム形式のデータであり、画像データのみでもよく、音声データとの組合せでもよい。動画像データMPは、データ記憶部29から取得されてもよく、外部装置(不図示)から取得されてもよい。
【0021】
カット遷移検出部13は、動画像データMPに基づき動画像MP中のカット遷移を検出し、検出結果をカットペア特定部15、カット構成情報出力部27に供給する。カット遷移とは、動画像MP中におけるカットの移り変わりを意味する。カット遷移は、相前後するフレーム中の画像および/または音声の特徴量を求め、特徴量の類似度に基づき検出される。画像および/または音声の特徴量としては、色ヒストグラムや顔画像検出、画像間の相関、および/または音声の量や音調・リズム等を用いることができる。なお、カット遷移の検出時に求められた特徴量は、データ記憶部29等に格納され、他の処理に利用されてもよい。
【0022】
カットペア特定部15は、詳細は後述するが、各カットの特徴量S´に基づき、複数のカットをカットグループに区分し、カットペアを特定する。カットペアの特定結果は、カット遷移の検出結果とともに、表示最適化部17、カットペア生成部19、カット構成情報出力部27に供給される。カットの特徴量S´としては、カットに含まれる画像の色ヒストグラムや顔画像検出、画像間の相関、および/または音声の量や音調・リズム等あるいはこれらの組合せを用いることができる。なお、カットペアの特定時に求められた特徴量S´は、データ記憶部29等に格納され、他の処理に利用されてもよい。
【0023】
カットグループとは、特徴量S´が互いに類似するカットの組合せを意味する。カットペアとは、カット構成中で繰返される一連の相異なるカットの組合せを意味し、時間的に連続する2以上のカットからなる。カットペア特定部15は、カットペアの特定結果に基づき、カットグループやカットペアを表す属性情報(後述するグループID、ペアID等)を各カットに付与する。属性情報は、表示最適化部17およびカットペア生成部19の他に、カット構成情報出力部27、データ記憶部29や外部装置等に供給されてもよい。
【0024】
表示最適化部17は、詳細は後述するが、カット構成画像CIの表示条件(表示範囲、表示サイズ等)に応じて、カット構成画像CIの表示を最適化する。具体的には、カット構成の一覧性とともにカット構成画像CIの視認性を確保するために、カット構成画像CIとして表示されるカットペアの数Nが最適表示数Noptに最適化される。最適化の結果は、カットペア生成部19に供給される。
【0025】
カットペア生成部19は、詳細は後述するが、カットペアの特定結果および表示の最適化結果に応じて、カット構成画像CIとして表示されるカットペアを生成する。具体的には、カットペアの生成条件に従って、カットの特徴量S´に基づき、最適カットペア数Noptを満たすようにカットペアが生成される。カットペア生成の結果は、カット構成画像生成部23に供給されるが、カット構成情報出力部27、データ記憶部29や外部装置等に供給されてもよい。
【0026】
メタ情報生成部21は、各カットに含まれる音声や画像の特徴を示すメタ情報MI(メタ情報の総称)を生成する。メタ情報生成部21では、動画像データMPおよびカット遷移の検出結果に基づき、動画像データMPから音声や画像の特徴が抽出される。そして、各カットの音声や画像の特徴を示すメタ情報MIが生成され、カット構成画像生成部23に供給される。
【0027】
カット構成画像生成部23は、動画像データMPおよびカットペア生成の結果に基づき、カット構成画像CIを生成する。カット構成画像CIとは、カットペア間の境界を明示するとともに、生成されたカットペアに含まれるカットの代表画像Iをカット遷移の順序に従って並べた画像である。カット構成画像CIの生成では、生成されたカットペアのカットに含まれる画像から所定の基準に従って代表画像Iが抽出される。カット構成画像CIには、メタ情報生成部21から供給されるメタ情報MIが含まれてもよい。代表画像Iとは、各カットを代表する画像であり、例えば、カットの中央フレームに相当する画像として抽出される。カット構成画像CIは、カット構成画像出力部25に供給される。
【0028】
カット構成画像出力部25は、ユーザが動画像MPのカット構成を把握できるように、カット構成画像生成部23から供給されたカット構成画像CIを出力する。カット構成画像CIは、動画像処理装置1に接続された表示装置、印刷装置、記憶装置や外部装置(いずれも不図示)に出力されてもよい。
【0029】
カット構成情報出力部27は、ユーザがカット構成の把握に利用できるように、カット遷移の検出結果、カットの区分結果やカットペアの特定結果をカット構成情報として出力する。カット構成情報は、動画像処理装置1に接続された表示装置、印刷装置、記憶装置や外部装置(いずれも不図示)に出力されてもよい。
【0030】
カット構成情報は、例えば、カット構成を考慮した動画像検索を実現するためのデータとして利用することができる。例えば、あるカットを基準カットとして、基準カットとカットペアをなすカットを検索したり、あるカットペアを基準カットペアとして、基準カットペアと同じ構成のカットペアを検索したりすることができる。また、カットペアを多く含む動画像MPやカット切返しを多く含む動画像MPを検索することもできる。
【0031】
データ記憶部29は、動画像データMPおよび動画像データMPに付属するデータを記憶している。データ記憶部29には、カット構成情報が動画像データMPに関連付けて記憶されている。なお、データ記憶部29には、カット構成画像CIが記憶されてもよい。また、図2では、データ記憶部29と他の構成要素との接続関係の表示が一部省略されている。
【0032】
ここで、上記機能構成において、データ取得部11、カット遷移検出部13、カットペア特定部15、表示最適化部17、カットペア生成部19、メタ情報生成部21、カット構成画像生成部23、カット構成画像出力部25、カット構成情報出力部27は、CPU、DSP(デジタル信号処理装置)等の演算処理装置により構成される。データ記憶部29は、フラッシュメモリ等の内部記憶装置、ハードディスクドライブ、ブルーレイディスクドライブ等の外部記憶装置により構成される。そして、CPUは、ROM等から読み出されたプログラムをRAM上に展開して実行することで、動画像処理方法を実現する。なお、上記機能構成は、少なくとも一部が専用ロジック等のハードウェアとして構成されてもよい。
【0033】
[3.カット構成配列Mの生成手順]
つぎに、図3から図7を参照して、カット構成配列Mの生成手順について説明する。図3には、動画像処理装置1の全体的な動作手順が示されている。
【0034】
図3に示すように、まず、データ取得部11では、動画像データMPが取得され(ステップS11)、カット遷移検出部13等に供給される。カット遷移検出部13では、動画像データMPに基づき動画像MP中のカット遷移が検出され(ステップS13)、検出結果がカットペア特定部15に供給される。カット遷移は、相前後するフレーム中の画像および/または音声の特徴量の類似度に基づき検出される。各カットには、カット遷移の順序を示す連番がカットIDとして付与される。
【0035】
図4には、カット遷移の検出結果から求められたカット構成の一例が示されている。ここでは、理解を容易にするために、カット1〜15の代表画像I1〜I15を用いてカット構成が示されている。図4に示すように、カット1、3、6、8、11、13が互いに類似し、カット2、4、7、9、12、14が互いに類似し、カット5、10、15が互いに類似している。
【0036】
つぎに、カットペア特定部15では、各カットをカットグループに区分し、カットペアを特定するカットペア特定処理が行われる。図5には、カットペア特定処理の手順が示されている。図5に示すように、カットペア特定処理では、まず、初期化処理が行われる(ステップS31)。初期化処理では、グループ数mおよびペアIDが初期化される(m=2、ペアID=1)。また、カット1、2にグループID=1、グループID=2が各々に付与され、カット1、2にペアID=1が付与される。
【0037】
ここで、グループ数mは、動画像データMPから特定されているカットグループ(初期化処理時では、カットグループ1、2が特定されていることになる。)の数を示している。グループIDおよびペアIDは、各カットが属するカットグループおよびカットペアを示すために、各カットに付与される。
【0038】
つぎに、カット1の特徴量S´が算出され、カットグループ1の特徴量S1としてデータ記憶部29等に格納される(ステップS33)。同様に、カット2の特徴量S´が算出され、カットグループ2の特徴量S2としてデータ記憶部29等に格納される(ステップS35)。カットグループの特徴量S(カットグループの特徴量の総称)は、色ヒストグラムや顔画像検出、画像間の相関、および/または音声の量や音調・リズム等、あるいはこれらの組合せとして算出される。
【0039】
つぎに、処理対象となる後続カットの存在が確認される(ステップS37)。後続カットが存在すれば(ステップS37で「Yes」)、後続カットの特徴量S´が算出され(ステップS39)、後続カットの特徴量S´とカットグループ1〜mの特徴量S1〜Smの間で類似が判定される(ステップS41)。ここで、判定に際しては、直前カットよりも大きなグループIDを伴うカットグループとの間で、特徴量Sの類似度が優先的に判定されてもよい。これは、同一カットペアに属する場合、直前カットよりも後続カットが属するカットグループのグループIDが大きくなるためである。
【0040】
そして、後続カットの特徴量S´とカットグループ1〜mのいずれかの間で特徴量S1〜Smの間で類似度が所定の閾値以上であると判定された場合(ステップS41で「Yes」)、後続カットには、最も類似度の高いカットグループx(1≦x≦m)のグループIDが付与される(ステップS43)。
【0041】
また、後続カットのグループIDが直前カットのグループIDと比較され(ステップS45)、前者の方が小さい場合にペアIDが1インクリメントされる(ステップS47)。この場合、直前カットと後続カットが相異なるカットペアに属し、両カットの間にカットペア間の境界(カットの切返し点)が存在することになる。後続カットには、従前のペアIDまたはインクリメントされたペアIDが付与される(ステップS49)。後続カットの特徴量S´は、カットグループxの特徴量Sxの一部として格納されて利用されてもよく、棄却されてもよい(ステップS51)。
【0042】
一方、後続カットの特徴量S´とカットグループ1〜mの特徴量S1〜Smの全ての間で類似度が所定の閾値未満であると判定された場合(ステップS41で「No」)、新たなカットグループを生成するためにグループ数mが1インクリメントされる(ステップS53)。後続カットには、新たなカットグループとして、グループ数mに相当するグループIDが付与される(ステップS55)。また、後続カットには、従前のペアIDが付与される(ステップS57)。後続カットの特徴量S´は、新たなカットグループmの特徴量Smとして格納されて利用される(ステップS59)。
【0043】
ステップS37〜S59の処理は、後続カットが存在しなくなるまで(ステップS37で「No」)繰返される。そして、後続カットが存在しなければ、カットペア特定処理が終了し、図3に示すように、引き続きステップS17の処理が行われる。
【0044】
図6には、図4に示したカット構成に対するカットペアの特定結果が示されている。図6に示すように、各カットの特徴量S´の類似度に基づき、カット1、3、6、8、11、13にグループID=1が付与され、カット2、4、7、9、12、14にグループID=2が付与され、カット5、10、15にグループID=3が付与されている。また、カット遷移の順序に基づき、カット1〜15にペアID=1〜6が付与され、カット1、2、カット3〜5、カット6、7、カット8〜10、カット11、12、カット13〜15が一連の相異なるカットとして繰返されるカットペア1〜6として各々に特定されている。
【0045】
カットペアの特定が終了すると、表示最適化部17では、カットペアの特定結果に基づき、カット構成配列Mが最適化される(ステップS17)。表示最適化部17では、まず、カット構成配列Mが生成される。カット構成配列Mとは、動画像MP中でのカットペアの出現順序および各カットペア中でのカットの出現順序に基づき、各カットを行列状に配列するための情報である。
【0046】
図7には、図6に示したカットペアの特定結果から生成されたカット構成配列Mが示されている。図7では、カット構成配列M中にカットIDが示されている。図7に示すカット構成配列Mでは、カット1、2が横並びに配列され、カット1、2の下にカット3〜5が横並びに配列され、同様に、カット6、7、カット8〜10、カット11、12、カット13〜15が配列されている。
【0047】
つまり、カット1〜15は、動画像MP中でのカットペアの出現順序(ペアID)を第1方向(縦方向)、各カットペア中でのカットの出現順序(グループID)を第2方向(横方向)とする行列状に並べて配列されている。なお、第1方向と第2方向の組合せは、縦方向と横方向の組合せに代えて、横方向と縦方向の組合せでもよい。
【0048】
[4.カット構成配列Mの最適化手順]
つぎに、図8および図9A〜9Cを参照して、カット構成配列Mの最適化手順について説明する。図8には、カット構成配列Mの最適化手順が示されている。
【0049】
以下では、所定の表示領域Adに対して、図7に示したカット構成配列Mを最適化する場合について説明する。ここで、表示領域Adは、第1方向の表示高(画素数)Y、第2方向の表示幅(画素数)X、表示範囲サイズA(=X×Y)である場合を想定する。各カットの代表画像Iは、第1方向の原寸高(画素数)y、第2方向の原寸幅(画素数)x、代表画像サイズa(=x×y)、アスペクト比Ra=x/yである場合を想定する。
【0050】
図8に示すように、まず、処理カウンタiが初期化(i=1)される(ステップS61)。つぎに、表示領域Adの表示幅Xから代表画像Iの最大表示幅xmaxが算出される(ステップS63)。最大表示幅xmaxは、表示領域Adの表示幅Xをカット構成のグループ数mで除して算出される(xmax=X/m)。なお、代表画像Iの最大表示幅xmaxが代表画像Iの原寸幅xより大きい場合には、最大表示幅xmaxが原寸幅xに設定されてもよい。
【0051】
つぎに、最大表示幅xmaxで代表画像Iを表示する場合のカットペアの表示数Nが算出される(ステップS65)。ここで、表示数Nは、表示領域Adの表示高Yを代表画像Iの最大表示高ymaxで除して算出される(N=Y/ymax)。なお、最大表示高ymaxは、最大表示幅xmaxをアスペクト比Raで除して算出される(ymax=xmax/Ra)。また、表示数Nは、小数点以下を切り捨てた値として算出される。
【0052】
つぎに、カットペアの表示数Nに基づきカット構成配列Mから第1の部分配列Mが生成される(ステップS67)。ここで、部分配列とは、カット構成配列Mから部分的に抽出された配列である。第1の部分配列Mは、カットペア1〜N中の全てのカットを含む配列として生成され、配列に含まれるカットの総数が第1の部分配列M中のカット総数nとなる。
【0053】
つぎに、表示領域Adに対する第1のカット構成画像CIの表示占有率Roが算出される(ステップS69)。ここで、第1のカット構成画像CIの表示占有率Roは、第1の部分配列M中のカット総数nに代表画像サイズ(a=xmax×ymax)を乗じた値を、表示範囲サイズAで除して算出される(Ro=a×n/A)。
【0054】
つぎに、処理カウンタiが1インクリメントされ(ステップS71)、表示数Nが1インクリメントされる(ステップS73)。つぎに、カットペアの表示数Nに基づきカット構成配列Mから第iの部分配列Mが生成される(ステップS75)。第iの部分配列Mは、カットペア1〜N中の全てのカットを含む配列として生成される。
【0055】
つぎに、表示数Nで代表画像Iを表示する場合の代表画像サイズaが算出される(ステップS77)。ここで、代表画像サイズaは、表示数Nで代表画像Iを表示する場合の表示高yと表示幅xを乗じて算出される(a=x×y)。表示高yは、表示領域Adの表示高Yを表示数Nで除して算出され(y=Y/N)、表示幅xは、表示高yにアスペクト比Raを乗じて算出される(x=y×Ra)。
【0056】
つぎに、表示領域Adに対する第iのカット構成画像CIの表示占有率Roが算出される(ステップS79)。ここで、第iのカット構成画像CIの表示占有率Roは、第iの部分配列M中のカット総数nに代表画像サイズaを乗じた値を、表示範囲サイズAで除して算出される(Ro=a×n/A)。
【0057】
つぎに、算出された表示占有率Roが直前の処理(処理カウンタi−1の処理)で算出された表示占有率Roi−1よりも小さいかが判定される(ステップS81)。そして、判定結果が肯定的であれば(ステップS81で「Yes」)、表示数Ni−1が最適表示数Noptとなる(ステップS83)。結果として、第i−1の部分配列Mi−1が最適化されたカット構成配列として決定される。
【0058】
一方、判定結果が否定的であれば(ステップS81で「No」)、処理がステップS71に復帰する。そして、次の処理カウンタi+1に相当する表示数Ni+1が設定され、ステップS81の判定結果が肯定的となるまでステップS71〜S81の処理が繰返される。
【0059】
ここで、上記手順によれば、表示数Nが大きくなるほど、代表画像Iの表示サイズaが小さくなる。このため、代表画像Iの最小表示高yminを予め設定しておき、表示数Nから算出される代表画像Iの表示高yが最小表示高ymin未満となるかが判定されてもよい。そして、判定結果が肯定的であれば、最適化処理を打ち切り、表示占有率Roが最大となる第1の部分配列Mの表示数Nを最適表示数Noptとしてもよい。
【0060】
図9A〜9Cには、図4に示したカット構成に対する最適化処理の結果が示されている。図9Aに示すように、第1の部分配列Mは、表示数N=4であり、カットペア1〜4に含まれるカット1〜10からなる。この場合、カット構成のグループ数がm=3であるので、カット構成画像CIとしては、図9Aに示すように、表示領域Adの表示幅X一杯にカットグループ1〜3の代表画像I1〜I10が表示されることになる。そして、第1の部分配列Mの表示占有率がRo=0.74と算出されている。
【0061】
図9Bに示すように、第2の部分配列Mは、表示数N=5であり、カットペア1〜5に含まれるカット1〜12からなる。この場合、カット構成画像CIとしては、図9Bに示すように、表示領域Adの表示高Y一杯にカットペア1〜5の代表画像I1〜I12が表示されることになる。そして、第2の部分配列Mの表示占有率がRo=0.76と算出されている。ここで、Ro(=0.74)<Ro(=0.76)であるので、最適化処理が継続される。
【0062】
図9Cに示すように、第3の部分配列Mは、表示数N=6であり、カットペア1〜6に含まれるカット1〜15からなる。この場合、カット構成画像CIとしては、図9Cに示すように、表示領域Adの表示高Y一杯にカットペア1〜6の代表画像I1〜I15が表示されることになる。そして、第3の部分配列Mの表示占有率がRo=0.67と算出されている。ここで、Ro(=0.67)<Ro(=0.76)であるので、第2の部分配列Mが最適化されたカット構成配列となる。よって、最適表示数Noptは、表示数N=5となる。
【0063】
なお、図9A、9Bでは、カット構成配列M中の全てのカットペア1〜6が表示されていないので、表示領域Adの下方には、表示されていないカットペアの存在を暗示するマークMが表示されている。
【0064】
以上説明したように、本実施形態に係る動画像処理方法によれば、表示領域Adに対する表示占有率Roを最大化するようにカットペアの数Nを調整し、調整されたカットペアの数Nを満たすカット構成画像CIを生成することで、カット構成の一覧性およびカット構成画像CIの視認性を確保可能なカット構成画像CIを生成することができる。
【0065】
ここで、図9A〜9Cを参照して説明したように、最適化された配列は、表示条件の制約により必ずしも動画像MP中の全てのカット構成を含んでいない場合がある。よって、最適化された配列に従ってカット構成画像CIを生成すると、動画像MPのカット構成を適切に表すことができなくなってしまう場合がある。このため、以下で説明するように、最適化された配列(最適表示数Nopt)を満たすようにカット構成配列Mからカットを選別してカットペアを生成した上で、カット構成画像CIが生成される。
【0066】
表示最適化処理が終了すると、図3に示すように、カットペア生成部19により、複数のカットペアから最適表示数Noptのカットペアが生成される(ステップS19)。カットペアは、複数のカットの少なくとも一部を組合せて、各カットペアをなす2以上のカットが相異なるカットグループに属するとともに動画像MP中でのカット遷移の前後関係を満たすように生成される。
【0067】
[5.カットペアの生成手順]
つぎに、図10から図25を参照して、カットペアの生成手順について説明する。図10には、カットペアの生成手順が示されている。
【0068】
カットペアの生成では、カット遷移の検出およびカットペアの特定が予め行われる。前述したように、カット遷移の検出では、複数のカットを含む動画像MPからカット間の遷移が検出される(ステップS91)。また、カットペアの特定では、複数のカットが相異なる特徴量Sを有する複数のカットグループに区分され、相異なるカットグループに属する2以上の連続するカットからなるカットペアであり、動画像MP中で繰返される複数のカットペアが特定される(ステップS93)。
【0069】
カットペアの生成では、カットペアは、カット構成配列M中のカットペアをペアグループに区分した上で、各ペアグループから生成(第1の生成手順)されてもよく、カットペアをペアグループに区分せずに、カット構成配列Mから直接生成(第2の生成手順)されてもよい。このため、カットペアの生成では、まず、第1の生成手順を選択するかが判定される(ステップS95)。
【0070】
そして、判定結果が肯定的である場合(ステップS95で「Yes」)、まず、カットまたはカットペアの特徴量に基づき、カット構成配列M中のカットペアが最適表示数Noptのペアグループに区分される(ステップS97)。つぎに、各ペアグループについて、各ペアグループに含まれるカットのうち少なくとも一部を組合せて、各ペアグループに含まれるカットペアから1のカットペアが生成される(ステップS98)。ここで、カットは、各カットペアをなす2以上のカットが相異なるカットグループに属するとともに動画中でのカット遷移の前後関係を満たすように組合される。
【0071】
一方、判定結果が否定的である場合(ステップS95で「No」)、ペアグループを考慮せずに、複数のカットの少なくとも一部を組合せて、複数のカットペアから最適表示数Noptのカットペアが生成される(ステップS99)。ここでも、カットは、各カットペアをなす2以上のカットが相異なるカットグループに属するとともに動画像MP中でのカット遷移の前後関係を満たすように組合される。
【0072】
以下では、図11から図25を参照して、カットペア1〜7から最適表示数Nopt=3を満たすように、カットペアを生成する場合について説明する。なお、以下では、図4〜図9で用いた動画像データMPとは異なる動画像データMPを用いて説明する。
【0073】
図11には、2つの生成手順によるカット構成画像CIの生成例が示されている。第1の生成手順では、まず、カット構成配列M中のカットペア1〜7がペアグループ1(カットペア1〜3)、ペアグループ2(カットペア4、5)、およびペアグループ3(カットペア6、7)に区分されている。つぎに、ペアグループ1からカット3、4が選別され、ペアグループ2からカット8、9が選別され、ペアグループ3からカット11、14が選別されている。なお、図中では、選別されたカットにハッチングが施されている。一方、第2の生成手順では、カットペア1〜7をペアグループに区分せずに、カット3、4、8、9、11、14がカット構成配列Mから直接選別されている。
【0074】
図12には、カットペアの生成条件の一例が示されている。カットペアは、図12に示すカットペアの生成条件に従ってカット構成配列Mから生成される。ここで、カットの特徴としては、カットの画像のフレーム数、カットの音声の音量、カットの画像の輝度・色、カットの画像中の動き量等が挙げられる。特徴量としては、合計値、平均値、最大・最小値、中央値、最頻値、分散、変動係数、変化値(差分)、ヒストグラム、行列値等が挙げられる。特徴量の処理単位としては、カット単位、カットペア単位、カットペア中の差分、対応するカット間等が挙げられる。特徴量の評価基準としては、特徴量の降順・昇順、基準値からの変動、連続する特徴量間の差分、行列値の内積・外積等が挙げられる。
【0075】
カットペアの生成条件は、例えば、カットの特徴を「フレーム数」、特徴量を「合計値」、処理単位を「カットペア単位」、評価基準を「特徴量の昇順」というように、カットの特徴、特徴量、処理単位および評価基準を適当に組合せて形成される。なお、上記したカットの特徴、特徴量、処理単位および評価基準は、一例にすぎず、必ずしも全ての組合せが可能であることを意味するものではない。以下では、いくつかの生成条件を例としてカットペアの生成処理について説明する。
【0076】
まず、第1の生成手順に従って、カットペア1〜7から最適表示数Nopt=3を満たすようにカットペアを生成する場合について説明する。なお、以下で挙げる処理条件およびカット構成は、カットペアの生成処理を説明するための一例である。
【0077】
図13には、カットペアのフレーム数に基づきカットペアを生成する例が示されている。まず、カットペア1〜7のフレーム数に基づきカットペア1〜7がペアグループ1〜3に区分される(ペアグループの項参照)。カットペア1〜7は、各ペアグループに含まれるカットペアのフレーム総数がほぼ等しくなるように区分される。上記例では、ペアグループ1、2、3に含まれるカットペアのフレーム総数が120、80、100となるように、カットペア1〜7が区分されている(累計の項参照)。つぎに、ペアグループ1〜3について、各ペアグループに含まれるカットペアからフレーム数が最大のカットペアが選別される。上記例では、ペアグループ1、2、3について、カットペア3、4、7が各々に選別されている(ペアフレーム数の項参照)。よって、カット構成画像CIを生成するために、カットペア3、4、7からなる3つのカットペアが生成される。
【0078】
なお、フレーム数に代えて、カットペア数に基づきカットペア1〜7を区分してもよい。この場合、カットペア1〜7は、各ペアグループに含まれるカットペアの数がほぼ等しくなるように、例えば、カットペア1、2とカットペア3、4とカットペア5〜7に区分されてもよい。また、フレーム数が最大のカットペアに代えて、フレーム数が最小のカットペアや中央値のカットペア等を選別してもよい。
【0079】
図14には、カットのフレーム数に基づきカットペアを生成する例が示されている。まず、カットペア1〜7に含まれ、カットグループ1に属する主カット(カット1、3、5、7、9、11、13)のフレーム数に基づきカットペア1〜7がペアグループ1〜3に区分される。
【0080】
具体的に、ペアグループの区分では、全ての主カットからフレーム数が上位2位となる2つの主カットが選択される。上記例では、フレーム数20、25の主カット5、9が選択されている(グループ1フレーム数の項参照)。そして、選択された主カットの位置を区切りとして、カットペア1〜7がペアグループ1〜3に区分される。この場合、上記例では、主カット5、9の位置を区切りとして、カットペア1〜3、カットペア4、5、カットペア6、7がペアグループ1、2、3に各々に区分されている(ペアグループの項参照)。
【0081】
つぎに、ペアグループ1〜3の各々について、カットグループ1に属する主カットからフレーム数が最大の主カットが選別される。上記例では、ペアグループ1、2、3について、主カット5、9、11が各々に選別されている(グループ1フレーム数の項参照)。
【0082】
つぎに、ペアグループ1〜3の各々について、カットグループ2に属する副カット(カット2、4、6、8、10、12、14)からフレーム数が最大の副カットが選別される。上記例では、ペアグループ1、2、3について、副カット2、10、14が各々に選別されている(グループ2フレーム数の項参照)。よって、カット構成画像CIを生成するために、カット2、5からなるカットペア、カット9、10からなるカットペア、カット11、14からなるカットペアが生成される。
【0083】
この場合、主カット5と副カット2の間でカット遷移の順序が逆順(主カットのカットID>副カットのカットID)となっているので、主カットと副カットの間でカット遷移の順序が正順(主カットのカットID<副カットのカットID)となるように、副カット2に代えて、副カット6が選別されてもよい。
【0084】
なお、主カットと副カットを各々のフレーム数に基づき別々に選別する代わりに、主カットをフレーム数に基づき選別した上で、選別された主カットと同一のカットペアに属する副カットを選別してもよい。この場合、例えば、主カット5、9、11を選別すると、副カット6、10、12が自動的に選別される。
【0085】
また、主カットのフレーム数に代えて、副カットのフレーム数に基づきカットペア1〜7を区分してもよく、カットペアのフレーム数に基づきカットペア1〜7を区分してもよい。また、フレーム数が上位2位となる2つの主カットに代えて、フレーム数が下位2位となる2つの主カットの位置を区切りとしてもよい。また、各ペアグループについてフレーム数が最大の主カットおよび副カットを選別する代わりに、フレーム数が最大となるカットペアに属する主カットおよび副カットを選別してもよい。
【0086】
図15には、カット間の音量変動に基づきカットペアを生成する例が示されている。まず、図13に示した例と同様に、カットペア1〜7のフレーム数に基づきカットペアがペアグループ1〜3に区分される。
【0087】
つぎに、ペアグループ1〜3の各々について、カットグループ1に属する主カット(カット1、3、5、7、9、11、13)から音量変動が最大の主カットが選別される。ここで、音量変動は、各ペアグループに含まれる主カットにおける平均音量に対する各主カットの音量の比率として算出される。上記例では、ペアグループ1、2、3に含まれる主カットの平均音量18.3、15.0、20.0に対して、音量変動の絶対値が最大となる主カット3(音量変動−6.7)、主カット7(同5.0)、主カット11(同−5.0)が選別されている(グループ1音量変動の項参照)。なお、同一ペアグループ内で絶対値の最大値が2以上存在する場合には、便宜的にカットIDが小さい主カットが選別されている。
【0088】
同様に、ペアグループ1〜3の各々について、カットグループ2に属する副カット(カット2、4、6、8、10、12、14)から音量変動が最大の副カットが選別される。ここで、音量変動は、各ペアグループに含まれる副カットにおける平均音量に対する各副カットの音量の比率として算出される。この場合、上記例では、ペアグループ1、2、3に含まれる副カットの平均音量18.3、15.0、12.5に対して、音量変動の絶対値が最大となる副カット6(音量変動−6.7)、副カット8(同−5.0)、副カット12(同2.5)が選別されている(グループ2音量変動の項参照)。なお、同一ペアグループ内で絶対値の最大値が2以上存在する場合には、便宜的にカットIDが小さい副カットが選別されている。よって、カット構成画像CIを生成するために、カット3、6からなるカットペア、カット7、8からなるカットペア、カット11、12からなるカットペアが生成される。
【0089】
なお、カットペアのフレーム数に基づきカットペアをペアグループに区分する代わりに、図14に示した例のように、全てのカットから音量変動が上位2位となる2つのカットを選択し、選択したカットの位置を区切りとして、カットペア1〜7をペアグループに区分してもよい。ここで、音量変動は、カットペア1〜7に含まれる全てのカットにおける平均音量に対する各カットの音量の比率として算出される。
【0090】
また、ペアグループ1〜3の各々について、主カットと副カットを区別せずに、各ペアグループに含まれる全てのカットから音量変動が最大のカットを選別してもよい。例えば、ペアグループ1については、カット1〜6から音量変動が最大のカット3(平均音量18.3からの音量変動−6.7)を選別した上で、選別されたカット3と同一のカットペア2に属するカット4を選別してもよい。
【0091】
また、各ペアグループについて音量変動が最大となる主カットおよび副カットを各々に選別する代わりに、音量変動が最大となるカットペアに属する主カットおよび副カットを選別してもよい。ここで、音量変動は、各ペアグループに含まれる全てのカットペアにおける平均音量に対する各カットペアの音量の比率として算出される。
【0092】
つぎに、第2の生成手順に従って、カットペア1〜7から最適表示数Nopt=3を満たすようにカットペアを生成する場合について説明する。なお、以下で挙げる処理条件およびカット構成は、カットペアの生成処理を説明するための一例である。
【0093】
図16には、カットペアのフレーム数に基づきカットペアを生成する例が示されている。カットペア1〜7からフレーム数が上位3位となる3つのカットペアが選択される。そして、選択されたカットペアに含まれるカットが選別される。上記例では、ペアフレーム数60、60、60のカットペア3、4、7に対応するカット5〜8、13、14が選別されている(ペアフレーム数の項参照)。よって、カット構成画像CIを生成するために、カットペア3、4、7からなる3つのカットペアが生成される。
【0094】
なお、フレーム数が上位3位となる3つのカットペアに代えて、フレーム数が平均的な3つのカットペアを選択してもよく、フレーム数が平均的な1つのカットペアと、フレーム数が上位2位となる2つのカットペアを選択してもよい。
【0095】
図17には、カットのフレーム数に基づきカットペアを生成する例が示されている。まず、カットペア1〜7に含まれる全てのカットからフレーム数が上位3位となる3つのカットが選別される。つぎに、選別されたカットと同一のカットペアに属するカットが選別される。上記例では、フレーム数25、20、25のカット2、5、9が選別された後、対応するカット1、6、10が選別されている。よって、カット構成画像CIを生成するために、カットペア1、3、5からなる3つのカットペアが生成される。
【0096】
なお、全てのカットに代えて、主カットまたは副カットのいずれか一方からフレーム数が上位3位となる3つのカットを選別してもよい。また、主カットまたは副カットのいずれか一方からフレーム数が平均的な1つのカットを選別し、他方からフレーム数が上位2位となる2つのカットを選別してもよい。
【0097】
図18には、カット間の音量変動に基づきカットペアを生成する例が示されている。まず、カットペア1〜7に含まれる全てのカットから音量変動が上位3位となる3つのカットが選別される。ここで、音量変動は、カットペア1〜7に含まれるカットにおける平均音量に対する各カットの音量の比率として算出される。つぎに、選別されたカットと同一のカットペアに属するカットが選別される。上記例では、いずれも音量変動−8.2のカット3、6、11が選別された後、対応するカット4、5、12が選別されている(グループ1、2音量変動の項参照)。よって、カット構成画像CIを生成するために、カットペア2、3、6からなる3つのカットペアが生成される。
【0098】
なお、全てのカットに代えて、主カットまたは副カットのいずれか一方から音量変動が上位3位となる3つのカットを選別してもよい。ここで、音量変動は、カットペア1〜7に含まれる主カットまたは副カットのいずれか一方における平均音量に対する各カットの音量の比率として算出される。
【0099】
図19には、カット間での画面輝度の変動に基づきカットペアを生成する例が示されている。まず、各カット1〜14の代表画像について、画像処理に基づき画面輝度を正規化して表すヒストグラムが算出される。つぎに、カットグループ毎に7つのカットの平均ヒストグラムが算出される。ヒストグラムでは、代表画像に含まれる画素の輝度を所定の輝度間隔で区分した場合における区分毎の頻度が表されている。図19には、カット1〜14の代表画像I1〜I14とともに、各代表画像I1〜I14の正規化ヒストグラムおよびカットグループ毎の平均ヒストグラムが示されている。
【0100】
つぎに、平均ヒストグラムに対する変動が上位3位となる3つのカットが選別される。ここでは、ヒストグラムの変動は、各カットの正規化ヒストグラムと、各カットが属するカットグループの平均ヒストグラムとの差分として算出される。そして、選別されたカットと同一のカットペアに属するカットが選別される。上記例では、カット1、11、14の変動が上位3位となり、カット構成画像CIを生成するために、カットペア1、6、7からなる3つのカットペアが生成される。
【0101】
つぎに、カット間での特徴量の類似度に基づきカットペアを生成する場合について説明する。以下では、カットペア1〜7をなすカット1〜14から最適表示数Nopt=3を満たすようにカットペアを生成する場合について説明する。
【0102】
図20には、カット1〜14間で特徴量の類似度を算出した結果が示されている。図20に示す算出結果では、カット1〜14は、カットグループ1(カット1、3、5、7、9、11、13)と、カットグループ2(カット2、4、6、8、10、12、14)に区分されるとともに、カットペア1〜7に区分されている。
【0103】
図20では、カット1、2の特徴量に相当するカットグループ1、2の特徴量S1、S2を基準として、カット1〜14間の特徴量の類似度が0〜1の値として示されている。ここで、特徴量の類似度が1に近いほどカット間で特徴量が類似していることを意味している。例えば、同一のカットグループに属するカット1−3間では、特徴量の類似度が0.9と高く、異なるカットグループに属するカット1−4間では、特徴量の類似度が0.1と低くなっている。
【0104】
図21には、カット1−2間の類似度を示す第1の類似度行列Ms1と、カット3−4間の類似度を示す第2の類似度行列Ms2が示されている。第1および第2の類似度行列Ms1、Ms2は、図20に示した算出結果から抽出された行列である。そして、第1と第2の類似度行列Ms1、Ms2の内積により、カットペア1(カット1、2)とカットペア2(カット3、4)の間の類似度を算出することができる。ここで、第1と第2の類似度行列Ms1、Ms2の内積が大きいほどカットペア間が類似していることを意味している。
【0105】
図21に示すように、第1の類似度行列Ms1は、(1.0、0.2、0.3、1.0)とベクトル化され、第2の類似度行列Ms2は、(0.9、0.1、0.2、0.8)とベクトル化される。よって、第1と第2の類似度行列Ms1、Ms2の内積は、1.0×0.9+0.2×0.1+0.3×0.2+1.0×0.8≒1.8と算出される。同様の方法で、カットペア1−2間を除くカットペア1〜7間の類似度が算出される。
【0106】
これにより、図22に示すように、カットペア1〜7間の類似度が算出される。図22には、カットペア1〜7間の類似度と併せて、カットペア1〜7について、類似度の総和が各々に示されている。ここで、類似度の総和が大きいほどカットペアの親和度が高いこと、つまり、カットペア1〜7を代表するカットペアである蓋然性が高いことを意味している。
【0107】
類似度行列Ms(類似度行列の総称)の内積に基づきカットペアを生成する場合、第1に、類似度の総和が最大(9.1)となるカットペア3が選択される。第2に、カットペア3との類似度が最低(1.1)となるカットペア7が選択される。第3に、カットペア7との類似度が最低(0.9)となるカットペア1が選択される。よって、カット構成画像CIを生成するために、カットペア1、3、7からなる3つのカットペアが生成される。
【0108】
なお、カットペア7との類似度が最低であるという基準に代えて、カットペア3との類似度が2番目に低いという基準でカットペアが選択されてもよい。また、類似度の総和が最大となるカットペア、最低となるカットペア、平均値に直近のカットペアという基準で3つのカットペアが選択されてもよい。
【0109】
これにより、全てのカットペアを代表する代表的なカットペアと、代表的なカットペアとは類似しない他のカットペアを生成することができる。
【0110】
図23には、カット1−2間の類似度を示す第1の類似度行列Ms1と、カット3−4間の類似度を示す第2の類似度行列Ms2が示されている。第1および第2の類似度行列Ms1、Ms2は、図20に示した算出結果から抽出された行列である。そして、カット1〜14間の類似度を示す類似度行列Msのスカラー値により、カットペアを選択することができる。ここで、類似度行列Msのスカラー値が大きいほど、カットペア1〜7を代表するカットペアである蓋然性が高いことを意味している。
【0111】
例えば、第1の類似度行列Ms1のスカラー値は、1.0+0.2+0.3+1.0=2.5と算出され、第2の類似度行列Ms2のスカラー値は、0.9+0.1+0.2+0.8=2.0と算出される。よって、カットペア1(カット1、2)とカットペア2(カット3、4)との間では、カットペア1の方が全てのカットペアを代表する代表的なカットペアである蓋然性が高いことになる。
【0112】
類似度行列Msのスカラー値に基づきカットペアを生成する場合、まず、カットペア1〜7間で類似度行列Msのスカラー値が算出される。つぎに、図22に示した場合において、類似度の総和をスカラー値に置き換えて処理することで、3つのカットペアが選択される。そして、選択されたカットペアに含まれるカットが選別される。
【0113】
これにより、全てのカットペアを代表する代表的なカットペアと、代表的なカットペアとは類似しない他のカットペアを生成することができる。
【0114】
カットペア生成処理が終了すると、図3に示すように、メタ情報生成部21により各カットのメタ情報MIが生成される(ステップS21)。メタ情報生成部21では、まず、動画像データMPおよびカット遷移の検出結果に基づき、動画像データMPから各カットに含まれる画像や音声の特徴が抽出される。
【0115】
例えば、カットに音声(セリフ、音響効果等)が含まれている場合、カットに含まれる音声が抽出され、音声認識処理等を通じて、抽出された音声に対応する文字・画像情報が生成されてもよい。カットに音声が含まれていない場合、無音カットであることを示す文字・画像情報が生成されてもよい。なお、無音カットは、セリフが含まれていない無音カットと、セリフも音響効果も含まれていない無音カットに区別されてもよい。カットに含まれる音声の音量の平均値・変動値、無音区間と有音区間の比率、音声の音調・リズムまたは変動を示す文字・画像情報が生成されてもよい。
【0116】
また、カットに含まれるフレームの数またはカットの再生に要する時間が算出されて、算出値を示す文字・画像情報が生成されてもよい。カットに含まれる画像の明るさの平均値・変動値、画像の内容等または変化を示す文字・画像情報が生成されてもよい。
【0117】
カット構成画像生成部23では、カットペア生成処理の結果に基づき、カット構成画像CIが生成される(ステップS23)。カット構成画像生成部23では、まず、動画像データMPおよびカットペア生成処理の結果に基づき、選別されたカットに属する一連の画像から所定の基準に従って代表画像Iが抽出される。なお、各カットの代表画像Iは、カット遷移の検出時に予め抽出されていてもよい。つぎに、カットペアを明示しつつ各カットの代表画像Iをカット遷移の順序に従って並べたカット構成画像CIが生成される。ここで、各カットのメタ情報MIが生成されている場合には、各カットの代表画像Iとともに表示されることになる。
【0118】
図24には、図13に示したカットペア生成処理の結果から生成されたカット構成画像CIの一例が示されている。図24に示すカット構成画像CIでは、カット5、6の代表画像I5、I6が横並びに配置され、カット5、6の代表画像I5、I6の下にカット7、8の代表画像I7、I8が横並びに配置され、カット7、8の代表画像I7、I8の下にカット13、14の代表画像I13、I14が横並びに配置されている。このようなカット構成画像CIによりカット構成の把握が容易となる。なお、カット構成画像CIの構成は、図24に示した構成に限定されるものではない。
【0119】
図25には、カット構成画像CIの変形例が示されている。図25に示すカット構成画像CIでは、カットの代表画像Iに重ねてカットのメタ情報MIが表示されている。カットのメタ情報MIとは、カットに含まれる画像や音声の特徴を示す情報である。
【0120】
音声特徴を示すメタ情報MIは、例えば、各カットに含まれる音声(セリフ、音響効果等)の内容を示す情報、各カットに音声が含まれないこと(無音カットであること)を示す情報等である。画像特徴を示すメタ情報MIは、例えば、各カットに含まれるフレームの数を示す情報、各カットの再生に要する時間を示す情報等である。
【0121】
ここで、図25の状態Aに示すカット構成画像CIでは、例えば、カット1の代表画像I1、カット7の代表画像I7、カット11の代表画像I11に対して、カット1、3のメタ情報MI1、MI3、カット5、7、9のメタ情報MI5、MI7、MI9、カット11のメタ情報MI11が各々に重ねて表示されている。これにより、3つのカットのメタ情報MI5、MI7、MI9を重ねて表示されたカット7の代表画像I7では、代表画像I7の視認性が低下している。
【0122】
このため、カット1、7、11の代表画像I1、I7、I11についてメタ情報MIによる隠蔽率、つまり代表画像I上でのメタ情報MIの表示占有率が算出される。この場合、カット7の代表画像I7では隠蔽率が相対的に高く、カット11の代表画像I11では隠蔽率が相対的に低くなっている。
【0123】
よって、図25の状態Bに示すカット構成画像CI´では、メタ情報MIによる隠蔽率に基づき、カット7の代表画像I7上のカット9のメタ情報MI9がカット11の代表画像I11上に移動されている。これにより、カット7の代表画像I7では、状態Aの場合と比べて隠蔽率が低くなり、代表画像I7の視認性を確保することができる。
【0124】
以上説明したように、本実施形態に係る動画像処理方法によれば、複数のカットの少なくとも一部を所定の条件を満たすように組合せて所定数のカットペアを生成し、生成されたカットペアからなるカット構成画像CIを生成することで、カット構成の一覧性およびカット構成画像CIの視認性を確保可能なカット構成画像CIを生成することができる。
【0125】
以上、添付図面を参照しながら本発明の好適な実施形態について詳細に説明したが、本発明はかかる例に限定されない。本発明の属する技術の分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本発明の技術的範囲に属するものと了解される。
【0126】
例えば、上記実施形態では、構成画像CIが最適表示数Nopt=3のカットペアを3行に並べた画像として説明されている。しかし、構成画像CIは、その表示条件に応じて、異なる最適表示数Noptで生成されてもよく、また最適表示数Noptが同一の場合でも、異なる行数・列数で代表画像Iを並べた画像として生成されてもよい。
【符号の説明】
【0127】
1 動画像処理装置
11 データ取得部
13 カット遷移検出部
15 カットペア特定部
17 表示最適化部
19 カットペア生成部
21 メタ情報生成部
23 カット構成画像生成部
25 カット構成画像出力部
27 カット構成情報出力部
29 データ記憶部
MP 動画像(データ)
I 代表画像
Nopt 最適表示数
CI カット構成画像
Ad 表示領域
Ro 表示占有率


【特許請求の範囲】
【請求項1】
複数のカットを含む動画像から前記カット間の遷移を検出するカット遷移検出部と、
前記複数のカットを相異なる特徴量を有する複数のカットグループに区分し、相異なるカットグループに属する2以上の連続するカットからなるカットペアであり、前記動画像中で繰返される複数の前記カットペアを特定するカットペア特定部と、
前記複数のカットペアから2以上の数のカットペアを選択し、前記選択されたカットペア中の全てのカットの代表画像を一定率で縮小して並べたカット構成画像を、予め定められた範囲の表示領域に表示する場合の表示占有率を算出し、前記表示領域に対する前記表示占有率を最大化するように、前記選択するカットペアの数を調整する表示最適化部と、
前記調整されたカットペアの数を満たす前記カット構成画像を生成するカット構成画像生成部と
を備える動画像処理装置。
【請求項2】
前記表示最適化部は、カットペア数Nに対応する第1の表示占有率と、カットペア数N+1に対応する第2の表示占有率を算出し、前記第2の表示占有率が前記第1の表示占有率よりも小さい場合に、前記カットペア数Nにより前記カット構成配列を最適化する、請求項1に記載の動画像処理装置。
【請求項3】
前記カット構成画像生成部は、前記動画像中でのカットペアの出現順序および前記各カットペア中でのカットの出現順序に基づき、各カットの前記代表画像を行列状に並べた前記カット構成画像を生成する、請求項1に記載の動画像処理装置。
【請求項4】
前記カット構成画像生成部は、前記選択されたカットペア中の全てのカットの代表画像を所定の縮小率よりも低い一定率で縮小して並べた前記カット構成画像を生成する、請求項1に記載の動画像処理装置。
【請求項5】
複数のカットを含む動画像から前記カット間の遷移を検出し、
前記複数のカットを相異なる特徴量を有する複数のカットグループに区分し、相異なるカットグループに属する2以上の連続するカットからなるカットペアであり、前記動画像中で繰返される複数の前記カットペアを特定し、
前記複数のカットペアから2以上のカットペアを選択し、前記選択されたカットペア中の全てのカットの代表画像を一定率で縮小して並べたカット構成画像を、予め定められた範囲の表示領域に表示する場合の表示占有率を算出し、
前記表示領域に対する前記表示占有率を最大化するように、前記選択するカットペアの数を調整し、
前記調整されたカットペアの数を満たす前記カット構成画像を生成すること
を含む動画像処理方法。
【請求項6】
複数のカットを含む動画像から前記カット間の遷移を検出し、
前記複数のカットを相異なる特徴量を有する複数のカットグループに区分し、相異なるカットグループに属する2以上の連続するカットからなるカットペアであり、前記動画像中で繰返される複数の前記カットペアを特定し、
前記複数のカットペアから2以上の数のカットペアを選択し、前記選択されたカットペア中の全てのカットの代表画像を一定率で縮小して並べたカット構成画像を、予め定められた範囲の表示領域に表示する場合の表示占有率を算出し、
前記表示領域に対する前記表示占有率を最大化するように、前記選択するカットペアの数を調整し、
前記調整されたカットペアの数を満たす前記カット構成画像を生成すること
を含む動画像処理方法をコンピュータに実行させるためのプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9A】
image rotate

【図9B】
image rotate

【図9C】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate

【図24】
image rotate

【図25】
image rotate