説明

動画像処理装置、動画像処理方法およびプログラム

【課題】動画像のカット構成を容易に把握可能にする、動画像処理装置、動画像処理方法およびプログラムを提供する。
【解決手段】複数のカットを含む動画像MPからカット間の遷移を検出し、カット間の類似度に基づき複数のカットをカットグループに区分し、動画像中でのカット間の時間的距離に基づきカット間距離Dcを算出し、複数のカットについて算出されたカット間距離をカットグループ毎に合算してカットグループ間距離Dgを算出し、カットグループに属するカットの代表画像Iと、カットグループ間距離を示す情報を含むカット構成画像CIを生成する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、動画像処理装置、動画像処理方法およびプログラムに関する。
【背景技術】
【0002】
映像(または動画像)は、一般に多数のカットから構成されている。従来、映像のカット構成を把握するために、映像のサムネイルを一定のフレーム間隔で時系列順に並べて表示することが知られている。この動画像処理方法は、何が映像の対象として捉えられているか、という情報を提供することができる。
【発明の概要】
【発明が解決しようとする課題】
【0003】
ところで、映像表現では、制作者の意図に応じて、例えば同じような内容のカットを時間的に隔てて構成する等、カット構成に工夫を凝らす場合がある。しかし、従来の動画像処理方法では、何が映像の対象として捉えられているか、という情報が提供されるが、映像の対象がどのように捉えられているか、換言すれば、映像の時間的コンテクストに関して映像がどのように表現されているか、という情報が十分に提供されない。
【0004】
一方、映像を鑑賞する者または映像を他の映像等の素材として利用する者には、映像の時間的コンテクストに関して映像がどのように表現されているか、という情報が重要となる場合がある。しかし、従来の動画像処理方法では、このような情報を十分に提供することができず、鑑賞者や利用者は、映像のカット構成を直感的に把握することができなかった。
【0005】
そこで、本発明は、動画像のカット構成を容易に把握可能にする、動画像処理装置、動画像処理方法およびプログラムを提供しようとするものである。
【課題を解決するための手段】
【0006】
本発明のある観点によれば、複数のカットを含む動画像からカット間の遷移を検出するカット遷移検出部と、カット間の類似度に基づき複数のカットをカットグループに区分するカット区分部と、動画像中でのカット間の時間的距離に基づきカット間距離を算出するカット間距離算出部と、複数のカットについて算出されたカット間距離をカットグループ毎に合算してカットグループ間距離を算出するカットグループ間距離算出部と、カットグループに属するカットの代表画像と、カットグループ間距離を示す情報を含むカット構成画像を生成するカット構成画像生成部とを備える動画像処理装置が提供される。
【0007】
上記カット間距離算出部は、カットiとカットjの動画像中でのカット遷移の順序を示す遷移情報をn、n(n<n)とする場合に、遷移情報n、nの差分値(n−n)から求まる(n−n(a≠0)を、カットiとカットjのカット間距離として算出してもよい。
【0008】
上記カット間距離算出部は、カットiとカットjの動画像中でのカット遷移のタイミングを示す遷移情報をn、n(n<n)とする場合に、遷移情報n、nの差分値(n−n)から求まる(n−n(b≠0)を、カットiとカットjのカット間距離として算出してもよい。
【0009】
上記遷移情報n、nは、各々にカットiの終了フレーム番号およびカットjの開始フレーム番号であり、または各々にカットiの終了タイムフレームおよびカットjの開始タイムフレームでもよい。
【0010】
上記カット間距離算出部は、カットiとカットjの動画像中でのカット遷移の順序を示す遷移情報をn1、n1(n1<n1)とする場合に、遷移情報n1、n1の差分値(n1−n1)から求まる(n1−n1(a≠0)を、カットiとカットjの第1のカット間距離として算出し、カットiとカットjの動画像中でのカット遷移のタイミングを示す遷移情報をn2、n2(n2<n2)とする場合に、遷移情報n2、n2の差分値(n2−n2)から求まる(n2−n2(b≠0)を、カットiとカットjの第2のカット間距離として算出し、第1のカット間距離および第2のカット間距離を項とする多項式に基づき、カットiとカットjのカット間距離を算出してもよい。
【0011】
上記遷移情報n2、n2は、各々にカットiの終了フレーム番号およびカットjの開始フレーム番号であり、または各々にカットiの終了タイムフレームおよびカットjの開始タイムフレームでもよい。
【0012】
上記代表画像生成部は、相異なるカットグループに属する1以上のカットの代表画像を、カットグループ間距離に従って隔てて配置したカット構成画像を生成してもよい。
【0013】
上記代表画像生成部は、カット遷移の順序を示す情報を含むカット構成画像を生成してもよい。
【0014】
上記代表画像生成部は、同一カットグループに2以上のカットが属する場合において、カットグループの基準カットの代表画像との変化部分が強調されるように、他のカットの代表画像を修正してもよい。
【0015】
上記カット間距離算出部は、カット間の時間的距離を示す遷移情報の逆数からカット間距離を算出し、複数のカットについて算出されたカット間距離をカットグループ毎に合算した値の逆数からカットグループ間距離を算出してもよい。
【0016】
また、本発明の別の観点によれば、複数のカットを含む動画像からカット間の遷移を検出し、カット間の類似度に基づき複数のカットをカットグループに区分し、動画像中でのカット間の時間的距離に基づきカット間距離を算出し、複数のカットについて算出されたカット間距離をカットグループ毎に合算してカットグループ間距離を算出し、カットグループに属するカットの代表画像と、カットグループ間距離を示す情報を含むカット構成画像を生成することを含む動画像処理方法が提供される。
【0017】
また、本発明の別の観点によれば、上記動画像処理方法をコンピュータに実行させるためのプログラムが提供される。ここで、プログラムは、コンピュータ読取り可能な記録媒体を用いて提供されてもよく、通信手段等を介して提供されてもよい。
【発明の効果】
【0018】
以上説明したように本発明によれば、動画像のカット構成を容易に把握可能にする、動画像処理装置、動画像処理方法およびプログラムを提供することができる。
【図面の簡単な説明】
【0019】
【図1】本発明の実施形態に係る動画像処理方法の概要を示す図である。
【図2】動画像処理装置の構成を示すブロック図である。
【図3】動画像処理装置の動作手順を示すフロー図である。
【図4】カット構成の一例を示す図である。
【図5】カット区分処理の手順を示すフロー図である。
【図6】図4に示したカット構成におけるカット区分処理の処理結果を示す図である。
【図7A】カット間距離の算出手順の一例を示す図である。
【図7B】カット間距離の算出手順の他の例を示す図である。
【図7C】カット間距離の算出手順のさらに他の例を示す図である。
【図8】図4に示したカット構成におけるカット間距離の算出結果を示す図である。
【図9】図8に示したカット構成におけるカットグループ間距離の算出結果を示す図である。
【図10】図4に示したカット構成におけるカット構成画像の一例を示す図である。
【図11】図10に示したカット構成画像の変形例を示す図である。
【図12】図10に示したカット構成画像の他の変形例を示す図である。
【発明を実施するための形態】
【0020】
以下に添付図面を参照しながら、本発明の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
【0021】
[1.動画像処理方法の概要]
まず、図1を参照して、本発明の実施形態に係る動画像処理方法の概要について説明する。図1には、動画像処理方法の概要が示されている。
【0022】
本発明の実施形態に係る動画像処理方法では、まず、複数のカットを含む動画像MPからカット間の遷移が検出される。つぎに、カット間の類似度に基づき複数のカットがカットグループに区分される。つぎに、動画像MP中でのカット間の時間的距離に基づきカット間距離Dc(カット間距離の総称)が算出され、複数のカットについて算出されたカット間距離Dcをカットグループ毎に合算してカットグループ間距離Dg(カットグループ間距離の総称)が算出される。
【0023】
ここで、カット間距離Dcは、カット間の関係性の程度を示し、カットグループ間距離Dgは、カットグループ間の関係性の程度を示している。そして、カットグループに属するカットの代表画像I(代表画像の総称)と、カットグループ間距離Dgを示す情報を含むカット構成画像CIが生成される。カット構成画像CIは、動画像MPのカット構成を容易に把握するための情報として、後述する動画像処理装置1や外部装置を通じて出力される。
【0024】
図1に示す例では、動画像MPは、カット1、カット2、カット1に類似するカット3、カット2に類似するカット4、カット1−4のいずれにも類似しないカット5からなる。カット1−5は、カット間の類似度に基づき、カット1、3が属するカットグループ1、カット2、4が属するカットグループ2、カット5が属するカットグループ3に区分される。
【0025】
カット1−5の間では、カット間の時間的距離に基づきカット間距離Dc1、2、Dc1、3、…、Dc4、5が算出され、カット1−5について算出されたカット間距離Dc1、2、Dc1、3、…、Dc4、5をカットグループ1−3毎に合算してカットグループ間距離Dg1、2、Dg1、3、Dg2、3が算出される。ここで、カットグループ間距離Dgは、カットグループ間の関係性の程度を示している。このため、カットグループ間距離Dg1、2、Dg1、3、Dg2、3を用いて、カットグループ1−2、1−3、2−3間の関係性の程度を示すことができる。
【0026】
ここで、図1に示す例では、動画像MPは、カット1、2とカット3、4からなるカットの繰返しと、カット4に続くカット5により構成されている。このため、カットの繰返しから判断して、カットグループ1には、カットグループ3よりもカットグループ2との間で強い関係性が認められる。また、カット遷移の順序から判断して、カットグループ3には、カットグループ1よりもカットグループ2との間で強い関係性が認められる。
【0027】
よって、例えば、カットグループ間距離Dgをカットグループ間の関係性の強さに反比例するように算出すれば、カットグループ1−2間のカットグループ間距離Dg1、2は、カットグループ1−3間のカットグループ間距離Dg1、3よりも小さく算出される。また、カットグループ2−3間のカットグループ間距離Dg2、3は、カットグループ1−3間のカットグループ間距離Dg1、3よりも小さく算出される。
【0028】
そして、カット構成画像CIでは、カットグループ1、2、3に属するカット1−5の代表画像I1−I5がカットグループ間のカットグループ間距離Dgに従って隔てて配置される。よって、カットグループ間の関係性の程度が容易に把握可能となる。なお、図1では、カットグループ間距離Dgが数値情報として示されているが、数値情報は示されなくてもよい。
【0029】
これにより、カット構成画像CIを用いて、映像の時間的コンテクストに関して映像がどのように表現されているか、という情報が提供される。よって、映像の鑑賞者または利用者は、映像を鑑賞し、または他の映像等の素材として利用する上で、映像のカット構成を容易に把握することができる。
【0030】
[2.動画像処理装置1の構成]
つぎに、図2を参照して、本発明の実施形態に係る動画像処理装置1について説明する。図2には、動画像処理装置1の主要な機能構成が示されている。図2に示すように、動画像処理装置1は、データ取得部11、カット遷移検出部13、カット区分部15、カット間距離算出部17、カットグループ間距離算出部19、カット構成画像生成部21、カット構成画像出力部23、カット構成情報出力部25、データ記憶部27を含んで構成される。
【0031】
データ取得部11は、複数のカットを含む動画像データMPを取得し、カット遷移検出部13、カット区分部15およびカット構成画像生成部21に供給する。動画像データMPは、一般にフレーム形式のデータであり、画像データのみでもよく、音声データとの組合せでもよい。動画像データMPは、データ記憶部27から取得されてもよく、外部装置(不図示)から取得されてもよい。
【0032】
カット遷移検出部13は、動画像データMP中のカット遷移を検出し、検出結果をカット区分部15に供給する。カット遷移とは、動画像MP中におけるカットの移り変わりを意味する。カット遷移は、相前後するフレーム中の画像および/または音声の特徴量を求め、特徴量の類似度に基づき検出される。画像および/または音声の特徴量としては、色ヒストグラムや顔画像検出、および/または音声の量や音調・リズム等を用いることができる。なお、カット遷移の検出結果は、カット区分部15の他に、カット構成情報出力部25、データ記憶部27や外部装置等に供給されてもよい。また、カット遷移の検出時に求められた特徴量は、データ記憶部27等に格納され、他の処理に利用されてもよい。
【0033】
カット遷移検出部13は、カット遷移を検出すると、動画像MP中でのカット遷移の順序を示す遷移情報やカット遷移のタイミングを示すカット遷移情報をカットに付与する。カット遷移の順序を示す遷移情報は、カット番号(カットID)等であり、カット遷移のタイミングを示す遷移情報は、例えば、フレーム番号やタイムコードである。フレーム番号やタイムコードは、動画像データMPから抽出されてもよく、動画像データMPに基づき生成されてもよい。カット遷移情報は、カット遷移の検出結果とともにカット区分部15に供給されるが、データ記憶部27や外部装置等に供給されてもよい。
【0034】
カット区分部15は、詳細は後述するが、カット間の類似度に基づき複数のカットをカットグループに区分する。カットの区分結果は、カット遷移の検出結果とともに、カット間距離算出部17に供給されるが、カット構成情報出力部25、データ記憶部27や外部装置等に供給されてもよい。カット間の類似度は、カットに含まれる画像および/または音声の色ヒストグラムや顔画像の検出結果、および/または音声の量や音調・リズム等からなるカットの特徴量S(特徴量の総称)から算出される。カットグループとは、特徴量Sが互いに類似するカットの組合せを意味する。カット区分部15は、カットの区分結果に基づきカットグループを表すグループIDを各カットに付与する。
【0035】
カット間距離算出部17は、詳細は後述するが、カット遷移情報に基づきカット間距離Dcを算出する。カット間距離Dcは、カット間の関係性の程度を示すために、動画像MP中でのカット間の時間的距離に基づき算出される。カット間距離Dcの算出結果は、カットグループ間距離算出部19に供給されるが、データ記憶部27や外部装置等に供給されてもよい。
【0036】
カットグループ間距離算出部19は、詳細は後述するが、カット間距離Dcの算出結果に基づきカットグループ間距離Dgを算出する。カットグループ間距離Dgは、カットグループ間の関係性の程度を示すために、複数のカットについて算出されたカット間距離Dcをカットグループ毎に合算して算出される。カットグループ間距離Dgの算出結果は、カット構成画像生成部21に供給されるが、カット構成情報出力部25、データ記憶部27や外部装置等に供給されてもよい。
【0037】
カット構成画像生成部21は、カット構成画像CIを生成するために、動画像データMPおよびカット遷移の検出結果に基づき、各カットに含まれる画像から所定の基準に従って代表画像Iを抽出する。代表画像Iとは、各カットを代表する画像であり、例えばカットの中央フレームに相当する画像として抽出される。カット構成画像CIは、カットグループに属するカットの代表画像Iと、カットグループ間距離Dgを示す情報を含む画像として生成される。
【0038】
カット構成画像出力部23は、ユーザが動画像MPのカット構成を容易に把握できるように、カット構成画像生成部21から供給されたカット構成画像CIを出力する。カット構成画像CIは、動画像処理装置1に接続された表示装置、印刷装置、記憶装置や外部装置(いずれも不図示)に出力されてもよい。
【0039】
カット構成情報出力部25は、ユーザがカット構成の把握に利用できるように、カット間距離Dcおよび/またはカットグループ間距離Dgの算出結果等をカット構成情報として出力する。カット構成情報は、動画像処理装置1に接続された表示装置、印刷装置、記憶装置や外部装置(いずれも不図示)に出力されてもよい。
【0040】
カット構成情報は、カット構成を考慮した動画像検索を実現するためのデータとして利用することができる。例えば、あるカットを基準カットとして、基準カットとの関係性が強いカットを検索したり、あるカットが属するカットグループを基準カットグループとして、基準カットグループとの関係性が強いカットグループを検索したりすることができる。また、互いに強い関係性を有するカットグループの集合からなる動画像MPを検索することもできる。
【0041】
データ記憶部27は、動画像データMPおよび動画像データMPに付属するデータを記憶している。データ記憶部27には、カット遷移の検出結果、カットの区分結果、カット間・カットグループ間距離Dc、Dgの算出結果等のカット構成情報、さらにはカット構成画像CI自体が動画像データMPに関連付けて記憶されもよい。なお、図2では、データ記憶部27と他の構成要素との接続関係が一部省略されている。
【0042】
ここで、上記機能構成において、データ取得部11、カット遷移検出部13、カット区分部15、カット間距離算出部17、カットグループ間距離算出部19、カット構成画像生成部21、カット構成画像出力部23、カット構成情報出力部25は、CPU、DSP(デジタル信号処理装置)等の演算処理装置により構成される。データ記憶部27は、フラッシュメモリ等の内部記憶装置、ハードディスクドライブ、ブルーレイディスクドライブ等の外部記憶装置により構成される。そして、CPUは、ROM等から読み出されたプログラムをRAM上に展開して実行することで、動画像処理方法を実現する。なお、上記機能構成は、少なくとも一部が専用ロジック等のハードウェアとして構成されてもよい。
【0043】
[3.動画像処理装置1の動作]
つぎに、図3から図12を参照して、本発明の実施形態に係る動画像処理装置1の動作について説明する。図3には、動画像処理装置1の動作手順が示されている。
【0044】
図3に示すように、まず、データ取得部11では、動画像データMPが取得され(ステップS11)、カット遷移検出部13等に供給される。カット遷移検出部13では、動画像データMPに基づき動画像MP中のカット遷移が検出され(ステップS13)、検出結果がカット区分部15に供給される。カット遷移は、相前後するフレーム中の画像および/または音声の特徴量に基づき検出される。各カットには、カットID、フレーム番号、タイムコード等のカット遷移情報が付与される(ステップS15)。なお、以下では、動画像MP中でのカット遷移の順序を示すカットIDをカット遷移情報として用いる場合について主に説明する。
【0045】
図4には、カット遷移の検出結果から求められたカット構成の一例が示されている。ここでは、理解を容易にするために、各カットの代表画像Iを用いてカット構成が示されている。なお、代表画像Iは、後述するように、カット構成画像生成部21で動画像データMPから抽出される。図4に示すように、カット1、3、6が互いに類似し、カット2、4、7が互いに類似し、カット5が他のカット1−4、6、7のいずれとも類似していない。
【0046】
つぎに、カット区分部15では、各カットをカットグループに区分するカット区分処理が行われる(ステップS17)。図5には、カット区分処理の手順が示されている。図5に示すように、カット区分処理では、まず、初期化処理が行われる(ステップS51)。初期化処理では、グループ数mが初期化される。また、カット1、2にグループID=1、グループID=2が各々に付与される。ここで、グループ数mは、動画像データMPから特定されているカットグループ(初期化処理時では、カットグループ1、2が特定されていることになる。)の数を示している。グループIDは、各カットが属するカットグループを示すために、各カットに付与される。
【0047】
つぎに、カット1、2の特徴量S1、S2が算出され(ステップS53)、カットグループ1、2の特徴量S1、S2として各々にデータ記憶部27等に格納される(ステップS55)。カットの特徴量Sは、例えば、色ヒストグラムや顔画像検出、および/または音声の量や音調・リズム等、あるいはこれらの組合せとして算出される。
【0048】
つぎに、処理対象となる後続カットの存在が確認される(ステップS57)。後続カットが存在すれば(ステップ57で「Yes」)、後続カットの特徴量S´が算出され(ステップS59)、後続カットとカットグループ1−mの間で特徴量Sの類似が判定される(ステップS61)。ここで、判定に際しては、直前カットよりも大きなグループIDを伴うカットグループとの間で、特徴量Sの類似度が優先的に判定されてもよい。これは、カットの繰返しが行われる場合、直前カットよりも後続カットが属するカットグループのグループIDが大きくなるためである。
【0049】
そして、後続カットとカットグループ1−mのいずれかの間で特徴量Sの類似度が所定の閾値以上であると判定された(ステップS61で「Yes」)場合、後続カットには、最も類似度の高いカットグループのグループIDが付与される(ステップS63)。後続カットの特徴量S´は、後続カットが属するカットグループの特徴量Sの一部として格納されて利用されてもよく(ステップS65)、棄却されてもよい。
【0050】
一方、後続カットとカットグループ1−mの全ての間で特徴量Sの類似度が所定の閾値未満であると判定された(ステップS61で「No」)場合、新たなカットグループを生成するためにグループ数mが1インクリメントされる(ステップS67)。後続カットには、新たなカットグループとして、グループ数mに相当するグループIDが付与される(ステップS69)。後続カットの特徴量Sは、後続カットが属する新たなカットグループの特徴量Smとして格納されて利用される(ステップS71)。
【0051】
ステップS57−S71の処理は、後続カットが存在しなくなるまで(ステップ57で「No」)繰返される。そして、後続カットが存在しなければ、カット区分処理が終了し、図3に示すように、引き続きステップS19の処理が行われる。カット区分部15では、カット遷移の検出結果とともに、カットの区分結果がカット間距離算出部17に供給される。
【0052】
図6には、図4に示したカット構成におけるカット区分処理の処理結果が示されている。図6に示すように、各カットの特徴量Sの類似度に基づき、カット1、3、6にグループID=1が付与され、カット2、4、7にグループID=2が付与され、カット5にグループID=3が付与されている。
【0053】
カット間距離算出部17では、カット遷移情報に基づきカット間距離Dcが算出され(ステップS19)、算出結果がカットグループ間距離算出部19に供給される。図7A−7Cには、各種のカット遷移情報を用いて、カット1−3からなる動画像MPについてカット間距離Dcを算出する手順が示されている。
【0054】
まず、図7Aでは、動画像MP中でのカット遷移の順序を示すカットIDがカット遷移情報として用いられている。図7Aに示すように、カット1−3には、カットID=1−3が各々に付与されている。
【0055】
まず、カットiのカットID=nとカットjのカットID=n(n<n)の差分値(n−n)が求められる。つぎに、差分値(n−n)のべき乗値(n−n(a≠0)がカットi−j間のカット間距離Dci、jとして算出される。
【0056】
べき指数aは、0以外の任意の整数または実数として定められる。ここで、動画像MP中でのカット遷移の順序が互いに近いカット間ほど、べき指数a<0である場合にカット間距離Dcが小さくなり、べき指数a>0である場合にカット間距離Dcが大きくなる。なお、以下では、a=−2の場合について説明する。
【0057】
例えば、カット1−2間のカット間距離Dc1、2は、カットIDの差分値1(=2−1)となり、カット間距離Dc1、2=1として算出される。また、カット1−3間のカット間距離Dc1、3は、カットIDの差分値2(=3−1)となり、カット間距離Dc1、3=2−2=1/4として算出される。同様にして、カット2−3間のカット間距離Dc2、3は、カット間距離Dc2、3=1として算出される。
【0058】
また、図7Bでは、動画像MP中でのカット遷移のタイミングを示すフレーム番号がカット遷移情報として用いられている。図7Bに示すように、カット1−3には、開始フレーム番号および終了フレーム番号が各々に付与されている。例えば、カット1の開始:終了フレーム番号がf=1:40、カット2の開始:終了フレーム番号がf=41:80、カット3の開始:終了フレーム番号がf=81:120として付与されている。
【0059】
まず、カットiの最終フレーム番号nとカットjの開始フレーム番号n(n<n)の差分値(n−n)が求められる。つぎに、差分値(n−n)のべき乗値(n−n(b≠0)がカットi−j間のカット間距離Dci、jとして算出される。
【0060】
べき指数bは、0以外の任意の整数または実数として定められる。ここで、動画像MP中でのカット遷移のタイミングが互いに近いカット間ほど、べき指数b<0である場合にカット間距離Dcが小さくなり、べき指数b>0である場合にカット間距離Dcが大きくなる。なお、以下では、b=−1の場合について説明する。
【0061】
例えば、カット1−2間のカット間距離Dc1、2は、フレーム番号の差分値1(=41−40)となり、カット間距離Dc1、2=1として算出される。また、カット1−3間のカット間距離Dc1、3は、フレーム番号の差分値41(=81−40)となり、カット間距離Dc1、3=1/41として算出される。同様にして、カット2−3間のカット間距離Dc2、3は、カット間距離Dc2、3=1として算出される。
【0062】
ここで、動画像MP中でのカット遷移のタイミングを示すカット遷移情報としては、タイムフレームが用いられてもよい。タイムフレームは、例えば、カット1の開始:終了タイムフレームが0秒:40秒、カット2の開始:終了タイムフレームが40.05秒:80秒、カット3の開始:終了タイムフレームが80.05秒:120秒として付与される。タイムフレームの場合もフレーム番号の場合と同様に、カット間距離Dcを算出することができる。
【0063】
なお、フレーム番号やタイムフレームをカット遷移情報として用いる場合、連続するカット同士のカット間距離Dcが他のカットとの間のカット間距離Dcよりも非常に大きくまたは小さくなってしまう(例えば、図7Bの例では、Dc1、2=1に対してDc1、3=1/41)。この場合、連続するカット同士のカット間距離Dcについては、動画像MP中でフレーム数または時間間隔が最小となるカットについて求められたカット間距離Dcの1/2(例えば、Dc1、2=Dc1、3/2=1/82)とする等、適当に調整されることが望ましい。
【0064】
また、図7Cでは、カットIDおよびフレーム番号がカット遷移情報として用いられている。図7Cに示すように、カット1−5には、カットIDとともに、開始フレーム番号および終了フレーム番号が各々に付与されている。
【0065】
まず、図7Aに示したように、カットIDを用いて第1のカット間距離Dc1が算出される。つぎに、図7Bに示したように、フレーム番号を用いて第2のカット間距離Dc2が算出される。そして、第1のカット間距離Dc1および第2のカット間距離Dc2を項とする、例えば以下のような多項式に基づき、カット間距離Dcが算出される。なお、多項式中の重み係数w1、w2は、カット間の関係性としてカット遷移の順序とタイミングを各々にどの程度重視するか、という評価基準に従って適宜に設定される。
Dci、j=w1×Dc1i、j+w2×Dc2i、j
【0066】
例えば、w1=0.8、w2=0.2の場合、カット1−2間のカット間距離Dc1、2=1(=0.8×1+0.2×1)、カット1−3間のカット間距離Dc1、3≒0.20(=0.8×1/4+0.2×1/41)、カット2−3間のカット間距離Dc2、3=1(=0.8×1+0.2×1)となる。
【0067】
図8には、図4に示したカット構成におけるカット間距離Dcの算出結果が示されている。図8に示すように、カット1−7には、カットID=1−7が各々に付与され、各カットの特徴量Sの類似度に基づき、カット1、3、6にグループID=1が付与され、カット2、4、7にグループID=2が付与され、カット5にグループID=3が付与されている。図8では、カット遷移情報としてカットIDが用いられている。また、カット間距離Dcを算出するためにべき指数a=−2が用いられている。
【0068】
図8に示すカット間距離Dcの算出結果によれば、例えば、カット1とカット2、3、4、5、6、7の間のカット間距離DcがDc1、2=1、Dc1、3=1/4、Dc1、4=1/9、Dc1、5=1/16、Dc1、6=1/25、Dc1、7=1/36と算出されている。
【0069】
図3を参照すると、カットグループ間距離算出部19では、カット間距離Dcの算出結果に基づきカットグループ間距離Dgが算出され、算出結果がカット構成画像生成部21に供給される(ステップS21)。
【0070】
図9には、図8に示したカット構成におけるカットグループ間距離Dgの算出結果が示されている。図9に示すように、カットグループ間距離Dgは、複数のカットについて算出されたカット間距離Dcをカットグループ毎に合算して算出される。なお、図9に示す例では、カットグループ間距離Dgが合算値の逆数として算出されているが、逆数として算出されなくてもよい。
【0071】
図9に示す例では、カットグループ1とカットグループ2の間のカットグループ間距離Dg1、2は、カットグループ1に属するカット1、3、6のいずれかとカットグループ2に属するカット2、4、7のいずれかとの間のカット間距離Dcと、カット1、3、6同士のカット間距離Dcと、カット2、4、7同士のカット間距離Dcを、以下のように合算し、合算値の逆数として算出されている。
Dg1、2={(Dc1、2+Dc1、4+Dc1、7+Dc2、3+Dc2、6+Dc3、4+Dc3、7+Dc4、6+Dc6、7
+(Dc1、3+Dc1、6+Dc3、6)+(Dc2、4+Dc2、7+Dc4、7)}−1
={(1+1/9+1/36+1+1/16+1+1/16+1/4+1)
+(1/4+1/25+1/9)+(1/4+1/25+1/9)}−1
=(4.51+0.40+0.40)−1≒0.19
【0072】
なお、カットグループ間距離Dg1、2は、以下のように、カットグループ1に属するカット1、3、6のいずれかとカットグループ2に属するカット2、4、7のいずれかとの間のカット間距離Dcとして算出されてもよい。
Dg1、2={(Dc1、2+Dc1、4+Dc1、7+Dc2、3+Dc2、6+Dc3、4+Dc3、7+Dc4、6+Dc6、7)}−1
={(1+1/9+1/36+1+1/16+1+1/16+1/4+1)
=4.51−1≒0.22
【0073】
また、カットグループ1とカットグループ3のカットグループ間距離Dg1、3は、カットグループ1に属するカット1、3、6のいずれかとカットグループ3に属するカット5との間のカット間距離Dcを、以下のように合算して算出されている。同様に、カットグループ2とカットグループ3のカットグループ間距離Dg2、3は、カットグループ2に属するカット2、4、7のいずれかとカットグループ3に属するカット5との間のカット間距離Dcを、以下のように合算して算出されている。
Dg1、3=(Dc1、5+Dc3、5+Dc5、6−1
=(1/16+1/4+1)−1=16/21≒0.76
Dg2、3=(Dc2、5+Dc4、5+Dc5、7−1
=(1/9+1+1/4)−1=36/49≒0.73
【0074】
図4に示した動画像MPは、カット1、カット2、カット1に類似するカット3、カット2に類似するカット4、カット5、カット1、3に類似するカット6、カット2、4に類似するカット7というカット構成を有する。つまり、図4に示した動画像MPは、カット1、2とカット3、4とカット6、7からなるカットの繰返しと、カット4に続くカット5により構成されている。
【0075】
このため、カットの繰返しから判断して、カット1、3、6が属するカットグループ1と、カット2、4、7が属するカットグループ2との間で強い関係性が認められる。また、カット遷移の順序から判断して、カットグループ3には、カットグループ1よりもカットグループ2との間で強い関係性が認められる。
【0076】
そして、図9に示した算出結果には、カットグループ1−3の間でカットグループ間距離Dg1、2<Dg2、3<Dg1、3の関係性が明らかにされている。ここで、カットグループ間距離Dgがカットグループ間の関係性の強さに反比例するように算出されていることを考慮すれば、図9に示した算出結果には、カットグループ1−3の間の関係性の強さが反映されているといえる。
【0077】
カットグループ間距離Dgを算出すると、図3に示すように、カット構成画像生成部21では、まず、動画像データMPおよびカット遷移の検出結果に基づき、各カットに含まれる画像から所定の基準に従って代表画像Iが抽出される(ステップS23)。つぎに、カットグループに属するカットの代表画像Iと、カットグループ間距離Dgを示す情報を含むカット構成画像CIが生成される(ステップS25)。
【0078】
図10には、図4に示したカット構成におけるカット構成画像CIの一例が示されている。図10に示すカット構成画像CIには、カットグループ1に属するカット1、3、6の代表画像I1、I3、I6、カットグループ2に属するカット2、4、7の代表画像I2、I4、I7、およびカットグループ3に属するカット5の代表画像I5が配置されている。ここで、同一カットグループに属するカットの代表画像Iは、横並びに纏めて配置されている。
【0079】
そして、カットグループ毎の代表画像Iの集合は、図9に示したカットグループ間距離Dgに従って隔てて配置されている。つまり、カットグループ毎の代表画像Iの集合は、カットグループ1−2間の距離と、カットグループ1−3間の距離と、カットグループ2−3間の距離の比率がDg1、2:Dg1、3:Dg2、3=0.19:0.76:0.73となるように配置されている。これにより、カットグループ間の関係性が強いカットグループほど近づけて配置することで、カットグループ間の関係性が容易に把握可能となる。
【0080】
なお、カットグループ間距離Dgがカットグループ間の関係性の強さに比例するように算出されている場合、カットグループ毎の代表画像Iの集合は、例えば、カットグループ間距離Dgの逆数に従って隔てて配置されてもよい。また、カット構成画像CIは、カットグループ間距離Dgを示す数値情報を含んでもよい。
【0081】
図11には、図10に示したカット構成画像CIの変形例が示されている。図11に示すカット構成画像CIでは、図10に示したカット構成画像CIに対して、カット遷移情報に基づきカット遷移の順序を示す情報が付加されている。つまり、カット1、2、3、4、5、6、7というカット遷移の順序を示す矢印が付加されている。これにより、カットグループ間の関係性とともに、動画像MP中でのカット遷移の順序が容易に把握可能となる。
【0082】
図12には、図10に示したカット構成画像CIの他の変形例が示されている。図12に示すカット構成画像CIでは、図10に示したカット構成画像CIに対して、同一カットグループに属する一部のカットの代表画像Iが修正されている。つまり、2以上のカットが属するカットグループでは、カットグループの基準カットの代表画像Iとの変化部分が強調されるように、他のカットの代表画像Iが修正されている。
【0083】
ここで、カットグループ1、2では、カット1が基準カットとして選択されている。そして、例えば、カット3、6の代表画像I3´、I6´は、カット1の代表画像I1との変化部分が強調されるように、例えば無変化部分に相当する背景画像が省略されている。これにより、動画像MP中でのカット遷移の順序とともに、カットグループ中でのカット間の関係性(カット内容の変化)が容易に把握可能となる。
【0084】
[4.まとめ]
以上説明したように、本発明の実施形態に係る動画像処理装置1および動画像処理方法によれば、動画像MP中でのカット間の時間的距離に基づきカット間距離Dcが算出され、複数のカットについて算出されたカット間距離Dcをカットグループ毎に合算してカットグループ間距離Dgが算出される。そして、カットグループに属するカットの代表画像Iと、カットグループ間距離Dgを示す情報を含むカット構成画像CIが生成される。
【0085】
これにより、カット構成画像CIを用いて、映像の時間的コンテクストに関して映像がどのように表現されているか、という情報が提供される。よって、映像の鑑賞者または利用者は、映像を鑑賞し、または他の映像等の素材として利用する上で、映像のカット構成を容易に把握することができる。
【0086】
以上、添付図面を参照しながら本発明の好適な実施形態について詳細に説明したが、本発明はかかる例に限定されない。本発明の属する技術の分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本発明の技術的範囲に属するものと了解される。
【符号の説明】
【0087】
1 動画像処理装置
11 データ取得部
13 カット遷移検出部
15 カット区分部
17 カット間距離算出部
19 カットグループ間距離算出部
21 カット構成画像生成部
23 カット構成画像出力部
25 カット構成情報出力部
27 データ記憶部
MP 動画(データ)
Dc カット間距離
Dg カットグループ間距離
I 代表画像
CI カット構成画像


【特許請求の範囲】
【請求項1】
複数のカットを含む動画像から前記カット間の遷移を検出するカット遷移検出部と、
前記カット間の類似度に基づき前記複数のカットをカットグループに区分するカット区分部と、
前記動画像中での前記カット間の時間的距離に基づきカット間距離を算出するカット間距離算出部と、
前記複数のカットについて算出された前記カット間距離を前記カットグループ毎に合算してカットグループ間距離を算出するカットグループ間距離算出部と、
前記カットグループに属する前記カットの代表画像と、前記カットグループ間距離を示す情報を含むカット構成画像を生成するカット構成画像生成部と
を備える動画像処理装置。
【請求項2】
前記カット間距離算出部は、カットiとカットjの前記動画像中での前記カット遷移の順序を示す遷移情報をn、n(n<n)とする場合に、前記遷移情報n、nの差分値(n−n)から求まる(n−n(a≠0)を、前記カットiと前記カットjの前記カット間距離として算出する、請求項1に記載の動画像処理装置。
【請求項3】
前記カット間距離算出部は、カットiとカットjの前記動画像中での前記カット遷移のタイミングを示す遷移情報をn、n(n<n)とする場合に、前記遷移情報n、nの差分値(n−n)から求まる(n−n(b≠0)を、前記カットiと前記カットjの前記カット間距離として算出する、請求項1に記載の動画像処理装置。
【請求項4】
前記遷移情報n、nは、各々に前記カットiの終了フレーム番号および前記カットjの開始フレーム番号であり、または各々に前記カットiの終了タイムフレームおよび前記カットjの開始タイムフレームである、請求項3に記載の動画像処理装置。
【請求項5】
前記カット間距離算出部は、カットiとカットjの前記動画像中での前記カット遷移の順序を示す遷移情報をn1、n1(n1<n1)とする場合に、前記遷移情報n1、n1の差分値(n1−n1)から求まる(n1−n1(a≠0)を、前記カットiと前記カットjの第1のカット間距離として算出し、
前記カットiと前記カットjの前記動画像中での前記カット遷移のタイミングを示す遷移情報をn2、n2(n2<n2)とする場合に、前記遷移情報n2、n2の差分値(n2−n2)から求まる(n2−n2(b≠0)を、前記カットiと前記カットjの第2のカット間距離として算出し、
前記第1のカット間距離および前記第2のカット間距離を項とする多項式に基づき、前記カットiと前記カットjの前記カット間距離を算出する、請求項1に記載の動画像処理装置。
【請求項6】
前記遷移情報n2、n2は、各々に前記カットiの終了フレーム番号および前記カットjの開始フレーム番号であり、または各々に前記カットiの終了タイムフレームおよび前記カットjの開始タイムフレームである、請求項5に記載の動画像処理装置。
【請求項7】
前記代表画像生成部は、相異なる前記カットグループに属する1以上のカットの代表画像を、前記カットグループ間距離に従って隔てて配置した前記カット構成画像を生成する、請求項1から6のいずれか1項に記載の動画像処理装置。
【請求項8】
前記代表画像生成部は、前記カット遷移の順序を示す情報を含む前記カット構成画像を生成する、請求項7に記載の動画像処理装置。
【請求項9】
前記代表画像生成部は、同一カットグループに2以上のカットが属する場合において、前記カットグループの基準カットの前記代表画像との変化部分が強調されるように、他のカットの前記代表画像を修正する、請求項7または8に記載の動画像処理装置。
【請求項10】
前記カット間距離算出部は、前記カット間の時間的距離を示す遷移情報の逆数から前記カット間距離を算出し、前記複数のカットについて算出された前記カット間距離を前記カットグループ毎に合算した値の逆数から前記カットグループ間距離を算出する、請求項1から9のいずれか1項に記載の動画像処理装置。
【請求項11】
複数のカットを含む動画像から前記カット間の遷移を検出し、
前記カット間の類似度に基づき前記複数のカットをカットグループに区分し、
前記動画像中での前記カット間の時間的距離に基づきカット間距離を算出し、
前記複数のカットについて算出された前記カット間距離を前記カットグループ毎に合算してカットグループ間距離を算出し、
前記カットグループに属する前記カットの代表画像と、前記カットグループ間距離を示す情報を含むカット構成画像を生成すること
を含む動画像処理方法。
【請求項12】
複数のカットを含む動画像から前記カット間の遷移を検出し、
前記カット間の類似度に基づき前記複数のカットをカットグループに区分し、
前記動画像中での前記カット間の時間的距離に基づきカット間距離を算出し、
前記複数のカットについて算出された前記カット間距離を前記カットグループ毎に合算してカットグループ間距離を算出し、
前記カットグループに属する前記カットの代表画像と、前記カットグループ間距離を示す情報を含むカット構成画像を生成すること
を含む動画像処理方法をコンピュータに実行させるためのプログラム。


【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7A】
image rotate

【図7B】
image rotate

【図7C】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate