説明

映像解析装置及び映像解析方法

【課題】映像の意味内容を考慮して映像のまとまりを検出することが可能な映像解析装置を提供する。
【解決手段】時系列に配列された複数のフレーム画像からなる映像を解析する映像解析装置であって、連続する2つのフレーム画像中の連続性の評価をフレーム画像より抽出される局所形状に基づく特徴量を用いて、2つのフレーム画像に同じ物体が存在するかを判断することによって行い、連続性の評価結果に基づいて映像を複数のセグメントに分割するセグメント作成部130と、フレーム画像から人物の顔画像を検出し、検出された顔画像の類似度に基づいてフレーム画像をグループ化する顔グループ作成部140と、セグメント作成部130により作成されたセグメントと顔グループ作成部140によるフレーム画像の分類結果に基づいて、セグメントの解析情報を作成する解析情報作成部150と、を備える映像解析装置100が提供される。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、映像解析装置及び映像解析方法に関する。
【背景技術】
【0002】
一般に、TV映像などの動画像中から利用者が再生や編集の目的で閲覧したい場面を簡単に呼び出したいときに、動画像中の任意の位置にチャプタポイント(区切り)を付加する方法が採られている。チャプタポイントを付加することによって、チャプタポイントを付加した位置の映像を簡単な操作で呼び出すことができ、チャプタポイント毎に区切られた単位(チャプタという)で映像を閲覧することができるようになる。
【0003】
また、DVDレコーダ等の映像を記録する装置では、映像に自動的にチャプタポイントを付加して記録することができるものがある。チャプタポイントを自動的に付与する方法の一例としては、例えば、5分間隔や10分間隔といった一定時間間隔で、自動的に動画像にチャプタポイントを付加してチャプタを作成するものがある。この場合、単純に固定時間長のチャプタが作成されるので、必ずしも利用者が見たい場面毎にチャプタが作成されるわけではない。
【0004】
一方、映像中から動画像の意味的なまとまりを自動的に検出し、検出されたまとまり毎にチャプタを作成する技術も考案されている。例えば、特許文献1には、利用者によって選択された任意の画像フレームの周辺部分を含む動画像のまとまりを検出する方法が開示されている。この方法では、画像フレームから抽出したカラーヒストグラムやエッジ特徴等を前後の画像フレームと比較することにより、動画像の意味的なまとまりを検出している。
【0005】
また、特許文献2には、動画像中に登場する人物に着目して動画像のまとまりを検出する方法が開示されている。この方法では、予め利用者によって指定された登場人物の顔画像に一致する画像フレームを映像中から検出し、検出された画像フレームを基準として周辺部分をまとまりとして固定長で検出している。
【0006】
【特許文献1】特表2004−526372号公報
【特許文献2】特開2001−285787号公報
【発明の開示】
【発明が解決しようとする課題】
【0007】
しかしながら、特許文献1に記載の技術では、カラーヒストグラムやエッジ特徴を用いているため、映像中の人や物などの被写体が移動した場合や映像内の明度変化が大きい場合、被写体同士で遮蔽が発生したりする場合などに、カラーヒストグラムやエッジ特徴の特徴量が大きく変化し、隣り合う画像フレーム同士の類似性を検出出来ずに不連続なシーンと判定してしまうことが起こる。このため、意味的に連続した動画像のまとまりを正しく検出することができず、細かく分割されたチャプタを作成してしまう可能性がある。
【0008】
一方、特許文献2に記載の技術では、検出された顔画像を含む画像フレームの前後の固定長フレームをチャプタとして検出しているため、意味的に連続した動画像のまとまりを途中で分割してしまうなど、映像内容の意味合いを考慮せずにチャプターを作成してしまうという問題があった。
【0009】
そこで、本発明は、上記問題に鑑みてなされたものであり、本発明の目的とするところは、映像の意味内容を考慮して映像のまとまりを検出することが可能な、新規かつ改良された映像解析装置及び映像解析方法を提供することにある。
【課題を解決するための手段】
【0010】
上記課題を解決するために、本発明のある観点によれば、時系列に配列された複数のフレーム画像からなる映像を解析する映像解析装置であって、フレーム画像より抽出される局所形状に基づく特徴量を用いて、連続する2つのフレーム画像に同じ物体が存在するか否かを判断することによって、2つのフレーム画像の連続性の評価を行い、連続性の評価結果に基づいて映像を複数のセグメントに分割するセグメント作成部と、フレーム画像から人物の顔画像を検出し、検出された顔画像の類似度に基づいてフレーム画像をグループ化する顔グループ作成部と、セグメント作成部により作成されたセグメントと顔グループ作成部によるフレーム画像の分類結果に基づいて、セグメントの解析情報を作成する解析情報作成部と、を備える映像解析装置が提供される。
【0011】
かかる構成により、意味的に連続した映像のまとまりを細かく分割することなく、映像の意味内容を考慮した一連のセグメントとして分割することが可能となる。これにより、利用者にとって利便性の高い効果的なセグメント作成を行うことができ、利用者は、意味内容が連続した映像のまとまり毎に視聴したい箇所の映像を選択することが可能となる。
【0012】
また、セグメント作成部は、各フレーム画像の局所形状に基づく特徴量を抽出する特徴量抽出部と、連続する2つのフレーム画像の特徴量を比較することによって、2つのフレーム画像中に同じ物体が含まれるか否かを検出する物体検出部と、物体検出部による物体検出結果に基づいて、連続する2つのフレーム画像の連続性の評価値を計算し、評価値が所定の閾値より低い場合に2つのフレーム画像の間で映像を分割してセグメントを作成するセグメント生成部と、を含むようにしてもよい。
【0013】
このように、前後のフレーム画像の局所形状に基づく特徴量を用いて、フレーム画像に含まれる物体を認識することによって映像の連続性の評価が行われるため、従来の画像特徴のみを用いる方法を比較して、フレーム間の細かな画像の変動による影響を少なくすることができる。従って、意味的に連続した映像を別のセグメントとして分割してしまう可能性を低減することが可能となる。
【0014】
また、顔グループ作成部は、フレーム画像から顔画像を検出する顔画像検出部と、顔画像検出部によって検出された顔画像を比較し、類似する顔画像が抽出された連続する複数のフレーム画像を1つの顔グループとするグループ作成部と、グループ作成部によって作成された各顔グループのフレーム画像から1以上の代表画像を選択する代表画像選択部と、を含むようにしてもよい。
【0015】
これにより、映像に登場する人物毎にフレームをグループ化することができ、さらに、各グループに代表画像が対応付けられることによって、代表画像をそのグループが属するセグメントのサムネイル画像として用いることができる。
【0016】
また、解析情報作成部は、セグメントに含まれる顔グループの代表画像をセグメントの代表画像として、セグメントの解析情報を作成するようにしてもよい。これにより、顔グループの代表画像をセグメントのサムネイル画像として利用者に提示することができ、利用者は、各セグメントに登場する人物を見て視聴したいセグメントを選択することが可能となる。
【0017】
また、セグメントの解析情報を表示装置に出力する解析情報出力部と、利用者によって選択されたセグメントの映像を再生し、表示装置に出力する映像出力部をさらに含むようにしてもよい。これにより、利用者に作成されたセグメントの情報を提示することができ、利用者は、作成されたセグメントの単位で映像を視聴することが可能となる。
【0018】
また、解析情報出力部は、セグメントの時系列に従って解析情報を出力するようにしてもよい。あるいは、解析情報出力部は、セグメントに含まれる顔グループに対応する顔画像に対応付けられる人物によりセグメントを分類し、分類された結果に従って解析情報を出力するようにしてもよい。
【0019】
また、顔グループ作成部によって検出された顔画像のフレーム画像中の位置に基づいて、フレーム画像中の人物が存在する領域を計算する人物領域作成部をさらに備え、セグメント作成部は、人物領域作成部によって計算された領域の特徴量を比較することによってセグメントを作成するようにしてもよい。このように、人物領域の物体検出結果を用いることにより、顔が他の物体で遮蔽されたり、顔が正面に向いていない場合等においても、画像中に人物が存在することを認識することができる。これにより、人物が登場するフレームをより正確に検出してグループ作成を行うことが可能となる。
【0020】
また、利用者によって選択された任意の検索画像が入力される検索画像入力部と、検索画像と各フレーム画像との類似度を評価する検索画像評価部と、検索画像から人物の顔画像を検出し、当該顔画像と各フレーム画像から検出された顔画像との類似度を評価する顔類似性評価部と、をさらに備え、解析情報作成部は、検索画像評価部による評価結果と顔類似性評価部による評価結果とに基づいて、解析情報の中から、検索画像に関連するセグメントの解析情報を抽出するようにしてもよい。これにより、予め利用者によって選択された画像に関連する解析情報のみを抽出することができ、利用者にとって関心を持つセグメントの情報のみを提示することが可能となる。
【0021】
また、解析情報作成部は、検索画像評価部によって検索画像との類似度が高いと評価されたフレーム画像が含まれるセグメントの解析情報を抽出するようにしてもよい。
【0022】
あるいは、解析情報作成部は、顔類似性評価部によって検索画像から検出された顔画像との類似度が高いと評価された顔画像を含むフレーム画像が含まれるセグメントの解析情報を抽出するようにしてもよい。
【0023】
また、上記課題を解決するために、本発明の別の観点によれば、時系列に配列された複数のフレーム画像からなる映像を解析する映像解析方法であって、フレーム画像より抽出される局所形状に基づく特徴量を用いて、連続する2つのフレーム画像に同じ物体が存在するか否かを判断することによって、2つのフレーム画像の連続性の評価を行い、連続性の評価結果に基づいて前記映像を複数のセグメントに分割するセグメント作成ステップと、フレーム画像から人物の顔画像を検出し、検出された顔画像の類似度に基づいてフレーム画像をグループ化する顔グループ作成ステップと、セグメント作成ステップにおいて作成されたセグメントと、顔グループ作成ステップにおけるフレーム画像の分類結果に基づいて、セグメントの解析情報を作成する解析情報作成ステップと、を含むことを特徴とする、映像解析方法が提供される。
【発明の効果】
【0024】
以上説明したように本発明によれば、映像の意味内容を考慮して映像のまとまりを検出することが可能となる。
【発明を実施するための最良の形態】
【0025】
以下に添付図面を参照しながら、本発明の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
【0026】
本発明は、TV映像などの動画像の中から任意の映像のまとまりを検出し、そのまとまりを代表する画像を選択することで、利用者が動画像中の閲覧したい場面を再生表示できる映像解析装置及び映像解析方法に関するものである。本発明にかかる映像解析装置及び映像解析方法は、画像認識技術を用いてフレーム画像内の物体を検出することで、映像シーンのまとまりを細かく分割することなく、映像の意味内容を考慮した一連のセグメントとして検出することを特徴とする。
【0027】
具体的には、連続するフレーム画像同士の部分的な類似性に着目し、フレーム画像中から局所形状に基づく特徴量を抽出し、前後のフレーム画像の特徴量を比較することにより、両画像に同じ物体が存在するか否かを判断する。抽出された局所的な特徴量を用いることにより、画像中に存在する物体の様々な変動に対しても追跡することができ、カラ一分布や画像フレームのエッジ特徴を用いる手法と比べて映像の連続性を頑健に評価することが可能となる。
【0028】
(第1の実施形態)
まず、図1を参照して、本発明の第1の実施形態にかかる映像解析装置について説明する。図1は、本発明の第1の実施形態にかかる映像解析装置100の概略構成を示すブロック図である。本実施形態にかかる映像解析装置100は、図1に示すように、映像取得部110と、映像データ記憶部120と、セグメント作成部130と、顔グループ作成部140と、解析情報作成部150と、解析情報記憶部160と、再生部170と、表示部180とにより構成される。
【0029】
映像データ記憶部120は、1以上の映像データが記録されている記憶媒体である。映像取得部110は、映像データ記憶部120から映像データを取得し、セグメント作成部130及び顔グループ作成部140に映像データを入力する。セグメント作成部130は、映像取得部110から入力された映像を意味的に連続した単位で分割したセグメントを作成する。顔グループ作成部140は、映像中に登場する人物の顔画像を認識し、顔画像の類似性に基づいて映像のフレーム画像をグループ化(顔グループという)する。解析情報作成部150は、セグメント作成部130によるセグメント作成結果と、顔グループ作成部140によって作成された顔グループとを用いて、映像の解析情報を作成する。解析情報記憶部160は、解析情報作成部150によって作成された解析情報が格納される記憶媒体である。再生部170は、解析情報作成部150によって作成された解析情報を読み出して表示部180に表示させ、利用者によって選択されたセグメントの映像を再生する。表示部180は、解析情報や映像データの動画像を表示するディスプレイ等の表示装置である。
【0030】
(セグメント作成部130)
図2を参照して、セグメント作成部130の詳細な構成についてさらに説明する。図2は、本実施形態にかかる映像解析装置100のセグメント作成部130の概略構成を示すブロック図である。図2に示すように、セグメント作成部130は、特徴量抽出部131と、特徴量記憶部132と、物体検出部133と、セグメント生成部134とにより構成される。
【0031】
特徴量抽出部131は、動画像を構成する各フレーム画像から特徴量を抽出する。画像からの特徴量の抽出は、下記の非特許文献1〜3に記載されている方法で行うことができる。
【0032】
非特許文献1:C.Harris and M.Stephens,“A combined corner and edge detector”,Proc.Alvey Vision Conf.,pp.147−151
非特許文献2:D.Lowe,“Distinctive image features from scale−invariant keypoints” International Journal of Computer Vision,60,2(2004),pp.91−110
非特許文献3:N.Sebe and M.S.Lew,“COMPARING SALIENT POINT DETECTORS” Proc.IEEE Int. Conf.on Multimedia and Expo,pp.65−68
【0033】
ここで、フレーム画像からの特徴量の抽出は、フレーム画像に対し、Harris functionやDifference of Gaussian functionなどを用いて画像フレーム内にある物体形状の局所的な突出点を検出するフィルタを適用したり(非特許文献1、2)、ウェーブレットを用いて物体形状の局所的な突出点を検出するフィルタを適用する(非特許文献3)等の従来既知の手法を用いて物体固有の特徴点を抽出することによって実現することができる。そして、抽出された特徴点の周辺画素の輝度情報を各特徴点の特徴量として抽出する。抽出された特徴量のデータは、特徴量記憶部132に格納される。
【0034】
物体検出部133は、特徴量抽出部131によって抽出された特徴量のデータに基づいて、各フレーム画像に同じ物体が存在するか否かを検出する。物体検出部133は、前後のフレーム画像から得られた特徴量を、例えばユークリッド距離などを用いて比較することにより、前のフレーム画像中に含まれる物体と同一の物体が次のフレーム画像中にも存在するか否かを検出することができる。
【0035】
図3に、物体検出部133による物体検出の例を示す。図3で、フレーム画像135a〜135cは動画像中の連続したフレーム画像を示しており、画像中の丸印は、特徴量抽出部131によって抽出された局所形状の特徴点を表している。物体検出部133は、フレーム画像135aと135b、フレーム画像135bと135cの各特徴点の特徴量を比較することにより、画像中に含まれる物体の特徴点同士の対応付けを行い、同じ物体が存在するかどうかを判定する。
【0036】
セグメント生成部134は、物体検出部133による物体検出結果に基づいてフレーム間の連続性を評価し、連続性の評価が高いフレーム同士が1つのセグメントとなるようにセグメントを生成する。例えば、物体検出部133による物体検出の結果、前後のフレームで同じ物体が存在した場合には、セグメント生成部134はフレーム間の連続性の評価値を高く算出し、同じ物体が存在しない場合には評価値を低く算出する。なお、連続性の評価値は、例えば、物体検出部133で特徴量の比較に用いたユークリッド距離等に基づいて算出するようにしてもよい。
【0037】
このようにして算出された連続性の評価値に基づいて、セグメント生成部134は、フレーム間の変化が大きい(連続性の評価値が低い)と判断される位置で動画像を分割し、セグメントを作成する。図4は、セグメント生成部134によるセグメントの生成処理の例を示したものである。図4には、10個のフレーム画像からなる動画像において、連続する2つのフレーム間の連続性を評価した結果が示されている。図4の例では、例えば、フレーム1と2、フレーム2と3、フレーム3と4の連続性の評価値がそれぞれ70、80、70と高い値であるのに対し、フレーム4と5の連続性評価値は10と低い値になっている。従って、この場合、フレーム1から4までが連続性が高い1つのまとまりであると判断することができる。
【0038】
セグメントを作成する場合にフレーム間の連続性が高いか低いかを判断する基準として、予め連続性の評価値について閾値を設定し、閾値と評価値との比較により判断するようにしてもよい。図4の例では、閾値を30と設定しているため、セグメント生成部134は、評価値が閾値30未満であるフレーム4と5との間、及びフレーム8と9との間が変化が大きい(連続性が低い)と判断し、フレーム4と5との間、及びフレーム8と9との間で動画像を分割する。従って、この場合は、セグメントA、B及びCの3つのセグメントが作成される。
【0039】
(顔グループ作成部140)
次に、図5を参照して、顔グループ作成部140の詳細な構成についてさらに説明する。図5は、本実施形態にかかる映像解析装置100の顔グループ作成部140の概略構成を示すブロック図である。図5に示すように、顔グループ作成部140は、顔画像検出部141と、顔画像記憶部142と、グループ作成部143と、代表画像選択部144とにより構成される。
【0040】
顔画像検出部141は、各フレーム画像中から人物の顔を検出する。顔検出の方法としては、例えば、上述した特許文献2(特開2001−285787号公報)に記載されているような既知の顔検出技術を適用してもよい。検出された顔の画像は、顔画像記憶部142に記録される。
【0041】
グループ作成部143は、検出された顔と顔画像記憶部142に記録された顔との類似評価を行い、類似した顔が検出されるフレーム画像を同じグループ(顔グループ)とする。顔の類似評価には、例えば、上述した特許文献2(特開2001−285787号公報)に記載されているような既知の技術を適用してもよい。また、グループ作成部143は、例えば、類似した顔が連続して検出されることを判定条件として顔グループを作成するようにしてもよい。
【0042】
図6には、類似した顔が連続して検出されることを判定条件として顔グループを作成した場合の例を示している。図6の例では、10個のフレーム画像から6つの顔画像が検出されている。フレーム2、3及び4から検出された3つの顔と、次のフレーム5及び6から検出された2つの顔は、顔の類似性が低いため異なるグループとしてグループaとグループbとに分けられる。一方、最後のフレーム10から検出された顔は、グループaに含まれる顔画像の人物と同じ人物Xの顔であるが、連続して検出されていないため、フレーム10は別のグループcとなる。グループ作成の結果は、図6に示すように、各グループの画像に含まれる人物情報(画像に含まれる人物のID)とそのグループの最初と最後のフレーム番号とが記録される。
【0043】
また、1つのフレーム画像から複数の顔が検出される場合には、検出された顔の数だけグループ作成処理が繰り返される。この場合、検出された顔が同じ人物であれば同じ顔グループに分類され、違う顔であれば違うグループに分類される。例えば、1つのフレーム画像から人物Xの顔が2つ検出された場合は1つのグループに分類し、人物Xと人物Yの2人の人物が検出された場合は2つのグループに分類される。
【0044】
代表画像選択部144は、各グループの代表画像として、顔グループに含まれるフレーム画像のうち任意のフレーム画像を選択し、代表画像とフレーム番号とを記録する。代表画像の選択方法は、顔グループ内の最初のフレーム画像を代表画像としてもよいし、あるいは、含まれる顔画像の面積が最も大きいものを代表画像としてもよい。図7は、代表画像選択部144による代表画像の選択処理の例を示した図である。図7に示す例は、最初のフレーム画像を代表画像として選択する例であり、グループAに属するフレーム画像のうち最初のフレーム2が代表画像として選択されている。
【0045】
(解析情報作成部150)
次に、解析情報作成部150の詳細についてさらに説明する。解析情報作成部150は、セグメント作成部130によって作成されたセグメントと、顔グループ作成部140によるグループ化の結果とに基づいて解析情報を作成する。図8は、解析情報作成部150による解析情報の作成例を示したものである。解析情報には、各セグメントの開始フレームと終了フレームの番号、各人物の代表画像と、人物情報(人物のID等)が記録される。
【0046】
(再生部170)
次に、図9を参照して、再生部170の詳細についてさらに説明する。図9は、本実施形態にかかる映像解析装置100の再生部170の概略構成を示すブロック図である。図9に示すように、再生部170は、表示形式選択部171と、解析情報集計部172と、解析情報出力部173と、セグメント選択部174と、映像出力部175とにより構成される。
【0047】
表示形式選択部171は、利用者が解析情報の表示形式を選択するための機能部である。解析情報の表示形式には、例えば、時系列に従って表示する形式や、登場人物の属性(性別、年齢等)に従って表示する形式等が挙げられる。この登場人物の属性は、顔画像記憶部142に記憶された顔画像を用いて、下記の非特許文献4に記載される方法などを用いて取得することができる。
非特許文献4:瀧川えりな、細井聖、“顔画像による自動性別・年代推定”、OMRON TECHNICS、Vol.43、No.1、pp.37−41
【0048】
解析情報集計部172は、表示形式選択部171において選択された表示形式に合わせて解析情報を表示するために集計を行う。図10は、人物毎に表示する表示形式が選択された場合の、解析情報集計部172による解析情報の集計例を示したものである。図10の例では、人物毎に、その人物が含まれるセグメントとセグメントに含まれる代表画像とが解析情報として集計されている。例えば、人物Xは、セグメントA及びCに含まれているため、人物Xに関するセグメントとしてセグメントA及びCの情報(開始フレーム、終了フレーム)と、各セグメントの代表画像とが収集される。
【0049】
解析情報出力部173は、解析情報集計部172によって集計された情報を表示部180に出力する。例えば、解析情報集計部172において、図10に示した例のように人物毎の集計を行った場合、人物毎に集計されたセグメントの代表画像の一覧を表示したり、あるいは、人物の一覧を表示させ、その中で利用者によって選択された人物が登場するセグメントの代表画像を表示するようにしてもよい。
【0050】
セグメント選択部174は、解析情報出力部173によって表示部180に出力された解析情報を見て、利用者が見たいセグメントを選択するための機能部である。映像出力部175は、セグメント選択部174によって選択されたセグメントの映像を映像データ記憶部120より取得して表示部180に出力する。映像出力部175は、選択されたセグメントの解析情報から該当するセグメントの開始フレーム及び終了フレームの情報を取得し、映像データ記憶部120から該当するフレームの映像を取得して表示部180に出力する。
【0051】
以上、映像解析装置100の構成について説明した。なお、映像解析装置100を構成する映像取得部110、セグメント作成部130、顔グループ作成部140、解析情報作成部150及び再生部等の各機能部は、これらの各部の機能を実行するソフトウェアプログラムをサーバ装置120にインストールすることにより実現することも可能であるし、専用のハードウェアにより実現することも可能である。また、上記ソフトウェアプログラムは、コンピュータ読み取り可能な記憶媒体に記憶されたものを読み出すことにより実行されてもよいし、あるいは、ネットワーク等を介して映像解析装置100に提供されるものであってもよい。また、映像データ記憶部120及び解析情報記憶部160等の記憶部は、例えば、半導体メモリ、光ディスク、磁気ディスク等の各種の記憶媒体等により構成されてもよい。
【0052】
次に、図11を参照して、本実施形態にかかる映像解析装置100によって実行される映像解析処理について説明する。図11は、本実施形態にかかる映像解析装置100によって実行される映像解析処理の流れを示すフローチャートである。
【0053】
まず、ステップS200で、映像取得部110は、映像データ記憶部120から所定の映像データを取得する。この映像データは、デジタルレコーダ等によってテレビ映像などを録画したものや、ビデオカメラ等で撮影された映像等である。
【0054】
次いで、ステップS202〜S206において、セグメント作成部130は、取得された映像データを複数に分割してセグメントを作成する。また、ステップS208〜ステップS212において、顔グループ作成部140は、映像に含まれる顔画像をグループ化し、代表画像を選択する。ここで、ステップS202〜S206の処理と、ステップS208〜ステップS212の処理は、並行して実行されるようにしてもよく、あるいは、一方の処理が終了した後にもう一方の処理が行われるようにしてもよい。
【0055】
ステップS202〜S206の処理について説明する。まず、ステップS202で、セグメント作成部130の特徴量抽出部131は、映像取得部110から取得した各フレームの画像中の特徴量を抽出する。特徴量の抽出は、上述したように、非特許文献1〜3に記載されているような従来既知の方法を用いて行うことができる。
【0056】
次いで、ステップ204で、物体検出部133は、抽出された特徴量に基づいて、前後のフレーム画像に同じ物体が存在するか否かを検出する。次いで、ステップS206で、セグメント作成部130は、ステップS204での物体検出結果に基づいてフレーム間の連続性評価を行い、フレーム間の変化が少ないフレームが同じセグメントとなるようにセグメントを作成する。
【0057】
次に、S208〜ステップS212の処理について説明する。まず、ステップS208で、顔画像検出部141は、各フレーム画像中から人物の顔を検出する。顔検出の方法としては、例えば上述した特許文献2(特開2001−285787号公報)に記載されているような既知の顔検出技術を適用することができる。
【0058】
次いで、ステップS210で、グループ作成部143は、検出された顔と顔画像記憶部142に記録された顔との類似評価を行い、類似した顔が連続して検出されるフレーム画像を同じ顔グループとし、グループ作成結果として各顔グループの顔画像に含まれる人物情報(ID等)とその顔グループの最初と最後のフレーム番号とを記録する。
【0059】
次いで、ステップS212で、代表画像選択部144は、各顔グループの代表画像として、顔グループに含まれるフレーム画像のうち任意のフレーム画像を選択する。代表画像の選択方法は、顔グループ内の最初のフレーム画像を代表画像としてもよいし、含まれる顔画像の面積が最も大きいものを代表画像としてもよい。
【0060】
セグメント作成部130によるセグメント作成処理(ステップS202〜S206)及び顔グループ作成部140による顔グループ作成処理(S208〜ステップS212)が終了したら、ステップS214で、解析情報作成部150が解析情報を作成する。解析情報作成部150は、セグメント作成部130によって作成されたセグメントと、顔グループ作成部140によるグループ化の結果とに基づいて解析情報を作成する。作成された解析情報は、ステップS216で、解析情報作成部150によって解析情報記憶部160に格納される。
【0061】
次いで、ステップS218で、再生部170は、解析情報記憶部160に格納された解析情報を表示部180に表示し、映像データの再生を行う。図12は、ステップ218の再生部170による映像再生処理の流れをより詳細に示したフローチャートである。図12を参照すると、まず、ステップS220で、解析情報の表示形式が利用者によって選択される。ステップS222で、解析情報集計部172は、選択された表示形式(時系列に表示、人物毎に表示、等)に合わせて解析情報を集計する。
【0062】
次いで、ステップS224で、解析情報出力部173は、解析情報集計部172によって集計された情報を表示部180に出力する。ステップS226で、利用者は、ステップS224で表示部180に表示された解析情報を見て、閲覧したいセグメントを選択する。ステップS228で、映像出力部175は、選択されたセグメントの映像を映像データ記憶部120より取得して再生し、表示部180に出力する。
【0063】
以上のように、上述した第1の実施形態にかかる映像解析装置及び映像解析方法によれば、前後のフレーム画像に含まれる物体を認識することによって映像の連続性の評価が行われるため、従来の画像特徴のみを用いる方法を比較して、フレーム間の細かな画像の変動による影響を少なくすることができる。従って、意味的に連続した映像を別のセグメントとして分割してしまう可能性を低減することが可能となり、利用者にとって利便性の高い効果的なセグメント作成を行うことができる。
【0064】
また、映像の解析に際し、予め利用者が関心のある場所や人物を指定する必要がないので、利用者に余分な操作を求めることなく映像の意味に準じたセグメント作成を行うことが可能となる。
【0065】
(第2の実施形態)
次に、本発明の第2の実施形態にかかる映像解析装置について説明する。上述した第1の実施形態においては、フレーム画像全体から特徴量を抽出して物体を検出するように構成されていたが、以下で説明する第2の実施形態は、顔グループ作成部により顔を検出した位置からフレーム画像中に存在する人物の領域を検出し、検出された人物領域から特徴量の抽出を行うようにすることを特徴とする。
【0066】
まず、図13を参照して、本発明の第2の実施形態にかかる映像解析装置の構成について説明する。図13は、第2の実施形態にかかる映像解析装置300の概略構成を示すブロック図である。本実施形態にかかる映像解析装置300は、図1に示した第1の実施形態にかかる映像解析装置100と比較して、新たに人物領域作成部390を備えるようにした点が異なる。以下では、本実施形態に係る映像解析装置300の構成について、第1の実施形態にかかる映像解析装置100と異なる点について説明し、その他については重複説明を避けるため省略する。
【0067】
(人物領域作成部390)
図14は、人物領域作成部390、セグメント作成部330及び顔グループ作成部340の概略構成を示すブロック図である。セグメント作成部330及び顔グループ作成部340の構成については、第1の実施形態にかかる映像解析装置100のセグメント作成部130及び顔グループ作成部140の構成と同様であるので、相違点についてのみ説明する。人物領域作成部390は、図14に示すように、人物領域検出部391と、人物領域記憶部392とにより構成される。
【0068】
人物領域検出部391は、顔グループ作成部340の顔画像検出部341より、各フレーム画像から顔画像を検出した結果を受け取り、顔画像が検出された位置から人物が存在する領域(人物領域)を算出して人物領域記憶部392に記録する。人物領域記憶部392は、人物領域検出部391によって検出された、各フレーム画像中の人物領域を記録するための記憶媒体である。人物領域の算出方法は、例えば、顔が検出された位置の下方の一定領域を人物領域と推定することによって算出するようにしてもよい。
【0069】
また、セグメント作成部330の特徴量抽出部331は、人物領域記憶部392から人物領域の情報を取得し、人物領域の特徴量を抽出して特徴量記憶部332に格納する。物体検出部333は、特徴量記憶部332に記録されている人物領域の特徴量を用いて、第1の実施形態の物体検出部133と同様の方法により物体検出を行う。そして、人物領域の特徴量を用いた物体検出の結果を顔グループ作成部340のグループ作成部343に入力する。
【0070】
グループ作成部343は、顔画像検出部341による顔画像の検出結果と、物体検出部333による人物領域の物体検出の結果とを用いて顔グループを作成する。顔グループの作成方法は、第1の実施形態のグループ作成部143と同様の方法が用いられる。
【0071】
図15は、顔画像検出部341による顔画像の検出結果と、物体検出部333による人物領域の物体検出の結果とを示した図である。図15に示したフレーム画像のうち左から1番目と2番目のフレームでは、人物の顔がある程度正面に向いているため、顔を認識することができる。従って、人物領域検出部391は、左から1、2番目のフレームで検出された顔位置より、フレーム内の太枠で示された人物領域を作成する。
【0072】
一方、右側の2つのフレームでは、人物の顔が所定の角度以上横向きあるいは後ろ向きになっているため、顔画像検出部341が顔として認識することができない。この場合、物体検出部333は、2番目のフレームの人物領域が3番目のフレーム内のどこにあるか(左から3番目のフレーム内の太枠)を検出し、その検出結果を人物領域記憶部392に格納する。
【0073】
このように、本実施形態では、顔が検出された際に人物領域検出部391で人物領域を作成し、この人物領域の検出を物体検出部333で行うことにより、顔の見えない人物の登場を検知することができる。顔の検出に加えて人物領域の物体検出結果を用いることにより、グループ作成部343は、人物が登場するフレームをより正確に検出することができる。
【0074】
次に、図16を参照して、本実施形態にかかる映像解析装置300によって実行される映像解析処理について説明する。図16は、本実施形態にかかる映像解析装置300によって実行される映像解析処理の流れを示すフローチャートである。
【0075】
まず、ステップS400で、映像取得部310は、映像データ記憶部320から所定の映像データを取得し、取得されたデータをセグメント作成部330及び顔グループ作成部340に入力する。次いで、ステップS402で、顔グループ作成部340の顔画像検出部341は、映像の各フレーム画像中から人物の顔を検出する。顔検出の方法としては、上述した第1の実施形態と同様に、特許文献2(特開2001−285787号公報)に記載されているような既知の顔検出技術を適用することができる。
【0076】
次いで、ステップS404で、人物領域検出部391は、顔画像検出部341による顔画像の検出結果に基づいて、各フレーム画像中の人物が存在する領域(人物領域)を算出する。人物領域の算出方法は、例えば、顔が検出された位置の下方の一定領域を人物領域と推定することによって算出するようにしてもよい。
【0077】
次いで、ステップS406で、セグメント作成部330の特徴量抽出部331は、映像取得部310から取得した各フレームの画像中の特徴量を抽出する。ここで、特徴量抽出部331は、人物領域検出部391によって検出された人物領域の情報を人物領域記憶部392から取得し、人物領域の特徴量の抽出する。次いで、ステップ408で、物体検出部333は、抽出された特徴量に基づいて、前後のフレーム画像に同じ物体が存在するか否かを検出し、人物領域を検出した場合は、画像内で検出した場所を人物領域記憶部392に記録する。
【0078】
次いで、ステップS410で、セグメント生成部334は、ステップS408での物体検出結果に基づいてフレーム間の連続性評価を行い、フレーム間の変化が少ないフレームが同じセグメントとなるようにセグメントを作成する。また、ステップS412で、顔グループ作成部340のグループ作成部343は、ステップS402での顔画像の検出結果と、ステップS408での人物領域の物体検出の結果とを用いて顔グループを作成する。その後、ステップS414で、代表画像選択部344は、ステップS412で作成された各顔グループの代表画像として、顔グループに含まれるフレーム画像のうち任意のフレーム画像を選択する。
【0079】
なお、図16に示すように、ステップS410と、ステップS412及びS414とは、並行して実行されるようにしてもよく、あるいは、一方の処理が終了した後にもう一方の処理が行われるようにしてもよい。
【0080】
ステップS410及びステップS414の終了後、ステップS416で、解析情報作成部350が解析情報を作成する。ステップS416以降の処理は、上述した第1の実施形態のステップS214〜S218の処理と同様であるので、ここでは説明を省略する。
【0081】
以上のように、上述した第2の実施形態にかかる映像解析装置及び映像解析方法によれば、顔画像による顔グループ作成の際に、顔画像の検出結果に加えて、人物領域の物体検出結果を用いることにより、顔が他の物体で遮蔽されたり、顔が正面に向いていない場合等においても、画像中に人物が存在することを認識することができる。これにより、人物が登場するフレームをより正確に検出してグループ作成を行うことが可能となる。
【0082】
(第3の実施形態)
次に、本発明の第3の実施形態にかかる映像解析装置について説明する。上述した第1及び第2の実施形態においては、映像解析装置によって解析された結果から、利用者が閲覧したい映像のセグメントを選択するように構成されていたが、以下で説明する第3の実施形態は、利用者によって予め任意のフレーム画像を指定してもらうことにより、指定された画像と類似するフレーム画像を持つセグメントや、指定された画像中に登場する人物と同じ人物が登場するセグメントを抽出するようにしたことを特徴とする。
【0083】
まず、図17を参照して、本発明の第3の実施形態にかかる映像解析装置の構成について説明する。図17は、第3の実施形態にかかる映像解析装置500の概略構成を示すブロック図である。本実施形態にかかる映像解析装置500は、図13に示した第2の実施形態にかかる映像解析装置300と比較して、新たに画像データ記憶部610、検索画像入力部620、検索画像評価部630及び顔類似性評価部640を備えるようにした点が異なる。以下では、本実施形態に係る映像解析装置500の構成について、第1及び第2の実施形態にかかる映像解析装置100及び300と異なる点について説明し、その他については重複説明を避けるため省略する。
【0084】
画像データ記憶部610は、利用者が映像中から検索したい画像を指定する際の、検索キーとなる画像(検索画像)が格納される記憶媒体である。検索画像入力部620には、画像データ記憶部610に格納されている検索画像の中から、利用者によって指定された画像(指定画像)が入力される。検索画像入力部620は、指定画像を検索画像評価部630に入力する。検索画像評価部630は、検索画像と映像の各フレーム画像との類似性を評価する。顔類似性評価部640は、検索画像から検出された顔とフレーム画像から検出された顔との類似性を評価する。
【0085】
(検索画像評価部630)
次に、図18を参照して、検索画像評価部630の詳細についてさらに説明する。図18は、検索画像評価部630及びセグメント作成部530の概略構成を示すブロック図である。セグメント作成部530の構成については、第1及び第2の実施形態にかかる映像解析装置のセグメント作成部の構成と同様であるので、以下では検索画像評価部630と関連する点についてのみ説明する。検索画像評価部630は、図18に示すように、特徴量抽出部631と、類似性評価部632とにより構成される。
【0086】
特徴量抽出部631は、検索画像の特徴量を抽出する。特徴量の抽出は、第1の実施形態において説明したセグメント作成部130の特徴量抽出部131と同様の方法によって実現できる。類似性評価部632は、セグメント作成部530の特徴量抽出部531によって抽出された各フレーム画像の特徴量と、検索画像評価部630の特徴量抽出部631によって抽出された検索画像の特徴量とを比較し、両者の類似性を評価する。類似性の評価は、第1の実施形態において説明したセグメント作成部130の物体検出部133と同様の方法により、2つの画像に同じ物体が存在するか否かを検出し、連続性の評価値を算出するのと同様の方法によって類似性の評価値を算出することができる。
【0087】
(顔類似性評価部640)
次に、図19を参照して、顔類似性評価部640の詳細についてさらに説明する。図19は、顔類似性評価部640及び顔グループ作成部540の概略構成を示すブロック図である。顔グループ作成部540の構成については、第1及び第2の実施形態にかかる映像解析装置の顔グループ作成部の構成と同様であるので、以下では顔類似性評価部640と関連する点についてのみ説明する。顔類似性評価部640は、図19に示すように、検索顔画像検出部641と、検索顔画像類似性評価部642とにより構成される。
【0088】
検索顔画像検出部641は、検索画像から顔画像を検出する。顔画像の検出は、第1の実施形態において説明した顔グループ作成部140の顔画像検出部141と同様の方法によって実現することができる。検索顔画像類似性評価部642は、検索顔画像検出部641によって検出された検索画像中の顔画像と、フレーム画像中の顔画像との類似性を評価する。顔類似性の評価は、第1の実施形態において説明した顔グループ作成部140のグループ作成部143と同様の方法によって実現することができる。検索顔画像類似性評価部642は、類似性の評価の結果、検索画像中の顔画像と類似する顔が含まれるグループを判定する。
【0089】
図20は、検索画像評価部630及び顔類似性評価部640による評価結果を示した図である。検索画像評価部630の類似性評価部632は、各フレーム画像と検索画像との類似性評価を実行し、図20に示すフレーム類似性評価結果001を得る。図20の例では、フレーム番号1〜10までのフレーム画像のうち、フレーム番号1〜6までが検索画像と類似するフレームであると判断されている。一方、顔類似性評価部640の検索顔画像類似性評価部642は、フレーム画像から検出された顔画像と検索画像から検出された顔画像の類似性評価を実行し、図20に示す類似グループ検索結果002を得る。図20の例では、フレーム番号3〜6に登場する人物の顔と、フレーム番号8〜10に登場する人物の顔とが、いずれも検索画像中に登場する人物の顔と類似していると判断されている。
【0090】
次に、図21を参照して、本実施形態にかかる映像解析装置500によって実行される映像解析処理について説明する。図21は、本実施形態にかかる映像解析装置500によって実行される映像解析処理の流れを示すフローチャートである。
【0091】
まず、ステップS700で、利用者は、画像データ記憶部610に格納された画像データの中から検索キーとなる検索画像を選択し、検索画像入力部620に入力する。次いで、ステップS702で、検索画像評価部630の特徴量抽出部631は、検索画像の特徴量を抽出する。次いで、ステップS704で、顔類似性評価部640の検索顔画像検出部641は、検索画像から顔画像を検出する。
【0092】
続くステップS706〜S720の処理は、上述した第2の実施形態におけるステップS400〜S414の処理と同様であるので、重複説明を避けるためここでは説明を省略する。
【0093】
ステップS716、S720の後、ステップS722で、検索画像評価部630の類似性評価部632は、検索画像と各フレーム画像との類似性評価を行う。次いで、ステップS724で、顔類似性評価部640の検索顔画像類似性評価部642は、検索画像中の顔画像と各フレーム画像中の顔画像との類似性評価を行い、検索画像中の顔画像に類似する顔画像が含まれる顔グループを判定する。
【0094】
次いで、ステップS726で、解析情報作成部550が解析情報を作成する。上述した第1及び第2の実施形態にかかる解析情報作成部は、セグメント作成部によるセグメント作成結果と、顔グループ作成部による顔認識結果とに基づいて解析情報を作成するように構成されたが、本実施形態にかかる解析情報作成部550は、上記の2つに加えて、検索画像評価部630及び顔類似性評価部640による評価結果を用いて解析情報を作成する。
【0095】
図22は、本実施形態にかかる解析情報作成部550によって作成される解析情報の一例を示したものである。図22に示すように、本実施形態にかかる解析情報作成部550は、第1、第2の実施形態で作成されるのと同様の解析情報に加えて、検索画像評価部630によるフレーム類似性評価結果や、顔類似性評価部640による類似グループ検索結果を用いて解析情報を作成する。図22の例では、フレーム番号201〜230のフレームが利用者が選択した画像と類似すると判断されている。また、利用者が選択した画像に登場する人物を含むグループとして、フレーム番号280〜300のフレームを含むグループcと、フレーム番号100〜125のフレームを含むグループbとが検索されている。
【0096】
これらの結果に基づいて、解析情報作成部550は、利用者が選択した画像と類似するフレームを含むセグメントや、利用者が選択した画像に登場する人物を含むセグメントの情報を解析情報をして抽出する。図22の例の場合、利用者が選択した画像と類似するフレームを含むセグメントとしてセグメントBが抽出され、利用者が選択した画像に登場する人物を含むセグメントとして、セグメントA及びBが抽出される。
【0097】
ステップS728で、解析情報は解析情報記憶部160に格納され、ステップS730で、再生部570によって表示部180に表示される。利用者は、表示部180に表示された解析情報から閲覧したいセグメントを選択し、再生部570は、選択されたセグメントの映像を映像データ記憶部520より取得して再生し、表示部580に出力する。
【0098】
以上のように、上述した第3の実施形態にかかる映像解析装置及び映像解析方法によれば、第1及び第2の実施形態において作成された解析情報の中から、予め利用者によって選択された画像に関連する解析情報のみを抽出することができる。これにより、選択された画像と類似した映像を含むセグメントや、選択された画像に含まれる人物が登場するセグメントのみを利用者に提示することができ、利用者が関心を持つセグメントをより簡単に選択することができるようになる。
【0099】
以上、添付図面を参照しながら本発明の好適な実施形態について説明したが、本発明は係る例に限定されないことは言うまでもない。当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
【0100】
例えば、上記実施形態では、映像の解析と解析結果の表示とが同一の装置において行われるものとしたが、本発明はかかる例に限定されない。例えば、映像の解析を行う装置と、解析情報の表示及び映像の再生を行う装置とを物理的に分離して構成してもよい。例えば、映像の解析を行う解析装置がネットワークを介して利用者に解析情報を提供し、利用者は、解析情報及び映像を表示させる表示装置を用いて視聴したいセグメントを選択し、映像を視聴することができるようにしてもよい。
【0101】
また、上記第3の実施形態では、検索キーとなる画像は映像中のあるフレームの画像であるとして説明したが、本発明はかかる例に限定されない。例えば、任意の人物の画像や、任意の物体の画像が検索画像として入力されるようにしてもよい。これにより、利用者が関心を持っている人物や商品などが登場するセグメントを抽出することが可能となる。
【図面の簡単な説明】
【0102】
【図1】本発明の第1の実施形態にかかる映像解析装置の概略構成を示すブロック図である。
【図2】同実施形態にかかる映像解析装置のセグメント作成部の概略構成を示すブロック図である。
【図3】セグメント作成部による物体検出処理の例を示す図である。
【図4】セグメント作成部によるセグメント作成処理の例を示す図である。
【図5】同実施形態にかかる映像解析装置の顔グループ作成部の概略構成を示すブロック図である。
【図6】顔グループ作成部による顔画像に基づく顔グループ作成処理の例を示す図である。
【図7】顔グループ作成部による代表画像の選択処理の例を示す図である。
【図8】解析情報作成部による解析情報の作成例を示す図である。
【図9】同実施形態にかかる映像解析装置の再生部の概略構成を示すブロック図である。
【図10】再生部による解析情報の集計処理の例を示す図である。
【図11】同実施形態にかかる映像解析装置によって実行される映像解析処理の流れを示すフローチャートである。
【図12】再生部によって実行される映像再生処理の流れを示すフローチャートである。
【図13】本発明の第2の実施形態にかかる映像解析装置の概略構成を示すブロック図である。
【図14】同実施形態にかかる映像解析装置のセグメント作成部、人物領域作成部及び顔画像認識部の概略構成を示すブロック図である。
【図15】人物領域作成部による人物領域の検出結果の例を示す図である。
【図16】同実施形態にかかる映像解析装置によって実行される映像解析処理の流れを示すフローチャートである。
【図17】本発明の第3の実施形態にかかる映像解析装置の概略構成を示すブロック図である。
【図18】同実施形態にかかる映像解析装置の検索画像評価部及びセグメント作成部の概略構成を示すブロック図である。
【図19】同実施形態にかかる映像解析装置の顔グループ作成部及び顔類似性評価部の概略構成を示すブロック図である。
【図20】同実施形態にかかる映像解析装置の検索画像評価部及び顔類似性評価部による評価結果の一例を示した図である。
【図21】同実施形態にかかる映像解析装置によって実行される映像解析処理の流れを示すフローチャートである。
【図22】同実施形態にかかる映像解析装置の解析情報作成部によって作成される解析情報の一例を示した図である。
【符号の説明】
【0103】
100、300、500 映像解析装置
110、310、510 映像取得部
120、320、520 映像データ記憶部
130、330、530 セグメント作成部
131、331、531 特徴量抽出部
132、332、532 特徴量記憶部
133、333、533 物体検出部
134、334、534 セグメント生成部
140、340、540 顔グループ作成部
141、341、541 顔画像検出部
142、342、542 顔画像記憶部
143、343、543 グループ作成部
144、344、544 代表画像選択部
150、350、550 解析情報作成部
160、360、560 解析情報記憶部
170、370、570 再生部
171 表示形式選択部
172 解析情報集計部
173 解析情報出力部
174 セグメント選択部
175 映像出力部
180、380、580 表示部
390、590 人物領域作成部
391 人物領域検出部
392 人物領域記憶部
610 画像データ記憶部
620 検索画像入力部
630 検索画像評価部
631 特徴量抽出部
632 類似性評価部
640 顔類似性評価部
641 検索顔画像検出部
642 検索顔画像類似性評価部

【特許請求の範囲】
【請求項1】
時系列に配列された複数のフレーム画像からなる映像を解析する映像解析装置であって、
前記フレーム画像より抽出される局所形状に基づく特徴量を用いて、連続する2つのフレーム画像に同じ物体が存在するか否かを判断することによって、前記2つのフレーム画像の連続性の評価を行い、前記連続性の評価結果に基づいて前記映像を複数のセグメントに分割するセグメント作成部と、
前記フレーム画像から人物の顔画像を検出し、前記検出された顔画像の類似度に基づいて前記フレーム画像をグループ化する顔グループ作成部と、
前記セグメント作成部により作成された前記セグメントと前記顔グループ作成部による前記フレーム画像の分類結果に基づいて、前記セグメントの解析情報を作成する解析情報作成部と、
を備えることを特徴とする、映像解析装置。
【請求項2】
前記セグメント作成部は、
前記各フレーム画像の局所形状に基づく特徴量を抽出する特徴量抽出部と、
連続する前記2つのフレーム画像の前記特徴量を比較することによって、前記2つのフレーム画像中に同じ物体が含まれるか否かを検出する物体検出部と、
前記物体検出部による物体検出結果に基づいて、連続する前記2つのフレーム画像の連続性の評価値を計算し、前記評価値が所定の閾値より低い場合に前記2つのフレーム画像の間で映像を分割してセグメントを作成するセグメント生成部と、
を含むことを特徴とする、請求項1に記載の映像解析装置。
【請求項3】
前記顔グループ作成部は、
前記フレーム画像から前記顔画像を検出する顔画像検出部と、
前記顔画像検出部によって検出された顔画像を比較し、類似する顔画像が抽出された連続する複数のフレーム画像を1つの顔グループとするグループ作成部と、
前記グループ作成部によって作成された各顔グループのフレーム画像から1以上の代表画像を選択する代表画像選択部と、
を含むことを特徴とする、請求項1または2に記載の映像解析装置。
【請求項4】
前記解析情報作成部は、前記セグメントに含まれる前記顔グループの代表画像を前記セグメントの代表画像として、前記セグメントの解析情報を作成することを特徴とする、請求項1〜3に記載の映像解析装置。
【請求項5】
前記セグメントの解析情報を表示装置に出力する解析情報出力部と、
利用者によって選択された前記セグメントの映像を再生し、前記表示装置に出力する映像出力部をさらに含むことを特徴とする、請求項1〜4に記載の映像解析装置。
【請求項6】
前記解析情報出力部は、前記セグメントの時系列に従って前記解析情報を出力することを特徴とする、請求項5に記載の映像解析装置。
【請求項7】
前記解析情報出力部は、前記セグメントに含まれる前記顔グループに対応する顔画像に対応付けられる人物により前記セグメントを分類し、分類された結果に従って前記解析情報を出力することを特徴とする、請求項5または6に記載の映像解析装置。
【請求項8】
前記顔グループ作成部によって検出された顔画像の前記フレーム画像中の位置に基づいて、前記フレーム画像中の人物が存在する領域を計算する人物領域作成部をさらに備え、
前記セグメント作成部は、前記人物領域作成部によって計算された領域の特徴量を比較することによってセグメントを作成することを特徴とする、請求項1〜7に記載の映像解析装置。
【請求項9】
利用者によって選択された任意の検索画像が入力される検索画像入力部と、
前記検索画像と前記各フレーム画像との類似度を評価する検索画像評価部と、
前記検索画像から人物の顔画像を検出し、当該顔画像と前記各フレーム画像から検出された顔画像との類似度を評価する顔類似性評価部と、
をさらに備え、
前記解析情報作成部は、前記検索画像評価部による評価結果と前記顔類似性評価部による評価結果とに基づいて、前記解析情報の中から、前記検索画像に関連するセグメントの解析情報を抽出することを特徴とする、請求項1〜8に記載の映像解析装置。
【請求項10】
前記解析情報作成部は、前記検索画像評価部によって前記検索画像との類似度が高いと評価された前記フレーム画像が含まれる前記セグメントの解析情報を抽出することを特徴とする、請求項9に記載の映像解析装置。
【請求項11】
前記解析情報作成部は、前記顔類似性評価部によって前記検索画像から検出された顔画像との類似度が高いと評価された顔画像を含む前記フレーム画像が含まれる前記セグメントの解析情報を抽出することを特徴とする、請求項9または10に記載の映像解析装置。
【請求項12】
時系列に配列された複数のフレーム画像からなる映像を解析する映像解析方法であって、
前記フレーム画像より抽出される局所形状に基づく特徴量を用いて、連続する2つのフレーム画像に同じ物体が存在するか否かを判断することによって、前記2つのフレーム画像の連続性の評価を行い、前記連続性の評価結果に基づいて前記映像を複数のセグメントに分割するセグメント作成ステップと、
前記フレーム画像から人物の顔画像を検出し、前記検出された顔画像の類似度に基づいて前記フレーム画像をグループ化する顔グループ作成ステップと、
前記セグメント作成ステップにおいて作成された前記セグメントと、前記顔グループ作成ステップにおける前記フレーム画像の分類結果に基づいて、前記セグメントの解析情報を作成する解析情報作成ステップと、
を含むことを特徴とする、映像解析方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate


【公開番号】特開2009−123095(P2009−123095A)
【公開日】平成21年6月4日(2009.6.4)
【国際特許分類】
【出願番号】特願2007−298377(P2007−298377)
【出願日】平成19年11月16日(2007.11.16)
【出願人】(000000295)沖電気工業株式会社 (6,645)
【Fターム(参考)】