説明

類似映像出力方法、類似映像出力装置および類似映像出力プログラム

【課題】印象が類似する映像データを出力する。
【解決手段】類似映像出力装置1は、複数の映像データが記憶された映像データ記憶部12と、複数の映像データのそれぞれについて、当該映像データを分割した区間毎の構造的特徴の出現する時間を構造的特徴量として算出し、構造的特徴量に基づいて、映像データ間の構造的特徴類似度を算出して、構造的特徴類似度データを出力する構造的特徴類似度算出手段22と、構造的特徴類似度データに基づいて、映像データ記憶部12から、基準映像データに類似する映像データを抽出する類似映像決定手段24と、を備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、類似する映像データを出力する類似映像出力方法、類似映像出力装置および類似映像出力プログラムに関する。
【背景技術】
【0002】
昨今の情報処理装置の発達に伴い、映像データなどの電子コンテンツが膨大に増えている。例えば、IPTV(Internet Protocol TeleVision)や動画共有サイトにおいて、ユーザは、大量の映像データの中から、興味のある映像データを選択し、任意のタイミングでその選択した映像データを閲覧することが可能である。ユーザは例えば、所望の映像データのキーワードやジャンルを指定することによって、指定された条件に合致する映像データを閲覧することができる。このように、ユーザが所望する映像データのイメージが明確である場合、検索条件を指定し、検索された映像データから所望の映像データを探すことは容易である。
【0003】
しかし、ユーザが所望する映像のイメージが明確でない場合、ユーザは、適切な検索条件を指定することができない。従ってユーザは、検索条件を指定する方法では、所望の映像を探し出すことが困難となってしまう。また、所望の映像データを閲覧する都度、検索条件を指定する操作が必要になるため、ユーザが煩わしさを感じる場合もある。
【0004】
このような問題を解決するためのアプローチの一つとして、映像推薦技術がある。この映像推薦とは、ユーザがある映像に対して閲覧や評価をした際に、関連する別の映像を提示することにより、ユーザの映像発見を容易にするための手法である。
【0005】
この映像推薦のための手法は、主に、協調フィルタリングと内容ベースフィルタリングに大別される。
【0006】
協調フィルタリングは、映像に対するユーザの閲覧履歴や評価履歴を利用することにより、ユーザもしくは映像同士が似ているかを分析し、推薦する手法である。例えば、ユーザからの評価値のつけられ方が似ているアイテムを推薦する方法がある(例えば、非特許文献1参照)。
【0007】
この協調フィルタリングの推薦手法では、非特許文献1に挙げた技術のように、映像間の関連を分析するために視聴履歴を利用する。非特許文献1に記載の技術は、視聴や評価をした映像が共通するユーザを嗜好が似ているとみなし、嗜好が似たユーザが視聴した映像のうち、未視聴の映像を推薦する。
【0008】
しかし、協調フィルタリングでは、ユーザの履歴を利用して推薦するという特性上、履歴の量が少ない場合には、視聴履歴の量が少ないため、映像を視聴したユーザが似ているかどうかを正確に分析できず、効果的な推薦を行うことができないという問題があった。例えば、サービスをあまり利用していない、もしくは、サービスに登録したばかりのユーザに推薦を行いたい場合や、埋もれていたり、サービスに新たに追加された映像を推薦の対象にしたい場合には、効果的な推薦を行うことができなかった。
【0009】
協調フィルタリングは、多くの視聴履歴を必要とするのに対し、内容ベースフィルタリングは、履歴の量が少ない場合でも、映像に付与されたメタデータや映像から抽出された映像特徴の情報に基づいて推薦を行うことができる。内容ベースフィルタリングによれば、サービスに登録したばかりの新規ユーザや埋もれている映像を対象にした推薦など、利用可能な履歴の量が少ない場合にも、映像を推薦することができる。これにより、サービスをより多くのユーザに利用してもらい、より多くの映像を視聴してもらうことができる。
【0010】
内容ベースフィルタリングに関する研究としては、ユーザが高く評価したコンテンツに付与されている属性の出現頻度を計測し、出現頻度の高い属性が付与されているコンテンツを推薦する手法(特許文献1)がある。また、ユーザや映像に付与されたメタデータの情報を利用せず、映像特徴の分析に基づいて推薦する手法(例えば、非特許文献2)もある。
【0011】
非特許文献2に挙げた技術は、映像の見た目と音の情報に基づいて映像の類似度を算出する。見た目の情報としては、色ヒストグラム、動きの激しさ、1秒あたりの平均ショット数を利用し、音の情報としては、音のテンポの平均値と分散を利用する。
【0012】
内容ベースフィルタリングの推薦手法では、映像と内容やジャンルが共通した映像を推薦することが一般的である。
【先行技術文献】
【特許文献】
【0013】
【特許文献1】特開2009−205418号公報
【非特許文献】
【0014】
【非特許文献1】B. Sarwar, G. Karypis, J. Konstan, and J. Riedl, “Item-Based Collaborative Filtering Recommendation Algorithms,” In Proceedings of the 10th international conference on World Wide Web, 2001.
【非特許文献2】B. Yang, T. Mei, X.-S. Hua, L. Yang, S.-Q. Yang and M. Li. Online Video Recommendation Based on Multimodal Fusion and Relevance Feedback. In Proc. ACM International Conference on Image and Video Retrieval (CIVR), pp. 73-80, 2007.
【発明の概要】
【発明が解決しようとする課題】
【0015】
しかし、映像を推薦する際、内容やジャンルが共通した映像を推薦するだけではなく、視聴者に与える印象が似ている映像を推薦することも重要である。例えば、明るい雰囲気の映像を視聴したユーザには、暗い雰囲気の映像ではなく、明るい雰囲気の映像を推薦した方が、ユーザが視聴する可能性が高い。
【0016】
内容ベースフィルタリングにおいて、映像間の関連を分析するための方法として、映像に付されたメタデータを利用する方法と、映像特徴を解析する方法がある。
【0017】
特許文献1の手法では、メタデータ中の属性やキーワードに基づいて、推薦する映像を決定する。そのため、メタデータ中に映像の印象に関する属性やキーワードが存在しない場合や、メタデータが全く付与されていない場合には、印象が似ている映像の推薦を行うことができなかった。
【0018】
また、非特許文献2に開示された映像間の関連を分析するために映像特徴を解析する技術では、映像全体を解析する。従って、視聴者の印象に残らないようなあまり重要でないシーンも類似度算出の対象となり、重要でないシーンの特徴は似ていても視聴者の映像に対する印象は似ていない映像を推薦してしまうという問題があった。また、この技術は、各特徴について、映像全体における平均値もしくは分散を類似度算出に利用するため、映像の前半に特徴が多く現れるといった、映像の時間軸に関する情報を比較することができないという問題があった。そのため、印象が似ている映像を、適切に推薦することができなかった。
【0019】
従って本発明の目的は、印象が類似する映像データを出力する類似映像出力方法、類似映像出力装置および類似映像出力プログラムを提供することである。
【課題を解決するための手段】
【0020】
上記課題を解決するため、本発明の第1の特徴は、類似する映像データを出力する類似映像出力方法に関する。すなわち本発明の第1の特徴に係る類似映像出力方法は、映像データ記憶部に記憶された複数の映像データのそれぞれについて、当該映像データを分割した区間毎の構造的特徴の出現する時間を構造的特徴量として算出し、構造的特徴量に基づいて、映像データ間の構造的特徴類似度を算出して、構造的特徴類似度データを出力する構造的特徴類似度算出ステップと、構造的特徴類似度データに基づいて、映像データ記憶部から、基準映像データに類似する映像データを抽出する類似映像決定ステップと、を備える。
【0021】
ここで、構造的特徴は、区間における色、動き、音響特徴、カット割り、音楽区間、発話区間およびテロップ区間のうち、いずれか一つ以上である。
【0022】
また、複数の映像データのそれぞれについて、当該映像データに含まれる重要シーンの特徴量を重要シーン特徴量として算出し、重要シーン特徴量に基づいて、映像データ間の重要シーン特徴類似度を算出して、重要シーン特徴類似度データを出力する重要シーン特徴類似度算出ステップをさらに備えても良い。この場合、類似映像決定ステップは、構造的特徴類似度データおよび重要シーン特徴類似度データに基づいて、映像データ記憶部から、基準映像データに類似する映像データを抽出する。
【0023】
ここで、重要シーン特徴は、重要シーンの色、動き、音響特徴のいずれか一つ以上である。
【0024】
本発明の第2の特徴は、類似する映像データを出力する類似映像出力方法に関する。本発明の第2の特徴に係る類似映像出力方法は、映像データ記憶部に記憶された複数の映像データのそれぞれについて、当該映像データに含まれる重要シーンの特徴量を重要シーン特徴量として算出し、重要シーン特徴量に基づいて、映像データ間の重要シーン特徴類似度を算出して、重要シーン特徴類似度データを出力する重要シーン特徴類似度算出ステップと、重要シーン特徴類似度データに基づいて、映像データ記憶部から、基準映像データに類似する映像データを抽出する類似映像決定ステップと、を備える。
【0025】
本発明の第3の特徴は、類似する映像データを出力する類似映像出力装置に関する。本発明の第3の特徴に係る類似映像出力装置は、複数の映像データが記憶された映像データ記憶部と、複数の映像データのそれぞれについて、当該映像データを分割した区間毎の構造的特徴の出現する時間を構造的特徴量として算出し、構造的特徴量に基づいて、映像データ間の構造的特徴類似度を算出して、構造的特徴類似度データを出力する構造的特徴類似度算出手段と、構造的特徴類似度データに基づいて、映像データ記憶部から、基準映像データに類似する映像データを抽出する類似映像決定手段と、を備える。
【0026】
ここで、構造的特徴は、区間における色、動き、音響特徴、カット割り、音楽区間、発話区間およびテロップ区間のうち、いずれか一つ以上である。
【0027】
また、複数の映像データのそれぞれについて、当該映像データに含まれる重要シーンの特徴量を重要シーン特徴量として算出し、重要シーン特徴量に基づいて、映像データ間の重要シーン特徴類似度を算出して、重要シーン特徴類似度データを出力する重要シーン特徴類似度算出手段をさらに備えても良い。この場合、類似映像決定手段は、構造的特徴類似度データおよび重要シーン特徴類似度データに基づいて、映像データ記憶部から、基準映像データに類似する映像データを抽出する。
【0028】
ここで、重要シーン特徴は、重要シーンの色、動き、音響特徴のいずれか一つ以上である。
【0029】
本発明の第4の特徴は、類似する映像データを出力する類似映像出力装置に関する。本発明の第4の特徴に係る類似映像出力装置は、複数の映像データが記憶された映像データ記憶部と、複数の映像データのそれぞれについて、当該映像データに含まれる重要シーンの特徴量を重要シーン特徴量として算出し、重要シーン特徴量に基づいて、映像データ間の重要シーン特徴類似度を算出して、重要シーン特徴類似度データを出力する重要シーン特徴類似度算出手段と、重要シーン特徴類似度データに基づいて、映像データ記憶部から、基準映像データに類似する映像データを抽出する類似映像決定手段と、を備える。
【0030】
本発明の第5の特徴は、コンピュータに、本発明の第1の特徴または第2の特徴に係る類似映像出力方法のステップを実行させるための類似映像出力プログラムである。
【発明の効果】
【0031】
本発明によれば、印象が類似する映像データを出力する類似映像出力方法、類似映像出力装置および類似映像出力プログラムを提供することができる。
【図面の簡単な説明】
【0032】
【図1】図1は、本発明の実施の形態に係る類似映像出力方法を説明するフローチャートである。
【図2】図2は、本発明の実施の形態に係る類似映像出力装置の機能ブロック図である。
【図3】図3は、本発明の実施の形態に係る構造的特徴量データのデータ構造とデータの一例を説明する図である。
【図4】図4は、本発明の実施の形態に係る構造的特徴類似度データのデータ構造とデータの一例を説明する図である。
【図5】図5は、本発明の実施の形態に係る重要シーン特徴量データのデータ構造とデータの一例を説明する図である。
【図6】図6は、本発明の実施の形態に係る重要シーン特徴類似度データのデータ構造とデータの一例を説明する図である。
【図7】図7は、本発明の実施の形態に係る類似度データのデータ構造とデータの一例を説明する図である。
【図8】図8は、本発明の実施の形態に係る映像管理データのデータ構造とデータの一例を説明する図である。
【図9】図9は、本発明の実施の形態に係る構造的特徴類似度算出処理を説明するフローチャートである。
【図10】図10は、本発明の実施の形態に係る構造的特徴類似度算出処理を説明する図である。
【図11】図11は、本発明の実施の形態に係る重要シーン特徴類似度算出処理を説明するフローチャートである。
【図12】図11は、本発明の実施の形態に係る重要シーン特徴類似度算出処理を説明する図である。
【図13】図13は、本発明の実施の形態に係る類似映像決定処理を説明するフローチャートである。
【発明を実施するための形態】
【0033】
次に、図面を参照して、本発明の実施の形態を説明する。以下の図面の記載において、同一又は類似の部分には同一又は類似の符号を付している。
【0034】
(実施の形態)
本発明の実施の形態に係る類似映像出力方法は、印象が類似する映像データを出力する。
【0035】
実施の形態に係る類似映像出力方法は、映像特徴量を分析して、映像の構造的な特徴が似ているかどうか、もしくは、映像の重要シーンの特徴が似ているかどうかに基づいて、複数の推薦対象の映像データから、印象が類似する映像データを、ユーザに推薦する映像データとして出力する。本発明の実施の形態においては、構造的特徴類似度および重要シーン特徴類似度の両方に基づいて、類似する映像データを算出する場合を説明するが、このいずれかのみでも構わない。ユーザが基準映像データの情報を入力すると、類似映像出力方法は、この基準映像データに類似する映像データを、ユーザに推薦する映像データとして出力する。ユーザに出力する推薦する映像データは、一つでも良いし複数でも良い。実施の形態において、推薦する対象をユーザと表記するが、このユーザは一般ユーザであっても良いし、実施の形態に係る類似映像出力方法を利用するシステムであっても良い。
【0036】
図1を参照して、実施の形態に係る類似映像出力方法の処理の概要を説明する。まず、類似映像出力方法は、ステップS1において基準映像データが入力されると、ステップS2に進む。
【0037】
ステップS2において、構造的類似度算出処理が実行される。構造的類似度算出処理において、映像データを分割した各区間毎の構造的特徴の出現する時間を構造的特徴量として算出し、構造的特徴量に基づいて、映像データ間の構造的特徴類似度が算出される。ここで、構造的特徴は、映像データの区間における色、動き、音響特徴、カット割り、音楽区間、発話区間およびテロップ区間などである。映像を時間順に見ていったとき、ショットの切り替わった時点をカット位置といい、ショットとは、連続して撮影された一つの場面である。
【0038】
ステップS3において、映像類似度算出処理が実行される。映像類似度算出処理において、映像データに含まれる重要シーンの特徴量を重要シーン特徴量として算出し、重要シーン特徴量に基づいて、映像データ間の重要シーン特徴類似度が算出される。ここで重要シーン特徴は、重要シーンの色、動き、音響特徴のいずれか一つ以上である。
【0039】
ステップS4において類似映像データが決定される。ここでは、ステップS2で算出された構造的特徴類似度、およびステップS3で算出された重要シーン特徴類似度の少なくともいずれかの類似度から算出された映像データ間の類似度に基づいて、基準映像データに類似する映像データが特定される。
【0040】
ステップS5において、ステップS4で特定された類似する映像データの情報が出力される。例えば、類似映像出力装置1は、特定された類似する映像データのタイトル、説明、推薦スコアなどのリストを、出力する。
【0041】
(類似映像出力装置)
図1を参照して説明した実施の形態に係る類似映像出力方法は、図2に示す類似映像出力装置1によって実現される。類似映像出力装置1は、記憶装置10、中央処理制御装置20および表示装置30を備える一般的なコンピュータである。類似映像出力装置1は、所定の処理を実行するための類似映像出力プログラムが、一般的なコンピュータにインストールされることにより実装される。この類似映像出力装置1の各構成要素は、サーバ装置のAPI(Application Program Interface)などであって、クライアント端末がこのAPI通じて映像情報を提供するためのプログラムにより実現されても良い。
【0042】
記憶装置10は、基準映像データ記憶部11、映像データ記憶部12、構造的特徴量データ記憶部13、構造的特徴類似度データ記憶部14、重要シーン特徴量データ記憶部15、重要シーン特徴類似度データ記憶部16、類似度データ記憶部17、類似映像リストデータ記憶部18および映像管理データ記憶部19が記憶される。また記憶装置10には、類似映像出力プログラムも記憶される。
【0043】
基準映像データ記憶部11は、記憶装置10のうち、基準映像データ11aが記憶された記憶領域である。類似映像出力装置1は、基準映像データ11aに印象が類似する映像データを出力する。基準映像データ11aは、映像データそのものであっても良いし、例えば、後述する映像データ記憶部12に記憶された映像データの識別子であっても良い。
【0044】
映像データ記憶部12は、記憶装置10のうち、複数の映像データ12a、12b…が記憶された記憶領域である。
【0045】
構造的特徴量データ記憶部13は、記憶装置10のうち、構造的特徴量データ13aが記憶された記憶領域である。構造的特徴量データ13aは、構造的特徴類似度算出手段22によって生成され、参照される。
【0046】
構造的特徴量データ13aは、図3に示すように、映像識別子および映像中の区分識別子と、その映像および区分における構造的特徴識別子および構造的特徴量とを対応づけたデータである。ここで、構造的特徴識別子は、映像データの区間における色、動き、音響特徴、カット割り、音楽区間、発話区間およびテロップ区間などの、本発明の構造的特徴を模式的に示したものである。図3に示す例において、構造的特徴識別子”FEA001”が色の構造的特徴を示している場合、映像識別子”MOV001”の区分識別子”DIV001”で識別される映像データの区分において、色の構造的特徴が、”(0.0001,0.0002,・・・・)”のベクトルであることを示している。類似映像出力装置1は、これらの構造的特徴識別子と、構造的特徴の名称と、を対応づけたデータを記憶装置10に記憶しても良い。
【0047】
構造的特徴類似度データ記憶部14は、記憶装置10のうち、構造的特徴類似度データ14aが記憶された記憶領域である。構造的特徴類似度データ14aは、任意の映像データ間の構造的特徴類似度を記憶する。構造的特徴類似度データ14aは、構造的特徴類似度算出手段22によって生成され、類似映像決定手段24によって参照される。
【0048】
構造的特徴類似度データ14aは、図4に示すように、第1の映像識別子と、第2の映像識別子と、これら第1および第2の映像識別子で特定される映像データ間の構造的特徴類似度と、が対応づけられたデータである。構造的特徴類似度は、図3を参照して説明した構造的特徴量データ13aから算出される。
【0049】
重要シーン特徴量データ記憶部15は、記憶装置10のうち、重要シーン特徴量データ15aが記憶された記憶領域である。重要シーン特徴量データ15aは、重要シーン特徴類似度算出手段23によって生成され、参照される。
【0050】
重要シーン特徴量データ15aは、図5に示すように、映像識別子および映像中の重要シーン識別子と、その映像および重要シーンにおける重要シーン特徴識別子および重要シーン特徴量とを対応づけたデータである。ここで、重要シーン特徴識別子は、重要シーンの色、動き、音響特徴などの重要シーン特徴の識別子である。例えば、重要シーンの色の特徴としてL*a*b*ヒストグラムが、重要シーンの動きの特徴としてオプティカルフローが、考えられる。類似映像出力装置1は、これらの重要シーン特徴識別子と、重要シーン特徴の名称と、を対応づけたデータを記憶装置10に記憶しても良い。
【0051】
重要シーン特徴類似度データ記憶部16は、記憶装置10のうち、重要シーン特徴類似度データ16aが記憶された記憶領域である。重要シーン特徴類似度データ16aは、任意の映像データ間の重要シーン特徴類似度を記憶する。重要シーン特徴類似度データ16aは、重要シーン特徴類似度算出手段23よって生成され、類似映像決定手段24によって参照される。
【0052】
重要シーン特徴類似度データ16aは、図6に示すように、第1の映像識別子と、第2の映像識別子と、これら第1および第2の映像識別子で特定される映像データ間の重要シーン特徴類似度と、が対応づけられたデータである。重要シーン特徴類似度は、図5を参照して説明した重要シーン特徴量データ15aから算出される。
【0053】
類似度データ記憶部17は、記憶装置10のうち、類似度データ17aが記憶された記憶領域である。類似度データ記憶部17は、類似映像決定手段24によって生成され、参照される。
【0054】
類似度データ17aは、第1の映像識別子と、第2の映像識別子と、これら第1および第2の映像識別子で特定される映像データ間の類似度と、類似度に対応する推薦スコアが対応づけられたデータである。映像データ間の類似度は、図4を参照して説明した構造的特徴類似度データ14aの構造的特徴類似度と、図6を参照して説明した重要シーン特徴類似度データ16aの重要シーン特徴類似度と、に基づいて算出される。図7に示す例では、映像データ間の類似度は、0から1の値を採る。推薦スコアは、類似度に基づいて算出され、図7に示す例では、0から100の値を採る。実施の形態において、類似度および推薦スコアは高いほど映像データが類似していることを示し、類似映像データとして推薦され易いことを示している。
【0055】
類似映像リストデータ記憶部18は、記憶装置10のうち、類似映像リストデータ18aが記憶された記憶領域である。類似映像リストデータ18aは、類似映像決定手段24によって出力され、類似映像情報出力手段25によって参照される。
【0056】
類似映像リストデータ18aは、基準映像データ11aに類似する映像として、ユーザに推薦する映像データの情報である。類似映像リストデータ18aは、推薦する映像データの識別子、タイトル、説明、推薦スコアなどが対応づけられたデータである。
【0057】
映像管理データ記憶部19は、記憶装置10のうち映像管理データ19aが記憶された記憶領域である。映像管理データ19aは、図8に示すように、映像識別子、映像名称およびその映像データの説明が対応づけられたデータである。映像管理データ19aは、ユーザに推薦する映像データの情報を表示するために参照される。
【0058】
図2に示すように、類似映像出力装置1の中央処理制御装置20は、基準映像データ取得手段21、構造的特徴類似度算出手段22、重要シーン特徴類似度算出手段23、類似映像決定手段24および類似映像情報出力手段25を備える。
【0059】
基準映像データ取得手段21は、基準映像データ11aを取得し、基準映像データ記憶部11に記憶する。類似映像出力装置1は、この基準映像データ11aに類似する映像データを検索する。基準映像データ11aは、映像データ記憶部12に記憶された映像データの識別子であっても良い。
【0060】
基準映像データ11aとして、映像データ記憶部12に記憶されていない映像データが入力された場合、入力された基準映像データ11aについて、後述する構造的特徴類似度算出手段22において、構造的特徴量が算出され、基準映像データ11aと、映像データ記憶部12の各映像データとの構造的特徴類似度が算出される。同様に、入力された基準映像データ11aについて、後述する重要シーン特徴類似度算出手段23において、重要シーン特徴量が算出され、基準映像データ11aと、映像データ記憶部12の各映像データとの重要シーン特徴類似度が算出される。さらに後述する類似映像決定手段24は、基準映像データ11aと、映像データ記憶部12の各映像データとの構造的特徴類似度と、基準映像データ11aと、映像データ記憶部12の各映像データとの重要シーン特徴類似度と、から基準映像データ11aと、映像データ記憶部12の各映像データとの類似度および推薦スコアを算出して、基準映像データ11aに類似する映像データの情報を出力する。
【0061】
本発明の実施の形態においては、基準映像データ11aとして、映像データ記憶部12に記憶された映像データの識別子が指定された場合を説明する。また、後述する構造的特徴類似度算出手段22、重要シーン特徴類似度算出手段23および類似映像決定手段24において、映像データ記憶部12に記憶された全ての映像データ間の類似度等を算出する場合について説明する。
【0062】
構造的特徴類似度算出手段22は、構造的特徴解析手段221および類似度算出手段222を備える。
【0063】
構造的特徴解析手段221は、映像データ記憶部12に記憶された複数の映像データのそれぞれについて、構造的特徴量を算出する。構造的特徴解析手段221は、例えば時間の長さが均等になるように、映像データを複数の区間に分割し、各区間毎の構造的特徴の出現する時間を構造的特徴量として算出する。ここで構造的特徴解析手段221は、構造的特徴量として、色、動き、音響特徴、カット割り、音楽区間、発話区間およびテロップ区間の各構造的特徴の出現する時間を、各映像データおよび各区間について算出する。構造的特徴解析手段221は、映像識別子と、映像データ中の区間の識別子と、構造的特徴の識別子をキーとして、構造的特徴量を対応づけたレコードを、構造的特徴量データ13aに挿入する。
【0064】
類似度算出手段222は、構造的特徴量データ13aの構造的特徴量に基づいて、映像データ間の構造的特徴類似度を算出して、構造的特徴類似度データ14aを出力する。ここで類似度算出手段222は、各映像識別子について、この映像識別子関連づけられる複数の構造的特徴量を要素に持つ特徴ベクトルを算出する。類似度算出手段222は、映像データ間の類似度として、この特徴ベクトルの類似度を算出する。類似度算出手段222は、第1の映像識別子と、第2の映像識別子と、この第1の映像識別子の映像データとこの第2の映像識別子の映像データとの構造的特徴類似度と、を対応づけたレコードを、構造的特徴類似度データ14aに挿入する。
【0065】
図9を参照して、構造的特徴類似度算出手段22による構造的特徴類似度算出処理を説明する。
【0066】
まず、映像データ記憶部12に記憶された各映像データについて、ステップS101ないしステップS103の処理を繰り返す。ステップS101において構造的特徴類似度算出手段22は、映像データを時間が均等となる複数の区分に分割する。
【0067】
この複数の区間のそれぞれについて、ステップS102およびステップS103の処理を繰り返す。構造的特徴類似度算出手段22は、各区間について、構造的特徴量を算出する。このとき構造的特徴類似度算出手段22は、各区間における色、動き、音響特徴、カット割り、音楽区間、発話区間およびテロップ区間の時間の長さを、構造的特徴量として算出し、ステップS103において、構造的特徴量データ13aに記録する。全ての区間について、ステップS102ないしステップS103の処理が終了すると、次の映像データについて、ステップS101ないしステップS103の処理を続ける。
【0068】
全ての映像データについてステップS101ないしステップS103の処理が終了すると、構造的特徴類似度算出手段22は、ステップS104ないしステップS107において、各映像データ間の構造的特徴類似度を算出する。まずステップS104において構造的特徴類似度算出手段22は、任意の第1の映像データについて、構造的特徴量データ13aから各区間の構造的特徴量を取得する。ステップS105において構造的特徴類似度算出手段22は、第2の映像データについて、構造的特徴量データ13aから各区間の構造的特徴量を取得する。
【0069】
ステップS106において構造的特徴類似度算出手段22は、ステップS104で取得した第1の映像データの構造的特徴量と、ステップS105で取得した第2の映像データの構造的特徴量から、第1の映像データと第2の映像データとの類似度を算出する。さらにステップS107において構造的特徴類似度算出手段22は、第1の映像データの識別子と、第2の映像データの識別子と、ステップS106で算出した構造的特徴量に基づく構造的特徴類似度とを対応づけて、構造的特徴類似度データ14aに記録する。
【0070】
ここで、構造的特徴類似度算出手段22の処理を詳述する。本発明の実施の形態において、構造的特徴とは、映像データのカット割り、音楽区間、発話区間、テロップ区間などである。本発明の実施の形態において、これらの構造的特徴がそれぞれ映像データに現れる時間に基づいて、映像データの構造的特徴量が算出される。例えば、音楽区間の構造的特徴量とは、図10(a)に示すように、映像データにおける音楽区間の時間の長さや、音楽区間の位置の情報である。本発明の実施の形態において、このような構造的特徴の類似する映像データを推薦することができる。
【0071】
構造的特徴の抽出方法として、既存の処理方法を利用することができる。例えば、映像データからカット位置の検出方法として、特許第2869398号公報に記載の方法などが考えられる。音楽区間の抽出方法として、特許第4572218号公報に記載の方法などが考えられる。発話区間の抽出方法として、特許第3105465号公報に記載の方法などが考えられる。テロップ区間の抽出方法として、特許第3479592号公報に記載の方法などが考えられる。
【0072】
構造的特徴類似度算出手段22は、図10(b)に示すように、映像をいくつかの区間に分割し、それぞれの区間における構造的特徴量を分析し、特徴ベクトルを作成する。構造的特徴類似度算出手段22は、例えば、映像を時間が均等になるようにいくつかの区間に分割する。また、構造的特徴類似度算出手段22は、それぞれの区間の長さに対する構造的特徴が出現する区間の長さの割合を数値で表し、それらを要素とする特徴ベクトルを作成する。ここで、特徴量の絶対値ではなく、増減が重要である場合、構造的特徴類似度算出手段22は、特徴ベクトルを正規化してもよい。
【0073】
ここで、映像データAの各区間の構造的特徴が出現する区間の長さの割合を要素とする特徴ベクトルをvとし、映像データBの各区間の構造的特徴が出現する区間の長さの割合を要素とする特徴ベクトルをvとする場合を考える。構造的特徴類似度算出手段22は、この特徴ベクトルvおよび特徴ベクトルvの類似度を算出することにより、特徴ベクトルvおよび特徴ベクトルvの類似度S(v,v)を算出する。
【0074】
ここで構造的特徴の特徴ベクトルの類似度の算出において、任意の尺度が利用される。例えば、特徴ベクトルの類似度尺度としてコサイン類似度を利用すると、S(v,v)は式(1)で与えられる。
【数1】

【0075】
ここで、vは、vのi次元目の値を示し、vは、vのi次元目の値を示す。nは、特徴ベクトルの次元数である。
【0076】
ここで、構造的特徴の抽出方法や使用する構造的特徴量が、N(>0)個存在する場合、構造的特徴類似度算出手段22は、それぞれについて、映像データAと映像データBとの類似度S(v,v)を求める。構造的特徴類似度算出手段22は、それぞれについて求められたS(v,v)に基づいて、構造的特徴に基づく類似度SABを、類似度SAB={SA,B|i=1〜N}とする。
【0077】
構造的特徴類似度算出手段22は、このように算出された類似度SABを、映像データAの識別子および映像データBの識別子に関連づけたレコードを生成し、構造的特徴類似度データ14aに挿入して記憶する。
【0078】
次に、重要シーン特徴類似度算出手段23を説明する。重要シーン特徴類似度算出手段23は、重要シーン抽出手段231、映像特徴解析手段232および類似度算出手段233を備える。
【0079】
重要シーン抽出手段231は、映像データ記憶部12に記憶された複数の映像データのそれぞれから、重要シーンを抽出する。重要シーンの抽出方法としては、ダイジェスト作成方法など既存の処理方法を用いることができる。本発明の実施の形態においては、一つの映像データから複数の重要シーンが抽出されても良い。
【0080】
映像特徴解析手段232は、映像データ記憶部12に記憶された複数の映像データのそれぞれの重要シーンについて、当該映像データに含まれる重要シーンの特徴量を重要シーン特徴量として算出する。ここで、映像特徴解析手段232は、重要シーン特徴量として、重要シーンの色、動き、音響特徴のいずれか一つ以上を、各映像データの各重要シーンについて算出する。映像特徴解析手段232は、各重要シーンの中間点におけるフレーム画像に基づいて、各重要シーン特徴量を算出しても良い。例えば映像特徴解析手段232は、この中間点におけるフレーム画像の色ヒストグラムを、重要シーンの色の特徴量として算出する。映像特徴解析手段232は、映像識別子と、映像データ中の重要シーンの識別子と、重要シーン特徴の識別子をキーとして、重要シーン特徴量を対応づけたレコードを、重要シーン特徴量データ15aに挿入する。
【0081】
類似度算出手段233は、重要シーン特徴量データ15aの重要シーン特徴量に基づいて、映像データ間の重要シーン特徴類似度を算出して、重要シーン特徴類似度データ16aを出力する。ここで類似度算出手段233は、各映像識別子について、この映像識別子関連づけられる複数の重要シーン特徴量を要素に持つ特徴ベクトルを算出する。類似度算出手段233は、映像データ間の類似度として、この特徴ベクトルの類似度を算出する。類似度算出手段233は、第1の映像識別子と、第2の映像識別子と、この第1の映像識別子の映像データとこの第2の映像識別子の映像データとの重要シーン特徴類似度と、を対応づけたレコードを、重要シーン特徴類似度データ16aに挿入する。
【0082】
図9を参照して、重要シーン特徴類似度算出手段23による重要シーン特徴類似度算出処理を説明する。
【0083】
まず、映像データ記憶部12に記憶された各映像データについて、ステップS201ないしステップS203の処理を繰り返す。ステップS201において重要シーン特徴類似度算出手段23は、各映像データから、重要シーンを抽出する。ここで一つの映像データから抽出する重要シーンは、一つでも良いし複数でも良い。
【0084】
この重要シーンのそれぞれについて、ステップS202およびステップS203の処理を繰り返す。重要シーン特徴類似度算出手段23は、各重要シーンについて、重要シーン特徴量を算出する。このとき重要シーン特徴類似度算出手段23は、各重要シーンの中間のフレームの重要シーンの色、動き、音響特徴のいずれか一つ以上を、重要シーン特徴量として算出し、ステップS203において、重要シーン特徴量データ15aに記録する。全ての重要シーンについて、ステップS202ないしステップS203の処理が終了すると、次の映像データについて、ステップS201ないしステップS203の処理を続ける。
【0085】
全ての映像データについてステップS201ないしステップS203の処理が終了すると、重要シーン特徴類似度算出手段23は、ステップS204ないしステップS207において、各映像データ間の重要シーン特徴類似度を算出する。まずステップS204において重要シーン特徴類似度算出手段23は、任意の第1の映像データについて、重要シーン特徴量データ15aから各重要シーンの重要シーン特徴量を取得する。ステップS205において重要シーン特徴類似度算出手段23は、第2の映像データについて、重要シーン特徴量データ15aから各重要シーンの重要シーン特徴量を取得する。
【0086】
ステップS206において重要シーン特徴類似度算出手段23は、ステップS204で取得した第1の映像データの重要シーン特徴量と、ステップS205で取得した第2の映像データの重要シーン特徴量から、第1の映像データと第2の映像データとの類似度を算出する。さらにステップS207において重要シーン特徴類似度算出手段23は、第1の映像データの識別子と、第2の映像データの識別子と、ステップS206で算出した重要シーン特徴量に基づく重要シーン特徴類似度とを対応づけて、重要シーン特徴類似度データ16aに記録する。
【0087】
ここで、重要シーン特徴類似度算出手段23の処理を詳述する。重要シーン抽出手段231が映像データから重要シーンを抽出する方法として、既存の処理方法を利用することができる。例えば、特許第4358723号公報に記載のダイジェスト映像作成方法などが考えられる。ダイジェスト映像作成技術により、映像データのダイジェストを作成することができるため、ダイジェストとして選択された区間を、映像データの重要シーンとしてみなすことができる。
【0088】
重要シーン特徴類似度算出手段23は、図12(a)に示すように、重要シーン抽出手段231で抽出された重要シーンについて、図12(b)に示すように、映像データの重要シーン特徴を解析する。重要シーン特徴類似度算出手段23は、重要シーン特徴量として、色、動き、音響特徴などを利用することができる。
【0089】
重要シーン特徴量の類似度算出には、任意の尺度が利用される。例えば、重要シーン特徴量として色ヒストグラムを利用する場合、重要シーン特徴類似度算出手段23は、図12に示すように、映像データの中からいくつかの重要シーンを抽出し、それぞれのシーンの中間点におけるフレームを抽出する。重要シーン特徴類似度算出手段23は、そのフレームの色ヒストグラムを作成し、特徴ベクトルとして表現する。ここで、ヒストグラムの次元間の距離は、利用する表色空間における距離を用いる。
【0090】
ここで、映像データAの各重要シーンから抽出した特徴量をv、映像Bの各重要シーンから抽出した特徴量をvとする。vとvの類似度I(v,v)は、例えば、式(2)によって算出される。
【数2】

【0091】
重要シーン特徴類似度算出手段23は、図10(b)に示すように、映像データAに含まれる各重要シーンA、A、…と、映像データB、B…に含まれる各シーンの類似度を算出する。類似度が高い重要シーンが存在するほど、I(v,v)の値は大きくなる。ここで、Nは、映像データAから抽出された重要シーンの数であり、Nは、映像データBから抽出された重要シーンの数である。vは映像データAのi番目の重要シーン、vは映像データBのj番目の重要シーンである。また、D(v,v)は、重要シーンvと重要シーンvの類似度である。
【0092】
ここで、Earth Mover’s Distance(Y. Rubner, C. Tomasi, and L. Guibas. "The earth mover’s distance as a metric for image retrieval," International Journal of Computer Vision Vol. 40, No. 2, pp. 99-121, 2000.)を利用する。vとvのEarth Mover’s Distanceを、E(v,v)とすると、D(v,v)は、式(3)によって算出される。
【数3】

【0093】
他の方法として、重要シーン特徴類似度算出手段23は、映像データAの特徴ベクトルをv、映像データBの特徴ベクトルをvとおいたとき、vとvのコサイン類似度を算出することによって、重要シーンAと重要シーンBの類似度D(v,v)を算出することができる。この類似度D(v,v)は、式(4)によって表される。
【数4】

【0094】
ここで、vは、映像データAの特徴ベクトルのi次元目の値で、vは、映像データBの特徴ベクトルのi次元目の値である。nは、特徴ベクトルの次元数である。
【0095】
ここで、重要シーンの抽出方法や使用する重要シーン特徴量が、N(>0)個存在する場合、重要シーン特徴類似度算出手段23は、それぞれについて、映像データAの重要シーンと映像データBの重要シーンの類似度I(v,v)の値を求める。重要シーン特徴類似度算出手段23は、それぞれについて求められたI(v,v)に基づいて、重要シーン特徴に基づく類似度IABを、類似度IAB={IA,B|i=1〜N}とする。
【0096】
重要シーン特徴類似度算出手段23は、このように算出された類似度IABを、映像データAの識別子および映像データBの識別子に関連づけたレコードを生成し、重要シーン特徴類似度データ16aに挿入して記憶する。
【0097】
次に、類似映像決定手段24を説明する。類似映像決定手段24は、構造的特徴類似度データ14aおよび重要シーン特徴類似度データ16aに基づいて、映像データ記憶部12から、基準映像データ11aに類似する映像データを抽出する。
【0098】
類似映像決定手段24は、構造的特徴および重要シーン特徴のうち、いずれか一方のみを用いて、基準映像データ11aに類似する映像データを抽出しても良い。例えば、構造的特徴のみに基づいて類似する映像データを抽出する際、類似映像決定手段24は、構造的特徴類似度データ14aに基づいて、構造的特徴類似度を映像データ間の類似度に設定する。重要シーン特徴のみに基づいて類似する映像データを抽出する際、類似映像決定手段24は、重要シーン特徴類似度データ16aに基づいて、重要シーン特徴類似度を映像データ間の類似度に設定する。
【0099】
構造的特徴類似度データ14aおよび重要シーン特徴類似度データ16aの両方に基づいて基準映像データ11aに類似する映像データを抽出する際、それぞれを重み付けして評価し、類似する映像データを抽出しても良い。この重みは、予めユーザなどにより指定されても良いし、管理者などによりデフォルトの重みが指定されても良い。
【0100】
類似映像決定手段24は、映像データ間の類似度が算出されると、この類似度に基づいて、基準映像データ11aに対する各映像データの推薦スコアを算出する。この推薦スコアは、類似度が高いほど高くなり、優先的に推薦されることを示す。類似映像決定手段24は、この推薦スコアに基づいて、基準映像データ11aに類似する映像データを抽出する。ここで類似映像決定手段24が抽出する映像データは、映像データそのものでなくても、映像データの識別子のみでも良い。類似映像決定手段24は、類似度の高い所定数の映像データを抽出してもよいし、所定の類似度以上の映像データを抽出しても良い。
【0101】
類似映像決定手段24は、類似度の高い映像データを推薦する映像データとして、これらの映像データの識別子を含む類似映像リストデータ18aを生成し、類似映像リストデータ記憶部18に記憶する。この類似映像リストデータ18aにおいて、ユーザに推薦の度合いを示すため、推薦対象の映像データの識別子に、その推薦スコアが対応づけられても良い。
【0102】
図13を参照して、類似映像決定手段24による類似映像決定処理を説明する。
【0103】
類似映像決定手段24は、映像データ記憶部12に記憶された任意の2つの映像データについて、ステップS301ないしステップS305の処理を繰り返す。
【0104】
まずステップS301において類似映像決定手段24は、構造的特徴類似度データ14aから第1の映像データおよび第2の映像データ間の構造的特徴類似度を取得する。同様にステップS302において類似映像決定手段24は、重要シーン特徴類似度データ16aから第1の映像データおよび第2の映像データ間の重要シーン特徴類似度を取得する。
【0105】
ステップS303において類似映像決定手段24は、ステップS301およびステップS302で取得した、第1の映像データおよび第2の映像データ間の構造的特徴類似度および重要シーン特徴類似度に基づいて、第1の映像データおよび第2の映像データ間の類似度を算出する。このとき類似映像決定手段24は、構造的特徴類似度および重要シーン特徴類似度をそれぞれ重み付けして、第1の映像データおよび第2の映像データ間の類似度を算出する。
【0106】
ステップS304において類似映像決定手段24は、第1の映像データの識別子と、第2の映像データの識別子と、第1の映像データおよび第2の映像データ間の類似度と、を対応づけたレコードを、類似度データ17aに挿入する。
【0107】
ステップS305において類似映像決定手段24は、類似度データ17aを参照して、基準映像データ11aとの類似度が高い映像データの識別子を、推薦する映像データの識別子として取得する。さらに類似映像決定手段24は、取得した推薦する映像データの識別子を含む類似映像リストデータ18aを生成し、記憶装置10に記憶する。
【0108】
ここで、類似映像決定手段24の処理を詳述する。類似映像決定手段24は、映像データAと映像データBの類似度について、構造的特徴に基づいて算出された類似度SABと、重要シーン特徴に基づいて算出された類似度IABとから、映像データAを視聴したユーザに対する映像データBの推薦スコアR(A,B)を算出する。
【0109】
推薦スコアR(A,B)は、構造的特徴に基づく構造的特徴類似度の値が大きい場合、もしくは、重要シーンに基づく重要シーン特徴類似度の値が大きい場合、推薦スコアR(A,B)の値も大きくなるように算出される。
【0110】
例えば、SABの各要素とIABの各要素の重み付き線形和により推薦スコアを算出する場合、R(A,B)は、式(5)で与えられる。
【数5】

【0111】
ここで、ただし、kIはIA,Bの重み、kSはSA,Bの重みである。映像データに含まれる重要シーン特徴を重視して推薦スコアを算出したい場合、kIの値は大きく設定される。映像データの演出を重視して推薦スコアを算出したい場合、IA,Bの値は大きく設定される。
【0112】
重要シーンに基づいて算出した映像データAと映像データBの類似度IAB、および、構造的特徴に基づいて算出した映像データAと映像データBの類似度SABのうち、どちらか片方のみを利用して、映像データAおよび映像データBの類似度R(A,B)が算出されても良い。重要シーンに基づいて算出した映像データAと映像データBの類似度IABのみ用いて類似度R(A,B)を算出する場合、類似度R(A,B)は、式(6)で与えられる。構造的特徴に基づいて算出した映像データAと映像データBの類似度SABのみ用いて類似度R(A,B)を算出する場合、類似度R(A,B)は、式(7)で与えられる。
【数6】

【数7】

【0113】
重みkIおよびIA,Bは、基準映像データ11aや映像データ記憶部12に記憶された映像データの種類によって適宜設定されても良い。例えば、ホームビデオなど、編集があまりされていない映像データの場合、重要シーンに基づいて算出した類似度を用いるのがよい。また、重要シーンの抽出が困難な映像を対象に推薦する場合には、構造的特徴に基づいて算出した類似度を用いるのがよい。それ以外の場合には、重要シーンに基づいて算出した類似度と構造的特徴に基づいて算出した類似度の両方を用いるのがよい。
【0114】
類似映像決定手段24は、類似度R(A,B)から推薦スコアを算出する。例えば、類似度R(A,B)を100分率表記に換算したものが、推薦スコアとして出力されても良い。ユーザに推薦度をわかりやすく知らせるため、推薦スコアは記号などで表記されても良い。例えば類似映像決定手段24は、類似度が高く推薦スコアが高い場合、推薦スコアを「★★★」などと表記し、類似度が比較的低く推薦スコアが低い場合、推薦スコアを「★」などと表記しても良い。
【0115】
類似映像決定手段24は、ユーザが映像データAにアクセスしたとき、映像データ記憶部12の任意の映像データXのうち、R(A,B)の値が大きい映像データから順に所定数の映像データについて類似映像リストデータ18aを作成する。
【0116】
次に、類似映像情報出力手段25を説明する。類似映像情報出力手段25は、記憶装置10から類似映像リストデータ18aおよび映像管理データ19aを読み出し、推薦する映像データの識別子に基づいて、これらの映像データのタイトルや内容などの情報を取得する。類似映像決定手段24は、推薦する映像データの識別子と、これらのタイトルなどを対応づけて、出力する。図2に参照する例では、類似映像出力装置1の表示装置30に表示する場合を説明するが、これに限られない。類似映像情報出力手段25は例えば、通信制御装置(図示せず)および通信ネットワークを介して、他のコンピュータの表示装置に表示しても良い。
【0117】
ここで、構造的特徴類似度算出手段22および重要シーン特徴類似度算出手段23の各処理は、基準映像データ取得手段21によって基準映像データ11aが入力された際に実行されても良いし、予め実行されていても良い。例えば、構造的特徴類似度算出手段22によって構造的特徴類似度データ14aが、重要シーン特徴類似度算出手段23によって重要シーン特徴類似度データ16aが、それぞれ予め算出されていれば、類似映像決定手段24は、容易に類似度データ17aおよび類似映像リストデータ18aを生成することができる。さらに、類似映像決定手段24によって、類似度データ17aも予め算出されていても良い。この様に予め類似度データなどを算出することにより、類似映像情報の出力に要する処理時間を短縮することができる。
【0118】
このように本発明の実施の形態に係る類似映像出力装置1によれば、映像データの構造的特徴に基づく類似度と、重要シーン特徴に基づく類似度によって、類似する映像データを特定することができる。
【0119】
構造的特徴に基づく類似度は、映像データの演出に関する特徴の類似度である。カット割りや音楽区間など、映像の演出に関係する特徴を抽出し、各特徴が映像の前半や後半など、時間軸におけるどの位置に多く出現するかを分析することによって、構造的特徴に基づく類似度が算出される。
【0120】
重要シーン特徴に基づく類似度は、視聴者の印象に残りやすいシーンに関する特徴の類似度である。視聴者の印象に残りやすいような重要シーンのみに限定して色などの特徴を分析することにより、重要シーン特徴に基づく類似度が算出される。
【0121】
一般的に、映像データの演出に関する特徴や、重要シーンにおける特徴が類似する映像は、視聴者の映像データに対する印象も類似すると考えられる。そこで本発明の実施の形態に係る類似映像出力装置1は、各映像データについて、映像データの演出に関する構造的特徴量や、重要シーンにおける重要シーン特徴量を算出し、これらの特徴量が基準映像データ11aと類似する映像データを、推薦映像データとして出力する。これにより、本発明の実施の形態に係る類似映像出力装置1は、基準映像データ11aに視聴者の映像データに対する印象が類似する映像データを推薦することができる。
【0122】
構造的特徴類似度算出手段22は、映像データから演出に関する構造的特徴を抽出し、各特徴が映像データの時間軸におけるどの位置でどのくらいの頻度で出現するかを分析して、構造的特徴類似度を算出する。このような構造的特徴類似度により、構造的特徴が映像データの前半部分に多く現れるのか、後半部分に多く現れるのか、あるいは、全体を通してまんべんなく現れるのかなどの情報に基づいて、映像データの類似度が算出される。映画などの映像データでは、緊迫感を与えるため、カット数を増やすといった演出がなされる。そのため、演出に関する特徴が似ている映像データは、視聴者に与える印象も似ていると考えられ、類似映像出力装置1は、構造的特徴類似度により、視聴者に与える印象の似ている映像データを推薦できる。
【0123】
また、構造的特徴類似度算出手段22は、映像データをいくつかの区間に分割し、各区間におけるカット割りや音楽区間などの構造的特徴量の出現頻度を要素とする特徴ベクトルの類似度を算出する。これにより、緊迫感などの印象を与えるためにカットの頻度を増減するといった、演出に関する情報を分析し、構造的特徴類に基づいた映像データの類似度を算出することができる。
【0124】
重要シーン特徴類似度算出手段23は、映像データの中で、視聴者の印象に残りやすいような重要シーンの特徴に基づいて、映像データの類似度を算出する。重要シーンの特徴として利用する特徴は、色、動き、音響特徴などがある。これにより、類似映像出力装置1は、映像データが視聴者に与える印象の似ている映像データを推薦することができる。
【0125】
例えば、ホラー映画には、明るいシーンもあれば暗いシーンもあるが、ホラー映画において、印象に残りやすい重要なシーンでは暗いシーンが一般的と考えられる。そこで重要シーン特徴類似度算出手段23が、重要シーンに限定して特徴を分析することにより、類似映像出力装置1は、例えば、「重要シーンに暗いシーンが多い」という観点で似ている映像データを発見できる。視聴者の印象に残りやすいシーンの特徴が似ている場合、映像データが視聴者に与える印象も似ていると考えられ、類似映像出力装置1は、重要シーン特徴類似度により、視聴者に与える印象の似ている映像を推薦できる。
【0126】
さらに、重要シーン特徴類似度算出手段23は、重要シーンに限定して特徴を分析し、類似度を算出する。これにより、映像全体の類似度を算出する場合に比べ、解析対象のシーンが少なくなるため、重要シーン特徴類似度算出手段23は、類似度算出にかかる計算処理量を削減することができる。
【0127】
このように本発明の実施の形態に係る類似映像出力装置1は、映像データの構造的特徴、または、映像データの重要シーンの特徴、あるいはその両方を分析することにより、映像データの印象の類似度を算出できる。これにより、本発明の実施の形態に係る類似映像出力装置1は、基準映像データ11aと印象の似た映像データを推薦することができる。
【0128】
(変形例)
本発明の実施の形態においては、基準映像データが一つの場合について説明したが、変形例においては、複数の基準映像データが指定された場合を説明する。
【0129】
変形例において、類似映像出力装置1の類似映像決定手段24aは、入力された複数の基準映像データが入力されると、これらの複数の基準映像データについての類似度を合計することにより、推薦する映像を決定することができる。
【0130】
例えば、入力としてN件の映像集合A={A|i=1〜N}が与えられると、式8に示したR’(A,B)を、式6および式7のR(A,B)の代わりに利用する。これにより類似映像決定手段24aは、変形例に係る類似映像リストデータ18bを生成することができる。
【数8】

【0131】
このように、本発明の変形例においては、複数の基準映像データについても、構造的特徴類似度および重要シーン特徴類似度に基づいて、これらの基準映像データに類似する映像データの情報を、出力することができる。
【0132】
(その他の実施の形態)
上記のように、本発明の最良の実施の形態とその変形例によって記載したが、この開示の一部をなす論述及び図面はこの発明を限定するものであると理解すべきではない。この開示から当業者には様々な代替実施の形態、実施例及び運用技術が明らかとなる。
【0133】
例えば、本発明の最良の実施の形態に記載した類似映像出力装置は、図2に示すように一つのハードウェア上に構成されても良いし、その機能や処理数に応じて複数のハードウェア上に構成されても良い。又、既存の情報処理システム上に実現されても良い。
【0134】
本発明はここでは記載していない様々な実施の形態等を含むことは勿論である。従って、本発明の技術的範囲は上記の説明から妥当な特許請求の範囲に係る発明特定事項によってのみ定められるものである。
【符号の説明】
【0135】
1 類似映像出力装置
10 記憶装置
11 基準映像データ記憶部
12 映像データ記憶部
13 構造的特徴量データ記憶部
14 構造的特徴類似度データ記憶部
15 重要シーン特徴量データ記憶部
16 重要シーン特徴類似度データ記憶部
17 類似度データ記憶部
18 類似映像リストデータ記憶部
19 映像管理データ記憶部
20 中央処理制御装置
21 基準映像データ取得手段
22 構造的特徴類似度算出手段
23 重要シーン特徴類似度算出手段
24 類似映像決定手段
25 類似映像情報出力手段
30 表示装置
221 構造的特徴解析手段
222、233 類似度算出手段
231 重要シーン抽出手段
232 映像特徴解析手段

【特許請求の範囲】
【請求項1】
類似する映像データを出力する類似映像出力方法であって、
映像データ記憶部に記憶された複数の映像データのそれぞれについて、当該映像データを分割した区間毎の構造的特徴の出現する時間を構造的特徴量として算出し、構造的特徴量に基づいて、映像データ間の構造的特徴類似度を算出して、構造的特徴類似度データを出力する構造的特徴類似度算出ステップと、
前記構造的特徴類似度データに基づいて、前記映像データ記憶部から、基準映像データに類似する映像データを抽出する類似映像決定ステップと、
を備えることを特徴とする類似映像出力方法。
【請求項2】
前記構造的特徴は、前記区間における色、動き、音響特徴、カット割り、音楽区間、発話区間およびテロップ区間のうち、いずれか一つ以上である
ことを特徴とする請求項1に記載の類似映像出力方法。
【請求項3】
前記複数の映像データのそれぞれについて、当該映像データに含まれる重要シーンの特徴量を重要シーン特徴量として算出し、重要シーン特徴量に基づいて、映像データ間の重要シーン特徴類似度を算出して、重要シーン特徴類似度データを出力する重要シーン特徴類似度算出ステップをさらに備え、
前記類似映像決定ステップは、前記構造的特徴類似度データおよび前記重要シーン特徴類似度データに基づいて、前記映像データ記憶部から、前記基準映像データに類似する映像データを抽出する
ことを特徴とする請求項1または2に記載の類似映像出力方法。
【請求項4】
前記重要シーン特徴は、前記重要シーンの色、動き、音響特徴のいずれか一つ以上である
ことを特徴とする請求項3に記載の類似映像出力方法。
【請求項5】
類似する映像データを出力する類似映像出力方法であって、
映像データ記憶部に記憶された複数の映像データのそれぞれについて、当該映像データに含まれる重要シーンの特徴量を重要シーン特徴量として算出し、重要シーン特徴量に基づいて、映像データ間の重要シーン特徴類似度を算出して、重要シーン特徴類似度データを出力する重要シーン特徴類似度算出ステップと、
前記重要シーン特徴類似度データに基づいて、前記映像データ記憶部から、基準映像データに類似する映像データを抽出する類似映像決定ステップと、
を備えることを特徴とする類似映像出力方法。
【請求項6】
類似する映像データを出力する類似映像出力装置であって、
複数の映像データが記憶された映像データ記憶部と、
前記複数の映像データのそれぞれについて、当該映像データを分割した区間毎の構造的特徴の出現する時間を構造的特徴量として算出し、構造的特徴量に基づいて、映像データ間の構造的特徴類似度を算出して、構造的特徴類似度データを出力する構造的特徴類似度算出手段と、
前記構造的特徴類似度データに基づいて、前記映像データ記憶部から、基準映像データに類似する映像データを抽出する類似映像決定手段と、
を備えることを特徴とする類似映像出力装置。
【請求項7】
前記構造的特徴は、前記区間における色、動き、音響特徴、カット割り、音楽区間、発話区間およびテロップ区間のうち、いずれか一つ以上である
ことを特徴とする請求項6に記載の類似映像出力装置。
【請求項8】
前記複数の映像データのそれぞれについて、当該映像データに含まれる重要シーンの特徴量を重要シーン特徴量として算出し、重要シーン特徴量に基づいて、映像データ間の重要シーン特徴類似度を算出して、重要シーン特徴類似度データを出力する重要シーン特徴類似度算出手段をさらに備え、
前記類似映像決定手段は、前記構造的特徴類似度データおよび前記重要シーン特徴類似度データに基づいて、前記映像データ記憶部から、前記基準映像データに類似する映像データを抽出する
ことを特徴とする請求項6または7に記載の類似映像出力装置。
【請求項9】
前記重要シーン特徴は、前記重要シーンの色、動き、音響特徴のいずれか一つ以上である
ことを特徴とする請求項8に記載の類似映像出力装置。
【請求項10】
類似する映像データを出力する類似映像出力装置であって、
複数の映像データが記憶された映像データ記憶部と、
前記複数の映像データのそれぞれについて、当該映像データに含まれる重要シーンの特徴量を重要シーン特徴量として算出し、重要シーン特徴量に基づいて、映像データ間の重要シーン特徴類似度を算出して、重要シーン特徴類似度データを出力する重要シーン特徴類似度算出手段と、
前記重要シーン特徴類似度データに基づいて、前記映像データ記憶部から、基準映像データに類似する映像データを抽出する類似映像決定手段と、
を備えることを特徴とする類似映像出力装置。
【請求項11】
コンピュータに、請求項1ないし請求項5のいずれか1項に記載のステップを実行させるための類似映像出力プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate


【公開番号】特開2012−222450(P2012−222450A)
【公開日】平成24年11月12日(2012.11.12)
【国際特許分類】
【出願番号】特願2011−83739(P2011−83739)
【出願日】平成23年4月5日(2011.4.5)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】