説明

コンテンツ紹介映像作成装置およびそのプログラム

【課題】本願発明は、コンテンツ紹介映像を素早く作成できるコンテンツ紹介映像作成装置を提供することを目的とする。
【解決手段】コンテンツ紹介映像作成装置1は、コンテンツを紹介する映像であるコンテンツ紹介映像を作成するものであり、パラメータ記憶手段10と、候補画像データベース20と、コンテンツ映像データベース30と、選出画像データベース40と、コンテンツ映像から候補画像を抽出する候補画像抽出手段50と、カット点を検出するカット点検出手段51と、選出画像を選出する基準となるスコアを算出するスコア算出手段61と、スコアが高い方から順に選出画像として選出する選出画像選出手段63と、選出画像を再生したコンテンツ紹介映像を作成する紹介映像作成手段70とを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本願発明は、コンテンツを紹介する映像であるコンテンツ紹介映像を作成するコンテンツ紹介映像作成装置およびそのプログラムに関する。
【背景技術】
【0002】
近年、TVの多チャンネル化やインターネットのブロードバンド化に伴い、様々な映像に触れる機会が増えている。このため、多種多様な映像から興味がある映像を選ぶ必要が生じる。しかし、映像は、静止画とは異なり、一見してその内容を伺い知ることは難しい。
【0003】
そこで、映像を要約したダイジェスト映像に対して、需要が高まっている。ダイジェスト映像は、その明確な定義がないものの、元の映像からその内容を短時間で表わした映像区間や興味が高いと思われる映像区間を抜き出し、1分程度に編集した映像を指すことが多い。このダイジェスト映像には、視聴者の興味がある映像が含まれることが好ましい。このため、従来から、ダイジェスト映像を作成する手法が提案されている(例えば、特許文献1〜3)。
【0004】
特許文献1に記載の発明は、映像から笑い顔を検出し、ダイジェスト映像を作成するものである。ここで、特許文献1に記載の発明は、音声の切れ目を考慮するため、1シーケンスが数〜数十秒程度で、コンテンツの内容をある程度把握できるダイジェスト映像を作成している。
【0005】
また、特許文献2に記載の発明は、画像や音声の変化をイベントとして検出し、ダイジェスト映像を作成するものである。ここで、特許文献2に記載の発明は、特許文献1に記載の発明と同様、コンテンツの内容をある程度把握できるダイジェスト映像を作成する。
【0006】
さらに、特許文献3に記載の発明は、登場人物をクラスタリングしながらダイジェスト映像を作成するものである。このため、特許文献3に記載の発明は、ダイジェスト映像を作成する際、人物識別処理(顔識別処理)を行っている。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特開2010−28705号公報
【特許文献2】特開2010−39877号公報
【特許文献2】特開2008−77536号公報
【発明の概要】
【発明が解決しようとする課題】
【0008】
しかし、特許文献1〜3に記載の発明では、ダイジェスト映像からコンテンツの内容をある程度把握できるようにするため、笑い顔の判定、音声変化の検出、人物識別処理などの負荷が高い処理を行う必要がある。このため、特許文献1〜3に記載の発明では、処理時間が長くなり、ダイジェスト映像を素早く作成することが困難である。
【0009】
そこで、本願発明は、前記した問題を解決し、コンテンツ紹介映像を素早く作成できるコンテンツ紹介映像作成装置およびそのプログラムを提供することを目的とする。
【課題を解決するための手段】
【0010】
前記した課題に鑑みて、本願第1発明に係るコンテンツ紹介映像作成装置は、コンテンツを紹介する映像であるコンテンツ紹介映像を作成するものであって、候補画像抽出手段と、スコア算出手段と、選出画像選出手段と、紹介映像作成手段とを備えることを特徴とする。
【0011】
かかる構成によれば、コンテンツ紹介映像作成装置は、候補画像抽出手段によって、前記コンテンツのジャンルを付加したコンテンツ映像が入力され、入力された当該コンテンツ映像内に予め設定された候補画像抽出区間から所定数の候補画像を抽出する。例えば、候補画像抽出手段は、候補画像抽出区間を等分割した位置にある画像を候補画像として抽出する。ここで、候補画像は、処理負荷を低くするため、少数(例えば、100枚)とすることが好ましい。
【0012】
また、コンテンツ紹介映像作成装置は、スコア算出手段によって、コンテンツ映像に付加されたジャンルが予め設定された顔領域検出対象の設定ジャンルに属するか否かを判定し、設定ジャンルに属すると判定した場合、候補画像抽出手段によって抽出された候補画像の顔領域大きさ情報をスコアとして算出し、設定ジャンルに属さないと判定した場合、コンテンツ映像内における候補画像の位置を基準に予め設定された動きベクトル検出区間から検出した動きベクトルの大きさの合計値をスコアとして算出する。
【0013】
つまり、スコア算出手段は、コンテンツ映像の全体ではなく、少数の候補画像からスコアを算出することで、処理負荷を低くしている。ここで、視聴者が登場人物に強い興味を有することが多いため、スコア算出手段は、候補画像から人物の顔領域を検出して、顔領域大きさ情報をスコアとして算出する。一方、コンテンツのジャンルによっては人物が殆ど登場しないため、人物の顔領域からスコアを算出することが適切でない場合もある。この場合、スコア算出手段は、顔領域大きさ情報でなく、動きベクトル検出区間内に位置する画像から動きベクトルをそれぞれ検出し、その動きベクトルの大きさの合計値をスコアとして算出する。このように、スコア算出手段は、コンテンツのジャンルに関わりなく、低い処理負荷でスコアを算出できる。
【0014】
また、コンテンツ紹介映像作成装置は、選出画像選出手段によって、スコア算出手段によって算出されたスコアが高い方から順に、所定数の候補画像を選出画像として選出する。そして、コンテンツ紹介映像作成装置は、紹介映像作成手段によって、選出画像選出手段によって選出された選出画像が、予め設定された選出画像1枚あたりの再生時間である選出画像再生時間だけ再生されるように、コンテンツ紹介映像を作成する。
【0015】
また、本願第2発明に係るコンテンツ紹介映像作成装置は、コンテンツ映像内における候補画像の位置を基準として、予め設定されたカット点検出区間からカット点を検出するカット点検出手段をさらに備え、候補画像抽出手段が、カット点が検出された場合、検出された当該カット点から選出画像再生時間だけ遡った位置の画像を候補画像として抽出することが好ましい。
かかる構成によれば、コンテンツ紹介映像作成装置は、候補画像の位置を基準にカット点を検出するため、カット点の検出漏れを少なくできる。
【0016】
また、本願第3発明に係るコンテンツ紹介映像作成装置は、コンテンツ映像内における選出画像の位置を基準として、予め設定されたカット点検出区間からカット点を検出するカット点検出手段をさらに備え、選出画像選出手段が、カット点が検出された場合、検出された当該カット点から選出画像再生時間だけ遡った位置の画像を選出画像として選出することが好ましい。
かかる構成によれば、コンテンツ紹介映像作成装置は、選出画像の位置を基準にカット点を検出するため、カット点の検出回数を少なくできる。
【0017】
また、本願第4発明に係るコンテンツ紹介映像作成装置は、スコア算出手段が、候補画像から顔領域を検出し、検出された当該顔領域の半径または面積を顔領域大きさ情報として算出し、候補画像から複数の顔領域が検出された場合、顔領域大きさ情報の最大値または合計値をスコアとして算出することが好ましい。
かかる構成によれば、コンテンツ紹介映像作成装置は、正確なスコアに基づいてコンテンツ紹介映像を作成することができる。
【0018】
また、本願第5発明に係るコンテンツ紹介映像作成装置は、候補画像をコンテンツの識別情報に対応付けて記憶する候補画像記憶手段をさらに備え、候補画像抽出手段が、識別情報がさらに付加されたコンテンツ映像が入力され、入力された当該コンテンツ映像から抽出した候補画像を当該コンテンツ映像に付加された識別情報に対応付けて候補画像記憶手段に書き込むと共に、識別情報に基づいて、当該入力されたコンテンツ映像と同一のコンテンツ映像の候補画像が候補画像記憶手段に記憶されているか否かを判定し、当該候補画像が記憶されていると判定した場合、候補画像記憶手段から当該候補画像を読み出すことが好ましい。
【0019】
ここで、例えば、ある番組の放送開始直後では、この番組の前半部分が収録されたコンテンツ映像からコンテンツ紹介映像を作成する。一方、この番組の放送終了後では、例えば、番組全体が収録されたコンテンツ映像からコンテンツ紹介映像を作成する。このように、同一のコンテンツ映像から2回以上、コンテンツ紹介映像を作成することがある。この場合、コンテンツ紹介映像作成装置は、抽出した候補画像を候補画像記憶手段に記憶しておくため、同一のコンテンツ映像に対する候補画像の抽出処理を最小限に抑えることができる。
【0020】
なお、本願第1発明に係るコンテンツ紹介映像作成装置は、一般的なコンピュータを、候補画像抽出手段、スコア算出手段、選出画像選出手段および紹介映像作成手段として機能させるコンテンツ紹介映像作成プログラムによって実現することもできる。
【発明の効果】
【0021】
本願発明によれば、以下のような優れた効果を奏する。
本願第1発明によれば、コンテンツのジャンルに関わりなく、低い処理負荷でスコアを算出するため、処理時間を短くでき、コンテンツ紹介映像を素早く作成できる。
【0022】
本願第2発明によれば、カット点の検出漏れを少なくできるため、頻繁にカットが切り替わることを強く抑制し、見やすいコンテンツ映像を作成できる。
本願第3発明によれば、カット点の検出回数を少なくできるため、頻繁にカットが切り替わることを抑制し、見やすいコンテンツ映像を素早く作成できる。
本願第4発明によれば、正確なスコアに基づいてコンテンツ紹介映像が作成されるため、コンテンツのジャンル、雰囲気、登場人物等の情報が視聴者に伝わりやすくなる。
本願第5発明によれば、同一のコンテンツ映像に対する候補画像の抽出処理を最小限に抑えるため、処理時間をより短くでき、コンテンツ紹介映像を素早く作成できる。
【図面の簡単な説明】
【0023】
【図1】本願発明の第1実施形態に係るコンテンツ紹介映像作成装置の概略を説明する図である。
【図2】本願発明の第1実施形態に係るコンテンツ紹介映像作成装置の構成を示すブロック図である。
【図3】図2,図6のカット点検出手段を説明する図である。
【図4】図2のスコア算出手段を説明する図である。
【図5】図2のコンテンツ紹介映像作成装置の動作を示すフローチャートである。
【図6】本願発明の第2実施形態に係るコンテンツ紹介映像作成装置の構成を示すブロック図である
【図7】図6のコンテンツ紹介映像作成装置の動作を示すフローチャートである。
【発明を実施するための形態】
【0024】
(第1実施形態)
以下、本願発明の各実施形態について、適宜図面を参照しながら詳細に説明する。なお、各実施形態において、同一の機能を有する手段には同一の符号を付し、説明を省略した。
【0025】
[コンテンツ紹介映像作成装置の概略]
図1を参照して、本願発明の第1実施形態に係るコンテンツ紹介映像作成装置1(図2参照)の概略について説明する。第1実施形態では、コンテンツ紹介映像作成装置1を、ソーシャルネットワークサービス(SNS)で利用する例で説明する。図1に示すように、このSNSでは、新作番組紹介画面Pgを視聴者に提示して、視聴者の間で新作番組を紹介するサービスを行っている。
【0026】
この新作番組紹介画面Pgには、新作番組のコンテンツ紹介映像が画面左上部の表示欄Vwに表示され、この新作番組の紹介文が画面右上部に位置するテキストボックスTx1に表示されている。また、新作番組紹介画面Pgには、テキストボックスTx1の下部に「コメントする」ボタンBt1が表示されている。ここで、視聴者がボタンBt1をクリックすると、図示を省略したコメント入力画面が開き、視聴者が新作番組に対するコメントを入力できる。すると、入力されたコメントが、画面最下部のテキストボックスTx2に表示される。図1の例では、2名の視聴者が入力したコメントが、テキストボックスTx2に表示されている。
【0027】
ここで、視聴者は、画面左中央部に表示された「この番組をみる」ボタンBt2をクリックする。すると、この操作に応じて、コンテンツ紹介映像作成装置1に新作番組の映像ファイル(コンテンツ映像)が入力され、コンテンツ紹介映像作成装置1が、この新作番組のコンテンツ紹介映像を作成する。その後、新作番組紹介画面Pgでは、このコンテンツ紹介映像が再生される。
【0028】
[コンテンツ紹介映像作成装置の構成]
以下、図2を参照して、コンテンツ紹介映像作成装置1の構成について説明する。
図2に示すように、コンテンツ紹介映像作成装置1は、コンテンツを紹介する映像であるコンテンツ紹介映像を作成するものであり、パラメータ記憶手段10と、候補画像データベース(候補画像記憶手段)20と、コンテンツ映像データベース30と、選出画像データベース(選出画像記憶手段)40と、候補画像抽出手段50と、候補画像順位付け手段60と、紹介映像作成手段70とを備える。
【0029】
ここで、コンテンツ映像は、連続した画像(フレーム画像)で構成されており、各画像をタイムコードまたはフレーム番号で特定することができる。言い換えるなら、コンテンツ映像では、ある画像の位置、および、ある画像から別の画像までの区間をタイムコードまたはフレーム番号で表すことができる。
また、コンテンツ映像には、新作番組を一意に識別するコンテンツID(識別情報)と、新作番組のジャンルとが付加されていることとする。
【0030】
パラメータ記憶手段10は、コンテンツ紹介映像作成装置1に必要な各種パラメータを予め記憶するメモリ、ハードディスク等の記憶装置である。このパラメータ記憶手段10に記憶されたパラメータは、コンテンツ紹介映像作成装置1の各手段によって適宜参照される。
【0031】
以下、パラメータ記憶手段10に記憶されたパラメータを具体的に説明する。
候補画像抽出区間は、コンテンツ映像内において、候補画像を抽出する区間を示すパラメータである。ここで、候補画像抽出区間は、視聴者が事前に知りたくない情報が新作番組の終盤に含まれる可能性があるため、コンテンツ映像の終盤を除いて、コンテンツ映像の先頭から8割までとしてもよい。
【0032】
候補画像抽出数は、候補画像を抽出する数を示すパラメータである。ここで、候補画像抽出数は、特に制限されないが、処理負荷が低くなるように、小さな値(例えば、100枚)に設定することが好ましい。
なお、候補画像とは、コンテンツ映像を構成する画像のうち、後記する選出画像として選出対象となる画像のことである。
【0033】
カット点検出区間は、候補画像の位置を基準として、カット点を検出する区間を示すパラメータである。第1実施形態では、カット点検出区間が1秒間に設定されることとする。
【0034】
動きベクトル検出区間は、候補画像の位置を基準として、動きベクトルを検出する区間を示すパラメータである。第1実施形態では、動きベクトル検出区間は、後記する候補映像区間と同じ区間(候補画像抽出区間を候補画像抽出数で等分割した区間)に設定されることとする。
【0035】
設定ジャンルは、コンテンツ映像に付加されたジャンルが、顔領域を検出する対象のジャンルであるか否かを判定する基準となるパラメータである。従って、設定ジャンルは、ドラマ、バラエティーといった人物が多く登場するジャンルが設定されることが好ましい。
【0036】
選出画像選出数は、選出画像を選出する数を示すパラメータである。
選出画像再生時間は、選出画像1枚あたりの再生時間を示すパラメータである。
なお、選出画像とは、コンテンツ映像を構成する画像のうち、コンテンツ紹介映像として表示される画像のことである。すなわち、選出画像は、コンテンツ映像を構成する画像のうち、視聴者が興味を示す可能性が高いと思われる画像である。
【0037】
ここで、選出画像選出数および選出画像再生時間は、コンテンツ紹介映像が短時間となるように設定することが好ましい。例えば、選出画像選出数を10枚に設定され、選出画像再生時間が1秒間に設定された場合、コンテンツ紹介映像は、10枚の選出画像を1秒ずつ再生した10秒の映像となる。
【0038】
なお、前記した各種パラメータは、コンテンツ紹介映像作成装置1のオペレータによって、パラメータ記憶手段10に予め設定される。また、各種パラメータは、視聴者が任意に設定することも可能である。例えば、図1の新作番組紹介画面Pgに候補映像抽出区間を入力するテキストボックス(不図示)を設け、このテキストボックスに入力された候補映像抽出区間をパラメータ記憶手段10に書き込む。これによって、視聴者が好きな区間でコンテンツ紹介映像を作成できる。この他、視聴者が視聴する前の時刻でコンテンツ紹介映像を作成してあらすじ映像とすることや、視聴者が視聴している最中にリアルタイムでコンテンツ紹介映像を更新することも可能である。
【0039】
候補画像データベース20は、候補画像抽出手段50が抽出した候補画像をタイムコードおよびコンテンツIDに対応付けて記憶するデータベースである。この候補画像データベース20は、後記する候補画像抽出手段50によって参照される。
【0040】
コンテンツ映像データベース30は、候補画像抽出手段50に入力されたコンテンツ映像をコンテンツIDに対応付けて記憶するデータベースである。このコンテンツ映像データベース30は、後記する紹介映像作成手段70によって参照される。
【0041】
選出画像データベース40は、選出画像をコンテンツIDに対応付けて記憶するデータベースである。例えば、選出画像データベース40は、コンテンツ映像のなかで視聴者によって指定された画像を選出画像として記憶する。
この他、他の視聴者が指定した画像がインターネットを介して送信された場合、選出画像データベース40は、送信されたこの画像を選出画像として記憶する。
【0042】
候補画像抽出手段50は、コンテンツ映像が入力されると共に、入力されたコンテンツ映像内に設定された候補画像抽出区間から候補画像抽出数(所定数)の候補画像を抽出するものであり、後記するカット点検出手段51を備える。具体的には、候補画像抽出手段50は、候補画像抽出区間を候補画像抽出数で等分割した候補映像区間をそれぞれ求め、各候補映像区間の先頭位置の画像を候補画像として抽出する。言い換えるなら、候補画像抽出手段50は、候補画像抽出区間を候補画像抽出数で等分割した位置にある画像を、候補画像としてそれぞれ抽出する。そして、候補画像抽出手段50は、抽出した全ての候補画像と、コンテンツ映像に付加されたコンテンツIDおよびジャンルとを候補画像順位付け手段60に出力する。
【0043】
また、候補画像抽出手段50は、入力されたコンテンツ映像をコンテンツIDに対応付けてコンテンツ映像データベース30に書き込む。さらに、候補画像抽出手段50は、抽出した候補画像をコンテンツIDおよびタイムコードに対応付けて候補画像データベース20に書き込む。なお、この候補画像データベース20の利用方法については、詳細を後記する。
【0044】
ここで、候補映像区間の先頭から選出画像再生時間(例えば、1秒間)の間にカット点が含まれる場合、コンテンツ紹介映像では、1秒未満でカットが切り替わり、視聴者にとって見づらくなる。そこで、カット点検出手段51によってカット点を検出し、コンテンツ紹介映像でカットが頻繁に切り替わる事態を防止することが好ましい。
【0045】
カット点検出手段51は、候補画像抽出手段50が抽出した候補画像ごとに、この候補画像の位置を基準としたカット点検出区間からカット点を検出するものである。具体的には、カット点検出手段51は、前後のフレーム画像における輝度変化や色変化によって、カット点を検出する。そして、候補画像抽出手段50は、カット点検出手段51が検出したカット点から選出画像再生時間だけ遡った位置の画像を候補画像として抽出する。
【0046】
以下、図3を参照して、カット点検出手段51を具体的に説明する(適宜図2参照)。
ここでは、カット点検出区間が1秒間に設定されているとする。また、候補画像抽出手段50が、時刻t,t,tの位置にある画像をそれぞれ候補画像として抽出したこととする。以後、時刻t,t,tの位置にある候補画像を候補画像t,t,tと呼ぶ。なお、各時刻の間には、t<t<t<tという関係が成立する。
【0047】
まず、カット点検出手段51は、候補画像tについて、カット点検出区間の開始時刻tから終了時刻ti+1までの1秒間でカット点を検出する。ここで、カット点が検出されないため、候補画像抽出手段50は、候補画像tをそのまま、コンテンツIDおよびジャンルと共に候補画像順位付け手段60に出力する。
【0048】
次に、カット点検出手段51は、候補画像tについて、カット点検出区間の開始時刻tから終了時刻tj+1までの1秒間でカット点を検出する。ここでは、時刻tでカット点が検出されたこととし、このカット点をカット点tと呼ぶ。この場合、候補画像抽出手段50は、候補画像tの代わりに、カット点tから1秒遡った位置にある候補画像tk-1を、コンテンツIDおよびジャンルと共に候補画像順位付け手段60に出力する。これによって、コンテンツ紹介映像作成装置1では、候補画像tk-1から1秒間、カット点が含まれることを防止できる。
【0049】
以下、図2に戻り、コンテンツ紹介映像作成装置1の構成について説明を続ける。
候補画像順位付け手段60は、候補画像抽出手段50から候補画像とコンテンツIDとジャンルとが入力され、コンテンツ紹介映像を作成するために候補画像を順位付けするものであり、スコア算出手段61と、選出画像選出手段63とを備える。
【0050】
スコア算出手段61は、入力された候補画像ごとに、選出画像を選出する基準となるスコアを算出するものである。まず、スコア算出手段61は、候補画像抽出手段50から入力されたジャンルに基づいて、顔領域大きさ情報をスコアとするか、または、動きベクトルの大きさの合計値をスコアとするか判定する。具体的には、スコア算出手段61は、候補画像抽出手段50から入力されたジャンルが設定ジャンルに属する場合、顔領域大きさ情報をスコアとして算出すると判定する。一方、スコア算出手段61は、候補画像抽出手段50から入力されたジャンルが設定ジャンルに属さない場合、動きベクトルの大きさの合計値をスコアとして算出すると判定する。
【0051】
<第1例:顔領域大きさ情報>
図4を参照し、顔領域大きさ情報からスコアを算出する方法について説明する(適宜図2参照)。
スコア算出手段61は、入力された候補画像の全てに対して、顔領域検出処理を施す。ここで、例えば、スコア算出手段61は、ViolaとJonesとが提案した顔領域検出処理を用いて、候補画像から人物顔を高速に検出する。このViolaとJonesとの顔領域検出処理は、オープンソースの画像処理・認識ライブラリであるOpenCVで公開されている(例えば、“http://opencv.jp/”を参照)。
【0052】
このViolaとJonesとの顔領域検出処理では、検出した顔領域の位置および半径が出力される。例えば、図4の候補画像では、大きく写った人物から顔領域αが検出され、その半径rαを顔領域αの大きさ情報とする。また、小さく写った人物から顔領域βが検出され、その半径rを顔領域βの大きさ情報とする。ここで、図4に示すように、スコア算出手段61は、1枚の候補画像から複数の顔領域α,βが検出された場合、顔領域αの半径rαおよび顔領域βの半径rβのうち、その値が最大となる半径rαをスコアとして算出する。例えば、顔領域αの半径rαが125ピクセルで、顔領域βの半径rβが86ピクセルである場合、この候補画像のスコアは、125となる。このように、スコア算出手段61は、入力された候補画像ごとに、その候補画像に含まれる顔領域が大きくなるほど、高いスコアを算出する。
【0053】
なお、スコア算出手段61は、ある候補画像から顔領域を1個しか検出しなかった場合、その顔領域の半径を、その候補画像のスコアとして算出する。また、スコア算出手段61は、ある候補画像から顔領域を1個も検出しなかった場合、その候補画像のスコアをゼロとする。また、スコア算出手段61は、顔領域α,βの半径rα,rβのうちの最大値をスコアとせずに、顔領域α,βの半径rα,rβの合計値をスコアとしてもよい。さらに、スコア算出手段61は、顔領域α,βの半径rα,rβを顔領域大きさ情報とせずに、顔領域α,βの面積を顔領域大きさ情報としてもよい。
【0054】
<第2例:動きベクトルの大きさの合計値>
以下、図2に戻り、動きベクトルの大きさの合計値からスコアを算出する方法について説明する(適宜図2参照)。
スコア算出手段61は、入力された候補画像ごとに、この候補画像の位置を基準とした動きベクトル検出区間から動きベクトルを検出する。そして、スコア算出手段61は、動きベクトル検出区間から検出された動きベクトルの大きさを合計し、その候補画像のスコアとする。例えば、スコア算出手段61は、動きベクトル検出区間内に位置する画像をそれぞれ、所定サイズのマクロブロックで走査して、動きベクトルを検出する(マクロブロック法)。
【0055】
以下、コンテンツ紹介映像作成装置1の構成について説明を続ける。
選出画像選出手段63は、入力された候補画像のうち、スコア算出手段61が算出したスコアが高い方から順に選出画像選出数(所定数)の候補画像を、選出画像として選出するものである。例えば、選出画像選出手段63は、選出画像選出数が10枚に設定されている場合、スコアが1位から10位までの候補画像を選出画像として選出する。また、選出画像選出手段63は、同じスコアの候補画像が2枚以上存在する場合、タイムコードが小さい方の候補画像を優先的に選出画像として選出する。そして、選出画像選出手段63は、選出した全ての選出画像とコンテンツIDとを紹介映像作成手段70に出力する。
【0056】
紹介映像作成手段70は、候補画像順位付け手段60から選出画像とコンテンツIDとが入力され、この選出画像が選出画像再生時間だけ再生されるように、コンテンツ紹介映像を作成するものである。ここで、スコアが高い順に選出画像が再生されるより、時系列で選出画像が再生される方が、視聴者にとって自然である。そこで、紹介映像作成手段70は、入力された選出画像をタイムコードでソートする。
【0057】
次に、紹介映像作成手段70は、入力されたコンテンツIDと同じコンテンツIDを有するコンテンツ映像を、コンテンツ映像データベース30から取得する。そして、紹介映像作成手段70は、取得したコンテンツ映像から、各選出画像の位置を基準として、選出画像再生時間の長さだけ映像を抽出する。その後、紹介映像作成手段70は、コンテンツ映像から抽出した映像を連結してコンテンツ紹介映像を作成する。
【0058】
例えば、選出画像選出数が10枚、選出画像再生時間が1秒間に設定されている場合を考える。この場合、紹介映像作成手段70は、10枚の選出画像を時系列にソートし、各選出画像の位置から1秒間の映像をコンテンツ映像から10区間抽出し、この10区間分の映像を連結して、10秒間のコンテンツ紹介映像を作成する。
この他、紹介映像作成手段70は、10枚の選出画像が1秒間ずつ再生されるようなコンテンツ紹介映像を作成してもよい。
【0059】
<候補画像データベースの利用方法>
以下、候補画像データベース20の利用方法について説明する。
前記したように、コンテンツ紹介映像作成装置1では、同一のコンテンツ映像が2回以上入力され、それぞれのコンテンツ映像からコンテンツ紹介映像を作成することがある。例えば、ある新作番組の前半部分(先頭から30分間)を収録したコンテンツ映像が入力された後、同じ新作番組の全体(先頭から60分間)を収録したコンテンツ映像が入力されることとする。
【0060】
新作番組の前半部分を収録したコンテンツ映像が入力されたとき(1回目の入力)、候補画像抽出手段50は、コンテンツ映像に付加されているコンテンツIDを検索キーとして、候補画像データベース20から候補画像を検索する。この場合、候補画像抽出手段50は、このコンテンツ映像の候補画像が候補画像データベース20に記憶されていないため、候補画像を1枚も取得できない。そこで、候補画像抽出手段50は、コンテンツ映像を等分割して候補画像を抽出する。さらに、候補画像抽出手段50は、抽出した全ての候補画像を、各候補画像のタイムコードおよびコンテンツIDに対応付けて候補画像データベース20に書き込む。以後、候補画像データベース20に書き込まれた候補画像を前半部分の候補画像と呼ぶ。その後、コンテンツ紹介映像作成装置1では、前記した手順にて、新作番組の前半部分を対象としたコンテンツ紹介映像が作成される。
【0061】
新作番組全体を収録したコンテンツ映像が入力されたとき(2回目の入力)、候補画像抽出手段50は、コンテンツIDを検索キーとして、候補画像データベース20から候補画像を検索する。この場合、候補画像抽出手段50は、前半部分の候補画像が候補画像データベース20に記憶されているため、この前半部分の候補画像を取得できる。また、候補画像抽出手段50は、候補画像データベース20から取得した前半部分の候補画像のうち、タイムコードが最も遅いものを確認する。つまり、候補画像抽出手段50は、コンテンツ映像のどの位置まで候補画像が既に抽出されているかを確認する。そして、候補画像抽出手段50は、新作番組全体のコンテンツ映像において、最も遅いタイムコードに対応する時刻から新作番組の終了時刻(例えば、60分)までの残り区間を等分割して、候補画像を抽出する。その後、コンテンツ紹介映像作成装置1では、前記した手順にて、新作番組全体を対象としたコンテンツ紹介映像が作成される。
【0062】
このように、一回抽出した候補画像を候補画像データベース20に記憶しておくことで、候補画像抽出手段50は、同一のコンテンツ映像で重複する部分(この例では、新作番組の前半部分)から、候補画像を繰り返し抽出する必要がない。
【0063】
[コンテンツ紹介映像作成装置の動作]
以下、図5を参照し、コンテンツ紹介映像作成装置1の動作について説明する(適宜図2参照)。
コンテンツ紹介映像作成装置1は、候補画像抽出手段50によって、コンテンツ映像内に設定された候補画像抽出区間から候補画像抽出数の候補画像を抽出する。具体的には、コンテンツ紹介映像作成装置1は、候補画像抽出手段50によって、候補画像抽出区間を候補画像抽出数で等分割した位置にある画像を候補画像として抽出する(ステップS1)。
【0064】
コンテンツ紹介映像作成装置1は、カット点検出手段51によって、候補画像ごとに、この候補画像の位置を基準としたカット点検出区間からカット点を検出する。具体的には、コンテンツ紹介映像作成装置1は、カット点検出手段51によって、前後のフレーム画像における輝度変化や色変化によって、カット点を検出する(ステップS2)。
【0065】
ステップS2の処理でカット点が検出された場合、コンテンツ紹介映像作成装置1は、候補画像抽出手段50によって、ステップS1で抽出した候補画像を、ステップS2で検出したカット点から選出画像再生時間だけ遡った位置の画像に変更する(ステップS3)。
【0066】
コンテンツ紹介映像作成装置1は、スコア算出手段61によって、候補画像ごとに、選出画像を選出する基準となるスコアを算出する。具体的には、コンテンツ紹介映像作成装置1は、スコア算出手段61によって、コンテンツ映像のジャンルが設定ジャンルに属する場合、候補画像の全てに対して顔領域検出処理を施し、検出した顔領域の半径を算出し、それら半径の最大値をスコアとして算出する。一方、コンテンツ紹介映像作成装置1は、スコア算出手段61によって、コンテンツ映像のジャンルが設定ジャンルに属さない場合、動きベクトル検出区間内で動きベクトルを検出し、それら動きベクトルの大きさを合計してスコアを算出する(ステップS4)。
【0067】
コンテンツ紹介映像作成装置1は、選出画像選出手段63によって、スコアが高い方から順に、選出画像選出数の候補画像を選出画像として選出する。ここで、同じスコアの候補画像が2以上存在する場合、コンテンツ紹介映像作成装置1は、選出画像選出手段63によって、タイムコードが小さい方の候補画像を優先的に選出画像として選出する(ステップS5)。
【0068】
コンテンツ紹介映像作成装置1は、紹介映像作成手段70によって、選出画像が選出画像再生時間だけ再生されるようにコンテンツ紹介映像を作成する。具体的には、コンテンツ紹介映像作成装置1は、紹介映像作成手段70によって、選出画像をタイムコードでソートし、コンテンツ映像から、各選出画像の位置を基準として、選出画像再生時間の長さだけ映像を抽出する。そして、コンテンツ紹介映像作成装置1は、紹介映像作成手段70によって、コンテンツ映像から抽出した映像を連結して、コンテンツ紹介映像を作成する(ステップS6)。
【0069】
以上のように、本願発明の第1実施形態に係るコンテンツ紹介映像作成装置1は、コンテンツ映像から候補画像抽出数だけ候補画像を抽出する。このため、コンテンツ紹介映像作成装置1は、コンテンツ映像全体をスコアの算出対象とする場合に比べて、少ない数の候補画像をスコアの算出対象とするため、低い処理負荷でスコアを算出できる。また、同一のコンテンツ映像が2回以上入力される場合、コンテンツ紹介映像作成装置1は、候補画像抽出手段50において、同一のコンテンツ映像で重複する部分から候補画像を繰り返し抽出することがない。これによって、コンテンツ紹介映像作成装置1は、例えば、2時間を越える長時間のコンテンツ映像であっても、新作番組の放送状況にあわせて、コンテンツ紹介映像を素早く作成することができる。つまり、コンテンツ紹介映像作成装置1は、高いリアルタイム性が要求される新作番組紹介サービスに最適である。
一方、従来のダイジェスト映像は、その作成に長い時間が必要になるため、放送開始直後であれば新作番組の前半部分からダイジェスト映像を作成し、放送終了後であれば新作番組全体からダイジェスト映像を作成するというように、新作番組の放送状況にあわせてダイジェスト映像を即座に作成することが困難である。
【0070】
また、コンテンツ紹介映像作成装置1では、コンテンツ紹介映像が短いため、視聴者が多数のコンテンツ紹介映像を視聴し、興味ある新作番組を探すことができる。これによって、コンテンツ紹介映像作成装置1は、従来技術に比べて、視聴者が多数の新作番組に触れる機会を増やすことができ、良好な新作番組紹介サービスを提供することができる。
一方、従来のダイジェスト映像は、1分程度に編集されているが、視聴者にとって長すぎるために好ましくない。
【0071】
さらに、コンテンツ紹介映像作成装置1は、カットが頻繁に切り替わる事態を防ぐことができるため、視聴者にとって極めて見やすいコンテンツ紹介映像を作成することができる。
【0072】
さらに、コンテンツ紹介映像は、新作番組の内容まで踏み込まずに、この新作番組のジャンル、雰囲気、登場人物などの情報を視聴者に伝えることを主眼としている。従って、顔領域の大きさを基準に順位付けされるため、コンテンツ紹介映像は、人物の顔が含まれるシーンが多くなり、視聴者にとって新作番組の内容が把握しやすい。
【0073】
(変形例1)
なお、第1実施形態では、選出画像選出手段63が、入力された候補画像から選出画像を選出するとして説明したが、これに限定されない。例えば、選出画像選出手段63は、入力された候補画像から選出画像を選出する代わりに、選出画像データベース40から選出画像を取得してもよい。具体的には、選出画像選出手段63は、コンテンツIDを検索キーとして、選出画像データベース40から選出画像を検索して取得する。そして、選出画像選出手段63は、選出画像データベース40から取得した選出画像をコンテンツIDと共に紹介映像作成手段70に出力する。これによって、選出画像選出手段63は、視聴者自身や他の視聴者が指定した選出画像をコンテンツ紹介映像に含めることができ、視聴者に対してジャンル等の様々な情報を提供しやすいコンテンツ紹介映像を作成できる。
【0074】
(変形例2)
なお、第1実施形態では、候補画像データベース20を各視聴者が個別に利用する例を説明したが、本発明は、これに限定されない。以下、変形例2として、候補画像データベース20を複数の視聴者で共有する例について説明する。
【0075】
前記したように、コンテンツ紹介映像作成装置1では、視聴者自身が、コンテンツ紹介映像を作成したい区間(つまり、候補映像抽出区間)を任意に設定できる。また、コンテンツ紹介映像作成装置1では、コンテンツ紹介映像を作成した際に、抽出した候補画像を候補画像データベース20に記憶させておくことができる。
【0076】
この場合、コンテンツ紹介映像作成装置1では、ある視聴者がコンテンツ紹介映像を作成する際、候補画像データベース20に既に記憶された候補画像を取得して、その視聴者が設定した候補映像抽出区間でコンテンツ紹介映像を即座に作成することもできる。このように、コンテンツ紹介映像作成装置1は、候補画像データベース20を複数の視聴者で共有することで、候補画像データベース20を有効活用でき、視聴者ごとに候補画像を抽出した場合に比べて、コンテンツ映像作成処理の負荷を軽減することができる。
【0077】
(第2実施形態)
[コンテンツ紹介映像作成装置の構成]
以下、図6を参照して、本願発明の第2実施形態に係るコンテンツ紹介映像作成装置1Bの構成について、第1実施形態と異なる点を説明する。第2実施形態では、図2の候補画像抽出手段50の代わりに、候補画像順位付け手段60Bがカット点検出手段62を備える点が大きく異なる。
【0078】
図6に示すように、コンテンツ紹介映像作成装置1Bは、パラメータ記憶手段10と、候補画像データベース(候補画像記憶手段)20と、コンテンツ映像データベース30と、選出画像データベース(選出画像記憶手段)40と、候補画像抽出手段50Bと、候補画像順位付け手段60Bと、紹介映像作成手段70とを備える。
【0079】
候補画像抽出手段50Bは、カット点を検出しない以外、図2の候補画像抽出手段50と同様のものである。つまり、候補画像抽出手段50Bは、カット点に関わりなく、候補画像抽出区間を候補画像抽出数で等分割した位置にある画像を、候補画像として抽出する。
【0080】
候補画像順位付け手段60Bは、コンテンツ紹介映像を作成するために候補画像を順位付けするものであり、スコア算出手段61と、カット点検出手段62と、選出画像選出手段63Bとを備える。
【0081】
カット点検出手段62は、図2のカット点検出手段51と同様、選出画像選出手段63Bが選出した選出画像ごとに、この選出画像の位置を基準としたカット点検出区間からカット点を検出するものである。そして、カット点検出手段62は、検出したカット点を示す情報を選出画像選出手段63Bに出力する。
【0082】
選出画像選出手段63Bは、図2の選出画像選出手段63と同様に選出画像を選出するものである。また、選出画像選出手段63Bは、カット点検出手段62がカット点を検出した場合、検出されたカット点から選出画像再生時間だけ遡った位置の画像を選出画像として抽出する。
【0083】
以下、図3に戻り、時刻tの位置にある選出画像tを例として説明する。
ここで、カット点検出手段62は、選出画像tについて、カット点検出区間の開始時刻tから終了時刻tj+1までの1秒間でカット点を検出する。ここでは、時刻tでカット点が検出されたこととする。この場合、カット点検出手段62は、選出画像tの代わりに、カット点tから1秒遡った位置にある選出画像tk-1を紹介映像作成手段70に出力する。これによって、コンテンツ紹介映像作成装置1Bでは、選出画像tk-1から1秒間、カット点が含まれることを防止できる。
【0084】
[コンテンツ紹介映像作成装置の動作]
以下、図7を参照し、コンテンツ紹介映像作成装置1Bの動作について説明する(適宜図6参照)。
なお、ステップS11,S12,S13,S16の処理は、図5のステップS1,S4,S5,S6と同様の処理であるため、説明を省略する。
【0085】
コンテンツ紹介映像作成装置1Bは、カット点検出手段62によって、ステップS13で選出した選出画像ごとに、この選出画像の位置を基準としたカット点検出区間からカット点を検出する(ステップS14)。
【0086】
ステップS14の処理でカット点が検出された場合、コンテンツ紹介映像作成装置1Bは、選出画像選出手段63Bによって、ステップS13で選出した選手画像を、ステップS14で検出したカット点から選出画像再生時間だけ遡った位置の画像に変更する(ステップS15)。
【0087】
以上のように、本願発明の第2実施形態に係るコンテンツ紹介映像作成装置1Bは、第1実施形態と同様、カットが頻繁に切り替わること防止でき、視聴者にとって見やすいコンテンツ紹介映像を素早く作成することができる。
【0088】
なお、各実施形態では、コンテンツの一例として新作番組をあげて説明したが、本願発明が対象とするコンテンツは、新作番組に限定されないことは言うまでもない。
また、各実施形態では、コンテンツ紹介映像作成装置1をSNSに利用する例をあげて説明したが、コンテンツ紹介映像作成装置1は、これに限定されない。例えば、本願発明に係るコンテンツ紹介映像作成装置は、ハードディスクレコーダ等の映像蓄積装置に内蔵され、この装置に蓄積された各映像からコンテンツ紹介映像を作成することができる。
【0089】
なお、各実施形態では、コンテンツ紹介映像作成装置1を独立した装置として説明したが、本願発明では、一般的なコンピュータのCPU、メモリ等のハードウェア資源を、前記した各手段として協調動作させるコンテンツ紹介映像作成プログラムによって実現することもできる。このコンテンツ紹介映像作成プログラムは、通信回線を介して配布しても良く、CD−ROMやフラッシュメモリ等の記録媒体に書き込んで配布しても良い。
【符号の説明】
【0090】
1,1B コンテンツ紹介映像作成装置
10 パラメータ記憶手段
20 候補画像データベース(候補画像記憶手段)
30 コンテンツ映像データベース
40 選出画像データベース(選出画像記憶手段)
50,50B 候補画像抽出手段
51,62 カット点検出手段
60,60B 候補画像順位付け手段
61 スコア算出手段
63,63B 選出画像選出手段
70 紹介映像作成手段

【特許請求の範囲】
【請求項1】
コンテンツを紹介する映像であるコンテンツ紹介映像を作成するコンテンツ紹介映像作成装置であって、
前記コンテンツのジャンルを付加したコンテンツ映像が入力され、入力された当該コンテンツ映像内に予め設定された候補画像抽出区間から所定数の候補画像を抽出する候補画像抽出手段と、
前記コンテンツ映像に付加されたジャンルが予め設定された顔領域検出対象の設定ジャンルに属するか否かを判定し、前記設定ジャンルに属すると判定した場合、前記候補画像抽出手段によって抽出された候補画像の顔領域大きさ情報をスコアとして算出し、前記設定ジャンルに属さないと判定した場合、前記コンテンツ映像内における候補画像の位置を基準に予め設定された動きベクトル検出区間から検出した動きベクトルの大きさの合計値を前記スコアとして算出するスコア算出手段と、
前記スコア算出手段によって算出されたスコアが高い方から順に、所定数の前記候補画像を選出画像として選出する選出画像選出手段と、
前記選出画像選出手段によって選出された選出画像が、予め設定された選出画像1枚あたりの再生時間である選出画像再生時間だけ再生されるように、前記コンテンツ紹介映像を作成する紹介映像作成手段と、
を備えることを特徴とするコンテンツ紹介映像作成装置。
【請求項2】
前記コンテンツ映像内における候補画像の位置を基準として、予め設定されたカット点検出区間からカット点を検出するカット点検出手段をさらに備え、
前記候補画像抽出手段は、前記カット点が検出された場合、検出された当該カット点から前記選出画像再生時間だけ遡った位置の画像を前記候補画像として抽出することを特徴とする請求項1に記載のコンテンツ紹介映像作成装置。
【請求項3】
前記コンテンツ映像内における選出画像の位置を基準として、予め設定されたカット点検出区間からカット点を検出するカット点検出手段をさらに備え、
前記選出画像選出手段は、前記カット点が検出された場合、検出された当該カット点から前記選出画像再生時間だけ遡った位置の画像を前記選出画像として選出することを特徴とする請求項1に記載のコンテンツ紹介映像作成装置。
【請求項4】
前記スコア算出手段は、前記候補画像から顔領域を検出し、検出された当該顔領域の半径または面積を前記顔領域大きさ情報として算出し、前記候補画像から複数の顔領域が検出された場合、前記顔領域大きさ情報の最大値または合計値を前記スコアとして算出することを特徴とする請求項1から請求項3の何れか一項に記載のコンテンツ紹介映像作成装置。
【請求項5】
前記候補画像を前記コンテンツの識別情報に対応付けて記憶する候補画像記憶手段をさらに備え、
前記候補画像抽出手段は、前記識別情報がさらに付加されたコンテンツ映像が入力され、入力された当該コンテンツ映像から抽出した候補画像を当該コンテンツ映像に付加された識別情報に対応付けて前記候補画像記憶手段に書き込むと共に、前記識別情報に基づいて、当該入力されたコンテンツ映像と同一のコンテンツ映像の候補画像が前記候補画像記憶手段に記憶されているか否かを判定し、当該候補画像が記憶されていると判定した場合、前記候補画像記憶手段から当該候補画像を読み出すことを特徴とする請求項1から請求項4の何れか一項に記載のコンテンツ紹介映像作成装置。
【請求項6】
コンテンツを紹介する映像であるコンテンツ紹介映像を作成するために、コンピュータを、
前記コンテンツのジャンルを付加したコンテンツ映像が入力され、入力された当該コンテンツ映像内に予め設定された候補画像抽出区間から所定数の候補画像を抽出する候補画像抽出手段、
前記コンテンツ映像に付加されたジャンルが予め設定された顔領域検出対象の設定ジャンルに属するか否かを判定し、前記設定ジャンルに属すると判定した場合、前記候補画像抽出手段によって抽出された候補画像の顔領域大きさ情報をスコアとして算出し、前記設定ジャンルに属さないと判定した場合、前記コンテンツ映像内における候補画像の位置を基準に予め設定された動きベクトル検出区間から検出した動きベクトルの大きさの合計値を前記スコアとして算出するスコア算出手段、
前記スコア算出手段によって算出されたスコアが高い方から順に、所定数の前記候補画像を選出画像として選出する選出画像選出手段、
前記選出画像選出手段によって選出された選出画像が、予め設定された選出画像1枚あたりの再生時間である選出画像再生時間だけ再生されるように、前記コンテンツ紹介映像を作成する紹介映像作成手段、
として機能させることを特徴とするコンテンツ紹介映像作成プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2012−105119(P2012−105119A)
【公開日】平成24年5月31日(2012.5.31)
【国際特許分類】
【出願番号】特願2010−252590(P2010−252590)
【出願日】平成22年11月11日(2010.11.11)
【出願人】(000004352)日本放送協会 (2,206)
【Fターム(参考)】