説明

特徴ベクトル生成装置、検索装置、特徴ベクトル生成方法、検索方法及びプログラム

【課題】各コンテンツを、放送局や放送日時などの各コンテンツに付属する情報に依存することなく同定することのできるデータの生成方法及びそれを用いた検索装置を提供する。
【解決手段】第1のコンテンツデータから可変部分を検出し、可変部分の削除された第1のコンテンツデータの特徴的な状態が出現する各時点を示す情報を基に、当該第1のコンテンツデータの特徴を示す第1の特徴ベクトルを生成し、コンテンツデータの特徴的な状態が出現する各時点を示す情報を基に生成された、当該コンテンツデータの特徴を示す特徴ベクトルを、当該コンテンツデータ及び当該コンテンツデータのメタデータのうちの少なくとも一方に対応付けて記憶する記憶手段に記憶された複数の特徴ベクトルのなかから、第1の特徴ベクトルと類似する特徴ベクトルを検索する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、コンテンツを同定するためのデータの生成方法およびそれを用いた検索装置に関する。
【背景技術】
【0002】
従来、コンテンツを検索する際には、各コンテンツに何らかの方法に付与したIDを用いる方法がある。放送コンテンツの場合には、放送日時や放送局をキーに所望のコンテンツを検索していた。
【0003】
各視聴者はコンテンツに応じたコミュニティに参加し、試聴しているコンテンツからコミュニティを同定する方法が開示されているが(例えば、特許文献1参照)は、この手法は、当該コンテンツに対応する日時とチャンネルからコミュニティを同定するというものである。
【0004】
また、コンテンツと対話画面の同期を取る場合に、当該コンテンツに予め埋め込まれている同期データを用いるという技術も開示されている(例えば、特許文献2参照)。
【0005】
しかし、放送コンテンツには、コンテンツIDが付いておらず、また地域によって、放送日時や放送局が異なるため、従来の技術では、コンテンツを同定することが困難な場合があった。
【特許文献1】特開2001−148841公報
【特許文献2】特開2001−298431公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
このように、放送局や放送日時からコンテンツを検索する場合、再放送や地域の違いによって放送日時やチャンネルが異なり、それらを基にした検索はできないという問題点があった。
【0007】
そこで、本発明は、各コンテンツを、放送局や放送日時などの各コンテンツに付属する情報に依存することなく同定することのできるデータの生成方法及び装置を提供することを目的とする。また、当該データを用いて、コンテンツや、コンテンツのメタデータを容易に検索することのできる検索方法及び装置を提供することを目的とする。
【課題を解決するための手段】
【0008】
時系列な第1のコンテンツデータから可変部分を検出し、可変部分の削除された第1のコンテンツデータの特徴的な状態が出現する各時点を示す情報を基に、当該第1のコンテンツデータの特徴を示す第1の特徴ベクトルを生成し、時系列なコンテンツデータの特徴的な状態が出現する各時点を示す情報を基に生成された、当該コンテンツデータの特徴を示す特徴ベクトルを、当該コンテンツデータ及び当該コンテンツデータのメタデータのうちの少なくとも一方に対応付けて記憶する記憶手段に記憶された複数の特徴ベクトルのなかから、第1の特徴ベクトルと類似する特徴ベクトルを検索する。
【発明の効果】
【0009】
本発明によれば、各コンテンツを、放送局や放送日時などの各コンテンツに付属する情報に依存することなく同定することができる。
【発明を実施するための最良の形態】
【0010】
以下、本発明の実施形態について図面を参照して説明する。
【0011】
以下の実施形態では、入力されたコンテンツデータ(以下、簡単にコンテンツとも呼ぶ)から当該コンテンツの固有の特徴を示すとともに、当該コンテンツを識別するための特徴ベクトルを生成し、この特徴ベクトルを用いて、コンテンツや当該コンテンツに対応するメタデータを検索する検索システムについて説明する。
【0012】
ここでは、コンテンツは、静止画や動画像などの画像データ(映像データ)と音声データを含む時系列なデータであり、このコンテンツの映像や音声上の特徴的な状態(例えば、シーンチェンジ、無音区間、及び音量が予め定められたレベル以上の状態など)が出現する各時点を示す情報(例えば、各時点までの時間)を基に、上記特徴ベクトルを生成する。
【0013】
まず、第1の実施形態として、以下の実施形態で説明する検索システムに含まれる特徴ベクトル生成装置について説明する。
【0014】
(第1の実施形態)
図1は、コンテンツ検索システムの要部である特徴ベクトル生成装置の構成例を示したもので、コンテンツが入力されるコンテンツ入力部1と、入力されたコンテンツから可変部分を検出する可変部分検出部2と、可変部分の削除されたコンテンツの不可変部分から特徴ベクトルを検出する特徴ベクトル計算部3と、特徴ベクトル計算部3で計算された特徴ベクトルを記憶するための特徴ベクトル記憶部4を含む。
【0015】
図2は、図1の特徴ベクトル生成装置の処理動作(特徴ベクトル生成処理動作)を説明するためのフローチャートである。以下、図2を参照して、図1の各部について説明する。
【0016】
まず、コンテンツ入力部1からコンテンツが入力される(ステップS1)。コンテンツとは例えば録画された放送コンテンツや、市販されているDVDコンテンツなどである。
【0017】
可変部分検出部2は、コンテンツ入力部1から入力されたコンテンツから可変部分を検出する(ステップS2)。可変部分とはコンテンツの中で、差し換えや省略が発生する部分であり、例えばCM(コマーシャル・メッセージ)部分である。CM部分を検出する方法は例えば、以下に示すような方法がある。(1)カット検出を行い、その検出時間が15秒(または30秒)毎に検出される部分をCM部分と判定する。(2)CMの前後で無音区間があることを利用して、無音区間が15秒(または30秒)毎に検出された場合、その無音区間をCM部分と判定する。(3)音声がモノラルの番組コンテンツの時にステレオ放送の部分をCMと判定する。(4)CMの画像パターンを記憶しておき、その画像パターンとマッチする部分をCM部分と判定する。(5)例えば特開2003−257160に開示されているような、TV信号の音声モード、TV信号における映像信号レベルパターン、音声信号レベルパターンを利用してCM区間を検出する。これは、例えば、番組コンテンツが二カ国語放送の場合に、そうでない部分をCM部分と判定する。
【0018】
可変部分検出部2では、上記のうちのいずれかの方法を用いて、あるいは、上記方法のいくつか組み合わせて用いることにより、入力されたコンテンツからCM部分を検出する。
【0019】
上記(4)の方法において、CMの画像パターンを記憶する場合には、例えば、上記(5)の方法を用いて、音声モードの違いによりCM区間が判定されたとき、当該CM区間の画像パターンを記憶しておき、その記憶パターンと同一の映像の場合にCMであると判定する。また、例えば、上記(3)の方法を用いて、モノラル放送の番組コンテンツの場合に、ステレオで放送があると、その区間をCMと判定し、当該区間の画像パターンを記憶する。なお、画像パターンの記憶は、全ての時刻において記憶する必要はなく、例えば5秒間隔で記憶する。また記憶する画像も画像サイズを間引いて小さくしたり、カラーからモノクロに変換したりして、データサイズを小さくすることが望ましい。記憶された画像パターンは、輝度値の数列となり、これをベクトルとして、コンテンツと比較することにより、CM区間を特定することができる。
【0020】
また、可変部分検出部2は、番組コンテンツの前後の主題歌(オープニングテーマ、エンディングテーマ)の流れる部分も可変部分と判定する。コンテンツの最初や最後の近くで歌の部分を可変部分と判定する。また、週毎、日毎、など一定時間毎に(周期的に)同じ特徴ベクトルが生成される部分を可変部分とすることも可能である。
【0021】
このようにして、コンテンツから可変部分が検出された場合には(ステップS3)、ステップS4へ進み、当該可変部分を当該コンテンツから削除する。
【0022】
可変部分は主にCMの部分であるが、CM以外に前後の主題歌の部分や周期的に同様の特徴ベクトルが生成される部分など、可変部分にはいくつかの種類がある。特徴ベクトルを作成する際にこれらの種類によって削除する可変部分を選択してもよい。例えばCMの部分は削除せず、前後の主題歌の部分だけ削除するなどである。このことにより、CMを検索することが目的の場合には、CM部分を削除せずに特徴ベクトルを生成することも可能である。
【0023】
ステップS4で、入力されたコンテンツから可変部分を削除すると、次に、ステップS5へ進み、特徴ベクトル計算部3は、特徴ベクトルを生成するために、まず、可変部分の削除されたコンテンツから、特徴タイミング、すなわち、当該コンテンツのシーン(場面)の変化する(シーンチェンジする)時点あるいは無音区間の出現する時点(例えば、無音区間の開始時点)あるいは、音量が予め定められたレベル以上となる時点などを検出する。
【0024】
シーンチェンジ、無音区間及び音量が予め定められたレベル以上となる状態のうちのいずれか2つ以上を組み合わせて、それぞれを特徴タイミングとして検出してもよいし、シーンチェンジ、無音区間及び音量が予め定められたレベル以上となる状態のうちのいずれか1つを特徴タイミングとして検出してもよい。
【0025】
シーンの変化する(切り替わる)時点とは、コンテンツ内で動きの大きい時点、すなわち、画像全体が大きく変化する時点を言う。シーンチェンジを検出する方法としては、時系列画像で前後の画像が大きく違う時点を検出する。また他にはMPEGの動きベクトルから求めることもでき、公知効用の技術を用いればよい。
【0026】
無音区間の検出方法としては、コンテンツの音声のレベル(音の大きさ)が、ある閾値よりも小さい部分を無音区間として判定する。この場合、例えば、無音区間の開始時点を特徴タイミングとして検出する。
【0027】
このようにして、可変部分の削除されたコンテンツから各特徴タイミングが検出されると、次に、ステップS6へ進み、特徴ベクトル計算部3は、検出された特徴タイミングから特徴ベクトルを生成する。特徴ベクトル計算部3は、検出された特徴タイミングの数と、可変部分の削除されたコンテンツの先頭から各特徴タイミングまでの時間を用いて、特徴ベクトルを求める。ここでは、コンテンツを当該コンテンツ中から検出された特徴タイミングで区切った各区間をセグメントと呼ぶ。特徴ベクトルは、この各セグメントの時間長を示す数値を先頭から順に一列に並べた数列である。この数列中の数値の数は、コンテンツ中のシーンチェンジ、無音区間の出現回数など、コンテンツの特徴を示す特徴タイミングの数に等しい。
【0028】
例えば、あるコンテンツにおいて、特徴タイミングが先頭から5秒後、8秒後、16秒後に検出された場合には、各セグメントの長さは「5、3、8」となるから、これを特徴ベクトルとする。
【0029】
セグメントの時間長が非常に短い場合、例えば、1秒以下の間隔で特徴タイミングが連続している場合、1秒以下を切り上げて、セグメントの時間長を1秒単位で示すようにしてもよい。例えば、特徴タイミングが先頭から0.2秒後、1.8秒後、2.2秒後、3.5秒後にある場合、各セグメントの長さを1/10秒単位で示すと、「0.2、1.6、0.4、1.3」となるが、各セグメントの長さを1秒単位で示すと、「1、1、1、1」となる。前者の方がより詳細度あるいは精度の高い特徴ベクトルであると云える。
【0030】
ここでは、各セグメントの時間長を先頭から順に並べた数列を特徴ベクトルとしているが、この場合に限らず、例えば、(可変部分の削除された)コンテンツの先頭から各特徴タイミングが検出された時点までの時間長を示す数値を先頭から順に一列に並べた数列であってもよい。すなわち、特徴タイミングが先頭から5秒後、8秒後、16秒後に検出された場合には、「5、8、16」を特徴ベクトルとして用いることもできる。
【0031】
このように、特徴ベクトルは、コンテンツ中でのシーンチェンジあるいは無音区間の出現パターンなどコンテンツの特徴を示しているといえる。
【0032】
特徴ベクトル計算部3は、上記のようにして、特徴ベクトルを生成するとともに、当該コンテンツから、各特徴タイミングの検出された時点における画像(好ましくは実際の画像よりも解像度を小さくした画像)や、音声データ、音量などの特徴情報を抽出してもよい。
【0033】
ステップS7では、ステップS6で生成された特徴ベクトルと、当該特徴ベクトルに対応する、コンテンツ入力部1から入力されたコンテンツとを特徴ベクトル記憶部4に記憶する。特徴ベクトル計算部3が、特徴ベクトルを生成するとともに、当該コンテンツから各特徴タイミングにおける上記特徴情報を抽出する場合には、この各特徴タイミングにおける特徴情報を上記特徴ベクトル中の対応する各数値(各特徴タイミング)に対応つけて特徴ベクトル記憶部4に記憶する。
【0034】
なお、上記説明では、特徴ベクトル計算部3では、可変部分が削除されたコンテンツから特徴ベクトルを求めていたが、特徴ベクトルは可変部分を含むコンテンツの全体から求めておき、特徴ベクトルから可変部分を取り除くために、特徴ベクトルを当該コンテンツの可変部分が出現する場所(時間)情報と組にして、特徴ベクトル記憶部4で記憶しても、同様の効果が得られる。
【0035】
以上のようにして、放送コンテンツやDVDコンテンツから、各コンテンツの識別子と用いられる特徴ベクトルが計算される。
【0036】
この特徴ベクトルの特徴は、可変部分、つまりCM部分を除いて特徴ベクトルを求めていることと、コンテンツ中でのシーンチェンジあるいは無音区間の出現パターンなどのコンテンツの特徴を示しているために、放送日時や放送局などのコンテンツに付属する情報に依存しない、コンテンツの内容そのもののみに依存するという点である。つまり、地域によって放送日時や放送局が違ったり、また再放送などによって、途中のCMが違っていても、コンテンツの内容が同じであれば、同様の特徴ベクトルを得ることができるのである。
【0037】
(第2の実施形態)
図3は、図1の特徴ベクトル生成装置を用いた、第2の実施形態にかかる検索システムの構成例を示したものである。なお、図3において、図1と同一部分には同一符号を付し、異なる部分についてのみ説明する。すなわち、図3では、図1の特徴ベクトル生成装置の各構成部のほかに、上記特徴ベクトルを用いてコンテンツを検索するための検索部5、コンテンツを記憶するためのコンテンツ記憶部6が追加されている。
【0038】
特徴ベクトル記憶部4には、図4に示すように、放送コンテンツから、上記特徴ベクトル生成装置で生成された、当該放送コンテンツを識別することのできる特徴ベクトルや特徴情報、コンテンツ記憶部6などに記憶される各放送コンテンツを読み出すための当該放送コンテンツへのリンク情報(例えば、当該放送コンテンツの記憶領域のアドレスなど)などが記憶されている。特徴ベクトル記憶部4では、特徴ベクトル、特徴情報、コンテンツへのリンク情報を含むレコードデータに対し、データIDを付して記憶している。なお、レコードデータには、リンク情報の代わりにコンテンツそのものが含まれていてもよい。いずれにしても、特徴ベクトルや特徴情報が、コンテンツに対応づけて記憶されていればよい。すなわち、後述する検索部5で、あるレコードデータが検索されたときには、当該レコードデータに含まれる特徴ベクトルや特徴情報に対応するコンテンツを特定できればよい。
【0039】
コンテンツ入力部1には、コンテンツ格納要求とともにコンテンツが入力される場合と、コンテンツ検索要求とともにコンテンツが入力される場合とがある。
【0040】
コンテンツ入力部1に、コンテンツ格納要求とともにコンテンツが入力された場合の特徴ベクトル生成処理を含むコンテンツ格納処理動作は、第1の実施形態と同様である。すなわち、第1の実施形態で説明したように、当該コンテンツから特徴ベクトルを生成し、図4に示したように、特徴ベクトル記憶部4に、特徴ベクトル、特徴情報、コンテンツへのリンク情報、及びデータIDを1組するとするレコードデータを記憶し、コンテンツ記憶部6に当該コンテンツを記憶する。
【0041】
コンテンツ入力部1に、コンテンツ検索要求とともにコンテンツが入力された場合には、第1の実施形態で説明したように、当該コンテンツから特徴ベクトルを生成し、検索部5は、この生成された特徴ベクトルを検索条件として用いて、特徴ベクトル記憶部4に記憶されているレコードデータのなかから検索条件の特徴ベクトルを含むレコードデータを検索する。検索されたレコードデータから、所望のコンテンツを得る。
【0042】
以下、コンテンツ入力部1にコンテンツ検索要求が入力された場合について説明する。
【0043】
コンテンツ入力部1にコンテンツ検索要求とともに入力されたコンテンツから特徴ベクトルを生成する処理動作は、第1の実施形態と同様である。ここでは、特徴ベクトルaが生成されたとする。特徴ベクトル計算部3は、生成された特徴ベクトルaを検索部5に渡す。検索部5は、受け取った特徴ベクトルaを検索条件として用いて、特徴ベクトルaに類似した特徴ベクトル含むレコードデータを特徴ベクトル記憶部4から検索する。
【0044】
上記特徴ベクトル生成処理において、可変部分を取り除いたコンテンツから特徴ベクトルを生成する場合には、特徴ベクトル記憶部4に記憶されている特徴ベクトルと、検索条件としての特徴ベクトルを、そのまま用いて検索する。
【0045】
一方、上記特徴ベクトル生成処理において、特徴ベクトルが可変部分を含むコンテンツの全体から生成される場合には、特徴ベクトル記憶部4に記憶されている特徴ベクトルと、検索条件としての特徴ベクトルのそれぞれから、当該可変部分のデータを取り除いて、検索を行う。この場合、可変部分のデータは、前述したように、特徴ベクトル記憶部4に記憶されているから、特徴ベクトル記憶部4に記憶されている特徴ベクトルから可変部分のデータを取り除く場合には、この特徴ベクトル記憶部4に記憶されている可変部分のデータ(可変部分の場所(時間)を示すデータ)を用いる。
【0046】
いずれの場合においても検索時には、可変部分、すなわち、CM部分を取り除いたコンテンツの特徴ベクトルを用いて検索を行う。再放送や、地域差によりコンテンツ内にあるCMが違っていても、コンテンツを同定することができる。
【0047】
検索部5では、特徴ベクトル記憶部4に記憶されている特徴ベクトルと検索条件の特徴ベクトルとの間の類似度を計算して検索を行う。ここでは、例えば、特徴ベクトル記憶部4に記憶されている各特徴ベクトルと検索条件の特徴ベクトルとの間で内積を計算することで、両者の類似度を求める。
【0048】
なお、特徴ベクトルの数列からn−gramを用いて検索することも可能である。例えば、特徴ベクトル記憶部4に記憶されている特徴ベクトルから、検索条件の特徴ベクトル中のあるN個の連続する数値を含む特徴ベクトルを検索する。n−gramを用いて検索することにより、例えば特徴ベクトル記憶部4に記憶されている特徴ベクトルが可変部分を除いたコンテンツ全体に対し生成されたものであり、また、検索条件の特徴ベクトルaがあるコンテンツの1部分だけの断片から生成された場合でも、特徴ベクトル記憶部4に記憶された特徴ベクトルから、特徴ベクトルaが類似している特徴ベクトルを検索することが可能であり、またその類似個所を特定することも可能である。この場合、検索クエリとなる特徴ベクトルは、全ての特徴タイミングから生成されなくてもよい。全ての特徴タイミングの数が多すぎる場合には、一定量の長さになるように、例えば先頭から200個というように、一定量の特徴タイミングのみから特徴ベクトルを生成するように、上限を設定してもよい。
【0049】
また、検索部5は、特徴ベクトルに含まれる、各セグメントの時間長について、ヒストグラムを作成し、特徴ベクトル記憶部4に記憶されている各特徴ベクトルと検索条件の特徴ベクトルとの間で、そのヒストグラムの類似度を計算して、検索を行うようにしてもよい。この場合、特徴ベクトル記憶部4に記憶されている特徴ベクトルと検索条件の特徴ベクトルとの間で、各セグメントの時間長のヒストグラムにおいて、各時間長の頻度の差の和がある閾値を越えない場合、2つの特徴ベクトルは類似しているとみなす。
【0050】
この方法により計算される類似度は、特徴ベクトル毎に、どのくらいの頻度で同じ特徴タイミングが存在するかに基づく類似度であり、各セグメントの順番に因らないため、検索コストが少ない。よってこのヒストグラムを用いた検索を前処理として用いて、特徴ベクトル記憶部4に記憶されている全特徴ベクトルのなかから、検索条件の特徴ベクトルaのヒストグラムと類似する特徴ベクトルを予め検索しておき、この絞り込まれた各特徴ベクトルと検索条件の特徴ベクトルaとの間で、内積を用いた検索方法やn−gramを用いた検索方法により、検索条件の特徴ベクトルaと類似する特徴ベクトルを特定する。
【0051】
また、図4に示すように、特徴ベクトル記憶部4に、特徴ベクトルとともに、各特徴タイミングにおける特徴情報(画像、音声、音量などの情報)が記憶され、検索部5に、検索条件として特徴ベクトルaとともに、各特徴タイミングにおける特徴情報(画像、音声、音量などの情報)が、特徴ベクトル計算部3から渡される場合には、特徴ベクトル間の類似度のほかに、特徴タイミング毎の特徴情報を比較して、より詳細な検索を行う。画像の類似度や、音声データ・音量の類似度の算出方法は、公知効用の技術を用いれば容易に行える。例えば、画像の類似度は、画像を輝度値のベクトルに変換し、内積を計算してベクトル同士の比較を行い、その類似性を計算する。また音量の類似度は、2つの音量の差が予め定められた閾値以下の場合に類似しているとみなす。
【0052】
同じコンテンツであっても、特徴ベクトル計算部3で必ず全く同じ特徴ベクトルが生成されるとは限らない。すなわち、特徴ベクトル計算部3で当該コンテンツから特徴ベクトルを生成する度に、特徴タイミングが検出される位置がずれて、多少異なる特徴ベクトルが生成されてしまうことは否めない。しかし、検索部5で、上記のような特徴ベクトル間の類似性を基に検索を行うことにより、ある程度の違いは吸収することができる。
【0053】
このように、検索部5では、検索条件の特徴ベクトルaと類似する特徴ベクトルを特徴ベクトル記憶部4から検索して、当該特徴ベクトルaと最も類似する特徴ベクトルを含むレコードデータ、すなわち、検索条件にマッチするコンテンツを検索する。
【0054】
上記第2の実施形態にかかる検索システムによれば、放送時間や放送局が異なっていたり、地域により違うCMが含まれている同じ内容のコンテンツに、検索条件として上記特徴ベクトルが与えられれば、このような違いに関わりなく、所望のコンテンツを容易にしかも確実に検索することができる。
【0055】
なお、上記第2の実施形態では、放送コンテンツから特徴ベクトルを生成し、放送コンテンツを検索する場合を例にとり説明した、放送コンテンツに限らず、市販のDVDなどに記憶されているコンテンツについても、上記同様であり、上記同様の効果が得られる。市販のDVDに記憶されるコンテンツの場合には、内容は似ているが、少しの違いを含む場合がある。例えば編集のしかたが異なるバージョンが別のパッケージとして販売されている。これらを似ているコンテンツであるとして検索することができる。この場合は可変部分検出部2は、DVDのバージョンによって違う特典映像などを検出したり、または、DVDに含まれる宣伝情報などを検出して、その可変部分を別に扱うことにより、類似コンテンツの検出を容易にすることができる。
【0056】
(第3の実施形態)
図5は、図1の特徴ベクトル生成装置を用いた、第3の実施形態にかかる検索システムの構成例を示したもので、サーバ100と複数のクライアント101とからなる、クライアント・サーバシステムである。なお、図5において、図1及び図3と同一部分には同一符号を付している。クライアント101は、コンテンツ入力部1、可変部分検出部2、特徴ベクトル計算部3と、さらに、サーバ100と通信を行うための通信部7、メタデータ出力部9を有する。クライアント101には、受信した放送コンテンツや、DVDなどの記録媒体から読み出されたコンテンツを再生・表示するコンテンツ閲覧装置102が接続されている。
【0057】
サーバ100は、各クライアント101と通信を行うための通信部8、特徴ベクトル記憶部4、検索部5を有する。
【0058】
クライアント101のコンテンツ入力部1には、メタデータ格納要求とともにコンテンツ及び当該コンテンツに対するメタデータが入力される場合と、検索要求とともにコンテンツが入力される場合とがある。
【0059】
コンテンツ入力部1にメタデータ格納要求とともに、コンテンツ及びメタデータが入力された場合には、第1の実施形態で説明したように、当該コンテンツから、特徴ベクトルを生成して、当該特徴ベクトルとともに、入力されたメタデータなどが、通信部7を介してサーバ100へ送信される。サーバ100は、通信部8で、クライアント101から送信された特徴ベクトルやメタデータなどを受信すると、当該特徴ベクトルやメタデータを含むレコードを特徴ベクトル記憶部4に記憶する。
【0060】
なお、クライアント101の特徴ベクトル計算部3で、可変部分を含むコンテンツから特徴ベクトルが計算される場合には、当該特徴ベクトルとともに、可変部分のデータもサーバ100へ送信し、サーバ100では、当該特徴ベクトル、メタデータ及び可変部分のデータを含むレコードデータを特徴ベクトル記憶部4へ記憶する。
【0061】
特徴ベクトル記憶部4には、後述するように、各クライアント101から送信されてきた、コンテンツのメタデータ、特徴ベクトルなどを含む複数のレコードデータが記憶されている。
【0062】
コンテンツ入力部1に、検索要求とともにコンテンツが入力される場合には、第1の実施形態で説明したように、当該コンテンツから特徴ベクトルを生成し、検索条件として当該特徴ベクトルなどを含む検索要求が通信部7から送信される。サーバ100は、この検索要求を通信部8で受信すると、検索部5は、当該検索要求の検索条件に含まれている特徴ベクトルに類似する特徴ベクトルを含むレコードデータを検索して、当該レコードデータに含まれるメタデータを特徴ベクトル記憶部4から取得し、それを要求元のクライアント101へ返す。
【0063】
あるコンテンツに対応するメタデータとは、例えば、当該コンテンツに対するユーザからの意見やコメントなどである。メタデータ格納要求を受け付けるために、図5のクライアント・サーバシステムは、電子掲示板(BBS)を用いている。すなわち、クライアント101のコンテンツ入力部1は、電子掲示板を用いて、メタデータ格納要求を受け付けるようになっている。クライアント101のユーザは、あるコンテンツに対する意見やコメントなどのメタデータの格納要求を、電子掲示板(BBS)により提供される所定のページにメタデータを書き込むことにより行う。このとき、特徴ベクトル計算部3は、コンテンツ入力部1から入力された当該コンテンツについての特徴ベクトルを生成する。この特徴ベクトルが当該メタデータに添付されて投稿される。特徴ベクトルの添付された意見やコメントなどのメタデータは通信部7を介して、クライアント101からサーバ100へ送信される。サーバ100は、通信部7を介して受信した特徴ベクトルの添付されたメタデータを含むレコードデータを特徴ベクトル記憶部4に記憶する。
【0064】
別のユーザがあるコンテンツを見ながら、他のユーザが投稿した意見やコメントなどのメタデータを見たいときには、当該別のユーザのクライアント101のコンテンツ入力部1から検索要求とともに当該コンテンツが入力される。当該コンテンツの特徴ベクトルを特徴ベクトル計算部3で生成し、この特徴ベクトルを検索条件として含む検索要求をサーバ100に送信する。サーバ100は、当該検索要求を受信すると、検索部5は、当該検索要求の検索条件に含まれる特徴ベクトルに類似する特徴ベクトルを含むレコードデータを特徴ベクトル記憶部4から検索して、当該検索されたレコードデータに含まれるメタデータを要求元のクライアント101へ返す。
【0065】
このように、上記第3の実施形態にかかる検索システムによれば、特徴ベクトル記憶部4に記憶されている様々なコンテンツに対するメタデータのなかから、ユーザが閲覧中のコンテンツに対するメタデータを容易に抽出することができるのである。
【0066】
ユーザは、コンテンツ全体に対する意見だけではなく、コンテンツのある場面についての意見も投稿することができる。例えば、ユーザが意見を投稿する場合、クライアント101に接続されているコンテンツ閲覧装置102で閲覧中のコンテンツの再生を一時停止し、その一時停止された場面での意見をコンテンツ入力部1、すなわち、電子掲示板を用いて入力する。一方、コンテンツ閲覧装置102で閲覧されているコンテンツデータは、コンテンツ入力部1にも入力されているので、可変部分検出部2及び特徴ベクトル計算部3は、コンテンツ入力部1に入力されたコンテンツデータを用いて、コンテンツ閲覧装置102で再生・表示されているコンテンツデータから、第1の実施形態で説明したように、特徴ベクトルを生成する。また、コンテンツ閲覧装置102ではコンテンツの再生開始から、時刻(再生時刻)を計測しており、この計測された再生時刻をコンテンツ入力部1及びメタデータ出力部9などにも出力するようになっている。そこで、コンテンツ入力部1は、再生の一時停止が指示されたときの再生時刻とともに、入力された意見(メッセージ)を一時記憶する。
【0067】
ユーザにより入力された意見(メッセージ)には、当該コンテンツの特徴ベクトル(可変部分の削除されたコンテンツ全体から生成された特徴ベクトル)と、上記再生時刻が添付されてサーバ100に送信される。サーバ100は、特徴ベクトル、再生時刻、当該再生時刻に再生される場面に対するユーザの意見、すなわち、メタデータを含むレコードデータを特徴ベクトル記憶部4に記憶する。
【0068】
なお、コンテンツの特徴ベクトルは、当該コンテンツがコンテンツ閲覧装置102で再生・表示されると同時に当該コンテンツをコンテンツ入力部1に入力しながら、可変部分検出部2及び特徴ベクトル計算部3で生成するのではなく、当該コンテンツがコンテンツ閲覧装置102で再生・表示される前に、コンテンツ入力部1に予めコンテンツを入力しておき、可変部分検出部2及び特徴ベクトル計算部3で生成するようにしてもよい。後者の場合には、ユーザが再生の一時停止を行い意見を入力した時点では、すでに特徴ベクトルが生成されているから、メタデータ格納要求の操作を行うとすぐに、ユーザにより入力された意見(メッセージ)、当該コンテンツの特徴ベクトル(可変部分の削除されたコンテンツ全体から生成された特徴ベクトル)、上記再生時刻を含むメタデータ格納要求がサーバ100に送信される。
【0069】
サーバ100の特徴ベクトル記憶部4に、コンテンツの特徴ベクトル、メタデータ及び、当該メタデータに対応する場面の再生時刻を記憶することで、別のユーザが、同じコンテンツを閲覧中に、現在閲覧している場面(の再生時刻)に応じたメタデータを表示することができる。
【0070】
例えば、別のユーザが、あるコンテンツを閲覧する際に、当該コンテンツについて、予め可変部分検出部2及び特徴ベクトル計算部3で、第1の実施形態で説明したように予め生成された特徴ベクトルを検索条件として含む検索要求を、通信部7を介してサーバ100へ送信する。サーバ100は、当該検索条件に含まれる特徴ベクトルと類似する特徴ベクトルを含むレコードデータを特徴ベクトル記憶部4から検索して、当該検索されたレコードデータを(そのようなレコードデータが複数あればその全てを)当該別のユーザのクライアント101に返す。すなわち、クライアント101は、あるコンテンツを閲覧する際に、まず、当該コンテンツの特徴ベクトルと類似する特徴ベクトルを含むレコードデータをサーバ100からダウンロードしておく。ダウンロードされたレコードデータは、例えば、メタデータ出力部9に一時格納される。
【0071】
コンテンツ閲覧装置102は、再生・表示されているコンテンツの再生時刻を計測し、この再生時刻は、コンテンツ入力部1及びメタデータ出力部9に出力される。メタデータ出力部9は、このコンテンツ閲覧装置102から出力される再生時刻と、ダウンロードされた各レコードデータに含まれる再生時刻とを比較し、コンテンツ閲覧装置102から出力される再生時刻が、ダウンロードされたレコードデータに含まれる再生時刻(time)に一致すると(ダウンロードされたレコードデータに含まれる再生時刻(time)に対応した場面が再生・表示されているときに)、当該レコードデータに含まれるメタデータを表示する。
【0072】
図6は、メタデータの表示例を示したもので、例えば、コンテンツ閲覧装置102のディスプレイの画面表示例を示したものである。この画面表示では、コンテンツ表示領域201、メタデータ表示領域202、コンテンツ制御領域203、意見書き込み領域204が設けられている。この画面は、コンテンツ入力部1及びメタデータ出力部9の制御の下、コンテンツ、メタデータなどが表示される。
【0073】
コンテンツ表示領域201には、コンテンツ閲覧装置102で再生されているコンテンツが表示される。
【0074】
メタデータ表示領域202には、メタデータ出力部9により、サーバ100からダウンロードされた各レコードデータに含まれるメタデータが、当該レコードデータに含まれる再生時刻に応じて表示される。
【0075】
メタデータ格納要求を送信する場合には、ユーザは、コンテンツの再生を一時停止し、意見書き込み領域204の領域204aに、自分の意見を書き込み、送信ボタン204bを押す。これを受けて、コンテンツ閲覧装置102から出力された、そのときの再生時刻(コンテンツ再生開始から、一時停止するまでに計測された時刻)と、領域204aに書き込まれた内容とが、一時コンテンツ入力部1に記憶される。その後、第1の実施形態で説明したように、可変部分検出部2及び特徴ベクトル計算部3により当該可変部分の除かれたコンテンツ全体から特徴ベクトルが生成されると(あるいは、前述したように、予め当該コンテンツについて特徴ベクトルを生成しておいてもよい)、一時記憶された、領域204aに書き込まれた意見(メタデータ)と再生時刻が、当該特徴ベクトルとともに、通信部7からサーバ100に送信される。
【0076】
この場合のサーバ100の特徴ベクトル記憶部4のレコードデータの記憶例を図7に示す。
【0077】
ユーザからのメタデータ格納要求に含まれる「このプレーすごいですね」というメタデータ、当該メタデータに対応するコンテンツの特徴ベクトル、当該コンテンツの再生開始から(当該コンテンツの先頭から)計測された、当該メタデータを投稿する際にコンテンツ表示領域201に表示されていた場面の再生時刻(図7では、「time」欄に書き込まれている)などを含むレコードデータには、当該レコードデータを識別するためのデータIDとして「3」が付与されて、特徴ベクトル記憶部4に登録される。
【0078】
図7において、特徴ベクトル記憶部4に記憶されているデータID「1」のレコードデータは、特徴ベクトルが「11、10、15、6、4」のコンテンツの、再生時刻(time)が「153000ミリ秒」の場面に、「すごいFine Playです。」という意見(メタデータ)を投稿したものである。
【0079】
例えば、上記データID「1」のレコードデータに対応するコンテンツを見ている他のユーザが、当該レコードデータをダウンロードすると、ユーザが当該コンテンツを閲覧しているときに、当該レコードデータに含まれている時刻(time)になると、図9に示すように、メタデータ表示領域202に当該レコードデータに含まれているメタデータが表示される。
【0080】
図7のデータID「2」のレコードデータは、リンク情報が含まれている。リンク先は、特徴ベクトル「10、5、13、5、4、6」のコンテンツの再生時刻「326000秒」のシーンである。上記データID「2」のレコードデータに対応するコンテンツを見ている他のユーザが、当該レコードデータをダウンロードすると、ユーザが当該コンテンツを閲覧しているときに、当該レコードデータに含まれている時刻(time)になると、図9に示すように、メタデータ表示領域202に当該レコードデータに含まれているメタデータが表示される。このメタデータには、上記リンク先へのリンクが設定されている。従って、メタデータ表示領域202に表示された当該データID「2」のメタデータであるメッセージを、ユーザがクリックすると、上記リンク先、すなわち、特徴ベクトル「10、5、13、5、4、6」のコンテンツの再生時刻「326000秒」のシーンがコンテンツ表示領域201に表示される。
【0081】
ある特定のコンテンツに対する意見を投稿するためのBBSそのものをメタデータとした場合、この電子掲示板自体に当該特定の番組コンテンツの特徴ベクトルを予め添付しておいてもよい。具体的には、図8に示すように、サーバ100の特徴ベクトル記憶部4に、電子掲示板のアドレス(図8では、「bbs−url」欄に記述される)と当該特定のコンテンツの特徴ベクトルを含む複数のレコードデータが登録されたBBSテーブルが予め記憶されている。
【0082】
この場合、ユーザがあるコンテンツに対する意見を投稿しようとする際には、ユーザは、まず、クライアント101のコンテンツ入力部1から電子掲示板の検索要求を行うための指示入力を行い、これを受けて、当該コンテンツについて予め生成された特徴ベクトルを検索条件として含む電子掲示板の検索要求が、通信部7からサーバ100へ送信される。
【0083】
サーバ100の検索部5は、当該検索要求に含まれる検索条件の特徴ベクトルと類似する特徴ベクトルを含むレコードデータを図8のBBSテーブルから検索する。その結果、検索されたレコードデータに含まれる電子掲示板のアドレスを要求元のクライアントに返す。電子掲示板のアドレスを受け取ったクライアント101のコンテンツ入力部1は、通信部7を介して、当該アドレスにアクセスし、例えば、図6の表示画面上で、意見書き込み領域204がアクティブとなる。すなわち、意見書き込み領域204の領域204aへ意見を書き込み、当該意見(メタデータ)の格納要求をサーバ100へ送信することができる。
【0084】
このように、特徴ベクトルを用いて電子掲示板を検索することにより、コンテンツに対する意見を投稿する際に、投稿先の所望の電子掲示板を容易に得ることができる。
【0085】
以上説明したように、上記第3の実施形態によれば、地域によって、あるいは再放送などにより、放送時間や放送局が異なり、そのために異なるCMが含まれていたり、さらに、記録媒体のバージョンが異なるなどにより、異なるCMが含まれている(すなわち、可変部分を含む)同じ内容のコンテンツを、当該コンテンツの特徴ベクトルを用いて同定することで、可変部分を含んでいても、この可変部分の違いに関わりなく、同じ内容のコンテンツに対するメタデータを容易に検索することができる。
【0086】
なお、図5には示していないが、クライアント101において、あるコンテンツについて、特徴ベクトルを生成したときには、当該特徴ベクトルと、当該コンテンツを対応つけて記憶するための記憶部が設けられていてもよい。あるコンテンツについて、一度特徴ベクトルを生成しておくと、以後は、当該記憶部に記憶された特徴ベクトルを、メタデータ格納要求や検索要求に用いるようにしてもよい。
【0087】
(第4の実施形態)
図9は、図1の特徴ベクトル生成装置を用いた、第4の実施形態にかかる検索システムの構成例を示したものである。なお、図9において、図3、図5と同一部分には同一符号を付している。
【0088】
図9に示す検索システムは、図5と同様、サーバ100と複数のクライアント101とからなる。クライアント101には、図5と同様にコンテンツ閲覧装置102が接続されている。また、クライアント101は、コンテンツ入力部1と、可変部分検出部2と、特徴ベクトル計算部3と、可変部分検出部2及び特徴ベクトル計算部3で、コンテンツ入力部1から入力された各コンテンツについて生成された特徴ベクトルと、当該コンテンツに対するメタデータなどを含むレコードデータを、例えば図4あるいは図7に示すように記憶する特徴ベクトル記憶部4と、特徴ベクトル記憶部4から特徴ベクトルを用いてレコードデータを検索する検索部5と、通信部7を含み、さらに、図5のメタデータ出力部9と、後述するように、サーバ100からダウンロードしたメタデータを用いてコンテンツを編集するためのコンテンツ編集部10を有している。
【0089】
サーバ100は、通信部8と、特徴ベクトルを含むメタデータを記憶するメタデータ記憶部11と、上記検索部5と同様に、特徴ベクトルを用いてメタデータ記憶部11に記憶されているメタデータを検索したり、検索条件として与えられた文字列をキーとして、メタデータ記憶部11に記憶されているメタデータを検索したりする検索部12を含む。
【0090】
サーバ100のメタデータ記憶部11には、図7に示すような各クライアント101から送られてきたメタデータが記憶されていてもよい。
【0091】
図9に示す構成の検索システムは、前述の第3の実施形態の検索システムと同様な処理動作も行える。例えば、図5に示す検索システムでは、検索部5はサーバ100が有し、クライアント101からの検索要求を受けて、サーバ100が特徴ベクトルを用いた検索を行っていたが、図9に示す検索システムの場合には、クライアント101が検索部5を有しているから、クライアント101内で、当該クライアント101内で生成された特徴ベクトルを用いて検索部5がメタデータの検索を行う。
【0092】
以下、第3の実施形態とは異なる処理動作について説明する。
【0093】
図9のサーバ100のメタデータ記憶部11には、コンテンツを編集するための編集情報を含むメタデータが記憶されている。コンテンツを編集する機器を用いて、番組の不要部分を削除したり、複数の番組コンテンツのそれぞれから、一部分を集めて再編集したり、番組にアノテーションを付けるなどした編集情報と、当該コンテンツの特徴ベクトルを含むメタデータ格納要求を、クライアント101からサーバ100に送信する。サーバ100は、当該メタデータ格納要求を受けて、特徴ベクトルとメタデータとしての編集情報を含むレコードデータをベクトル記憶部4に記憶する。
【0094】
ある別のユーザが、コンテンツの編集情報を検索しようとする場合、クライアント101から、当該コンテンツの特徴ベクトルを検索条件とする検索要求がサーバ100へ送信される。サーバ100は、前述同様にして、特徴ベクトル記憶部4から、検索条件の特徴ベクトルと類似する特徴ベクトルを含むレコードデータを検索し、検索結果のレコードデータあるいは、当該レコードデータに含まれるメタデータを要求元のクライアント101へ返す。
【0095】
クライアント101のコンテンツ編集部10は、サーバ100から返された検索結果のメタデータを使って、コンテンツを編集する。すなわち、メタデータが、当該コンテンツの不要部分を示す情報を含む編集情報の場合には、その編集情報を用いて、コンテンツ閲覧装置102で、不要部分が再生されないようにコンテンツ閲覧装置102を制御する。また、メタデータに、当該コンテンツのあるシーンにアノテーションを表示するための編集情報が含まれている場合には、そのシーンを再生するときに、同時に当該アノテーションを表示するよう、コンテンツ閲覧装置102を制御する。
【0096】
サーバ100のメタデータ記憶部11には、例えば、図10に示すようなメタデータが予め記憶されていてもよい。図10のメタデータは、クライアント101にダウンロードされて、クライアント101でコンテンツの編集を行うためのメタデータを記述したものである。
【0097】
図9のメタデータでは、映像については、「videoid=1」という識別子を付したビデオデータと、「videoid=2」という識別子を付したビデオデータを、この順に再生し、音声については、「audio=1」という識別子を付した音声データと、「audio=2」という識別子を付した音声データを、この順に再生し、さらに、「videoid=1」という識別子を付したビデオデータを再生しているときに、「○○のコーナーです」というメッセージを表示し、「videoid=1」という識別子を付したビデオデータを再生しているときに、「××のコーナーです」というメッセージを表示するという編集内容を示している。
【0098】
より具体的には、「videoid=1」という識別子を付したビデオデータは、特徴ベクトルが「1、9、8、7、12、3、4」であるコンテンツであり(図10では、<uri vector>要素で示している値「1、9、8、7、12、3、4」)、このコンテンツの先頭からの再生時刻(図10では、<uri time>要素で示している値)が「153000ミリ秒」から、時間(図10の<uri duration>要素で示している値)「1000ミリ秒」の間のビデオデータである。
【0099】
このビデオデータの再生と同時に、「audioid=1」という識別子を付した音声データ、すなわち、特徴ベクトルが「1、9、8、7、13、2、1」であるコンテンツ(図10では、<uri vector>要素で示している値「1、9、8、7、13、2、1」)の先頭からの再生時刻(図10では、<uri time>要素で示している値)が「153000ミリ秒」から、時間(図10の<uri duration>要素で示している値)「1000ミリ秒」の間の音声データを再生する。
【0100】
さらに、上記「videoid=1」という識別子を付したビデオデータを再生しているとき、当該ビデオデータの再生時刻(図10では、<time>要素で示している値)が「5秒」から、時間(図10の<duration>要素で示している値)「20秒」の間、図10の<message>要素の値「○○のコーナーです」を表示する。
【0101】
その後、「videoid=2」という識別子を付したビデオデータと、「audioid=2」という識別子を付した音声データが同時に再生される。
【0102】
「videoid=2」という識別子を付したビデオデータは、特徴ベクトルが「10、9、2、8、3、7、8」であるコンテンツ(図10では、<uri vector>要素で示している値)の先頭からの再生時刻(図10では、<uri time>要素で示している値)が「154800ミリ秒」から、時間(図10の<uri duration>要素で示している値)「50000ミリ秒」の間のビデオデータである。
【0103】
「audioid=2」という識別子を付した音声データは、特徴ベクトルが「10、9、2、8、3、7、8」であるコンテンツ(図10では、<uri vector>要素で示している値)の先頭からの再生時刻(図10では、<uri time>要素で示している値)が「154800ミリ秒」から、時間(図10の<uri duration>要素で示している値)「50000ミリ秒」の間の音声データである。
【0104】
さらに、上記「videoid=2」という識別子を付したビデオデータを再生しているとき、当該ビデオデータの再生時刻(図10では、<time>要素で示している値)が「10秒」から、時間(図10の<duration>要素で示している値)「20秒」の間、図10の<message>要素の値「××のコーナーです」を表示する。
【0105】
図10に示したようなメタデータには、「1、9、8、7、12、3、4」、「1、9、8、7、13、2、1」、「10、9、2、8、3、7、8」という3つのコンテンツの特徴ベクトルが含まれている。従って、クライアント101からの検索要求に含まれる検索条件の特徴ベクトルが、上記3つの特徴ベクトルのうちのいずれかに類似する場合に、当該メタデータが検索部12により検索される。サーバ100は、検索結果の図10のメタデータを要求元のクライアント101へ返す。クライアント101のコンテンツ編集部10は、当該メタデータを用いて、コンテンツの編集を行う。なお、特徴ベクトルは、図10で表示したものよりも長いことが考えられるが、ここでは説明のために簡単に表示している。
【0106】
なお、図10のメタデータの特徴ベクトルが記述されている領域には、当該特徴ベクトルに対応するコンテンツへのリンクが設定されていてもよい。
【0107】
また、メタデータの検索方法としては、上記のように、特徴ベクトルを検索条件として用いる場合のほか、例えば、メタデータに各コンテンツのタイトルなどの文字列が含まれている場合には、さらに、文字列を検索条件として用いることもできる。すなわち、クライアント101のコンテンツ入力部1から、ユーザが、メタデータを検索するための所望の文字列を入力すると、当該文字列検索条件として含む検索要求がサーバ100へ送信される。サーバ100の検索部12は、検索条件の文字列を含むメタデータをメタデータ記憶部11から検索し、検索されたメタデータを要求元のクライアント101へ返す。
【0108】
また、あるコンテンツのあるシーンを特定するために、当該コンテンツ(可変部分の削除されたコンテンツ)の特徴ベクトルと、当該シーンの出現する再生時刻とを用いる場合を説明したが、この場合に限らない。例えば、特徴ベクトルを当該コンテンツの先頭から当該シーンの出現するまでのコンテンツデータから生成したり、当該シーン以降のコンテンツデータから当該コンテンツの特徴ベクトルを生成してもよい。この場合、検索部5や検索部12で、特徴ベクトルを用いてレコードデータを検索するとき、検索条件の特徴ベクトルと特徴ベクトル記憶部4やメタデータ記憶部11に記憶されている特徴ベクトルとの間で、特徴ベクトルの数列に含まれる全数値との間での類似度ではなく、特徴ベクトル記憶部4やメタデータ記憶部11に記憶されている各特徴ベクトルの数列のうちのある一区間の数列が、検索条件の特徴ベクトルに最も類似する特徴ベクトルを検索する。
【0109】
(第5の実施形態)
図11は、図1の特徴ベクトル生成装置を用いた、第5の実施形態にかかる検索システムの構成例を示したものである。このシステムは、サーバ100と複数のクライアント101とからなる。なお、図11において、図9と同一部分には同一符号を付し、異なる部分についてのみ説明する。
【0110】
クライアント101は、図9の各構成部の他に、属性情報取得部13がさらに追加されている。
【0111】
ここで属性情報とは、コンテンツのタイトルや、放送日時、放送局名、ジャンル、コメントなどを記述したデータで、例えばEPG(electronic program guide)情報である。
【0112】
クライアント101の特徴ベクトル記憶部4には、例えば、図12に示したように、コンテンツ入力部1から入力されたコンテンツから生成された特徴ベクトルと当該コンテンツについて属性情報取得部13で取得した属性情報と、メタデータを含むレコードデータに当該レコードデータを識別するためのデータIDを付して記憶されている。なお、特徴ベクトル記憶部4には、サーバ100からダウンロードされたレコードデータが記憶されていてもよい。レコードデータには、当該レコードデータに対応するコンテンツが実際に記憶されている記憶領域へのリンク情報や、コンテンツデータそのものが含まれていてもよい。
【0113】
サーバ100のメタデータ記憶部11にも、図12に示したように、特徴ベクトル、属性情報、メタデータ、データIDを含むレコードデータが多数記憶されている。メタデータ記憶部11に記憶されているメタデータは、各クライアント101からのメタデータ格納要求を受けて記憶されているものと、予め記憶されているものとがあってもよい。
【0114】
α地域のユーザAが、属性情報取得部13で取得した属性情報を用いて、コンテンツC1を選択し、コンテンツ閲覧装置102を経由して、当該コンテンツC1を録画する場合(例えば、当該属性情報からコンテンツC1の録画予約を行う)、コンテンツC1は、コンテンツ閲覧装置102からコンテンツ入力部1に出力されて、第1の実施形態で説明したように、可変部分検出部2及び特徴ベクトル計算部3により特徴ベクトルが生成される。そして、この特徴ベクトルと、属性情報取得部13で取得された属性情報を含むレコードデータが特徴ベクトル記憶部4に記憶される。ここで、コンテンツC1の特徴ベクトルを「B1001」、属性情報を「E1001」とする。
【0115】
次に、図13に示すフローチャートを参照して、図11の検索システムにおけるメタデータの検索処理動作について説明する。
【0116】
ユーザAは、コンテンツC1のメタデータを取得するために、コンテンツ入力部1から、特徴ベクトル「B1001」と属性情報「E1001」を検索条件として含む検索要求を行うための指示入力を行うと、当該検索要求が通信部7からサーバ100へ送信される。
【0117】
サーバ100の通信部8は、当該検索要求を受け取ると(ステップS101、ステップS102)、それを検索部12へ渡す。検索部12は、ステップS102で受け取った検索条件に属性情報が含まれていないときには、そのままステップS107へ進む。一方、当該検索要求に、属性情報が検索条件として含まれている場合には(ステップS103)ステップS104へ進み、まず、属性情報を用いて、当該属性情報に一致するレコードデータをメタデータ記憶部11に記憶されているレコードデータのなかから検索する(ステップS104)。検索条件として与えられた属性情報「E1001」を含むレコードデータが検索されたときには、当該レコードデータを要求元のクライアント101へ返す。
【0118】
クライアント101の通信部7で当該検索結果のレコードデータを受け取ると、メタデータ出力部9は、検索結果のレコードデータに含まれるメタデータなどの情報を、例えば、図14に示すように、コンテンツ閲覧装置102に表示させる。表示されたメタデータをユーザAが見て、ユーザAが所望するコンテンツのメタデータを選択して、「OK」ボタン201を押すことで、処理は終了するが、そうでない場合には、すなわち、「キャンセル」ボタン202を押したときには、検索結果には、ユーザAが所望するメタデータが含まれていない旨の通知が、コンテンツ入力部1から通信部7を介してサーバ100へ通知される(ステップS106)。サーバ10は当該通知を受け取ると、検索部12は、次に、検索条件として与えられた特徴ベクトルを用いて、前述同様に検索を行う(ステップS107)。
【0119】
メタデータ記憶部11に記憶されているレコードデータのなかから、検索条件の特徴ベクトル「B1001」に類似する特徴ベクトルを含むレコードデータが検索されたときには(ステップS108)、当該レコードデータを要求元のクライアント101へ返す。
【0120】
クライアント101の通信部7で当該検索結果のレコードデータを受け取ると、メタデータ出力部9は、検索結果のレコードデータに含まれるメタデータなどの情報を、図14に示すように、コンテンツ閲覧装置102に表示させる。このとき、表示されたメタデータをユーザAが見て、ユーザAが所望するコンテンツのメタデータが存在しな場合には、再び「キャンセル」ボタンが押されるので、それを受けて、その旨の通知が、サーバ100へ通知され(ステップS109)、ここで処理が終了する。一方、表示されたメタデータをユーザAが見て、ユーザAが所望のレコードデータを選択して、「OK」ボタンを押すと、その旨が、サーバ100へ通知される(ステップS109)。この通知を受けて、サーバ100は、ステップS110へ進み、ステップS102で受け取った検索条件に属性情報が含まれている場合には、さらに、ステップS111へ進み、当該属性情報を、ステップS107及びステップS108で検索されたレコードデータに追加して、検索処理を終了する。
【0121】
なお、ステップS108で、特徴ベクトルを用いた検索を行った結果、当該特徴ベクトルに一致あるいは類似する特徴ベクトルを含むレコードデータが検索されなかったとき、ステップS109で、そのようなレコードデータが検索されたものの、ユーザAが「キャンセル」ボタンを押したとき、ステップS110で、当該検索されたレコードデータの「いずれかに対し、ユーザAが「OK」ボタンを押したものの、検索条件に属性情報が含まれていないとき、検索処理は、そこで、終了する。
【0122】
さて、上記ステップS106で、サーバ100が、ユーザAから、「OK」ボタンを押したとき、すなわち、ユーザAから、所望するコンテンツC1のメタデータである旨の確認通知を受けたとする。この場合、ここで、検索処理が終了する。
【0123】
次にβ地域のユーザBがユーザAと同様のコンテンツC1を録画した場合、このコンテンツから、特徴ベクトル「B1001」と類似した特徴ベクトル「B1002」が生成され、当該コンテンツの属性情報は、属性情報「E1001」とは異なる属性情報「E1002」が取得されたとする。ユーザBがメタデータを取得するために、ユーザBのクライアント101から特徴ベクトル「B1002」と属性情報「E1002」を検索条件とする検索要求が上記ユーザAの場合と同様に、サーバ100に送信される。
【0124】
まず、サーバ100の検索部5では、属性情報「E1002」を用いて、メタデータ記憶部11から当該属性情報に一致するレコードデータを検索する。属性情報には放送局、放送日時が含まれているため、属性情報「E1002」と完全に一致する属性情報を含むレコードデータが検索される(ステップS101〜ステップS105)。
【0125】
ここで属性情報「E1002」に一致する属性情報を含むレコードデータが検索されなかったときには、次に、ステップS107へ進み、検索部5は、検索条件の特徴ベクトル「B1002」を基に検索を行う。検索条件の特徴ベクトル「B1002」は特徴ベクトル「B1000」と類似しているため、図12のデータIDが「1」のレコードデータが検索される。このレコードデータには、メタデータ「M1001」が含まれている(ステップS107)。
【0126】
属性情報や特徴ベクトルを用いた検索を行うと、該当するレコードデータは複数検索されることがある。検索されたレコードデータに含まれる、属性情報には、当該レコードデータに対応するコンテンツのジャンルを示す情報が含まれていることがある。ジャンルとは「映画」「スポーツ」などのコンテンツの種別のことである。
【0127】
サーバ100は、各ユーザからの検索要求、メタデータ格納要求の履歴を記憶しておいてもよい。この場合、複数のレコードデータが検索されたときに、ユーザBの履歴に記憶されている属性情報を参照して、出現頻度の高いジャンルの順に、検索結果のレコードデータを並び替えるなどのソーティング処理を行ってもよい。
【0128】
ステップS108で検索された、データID「1」のレコードデータを含む検索結果のレコードデータ群が、ユーザBのクライアント101のメタデータ出力部9により、図14に示すようにコンテンツ閲覧装置102に表示される。ユーザBが、データID「1」のレコードデータを選択して、「OK」ボタンを押すことにより、データID「1」のレコードデータが、ユーザBが所望するレコードデータである旨の通知がサーバ100へ送信される(ステップS109)。サーバ100は、ユーザBから送られてきた検索条件に属性情報「E1002」が含まれているので(ステップS110)、当該属性情報をデータID「1」のレコードデータに追加する(ステップS111)。
【0129】
この結果、メタデータ「M1001」を含むデータID「1」のレコードデータは、特徴ベクトル「B1001」と、属性情報「E1001」と、属性情報「E1002」を含むことになる。
【0130】
ユーザBが検索要求を出す前に、サーバ100のメタデータ記憶部11に、特徴ベクトル「B1002」と属性情報「E1002」と、メタデータ「M1001」とは異なるメタデータ「M1002」とを含む別のレコードデータ(例えば、当該レコードデータのデータIDを「10」とする)があり、当該レコードデータがデータID「1」のレコードデータとともに検索され、コンテンツ閲覧装置102で表示された場合に、ユーザBがデータID「1」の(メタデータ「M1001」を含む)レコードデータを選択した場合には、データID「1」のレコードデータに属性情報「E1002」を追加する。
【0131】
次に、β地域のユーザCのクライアント101が、特徴ベクトル「B1002」と属性情報「E1002」を検索条件として含むメタデータの検索要求をサーバ100へ送信した場合、サーバ100の検索部5では、前述同様、属性情報「E1002」を用いてメタデータ記憶部11を検索する。この場合、データID「1」のレコードデータには、属性情報「E1001」と「E1002」が含まれているから、データID「1」のレコードデータがステップS105で検索される。
【0132】
この場合、ユーザCのクライアント101が特徴ベクトル計算部3を持たないとき(すなわち、検索条件に特徴ベクトルが含まれていないとき)でも、属性情報を用いて、所望のコンテンツのレコードデータ、すなわち、メタデータを検索することができる。
【0133】
以上説明したように、上記第5の実施形態によれば、特徴ベクトルを補助的に用いることにより、放送時間や放送局などが地域によって異なるために、あるいは、再放送されて放送日時が異なるために、異なる属性情報を有する同一のコンテンツに対するメタデータが、容易に検索できるようになる。
【0134】
上記第5の実施形態では、属性情報がEPG情報であり、そのような属性情報を有する、放送コンテンツに対するメタデータを検索する場合を説明したが、第5の実施形態にかかる検索システムはこの場合に限らない。EPG情報のような属性情報を持たないコンテンツ、例えば、市販のDVDに記録されているコンテンツの場合には、同一コンテンツでも様々なバージョンで販売されている。従って、このバージョンによって異なるDVDに固有のIDを属性情報として用いれば、前述同様に、メタデータの検索が容易に行える。このDVDに固有のIDは、例えば以下のようにして生成することが出来る。DVDのデータの先頭から一定量、例えば200キロバイトのデータを読み出し、これを基にハッシュ値を計算し、ハッシュテーブルを参照することでIDとして利用することが可能である。
【0135】
上記第1〜第5の実施形態によれば、放送局や放送日時などの各コンテンツに付属する情報に依存しない、各コンテンツの内容そのものの特徴から、各コンテンツを同定するためのIDデータを生成することにより、当該IDデータを用いて、コンテンツやコンテンツのメタデータを容易に検索することができる。
【0136】
放送局や放送日時に無関係にコンテンツを同定できることで、再放送のコンテンツや、地域差によって放送局や放送日時が異なる場合でも、コンテンツを同定することができる。またCMを検出してCM区間を別に扱うことにより、再放送などで途中のCMが違う場合でもコンテンツを同定することができる。
【0137】
なお、コンテンツ入力部1、可変部分検出部2、特徴ベクトル計算部3、検索部5、12,通信部7,8,メタデータ出力部9,コンテンツ編集部10,属性情報取得部13などの各構成部の機能は、コンピュータに、上記各実施形態で説明したような各構成部の処理手順を記述したプログラムを実行させることにより実現することができる。
【0138】
また、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
【図面の簡単な説明】
【0139】
【図1】本発明の第1の実施形態にかかる特徴ベクトル生成装置の構成例を示した図。
【図2】図1の特徴ベクトル生成装置の処理動作を説明するためのフローチャート。
【図3】第2の実施形態にかかる検索システムの構成例を示した図。
【図4】特徴ベクトル記憶部の記憶例を示した図。
【図5】第3の実施形態にかかる検索システムの構成例を示した図。
【図6】メタデータの表示例を示した図。
【図7】特徴ベクトル記憶部のレコードデータの記憶例を示した図。
【図8】BBSテーブルの一例を示した図。
【図9】第4の実施形態にかかる検索システムの構成例を示した図。
【図10】コンテンツの編集を行うためのメタデータの一例を示した図。
【図11】第5の実施形態にかかる検索システムの構成例を示した図。
【図12】特徴ベクトル記憶部のレコードデータの他の記憶例を示した図。
【図13】図11の検索システムにおけるメタデータの検索処理動作について説明するためのフローチャート。
【図14】検索されたメタデータの表示例を示した図。
【符号の説明】
【0140】
1…コンテンツ入力部、2…可変部分検出部、3…特徴ベクトル計算部、4…特徴ベクトル記憶部、5、12…検索部、6…コンテンツ記憶部、7、8…通信部、9…メタデータ出力部、10…コンテンツ編集部、11…メタデータ記憶部、13…属性情報取得部、100…サーバ装置、101…クライアント装置。

【特許請求の範囲】
【請求項1】
時系列なコンテンツデータを入力する入力手段と、
前記コンテンツデータの特徴的な状態が出現する各時点を示す情報を基に、当該コンテンツデータの特徴を示す特徴ベクトルを生成する生成手段と、
前記コンテンツデータと前記特徴ベクトルとを記憶する記憶手段と、
を具備したことを特徴とする特徴ベクトル生成装置。
【請求項2】
前記コンテンツデータは映像データ及び音声データを含み、
前記コンテンツデータの特徴的な状態は、シーンチェンジ、無音区間、及び音量が予め定められたレベル以上の状態のうちの少なくとも1つであることを特徴とする請求項1記載の特徴ベクトル生成装置。
【請求項3】
当該コンテンツデータの特徴的な状態が出現する各時点を示す情報は、前記コンテンツデータの開始から前記各時点までの時間であることを特徴とする請求項1記載の特徴ベクトル生成装置。
【請求項4】
前記コンテンツデータから可変部分を検出する可変部分検出手段をさらに具備し、
前記生成手段は、
前記可変部分の削除された前記コンテンツデータから前記特徴ベクトルを生成することを特徴とする請求項1記載の特徴ベクトル生成装置。
【請求項5】
前記コンテンツデータのメタデータを検索するための、前記生成手段で生成された特徴ベクトルを含む検索要求を送信する手段をさらに具備したことを特徴とする請求項1記載の特徴ベクトル生成装置。
【請求項6】
時系列なコンテンツデータの特徴的な状態が出現する各時点を示す情報を基に生成された、当該コンテンツデータの特徴を示す特徴ベクトルを、前記コンテンツデータ及び当該コンテンツデータのメタデータのうちの少なくとも一方に対応付けて記憶する記憶手段と、
時系列な第1のコンテンツデータから可変部分を検出する可変部分検出手段と、
前記可変部分の削除された前記第1のコンテンツデータの特徴的な状態が出現する各時点を示す情報を基に、当該第1のコンテンツデータの特徴を示す第1の特徴ベクトルを生成する生成手段と、
前記記憶手段に記憶された複数の特徴ベクトルのなかから、前記第1の特徴ベクトルと類似する特徴ベクトルを検索する検索手段と、
を具備したことを特徴とする検索装置。
【請求項7】
時系列なコンテンツデータの特徴的な状態が出現する各時点を示す情報を基に生成された、当該コンテンツデータの特徴を示す特徴ベクトルを、前記コンテンツデータに対するメタデータに対応付けて記憶する記憶手段と、
時系列な第1のコンテンツデータの特徴的な状態が出現する各時点を示す情報を基に生成された、当該第1のコンテンツデータの特徴を示す第1の特徴ベクトルを検索条件として含む検索要求を受信する手段と、
前記記憶手段に記憶された特徴ベクトルのなかから、前記第1の特徴ベクトルと類似する特徴ベクトルを検索する検索手段と、
前記検索手段で検索された特徴ベクトルに対応つけられたメタデータを含む検索結果を前記検索要求の要求元へ送信する送信手段と、
を具備したことを特徴とする検索装置。
【請求項8】
前記特徴ベクトルは、前記コンテンツデータ中の前記各時点の出現回数と、当該コンテンツデータを前記各時点で区切った各区間の時間長を示すことを特徴とする請求項1記載の特徴ベクトル生成装置。
【請求項9】
前記可変部分検出手段は、前記コンテンツデータ中のCM(コマーシャル・メッセージ)部分を可変部分として検出することを特徴とする請求項4記載の特徴ベクトル生成装置。
【請求項10】
前記検索要求は、前記第1のコンテンツデータの属性情報をさらに含み、
前記記憶手段は、前記属性情報を、前記送信手段で送信したメタデータのうち前記要求元のユーザにより選択されたメタデータに対応付けて記憶することを特徴とする請求項7記載の検索装置。
【請求項11】
時系列なコンテンツデータの特徴的な状態が出現する各時点を示す情報を基に生成された、当該コンテンツデータの特徴を示す特徴ベクトルを、前記コンテンツデータに対するメタデータ及びEPG(electronic program guide)情報に対応付けて記憶する記憶手段と、
時系列な第1のコンテンツデータの特徴的な状態が出現する各時点を示す情報を基に生成された、当該第1のコンテンツデータの特徴を示す第1の特徴ベクトル、あるいは当該第1の特徴ベクトル及び前記第1のコンテンツデータの第1のEPG情報を検索条件として含む検索要求を受信する手段と、
前記検索要求に前記第1のEPG情報を含む場合には、前記記憶手段に記憶されたEPG情報のなかから前記第1のEPG情報に一致するEPG情報を検索し、当該第1のEPG情報に一致するEPG情報が検索されなかった場合と前記検索要求に前記第1のEPG情報が含まれない場合には、前記記憶手段に記憶された特徴ベクトルのなかから、前記第1の特徴ベクトルと類似する特徴ベクトルを検索する検索手段と、
前記検索手段で検索された前記第1のEPG情報に一致するEPG情報に対応付けられたメタデータ、あるいは前記検索手段で検索された前記第1の特徴ベクトルに類似する特徴ベクトルに対応付けられたメタデータを含む検索結果を前記検索要求の要求元へ送信する送信手段と、
を具備したことを特徴とする検索装置。
【請求項12】
前記検索要求に前記第1のEPG情報を含む場合に、前記送信手段で、前記第1の特徴ベクトルに類似する特徴ベクトルに対応付けられたメタデータを含む検索結果を前記検索要求の要求元へ送信したとき、
前記記憶手段は、前記第1のEPG情報を、前記送信手段で送信したメタデータのうち前記要求元のユーザにより選択されたメタデータに対応付けて記憶することを特徴とする請求項11記載の検索装置。
【請求項13】
時系列なコンテンツデータの特徴的な状態が出現する各時点を示す情報を基に、当該コンテンツデータの特徴を示す特徴ベクトルを生成する特徴ベクトル生成方法。
【請求項14】
前記状態は、シーンチェンジ、無音区間、及び音量が予め定められたレベル以上の状態のうちの少なくとも1つであることを特徴とする請求項13記載の特徴ベクトル生成方法。
【請求項15】
当該コンテンツデータの特徴的な状態が出現する各時点を示す情報は、前記コンテンツデータの開始から前記各時点までの時間であることを特徴とする請求項13記載の特徴ベクトル生成方法。
【請求項16】
前記特徴ベクトルは、前記コンテンツデータ中の前記各時点の出現回数と、当該コンテンツデータを前記各時点で区切った各区間の時間長を示すことを特徴とする請求項13記載の特徴ベクトル生成方法。
【請求項17】
時系列な第1のコンテンツデータから可変部分を検出するステップと、
前記可変部分の削除された前記第1のコンテンツデータの特徴的な状態が出現する各時点を示す情報を基に、当該第1のコンテンツデータの特徴を示す第1の特徴ベクトルを生成する生成ステップと、
時系列なコンテンツデータの特徴的な状態が出現する各時点を示す情報を基に生成された、当該コンテンツデータの特徴を示す特徴ベクトルを、前記コンテンツデータ及び当該コンテンツデータのメタデータのうちの少なくとも一方に対応付けて記憶する記憶手段に記憶された複数の特徴ベクトルのなかから、前記第1の特徴ベクトルと類似する特徴ベクトルを検索するステップと、
を有する検索方法。
【請求項18】
時系列な第1のコンテンツデータから可変部分を検出するステップと、
前記可変部分の削除された前記第1のコンテンツデータの特徴的な状態が出現する各時点を示す情報を基に、当該第1のコンテンツデータの特徴を示す第1の特徴ベクトルを生成する生成ステップと、
時系列なコンテンツデータの特徴的な状態が出現する各時点を示す情報を基に生成された、当該コンテンツデータの特徴を示す特徴ベクトルを、前記コンテンツデータ及び当該コンテンツデータのメタデータのうちの少なくとも一方に対応付けて記憶する記憶手段に記憶された複数の特徴ベクトルのなかから、前記第1の特徴ベクトルと類似する特徴ベクトルを検索するステップと、
をコンピュータに実行させるためのプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate


【公開番号】特開2006−139408(P2006−139408A)
【公開日】平成18年6月1日(2006.6.1)
【国際特許分類】
【出願番号】特願2004−326811(P2004−326811)
【出願日】平成16年11月10日(2004.11.10)
【出願人】(000003078)株式会社東芝 (54,554)
【Fターム(参考)】