特徴ベクトル生成装置、検索装置、特徴ベクトル生成方法、検索方法及びプログラム

【課題】各コンテンツを、放送局や放送日時などの各コンテンツに付属する情報に依存することなく同定することのできるデータの生成方法及びそれを用いた検索装置を提供する。
【解決手段】第１のコンテンツデータから可変部分を検出し、可変部分の削除された第１のコンテンツデータの特徴的な状態が出現する各時点を示す情報を基に、当該第１のコンテンツデータの特徴を示す第１の特徴ベクトルを生成し、コンテンツデータの特徴的な状態が出現する各時点を示す情報を基に生成された、当該コンテンツデータの特徴を示す特徴ベクトルを、当該コンテンツデータ及び当該コンテンツデータのメタデータのうちの少なくとも一方に対応付けて記憶する記憶手段に記憶された複数の特徴ベクトルのなかから、第１の特徴ベクトルと類似する特徴ベクトルを検索する。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、コンテンツを同定するためのデータの生成方法およびそれを用いた検索装置に関する。
【背景技術】
【０００２】
従来、コンテンツを検索する際には、各コンテンツに何らかの方法に付与したＩＤを用いる方法がある。放送コンテンツの場合には、放送日時や放送局をキーに所望のコンテンツを検索していた。
【０００３】
各視聴者はコンテンツに応じたコミュニティに参加し、試聴しているコンテンツからコミュニティを同定する方法が開示されているが（例えば、特許文献１参照）は、この手法は、当該コンテンツに対応する日時とチャンネルからコミュニティを同定するというものである。
【０００４】
また、コンテンツと対話画面の同期を取る場合に、当該コンテンツに予め埋め込まれている同期データを用いるという技術も開示されている（例えば、特許文献２参照）。
【０００５】
しかし、放送コンテンツには、コンテンツＩＤが付いておらず、また地域によって、放送日時や放送局が異なるため、従来の技術では、コンテンツを同定することが困難な場合があった。
【特許文献１】特開２００１−１４８８４１公報
【特許文献２】特開２００１−２９８４３１公報
【発明の開示】
【発明が解決しようとする課題】
【０００６】
このように、放送局や放送日時からコンテンツを検索する場合、再放送や地域の違いによって放送日時やチャンネルが異なり、それらを基にした検索はできないという問題点があった。
【０００７】
そこで、本発明は、各コンテンツを、放送局や放送日時などの各コンテンツに付属する情報に依存することなく同定することのできるデータの生成方法及び装置を提供することを目的とする。また、当該データを用いて、コンテンツや、コンテンツのメタデータを容易に検索することのできる検索方法及び装置を提供することを目的とする。
【課題を解決するための手段】
【０００８】
時系列な第１のコンテンツデータから可変部分を検出し、可変部分の削除された第１のコンテンツデータの特徴的な状態が出現する各時点を示す情報を基に、当該第１のコンテンツデータの特徴を示す第１の特徴ベクトルを生成し、時系列なコンテンツデータの特徴的な状態が出現する各時点を示す情報を基に生成された、当該コンテンツデータの特徴を示す特徴ベクトルを、当該コンテンツデータ及び当該コンテンツデータのメタデータのうちの少なくとも一方に対応付けて記憶する記憶手段に記憶された複数の特徴ベクトルのなかから、第１の特徴ベクトルと類似する特徴ベクトルを検索する。
【発明の効果】
【０００９】
本発明によれば、各コンテンツを、放送局や放送日時などの各コンテンツに付属する情報に依存することなく同定することができる。
【発明を実施するための最良の形態】
【００１０】
以下、本発明の実施形態について図面を参照して説明する。
【００１１】
以下の実施形態では、入力されたコンテンツデータ（以下、簡単にコンテンツとも呼ぶ）から当該コンテンツの固有の特徴を示すとともに、当該コンテンツを識別するための特徴ベクトルを生成し、この特徴ベクトルを用いて、コンテンツや当該コンテンツに対応するメタデータを検索する検索システムについて説明する。
【００１２】
ここでは、コンテンツは、静止画や動画像などの画像データ（映像データ）と音声データを含む時系列なデータであり、このコンテンツの映像や音声上の特徴的な状態（例えば、シーンチェンジ、無音区間、及び音量が予め定められたレベル以上の状態など）が出現する各時点を示す情報（例えば、各時点までの時間）を基に、上記特徴ベクトルを生成する。
【００１３】
まず、第１の実施形態として、以下の実施形態で説明する検索システムに含まれる特徴ベクトル生成装置について説明する。
【００１４】
（第１の実施形態）
図１は、コンテンツ検索システムの要部である特徴ベクトル生成装置の構成例を示したもので、コンテンツが入力されるコンテンツ入力部１と、入力されたコンテンツから可変部分を検出する可変部分検出部２と、可変部分の削除されたコンテンツの不可変部分から特徴ベクトルを検出する特徴ベクトル計算部３と、特徴ベクトル計算部３で計算された特徴ベクトルを記憶するための特徴ベクトル記憶部４を含む。
【００１５】
図２は、図１の特徴ベクトル生成装置の処理動作（特徴ベクトル生成処理動作）を説明するためのフローチャートである。以下、図２を参照して、図１の各部について説明する。
【００１６】
まず、コンテンツ入力部１からコンテンツが入力される（ステップＳ１）。コンテンツとは例えば録画された放送コンテンツや、市販されているＤＶＤコンテンツなどである。
【００１７】
可変部分検出部２は、コンテンツ入力部１から入力されたコンテンツから可変部分を検出する（ステップＳ２）。可変部分とはコンテンツの中で、差し換えや省略が発生する部分であり、例えばＣＭ（コマーシャル・メッセージ）部分である。ＣＭ部分を検出する方法は例えば、以下に示すような方法がある。（１）カット検出を行い、その検出時間が１５秒（または３０秒）毎に検出される部分をＣＭ部分と判定する。（２）ＣＭの前後で無音区間があることを利用して、無音区間が１５秒（または３０秒）毎に検出された場合、その無音区間をＣＭ部分と判定する。（３）音声がモノラルの番組コンテンツの時にステレオ放送の部分をＣＭと判定する。（４）ＣＭの画像パターンを記憶しておき、その画像パターンとマッチする部分をＣＭ部分と判定する。（５）例えば特開２００３−２５７１６０に開示されているような、ＴＶ信号の音声モード、ＴＶ信号における映像信号レベルパターン、音声信号レベルパターンを利用してＣＭ区間を検出する。これは、例えば、番組コンテンツが二カ国語放送の場合に、そうでない部分をＣＭ部分と判定する。
【００１８】
可変部分検出部２では、上記のうちのいずれかの方法を用いて、あるいは、上記方法のいくつか組み合わせて用いることにより、入力されたコンテンツからＣＭ部分を検出する。
【００１９】
上記（４）の方法において、ＣＭの画像パターンを記憶する場合には、例えば、上記（５）の方法を用いて、音声モードの違いによりＣＭ区間が判定されたとき、当該ＣＭ区間の画像パターンを記憶しておき、その記憶パターンと同一の映像の場合にＣＭであると判定する。また、例えば、上記（３）の方法を用いて、モノラル放送の番組コンテンツの場合に、ステレオで放送があると、その区間をＣＭと判定し、当該区間の画像パターンを記憶する。なお、画像パターンの記憶は、全ての時刻において記憶する必要はなく、例えば５秒間隔で記憶する。また記憶する画像も画像サイズを間引いて小さくしたり、カラーからモノクロに変換したりして、データサイズを小さくすることが望ましい。記憶された画像パターンは、輝度値の数列となり、これをベクトルとして、コンテンツと比較することにより、ＣＭ区間を特定することができる。
【００２０】
また、可変部分検出部２は、番組コンテンツの前後の主題歌（オープニングテーマ、エンディングテーマ）の流れる部分も可変部分と判定する。コンテンツの最初や最後の近くで歌の部分を可変部分と判定する。また、週毎、日毎、など一定時間毎に（周期的に）同じ特徴ベクトルが生成される部分を可変部分とすることも可能である。
【００２１】
このようにして、コンテンツから可変部分が検出された場合には（ステップＳ３）、ステップＳ４へ進み、当該可変部分を当該コンテンツから削除する。
【００２２】
可変部分は主にＣＭの部分であるが、ＣＭ以外に前後の主題歌の部分や周期的に同様の特徴ベクトルが生成される部分など、可変部分にはいくつかの種類がある。特徴ベクトルを作成する際にこれらの種類によって削除する可変部分を選択してもよい。例えばＣＭの部分は削除せず、前後の主題歌の部分だけ削除するなどである。このことにより、ＣＭを検索することが目的の場合には、ＣＭ部分を削除せずに特徴ベクトルを生成することも可能である。
【００２３】
ステップＳ４で、入力されたコンテンツから可変部分を削除すると、次に、ステップＳ５へ進み、特徴ベクトル計算部３は、特徴ベクトルを生成するために、まず、可変部分の削除されたコンテンツから、特徴タイミング、すなわち、当該コンテンツのシーン（場面）の変化する（シーンチェンジする）時点あるいは無音区間の出現する時点（例えば、無音区間の開始時点）あるいは、音量が予め定められたレベル以上となる時点などを検出する。
【００２４】
シーンチェンジ、無音区間及び音量が予め定められたレベル以上となる状態のうちのいずれか２つ以上を組み合わせて、それぞれを特徴タイミングとして検出してもよいし、シーンチェンジ、無音区間及び音量が予め定められたレベル以上となる状態のうちのいずれか１つを特徴タイミングとして検出してもよい。
【００２５】
シーンの変化する（切り替わる）時点とは、コンテンツ内で動きの大きい時点、すなわち、画像全体が大きく変化する時点を言う。シーンチェンジを検出する方法としては、時系列画像で前後の画像が大きく違う時点を検出する。また他にはＭＰＥＧの動きベクトルから求めることもでき、公知効用の技術を用いればよい。
【００２６】
無音区間の検出方法としては、コンテンツの音声のレベル（音の大きさ）が、ある閾値よりも小さい部分を無音区間として判定する。この場合、例えば、無音区間の開始時点を特徴タイミングとして検出する。
【００２７】
このようにして、可変部分の削除されたコンテンツから各特徴タイミングが検出されると、次に、ステップＳ６へ進み、特徴ベクトル計算部３は、検出された特徴タイミングから特徴ベクトルを生成する。特徴ベクトル計算部３は、検出された特徴タイミングの数と、可変部分の削除されたコンテンツの先頭から各特徴タイミングまでの時間を用いて、特徴ベクトルを求める。ここでは、コンテンツを当該コンテンツ中から検出された特徴タイミングで区切った各区間をセグメントと呼ぶ。特徴ベクトルは、この各セグメントの時間長を示す数値を先頭から順に一列に並べた数列である。この数列中の数値の数は、コンテンツ中のシーンチェンジ、無音区間の出現回数など、コンテンツの特徴を示す特徴タイミングの数に等しい。
【００２８】
例えば、あるコンテンツにおいて、特徴タイミングが先頭から５秒後、８秒後、１６秒後に検出された場合には、各セグメントの長さは「５、３、８」となるから、これを特徴ベクトルとする。
【００２９】
セグメントの時間長が非常に短い場合、例えば、１秒以下の間隔で特徴タイミングが連続している場合、１秒以下を切り上げて、セグメントの時間長を１秒単位で示すようにしてもよい。例えば、特徴タイミングが先頭から０．２秒後、１．８秒後、２．２秒後、３．５秒後にある場合、各セグメントの長さを１／１０秒単位で示すと、「０．２、１．６、０．４、１．３」となるが、各セグメントの長さを１秒単位で示すと、「１、１、１、１」となる。前者の方がより詳細度あるいは精度の高い特徴ベクトルであると云える。
【００３０】
ここでは、各セグメントの時間長を先頭から順に並べた数列を特徴ベクトルとしているが、この場合に限らず、例えば、（可変部分の削除された）コンテンツの先頭から各特徴タイミングが検出された時点までの時間長を示す数値を先頭から順に一列に並べた数列であってもよい。すなわち、特徴タイミングが先頭から５秒後、８秒後、１６秒後に検出された場合には、「５、８、１６」を特徴ベクトルとして用いることもできる。
【００３１】
このように、特徴ベクトルは、コンテンツ中でのシーンチェンジあるいは無音区間の出現パターンなどコンテンツの特徴を示しているといえる。
【００３２】
特徴ベクトル計算部３は、上記のようにして、特徴ベクトルを生成するとともに、当該コンテンツから、各特徴タイミングの検出された時点における画像（好ましくは実際の画像よりも解像度を小さくした画像）や、音声データ、音量などの特徴情報を抽出してもよい。
【００３３】
ステップＳ７では、ステップＳ６で生成された特徴ベクトルと、当該特徴ベクトルに対応する、コンテンツ入力部１から入力されたコンテンツとを特徴ベクトル記憶部４に記憶する。特徴ベクトル計算部３が、特徴ベクトルを生成するとともに、当該コンテンツから各特徴タイミングにおける上記特徴情報を抽出する場合には、この各特徴タイミングにおける特徴情報を上記特徴ベクトル中の対応する各数値（各特徴タイミング）に対応つけて特徴ベクトル記憶部４に記憶する。
【００３４】
なお、上記説明では、特徴ベクトル計算部３では、可変部分が削除されたコンテンツから特徴ベクトルを求めていたが、特徴ベクトルは可変部分を含むコンテンツの全体から求めておき、特徴ベクトルから可変部分を取り除くために、特徴ベクトルを当該コンテンツの可変部分が出現する場所(時間)情報と組にして、特徴ベクトル記憶部４で記憶しても、同様の効果が得られる。
【００３５】
以上のようにして、放送コンテンツやＤＶＤコンテンツから、各コンテンツの識別子と用いられる特徴ベクトルが計算される。
【００３６】
この特徴ベクトルの特徴は、可変部分、つまりＣＭ部分を除いて特徴ベクトルを求めていることと、コンテンツ中でのシーンチェンジあるいは無音区間の出現パターンなどのコンテンツの特徴を示しているために、放送日時や放送局などのコンテンツに付属する情報に依存しない、コンテンツの内容そのもののみに依存するという点である。つまり、地域によって放送日時や放送局が違ったり、また再放送などによって、途中のＣＭが違っていても、コンテンツの内容が同じであれば、同様の特徴ベクトルを得ることができるのである。
【００３７】
（第２の実施形態）
図３は、図１の特徴ベクトル生成装置を用いた、第２の実施形態にかかる検索システムの構成例を示したものである。なお、図３において、図１と同一部分には同一符号を付し、異なる部分についてのみ説明する。すなわち、図３では、図１の特徴ベクトル生成装置の各構成部のほかに、上記特徴ベクトルを用いてコンテンツを検索するための検索部５、コンテンツを記憶するためのコンテンツ記憶部６が追加されている。
【００３８】
特徴ベクトル記憶部４には、図４に示すように、放送コンテンツから、上記特徴ベクトル生成装置で生成された、当該放送コンテンツを識別することのできる特徴ベクトルや特徴情報、コンテンツ記憶部６などに記憶される各放送コンテンツを読み出すための当該放送コンテンツへのリンク情報（例えば、当該放送コンテンツの記憶領域のアドレスなど）などが記憶されている。特徴ベクトル記憶部４では、特徴ベクトル、特徴情報、コンテンツへのリンク情報を含むレコードデータに対し、データＩＤを付して記憶している。なお、レコードデータには、リンク情報の代わりにコンテンツそのものが含まれていてもよい。いずれにしても、特徴ベクトルや特徴情報が、コンテンツに対応づけて記憶されていればよい。すなわち、後述する検索部５で、あるレコードデータが検索されたときには、当該レコードデータに含まれる特徴ベクトルや特徴情報に対応するコンテンツを特定できればよい。
【００３９】
コンテンツ入力部１には、コンテンツ格納要求とともにコンテンツが入力される場合と、コンテンツ検索要求とともにコンテンツが入力される場合とがある。
【００４０】
コンテンツ入力部１に、コンテンツ格納要求とともにコンテンツが入力された場合の特徴ベクトル生成処理を含むコンテンツ格納処理動作は、第１の実施形態と同様である。すなわち、第１の実施形態で説明したように、当該コンテンツから特徴ベクトルを生成し、図４に示したように、特徴ベクトル記憶部４に、特徴ベクトル、特徴情報、コンテンツへのリンク情報、及びデータＩＤを１組するとするレコードデータを記憶し、コンテンツ記憶部６に当該コンテンツを記憶する。
【００４１】
コンテンツ入力部１に、コンテンツ検索要求とともにコンテンツが入力された場合には、第１の実施形態で説明したように、当該コンテンツから特徴ベクトルを生成し、検索部５は、この生成された特徴ベクトルを検索条件として用いて、特徴ベクトル記憶部４に記憶されているレコードデータのなかから検索条件の特徴ベクトルを含むレコードデータを検索する。検索されたレコードデータから、所望のコンテンツを得る。
【００４２】
以下、コンテンツ入力部１にコンテンツ検索要求が入力された場合について説明する。
【００４３】
コンテンツ入力部１にコンテンツ検索要求とともに入力されたコンテンツから特徴ベクトルを生成する処理動作は、第１の実施形態と同様である。ここでは、特徴ベクトルａが生成されたとする。特徴ベクトル計算部３は、生成された特徴ベクトルａを検索部５に渡す。検索部５は、受け取った特徴ベクトルａを検索条件として用いて、特徴ベクトルａに類似した特徴ベクトル含むレコードデータを特徴ベクトル記憶部４から検索する。
【００４４】
上記特徴ベクトル生成処理において、可変部分を取り除いたコンテンツから特徴ベクトルを生成する場合には、特徴ベクトル記憶部４に記憶されている特徴ベクトルと、検索条件としての特徴ベクトルを、そのまま用いて検索する。
【００４５】
一方、上記特徴ベクトル生成処理において、特徴ベクトルが可変部分を含むコンテンツの全体から生成される場合には、特徴ベクトル記憶部４に記憶されている特徴ベクトルと、検索条件としての特徴ベクトルのそれぞれから、当該可変部分のデータを取り除いて、検索を行う。この場合、可変部分のデータは、前述したように、特徴ベクトル記憶部４に記憶されているから、特徴ベクトル記憶部４に記憶されている特徴ベクトルから可変部分のデータを取り除く場合には、この特徴ベクトル記憶部４に記憶されている可変部分のデータ（可変部分の場所（時間）を示すデータ）を用いる。
【００４６】
いずれの場合においても検索時には、可変部分、すなわち、ＣＭ部分を取り除いたコンテンツの特徴ベクトルを用いて検索を行う。再放送や、地域差によりコンテンツ内にあるＣＭが違っていても、コンテンツを同定することができる。
【００４７】
検索部５では、特徴ベクトル記憶部４に記憶されている特徴ベクトルと検索条件の特徴ベクトルとの間の類似度を計算して検索を行う。ここでは、例えば、特徴ベクトル記憶部４に記憶されている各特徴ベクトルと検索条件の特徴ベクトルとの間で内積を計算することで、両者の類似度を求める。
【００４８】
なお、特徴ベクトルの数列からｎ−ｇｒａｍを用いて検索することも可能である。例えば、特徴ベクトル記憶部４に記憶されている特徴ベクトルから、検索条件の特徴ベクトル中のあるＮ個の連続する数値を含む特徴ベクトルを検索する。ｎ−ｇｒａｍを用いて検索することにより、例えば特徴ベクトル記憶部４に記憶されている特徴ベクトルが可変部分を除いたコンテンツ全体に対し生成されたものであり、また、検索条件の特徴ベクトルａがあるコンテンツの１部分だけの断片から生成された場合でも、特徴ベクトル記憶部４に記憶された特徴ベクトルから、特徴ベクトルａが類似している特徴ベクトルを検索することが可能であり、またその類似個所を特定することも可能である。この場合、検索クエリとなる特徴ベクトルは、全ての特徴タイミングから生成されなくてもよい。全ての特徴タイミングの数が多すぎる場合には、一定量の長さになるように、例えば先頭から２００個というように、一定量の特徴タイミングのみから特徴ベクトルを生成するように、上限を設定してもよい。
【００４９】
また、検索部５は、特徴ベクトルに含まれる、各セグメントの時間長について、ヒストグラムを作成し、特徴ベクトル記憶部４に記憶されている各特徴ベクトルと検索条件の特徴ベクトルとの間で、そのヒストグラムの類似度を計算して、検索を行うようにしてもよい。この場合、特徴ベクトル記憶部４に記憶されている特徴ベクトルと検索条件の特徴ベクトルとの間で、各セグメントの時間長のヒストグラムにおいて、各時間長の頻度の差の和がある閾値を越えない場合、２つの特徴ベクトルは類似しているとみなす。
【００５０】
この方法により計算される類似度は、特徴ベクトル毎に、どのくらいの頻度で同じ特徴タイミングが存在するかに基づく類似度であり、各セグメントの順番に因らないため、検索コストが少ない。よってこのヒストグラムを用いた検索を前処理として用いて、特徴ベクトル記憶部４に記憶されている全特徴ベクトルのなかから、検索条件の特徴ベクトルａのヒストグラムと類似する特徴ベクトルを予め検索しておき、この絞り込まれた各特徴ベクトルと検索条件の特徴ベクトルａとの間で、内積を用いた検索方法やｎ−ｇｒａｍを用いた検索方法により、検索条件の特徴ベクトルａと類似する特徴ベクトルを特定する。
【００５１】
また、図４に示すように、特徴ベクトル記憶部４に、特徴ベクトルとともに、各特徴タイミングにおける特徴情報（画像、音声、音量などの情報）が記憶され、検索部５に、検索条件として特徴ベクトルａとともに、各特徴タイミングにおける特徴情報（画像、音声、音量などの情報）が、特徴ベクトル計算部３から渡される場合には、特徴ベクトル間の類似度のほかに、特徴タイミング毎の特徴情報を比較して、より詳細な検索を行う。画像の類似度や、音声データ・音量の類似度の算出方法は、公知効用の技術を用いれば容易に行える。例えば、画像の類似度は、画像を輝度値のベクトルに変換し、内積を計算してベクトル同士の比較を行い、その類似性を計算する。また音量の類似度は、２つの音量の差が予め定められた閾値以下の場合に類似しているとみなす。
【００５２】
同じコンテンツであっても、特徴ベクトル計算部３で必ず全く同じ特徴ベクトルが生成されるとは限らない。すなわち、特徴ベクトル計算部３で当該コンテンツから特徴ベクトルを生成する度に、特徴タイミングが検出される位置がずれて、多少異なる特徴ベクトルが生成されてしまうことは否めない。しかし、検索部５で、上記のような特徴ベクトル間の類似性を基に検索を行うことにより、ある程度の違いは吸収することができる。
【００５３】
このように、検索部５では、検索条件の特徴ベクトルａと類似する特徴ベクトルを特徴ベクトル記憶部４から検索して、当該特徴ベクトルａと最も類似する特徴ベクトルを含むレコードデータ、すなわち、検索条件にマッチするコンテンツを検索する。
【００５４】
上記第２の実施形態にかかる検索システムによれば、放送時間や放送局が異なっていたり、地域により違うＣＭが含まれている同じ内容のコンテンツに、検索条件として上記特徴ベクトルが与えられれば、このような違いに関わりなく、所望のコンテンツを容易にしかも確実に検索することができる。
【００５５】
なお、上記第２の実施形態では、放送コンテンツから特徴ベクトルを生成し、放送コンテンツを検索する場合を例にとり説明した、放送コンテンツに限らず、市販のＤＶＤなどに記憶されているコンテンツについても、上記同様であり、上記同様の効果が得られる。市販のＤＶＤに記憶されるコンテンツの場合には、内容は似ているが、少しの違いを含む場合がある。例えば編集のしかたが異なるバージョンが別のパッケージとして販売されている。これらを似ているコンテンツであるとして検索することができる。この場合は可変部分検出部２は、ＤＶＤのバージョンによって違う特典映像などを検出したり、または、ＤＶＤに含まれる宣伝情報などを検出して、その可変部分を別に扱うことにより、類似コンテンツの検出を容易にすることができる。
【００５６】
（第３の実施形態）
図５は、図１の特徴ベクトル生成装置を用いた、第３の実施形態にかかる検索システムの構成例を示したもので、サーバ１００と複数のクライアント１０１とからなる、クライアント・サーバシステムである。なお、図５において、図１及び図３と同一部分には同一符号を付している。クライアント１０１は、コンテンツ入力部１、可変部分検出部２、特徴ベクトル計算部３と、さらに、サーバ１００と通信を行うための通信部７、メタデータ出力部９を有する。クライアント１０１には、受信した放送コンテンツや、ＤＶＤなどの記録媒体から読み出されたコンテンツを再生・表示するコンテンツ閲覧装置１０２が接続されている。
【００５７】
サーバ１００は、各クライアント１０１と通信を行うための通信部８、特徴ベクトル記憶部４、検索部５を有する。
【００５８】
クライアント１０１のコンテンツ入力部１には、メタデータ格納要求とともにコンテンツ及び当該コンテンツに対するメタデータが入力される場合と、検索要求とともにコンテンツが入力される場合とがある。
【００５９】
コンテンツ入力部１にメタデータ格納要求とともに、コンテンツ及びメタデータが入力された場合には、第１の実施形態で説明したように、当該コンテンツから、特徴ベクトルを生成して、当該特徴ベクトルとともに、入力されたメタデータなどが、通信部７を介してサーバ１００へ送信される。サーバ１００は、通信部８で、クライアント１０１から送信された特徴ベクトルやメタデータなどを受信すると、当該特徴ベクトルやメタデータを含むレコードを特徴ベクトル記憶部４に記憶する。
【００６０】
なお、クライアント１０１の特徴ベクトル計算部３で、可変部分を含むコンテンツから特徴ベクトルが計算される場合には、当該特徴ベクトルとともに、可変部分のデータもサーバ１００へ送信し、サーバ１００では、当該特徴ベクトル、メタデータ及び可変部分のデータを含むレコードデータを特徴ベクトル記憶部４へ記憶する。
【００６１】
特徴ベクトル記憶部４には、後述するように、各クライアント１０１から送信されてきた、コンテンツのメタデータ、特徴ベクトルなどを含む複数のレコードデータが記憶されている。
【００６２】
コンテンツ入力部１に、検索要求とともにコンテンツが入力される場合には、第１の実施形態で説明したように、当該コンテンツから特徴ベクトルを生成し、検索条件として当該特徴ベクトルなどを含む検索要求が通信部７から送信される。サーバ１００は、この検索要求を通信部８で受信すると、検索部５は、当該検索要求の検索条件に含まれている特徴ベクトルに類似する特徴ベクトルを含むレコードデータを検索して、当該レコードデータに含まれるメタデータを特徴ベクトル記憶部４から取得し、それを要求元のクライアント１０１へ返す。
【００６３】
あるコンテンツに対応するメタデータとは、例えば、当該コンテンツに対するユーザからの意見やコメントなどである。メタデータ格納要求を受け付けるために、図５のクライアント・サーバシステムは、電子掲示板（ＢＢＳ）を用いている。すなわち、クライアント１０１のコンテンツ入力部１は、電子掲示板を用いて、メタデータ格納要求を受け付けるようになっている。クライアント１０１のユーザは、あるコンテンツに対する意見やコメントなどのメタデータの格納要求を、電子掲示板（ＢＢＳ）により提供される所定のページにメタデータを書き込むことにより行う。このとき、特徴ベクトル計算部３は、コンテンツ入力部１から入力された当該コンテンツについての特徴ベクトルを生成する。この特徴ベクトルが当該メタデータに添付されて投稿される。特徴ベクトルの添付された意見やコメントなどのメタデータは通信部７を介して、クライアント１０１からサーバ１００へ送信される。サーバ１００は、通信部７を介して受信した特徴ベクトルの添付されたメタデータを含むレコードデータを特徴ベクトル記憶部４に記憶する。
【００６４】
別のユーザがあるコンテンツを見ながら、他のユーザが投稿した意見やコメントなどのメタデータを見たいときには、当該別のユーザのクライアント１０１のコンテンツ入力部１から検索要求とともに当該コンテンツが入力される。当該コンテンツの特徴ベクトルを特徴ベクトル計算部３で生成し、この特徴ベクトルを検索条件として含む検索要求をサーバ１００に送信する。サーバ１００は、当該検索要求を受信すると、検索部５は、当該検索要求の検索条件に含まれる特徴ベクトルに類似する特徴ベクトルを含むレコードデータを特徴ベクトル記憶部４から検索して、当該検索されたレコードデータに含まれるメタデータを要求元のクライアント１０１へ返す。
【００６５】
このように、上記第３の実施形態にかかる検索システムによれば、特徴ベクトル記憶部４に記憶されている様々なコンテンツに対するメタデータのなかから、ユーザが閲覧中のコンテンツに対するメタデータを容易に抽出することができるのである。
【００６６】
ユーザは、コンテンツ全体に対する意見だけではなく、コンテンツのある場面についての意見も投稿することができる。例えば、ユーザが意見を投稿する場合、クライアント１０１に接続されているコンテンツ閲覧装置１０２で閲覧中のコンテンツの再生を一時停止し、その一時停止された場面での意見をコンテンツ入力部１、すなわち、電子掲示板を用いて入力する。一方、コンテンツ閲覧装置１０２で閲覧されているコンテンツデータは、コンテンツ入力部１にも入力されているので、可変部分検出部２及び特徴ベクトル計算部３は、コンテンツ入力部１に入力されたコンテンツデータを用いて、コンテンツ閲覧装置１０２で再生・表示されているコンテンツデータから、第１の実施形態で説明したように、特徴ベクトルを生成する。また、コンテンツ閲覧装置１０２ではコンテンツの再生開始から、時刻（再生時刻）を計測しており、この計測された再生時刻をコンテンツ入力部１及びメタデータ出力部９などにも出力するようになっている。そこで、コンテンツ入力部１は、再生の一時停止が指示されたときの再生時刻とともに、入力された意見（メッセージ）を一時記憶する。
【００６７】
ユーザにより入力された意見（メッセージ）には、当該コンテンツの特徴ベクトル（可変部分の削除されたコンテンツ全体から生成された特徴ベクトル）と、上記再生時刻が添付されてサーバ１００に送信される。サーバ１００は、特徴ベクトル、再生時刻、当該再生時刻に再生される場面に対するユーザの意見、すなわち、メタデータを含むレコードデータを特徴ベクトル記憶部４に記憶する。
【００６８】
なお、コンテンツの特徴ベクトルは、当該コンテンツがコンテンツ閲覧装置１０２で再生・表示されると同時に当該コンテンツをコンテンツ入力部１に入力しながら、可変部分検出部２及び特徴ベクトル計算部３で生成するのではなく、当該コンテンツがコンテンツ閲覧装置１０２で再生・表示される前に、コンテンツ入力部１に予めコンテンツを入力しておき、可変部分検出部２及び特徴ベクトル計算部３で生成するようにしてもよい。後者の場合には、ユーザが再生の一時停止を行い意見を入力した時点では、すでに特徴ベクトルが生成されているから、メタデータ格納要求の操作を行うとすぐに、ユーザにより入力された意見（メッセージ）、当該コンテンツの特徴ベクトル（可変部分の削除されたコンテンツ全体から生成された特徴ベクトル）、上記再生時刻を含むメタデータ格納要求がサーバ１００に送信される。
【００６９】
サーバ１００の特徴ベクトル記憶部４に、コンテンツの特徴ベクトル、メタデータ及び、当該メタデータに対応する場面の再生時刻を記憶することで、別のユーザが、同じコンテンツを閲覧中に、現在閲覧している場面（の再生時刻）に応じたメタデータを表示することができる。
【００７０】
例えば、別のユーザが、あるコンテンツを閲覧する際に、当該コンテンツについて、予め可変部分検出部２及び特徴ベクトル計算部３で、第１の実施形態で説明したように予め生成された特徴ベクトルを検索条件として含む検索要求を、通信部７を介してサーバ１００へ送信する。サーバ１００は、当該検索条件に含まれる特徴ベクトルと類似する特徴ベクトルを含むレコードデータを特徴ベクトル記憶部４から検索して、当該検索されたレコードデータを（そのようなレコードデータが複数あればその全てを）当該別のユーザのクライアント１０１に返す。すなわち、クライアント１０１は、あるコンテンツを閲覧する際に、まず、当該コンテンツの特徴ベクトルと類似する特徴ベクトルを含むレコードデータをサーバ１００からダウンロードしておく。ダウンロードされたレコードデータは、例えば、メタデータ出力部９に一時格納される。
【００７１】
コンテンツ閲覧装置１０２は、再生・表示されているコンテンツの再生時刻を計測し、この再生時刻は、コンテンツ入力部１及びメタデータ出力部９に出力される。メタデータ出力部９は、このコンテンツ閲覧装置１０２から出力される再生時刻と、ダウンロードされた各レコードデータに含まれる再生時刻とを比較し、コンテンツ閲覧装置１０２から出力される再生時刻が、ダウンロードされたレコードデータに含まれる再生時刻（ｔｉｍｅ）に一致すると（ダウンロードされたレコードデータに含まれる再生時刻（ｔｉｍｅ）に対応した場面が再生・表示されているときに）、当該レコードデータに含まれるメタデータを表示する。
【００７２】
図６は、メタデータの表示例を示したもので、例えば、コンテンツ閲覧装置１０２のディスプレイの画面表示例を示したものである。この画面表示では、コンテンツ表示領域２０１、メタデータ表示領域２０２、コンテンツ制御領域２０３、意見書き込み領域２０４が設けられている。この画面は、コンテンツ入力部１及びメタデータ出力部９の制御の下、コンテンツ、メタデータなどが表示される。
【００７３】
コンテンツ表示領域２０１には、コンテンツ閲覧装置１０２で再生されているコンテンツが表示される。
【００７４】
メタデータ表示領域２０２には、メタデータ出力部９により、サーバ１００からダウンロードされた各レコードデータに含まれるメタデータが、当該レコードデータに含まれる再生時刻に応じて表示される。
【００７５】
メタデータ格納要求を送信する場合には、ユーザは、コンテンツの再生を一時停止し、意見書き込み領域２０４の領域２０４ａに、自分の意見を書き込み、送信ボタン２０４ｂを押す。これを受けて、コンテンツ閲覧装置１０２から出力された、そのときの再生時刻（コンテンツ再生開始から、一時停止するまでに計測された時刻）と、領域２０４ａに書き込まれた内容とが、一時コンテンツ入力部１に記憶される。その後、第１の実施形態で説明したように、可変部分検出部２及び特徴ベクトル計算部３により当該可変部分の除かれたコンテンツ全体から特徴ベクトルが生成されると（あるいは、前述したように、予め当該コンテンツについて特徴ベクトルを生成しておいてもよい）、一時記憶された、領域２０４ａに書き込まれた意見（メタデータ）と再生時刻が、当該特徴ベクトルとともに、通信部７からサーバ１００に送信される。
【００７６】
この場合のサーバ１００の特徴ベクトル記憶部４のレコードデータの記憶例を図７に示す。
【００７７】
ユーザからのメタデータ格納要求に含まれる「このプレーすごいですね」というメタデータ、当該メタデータに対応するコンテンツの特徴ベクトル、当該コンテンツの再生開始から（当該コンテンツの先頭から）計測された、当該メタデータを投稿する際にコンテンツ表示領域２０１に表示されていた場面の再生時刻（図７では、「ｔｉｍｅ」欄に書き込まれている）などを含むレコードデータには、当該レコードデータを識別するためのデータＩＤとして「３」が付与されて、特徴ベクトル記憶部４に登録される。
【００７８】
図７において、特徴ベクトル記憶部４に記憶されているデータＩＤ「１」のレコードデータは、特徴ベクトルが「１１、１０、１５、６、４」のコンテンツの、再生時刻（ｔｉｍｅ）が「１５３０００ミリ秒」の場面に、「すごいＦｉｎｅＰｌａｙです。」という意見（メタデータ）を投稿したものである。
【００７９】
例えば、上記データＩＤ「１」のレコードデータに対応するコンテンツを見ている他のユーザが、当該レコードデータをダウンロードすると、ユーザが当該コンテンツを閲覧しているときに、当該レコードデータに含まれている時刻（ｔｉｍｅ）になると、図９に示すように、メタデータ表示領域２０２に当該レコードデータに含まれているメタデータが表示される。
【００８０】
図７のデータＩＤ「２」のレコードデータは、リンク情報が含まれている。リンク先は、特徴ベクトル「１０、５、１３、５、４、６」のコンテンツの再生時刻「３２６０００秒」のシーンである。上記データＩＤ「２」のレコードデータに対応するコンテンツを見ている他のユーザが、当該レコードデータをダウンロードすると、ユーザが当該コンテンツを閲覧しているときに、当該レコードデータに含まれている時刻（ｔｉｍｅ）になると、図９に示すように、メタデータ表示領域２０２に当該レコードデータに含まれているメタデータが表示される。このメタデータには、上記リンク先へのリンクが設定されている。従って、メタデータ表示領域２０２に表示された当該データＩＤ「２」のメタデータであるメッセージを、ユーザがクリックすると、上記リンク先、すなわち、特徴ベクトル「１０、５、１３、５、４、６」のコンテンツの再生時刻「３２６０００秒」のシーンがコンテンツ表示領域２０１に表示される。
【００８１】
ある特定のコンテンツに対する意見を投稿するためのＢＢＳそのものをメタデータとした場合、この電子掲示板自体に当該特定の番組コンテンツの特徴ベクトルを予め添付しておいてもよい。具体的には、図８に示すように、サーバ１００の特徴ベクトル記憶部４に、電子掲示板のアドレス（図８では、「ｂｂｓ−ｕｒｌ」欄に記述される）と当該特定のコンテンツの特徴ベクトルを含む複数のレコードデータが登録されたＢＢＳテーブルが予め記憶されている。
【００８２】
この場合、ユーザがあるコンテンツに対する意見を投稿しようとする際には、ユーザは、まず、クライアント１０１のコンテンツ入力部１から電子掲示板の検索要求を行うための指示入力を行い、これを受けて、当該コンテンツについて予め生成された特徴ベクトルを検索条件として含む電子掲示板の検索要求が、通信部７からサーバ１００へ送信される。
【００８３】
サーバ１００の検索部５は、当該検索要求に含まれる検索条件の特徴ベクトルと類似する特徴ベクトルを含むレコードデータを図８のＢＢＳテーブルから検索する。その結果、検索されたレコードデータに含まれる電子掲示板のアドレスを要求元のクライアントに返す。電子掲示板のアドレスを受け取ったクライアント１０１のコンテンツ入力部１は、通信部７を介して、当該アドレスにアクセスし、例えば、図６の表示画面上で、意見書き込み領域２０４がアクティブとなる。すなわち、意見書き込み領域２０４の領域２０４ａへ意見を書き込み、当該意見（メタデータ）の格納要求をサーバ１００へ送信することができる。
【００８４】
このように、特徴ベクトルを用いて電子掲示板を検索することにより、コンテンツに対する意見を投稿する際に、投稿先の所望の電子掲示板を容易に得ることができる。
【００８５】
以上説明したように、上記第３の実施形態によれば、地域によって、あるいは再放送などにより、放送時間や放送局が異なり、そのために異なるＣＭが含まれていたり、さらに、記録媒体のバージョンが異なるなどにより、異なるＣＭが含まれている（すなわち、可変部分を含む）同じ内容のコンテンツを、当該コンテンツの特徴ベクトルを用いて同定することで、可変部分を含んでいても、この可変部分の違いに関わりなく、同じ内容のコンテンツに対するメタデータを容易に検索することができる。
【００８６】
なお、図５には示していないが、クライアント１０１において、あるコンテンツについて、特徴ベクトルを生成したときには、当該特徴ベクトルと、当該コンテンツを対応つけて記憶するための記憶部が設けられていてもよい。あるコンテンツについて、一度特徴ベクトルを生成しておくと、以後は、当該記憶部に記憶された特徴ベクトルを、メタデータ格納要求や検索要求に用いるようにしてもよい。
【００８７】
（第４の実施形態）
図９は、図１の特徴ベクトル生成装置を用いた、第４の実施形態にかかる検索システムの構成例を示したものである。なお、図９において、図３、図５と同一部分には同一符号を付している。
【００８８】
図９に示す検索システムは、図５と同様、サーバ１００と複数のクライアント１０１とからなる。クライアント１０１には、図５と同様にコンテンツ閲覧装置１０２が接続されている。また、クライアント１０１は、コンテンツ入力部１と、可変部分検出部２と、特徴ベクトル計算部３と、可変部分検出部２及び特徴ベクトル計算部３で、コンテンツ入力部１から入力された各コンテンツについて生成された特徴ベクトルと、当該コンテンツに対するメタデータなどを含むレコードデータを、例えば図４あるいは図７に示すように記憶する特徴ベクトル記憶部４と、特徴ベクトル記憶部４から特徴ベクトルを用いてレコードデータを検索する検索部５と、通信部７を含み、さらに、図５のメタデータ出力部９と、後述するように、サーバ１００からダウンロードしたメタデータを用いてコンテンツを編集するためのコンテンツ編集部１０を有している。
【００８９】
サーバ１００は、通信部８と、特徴ベクトルを含むメタデータを記憶するメタデータ記憶部１１と、上記検索部５と同様に、特徴ベクトルを用いてメタデータ記憶部１１に記憶されているメタデータを検索したり、検索条件として与えられた文字列をキーとして、メタデータ記憶部１１に記憶されているメタデータを検索したりする検索部１２を含む。
【００９０】
サーバ１００のメタデータ記憶部１１には、図７に示すような各クライアント１０１から送られてきたメタデータが記憶されていてもよい。
【００９１】
図９に示す構成の検索システムは、前述の第３の実施形態の検索システムと同様な処理動作も行える。例えば、図５に示す検索システムでは、検索部５はサーバ１００が有し、クライアント１０１からの検索要求を受けて、サーバ１００が特徴ベクトルを用いた検索を行っていたが、図９に示す検索システムの場合には、クライアント１０１が検索部５を有しているから、クライアント１０１内で、当該クライアント１０１内で生成された特徴ベクトルを用いて検索部５がメタデータの検索を行う。
【００９２】
以下、第３の実施形態とは異なる処理動作について説明する。
【００９３】
図９のサーバ１００のメタデータ記憶部１１には、コンテンツを編集するための編集情報を含むメタデータが記憶されている。コンテンツを編集する機器を用いて、番組の不要部分を削除したり、複数の番組コンテンツのそれぞれから、一部分を集めて再編集したり、番組にアノテーションを付けるなどした編集情報と、当該コンテンツの特徴ベクトルを含むメタデータ格納要求を、クライアント１０１からサーバ１００に送信する。サーバ１００は、当該メタデータ格納要求を受けて、特徴ベクトルとメタデータとしての編集情報を含むレコードデータをベクトル記憶部４に記憶する。
【００９４】
ある別のユーザが、コンテンツの編集情報を検索しようとする場合、クライアント１０１から、当該コンテンツの特徴ベクトルを検索条件とする検索要求がサーバ１００へ送信される。サーバ１００は、前述同様にして、特徴ベクトル記憶部４から、検索条件の特徴ベクトルと類似する特徴ベクトルを含むレコードデータを検索し、検索結果のレコードデータあるいは、当該レコードデータに含まれるメタデータを要求元のクライアント１０１へ返す。
【００９５】
クライアント１０１のコンテンツ編集部１０は、サーバ１００から返された検索結果のメタデータを使って、コンテンツを編集する。すなわち、メタデータが、当該コンテンツの不要部分を示す情報を含む編集情報の場合には、その編集情報を用いて、コンテンツ閲覧装置１０２で、不要部分が再生されないようにコンテンツ閲覧装置１０２を制御する。また、メタデータに、当該コンテンツのあるシーンにアノテーションを表示するための編集情報が含まれている場合には、そのシーンを再生するときに、同時に当該アノテーションを表示するよう、コンテンツ閲覧装置１０２を制御する。
【００９６】
サーバ１００のメタデータ記憶部１１には、例えば、図１０に示すようなメタデータが予め記憶されていてもよい。図１０のメタデータは、クライアント１０１にダウンロードされて、クライアント１０１でコンテンツの編集を行うためのメタデータを記述したものである。
【００９７】
図９のメタデータでは、映像については、「ｖｉｄｅｏｉｄ＝１」という識別子を付したビデオデータと、「ｖｉｄｅｏｉｄ＝２」という識別子を付したビデオデータを、この順に再生し、音声については、「ａｕｄｉｏ＝１」という識別子を付した音声データと、「ａｕｄｉｏ＝２」という識別子を付した音声データを、この順に再生し、さらに、「ｖｉｄｅｏｉｄ＝１」という識別子を付したビデオデータを再生しているときに、「○○のコーナーです」というメッセージを表示し、「ｖｉｄｅｏｉｄ＝１」という識別子を付したビデオデータを再生しているときに、「××のコーナーです」というメッセージを表示するという編集内容を示している。
【００９８】
より具体的には、「ｖｉｄｅｏｉｄ＝１」という識別子を付したビデオデータは、特徴ベクトルが「１、９、８、７、１２、３、４」であるコンテンツであり（図１０では、＜ｕｒｉｖｅｃｔｏｒ＞要素で示している値「１、９、８、７、１２、３、４」）、このコンテンツの先頭からの再生時刻（図１０では、＜ｕｒｉｔｉｍｅ＞要素で示している値）が「１５３０００ミリ秒」から、時間（図１０の＜ｕｒｉｄｕｒａｔｉｏｎ＞要素で示している値）「１０００ミリ秒」の間のビデオデータである。
【００９９】
このビデオデータの再生と同時に、「ａｕｄｉｏｉｄ＝１」という識別子を付した音声データ、すなわち、特徴ベクトルが「１、９、８、７、１３、２、１」であるコンテンツ（図１０では、＜ｕｒｉｖｅｃｔｏｒ＞要素で示している値「１、９、８、７、１３、２、１」）の先頭からの再生時刻（図１０では、＜ｕｒｉｔｉｍｅ＞要素で示している値）が「１５３０００ミリ秒」から、時間（図１０の＜ｕｒｉｄｕｒａｔｉｏｎ＞要素で示している値）「１０００ミリ秒」の間の音声データを再生する。
【０１００】
さらに、上記「ｖｉｄｅｏｉｄ＝１」という識別子を付したビデオデータを再生しているとき、当該ビデオデータの再生時刻（図１０では、＜ｔｉｍｅ＞要素で示している値）が「５秒」から、時間（図１０の＜ｄｕｒａｔｉｏｎ＞要素で示している値）「２０秒」の間、図１０の＜ｍｅｓｓａｇｅ＞要素の値「○○のコーナーです」を表示する。
【０１０１】
その後、「ｖｉｄｅｏｉｄ＝２」という識別子を付したビデオデータと、「ａｕｄｉｏｉｄ＝２」という識別子を付した音声データが同時に再生される。
【０１０２】
「ｖｉｄｅｏｉｄ＝２」という識別子を付したビデオデータは、特徴ベクトルが「１０、９、２、８、３、７、８」であるコンテンツ（図１０では、＜ｕｒｉｖｅｃｔｏｒ＞要素で示している値）の先頭からの再生時刻（図１０では、＜ｕｒｉｔｉｍｅ＞要素で示している値）が「１５４８００ミリ秒」から、時間（図１０の＜ｕｒｉｄｕｒａｔｉｏｎ＞要素で示している値）「５００００ミリ秒」の間のビデオデータである。
【０１０３】
「ａｕｄｉｏｉｄ＝２」という識別子を付した音声データは、特徴ベクトルが「１０、９、２、８、３、７、８」であるコンテンツ（図１０では、＜ｕｒｉｖｅｃｔｏｒ＞要素で示している値）の先頭からの再生時刻（図１０では、＜ｕｒｉｔｉｍｅ＞要素で示している値）が「１５４８００ミリ秒」から、時間（図１０の＜ｕｒｉｄｕｒａｔｉｏｎ＞要素で示している値）「５００００ミリ秒」の間の音声データである。
【０１０４】
さらに、上記「ｖｉｄｅｏｉｄ＝２」という識別子を付したビデオデータを再生しているとき、当該ビデオデータの再生時刻（図１０では、＜ｔｉｍｅ＞要素で示している値）が「１０秒」から、時間（図１０の＜ｄｕｒａｔｉｏｎ＞要素で示している値）「２０秒」の間、図１０の＜ｍｅｓｓａｇｅ＞要素の値「××のコーナーです」を表示する。
【０１０５】
図１０に示したようなメタデータには、「１、９、８、７、１２、３、４」、「１、９、８、７、１３、２、１」、「１０、９、２、８、３、７、８」という３つのコンテンツの特徴ベクトルが含まれている。従って、クライアント１０１からの検索要求に含まれる検索条件の特徴ベクトルが、上記３つの特徴ベクトルのうちのいずれかに類似する場合に、当該メタデータが検索部１２により検索される。サーバ１００は、検索結果の図１０のメタデータを要求元のクライアント１０１へ返す。クライアント１０１のコンテンツ編集部１０は、当該メタデータを用いて、コンテンツの編集を行う。なお、特徴ベクトルは、図１０で表示したものよりも長いことが考えられるが、ここでは説明のために簡単に表示している。
【０１０６】
なお、図１０のメタデータの特徴ベクトルが記述されている領域には、当該特徴ベクトルに対応するコンテンツへのリンクが設定されていてもよい。
【０１０７】
また、メタデータの検索方法としては、上記のように、特徴ベクトルを検索条件として用いる場合のほか、例えば、メタデータに各コンテンツのタイトルなどの文字列が含まれている場合には、さらに、文字列を検索条件として用いることもできる。すなわち、クライアント１０１のコンテンツ入力部１から、ユーザが、メタデータを検索するための所望の文字列を入力すると、当該文字列検索条件として含む検索要求がサーバ１００へ送信される。サーバ１００の検索部１２は、検索条件の文字列を含むメタデータをメタデータ記憶部１１から検索し、検索されたメタデータを要求元のクライアント１０１へ返す。
【０１０８】
また、あるコンテンツのあるシーンを特定するために、当該コンテンツ（可変部分の削除されたコンテンツ）の特徴ベクトルと、当該シーンの出現する再生時刻とを用いる場合を説明したが、この場合に限らない。例えば、特徴ベクトルを当該コンテンツの先頭から当該シーンの出現するまでのコンテンツデータから生成したり、当該シーン以降のコンテンツデータから当該コンテンツの特徴ベクトルを生成してもよい。この場合、検索部５や検索部１２で、特徴ベクトルを用いてレコードデータを検索するとき、検索条件の特徴ベクトルと特徴ベクトル記憶部４やメタデータ記憶部１１に記憶されている特徴ベクトルとの間で、特徴ベクトルの数列に含まれる全数値との間での類似度ではなく、特徴ベクトル記憶部４やメタデータ記憶部１１に記憶されている各特徴ベクトルの数列のうちのある一区間の数列が、検索条件の特徴ベクトルに最も類似する特徴ベクトルを検索する。
【０１０９】
（第５の実施形態）
図１１は、図１の特徴ベクトル生成装置を用いた、第５の実施形態にかかる検索システムの構成例を示したものである。このシステムは、サーバ１００と複数のクライアント１０１とからなる。なお、図１１において、図９と同一部分には同一符号を付し、異なる部分についてのみ説明する。
【０１１０】
クライアント１０１は、図９の各構成部の他に、属性情報取得部１３がさらに追加されている。
【０１１１】
ここで属性情報とは、コンテンツのタイトルや、放送日時、放送局名、ジャンル、コメントなどを記述したデータで、例えばＥＰＧ（electronic program guide）情報である。
【０１１２】
クライアント１０１の特徴ベクトル記憶部４には、例えば、図１２に示したように、コンテンツ入力部１から入力されたコンテンツから生成された特徴ベクトルと当該コンテンツについて属性情報取得部１３で取得した属性情報と、メタデータを含むレコードデータに当該レコードデータを識別するためのデータＩＤを付して記憶されている。なお、特徴ベクトル記憶部４には、サーバ１００からダウンロードされたレコードデータが記憶されていてもよい。レコードデータには、当該レコードデータに対応するコンテンツが実際に記憶されている記憶領域へのリンク情報や、コンテンツデータそのものが含まれていてもよい。
【０１１３】
サーバ１００のメタデータ記憶部１１にも、図１２に示したように、特徴ベクトル、属性情報、メタデータ、データＩＤを含むレコードデータが多数記憶されている。メタデータ記憶部１１に記憶されているメタデータは、各クライアント１０１からのメタデータ格納要求を受けて記憶されているものと、予め記憶されているものとがあってもよい。
【０１１４】
α地域のユーザＡが、属性情報取得部１３で取得した属性情報を用いて、コンテンツＣ１を選択し、コンテンツ閲覧装置１０２を経由して、当該コンテンツＣ１を録画する場合（例えば、当該属性情報からコンテンツＣ１の録画予約を行う）、コンテンツＣ１は、コンテンツ閲覧装置１０２からコンテンツ入力部１に出力されて、第１の実施形態で説明したように、可変部分検出部２及び特徴ベクトル計算部３により特徴ベクトルが生成される。そして、この特徴ベクトルと、属性情報取得部１３で取得された属性情報を含むレコードデータが特徴ベクトル記憶部４に記憶される。ここで、コンテンツＣ１の特徴ベクトルを「Ｂ１００１」、属性情報を「Ｅ１００１」とする。
【０１１５】
次に、図１３に示すフローチャートを参照して、図１１の検索システムにおけるメタデータの検索処理動作について説明する。
【０１１６】
ユーザＡは、コンテンツＣ１のメタデータを取得するために、コンテンツ入力部１から、特徴ベクトル「Ｂ１００１」と属性情報「Ｅ１００１」を検索条件として含む検索要求を行うための指示入力を行うと、当該検索要求が通信部７からサーバ１００へ送信される。
【０１１７】
サーバ１００の通信部８は、当該検索要求を受け取ると（ステップＳ１０１、ステップＳ１０２）、それを検索部１２へ渡す。検索部１２は、ステップＳ１０２で受け取った検索条件に属性情報が含まれていないときには、そのままステップＳ１０７へ進む。一方、当該検索要求に、属性情報が検索条件として含まれている場合には（ステップＳ１０３）ステップＳ１０４へ進み、まず、属性情報を用いて、当該属性情報に一致するレコードデータをメタデータ記憶部１１に記憶されているレコードデータのなかから検索する（ステップＳ１０４）。検索条件として与えられた属性情報「Ｅ１００１」を含むレコードデータが検索されたときには、当該レコードデータを要求元のクライアント１０１へ返す。
【０１１８】
クライアント１０１の通信部７で当該検索結果のレコードデータを受け取ると、メタデータ出力部９は、検索結果のレコードデータに含まれるメタデータなどの情報を、例えば、図１４に示すように、コンテンツ閲覧装置１０２に表示させる。表示されたメタデータをユーザＡが見て、ユーザＡが所望するコンテンツのメタデータを選択して、「ＯＫ」ボタン２０１を押すことで、処理は終了するが、そうでない場合には、すなわち、「キャンセル」ボタン２０２を押したときには、検索結果には、ユーザＡが所望するメタデータが含まれていない旨の通知が、コンテンツ入力部１から通信部７を介してサーバ１００へ通知される（ステップＳ１０６）。サーバ１０は当該通知を受け取ると、検索部１２は、次に、検索条件として与えられた特徴ベクトルを用いて、前述同様に検索を行う（ステップＳ１０７）。
【０１１９】
メタデータ記憶部１１に記憶されているレコードデータのなかから、検索条件の特徴ベクトル「Ｂ１００１」に類似する特徴ベクトルを含むレコードデータが検索されたときには（ステップＳ１０８）、当該レコードデータを要求元のクライアント１０１へ返す。
【０１２０】
クライアント１０１の通信部７で当該検索結果のレコードデータを受け取ると、メタデータ出力部９は、検索結果のレコードデータに含まれるメタデータなどの情報を、図１４に示すように、コンテンツ閲覧装置１０２に表示させる。このとき、表示されたメタデータをユーザＡが見て、ユーザＡが所望するコンテンツのメタデータが存在しな場合には、再び「キャンセル」ボタンが押されるので、それを受けて、その旨の通知が、サーバ１００へ通知され（ステップＳ１０９）、ここで処理が終了する。一方、表示されたメタデータをユーザＡが見て、ユーザＡが所望のレコードデータを選択して、「ＯＫ」ボタンを押すと、その旨が、サーバ１００へ通知される（ステップＳ１０９）。この通知を受けて、サーバ１００は、ステップＳ１１０へ進み、ステップＳ１０２で受け取った検索条件に属性情報が含まれている場合には、さらに、ステップＳ１１１へ進み、当該属性情報を、ステップＳ１０７及びステップＳ１０８で検索されたレコードデータに追加して、検索処理を終了する。
【０１２１】
なお、ステップＳ１０８で、特徴ベクトルを用いた検索を行った結果、当該特徴ベクトルに一致あるいは類似する特徴ベクトルを含むレコードデータが検索されなかったとき、ステップＳ１０９で、そのようなレコードデータが検索されたものの、ユーザＡが「キャンセル」ボタンを押したとき、ステップＳ１１０で、当該検索されたレコードデータの「いずれかに対し、ユーザＡが「ＯＫ」ボタンを押したものの、検索条件に属性情報が含まれていないとき、検索処理は、そこで、終了する。
【０１２２】
さて、上記ステップＳ１０６で、サーバ１００が、ユーザＡから、「ＯＫ」ボタンを押したとき、すなわち、ユーザＡから、所望するコンテンツＣ１のメタデータである旨の確認通知を受けたとする。この場合、ここで、検索処理が終了する。
【０１２３】
次にβ地域のユーザＢがユーザＡと同様のコンテンツＣ１を録画した場合、このコンテンツから、特徴ベクトル「Ｂ１００１」と類似した特徴ベクトル「Ｂ１００２」が生成され、当該コンテンツの属性情報は、属性情報「Ｅ１００１」とは異なる属性情報「Ｅ１００２」が取得されたとする。ユーザＢがメタデータを取得するために、ユーザＢのクライアント１０１から特徴ベクトル「Ｂ１００２」と属性情報「Ｅ１００２」を検索条件とする検索要求が上記ユーザＡの場合と同様に、サーバ１００に送信される。
【０１２４】
まず、サーバ１００の検索部５では、属性情報「Ｅ１００２」を用いて、メタデータ記憶部１１から当該属性情報に一致するレコードデータを検索する。属性情報には放送局、放送日時が含まれているため、属性情報「Ｅ１００２」と完全に一致する属性情報を含むレコードデータが検索される（ステップＳ１０１〜ステップＳ１０５）。
【０１２５】
ここで属性情報「Ｅ１００２」に一致する属性情報を含むレコードデータが検索されなかったときには、次に、ステップＳ１０７へ進み、検索部５は、検索条件の特徴ベクトル「Ｂ１００２」を基に検索を行う。検索条件の特徴ベクトル「Ｂ１００２」は特徴ベクトル「Ｂ１０００」と類似しているため、図１２のデータＩＤが「１」のレコードデータが検索される。このレコードデータには、メタデータ「Ｍ１００１」が含まれている（ステップＳ１０７）。
【０１２６】
属性情報や特徴ベクトルを用いた検索を行うと、該当するレコードデータは複数検索されることがある。検索されたレコードデータに含まれる、属性情報には、当該レコードデータに対応するコンテンツのジャンルを示す情報が含まれていることがある。ジャンルとは「映画」「スポーツ」などのコンテンツの種別のことである。
【０１２７】
サーバ１００は、各ユーザからの検索要求、メタデータ格納要求の履歴を記憶しておいてもよい。この場合、複数のレコードデータが検索されたときに、ユーザＢの履歴に記憶されている属性情報を参照して、出現頻度の高いジャンルの順に、検索結果のレコードデータを並び替えるなどのソーティング処理を行ってもよい。
【０１２８】
ステップＳ１０８で検索された、データＩＤ「１」のレコードデータを含む検索結果のレコードデータ群が、ユーザＢのクライアント１０１のメタデータ出力部９により、図１４に示すようにコンテンツ閲覧装置１０２に表示される。ユーザＢが、データＩＤ「１」のレコードデータを選択して、「ＯＫ」ボタンを押すことにより、データＩＤ「１」のレコードデータが、ユーザＢが所望するレコードデータである旨の通知がサーバ１００へ送信される（ステップＳ１０９）。サーバ１００は、ユーザＢから送られてきた検索条件に属性情報「Ｅ１００２」が含まれているので（ステップＳ１１０）、当該属性情報をデータＩＤ「１」のレコードデータに追加する（ステップＳ１１１）。
【０１２９】
この結果、メタデータ「Ｍ１００１」を含むデータＩＤ「１」のレコードデータは、特徴ベクトル「Ｂ１００１」と、属性情報「Ｅ１００１」と、属性情報「Ｅ１００２」を含むことになる。
【０１３０】
ユーザＢが検索要求を出す前に、サーバ１００のメタデータ記憶部１１に、特徴ベクトル「Ｂ１００２」と属性情報「Ｅ１００２」と、メタデータ「Ｍ１００１」とは異なるメタデータ「Ｍ１００２」とを含む別のレコードデータ（例えば、当該レコードデータのデータＩＤを「１０」とする）があり、当該レコードデータがデータＩＤ「１」のレコードデータとともに検索され、コンテンツ閲覧装置１０２で表示された場合に、ユーザＢがデータＩＤ「１」の（メタデータ「Ｍ１００１」を含む）レコードデータを選択した場合には、データＩＤ「１」のレコードデータに属性情報「Ｅ１００２」を追加する。
【０１３１】
次に、β地域のユーザＣのクライアント１０１が、特徴ベクトル「Ｂ１００２」と属性情報「Ｅ１００２」を検索条件として含むメタデータの検索要求をサーバ１００へ送信した場合、サーバ１００の検索部５では、前述同様、属性情報「Ｅ１００２」を用いてメタデータ記憶部１１を検索する。この場合、データＩＤ「１」のレコードデータには、属性情報「Ｅ１００１」と「Ｅ１００２」が含まれているから、データＩＤ「１」のレコードデータがステップＳ１０５で検索される。
【０１３２】
この場合、ユーザＣのクライアント１０１が特徴ベクトル計算部３を持たないとき（すなわち、検索条件に特徴ベクトルが含まれていないとき）でも、属性情報を用いて、所望のコンテンツのレコードデータ、すなわち、メタデータを検索することができる。
【０１３３】
以上説明したように、上記第５の実施形態によれば、特徴ベクトルを補助的に用いることにより、放送時間や放送局などが地域によって異なるために、あるいは、再放送されて放送日時が異なるために、異なる属性情報を有する同一のコンテンツに対するメタデータが、容易に検索できるようになる。
【０１３４】
上記第５の実施形態では、属性情報がＥＰＧ情報であり、そのような属性情報を有する、放送コンテンツに対するメタデータを検索する場合を説明したが、第５の実施形態にかかる検索システムはこの場合に限らない。ＥＰＧ情報のような属性情報を持たないコンテンツ、例えば、市販のＤＶＤに記録されているコンテンツの場合には、同一コンテンツでも様々なバージョンで販売されている。従って、このバージョンによって異なるＤＶＤに固有のＩＤを属性情報として用いれば、前述同様に、メタデータの検索が容易に行える。このＤＶＤに固有のＩＤは、例えば以下のようにして生成することが出来る。ＤＶＤのデータの先頭から一定量、例えば２００キロバイトのデータを読み出し、これを基にハッシュ値を計算し、ハッシュテーブルを参照することでＩＤとして利用することが可能である。
【０１３５】
上記第１〜第５の実施形態によれば、放送局や放送日時などの各コンテンツに付属する情報に依存しない、各コンテンツの内容そのものの特徴から、各コンテンツを同定するためのＩＤデータを生成することにより、当該ＩＤデータを用いて、コンテンツやコンテンツのメタデータを容易に検索することができる。
【０１３６】
放送局や放送日時に無関係にコンテンツを同定できることで、再放送のコンテンツや、地域差によって放送局や放送日時が異なる場合でも、コンテンツを同定することができる。またＣＭを検出してＣＭ区間を別に扱うことにより、再放送などで途中のＣＭが違う場合でもコンテンツを同定することができる。
【０１３７】
なお、コンテンツ入力部１、可変部分検出部２、特徴ベクトル計算部３、検索部５、１２，通信部７，８，メタデータ出力部９，コンテンツ編集部１０，属性情報取得部１３などの各構成部の機能は、コンピュータに、上記各実施形態で説明したような各構成部の処理手順を記述したプログラムを実行させることにより実現することができる。
【０１３８】
また、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
【図面の簡単な説明】
【０１３９】
【図１】本発明の第１の実施形態にかかる特徴ベクトル生成装置の構成例を示した図。
【図２】図１の特徴ベクトル生成装置の処理動作を説明するためのフローチャート。
【図３】第２の実施形態にかかる検索システムの構成例を示した図。
【図４】特徴ベクトル記憶部の記憶例を示した図。
【図５】第３の実施形態にかかる検索システムの構成例を示した図。
【図６】メタデータの表示例を示した図。
【図７】特徴ベクトル記憶部のレコードデータの記憶例を示した図。
【図８】ＢＢＳテーブルの一例を示した図。
【図９】第４の実施形態にかかる検索システムの構成例を示した図。
【図１０】コンテンツの編集を行うためのメタデータの一例を示した図。
【図１１】第５の実施形態にかかる検索システムの構成例を示した図。
【図１２】特徴ベクトル記憶部のレコードデータの他の記憶例を示した図。
【図１３】図１１の検索システムにおけるメタデータの検索処理動作について説明するためのフローチャート。
【図１４】検索されたメタデータの表示例を示した図。
【符号の説明】
【０１４０】
１…コンテンツ入力部、２…可変部分検出部、３…特徴ベクトル計算部、４…特徴ベクトル記憶部、５、１２…検索部、６…コンテンツ記憶部、７、８…通信部、９…メタデータ出力部、１０…コンテンツ編集部、１１…メタデータ記憶部、１３…属性情報取得部、１００…サーバ装置、１０１…クライアント装置。

【特許請求の範囲】
【請求項１】
時系列なコンテンツデータを入力する入力手段と、
前記コンテンツデータの特徴的な状態が出現する各時点を示す情報を基に、当該コンテンツデータの特徴を示す特徴ベクトルを生成する生成手段と、
前記コンテンツデータと前記特徴ベクトルとを記憶する記憶手段と、
を具備したことを特徴とする特徴ベクトル生成装置。
【請求項２】
前記コンテンツデータは映像データ及び音声データを含み、
前記コンテンツデータの特徴的な状態は、シーンチェンジ、無音区間、及び音量が予め定められたレベル以上の状態のうちの少なくとも１つであることを特徴とする請求項１記載の特徴ベクトル生成装置。
【請求項３】
当該コンテンツデータの特徴的な状態が出現する各時点を示す情報は、前記コンテンツデータの開始から前記各時点までの時間であることを特徴とする請求項１記載の特徴ベクトル生成装置。
【請求項４】
前記コンテンツデータから可変部分を検出する可変部分検出手段をさらに具備し、
前記生成手段は、
前記可変部分の削除された前記コンテンツデータから前記特徴ベクトルを生成することを特徴とする請求項１記載の特徴ベクトル生成装置。
【請求項５】
前記コンテンツデータのメタデータを検索するための、前記生成手段で生成された特徴ベクトルを含む検索要求を送信する手段をさらに具備したことを特徴とする請求項１記載の特徴ベクトル生成装置。
【請求項６】
時系列なコンテンツデータの特徴的な状態が出現する各時点を示す情報を基に生成された、当該コンテンツデータの特徴を示す特徴ベクトルを、前記コンテンツデータ及び当該コンテンツデータのメタデータのうちの少なくとも一方に対応付けて記憶する記憶手段と、
時系列な第１のコンテンツデータから可変部分を検出する可変部分検出手段と、
前記可変部分の削除された前記第１のコンテンツデータの特徴的な状態が出現する各時点を示す情報を基に、当該第１のコンテンツデータの特徴を示す第１の特徴ベクトルを生成する生成手段と、
前記記憶手段に記憶された複数の特徴ベクトルのなかから、前記第１の特徴ベクトルと類似する特徴ベクトルを検索する検索手段と、
を具備したことを特徴とする検索装置。
【請求項７】
時系列なコンテンツデータの特徴的な状態が出現する各時点を示す情報を基に生成された、当該コンテンツデータの特徴を示す特徴ベクトルを、前記コンテンツデータに対するメタデータに対応付けて記憶する記憶手段と、
時系列な第１のコンテンツデータの特徴的な状態が出現する各時点を示す情報を基に生成された、当該第１のコンテンツデータの特徴を示す第１の特徴ベクトルを検索条件として含む検索要求を受信する手段と、
前記記憶手段に記憶された特徴ベクトルのなかから、前記第１の特徴ベクトルと類似する特徴ベクトルを検索する検索手段と、
前記検索手段で検索された特徴ベクトルに対応つけられたメタデータを含む検索結果を前記検索要求の要求元へ送信する送信手段と、
を具備したことを特徴とする検索装置。
【請求項８】
前記特徴ベクトルは、前記コンテンツデータ中の前記各時点の出現回数と、当該コンテンツデータを前記各時点で区切った各区間の時間長を示すことを特徴とする請求項１記載の特徴ベクトル生成装置。
【請求項９】
前記可変部分検出手段は、前記コンテンツデータ中のＣＭ（コマーシャル・メッセージ）部分を可変部分として検出することを特徴とする請求項４記載の特徴ベクトル生成装置。
【請求項１０】
前記検索要求は、前記第１のコンテンツデータの属性情報をさらに含み、
前記記憶手段は、前記属性情報を、前記送信手段で送信したメタデータのうち前記要求元のユーザにより選択されたメタデータに対応付けて記憶することを特徴とする請求項７記載の検索装置。
【請求項１１】
時系列なコンテンツデータの特徴的な状態が出現する各時点を示す情報を基に生成された、当該コンテンツデータの特徴を示す特徴ベクトルを、前記コンテンツデータに対するメタデータ及びＥＰＧ（electronic program guide）情報に対応付けて記憶する記憶手段と、
時系列な第１のコンテンツデータの特徴的な状態が出現する各時点を示す情報を基に生成された、当該第１のコンテンツデータの特徴を示す第１の特徴ベクトル、あるいは当該第１の特徴ベクトル及び前記第１のコンテンツデータの第１のＥＰＧ情報を検索条件として含む検索要求を受信する手段と、
前記検索要求に前記第１のＥＰＧ情報を含む場合には、前記記憶手段に記憶されたＥＰＧ情報のなかから前記第１のＥＰＧ情報に一致するＥＰＧ情報を検索し、当該第１のＥＰＧ情報に一致するＥＰＧ情報が検索されなかった場合と前記検索要求に前記第１のＥＰＧ情報が含まれない場合には、前記記憶手段に記憶された特徴ベクトルのなかから、前記第１の特徴ベクトルと類似する特徴ベクトルを検索する検索手段と、
前記検索手段で検索された前記第１のＥＰＧ情報に一致するＥＰＧ情報に対応付けられたメタデータ、あるいは前記検索手段で検索された前記第１の特徴ベクトルに類似する特徴ベクトルに対応付けられたメタデータを含む検索結果を前記検索要求の要求元へ送信する送信手段と、
を具備したことを特徴とする検索装置。
【請求項１２】
前記検索要求に前記第１のＥＰＧ情報を含む場合に、前記送信手段で、前記第１の特徴ベクトルに類似する特徴ベクトルに対応付けられたメタデータを含む検索結果を前記検索要求の要求元へ送信したとき、
前記記憶手段は、前記第１のＥＰＧ情報を、前記送信手段で送信したメタデータのうち前記要求元のユーザにより選択されたメタデータに対応付けて記憶することを特徴とする請求項１１記載の検索装置。
【請求項１３】
時系列なコンテンツデータの特徴的な状態が出現する各時点を示す情報を基に、当該コンテンツデータの特徴を示す特徴ベクトルを生成する特徴ベクトル生成方法。
【請求項１４】
前記状態は、シーンチェンジ、無音区間、及び音量が予め定められたレベル以上の状態のうちの少なくとも１つであることを特徴とする請求項１３記載の特徴ベクトル生成方法。
【請求項１５】
当該コンテンツデータの特徴的な状態が出現する各時点を示す情報は、前記コンテンツデータの開始から前記各時点までの時間であることを特徴とする請求項１３記載の特徴ベクトル生成方法。
【請求項１６】
前記特徴ベクトルは、前記コンテンツデータ中の前記各時点の出現回数と、当該コンテンツデータを前記各時点で区切った各区間の時間長を示すことを特徴とする請求項１３記載の特徴ベクトル生成方法。
【請求項１７】
時系列な第１のコンテンツデータから可変部分を検出するステップと、
前記可変部分の削除された前記第１のコンテンツデータの特徴的な状態が出現する各時点を示す情報を基に、当該第１のコンテンツデータの特徴を示す第１の特徴ベクトルを生成する生成ステップと、
時系列なコンテンツデータの特徴的な状態が出現する各時点を示す情報を基に生成された、当該コンテンツデータの特徴を示す特徴ベクトルを、前記コンテンツデータ及び当該コンテンツデータのメタデータのうちの少なくとも一方に対応付けて記憶する記憶手段に記憶された複数の特徴ベクトルのなかから、前記第１の特徴ベクトルと類似する特徴ベクトルを検索するステップと、
を有する検索方法。
【請求項１８】
時系列な第１のコンテンツデータから可変部分を検出するステップと、
前記可変部分の削除された前記第１のコンテンツデータの特徴的な状態が出現する各時点を示す情報を基に、当該第１のコンテンツデータの特徴を示す第１の特徴ベクトルを生成する生成ステップと、
時系列なコンテンツデータの特徴的な状態が出現する各時点を示す情報を基に生成された、当該コンテンツデータの特徴を示す特徴ベクトルを、前記コンテンツデータ及び当該コンテンツデータのメタデータのうちの少なくとも一方に対応付けて記憶する記憶手段に記憶された複数の特徴ベクトルのなかから、前記第１の特徴ベクトルと類似する特徴ベクトルを検索するステップと、
をコンピュータに実行させるためのプログラム。

【図１】