説明

マルチメディア検索システム

【課題】良く似ているデータ同士であっても、カテゴリが異なる場合には、区別して検索できる精度を向上したマルチメディア検索システムを提供する。
【解決手段】画像の局所領域の画像特徴量から画像特徴量ベクトルを生成することに加え、画像以外のメディアデータからもメディア特徴量ベクトルを生成する。そして、これらの画像特徴量ベクトル及びメディア特徴量ベクトルを結合した結合特徴量ベクトルを、部分空間に写像することで、標本データセットを複数のクラスタに分類する。これにより、例えば、画像が良く似ていても、分類されるクラスタが差別化されやすくなるので、画像特徴量ベクトルのみでは区別することが難しい検索対象であっても、区別して検索できる精度を向上することができる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像と画像以外のメディアデータからなる標本データを複数まとめた標本データセットに基づき、未知の画像あるいは画像以外のメディアデータが入力された場合に、標本データのいずれに類似するかを検索するマルチメディア検索システムに関する。
【背景技術】
【0002】
例えば、画像を対象とした一般物体認識は、認識対象のカテゴリが多く、また同一カテゴリの物体であっても、形態が様々であるため、困難性が高い技術であることが知られている。
【0003】
近年では、このような一般物体認識に、例えば非特許文献1に記載されているように、画像の局所特徴量(局所パターン)の分布に基づいて認識対象の認識を行なう手法を適用することで、認識精度の向上が図られている。
【0004】
この非特許文献1では、複数のカテゴリの標本画像の各々について、エッジ等の特徴点を多数抽出し、それらの特徴点周辺パターンをSIFT(Scale-Invariant Feature Transform)特徴ベクトルにより表現する。そして、予め求めておいた代表的な局所パターンであるvisual wordsに基づいて、各画像の特徴点周辺パターンをヒストグラム化する。これにより、各画像は、visual wordsの集合として表現され、そのヒストグラムから、画像の特徴ベクトルが定められる。このように定められた画像特徴ベクトルは、SVM(サポートベクターマシン)などにより各カテゴリに分類される。
【先行技術文献】
【非特許文献】
【0005】
【非特許文献1】”Visual Categorization with Bags of Keypoints” Gabriella Csurka, Christopher R. Dance, Lixin Fan, Jutta Willamowski, Cedric Bray, In ECCV International Workshop on Statistical Learning in Computer Vision (2004)
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、画像の局所パターンのみに基づいて認識を行なう場合、カテゴリが異なるにも係らず、良く似ている画像に関しては、必ずしも高い認識精度を期待することはできないという問題がある。
【0007】
本願発明は、上述した点に鑑みてなされたもので、良く似ているデータ同士であっても、カテゴリが異なる場合には、区別して検索できる精度を向上したマルチメディア検索システムを提供することを目的とする。
【課題を解決するための手段】
【0008】
上記目的を達成するために、請求項1に記載のマルチメディア検索システムは、
画像と、その画像に関連する情報を示す画像以外のメディアデータからなる標本データを複数まとめた標本データセットに基づき、未知の画像あるいは画像以外のメディアデータが入力された場合に、標本データのいずれに該当するかを検索するものであって、
標本データの画像の局所領域の画像特徴量から、当該画像の画像特徴量ベクトルを生成する画像特徴量ベクトル生成手段と、
標本データのメディアデータから特徴量を抽出し、メディア特徴量ベクトルを生成するメディア特徴量ベクトル生成手段と、
複数の標本データに関して、画像特徴量ベクトルとメディア特徴量ベクトルとを結合した結合特徴量ベクトルを生成するとともに、これらの結合特徴量ベクトルを、結合特徴量ベクトルの次元数よりも少ない次元数の部分空間に写像することにより、標本データセットを複数のクラスタに分類するクラスタリング手段と、を備えたことを特徴とする。
【0009】
上述したように、請求項1に記載の発明では、画像の局所領域の画像特徴量から画像特徴量ベクトルを生成するのみでなく、画像以外のメディアデータからもメディア特徴量ベクトルを生成する。そして、これらの画像特徴量ベクトル及びメディア特徴量ベクトルを結合した結合特徴量ベクトルを、部分空間に写像することで、標本データセットを複数のクラスタに分類している。このように、画像特徴量ベクトルとメディア特徴量ベクトルとを結合することで、画像が良く似ていても、分類されるクラスタが差別化されやすくなるので、画像特徴量ベクトルのみでは区別することが難しい検索対象であっても、区別して検索できる精度を向上することができる。
【0010】
請求項2に記載したように、未知の画像が入力された場合に、この画像の画像特徴量ベクトルを生成し、当該画像特徴量ベクトルを部分空間に写像することにより、画像特徴量ベクトルが分類されるべきクラスタを算出するクラスタ算出手段と、クラスタ算出手段により算出されたクラスタに分類されるメディアデータの中で、そのクラスタを代表するメディアデータを抽出して、検索結果として出力する検索結果出力手段と、を備えることが好ましい。これにより、画像に付随するメディアデータを利用して、その画像の内容に最も相応しいと考えられるメディアデータを検索結果として出力することが可能になる。
【0011】
より具体的には、請求項3に記載したように、クラスタリング手段は、複数の標本データに関する結合特徴量ベクトルをデータ行列として、このデータ行列を、部分空間を定める基底ベクトルからなる基底行列と、基底ベクトルにより定められる部分空間に写像するための各基底ベクトルと結合される重みデータをまとめた重み行列とに分解するものであり、クラスタ算出手段は、未知の画像の画像特徴量ベクトルを、クラスタリング手段によって分解された基底行列における画像特徴量ベクトルの基底ベクトルのみからなる部分基底行列を用いて、当該部分基底行列による部分空間に写像するための重み行列を算出し、当該重み行列に最も近い行列要素を、クラスタリング手段により分解された重み行列の中から抽出するものであり、検索結果出力手段は、クラスタ算出手段により抽出された重み行列の行列要素に対応する、メディア特徴量ベクトルの基底ベクトルの値が最大のメディアデータを、そのクラスタを代表するメディアデータとして抽出することが好ましい。これにより、未知の画像の画像特徴量ベクトルが分類されるべきクラスタを算出し、そのクラスタに分類されるメディアデータの中で、クラスタを代表するメディアデータを抽出することができる。
【0012】
請求項4に記載したように、未知のメディアデータが入力された場合に、このメディアデータのメディア特徴量ベクトルを生成し、当該メディア特徴量ベクトルを部分空間に写像することにより、メディア特徴量ベクトルが分類されるべきクラスタを算出するクラスタ算出手段と、クラスタ算出手段により算出されたクラスタに分類される画像の中で、そのクラスタを代表する画像を抽出して、検索結果として出力する検索結果出力手段と、を備えることが好ましい。これにより、メディアデータを検索キーとして、そのメディアデータに相応しいと考えられる画像を検索結果として出力することが可能になる。
【0013】
より具体的には、請求項5に記載したように、クラスタリング手段は、複数の標本データに関する結合特徴量ベクトルをデータ行列として、このデータ行列を、部分空間を定める基底ベクトルからなる基底行列と、基底ベクトルにより定められる部分空間に写像するための各基底ベクトルと結合される重みデータをまとめた重み行列とに分解するものであり、クラスタ算出手段は、未知のメディアデータのメディア特徴量ベクトルを、クラスタリング手段によって分解された基底行列におけるメディア特徴量ベクトルの基底ベクトルのみからなる部分基底行列を用いて、当該部分基底行列による部分空間に写像するための重み行列を算出し、当該重み行列に最も近い行列要素を、クラスタリング手段により分解された重み行列の中から抽出するものであり、検索結果出力手段は、クラスタ算出手段により抽出された重み行列の行列要素に対応する画像特徴量ベクトルの基底ベクトルに対して、最も類似した画像特徴量ベクトルを有する画像を、そのクラスタを代表する画像として抽出することが好ましい。これにより、未知のメディアデータのメディア特徴量ベクトルが分類されるべきクラスタを算出し、そのクラスタに分類される画像データの中で、クラスタを代表する画像データを抽出することができる。
【0014】
請求項6に記載したように、メディアデータは、1つ以上の単語から構成される文章、位置情報、時刻情報の中から一つ以上を用いて構成されたデータであることが好ましい。画像の解説を行なった文章や、画像を取得した位置や時刻などを示す位置情報、時刻情報は、画像の特徴を表現するメディアデータとして好適であるためである。
【0015】
請求項7に記載したように、標本データは、インターネットを介して収集することが好ましい。多くの物体を認識するには、多種の物体を含んだ標本データを用意する必要がある。このため、多数の画像に対して、名称などのメディアデータを人手をかけて付与していくには、非常に時間と手間がかかる作業となる。それに対して、近年では、多くのホームページがインターネット上に公開され、その中には、画像と、その画像を解説した文章などがセットとなっていることも多い。従って、インターネットを介して標本データを収集することにより、人手をかけずに標本データを用意することが可能である。
【図面の簡単な説明】
【0016】
【図1】標本データに基づいて学習を行なう学習部の構成を示す構成図である。
【図2】未知の画像又は文章が入力された場合に、標本データのいずれに類似するかを検索する検索部の構成を示す構成図である。
【発明を実施するための形態】
【0017】
以下、本発明の実施形態によるマルチメディア検索システムについて、図面に基づいて説明する。図1は、マルチメディア検索システムにおける学習部1の構成を示す構成図である。なお、本実施形態においては、画像に関連する情報を示すメディアデータとして、文章を適用した例について説明する。
【0018】
図1において、標本データ10は、画像と、その画像に関連する情報を示す文章からなる。この標本データ10として、多種の物体に関する多数の画像と、それらの画像に付随する文章が用意される。本実施形態では、未知の画像や文章が入力されたときに、標本データの中から類似性の高い画像や単語などを検索するので、認識可能な物体のカテゴリは、標本データにおける物体のカテゴリの種類に依存する。そのため、認識物体のカテゴリを拡大しようとした場合、多くの標本データを用意する必要がある。
【0019】
ただし、多数の画像に対して、物体名称などのデータを人手をかけて付与した場合、非常に時間と手間がかかることになる。そのため、本実施形態では、多種の物体に関する標本データを効率的に収集するために、インターネットを利用する。近年では、多くのホームページがインターネット上に公開され、その中には、画像と、その画像を解説した文章などがセットとなっているものも多い。従って、インターネットを介して標本データを収集することにより、人手をかけず効率的に標本データを用意することができる。
【0020】
標本データ10における画像は、画像用特徴変換部20に与えられ、標本データ10における文章は、メディア用特徴変換部30に与えられる。
【0021】
画像用特徴変換部20は、入力された画像をN1次元(例えば1000次元)の画像特徴量ベクトルに変換するものである。画像をN1次元の画像特徴量ベクトルに変換する手法として種々の方法が知られているが、本実施形態において採用した方法について、以下に簡単に説明する。
【0022】
まず、画像から沢山の小領域を切り出して、各小領域の特徴量である輝度分布の勾配方向のパターンを、SIFT(Scale-Invariant Feature Transform)特徴ベクトル(128次元のベクトル)により表す。このSIFT特徴ベクトルは、小領域を4×4=16グリッドに分割し、各グリッドの勾配方向を8方向のベクトルにて表現したものである。
【0023】
なお、小領域の切り出し方法としては、例えば、画像においてエッジなどの特徴点を求め、その特徴点の周りの一定の領域を小領域とすれば良い。あるいは、ある大きさの窓を用意し、画像上で少しずつずらしながら、窓内の領域を小領域として切り出しても良い。さらに、1枚の画像に対して、窓の大きさを変えつつ複数回小領域を切り出すようにしても良い。
【0024】
また、画像の局所領域の特徴量は、SIFT特徴ベクトルに限らず、例えばSURF特徴ベクトルによって表しても良い。SURFによる特徴量算出方法は、”SURF:Speed Up Robust Features” Herbert Bay, Tinne Tuytelaars, Luc Van Gool, Proceedings of the ninth European Conference on Computer Vision, Vol. 1, pp.404-417, May 2006に詳しく説明されている。
【0025】
全ての標本データの画像に関して、全局所特徴量に対応するSIFT特徴ベクトルが算出されると、SIFT特徴ベクトルの128次元空間において、K−平均法(K‐means)を用いて、算出したSIFT特徴ベクトルをN1個にクラスタリングする。そして、各クラスタの中心に当たるSIFT特徴ベクトルを、画像の特徴を表すための代表的なパターンであるvisual wordsとして定める。
【0026】
上述したようにして定められたN1個のvisual wordsと、各画像ごとに算出されたSIFT特徴ベクトルとを用いて、各画像にそれぞれのvisual wordsがいくつ含まれているかを算出する。これにより、各画像がN1個のvisual wordsの集合として表現され、各画像はN1次元の画像特徴量ベクトルに変換される。
【0027】
一方、メディア用特徴変換部30は、入力された文章をN2次元のメディア特徴量ベクトルに変換するものである。このため、メディア用特徴変換部30は、入力された文章を形態素解析して、名詞、形容詞等の単語に分割する。全ての標本データの文章が単語に分割された後、分割されたすべての単語をベースとして、それぞれの文章に、分割された単語が何回現れたかを計算する。これにより、それぞれの文章が、分割されたすべての単語数を次元数(N2次元)とするメディア特徴量ベクトルに変換される。
【0028】
なお、文章をN2次元のメディア特徴量ベクトルに変換する際、公知のTF−IDFを用いても良い。TF−IDFは、単語の出現頻度(TF)のみでなく、その単語が多くの文章に現れる度合を示す逆文章頻度(IDF)の二つの指標で計算される。そのため、多くの文章に現れる単語の重要度を下げ、特定の文章にしか現れない単語の重要度を上げることができる。
【0029】
結合部40は、画像用特徴変換部20によって算出されたN1次元の画像特徴量ベクトルと、メディア用特徴変換部30によって算出されたN2次元のメディア特徴量ベクトルとを統合して、標本データに対応する結合特徴量ベクトルを生成するものである。なお、結合部40によりN1次元の画像特徴量ベクトルとN2次元のメディア特徴量ベクトルが統合された結果、結合特徴量ベクトルの次元数は、N1+N2=N(次元)となる。
【0030】
結合部40は、標本データセットに含まれる全ての標本データに関して、上述した手法により結合特徴量ベクトルを作成し、さらに、それらをまとめてデータ行列Mを作成する。すなわち、データ行列Mは、N次元の結合特徴ベクトルにて表されたD個の標本データをまとめることにより、N行D列の行列となる。このデータ行列Mは、基底分解部50に与えられる。
【0031】
基底分解部50は、データ行列Mを、結合特徴量ベクトルの次元数Nよりも少ない次元数Rの部分空間に写像することにより、標本データを複数のクラスタに分類する。この複数のクラスタへの分類には、特異値分解、主成分分析、非負行列因子分解などの手法を適用できるが、以下は、非負行列因子分解を用いて複数のクラスタに分類する例について説明する。
【0032】
基底分解部50は、以下の数式1に示すように、N行D列のデータ行列Mを、基底ベクトルをまとめたN行R列の基底行列Wと、標本データのN次元特徴量ベクトルを基底ベクトルによるR次元の部分空間に写像するための重みデータをまとめたR行D列の重み行列Hとに近似により分解する。
【0033】
【数1】

【0034】
具体的には、基底分解部50は、以下の数式2に示す演算式に従って、基底行列Wと重み行列Hの更新を繰り返して、基底行列Wと重み行列Hを算出する。更新を繰り返すことにより、基底行列Wと重み行列Hとによる近似の精度を向上することができる。
【0035】
【数2】

【0036】
なお、数式2の第2式は、更新した基底行列Wを正規化するためのものである。そして、上述した数式2による、基底行列Wと重み行列Hの更新は、例えば予め定めた回数(例えば千回)、あるいは更新前後の変化量(差や比率)が所定値以下となるまで繰り返される。
【0037】
非負行列因子分解は、大規模な標本データから、少数の本質的な成分である基底ベクトルを基底行列Wとして抽出するものである。この基底行列W及び重み行列Hを算出することにより、N次元の特徴量ベクトルにて表わされた標本データを、N次元よりも少ない、基底ベクトルによるR次元の部分空間に写像することができる。このような写像による変換を行なうことで、部分空間において標本データを複数のクラスタに適切に分類することができる。
【0038】
ここで、重み行列Hにおける重みベクトルは、標本データを基底ベクトルによる部分空間に写像する際の座標位置を示すものとなる。従って、重み行列Hにおける各重みベクトルが、分類された複数のクラスタを示すものとなる。
【0039】
上述したように、本実施形態では、画像の局所特徴量から画像特徴量ベクトルを生成するのみでなく、画像に関連する情報を示す文章に基づいてメディア特徴量ベクトルを生成する。そして、これらの画像特徴量ベクトル及びメディア特徴量ベクトルを結合した結合特徴量ベクトルを、基底ベクトルによる部分空間に写像することで、標本データを複数のクラスタに分類する。このように、画像特徴量ベクトルとメディア特徴量ベクトルとを結合することで、画像が良く似ていても、分類されるクラスタが差別化されやすくなるので、画像特徴量ベクトルのみでは区別することが難しい検索対象であっても、区別して検索できる精度を向上することができる。
【0040】
次に、図2に基づいて、未知の画像又は文章が入力された場合に、標本データのいずれに該当するかを検索する検索部2について説明する。
【0041】
検索部2は、未知の画像又は文章からなる入力データ60が入力されたときに、学習部1における学習結果である基底行列W及び重み行列Hを利用して、入力された画像又は文章に相応しい標本データの検索を行なう。
【0042】
入力されたデータが画像である場合、その画像は、画像用特徴変換部70において、標本データの画像に対するのと同様の手法により、N1次元の画像特徴量ベクトルに変換される。画像用特徴変換部70により変換されたN1次元の画像特徴量ベクトルは、基底分解部90に入力される。
【0043】
基底分解部90は、入力された画像のN1次元ベクトルをN1行1列の入力行列m1と置いた場合に、その入力行列m1と、学習部1により算出された基底行列Wとを用いて、重み行列h1を算出する。ただし、このとき、基底行列Wにおける画像特徴量ベクトルに対応する基底ベクトルのみからなる部分基底行列W1を用いて、以下の数式3に示すように、入力行列m1を部分基底行列W1と重み行列h1とに分解する。これにより、入力された画像の画像特徴量ベクトルを、部分基底行列W1による部分空間に写像するための重み行列h1を算出することができる。
【0044】
【数3】

【0045】
なお、入力行列m1を部分基底行列W1と重み行列h1とに分解するための演算手法は、上述した数式2と同様であるが、部分基底行列W1は更新する必要がないので、重み行列h1の更新のみ繰り返し行なうことで、重み行列h1を算出する。
【0046】
重み行列h1が算出されると、その重み行列h1は検出部100に与えられる。検出部100は、学習部1により算出された重み行列Hの中から、重み行列h1の要素である重みベクトルと最も類似する重みベクトルを抽出することにより、入力画像が分類されるべきクラスタを検索する。そして、抽出した重みベクトルに対応する基底ベクトルを、基底行列Wから抜き出す。この抜き出した基底ベクトルにおいて、メディア特徴量ベクトルに対応する基底ベクトルを対象として、最も要素値が大きい要素を選択する。
【0047】
メディア特徴量ベクトルは、上述したように、単語の出現頻度に応じてベクトルの要素値が定められている。従って、メディア特徴量ベクトルに対応する基底ベクトルにおいて最も要素値が大きい要素は、最も出現回数の多い単語を示しており、入力した画像が分類されるべきクラスタの特徴を最も適切に示すものとみなすことができる。そのため、検出部100では、標本データの文章の各単語を保存した辞書から、最大の要素値を持つ要素に対応する単語を読み出し、検索結果として出力する。出力された検索結果は、図示しない情報表示部により、画像又は音声などにより提示される。
【0048】
なお、各クラスタの特徴を示す単語は、学習部1において標本データを複数のクラスタに分類したときに予め定めておいても良い。
【0049】
また、入力されたデータが文章である場合、その文章は、メディア用特徴変換部80において、標本データの文章に対するのと同様の手法により、N2次元の文章特徴量ベクトルに変換される。メディア用特徴変換部80により変換されたN2次元の文章特徴量ベクトルは、基底分解部90に入力される。
【0050】
基底分解部90は、入力された文章のN2次元ベクトルをN2行1列の入力行列m2と置いた場合に、その入力行列m2と、学習部1により算出された基底行列Wとを用いて、重み行列h2を算出する。ただし、このとき、基底行列Wにおけるメディア特徴量ベクトルに対応する基底ベクトルのみからなる部分基底行列W2を用いて、以下の数式4に示すように、入力行列m2を部分基底行列W2と重み行列h2とに分解する。これにより、入力された文章のメディア特徴量ベクトルを、部分基底行列W2による部分空間に写像するための重み行列h2を算出することができる。
【0051】
【数4】

【0052】
なお、この場合も、重み行列h2の更新のみを繰り返し行なうことにより、入力行列m2を部分基底行列W2と重み行列h2とに分解する。
【0053】
重み行列h2が算出されると、その重み行列h2は検出部100に与えられる。検出部100は、学習部1により算出された重み行列Hの中から、重み行列h2の要素である重みベクトルと最も類似する重みベクトルを抽出する。このようにして、入力された文章が分類されるべきクラスタを検索する。そして、抽出した重みベクトルに対応する基底ベクトルを、基底行列Wから抜き出す。
【0054】
さらに、検出部100は、この抜き出した基底ベクトルにおいて、画像特徴量ベクトルに対応する基底ベクトルと、最も類似した画像特徴量ベクトルを有する画像を、標本データの各画像を保存した辞書から、そのクラスタを代表する画像として抽出して、検索結果として出力する。出力された検索結果は、図示しない情報表示部により、画像として表示される。
【0055】
このように、未知の文章が入力された場合には、その文章のメディア特徴量ベクトルが分類されるべきクラスタを算出し、そのクラスタに分類される画像データの中で、クラスタを代表する画像データを抽出して表示することができる。
【0056】
以上、本発明の好ましい実施形態について説明したが、本発明は上述した実施形態になんら制限されることなく、本発明の主旨を逸脱しない範囲において、種々変形して実施することが可能である。
【0057】
例えば、上述した実施形態では、画像に関連する情報を示すメディアデータとして文章を利用する例について説明したが、例えば画像を取得した位置情報や、時刻情報も、画像の特徴を示すデータとなりえるため、位置情報や時刻情報もメディアデータとして用いることができる。
【符号の説明】
【0058】
1…学習部
2…検索部
20,70…画像用特徴変換部
30,80…メディア用特徴変換部
40…結合部
50,90…基底分解部
100…検出部

【特許請求の範囲】
【請求項1】
画像と、その画像に関連する情報を示す画像以外のメディアデータからなる標本データを複数まとめた標本データセットに基づき、未知の画像あるいは画像以外のメディアデータが入力された場合に、前記標本データのいずれに類似するかを検索するマルチメディア検索システムであって、
前記標本データの画像の局所領域の画像特徴量から、当該画像の画像特徴量ベクトルを生成する画像特徴量ベクトル生成手段と、
前記標本データのメディアデータから特徴量を抽出し、メディア特徴量ベクトルを生成するメディア特徴量ベクトル生成手段と、
複数の標本データに関して、画像特徴量ベクトルとメディア特徴量ベクトルとを結合した結合特徴量ベクトルを生成するとともに、これらの結合特徴量ベクトルを、結合特徴量ベクトルの次元数よりも少ない次元数の部分空間に写像することにより、前記標本データセットを複数のクラスタに分類するクラスタリング手段と、を備えたことを特徴とするマルチメディア検索システム。
【請求項2】
未知の画像が入力された場合に、この画像の画像特徴量ベクトルを生成し、当該画像特徴量ベクトルを前記部分空間に写像することにより、前記画像特徴量ベクトルが分類されるべきクラスタを算出するクラスタ算出手段と、
前記クラスタに分類されるメディアデータの中で、そのクラスタを代表するメディアデータを抽出して、検索結果として出力する検索結果出力手段と、を備えることを特徴とする請求項1に記載のマルチメディア検索システム。
【請求項3】
前記クラスタリング手段は、複数の標本データに関する結合特徴量ベクトルをデータ行列として、このデータ行列を、部分空間を定める基底ベクトルからなる基底行列と、前記基底ベクトルにより定められる部分空間に写像するための各基底ベクトルと結合される重みデータをまとめた重み行列とに分解するものであり、
前記クラスタ算出手段は、前記未知の画像の画像特徴量ベクトルを、前記クラスタリング手段によって分解された基底行列における画像特徴量ベクトルの基底ベクトルのみからなる部分基底行列を用いて、当該部分基底行列による部分空間に写像するための重み行列を算出し、当該重み行列に最も近い行列要素を、前記クラスタリング手段により分解された重み行列の中から抽出するものであり、
前記検索結果出力手段は、前記クラスタ算出手段により抽出された重み行列の行列要素に対応する、メディア特徴量ベクトルの基底ベクトルの値が最大のメディアデータを、そのクラスタを代表するメディアデータとして抽出することを特徴とする請求項2に記載のマルチメディア検索システム。
【請求項4】
未知のメディアデータが入力された場合に、このメディアデータのメディア特徴量ベクトルを生成し、当該メディア特徴量ベクトルを前記部分空間に写像することにより、前記メディア特徴量ベクトルが分類されるべきクラスタを算出するクラスタ算出手段と、
前記クラスタに分類される画像の中で、そのクラスタを代表する画像を抽出して、検索結果として出力する検索結果出力手段と、を備えることを特徴とする請求項1に記載のマルチメディア検索システム。
【請求項5】
前記クラスタリング手段は、複数の標本データに関する結合特徴量ベクトルをデータ行列として、このデータ行列を、部分空間を定める基底ベクトルからなる基底行列と、前記基底ベクトルにより定められる部分空間に写像するための各基底ベクトルと結合される重みデータをまとめた重み行列とに分解するものであり、
前記クラスタ算出手段は、前記未知のメディアデータのメディア特徴量ベクトルを、前記クラスタリング手段によって分解された基底行列におけるメディア特徴量ベクトルの基底ベクトルのみからなる部分基底行列を用いて、当該部分基底行列による部分空間に写像するための重み行列を算出し、当該重み行列に最も近い行列要素を、前記クラスタリング手段により分解された重み行列の中から抽出するものであり、
前記検索結果出力手段は、前記クラスタ算出手段により抽出された重み行列の行列要素に対応する画像特徴量ベクトルの基底ベクトルに対して、最も類似した画像特徴量ベクトルを有する画像を、そのクラスタを代表する画像として抽出することを特徴とする請求項4に記載のマルチメディア検索システム。
【請求項6】
前記メディアデータは、1つ以上の単語から構成される文章、位置情報、時刻情報の中から一つ以上を用いて構成されたデータであることを特徴とする請求項1乃至6のいずれかに記載のマルチメディア検索システム。
【請求項7】
前記標本データは、インターネットを介して収集することを特徴とする請求項1乃至7のいずれかに記載のマルチメディア検索システム。

【図1】
image rotate

【図2】
image rotate


【公開番号】特開2011−103082(P2011−103082A)
【公開日】平成23年5月26日(2011.5.26)
【国際特許分類】
【出願番号】特願2009−258166(P2009−258166)
【出願日】平成21年11月11日(2009.11.11)
【出願人】(502324066)株式会社デンソーアイティーラボラトリ (332)
【Fターム(参考)】