説明

特徴ベクトル生成装置、特徴ベクトル生成方法及びプログラム

【課題】ビジュアルキーワードを用いた特徴ベクトル生成のための計算コストを低減すること。
【解決手段】特徴ベクトル生成部20は、部分画像抽出部22により、クエリ画像から複数の部分画像を抽出する。クラスタリング部24は、抽出された複数の部分画像を、該部分画像の特徴量に基づいてクラスタリングする。マッピング部26は、クラスタリングによって形成されたクラスタ(基準クラスタ)と、ビジュアルキーワード(基準クラスタ)との間の距離を算出し、クラスタにクラスタリングされた部分画像を、該クラスタとの距離が最も近いビジュアルキーワードに分類する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、特徴ベクトル生成装置、特徴ベクトル生成方法及びプログラムに関する。
【背景技術】
【0002】
画像を検索キーとして入力し、画像の特徴量(配色、テクスチャ、形状等の画像の特徴を数値化して表現したもの)を比較することにより、検索キーである画像(以下「クエリ画像」という)に類似する画像を検索する技術が知られている。ユーザがクエリ画像を入力すると、クエリ画像から特徴量を抽出して、検索対象の画像の特徴量との類似度を算出することで、類似画像を検索する(例えば、特許文献1)。
【0003】
また、画像内の部分的な領域に注目した類似画像の検索技術として、ビジュアルキーワードという手法が知られている。これは、1枚の画像が複数の部分画像により構成されていると捉えることにより考案された手法であり、次のような処理により特徴ベクトルが生成される。
【0004】
即ち、画像から複数の部分画像を抽出して、予め画像がクラスタリングされて形成された基準となるクラスタ(以下適宜「基準クラスタ」という)に対して、その部分画像を特徴量に基づいて分類し、各部分画像が属する基準クラスタの数に基づいて特徴ベクトルが生成される。このように、ビジュアルキーワードを用いることで、画像全体から抽出される特徴量ではなく、画像を細かな領域として捉えた特徴量により、精度のよい画像検索が可能になる。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2001−52175号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかし、上述の従来技術には、次ぎのような課題があった。
先ず、特許文献1の技術により1枚の画像から抽出される特徴量は、その画像全体の特徴を示すものであるため、全体的な構成が類似している画像を検索する際に有効である。しかし、一般に1枚の画像の中に含まれるオブジェクトは多種多様であり、それらを特許文献1の特徴量で表現するのは困難である。
【0007】
一枚の画像が複数の領域に分割し、その分割した部分画像毎の特徴量によって画像の特徴を表すこともできるが、比較対象の画像間で部分画像毎の特徴量を比較するには、例えば、100分割した2枚の画像の比較であれば、100×100通りのパターンで特徴量を比較し類似度を算出するように、計算量が膨大となる。
【0008】
これに対し、ビジュアルキーワードあれば、各基準クラスタに分類された部分画像の数によって表現された特徴ベクトルにより類似度の算出が可能になる。しかし、各部分画像と、各基準クラスタとの間の距離を全て算出する必要があり、1枚の画像から抽出される部分画像は数百〜数千、分類対象であるクラスタの数は数万〜数十万となると、これらの全ての組み合わせでの距離算出の計算コストは膨大となってしまった。
【0009】
本発明は、上述の課題に鑑みて為されたものであり、その目的とするところは、ビジュアルキーワードを用いた特徴ベクトル生成のための計算コストを低減することである。
【課題を解決するための手段】
【0010】
上記目的を達成するため、第1の発明は、画像内から抽出した複数の部分画像を複数の基準クラスタの何れかに分類して、各基準クラスタへの分類数に基づく特徴ベクトルを生成する特徴ベクトル生成装置において、前記抽出された複数の部分画像を、該部分画像の特徴量に基づいてクラスタリングするクラスタリング手段と、前記クラスタリングによって形成されたクラスタを対象クラスタとして、該対象クラスタと前記各基準クラスタとの間の距離を算出する距離算出手段と、前記対象クラスタに属する部分画像を、該対象クラスタとの前記距離が最も近い基準クラスタに分類する分類手段と、を備えることを特徴としている。
【0011】
第1の発明によれば、画像から抽出した部分画像を一旦クラスタリングして纏め上げ、このクラスタリングに形成される対象クラスタと、基準クラスタとの間の距離に基づいて、対象クラスタに属する部分画像をまとめて基準クラスタに分類する。このため、部分画像と、基準クラスタとの間の距離を全て算出する計算コストが削減される。従って、ビジュアルキーワードを用いた特徴ベクトル生成のための計算コストを低減することができる。
【0012】
また、第2の発明における前記分類手段は、前記個々の部分画像と、前記画像内から抽出した部分画像の分類が行われた基準クラスタとの間の距離を算出し、この距離が最も近い基準クラスタに分類先を変更することを特徴としている。
【0013】
第2の発明によれば、個々の部分画像と、分類が行われた基準クラスタとの間の距離が最も近い基準クラスタに分類先を変更するため、クラスタ単位でまとめて分類された部分画像の中でも、基準クラスタとの距離が遠い部分画像については適切な基準クラスタに分類先を変更することができる。従って、上記の効果に加えて、特徴ベクトルの精度を向上させることができる。
【0014】
また、第3の発明において、前記分類が行われた基準クラスタと、該基準クラスタに分類された前記部分画像との間の距離を算出するクラスタ距離算出手段を更に備え、前記分類手段は、前記クラスタ距離算出手段により算出された距離が所定値以上の部分画像を選定し、その選定した部分画像と該部分画像の分類が行われた基準クラスタとの間の距離を算出して、分類先の変更を行うことを特徴としている。
【0015】
第3の発明によれば、分類された部分画像と、分類先の基準クラスタとの間の距離が一定値以上となる部分画像について、該部分画像と基準クラスタとの間の距離に基づいて分類先を変更する。このため、対象クラスタとの距離が遠い部分画像について、分類先の変更を行える。従って、分類先の見直しを行う部分画像を絞り込むことができ、特徴ベクトルの精度向上のための計算コストを抑えることができる。
【発明の効果】
【0016】
本発明によれば、ビジュアルキーワードを用いた特徴ベクトル生成のための計算コストを低減することができる。
【図面の簡単な説明】
【0017】
【図1】画像検索装置の機能構成を示すブロック図。
【図2】特徴ベクトル生成処理のフローチャート。
【図3】特徴ベクトルを生成するまでの処理を説明するための概念図。
【図4】マッピング先のビジュアルキーワードを変更する処理を説明するための概念図。
【発明を実施するための最良の形態】
【0018】
[画像検索装置の構成]
以下、本発明の特徴ベクトル生成装置を、図1に示す画像検索装置1内の特徴ベクトル生成部20及びインデクシング部70に適用した場合の実施の形態を図面に基づいて説明する。
【0019】
図1は、画像検索装置1の機能ブロック図である。画像検索装置1は、通信ネットワークを介して接続されたインターネットに接続され、該インターネットを介してウェブ上から画像データを収集可能となっている。この収集したデータをデータベース(DB)に蓄積して、検索対象の画像を作成する。
【0020】
画像検索装置1は、通信ネットワークを介して接続されたパーソナルコンピュータや携帯端末等のクライアント端末から送信されるクエリ画像を検索要求として受信する。そして、その検索要求に応じた類似画像検索を行って、類似度順にランキングした検索結果をクライアント端末に返送する。
【0021】
本実施形態における画像検索装置1は、ビジュアルキーワードの手法を用いて画像の特徴ベクトルを生成してインデックス化する。ビジュアルキーワードによる画像検索とは、1枚の画像を複数の画像領域の集合として表現し、各画像を構成する画像領域(以下、適宜「部分画像」という)から得られる特徴量に基づいて画像のインデックス(特徴ベクトル)を生成する技術であり、テキスト中のキーワードから文章の特徴量を求めるテキスト検索技術の応用といえる。
【0022】
このため、ビジュアルキーワードによる画像検索では、画像中の画像領域をキーワードとして扱うことでテキスト検索技術(転置インデックスやベクトル空間モデル、単語の出現頻度等)における技術を画像領域検索へ適用して、大規模且つ高速性を実現することができる。
【0023】
ビジュアルキーワードによる画像検索についての参考技術文献としては、
・Sivic and Zisserman:“Efficient visual search for objects in videos”, Proceedings of the IEEE, Vol.96,No.4.,pp.548-566,Apr 2008.
・Yang and Hauptmann:“A text categorization approach to video scene classification using keypoint features”,Carnegie Mellon University Technical Report,pp.25,Oct 2006.
・Jiang and Ngo:“Bag-of-visual-words expansion using visual relatedness for video indexing”,Proc.31st ACM SIGIR Conf.,pp.769-770,Jul 2008.
・Jiang, Ngo, andYang:“Towards optimal bag-of-features for object categorization and semantic video retrieval”,Proc.6th ACM CIVR Conf.,pp.494-501,Jul.2007.
・Yang, Jiang, Hauptmann, and Ngo:“Evaluating bag-of-visual-words representations in scene classification”,Proc.15th ACM MM Conf., Workshop onMMIR,pp.197-206,Sep. 2007.
等が挙げられる。
【0024】
また、ある一つの画像を複数の部分画像の集合として表現することによって、一般的な類似画像検索とは異なり、画像中の一部分を任意の大きさや位置で切り出した画像をクエリ画像とした検索が可能となる。このため、ユーザは、所望の検索結果を得るために、画像の一部分を指定するといった操作により、より直接・正確にクエリを表現することができる。
【0025】
図1に示すように、画像検索装置1は、クエリ画像受付部10、特徴ベクトル生成部20、類似度算出部30、検索結果出力部50、ビジュアルキーワード生成部60、ビジュアルキーワードDB65、インデクシング部70、インデックスDB75、領域管理DB80及び検索対象画像DB90を備えて構成される。
【0026】
これらの機能部は、所謂コンピュータにより構成され、演算/制御装置としてのCPU(Central Processing Unit)、記憶媒体としてのRAM(Random Access Memory)及びROM(Read Only Memory)、通信インターフェイス等が連関することで実現される。
【0027】
クエリ画像受付部10は、クライアント端末から送信される類似画像検索の検索キーとなるクエリ画像を受信して受け付ける。このクエリ画像は、検索対象画像DB90に格納されている画像や、その画像データの一部分の領域を指定する操作により切り出された画像、新たに受信した画像がある。また、クエリ画像としては、1つの画像であってもよいし、複数の画像の組み合わせでもよい。
【0028】
特徴ベクトル生成部20は、クエリ画像から部分画像を抽出し、その部分画像の特徴量に基づいて特徴ベクトルを生成する特徴ベクトル生成処理(図2参照)を行って、クエリ画像から特徴ベクトルを生成する。特徴ベクトル生成部20は、図1に示すように、部分画像抽出部22と、クラスタリング手段としてのクラスタリング部24と、距離算出手段及び分類手段としてのマッピング部26とを備えて構成され、これらが協働することにより、後述する特徴ベクトル生成処理を実現する。
【0029】
類似度算出部30は、インデックスDB75に記憶された検索対象画像毎の特徴ベクトルと、クエリ画像から生成した特徴ベクトルとの間の類似度を算出する。この類似度の算出には、コサイン距離やBhattacharyya距離等の公知技術が用いられる。尚、比較領域の切り出しや、類似度の算出の詳細については後述する。
【0030】
検索結果出力部50は、類似度算出部30により算出された類似度に基づいて、検索対象の画像をランク付けしたデータを生成する。この検索結果出力部50が出力するデータは、例えば、検索対象画像の画像IDを類似度に基づいてソートしたデータである。画像IDには、検索対象画像DB90にアクセスするためのアドレス(URL)を付加してもよい。
【0031】
ビジュアルキーワード生成部60は、画像データの特徴ベクトルを生成する際に、画像内の部分画像をマッピングする対象の分類先(基準クラスタ)を生成する。ビジュアルキーワード生成部60は、画像検索に用いる画像や学習用に予め用意された画像データから複数の部分画像を抽出し、その部分画像の有する特徴量に基づいてそれらをクラスタリングする。尚、クラスタリングの標準的な手法としては、k-means, Hierarchical Agglomerative Clustering(HAC)などが用いられる。
【0032】
特徴ベクトル生成部20は、画像から検出した部分画像を、ビジュアルキーワード生成部60のクラスタリングにより形成される基準クラスタにマッピング(分類)することで、特徴ベクトルを生成する。この基準クラスタを、画像を視覚的なキーワードの集まりとして表現するための特徴量空間として「ビジュアルキーワード」という。
【0033】
ビジュアルキーワードDB65は、ビジュアルキーワード生成部60のクラスタリングにより形成されたクラスタを識別するビジュアルキーワードID(VKID)と、そのクラスタの特徴量空間(多次元空間)での中心点の座標である中心座標と、該クラスタの範囲を示す半径とを対応付けて記憶するデータベースである。
【0034】
中心座標は、各クラスタに属する画像の特徴量の平均値を示す値であり、特徴量空間上での多次元の座標により示される。半径は、例えば、クラスタに属する画像のうちの、中心座標から最遠の画像との距離により求められる。
【0035】
インデクシング部70は、図2の特徴ベクトル生成処理に基づいて検索対象画像DB90に記憶された画像データについての特徴ベクトルを生成して、この生成した特徴ベクトルを画像データのインデックスとしてインデックスDB75に対応付けて記憶する。インデクシング部70は、部分画像抽出部72と、クラスタリング部74と、マッピング部76とを備えて構成され、これらが協働することにより、後述する特徴ベクトル生成処理を実現する。
【0036】
また、インデクシング部70は、画像データから検出した部分画像に領域IDを割り振り、その部分画像をマッピングしたビジュアルキーワードのVKIDを画像IDと領域IDとに対応付けて領域管理DB80に記憶する。この領域IDは、画像内でのXY座標であってもよいし、領域分割した際の行番号・列番号であってもよい。
【0037】
インデックスDB75は、検索対象画像DB90に記憶された画像データの画像IDと、この画像データから生成した特徴ベクトル(ビジュアルキーワード毎の部分画像の出現頻度)とを対応付けて記憶するデータベースである。
【0038】
領域管理DB80は、検索対象画像内の部分画像をマッピングしたビジュアルキーワードの対応関係を管理するデータベースであり、図1に示すように、検索対象画像の画像IDと、領域IDと、VKIDとを対応付けて記憶する。
【0039】
検索対象画像DB90は、類似画像の検索対象としてインターネット上から収集した画像データ(「検索対象画像」という)を蓄積記憶するデータベースであって、図1に示すように、画像IDと、画像データとを対応付けて記憶する。画像IDは、各画像データを固有に識別するための識別情報であって、キーワード及び画像データを記憶する際に、割り振られる。
【0040】
〔特徴ベクトル生成処理〕
次に、特徴ベクトル生成処理について、図2のフローチャートと、図3〜図4の概念図とを参照しながら説明する。特徴ベクトル生成処理は、特徴ベクトル生成部20がクエリ画像に対して、インデクシング部70が検索対象画像に対して行うが、以下の説明では、特徴ベクトル生成部20が行う場合を取り上げて説明する。
【0041】
先ず、部分画像抽出部22が、クエリ画像の画像データから複数の部分画像を抽出する(ステップS11)。この部分画像の抽出方法としては、画像中の特徴的な領域(特徴領域)を抽出する手法と、画像を所定領域で分割することで抽出する手法とがある。
【0042】
特徴領域を検出する手法としては、
・Harris−affine
・Hessian−affine
・Maximally stable extremal regions(MSER)
・Difference of Gaussians(DoG)
・Laplacian of Gaussian(LoG)
・Determinant of Hessian(DoH)
等がある。
【0043】
また、特徴領域の検出技術については、“Local Invariant Feature Detectors: A Survey”(Foundations and Trends in Computer Graphics and Vision,Vol.3,No.3,pp.177-280,2007.)等において公開されており、適宜公知技術を採用可能である。
【0044】
また、画像を所定領域で分割して検出する手法としては、例えば、予め定めたM×Nブロックに分割したり、分割後のブロックの大きさが予め定めたm×n画素となるように分割したりする手法がある。例えば、画像を10×10のブロックに分割する場合、画像の大きさが640×480画素であれば、1ブロックの大きさは64×48画素となる。
【0045】
次に、抽出した部分画像が有する特徴量を算出する(ステップS12)。尚、特徴領域を抽出している場合には、スケール変化や回転、角度変化等のアフィン変換に耐性を持つ局所特徴量を抽出する。局所特徴量の一例としては、例えば次のものが挙げられる。
【0046】
・SIFT
・gradient location and orientation histogram
・shape context
・PCA−SIFT
・spin images
・steerable filters
・differential invariants
・complex filters
・moment invariants
【0047】
局所特徴量の抽出については、“A performance evaluation of local descriptors”(IEEE Trans. Pattern Analysis and Machine Intelligence, Vol.27, No.10,pp.1615-1630,2005.)等において公開されており、適宜公知技術を採用可能である。
【0048】
この特徴領域から抽出した特徴量に基づいて生成した特徴ベクトルは、オブジェクト(物体)の存在する可能性の高い特徴領域から生成されるため、画像中のオブジェクトの特徴を示す指標として有効である。
【0049】
また、領域分割により部分画像を抽出している場合には、画像の配色やテクスチャ、形状等の各画像の特徴を数値化して表現した画像特徴量を用いる。この領域分割により検出した領域画像の特徴量から生成した特徴ベクトルは、画像を構成する各部分から生成されるため、画像の全体的な構成を示す指標として有効である。
【0050】
そして、クラスタリング部24が、画像データから抽出した複数の部分画像を、該部分画像の特徴量に基づいてクラスタリングする(ステップS13)。このクラスタリングにより形成されるクラスタを適宜「対象クラスタ」という。クラスタリングの標準的な手法としては、k-means, Hierarchical Agglomerative Clustering(HAC)などが用いられる。また、クラスタ数Mは、部分画像の数の1/5(L=5)〜1/10(L=10)程度に設定する。
【0051】
例えば、部分画像抽出部22は、図3に示すように画像G1からK個の部分画像を抽出したとする。この部分画像をクラスタリング部24は、部分画像の特徴量に基づいてクラスタリングすることにより、図3のようにM個の対象クラスタを形成する。各対象クラスタには、類似する特徴量を有する部分画像が纏め上げられることになる。
【0052】
次に、マッピング部26は、ステップS13のクラスタリングにより形成された対象クラスタの中から1つを選択し(ステップS14)、その対象クラスタと、各ビジュアルキーワード(ビジュアルキーワード生成部60により予め形成された基準クラスタ)との間の距離を算出する(ステップS15)。この距離は、特徴量空間上におけるクラスタの中心座標と、ビジュアルキーワードの中心座標との間の距離によって求められる。クラスタの中心座標に用いる値としては、クラスタに属するデータ(特徴量)の平均値としてのcentroidの他に、中心に最も近いデータを採用するmedoidや、データを昇順に並べたときに中央に位置するデータを採用するmedian等を適用することができる。
【0053】
そして、算出した距離が最も近いビジュアルキーワードに、選択した対象クラスタ内の部分画像をマッピング(分類)する(ステップS16)。この際、マッピング部26は、インデックスDB75の特徴ベクトルの各ビジュアルキーワードのスカラ値にその部分画像の数を加算する。また、領域管理DB80の部分画像の領域IDに、該部分画像をマッピングしたビジュアルキーワードのVKIDの割り当てを行い、各々を対応付けて記憶する。
【0054】
例えば、図3において、クラスタ#1と、ビジュアルキーワードVK1〜VKNとの間の距離を算出した結果、ビジュアルキーワードVK3が最も近いと判定されたとする。この場合は、クラスタ#1に属する部分画像G11〜G15がビジュアルキーワードVK3にマッピングされることとなる。
【0055】
次に、マッピング部26は、ステップS14において全ての対象クラスタを選択したか否かを判定し(ステップS17)、未選択の対象クラスタがある場合には(ステップS17;No)、ステップS14に処理を移行して、ステップS16までの処理を繰り返す。
【0056】
また、全ての対象クラスタを選択したと判定した場合には(ステップS17;Yes)、各部分画像と、ステップS16でマッピングが行われたビジュアルキーワードとの間の距離を算出して、その距離に基づいて部分画像の再マッピングを行う。
【0057】
即ち、部分画像を1つ選択して(ステップS18)、その部分画像と、部分画像をマッピングしているビジュアルキーワードとの間の距離を算出する(ステップS19)。この距離算出は、選択した部分画像をマッピングしたビジュアルキーワードだけでなく、ステップS16においてマッピングが行われた全てのビジュアルキーワードに対して行う。また、ビジュアルキーワードとの間の距離は、部分画像の有する特徴量の特徴量空間上での座標と、ビジュアルキーワードの中心座標との間の距離により求められる。
【0058】
そして、選択した部分画像との間の距離が最も近いビジュアルキーワードを選定して、部分画像にそのビジュアルキーワードのVKIDを割り当てることで、該ビジュアルキーワードに再マッピングする(ステップS20)。
【0059】
例えば、ステップS16において、図4に示すように、クラスタ#1に属する部分画像G11〜G15をビジュアルキーワードVK3にマッピングしたとする。この際、部分画像G15と、各ビジュアルキーワードとの間の距離を算出した結果、ビジュアルキーワードVK5との距離が最も近いと判定され、部分画像G15は、ビジュアルキーワードVK3からビジュアルキーワードVK5に再マッピングされることとなる。従って、クラスタとして一纏まりで部分画像がマッピングされたとして、適切なビジュアルキーワードに再マッピングすることができる。
【0060】
マッピング部26は、ステップS18において全ての部分画像を選択したか否かを判定して(ステップS21)、未選択のものがあると判定した場合には(ステップS21;No)、ステップS18に処理を移行する。
【0061】
また、全ての部分画像を選択したと判定した場合には(ステップS21;Yes)、マッピングしたビジュアルキーワードに基づいて特徴ベクトルを生成する(ステップS22)。即ち、マッピングした結果のビジュアルキーワード毎での部分画像の出現頻度により多次元で表される特徴ベクトルを生成する。これにより、図3のように画像G1についての特徴ベクトルVが生成される。
【0062】
特徴ベクトル生成部20は、上記の処理により生成した特徴ベクトルを類似度算出部30に出力すると、類似度算出部30が、検索対象画像の特徴ベクトルとの間の類似度を算出する。また、インデクシング部70は、上記の処理により生成した特徴ベクトルを、検索対象画像の画像IDに対応付けてインデックスDB75に対応付けて記憶する。
【0063】
以上のように、本実施形態によれば、画像から抽出した部分画像をクラスタリングすることにより、類似する部分画像を纏め上げて、クラスタ単位でビジュアルキーワードにマッピングするため、ビジュアルキーワードを用いた特徴ベクトル生成のための計算コストを低減することができる。
【0064】
より具体的には、抽出した部分画像の数がK個、ビジュアルキーワードの数がN個とすると、従来の各部分画像とビジュアルキーワードとの間の距離に基づいてマッピング手法であれば、K×Nの計算コストがかかる。これに対し、本実施形態の手法であれば、K個の部分画像をM個のクラスタにクラスタリングする計算コストK×Mと、M個のクラスタとN個のビジュアルキーワードとの距離算出によりマッピングする計算コストM×Nとの合計となる。
【0065】
例えば、一枚の画像から抽出される部分画像が1,000個であり、クラスタ数が200個(部分画像の数の1/5)であり、ビジュアルキーワードが450,000個であるとする。この場合、従来のマッピング手法であれば、計算コストは、450,000,000(=1,000×450,000)となり、本実施形態の手法であれば、計算コストは、90,200,000(=1,000×200+200×450,000)となる。このように、本実施形態の手法であれば、従来の手法に対して、計算コストを約80%削減することができる。
【0066】
また、ステップS18〜S21の処理により一旦マッピングした部分画像を再マッピングするために距離算出を行っているが、この距離の算出は、全てのビジュアルキーワードではなく、ステップS16でマッピングされたビジュアルキーワードとしている。即ち、予め生成しておいたN個のビジュアルキーワードのうち、部分画像がマッピングされたビジュアルキーワードはQ個(≦N)となるから、このQ個のビジュアルキーワードとの間の距離算出を行えばよく、この計算コストはK×Qとなる。従って、特徴ベクトルの精度向上のための計算コストも抑えることができる。
【0067】
尚、上述の実施形態は本発明を適用した一例であって、その適用可能な範囲は上述に限られない。例えば、本実施形態において、ステップS16のマッピングの後に、部分画像とビジュアルキーワードとの距離に基づいて再マッピングを行うこととして説明したが、この処理を行わずにマッピングを完了させることとしてもよい。但し、上述したように、再マッピングすることで、生成される特徴ベクトルの精度が向上するのは無論である。
【0068】
また、上述の実施形態では、クラスタ内の部分画像を、該クラスタと最も距離の近いビジュアルキーワードにマッピングすることとして説明したが、例えば、クラスタ内でも該クラスタの中心座標と距離が一定値以上離れている部分画像については、個別にビジュアルキーワードとの距離を測ってマッピングすることとしてもよい。
【0069】
即ち、クラスタ距離算出手段としてのクラスタリング部24(74)は、クラスタリングの際に、クラスタの中心座標と、部分画像との距離を保持しておき、その距離が一定値以上離れている場合には、クラスタ内の部分画像をビジュアルキーワードにマッピングするステップS16の処理の対象から外す。そして、マッピング部26(76)は、そのマッピング対象から外した部分画像については、個々にビジュアルキーワードとの間の距離を算出して、最も近いビジュアルキーワードに対してマッピングを行う。
【0070】
これにより、クラスタリングされた部分画像の大部分を、クラスタとビジュアルキーワードとの距離に基づいてマッピングすることができるので、マッピングの計算コストを低減させつつ、特徴ベクトルの精度も向上させることができる。
【0071】
また、ステップS18〜S21において、画像から抽出した全ての部分画像についてビジュアルキーワードとの距離を算出することしたが、例えば、ステップS16においてマッピングした部分画像のうち、そのマッピング先のビジュアルキーワードの中心との距離が所定値以上の部分画像を選択して距離算出及び再マッピングすることとしてもよい。
【0072】
具体的には、図4において、部分画像G11〜G15と、ビジュアルキーワードVK3の中心C3との距離を算出して、その距離が所定値以上となった部分画像G15について他のビジュアルキーワードとの距離を算出して、再マッピングする。従って、再マッピングする対象の部分画像を絞り込むことができる。
【0073】
また、テキスト検索における単語の重み付け手法であるTF/IDF(term frequency-inverse document frequency)により、特徴ベクトルに重み付けを行うこととしてもよい。
【0074】
TF/IDFに関する参考資料としては、
C.D.Manning, P.Raghavan and H.Schutze:" Introduction to Information Retrieval",Cambridge University Press.2008.
が知られている。
【0075】
TF/IDFは、文章中の特徴的な単語を抽出するためのアルゴリズムであり、単語の出現頻度であるTFと、逆出現頻度であるIDFとの二つの指標により算出される。具体的には、次式により求められる。
TF/IDF=TF(i,j)/T(i)*IDF(j)
IDF(i)=log(N/DF(i))
【0076】
ここで、
TF(i,j)は、キーワード抽出対象のドキュメントi中でのキーワードjの出現数
T(i)は、ドキュメントi中の全ての単語の数
Nは、全てのドキュメント数
DF(j)は、キーワードjが含まれるドキュメントの数
である。
【0077】
これを、ドキュメントを画像、単語を同一のビジュアルキーワードに属する部分画像として捉え、各画像のビジュアルキーワード毎にTF/IDF値を求めて、このTF/IDF値を、部分画像をマッピングしたビジュアルキーワードに加算することで、特徴ベクトルを生成する。
【0078】
このとき、画像IDをi、各ビジュアルキーワードkとして、各ビジュアルキーワードの重み値であるTF/IDF(i,k)は以下の式により算出する。
【0079】
TF/IDF(i,k)=TF(i,k)/T(i)*IDF(k)
IDF(k) =log(N/DF(k))
【0080】
尚、TF(i,k)は、画像iから抽出した部分画像がビジュアルキーワードkで出現する数に重み付けを行ったものであり、各ビジュアルキーワードk内に属する(出現する)部分画像と、ビジュアルキーワードkの中心点との距離に基づく上述した重み値(0〜1)となる。
【0081】
また、T(i)は、画像iから抽出した部分画像の総数に、ビジュアルキーワードとの距離に基づく重み付けをした値であり、画像iから抽出した各部分画像が属するクラスタとの距離に基づいた重み値を合計したものである。
【0082】
また、DF(k)は、各ビジュアルキーワードkに分類した部分画像が、各ビジュアルキーワードkに出現する数に、ビジュアルキーワードとの距離に基づく重み付けを行った値である。また、Nは、検索対象画像DB90の画像総数である。
【0083】
このように、TF/IDFにおけるドキュメントを画像とみなし、ドキュメント内の単語を同一のビジュアルキーワードに属する部分画像とみなして重み付けを行うことで、各画像に出現する部分画像の重要度を下げ、特定の画像に際立って出現する特徴的な部分画像についての重要度を上げるように特徴ベクトルのスカラ値に重み付けを行うことができる。
【0084】
このTF/IDFによる重み付けを用いて、クエリ画像内の部分画像が属するビジュアルキーワードと、検索対象画像内の部分画像が属するビジュアルキーワードとの類似スコアを求めてもよい。
【0085】
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
【符号の説明】
【0086】
1 画像検索装置
10 クエリ画像受付部
20 特徴ベクトル生成部
22 部分画像抽出部
24 クラスタリング部
26 マッピング部
30 類似度算出部
50 検索結果出力部
60 ビジュアルキーワード生成部
70 インデクシング部
72 部分画像抽出部
74 クラスタリング部
76 マッピング部
65 ビジュアルキーワードDB
70 検索対象画像DB
75 インデックスDB
80 領域管理DB
90 検索対象画像DB

【特許請求の範囲】
【請求項1】
画像内から抽出した複数の部分画像を複数の基準クラスタの何れかに分類して、各基準クラスタへの分類数に基づく特徴ベクトルを生成する特徴ベクトル生成装置において、
前記抽出された複数の部分画像を、該部分画像の特徴量に基づいてクラスタリングするクラスタリング手段と、
前記クラスタリングによって形成されたクラスタを対象クラスタとして、該対象クラスタと前記各基準クラスタとの間の距離を算出する距離算出手段と、
前記対象クラスタに属する部分画像を、該対象クラスタとの前記距離が最も近い基準クラスタに分類する分類手段と、
を備えることを特徴とする特徴ベクトル生成装置。
【請求項2】
前記分類手段は、
前記個々の部分画像と、前記画像内から抽出した部分画像の分類が行われた基準クラスタとの間の距離を算出し、この距離が最も近い基準クラスタに分類先を変更する
ことを特徴とする請求項1に記載の特徴ベクトル生成装置。
【請求項3】
前記分類が行われた基準クラスタと、該基準クラスタに分類された前記部分画像との間の距離を算出するクラスタ距離算出手段を更に備え、
前記分類手段は、
前記クラスタ距離算出手段により算出された距離が所定値以上の部分画像を選定し、その選定した部分画像と該部分画像の分類が行われた基準クラスタとの間の距離を算出して、分類先の変更を行う
ことを特徴とする請求項2に記載の特徴ベクトル生成装置。
【請求項4】
コンピュータが、画像内から抽出した複数の部分画像を複数の基準クラスタの何れかに分類して、各基準クラスタへの分類数に基づく特徴ベクトルを生成する特徴ベクトル生成方法において、
前記抽出された複数の部分画像を、該部分画像の特徴量に基づいてクラスタリングするクラスタリング工程と、
前記クラスタリングによって形成されたクラスタを対象クラスタとして、該対象クラスタと前記各基準クラスタとの間の距離を算出する距離算出工程と、
前記対象クラスタに属する部分画像を、該対象クラスタとの前記距離が最も近い基準クラスタに分類する分類工程と、
を前記コンピュータが実行することを特徴とする特徴ベクトル生成方法。
【請求項5】
請求項4に記載の特徴ベクトル生成方法をコンピュータに実行させるためのプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate


【公開番号】特開2012−79187(P2012−79187A)
【公開日】平成24年4月19日(2012.4.19)
【国際特許分類】
【出願番号】特願2010−225304(P2010−225304)
【出願日】平成22年10月5日(2010.10.5)
【出願人】(500257300)ヤフー株式会社 (1,128)
【Fターム(参考)】