説明

画像検索方法およびシステム

【課題】クエリ画像および検索対象画像の類似性を、各特徴点の局所特徴量の類似性のみならず、被写体が同一であるか否かも考慮して判定できる画像検索システムを提供する。
【解決手段】クエリ画像および各検索対象画像の特徴点の局所特徴量を比較してNベストの対応点を抽出するNベスト抽出部2と、Nベスト対応点の局所特徴量をクエリ画像の対応する特徴点の局所特徴量と比較し、各局所領域のスケールおよびオリエンテーションの相違に関する分布を算出する相違分布算出部3と、相違分布に基づいて対応点候補を抽出する対応点候補抽出部4と、対応点候補およびクエリ画像の対応する特徴点の位置座標を正規化する正規化部5と、正規化された位置座標同士を比較して相対位置分布を算出する相対位置分布算出部6と、相対位置分布に基づいて対応点を抽出する対応点抽出部7と、抽出された対応点に基づいて検索対象画像を決定する類似画像決定部8とを具備した。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、クエリ画像に類似した画像を多数の検索対象画像の中から検索する画像検索方法およびシステムに係り、特に各画像の局所特徴量同士を比較して対応点を求め、その個数に基づいて画像間の類似性を判断する画像検索方法およびシステムに関する。
【背景技術】
【0002】
建物など剛体の画像をロバストに検出する手法の一つとして、非特許文献1にSIFT(Scale Invariant Feature Transform)が開示されている。このSIFTでは、クエリ画像および検索対象画像の双方から予め局所特徴量が抽出され、各画像の局所特徴量間のユークリッド距離Lに基づいて最近傍探索が実行される。そして、距離の近い局所特徴量同士が対応点ペアとされ、最終的に対応点ペアの多い検索対象画像が検索結果とされる。このとき、最近傍の特徴点の対応点マッチング精度を高めるために、最も近い距離L1のみならず2番目に近い距離L2も求められ、両者の比(L1/L2:ratio of distances)が所定の閾値t以下であれば対応点とされるが、閾値tよりも大きければ対応点とされない。
【0003】
非特許文献1では、予備実験においてt=0.85で急激な誤対応点増加が確認されたことからt=0.8としている。しかしながら、閾値tを小さな値に設定すれば、対応点の精度は高くなる傾向を示すものの、対応点ペアが少なくなるので検索精度を高くできるとは限らない。すなわち、非特許文献1では閾値tを適正値に設定することが難しかった。
【0004】
このような技術課題に対して、特許文献1には、所定数の対応点ペアが得られるように、対応点ペアが少なければ閾値tを段階的に上げ、多ければ閾値tを段階的に下げるといったように、抽出される対応点ペアの個数に応じて閾値tを適応的に変更する技術が開示されている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2007−140613号公報
【非特許文献】
【0006】
【非特許文献1】David G. Lowe,"Distinctive image features from scale-invariant keypoints" International Journal of Computer Vision, 60, 2 (2004), pp.91-110.
【発明の概要】
【発明が解決しようとする課題】
【0007】
上記の従来技術では、所定の閾値tで得られる対応点ペアが少ないと、閾値tが適応的に上昇するので対応点ペアが増える。しかしながら、もともと同一物体が画像内に含まれていないために対応点ペアが少ないクエリ画像および検索対象画像のペアについても閾値tが上げられてしまうので、本来であれば対応点ペアとされない特徴点同士までもが対応点ペアとされてしまうという問題があった。
【0008】
また、上記の従来技術では、特徴点ごとに、その局所特徴量の類似性のみに基づいて対応点が決定されていたため、例えば建物の画像における窓やチェーン展開している店の看板のように、類似した形状の被写体がクエリ画像および検索対象画像のそれぞれに含まれていると、類似度の高い多数の特徴点が対応点として誤って抽出されてしまうという問題があった。
【0009】
本発明の目的は、上記した従来技術の課題を解決し、クエリ画像および検索対象画像の類似性を、各特徴点の局所特徴量の類似性のみならず、被写体が同一であるか否かも考慮して判定できる画像検索方法およびシステムを提供することにある。
【課題を解決するための手段】
【0010】
上記の目的を達成するために、本発明は、クエリ画像に類似した画像を検索対象画像の集合から検索する画像検索システムにおいて、クエリ画像および各検索対象画像の特徴点から局所特徴量を抽出する局所特徴量抽出手段と、クエリ画像および検索対象画像の各特徴点から抽出した局所特徴量を比較し、クエリ画像の特徴点ごとに、類似度が上位Nベストの対応点を抽出するNベスト抽出手段と、Nベスト対応点の局所特徴量をクエリ画像の対応する特徴点の局所特徴量と比較し、両者の局所領域の相違に関する分布を算出する相違分布算出手段と、相違分布に基づいて、対応点としての尤度が高い複数の対応点候補を抽出する対応点候補抽出手段と、対応点候補の局所特徴量をクエリ画像の対応する特徴点の局所特徴量と比較し、各局所領域の位置座標を正規化する正規化手段と、前記正規化された対応点候補の位置座標をクエリ画像の対応する特徴点の位置座標と比較し、各位置座標の相対的な位置関係の分布を算出する相対位置分布算出手段と、相対位置分布に基づいて、対応点としての尤度が高い複数の対応点を抽出する対応点抽出手段と、前記抽出された対応点に基づいて、クエリ画像に類似した検索対象画像を決定する類似画像決定手段とを具備したことを特徴とする。
【発明の効果】
【0011】
本発明によれば、特徴点の局所特徴量に基づいて対応点を抽出する際に、従来のように特徴点同士の個々の類似性に基づいて厳しい抽出条件で少数の対応点を抽出するのではなく、初めは抽出条件を緩めて多数の対応点候補を抽出し、次いで、この多数の対応点候補の局所特徴量の相対的な関係に基づいて尤度の高い対応点を抽出するようにした。したがって、建物画像の窓やチェーン展開している店の看板を含む画像のように、被写体が異なるにもかかわらず局所特徴量が類似する特徴点が数多く存在する画像同士の比較でも、これらの特徴点が対応点として誤抽出されにくくなる。
【図面の簡単な説明】
【0012】
【図1】本発明の一実施形態に係る画像検索システムのブロック図である。
【図2】相違分布の算出方法を模式的に示した図である。
【図3】相違分布の一例を示した図である。
【図4】対応点候補の抽出方法の一例を示した図である。
【図5】正規化および相対位置分布の算出方法を模式的に示した図である。
【図6】相対位置分布の一例を示した図である。
【図7】対応点の抽出方法の一例を示した図である。
【図8】本発明の一実施形態の動作を示したメインフローである。
【図9】対応点候補抽出処理の手順を示したフローチャートである。
【図10】対応点抽出処理の手順を示したフローチャートである。
【発明を実施するための形態】
【0013】
以下、図面を参照して本発明の実施形態について詳細に説明する。図1は、本発明の一実施形態に係る画像検索システムの主要部の構成を示したブロック図であり、ここでは、本発明の説明に不要な構成は図示が省略されている。
【0014】
局所特徴量抽出部1は、クエリ画像Iqおよび多数の検索対象画像Iw(k)の各特徴点を基準にして局所特徴量fq(i),fw(k,j)を抽出する。なお、符号kは検索対象画像の識別子である。本実施形態では、SIFTを利用して特徴点の抽出および対応付けが行われる。すなわち、局所領域の特定には、非特許文献1に開示されているDifference of Gaussian (DoG)によるスケールスペース内の極値に基づく特徴点抽出が用いられる。この特徴点抽出の結果、特徴点の位置およびその局所領域の範囲が算出され、この局所領域の特徴記述子として、輝度勾配の方向ヒストグラムが用いられる。
【0015】
このような方向ヒストグラムは、特徴領域の各ピクセルの輝度勾配を算出し、それに重みを付けてヒストグラムを生成し、最も多いbin領域の方向を基準にして、その方向に特徴領域の回転(オリエンテーション)を行い、再度輝度方向の方向ヒストグラムを作成し、さらに前記ヒストグラムをブロックに分割し、各ブロック内で方向ヒストグラムを算出し、これを正規化してベクトル化することにより得られる。本実施形態では、ブロック内の輝度方向を8方向、対象領域内を16分割しているため、一つの特徴記述子は8*16=128次元となる。
【0016】
これら特徴記述子の特徴として、局所領域の特徴を生成するのでオクルージョンに耐性があり、特徴点に対してスケールを決定するので画像サイズに不変であり、また輝度勾配に基づき画像平面内でオリエンテーションを行うので、画像平面に対する回転に不変であることなどが挙げられる。さらに、エッジ成分を利用しているので輝度変化に耐性がある。このような特徴点検出が画像の全てのピクセルに対して行われるが、ある特徴点が極値を取った場合でも特徴点として不適な場合は特徴領域から除外される。
【0017】
本実施形態では、クエリ画像Iqの各局所特徴量fq(i)が次式(1)で表される。pq(i)は同次座標で表した特徴点の位置、op(i)は特徴点のオリエンテーション、σq(i)は特徴点が発見されたスケール、dq(i)は特徴記述子であり、符号iはクエリ画像Iqの特徴点識別子である。
【0018】
fq(i)={pq(i),op(i), σq(i),dq(i)} ・・・(1)
【0019】
同様に、各検索対象画像Iw(k)の局所特徴量fw(k,j)は次式(2)で表される。pw(k,j)は同次座標で表した特徴点の位置、ow(k,j)は特徴点のオリエンテーション、σw(k,j)は特徴点が発見されたスケール、dw(k,j)は特徴記述子であり、符号jは検索対象画像Iw(k)の特徴点識別子である。
【0020】
fw(k,j)={pw(k,j),ow(k,j),σw(k,j),dw(k,j)} ・・・(2)
【0021】
Nベスト抽出部2は、クエリ画像Iqの各特徴点の局所特徴量と全ての検索対象画像Iw(k)の各特徴点の局所特徴量とを比較し、抽出条件を従来技術よりも緩めて、クエリ画像Iqの特徴点ごとに、各検索対象画像Iw(k)から局所特徴量の類似度が高い上位N個の特徴点をNベスト対応点として抽出する。したがって、クエリ画像Iqにm個の特徴点が設定されていれば、(m×N)個のNベスト対応点が全ての検索対象画像Iw(k)から抽出されることになる。
【0022】
本実施形態では、クエリ画像Iqの各特徴点について、全ての検索対象画像Iw(k)の各特徴点を対象に局所特徴量の最近傍探索を行い、検索対象画像ごとに、局所特徴量間の距離に基づいて類似度を算出する。本実施形態では、各特徴点の局所特徴量fq(i),fw(k,j)間の類似度が、次式(3)で与えられる各特徴記述子dq(i),dw(k,j)間のユークリッド距離Lで代表される。
【0023】
L=|dq(i)−dw(k,j)| ・・・(3)
【0024】
相違分布算出部3は、Nベスト対応点の局所特徴量をクエリ画像の対応する特徴点の局所特徴量と比較し、各局所領域の相違に関する分布を算出する。本実施形態では、局所領域のスケール比(または差)、およびオリエンテーションの角度差(または角度比)に関する分布を算出する。本実施形態では、図2に一例を示したように、Nベスト対応点ごとに、その局所特徴量とクエリ画像Iqの対応する局所特徴量との局所領域(スケール)のサイズ比およびオリエンテーションの角度差を算出して対応付け、これを全てのNベスト対応点について実施してプロットすることにより、図3に一例を示した相違分布を算出する。
【0025】
対応点候補抽出部4は、前記相違分布に基づいて、対応点としての尤度が高い複数の対応点候補を抽出する。図4は、対応点候補の抽出方法の一例を示した図であり、本実施形態では、分布密度の最も高い位置を中心に所定の範囲内に存在するNベスト対応点が対応点候補とされ、それ以外のNベスト対応点はノイズとして除去される。
【0026】
正規化部5は、前記対応点候補の局所特徴量、特に局所領域のサイズに基づいて、各検索対象画像およびクエリ画像の一方を他方に合わせて拡縮することで両者の位置座標を正規化する。本実施形態では、前記分布密度の最も高い位置の対応点に基づいてクエリ画像Iqのサイズと検索対象画像Iw(k)のサイズとの差を算出し、これに基づいて前記各対応点候補の位置座標が変換される。
【0027】
相対位置分布算出部6は、前記正規化された対応点候補の位置座標とクエリ画像の対応する特徴点の位置座標との相対的な位置関係の分布を算出する。
【0028】
図5は、前記正規化および分布算出の一例を模式的に表現した図であり、本実施形態では、正規化された対応点候補の位置座標をクエリ画像の対応する特徴点の位置座標と比較し、各位置座標のX方向およびY方向に関する相対位置の差を求め、これを全ての対応点候補について実施してプロットすることにより、図6に一例を示した相対位置分布を算出する。
【0029】
対応点抽出部7は、前記相対位置分布に基づいて、対応点としての尤度が高い複数の対応点を抽出する。図7は、対応点の抽出方法の一例を示した図であり、本実施形態では、分布密度の最も高い位置を中心に所定の範囲内に存在する対応点候補が対応点とされ、それ以外の対応点候補はノイズとして除去される。また、クエリ画像Iqの各特徴点に複数の対応点が抽出されていると、最尤の対応点以外は除去される。
【0030】
類似画像決定部8は、対応点が最も多い検索対象画像Iw(k)を抽出し、これを検索結果として出力する。あるいは更に、前記抽出された複数の対応点を利用して射影変換を行い、このうち、射影変換できた対応点の個数が最も多い検索対象画像Iw(k)を検索結果とするようにしても良い。
【0031】
次いで、フローチャートを参照して本発明の一実施形態の動作を詳細に説明する。図8は、本発明の一実施形態の動作を示したメインフローである。
【0032】
ステップS1では、局所特徴量抽出部1において、クエリ画像Iqから各特徴点を基準にした局所領域の特徴量fq(i)が抽出され、さらに全ての検索対象画像Iw(k)から各特徴点を基準にした局所領域の特徴量fw(k,j)が抽出される。ステップS2では、検索対象画像Iw(k)の一つが、今回の比較対照として選択される。ステップS3では、クエリ画像Iqの各特徴点と局所特徴量が一致または類似する検索対象画像Iw(k)の特徴点を対応点候補として抽出する対応点候補抽出処理が実行される。
【0033】
図9は、前記ステップS3で実行される対応点候補抽出処理の手順を示したフローチャートであり、ステップS101では、クエリ画像Iqから抽出された多数の特徴点の中の一つの局所特徴量fq(i)が選択される。ステップS102では、今回の検索対象画像Iw(k)の全ての特徴点の局所特徴量fwとクエリ画像Iqの今回の局所特徴量fq(i)との類似度が、各特徴量間の距離(ユークリッド距離)として算出される。ステップS103では、局所特徴量の距離が近い上位N個の対応点(Nベスト対応点)が抽出される。ステップS104では、クエリ画像Iqの全ての特徴点についてNベスト対応点の抽出が完了したか否かが判定され、完了するまではステップS101へ戻って上記の各処理が繰り返される。
【0034】
ステップS105では、抽出されたNベスト対応点の一つと、これに対応するクエリ画像Iqの特徴点とのペアが取得される。ステップS106では、前記取得されたペアの局所特徴量同士が比較され、そのサイズ比およびオリエンテーションの角度差が算出される。ステップS107では、前記図2を参照して説明したように、今回のNベスト対応点が、前記サイズ比およびオリエンテーション角度差に基づいてプロットされる。ステップS108では、全てのNベスト対応点に関してプロットが完了したか否かが判定される。完了していなければステップS105へ戻り、残りのNベスト対応点について同様の手順が繰り返される。
【0035】
全てのNベスト対応点に関してプロットが完了して前記図3の位相分布が完成するとステップS109へ進み、分布密度の最大位置が検出される。ステップS110では、前記図4に示したように、前記最大位置から所定の範囲内のNベスト対応点が対応点候補とされ、それ以外のNベスト対応点はノイズとして破棄される。
【0036】
図8へ戻り、ステップS4では、前記対応点候補の中から対応点を抽出する対応点抽出処理が実行される。図10は、この対応点抽出処理の手順を示したフローチャートである。
【0037】
ステップS201では、前記分布密度の最大位置の局所特徴量と、この最大位置と対応するクエリ画像Iqの特徴点の局所特徴量とが比較され、両者のスケールに基づいてクエリ画像Iqに対する検索対象画像Iw(k)の拡縮倍率が算出される。ステップS202では、クエリ画像Iqに合わせて検索対象画像Iw(k)の位置座標を正規化すべく、前記対応点候補の位置座標が前記拡縮倍率に基づいて変換される。
【0038】
ステップS203では、対応点候補の一つに注目し、前記図5を参照して説明したように、その正規化後の位置座標と、これに対応するクエリ画像Iqの特徴点の位置座標とのズレ量が、X方向およびY方向に関して算出される。ステップS204では、前記X方向およびY方向のズレ量がプロットされる。ステップS205では、全ての対応点候補に関してプロットが完了したか否かが判定される。完了していなければステップS203へ戻り、残りの対応点候補について同様の手順が繰り返される。
【0039】
全ての対応点候補に関してプロットが完了し、前記図6に示した相対位置分布が完成するとステップS206へ進み、前記図7に示したように、分布密度が最大となる位置を中心に所定の抽出範囲が設定される。ステップS207では、前記抽出範囲内の対応点候補が対応点とされ、それ以外の対応点候補はノイズとして破棄される。
【0040】
図8へ戻り、ステップS5では、全ての検索対象画像Iw(k)に関して上記の対応点抽出処理が完了したか否かが判定される。完了していなければステップS2へ戻り、注目する検索対象画像Iw(k)を切り換えながら上記の各処理が繰り返される。ステップS6では、前記類似画像決定部8において、検索対象画像Iw(k)が前記対応点の個数でソートされ、対応点数が最多である唯一の検索対象画像、あるいは対応点数が上位の複数の検索対象画像が検索結果として出力される。
【0041】
なお、以上のようにして抽出された対応点を用いて、検索対象画像Iw(k)ごとにクエリ画像Iqからの射影変換を実施し、射影変換行列の構築に実際に利用できた対応点の個数が最多である唯一あるいは上位の複数の検索対象画像が検索結果として出力されるようにしても良い。
【符号の説明】
【0042】
1…局所特徴量抽出部,2…Nベスト抽出部,3…相違分布算出部,4…対応点候補抽出部,5…正規化部,6…相対位置分布算出部,7…対応点抽出部,8…類似画像決定部

【特許請求の範囲】
【請求項1】
クエリ画像に類似した画像を検索対象画像の集合から検索する画像検索システムにおいて、
クエリ画像および各検索対象画像の特徴点から局所特徴量を抽出する局所特徴量抽出手段と、
クエリ画像および検索対象画像の各特徴点から抽出した局所特徴量を比較し、クエリ画像の特徴点ごとに、類似度が上位Nベストの対応点を抽出するNベスト抽出手段と、
前記Nベスト対応点の局所特徴量をクエリ画像の対応する特徴点の局所特徴量と比較し、両者の局所領域の相違に関する分布を算出する相違分布算出手段と、
前記相違分布に基づいて、対応点としての尤度が高い複数の対応点候補を抽出する対応点候補抽出手段と、
前記対応点候補の局所特徴量をクエリ画像の対応する特徴点の局所特徴量と比較し、各局所領域の位置座標を正規化する正規化手段と、
前記正規化された対応点候補の位置座標をクエリ画像の対応する特徴点の位置座標と比較し、各位置座標の相対的な位置関係の分布を算出する相対位置分布算出手段と、
前記相対位置分布に基づいて、対応点としての尤度が高い複数の対応点を抽出する対応点抽出手段と、
前記抽出された対応点に基づいて、クエリ画像に類似した検索対象画像を決定する類似画像決定手段とを具備したことを特徴とする画像検索システム。
【請求項2】
前記相違分布算出手段は、前記Nベスト対応点の局所特徴量をクエリ画像の対応する特徴点の局所特徴量と比較し、両者の局所領域のスケールおよびオリエンテーションの相違に関する分布を算出することを特徴とする請求項1に記載の画像検索システム。
【請求項3】
前記相対位置分布算出手段は、前記正規化された対応点候補の位置座標をクエリ画像の対応する特徴点の位置座標と比較し、各位置座標のX方向およびY方向に関する位置ズレの分布を算出することを特徴とする請求項1に記載の画像検索システム。
【請求項4】
前記類似画像決定手段は、前記抽出された複数の対応点に基づいて、クエリ画像と各検索対象画像との射影変換を行い、射影変換に用いられた対応点に基づいて、クエリ画像に類似した検索対象画像を決定することを特徴とする請求項1ないし3のいずれかに記載の画像検索システム。
【請求項5】
クエリ画像に類似した画像を検索対象画像の集合から検索する画像検索方法において、
クエリ画像および各検索対象画像の特徴点から局所特徴量を抽出する手順と、
クエリ画像および検索対象画像の各特徴点から抽出した局所特徴量を比較し、クエリ画像の特徴点ごとに、類似度が上位Nベストの対応点を抽出する手順と、
前記Nベスト対応点の局所特徴量をクエリ画像の対応する特徴点の局所特徴量と比較し、両者の局所領域の相違に関する分布を算出する手順と、
前記相違分布に基づいて、対応点としての尤度が高い複数の対応点候補を抽出する手順と、
前記対応点候補の局所特徴量をクエリ画像の対応する特徴点の局所特徴量と比較し、各局所領域の位置座標を正規化する手順と、
前記正規化された対応点候補の位置座標をクエリ画像の対応する特徴点の位置座標と比較し、各位置座標の相対的な位置関係の分布を算出する手順と、
前記相対位置分布に基づいて、対応点としての尤度が高い複数の対応点を抽出する手順と、
前記抽出された対応点に基づいて、クエリ画像に類似した検索対象画像を決定する手順とを具備したことを特徴とする画像検索方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate


【公開番号】特開2011−8507(P2011−8507A)
【公開日】平成23年1月13日(2011.1.13)
【国際特許分類】
【出願番号】特願2009−151020(P2009−151020)
【出願日】平成21年6月25日(2009.6.25)
【出願人】(000208891)KDDI株式会社 (2,700)
【Fターム(参考)】