説明

画像マッチング装置及び画像マッチングプログラム

【課題】特徴ベースの画像マッチングにおいて、特徴箇所の減少を防ぐことができる画像マッチング装置を提供する。
【解決手段】入力したクエリ画像群と、予め保存されている検索対象画像とのそれぞれから特徴箇所を抽出し、抽出した特徴箇所毎に局所記述子を算出して特徴データとして出力する特徴表現手段と、クエリ画像群の特徴データを統合し、統合結果特徴データとして出力する特徴統合手段と、統合結果特徴データと、検索対象画像の特徴データとの間で各々の特徴箇所の局所記述子のベクトル間距離値に基づくスコア値を算出し、クエリ画像の特徴箇所に対応する検索対象画像のスコア値に基づきマッチング画像を出力する照合手段とを備えた。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、特徴対応に基づく画像マッチング技術を用いた画像マッチング装置及び画像マッチングプログラムに関する。
【背景技術】
【0002】
近年、画像処理・コンピュータビジョン・パターン認識などの幅広い分野において、画像マッチングの研究が盛んに行われている。画像マッチングとは、ユーザによって入力された1枚のクエリ画像と、検索対象として1枚もしくは複数の画像を有するデータベースが存在するときに、この検索対象データベース内画像群からクエリ画像と同様、もしくは類似した画像を求める技術である。この画像マッチングはその閾値の設定によって、検索対象データベース内にクエリ画像と同様もしくは類似した画像が存在するか否かの判定にも利用することができる。
【0003】
画像マッチングのアプローチは領域ベースのものと特徴ベースのものに大別される。領域ベースのマッチング手法は、2枚の画像間の相違度および類似度に基づきマッチングを行う。具体的にはクエリ画像もしくはクエリ画像中のオブジェクト部分をテンプレート画像として、検索対象データベース内の画像に対してこのテンプレート画像を少しずつずらしながら比較を行い、この処理を検索対象データベース内の全ての画像に対して行うことで画像マッチングを実現する。比較の際は例えばSAD(Sum of Absolute Differences)やSSD(Sum of Squared Differences)といった手法を用いてクエリ画像と検索対象データベース内画像間の相違度が最小となる画像やその位置を求める方法、もしくはNCC(Normalized Cross Correlation)やPOC(Phase-Only Correlation)といった手法を用いてクエリ画像と検索対象データベース内画像間の類似度が最大となる画像やその位置を求める方法がある(例えば、非特許文献1参照)。しかし、これらの領域ベースのアプローチは画像マッチングに要する計算時間が多くなり、また大きな画像変形に弱いといった問題がある。
【0004】
そこで近年、特徴ベースの画像マッチング手法が盛んに研究されている。特徴ベースのマッチングは、クエリ画像と検索対象データベース内画像において、各画像からコーナーのように画素の濃淡値の変化が大きい特徴箇所(特徴点や特徴領域)を抽出し、その周囲の局所領域に対して局所記述子(特徴量)を算出し、局所記述子同士を比較することで実現する。具体的には、クエリ画像から取得した全ての特徴箇所に対して、検索対象データベース内の画像に含まれる特徴箇所の全てと局所記述子の比較を行い、クエリ画像の各特徴箇所の最近傍となる特徴箇所を算出し、この特徴箇所を含む検索対象データベース内画像に票を投じ、投票結果の得票数が最大となる画像をクエリ画像とのマッチング結果画像として出力する(例えば、非特許文献2参照)。
【0005】
なお、特徴点や特徴領域の抽出にはHarris-Affine region、Hessian-Affine region,Difference of Gaussians(DoG) region、Maximally Stable Extremal Regions(MSER)といった手法があり、局所記述子としてSIFT(Scale-Invariant Feature Transform)やGLOH(Gradient Location-Orientation Histogram)が提案されている。また、SIFTを改良した手法として、PCA (Principal Component Analysis)−SIFT、SURF(Supeeded-Up Robust Features)、ASIFT(Affine-SIFT)なども提案されている(例えば、非特許文献1参照)。特徴ベースのマッチング手法は領域ベースのマッチング手法と比較して計算時間が少ないこと、さらに画像変形にロバストであることから大量の画像を対象としてマッチングするような応用に適した手法である。
【先行技術文献】
【非特許文献】
【0006】
【非特許文献1】伊藤康一,高橋徹,青木孝文,“高精度な画像マッチング手法の検討”,第25回信号処理シンポジウム,No.C5−1,pp.547−552,2010.
【非特許文献2】本道貴行,黄瀬浩一,“大規模画像認識のための局所特徴量の性能比較”,画像の認識・理解シンポジウム(MIRU2008)論文集,IS5−6,pp.550−555,2008.
【発明の概要】
【発明が解決しようとする課題】
【0007】
特徴ベースの画像マッチング手法では、クエリ画像と検索対象データベース内画像において、各画像からコーナーのように画素の濃淡値の変化が大きい特徴箇所(特徴点や特徴領域)を抽出し、その周囲の局所領域に対して局所記述子(特徴量)を算出し、この局所記述子同士を比較することで実現している。そのため被写体の撮影条件や配置、被写体自体の形状によって発生する画像上のぼけや部分的な隠ぺいにより、本来抽出されるべき特徴箇所がうまく抽出できないことがある。これによって画像マッチングの結果としてふさわしい画像に対応づけられる特徴箇所数が少なくなり、画像マッチングが正しく行えないという問題がある。
【0008】
本発明は、このような事情に鑑みてなされたもので、特徴ベースの画像マッチングにおいて、特徴箇所の減少を防ぐことができる画像マッチング装置及び画像マッチングプログラムを提供することを目的とする。
【課題を解決するための手段】
【0009】
本発明は、入力したクエリ画像群と、予め保存されている検索対象画像とのそれぞれから特徴箇所を抽出し、抽出した前記特徴箇所毎に局所記述子を算出して特徴データとして出力する特徴表現手段と、前記クエリ画像群の前記特徴データを統合し、統合結果特徴データとして出力する特徴統合手段と、前記統合結果特徴データと、前記検索対象画像の前記特徴データとの間で各々の特徴箇所の局所記述子のベクトル間距離値に基づくスコア値を算出し、クエリ画像の特徴箇所に対応する検索対象画像のスコア値に基づきマッチング画像を出力する照合手段とを備えたことを特徴とする。
【0010】
本発明は、入力画像を元に、画素を間引いて生成した複数の画像をクエリ画像群として出力する間引き画像生成手段と、クエリ画像群と、予め保存されている検索対象画像とのそれぞれから特徴箇所を抽出し、抽出した前記特徴箇所毎に局所記述子を算出して特徴データとして出力する特徴表現手段と、前記クエリ画像群の前記特徴データを統合し、統合結果特徴データとして出力する特徴統合手段と、前記統合結果特徴データと、前記検索対象画像の前記特徴データとの間で各々の特徴箇所の局所記述子のベクトル間距離値に基づくスコア値を算出し、クエリ画像の特徴箇所に対応する検索対象画像のスコア値に基づきマッチング画像を出力する照合手段とを備えたことを特徴とする。
【0011】
本発明は、前記特徴統合手段は、前記特徴データの全てもしくは特徴要素の値に応じてその一部を選択し、選ばれた特徴データを統合結果特徴データとすることを特徴とする。
【0012】
本発明は、前記特徴統合手段は、前記クエリ画像群の特徴データのうち、Hessian値が所定の閾値より大きい特徴データを選定し、選ばれた全ての特徴データを前記統合結果特徴データとすることを特徴とする。
【0013】
本発明は、前記特徴統合手段は、前記クエリ画像群の特徴データのうち、Hessian値が大きい順に所定数分の特徴データを選定し、選ばれた全ての特徴データを前記統合結果特徴データとすることを特徴とする。
【0014】
本発明は、前記特徴統合手段は、前記クエリ画像群の特徴データのうち、各特徴データの特徴箇所の座標値を元画像上の座標値に変換し、座標値が一致する特徴データ内で特徴要素を比較することで代表特徴データを選定し、全ての座標における選定結果を前記統合結果特徴データとすることを特徴とする。
【0015】
本発明は、前記特徴統合手段は、前記クエリ画像群の特徴データのうち、各特徴データの特徴箇所の座標値を元画像上の座標値に変換し、座標値が一致する特徴データ内でHessian値を比較することで、Hessian値が大きい特徴データを算出し、全ての座標における算出結果を前記統合結果特徴データすることを特徴とする。
【0016】
本発明は、コンピュータを前記画像マッチング装置として機能させるための画像マッチングプログラムである。
【発明の効果】
【0017】
本発明によれば、特徴ベースの画像マッチングにおいて、特徴箇所の減少を防ぐことができ、画像マッチングの精度向上を実現することができるという効果が得られる。
【図面の簡単な説明】
【0018】
【図1】本発明の第1の実施形態の構成を示すブロック図である。
【図2】図1に示す装置の動作を示すフローチャートである。
【図3】間引き処理を示す説明図である。
【図4】図1に示す装置の動作を示すフローチャートである。
【図5】図1に示す装置の動作を示すフローチャートである。
【図6】図1に示す装置の動作を示すフローチャートである。
【図7】本発明の第2の実施形態における装置の動作を示すフローチャートである。
【図8】本発明の第3の実施形態の構成を示すブロック図である。
【図9】図8に示す装置の動作を示すフローチャートである。
【図10】入力データから特徴量を抽出して保存する動作を示すフローチャートである。
【図11】サンプリング視点群の設定方法を示す説明図である。
【図12】サンプリング視点群の設定方法を示す説明図である。
【図13】テクスチャデータを抽出する処理を示す説明図である。
【図14】2次元展開画像を生成する処理を示す説明図である。
【図15】特徴点データの一例を示す説明図である。
【図16】ぼけの発生要因と解決策を示す説明図である。
【発明を実施するための形態】
【0019】
以下、図面を参照して、本発明の一実施形態による画像マッチング装置を説明する。始めに、図10〜図15を参照して、被写体の3次元形状情報とテクスチャ情報から2次元展開画像を得る動作を説明する。図10は、クエリとして入力した入力データ(3次元形状情報とテクスチャ情報)から特徴量を抽出して保存する動作を示すフローチャートである。
【0020】
まず、ユーザが入力部を操作して、クエリとして3次元情報入力を指示すると、対象の被写体の3次元形状データとテクスチャデータを入力する(ステップS61)。次に、入力した3次元形状データで定義される3次元形状の中心位置を決定する(ステップS62)。中心位置は3次元形状内部であれば、任意の点で良く、中心位置の決定は例えば、3次元形状を構成する全点の3次元座標情報から重心位置(Xg,Yg,Zg)を算出し、その点を中心位置とすればよい。重心位置は(1)式によって算出する。なお、(1)式においてnは3次元形状として記録された点の総数を示す。nは形状を表現するのに十分な数であればよく、この点は複雑形状であれば多く必要であり、単純形状であれば少数でよい。例えば立方体ならn=8で表現できる。
【数1】

【0021】
次に、設定した3次元形状の中心位置を中心座標とした球体を設定し、この球体を視点球とする。なお、視点球の半径は3次元形状の中心位置から3次元形状の表面までの最遠距離よりも大きいものとする。続いて、視点球の表面上にサンプリング視点群を設定する(ステップS63)。サンプリング視点群の設定方法は、図11に示すように、ある距離毎に平行する複数の平面と、平面群に直交しかつ所定距離毎に平行する複数の平面が視点球の表面上で交わる箇所としてもよい。また、図12に示すように、ある直交する2軸周りを、3次元形状の中心位置から角度が一定となるように配置してもよい。
【0022】
なお、3次元形状の中心位置に対し視点球を構成する2軸は任意でよい。例えば、視点球を構成する2軸をそれぞれsX軸,sY軸としたとき、x軸,y軸,z軸で構成されるオブジェクト座標系のx軸とsX軸を一致させ、またオブジェクト座標系のy軸とsY軸を一致させてもよい。また部分的な3次元形状データやテクスチャデータに対して、部分的にサンプリング視点群を設定してもよい。例えば、球状にある任意の点をsX軸を回転の軸として0°〜180°まで1°ずつ変化させ、その各々の角度にある点からsY軸まわりを1回転し1°ずつサンプリング視点を設定してもよい。サンプリング視点を設定する角度は1°でなくてもよいが、小さく設定した方がサンプリング数が増え、角度を大きく設定するとサンプリング数が減る。
【0023】
次に、サンプリング視点と3次元形状の中心位置を結ぶ線である視線を決定し(ステップS64)、決定した視線と3次元形状の交点のテクスチャデータを抽出する。この時、図13に示すように、視線と3次元形状の交点うち、サンプリング視点に近い方のテクスチャデータを抽出する。テクスチャデータとして、例えば画素のRGB値を抽出する。
【0024】
なお、テクスチャデータは交点のテクスチャデータのみではなく、交点に隣接する数画素のテクスチャデータや、交点のデプス情報をともに抽出するようにしてもよい。また、サンプリング視点の観測の角度や、各サンプリング視点の密度を関連付けて抽出してもよい。抽出方法は、例えばコンピュータグラフィクスで使われるピッキング技術を用いることで実現する。そして、視線の決定(ステップS64)と、視線と3次元形状の交点のテクスチャ情報の抽出処理(ステップS15)を、全サンプリング視点数分繰り返し実行する。
【0025】
次に、抽出したテクスチャデータ群の2次元展開画像を生成し出力する(ステップS66)。2次元展開画像の縦横のサイズは、例えば図12で示すサンプリング視点の設定において、サンプリング角度を一定としたとき、2次元展開画像の縦のピクセル数をH、横のピクセル数をWとおくと、HとWはそれぞれ(2)式によって算出できる。
【数2】

【0026】
なお、(2)式において、Δdx,Δdyはそれぞれ視点球を構成するsX軸、sY軸を回転の軸としたときのサンプリング角度を示す。抽出処理結果の2次元展開画像上の位置は、図14に示すように2次元展開画像左下を原点とし、sX軸を回転の軸としたとき0°を起点とし、サンプリング角度Δdx毎角度が大きくなるとともに2次元展開画像のy軸方向に順に、またsY軸を回転の軸としたとき0°を起点とし、サンプリング角度Δdy毎回転角度が大きくなるとともにx軸方向に順に、それぞれ交点のテクスチャデータの抽出処理結果を展開することで実現する。
【0027】
最後に、2次元展開画像の特徴量を抽出し(ステップS67)、得られた特徴量を識別可能な特徴点番号と関係付けて記憶部に保存する(ステップS68)。図15に、記憶部に2次元展開画像の特徴量抽出結果データとして保存した特徴量データを示す。これにより、記憶部には、入力した3次元形状データとテクスチャデータとから得た2次元展開画像の特徴量が記憶されることになる。
【0028】
しかし、図10に示す処理動作によって、被写体の3次元形状情報とテクスチャ情報から2次元展開画像を得る場合において、部分的にぼけが発生することがある。これは図16に示すように各仮想視点から被写体表面までの距離や被写体の形状によって、各視点から取得するテクスチャ情報が重複することによる。この問題を解決するためには2次元展開画像生成時に配置する仮想視点の間隔を調節する必要があるが、多くの被写体において各視線と物体表面が為す角度は一定では無いため、この視点間隔は一定値に設定することができない。そこで視点間隔を複数設定し、異なる視点間隔で取得した複数の2次元展開画像の特徴箇所を統合することでこのような問題を解決する方法について以下で説明する。
【0029】
<第1の実施形態>
図1は本実施形態の構成を示すブロック図である。画像マッチング装置はコンピュータ装置によって構成する。図1において、符号1は画像マッチング処理を行う画像マッチング部である。符号2は、2次元画像データを入力する画像入力部である。符号3は、画像マッチング処理に必要なデータを記憶する記憶部である。符号4はキーボード等から構成する入力部である。符号5は、表示装置等から構成する表示部である。
【0030】
符号11は、画像入力部2を介して入力した2次元展開画像をもとに画像を生成しクエリ画像群として保存する間引き画像生成部である。符号12は、間引き画像生成部で保存したクエリ画像群と記憶部3に予め用意してある検索対象データベース内画像の特徴箇所を抽出し、特徴箇所の局所記述子を算出する特徴表現部である。符号13は特徴表現部で保存した特徴箇所の記述子のうちクエリ画像群から抽出した特徴箇所の記述子を統合して統合結果特徴データとして記憶部3に保存する特徴統合部である。符号14はクエリ画像群の特徴データである統合結果特徴データと前記検索対象データベース内画像の特徴箇所間で局所記述子を比較し、投票の上画像マッチング結果を出力する照合部である。
【0031】
次に、図2を参照して、図1に示す間引き画像生成部11の動作を説明する。ここでは、図10に示す処理動作によって被写体の3次元形状情報とテクスチャ情報をもとに生成した1枚の2次元展開画像を入力し、1枚もしくは複数の2次元画像を検索対象データベースとして予め記憶部3に記憶しておくものとする。図2は、画像入力部2から2次元展開画像を入力し、この間引き間隔でクエリ画像を複数生成する動作を示すフローチャートである。間引き間隔がa(a≧0)の場合、縦(a+1)×横(a+1)の正方形毎に画像を分割し、この分割画素の中で同じ位置の1画素を選択し、(a+1)(a+1)枚の画像を生成する。入力した展開画像中の各画素(x,y)の、分類式(生成画像番号n(n:1≦n≦(a+1)(a+1)))および分類後の生成画像中での座標値(x,y)は、それぞれ(3)式、(4)式を用いて求めることができる。
【数3】

画像nにおけるiとjの値をi,jとする。
【数4】

【0032】
例えば、間引き間隔が1の場合、図3に示す通り画像を縦2×横2の正方形毎に区切り、分割された画像中で同じ位置(図3中の(1)/(2)/(3)/(4))の1画素ずつを選択していき、4枚の画像を生成する。上記(3)式、(4)式を適用すると(5)式を導くことができる。
【数5】

【0033】
間引き間隔を複数指定した場合は、前述した画像生成処理を繰り返す。その場合、画像番号は重複を避けるため通し番号を用いる。最後に、生成された全ての画像をクエリ画像群として記憶部3に保存する。
【0034】
なお、ここでは2次元展開画像が事前に生成されているものとし、この画像を入力し画素を間引いた画像を複数生成することで疑似的にテクスチャ情報を取得する視点間隔を変化させたクエリ画像を複数取得したが、図10に示す処理動作によって2次元展開画像を生成する際、同時に視点間隔を変えた複数の展開画像を出力してもよい。
【0035】
次に図4を参照して、図1に示す特徴表現部12が間引き画像生成部11によって記憶部3に保存したクエリ画像群と記憶部3に予め保存した検索対象データベース内画像から、特徴箇所を抽出しこの特徴箇所毎に局所記述子を算出し保存する動作を説明する。図4は、間引き画像生成部11により生成し記憶部3に保存したクエリ画像群と記憶部3に予め保存した検索対象データベース内画像から、特徴箇所を抽出しこの特徴箇所毎に局所記述子を算出し保存する動作を示すフローチャートである。
【0036】
まず、ユーザが入力部4を操作して、2次元画像の入力を指示すると、特徴表現部12は画像入力部2からクエリ画像群と検索対象データベース内画像を2次元画像データとして入力する(ステップS11)。この2次元画像データはユーザ入力の2次元展開画像をもとに間引き画像生成部で生成したクエリ画像群と、記憶部3に予め保存した検索対象データベース内の画像とする。なお検索対象データベース内画像の画像サイズが異なる場合は、画像サイズを正規化して入力する。この正規化は画像サイズによって特徴箇所検出時に検出される特徴箇所数を公平に保つ意味を持ち、最終的に特徴箇所の対応付けを行う際、この対応付けの確からしさを向上させる効果がある。
【0037】
そして、特徴表現部12は入力した2次元画像データから特徴箇所を抽出し(ステップS12)、抽出した全ての特徴箇所で局所記述子を算出する(ステップS13)。なお特徴抽出処理は、例えば非特許文献1に記載の方法であるHarris-Affine region、Hessian-Affine region、Difference of Gaussians(DOG)やMaximally Stable Extremal Regions(MSER)等の方法を用いて実行する。また、局所記述子は例えば非特許文献1に記載の方法であるSIFT、GLOH、PCA−SIFT、SURFやASIFT等の方法を用いて実行する。ここでは以降SURFを用いるものとして説明する。SURFでは、キーポイントとスケールの検出のために、近似的にHessianを求めている。Hessian値はエッジの強度を表し、Hessian値が大きいことはすなわちエッジが強いことを表す。画像マッチング精度劣化の原因として示した画像上のぼけは、Hessian値を指標とすることで、発生が少ない箇所の特徴量を選択利用することが可能となる。最後に、特徴表現部12は、2次元画像データの画像番号もしくは画像ファイル名と、各々の画像から得られた特徴箇所の位置と局所記述子とを関連付けて特徴データとして記憶部3に保存する(ステップS14)。
【0038】
次に、図5を参照して、図1に示す特徴統合部13が、特徴表現部12によりクエリ画像群から算出して保存した特徴箇所を統合する動作を説明する。図5は、複数のクエリ画像から特徴表現部12において算出し保存した特徴箇所を統合する動作を示すフローチャートである。まず、特徴統合部13は、クエリ画像群から取得した特徴箇所のみ特徴データを読み出す(ステップS21)。続いて、特徴統合部13は、保存対象の選定を行う(ステップS22)。保存対象の選定では、Hessian値の大きい順に特徴データをソートし、上位からユーザが設定した特徴データ数分を統合結果特徴データとして保存する。保存対象の選定をすることによって照合に用いる特徴数を制御して計算量を減らすことができるが、保存対象の選定を実施せずに全ての特徴データを保存してもよい。また保存対象の選定時に特徴データ数を設定するのではなく、Hessian値の大きさで閾値を設定しこの閾値より大きいもののみを保存対象とするのでもよい。最後に、特徴統合部13は、保存対象に選定された特徴データについて、特徴表現部12によって保存した全てのデータ(2次元画像データの画像番号と、各々の画像から得られた特徴箇所の位置と局所記述子とを関連付けた特徴データ)を統合結果特徴データとして記憶部3に保存する(ステップS23)。
【0039】
次に、図6を参照して、図1に示す照合部14が、クエリ画像群の特徴データである統合結果特徴データと検索対象データベース内画像の特徴箇所間で局所記述子を比較し、投票の上画像マッチング結果を出力する動作を説明する。図6は、照合部14が、クエリ画像群の特徴データである統合結果特徴データと検索対象データベース内画像の特徴箇所間で局所記述子を比較し、投票の上画像マッチング結果を出力する動作を示すフローチャートである。
【0040】
まず、照合部14は、記憶部3からクエリ群の特徴データを統合した統合結果特徴データと検索対象データベース内画像の特徴データを読み出す(ステップS31)。続いて、照合部14は、読み出した統合結果特徴データと検索対象データベース内画像の特徴データとを照合する。照合は、読み出した特徴データそれぞれの特徴量1〜特徴量kまでのk次元ベクトルのベクトル間距離を算出し(ステップS32)、検索対象データベース内画像の特徴データの中で統合結果特徴データとの距離が予め定めた閾値より小さくなる組を求め、この該当する画像に対して投票を行う(ステップS33)。ここで投票対象は事前に設定した近傍数K(K≧1)分行う。また、投票は、求めた距離が事前に設定した一定の閾値以下のものに対して行ってもよいし、近傍間での距離値が一定以上の差がつくまで投票を繰り返してもよい。
【0041】
次に、照合部14は、統合結果特徴データの全ての特徴箇所において照合を行った結果から、投票数が最も多いものを最短距離の対象の画像であると決定し、画像IDを表示部6に出力する(ステップS34)。なお、ここでは特徴箇所間の対応数から投票結果を求めたが、特徴箇所間の類似度に重みづけをするため画像に対する投票時に特徴箇所間の距離が小さくなる組に対し距離値に応じた得点を投票してもよい。またベクトル間距離以外の指標を用いて類似度を算出し、その類似度に基づく得点を投票してもよい。このとき出力する画像マッチング結果は、最多得票数の画像だけでなく、投票数のランキングを出力してもよい。
【0042】
以上説明したように、クエリ画像やクエリ画像内のオブジェクトと、検索対象データベース内画像とで画像マッチングを実施する際、クエリデータと検索対象データベース内画像の照合に用いる特徴量のデータとして、3次元被写体を展開した2次元展開画像から複数のクエリ画像を作成し、そこから抽出した特徴箇所を統合することにより、2次元展開画像上のぼけを原因とした特徴箇所の減少や特徴量の変化による対応付けの悪化を防ぐことができる。これにより画像マッチング精度向上を実現することが可能となる。
【0043】
<第2の実施形態>
第1の実施形態を適用したとき、特徴統合部13においてHessian値等の特徴量に基づいた閾値により保存対象を選定すると、間引き間隔を変えた複数のクエリ画像において同じ箇所を示す画素から複数の特徴データが出力されることがあり、出力される統合結果特徴データの座標値の片寄りを招く可能性がある。正解として最終的に選ばれるべき検索対象データベース内画像が撮影された被写体の3次元的な部位は事前に分からないため、照合に利用するクエリ画像群の特徴箇所の座標値が片寄ることによって検索対象データベース内画像に写っている部位の2次元展開画像上の特徴データが失われてしまい、最終的に照合を実施する際に精度の劣化を招くことがある。また、もし保存対象の選定を行わなかった場合は、統合結果特徴データ数が大きくなるため、照合処理の計算量が大きくなるという問題がある。これらの問題を解決するため第2の実施形態では、座標値を考慮した特徴データの選定方法を適用する。
【0044】
第2の実施形態における画像マッチング装置の構成は、図1に示す構成と同じであるので、ここでは詳細な説明を省略する。第2の実施形態における画像マッチング装置が、第1の実施形態における画像マッチング装置と異なる点は、特徴統合部13の処理動作であるので、図7を参照して、第2の実施形態における特徴統合部13の処理動作を説明する。図7は、特徴統合部13が、複数のクエリ画像から特徴表現部12で算出し保存した特徴箇所を統合する動作を示すフローチャートである。
【0045】
まず、特徴統合部13は、特徴表現部12により保存した特徴データの中から、クエリ画像群の特徴データを読み出す(ステップS41)。続いて、特徴統合部13は、クエリ画像群は画像サイズが異なる画像群なので、元の2次元展開画像のサイズ(もしくは間引き間隔a(a≧0)が一番小さい画像サイズ)に合わせて元画像上の座標変換を行い、座標値を復元する(ステップS42)。この時、間引き画像生成部11により保存した座標値変換用データ(画像番号nとその間引き間隔aおよびi,j)を記憶部3より読み出し、(6)式を用いて変換後の座標値を算出する。なお、変換前の画像番号nにおける座標を(x,y)、変換後の座標を(x,y)とする。
【数6】

【0046】
次に、特徴統合部13は、調整済の前記特徴データを座標値でソートする(ステップS43)。そして、ソート順にi番目の特徴である特徴(i)とj番目の特徴である特徴(j)の座標(それぞれ座標(i)=(x,y)と座標(j))が一致するか否か判定する(ステップS45)。このときi=0よりスタートし、jはi+1以降を示す。なお座標の一致判定を行う際は(7)式を用い、座標間の距離が事前に設定した閾値R(0≦R)より小さければ一致しているとみなす。このときRが大きければ一致する特徴が多くなり、最終的に出力される統合結果特徴データ数は少なくなる。
【数7】

【0047】
次に、特徴統合部13は、一致判定の結果、特徴(i)と特徴(j)が(7)式を満たした場合、最大特徴である特徴(Max)と特徴比較を行い(ステップS46)、特徴(Max)更新処理を実施する(ステップS47)。なお特徴(Max)の初期値は特徴(i)である(ステップS44)。比較する特徴要素Dは特徴箇所のHessian値を用いてもよい。例えば特徴(i)と特徴(j)のうちHessian値の大きい方を特徴(l)として、特徴(l)のHessian値を特徴要素D(l)と特徴(Max)のHessian値D(Max)を比較し、判別式である(8)式を満たした場合、特徴(Max)を特徴(l)に上書き更新する。(8)式を満たさない場合特徴(Max)の更新は行わない。この特徴(Max)更新処理を、(7)式を満たさなくなるまでjの値を1ずつ加算して繰り返し実施する(ただしj<全特徴箇所)。
【数8】

【0048】
(7)式を満たさなくなった時点での特徴(Max)を、一致する座標値を持つ特徴の中で最大の特徴を有する特徴として、統合結果特徴データとして保存する(ステップS48)。そして引き続きjの次の特徴から処理を実施するため、i=j+1にiの値を更新して繰り返し処理を行う(ただしi<(全特徴箇所−1))。
【0049】
なお、図7を参照して説明した特徴統合部13を除いた間引きが像生成部11、特徴表現部12及び照合部14の処理動作は、第1の実施形態と同様であるので、ここでは詳細な説明を省略する。
【0050】
以上説明したように第2の実施形態では、第1の実施形態と同様に2次元展開画像上のぼけを原因とした特徴箇所の減少や特徴量の変化による対応付けの悪化を防ぐことができる。その上で、第1の実施形態の問題を解消することが可能である。これにより処理速度を落とさずに画像マッチング精度向上を実現することが可能となる。
【0051】
<第3の実施形態>
第1の実施例と第2の実施例は前記特願記載の方法により得た被写体の2次元展開画像上のぼけの影響を緩和する方法を説明したが、本発明の特徴統合による方法は撮影画像に適用することもできる。例えばクエリ画像を撮影するカメラから最近傍の被写体と最遠の被写体とが為す距離が、カメラの被写界深度よりも大きいとき、得られる画像は一部にしかピントが合っていないためクエリ画像中にぼけが発生する。これはF値の明るいレンズを使用して高速シャッターを切る必要がある場合や、極めて小さく、かつ激しい凹凸のある被写体を撮影(接写)する場合に起こりやすい事象である。ぼけの発生箇所は特徴抽出が困難であり、この困難性が招く特徴点数の減少が特徴点対応に基づく画像マッチング手法の問題点とされている。そこで第3の実施形態では焦点距離を変えた複数のクエリ画像を取得し、複数クエリ画像間で特徴箇所を統合することにより、この問題を解決する方法について説明する。
【0052】
以下、図面を参照して、本発明の第3の実施形態による画像マッチング装置を説明する。図8は本実施形態の構成を示すブロック図である。図8に示す画像マッチング部1の構成は、図1に示す画像マッチング部1の間引き画像生成部11を省き、画像入力部2の出力を特徴表現部12に入力するようにした点である。図8において、符号1は画像マッチング処理を行う画像マッチング部である。符号2は、2次元画像データを入力する画像入力部である。符号3は、画像マッチング処理に必要なデータを記憶する記憶部である。符号4はキーボード等から構成する入力部である。符号5は、表示装置等から構成する表示部である。
【0053】
符号12は、画像入力部2を介して入力したクエリ画像と記憶部3に予め用意してある検索対象データベース内画像の特徴箇所を抽出し、特徴箇所の局所記述子を算出する特徴表現部である。符号13は、特徴表現部12で算出した特徴箇所の局所記述子を複数画像分まとめる特徴統合部である。符号14は特徴表現部12で算出し特徴統合部13で統合した各特徴箇所の局所記述子を、画像入力部2によって入力された画像と記憶部3に用意されている画像の特徴箇所間で比較し、投票の上画像マッチング結果を出力する照合部である。
【0054】
次に、図8に示す画像マッチング装置の処理動作を説明する。ここではクエリとして固定カメラから焦点を変えながら被写体を撮影した複数の2次元画像を複数入力し、1枚もしくは複数の2次元画像を検索対象データベースとして予め記憶部3に記憶しておくものとして説明する。
【0055】
次に、図8に示す特徴表現部12が画像入力部2から入力したクエリ画像と、記憶部3に予め保存した検索対象データベース内画像から、特徴箇所を抽出しこの特徴箇所毎に局所記述子を算出し保存する動作を説明する。図8に示す特徴表現部12の動作は、図4に示す動作と同様であるので、ここでは簡単に説明する。
【0056】
まず、ユーザが入力部4を操作して、2次元画像の入力を指示すると、特徴表現部12は画像入力部2から2次元画像データを入力する。この2次元画像データはユーザ入力のクエリ画像と記憶部に予め保存した検索対象データベース内の画像とする。なお検索対象データベース内画像の画像サイズが異なる場合は、画像サイズを正規化して入力する。この正規化は画像サイズによって特徴箇所検出時に検出される特徴箇所数を公平に保つ意味を持ち、最終的に特徴箇所の対応付けを行う際、この対応付けの確からしさを向上させる効果がある。そして、特徴表現部12は入力した画像から特徴箇所を抽出し、抽出した全ての特徴箇所で局所記述子を算出する。最後に2次元画像データの画像ファイル名と、各々の画像から得られた特徴箇所の位置と局所記述子とを関連付けて特徴データとして記憶部3に保存する。
【0057】
次に、図9を参照して、図8に示す特徴統合部12が、特徴表現部12で複数のクエリ画像から算出し保存した特徴箇所を統合する動作を説明する。図9は複数のクエリ画像から特徴表現部12で算出し保存した特徴箇所を統合する動作を示すフローチャートである。まず、特徴統合部12は、特徴表現部12により保存した特徴データの中から、クエリ画像群の特徴データを読み出す(ステップS51)。続いて、特徴統合部12は、この特徴データを座標値でソートする(ステップS52)。そして、ソート順にi番目の特徴である特徴(i)とj番目の特徴である特徴(j)の座標(それぞれ座標(i)=(x,y)と座標(j))が一致するか否か判定する(ステップS54)。このときi=0よりスタートしjはi+1以降を示す。なお座標の一致判定を行う際は(7)式を用い、座標間の距離が事前に設定した閾値R(0≦R)より小さければ一致しているとみなす。このときRが大きければ一致する特徴が多くなり、最終的に出力される統合結果特徴データ数は少なくなる。
【0058】
次に、特徴統合部13は、一致判定結果、特徴(i)と特徴(j)が(7)式を満たした場合、最大特徴である特徴(Max)と特徴比較を行い(ステップS55)、特徴(Max)更新処理を実施する(ステップS56)。なお特徴(Max)の初期値は特徴(i)である(ステップS53)。比較する特徴要素Dは特徴箇所のHessian値を用いてもよい。例えば特徴(i)と特徴(j)のうちHessian値の大きい方を特徴(l)として、特徴(l)のHessian値を特徴要素D(l)と特徴(Max)のHessian値D(Max)を比較し、判別式である(8)式を満たした場合、特徴(Max)を特徴(l)に上書き更新する。一方、(8)式を満たさない場合特徴(Max)の更新は行わない。
【0059】
この特徴(Max)更新処理を、(7)式を満たさなくなるまでjの値を1ずつ加算して繰り返し実施する(ただしj<全特徴箇所)。そして、(7)式を満たさなくなった時点での特徴(Max)を、一致する座標値を持つ特徴の中で最大の特徴を有する特徴として、統合結果特徴データとして保存する(ステップS57)。そして、引き続きjの次の特徴から処理を実施するため、i=j+1にiの値を更新して繰り返し処理を行う(ただしi<(全特徴箇所−1))。
【0060】
次に、図8に示す照合部14が、特徴表現部12で算出し特徴統合部12で保存した各特徴箇所の局所記述子を、画像入力部2によって入力された画像と記憶部3に用意されている画像の特徴箇所間で比較し、投票の上画像マッチング結果を出力する動作を説明する。図8に示す照合部14の動作は、図6に示す動作と同様であるので、ここでは簡単に説明する。
【0061】
まず、照合部14は記憶部3からクエリ群の特徴データを統合した統合結果特徴データと検索対象データベース内画像の特徴データを読み出す。続いて、照合部14は、読み出した統合結果特徴データと検索対象データベース内画像の特徴データとを照合する。照合は、読み出した特徴データそれぞれの特徴量1〜特徴量kまでのk次元ベクトルのベクトル間距離を算出し、検索対象データベース内画像の特徴データの中で統合結果特徴データとの距離が予め定めた閾値より小さくなる組を求め、この該当する画像に対して投票を行う。ここで投票対象は事前に設定した近傍数K(K≧1)分行う。この距離が事前に設定した一定の閾値以下のものに対して行ってもよいし、近傍間での距離値が一定以上の差がつくまで投票を繰り返してもよい。
【0062】
次に、照合部14は、統合結果特徴データの全ての特徴箇所において照合を行った結果から、投票数が最も多いものを最短距離の対象の被写体であると決定し、画像IDを表示部6に出力する。なお、ここでは特徴箇所間の対応数から投票結果を求めたが、特徴箇所間の類似度に重みづけをするため画像に対する投票時に特徴箇所間の距離が小さくなる組に対し距離値に応じた得点を投票してもよい。またベクトル間距離以外の指標を用いて類似度を算出し、その類似度に基づく得点を投票してもよい。
【0063】
なお、前述した説明では複数画像から特徴を抽出しこの特徴を統合したが、複数画像から予め多焦点合成を行い疑似的に被写界深度の深い画像を取得することで、特徴箇所の減少を防ぐことも可能である。ただし多焦点合成を行う際に画像のコントラスト情報等を元に各画像から焦点の合っている部分を抽出しこの抽出箇所を合成しており、特徴箇所対応による照合を行う場合処理が冗長となる。前述した構成では画像合成およびその後再度特徴抽出を行う手間がないため、予め多焦点合成を実施するよりも高速な処理が実現可能である。
【0064】
また、前述した特徴統合部では座標値毎に特徴を選定したが第1の実施形態で示したように、クエリ画像群の特徴データ全てを統合結果特徴データとして用いてもよい。ただしこの場合、計算量がかかるため、前述した構成では座標値毎に特徴を選定している。
【0065】
なお、前述した全ての実施形態においてクエリ画像側で特徴箇所の統合を行ったが、検索対象データベース内画像側の処理において特徴箇所の統合を実施するようにしてもよい。
【0066】
以上説明したように、クエリ画像やクエリ画像内のオブジェクトと、検索対象データベース内画像とで画像マッチングを実施する際、クエリデータと検索対象データベース内画像の照合に用いる特徴量のデータとして、同じ被写体を撮影した複数のクエリ画像で特徴箇所を統合することにより、抽出する特徴箇所の減少による対応付けの悪化を防ぐことができる。これにより画像マッチング精度向上を実現することが可能となる。
【0067】
なお、図1および図8における処理部の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより画像マッチング処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータシステム」は、ホームページ提供環境(あるいは表示環境)を備えたWWWシステムも含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(RAM)のように、一定時間プログラムを保持しているものも含むものとする。
【0068】
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであってもよい。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。
【0069】
以上、図面を参照して本発明の実施の形態を説明してきたが、上記実施の形態は本発明の例示に過ぎず、本発明が上記実施の形態に限定されるものではないことは明らかである。したがって、本発明の精神及び範囲を逸脱しない範囲で構成要素の追加、省略、置換、その他の変更を行っても良い。
【産業上の利用可能性】
【0070】
特徴対応に基づく画像マッチング技術を用いて画像マッチングを行うことが不可欠な用途に適用できる。
【符号の説明】
【0071】
1・・・画像マッチング部、2・・・画像入力部、3・・・記憶部、4・・・入力部、5・・・表示部、11・・・間引き画像生成部、12・・・特徴表現部、13・・・特徴統合部、14・・・照合部

【特許請求の範囲】
【請求項1】
入力したクエリ画像群と、予め保存されている検索対象画像とのそれぞれから特徴箇所を抽出し、抽出した前記特徴箇所毎に局所記述子を算出して特徴データとして出力する特徴表現手段と、
前記クエリ画像群の前記特徴データを統合し、統合結果特徴データとして出力する特徴統合手段と、
前記統合結果特徴データと、前記検索対象画像の前記特徴データとの間で各々の特徴箇所の局所記述子のベクトル間距離値に基づくスコア値を算出し、クエリ画像の特徴箇所に対応する検索対象画像のスコア値に基づきマッチング画像を出力する照合手段と
を備えたことを特徴とする画像マッチング装置。
【請求項2】
入力画像を元に、画素を間引いて生成した複数の画像をクエリ画像群として出力する間引き画像生成手段と、
クエリ画像群と、予め保存されている検索対象画像とのそれぞれから特徴箇所を抽出し、抽出した前記特徴箇所毎に局所記述子を算出して特徴データとして出力する特徴表現手段と、
前記クエリ画像群の前記特徴データを統合し、統合結果特徴データとして出力する特徴統合手段と、
前記統合結果特徴データと、前記検索対象画像の前記特徴データとの間で各々の特徴箇所の局所記述子のベクトル間距離値に基づくスコア値を算出し、クエリ画像の特徴箇所に対応する検索対象画像のスコア値に基づきマッチング画像を出力する照合手段と
を備えたことを特徴とする画像マッチング装置。
【請求項3】
前記特徴統合手段は、前記特徴データの全てもしくは特徴要素の値に応じてその一部を選択し、選ばれた特徴データを統合結果特徴データとすることを特徴とする請求項1または2に記載の画像マッチング装置。
【請求項4】
前記特徴統合手段は、前記クエリ画像群の特徴データのうち、Hessian値が所定の閾値より大きい特徴データを選定し、選ばれた全ての特徴データを前記統合結果特徴データとすることを特徴とする請求項1から3のいずれかに記載の画像マッチング装置。
【請求項5】
前記特徴統合手段は、前記クエリ画像群の特徴データのうち、Hessian値が大きい順に所定数分の特徴データを選定し、選ばれた全ての特徴データを前記統合結果特徴データとすることを特徴とする請求項1から3のいずれかに記載の画像マッチング装置。
【請求項6】
前記特徴統合手段は、前記クエリ画像群の特徴データのうち、各特徴データの特徴箇所の座標値を元画像上の座標値に変換し、座標値が一致する特徴データ内で特徴要素を比較することで代表特徴データを選定し、全ての座標における選定結果を前記統合結果特徴データとすることを特徴とする請求項1に記載の画像マッチング装置。
【請求項7】
前記特徴統合手段は、前記クエリ画像群の特徴データのうち、各特徴データの特徴箇所の座標値を元画像上の座標値に変換し、座標値が一致する特徴データ内でHessian値を比較することで、Hessian値が大きい特徴データを算出し、全ての座標における算出結果を前記統合結果特徴データすることを特徴とする請求項1に記載の画像マッチング装置。
【請求項8】
コンピュータを請求項1から7のいずれかに記載の画像マッチング装置として機能させるための画像マッチングプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate


【公開番号】特開2013−101423(P2013−101423A)
【公開日】平成25年5月23日(2013.5.23)
【国際特許分類】
【出願番号】特願2011−243603(P2011−243603)
【出願日】平成23年11月7日(2011.11.7)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】