画像類似度算出装置、画像類似度算出方法、画像類似度算出プログラム及び記録媒体
【課題】反転関係にある画像同士が類似していると判断することができる画像類似度算出装置、画像類似度算出方法、画像類似度算出プログラム及び記録媒体を提供する。
【解決手段】画像類似度算出装置1は、入力画像30と参照画像31との類似度を算出する装置である。この装置は、局所特徴量抽出部12及び類似度算出部14を備える。局所特徴量抽出部12は、入力画像30及び参照画像31の特徴点を取得し、入力画像30及び参照画像31の特徴点ごとに回転及び反転に対して不変となる特徴量を記述する。類似度算出部14は、入力画像30及び参照画像31の特徴点ごとの特徴量に基づいて、入力画像30と参照画像31との類似度を算出する。
【解決手段】画像類似度算出装置1は、入力画像30と参照画像31との類似度を算出する装置である。この装置は、局所特徴量抽出部12及び類似度算出部14を備える。局所特徴量抽出部12は、入力画像30及び参照画像31の特徴点を取得し、入力画像30及び参照画像31の特徴点ごとに回転及び反転に対して不変となる特徴量を記述する。類似度算出部14は、入力画像30及び参照画像31の特徴点ごとの特徴量に基づいて、入力画像30と参照画像31との類似度を算出する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像類似度算出装置、画像類似度算出方法、画像類似度算出プログラム及び記録媒体に関するものである。
【背景技術】
【0002】
従来、画像類似度算出装置として、入力画像と参照画像との類似度を、局所特徴量を用いて算出するものが知られている(例えば、特許文献1参照。)。特許文献1記載の装置は、画像から適宜選択された局所的な特徴点それぞれについて、回転、拡大及び縮小に不変となる局所的な形状の特徴量(局所特徴量)を算出する。そして、入力画像及び参照画像の局所特徴量を用いて類似度を算出する。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2011−2966号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、特許文献1記載の画像類似度算出装置にあっては、特徴点周辺の部分画像と当該部分画像とを比較する際に、左右又は上下に反転した画像は全く別のものであると判定する。当技術分野では、反転関係にある画像同士が類似していると判断することができる画像類似度算出装置、画像類似度算出方法、画像類似度算出プログラム及び記録媒体が望まれている。
【課題を解決するための手段】
【0005】
すなわち本発明の一側面に係る画像類似度算出装置は、入力画像と参照画像との類似度を算出する装置である。この装置は、特徴点取得部、特徴量記述部及び類似度算出部を備える。特徴点取得部は、入力画像及び参照画像の特徴点を取得する。特徴点記述部は、入力画像及び参照画像の特徴点ごとに回転及び反転に対して不変となる特徴量を記述する。類似度算出部は、入力画像及び参照画像の特徴点ごとの特徴量に基づいて、入力画像と参照画像との類似度を算出する。
【0006】
この画像類似度算出装置では、回転のみならず反転に対して不変となる特徴量を画像から抽出し、該特徴量を用いて画像の類似度を算出する。このため、反転関係にある画像同士が類似していると判断することができる。
【0007】
一実施形態においては、特徴量記述部は、特徴点を含む所定領域内のエッジ強度に基づいてエッジ方向を複数算出し、算出された複数のエッジ方向を組み合わせた向きを基準として当該特徴点の特徴量を記述してもよい。このように構成することで、少なくとも2方向の特徴ベクトルを基準として特徴量を記述することができるため、回転のみならず反転に対して不変となる特徴量を記述することができる。
【0008】
一実施形態においては、特徴量記述部は、最も度数の多いエッジ方向を主エッジ方向として算出し、主エッジ方向から右回り180度のエッジ強度の総和と左回り180度のエッジ強度の総和とを比較することによって主エッジ方向に直交する副エッジ方向を算出し、主エッジ方向及び副エッジ方法を組み合わせた向きを基準として特徴点の特徴量を記述してもよい。このように構成することで、主エッジ方向及び副エッジ方向を用いて、回転のみならず反転に対して不変となる特徴量を容易に記述することができる。
【0009】
一実施形態においては、類似度算出部は、予め作成された複数の代表特徴量と入力画像の特徴点ごとの特徴量とを比較し、代表特徴量に最近傍となる特徴量の出現頻度を代表特徴量ごとに算出してもよい。そして、類似度算出部は、複数の代表特徴量と参照画像の特徴点ごとの特徴量とを比較し、代表特徴量に最近傍となる特徴量の出現頻度を代表特徴量ごとに算出してもよい。さらに、類似度算出部は、入力画像における出現頻度の分布、及び参照画像における出現頻度の分布に基づいて、類似度を算出してもよい。このように構成することで、予め定めた複数のカテゴリの代表特徴量に対してどの程度類似するのかを入力画像及び参照画像それぞれで出現頻度の分布として算出することができる。このため、算出された出現頻度の分布を比較等することによって、画像の類似度を適切に算出することができる。
【0010】
一実施形態においては、画像類似度算出装置がサイズ調整部を備えてもよい。サイズ調整部は、入力画像及び参照画像の中央領域又は着目領域の大きさが一定値となるように入力画像及び参照画像の大きさを調整する。この場合、特徴点取得部は、サイズ調整部により大きさが調整された後の入力画像及び参照画像から特徴点を取得してもよい。このように構成することで、特徴量を抽出する領域を一定レベル以上に確保することができる。
【0011】
また、本発明の他の側面に係る画像類似度算出方法は、画像と参照画像との類似度を算出する方法である。この方法は、特徴点取得ステップ、特徴量記述ステップ及び類似度算出ステップを備える。特徴点取得ステップでは、入力画像及び参照画像の特徴点を取得する。特徴量記述ステップでは、入力画像及び参照画像の特徴点ごとに回転及び反転に対して不変となる特徴量を記述する。類似度算出ステップでは、入力画像及び参照画像の特徴点ごとの特徴量に基づいて、入力画像と参照画像との類似度を算出する。
【0012】
また、本発明の他の側面に係る画像類似度算出プログラムは、入力画像と参照画像との類似度を算出するようにコンピュータを動作させるプログラムである。このプログラムは、コンピュータを、特徴点取得部、特徴量記述部及び類似度算出部として動作させる。特徴点取得部は、入力画像及び参照画像の特徴点を取得する。特徴点記述部は、入力画像及び参照画像の特徴点ごとに回転及び反転に対して不変となる特徴量を記述する。類似度算出部は、入力画像及び参照画像の特徴点ごとの特徴量に基づいて、入力画像と参照画像との類似度を算出する。
【0013】
また、本発明の他の側面に係る記録媒体は、入力画像と参照画像との類似度を算出するようにコンピュータを動作させる画像類似度算出プログラムが記録されたコンピュータ読み取り可能な記録媒体である。このプログラムは、コンピュータを、特徴点取得部、特徴量記述部及び類似度算出部として動作させる。特徴点取得部は、入力画像及び参照画像の特徴点を取得する。特徴点記述部は、入力画像及び参照画像の特徴点ごとに回転及び反転に対して不変となる特徴量を記述する。類似度算出部は、入力画像及び参照画像の特徴点ごとの特徴量に基づいて、入力画像と参照画像との類似度を算出する。
【0014】
上述した画像類似度算出方法、画像類似度算出プログラム及び画像類似度算出ブログラムが記録された記録媒体によれば、上述した画像類似度算出装置と同様の効果を奏する。
【発明の効果】
【0015】
以上説明したように、本発明の種々の側面及び実施形態によれば、反転関係にある画像同士が類似していると判断することができる。
【図面の簡単な説明】
【0016】
【図1】実施形態に係る画像類似度算出装置を搭載した携帯端末の機能ブロック図である。
【図2】図1中の画像類似度算出装置が搭載される携帯端末のハードウェア構成図である。
【図3】図1中の画像類似度算出装置のヒストグラム作成動作を示すフローチャートである。
【図4】画像のサイズ調整を説明する概要図である。
【図5】特徴点及びスケールを説明する概要図である。
【図6】局所特徴量を説明する概要図である。
【図7】反転関係を有する画像における局所特徴量を説明する概要図である。
【図8】スケールの他の例を説明する概要図である。
【図9】(A)は、形状ヒストグラムの一例である。(B)は、色ヒストグラムの一例である。
【図10】図1中の画像類似度算出装置の類似度算出動作を示すフローチャートである。
【図11】画像類似度算出装置の変形例の機能ブロック図である。
【発明を実施するための形態】
【0017】
以下、添付図面を参照して本発明の実施形態について説明する。なお、図面の説明において同一の要素には同一の符号を付し、重複する説明を省略する。また、図面の寸法比率は、説明のものと必ずしも一致していない。
【0018】
本実施形態に係る画像類似度算出装置は、入力画像と参照画像との類似度を算出する装置である。この装置は、例えば、携帯電話、デジタルカメラ、PDA(Personal Digital Assistant)又は通常のコンピュータシステム等に搭載される。なお、以下では、説明理解の容易性を考慮し、本発明に係る画像類似度算出装置の一例として、携帯端末に搭載される画像類似度算出装置を説明する。
【0019】
図1は、本実施形態に係る画像類似度算出装置1を備える携帯端末2の機能ブロック図である。図1に示す携帯端末2は、例えばユーザにより携帯される移動端末であり、図2に示すハードウェア構成を有する。図2は、携帯端末2のハードウェア構成図である。図2に示すように、携帯端末2は、物理的には、CPU(Central Processing Unit)100、ROM(Read Only Memory)101及びRAM(Random Access Memory)102等の主記憶装置、カメラ又はキーボード等の入力デバイス103、ディスプレイ等の出力デバイス104、ハードディスク等の補助記憶装置105などを含む通常のコンピュータシステムとして構成される。後述する携帯端末2及び画像類似度算出装置1の各機能は、CPU100、ROM101、RAM102等のハードウェア上に所定のコンピュータソフトウェアを読み込ませることにより、CPU100の制御の元で入力デバイス103及び出力デバイス104を動作させるとともに、主記憶装置や補助記憶装置105におけるデータの読み出し及び書き込みを行うことで実現される。なお、上記の説明は携帯端末2のハードウェア構成として説明したが、画像類似度算出装置1がCPU100、ROM101及びRAM102等の主記憶装置、入力デバイス103、出力デバイス104、補助記憶装置105などを含む通常のコンピュータシステムとして構成されてもよい。また、携帯端末2は、通信モジュール等を備えてもよい。
【0020】
図1に示すように、携帯端末2は、画像類似度算出装置1及び表示部32を備えている。画像類似度算出装置1は、画像入力部10、サイズ調整部11、局所特徴量抽出部(特徴点取得部、特徴量記述部)12、色特徴量抽出部13及び類似度算出部14を備えている。
【0021】
画像入力部10は、比較する2つの画像データを入力する機能を有している。画像入力部10は、入力画像30及び参照画像31を入力する。画像入力部10は、例えば、携帯端末2に搭載されたカメラにより撮像された入力画像30を入力してもよいし、通信を介して入力画像30を入力してもよい。また、既に携帯端末2の主記憶装置又は補助記憶装置105に記録された入力画像30を入力してもよい。同様に、画像入力部10は、例えば、携帯端末2に搭載されたカメラにより撮像された参照画像31を入力してもよいし、通信を介して参照画像31を入力してもよい。また、既に携帯端末2の主記憶装置又は補助記憶装置105に記録された参照画像31を入力してもよい。
【0022】
サイズ調整部11は、画像の大きさを調整する機能を有している。例えば、サイズ調整部11は、画像の中央を含む中央領域の面積の大きさが一定値となるように、アスペクト比を維持しながら画像の大きさを調整(拡大又は縮小)する。なお、サイズ調整部11は、着目しているオブジェクトの領域(着目領域)の面積の大きさが一定値となるように画像の大きさを調整してもよい。着目領域は、例えばユーザにより指定された領域、又は、物体検出技術等により自動的に抽出された領域が用いられる。サイズ調整部11は、入力画像30及び参照画像31の画像の大きさをそれぞれ調整する。
【0023】
局所特徴量抽出部12は、画像の局所的な特徴量を抽出する機能を有している。ここで局所的特徴量とは、描画された物体の形状に関する特徴であり、本実施形態では回転及び反転に対して不変となるように記述される。まず、局所特徴量抽出部12は、サイズ調整部11により大きさが調整された画像の特徴点を取得する。特徴点の設定方法は特に限定されない。例えば、画像上にグリッド状に配置された点であってもよい。また、ランダムにサンプリングした点であってもよい。また、コーナー検出法によって取得された特徴点であってもよい。
【0024】
そして、局所特徴量抽出部12は、設定された特徴点の座標及び当該特徴点を含む所定領域内の画素の輝度値に基づいて、特徴点ごとに特徴量を算出する。所定領域とは、例えば、当該特徴点を中心とする略円状の固定領域である。局所特徴量抽出部12は、所定領域内の画素の輝度値に基づいて、エッジ情報を取得する。局所特徴量抽出部12は、所定領域内のエッジ強度に基づいてエッジ方向を複数算出し、算出された複数のエッジ方向を組み合わせたものを当該特徴点の特徴量として記述する。具体的には、局所特徴量抽出部12は、最も度数の多いエッジ方向を主エッジ方向として算出するとともに、主エッジ方向から右回り180度のエッジ強度の総和と左回り180度のエッジ強度の総和とを比較することによって主エッジ方向に直交する副エッジ方向を算出する。そして、局所特徴量抽出部12は、主エッジ方向及び副エッジ方法を組み合わせた方向(向き)を基準として特徴量を記述する。
【0025】
色特徴量抽出部13は、画像の色に関する特徴量を抽出する機能を有している。例えば、色特徴量抽出部13は、画像全体の大域的な色の特徴を抽出する。例えば、色ヒストグラムとセグメンテーションを用いて領域の大きさと形状とを考慮した特徴ベクトルを算出する。
【0026】
類似度算出部14は、入力画像30と参照画像31とを比較した場合の類似度を算出する機能を有している。類似度算出部14は、例えば、形状ヒストグラム生成部141、色ヒストグラム生成部142及び演算部143を備えている。
【0027】
形状ヒストグラム生成部141は、特徴点ごとに取得された局所特徴量に基づいて、入力画像30及び参照画像31のベクトル量子化ヒストグラムを作成する。形状ヒストグラム生成部141は、例えば、BAG−of−Visual Wordsを用いてベクトル量子化ヒストグラムを作成する。従来の手法では、SIFT又はSURF等の局所特徴量を採用している。ここでは、上述した回転及び反転に対して不変となる局所特徴量を用いてベクトル量子化ヒストグラムを生成する。
【0028】
まず、複数の学習画像を用いて、局所特徴量を抽出し、局所特徴量空間における局所特徴量の分布に基づいてベクトル量子化を行う。ベクトル量子化においては、局所特徴量空間を予め定めたn個の領域に分割する。この空間分割には、k−means等の手法が用いられる。これにより、局所特徴量はその属する分割領域に応じて、n個のカテゴリ(Visual WordsのID)に分類される。
【0029】
形状ヒストグラム生成部141は、各カテゴリに分類される局所特徴量の出現頻度を算出する。ここで、各分割領域において確率密度分布の重心となるベクトルを代表特徴量とすると、どのカテゴリに分類されるか判定するために代表特徴量との距離を利用してもよい。この場合、形状ヒストグラム生成部141は、予め作成された複数の代表特徴量と入力画像30の特徴点ごとの局所特徴量とを比較する。そして、代表特徴量に最近傍となる局所特徴量の出現頻度を代表特徴量ごとに算出する。すなわち、入力画像30の局所特徴量に基づいて、横軸(等級)が代表特徴量(カテゴリ)、縦軸が局所特徴量の出現頻度となる形状ヒストグラムを作成する。この形状ヒストグラムそのものが入力画像30の形状特徴となる。すなわち、出現頻度の分布が形状特徴となる。
【0030】
同様に、形状ヒストグラム生成部141は、予め作成された複数の代表特徴量と参照画像31の特徴点ごとの局所特徴量とを比較する。そして、代表特徴量に最近傍となる局所特徴量の出現頻度を代表特徴量ごとに算出する。すなわち、参照画像31の局所特徴量に基づいて、横軸(等級)が代表特徴量(カテゴリ)、縦軸が局所特徴量の出現頻度となる形状ヒストグラムを作成する。この形状ヒストグラムそのものが参照画像31の形状特徴となる。
【0031】
色ヒストグラム生成部142は、色特徴量抽出部13により抽出された色特徴量を用いて色ヒストグラムを生成する。例えば、横軸(等級)がセグメンテーションされた領域の大きさ、形状又は色等により算出された特徴量、縦軸が特徴量の出現頻度となる色ヒストグラムを作成する。この色ヒストグラムそのものが入力画像30の色特徴となる。色ヒストグラム生成部142は、入力画像30及び参照画像31の色ヒストグラムをそれぞれ作成する。
【0032】
演算部143は、入力画像30及び参照画像31の形状ヒストグラム(出現頻度の分布)に基づいて、入力画像30と参照画像31との形状に関する類似度を算出する。演算部143は、さらに、入力画像30及び参照画像31の色ヒストグラムに基づいて、入力画像30と参照画像31との色に関する類似度を算出する。そして、演算部143は、形状に関する類似度及び色に関する類似度に基づいて、最終的な類似度を算出する。ヒストグラムを用いた類似度の算出には、例えばHistogram Intersectionが用いられる。なお、ヒストグラムの空間をPCAやLDAなどにより変換し、その変換後のベクトル間の距離に基づいて類似度を算出してもよい。
【0033】
表示部32は、演算部143により算出された類似度を表示する。表示部32として、例えばディスプレイが用いられる。
【0034】
次に、本実施形態に係る画像類似度算出装置1の動作を説明する。図3は、本実施形態に係る画像類似度算出装置1のヒストグラム作成動作を示すフローチャートである。図3に示す制御処理は、例えば携帯端末2に備わる処理開始ボタンがONされたタイミングで実行される。
【0035】
図3に示すように、画像入力部10が入力画像30及び参照画像31をそれぞれ入力する(S10)。S10の処理が終了すると、サイズ調整処理へ移行する(S12)。S12の処理では、サイズ調整部11が入力画像30及び参照画像31の大きさをそれぞれ調整する。サイズ調整の例を、図4を用いて説明する。図4は、入力画像30を例にした画像サイズ調整の説明図である。図4に示すように、サイズ調整部11は、画像の上下方向の調整パラメータh及び左右方向の調整パラメータwを設定する。そして、中央領域30aの面積(画素)が一定になるパラメータw及びhを算出する。これにより、サイズ調整部11は、アスペクト比を維持しながら画像の大きさを調整する。なお、図4では、入力画像30の大きさを調整する場合を説明したが、参照画像31の大きさについても同様に調整する。S12の処理が終了すると、局所特徴量抽出処理(S14(特徴点取得ステップ、特徴量記述ステップ))及び色特徴量抽出処理(S20)へ移行する。
【0036】
S14の処理では、局所特徴量抽出部12が、S12の処理で入力された入力画像30及び参照画像31から局所特徴量を抽出する。特徴点の取得の例を図5を用いて説明する。図5は、入力画像30を例にした特徴点の取得を説明する概要図である。図5に示すように、局所特徴量抽出部12は、グリッド状に配置された格子点Ts(s:整数)の座標を特徴点として取得する。なお、コーナー検出を利用して、各格子点に最近傍のコーナーを特徴点として取得してもよい。そして、局所特徴量抽出部12は、特徴点Tsを中心とする円領域Csを、特徴量を抽出するための領域に設定する。
【0037】
次に、局所特徴量抽出部12は、特徴点ごとに局所特徴量を取得する。局所特徴量の取得の例を、図6を用いて説明する。図6は、入力画像30を例にした局所特徴量の取得を説明する概要図である。図6に示すように、特徴点Tsの特徴量を取得する場合を説明する。まず、局所特徴量抽出部12は、特徴点Tsの座標位置及び領域Csを取得する。次に、局所特徴量抽出部12は、領域Cs内の輝度値に基づいてエッジ情報を取得する。そして、局所特徴量抽出部12は、領域Cs内のエッジ方向を24方向に積算し、最も大きなエッジ方向を主エッジ方向として決定する。次に、主エッジ方向を中心として、右回り180°の範囲の方向に向いているエッジ強度の総和と、主エッジ方向を中心として、左回り180°の範囲の方向に向いているエッジ強度の総和と、を比較して副エッジ方向を算出する。例えば、局所特徴量抽出部12は、エッジ強度の総和が大きい方向を副エッジ方向とする。その後、主エッジ方向と副エッジ方向とを基準として記述ブロックBt(t:整数)を設定する。これにより、フリップ不変(反転不変)の特徴量を記述できる。図7は、入力画像30と、入力画像30と反転関係を有する参照画像31の一例である。主エッジ方向と副エッジ方向とを基準として記述ブロックBtを設定するため、図7に示すように、入力画像30及び参照画像31の記述ブロックBtは、同一のオブジェクト位置に関するエッジ方向を記述することになる。その後、局所特徴量抽出部12は、記述ブロックBtごとに24方向のエッジ強度を算出して、各方向を等級とする方向ヒストグラムを作成する。なお、24方向のエッジ強度を方向に応じて総和をとり、8方向の方向ヒストグラムとしてもよい。また、図8に示すように、領域Csの半径を変更させて、それぞれ局所特徴量を記述するようにしてもよい。図8では、領域Csの半径を4段階に変更している。局所特徴量抽出部12は、全ての特徴点Tsについて局所特徴量を記述する。S14の処理が終了すると、分類処理へ移行する(S16)。
【0038】
S16の処理では、形状ヒストグラム生成部141が、S14の処理で記述された局所特徴量を分類する。形状ヒストグラム生成部141は、局所特徴量を、予め学習したVisual WordのIDを用いて符号化する。形状ヒストグラム生成部141は、局所特徴量と代表特徴ベクトルとを比較し、最近傍の代表特徴ベクトルとなるVisual WordのIDで符号化する。S16の処理が終了すると、形状ヒストグラム生成処理へ移行する(S18)。
【0039】
S18の処理では、形状ヒストグラム生成部141が、S16の処理で符号化された局所特徴量を用いて、形状ヒストグラムを生成する。形状ヒストグラム生成部141は、上述したIDごとに出現頻度をカウントすることによって形状ヒストグラムを生成する。図9の(A)は、n個のIDが存在している場合の形状ヒストグラムの一例である。S18の処理が終了すると、形状特徴に関する処理は終了となる。
【0040】
一方、S20の処理では、色特徴量抽出部13が、入力画像30及び参照画像31の色特徴量をそれぞれ抽出する(S20)。色特徴量抽出部13は、各色の連続する領域の大きさを算出する。そして、色ヒストグラム生成部142は、領域の大きさ及び色に基づいて、又は、領域の大きさ、色及び領域形状の複雑さに基づいて、等級を作成して色ヒストグラムを作成する(S22)。図9の(B)は、m個のカテゴリに分類された色ヒストグラムの一例である。これにより、同一の色でも異なる領域の大きさを有する画像を区別することができる。S22の処理が終了すると、色特徴に関する処理は終了となる。
【0041】
以上で図3に示す制御処理を終了する。図3に示す制御処理を実行することにより、入力画像30及び参照画像31それぞれについて、形状及び色に関するヒストグラムが作成される。なお、説明理解の容易性を考慮して、入力画像30及び参照画像31を纏めて処理する例を説明したが、別々に処理してもよい。また、S14〜S18の処理とS20〜S22の処理とを別々に処理してもよい。
【0042】
次に、本実施形態に係る画像類似度算出装置1の類似度算出動作を説明する。図10は、本実施形態に係る画像類似度算出装置1の類似度算出動作を示すフローチャートである。図10に示す制御処理は、例えば図3に示す制御処理の終了後に実行される。
【0043】
図10に示すように、演算部143が入力画像30のヒストグラムを入力する(S30)。そして、演算部143が参照画像31のヒストグラムを入力する(S32)。そして、演算部143は、類似度を算出する(S34:類似度算出ステップ)。演算部143は、入力画像30の形状ヒストグラム及び色ヒストグラムを、参照画像31の形状ヒストグラム及び色ヒストグラムとそれぞれ比較する。演算部143は、特徴量(等級)ごとにHistogram Intersectionを用いて評価する。例えば、入力画像30をx、入力画像30のi番目の等級をxi、参照画像31をy、参照画像31のi番目の等級をyiとすると、以下の式1を用いて類似度を算出する。
【数1】
ここで、形状ヒストグラムにより算出された類似度をSshape、色ヒストグラムにより算出された類似度をScolorとすると、総合的な類似度Sallを以下の式2で算出する。
【数2】
ここで、wshape及びwcolorは形状及び色の重みであり、適宜設定される。S34の処理が終了すると、図10に示す制御処理を終了する。
【0044】
以上、図10に示す制御処理を実行することにより、形状ヒストグラム及び色ヒストグラムを用いて類似度が算出される。なお、形状ヒストグラムのみを用いて類似度を算出し、総合的な類似度としてもよい。また、テクスチャ特徴など、異なる特徴をさらに加えて類似度を算出してもよい。
【0045】
次に、携帯端末2(コンピュータ)を画像類似度算出装置1として機能させるための画像類似度算出プログラムを説明する。
【0046】
画像類似度算出プログラムは、メインモジュール、入力モジュール及び演算処理モジュールを備えている。メインモジュールは、画像処理を統括的に制御する部分である。入力モジュールは、入力画像30及び参照画像31を取得するように携帯端末2を動作させる。演算処理モジュールは、サイズ調整モジュール、局所特徴量抽出モジュール、色特徴量抽出モジュール及び類似度演算モジュールを備えている。メインモジュール、入力モジュール及び演算処理モジュールを実行させることにより実現される機能は、上述した画像類似度算出装置1の画像入力部10、サイズ調整部11、局所特徴量抽出部12、色特徴量抽出部13及び類似度算出部14の機能とそれぞれ同様である。
【0047】
画像類似度算出プログラムは、例えば、コンピュータ読み取り可能なROM等の記憶媒体または半導体メモリによって提供される。また、画像類似度算出プログラムは、データ信号としてネットワークを介して提供されてもよい。
【0048】
以上、本実施形態に係る画像類似度算出装置1によれば、回転のみならず反転に対して不変となる特徴量を画像から抽出し、該特徴量を用いて画像の類似度を算出する。このため、反転関係にある画像同士が類似していると判断することができる。従来の局所特徴量であるSIFT及びSURFにあっては、左右反転に対して異なる記述をするため、反転関係にある画像同士が類似していると判断することが容易にはできない。また、SIFT及びSURFによる特徴量を用いて、このような反転された部分画像を類似していると判断するためには、後段でヒューリスティックな処理や学習を利用する等の間接的な処理が必要となる。これに対して、本実施形態に係る画像類似度算出装置1によれば、特徴量そのものを反転に関して不変となるように記述できるため、オブジェクトの反転を容易に取り扱うことができる。さらに、従来必要であった後処理や学習等における反転不変に関するパラメータについては不要となる。このため、類似度を適切に算出するためのパラメータの解空間を狭めることができるので、処理の安定性を高めることができる。
【0049】
また、本実施形態に係る画像類似度算出装置1によれば、主エッジ方向及び副エッジ方向を用いて、回転のみならず反転に対して不変となる特徴量を容易に記述することができる。
【0050】
また、本実施形態に係る画像類似度算出装置1によれば、予め定めた複数のカテゴリの代表特徴量に対してどの程度類似するのかを入力画像30及び参照画像31それぞれで出現頻度の分布として算出することができる。このため、算出された出現頻度の分布を比較等することによって、画像の類似度を適切に算出することができる。
【0051】
また、本実施形態に係る画像類似度算出装置1によれば、サイズ調整部11により入力画像30及び参照画像31の大きさをそれぞれ調整するため、特徴量を抽出する領域を一定レベル以上に確保し、画像の解像度や画像中の着目物体の大きさに依存しない特徴量を記述することができる。
【0052】
なお、上述した実施形態は本発明に係る画像類似度算出装置、画像類似度算出方法、画像類似度算出プログラム及び記録媒体の一例を示すものであり、実施形態に係る装置、方法、プログラム及び記録媒体に限られるものではなく、変形し、又は他のものに適用したものであってもよい。
【0053】
例えば、上述した実施形態では、主エッジ方向及び副エッジ方向を組み合わせた方向を基準として特徴量を記述する例を説明したが、3以上のエッジ方向を組み合わせた方向を基準として特徴量を記述してもよい。
【0054】
また、上述した実施形態では、全ての特徴点を設定した後に局所特徴量を取得する例を説明したが、特徴点を設定する度に局所特徴量を取得してもよい。
【0055】
また、上述した実施形態では、入力画像30及び参照画像31が同時に入力される場合を説明したが、これに限られるものではない。すなわち、複数の参照画像31を予め用意し、参照画像31のヒストグラムについては事前に取得しておき、その後、入力画像30を検索画像として入力してもよい。このような構成を図11に示す。図11では、画像類似度算出装置1は、参照画像サーバ100と接続されている。参照画像サーバ100は、参照画像DB34及び参照画像ヒストグラムDB33を備えている。参照画像DB34は、例えば参照画像31を格納する。参照画像サーバ100は、例えば参照画像31をインターネット上に存在する画像とする。この場合、参照画像DB34は、参照画像31そのものを格納するのではなく、URL及びサムネイルを格納すればよい。参照画像ヒストグラムDB33は、参照画像31の形状ヒストグラム及び色ヒストグラムを格納する。
【0056】
画像類似度算出装置1は、入力画像30に関して形状ヒストグラム及び色ヒストグラムを作成する。そして、演算部143は、参照画像サーバ100から参照画像31の形状ヒストグラム及び色ヒストグラムを入力する。そして、演算部143は、形状ヒストグラム及び色ヒストグラムを画像間で比較し、類似度を算出する。画像類似度算出装置1は、算出した類似度を参照画像サーバ100へ送信する。参照画像サーバ100は、類似度の高い参照画像31(例えば上位x番目までの参照画像31)又はそれらのURL及びサムネイルを携帯端末2へ送信し表示させる。このように、画像類似度算出装置1は、類似画像検索システムの一部として採用することができる。
【符号の説明】
【0057】
1…画像類似度算出装置、11…サイズ調整部、12…局所特徴量抽出部(特徴点取得部、特徴量記述部)、13…色特徴量抽出部、14…類似度算出部。
【技術分野】
【0001】
本発明は、画像類似度算出装置、画像類似度算出方法、画像類似度算出プログラム及び記録媒体に関するものである。
【背景技術】
【0002】
従来、画像類似度算出装置として、入力画像と参照画像との類似度を、局所特徴量を用いて算出するものが知られている(例えば、特許文献1参照。)。特許文献1記載の装置は、画像から適宜選択された局所的な特徴点それぞれについて、回転、拡大及び縮小に不変となる局所的な形状の特徴量(局所特徴量)を算出する。そして、入力画像及び参照画像の局所特徴量を用いて類似度を算出する。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2011−2966号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、特許文献1記載の画像類似度算出装置にあっては、特徴点周辺の部分画像と当該部分画像とを比較する際に、左右又は上下に反転した画像は全く別のものであると判定する。当技術分野では、反転関係にある画像同士が類似していると判断することができる画像類似度算出装置、画像類似度算出方法、画像類似度算出プログラム及び記録媒体が望まれている。
【課題を解決するための手段】
【0005】
すなわち本発明の一側面に係る画像類似度算出装置は、入力画像と参照画像との類似度を算出する装置である。この装置は、特徴点取得部、特徴量記述部及び類似度算出部を備える。特徴点取得部は、入力画像及び参照画像の特徴点を取得する。特徴点記述部は、入力画像及び参照画像の特徴点ごとに回転及び反転に対して不変となる特徴量を記述する。類似度算出部は、入力画像及び参照画像の特徴点ごとの特徴量に基づいて、入力画像と参照画像との類似度を算出する。
【0006】
この画像類似度算出装置では、回転のみならず反転に対して不変となる特徴量を画像から抽出し、該特徴量を用いて画像の類似度を算出する。このため、反転関係にある画像同士が類似していると判断することができる。
【0007】
一実施形態においては、特徴量記述部は、特徴点を含む所定領域内のエッジ強度に基づいてエッジ方向を複数算出し、算出された複数のエッジ方向を組み合わせた向きを基準として当該特徴点の特徴量を記述してもよい。このように構成することで、少なくとも2方向の特徴ベクトルを基準として特徴量を記述することができるため、回転のみならず反転に対して不変となる特徴量を記述することができる。
【0008】
一実施形態においては、特徴量記述部は、最も度数の多いエッジ方向を主エッジ方向として算出し、主エッジ方向から右回り180度のエッジ強度の総和と左回り180度のエッジ強度の総和とを比較することによって主エッジ方向に直交する副エッジ方向を算出し、主エッジ方向及び副エッジ方法を組み合わせた向きを基準として特徴点の特徴量を記述してもよい。このように構成することで、主エッジ方向及び副エッジ方向を用いて、回転のみならず反転に対して不変となる特徴量を容易に記述することができる。
【0009】
一実施形態においては、類似度算出部は、予め作成された複数の代表特徴量と入力画像の特徴点ごとの特徴量とを比較し、代表特徴量に最近傍となる特徴量の出現頻度を代表特徴量ごとに算出してもよい。そして、類似度算出部は、複数の代表特徴量と参照画像の特徴点ごとの特徴量とを比較し、代表特徴量に最近傍となる特徴量の出現頻度を代表特徴量ごとに算出してもよい。さらに、類似度算出部は、入力画像における出現頻度の分布、及び参照画像における出現頻度の分布に基づいて、類似度を算出してもよい。このように構成することで、予め定めた複数のカテゴリの代表特徴量に対してどの程度類似するのかを入力画像及び参照画像それぞれで出現頻度の分布として算出することができる。このため、算出された出現頻度の分布を比較等することによって、画像の類似度を適切に算出することができる。
【0010】
一実施形態においては、画像類似度算出装置がサイズ調整部を備えてもよい。サイズ調整部は、入力画像及び参照画像の中央領域又は着目領域の大きさが一定値となるように入力画像及び参照画像の大きさを調整する。この場合、特徴点取得部は、サイズ調整部により大きさが調整された後の入力画像及び参照画像から特徴点を取得してもよい。このように構成することで、特徴量を抽出する領域を一定レベル以上に確保することができる。
【0011】
また、本発明の他の側面に係る画像類似度算出方法は、画像と参照画像との類似度を算出する方法である。この方法は、特徴点取得ステップ、特徴量記述ステップ及び類似度算出ステップを備える。特徴点取得ステップでは、入力画像及び参照画像の特徴点を取得する。特徴量記述ステップでは、入力画像及び参照画像の特徴点ごとに回転及び反転に対して不変となる特徴量を記述する。類似度算出ステップでは、入力画像及び参照画像の特徴点ごとの特徴量に基づいて、入力画像と参照画像との類似度を算出する。
【0012】
また、本発明の他の側面に係る画像類似度算出プログラムは、入力画像と参照画像との類似度を算出するようにコンピュータを動作させるプログラムである。このプログラムは、コンピュータを、特徴点取得部、特徴量記述部及び類似度算出部として動作させる。特徴点取得部は、入力画像及び参照画像の特徴点を取得する。特徴点記述部は、入力画像及び参照画像の特徴点ごとに回転及び反転に対して不変となる特徴量を記述する。類似度算出部は、入力画像及び参照画像の特徴点ごとの特徴量に基づいて、入力画像と参照画像との類似度を算出する。
【0013】
また、本発明の他の側面に係る記録媒体は、入力画像と参照画像との類似度を算出するようにコンピュータを動作させる画像類似度算出プログラムが記録されたコンピュータ読み取り可能な記録媒体である。このプログラムは、コンピュータを、特徴点取得部、特徴量記述部及び類似度算出部として動作させる。特徴点取得部は、入力画像及び参照画像の特徴点を取得する。特徴点記述部は、入力画像及び参照画像の特徴点ごとに回転及び反転に対して不変となる特徴量を記述する。類似度算出部は、入力画像及び参照画像の特徴点ごとの特徴量に基づいて、入力画像と参照画像との類似度を算出する。
【0014】
上述した画像類似度算出方法、画像類似度算出プログラム及び画像類似度算出ブログラムが記録された記録媒体によれば、上述した画像類似度算出装置と同様の効果を奏する。
【発明の効果】
【0015】
以上説明したように、本発明の種々の側面及び実施形態によれば、反転関係にある画像同士が類似していると判断することができる。
【図面の簡単な説明】
【0016】
【図1】実施形態に係る画像類似度算出装置を搭載した携帯端末の機能ブロック図である。
【図2】図1中の画像類似度算出装置が搭載される携帯端末のハードウェア構成図である。
【図3】図1中の画像類似度算出装置のヒストグラム作成動作を示すフローチャートである。
【図4】画像のサイズ調整を説明する概要図である。
【図5】特徴点及びスケールを説明する概要図である。
【図6】局所特徴量を説明する概要図である。
【図7】反転関係を有する画像における局所特徴量を説明する概要図である。
【図8】スケールの他の例を説明する概要図である。
【図9】(A)は、形状ヒストグラムの一例である。(B)は、色ヒストグラムの一例である。
【図10】図1中の画像類似度算出装置の類似度算出動作を示すフローチャートである。
【図11】画像類似度算出装置の変形例の機能ブロック図である。
【発明を実施するための形態】
【0017】
以下、添付図面を参照して本発明の実施形態について説明する。なお、図面の説明において同一の要素には同一の符号を付し、重複する説明を省略する。また、図面の寸法比率は、説明のものと必ずしも一致していない。
【0018】
本実施形態に係る画像類似度算出装置は、入力画像と参照画像との類似度を算出する装置である。この装置は、例えば、携帯電話、デジタルカメラ、PDA(Personal Digital Assistant)又は通常のコンピュータシステム等に搭載される。なお、以下では、説明理解の容易性を考慮し、本発明に係る画像類似度算出装置の一例として、携帯端末に搭載される画像類似度算出装置を説明する。
【0019】
図1は、本実施形態に係る画像類似度算出装置1を備える携帯端末2の機能ブロック図である。図1に示す携帯端末2は、例えばユーザにより携帯される移動端末であり、図2に示すハードウェア構成を有する。図2は、携帯端末2のハードウェア構成図である。図2に示すように、携帯端末2は、物理的には、CPU(Central Processing Unit)100、ROM(Read Only Memory)101及びRAM(Random Access Memory)102等の主記憶装置、カメラ又はキーボード等の入力デバイス103、ディスプレイ等の出力デバイス104、ハードディスク等の補助記憶装置105などを含む通常のコンピュータシステムとして構成される。後述する携帯端末2及び画像類似度算出装置1の各機能は、CPU100、ROM101、RAM102等のハードウェア上に所定のコンピュータソフトウェアを読み込ませることにより、CPU100の制御の元で入力デバイス103及び出力デバイス104を動作させるとともに、主記憶装置や補助記憶装置105におけるデータの読み出し及び書き込みを行うことで実現される。なお、上記の説明は携帯端末2のハードウェア構成として説明したが、画像類似度算出装置1がCPU100、ROM101及びRAM102等の主記憶装置、入力デバイス103、出力デバイス104、補助記憶装置105などを含む通常のコンピュータシステムとして構成されてもよい。また、携帯端末2は、通信モジュール等を備えてもよい。
【0020】
図1に示すように、携帯端末2は、画像類似度算出装置1及び表示部32を備えている。画像類似度算出装置1は、画像入力部10、サイズ調整部11、局所特徴量抽出部(特徴点取得部、特徴量記述部)12、色特徴量抽出部13及び類似度算出部14を備えている。
【0021】
画像入力部10は、比較する2つの画像データを入力する機能を有している。画像入力部10は、入力画像30及び参照画像31を入力する。画像入力部10は、例えば、携帯端末2に搭載されたカメラにより撮像された入力画像30を入力してもよいし、通信を介して入力画像30を入力してもよい。また、既に携帯端末2の主記憶装置又は補助記憶装置105に記録された入力画像30を入力してもよい。同様に、画像入力部10は、例えば、携帯端末2に搭載されたカメラにより撮像された参照画像31を入力してもよいし、通信を介して参照画像31を入力してもよい。また、既に携帯端末2の主記憶装置又は補助記憶装置105に記録された参照画像31を入力してもよい。
【0022】
サイズ調整部11は、画像の大きさを調整する機能を有している。例えば、サイズ調整部11は、画像の中央を含む中央領域の面積の大きさが一定値となるように、アスペクト比を維持しながら画像の大きさを調整(拡大又は縮小)する。なお、サイズ調整部11は、着目しているオブジェクトの領域(着目領域)の面積の大きさが一定値となるように画像の大きさを調整してもよい。着目領域は、例えばユーザにより指定された領域、又は、物体検出技術等により自動的に抽出された領域が用いられる。サイズ調整部11は、入力画像30及び参照画像31の画像の大きさをそれぞれ調整する。
【0023】
局所特徴量抽出部12は、画像の局所的な特徴量を抽出する機能を有している。ここで局所的特徴量とは、描画された物体の形状に関する特徴であり、本実施形態では回転及び反転に対して不変となるように記述される。まず、局所特徴量抽出部12は、サイズ調整部11により大きさが調整された画像の特徴点を取得する。特徴点の設定方法は特に限定されない。例えば、画像上にグリッド状に配置された点であってもよい。また、ランダムにサンプリングした点であってもよい。また、コーナー検出法によって取得された特徴点であってもよい。
【0024】
そして、局所特徴量抽出部12は、設定された特徴点の座標及び当該特徴点を含む所定領域内の画素の輝度値に基づいて、特徴点ごとに特徴量を算出する。所定領域とは、例えば、当該特徴点を中心とする略円状の固定領域である。局所特徴量抽出部12は、所定領域内の画素の輝度値に基づいて、エッジ情報を取得する。局所特徴量抽出部12は、所定領域内のエッジ強度に基づいてエッジ方向を複数算出し、算出された複数のエッジ方向を組み合わせたものを当該特徴点の特徴量として記述する。具体的には、局所特徴量抽出部12は、最も度数の多いエッジ方向を主エッジ方向として算出するとともに、主エッジ方向から右回り180度のエッジ強度の総和と左回り180度のエッジ強度の総和とを比較することによって主エッジ方向に直交する副エッジ方向を算出する。そして、局所特徴量抽出部12は、主エッジ方向及び副エッジ方法を組み合わせた方向(向き)を基準として特徴量を記述する。
【0025】
色特徴量抽出部13は、画像の色に関する特徴量を抽出する機能を有している。例えば、色特徴量抽出部13は、画像全体の大域的な色の特徴を抽出する。例えば、色ヒストグラムとセグメンテーションを用いて領域の大きさと形状とを考慮した特徴ベクトルを算出する。
【0026】
類似度算出部14は、入力画像30と参照画像31とを比較した場合の類似度を算出する機能を有している。類似度算出部14は、例えば、形状ヒストグラム生成部141、色ヒストグラム生成部142及び演算部143を備えている。
【0027】
形状ヒストグラム生成部141は、特徴点ごとに取得された局所特徴量に基づいて、入力画像30及び参照画像31のベクトル量子化ヒストグラムを作成する。形状ヒストグラム生成部141は、例えば、BAG−of−Visual Wordsを用いてベクトル量子化ヒストグラムを作成する。従来の手法では、SIFT又はSURF等の局所特徴量を採用している。ここでは、上述した回転及び反転に対して不変となる局所特徴量を用いてベクトル量子化ヒストグラムを生成する。
【0028】
まず、複数の学習画像を用いて、局所特徴量を抽出し、局所特徴量空間における局所特徴量の分布に基づいてベクトル量子化を行う。ベクトル量子化においては、局所特徴量空間を予め定めたn個の領域に分割する。この空間分割には、k−means等の手法が用いられる。これにより、局所特徴量はその属する分割領域に応じて、n個のカテゴリ(Visual WordsのID)に分類される。
【0029】
形状ヒストグラム生成部141は、各カテゴリに分類される局所特徴量の出現頻度を算出する。ここで、各分割領域において確率密度分布の重心となるベクトルを代表特徴量とすると、どのカテゴリに分類されるか判定するために代表特徴量との距離を利用してもよい。この場合、形状ヒストグラム生成部141は、予め作成された複数の代表特徴量と入力画像30の特徴点ごとの局所特徴量とを比較する。そして、代表特徴量に最近傍となる局所特徴量の出現頻度を代表特徴量ごとに算出する。すなわち、入力画像30の局所特徴量に基づいて、横軸(等級)が代表特徴量(カテゴリ)、縦軸が局所特徴量の出現頻度となる形状ヒストグラムを作成する。この形状ヒストグラムそのものが入力画像30の形状特徴となる。すなわち、出現頻度の分布が形状特徴となる。
【0030】
同様に、形状ヒストグラム生成部141は、予め作成された複数の代表特徴量と参照画像31の特徴点ごとの局所特徴量とを比較する。そして、代表特徴量に最近傍となる局所特徴量の出現頻度を代表特徴量ごとに算出する。すなわち、参照画像31の局所特徴量に基づいて、横軸(等級)が代表特徴量(カテゴリ)、縦軸が局所特徴量の出現頻度となる形状ヒストグラムを作成する。この形状ヒストグラムそのものが参照画像31の形状特徴となる。
【0031】
色ヒストグラム生成部142は、色特徴量抽出部13により抽出された色特徴量を用いて色ヒストグラムを生成する。例えば、横軸(等級)がセグメンテーションされた領域の大きさ、形状又は色等により算出された特徴量、縦軸が特徴量の出現頻度となる色ヒストグラムを作成する。この色ヒストグラムそのものが入力画像30の色特徴となる。色ヒストグラム生成部142は、入力画像30及び参照画像31の色ヒストグラムをそれぞれ作成する。
【0032】
演算部143は、入力画像30及び参照画像31の形状ヒストグラム(出現頻度の分布)に基づいて、入力画像30と参照画像31との形状に関する類似度を算出する。演算部143は、さらに、入力画像30及び参照画像31の色ヒストグラムに基づいて、入力画像30と参照画像31との色に関する類似度を算出する。そして、演算部143は、形状に関する類似度及び色に関する類似度に基づいて、最終的な類似度を算出する。ヒストグラムを用いた類似度の算出には、例えばHistogram Intersectionが用いられる。なお、ヒストグラムの空間をPCAやLDAなどにより変換し、その変換後のベクトル間の距離に基づいて類似度を算出してもよい。
【0033】
表示部32は、演算部143により算出された類似度を表示する。表示部32として、例えばディスプレイが用いられる。
【0034】
次に、本実施形態に係る画像類似度算出装置1の動作を説明する。図3は、本実施形態に係る画像類似度算出装置1のヒストグラム作成動作を示すフローチャートである。図3に示す制御処理は、例えば携帯端末2に備わる処理開始ボタンがONされたタイミングで実行される。
【0035】
図3に示すように、画像入力部10が入力画像30及び参照画像31をそれぞれ入力する(S10)。S10の処理が終了すると、サイズ調整処理へ移行する(S12)。S12の処理では、サイズ調整部11が入力画像30及び参照画像31の大きさをそれぞれ調整する。サイズ調整の例を、図4を用いて説明する。図4は、入力画像30を例にした画像サイズ調整の説明図である。図4に示すように、サイズ調整部11は、画像の上下方向の調整パラメータh及び左右方向の調整パラメータwを設定する。そして、中央領域30aの面積(画素)が一定になるパラメータw及びhを算出する。これにより、サイズ調整部11は、アスペクト比を維持しながら画像の大きさを調整する。なお、図4では、入力画像30の大きさを調整する場合を説明したが、参照画像31の大きさについても同様に調整する。S12の処理が終了すると、局所特徴量抽出処理(S14(特徴点取得ステップ、特徴量記述ステップ))及び色特徴量抽出処理(S20)へ移行する。
【0036】
S14の処理では、局所特徴量抽出部12が、S12の処理で入力された入力画像30及び参照画像31から局所特徴量を抽出する。特徴点の取得の例を図5を用いて説明する。図5は、入力画像30を例にした特徴点の取得を説明する概要図である。図5に示すように、局所特徴量抽出部12は、グリッド状に配置された格子点Ts(s:整数)の座標を特徴点として取得する。なお、コーナー検出を利用して、各格子点に最近傍のコーナーを特徴点として取得してもよい。そして、局所特徴量抽出部12は、特徴点Tsを中心とする円領域Csを、特徴量を抽出するための領域に設定する。
【0037】
次に、局所特徴量抽出部12は、特徴点ごとに局所特徴量を取得する。局所特徴量の取得の例を、図6を用いて説明する。図6は、入力画像30を例にした局所特徴量の取得を説明する概要図である。図6に示すように、特徴点Tsの特徴量を取得する場合を説明する。まず、局所特徴量抽出部12は、特徴点Tsの座標位置及び領域Csを取得する。次に、局所特徴量抽出部12は、領域Cs内の輝度値に基づいてエッジ情報を取得する。そして、局所特徴量抽出部12は、領域Cs内のエッジ方向を24方向に積算し、最も大きなエッジ方向を主エッジ方向として決定する。次に、主エッジ方向を中心として、右回り180°の範囲の方向に向いているエッジ強度の総和と、主エッジ方向を中心として、左回り180°の範囲の方向に向いているエッジ強度の総和と、を比較して副エッジ方向を算出する。例えば、局所特徴量抽出部12は、エッジ強度の総和が大きい方向を副エッジ方向とする。その後、主エッジ方向と副エッジ方向とを基準として記述ブロックBt(t:整数)を設定する。これにより、フリップ不変(反転不変)の特徴量を記述できる。図7は、入力画像30と、入力画像30と反転関係を有する参照画像31の一例である。主エッジ方向と副エッジ方向とを基準として記述ブロックBtを設定するため、図7に示すように、入力画像30及び参照画像31の記述ブロックBtは、同一のオブジェクト位置に関するエッジ方向を記述することになる。その後、局所特徴量抽出部12は、記述ブロックBtごとに24方向のエッジ強度を算出して、各方向を等級とする方向ヒストグラムを作成する。なお、24方向のエッジ強度を方向に応じて総和をとり、8方向の方向ヒストグラムとしてもよい。また、図8に示すように、領域Csの半径を変更させて、それぞれ局所特徴量を記述するようにしてもよい。図8では、領域Csの半径を4段階に変更している。局所特徴量抽出部12は、全ての特徴点Tsについて局所特徴量を記述する。S14の処理が終了すると、分類処理へ移行する(S16)。
【0038】
S16の処理では、形状ヒストグラム生成部141が、S14の処理で記述された局所特徴量を分類する。形状ヒストグラム生成部141は、局所特徴量を、予め学習したVisual WordのIDを用いて符号化する。形状ヒストグラム生成部141は、局所特徴量と代表特徴ベクトルとを比較し、最近傍の代表特徴ベクトルとなるVisual WordのIDで符号化する。S16の処理が終了すると、形状ヒストグラム生成処理へ移行する(S18)。
【0039】
S18の処理では、形状ヒストグラム生成部141が、S16の処理で符号化された局所特徴量を用いて、形状ヒストグラムを生成する。形状ヒストグラム生成部141は、上述したIDごとに出現頻度をカウントすることによって形状ヒストグラムを生成する。図9の(A)は、n個のIDが存在している場合の形状ヒストグラムの一例である。S18の処理が終了すると、形状特徴に関する処理は終了となる。
【0040】
一方、S20の処理では、色特徴量抽出部13が、入力画像30及び参照画像31の色特徴量をそれぞれ抽出する(S20)。色特徴量抽出部13は、各色の連続する領域の大きさを算出する。そして、色ヒストグラム生成部142は、領域の大きさ及び色に基づいて、又は、領域の大きさ、色及び領域形状の複雑さに基づいて、等級を作成して色ヒストグラムを作成する(S22)。図9の(B)は、m個のカテゴリに分類された色ヒストグラムの一例である。これにより、同一の色でも異なる領域の大きさを有する画像を区別することができる。S22の処理が終了すると、色特徴に関する処理は終了となる。
【0041】
以上で図3に示す制御処理を終了する。図3に示す制御処理を実行することにより、入力画像30及び参照画像31それぞれについて、形状及び色に関するヒストグラムが作成される。なお、説明理解の容易性を考慮して、入力画像30及び参照画像31を纏めて処理する例を説明したが、別々に処理してもよい。また、S14〜S18の処理とS20〜S22の処理とを別々に処理してもよい。
【0042】
次に、本実施形態に係る画像類似度算出装置1の類似度算出動作を説明する。図10は、本実施形態に係る画像類似度算出装置1の類似度算出動作を示すフローチャートである。図10に示す制御処理は、例えば図3に示す制御処理の終了後に実行される。
【0043】
図10に示すように、演算部143が入力画像30のヒストグラムを入力する(S30)。そして、演算部143が参照画像31のヒストグラムを入力する(S32)。そして、演算部143は、類似度を算出する(S34:類似度算出ステップ)。演算部143は、入力画像30の形状ヒストグラム及び色ヒストグラムを、参照画像31の形状ヒストグラム及び色ヒストグラムとそれぞれ比較する。演算部143は、特徴量(等級)ごとにHistogram Intersectionを用いて評価する。例えば、入力画像30をx、入力画像30のi番目の等級をxi、参照画像31をy、参照画像31のi番目の等級をyiとすると、以下の式1を用いて類似度を算出する。
【数1】
ここで、形状ヒストグラムにより算出された類似度をSshape、色ヒストグラムにより算出された類似度をScolorとすると、総合的な類似度Sallを以下の式2で算出する。
【数2】
ここで、wshape及びwcolorは形状及び色の重みであり、適宜設定される。S34の処理が終了すると、図10に示す制御処理を終了する。
【0044】
以上、図10に示す制御処理を実行することにより、形状ヒストグラム及び色ヒストグラムを用いて類似度が算出される。なお、形状ヒストグラムのみを用いて類似度を算出し、総合的な類似度としてもよい。また、テクスチャ特徴など、異なる特徴をさらに加えて類似度を算出してもよい。
【0045】
次に、携帯端末2(コンピュータ)を画像類似度算出装置1として機能させるための画像類似度算出プログラムを説明する。
【0046】
画像類似度算出プログラムは、メインモジュール、入力モジュール及び演算処理モジュールを備えている。メインモジュールは、画像処理を統括的に制御する部分である。入力モジュールは、入力画像30及び参照画像31を取得するように携帯端末2を動作させる。演算処理モジュールは、サイズ調整モジュール、局所特徴量抽出モジュール、色特徴量抽出モジュール及び類似度演算モジュールを備えている。メインモジュール、入力モジュール及び演算処理モジュールを実行させることにより実現される機能は、上述した画像類似度算出装置1の画像入力部10、サイズ調整部11、局所特徴量抽出部12、色特徴量抽出部13及び類似度算出部14の機能とそれぞれ同様である。
【0047】
画像類似度算出プログラムは、例えば、コンピュータ読み取り可能なROM等の記憶媒体または半導体メモリによって提供される。また、画像類似度算出プログラムは、データ信号としてネットワークを介して提供されてもよい。
【0048】
以上、本実施形態に係る画像類似度算出装置1によれば、回転のみならず反転に対して不変となる特徴量を画像から抽出し、該特徴量を用いて画像の類似度を算出する。このため、反転関係にある画像同士が類似していると判断することができる。従来の局所特徴量であるSIFT及びSURFにあっては、左右反転に対して異なる記述をするため、反転関係にある画像同士が類似していると判断することが容易にはできない。また、SIFT及びSURFによる特徴量を用いて、このような反転された部分画像を類似していると判断するためには、後段でヒューリスティックな処理や学習を利用する等の間接的な処理が必要となる。これに対して、本実施形態に係る画像類似度算出装置1によれば、特徴量そのものを反転に関して不変となるように記述できるため、オブジェクトの反転を容易に取り扱うことができる。さらに、従来必要であった後処理や学習等における反転不変に関するパラメータについては不要となる。このため、類似度を適切に算出するためのパラメータの解空間を狭めることができるので、処理の安定性を高めることができる。
【0049】
また、本実施形態に係る画像類似度算出装置1によれば、主エッジ方向及び副エッジ方向を用いて、回転のみならず反転に対して不変となる特徴量を容易に記述することができる。
【0050】
また、本実施形態に係る画像類似度算出装置1によれば、予め定めた複数のカテゴリの代表特徴量に対してどの程度類似するのかを入力画像30及び参照画像31それぞれで出現頻度の分布として算出することができる。このため、算出された出現頻度の分布を比較等することによって、画像の類似度を適切に算出することができる。
【0051】
また、本実施形態に係る画像類似度算出装置1によれば、サイズ調整部11により入力画像30及び参照画像31の大きさをそれぞれ調整するため、特徴量を抽出する領域を一定レベル以上に確保し、画像の解像度や画像中の着目物体の大きさに依存しない特徴量を記述することができる。
【0052】
なお、上述した実施形態は本発明に係る画像類似度算出装置、画像類似度算出方法、画像類似度算出プログラム及び記録媒体の一例を示すものであり、実施形態に係る装置、方法、プログラム及び記録媒体に限られるものではなく、変形し、又は他のものに適用したものであってもよい。
【0053】
例えば、上述した実施形態では、主エッジ方向及び副エッジ方向を組み合わせた方向を基準として特徴量を記述する例を説明したが、3以上のエッジ方向を組み合わせた方向を基準として特徴量を記述してもよい。
【0054】
また、上述した実施形態では、全ての特徴点を設定した後に局所特徴量を取得する例を説明したが、特徴点を設定する度に局所特徴量を取得してもよい。
【0055】
また、上述した実施形態では、入力画像30及び参照画像31が同時に入力される場合を説明したが、これに限られるものではない。すなわち、複数の参照画像31を予め用意し、参照画像31のヒストグラムについては事前に取得しておき、その後、入力画像30を検索画像として入力してもよい。このような構成を図11に示す。図11では、画像類似度算出装置1は、参照画像サーバ100と接続されている。参照画像サーバ100は、参照画像DB34及び参照画像ヒストグラムDB33を備えている。参照画像DB34は、例えば参照画像31を格納する。参照画像サーバ100は、例えば参照画像31をインターネット上に存在する画像とする。この場合、参照画像DB34は、参照画像31そのものを格納するのではなく、URL及びサムネイルを格納すればよい。参照画像ヒストグラムDB33は、参照画像31の形状ヒストグラム及び色ヒストグラムを格納する。
【0056】
画像類似度算出装置1は、入力画像30に関して形状ヒストグラム及び色ヒストグラムを作成する。そして、演算部143は、参照画像サーバ100から参照画像31の形状ヒストグラム及び色ヒストグラムを入力する。そして、演算部143は、形状ヒストグラム及び色ヒストグラムを画像間で比較し、類似度を算出する。画像類似度算出装置1は、算出した類似度を参照画像サーバ100へ送信する。参照画像サーバ100は、類似度の高い参照画像31(例えば上位x番目までの参照画像31)又はそれらのURL及びサムネイルを携帯端末2へ送信し表示させる。このように、画像類似度算出装置1は、類似画像検索システムの一部として採用することができる。
【符号の説明】
【0057】
1…画像類似度算出装置、11…サイズ調整部、12…局所特徴量抽出部(特徴点取得部、特徴量記述部)、13…色特徴量抽出部、14…類似度算出部。
【特許請求の範囲】
【請求項1】
入力画像と参照画像との類似度を算出する画像類似度算出装置であって、
前記入力画像及び前記参照画像の特徴点を取得する特徴点取得部と、
前記入力画像及び前記参照画像の前記特徴点ごとに回転及び反転に対して不変となる特徴量を記述する特徴量記述部と、
前記入力画像及び前記参照画像の前記特徴点ごとの前記特徴量に基づいて、前記入力画像と前記参照画像との類似度を算出する類似度算出部と、
を備える画像類似度算出装置。
【請求項2】
前記特徴量記述部は、前記特徴点を含む所定領域内のエッジ強度に基づいてエッジ方向を複数算出し、算出された複数のエッジ方向を組み合わせた向きを基準として当該特徴点の特徴量を記述する請求項1に記載の画像類似度算出装置。
【請求項3】
前記特徴量記述部は、最も度数の多いエッジ方向を主エッジ方向として算出し、主エッジ方向から右回り180度のエッジ強度の総和と左回り180度のエッジ強度の総和とを比較することによって主エッジ方向に直交する副エッジ方向を算出し、主エッジ方向及び副エッジ方法を組み合わせた向きを基準として前記特徴点の特徴量を記述する請求項2に記載の画像類似度算出装置。
【請求項4】
前記類似度算出部は、
予め作成された複数の代表特徴量と前記入力画像の前記特徴点ごとの前記特徴量とを比較し、前記代表特徴量に最近傍となる前記特徴量の出現頻度を前記代表特徴量ごとに算出し、
前記複数の代表特徴量と前記参照画像の前記特徴点ごとの前記特徴量とを比較し、前記代表特徴量に最近傍となる前記特徴量の出現頻度を前記代表特徴量ごとに算出し、
前記入力画像における前記出現頻度の分布、及び前記参照画像における前記出現頻度の分布に基づいて、前記類似度を算出する請求項1〜3の何れか一項に記載の画像類似度算出装置。
【請求項5】
前記入力画像及び前記参照画像の中央領域又は着目領域の大きさが一定値となるように前記入力画像及び前記参照画像の大きさを調整するサイズ調整部をさらに備え、
前記特徴点取得部は、前記サイズ調整部により大きさが調整された後の前記入力画像及び前記参照画像から特徴点を取得する
請求項1〜4の何れか一項に記載の画像類似度算出装置。
【請求項6】
入力画像と参照画像との類似度を算出する画像類似度算出方法であって、
前記入力画像及び前記参照画像の特徴点を取得する特徴点取得ステップと、
前記入力画像及び前記参照画像の前記特徴点ごとに回転及び反転に対して不変となる特徴量を記述する特徴量記述ステップと、
前記入力画像及び前記参照画像の前記特徴点ごとの前記特徴量に基づいて、前記入力画像と前記参照画像との類似度を算出する類似度算出ステップと、
を備える画像類似度算出方法。
【請求項7】
入力画像と参照画像との類似度を算出するようにコンピュータを動作させる画像類似度算出プログラムであって、
前記入力画像及び前記参照画像の特徴点を取得する特徴点取得部と、
前記入力画像及び前記参照画像の前記特徴点ごとに回転及び反転に対して不変となる特徴量を記述する特徴量記述部と、
前記入力画像及び前記参照画像の前記特徴点ごとの前記特徴量に基づいて、前記入力画像と前記参照画像との類似度を算出する類似度算出部
として前記コンピュータを動作させる画像類似度算出プログラム。
【請求項8】
入力画像と参照画像との類似度を算出するようにコンピュータを動作させる画像類似度算出プログラムが記録されたコンピュータ読み取り可能な記録媒体であって、
前記入力画像及び前記参照画像の特徴点を取得する特徴点取得部と、
前記入力画像及び前記参照画像の前記特徴点ごとに回転及び反転に対して不変となる特徴量を記述する特徴量記述部と、
前記入力画像及び前記参照画像の前記特徴点ごとの前記特徴量に基づいて、前記入力画像と前記参照画像との類似度を算出する類似度算出部
として前記コンピュータを動作させる前記画像類似度算出プログラムが記録された記録媒体。
【請求項1】
入力画像と参照画像との類似度を算出する画像類似度算出装置であって、
前記入力画像及び前記参照画像の特徴点を取得する特徴点取得部と、
前記入力画像及び前記参照画像の前記特徴点ごとに回転及び反転に対して不変となる特徴量を記述する特徴量記述部と、
前記入力画像及び前記参照画像の前記特徴点ごとの前記特徴量に基づいて、前記入力画像と前記参照画像との類似度を算出する類似度算出部と、
を備える画像類似度算出装置。
【請求項2】
前記特徴量記述部は、前記特徴点を含む所定領域内のエッジ強度に基づいてエッジ方向を複数算出し、算出された複数のエッジ方向を組み合わせた向きを基準として当該特徴点の特徴量を記述する請求項1に記載の画像類似度算出装置。
【請求項3】
前記特徴量記述部は、最も度数の多いエッジ方向を主エッジ方向として算出し、主エッジ方向から右回り180度のエッジ強度の総和と左回り180度のエッジ強度の総和とを比較することによって主エッジ方向に直交する副エッジ方向を算出し、主エッジ方向及び副エッジ方法を組み合わせた向きを基準として前記特徴点の特徴量を記述する請求項2に記載の画像類似度算出装置。
【請求項4】
前記類似度算出部は、
予め作成された複数の代表特徴量と前記入力画像の前記特徴点ごとの前記特徴量とを比較し、前記代表特徴量に最近傍となる前記特徴量の出現頻度を前記代表特徴量ごとに算出し、
前記複数の代表特徴量と前記参照画像の前記特徴点ごとの前記特徴量とを比較し、前記代表特徴量に最近傍となる前記特徴量の出現頻度を前記代表特徴量ごとに算出し、
前記入力画像における前記出現頻度の分布、及び前記参照画像における前記出現頻度の分布に基づいて、前記類似度を算出する請求項1〜3の何れか一項に記載の画像類似度算出装置。
【請求項5】
前記入力画像及び前記参照画像の中央領域又は着目領域の大きさが一定値となるように前記入力画像及び前記参照画像の大きさを調整するサイズ調整部をさらに備え、
前記特徴点取得部は、前記サイズ調整部により大きさが調整された後の前記入力画像及び前記参照画像から特徴点を取得する
請求項1〜4の何れか一項に記載の画像類似度算出装置。
【請求項6】
入力画像と参照画像との類似度を算出する画像類似度算出方法であって、
前記入力画像及び前記参照画像の特徴点を取得する特徴点取得ステップと、
前記入力画像及び前記参照画像の前記特徴点ごとに回転及び反転に対して不変となる特徴量を記述する特徴量記述ステップと、
前記入力画像及び前記参照画像の前記特徴点ごとの前記特徴量に基づいて、前記入力画像と前記参照画像との類似度を算出する類似度算出ステップと、
を備える画像類似度算出方法。
【請求項7】
入力画像と参照画像との類似度を算出するようにコンピュータを動作させる画像類似度算出プログラムであって、
前記入力画像及び前記参照画像の特徴点を取得する特徴点取得部と、
前記入力画像及び前記参照画像の前記特徴点ごとに回転及び反転に対して不変となる特徴量を記述する特徴量記述部と、
前記入力画像及び前記参照画像の前記特徴点ごとの前記特徴量に基づいて、前記入力画像と前記参照画像との類似度を算出する類似度算出部
として前記コンピュータを動作させる画像類似度算出プログラム。
【請求項8】
入力画像と参照画像との類似度を算出するようにコンピュータを動作させる画像類似度算出プログラムが記録されたコンピュータ読み取り可能な記録媒体であって、
前記入力画像及び前記参照画像の特徴点を取得する特徴点取得部と、
前記入力画像及び前記参照画像の前記特徴点ごとに回転及び反転に対して不変となる特徴量を記述する特徴量記述部と、
前記入力画像及び前記参照画像の前記特徴点ごとの前記特徴量に基づいて、前記入力画像と前記参照画像との類似度を算出する類似度算出部
として前記コンピュータを動作させる前記画像類似度算出プログラムが記録された記録媒体。
【図1】
【図2】
【図3】
【図9】
【図10】
【図11】
【図4】
【図5】
【図6】
【図7】
【図8】
【図2】
【図3】
【図9】
【図10】
【図11】
【図4】
【図5】
【図6】
【図7】
【図8】
【公開番号】特開2013−54529(P2013−54529A)
【公開日】平成25年3月21日(2013.3.21)
【国際特許分類】
【出願番号】特願2011−192048(P2011−192048)
【出願日】平成23年9月2日(2011.9.2)
【出願人】(505277358)株式会社モルフォ (18)
【Fターム(参考)】
【公開日】平成25年3月21日(2013.3.21)
【国際特許分類】
【出願日】平成23年9月2日(2011.9.2)
【出願人】(505277358)株式会社モルフォ (18)
【Fターム(参考)】
[ Back to top ]