説明

特徴量取得装置、類似画像検索装置、特徴量取得方法およびプログラム。

【課題】画像特徴量を抽出した学習用の画像に比べて、類似画像検索の対象である画像内の物体の位置がずれている場合であっても、その位置ずれによる類似画像検索の精度の低減を軽減すること。
【解決手段】画像データに基づき、画像上において特徴量を算出するために画像を区分する単位領域として、同心円の複数の扇状形状の領域を決定する領域決定部と、前記画像データの画素値の平均を前記単位領域毎に算出することにより、入力画像の特徴量を算出する特徴量算出部と、を備えることを特徴とする。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像データの特徴量を取得する特徴量取得装置、当該特徴量取得装置を含む類似画像検索装置、特徴量取得方法、および、これら特徴量取得装置または類似画像検索装置における各手段を実行するプログラムに関する。
【背景技術】
【0002】
2次元画像の分類や類似画像検索を行うための指標として、当該画像の特徴を示す特徴量を抽出する手法が一般に用いられている。なかでも、非特許文献1で紹介されている、GISTと呼ばれる特徴量を抽出する手法は、画像の構図を反映した特徴量を抽出できる手法として、画像分類や類似画像検索に広く用いられている(例えば、非特許文献2参照)。
【先行技術文献】
【非特許文献】
【0003】
【非特許文献1】Aude Oliva、他1名、「Modeling the shape of the scene: a holistic representation of the spatial envelope」、International Journal of Computer Vision、Vol. 42(3)、2001年、p.145-175
【非特許文献2】Matthijs Douze、他4名、「Evaluation of GIST descriptors for web-scale image search」、International Conference on Image and Video Retrieval、2009年7月
【発明の概要】
【発明が解決しようとする課題】
【0004】
非特許文献1に記載の方法では、特徴量を算出するための単位領域に方向画像を分割する際、4×4の格子状にブロック分割を行う。この分割では、画像全体の構図の反映はできるものの、画像内に存在する物体の回転や位置ずれに対応できない問題がある。
言い換えると、類似画像検索を行うために参照データとして用意されている画像内の物体の位置と、当該類似画像検索の対象となる画像内の物体の位置が異なる場合、単位領域毎の特徴量が異なる場合がある。例えば、参照データの画像と比較して画像内の物体が画像の中央を中心として回転している画像が類似画像検索の対象であった場合、画像内の中央部分では位置ずれは少ないものの、画像の外縁部分における画像の位置ずれは多くなる。この画像の位置ずれにより、対象の画像の外縁部分では、単位領域毎の特徴量が、参照データと異なる場合がある。この場合、画像内に含まれる物体も同一で画像として類似しているにも関わらず、類似画像検索において非類似と判定されるおそれがある。よって、類似画像検索の精度が低下する問題がある。
【0005】
本発明は、このような事情を考慮してなされたものであり、その目的は、画像特徴量を抽出した学習用の画像に比べて、類似画像検索の対象である画像内の物体の位置がずれている場合であっても、その位置ずれによる類似画像検索の精度の低減を軽減することができる特徴量取得装置、類似画像検索装置、特徴量取得方法およびプログラムを提供することにある。
【課題を解決するための手段】
【0006】
この発明は上述した課題を解決するためになされたもので、本発明の一態様による特徴量取得装置は、入力する入力画像の画像データに基づき画素毎に画素値の対数を示すコントラスト強調画像データを生成する対数演算部と、前記コントラスト強調画像データから高周波成分を除去した高周波成分除去画像データを生成するフィルタリング部と、前記高周波成分除去画像データに基づき、各画素を基準とした方位に応じて各画素に対応する画像内の特徴量を表わす方向画像データを算出する方向画像算出部と、前記方向画像データに対して画像中の輪郭をぼかすためのフィルタを適用してぼかし画像データを生成するぼかし処理部と、前記ぼかし画像データに基づき、画像上において特徴量を算出するために画像を区分する単位領域として、同心円の複数の扇状形状の領域を決定する領域決定部と、前記ぼかし画像データの画素値の平均を前記単位領域毎に算出することにより、前記入力画像の特徴量を算出する特徴量算出部と、を備えることを特徴とする。
【0007】
また、本発明の一態様による特徴量取得方法は、上述の特徴量取得装置において、前記入力画像の画像データ、前記コントラスト強調画像データ、および前記高周波成分除去画像データのうち少なくともいずれか1つのデータにおいて表わされている色空間を予め決められている他の色空間に変換する色空間変換部をさらに有することを特徴とする。
【0008】
また、本発明の一態様による特徴量取得方法は、上述の特徴量取得装置において、前記特徴量算出部が、前記ぼかし画像データの画素値の平均および分散を前記単位領域毎に算出し、算出した平均および分散に基づく特徴量を求めることを特徴とする。
【0009】
この発明は上述した課題を解決するためになされたもので、本発明の一態様による特徴量取得装置は、入力する入力画像の画像データに基づき、画像上において特徴量を算出するために画像を区分する単位領域として、同心円の複数の扇状形状の領域を決定する領域決定部と、前記画像データのカラーヒストグラムを前記単位領域毎に算出することにより、前記入力画像の特徴量を算出する特徴量算出部と、を備えることを特徴とする。
【0010】
この発明は上述した課題を解決するためになされたもので、本発明の一態様による特徴量取得装置は、入力する入力画像の画像データに基づき、画像上において特徴量を算出するために画像を区分する単位領域として、同心円の複数の扇状形状の領域を決定する領域決定部と、前記画像データのカラーモーメントを前記単位領域毎に算出することにより、前記入力画像の特徴量を算出する特徴量算出部と、を備えることを特徴とする。
【0011】
また、本発明の一態様による特徴量取得方法は、上述の特徴量取得装置において、前記単位領域が、隣接する単位領域と重複する形状であることを特徴とする。
【0012】
この発明は上述した課題を解決するためになされたもので、本発明の一態様による類似画像検索装置は、上述に記載のいずれかの特徴量取得装置を備える類似画像検索装置であって、前記入力画像に類似する類似画像の候補である複数の候補画像を示す情報と、前記特徴量算出部によって算出された前記候補画像の特徴量とをそれぞれ対応付ける情報を記憶する記憶部と、前記記憶部を参照して、前記特徴量算出部によって算出された前記入力画像の特徴量と前記候補画像の特徴量との類似度を算出し、当該類似度に基づいて前記入力画像に類似する前記候補画像を得る類似画像検索部と、を備えることを特徴とする。
【0013】
この発明は上述した課題を解決するためになされたもので、本発明の一態様による特徴量取得方法は、入力する入力画像の画像データに基づき画素毎に画素値の対数を示すコントラスト強調画像データを生成する対数演算処理ステップと、前記コントラスト強調画像データから高周波成分を除去した高周波成分除去画像データを生成するフィルタリング処理ステップと、前記高周波成分除去画像データに基づき、各画素を基準とした方位に応じて各画素に対応する画像内の特徴量を表わす方向画像データを算出する方向画像算出処理ステップと、前記方向画像データに対して画像中の輪郭をぼかすためのフィルタを適用してぼかし画像データを生成するぼかし処理ステップと、前記ぼかし画像データに基づき、画像上において特徴量を算出するために画像を区分する単位領域として、同心円の複数の扇状形状の領域を決定する領域決定処理ステップと、前記ぼかし画像データの画素値の平均を前記単位領域毎に算出することにより、前記入力画像の特徴量を算出する特徴量算出処理ステップと、を備えることを特徴とする特徴量取得方法。
【0014】
この発明は上述した課題を解決するためになされたもので、本発明の一態様によるプログラムは、コンピュータに、上述の特徴量取得方法の各ステップを実行させるためのプログラムであることを特徴とする。
【発明の効果】
【0015】
この発明によれば、画像特徴量を抽出した学習用の候補画像に比べて、類似画像検索の対象である画像内の物体の位置がずれている場合であっても、その位置ずれによる類似画像検索の精度の低減を軽減することができる。
【図面の簡単な説明】
【0016】
【図1】本発明に係る第1実施形態における特徴量取得装置の構成の一例を示す構成図である。
【図2】本発明に係る第1実施形態における特徴量取得方法の一例を示すフローチャートである。
【図3】本発明に係る第1実施形態における方向画像算出部が微分画像データを求めるために用いるマスクの一例を示す図である。
【図4】本発明に係る第1実施形態におけるぼかし処理部が行うぼかし処理の一例について説明するための図である。
【図5】本発明に係る第1実施形態における領域決定部が決定する単位領域の一例を示す図である。
【図6】本発明に係る第1実施形態における領域決定部が決定する単位領域の一例を説明するための図である。
【図7】本発明に係る第1実施形態における領域決定部が決定する単位領域の一例を説明するための参考図である。
【図8】本発明に係る第1実施形態における領域決定部が決定する単位領域の一例を説明するための参考図である。
【図9】本発明に係る第1実施形態における領域決定部が決定する単位領域の一例を説明するための参考図である。
【図10】本発明に係る第1実施形態における領域決定部が決定する単位領域の一例を説明するための参考図である。
【図11】本発明に係る第1実施形態における領域決定部が決定する単位領域の一例を説明するための参考図である。
【図12】本発明に係る第1実施形態における領域決定部が決定する単位領域の他の例を示す図である。
【図13】図12に示す単位領域を説明するための図である。
【図14】図12に示す単位領域を説明するための図である。
【図15】本発明に係る第1実施形態における領域決定部が決定する単位領域の一例を説明するための参考図である。
【図16】本発明に係る第1実施形態において特徴量算出部が算出する特徴量のデータ構成の一例を示す図である。
【図17】本発明に係る第2実施形態における類似画像検索装置の構成の一例を示す構成図である。
【図18】本発明に係る第2同実施形態における類似画像検索方法の一例を示すフローチャートである。
【図19】本発明に係る第2同実施形態において検索対象画像の指定に際して表示部が表示する画面の例を示す図である。
【発明を実施するための形態】
【0017】
<第1実施形態>
以下、図面を参照して、本発明の実施形態について説明する。
図1は、本発明の第1実施形態における特徴量取得装置1の概略構成を示す構成図である。同図において、特徴量取得装置1は、画像取得部11と、前処理部21と、特徴量取得部31と、特徴量次元圧縮部41と、特徴量出力部51とを具備する。前処理部21は、対数演算部211と、フィルタリング部212と、色空間変換部213とを具備する。特徴量取得部31は、方向画像算出部311と、ぼかし処理部312と、領域決定部313と、特徴量算出部314とを具備する。
【0018】
画像取得部11は、特徴量を求める対象の画像データを入力して、この画像データを前処理部21に出力する。例えば、画像取得部11は、類似する複数の画像をデータベースから検索する画像処理サービスを提供するウェブサーバから、当該ウェブサーバが画像処理に用いる画像データを受信し、受信した画像データを前処理部21に出力する。以下では、画像取得部11の取得する画像データを「入力画像データ」と称し、入力画像データが示す画像を「入力画像」と称する。
【0019】
前処理部21は、入力画像データに対して、入力画像の特徴量を求めるための前処理を行った画像データを特徴量取得部31に出力する。この前処理部21において、対数演算部211は、入力画像データの画素毎に、入力画像がカラー画像の場合は色成分毎に、画素値の対数(log)を取ったコントラスト強調画像データを生成する。フィルタリング部212は、対数演算部211が生成したコントラスト強調画像データから高周波成分を除去するフィルタリング処理を行って、高周波成分除去画像データを生成する。色空間変換部213は、高周波成分除去画像データの色空間を他の色空間に変換して色空間変換画像データを生成する。なお、前処理部21は、色変換部213を備えずに、フィルタリング部212からの高周波成分除去画像データを特徴量取得部31に出力する構成であってもよい。
【0020】
特徴量取得部31は、前処理部21から出力される色空間変換画像データに基づき、画像データの特徴量を取得して特徴量次元圧縮部41に出力する。特徴量取得部31において、方向画像算出部311は、色空間変換部213から出力される色空間変換画像データに基づき、各画素を基準とした方位に応じて各画素に対応する画像内の特徴量を表わす方向画像データを算出する。なお、特徴量取得部31は、前処理部21のフィルタリング部212が出力する高周波成分除去画像データに基づき、画像データの特徴量を取得して特徴量次元圧縮部41に出力する構成であってもよい。ぼかし処理部312は、方向画像データに対してぼかし処理を行いぼかし画像データを生成する。領域決定部313は、ぼかし画像データ上において、特徴量を算出する際の処理の基準の単位領域となる領域を決定する。特徴量算出部314は、領域決定部313が決定した単位領域毎に、ぼかし画像データの画素値の平均と分散を算出することにより、入力画像の特徴量を算出する。
【0021】
この領域決定部31は、ぼかし画像データに基づき、画像上において特徴量を算出するために画像を区分する単位領域として、同心円の複数の扇状形状の領域を決定する。
なお、本実施形態に係る特徴量取得装置1は、この領域決定部313によって決定される単位領域の形状に特徴を有し、この形状の詳細については、以下に説明する。
また、本実施形態において、特徴量取得装置1の特徴量算出部314は、ぼかし画像データの画素値の平均と分散を算出することにより、入力画像の特徴量を算出する例を用いて以下説明する。しかし、本発明はこれに限られず、特徴量取得装置1の特徴量算出部314は、ぼかし画像データの画素値の平均のみを算出することにより、入力画像の特徴量を算出するものであってもよい。
【0022】
特徴量次元圧縮部41は、特徴量算出部314が算出した特徴量の次元数を減らして圧縮後特徴量を算出する。なお、本実施形態において、特徴量取得装置1は、この特徴量次元圧縮部41を備え、特徴量算出部314が算出した特徴量の次元数を減らして圧縮後特徴量を算出する例を用いて以下説明するが、本発明はこれに限られず、特徴量次元圧縮部41を備えない構成であってもよい。
特徴量出力部51は、特徴量次元圧縮部41が算出した圧縮後特徴量を特徴量取得装置1の外部に出力する。例えば、特徴量出力部51は、入力画像データの送信元のウェブサーバに、圧縮後特徴量を送信する。
【0023】
次に、特徴量取得装置1の動作について説明する。
図2は、特徴量取得装置1が特徴量(圧縮後特徴量)を求める処理手順を示すフローチャートである。特徴量取得装置1の画像取得部11は、入力画像データIを入力すると同図の処理を開始する。
なお、以下では、入力画像がカラー画像であり、入力画像データが赤(R)、緑(G)、青(B)の3チャンネルのデータである場合の一例について説明する。入力画像がモノクロ画像の場合は、特徴量取得装置1は1チャンネルのデータを取得して、以下に説明する処理のうち1チャンネル分の処理を行う。
ステップST11〜ST13では、前処理部21が入力画像データに対する前処理を行う。
【0024】
(ステップST11:対数算出処理)
まず、対数演算部211が、式(1)に基づいて、入力画像データIに対して、チャネルch毎に、各画素の画素値の対数(log)を取ったコントラスト強調画像データIl_chを生成する(ステップST11)。言い換えると、対数演算部211は、入力画像データに基づき、画素毎に画素値の対数を示すコントラスト強調画像データIl_chを生成する。
【0025】
【数1】

【0026】
ここで、式(1)に示す「Ich」は、入力画像データIに含まれるチャンネル毎の各画素の画素値を要素とする行列であり、「Ich+1」は、行列Ichの各要素に“1”を加えることを示す。また、「log(Ich+1)」は、行列Ich+1の各要素の対数を取ることを示す。
対数演算部211が画素値の対数を取ることにより、画素値が比較的小さいレベル(つまり、人間の目が明るさの差を感じやすいレベル)におけるコントラストが強調され、より適切に画像の特徴を特徴量に反映させることが可能となる。対数演算部211は、生成したコントラスト強調画像データIl_chをフィルタリング部212に出力する。
【0027】
(ステップST12:周波数領域フィルタリング処理)
次に、フィルタリング部212は、コントラスト強調画像データIl_chに基づき、対数演算部211から出力されるコントラスト強調画像の高周波成分を抑制するフィルタリング処理を行う。具体的には、フィルタリング部212は、式(2)に基づいて、コントラスト強調画像データIl_chに対してフィルタリング処理を行い、高周波成分除去画像データoutchをチャネルch毎に生成する。
【0028】
【数2】

【0029】
ここで、「fft2」は、2次元fft(Fast Fourier Transform、高速フーリエ変換)を示し、「ifft2」は、2次元逆fftを示す。また、「*」は畳み込み演算を示す。「f」は、式(3)で示されるフィルタである。
【0030】
【数3】

【0031】
ここで、「fx+fy」は、任意の画素P(x,y)から入力画像の中心までの距離(画素数)の2乗を示す。また、sは定数である。
式(3)に示されるフィルタfは、高周波成分を抽出するフィルタである。フィルタリング部212は、式(2)に従って、コントラスト強調画像データIl_chの高周波成分を抽出し、抽出した高周波成分をコントラスト強調画像データIl_chから減算することにより、コントラスト強調画像データIl_chから高周波成分を除去した高周波成分除去画像データoutchを生成する。
このフィルタリング部212が高周波成分を除去することで、入力画像データIの微細な画像部分から特徴量を抽出する際に、当該微細な画像部分の特徴量が低減することへの影響を抑圧することができる。
これにより、特徴量取得装置1は、類似画像を検索する際に、微細な画像部分にとらわれずに、より大局的に画像の類似度を評価できる。言い換えると、フィルタリング部212が高周波成分を除去することにより、微細な画像部分について局所的な類似度を算出することなく、この微細な画像部分を含む単位領域毎に、画像の類似度を大局的に評価することができる。フィルタリング部212は、生成した高周波成分除去画像データを、色空間変換部213に出力する。
なお、定数sの値については、7.2〜7.5の間の値に設定したときに、より良好な実験結果を得ることができた。よって、フィルタリング部212に設定するフィルタとしては、式(3)に示す定数sが、7.2≦定数s≦7.5の範囲であることが好ましい。
【0032】
(ステップST13:色空間変換処理)
次に、色空間変換部213は、フィルタリング部212から出力される高周波成分除去画像データoutchが示す色空間を、他の色空間に変換した色空間変換画像データを生成する(ステップST13)。
ここで、色空間変換部213による変換後の色空間は、照明変動に強い色空間であればよく、予め決められている。
例えば、色空間変換部213は、式(4)に基づいて、高周波成分除去画像データoutchが示す色空間であるRGB色空間をオポーネント(Opponent)色空間に変換する。
【0033】
【数4】

【0034】
ここで、式(4)に示すR、G、Bは、各々、高周波成分除去画像データのうち、赤(R)、緑(G)、青(B)の各チャンネルの部分行列を示す。また、式(4)に示すO、O、Oは、各々、色空間変換画像データのうち、オポーネントの各色成分に対応する部分行列を示す。なお、この色成分O、O、Oを、ここではチャネルという。
この色空間変換部213が変換する色空間として、照明変動に強い色空間を予め決めておくことで、色の違いによる特徴量への影響を軽減して、より適切な特徴量を得ることが可能になる。
例えば、同じものを撮像したにもかかわらず、照明光の影響により異なる色となった2つの画像や、色は異なるが同じ型の自動車を撮像した類似する構図の2つの画像を、それぞれオポーネント色空間で表現した場合、チャネルOの要素は、色合い、すなわちRGBの画素値の比にかかわらず、RGBの輝度値の合計に応じて同一の値となる。したがって、色空間変換部213が変換する色空間として、オポーネント色空間を用いることにより、色の違いによる特徴量への影響を軽減して、より適切な特徴量を得ることが可能になる。
色空間変換部213は、色空間を変換してチャネルch毎に得られる色空間変換画像データを、方向画像算出部311に出力する。
ここでは、高周波成分除去画像データについて色空間の変換を行う説明を行ったが、色空間の変換は、特徴量算出前の画像データに対して行うものであれば、いずれの段階で行ってもよい。例えば、入力画像データに対して色空間の変換を行い、色空間の変換後の画像データを対数演算部211の入力としてもよい。また、コントラスト強調画像データに対して色空間の変換を行い、色空間の変換後の画データをフィルタリング部212の入力としてもよい。
また、色空間の変換自体を行わなくてもよく、色空間の変換を行わない場合には、以下の方向画像の算出以降の処理もRGBの各チャネルの部分行列のまま処理を行えばよい。
【0035】
ステップST14〜ST17では、特徴量取得部31が特徴量を取得する。
(ステップST14:方向画像算出処理)
まず、方向画像算出部311は、色空間変換部213から入力する色空間変換画像データに基づいて、各画素を基準とした方位に応じて各画素に対応する画像内の特徴量を表わす方向画像データを生成する。
方向画像データを生成するために、方向画像算出部311は、まず、色空間変換画像データにおけるx方向およびy方向のそれぞれについて、微分画像データを生成する。
【0036】
ここで、図3を参照して、方向画像算出部311が微分画像データを求めるために用いるマスクの一例について説明する。図3は、方向画像算出部311が微分画像データを求めるために用いるマスクの一例を示す図である。
例えば、方向画像算出部311は、色空間変換画像データにおける各画素について、図3(a)に示すように、任意の画素Pの左隣の画素の画素値に0.5を乗じた値から、右隣の画素の画素値に0.5を乗じた値を減算して、微分画像データにおけるx方向の画素値I’Och_x(x,y)を、チャネルch毎に得る。また、同図(b)に示すように、方向画像算出部311は、任意の画素Pの上隣の画素の画素値に0.5を乗じた値から、下隣の画素の画素値に0.5を乗じた値を減算して、微分画像データにおけるy方向の画素値を、チャネルch毎に得る。
これを式で表すと、式(5)のようになる。
【0037】
【数5】

【0038】
ここで、式(5)に示す「Och」(ch=1,2,3)は、チャンネルO、O、Oのうちいずれか1つを示すものである。方向画像算出部311は、各チャンネルOchの色空間変換画像データに基づき、式(5)に従って、微分画像データI’Och_x、I’Och_yを算出する。
また、式(5)に示す「I’Och_x(x,y)」は、座標(x,y)の画素Pおける、チャンネルOchのx方向の微分画像データ値(画素値)を示す。同様に、式(5)に示す「I’Och_y(x,y)」は、座標(x,y)の画素Pおける、チャンネルOchのy方向の微分画像データ値(画素値)を示す。
【0039】
また、本実施形態では、矩形画面の入力画像において、最も左上の画素を座標(0,0)として、横軸方向をx、縦軸方向をyとする。
つまり、x座標は、矩形画面の最も左の画素のx座標を“0”として、左から右に向かって、x=1,2,3,・・・と設定されている。したがって、方向画像算出部311が微分画像データを算出中の画素Pの座標(x,y)に対して、座標(x−1,y)が左隣の画素Pの座標であり、座標(x+1,y)が右隣の画素Pの座標である。
また、y座標は、矩形画面の最も上の画素のy座標を“0”として、上から下に向かって、y=1,2,3,・・・と設定されている。したがって、方向画像算出部311が微分画像データを算出中の画素Pの座標(x,y)に対して、座標(x,y−1)が上隣の画素Pの座標であり、座標(x,y+1)が下隣の画素Pの座標である。
【0040】
次に、方向画像算出部311は、式(6)に従って、微分画像データに基づき、各画素を基準とした方位に応じて各画素に対応する画像内の特徴量を表わす方向画像データを算出する。
【0041】
【数6】

【0042】
ここで、式(6)に示すθは、任意の座標(x,y)の画素Pについて、方向画像算出部311が算出する方向画像データの方向(角度)、すなわち、画素Pを基準とした方位を示す。例えば、方向画像算出部311が4方向について方向画像データを算出する場合は、θ=0°、90°、180°、270°(d=4)のうち、少なくともいずれか1つの値をとるように設定されている。なお、本実施形態において、方向画像算出部311は、全方向に対応する方向画像データを算出するように設定されている。したがって、方向画像算出部311は、各画素について、チャンネルch毎に、各方向θに対応する4つの画素値を算出する。
あるいは、方向画像算出部311が8方向について方向画像データを算出する場合は、θ=0°、45°、90°、135°、180°、225°、270°、315°(d=8)のうち、少なくともいずれか1つの値をとるように設定されている。なお、本実施形態において、方向画像算出部311は、全方向に対応する方向画像データを算出するように設定されている。従って、方向画像算出部311は、各画素について、チャネルch毎に、8つの画素値を算出する。
つまり、本実施形態において、方向画像算出部311は、方向画像データとして、各画素について、チャネル数(ch)×方向数(d)の数だけ、それぞれに対応する画素値を算出する。
なお、方向数dが多いほど、より精密に画像の類否判断を行い得る特徴量を提供できるが、特徴量を算出するための計算量が増大し、また、特徴量のデータ量も増大する(すなわち、特徴量を記憶しておくために必要となるメモリ容量が増大する)。この類否判断の精度と、計算量およびメモリ容量とのトレードオフから、方向数dは、4〜16に設定することが好ましい。
本実施形態において、方向画像算出部311は、8方向(d=8)について方向画像データを算出することが設定されている。
【0043】
方向画像算出部311が算出する方向画像データは、任意の座標(x,y)の画素Pにおいて、予め決められたそれぞれの方向θの画素におけるエッジの有無や強さを示すデータである。特徴量取得部31が方向画像データに基づいて特徴量を算出することにより、画像中においてエッジを形成する物体の輪郭等が特徴量に反映される。このため、特徴量取得部31は、画像中に含まれる物体の形状が強く反映された特徴量を得ることができる。
また、方向画像算出部311は、微分画像データを最初に取得しておき、この微分画像データに基づいて方向画像データを算出することにより、ガボールフィルタ(Gaborfilter)を用いて方向画像を求める方法よりも、少ない演算量で方向画像を得ることができる。
方向画像算出部311は、算出した方向画像データをぼかし処理部312に出力する。
【0044】
(ステップST15:ぼかし処理)
次に、ぼかし処理部312は、方向画像算出部311から出力される方向画像データに対し、チャンネルch毎、かつ、方向画像データの方向θ毎に、各画素についてぼかし処理を行い、ぼかし画像データを生成する。
ここで、図4を参照して、ぼかし処理部312によるぼかし処理について説明する。図4は、ぼかし処理部312が方向画像データに対して4段階のぼかし処理を行い、ぼかし画像データを生成する一例を示す図である。
例えば、ぼかし処理部312は、ガウシアンフィルタ(Gaussian filter)を用いて各段階のぼかし処理を行う。
【0045】
まず、ぼかし処理部312は、方向画像データに対して、カーネル(ぼかし強度を示す値)がσ1のガウシアンフィルタを適用してぼかし画像データD1を生成する。次に、ぼかし処理部312は、ぼかし画像データD1に対して、カーネルがσ2のガウシアンフィルタを適用して、ぼかし画像データD2を生成する。さらに、ぼかし処理部312は、ぼかし画像データD2に対して、カーネルがσ3のガウシアンフィルタを適用して、ぼかし画像データD3を生成する。そして、ぼかし処理部312は、ぼかし画像データD3に対して、カーネルがσ4のガウシアンフィルタを適用して、ぼかし画像データD4を生成する。
ここで、カーネル=σ1、σ2、σ3、σ4の値は、同じ値であってもよいし、異なる値であってもよい。本実施形態において、ぼかし処理部312に対して、各カーネルの値を1.2〜1.5の範囲で設定した場合に、良好な結果が得られた。よって、本実施形態では、この範囲のカーネルのガウシアンフィルタを適用することを、ぼかし処理部312に対して予め設定しておく。
【0046】
ここでいう「ぼかし処理」は、画像の輪郭をぼかす処理である。ぼかし処理部312により輪郭をぼかした画像データを生成しておくことにより、例えば類似画像検索において、ピントが合って輪郭がシャープに撮像された画像と、ピントが合わずに輪郭がぼけて撮像された画像との類比判断を行う際に、それぞれのボケ具合の画像を比較して、より適切な判断結果を得ることができる。つまり、ぼかし処理部313がぼかし処理を施すことによって、同一の被写体を撮影した画像であって、ピントが合っている画像と合っていない画像を比較した場合、両画像が類似していると判定できる範囲を拡大することができる。
ぼかし処理部312は、生成した各段階のぼかし画像データD1〜D4を、領域決定部313に出力する。
【0047】
(ステップST16:領域決定処理)
次に、領域決定部313は、チャンネルch毎、方向画像データの方向θ毎、かつ、ぼかし処理の段階毎の各ぼかし画像について、特徴量算出部314が特徴量を求める際の単位領域を決定する領域分割を行う。この領域決定部313は、決定した領域毎の画像データ(すなわち、チャンネルch毎、方向画像データの方向θ毎、ぼかし処理の段階毎、かつ、単位領域毎のぼかし画像データ)を特徴量算出部314に出力する。
【0048】
図5は、領域決定部313が決定する単位領域の一例を示す図である。領域決定部313は、例えば、ぼかし画像D1を、同図に示すように18の単位領域r1〜r18に分割する。
領域決定部31は、ぼかし画像D1をg(g≧2)個の複数の同心円により分割する。
本実施形態において、領域決定部31は、図6に示す通り、例えば正方形のぼかし画像D1に内接する第1の円C1と、この第1の円C1よりも半径が小さい第2の円C2と第3の円C3により、ぼかし画像D1を分割する。なお、この第1〜3の円C1〜C3は、同心円であり、本実施形態において、その半径の差は均等である。つまり、第1の円C1の半径はRであり、第2の円C2の半径は2Rであり、第3の円C3の半径は3Rである。
【0049】
なお、本実施形態において、領域決定部31は、半径の差が均等の3つの同心円により単位領域を決定するが、本発明はこれに限られず、Logスペースに変換して、Logスペースで均等に分割するものであってもよい。なお、画像の構図にある程度対応するため、領域決定部31は、上述のように例えば半径差が均等になるように分割する方が好ましい。しかし、本発明はこれに限られず、不均等に分割するものであってもよい。
また、本実施形態において、ぼかし画像D1が正方形である例を用いて以下説明するが、本発明はこれに限られず、長方形や円形であってもよい。なお、長方形の場合、領域決定部31は、長辺に内接する第1の円C1と、この第1の円C1よりも半径が小さい第2の円C2と第3の円C3でぼかし画像D1を分割する。
【0050】
この領域決定部31は、図6に示した通り第1〜3の円C1〜C3でぼかし画像D1を分割するとともに、図5に示す通り、この円の中心部から放射状に伸びる複数の分割線によりさらに分割して、ぼかし画像D1を複数の扇状形状の領域に分割する。なお、本実施形態において、単位領域r1〜r12のように、2つの弧と各弧の両端と接する半径により形成される扇状形状を扇形形状という。また、単位領域r13〜r18のように、1つの弧と各弧の両端とを接する半径により形成される扇状形状を扇環形状という。この扇形形状と扇環形状とを合わせて、以下、扇状形状という。
【0051】
本実施形態において、領域決定部31は、図5に示す通り、同心円を均等のh(h≧2)個の扇状形状に分割する。たとえば、領域決定部31は、各扇状形状の中心角が60°となるように、第1〜3の円C1〜C3によって分割された円や環の形状の領域を、それぞれ、n=6等分する。従って、同心円を複数の扇形(扇環)形状の領域に分割できる。よって、領域決定部31は、3つの同心円C1〜C3をそれぞれ6分割する場合、図5で示しているように18の領域r1〜r18に分割できる。
このように、領域決定部31は、画像の中心を扇形(扇環)形状の中心として、ぼかし画像D1を分割する単位領域を決定することにより、画像回転および撮像対象となる物体の回転にも対応することができる。この点について、図7〜9を参照して以下説明する。
【0052】
なお、図7〜9を参照して以下に説明する例は、本発明を説明するための参考であって、本発明によるものではない。例えば、非特許文献2において説明する方法によるものである。
図7は、本願発明によらない方法で画像を縦および横に領域分割する単位領域の一例を示す図である。同図の例では、画像(ぼかし画像)D200が、4行×4列の16の単位領域r201〜r216に分割されている。
ここで、画像D200には、図8に示すような被写体である人物の顔が中央に映されているとする。また、この画像D200に映されている人物の顔が画像の中央を中心にして紙面右回りに10°回転された画像220の一例を図9に示す。
図8、9を参照して、この回転された画像220が特徴量取得装置1に入力された場合の処理と、回転されていない画像200が特徴量取得装置1に入力された場合の処理とを比較しながら、本発明の参考例について説明する。
【0053】
例えば、回転されていない画像200では、被写体である人物の右目が単位領域r210に、左目が単位領域r211に、それぞれ含まれている。一方、回転された画像220では、被写体である人物の右目が単位領域r206に、左目が単位領域r211に、それぞれ含まれている。つまり、回転された画像220と回転されていない画像200において、単位領域毎に、画像内に含まれる被写体の特徴的な部分(ここでは人物の目)が異なる単位領域内に存在することとなる。
このため、図7に示す通り、格子状に分割された単位領域によると、次のステップST17において説明する通り、特徴量算出部314が単位領域毎に平均および分散を算出して特徴量を求めた際に、回転された画像220と回転されていない画像200とでは、平均や分散の並び順が異なる。すなわち、同一の被写体を含む画像であるにも関わらず、特徴量算出部314によって得られる単位領域毎の特徴量が異なる。これによって、本来類似する画像と判定されるべき画像200と画像220の特徴量が異なるため、類似画像と判定されないおそれがある。
【0054】
これに対して、本願発明のように、画像を扇形(扇環)形状に分割した例を、図10、11を参照して説明する。図10は、図8に示すように回転されていない画像200を扇形(扇環)形状の単位領域に分割した一例を示す。図11は、図9に示すように回転されている画像220を扇形(扇環)形状の単位領域に分割した一例を示す。
図10に示すように、扇形(扇環)形状に分割した単位領域によれば、回転されていない画像200において、被写体の人物の右目が単位領域r17に、左目が単位領域r14に、それぞれ含まれている。
また、図11に示すように、回転された画像220においても、被写体の人物の右目は単位領域r17に、左目は単位領域r14に、それぞれ含まれている。
【0055】
このように、画像内において被写体である物体が画像の中央を中心に回転した場合であっても、単位領域を扇形(扇環)形状に分割することによって、その画像内に含まれる被写体である物体の特徴的な部分(ここでは人物の目)が同一の単位領域内に存在している。したがって、特徴量算出部314が次のステップST17において単位領域毎に平均および分散を算出して特徴量を求めた際に、回転された画像220と回転されていない画像200とで、各単位領域における特徴量を概ね同等にすることができる。つまり、特徴量算出部314が単位領域毎に平均および分散を算出して特徴量を求めた際に、回転された画像220と回転されていない画像200とでは、平均や分散の並び順が概ね同じになる。
【0056】
また、領域決定部31は、図5に示すように単位領域を扇形(扇環)形状に分割する場合、図12に示す通り、各単位領域が隣接する単位領域と重複するように、ぼかし画像を分割するものであってもよい。
図12は、領域決定部31が分割する単位領域r7、r13、r14の他の例である単位領域r107、r113、r114の一例を示す図である。
図示の通り、単位領域r107は、図5に示した単位領域r7の中心角を大きくするとともに半径を長くした単位領域である。また、単位領域r113は、図5に示した単位領域r13の中心角を大きくするとともに半径を長くした単位領域であり、単位領域r114は、単位領域r14の中心角を大きくするとともに半径を長くした単位領域である。
つまり、領域決定部31は、単位領域r7、r13、r14の面積に対して、予め決められた角度および半径に応じた面積だけ拡大した単位領域r107、r113、r114を決定する。これにより、これら単位領域r107、r113、r114は、拡大された部分が隣接する領域においてそれぞれ重複している。
【0057】
本実施形態において、領域決定部31は、例えば、図5に示す通り、扇形(扇環)形状に分割した単位領域について、各単位領域の中心角を左右15°ずつ拡大させて、つまり、中心角を両側あわせて30°拡大させた単位領域を決定する。例えば、領域決定部31は、図12に示す通り、単位領域r7、r13、r14に比べて、中心角が左右それぞれ15°ずつ拡大している単位領域r107、r113、r114を決定する。
また、領域決定部31は、例えば、図5に示す通り、扇形(扇環)形状に分割した単位領域について、扇形の弧の部分を外側に5画素分の長さだけ拡大させる。例えば、領域決定部31は、図12に示す通り、単位領域r13、r14に比べて、それぞれの弧の部分が第1の円C1の外周から5画素分の長さだけ外側に拡大している扇形形状の単位領域r113、r114に分割する。つまり、領域決定部31は、単位領域r13、r14の弧である第1の円C1の半径に5画素分の長さを加算した半径(R+5画素分の長さ)の円の外周を弧とする単位領域r113、r114に分割する。
【0058】
領域決定部31による単位領域r113の分割について、図13を参照して詳細に説明する。図13は、領域決定部31によって決定される単位領域の形状の一例を示す図である。
この領域決定部31は、単位領域r13の中心角α1=60°に、一方の端にα2=15°、他の端にα3=15°を、それぞれ加えた中心角α4=90°を、単位領域r113の中心角と決定する。また、領域決定部31は、単位領域r13の半径Rに5画素分に対応する長さRaを加算した半径R+Raを、単位領域r113の半径と決定する。
なお、本実施形態において、長さRaは5画素分に対応する長さとしたが、これは、ぼかし画像D1の画像サイズが128×128画素であって、単位領域を18分割する場合に最適な値である。よって、領域決定部31は、ぼかし画像の画像サイズや単位領域の分割数に応じて、最適な長さRaを決定することが好ましい。
【0059】
次に、領域決定部31による単位領域r107の分割について、図14を参照して詳細に説明する。図14は、領域決定部31によって決定される単位領域の形状の一例を示す図である。
単位領域r107のように扇環形状である場合、弧の部分が2辺ある。この場合、領域決定部31は、両方の弧の部分について、それぞれ、単位領域r7の外側に5画素分ずつ拡大させる。
例えば、領域決定部31は、図14に示す通り、単位領域r7において第1の円C1の外周の一部であった弧の部分を第1の円C1の外周より5画素分だけ内側となるように、かつ、単位領域r7において第2の円C2の外周の一部であった弧の部分を第2の円C2の外周から5画素分だけ外側となるように、単位領域r107を決定する。つまり、領域決定部31は、円の内側の弧が第1の円C1の半径から5画素分の長さRaを減算した半径(r−5画素分の長さ)の円の外周となり、円の外側の弧が第2の円C2の半径に5画素分の長さRaを加算した半径(r+5画素分の長さ)の円の外周となる単位領域r107を決定する。
また、領域決定部31は、上述の通り、単位領域r107の中心角を拡大してα4=90°に決定する。
つまり、単位領域r107の半径は、R+2Raであり、中心角は、α4=90°である。
【0060】
なお、本実施形態において、領域決定部31は、ぼかし画像D1に内接する第1の円C1を最大の半径の円として説明したが、本発明これに限られず、ぼかし画像D1に概説する円を最大の半径の円として、その内側に、半径差が均等になるように複数の同心円を決定して、単位領域に分割するものであってもよい。
この例を、図15を参照して説明する。
図15(a)は、上述の通り、ぼかし画像に内接する第1の円C1と、第2,3の円C2、C3により分割する例を示す図である。類似画像検索において、画像内において特徴的な物体は、画像の中央部分に存在する場合が多く、このように、画像の中心部分を強調したい場合は、このように内接円を作るように分割する方法が適している。
一方、図15(b)は、ぼかし画像に内接する第4の円C4と、この第4の円C4よりも小さい第5、6の円C5、C6により分割する例を示す図である。類似画像検索において、画像全体を考慮したい場合、つまり、画像の中央部分を強調したくない場合は、このように外接円を作るように分割する方法が適している。
【0061】
次に、図2に戻って、特徴量取得装置1が特徴量(圧縮後特徴量)を求める処理手順の続きを説明する。
(ステップST17:特徴量算出処理)
次に、特徴量算出部314は、領域決定部313から入力される単位領域が決定されたぼかし画像データに基づき、画素値の平均と分散とを単位領域r1〜r18毎に示す特徴量を算出する。
図16は、特徴量算出部314が算出する特徴量のデータ構成を示す図である。同図に示すように、特徴量算出部314は、領域決定部313から入力されるぼかし画像データの画素値の平均および分散を、チャンネルch毎、方向画像データの方向θ毎、ぼかし処理の段階毎、かつ、単位領域r1〜r18毎に算出して、3456次元の特徴量を生成する。すなわち、方向数8×ぼかし処理の段階数4×平均と分散とで次元数2×領域数18×チャンネル数3=3456次元となる。
【0062】
具体的処理としては、まず、特徴量算出部314は、チャンネルch毎、方向画像データの方向θ毎、ぼかし処理の段階毎に、(1)単位領域毎の画素値の平均および分散を算出し、(2)算出した平均および分散に、単位領域に応じた重み係数を乗算する。
この重み係数は、人間の視覚において画像の中心部が注目される特性に応じた特徴量を生成するために乗算されるものである。中心領域の重み係数は、中間領域および外側領域の重み係数よりも大きい値が特徴量算出部314に設定されている。
例えば、中心領域の重み係数w_cとして0.6、中間領域の重み係数w_mとして0.3、外側領域の重み係数w_oとして0.1を、それぞれ用いる。本実施形態において、中央領域とは単位領域r13〜18であり、中間領域とは単位領域r7〜12であり、外側領域とは単位領域r1〜6である。
【0063】
次に、特徴量算出部314は、特徴量のデータ全体について値の総和を1とする正規化を行う。すなわち、特徴量算出部314は、3456個のデータの合計値を算出し、算出した合計値で各平均および分散を除算する。
この正規化により、特徴量算出部314は、画像全体の明るさによる影響を緩和した特徴量を得ることができる。
【0064】
このように、特徴量算出部314は、方向画像における画素値について単位領域毎の平均および分散に基づいて特徴量を算出する。平均や分散は、データの特性を端的に示す指標値である。よって、特徴量算出部314は、この平均および分散を用いて特徴量を算出することにより、画像の特性を的確に捉えた特徴量を得ることができる。
特徴量算出部314は、算出した特徴量を、特徴量次元圧縮部41に出力する。
【0065】
(ステップST18:特徴量次元圧縮処理)
次に、特徴量次元圧縮部41は、特徴量算出部314から出力される特徴量の次元(データ数)を圧縮することによるデータ圧縮を行って、圧縮後特徴量を算出する。特徴量次元圧縮部41は、特徴量の次元を圧縮する技術として、様々な既存の次元圧縮技術を用いることができる。例えば、特徴量次元圧縮部41は、主成分分析(Principal Component Analysis;PCA)を行って、以下のように次元圧縮を行う。
まず、特徴量取得装置1の特徴量算出部314は、予め、M枚の学習画像の各々に対して、上述した入力画像の場合と同様の処理を行ってN次元(本実施形態では3456次元)の特徴量を算出し、式(7)に示されるN×M次元の行列を得る。
【0066】
【数7】

【0067】
ここで、行列Xの1列分が1枚の学習画像から得られるN次元の特徴量に相当し、このN次元の特徴量が学習画像の枚数に応じてM列並んでいる。
そして、特徴量次元圧縮部41は、式(8)に基づいて、行列Xの分散共分散行列Σを算出する
【0068】
【数8】

【0069】
ここで、「Σ」は分散協分散行列を示し、「E」は期待値を示し、「T」は転置行列を示す。
さらに、特徴量次元圧縮部41は、式(9)を満たす、分散協分散行列の固有ベクトルYと、期待値E[X]とを予め記憶しておく。
【0070】
【数9】

【0071】
ここで、「Y」は、分散協分散行列Σの固有ベクトルを示し、「λ」は、分散協分散行列Σの固有値を示す。以下では、固有ベクトルYおよび期待値E[X]を「辞書」と称する。
【0072】
次元圧縮を行う際には、特徴量次元圧縮部41は、予め記憶する辞書を用いて、式(10)の行列F’を算出する。
【0073】
【数10】

【0074】
このF’は、特徴量と同じくN個(本実施形態では3456個)の要素を有するN次元ベクトルである。すなわち、この段階ではまだ次元圧縮されていない。ただし、F’では、学習画像間における相違点と相関性の強い要素ほど上位に位置している。
そこで、特徴量次元圧縮部41は、F’の要素を上位からn(nは、0<n≦Nの正整数)個選んで圧縮後特徴量を生成する。ここで、nは予め定められる定数であり、例えば、特徴量の3456次元に対して、36〜100のいずれかの値に定められている。このnの値を小さく設定するほど、圧縮後特徴量の次元を削減できるので、圧縮後特徴量を記憶するためのデータ量が少なくて済み、また、画像の類似性判定の際の計算量が少なくて済む。一方、nの値を小さく設定するほど、特徴量に含まれていた情報の欠落度合いが大きくなり、画像の類否判断等の精度が低下する。そこで、nの値は、例えば、特徴量取得装置1を実際に運用する中で、特徴量を利用するアプリケーションにおいて求められる画像の類否判定等の精度と、許容されるメモリ容量および計算量とのトレードオフに基づいて定める。
以上のように、主成分分析を行って特徴量の次元を圧縮することにより、特徴量算出部314が算出した特徴量の、画像の相違点を示す情報の多くを保持しつつ、データ量を圧縮できる。
【0075】
その後、特徴量次元圧縮部41は生成した圧縮後特徴量を特徴量出力部51に出力し、特徴量出力部51は、入力画像の送信元のウェブサーバ等、圧縮後特徴量の要求元に対して、特徴量次元圧縮部41から出力される圧縮後特徴量を送信する。
この圧縮後特徴量の利用方法としては、例えば、類似する複数の画像を検索する画像処理サービスを提供するウェブサーバが、類似画像を検索する際に、以下のように利用することが考えられる。
まず、このウェブサーバが、予めバックグラウンド処理にてWWW(World Wide Web)上から様々な画像データを取得する。そして、ウェブサーバは、取得した画像データを特徴量取得装置1に送信して圧縮後特徴量を取得し、画像データと圧縮後特徴量とを対応付けて記憶しておく。
そして、ウェブサーバは、画像処理要求を受信すると、処理対象の画像データ(画像処理要求に含まれる画像データ)を特徴量取得装置1に送信して、当該画像データの圧縮後特徴量を取得する。
そして、ウェブサーバは、処理対象の画像データの圧縮後特徴量と、予め記憶する各画像の圧縮後特徴量とを比較して、特徴量の類似する画像を選択することにより、処理対象の画像に類似する画像のデータを選択して画像処理サービスを行う。
【0076】
以上説明した通り、領域決定部31が、画像を分割する単位領域として、扇形(扇環)形状の複数の単位領域を決定することにより、画像内に映されている物体が画像内で移動あるいは回転した場合であっても、この物体の移動あるいは回転に対応することができる。これは、画像内の物体が画像の中央を中心にして回転した場合、この物体が回転していない画像において、物体の特徴部分が存在する単位領域に当該特徴部分が含まれている可能性が、格子状に単位領域を分割するものに比べて高いと考えられるからである。この考え方は、上述において、図8〜11を参照して説明した通りである。
また、上述の通り、領域決定部31が、各単位領域が隣接する単位領域と重複するように、ぼかし画像を分割することにより、画像内の物体が移動あるいは回転した場合であっても、重複する領域に対応する画像内の物体の移動あるいは回転に対応することができる。つまり、画像内における物体が、±5画素分の位置ずれ、あるいは、±15°分の回転をした場合であっても、単位領域毎に含まれる物体の特徴的な部分を各領域に含ませることができる。したがって、特徴量算出部314が単位領域毎に平均および分散を算出して特徴量を求めた際に、回転された画像と回転されていない画像とで、各単位領域における特徴量を概ね同等にすることができる。つまり、特徴量算出部314が単位領域毎に平均および分散を算出して特徴量を求めた際に、回転された画像220と回転されていない画像200とでは、平均や分散の並び順が概ね同じになる。これによって、画像特徴量を抽出した学習用の画像に比べて、類似画像検索の対象である画像内の物体の位置がずれている場合であっても、その位置ずれによる類似画像検索の精度の低減を軽減することができる。
【0077】
また、特徴量取得装置1は、データの特性を端的に示す指標である平均および分散に基づいて特徴量を取得するので、画像毎の特性の違いを適切に反映し、比較的次元数の少ない特徴量を得ることができる。
特に本願発明者の行った実験にて、平均および分散に基づいて特徴量を取得することにより、GISTによって得られる特徴量よりも少ない次元の特徴量にて、GISTと同等の精度にて画像分類や類似画像検索を行うことができた。
【0078】
また、方向画像算出部311が、微分画像データを算出し、算出した微分画像データに基づいて方向画像を算出することにより、ガボールフィルタ(Gabor filter)を用いて方向画像を求める方法よりも、少ない演算量で方向画像を得ることができる。
また、ぼかし処理部312が複数段階のぼかし処理を行い、特徴量算出部314が、ぼかし処理の各段階で得られるぼかし画像データについて特徴量を求めることにより、この特徴量を用いて、ピントが合っている画像とピントが合っていない画像との類否判断など、画像のぼけ具合に関わらず、画像類否判断や画像分類等の処理を適切に行うことが出来る。
【0079】
また、特徴量次元圧縮部41が、主成分分析等の次元圧縮技術を用いて特徴量の次元を圧縮することにより、画像類否判断や画像分類等の際の精度を保持しつつ、特徴量のデータ量を圧縮できる。このデータ量の圧縮により、特徴量を記憶するためのメモリ容量を削減できると共に、画像類否判断や画像分類等の際の、特徴量の類否判定の演算量を削減できる。
【0080】
なお、特徴量取得装置1が、前処理部21の一部または全部を備えない構成としてもよい。これにより、装置の構成を簡略化し、また、計算量を削減できる。
一方、前述したように、特徴量取得装置1が、対数演算部211を具備することにより、画素値が比較的小さいレベル(人間の目が明るさの差を感じやすいレベル)におけるコントラストが強調され、より適切に画像の特徴を特徴量に反映させることが可能となる。
また、フィルタリング部212を具備することにより、画像データの微細な部分の特徴量への影響を抑圧できる。また、色空間変換部213を具備することにより、色の違いの特徴量への影響を軽減して、より適切な特徴量を得ることが可能になる。
【0081】
また、特徴量取得装置1が、方向画像算出部311と、ぼかし処理部312と、領域決定部313との一部または全部を具備しない構成としてもよい。例えば、特徴量取得装置1が方向画像算出部311を具備しない場合は、特徴量算出部314は、方向画像に換えて、入力画像あるいは入力画像に対して前処理等の処理が行われた画像に基づいて特徴量を算出する。これにより、装置の構成を簡略化し、また、計算量を削減できる。
一方、前述したように、特徴量取得装置1が、方向画像算出部311を具備することにより、画像中に含まれる物の形状が強く反映された特徴量を得ることができる。また、ぼかし処理部312を具備することにより、画像中の輪郭等のぼけ具合に関わらず、より適切に画像の類否判断等を行える特徴量を取得できる。また、領域決定部313を具備することにより、特徴量算出部314が特徴量を算出する際に、人間の視覚の特性に応じて、画像の中心ほど大きい値の重み係数を乗じて重み付けを行うことができる。
なお、ぼかし処理部312が行うぼかし処理は、上述した4段階の処理に限らない。例えば、3段階など、4段階以外の処理を行うようにしてもよい。
【0082】
また、特徴量取得装置1が、特徴量次元圧縮部41を具備しない構成としてもよい。これにより、装置の構成を簡略化し、また、計算量を削減できる。また、特徴量次元圧縮部41による特徴量の次元圧縮を行わない場合でも、上述したように、例えばGISTにおける特徴量と比べて次元の小さい特徴量が得られる。
一方、前述したように、特徴量取得装置1が、特徴量次元圧縮部41を具備することにより、次元圧縮前の特徴量に含まれる、画像の相違点を示す情報の多くを保持しつつ、特徴量の次元をさらに小さくできる。
【0083】
また、本発明に係る特徴量算出部314は、上述の機能を有するものに限られず、例えば、カラーヒストグラムやカラーモーメント等を計算することにより、画像の特徴量を算出するものであってもよい。
この場合、特徴量取得部31は、方向画像算出部311による方向画像データの生成をすることなく、前処理部21から入力する色空間変換画像データに基づき、ぼかし処理312による処理を行ったぼかし画像について、領域決定部313によって決定された単位領域毎に、カラーヒストグラムあるいはカラーモーメントを算出して、入力画像の特徴量を算出する。
【0084】
<第2実施形態>
第2実施形態では、第1実施形態で説明した特徴量取得装置を用いて類似画像を検索する類似画像検索装置の一例について説明する。
図17は、本発明の第2実施形態における類似画像検索装置の概略構成を示す構成図である。同図において、類似画像検索装置6は、入力部61と、表示部62と、記憶部63と、検索対象画像取得部64と、特徴量取得装置1と、類似画像検索部65と、検索結果表示処理部66とを具備する。なお、特徴量取得装置1は、上述において説明した第1実施形態に係る特徴量取得装置1である。
【0085】
入力部61は、マウスやキーボード等の入力デバイスを具備し、類似画像検索の元画像となる検索対象画像の指定など、類似画像検索装置6のユーザによる入力操作を受け付ける。表示部62は、例えば液晶ディスプレイによる表示画面を備え、画像やテキスト等の各種データを表示する。特に、表示部62は、類似画像検索装置6による類似画像の検索結果を表示する。
記憶部63は、類似画像検索装置6が検索する類似画像の候補である複数の候補画像を、特徴量と対応付けて予め記憶する。
【0086】
検索対象画像取得部64は、ユーザの入力操作に基づいて、類似画像検索の元画像となる検索対象画像を取得する。
特徴量取得装置1は、図1の特徴量取得装置と同様であり、検索対象画像取得部64から入力される画像の特徴量を取得する。
類似画像検索部65は、検索対象画像取得部64が取得した検索対象画像と類似する類似画像を、記憶部63の記憶する候補画像の中から選択する。すなわち、類似画像検索部65は、記憶部63を検索して類似画像を取得する。検索結果表示処理部66は、類似画像検索部65が選択した類似画像を表示部62に表示させる。
【0087】
次に、類似画像検索装置6の動作について説明する。
図18は、類似画像検索装置6が行う画像検索の処理手順の概略を示すフローチャートである。同図において、まず、ステップST211で、検索対象画像取得部64は、類似画像検索の元画像(対象)となる検索対象画像の指定を受け付ける。次に、ステップST212で、特徴量取得装置1は、検索対象に指定された画像の特徴量を取得する。次に、ステップST213で、類似画像検索部65は、特徴量取得装置1が取得した特徴量に基づき検索対象の画像に類似する類似画像を検索する。次に、ステップST214で、検索結果表示処理部66は、検索により得られた類似画像を表示する。以下、これらのステップの各々について詳細に説明する。
【0088】
ステップST211において、検索対象画像取得部64は、類似画像検索の元画像(対象)となる検索対象画像の指定を受け付ける。
ここで、図19は、検索対象画像の指定に際して表示部62が表示する画面の例を示す図である。
【0089】
例えば、類似画像検索装置6は、図19に示されるように、複数の画像のサムネイルを表示するとともに、各画像の下に「似た画像」と示す選択欄が付されたウェブページを、表示部62が表示する。ここで表示部62が表示するウェブページは、例えば、検索対象画像取得部64が、類似画像検索装置6のユーザによる類似画像検索要求操作に従って、ユーザが閲覧中のウェブページに含まれる複数の画像を、1枚のウェブページに纏め、「似た画像」の選択欄を付したものである。言い換えると、このウェブページは、ユーザが閲覧中のウェブページに含まれる全ての画像を類似画像検索の対象画像として表示するとともに、当該画像に類似する類似画像の検索をユーザが指示するための「似た画像」の選択欄を当該画像の付近に表示するものである。
そして、入力部61は、ユーザがこの選択欄のいずれかをマウスクリックすることによる検索対象画像の選択操作を受け付ける。そして、検索対象画像取得部64は、入力部61が受け付けた選択操作に基づいて、マウスクリックされた選択欄に対応付けられている画像を、検索対象画像として取得(決定)し、取得した検索対象画像を特徴量取得装置1に出力する。その後、ステップST212に進む。
【0090】
なお、検索対象画像の候補は、上述した、ユーザが閲覧中のウェブページに含まれる複数の画像に限らない。類似画像検索装置6(検索対象画像取得部64)は、様々な画像を検索対象画像とすることができる。例えば、検索対象画像取得部64が、記憶部63が記憶する画像の中からユーザによって選択された画像を、検索対象画像として取得するようにしてもよい。
また、検索対象画像の指定方法は、上述した選択欄をマウスクリックする方法に限らない。例えば、ユーザが、検索対象に指定したい画像をスキャナに読み取らせ、検索対象画像取得部64が、スキャナから入力画像データを取り込むようにしてもよい。あるいは、ユーザが、検索対象に指定したい画像のファイル名を、入力部61のキーボードを用いて入力することによって、検索対象画像を指定するようにしてもよい。
【0091】
ステップST212において、特徴量取得装置1が、第1実施形態で説明した特徴量取得方法を用いて、指定された検索対象画像の特徴量を取得する。
ステップST213において、類似画像検索部65は、特徴量取得装置1が取得した特徴量に基づき、類似画像検索を行う。
ここで、記憶部63は、検索対象画像に類似する類似画像の候補である複数の候補画像と、ステップST212で特徴量取得装置1が行う特徴量取得方法を当該候補画像に適用して得られる特徴量とをそれぞれ対応付けて、予め記憶している。記憶部63が記憶する候補画像は、例えば、類似画像検索装置6がバックグラウンドで、インターネット上の予め指定されたウェブページから取得した画像である。そして、類似画像検索装置6は、このウェブページから取得した画像を、特徴量取得装置1に出力して特徴量を取得し、画像と特徴量とを対応付けて、記憶部63に予め(類似画像検索開始前に)書き込んでおく。
【0092】
そして、類似画像検索部65は、記憶部63を参照して、候補画像の各々について、当該候補画像の特徴量と検索対象画像の特徴量との距離(以下、「画像間距離」と称する)を算出し、算出した画像間距離に基づいて類似画像(検索結果画像)を選択する。
ここでいう画像間距離とは、2つの特徴量の類似度を示す尺度である。例えば、類似画像検索部65は、式(11)に基づいて、候補画像のうちj番目の画像(ここでの順序付けは、候補画像の順序を一意に決定できる順序付けであればよい。例えば、記憶部63のメモリ空間において、各候補画像が記憶されている記憶領域の先頭アドレスの小さい順を用いることができる。)と検索対象画像との画像間距離を算出する。
【0093】
【数11】

【0094】
ここで、記憶部63の記憶する候補画像の数をM枚として、jは1≦j≦Mの正整数である。また、Nは、特徴量取得装置1が取得する特徴量の次元数であり、N個のスカラー量で1枚の画像の特徴量が示されているとする。また、二次元配列D(i,j)の第j列にあたるN次元ベクトルD(i,j)(1≦i≦N)は、候補画像のうちj番目の画像の特徴量を示し、N次元ベクトルd(i)(1≦i≦N)は、検索対象画像の特徴量を示し、S(j)は、候補画像のうちj番目の画像と、検索対象画像との画像間距離を示す。
【0095】
類似画像検索部65は、この画像間距離S(j)が小さい候補画像ほど、検索対象画像に類似する(画像の類似度が高い)と判定する。すなわち、M枚全ての画像と検索対象画像との間の画像間距離S(j)を計算し、次にS(j)の小さいものから順にR個(0≦R≦M)を検索結果として選び出すことで、類似画像検索を行う。そして、類似画像検索部65は、検索結果を検索結果表示処理部66に出力する。例えば、記憶部63が、各候補画像を識別する画像番号と当該候補画像とを対応付けて記憶しておき、類似画像検索部65は、画像間距離の小さい順にR個の画像番号を検索結果表示処理部66に出力する。
なお、類似画像検索部65が画像間距離を取得する方法は、上述した方法に限らず、各候補画像と検索対象画像との類似度を示す画像間距離を得られる方法であればよい。例えば、式(11)に示される式に代えて、式(12)に示される式を用いるようにしてもよい。
【0096】
【数12】

【0097】
ここで、N、i、j、D(i,j)、d(i)、S(i)は、式(11)で説明したのと同様である。
【0098】
ステップST214において、検索結果表示処理部66は、検索結果を表示する。
例えば、検索結果表示処理部66は、類似画像検索部65から出力される検索結果を、類似画像検索部65から出力される順(画像間距離の小さい順)にサムネイル表示する。
【0099】
このように、類似画像検索装置6は、第1実施形態で説明した特徴量取得方法を用いて類似画像を検索するので、画像特徴量を抽出した類似画像の候補である複数の候補画像に比べて、類似画像検索の対象である画像内の物体の位置がずれている場合であっても、その位置ずれによる類似画像検索の精度の低減を軽減することができる。
また、比較的次元数の少ない特徴量を用いて、適切な類似画像を行うことができる。すなわち、記憶部63が特徴量を記憶するための記憶容量を削減しつつ、適切に類似画像を検索することができる。
【0100】
なお、特徴量取得装置1または類似画像検索装置6の各部の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより各部の処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。
また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の保持装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含むものとする。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
【0101】
以上、この発明の実施形態を図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計変更等も含まれる。
【符号の説明】
【0102】
1・・・特徴量取得装置、11・・・画像取得部、21・・・前処理部、211・・・対数演算部、212・・・フィルタリング部、213・・・色空間変換部、31・・・特徴量取得部、311・・・方向画像算出部、312・・・ぼかし処理部、313・・・領域決定部、314・・・特徴量算出部、41・・・特徴量次元圧縮部、51・・・特徴量出力部、6・・・類似画像検索装置、61・・・入力部、62・・・表示部、63・・・記憶部、64・・・検索対象画像取得部、65・・・類似画像検索部、66・・・検索結果表示処理部

【特許請求の範囲】
【請求項1】
入力する入力画像の画像データに基づき画素毎に画素値の対数を示すコントラスト強調画像データを生成する対数演算部と、
前記コントラスト強調画像データから高周波成分を除去した高周波成分除去画像データを生成するフィルタリング部と、
前記高周波成分除去画像データに基づき、各画素を基準とした方位に応じて各画素に対応する画像内の特徴量を表わす方向画像データを算出する方向画像算出部と、
前記方向画像データに対して画像中の輪郭をぼかすためのフィルタを適用してぼかし画像データを生成するぼかし処理部と、
前記ぼかし画像データに基づき、画像上において特徴量を算出するために画像を区分する単位領域として、同心円の複数の扇状形状の領域を決定する領域決定部と、
前記ぼかし画像データの画素値の平均を前記単位領域毎に算出することにより、前記入力画像の特徴量を算出する特徴量算出部と、
を備えることを特徴とする特徴量取得装置。
【請求項2】
前記入力画像の画像データ、前記コントラスト強調画像データ、および前記高周波成分除去画像データのうち少なくともいずれか1つのデータにおいて表わされている色空間を予め決められている他の色空間に変換する色空間変換部をさらに有することを特徴とする請求項1に記載の特徴量取得装置。
【請求項3】
前記特徴量算出部は、前記ぼかし画像データの画素値の平均および分散を前記単位領域毎に算出し、算出した平均および分散に基づく特徴量を求めることを特徴とする請求項1あるいは2に記載の特徴量取得装置。
【請求項4】
入力する入力画像の画像データに基づき、画像上において特徴量を算出するために画像を区分する単位領域として、同心円の複数の扇状形状の領域を決定する領域決定部と、
前記画像データのカラーヒストグラムを前記単位領域毎に算出することにより、前記入力画像の特徴量を算出する特徴量算出部と、
を備えることを特徴とする特徴量取得装置。
【請求項5】
入力する入力画像の画像データに基づき、画像上において特徴量を算出するために画像を区分する単位領域として、同心円の複数の扇状形状の領域を決定する領域決定部と、
前記画像データのカラーモーメントを前記単位領域毎に算出することにより、前記入力画像の特徴量を算出する特徴量算出部と、
を備えることを特徴とする特徴量取得装置。
【請求項6】
前記単位領域は、隣接する単位領域と重複する形状であることを特徴とする請求項1〜5のいずれか一項に記載の特徴量取得装置。
【請求項7】
請求項1〜6のいずれか一項に記載の特徴量取得装置を備える類似画像検索装置であって、
前記入力画像に類似する類似画像の候補である複数の候補画像を示す情報と、前記特徴量算出部によって算出された前記候補画像の特徴量とをそれぞれ対応付ける情報を記憶する記憶部と、
前記記憶部を参照して、前記特徴量算出部によって算出された前記入力画像の特徴量と前記候補画像の特徴量との類似度を算出し、当該類似度に基づいて前記入力画像に類似する前記候補画像を得る類似画像検索部と、
を備えることを特徴とする類似画像検索装置。
【請求項8】
入力する入力画像の画像データに基づき画素毎に画素値の対数を示すコントラスト強調画像データを生成する対数演算処理ステップと、
前記コントラスト強調画像データから高周波成分を除去した高周波成分除去画像データを生成するフィルタリング処理ステップと、
前記高周波成分除去画像データに基づき、各画素を基準とした方位に応じて各画素に対応する画像内の特徴量を表わす方向画像データを算出する方向画像算出処理ステップと、
前記方向画像データに対して画像中の輪郭をぼかすためのフィルタを適用してぼかし画像データを生成するぼかし処理ステップと、
前記ぼかし画像データに基づき、画像上において特徴量を算出するために画像を区分する単位領域として、同心円の複数の扇状形状の領域を決定する領域決定処理ステップと、
前記ぼかし画像データの画素値の平均を前記単位領域毎に算出することにより、前記入力画像の特徴量を算出する特徴量算出処理ステップと、
を備えることを特徴とする特徴量取得方法。
【請求項9】
コンピュータに、請求項8に記載の特徴量取得方法の各ステップを実行させるためのプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate


【公開番号】特開2012−146221(P2012−146221A)
【公開日】平成24年8月2日(2012.8.2)
【国際特許分類】
【出願番号】特願2011−5320(P2011−5320)
【出願日】平成23年1月13日(2011.1.13)
【新規性喪失の例外の表示】特許法第30条第1項適用申請有り 平成22年7月26日 社団法人映像情報メディア学会発行の「映像情報メディア学会技術報告 映情学技報 Vol.34 No.32」に発表
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】