説明

特徴量生成装置、方法及びプログラム

【課題】高い認識精度を維持しつつ特徴量の次元数を削減することができる特徴量生成装置、方法及びプログラムを提供する。
【解決手段】特徴量生成装置は、入力画像を分割し、分割された各部分領域から、例えば勾配方向をヒストグラム化した特徴量を抽出し、分割された部分領域を複数選択し、選択された部分領域を処理単位として、部分領域の位置に応じた重み付けを行い、特徴量を次元ごとに合算することにより特徴量の次元削除を行う。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、特徴量生成装置、方法及びプログラムに関する。
【背景技術】
【0002】
画像の特徴量を生成し、これを用いて画像中の物体を認識する技術が知られている。画像中の物体を認識するための特徴量を生成する手法として、非特許文献1のHOG(Histograms of Orientation Gradients)特徴量や、非特許文献2のPHOG(Pyramid of Histograms of Orientation Gradients)特徴量などが提案されている。
【0003】
HOG特徴量は、画像の局所領域における勾配方向をヒストグラム化した特徴量を生成する。例えば図3に示すような、縦に6分割、横に8分割の計48個の部分領域に分割した入力画像についてHOG特徴量を生成する場合、まず、各部分領域について20度ごとに算出した勾配方向のヒストグラムを生成する。20度ごとに勾配方向を算出すると、180度÷20度の9種類の勾配が定義される。したがって、図3の部分領域1からは、9次元の勾配方向ヒストグラムが生成される。残りの部分領域についても同様に勾配方向ヒストグラムを生成する。次に、s部分領域ずつずらしながら、n×n(縦n個、横n個)部分領域ごとに特徴量の正規化を行い、HOG特徴量を生成する。例えば、s=1、n=2の場合、{1,2,7,8}の4部分領域で正規化を行い、4部分領域×9次元の特徴量を生成する。1部分領域ずつずらしながら、{2,3,8,9}{3,4,9,10}・・・というように特徴量を生成し、入力画像に対する特徴量として、計4部分領域×9次元×5×7=1260次元の特徴量が生成される。HOG特徴量の次元数は、入力画像を最初にm×mに分割し、部分領域ごとにd次元の特徴を抽出する場合、(n×n)×d×(m−(n−s))×(m−(n−s))で計算できる。
【0004】
PHOG特徴量は、HOG特徴量を多重解像度化して生成する。2階層のPHOG特徴量の生成では、まず1階層目は前述のHOG特徴量を用い、次に2階層目の特徴量を生成する。例えば図4に示すような、前述したHOG特徴量の部分領域1(図3参照)等をさらに半分に分割した入力画像について、{1’,2’,13’,14’}等の部分領域を作成し、解像度の高い特徴量を抽出する。分割した部分領域で、例えば、s=1、n=2の場合、{1’,2’,13’,14’}の4部分領域で正規化を行い、4部分領域×9次元の特徴量を生成する。そして1部分領域ずつずらしながら、{2’,3’,14’,15’}{3’,4’,15’,16’}・・・というように特徴量を生成し、計4部分領域×9次元×11×15=5940次元の特徴量が生成される。最後に、1階層目と2階層目の特徴量を結合する。この例においてPHOGでは1枚の入力画像に対して、合計5940+1260=7200次元の特徴量が生成される。このように解像度の高い特徴量を抽出するために、画像を一定の大きさで分割した部分領域の多階層化を行うことで、物体認識精度の向上が可能になる。
【先行技術文献】
【特許文献】
【0005】
【非特許文献1】N. Dalal, B. Triggs. "Histograms of Oriented Gradients for Human Detection". Proc. CVPR, pp.886-893, 2005.
【非特許文献2】A. Bosch, A. Zisserman, X. Munoz. "Representing shape with a spatial pyramid kernel". Proc. CVPR, pp.401-408, 2007.
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、上述の手法では特徴量の次元数が多いため処理に時間がかかるという問題があった。特に、非特許文献2の特徴量生成方式では、画像を一定の大きさで分割した部分領域の多階層化を行うほど、特徴量の次元数が増大し、必要なメモリ容量や処理時間が増加するという問題があった。
【0007】
本発明は、上記問題点に鑑みてなされたもので、高い認識精度を維持しつつ特徴量の次元数を削減することができる特徴量生成装置、方法及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0008】
本発明は、画像を分割し、分割された各部分領域から特徴量を抽出する局所特徴量手段と、前記局所特徴量抽出手段により分割された部分領域を複数選択する部分領域選択手段と、選択された部分領域を処理単位として特徴量の次元削除を行う特徴量次元削減手段と、を備えることを特徴とする特徴量生成装置である。
【0009】
本発明は、画像を分割し、分割された各部分領域から特徴量を抽出し、前記局所特徴量抽出手段により分割された部分領域を複数選択し、選択された部分領域を処理単位として特徴量の次元削除を行うことを特徴とする特徴量生成方法である。
【0010】
本発明は、コンピュータに、画像を分割し、分割された各部分領域から特徴量を抽出する局所特徴量処理、前記局所特徴量抽出処理により分割された部分領域を複数選択する部分領域選択処理、選択された部分領域を処理単位として特徴量の次元削除を行う特徴量次元削減処理、を実行させることを特徴とするプログラムである。
【発明の効果】
【0011】
本発明によれば、高い認識精度を維持しつつ特徴量の次元数を削減することができる。
【図面の簡単な説明】
【0012】
【図1】図1は本発明の第1の実施形態に係る特徴量生成装置のブロック図である。
【図2】図2は本発明の第1の実施形態に係る特徴量生成装置の動作を説明するためフローチャートである。
【図3】図3は縦に6分割、横に8分割の計48個の部分領域に分割した画像を示す図である。
【図4】図4は図3の画像の各部分領域をさらに半分に分割した画像を示す図である。
【発明を実施するための形態】
【0013】
以下、本発明の実施形態について図面を参照して説明する。
【0014】
(第1の実施形態)
図1は、本発明の第1の実施形態に係る特徴量生成装置のブロック図である。図示されるように、この特徴量生成装置は、画像入力装置110と、データ処理部120と、特徴量出力装置130とを備える。
【0015】
画像入力装置110は、スチルカメラやビデオカメラといった撮像システムで撮影した画像をデータ処理部120の局所特徴量抽出部121に入力する。
【0016】
データ処理部120は、局所特徴量抽出部121と、部分領域選択部122と、特徴量次元削減部123とを含む。
【0017】
局所特徴量抽出部121は、入力された画像を一定の大きさの部分領域に分割し、分割した部分領域から特徴量を抽出する。部分領域選択部122は、分割した部分領域の中から複数の部分領域を選択する。特徴量次元削減部123は、部分領域選択部122で選択した領域間で次元削減を行う。
【0018】
特徴量出力装置130は、特徴量次元削減部123によって生成された特徴量を出力する。
【0019】
次に、本実施形態にかかる特徴量生成装置の動作について説明する。図2は、本特徴量生成装置による動作の一例を示すフローチャートである。
【0020】
まず、画像入力装置110は、スチルカメラやビデオカメラから取得した画像やWEBに投稿された画像を取得し、局所特徴量抽出部121に渡す(ステップS1)。
【0021】
局所特徴量抽出部121は、入力画像を一定の大きさの部分領域に分割し、分割した部分領域から局所特徴量を抽出する(ステップS2)。局所特徴量の抽出は、例えば非特許文献1で採用されている勾配方向ヒストグラムを用いてもよいし、SIFT(Scale-Invariant Feature Transform)やSURF(Speeded Up Robust Features)などを部分領域ごとに抽出する方法を用いても良い。
【0022】
勾配方向ヒストグラムの場合、画素Xiの勾配方向θはdx=X(i+1)−X(i−1)、dy=Y(i+1)−Y(i−1)として、θ=arctan(dy/dx)で計算し、勾配強度Lは|L|=SQRT(dx×dx+dy×dy)で計算する。ブロック内部で、すべてのXiについて、勾配方向θと勾配強度Lを算出した後、θに相当するビンに勾配強度Lを加算する。なお、ここでは画像を分割してから勾配方向や勾配強度を算出したが、先に勾配方向や勾配強度を算出してから、画像を分割しても良い。
【0023】
次に、複数の部分領域から構成される、局所特徴量の次元削減を行う単位領域(複数の部分領域)を、部分領域選択部122を用いて選択する(ステップS3)。部分領域選択部122は、例えば部分領域間の距離に基づいて、部分領域を複数選択する。例えば図4に示すような、縦に12分割、横に18分割した入力画像において、基準となる部分領域から距離が1である部分領域を選択する場合、部分領域{14’}を基準として見ると、距離が1の部分領域は{2’,13’,15’,26’}となる。また、基準となる部分領域{14’}からの距離が√2以下の部分領域を選択する場合は、{1’,2’,3’,13’,15’,25’,26’,27’}を選択することになる。別の例では、画像の縦軸を対称軸とし、横幅の中間位置に対して対称軸を設定した場合、{14’}について距離が0の部分領域は{23’}、距離が1の部分領域は{10’,11’,12’,22’,24’,34’,35’,36’}となる。
【0024】
対称軸を設定した方がよい画像例として、洋服画像が挙げられる。洋服は左右対称になっていることが多いため、対称の位置にある部分領域の特徴量と似ている。複数の似た特徴量が選択できると1つの特徴量に集約できるため、次元削減の効果が見込まれる。
【0025】
また、多階層化により特徴量を生成する場合等において、分割前の部分領域に含まれる部分領域単位で選択してもよい。例えば図3に示す入力画像で1階層目の特徴量生成を行い、この画像の各部分領域をさらに半分に分割した画像(図4)で2階層目の特徴量を生成する場合、図3の画像の部分領域{1}に相当する、図4の分割後の画像の部分領域{1’,2’,13’,14’}を選択するようにしてもよい。
【0026】
また、予め画像中から部分領域の類似度を算出し、類似度に基づいて部分領域を複数選択してもよい。例えば、全画像から平均画像を作成し、平均画像中から部分領域ごとに局所特徴量を算出する。部分領域ごとに局所特徴量の類似度をヒストグラムインターセクションにより算出する。なお、類似度は部分領域の特徴量の差が小さい場合に類似度が大きくなる値であればよい。
【0027】
最後に、選択した複数の部分領域で次元削減を、特徴量次元削減部123を用いて行う(ステップS4)。特徴量次元削減部123は、複数選択された部分領域の位置に応じた重み付けを行い、特徴量を次元ごとに合算する。例えば、前記14’について距離が√2以下の部分領域を選択した場合、{1’,2’,3’,13’,15’,25’,26’,27’}の部分領域について、重みを設定する。部分領域の位置(x、y)における次元削減後のn次元の特徴量Vは、部分領域v(x、y)と重みα(x、y)を用いて、次元ごとに式1により計算される。ここで重みαを、位置(x、y)を中心とするガウス分布とすると、αは式2で表される。なお、ここではガウス分布は等方性を仮定したが非等方性でも良い。
【0028】
【数1】

【0029】
【数2】

【0030】
また、特徴量を次元ごとに合算するのではなく、複数選択された部分領域の各次元の中央値を用いてもよい。対称の位置にある複数の部分領域に対して次元削減を行う場合は、予め対称軸に対して部分領域を反転させた後、前述の次元削減を行ってもよい。このように、本発明では部分領域に対する次元削減を行うことで、特徴量を減らすことができる。
【0031】
次に、本発明の第1の実施形態の実施例について詳細に説明する。
【0032】
まず、データ処理部120の局所特徴量抽出部121は、入力画像に対して縦・横方向に分割を行う。例えば、入力画像が480×640サイズで、横方向12、縦方向16の一定の大きさで分割する場合、1部分領域は40ピクセル×40ピクセルから構成される。次に、部分領域ごとに勾配方向ヒストグラムの局所特徴量を抽出する。勾配方向が20度間隔のヒストグラムを作成する場合、0度から180度と、180度から360度について、例えば、方向30度と、方向210度は、同じ方向として扱い、次元数は180÷20=9次元となる。
【0033】
次に、部分領域選択部122は次元削減の処理単位となる部分領域を選択する。例えば図4の画像において2×2の部分領域を選択する場合、まず、{1’,2’,13’,14’}を選択する。更に、1部分領域ずつずらしながら{2’,3’,14’,15’}・・・を選択する。選択した部分領域は、横方向11、縦方向15の領域からなる。
【0034】
次に、特徴量次元削減部123は、特徴量の次元削減を行う。例えば図4の画像では、選択された複数の部分領域毎で重みが等しい平均化を行う。この場合、各部分領域は9次元で構成され、4つの部分領域の平均化を行うため、特徴量は9次元のままである。以上から、図4の画像での全特徴量の次元数は9次元×11×15=1485次元となる。
【0035】
次に、第1の実施の形態の効果について説明する。例えば図3、図4を用いて上述したように多層化により特徴量を生成する場合であって、1階層目は通常のHOG特徴量を生成し、2階層目について本発明の手法により特徴量を生成する場合、1枚の入力画像から、(1階層目で生成した1260次元の特徴量)+(2階層目で生成した1485次元の特徴量)=2745次元の特徴量が生成される。
【0036】
例えば非特許文献2に示すようなPHOG特徴量の生成方法と、本発明による特徴量の生成方法のそれぞれで、洋服画像2532枚を5カテゴリに分類する実験を行ったところ、両者ともに分類精度は73%であった。PHOG特徴量の特徴量の次元数は7200次元であることから、精度は同等で、次元数を約1/3に抑えることができた。従って、本発明は、認識精度を維持しつつ特徴量の次元数を削減することができる。
【0037】
また、本発明によれば、認識精度を維持しつつ特徴量の次元数を削減することができるため、画像中の物体を高速に認識するといった用途に適用できる。特に、携帯端末のようなCPUスペックが比較的低い処理能力の端末においても、画像中の物体を認識し、関連する情報を、表示デバイスを通して高速に提示できることが必要なFA(Factory Automation)用途に用いることができる。
【0038】
上述した本発明の実施形態に係る画像処理装置の局所特徴量抽出部121、部分領域選択部122、特徴量次元削減部123は、本特徴量生成装置のCPU(Central Processing Unit)が記憶部に格納された動作プログラム等を読み出して実行することにより実現されてもよく、また、ハードウェアで構成されてもよい。上述した実施の形態の一部の機能のみをコンピュータプログラムにより実現することもできる。
【0039】
以上、好ましい実施の形態をあげて本発明を説明したが、本発明は必ずしも上記実施の形態に限定されるものではなく、その技術的思想の範囲内において様々に変形し実施することが出来る。
【符号の説明】
【0040】
110 画像入力装置
120 データ処理部
121 局所特徴量抽出部
122 部分領域選択部
123 特徴量次元削減部
130 特徴量出力装置

【特許請求の範囲】
【請求項1】
画像を分割し、分割された各部分領域から特徴量を抽出する局所特徴量手段と、
前記局所特徴量抽出手段により分割された部分領域を複数選択する部分領域選択手段と、
選択された部分領域を処理単位として特徴量の次元削除を行う特徴量次元削減手段と、
を備えることを特徴とする特徴量生成装置。
【請求項2】
前記部分領域選択手段は、部分領域間の距離に基づいて、部分領域を複数選択する
ことを特徴とする請求項1に記載の特徴量生成装置。
【請求項3】
前記次元削減手段は、前記部分領域選択手段で選択された複数の部分領域の特徴量に対して、部分領域間の距離に応じて減衰する重み付けを行い、特徴量を次元ごとに合算する
ことを特徴とする請求項1又は2に記載の特徴量生成装置。
【請求項4】
画像を分割し、分割された各部分領域から特徴量を抽出し、
前記局所特徴量抽出手段により分割された部分領域を複数選択し、
選択された部分領域を処理単位として特徴量の次元削除を行う
ことを特徴とする特徴量生成方法。
【請求項5】
前記部分領域間の距離に基づいて、前記複数の部分領域を選択する
ことを特徴とする請求項4に記載の特徴量生成方法。
【請求項6】
前記特徴量の次元削減では、前記複数選択された複数の部分領域の特徴量に対して、部分領域間の距離に応じて減衰する重み付けを行い、特徴量を次元ごとに合算する
ことを特徴とする請求項4又は5に記載の特徴量生成方法。
【請求項7】
コンピュータに、
画像を分割し、分割された各部分領域から特徴量を抽出する局所特徴量処理、
前記局所特徴量抽出処理により分割された部分領域を複数選択する部分領域選択処理、
選択された部分領域を処理単位として特徴量の次元削除を行う特徴量次元削減処理、
を実行させることを特徴とするプログラム。
【請求項8】
前記部分領域選択処理は、部分領域間の距離に基づいて、部分領域を複数選択する
ことを特徴とする請求項7に記載のプログラム。
【請求項9】
前記次元削減処理は、前記部分領域選択処理で選択された複数の部分領域の特徴量に対して、部分領域間の距離に応じて減衰する重み付けを行い、特徴量を次元ごとに合算する
ことを特徴とする請求項7又は8に記載のプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate


【公開番号】特開2013−97583(P2013−97583A)
【公開日】平成25年5月20日(2013.5.20)
【国際特許分類】
【出願番号】特願2011−239863(P2011−239863)
【出願日】平成23年11月1日(2011.11.1)
【出願人】(000004237)日本電気株式会社 (19,353)
【Fターム(参考)】