説明

画像を表す特徴ベクトルを導き出す方法、画像分類方法、および画像解析装置

【課題】画像の記述、分類、かつ/またはマッチングを行う方法および装置であって、計算的に単純である、方法および装置を提供する。
【解決手段】画像、特に画像のテクスチャを分類する方法は、まず、所定のマッピング関数を使用して画像の二次元表現を一次元表現にマッピングすることによってテクスチャを表す特徴ベクトルを導き出すこと、そしてそれから、(i)表現レベルがしきい値と交差するレート、(ii)しきい値に交差するときのレベルの変化レート、および(iii)レベルがしきい値を上回った(または下回った)ままである平均持続期間を求めること、とを含む。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像を解析する方法および装置に関し、特に、画像のテクスチャの解析および分類に関するものである。
【0002】
輝度/色パターンの規則性、粗さ、または滑らかさに関連する、画像中の領域の特定の視覚的特徴は一般にテクスチャ属性と呼ばれる。テクスチャ属性は人間の物体知覚および物体認識にとって重要である。テクスチャ属性はマシンビジョンにおける様々なタスク、たとえば、自動目視検査または衛星画像の解析等の遠隔探査にも適用することが可能である。
【0003】
テクスチャ解析は通常、画像または領域から固有のテクスチャ特徴を抽出することを含み、このテクスチャ特徴を後に画像マッチング、領域分類等に使用することができる。
【0004】
多くの既存のテクスチャ解析手法は3つの大きなクラス:i)構造的手法、ii)統計的手法、およびiii)スペクトル的手法の中の1つに分類することができる。
【0005】
構造的手法では、テクスチャは、小塊(blob)、線分、角等、特定の視覚的基本物(visual primitives)の特徴および空間配置によって特徴付けられる。
【0006】
統計的手法では、テクスチャは、関心領域内の輝度値の統計的な分布によって特徴付けられる。
【0007】
スペクトル的手法では、属性の異なるフィルタのセットが使用され、基礎をなす画像に対するそれぞれの応答が特徴ベクトルとして使用される。たとえば、方向応答および周波数応答が変化するガボールフィルタを使用することが可能である。(D. Dunn, W. HigginsおよびJ. Wakeley著「Texture segmentation using 2-D Gabor elementary functions」、IEEE Trans. Pattern Anal. And Machine Intell., vol. 16, no. 2, Feb. 1994を参照のこと)。
【0008】
これら既知の方法は概して、二次元(2−D)格子として通常定義される画像領域において動作する。
【0009】
画像を、マッピング関数、たとえばペアノ曲線またはヒルベルト曲線等の平面充填曲線を使用して一次元(1−D)表現にマッピングすることができるということも既知である。(Peano G.著「Sur une courbe que remplit toute une aire plane」、 Math Annln., 36, pp.157-160 (1890)、 およびD. Hilbert著「Uber die stetige Abbildung einer Linie auf ein Flachenstuck」、 Math, Annln, 38, pp. 459-460 (1891)を参照のこと)。続けて、1−D信号の属性を、たとえば、フーリエ解析によって解析して、画像のテクスチャ特性を決定することができる。
【0010】
既存の手法の大半は計算集約的である。画像輝度の変化、領域の並行移動および回転に対して不変であるテクスチャの記述、分類、かつ/またはマッチングを行う方法および装置であって、方法は計算的に単純である、方法および装置を提供することが望ましい。
【0011】
本発明の態様は添付の特許請求の範囲に記載される。
【0012】
本発明のさらなる態様によれば、画像の一次元表現が統計的に解析されて、画像を表す特徴ベクトルが導き出される。
【0013】
この解析は、好ましくは、一次元表現を少なくとも1つのしきい値と比較することを含み、以下の中のいずれか1つまたは複数を求めるように構成することができる。
(a)表現がしきい値と交差するレート。
(b)しきい値に交差するポイントにおける表現の平均傾き。ポイントは、表現値が増加しているところにあるポイントを選択しても(平均「上向き傾き」を得る)、または表現値が減少しているところにあるポイントを選択しても(平均「下向き傾き」を得る)よい。代替として、平均上向き傾きおよび平均下向き傾きを両方とも求めてもよく、また単純にすべてのポイントにおける平均傾きを求めてもよい。
(c)表現がしきい値を上回った(または下回った)ままである平均間隔。
【0014】
計算的に単純に得ることのできる上記パラメータが多くの画像クラス、特に画像テクスチャの良好な識別を提供することがわかっている。パラメータ(a)および(b)の組み合わせが特に有効であることが分かっている。
【0015】
本発明による方法の好ましい実施形態は以下のステップを含む。
1.適宜選択された平面充填曲線、たとえば、ターゲット関数での隣接点がソース関数での隣接点でもあるという属性を有する自己回避型の曲線、に基づく変換を利用することにより、2−D関数(「ソース関数」)を1−D関数(「ターゲット関数」)にマッピングするステップ。このような曲線の例はペアノ曲線およびヒルベルト曲線である。
2.結果得られたターゲット関数にしかるべき変換を適用するステップ。このような変換の一例はスケール不変性のターゲット関数を生成する対数変換である。
3.ターゲット関数のダイナミックレンジ内で識別レベルを選択するステップ。
4.ターゲット関数が選択された識別レベルと交差するポイントセットを求めるステップ。
5.セットのしかるべき統計的特徴、たとえば(i)ポイントが発生するレート、(ii)ポイントにおけるターゲット関数の平均傾き、および(iii)ターゲット関数が隣接ポイント間で識別レベルを上回った(または下回った)ままであった平均間隔、を求めるステップ。
6.選択された統計的特徴(ステップ5において求められる)を組み合わせて、ソース関数、ひいては画像を記述する特徴ベクトルを構築するステップ。
【0016】
この特徴ベクトルは、一次元ターゲット関数の一部で表される画像の一部のみに関連してもよい。画像の他の部分についての特徴ベクトルもさらに導き出すことができる。好ましい実施形態では、一次元関数の連続した重複セグメントが解析されて、各特徴ベクトルが導き出される。しかし、セグメントの重複は必要不可欠なことではない。
【0017】
好ましい実施形態では、統計的特徴のそれぞれは、一次元表現をしきい値レベルと比較することによって求められる。しきい値は異なる特徴に対して異なってもよく、またはこういった特徴の中の少なくともいくつかに対して同じであってもよい。また、単純な固定値しきい値を可変しきい値で置き換えることも可能である(本明細書において、「しきい値関数」という語は可変しきい値および固定値しきい値の両方を指すために使用され、関数は所定の定数である)。
【0018】
本発明の改良において、ターゲット関数が異なるそれぞれのしきい値関数と交差するレートを別個に求めることによってより良好な識別が実現される。好ましくは、少なくとも1つのしきい値関数について、交点におけるターゲット関数の平均傾きに2つの別個の値:一方の値は、関数が増加しているときのその関数の傾き(「上向き傾き」)を表し、他方の値は、関数が減少しているときのその関数の傾き(「下向き傾き」)を表す、が導き出される。
【0019】
特徴ベクトルの構築に使用される値のいずれかの導出に、平均値(mean)、中央値、または分散等、平均(average)以外の統計的特徴を使用してもよい。
【0020】
本発明については主に、画像のグレーレベルで表されるテクスチャを解析する文脈の中で説明するが、テクスチャは追加または代替として、色等他の特徴で表すことも可能である。
【0021】
これより、本発明を具現する構成について、添付図面を参照しながら例として説明することにする。
【0022】
図1は、本発明によるテクスチャ分類器のブロック図である。
【0023】
入力画像マッパー(IIM)100は、いわゆるペアノスキャンを採用して、入力210において受け取った二次元(2−D)入力画像のグレーレベル値を、出力212において生成される、ターゲット関数と呼ばれる一次元(1−D)関数で表す。図2A〜図2Cは、9×9ピクセルの参照画像に適用されたペアノスキャンの一例を示す。画像は210'で示され、ペアノスキャンに対応するパスは211で示される。212'に示されるグラフは、出力212において生成されるターゲット関数を表す。この例では、ピクセル幅が1に等しく、したがってグラフ212'上のピクセルインデックスはインデックス0を有するピクセルからの距離に対応するものと想定する。
【0024】
スケール不変変換器(SIT)101はしかるべき対数変換を使用して、IIM100の出力212におけるターゲット関数を、214において、2−D入力画像のダイナミックレンジから独立した値を有するターゲット関数表現に変換する。入力画像のダイナミックレンジは、照明条件の変更、イメージセンサの局所感度の変更その他による影響を受けうる。
【0025】
移動窓セレクタ(MWS)102は、214においてスケール不変変換器(SIT)101からの信号によって駆動され、それ以降の処理に適したターゲット関数表現のセグメントを選択する。これを図3に示す。プロット214'に示すターゲット関数は、それぞれ32ピクセル長の連続し重複した49個のセグメント(300,・・・,348)に細分される。
【0026】
MWS102の出力は、交差レート推定器(CRE)104、交差傾き推定器(CSE)105、および滞留間隔推定器(STE)106を含む複数の特徴推定器の信号入力に並行して与えられる。
【0027】
交差レート推定器(CRE)104の制御入力は参照レベル発生器(RLG)103に接続されて、ターゲット関数表現からの特徴抽出に使用する識別レベルを設定するのに適したレートしきい値関数(この実施形態では単純な定数値)を定義する信号をライン204上で受け取る。同様に、交差傾き推定器(CSE)105および滞留間隔推定器(STE)106も、参照レベル発生器(RLG)103からライン205および206上それぞれにおいて、これら推定器が特徴抽出に使用する識別レベルを設定するのに適した傾きしきい値関数および適した持続期間しきい値関数を定義する信号を受け取る。
【0028】
本実施形態では、3つの推定器はすべて、図4〜図6中で401において示される共通の固定値識別レベルを定義する信号を受け取る。これは別様に選択してもよく、レベル401は、変換器214の一次元出力中の値の中央値を表してもよく、または現在の窓中の値の中央値を表してもよい。しかし代替として、推定器の識別レベルは互いに異なってもよく、また可変であってもよい。
【0029】
図4を参照すると、交差レート推定器(CRE)104は、ターゲット関数表現214がそれぞれ指定されたセグメント内で選択された識別レベル401に交差したポイント数を求める。CREの出力220は、画像テクスチャ分類器ITCの入力に与えられる。図4の例は、4番目の窓であるW4に対して行われた解析に関連するものである。信号は識別レベル401に、T1、T2、・・・、T8とマークされた8回交差する。
【0030】
図5を参照すると、交差傾き推定器(CSE)105は、ターゲット関数表現214'がそれぞれ指定された窓内で選択された識別レベルと交差したポイントにおける傾きの平均値を求める。図5は、ターゲット関数が識別レベル401にポイント:T1、T3、T5、T7(上向き交差)およびT2、T4、T6、T8(下向き交差)で交差する窓W4に関する例を示している。Ψ1、−Ψ2、Ψ3等の傾き値が各ポイントT1、・・・、T8について算出され、それから下向き傾きおよび上向き傾きが別個に平均化され、これらの値が適宜組み合わせられる。交点における表現の傾きまたは勾配の平均を示す結果は、CSEの出力221に提供され、そして画像テクスチャ分類器ITCの入力に与えられる。
【0031】
図6を参照すると、滞留間隔推定器(STE)106は、ターゲット関数表現214がそれぞれ指定されたセグメント内で選択された識別レベルを上回ったままである間隔の平均長を求める。図6は、識別レベル401を使用しての窓W4に関する滞留間隔計算の一例を示すものである。ターゲット関数は4つの間隔501、502、503、および504において識別レベルを上回っているため、STE106はこれら4つの間隔の長さの算術平均を算出する。STE106の出力は画像テクスチャ分類器ITCのさらなる入力222に与えられる。
【0032】
画像テクスチャ分類器(ITC)107は入力において利用可能な特徴データをまとめて処理して、2−D入力画像のテクスチャ分類を行う。テクスチャ分類に使用される手順は、特徴空間全体を関心のあるテクスチャクラスを表す指定数の領域に分割することに基づくことができる。
【0033】
図7は、各次元がCRE104、CSE105、およびSTE106のそれぞれ1つによって生成されたパラメータに対応する三次元(3D)特徴空間Sの一例を示す。空間Sは、各領域が関心のあるM個のテクスチャクラスのうちの1つを表すようにM個の領域S1、S2、・・・、SMに分割される。これらの領域(複数の適した下位領域を含みうる)の1つは、未指定(未知)のテクスチャのクラスを表すために使用することができる。
【0034】
領域は重複しない。すなわち、
【0035】
Si∩Sj=φ, i,j=1,2,...,M i≠j
【0036】
であり、全体の特徴空間Sの分割は網羅的である、すなわち、
S1∪S2∪...∪SM=S
である。
【0037】
本発明による画像解析手順は、出力220、221、および222において、それぞれ利用可能な3つの推定器CRE、CSE、およびSTEからの数値を生成する。3D特徴空間では、このような三つ組を、領域S1、S2、・・・、SMの中の1つに入るはずのポイントとして見ることができる。ポイントがSkに入る(1≦k≦M)場合、テスト中の画像がM個のテクスチャクラスの中のクラスkに属するテクスチャを示していると判断される。
【0038】
特徴空間SのM個の領域への分割は、最小費用や、最小確率の分類誤り等に基づく最適化基準に従って行うことができる。必要とされる分割手順は、統計的決定理論の様々な応用に実行される標準的な演算である。
【0039】
再び図4を参照すると、本発明の改良された実施形態では、参照レベル発生器103は3つの別個の参照レベル401、402、および403を交差レート推定器104に提供する。したがって、CRE104は、その他のしきい値402および403に交差する回数を表すさらに2つの値を提供することができる。図4では、レベル402および403には、それぞれ、U1、U2、・・・、U18およびL1・・・L8に示されるように、18回および8回交差または到達する。
【0040】
また、図5を参照すると、ターゲット関数214'がしきい値と交差するポイントを上向き交差および下向き交差に分類可能なことに気付くことになる。改良された実施形態では、交差傾き推定器105は上向き傾きおよび下向き傾きを別個に平均化するため、1つの値ではなく2つの値を提供する。
【0041】
この実施形態では、交差レート推定器104、交差傾き推定器105、および滞留間隔推定器106によって提供される6つの値が画像テクスチャ分類器107によって使用されて、6次元特徴空間内で画像が分類される。
【0042】
代替の構成では、交差レート推定器104からの3つの値、および/または交差傾き推定器105からの2つの値は、たとえば、各種重み付け係数を使用することによって組み合わせ、それぞれ単一の値を形成することができる。
【0043】
多くの用途において、たとえば一次元関数が、いくつかのビデオシステムで発生しうるように繰り返しスキャンされる画像から導き出される場合、一次元関数が時間領域を占有することが予期される。この場合、ひとつの時間間隔は、この表記上の時間期間中にスキャンされた画像のひとつのセグメントを表すであろう。したがって、この状況におけるターゲット関数の引数は、スキャン曲線上の選択されたポイントからの距離である場合もあれば、または選択された参照時間瞬間から経過した時間である場合もある。
【0044】
実施例は説明を明確にするためにかなり単純なものである。多数の代替の実施例が存在する。代替の実施例は、
(a)異なるマッピング関数を適用すること、
(b)タイプの異なるスケール不変変換を適用すること、
(c)特徴セットの定義に使用するルールを変更すること、
(d)識別信号の数およびレベルを変更すること、および/または
(e)特徴セットの異なる統計的特徴を使用すること、
によって得ることができる。
【0045】
本発明について二次元画像を解析する文脈の中で説明したが、本技法は、しかるべき空間充填曲線を採用することによって多次元データ、特に多次元画像の解析に拡張することが可能である。画像は、従来の視覚的画像であっても、または電磁スペクトルの非視覚的部分の画像であっても、または実際に、超音波画像等異なる領域のものであってもよい。
【図面の簡単な説明】
【0046】
【図1】本発明によるテクスチャ分類システムのブロック図である。
【図2A】画像のペアノスキャンを示す図である。
【図2B】画像のペアノスキャンを示す図である。
【図2C】画像のペアノスキャンを示す図である。
【図3】移動窓セレクタの動作を示す図である。
【図4】交差レート推定器の動作を示す図である。
【図5】交差傾き推定器の動作を示す図である。
【図6】滞留間隔推定器の動作を示す図である
【図7】テクスチャの分類を可能にする特徴空間の分割を示す図である。

【特許請求の範囲】
【請求項1】
画像を表す特徴ベクトルを導き出す方法であって、
(i)所定のマッピング関数を使用して前記画像の一次元表現を導き出すことであって、前記一次元表現は、連続的に変化して前記画像の隣接領域を表すレベルを有する、前記画像の一次元表現を導き出すことと、
(ii)少なくとも、前記レベルがレートしきい値関数のレベルと交差するレートを表すレート値を導き出すことによって前記特徴ベクトルを形成することと
を含む、画像を表す特徴ベクトルを導き出す方法。
【請求項2】
前記レートしきい値関数は所定の定数である、請求項1記載の画像を表す特徴ベクトルを導き出す方法。
【請求項3】
前記特徴ベクトルは、
前記一次元表現の前記レベルがそれぞれの異なる所定のレートしきい値関数のレベルと交差するレートをそれぞれ表す複数のレート値を導き出すこと
によって形成される、請求項1または2記載の画像を表す特徴ベクトルを導き出す方法。
【請求項4】
画像を表す特徴ベクトルを導き出す方法であって、
(i)所定のマッピング関数を使用して前記画像の一次元表現を導き出すことであって、前記一次元表現は、連続的に変化して前記画像の隣接領域を表すレベルを有する、前記画像の一次元表現を導き出すことと、
(ii)少なくとも、前記レベルが持続期間しきい値関数のレベルを上回った(または下回った)ままである間隔の長さに依存する持続期間値を導き出すことによって前記特徴ベクトルを形成することと
を含む、画像を表す特徴ベクトルを導き出す方法。
【請求項5】
前記特徴ベクトルは、
前記レベルが持続期間しきい値関数のレベルを上回った(または下回った)ままである間隔の長さに依存する持続期間値も導き出すこと
によって形成される、請求項1〜3のいずれか一項記載の画像を表す特徴ベクトルを導き出す方法。
【請求項6】
前記持続期間しきい値関数は所定の定数である、請求項4または5記載の画像を表す特徴ベクトルを導き出す方法。
【請求項7】
前記持続期間値は、前記一次元表現の前記レベルが前記第3の所定の関数を上回った(または下回った)ままである複数の持続期間の統計関数である、請求項4、5、または6記載の画像を表す特徴ベクトルを導き出す方法。
【請求項8】
前記特徴ベクトルは、前記一次元表現の第1の部分から導き出され、
前記方法は、前記一次元表現の連続部分それぞれを表す特徴ベクトルをさらに導き出すステップを含む、
請求項1〜7のいずれか一項記載の画像を表す特徴ベクトルを導き出す方法。
【請求項9】
前記連続部分は互いに重複する、請求項8記載の画像を表す特徴ベクトルを導き出す方法。
【請求項10】
前記特徴ベクトルを導き出す前に、
前記一次元表現をスケーリングするステップであって、それによって前記表現のダイナミックレンジの変動を補償する、前記一次元表現をスケーリングするステップ
を含む、請求項1〜9のいずれか一項記載の画像を表す特徴ベクトルを導き出す方法。
【請求項11】
前記画像の前記一次元表現は前記画像のグレースケールでの変動を表す、請求項1〜10のいずれか一項記載の画像を表す特徴ベクトルを導き出す方法。
【請求項12】
二次元画像を表す特徴ベクトルを導き出すために使用される、請求項1〜11のいずれか一項記載の画像を表す特徴ベクトルを導き出す方法。
【請求項13】
請求項1〜12のいずれか一項記載の方法を使用して特徴ベクトルを導き出すことと、
その次に、特徴空間内の複数の指定領域のいずれがその特徴ベクトルを包含するかを求めることと
を含む画像分類方法。
【請求項14】
請求項1〜12のいずれか一項記載の方法を使用して特徴ベクトルを導き出すように構成される画像解析装置。

【図1】
image rotate

【図2A】
image rotate

【図2B】
image rotate

【図2C】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2008−198224(P2008−198224A)
【公開日】平成20年8月28日(2008.8.28)
【国際特許分類】
【出願番号】特願2008−78850(P2008−78850)
【出願日】平成20年3月25日(2008.3.25)
【分割の表示】特願2003−538979(P2003−538979)の分割
【原出願日】平成14年9月25日(2002.9.25)
【出願人】(501253316)ミツビシ・エレクトリック・インフォメイション・テクノロジー・センター・ヨーロッパ・ビーヴィ (77)
【氏名又は名称原語表記】MITSUBISHI ELECRIC INFORMATION TECHNOLOGY CENTRE EUROPE B.V.
【住所又は居所原語表記】20 Frederick Sanger Road, The Surrey Research Park, Guildford, Surrey GU2 5YD, Great Britain
【Fターム(参考)】