説明

画像をスーパーピクセルにセグメント化する方法

【課題】スーパーピクセルを用いて画像をセグメント化する方法を提供する。
【解決手段】画像を入力し(ステップ601)、各頂点が画像内のピクセルに対応し、各枝が対応するピクセルの類似度を示す重みに関連付けられたグラフを構築し(ステップ610)、エントロピーレート及びバランス関数に基づく目的関数を用いて(ステップ602)、目的関数に従って各枝の利得を求め(ステップ620)、利得に従って枝をソートし(ステップ630)、最大利得を有する枝をグラフに追加し(ステップ640)、連結された部分グラフの数がしきい値に等しいか否かを判断し(ステップ650)、偽である場合、ステップ620、ステップ630、及びステップ640を繰り返し、真である場合、所望のスーパーピクセルが得られる(ステップ603)。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、包括的には、ピクセルをセグメント化することに関し、より詳細には、スーパーピクセルを用いて画像をセグメント化することに関する。
【背景技術】
【0002】
本技術分野では一般に、スーパーピクセルとは、デジタル画像において、単一のピクセルよりも大きな多角形ピクセルクラスターであり、同じ色及び明るさでレンダリングすることができる(米国特許第7,744,185号を参照)。
【0003】
スーパーピクセルのセグメント化は、物体認識、画像セグメント化、及び3D再構築の用途において用いられる。スーパーピクセルを用いる1つの主な利点は、計算効率である。スーパーピクセル表現は、ピクセル表現と比較して、必要とされる画像プリミティブの数を大幅に削減する。
【0004】
例えば、Lラベルラベリング問題では、ピクセル表現の解空間はLであり、ここで、nはピクセル数であり、通常10個である。一方、スーパーピクセル表現の解空間はLであり、ここで、mはスーパーピクセル数であり、通常10個である。
【0005】
スーパーピクセルは単一の物体からの一組のピクセルであると一般に仮定される。これは、スーパーピクセルセグメント化の実際的な定義につながり、この定義は、画像内のピクセルを、知覚的に一貫したクラスターに分割する。一貫した知覚的特性は、スーパーピクセルの境界が物体の境界を維持していることを暗に意味する。
【0006】
ほとんどのクラスタリングプロセスは、スーパーピクセルセグメント化として特徴付けることができる。しかしながら、従来のプロセスのほとんどはクラスターの一般的側面をモデル化し、スーパーピクセルセグメント化用に最適化されていない。その上、多くのプロセスは、集中的な計算を必要とし、セグメント化には適していない。
【0007】
1つの方法は、グラフに基づくスーパーピクセルセグメント化を用いるものである。画像は近傍グラフにマッピングされる。この方法は、境界述語(boundary predicate)を用いて、スーパーピクセルを構築するために枝(edges)を順次切断する。この方法は、高速ではあるが、不規則な形状及びサイズを有するスーパーピクセルを生成する。
【0008】
平均値シフト法(mean-shift method)は、局所的な変動には正確であるが、この方法もスーパーピクセルが不規則になるという問題を欠点として有する(特許文献1を参照)。
【0009】
スーパーピクセルセグメント化のための別の方法は、NCutである(特許文献2を参照)。NCutは、同様のサイズ及びコンパクトな形状を有するスーパーピクセルを生成する。しかしながら、この方法も、計算コストが高く、適度なサイズの画像、例えば481×321ピクセルであっても数分を要する。
【0010】
ターボピクセル(TurboPixel)は、同様の規則性を達成する効率的な代替手段である。ターボピクセルは、画像に一様に配置されたシードから曲線を展開することに基づいている。ターボピクセルは、曲線展開中にさまざまな制約を用いて、スーパーピクセルの規則性を実施する。
【0011】
グラフ切断は、高密度パッチ割当て技法を通じて規則的なスーパーピクセルを達成するのに用いることができる。別の方法では、スーパーピクセルは、切断コストを規定する確率的境界マップを用いて規則的なグリッドと一致する。この方法で用いられている目的関数によって、画像間の同形写像が可能になる。
【先行技術文献】
【特許文献】
【0012】
【特許文献1】米国特許出願公開第20100284607号
【特許文献2】米国特許出願公開第20110013837号
【発明の概要】
【0013】
本発明の実施の形態は、クラスタリング目的関数を用いて、画像をスーパーピクセルにセグメント化する方法を提供する。この目的関数は、2つの構成要素、すなわち、ランダムウォークのエントロピーレート(entropy rate of a random walk)と、バランス関数(balancing function)とを含む。エントロピーレートは、コンパクトで一様な(homogeneous)クラスターを形成する一方、バランス関数は、同様のサイズを有するクラスターを生成する。
【0014】
クラスタリングについて、データ点(data point)が頂点に対応し、ペアワイズ類似度(pair-wise similarities)が枝重み(edge weights)に対応するグラフを構築する。本発明は、マトロイド制約を条件として、目的関数を最大にすることによってグラフを分割する。
【0015】
本発明は、貪欲プロセス(greedy process)を用いて目的関数を解き、目的関数の劣モジュラ性(submodularity)及び単調性(monotonicity)を利用して、一定の近似限界を証明する。
【図面の簡単な説明】
【0016】
【図1】本発明の一実施形態に係る、枝がクラスター形成において未選択な場合の重みの一例を示した概略図である。
【図2】本発明の一実施形態に係る、ランダムウォークのエントロピーレートの例(A)〜(D)を示した概略図である。
【図3】本発明の一実施形態に係る、同様のサイズのクラスターを得る際のバランス関数の例(A)〜(B)を示した概略図である。
【図4】本発明の一実施形態に係る、解放のアルゴリズムを示した概略図である。
【図5】本発明の一実施形態に係る、セグメント化中のスーパーピクセル階層を生成する凝集性を示した概略図である。
【図6】本発明の一実施形態に係る、基本的なステップと示した概略図である。
【発明を実施するための形態】
【0017】
グラフ表現
本発明は、画像内のピクセルを表す無向グラフ(undirected graph)には、従来の表記G=(V,E)を用いる。ここで、Vはピクセルに対応する頂点集合であり、Eは枝集合である。Vのi番目の頂点はvによって表され、頂点vと頂点vとを接続する枝はei,jによって表される。重み関数wは、枝によって連結された2つの頂点間の類似度を与える。無向グラフでは、枝のインデックスは交換可能であり、ei,j=ej,iであり、枝重みは対称的であり、wi,j=wj,iである。
【0018】
グラフ分割
グラフ分割Sとは、集合Vを互いに素な部分集合S={S,S,...,S}に分割することをいう。互いに素な部分集合Sは、
【数1】

となる集合である。グラフ分割は部分集合選択問題である。本発明の目的(goal)は、結果のグラフ(V,A)がK個の連結部分グラフ(連結構成要素)を有するように、集合E内の枝の部分集合Aを選択することである。結果の各部分グラフがスーパーピクセルに対応する。
【0019】
エントロピー
エントロピーHは、確率変数の不確実性の尺度を示す。条件付き確率質量関数pを有する離散確率変数Xのエントロピーは、下記の式(1)で求めることができる。
【0020】
【数2】

【0021】
ここで、
【数3】

は確率変数Xの台集合(support)である。条件付きエントロピーH(X|Y)は、相関確率変数Yの値が既知であるとすると、確率変数Xの残りの不確実性を定量化する。条件付きエントロピーH(X|Y)は、下記の式(2)で定義される。
【0022】
【数4】

【0023】
ここで、
【数5】

は、Yの台集合であり、pX|Yは条件付き確率質量関数である。
【0024】
エントロピーレート
エントロピーレートは、確率過程X={X,t∈T}の不確実性を定量化する。ここで、Tはインデックス集合である。離散ランダム過程の場合、エントロピーレートは、下記の式(3)で示される漸近測度として、定義される。
【0025】
【数6】

【0026】
エントロピーレートは、過去の先行する軌線を観測した後のランダム過程の残りの不確実性の尺度を示す。定常確率過程の場合、式3における極限が常に存在する。定常1次マルコフ過程の場合、エントロピーレートは、下式の形を有する。
【0027】
【数7】

【0028】
最初の等式は、1次マルコフ性に起因するものであり、2番目の等式は、定常性の帰結である。H(X|X)は時間非依存であるので、本発明においては、極限(limit)を省くことにする。
【0029】
ランダムウォーク
ランダムウォークは、グラフ上の確率過程である。非負の類似尺度wを有するグラフG=(V,E)上のランダムウォークをX={X,t∈T,X∈V}とする。ランダムウォークXは、1つの頂点から他の頂点への連続したランダムなジャンプで構成される軌線である。本発明においては、従来の構築法を用いることにする。頂点vからvへの遷移確率は、関連付けられた枝重みに比例し、下記の式(4)で定義される。
【0030】
【数8】

【0031】
ここで、
【0032】
【数9】

【0033】
は、vのインシデント重み(incident weight:付帯する重み)の和である。
【0034】
定常分布は、下記の式(5)である。
【0035】
【数10】

【0036】
ここで、
【数11】

は、正規化定数である。
【0037】
特定の頂点上のランダムウォークが、頂点の総インシデント重みに比例する確率について説明する。非連結グラフの場合、定常分布は唯一のものとはならない。しかしながら、式(5)のμは、常に定常分布である。これは、μ=Pμを通じて検証することができる。ここで、P=[p]i,jは遷移行列である。ランダムウォークのエントロピーレートは、式(2)を適用することによって、下記の式(6)で求めることができる。
【0038】
【数12】

【0039】
劣モジュラ性
劣モジュラ関数の定義を用いることにする。有限集合をEとする。集合関数Fは、全ての
【数13】

について、下記の(7)式である場合に、劣モジュラである。
【0040】
【数14】

【0041】
この特性は、収量逓減特性(diminishing return property)としての別名を有し、すなわち、モジュールの影響は、後段で用いられる場合に後段になるほど小さくなる。
【0042】
厳密単調増加集合関数
集合関数Fは、
【数15】

である場合に、厳密単調増加である。
【0043】
マトロイド
マトロイドは、有限集合Eと、次の3つの条件を満たす集合Eの部分集合の系(collection)Iとを含む順序対M=(E,I)である。
【数16】

【数17】

【数18】

【0044】
本発明の目的関数は、単調増加及び劣モジュラである。これを示すために、エントロピーレート及びエントロピーの等価な集合関数を説明することにする。単調増加劣モジュラ関数を最大にすることはNP困難である。しかしながら、マトロイド表現を用いてグラフ分割問題を定式化し、単純な貪欲プロセスが1/2近似限界を与えることを証明することにする。
【0045】
エントロピーレートクラスタリング
グラフ構築
ピクセルを示す頂点と、類似度行列の形で与えられるペアワイズ類似度を示す枝重みとを有する連結グラフG=(V,E)を画像から構築する。また、グラフのあらゆる頂点が0の重みを有する自己ループを有するものと仮定する。グラフを分割するように枝の部分集合を選択すると、未選択の枝の重みは、結果のグラフ内に配分されて戻される。ループがデフォルトで選択され、集合Eには存在しない。選択されていない枝ごとに、各頂点の総インシデント重みが定数を維持するように、関連付けられた頂点のループの枝重みを増加させる。
【0046】
図1に示すように、枝ei,j101がクラスター形成において未選択である場合、対応する重みwi,jは、2つの頂点のループ102に再配分される。
【0047】
この構築は式(5)を変えることはない。これは、枝が順次選択される反復プロセスにとって重要である。このグラフ構築の下では、遷移確率の等価な集合関数pi,jは、下記の式(8)である。
【0048】
【数19】

【0049】
ここで、Aは分割のために選択された枝の集合である。その結果、ランダムウォークのエントロピーレートは、下記の(9)式で示される等価な集合関数を有する。
【0050】
【数20】

【0051】
エントロピーレート
図2A〜図2Dに示すように、ランダムウォークのエントロピーレートを、その関連付けられたグラフ上で、一様かつコンパクトなクラスターを得るための判定基準として用いる。図2A及び図2Bは1つのデータセットに対応する一方、図2C及び図2Dは別のデータセットに対応する。あらゆる頂点がループを有するが、これらのループは図示されていない。図2Aにおけるコンパクトなクラスターのエントロピーレートは、図2Bにおけるコンパクト性に劣るクラスターのエントロピーレートよりも高い目的値(objective value)を有する。図2Cにおける一様なクラスターのエントロピーレートは、図2Dにおける一様性に劣るクラスターよりも高い目的値を有する。
【0052】
本発明は、ガウスカーネルを用いて、距離を類似度に変換する。これらのグラフ分割のそれぞれにおいて、連結構成要素として4つの異なるクラスターが示される。一様かつコンパクトなクラスターは、より大きなエントロピーレートを与える。どの枝の選択も或る値だけエントロピーレートを増加させるが、この増加は、コンパクトかつ一様なクラスターから枝を選択する場合に、より大きなものとなる。
【0053】
本発明で提案されたグラフ構築法の下でのランダムウォークのエントロピーレートは単調増加劣モジュラ関数である。枝を追加することによって、不確実性が増加するので、エントロピーレートは単調増加である。収量逓減特性は、枝を選択することによる不確実性の増加が、後段になるほど小さくなるということに由来する。その理由は、後段は、より多くの枝と共有されるからである。
【0054】
したがって、グラフ上のランダムウォーク
【数21】

は、本発明のグラフ構築法の下では単調増加劣モジュラ関数である。
【0055】
バランス関数
同様のサイズを有するクラスターを促進するバランス関数を説明する。選択された枝集合をAとし、グラフ内の連結された部分グラフの数をNとし、クラスターメンバーシップの分布をZとする。分割{S,S,...,SNA}について、Zの分布は、下記の式(10)に等しく、
【0056】
【数22】

【0057】
バランス項は、下記の式(11),(12)によって与えられる。
【0058】
【数23】

【0059】
エントロピーH(Z)は、同様のサイズを有するクラスターに有利に働くのに対して、Nはより少ない数のクラスターに有利に働く。
【0060】
図3A及び図3Bは、同様のサイズのクラスターを得る際のバランス関数の役割を示している。連結構成要素は、データセット内のさまざまなクラスターを示している。バランス関数は、図3Bにおけるバランス性に劣るクラスタリングと比較して、図3Aにおけるバランスされたクラスタリングに対してより高い目的値を有する。
【0061】
エントロピーレートと同様に、バランス関数も単調増加劣モジュラ関数である。
【0062】
本発明では、エントロピーレート及びバランス関数を組み合わせて、コンパクトで一様でかつバランスされたクラスターを求める、下記の式(13)で示される部分集合選択問題を解く。
【0063】
【数24】

【0064】
式(13)におけるパラメーターλ>0は、バランス重みであり、このバランス重みは、クラスタリングをバランスさせるときの優先権(preference)を制御するのに用いられる。
【0065】
上記に基づくと、下記の式(14)の目的関数は、単調増加劣モジュラ関数である。
【0066】
【数25】

【0067】
クラスターを結合することは、バランス項の利得(gain)になるので、全ての局所最適解において正確にK個のクラスターが存在することが保証される。
【0068】
貪欲ヒューリスティック
劣モジュラ集合関数を最大にする1つのプロセスは貪欲プロセスを用いる。このプロセスは、空集合(完全非連結グラフ、
【数26】

)から開始し、枝を集合に順次追加する。各反復において、このプロセスは最大の利得を与える枝を追加する。反復は、連結された部分グラフの数が事前に設定された数N=Kに達すると停止する。
【0069】
更なる高速化を達成するために、枝集合Aが閉路を含むことができないように、枝集合Aに対して付加的な制約を課す。この制約は、連結された部分グラフ内の付加的な枝を直ちに無視し、貪欲探索における評価の回数を削減する。これらの枝はグラフの分割を変更しない。この制約によって、解空間は、元の問題と比較してより小さくなり(木構造の部分グラフのみが許容される)、実際に、クラスタリング結果は非常に類似する。
【0070】
クラスター数の制約N≧Kとともに、この無閉路制約によって、マトロイドM=(E,I)を含む独立集合の定義が得られる。枝Eが枝集合であり、かつ、Eの部分集合Aのうちの、枝集合Aが無閉路である集合がIであり、K個以上の連結構成要素を有するグラフ分割を構成する場合、対M=(E,I)はマトロイドである。
【0071】
グラフ分割問題を再定式化したものは、下記の式(15)であり、解法のアルゴリズムは図4に示されている。
【0072】
【数27】

【0073】
貪欲プロセスは、マトロイド制約を条件として、非減少劣モジュラ関数を最大にする1/2近似を与えるので、図4に示すようなプロセスは、式(15)を解く1/2近似を示している。
【0074】
効率的な実施態様
本発明は、最初に、各枝をAに追加する利得を計算し、ヒープを構築する。各反復において、最大利得を有する枝がヒープから除去され、Aに含められる。この枝を含めることは、ヒープ内の残りの枝のうちのいくつかのものの利得に影響を与える。したがって、ヒープを更新する必要がある。しかしながら、劣モジュラ特性によって、ヒープ構造の効率的な更新が可能になる。重要な知見は、全体にわたって、すなわち、各枝の利得は決して増加することができないということであり、すなわち(i.e.)、収量逓減特性である。したがって、最も上の要素の利得は更新されるが、他の要素は必ずしも更新されない場合、ヒープを維持することで十分である。ヒープの最も上の要素は更新され、他の要素の値は減少することしかできないので、最も上の要素は最大値である。
【0075】
実際には、このプロセスは、単純な機器(implementation)よりもはるかに高速に動作する。平均すると、各反復において、ヒープに対して更新はほとんど行わない。本発明における実験では、このプロセスは、画像サイズ481×321に対して200倍〜300倍の高速化を提供する。
【0076】
図6は、本発明の1つの実施形態の基本的なステップを示している。入力は画像601である。本発明においては、頂点が枝によって連結されたグラフを構築する(610)。各頂点は画像内のピクセルに対応し、各枝は、該対応するピクセルの類似度を示す重みに関連付けられる。最初に、グラフは枝も一切含んでいない。目的関数は、枝をグラフに順次追加する貪欲プロセスを用いて最大にされる。
【0077】
本発明では、目的関数に基づいて、各枝をグラフに追加する利得を求める(620)。目的関数は、エントロピーレート及びバランス項を含む(602)。
【0078】
利得に従って枝をソートし(630)、最大利得を有する枝をグラフに追加する(640)。
【0079】
本発明では、連結された部分グラフの数が或るしきい値Kに等しいか否かを判断する。偽である場合、ステップ620、ステップ630、及びステップ640を繰り返す。真である場合、所望のスーパーピクセルが得られる(603)。
【0080】
方法600のステップは、当該技術分野において知られているように、メモリ及び入出力インターフェースに接続されたプロセッサにおいて実行することができる。
【0081】
自動パラメーター調節
本発明では、バランスパラメーターλを自動的に調整する方法を説明することにする。ユーザーが指定した初期値λ’が与えられると、最終的なバランスパラメーターλは、(1)スーパーピクセルの数K、及び(2)入力画像から計算されるデータ依存動的パラメーターβに基づいて調整される。クラスター数Kは、多数のスーパーピクセルが必要とされるときに、バランス項をより重要視するために導入される。データ依存項は、単一の枝をグラフに含めたときの最大限のエントロピーレートの増加と最大限のバランス項の増加との比は、下記の式によって与えられ、
【0082】
【数28】

【0083】
目的関数におけるこれらの2つの項の大きさの差(magnitude difference)を補償する。最終的なバランスパラメーターは、λ=βKλ’によって与えられる。
【0084】
スーパーピクセル階層
セグメント化プロセスは、別々のクラスターとしての各ピクセルから開始し、クラスターを次第に結合して、より大きなスーパーピクセルを構築する。このセグメント化階層は、画像の複数のセグメント化を同時に引き起こす。用途に基づいて、セグメント化におけるスーパーピクセルの正確な数を選択することができる。図5は、セグメント化中のスーパーピクセル階層を生成するこの凝集性を示している。
【0085】
階層は、対話型編集、又は複数のスーパーピクセルのセグメント化からの情報を利用するアルゴリズム等の多くの視覚アプリケーションにとって有用である。初期セグメント化が完了した後、ユーザーは、特定のスーパーピクセルを選択し、階層に基づいてこれらのスーパーピクセルを更に統合又は分割することができる。これは、スーパーピクセルが複数の器官を含む場合があり、そのスーパーピクセルの更なるグループ化/セグメント化が器官の分離を引き起こす医療用のセグメント化等の対話型解析にとって重要である。
【0086】
一般的なクラスタリング
本発明を画像セグメント化について説明してきたが、本方法は、どのクラスタリング問題にも適用される。画像のピクセルの代わりに点の集合が与えられると、それらの点の間の類似度を距離メトリックに基づいて定義することができる。その後、同じグラフ構築法が、点がグラフの頂点であるとともに枝が点をそのL個の最近傍点に接続するこの一般的な点の集合に適用される。説明したアルゴリズムは、この点集合のクラスタリングを引き起こす。
【0087】
一般的なクラスタリングの領域は、データマイニング、財務、バイオインフォマティクス、医薬、神経科学等を含むが、これらに限定されるものではない。
【0088】
発明の効果
本発明は、スーパーピクセルを生成する新規なクラスタリング目的関数を提供する。クラスタリング目的関数は、グラフ上のランダムウォークのエントロピーレートとバランス関数との組み合わせを最大にすることに基づいている。目的関数の劣モジュラ性及びマトロイド表現を用い、貪欲プロセスを用いて目的関数を最大にする問題を解く。

【特許請求の範囲】
【請求項1】
画像をスーパーピクセルにセグメント化する方法であって、
頂点が枝によって連結されたグラフを構築するステップであって、各頂点は、前記画像内のピクセルに対応し、各枝は、該対応するピクセルの類似度を示す重みに関連付けられる、構築するステップと、
前記グラフ内の枝の部分集合を選択するステップであって、前記グラフを部分グラフにセグメント化し、該選択することは目的関数を最大にし、該目的関数は劣モジュラである、選択するステップと、
部分グラフの数が或るしきい値に等しくなるまで、最大利得を有する前記枝を前記グラフに追加するステップ、並びに、そうでない場合には、前記選択するステップ及び前記追加するステップを繰り返すステップと、
を含み、
各前記ステップはプロセッサにおいて実行される、画像をスーパーピクセルにセグメント化する方法。
【請求項2】
各部分グラフは、一様なかつ同様のサイズのスーパーピクセルを含む、請求項1に記載の方法。
【請求項3】
前記目的関数は、一様なスーパーピクセルを生成するエントロピーレートを含む、請求項2に記載の方法。
【請求項4】
前記目的関数は、同様のサイズのセグメントを生成するバランス項を含む、請求項2に記載の方法。
【請求項5】
前記エントロピーレートは、劣モジュラ及び単調増加である、請求項3に記載の方法。
【請求項6】
前記バランス項は、劣モジュラ及び単調増加である、請求項4に記載の方法。
【請求項7】
無閉路グラフにおける部分グラフの数に対する制約がマトロイドである、請求項1に記載の方法。
【請求項8】
目的関数は、前記制約を条件として、貪欲プロセスを用いて最大にされる、請求項7に記載の方法。
【請求項9】
最適性が、前記目的関数の大域的最小値の1/2となるように保証される、請求項1に記載の方法。
【請求項10】
前記貪欲プロセスは、ヒープ構造を用いて実施される、請求項8に記載の方法。
【請求項11】
前記セグメント化は階層的に達成される、請求項1に記載の方法。
【請求項12】
前記階層は、前記画像の複数のセグメント化を同時に形成する、請求項11に記載の方法。
【請求項13】
前記バランス項は、自動的に調節される、請求項4に記載の方法。
【請求項14】
前記バランス項は、セグメント化をカスタマイズするようにユーザーによって変更される、請求項4に記載の方法。
【請求項15】
前記セグメント化は、ユーザーの監視を伴って対話的に実行される、請求項1に記載の方法。
【請求項16】
非画像領域における一般的なクラスタリング問題が解かれる、請求項1に記載の方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2012−234528(P2012−234528A)
【公開日】平成24年11月29日(2012.11.29)
【国際特許分類】
【外国語出願】
【出願番号】特願2012−94531(P2012−94531)
【出願日】平成24年4月18日(2012.4.18)
【出願人】(000006013)三菱電機株式会社 (33,312)
【Fターム(参考)】