説明

強度に基づくラベル伝播およびレベルセットの確率で画像をセグメント化する方法

【課題】この発明の強度に基づくラベル伝播およびレベルセットの確率で画像をセグメント化する方法は、画像細分化においてユーザラベルを活用する。
【解決手段】ユーザラベルは、画像強度情報に関して伝播される。伝播されたユーザラベルは、レベルセット展開のコスト関数に含まれる。レベルセットは、オブジェクトセグメントの確率を表わす。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は、一般的には画像処理に関し、さらに詳細には、画像セグメンテーション(セグメント化)に関するものである。
【背景技術】
【0002】
従来の画像処理は、画像をセグメント化(細分化)するために、レベルセット(レベル組)およびユーザ情報を使用することができる。たとえば、米国特許第7,277,582号、「User interactive level set methods for image segmentation(画像セグメント化のためのユーザ対話型レベルセット方法)」、を参照。レベルセットは、コスト関数を最小化するために展開され、オブジェクトピクセル(オブジェクト画素)およびバックグラウンドピクセル(背景画素)のイメージ(画像)強度バリアンス(偏差)が、コスト関数において使用される。ユーザは、ピクセル(画素)をオブジェクト画素または背景画素としてラベル付けし、ユーザによりラベル付けされた画素およびその近くの画素の符号からの、展開するレベルセットの符号の偏差を、等方性の重み付け(すなわち、全方向に一様な重み付け)によりペナルティーを科すことができる。
【発明の概要】
【発明が解決しようとする課題】
【0003】
しかしながら、従来、ユーザラベルは画像強度情報を組込まない。レベルセット展開における偏差項が支配し、また、ユーザにより選択された背景位置の近くの画素だけが背景として残る。
【0004】
図1は、従来のユーザ対話処理でのセグメンテーション(セグメント化)に失敗した画像を示す。図2に示される正しいセグメンテーションを達成するのは難しい。
【0005】
この発明の目的は、正しいセグメンテーションを近似したセグメンテーションを生成することである。
【課題を解決するための手段】
【0006】
この発明の実施の形態は、レベルセットおよびユーザラベルを使用して、入力画像をセグメント化する方法を提供する。本方法は、画像強度情報に基づいてラベルを伝播し、該情報を確率的なレベルセット表示と組み合わせる。本方法は、精度を改善、増大するとともに、処理時間を減少させる。
【発明の効果】
【0007】
図6は、上述された本方法によって製作されたセグメント309を示し、それは、従来の方法での、図1に示されるセグメンテーションよりも、より正確に目で見ることができる。
【図面の簡単な説明】
【0008】
【図1】従来の方法での、失敗したセグメンテーションの画像である。
【図2】図1の画像に対する正しいセグメンテーションである。
【図3】この発明の実施の形態1による、画像をセグメント化する方法のブロック図である。
【図4】この発明の実施の形態1による、ラベル付けされた画素を有する画像である。
【図5】この発明の実施の形態1による、画像グリッドグラフの概略図である。
【図6】この発明の実施の形態1による、セグメントの画像である。
【発明を実施するための形態】
【0009】
実施の形態1.
図3は、出力画像においてセグメント309を生成するために、我々の発明の実施の形態により、入力画像301をセグメント化する方法300を示す。図6を参照。本方法の工程は、当該技術において知られているように、バスで接続されたメモリおよび入出力インタフェースを含むプロセッサで行うことができる。
【0010】
ユーザは、1セット(組)のラベル310を供給する。そのラベルのセットは、オブジェクト画素311および背景画素312を識別する(図4を参照)。それらのラベルは、最初のレベルセット303を生成するために伝播310される。その後、そのレベルセットは、出力画像においてセグメント309を生成するために、以下に詳細に記述されるコスト関数Jを使用して展開302される。
【0011】
レベルセットは、関数Ω、関数Ωおよび関数Cを有する空間領域における入力画像のセグメンテーション(細分化)を表し、ここで、
【数1】

である。また、ここで、関数Ωは、オブジェクト画素の背景領域を識別し、関数Ωは、背景画素の背景領域を識別し、関数Cは、オブジェクト領域と背景領域との間の境界画素を識別し、また、(x、y)は、入力画像内の画素の位置の座標である。
【0012】
コスト関数Jの、領域に基づくレベルセットコスト関数Jは、
【数2】

である。ここで、uは、画像位置(x、y)の画素の強度であり、また、
【数3】

は、各領域の画素強度の平均であり、また、
【数4】

である。ここで、
【数5】

は、ヘヴィサイドのステップ(階段)関数である。単位ステップ(階段)関数とも呼ばれる、ヘヴィサイドの階段関数Hは、不連続関数であり、その値は、負の引数に対して0、また、正の引数に対して1である。
【0013】
我々のコスト関数Jは、また、以下に述べるような、ユーザラベルコスト関数Jおよび最大確信度(マクシマムビリーフ)コスト関数Jを含む。
ユーザラベルのセットは、次の関数L(x、y)を使用してエンコードされる。
【0014】
【数6】

【0015】
図5に示されるように、ラベル伝播310は、ラベル付けされていない各画素510からラベル付けされた画素のうちの1つ511までの、画像グリッドグラフにおける経路501に沿った最小距離Dを決定する。画像グリッドグラフでは、各画素はノードであり、また、エッジは、各ノードを、画素510に対してのみ示されるように、8つの最も近い近隣の画素に接続する。
【0016】
最小距離は、以下の式(9)で表される。
【0017】
【数7】

【0018】
ここで、k=0、1に対して、L(x、y)=kであり、また、mは画素(x、y)のインデックスである。
【0019】
すなわち、D(x、y)は、位置(x、y)のラベル付けされていない画素から、ラベル付けされた画素のうちの強度が類似する1つまでの最小距離である。対応する経路は、(x、y)、(x、y)、(x、y)、...、(x、y)であり、ここで、L(x、y)=0である。インデックスmは、すべてのピクセル位置(x、y)に対して変化する。
【0020】
言いかえれば、異なる位置の、ラベル付けされていない画素は、ラベル付けされた画素のうちの1つへの異なる経路を有し、またその結果、異なる経路長mを有する。
【0021】
【数8】

【0022】
最小距離は、確率的なレベルセットを以下の式のように初期化する。
【0023】
【数9】

【0024】
確率的なレベルセットが、以下の式の最大確信度コスト関数において使用される。
【0025】
【数10】

【0026】
ここで、
【数11】

は、オブジェクト画素の数である。
【0027】
したがって、展開中に使用されるコスト関数は、以下の式のように、領域に基づくコスト関数J、ユーザコスト関数Jおよび最大確信度コスト関数Jの和である。
【0028】
【数12】

【0029】
ここで、λU_およびλは、それぞれユーザコスト関数Jおよび最大確信度コスト関数Jの相対的重要度を制御するスカラパラメータである。
【0030】
レベルセットは、極小値に到達するまで、コスト関数のオイラー−ラグランジュ方程式を使用して、展開される。これらのオイラー−ラグランジュ方程式は、極小値で微分可能で且つ定常である。
【0031】
図6は、上述された本方法によって製作されたセグメント309を示し、それは、従来の方法での、図1に示されるセグメンテーションよりも、より正確に目で見ることができる。
【0032】
この発明は好ましい実施の形態の例として記述されたが、この発明の趣旨および範囲内で様々な他の改変および変更を行ってもよいことが理解されるべきである。したがって、この発明の真実の趣旨および範囲内に入るような、すべての変更例および変形例をカバーすることが、添付の特許請求の範囲の目的である。

【特許請求の範囲】
【請求項1】
オブジェクトの入力画像をセグメント化するための方法であって、
ラベル付けされた画素および残りのラベル付けされていない画素を生成するため、入力画像内の画素に対して、オブジェクト画素と背景画素とを識別する1組のラベルをユーザによって指定する工程と、
確率的に表される最初のレベルセットを生成するために、近隣の画素の強度の差に基づいて、前記入力画像内の前記ラベルを伝播する工程と、
出力画像内にセグメントを生成するために、コスト関数を使用して前記最初のレベルセットを展開する工程と、を備え、前記工程がプロセッサで行われる、方法。
【請求項2】
前記レベルは、関数Ω、関数Ωおよび関数Cを有する空間領域における前記入力画像のセグメンテーションを表し、ここで、
【数1】

であり、またここで、前記関数Ωは前記オブジェクト画素のオブジェクト領域を識別し、前記関数Ωは前記背景画素の背景領域を識別し、前記関数Cは、前記オブジェクト領域と前記背景領域との間の境界画素を識別し、また、(x、y)は前記入力画像内の画素の位置の座標である、請求項1の方法。
【請求項3】
前記コスト関数は領域に基づくレベルセット関数J、ユーザラベルコスト関数Jおよび最大確信度コスト関数Jを含む、請求項1の方法。
【請求項4】
前記領域に基づくコスト関数は以下の式であり、
【数2】

ここで、uは位置(x、y)の画素の強度であり、また、
【数3】

は、特別な領域内の画素強度の平均であり、また、
【数4】

であり、ここで、
【数5】

はヘヴィサイドの階段関数である、請求項3の方法。
【請求項5】
前記ユーザラベルのセットは、関数、
【数6】

を使用してエンコードされる、請求項4の方法。
【請求項6】
前記伝播は、ラベル付けされていない各画素から前記ラベル付けされた画素のうちの1つまでの、画像グリッドグラフにおける経路に沿った最小距離Dを決定し、ここで、該最小距離は、
【数7】

であり、またここで、k=0、1に対して、L(x、y)=kであり、mは画素(x、y)のインデックスである、請求項5の方法。
【請求項7】
前記最小距離は、確率的なレベルセットを、以下の式、
【数8】

のように初期化する、請求項6の方法。
【請求項8】
前記確率的なレベルセットは、以下の式の最大確信度コスト関数において使用され、
【数9】

ここで、
【数10】

は前記オブジェクト画素の数である、請求項7の方法。
【請求項9】
前記コスト関数は、
【数11】

であり、ここで、λU_およびλは、それぞれユーザコスト関数Jおよび最大確信度コスト関数Jの相対的重要度を制御するスカラパラメータである、請求項1の方法。
【請求項10】
前記展開することは、極小値に到達するまで、前記コスト関数のオイラー−ラグランジュ方程式を使用する、請求項1の方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2011−170846(P2011−170846A)
【公開日】平成23年9月1日(2011.9.1)
【国際特許分類】
【外国語出願】
【出願番号】特願2011−19715(P2011−19715)
【出願日】平成23年2月1日(2011.2.1)
【出願人】(597067574)ミツビシ・エレクトリック・リサーチ・ラボラトリーズ・インコーポレイテッド (484)
【住所又は居所原語表記】201 BROADWAY, CAMBRIDGE, MASSACHUSETTS 02139, U.S.A.
【Fターム(参考)】