説明

視差推定装置およびそのプログラム

【課題】本発明は、視差の推定精度の低下を抑制する視差推定装置を提供する。
【解決手段】視差推定装置1は、正規化相互相関で算出した類似度にコサイン逆関数を適用して第1の重み係数を乗じた誤差関数を用いてデータ項を生成するデータ項生成手段11と、スムーズ項生成手段12と、ブロック間でメッセージを伝搬するメッセージ伝搬手段13と、視差候補決定手段14と、正規化相互相関で算出した類似度にコサイン逆関数を適用して第1の重み係数より大きな第2の重み係数を乗じた誤差関数を用いてデータ項を生成するデータ項生成手段21と、スムーズ項生成手段22と、画素間でメッセージを伝搬するメッセージ伝搬手段23と、メッセージ伝搬手段23が更新した下位階層におけるエネルギーが最小となる視差であって、視差候補決定手段14から入力された視差候補に含まれる視差を視差情報として決定する視差決定手段24と、を備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、信頼度伝搬法により、ステレオ画像の各画素の視差を示す視差情報を決定する視差推定装置およびそのプログラムに関する。
【背景技術】
【0002】
例えば、3次元立体モデルを生成する際、ステレオ画像の各画素の視差を推定する視差推定技術が広く用いられている。この視差推定技術としては、例えば、ステレオ画像間で類似度を求めるブロックマッチングが知られている。また、類似度の計算方法としては、例えば、差の二乗和を求めるSSD(Sum of Squared Difference)、差の絶対和を求めるSAD(Sum of Absolute Difference)、および、正規化相互相関を求めるZNCC(Zero-mean Normalized Cross-Correlation)が知られている(例えば、非特許文献1)。
【0003】
また、視差推定技術としては、視差情報にマルコフランダムフィールドモデルを仮定し、ステレオ画像間のデータ項とスムーズ項とで構成されるエネルギーを最小化することにより、ノイズが少なく滑らかな視差情報を生成する信頼度伝搬法も知られている(例えば、非特許文献2)。ここで、データ項はステレオ画像間の類似度であり、スムーズ項は視差の不連続性を表す。
【先行技術文献】
【非特許文献】
【0004】
【非特許文献1】ディジタル画像処理、CG−Arts協会、2006年、p202−p204
【非特許文献2】Pedro F.Felzenszwalb,Daniel P.Huttenlocher:Efficient Belief Propagation for Early Vision.CVPR(1)2004:261‐268
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかし、この信頼度伝搬法では、撮影カメラの個体差や撮影環境によってステレオ画像間に輝度差が生じた場合、視差の推定精度が低下するという問題がある。例えば、図14(a)のコート面に表示された「20」という模様を、2台の撮影カメラでステレオ画像として撮影した場合を考える。ここで、図14(a)の下方向に配置された1台目の撮影カメラが、図14(b)に示す画像を撮影したとする。この場合、図14(b)の画像において、「20」という模様の輝度ヒストグラムは、図14(c)に示すようになる。一方、図14(a)の斜め下方向に配置された2台目の撮影カメラが、図14(d)に示す画像を撮影したとする。この場合、図14(d)の画像において、「20」という模様の輝度ヒストグラムは、図14(e)に示すようになる。なお、図14(b),(d)では、照明光が強くなる程、濃い色を付している。また、図14(c),(e)では、縦軸が輝度値であり、横軸がその輝度値を有する画素数を示す。
【0006】
ここで、2台の撮影カメラは、それぞれから見て、「20」という模様に対する照明光のあたり方が異なる撮影環境にある。このため、図14(c)および図14(e)に示すように、ステレオ画像間の輝度ヒストグラムは、大きく異なる。この場合、図14(a)の「20」という模様について、図14(b),(c)のステレオ画像から視差を推定することが困難である。この輝度差により視差の推定精度が低下する問題は、撮影カメラのレベル調整を十分に行っても解消することが難しい。
【0007】
そこで、本発明は、前記した問題を解決し、視差の推定精度の低下を抑制する視差推定装置およびそのプログラムを提供することを課題とする。
【課題を解決するための手段】
【0008】
前記した課題を解決するため、本願第1発明に係る視差推定装置は、ステレオ画像間の類似度を示すデータ項と視差の連続性を示すスムーズ項とを含むエネルギーを最小化する手法により、前記ステレオ画像の画素ごとの視差を示す視差情報を決定する視差推定装置であって、上位階層データ項生成手段と、上位階層スムーズ項生成手段と、上位階層エネルギー伝搬手段と、視差候補決定手段と、下位階層データ項生成手段と、下位階層スムーズ項生成手段と、下位階層エネルギー伝搬手段と、視差決定手段と、を備えることを特徴とする。
【0009】
かかる構成によれば、視差推定装置は、上位階層データ項生成手段によって、前記ステレオ画像が入力されると共に、正規化相互相関で算出した前記類似度にコサイン逆関数を適用した誤差関数を用いて、入力された前記ステレオ画像からデータ項を生成する。ここで、正規化相互相関で算出した類似度にコサイン逆関数を適用することで、視差推定装置は、エネルギーの最小値を見つけやすいエネルギー分布を得ることができる。そして、視差推定装置は、上位階層スムーズ項生成手段で、所定の生成式によってスムーズ項を生成する。
【0010】
また、視差推定装置は、上位階層エネルギー伝搬手段によって、前記上位階層データ項生成手段が生成したデータ項と前記上位階層スムーズ項生成手段が生成したスムーズ項とを含む前記画素ごとのエネルギーが集合したエネルギー集合を生成し、当該エネルギー集合を複数の画素で構成されるブロックに分割し、処理対象の前記ブロックの移動と、当該処理対象のブロックに対する所定の生成式によって生成したエネルギーの伝搬とを繰り返して、前記ブロックごとにエネルギーを更新する。そして、視差推定装置は、視差候補決定手段によって、前記上位階層エネルギー伝搬手段が更新したブロックごとのエネルギーが最小となる視差を前記ブロックの視差として決定し、当該ブロックの視差を当該ブロックに含まれる画素に割り当てて当該画素ごとの視差候補として出力する。つまり、視差推定装置は、1つのブロックを1つの画素とみなしてエネルギーの伝搬を行う。
【0011】
また、視差推定装置は、下位階層データ項生成手段によって、前記ステレオ画像が入力されると共に、前記正規化相互相関で算出した前記類似度にコサイン逆関数を適用した誤差関数を用いて、入力された前記ステレオ画像からデータ項を生成する。ここで、正規化相互相関で算出した類似度にコサイン逆関数を適用することで、視差推定装置は、エネルギーの最小値を見つけやすいエネルギー分布を得ることができる。そして、視差推定装置は、下位階層スムーズ項生成手段で、所定の生成式によってスムーズ項を生成する。
【0012】
また、視差推定装置は、下位階層エネルギー伝搬手段によって、前記下位階層データ項生成手段が生成したデータ項と前記下位階層スムーズ項生成手段が生成したスムーズ項とを含む前記画素ごとのエネルギーが集合したエネルギー集合を生成し、当該エネルギー集合内における画素間で、所定の生成式によって生成したエネルギーを伝搬して、前記画素ごとにエネルギーを更新する。そして、視差推定装置は、視差決定手段によって、前記下位階層エネルギー伝搬手段が更新した画素ごとのエネルギーが最小となる視差であって、前記視差候補決定手段から入力された視差候補に含まれる視差を前記視差情報として決定する。
【0013】
つまり、視差推定装置は、ブロックの階層(上位階層)で画像全体のおおまかな視差(視差候補)を求め、画素の階層(下位階層)で被写体の輪郭を重視した視差を求める。そして、視差推定装置は、上位階層の視差候補に含まれる下位階層の視差を視差情報として決定することで、上位階層と下位階層との視差推定結果を統合する。
【0014】
また、本願第2発明に係る視差推定装置は、前記上位階層データ項生成手段が、予め設定した第1の重み係数をさらに乗じた前記誤差関数を用いて、前記入力されたステレオ画像から前記データ項を生成し、前記下位階層データ項生成手段が、前記第1の重み係数より大きな第2の重み係数をさらに乗じた前記誤差関数を用いて、前記入力されたステレオ画像から前記データ項を生成することを特徴とする。
【0015】
ここで、例えば、信頼度伝搬法では、重み係数を大きくすると、被写体の輪郭が判別し易くなる代わりにノイズが多くなり、重み係数を小さくすると、被写体の輪郭がぼやける代わりにノイズが少なくなる。このように、信頼度伝搬法では、1つの重み係数を適切な値に設定することが難しい。このため、視差推定装置は、ブロックの階層(上位階層)で、第1の重み係数を小さな値に設定して画像全体のおおまかな視差(視差候補)を求め、画素の階層(下位階層)で、第2の重み係数を大きな値に設定して被写体の輪郭を重視した視差を求める。
【0016】
また、前記した課題を解決するため、本願第3発明に係る視差推定装置は、ステレオ画像間の類似度を示すデータ項と視差の連続性を示すスムーズ項とを含むエネルギーを最小化する手法により、前記ステレオ画像の画素ごとの視差を示す視差情報を決定する視差推定装置であって、上位階層データ項生成手段と、上位階層スムーズ項生成手段と、上位階層エネルギー伝搬手段と、視差候補決定手段と、下位階層データ項生成手段と、下位階層スムーズ項生成手段と、下位階層エネルギー伝搬手段と、視差決定手段と、を備えることを特徴とする。
【0017】
かかる構成によれば、視差推定装置は、上位階層データ項生成手段によって、前記ステレオ画像が入力されると共に、入力された前記ステレオ画像から誤差関数を用いてデータ項を生成する。また、視差推定装置は、上位階層スムーズ項生成手段で、所定の生成式によってスムーズ項を生成する。
【0018】
また、視差推定装置は、上位階層エネルギー伝搬手段によって、前記上位階層データ項生成手段が生成したデータ項と前記上位階層スムーズ項生成手段が生成したスムーズ項とを含む前記画素ごとのエネルギーが集合したエネルギー集合を生成し、当該エネルギー集合を複数の画素で構成されるブロックに分割し、処理対象の前記ブロックの移動と、当該処理対象のブロックに対する所定の生成式によって生成したエネルギーの伝搬とを繰り返して、前記ブロックごとにエネルギーを更新する。そして、視差推定装置は、視差候補決定手段によって、前記上位階層エネルギー伝搬手段が更新したブロックごとのエネルギーが最小となる視差を前記ブロックの視差として決定し、当該ブロックの視差を当該ブロックに含まれる画素に割り当てて当該画素ごとの視差候補として出力する。つまり、視差推定装置は、1つのブロックを1つの画素とみなしてエネルギーの伝搬を行う。
【0019】
また、視差推定装置は、下位階層データ項生成手段によって、前記ステレオ画像が入力されると共に、入力された前記ステレオ画像から誤差関数を用いてデータ項を生成する。そして、視差推定装置は、下位階層スムーズ項生成手段で、所定の生成式によってスムーズ項を生成する。
【0020】
また、視差推定装置は、下位階層エネルギー伝搬手段によって、前記下位階層データ項生成手段が生成したデータ項と前記下位階層スムーズ項生成手段が生成したスムーズ項とを含む前記画素ごとのエネルギーが集合したエネルギー集合を生成し、当該エネルギー集合内における画素間で、所定の生成式によって生成したエネルギーを伝搬して、前記画素ごとにエネルギーを更新する。そして、視差推定装置は、視差決定手段によって、前記下位階層エネルギー伝搬手段が更新した画素ごとのエネルギーが最小となる視差であって、前記視差候補決定手段から入力された視差候補に含まれる視差を前記視差情報として決定する。
【0021】
つまり、視差推定装置は、ブロックの階層(上位階層)で画像全体のおおまかな視差(視差候補)を求め、画素の階層(下位階層)で被写体の輪郭を重視した視差を求める。そして、視差推定装置は、上位階層の視差候補に含まれる下位階層の視差を視差情報として決定することで、上位階層と下位階層との視差推定結果を統合する。
【0022】
また、前記した課題を解決するため、本願第4発明に係る視差推定装置は、ステレオ画像間の類似度を示すデータ項と視差の連続性を示すスムーズ項とを含むエネルギーを最小化する手法により、前記ステレオ画像の画素ごとの視差を示す視差情報を決定する視差推定装置であって、データ項生成手段と、スムーズ項生成手段と、エネルギー伝搬手段と、視差決定手段と、を備えることを特徴とする。
【0023】
かかる構成によれば、視差推定装置は、データ項生成手段によって、前記ステレオ画像が入力されると共に、前記正規化相互相関で算出した前記類似度にコサイン逆関数を適用した誤差関数を用いて、入力された前記ステレオ画像からデータ項を生成する。ここで、正規化相互相関で算出した類似度にコサイン逆関数を適用することで、視差推定装置は、エネルギーの最小値を見つけやすいエネルギー分布を得ることができる。また、視差推定装置は、スムーズ項生成手段で、所定の生成式によってスムーズ項を生成する。
【0024】
また、視差推定装置は、エネルギー伝搬手段によって、前記データ項生成手段が生成したデータ項と前記スムーズ項生成手段が生成したスムーズ項とを含む前記画素ごとのエネルギーが集合したエネルギー集合を生成し、当該エネルギー集合内における画素間で、所定の生成式によって生成したエネルギーを伝搬して、前記画素ごとにエネルギーを更新する。そして、視差推定装置は、視差決定手段によって、前記エネルギー伝搬手段が更新した画素ごとのエネルギーが最小となる視差を前記視差情報として推定する。
【0025】
また、本願第1発明〜本願第4発明に係る視差推定装置は、コンピュータを、前記した各手段として機能させる視差推定プログラムによって実現することが好ましい。
【発明の効果】
【0026】
本発明は、以下のような優れた効果を奏する。
本願第1発明は、エネルギーの最小値を見つけやすいエネルギー分布を得ることができると共に、画像全体のおおまかな視差を求めた上位階層の視差推定結果と、被写体の輪郭を重視して視差を求めた下位階層の視差推定結果とを統合する。これによって、本願第1発明は、ステレオ画像間に輝度差が生じた場合でも、その輝度差に起因する視差推定の誤差を少なくでき、視差の推定精度の低下を抑制することができる。
【0027】
本願第2発明は、信頼度伝搬法において、ステレオ画像間に輝度差が生じた場合でも、その輝度差に起因する視差推定の誤差を少なくでき、視差の推定精度の低下を抑制することができる。
【0028】
本願第3発明は、画像全体のおおまかな視差を求めた上位階層の視差推定結果と、被写体の輪郭を重視して視差を求めた下位階層の視差推定結果とを統合する。これによって、本願第3発明は、ステレオ画像間に輝度差が生じた場合でも、その輝度差に起因する視差推定の誤差を少なくでき、視差の推定精度の低下を抑制することができる。
【0029】
本願第4発明は、エネルギーの最小値を見つけやすいエネルギー分布を得ることができる。これによって、本願第4発明は、ステレオ画像間に輝度差が生じた場合でも、その輝度差に起因する視差推定の誤差を少なくでき、視差の推定精度の低下を抑制することができる。
【図面の簡単な説明】
【0030】
【図1】本発明での信頼度伝搬法による視差推定を説明する説明図である。
【図2】本発明での信頼度伝搬法による視差推定の手順を示すフローチャートである。
【図3】本発明の第1実施形態に係る視差推定装置の構成を示すブロック図である。
【図4】本発明における上位階層(ブロック)を説明する説明図である。
【図5】本発明における下位階層(画素)を説明する説明図である。
【図6】図3の視差推定装置によるテンプレートマッチングを説明する説明図である。
【図7】本発明における上位階層でのメッセージの伝搬を説明する説明図である。
【図8】本発明における上位階層の移動を説明する説明図であり、(a)は初期位置の図であり、(b)は(a)から1画素だけ水平方向に移動した図であり、(c)は(b)から1画素だけ水平方向に移動した図であり、(d)は(a)から1画素だけ垂直方向に移動した図である。
【図9】図3の視差推定装置による視差の決定を説明する説明図である。
【図10】図3の視差推定装置の動作を示すフローチャートである。
【図11】本発明の第3実施形態に係る視差推定装置の構成を示すブロック図である。
【図12】本発明の実施例を説明する画像であり、(a)は従来の信頼度伝搬法による視差画像であり、(b)は本発明による視差画像である。
【図13】本発明の実施例を説明する画像であり、輝度を徐々に低下させた際のステレオ画像(L画像、R画像)と、従来の信頼度伝搬法による視差画像と、本発明による視差画像とである。
【図14】従来の信頼度伝搬法による視差推定の際、輝度差により視差の推定精度が低下する問題を説明する図であり、(a)はコート面を示す図であり、(b)は1台目の撮影カメラでコート面の模様を撮影した図であり、(c)は(b)の模様部分の輝度ヒストグラムであり、(d)は2台目の撮影カメラでコート面の模様を撮影した図であり、(e)は(d)の模様部分の輝度ヒストグラムである。
【発明を実施するための形態】
【0031】
(本発明の概略:信頼度伝搬法による視差推定)
本発明の各実施形態では、データ項とスムーズ項とを含むエネルギーを最小化する手法として、信頼度伝搬法を用いている。そこで、最初に、本発明における信頼度伝搬法の概略を説明する。
この信頼度伝搬法(BP法:Belief Propagation法)は、視差情報にマルコフランダムフィールド(MRF:Markov Random Field)モデルを仮定し、ステレオ画像のブロック間のデータ項とスムーズ項とで構成されるエネルギーを最小化することにより、ノイズが少なく滑らかな視差情報を生成するものである。ここで、信頼度伝搬法は、図1に示すように、処理の対象となる画素の近傍画素から、メッセージと呼ばれる各画素にどの視差が割り当てられるかという確率に関するエネルギーを受け取り、それらからメッセージ(エネルギー)を更新して近傍画素に伝搬させる。そして、信頼度伝搬法は、この処理を画像内の全ての画素に対して繰り返し行うことで各画素の視差情報を求める。
【0032】
ここで、図1では、枠(白塗四角形)が画素を示し、矢印mが画素間のメッセージ(エネルギー)の流れを示している。また、図1に示すように、画素を縦横に配列したものをエネルギー集合と呼ぶ。さらに、文字「s」が付された画素sは、メッセージの伝搬元となる画素を示し、文字「p」が付された画素pは、処理対象の画素を示し、文字「q」が付された画素qは、メッセージの伝搬先となる隣接画素を示す。なお、図1では、説明を簡易にするために、一部符号のみを図示した。
【0033】
図2を参照し、信頼度伝搬法による視差推定の手順を説明する。
図2に示すように、信頼度伝搬法では、メッセージの生成に必要なデータ項を生成する(ステップS1)。ここで、データ項を生成する誤差関数は、様々のものがあるが、RSSD(Root Sum of Squared Difference)で生成する場合、下記の式(1)となる。
【0034】
【数1】

【0035】
ここで、fは画素pの視差値、fは画素qの視差値、R(p)は画素pを中心としたブロック内の画素集合、Iはブロック画像の画素値、I´は処理対象画像の画素値、λは誤差関数の重み付けを表す。例えば、視差値fは、2枚のステレオ画像をテンプレートマッチングした際の画素pのずれ量から求めることができる(視差値fも同様)。また、iは水平方向の画素位置、jは垂直方向の画素位置である。
【0036】
続いて、信頼度伝搬法では、下記の式(2)で表されるスムーズ関数でスムーズ項を生成する(ステップS2)。このスムーズ関数は、視差情報の滑らかさ(例えば、ノイズの少なさ)を示す関数である。
【0037】
【数2】

【0038】
そして、信頼度伝搬法では、下記の式(3)で表される生成式によって、メッセージを生成し、このメッセージの伝搬を行う(ステップS3)。
【0039】
【数3】

【0040】
ここで、minは最小値を取得する関数、mはメッセージ、tは反復回数、N(p)/qは画素q以外で画素pへメッセージを渡す近傍画素の集合、sはその近傍画素の要素画素を表す。この式(3)は、漸化式になっており、受け取ったメッセージをもとにメッセージを更新する処理を繰り返し行うことを示す。そして、信頼度伝搬法では、このメッセージの伝搬を全画素で行う。
【0041】
予め設定したT回まで反復したとき、画素qの視差に関するエネルギーは、下記の式(4)で表すことができる。そして、信頼度伝搬法では、この式(4)で表されるエネルギーbが最小になる視差値fを各画素の最終的な視差として決定する(ステップS4)。
【0042】
【数4】

【0043】
以下、本発明の各実施形態について、適宜図面を参照しながら詳細に説明する。なお、各実施形態において、同一の機能を有する手段には同一の符号を付し、説明を省略した。
【0044】
(第1実施形態)
[視差推定装置の構成]
図3を参照し、本発明の第1実施形態に係る視差推定装置1の構成について説明する。図3に示すように、視差推定装置1は、ステレオ画像間の類似度を示すデータ項と視差の連続性を示すスムーズ項とを含むエネルギーを最小化する信頼度伝搬法により、ステレオ画像の視差を示す視差情報を推定するものである。第1実施形態では、視差推定装置1は、上位階層(ブロックの階層)および下位階層(画素の階層)という2つの階層でそれぞれ信頼度伝搬法による視差推定を行うため、上位階層処理部10と、下位階層処理部20とを備える。
【0045】
ここで、図4および図5を参照し、ブロックの階層と、画素の階層とをそれぞれ説明する。この上位階層UBは、図1のエネルギー集合における複数の画素で構成されたブロックである。図4の例では、上位階層UBは、縦横3つの画素で構成されるブロックとなる。そして、上位階層処理部10は、1つの上位階層UBを1つの画素とみなして、信頼度伝搬法による視差推定を行う。なお、図4のエネルギー集合では、枠(白塗四角形)がエネルギー集合内の画素を示し、破線が上位階層UBを示している。また、図4では、説明を簡易にするために、一部符号のみを図示した。
【0046】
また、下位階層LBは、図5に示すように、図1のエネルギー集合における画素のそれぞれである。つまり、下位階層処理部20は、図1の信頼度伝搬法と同様、画素間でメッセージを伝搬させて、視差推定を行うことになる。なお、図5のエネルギー集合では、枠(白塗四角形)がエネルギー集合内の画素を示し、破線が下位階層LBを示している。また、図5では、説明を簡易にするために、一部符号のみを図示した。
【0047】
以下、図3に戻り、視差推定装置1の構成について説明を続ける。
上位階層処理部10は、画像全体のおおまかな視差を求めるべく、上位階層での視差推定を行うものであり、データ項生成手段(上位階層データ項生成手段)11と、スムーズ項生成手段(上位階層スムーズ項生成手段)12と、メッセージ伝搬手段(上位階層エネルギー伝搬手段)13と、視差候補決定手段14とを備える。
【0048】
データ項生成手段11は、ステレオ画像(L画像、R画像)が入力されると共に、後記する誤差関数を用いて、入力されたステレオ画像からデータ項を生成する。まず、データ項生成手段11は、入力されたステレオ画像に対してテンプレートマッチングを行って画素ごとにずれ(視差)を算出する。具体的には、図6に示すように、データ項生成手段11は、L画像(ブロック画像)から所定サイズのテンプレートTPを抜き出す。そして、データ項生成手段11は、抜き出したテンプレートTPをR画像(処理対象画像)全体で移動させながら、それぞれの位置で類似度を求める。このとき、データ項生成手段11は、テンプレートTPをR画像の左端から水平方向に移動させながらテンプレートマッチングを行う(ラスタスキャン)。
【0049】
ここで、データ項生成手段11は、正規化相互相関(ZNCC)で類似度を算出する。つまり、データ項生成手段11は、ステレオ画像の類似度を下記の式(5)を用いて算出する。
【0050】
【数5】

【0051】
ここで、Iはブロック画像のテンプレート内の画素値の平均値、I´は処理対象画像のテンプレート内の画素値の平均値である。
【0052】
そして、データ項生成手段11は、この類似度にコサイン逆関数を適用する誤差関数によって、この類似度をブロック画像および処理対象画像双方のベクトルのなす角に変換し、データ項を生成する。つまり、データ項生成手段11は、下記の式(6)および式(7)で表される誤差関数によりデータ項を生成する。このとき、データ項生成手段11は、上位階層での処理を行うところ、式(7)で表される上位階層ごとの誤差関数を用いる。このとき、上位階層で画像全体のおおまかな視差を求めるため、データ項生成手段11は、後記するデータ項生成手段21よりも、式(6)における重み付けを小さく設定する(例えば、λ=5)。その後、データ項生成手段11は、生成したデータ項をメッセージ伝搬手段13に出力する。
【0053】
【数6】

【0054】
【数7】

【0055】
ここで、p´は処理対象の上位階層(ブロック)であり、B(p)は画素pを中心とするε×εの上位階層(ブロック)内の画素集合である。
【0056】
スムーズ項生成手段12は、所定の生成式によってスムーズ項を生成する。ここで、スムーズ項生成手段12は、下記の式(8)で表される上位階層ごとのスムーズ関数を用いて、スムーズ項を生成する。そして、スムーズ項生成手段12は、生成したスムーズ項をメッセージ伝搬手段13に出力する。
【0057】
【数8】

【0058】
ここで、q´は上位階層p´のメッセージ伝搬先となる上位階層(ブロック)、εは上位階層(ブロック)境界の画素数である。つまり、εは、上位階層(ブロック)の縦横一辺あたりの画素数である。
【0059】
ここで、マルコフランダムフィールドおよびスムーズ項について補足する。このマルコフランダムフィールドは、画像で互いに隣接する画素の色、輝度や視差が似ていることを示すモデルである。そして、スムーズ項は、このマルコフランダムフィールドを踏まえた視差の連続性に関する関数であり、各画素に視差を割り当てた際、互いに隣接する画素の視差が同じであればエネルギーが小さく、異なればエネルギーが大きくなる。例えば、マルコフランダムフィールドでは、ある画素の視差値が1で、その隣接画素の視差値が1である場合、エネルギーは0となる。また、ある画素の視差値が1で、その画素に隣接する画素の視差値が2である場合、例えば、エネルギーは1となる。さらに、ある画素の視差値が1で、その隣接画素の視差値が10である場合、例えば、エネルギーは9となる。つまり、信頼度伝搬法において、エネルギーが最小となる視差が最終的な視差情報となることを考慮すれば、このマルコフランダムフィールドにより、互いに隣接する画素は、同じような視差値になり易くなる。
【0060】
メッセージ伝搬手段13は、データ項生成手段11からデータ項が入力され、スムーズ項生成手段12からスムーズ項が入力される。そして、メッセージ伝搬手段13は、図1と同様に、これらデータ項およびスムーズ項を含むエネルギーが集合したエネルギー集合を生成する。例えば、メッセージ伝搬手段13は、画像における画素位置に対応した位置に画素ごとのエネルギーを配置することで、エネルギー集合を生成する。
【0061】
そして、メッセージ伝搬手段13は、このエネルギー集合を予め設定した数の画素(例えば、縦横にε個の画素)で構成される上位階層に分割し、処理対象の上位階層の移動と、処理対象の上位階層に対するメッセージの伝搬とを繰り返して、上位階層ごとにエネルギーを更新する。言い換えるなら、メッセージ伝搬手段13は、前記した式(3)において、1つの上位階層を1つの画素とみなして、上位階層間でメッセージの伝搬を行う。なお、移動とは、エネルギー集合内において、処理対象の上位階層を水平方向および垂直方向に所定の回数移動させることであり、その詳細は後記する。
【0062】
視差候補決定手段14は、メッセージ伝搬手段13が更新した、上位階層ごとのエネルギーが最小となる視差を上位階層の視差として決定する。つまり、視差候補決定手段14は、前記した式(4)において、1つの上位階層を1つの画素とみなして、上位階層の視差を決定する。そして、視差候補決定手段14は、決定した上位階層の視差をこの上位階層に含まれる各画素に割り当てて、画素ごとの視差候補として後記する視差決定手段24に出力する。
【0063】
<上位階層でのメッセージの伝搬および視差候補の決定>
以下、図7,図8を参照し、メッセージ伝搬手段13および視差候補決定手段14を詳細に説明する(適宜図3参照)。なお、図7,図8のエネルギー集合では、枠(白塗四角形)が画素を示し、矢印mがメッセージの流れを示し、破線が上位階層UB(UB1〜5)を示している。また、図7,図8では、説明を簡易にするために、一部符号のみを図示した。
【0064】
例えば、図7に示すように、メッセージ伝搬手段13は、メッセージの伝搬元である上位階層UB1〜UB3から、処理対象の上位階層UB4にメッセージを受け渡す。また、上位階層UB4において、メッセージ伝搬手段13が、受け取ったメッセージで、上位階層UB4のエネルギーを更新する共に、上位階層UB4から、メッセージの伝搬先である上位階層UB5にメッセージを受け渡す。このとき、視差候補決定手段14は、処理対象の上位階層UB4について、エネルギーが最小となる視差をこの上位階層UB4の視差として決定する。そして、視差候補決定手段14は、この上位階層UB4の視差を、上位階層UB4に含まれる全ての画素の視差とする。
【0065】
また、メッセージ伝搬手段13および視差候補決定手段14は、処理対象の上位階層UBを移動させながら、前記した処理を繰り返す。具体的には、メッセージ伝搬手段13および視差候補決定手段14は、図8(a)に示す初期位置において、処理対象の上位階層UBの視差を決定する。そして、メッセージ伝搬手段13は、図8(b)に示すように、図8(a)に示す初期位置から処理対象の上位階層UBを水平方向に1つの画素だけ移動させ、この位置での視差を決定する。さらに、メッセージ伝搬手段13は、図8(c)に示すように、図8(b)に示す位置から処理対象の上位階層UBを水平方向に1つの画素だけ移動させ、この位置での視差を決定する。このように、メッセージ伝搬手段13は、処理対象の上位階層UBを初期位置から水平方向に移動させながらの処理を、ε回行う。
【0066】
次に、図8(d)に示すように、メッセージ伝搬手段13は、図8(a)に示す初期位置から処理対象の上位階層UBを垂直方向に1つの画素だけ移動させ、この位置での視差を決定する。そして、メッセージ伝搬手段13は、図8(d)の位置から上位階層UBを水平方向に移動させながらそれぞれの位置で視差を決定する。このように、メッセージ伝搬手段13は、ε行の処理が完了するまで視差の決定を繰り返す。その結果、各画素には、処理を繰り返した回数(つまり、ε×ε回、図7の例では9回)だけの視差(視差値)が割り当てられる。従って、視差候補決定手段14は、割り当てられた視差(視差値)のそれぞれを、画素ごとの視差候補として視差決定手段24に出力する。
【0067】
なお、エネルギー集合の周辺に位置する画素は、中心側に位置する画素よりも視差(視差候補)の数が少ない場合がある。例えば、左上等の4隅に位置する画素は、処理対象の上位階層UBに1回しか含まれないため、視差(視差候補)が1個となる。また、例えば、最上列左側2行目の画素は、処理対象の上位階層UBに2回しか含まれないため、視差(視差候補)が2個となる。
【0068】
以下、図3に戻り、視差推定装置1の構成について説明を続ける。
下位階層処理部20は、被写体の輪郭を重視して視差を求めるべく、下位階層(下位ブロック)での視差推定を行うものであり、データ項生成手段(下位階層データ項生成手段)21と、スムーズ項生成手段(下位階層スムーズ項生成手段)22と、メッセージ伝搬手段(下位階層エネルギー伝搬手段)23と、視差決定手段24とを備える。
【0069】
データ項生成手段21は、ステレオ画像(L画像、R画像)が入力されると共に、データ項生成手段11と同様に、入力されたステレオ画像からデータ項を生成する。つまり、データ項生成手段21は、前記した式(5)でステレオ画像の類似度を求め、前記した式(6)で表される誤差関数を用いてデータ項を生成する。このとき、下位階層では被写体の輪郭を重視して視差を求めるため、データ項生成手段21は、前記したデータ項生成手段11よりも、式(6)における重み付けを大きくする(例えば、λ=15)。そして、データ項生成手段21は、生成したデータ項を後記するメッセージ伝搬手段23に出力する。
【0070】
スムーズ項生成手段22は、所定の生成式によってスムーズ項を生成する。つまり、スムーズ項生成手段22は、前記した式(2)で表されるスムーズ関数を用いて、スムーズ項を生成する。そして、スムーズ項生成手段22は、生成したスムーズ項をメッセージ伝搬手段23に出力する。
【0071】
メッセージ伝搬手段23は、データ項生成手段21からデータ項が入力され、スムーズ項生成手段22からスムーズ項が入力される。そして、メッセージ伝搬手段23は、これらデータ項およびスムーズ項を含むエネルギーが集合したエネルギー集合を生成する。この場合、メッセージ伝搬手段23は、前記した式(3)を用いて、メッセージを生成する。そして、メッセージ伝搬手段23は、このエネルギー集合内の下位階層間でメッセージを伝搬させて、下位階層におけるエネルギーを更新する。
【0072】
視差決定手段24は、メッセージ伝搬手段23が更新した、下位階層におけるエネルギーが最小となる視差を下位階層の視差として決定する。つまり、視差決定手段24は、前記した式(4)が最小となる視差を下位階層の視差として決定する。そして、視差決定手段24は、視差候補決定手段14から入力された視差候補(上位階層の視差)の中に含まれる下位階層の視差を、画素ごとの視差情報として推定する。
【0073】
以下、図9を参照し、視差情報の推定について説明する。
この図9では、図左側が被写体Obであり、被写体Obの輪郭Egを太線で図示した。従って、図9右側が、被写体Ob以外の背景部分となる。さらに、図9では、画素のそれぞれを破線の枠(四角形)で図示した。
また、上位階層の一辺あたりの画素数が3画素(ε=3)であるとして説明する。言い換えるなら、各画素の視差候補が3×3=9個存在することになる。
【0074】
まず、輪郭Egから離れた被写体Obに対応する画素(下位階層)α1について考える。ここで、この画素α1は、その近隣画素と殆ど同じ視差になることから、視差候補決定手段14が出力する視差候補の種類が少なくなる(又は1種類)。ここで、例えば、視差候補決定手段14が、画素α1の視差候補を「4,4,3,4,4,4,4,3,4」という9個、つまり、「3,4」という2種類の視差候補を出力したとする。このとき、画素α1の視差値が「4」であれば、視差決定手段24は、画素α1の視差情報を2種類の視差候補「3,4」に含まれる「4」とする。
【0075】
次に、輪郭Egの近くにある被写体Obに対応する画素(下位階層)α2について考える。この画素α2は、被写体Obの視差および背景部分の視差のそれぞれが視差候補となることから、視差候補決定手段14が出力する視差候補の種類が多くなる。ここで、例えば、視差候補決定手段14が、画素α2の視差候補を「1,2,2,1,3,4,4,3,4」という9個、つまり、「1,2,3,4」という4種類の値の視差候補を出力したとする。このとき、画素α2(下位階層)の視差値が「4」であれば、視差決定手段24は、画素α2の視差情報を4種類の視差候補「1,2,3,4」に含まれる「4」とする。
【0076】
さらに、輪郭Egの近くにある背景部分に対応する画素(下位階層)α3について考える。ここで、例えば、視差候補決定手段14が、画素α3の視差候補を「1,2,8,1,3,1,1,2,1」という9個の視差候補を出力したとする。通常、背景部分よりも被写体Obが手前側に位置することから、背景部分に対応する画素α3は、その視差値が、被写体Obに対応する画素α1,α2より小さくなる。しかし、この画素α3で、ステレオ画像の輝度差により、視差候補に「8」というノイズが混入したとする。この場合でも、画素α3(下位階層)の視差値が「2」であれば、視差決定手段24は、画素α3の視差情報を視差候補に含まれる「2」とし、「8」というノイズを視差情報とすることがない。このようにして、視差決定手段24は、画素ごとに上位階層の視差推定結果と下位階層の視差推定結果とを統合し、輝度差による視差推定の精度の低下を抑制する。
【0077】
[視差推定装置の動作]
以下、図10を参照し、視差推定装置1の動作について説明する(適宜図3参照)。
視差推定装置1は、データ項生成手段11によって、上位階層についてデータ項を生成する(ステップS11)。つまり、データ項生成手段11は、入力されたステレオ画像に対してテンプレートマッチングを行い、前記した式(5)でステレオ画像の類似度を求め、前記した式(6)および式(7)で表される誤差関数によりデータ項を生成する。
【0078】
また、視差推定装置1は、スムーズ項生成手段12によって、上位階層についてスムーズ項を生成する(ステップS12)。つまり、スムーズ項生成手段12は、前記した式(8)で表されるスムーズ関数を用いて、スムーズ項を生成する。
【0079】
また、視差推定装置1は、メッセージ伝搬手段13によって、上位階層についてメッセージの伝搬を行う(ステップS13)。つまり、メッセージ伝搬手段13は、エネルギー集合を生成し、このエネルギー集合内における上位階層の移動と、上位階層でのメッセージの伝搬とを繰り返して、上位階層におけるエネルギーを更新する。
【0080】
また、視差推定装置1は、視差候補決定手段14によって、視差候補(上位階層の視差)を決定する(ステップS14)。つまり、視差候補決定手段14は、上位階層におけるエネルギーが最小となる視差を上位階層の視差として決定し、これを上位階層に含まれる画素に割り当てて画素ごとの視差候補とする。
【0081】
また、視差推定装置1は、データ項生成手段21によって、下位階層についてデータ項を生成する(ステップS15)。つまり、データ項生成手段21は、入力されたステレオ画像に対してテンプレートマッチングを行い、前記した式(5)でステレオ画像の類似度を求め、前記した式(6)で表される誤差関数を用いてデータ項を生成する。
【0082】
また、視差推定装置1は、スムーズ項生成手段22によって、下位階層についてスムーズ項を生成する(ステップS16)。つまり、スムーズ項生成手段22は、前記した式(2)で表されるスムーズ関数を用いて、スムーズ項を生成する。
【0083】
また、視差推定装置1は、メッセージ伝搬手段23によって、下位階層についてメッセージの伝搬を行う(ステップS17)。つまり、メッセージ伝搬手段23は、エネルギー集合を生成し、このエネルギー集合内における下位階層(画素)間でメッセージを伝搬させ、下位階層におけるエネルギーを更新する。
【0084】
また、視差推定装置1は、視差決定手段24によって、視差を決定する(ステップS18)。つまり、視差決定手段24は、下位階層におけるエネルギーが最小となる視差を下位階層の視差として決定する。そして、視差決定手段24は、視差候補(上位階層の視差)の中に含まれる下位階層の視差を画素ごとの視差情報として決定する。
【0085】
以上のように、本発明の第1実施形態に係る視差推定装置1は、正規化相互相関で算出した類似度にコサイン逆関数を適用することで(式(5)および式(6)参照)、エネルギーの最小値を見つけやすいエネルギー分布を得ることができる。また、視差推定装置1は、上位階層処理部10によって、式(6)のλ(第1の重み係数)を小さな値として画像全体のおおまかな視差を求める。また、視差推定装置1は、下位階層処理部20によって、式(6)のλ(第2の重み係数)を大きな値として被写体の輪郭を重視した視差を求める。そして、視差推定装置1は、上位階層の視差候補に含まれる下位階層の視差を視差情報として推定することで、上位階層と下位階層との視差推定結果を統合する。これによって、視差推定装置1は、ステレオ画像間に輝度差が生じた場合でも、その輝度差に起因する視差推定の誤差を少なくでき、視差の推定精度の低下を抑制することができる。
【0086】
なお、第1実施形態では、データ項およびスムーズ項と記載して説明したが、信頼度伝搬法では、データ項およびスムーズ項のそれぞれをエネルギーと呼ぶ場合がある。この場合でも、本発明の第1実施形態に係る視差推定装置1を適用できることは言うまでもない。
【0087】
なお、第1実施形態では、上位階層処理部10と、下位階層処理部20とを備えることとして説明したが、これに限定されない。例えば、本発明は、図3のデータ項生成手段11,21の機能を有する1つの手段によって上位階層および下位階層のデータ項を生成し、スムーズ項生成手段12,22の機能を有する1つの手段によって上位階層および下位階層のスムーズ項を生成してもよい。そして、本発明は、メッセージ伝搬手段13,23の機能を有する1つの手段によって上位階層および下位階層でのメッセージの伝搬を行い、視差候補決定手段14および視差決定手段24の機能を有する1つの手段によって、最終的に画素ごとに視差を決定してもよい。
【0088】
(第2実施形態)
[視差推定装置の構成]
以下、図3に戻り、本発明の第2実施形態に係る視差推定装置1Aについて、第1実施形態と異なる点を説明する。第2実施形態では、データ項生成手段11およびデータ項生成手段21が用いる誤差関数が、第1実施形態と異なる。
【0089】
データ項生成手段11は、前記した式(6),式(7)以外の誤差関数、例えば、式(1)を用いて、データ項を生成する。
データ項生成手段21は、データ項生成手段11と同様、前記した式(6),式(7)以外の誤差関数、例えば、式(1)を用いて、データ項を生成する。
なお、これら以外の各手段は、第1実施形態と同様のものであるため、説明を省略する。
【0090】
[視差推定装置の動作]
以下、図10を参照し、視差推定装置1Aの動作について、第1実施形態と異なる点を説明する(適宜図3参照)。
【0091】
視差推定装置1Aは、データ項生成手段11によって、例えば、前記した式(1)で表される誤差関数を用いて、上位階層についてデータ項を生成する(ステップS11)。
また、視差推定装置1Aは、データ項生成手段21によって、例えば、前記した式(1)で表される誤差関数を用いて、下位階層についてデータ項を生成する(ステップS15)。
なお、これら以外の各ステップは、第1実施形態と同様のものであるため、説明を省略する。
【0092】
以上のように、本発明の第2実施形態に係る視差推定装置1Aは、上位階層の視差候補に含まれる下位階層の視差を視差情報として推定することで、上位階層と下位階層との視差推定結果を統合する。これによって、視差推定装置1Aは、第1実施形態と同様に、ステレオ画像間に輝度差が生じた場合でも、その輝度差に起因する視差推定の誤差を少なくでき、視差の推定精度の低下を抑制することができる。
【0093】
なお、第2実施形態では、誤差関数が式(1)に限定されない。例えば、本発明の第2実施形態に係る視差推定装置1は、SADによる誤差関数を用いてもよい。
【0094】
(第3実施形態)
[視差推定装置の構成]
以下、図11を参照し、本発明の第3実施形態に係る視差推定装置1Bについて、第1実施形態と異なる点を説明する。第3実施形態では、視差候補(上位階層の視差)を求めない点が、第1実施形態と異なる。このため、視差推定装置1Bは、図11に示すように、データ項生成手段31と、スムーズ項生成手段32と、メッセージ伝搬手段(エネルギー伝搬手段)33と、視差決定手段34とを備える。
【0095】
データ項生成手段31は、ステレオ画像(L画像、R画像)が入力されると共に、データ項生成手段21と同様に、入力されたステレオ画像からデータ項を生成する。つまり、データ項生成手段21は、前記した式(5)でステレオ画像の類似度を求め、前記した式(6)で表される誤差関数を用いてデータ項を生成する。そして、データ項生成手段31は、生成したデータ項を後記するメッセージ伝搬手段33に出力する。
【0096】
スムーズ項生成手段32は、所定の生成式によってスムーズ項を生成する。つまり、スムーズ項生成手段32は、前記した式(2)で表されるスムーズ関数を用いて、スムーズ項を生成する。そして、スムーズ項生成手段32は、生成したスムーズ項をメッセージ伝搬手段33に出力する。
【0097】
メッセージ伝搬手段33は、データ項生成手段31からデータ項が入力され、スムーズ項生成手段32からスムーズ項が入力される。そして、メッセージ伝搬手段33は、これらデータ項およびスムーズ項を含むエネルギーが集合したエネルギー集合を生成する。この場合、メッセージ伝搬手段33は、前記した式(3)を用いて、メッセージを生成する。そして、メッセージ伝搬手段33は、このエネルギー集合内における画素間でメッセージを伝搬させて、画素ごとにエネルギーを更新する。
【0098】
視差決定手段34は、メッセージ伝搬手段33が更新した画素ごとのエネルギーが最小となる視差を画素ごとの視差情報として推定する。つまり、視差決定手段34は、前記した式(4)が最小となる視差を視差情報として推定する。
【0099】
[視差推定装置の動作]
以下、図2に戻り、視差推定装置1Bの動作について説明する(適宜図11参照)。
まず、視差推定装置1Bは、データ項生成手段31によって、データ項を生成する(ステップS1)。つまり、データ項生成手段31は、入力されたステレオ画像に対してテンプレートマッチングを行い、前記した式(5)でステレオ画像の類似度を求め、前記した式(6)で表される誤差関数を用いてデータ項を生成する。
【0100】
また、視差推定装置1Bは、スムーズ項生成手段32によって、所定の生成式によってスムーズ項を生成する(ステップS2)。つまり、スムーズ項生成手段32は、前記した式(2)で表されるスムーズ関数を用いて、スムーズ項を生成する。
【0101】
また、視差推定装置1Bは、メッセージ伝搬手段33によって、画素間でメッセージの伝搬を行う(ステップS3)。つまり、メッセージ伝搬手段33は、エネルギー集合を生成し、このエネルギー集合内における画素間でメッセージを伝搬させてエネルギーを更新する。
【0102】
また、視差推定装置1Bは、視差決定手段34によって、視差を決定する(ステップS4)。つまり、視差決定手段34は、エネルギーが最小となる視差を視差情報として推定する。
【0103】
以上のように、本発明の第3実施形態に係る視差推定装置1Bは、正規化相互相関で算出した類似度にコサイン逆関数を適用することで(式(5)および式(6)参照)、エネルギーの最小値を見つけやすいエネルギー分布を得ることができる。これによって、視差推定装置1Bは、第1,2実施形態と同様に、ステレオ画像間に輝度差が生じた場合でも、その輝度差に起因する視差推定の誤差を少なくでき、視差の推定精度の低下を抑制することができる。
【0104】
なお、各実施形態では、データ項とスムーズ項とを含むエネルギーを最小化する手法の一例として信頼度伝搬法を説明したが、本発明は、これに限定されない。本発明では、この手法として、例えば、ビタビアルゴリズムを用いることもできる。
【0105】
なお、各実施形態では、本発明に係る視差推定装置を独立した装置として説明したが、本発明では、一般的なコンピュータを、前記した各手段として機能させる視差推定プログラムによっても実現することもできる。この視差推定プログラムは、通信回線を介して配布しても良く、CD−ROMやフラッシュメモリ等の記録媒体に書き込んで配布しても良い。
【実施例】
【0106】
以下、実施例として、本発明の効果について説明する。
図3の視差推定装置1を用いて、ステレオ画像の視差推定を行った。また、比較対象として、同一のステレオ画像について、誤差関数に正規化相互相関を用いた従来の信頼度伝搬法により視差推定を行った。そして、それぞれが出力する視差情報から、各画素の視差が大きいほど輝度が高く、視差が小さいほど輝度が低くなる視差画像を生成した。
【0107】
図12(a)に示すように、従来の信頼度伝搬法は、その視差画像において、被写体の輪郭が不鮮明な箇所が点在する。一方、図12(b)に示すように、本発明は、その視差画像において、被写体の輪郭が鮮明になっている。この結果から、本発明は、従来技術に比べて有効であることが確認できる。
【0108】
また、従来の信頼度伝搬法および本発明のそれぞれについて、ステレオ画像間に輝度差が生じた場合、視差の推定精度がどの程度低下するか実験した。具体的には、ステレオ画像の一方(R画像)の輝度を徐々に低下させながら、従来の信頼度伝搬法および本発明のそれぞれで視差推定を行って視差画像を生成した。そして、図13に、輝度を徐々に低下させた際のステレオ画像(L画像、R画像)、従来の信頼度伝搬法による視差画像(従来技術)、および、本発明による視差画像(実施例)を示した。
【0109】
なお、図13では、従来技術において、M=1、N=1、λ=0.07、および、T=10とした。ここで、Mは上位階層の縦方向の画素数、Nは上位階層の横方向の画素数である。また、実施例の上位階層において、M=3、N=3,λ=5、ε=3、および、T=10とした。さらに、実施例の下位階層において、M=3、N=3,λ=15、および、T=10とした。
【0110】
従来の信頼度伝搬法で輝度を1%低下させた場合、その視差画像は、被写体の輪郭のくずれが目立つようになる。そして、従来の信頼度伝搬法で輝度を3%低下させた場合、その視差画像は、被写体の輪郭が大きく崩れるようになる。さらに、従来の信頼度伝搬法で輝度を10%低下させた場合、その視差画像において、被写体の輪郭を判別することが不可能となる。このことから、従来の信頼度伝搬法では、ステレオ画像間の輝度差が大きくなるほど、視差の推定精度が大きく低下していることがわかる。
【0111】
一方、本発明では、輝度を1%から10%までの間で低下させても、被写体の輪郭に大きな崩れは見られない。このことから、本発明は、ステレオ画像間の輝度差が大きくなっても、視差の推定精度の低下を十分に抑制できると考えられる。従って、本発明は、例えば、屋外などの撮影環境が整っていない場所で撮影した多視点カメラ画像にも適用することができる。より具体的には、本発明は、例えば、スポーツのあるシーンを多視点カメラで撮影し、撮影映像に視差推定を行うことで、シーンの3次元立体モデルを生成に応用することができる。
【符号の説明】
【0112】
1 視差推定装置
1A 視差推定装置
1B 視差推定装置
10 上位階層処理部
11 データ項生成手段(上位階層データ項生成手段)
12 スムーズ項生成手段(上位階層スムーズ項生成手段)
13 メッセージ伝搬手段(上位階層エネルギー伝搬手段)
14 視差候補決定手段
20 下位階層処理部
21 データ項生成手段(下位階層データ項生成手段)
22 スムーズ項生成手段(下位階層スムーズ項生成手段)
23 メッセージ伝搬手段(下位階層エネルギー伝搬手段)
24 視差決定手段
31 データ項生成手段
32 スムーズ項生成手段
33 メッセージ伝搬手段(エネルギー伝搬手段)
34 視差決定手段

【特許請求の範囲】
【請求項1】
ステレオ画像間の類似度を示すデータ項と視差の連続性を示すスムーズ項とを含むエネルギーを最小化する手法により、前記ステレオ画像の画素ごとの視差を示す視差情報を決定する視差推定装置であって、
前記ステレオ画像が入力されると共に、正規化相互相関で算出した前記類似度にコサイン逆関数を適用した誤差関数を用いて、入力された前記ステレオ画像からデータ項を生成する上位階層データ項生成手段と、
所定の生成式によってスムーズ項を生成する上位階層スムーズ項生成手段と、
前記上位階層データ項生成手段が生成したデータ項と前記上位階層スムーズ項生成手段が生成したスムーズ項とを含む前記画素ごとのエネルギーが集合したエネルギー集合を生成し、当該エネルギー集合を複数の画素で構成されるブロックに分割し、処理対象の前記ブロックの移動と、当該処理対象のブロックに対する所定の生成式によって生成したエネルギーの伝搬とを繰り返して、前記ブロックごとにエネルギーを更新する上位階層エネルギー伝搬手段と、
前記上位階層エネルギー伝搬手段が更新したブロックごとのエネルギーが最小となる視差を前記ブロックの視差として決定し、当該ブロックの視差を当該ブロックに含まれる画素に割り当てて当該画素ごとの視差候補として出力する視差候補決定手段と、
前記ステレオ画像が入力されると共に、前記正規化相互相関で算出した前記類似度にコサイン逆関数を適用した誤差関数を用いて、入力された前記ステレオ画像からデータ項を生成する下位階層データ項生成手段と、
所定の生成式によってスムーズ項を生成する下位階層スムーズ項生成手段と、
前記下位階層データ項生成手段が生成したデータ項と前記下位階層スムーズ項生成手段が生成したスムーズ項とを含む前記画素ごとのエネルギーが集合したエネルギー集合を生成し、当該エネルギー集合内における画素間で、所定の生成式によって生成したエネルギーを伝搬して、前記画素ごとにエネルギーを更新する下位階層エネルギー伝搬手段と、
前記下位階層エネルギー伝搬手段が更新した画素ごとのエネルギーが最小となる視差であって、前記視差候補決定手段から入力された視差候補に含まれる視差を前記視差情報として決定する視差決定手段と、
を備えることを特徴とする視差推定装置。
【請求項2】
前記上位階層データ項生成手段は、予め設定した第1の重み係数をさらに乗じた前記誤差関数を用いて、前記入力されたステレオ画像から前記データ項を生成し、
前記下位階層データ項生成手段は、前記第1の重み係数より大きな第2の重み係数をさらに乗じた前記誤差関数を用いて、前記入力されたステレオ画像から前記データ項を生成することを特徴とする請求項1に記載の視差推定装置。
【請求項3】
ステレオ画像間の類似度を示すデータ項と視差の連続性を示すスムーズ項とを含むエネルギーを最小化する手法により、前記ステレオ画像の画素ごとの視差を示す視差情報を決定する視差推定装置であって、
前記ステレオ画像が入力されると共に、入力された前記ステレオ画像から誤差関数を用いてデータ項を生成する上位階層データ項生成手段と、
所定の生成式によってスムーズ項を生成する上位階層スムーズ項生成手段と、
前記上位階層データ項生成手段が生成したデータ項と前記上位階層スムーズ項生成手段が生成したスムーズ項とを含む前記画素ごとのエネルギーが集合したエネルギー集合を生成し、当該エネルギー集合を複数の画素で構成されるブロックに分割し、処理対象の前記ブロックの移動と、当該処理対象のブロックに対する所定の生成式によって生成したエネルギーの伝搬とを繰り返して、前記ブロックごとにエネルギーを更新する上位階層エネルギー伝搬手段と、
前記上位階層エネルギー伝搬手段が更新したブロックごとのエネルギーが最小となる視差を前記ブロックの視差として決定し、当該ブロックの視差を当該ブロックに含まれる画素に割り当てて当該画素ごとの視差候補として出力する視差候補決定手段と、
前記ステレオ画像が入力されると共に、入力された前記ステレオ画像から誤差関数を用いてデータ項を生成する下位階層データ項生成手段と、
所定の生成式によってスムーズ項を生成する下位階層スムーズ項生成手段と、
前記下位階層データ項生成手段が生成したデータ項と前記下位階層スムーズ項生成手段が生成したスムーズ項とを含む前記画素ごとのエネルギーが集合したエネルギー集合を生成し、当該エネルギー集合内における画素間で、所定の生成式によって生成したエネルギーを伝搬して、前記画素ごとにエネルギーを更新する下位階層エネルギー伝搬手段と、
前記下位階層エネルギー伝搬手段が更新した画素ごとのエネルギーが最小となる視差であって、前記視差候補決定手段から入力された視差候補に含まれる視差を前記視差情報として決定する視差決定手段と、
を備えることを特徴とする視差推定装置。
【請求項4】
ステレオ画像間の類似度を示すデータ項と視差の連続性を示すスムーズ項とを含むエネルギーを最小化する手法により、前記ステレオ画像の画素ごとの視差を示す視差情報を決定する視差推定装置であって、
前記ステレオ画像が入力されると共に、前記正規化相互相関で算出した前記類似度にコサイン逆関数を適用した誤差関数を用いて、入力された前記ステレオ画像からデータ項を生成するデータ項生成手段と、
所定の生成式によってスムーズ項を生成するスムーズ項生成手段と、
前記データ項生成手段が生成したデータ項と前記スムーズ項生成手段が生成したスムーズ項とを含む前記画素ごとのエネルギーが集合したエネルギー集合を生成し、当該エネルギー集合内における画素間で、所定の生成式によって生成したエネルギーを伝搬して、前記画素ごとにエネルギーを更新するエネルギー伝搬手段と、
前記エネルギー伝搬手段が更新した画素ごとのエネルギーが最小となる視差を前記視差情報として決定する視差決定手段と、
を備えることを特徴とする視差推定装置。
【請求項5】
ステレオ画像間の類似度を示すデータ項と視差の連続性を示すスムーズ項とを含むエネルギーを最小化する手法により、前記ステレオ画像の画素ごとの視差を示す視差情報を決定するために、コンピュータを、
前記ステレオ画像が入力されると共に、正規化相互相関で算出した前記類似度にコサイン逆関数を適用した誤差関数を用いて、入力された前記ステレオ画像からデータ項を生成する上位階層データ項生成手段、
所定の生成式によってスムーズ項を生成する上位階層スムーズ項生成手段、
前記上位階層データ項生成手段が生成したデータ項と前記上位階層スムーズ項生成手段が生成したスムーズ項とを含む前記画素ごとのエネルギーが集合したエネルギー集合を生成し、当該エネルギー集合を複数の画素で構成されるブロックに分割し、処理対象の前記ブロックの移動と、当該処理対象のブロックに対する所定の生成式によって生成したエネルギーの伝搬とを繰り返して、前記ブロックごとにエネルギーを更新する上位階層エネルギー伝搬手段、
前記上位階層エネルギー伝搬手段が更新したブロックごとのエネルギーが最小となる視差を前記ブロックの視差として決定し、当該ブロックの視差を当該ブロックに含まれる画素に割り当てて当該画素ごとの視差候補として出力する視差候補決定手段、
前記ステレオ画像が入力されると共に、前記正規化相互相関で算出した前記類似度にコサイン逆関数を適用した誤差関数を用いて、入力された前記ステレオ画像からデータ項を生成する下位階層データ項生成手段、
所定の生成式によってスムーズ項を生成する下位階層スムーズ項生成手段、
前記下位階層データ項生成手段が生成したデータ項と前記下位階層スムーズ項生成手段が生成したスムーズ項とを含む前記画素ごとのエネルギーが集合したエネルギー集合を生成し、当該エネルギー集合内における画素間で、所定の生成式によって生成したエネルギーを伝搬して、前記画素ごとのエネルギーを更新する下位階層エネルギー伝搬手段、
前記下位階層エネルギー伝搬手段が更新した画素ごとのエネルギーが最小となる視差であって、前記視差候補決定手段から入力された視差候補に含まれる視差を前記視差情報として決定する視差決定手段、
として機能させるための視差推定プログラム。
【請求項6】
前記上位階層データ項生成手段は、予め設定した第1の重み係数をさらに乗じた前記誤差関数を用いて、前記入力されたステレオ画像から前記データ項を生成し、
前記下位階層データ項生成手段は、前記第1の重み係数より大きな第2の重み係数をさらに乗じた前記誤差関数を用いて、前記入力されたステレオ画像から前記データ項を生成することを特徴とする請求項5に記載の視差推定プログラム。
【請求項7】
ステレオ画像間の類似度を示すデータ項と視差の連続性を示すスムーズ項とを含むエネルギーを最小化する手法により、前記ステレオ画像の画素ごとの視差を示す視差情報を決定するために、コンピュータを、
前記ステレオ画像が入力されると共に、入力された前記ステレオ画像から誤差関数を用いてデータ項を生成する上位階層データ項生成手段、
所定の生成式によってスムーズ項を生成する上位階層スムーズ項生成手段、
前記上位階層データ項生成手段が生成したデータ項と前記上位階層スムーズ項生成手段が生成したスムーズ項とを含む前記画素ごとのエネルギーが集合したエネルギー集合を生成し、当該エネルギー集合を複数の画素で構成されるブロックに分割し、処理対象の前記ブロックの移動と、当該処理対象のブロックに対する所定の生成式によって生成したエネルギーの伝搬とを繰り返して、前記ブロックごとにエネルギーを更新する上位階層エネルギー伝搬手段、
前記上位階層エネルギー伝搬手段が更新したブロックごとのエネルギーが最小となる視差を前記ブロックの視差として決定し、当該ブロックの視差を当該ブロックに含まれる画素に割り当てて当該画素ごとの視差候補として出力する視差候補決定手段、
前記ステレオ画像が入力されると共に、入力された前記ステレオ画像から誤差関数を用いてデータ項を生成する下位階層データ項生成手段、
所定の生成式によってスムーズ項を生成する下位階層スムーズ項生成手段、
前記下位階層データ項生成手段が生成したデータ項と前記下位階層スムーズ項生成手段が生成したスムーズ項とを含む前記画素ごとのエネルギーが集合したエネルギー集合を生成し、当該エネルギー集合内における画素間で、所定の生成式によって生成したエネルギーを伝搬して、前記画素ごとにエネルギーを更新する下位階層エネルギー伝搬手段、
前記下位階層エネルギー伝搬手段が更新した画素ごとのエネルギーが最小となる視差であって、前記視差候補決定手段から入力された視差候補に含まれる視差を前記視差情報として決定する視差決定手段、
として機能させるための視差推定プログラム。
【請求項8】
ステレオ画像間の類似度を示すデータ項と視差の連続性を示すスムーズ項とを含むエネルギーを最小化する手法により、前記ステレオ画像の画素ごとの視差を示す視差情報を決定するために、コンピュータを、
前記ステレオ画像が入力されると共に、前記正規化相互相関で算出した前記類似度にコサイン逆関数を適用した誤差関数を用いて、入力された前記ステレオ画像からデータ項を生成するデータ項生成手段、
所定の生成式によってスムーズ項を生成するスムーズ項生成手段、
前記データ項生成手段が生成したデータ項と前記スムーズ項生成手段が生成したスムーズ項とを含む前記画素ごとのエネルギーが集合したエネルギー集合を生成し、当該エネルギー集合内における画素間で、所定の生成式によって生成したエネルギーを伝搬して、前記画素ごとのエネルギーを更新するエネルギー伝搬手段、
前記エネルギー伝搬手段が更新した画素ごとのエネルギーが最小となる視差を前記視差情報として決定する視差決定手段、
として機能させるための視差推定プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図14】
image rotate

【図12】
image rotate

【図13】
image rotate


【公開番号】特開2011−180675(P2011−180675A)
【公開日】平成23年9月15日(2011.9.15)
【国際特許分類】
【出願番号】特願2010−42109(P2010−42109)
【出願日】平成22年2月26日(2010.2.26)
【国等の委託研究の成果に係る記載事項】(出願人による申告)平成21年度、総務省、情報通信研究機構「革新的な三次元映像技術による超臨場感コミュニケーション技術の研究開発」委託事業、産業技術力強化法第19条の適用を受ける特許出願
【出願人】(000004352)日本放送協会 (2,206)
【Fターム(参考)】