説明

トレリス構造を用いてシーンの仮想画像を生成する方法とシステム

【課題】奥行き画像における品質問題を克服し、レンダリング画像内のアーティファクトを低減することができる、トレリスに基づくビュー合成方法を提供する。
【解決手段】シーンの仮想ビューの画像が、該シーンから取得されたテクスチャ画像のセット及び奥行き画像の対応するセットに基づいて生成される。選択された画像の各ピクセルに関連付けられた候補奥行き値のセットが求められる。候補奥行き値ごとに、仮想画像の合成品質を推定するコストが求められる。最小コストを有する候補奥行き値が選択され、ピクセルの最適奥行き値が得られる。次に、各ピクセルの最適奥行き値及びテクスチャ画像に基づいて仮想画像が合成される。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は、包括的には奥行き画像に基づくレンダリング(DIBR)に関し、より詳細には、トレリス構造を用いて仮想ビューの仮想画像を生成する方法に関する。
【背景技術】
【0002】
3Dディスプレイは、各眼の3Dシーンの異なるビューの画像を提示する。従来のステレオシステムでは、左のビュー及び右のビューの画像が取得され、符号化され、格納又は送信され、その後、復号され表示される。より進んだシステムでは、既存の入力ビューとは異なる視点を有する仮想画像を合成して、向上した3D特徴、例えば、ステレオ表示の知覚奥行きの調整、及びシーンの新規の仮想ビューのための多数の仮想画像の生成を可能にし、マルチビュー自動立体ディスプレイをサポートすることができる。
【0003】
奥行き画像に基づくレンダリング(DIBR)は、仮想画像を合成する方法であり、通常、シーンの奥行き画像を必要とする。奥行き画像はノイズを含む可能性があり、これによってレンダリング画像内にアーティファクトが生じる可能性があり、ピクセルレベルの奥行き画像は、通常、オブジェクト境界において発生する奥行き不連続部を必ずしも表すことができず、これはレンダリング画像内のアーティファクトの別の発生源となる。
【0004】
図1に示すように、従来技術によるビュー合成はワーピングステップ110を含み、該ワーピングステップ110において、仮想位置に対応するピクセルが、シーンのジオメトリに基づいて、基準入力画像101及び102、すなわち基準画像のテクスチャ画像及び奥行き画像から、ワーピング画像にワーピングされる。テクスチャ画像において、各ピクセル(サンプル)は2Dロケーション及び輝度を有し、輝度は、3(RGB)チャネルが用いられる場合、色とすることができる。奥行き画像において、2Dロケーションにある各ピクセルは、カメラからシーンへの奥行きである。
【0005】
ブレンディング120中、入力視点ごとに、ワーピング画像が単一の画像に結合される。穴埋め130は、ブレンディング画像内の任意の残った穴を埋め、合成された仮想画像103を生成する。ブレンディングは、合成仮想画像が生成される入力視点が複数存在するときのみ実行される。
【0006】
ワーピングステップは、前方ワーピング及び後方ワーピングを含むことができる。前方ワーピングでは、基準画像内のピクセル値は、3D射影を介して仮想画像にマッピングされる。一方、後方ワーピングでは、基準画像内のピクセル値は仮想画像に直接マッピングされない。代わりに、奥行き値が仮想画像にマッピングされ、次にワーピングされた奥行き画像を用いて、仮想画像内のピクセルロケーションごとに基準画像内の対応するピクセル値を求める。
【0007】
仮想画像内のピクセルのほとんどは、ワーピングプロセス後にマッピングされる。一方、いくつかのピクセルは対応するマッピングされた奥行き値を一切有しない。これは、或る視点から別の視点へのディスオクルージョン(disocclusion:非遮蔽)によって生じる。マッピングされた奥行き値のないピクセルは、仮想画像の穴として知られている。
【0008】
複数の入力基準画像が存在するとき、ブレンディングを用いてワーピング結果を単一の画像に統合する。いくつかの穴は、このステップ中に補完的に埋めることができる。すなわち、左の基準画像の穴は、右の基準画像からマッピングされた値を有することができる。加えて、ブレンディングによって、異なる基準画像からの異なるマッピング値が存在するときに生じるマッピング衝突を解消することもできる。例えば、加重平均を適用することができるか、又は基準画像に対する仮想視点ロケーションの近接度に依拠してマッピング値のうちの1つが選択される。
【0009】
ブレンディングプロセスの後、いくつかの穴が残っている。このため、最終的な穴埋めが必要となる。例えば、インペインティングを用いて周囲のピクセル値を残りの穴に広げる(propagate)ことができる。1つの実施態様では、背景ピクセルを小さな穴に広げる。
【発明の概要】
【発明が解決しようとする課題】
【0010】
従来技術の方法は、奥行きマップ画像におけるエラーに対処することができない。したがって、合成画像に境界アーティファクトがなくなり、かつ合成画像が、入力画像内に存在する画像特徴と幾何学的に一致するように、合成画像の品質を改善するためのより正確なビュー合成が必要とされている。
【0011】
ビュー合成は、自由視点ナビゲーション、及び自動立体ディスプレイ用の画像生成を含む、複数の3Dビデオ用途に不可欠な機能である。この目的では通常、奥行き画像に基づくレンダリング(DIBR)法が適用される。
【0012】
しかしながら、レンダリング画像の品質は奥行き画像の品質に非常に敏感であり、奥行き画像は通常、エラーを起こしやすいプロセスによって推定される。さらに、ピクセルごとの奥行き画像は、特に奥行き境界に沿った3Dシーンの理想的表現ではない。この表現によって、オクルージョン領域を有するシーンの合成結果が不自然になる可能性がある。
【0013】
この発明の実施の形態は、奥行き画像における上記の制限を克服し、レンダリング画像内のアーティファクトを低減することができる、トレリスに基づくビュー合成方法を提供する。
【課題を解決するための手段】
【0014】
この方法により、ワーピングされる必要があるピクセルごとに、奥行き値の候補セットが、該ピクセルの推定奥行き値及び近傍の奥行き値に基づいて特定される。各候補奥行き値のコストが、合成品質の推定値に基づいて定量化される。次に、最適期待品質を有する候補奥行き値が選択される。
【図面の簡単な説明】
【0015】
【図1】従来技術のビュー合成方法のブロック図である。
【図2】この発明の実施の形態に従って構築されたビュー合成のトレリスの概略図である。
【図3】この発明の実施の形態による、次のピクセルの奥行き値を予測するのに用いられる近傍のピクセルの概略図である。
【図4】この発明の実施の形態による、次のピクセルの奥行き値を予測するのに用いられる近傍のピクセルの別の概略図である。
【図5】この発明の実施の形態による、次のピクセルの奥行き値を予測するのに用いられる近傍のピクセルの別の概略図である。
【図6】この発明の実施の形態による、異なるコスト関数を割り当てられた奥行き境界を増減することの概略図である。
【図7】この発明の実施の形態による、トレリスに基づくビュー合成の方法のフローチャートである。
【図8】この発明の実施の形態による、トレリスに基づくビュー合成の非反復的方法のフローチャートである。
【図9】この発明の実施の形態による、トレリスに基づくビュー合成の反復的方法のフローチャートである。
【発明を実施するための形態】
【0016】
奥行き画像は、推定プロセス又は取得プロセスによって生じたエラーを有する可能性がある。加えて、ピクセルごとの奥行き画像の表現は、奥行き不連続性において必ずしも正確であるとは限らない。
【0017】
したがって、この発明の実施の形態は、奥行き画像の表現及び推定における制限を克服するトレリスに基づくビュー合成方法を提供する。奥行き画像は、レンジカメラによって取得することもできるし、左テクスチャ画像及び右テクスチャ画像における立体視差対応から推定することもできる。この方法は、奥行き画像に基づくレンダリング(DIBR)のワーピングプロセス中に適用される。
【0018】
図2は、この発明の実施の形態によるビュー合成のために構築されたトレリス201の一例を示している。トレリス201は、所定の数のピクセルについて構築される。1つの実施の形態では、画像ピクセルの1つのラインがトレリスに構成され、ワーピングプロセスはラインごとに実行される。すなわち、トレリスの各列は異なる奥行き値A〜Dを有する1つの画像ピクセルを表す。トレリスの各列内のノードは、仮想画像内のそのピクセルの候補奥行き値マッピングを表す。
【0019】
第1のステップにおいて、奥行き値のセット202がピクセルごとに特定される。セットは、入力奥行き画像から推定された奥行き値、及び近傍の奥行き値に基づくいくつかの他の候補奥行き値を含む。候補奥行き値の数は、トレリス内の行数に対応する。図2では、各ピクセルはトレリス内の4つの行に対応する4つの奥行き値A〜Dを有する。
【0020】
第2のステップにおいて、コスト関数を用いて合成品質を推定する。合成品質は最適候補奥行き値を選択する判断基準である。
【0021】
候補奥行き値のセットを求める
第1のステップにおいて、入力奥行き画像からの推定奥行き値を含む候補奥行き値のセットが特定される。この値に加えて、いくつかの他の候補奥行き値が近傍の奥行き値から特定される。候補奥行き値は、入力奥行き画像からの推定奥行き値が正しくないとき、すなわち該奥行き値によってアーティファクト又は入力画像との不一致が生じるときに用いることができる。以下で、最適候補奥行き値を求めるいくつかの方法を説明する。
【0022】
候補奥行き値のセットを求める1つの方法は、入力奥行き画像からの推定値に対する所定の増加及び/又は減少を用いる方法である。例えば、推定奥行き値が50である場合、奥行き値の候補セットは、{49,50,51}を含むことができる。1以外の係数によるインクリメントも検討することができる。値の数は可変とすることもでき、必ずしも推定奥行き値を中心に対称である必要はなく、例えばセットは{46,48,50,52,54}とすることもできるし、{48,49,50,52,54}とすることもできる。候補奥行き値は、ルックアップテーブルによって求めることもできる。ルックアップテーブルでは、候補奥行き値は場合によっては推定奥行き値ごとに変動することができる。
【0023】
候補奥行き値のセットを求める第2の方法は、近傍のピクセルからの奥行き値に基づく予測値を用いる方法である。例えば、近傍の奥行き値からの平均値又は中央値を用いることができる。所定のウィンドウサイズを用いて、予測において検討する近傍ピクセルの数を確定することもできる。
【0024】
好ましい方法は、ウィンドウ内に、同じラインからの前のピクセルを含める。図3では、左からの同じライン内の4つのピクセル301がウィンドウ内にある。図4では、上記のラインからの同じ列内の4つのピクセル401がウィンドウ内にある。図5において、ピクセル501の4×4のウィンドウが特定される。別の実施態様では、ピクセルは任意の形状に適合することができる。候補奥行き値の数が増加する結果として、計算複雑度が増加する。なぜなら、各候補がチェックされ、比較されるためである。
【0025】
図2では、ピクセルごとに候補奥行き値の数が4にセットされている。1つの例では、奥行き値A(下から1行目)は入力奥行き画像からの推定奥行き値を表す。奥行き値B及びC(中央の行2及び3)は、それぞれ奥行き値Aを1だけ増減した奥行き値である。奥行き値D(最上行)は、図3に示すように近傍のピクセルからの中央奥行き値を用いることによって予測された奥行き値を示す。
【0026】
動的プログラミングを用いたビュー合成
候補奥行き値のセットが求められた後、トレリス内の各ノードは、合成品質を推定するコスト関数に従ってメトリックを割り当てられる。次に、ビュー合成問題は、トレリスにわたって奥行き値の最適なセットを求めることによって解決される。動的プログラミングを用いて最適化問題を解決する。
【0027】
合成品質を推定するために、コスト関数として評価関数が定義される。コスト関数は、ワーピングプロセスが前方ワーピングであるか、又は後方ワーピングであるかに依拠することができる。一般性を損なうことなく、この発明の好ましい実施の形態について後方ワーピングを仮定してコスト関数の定義を説明する。この定義は前方ワーピングにも同様に容易に適用することができる。
【0028】
1つの実施態様では、コスト関数はピクセルの2つの正方形ブロック間の平均二乗誤差(MSE)を評価する。これらのブロックはピクセルロケーションに対し左上のブロックである。(x,y)が現在のピクセルロケーションを表すものとし、(x’,y’)が候補奥行き値を用いてワーピングされた位置を表すものとする。
【0029】
第1のブロックは合成仮想画像内の(x−s,y−s)〜(x,y)に位置し、第2のブロックは基準画像内の(x’−s,y’−s)〜(x’,y’)に位置する。ここで、sはブロックサイズである。ブロックの一部分が画像エリアを越えている場合、クロッピングが適用される。
【0030】
MSE以外のエネルギー関数もコスト関数として用いることができる。例えば、平均絶対誤差は、合成品質を推定する有効なコスト関数である。また、画像特徴又は構造類似度(structural similarity measure)もブロックから抽出することができ、整合プロセスを用いてブロックが幾何学的に一貫しているか否かを判断することができる。
【0031】
前景オブジェクトにおける任意のアーティファクトは、人間の眼によって、より容易に知覚されるので、前景のオブジェクトを一貫した方式で合成する方法が必要とされている。このため、この方法では、コストメトリックを求めるのに左上のブロックが必ずしも用いられるとは限らない。
【0032】
図6に示すように、ピクセルは3つのタイプのエリア、すなわち、図6に示すような第1のエリア601、奥行き減少エリア602、及び奥行き増加エリア603に分類される。奥行き減少境界(図6の右境界)又はフラットエリアにあるピクセルの場合、左上ブロックが用いられる。奥行き増加境界(図6の左境界)にあるピクセルの場合、右上ブロックが用いられる。
【0033】
いくつかの応用形態では、合成プロセスへの入力として、推定奥行き画像に加えて信頼マップも用いることができる。奥行き推定器が高い信頼度を示すとき、奥行き画像からの奥行き値のコスト関数を係数によって重み付けすることができる。
【0034】
システムの実施の形態
以下において、トレリスに基づく画像合成について図7〜図9に示す3つの実施の形態を説明する。これらの実施の形態は、複雑度の昇順で並べられる。図において、「サンプル」は様々な画像内のピクセルである。
【0035】
図7に示すような第1の実施の形態において、限られた複雑度で局所最適化が実行される。この実施の形態では、候補奥行き値選択は前のピクセルからの最適奥行き候補の選択に依拠しない。したがって、候補奥行き値割当て及びピクセルの評価を並行に実行することができる。この実施態様のステップごとの説明を以下に記載する。
【0036】
図7〜図9に示すステップは、当該技術分野において既知のメモリ及び入力/出力インターフェースに接続されたプロセッサにおいて実行することができる。仮想画像を表示デバイスにレンダリング及び出力することができる。代替的に、ステップは、ビデオ符号化器又は復号器(コーデック)内のディスクリート電子部品を含む手段を用いてシステム内に実装することができる。より具体的には、ビデオ符号化/復号システムに関しては、この発明において説明される仮想画像を生成する方法を用いて、他のビューの画像を予測することもできる。例えば、参照によりこの明細書に援用される、米国特許第7,728,877号「Method and system for synthesizing multiview videos」を参照されたい。
【0037】
ステップ701:トレリス内の全てのピクセルの候補奥行き値を特定する。このステップにおいて、以下の候補が求められる。
a.奥行き値A:現在のピクセルの奥行き画像においてシグナリングされている奥行き値を選択する。ピクセルがそのライン内の第1のピクセルでない場合、以下のように2つの更なる奥行き値候補が選択される。
b.奥行き値B:同じラインの前の複数のピクセルの奥行き画像においてシグナリングされた奥行き値のセットにおいて、奥行き値Aと最も異なる奥行き値を選択する。前のピクセルは図3に示すものである。4つの前のピクセルが好ましい。
c.奥行き値C:奥行き値Cは奥行き値Bと異なり、同じラインから選択され、図4に示すように上記のラインからの同じ列内の奥行き値間で選択され、奥行き値Aと最も異なる。
d.奥行き値D:この実施の形態ではそのような候補奥行き値はない。
【0038】
ステップ702:各ピクセルの候補奥行き値ごとのコストを評価する。
【0039】
ステップ703:ピクセルごとの全ての候補奥行き値のコストを比較し、最小コストを有する候補奥行き値を求める。ピクセルごとに対応する奥行き値を選択する。
【0040】
図8は、複雑度が制限された局所最適化でもある第2の実施の形態を示している。この実施態様では、トレリスの列内の候補奥行き値割当ては、トレリス内の直前のピクセル又は列の最適奥行き選択に依拠する。以下は、この実施態様のステップごとの説明である。
【0041】
ステップ801:インデックスiを初期化する。
【0042】
ステップ802:ピクセルiの候補奥行き値を特定する。このステップにおいて、図7に示す実施の形態と同様にして選択された3つの奥行き値候補を含む。しかしながら、奥行き値B及びCを導出するとき、前のピクセルからの最適奥行き値が用いられ、これは奥行き画像においてシグナリングされるものと異なり得る。
【0043】
ステップ803:ピクセルiの奥行き候補ごとのコストを評価する。
【0044】
ステップ804:すべての奥行き候補のコストを比較し、ピクセルiの最小コストを求める。
【0045】
ステップ805:トレリス内で処理されていない更なるピクセルが存在する場合、iを1だけ増加し(806)、反復する。
【0046】
第1の2つの実施の形態では、最適奥行き候補は局所コスト関数を評価することによってトレリス内で行ごとに選択される。第3の実施の形態では、列からの奥行き候補を結合したものである、トレリスにわたる最適経路が求められる。経路コストは、経路内のノードコストの和として定義される。
【0047】
異なる経路内のノードに異なる奥行き値を割り当てることができるので、ノードは異なる経路内で異なるコスト値を呈することができる。この実施の形態は図9に示されている。手順は、i及びpにわたって反復する2つのループからなる。外側のループは全ての可能な経路にわたるものである一方、内側のループは可能な経路内の全てのノードについてのものである。
【0048】
潜在的な経路ごとに、経路内で順次、ノードの候補奥行き値を特定し(901)評価する(902)。奥行き候補割当ては以下のように求められる。経路内に更なるピクセルがあるか否かを判断する(903)。
【0049】
次のノードが行「奥行き値A」に位置する場合、ノードは奥行き画像内でシグナリングされた通りの奥行き値にセットされる。ノードが行「奥行き値B」に位置する場合、同じライン内の前のピクセルの所与の奥行き値のセットからの中央値である奥行き値を選択する。前のピクセルの所与の奥行き値が現在の経路について指定される。ノードが行「奥行き値C」に位置する場合、ノードは、画像内の上記のラインの同じ列からの奥行き値の中央値として選択される。
【0050】
異なる経路が同じノードを交差している場合、該同じノードについて奥行き値Bに異なる値を割り当てることができる。奥行き値A及びCは異なる経路について同じままにされる。
【0051】
経路内の全てのノードが評価された後、ノードコストの合計として経路コストが求められ(904)、更なる経路がない場合(905)、最小コストを有する経路が最終合成結果のために用いられる(906)。

【特許請求の範囲】
【請求項1】
シーンの仮想ビューの画像を、該シーンから取得されたテクスチャ画像のセット及び奥行き画像の対応するセットに基づいて生成する方法であって、
選択された画像の各ピクセルに関連付けられた候補奥行き値のセットを求めるステップと、
前記候補奥行き値ごとに、仮想画像の合成品質を推定するコストを求めるステップと、
前記ピクセルの最適奥行き値を得るために、最小コストを有する前記候補奥行き値を選択するステップと、
前記各ピクセルの前記最適奥行き値及び前記テクスチャ画像に基づいて前記仮想画像を合成するステップと、
を含み、前記ステップはプロセッサにおいて実行される、シーンの仮想ビューの画像を、該シーンから取得されたテクスチャ画像のセット及び奥行き画像の対応するセットに基づいて生成する方法。
【請求項2】
前記候補奥行き値のセットは前記仮想画像から求められる、請求項1に記載の方法。
【請求項3】
前記候補奥行き値のセットは前記入力テクスチャ画像のセットから求められる、請求項1に記載の方法。
【請求項4】
前記候補奥行き値のセットを求めるステップは、前記ピクセルの近傍における前のピクセルと無関係である、請求項1に記載の方法。
【請求項5】
前記候補奥行き値のセットを求めるステップは、前記ピクセルの近傍における前のピクセルに依拠する、請求項1に記載の方法。
【請求項6】
前記ピクセルごとに、エリアのタイプを、奥行き減少境界エリア、フラットエリア、又は奥行き増加境界エリアのいずれかとして分類するステップと、
前記エリアのタイプに基づいて前記ピクセルごとに一意のコスト関数を割り当てるステップと、
を更に含む、請求項1に記載の方法。
【請求項7】
前記最小コストを有する前記候補奥行き値を選択するステップは、動的プログラミングを用いて実行される、請求項1に記載の方法。
【請求項8】
前記仮想画像を表示デバイスに出力するステップ、
を更に含む、請求項1に記載の方法。
【請求項9】
前記候補奥行き値のセットはトレリスを用いて求められ、該トレリスのノードの各列は、該トレリスの行内に異なる候補奥行き値を有する1つのピクセルを表す、請求項1に記載の方法。
【請求項10】
前記コストはコスト関数によって求められ、前記コスト関数は、ピクセルの2つの正方形ブロック間の平均二乗誤差を評価する、請求項1に記載の方法。
【請求項11】
前記候補奥行き値の前記コストは信頼マップに従って重み付けされる、請求項1に記載の方法。
【請求項12】
前記コストはコスト関数によって求められ、前記コスト関数は、ピクセルの2つの正方形ブロック間の構造類似性を評価する、請求項1に記載の方法。
【請求項13】
前記仮想画像を予測子として用いて他の画像を符号化するステップ、
を更に含む、請求項1に記載の方法。
【請求項14】
前記奥行き候補値は、前記奥行き画像内の対応するピクセルの前記奥行き値の所定の増加に従って求められる、請求項4に記載の方法。
【請求項15】
前記奥行き候補値は、前記奥行き画像内の対応するピクセルの前記奥行き値の所定の減少に従って求められる、請求項4に記載の方法。
【請求項16】
前記奥行き候補は、前記奥行き画像内の近傍ピクセルからの前記奥行き値の平均として求められる、請求項5に記載の方法。
【請求項17】
前記奥行き候補は、前記奥行き画像内の近傍ピクセルからの前記奥行き値の中央値として求められる、請求項5に記載の方法。
【請求項18】
前記奥行き候補値は、前記奥行き画像内の対応するピクセルの前記奥行き値と、近傍のピクセルからの前記奥行き値との間の最大差に従って求められる、請求項5に記載の方法。
【請求項19】
前記候補奥行き値は、以前のコスト推定値に基づいて選択された最適奥行き値を有する近傍のピクセルから求められる、請求項5に記載の方法。
【請求項20】
シーンの仮想ビューの画像を、該シーンから取得されたテクスチャ画像のセット及び奥行き画像の対応するセットに基づいて生成するシステムであって、
選択された画像の各ピクセルに関連付けられた候補奥行き値のセットを求める手段と、
前記候補奥行き値ごとに、仮想画像の合成品質を推定するコストを求める手段と、
前記ピクセルの最適奥行き値を得るために、最小コストを有する前記候補奥行き値を選択する手段と、
前記各ピクセルの前記最適奥行き値及び前記テクスチャ画像に基づいて前記仮想画像を合成する手段と、
を備え、前記各手段はプロセッサにより実行される、シーンの仮想ビューの画像を、該シーンから取得されたテクスチャ画像のセット及び奥行き画像の対応するセットに基づいて生成するシステム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2012−170067(P2012−170067A)
【公開日】平成24年9月6日(2012.9.6)
【国際特許分類】
【外国語出願】
【出願番号】特願2012−24801(P2012−24801)
【出願日】平成24年2月8日(2012.2.8)
【出願人】(597067574)ミツビシ・エレクトリック・リサーチ・ラボラトリーズ・インコーポレイテッド (484)
【住所又は居所原語表記】201 BROADWAY, CAMBRIDGE, MASSACHUSETTS 02139, U.S.A.
【Fターム(参考)】