説明

ビデオ変換システムのためのデプスマップを生成する方法およびそのシステム

【課題】2次元(2D)画像を3次元(3D)画像に変換するためのデプスマップを生成するためのプロセスを提供する。
【解決手段】プロセスは、2D画像からデプスグラディエントマップ140を生成することを含み、上記デプスグラディエントマップ140が、1以上のエッジカウントを1以上のデプス値に対応づけるよう構成されている。さらに、上記2D画像から画像成分を抽出すことを含み、上記画像成分が、色空間の色成分に対応している。さらに、上記画像成分に基づいて上記デプスグラディエントマップ140を調節するための一組のゲインを決定し、上記デプスグラディエントマップ140と上記一組のゲインとに基づいてデプス融合を実行することによって上記デプスマップ140を生成することを含む。

【発明の詳細な説明】
【クロスリファレンス】
【0001】
本出願は、2009年12月15日に共同出願された現在係属中の米国仮出願No,61286397(代理人整理番号No,HIMX−0011−US−PRO)「ビデオ変換システム」の優先権の利益を主張する。本出願は仮出願ではない。この記述により先の出願の記載は、すべての目的に対して、付属書あるいは付属物を含む先の出願全体を参照することによって組み込まれる。
【技術分野】
【0002】
本発明の実施形態は、一般的に、ディスプレイテクノロジーに関し、さらに具体的に言えば、デプスマップ生成方法とビデオ変換方法とビデオ変換システムとに関する。
【背景技術】
【0003】
本明細書中に別段の記載がない限り、この背景技術の欄に記載されたアプローチは、本願請求項に係る発明の先行技術ではなく、また、この背景技術の欄に包含することによって先行技術であると認めるものでもない。
【0004】
3次元(3D)画像あるいは3Dビデオは、深度(depth)知覚の錯覚をもたらすことがある。従来の3Dテクノロジーは、立体写真を基にしており、2つのレンズから画像を捉えるための特別なカメラを要求する。従来の3D立体画像やビデオを再生するため、人間の目の遠近感を模倣する2つの画像を同時に表示することにより見る人に対して深度錯覚をもたらすために、特別なハードウェアおよび/または特別なメガネが要求される。3Dディスプレイは、目を見張るような視覚体験を提示し、ブロードキャスト、映画、ゲームや写真といった多くのアプリケーションに利益をもたらすが、3Dコンテンツを生成するための効果的なアプローチに乏しいのが現状である。
【0005】
さらに、従来の2次元(2D)ハードウェアを用いて撮られてきた2D画像や2Dビデオに関して、従来の3Dディスプレイハードウェアおよび/または3Dメガネは、これらの2Dコンテンツから3D効果を表示するための能力が欠けている。したがって、3Dディスプレイハードウェアを用いて3D効果を表現する前に、2D画像を3D画像に変換する必要があり、同様に2Dビデオを3Dビデオに変換する必要がある。しかし、2D画像/ビデオを3D画像/ビデオに変換するための従来の技術は、実行するためにかなりのコンピューティングリソースを必要とする、オブジェクトベースのセグメンテーションおよび動作補正の技術に、頻繁に依存する。
【発明の概要】
【0006】
本願開示の1以上の実施形態によれば、2次元(2D)画像を3次元(3D)画像に変換するためのデプスマップを生成するためのプロセスを示すことができる。この画像変換のプロセスは、2D画像からデプスグラディエントマップを生成するために実装され、このデプスグラディエントマップは、1以上のエッジカウントを1以上のデプス値(depth values)に対応づけるよう構成される。上記画像変換のプロセスは、2D画像から画像成分を抽出することができ、この画像成分は、色空間の色成分に対応する。上記画像変換のプロセスは、画像成分に基づいて、デプスグラディエントマップを調整するための一組のゲインを決定することができる。そして、上記画像変換のプロセスは、上記デプスグラディエントマップと上記一組のゲインとに基づくデプス融合(depth fusion)を実行することによって、さらにデプスマップを生成することができる。
【0007】
本願が開示するその他の実施形態によれば、2次元(2D)ビデオを3次元(3D)ビデオに変換するためのプロセスを示すことができる。このビデオ変換のプロセスは、2Dビデオから第1の2D画像を選択して、この第1の2D画像に対応する第1デプスグラディエントマップを生成するために実装される。上記ビデオ変換のプロセスは、2Dビデオから第2の2D画像を選択することができ、この第2の2D画像は、第1の2D画像の後に続く。上記ビデオ変換のプロセスは、第1デプスグラディエントマップと第2の2D画像とを用いることでデプス融合を実行することによって、第1デプスマップを生成することができる。そして、上記ビデオ変換のプロセスは、第1デプスマップを用いることによって、3Dビデオのために第2の2D画像を第1の3D画像に変換することができる。
【0008】
本願が開示するさらなる実施形態によれば、ビデオ変換のためにデプスマップを生成するよう、システムを構成することができる。上記システムは、2D画像に基づいてデプスグラディエントマップを生成するためのデプスグラディエントマップジェネレータを備えることができる。上記システムは、2D画像から1以上の画像成分を抽出するための、および1以上の画像成分に基づいて一組以上のゲインをそれぞれ決定するためのデプスリファインメントエンジンを備えることができる。そして、上記システムは、デプスグラディエントマップと一組以上のゲインとに基づいてデプス融合を実行することによって、デプスマップを生成するためのデプスグラディエントマップジェネレータとデプスリファインメントエンジンとが結合されたデプス融合エンジンをさらに備えることができる。
【0009】
上述の発明の概要は、実例となるだけであり、どのような限定も意図していない。上述の実例となるアスペクト、実施形態、特徴に加えて、さらなるアスペクト、実施形態、特徴が、図面および後述の詳細な説明への言及によって明らかになるだろう。
【図面の簡単な説明】
【0010】
【図1】図1は、3D変換を実行するためのビデオ変換システムの実例となる実施形態を含むブロック図を示す。
【図2】図2は、3D変換のためのデプスマップを生成するために実装されているデプス生成モジュールの実例となる実施形態を示す。
【図3】図3は、デプスマップを生成する間に、実例となる実施形態によって生成された中間結果のシナリオを示す。
【図4】図4は、2D画像からデプスマップを生成するためのプロセスの実例となる実施形態のフローチャートを示す。
【図5】図5は、3Dビデオ変換プロセスを最適化するためのプロセスの実例となる実施形態のフローチャートを示す。
【発明を実施するための形態】
【0011】
後述の詳細な説明において、言及は、本発明の一部を形成する添付図面について成される。この添付図面において、文脈が違うことを指示しない限り、同じ記号は、通常、同じ構成を特定する。詳細な説明、図面、請求項において記載された実例となる実施形態は、限定することを意味していない。ここに示された対象の意図あるいは範囲から離れることなしに、他の実施形態を利用し、別の変化を生じることも可能である。本願に一般に記載され、図面において説明されている本発明のアスペクトを、本願に明確に予期されている多種多様の異なった形態のすべてにおいて、アレンジし、置き換え、結合し、設計することができると簡単に理解されるであろう。
【0012】
本願の開示は、ビデオ変換のためのデプスマップの生成に関して、方法、装置、コンピュータプログラムおよびシステムについて、「inter alia」を引用する。本実施形態において、デプス生成モジュールは、デプスマップを生成するために2D画像を処理する。3D変換エンジンは、2D画像を3D画像へ変換するためにデプスマップを用いる。デプスマップを生成するために、デプス生成モジュールのデプスグラディエントマップジェネレータは、2D画像からデプスグラディエントマップを生成する。デプス生成モジュールのデプスリファインメントモジュールは、2D画像から1以上の画像成分を抽出し、これらの1以上の画像成分の深度特性を強化するためのデプスグラディエントマップを調整するために、一組のゲインを決定する。デプス生成モジュールのデプス融合モジュールは、デプスグラディエントマップとデプスマップを生成するための一組のゲインとに基づいてデプス融合を実行する。
【0013】
本願開示の全体にわたって、「デプスマップ」は、広く、3D画像やビデオに関したデプス値(depth values)を保存するためのデータ構造を言う。2D画像内のそれぞれのピクセルが、対応するデプス値を与えられれば、2D画像は、3Dテクノロジーを用いて表示することができる。上記デプス値は、対象のピクセルから視点までの距離に関連している。例えば、対象のピクセルが視点からさらに離れれば離れるほど、対象と視点との間の距離はより大きくなり、したがって、対象と視点との間のデプス値は、より大きくなる。2D画像におけるすべてのピクセルに対するデプス値は、デプスマップに保存される。例えば、2D画像が1024×768の解像度を有する場合、デプスマップも同様に、2D画像におけるピクセルに対するデプス値に対応する1024×768を有する。
【0014】
本願開示の全体にわたって、「グラディエント(gradient)」は、特定値に対する変化の「険しさ」を表わす。本実施形態において、グラディエント値がより高ければ、特定値に対する変化率がより大きくなる。例えば、グラディエント値は、画像線のピクセルに対するデプス値の変化率を保存するために用いられる。したがって、グラディエント値が高ければ高いほど、画像線における一のピクセルのデプス値とその次のピクセルのデプス値との間の差は、より大きくなる。「デプスグラディエントマップ」は、広く、画像におけるピクセルのデプス値に関連しているデプスグラディエント値を保存するためのデータ構造を言う。本実施形態において、デプスグラディエントマップは、画像の画像線から引き出された、正規化されて蓄積されたエッジカウントを有する。
【0015】
本願開示の全体にわたって、「色空間」は、広く、2Dまたは3Dカラー画像を保存するために用いられるカラーコーディングスキームを言う。色空間は、それぞれのピクセルの色を複数の色成分に分けるために用いられる。例えば、RGB色空間は、ピクセルの色を保存するために、赤(R)色成分と、緑(G)色成分と、青(B)色成分とを用いる。YCbCr色空間は、ピクセルの輝度を保存するためにY色成分を用い、ピクセルの青色の違い(blue-difference)を保存するためにCr色成分を用い、ピクセルの赤色の違い(red-difference)を保存するためにCb色成分を用いる。色空間の色成分は、カラーピクセルの色彩値(color value)と同義である。そのため、YCbCr色空間を用いて符号化(encode)された色は、3つの「色彩値」、すなわち、Y色彩値、Cb色彩値、Cr色彩値を有する。また、異なった色成分を用いている他の色空間は、ピクセルの色を保存するために、同様の、または異なった色彩値の数を有する。さらに、「画像成分」は、広く、すべての画像のピクセルに対する特定の色成分の色彩値を言う。そのため、画像のY画像成分は、画像におけるすべてのピクセルのY色彩値を保存する。
【0016】
本願開示の全体にわたって、「単調増加リファインメント」は、3D環境において、ピクセルが精緻化(refine)されたデプス値で表示される場合に、ピクセルが表現する対象の深度特性を強化するために、ピクセルの色彩値に基づいたデプス値を精緻化することを言う。本実施形態において、上記単調増加リファインメントは、ピクセルの色彩値に対応するゲインを用いてデプス値を調整することによって、成し遂げられる。本願開示の全体にわたって、「デプス融合(depth fusion)」は、広く、デプスグラディエント値とゲインとに基づいた特定のタイプの演算を言う。本実施形態において、デプスグラディエント値は、ピクセルに対する基本デプス値として用いられ、ピクセルの色彩値は、一組のゲインを決定するために用いられる。一組のゲインは、基本デプス値を調整するために用いられる。
【0017】
図1は、3D変換を実行するためのビデオ変換システムの実例となる実施形態を含むブロック図を示す。図1において、デプス生成モジュール130と1以上の3D変換エンジン150は、2Dビデオ110をディスプレイ170,180,190に表示するための3Dビデオに変換するために構成されている。フレームバッファ120は、2Dビデオ110から取ってきた1以上の2D画像を保存するために用いられる。デプス生成モジュール130は、これに限定されるものではないが、デプスグラディエントマップジェネレータ131、デプスリファインメントエンジン132、デプス融合モジュール133、コンピューティングプロセッサ135、および/またはメモリー136を有するように構成される。上記3D変換エンジン150は、デプスアウェア(depth-aware)2Dビデオ強化エンジン151、サイドバイサイド(side-by-side)2D+Zフォーマットエンジン152、マルチビューDIBR(Depth Image-based Rendering)エンジン153である。さらに、3D画像を表示することができる上記ディスプレイは、これに限定されるものではないが、2Dディスプレイ170、3Dディスプレイ180、3Dマルチビューステレオスコープディスプレイ190である。
【0018】
本実施形態において、2Dビデオ110は、カムコーダーのような2Dビデオ撮影装置によって生成されたビデオストリーム、あるいは、2D映画から変換されたビデオストリームである。上記2Dビデオ110は、2Dカラー静止画像をそれぞれ保存する複数の画像フレームを含む。それぞれの2D画像は、個別の解像度に基づいて構成された複数のカラーピクセルを有する。例えば、ある2D画像が、1024×768の解像度を有する場合、これは、この2D画像が、768の水平な画像線を有していて、この画像線のそれぞれが、カラーインフォメーションであるピクセルを1024有していることを意味している。その他の一般的な画像解像度は、これに限定されるものではないが、640×480、1280×1024、1920×1200を含む。本実施形態において、上記2Dビデオ110は、フレームバッファ120に送り込まれる。上記フレームバッファ120は、上記2Dビデオ110から2D画像を高速ロードするための記憶装置である。本実施形態において、デプス生成モジュール130と3D変換エンジン150は、上記フレームバッファ120に保存された2D画像にすばやくアクセスするように構成されている。
【0019】
本実施形態において、デプスグラディエントマップジェネレータ131は、フレームバッファ120から2D画像を抽出して、この2D画像に基づいてデプスグラディエントマップを生成する。デプスリファインメントエンジン132は、上記デプスグラディエントマップジェネレータ131と同様の2D画像をフレームバッファ120から抽出し、2D画像に基づいて一組のゲインを生成するように構成される。本実施形態において、一組のゲインは、単調に増加するシーケンスの範囲内にある。デプスグラディエントマップと一組のゲインとに基づいて、デプス融合モジュール133は、デプスマップ140を生成するためにデプス融合を実行する。デプスマップ140とフレームバッファ120における2D画像は、2D画像を3D画像に変換するための3D変換エンジン150に送られる。デプスグラディエントマップジェネレータ131、デプスリファインメントエンジン132、デプス融合モジュール133の詳細は、さらに後に説明されている。
【0020】
本実施形態において、デプス生成モジュール130は、デプスマップ140を生成するためのコンピューティングプロセッサ135を利用する。上記コンピューティングプロセッサ135は、マイクロプロセッサ、または、プログラムで制御できるインストラクションに基づくコマンドを実行する一般的な、あるいは特定のコンピューティングデバイスである。本実施形態において、コンピューティングプロセッサ135は、プログラムで制御できるインストラクションを実行するために、そして、この実行における中間の処理結果を保存するために、メモリー136を利用する。メモリー136は、ランダムアクセスメモリー(RAM)、リードオンリーメモリー(ROM)、フラッシュメモリー、従来型の磁気あるいは光学ディスク、テープドライブ、またはこれらのデバイスの結合のどのような形式でもよい。
【0021】
本実施形態において、3D変換エンジン150は、フレームバッファ120から2D画像を抽出し2D画像を3D画像に変換するために、デプスマップ140を用いる。本実施形態において、デプスアウェア(depth-aware)2Dビデオ強化エンジン151は、デプスマップ140に基づいて、2D画像の深度特性を強化する。特に、デプスアウェア2Dビデオ強化エンジン151は、2D画像のエッジ、コントラスト、彩度(saturation)を向上させる。例えば、2D画像における対象は、それぞれのデプス値が既定の閾値の上か下かによって決まる、上記対象に対応するコントラスト(あるいは彩度(saturation)等)を増加、減少することによって強化される。言い換えれば、デプス値が閾値よりも小さければ、すでに閾値よりも大きい別のデプス値以上に強化される。デプスアウェア2Dビデオ強化エンジン151は、米国特許出願No,12/242,672、「Depth-Based Image Enhancement」などにおいて記載されている技術のような適当な従来型技術によって実行される。
【0022】
本実施形態において、サイドバイサイド(side-by-side)2D+Zフォーマットエンジン152は、それぞれの画像のピクセルが、スクリーンのある面の前に表示されるべきか、あるいは後ろに表示されるべきかを示すための特定のデプスマップを有する3D画像(例えば、シーケンシャルレフト/ライト、アナグリフ、偏光画像)を生成する。マルチビューDIBR(Depth Image-based Rendering)エンジン153は、異なる視点の2D画像を生成する。この2D画像は、多数の視点から画像を同時に捕まえるマルチプルカメラによって生成されたものと同様である。
【0023】
本実施形態において、3D変換エンジン150によって生成された3D画像は、様々な2Dまたは3Dディスプレイ装置によって表示される。例えば、2Dディスプレイ170は、デプスマップ140に基づいて2D画像を処理することができ、2Dの範疇に入る画像を表示することができる。3Dディスプレイ180は、異なった視点角度に基づく異なった色と彩度(intensity)のピクセルを表示するための自動ステレオスコープ技術を利用する。3Dディスプレイ180のために、この3Dディスプレイ180を見る人は、シーケンスレフト/ライト画像のためのシャッターメガネ、アナグラフ画像のためのレッド/シアンメガネ、偏光画像のための偏光めがねを身につける。そして、3Dマルチビューステレオスコープディスプレイ190は、異なった視点の2D画像に基づいて生成された3D画像を表示する。上記3Dマルチビューステレオスコープディスプレイ190は、この3Dマルチビューステレオスコープディスプレイ190を見る人が、裸眼で3Dイリュージョンの眺めを直接楽しむことができるように、バリアあるいはレンズ状のパネルを有する。
【0024】
本実施形態において、デプス生成モジュール130は、デプスグラディエントマップジェネレータ131とデプスリファインメントエンジン132をそれぞれの操作を同時に実行するために制御する。最適化された性能のために、デプスリファインメントエンジン132は、第1の2D画像から、第1の2D画像と関連してはいるが異なっている、第2の2D画像を精緻化するために生成されたデプスグラディエントマップを利用する。最適化されたプロセス、および/または、パラレルのプロセスについての詳細は、さらに後に説明されている。
【0025】
図2は、3D変換のためのデプスマップを生成するために実装されているデプス生成モジュールの実例となる実施形態を示す。図2において、図1のデプス生成モジュール130と同様のデプス生成モジュールは、デプスグラディエントマップジェネレータ220(図1のデプスグラディエントマップジェネレータ131と同様)と、デプスリファインメントエンジン230(図1のデプスリファインメントエンジン132と同様)と、デプス融合モジュール250(図1のデプス融合モジュール133と同様)とを有する。図2のデプス生成モジュールは、フレームバッファ(図2においては図示せず)から抽出される2D画像210に基づいてデプスマップ260を生成する。デプスグラディエントマップ220は、特に、エッジフィルタ221と、エッジアキュムレータ223と、シーンデプスアサインメントモジュール225とを包含する。デプスリファインメントエンジン230は、特に、色空間エクストラクタ231と、1以上の画像成分リファインメントモジュール233,235,そして/または、237とを包含する。
【0026】
本実施形態において、エッジフィルタ221は、2D画像210の一の画像線を規則的な方法で1度に処理することによって、エッジの数を検出する。例えば、エッジフィルタ221は、2D画像210において、トップダウンの、またはボトムアップの、インターレースの、またはノンインターレースの命令で画像線を読み込む。それぞれの画像に対して、エッジフィルタ221は、規則正しく画像線のなかのピクセルを評価して、隣同士のピクセルが、ある既定の閾値を上回る特定の変化を持つとき、エッジを検出する。この変化は、色彩と明るさに基づく。例えば、エッジフィルタ221は、2つの隣り合うピクセル間の色彩変化が色彩変動閾値よりも大きければ、その時、現在の画像線でのエッジでもよいと決定する。さらに、エッジフィルタ221は、それぞれのピクセルの明度/輝度のレベルに基づいて画像線をフィルターにかける。あるピクセルがその次のピクセルよりも高いまたは低い輝度レベルであり(言い換えれば、あるピクセルがその次のピクセルよりも明るいまたは薄暗い場合)、輝度レベル変化が既定の輝度閾値を超える場合、その時、エッジフィルタ221は、エッジを現在の画像線に検出することができると判断を下す。
【0027】
画像線のすべてのピクセルが、それぞれ隣接するピクセルと評価され、比較されたあとで、エッジフィルタ221は、検出されたエッジの数をエッジカウントとして合計して、このエッジカウントを画像線に対応づける。その後、エッジフィルタ221は、2D画像からその他の画像線を順番に選び、2D画像のそれぞれの画像線が対応するエッジカウントを有するまでこのプロセスを続ける。この最終結果は、図3のテーブル310に類似するテーブルと共通点がある。このテーブルにおいて、それぞれの画像線は、対応するエッジカウント値を有する。この最終結果はまた、さらなる処理のためにエッジアキュムレータ223に移される。
【0028】
本実施形態において、エッジアキュムレータ223は、2D画像210のそれぞれの画像線に対する蓄積されたエッジカウントを算出する。一般に、人間の視覚は、2D画像210の上半分を視点からより離れていると解釈し、2D画像210の下半分を視点からより近いと解釈する傾向がある。これは、通常真実であり、いくつかの2D画像210において、空が上端部分を占有する傾向があり、地面が下端部分を占有する傾向があるためである。したがって、上記仮定の下、デプスグラディエントマップジェネレータ220は、より高いデプスグラディエントを2D画像のより底の方にある画像線に与えることによって、2D画像に対する最初のデプスマップを組み上げる。言い換えれば、2D画像210における第1の画像線の下方にある第2の画像線は、第1の画像線よりも視点により近いと仮定できる。この仮定と、エッジは深度に対応しているという仮定とに基づいて、エッジアキュムレータ223は、第1の画像線のエッジカウントを第2の画像線のエッジカウントに加え、その結果、第1の画像線よりもエッジカウントを有する第2の画像線を確保している。上記アプローチは、3Dディスプレイにおいて、第2画像線を、第1画像線よりもより近い視点で表示することができるようにする。生成された3D効果は、第1の画像線と第2の画像線とがお互いに隣接しているときでも有効である。
【0029】
本実施形態において、2D画像210の特定の画像線について、エッジアキュムレータ223は、この特定の画像線よりも「さらに遠く離れている(farther away)」、すべての「距離がある(distant)」画像線のエッジカウントを上記特定の画像線のエッジカウントへ蓄積し、上記特定の画像線が、どのような「距離がある」画像線よりもエッジカウントをより有することができるようにする。2D画像が、上端部が視点から遠く、底部が視点から近いという仮定の下にある場合、「さらに遠く離れている」どのような画像線も、2D画像210における上記特定の画像線の「上側(above)」にある画像線である。2D画像210の「最底部(most-bottom)」の画像線に対して、エッジアキュムレータ233は、2D画像210におけるすべての画像線のエッジカウントをトータルエッジカウントに加え、最底部の画像線に対する蓄積されたエッジカウントとして、このトータルエッジカウントを与える。
【0030】
上記アプローチは、図3のテーブル320と同様のアウトプットを生成し、それぞれ特定の画像線は、蓄積されたエッジカウントに対応する。それぞれ蓄積されたエッジカウントは、特定の画像線の「上側」にある画像線のすべてのエッジカウントの小計である。本実施形態において、デプスグラディエントマップジェネレータ220は、2D画像210の上半分が、下半分よりも視点により近くなるように表示されることを決定することもできる。この場合、エッジアキュムレータ223は、異なった命令でエッジカウントを蓄積する。例えば、「底(bottom)」の画像線のエッジカウントを「上(top)」の画像線のエッジカウントに加えることによって、エッジカウントを蓄積する。したがって、エッジアキュムレータ223は、どの映像線も、他のどんな「近い(closer)」画像線よりも蓄積されたエッジカウントを有さないアウトプットテーブルを提供することもできる。エッジアキュムレーションの詳細はさらに後ほど説明される。
【0031】
本実施形態において、シーンデプスアサインメントモジュール225は、2D画像210のそれぞれの画像線に対する蓄積されたエッジカウントの正規化を実行する。多くの色空間に対する色彩値は、0から255までの範囲(すなわち、上記色彩値は8ビット値である)を有するので、デプスマップのデプス値は、0から255までの同様範囲に正規化される。このとき、0が最も遠いことを意味しており、255が最も近いことを意味している。エッジアキュムレータ223により生成されたデプスグラディエントマップにおいて、(デプスグラディエント値と判断されうるであろう)蓄積されたエッジカウントは、0から255より高い数値、またはより低い数値までの範囲を有する。シーンデプスアサインメントモジュール225は、2D画像210の最も近い視点と判断された画像線が、255の正規化されたエッジカウントを有することができるように、上記蓄積されたエッジカウントを正規化するための正規化率を決定する。その他の上記蓄積されたエッジカウントは、同じ正規化率に基づいて、比例的に拡大または縮小される。このオペレーションが終了した後、シーンデプスアサインメントモジュール225は、アウトプットとしてデプスグラディエントマップ241を生成する。本実施形態において、シーンデプスアサインメントモジュール225は、デプスグラディエントマップジェネレータ220から除外されてもよいし、また、デプス融合モジュール250によって生成されたデプスマップ260の正規化を実行してもよい。
【0032】
本実施形態において、デプスグラディエントマップ241は、2D画像210の解像度によって定められる2D画像210の画像線の数と同じ数のデプスグラディエント値を有する。例えば、2D画像210が1024×768の解像度を有するならば、このときデプスグラディエントマップ241は、768のエントリーを有する。デプスグラディエントマップ241の最後のエントリーは、255に正規化される。さらに、デプスグラディエントマップ241におけるそれぞれのエントリーは、2D画像210の対応する画像線に対応しており、同じ画像線におけるすべてのピクセルに対する最初のデプス値として判断されたデプスグラディエント値を表わしている。言い換えれば、デプスグラディエントマップ241は、2D画像210の画像線に対する最初のデプス値をもたらす。
【0033】
本実施形態において、色空間エクストラクタ231は、2D画像210を処理し、2D画像210から1以上の画像成分を抽出する。上記色空間エクストラクタ231は、2D画像210が符号化された色空間を決定し、色空間の色成分に対応する画像成分を抽出する。例えば、YCbCr色空間を用いて2D画像210を符号化することを決定するときに、色空間エクストラクタ231は、2D画像210から3つの画像成分(Y画像成分、Cb画像成分、およびCr画像成分)を抽出する。2D画像210から抽出された時点で、Y画像成分は、2D画像210におけるすべてのピクセルのY色彩値を有し、Cb画像成分は、2D画像210におけるすべてのピクセルのCb色彩値を有し、そしてCr画像成分は、2D画像210におけるすべてのピクセルのCr色彩値を有する。
【0034】
本実施形態において、色空間エクストラクタ231によって抽出されたY画像成分は、Yリファインメントモジュール233に送られ、Cb画像成分は、Cbリファインメントモジュール235に送られ、Cr画像成分は、Crリファインメントモジュール237に送られる。別の色空間(例えば、RGB色空間)が、2D画像210を符号化するために用いられる場合、デプスリファインメントエンジン230は、色空間エクストラクタ231によって抽出されたR、G、そして/またはB画像成分を処理するための追加の画像成分リファインメントモジュール(例えば、Rリファインメントモジュール、Gリファインメントモジュール、そして/またはBリファインメントモジュール)を有する。
【0035】
本実施形態において、2D画像210におけるピクセルの色彩と明度は、明白な深度特性を有する。とくに、人の視覚は、2D画像210における対象の特定の色あるいは明度を、対象と2D画像210の視点との間の距離に対応づける。例えば、暖色(例えば、赤色)は、近いように感じさせ、寒色(例えば、青)は、遠いように感じさせる。また、高い輝度を有する対象は、2D画像における低い輝度を有する別の対象よりも近く感じさせる。YCbCr色空間において、Y色成分は、ピクセルの輝度情報を保存する。Cr色成分は、赤色の違い(red-difference)を保存するための彩度(chroma)成分であり、Cb色成分も同様に、ピクセルのための青色の違い(blue-difference)を保存するための彩度(chroma)成分である。それ故に、YCbCr色空間の深度特性を強化するために、画像成分リファインメントモジュール233,235,237は、より近く見える明るい色のピクセルを作るために、より遠く見えるくすんだ色のピクセルを作るために、より近く見える暖かい色のピクセルを作るために、そして、より遠く見える冷たい色のピクセルを作るために、一組のゲインを生成する。
【0036】
本実施形態において、Yリファインメントモジュール233は、Y画像成分におけるそれぞれのY色彩値に対応する第1ゲインを決定する。一組の上記第1ゲインは、広く、Ybase−YthからYbase+Ythに及び、Ybaseが調節可能である直線状に増加するシーケンスの範囲にある。例えば、上記直線状に増加するシーケンスは、1−Ythから1+Ythに変動する。上記Ythは、直線状に増加するシーケンスを調節するための変数である。言い換えれば、0から255の範囲にある特定のY色彩値について、この特定のY色彩値に対応する第1ゲインは、1−Ythから1+Ythの範囲内に収まる。例えば、Y色彩値が0であるとき、Yに対する第1ゲインは、1−Ythである。Y色彩値が128であるとき、Yに対する第1ゲインは、1である。Y色彩値が255であるとき、Yに対する第1ゲインは、1+Ythである。本実施形態において、変数Yth は、異なった状況(あるいは適用)に基づいて決定される変数である。
【0037】
本実施形態において、Y画像成分におけるすべてのY色彩値に対する第1ゲインは、Yの一組のゲイン243に保存される。Yの一組のゲイン243におけるそれぞれの第1ゲインは、2D画像210のピクセルに対応する。したがって、Yの一組のゲイン243も、特定のピクセルの位置(例えば、画像線の位置や画像線上での場所)を有する。このように、第1ゲインは、特定のピクセルから抽出されたY色彩値に基づいて決定されるので、Yの一組のゲイン243は、Y画像成分におけるY色彩値の数値と同等の数のエントリーを有し、また、2D画像210におけるピクセルの数と同等の数のエントリーを有する。
【0038】
本実施形態において、Cbリファインメントモジュール235は、Cb画像成分におけるそれぞれのCb色彩値に対応する第2ゲインを決定する。直線状の第2ゲインの範囲を、広く、Cbbase+CbthからCbbase−Cbthまで表現することができ、Cbbaseは調節可能な値である。一組の上記第2ゲインは、例えば、0から255に及ぶCb色彩値に対して、1+Cbthから1−Cbthの範囲にある。上記Cbthは、異なった状況(あるいは適用)に基づいて決定される変数である。Cbリファインメントモジュール235は、Cbの一組のゲイン245におけるすべての第2ゲインを取り付ける。Cbの一組のゲイン245において、それぞれの第2ゲインは、2D画像210におけるピクセルに対応する。
【0039】
本実施形態において、Crリファインメントモジュール237は、Cr画像成分にYリファインメントモジュール233と同様のオペレーションを実行する。特に、Crリファインメントモジュール237は、Cr画像成分におけるそれぞれのCr色彩値に対応する第3ゲインを決定する。直線状の第3ゲインの範囲を、広く、Crbase+CrthからCrbase−Crthまで表現することができ、Crbaseは調節可能な値である。一組の上記第3ゲインは、例えば、0から255までに及ぶCr色彩値に対して、1−Crthから1+Crthの範囲にある。上記Crthは異なった状況(あるいは適用)に基づいて決定される変数である。Crリファインメントモジュール237は、Crの一組のゲイン247のすべての第3ゲインを取り付ける。Crの一組のゲイン247において、それぞれの第3ゲインは、2D画像210におけるピクセルに対応する。
【0040】
本実施形態において、デプスグラディエントマップ241と、Yの一組のゲイン243と、Cbの一組のゲイン245と、Crの一組のゲイン247とは、さらなるオペレーションのためにデプス融合モジュール250に送られる。上記デプス融合モジュール250は、正規化されたエッジカウントを、第1出力を生成するためのYの一組のゲインに適用する。上記第1出力は、このとき、第2出力を生成するためのCbの一組のゲイン245に適用される。第2出力は、さらに、Crの一組のゲイン247に適用される。上記デプス融合オペレーション後に、デプス融合モジュール250は、その後の3D変換オペレーションのためにデプスマップ260を出力する。
【0041】
特に、デプス融合モジュール250は、デプスグラディエントマップ241から特定のデプスグラディエント値を最初に選択し、正規化されたデプスグラディエント値が計算されたものから画像線を決定する。デプス融合モジュール250は、そのとき、Yの一組のゲイン243から特定の第1ゲインを選択し、Cbの一組のゲイン245から特定の第2ゲインを選択し、そして、Crの一組のゲイン247から特定の第3ゲインを選択する。第1、第2および第3ゲインは、あらかじめ決められた画像線に位置づけられた特定のピクセルに対応する。このとき、デプス融合モジュール250は、上述の第1、第2および第3ゲインと、特定の正規化されたデプスグラディエント値とに基づいてデプス融合を実行する。上記デプス融合の出力は、デプスマップ260の特定のピクセルに対するデプス値に対応する。デプス融合モジュール250は、2D画像210のそれぞれのピクセルが、デプスマップ260の対応するデプス値を有するまで上述のデプス融合オペレーションを続ける。デプス融合オペレーションの詳細は、さらに後に説明される。
【0042】
図3は、デプスマップを生成する間に、実例となる実施形態によって生成された中間結果のシナリオを示す。図3において、テーブル310は、図2のエッジフィルタ221によって2D画像が処理された後の出力シナリオ例である。テーブル320は、図2のエッジアキュムレータ223が、テーブル310を処理した後の出力シナリオ例である。テーブル330は、図2のシーンデプスアサインメントモジュール225がテーブル320を処理した後の出力シナリオ例である。テーブル340は、図2のデプス融合モジュール250がテーブル330と、画像成分から生成されたゲイン例とを処理した後の出力シナリオ例である。テーブル350は、図2のデプス融合モジュール250がテーブル340のデプス値を正規化した後の出力シナリオ例である。
【0043】
テーブル310において、10の画像線を有する2D画像は、フレームバッファに取り込まれている。エッジフィルタは、走査線によって2D画像線を処理し、それぞれの画像線に対するエッジの数を数える。テーブル310と、図3における他の後に続くテーブルにおいて、画像線1は、2D画像の一番上の画像線を表わし、画像線2は、2D画像の上から2番目の画像線を表わし、そして、画像線10は2D画像の最後の線(または最下部の線)を表わす。テーブル310において、エッジフィルタは、画像線1において20エッジ、画像線2において50エッジ等を検出している。
【0044】
テーブル310に基づいて、エッジアキュムレータは、すべての以前の画像線のエッジカウントの小計で特定の画像線のエッジカウントを蓄積し、テーブル320における蓄積されたエッジカウントを保存する。テーブル320の例において、特定の画像線に対する蓄積されたエッジカウントは、すべての「上の」画像線のエッジカウントを(エッジカウントの小計として)加え、特定の画像線自身のエッジカウントを加えることによってすばやく計算される。例えば、画像線5について、画像線1,画像線2,画像線3,画像線4が、2D画像における画像線5のすべての「上の」画像線であると仮定すれば、蓄積されたエッジカウントは、画像線1,画像線2,画像線3,画像線4のエッジカウントの小計に画像線5自身のエッジカウントを加えたものに等しい。したがって、蓄積されたエッジカウントは、(20+50+70+120)+40=300となるはずである。すべての画像線がエッジアキュムレータにより処理された後、テーブル320は、すべての画像線について、蓄積されたエッジカウントを保存するために用いられる。テーブル320において、最初の画像線(画像線1)は、最小のエッジ数であり、視点から最も離れていると判断される。最もエッジ数の多い最後の画像線(画像線10)は、視点に最も近いと判断される。
【0045】
本実施形態において、シーンデプスアサインメントモジュールは、正規化され蓄積されたエッジカウントテーブル330を生成するためにテーブル320を処理する。上記シーンデプスアサインメントモジュールは、視点から最も離れていることを意味する値0と、視点から最も近いことを意味する値255とを与える。最後の画像線(画像線10)が最も近いと判断されてから、その画像線(画像線10)の正規化され蓄積されたエッジカウントは、値255を与えられる。最後の画像線に基づいて、その前の画像線は、255/(最後の画像線について蓄積されたエッジカウント)に等しい割合で正規化される。テーブル320のシナリオにおいて、画像線10について蓄積されたエッジカウントは670であり、このときテーブル320におけるすべての蓄積されたエッジカウントは、255/670の割合で正規化される。
【0046】
例えば、画像線1について、正規化され蓄積されたエッジカウントは、20×255/670=8である。画像線5について、正規化され蓄積されたエッジカウントは、300×255/670=114である。テーブル330は、上記正規化率をテーブル320における蓄積されたエッジカウントに適用した後で、画像線に対する「正規化され蓄積されたエッジカウント」(例えば、デプスグラディエント値)を保存し、デプスグラディエントマップと判断される。画像線において、複雑なエッジを持てばもつほど、より大きいデプスグラディエントを有する。したがって、出力3D画像は、対象と雲ひとつない青空との間ではっきりした深度変化を有し、焦点をぼかした背景の上方境界と焦点のあった対象との間でのはっきりした深度変化を有するので、このアプローチは有利である。
【0047】
本実施形態において、色空間エクストラクタは、2D画像をY、Cb、Cr画像成分として抽出する。上記画像成分におけるそれぞれの色彩値に対して、対応するゲインは、精緻目的のために決定される。テーブル340に示すように、ピクセル1は画像線1のものであり、1のY色彩値と、255のCb色彩値と、30のCr色彩値を有する。上記色彩値に基づいて、第1ゲイン(例、F(Y))と、第2ゲイン(例、F(Cb))と、第3ゲイン(例、F(Cr))とは、リファインメントモジュールによって決定される。さらに、それぞれの画像線に対するデプスグラディエント値(G)もまた、テーブル330からコピーされる。同じ画像線におけるすべてのピクセルは、画像線に対応する同じデプスグラディエント値を用いることに気づかされるはずである。
【0048】
本実施形態において、式F(Y)は、0から255の範囲のY色彩値に対して、1−Ythから1+Ythの範囲の直線状のゲインを提供する。言い換えれば、ピクセルが0のY色彩値を有するならば、1−Ythゲインを与えられる。255のY色彩値に対して、1+Ythゲインを与えられる。したがって、
F(Y)=(1−Yth)+(2×Yth×Y)/255(0≦Y≦255)
さらに、式F(Cb)と式F(Cr)が、同様に決定される。
F(Cb)=(1−Cbth)+(2×Cbth×Cb)/255(0≦Cb≦255)
F(Cr)=(1−Crth)+(2×Crth×Cr)/255(0≦Cr≦255)
示されているテーブル340において、Y、Cb、Cr色彩値に対する個々のゲインの計算に対して、Ythは0.2にセットされ、Cbthは0.1にセットされ、Crthは0.3にセットされる。
【0049】
本実施形態において、デプス融合モジュールは、デプスグラディエントマップ(例えば、テーブル340のGの値)と、1以上の第1ゲイン、第2ゲイン、および第3ゲイン(例えば、テーブル340に示されたF(Y)、F(Cb)、F(Cr)の値)とを用いてデプス融合を実行する。上記デプス融合は、それぞれのピクセルに対するデプス値を計算するために、G×F(Y)×F(Cb)×F(Cr)の式を利用する。すべてのピクセルに対するデプス値がデプス融合式に基づいて計算された後、出力デプス値は、3D変換のためのデプスマップと判断される。テーブル340の例によれば、ピクセル3に対するデプス値は、53×0.86×0.93×1.19=51である。
【0050】
本実施形態において、正規化された値が、8ビットデプス値の0から255の範囲内にあるように、デプス融合モジュールはピクセル値についてデプス値を正規化する。上記正規化プロセスは、テーブル340から最大デプス値を選択し、それに従ってすべてのデプス値を調節する。テーブル340に示すように、正規化前の最大デプス値はピクセル8の318である。したがって、ピクセル3について正規化されたデプス値は、51×255/318=41である。テーブル340のデプス値が正規化された後、その結果はテーブル350に示され、テーブル350において、それぞれのピクセルは、0から255の範囲内にある対応する正規化されたデプス値を有する。言い換えれば、テーブル350は、9つの2D画像のピクセルに対するデプスマップと判断される。
【0051】
図4は、2D画像からデプスマップを生成するためのプロセスの実例となる実施形態のフローチャートを示す。このプロセス401は、様々な機能的ブロックまたはアクションを表記する。この機能的ブロックまたはアクションは、処理ステップとして、機能的オペレーションとして、イベントとして、そして/または動作として記載され、ハードウェア、ソフトウェア、そして/またはファームウェアにより実行される。本開示についての当業者は、図4に示された機能的ブロックの多数の代替手段が、様々な実施において実行される可能性があることを認識するだろう。本実施形態において、プロセス401について機械が実行可能なインストラクションは、メモリーに保存され、処理ユニットによって実行され、そして/または図1のデプス生成モジュール130のような携帯装置に実装される。
【0052】
当業者は、本願において開示されているあらゆるプロセスと方法について、上記プロセスと上記方法において実行された機能は、異なる命令により実行される可能性があることを十分理解するだろう。さらに、概要が述べられたステップおよびオペレーションは、実例として提供されただけであり、ステップおよびオペレーションのいくつかは任意で、より少ないステップとオペレーションを組み合わせたり、あるいは、本願開示の実施形態の本質を損なうことなしに追加のステップおよびオペレーションを拡張したりすることもできる。さらに、概要が述べられたステップおよびオペレーションの1以上は、同時に実行されてもよい。
【0053】
ブロック410において、デプス生成モジュールは、フレームバッファから2D画像を抽出することによって、3D変換のために2D画像を処理する。本実施形態において、デプス生成モジュールのデプスグラディエントマップジェネレータは、ブロック421,423,425,427,429を通して2D画像を処理する。そして、デプス生成モジュールのデプスリファインメントモジュールはブロック431,433,435,437を通して2D画像を処理する。本実施形態において、ブロック421,423,425,427,429を通るルートは、ブロック431,433,435,437を通るルートと同時に処理される。言い換えれば、デプスグラディエントマップジェネレータとデプスリファインメントモジュールとは、独立して、同時にそれぞれのオペレーションを実行し、それぞれの出力は、さらなる処理のため、ブロック450に送られる。
【0054】
ブロック421において、デプスグラディエントマップのエッジフィルタは、規則正しく各線ごとに2D画像を処理する。本実施形態において、上記エッジフィルタは、2D画像から横または縦の画像線を抽出する。エッジフィルタはまた、上から下、下から上、左から右、右から左の順序で2D画像を処理する。さらに、エッジフィルタは、インターレース方式(飛び越し走査)またはノンインターレース方式(順次走査)の処理命令を用いる。
【0055】
ブロック423において、それぞれの画像線を処理するために、エッジフィルタは画像線におけるエッジの数を検出する。この検出されたエッジの数は、画像線に対するエッジカウントと判断される。
【0056】
ブロック425において、エッジフィルタは、2D画像のすべての画像線が処理されたかどうかを決定する。答えが「NO」ならば、プロセス401はブロック421に戻り、その他の画像線が処理するための2D画像から抽出される。ブロック425における答えが「YES」ならば、プロセス401は、ブロック427に進む。
【0057】
ブロック427において、エッジアキュムレータは、2D画像のそれぞれの画像線に対する「上の」画像線のエッジカウントを蓄積する。対応する蓄積されたエッジカウントはそれぞれの画像線に与えられる。
【0058】
ブロック429において、シーンデプスアサインメントモジュールは、2D画像のすべての画像線に対する蓄積されたエッジカウントを正規化し、ブロック450によりさらに処理するためにデプスグラディエントマップを生成する。
【0059】
ブロック431において、色空間エクストラクタは、2D画像から1以上の画像成分を抽出する。それぞれの画像成分は、色空間の色成分に対応する。例えば、Y画像成分は、YCbCr色空間のY色成分に対応する。R画像成分は、RGB色空間のレッド(R)色成分に対応する。
【0060】
ブロック433において、画像成分は、ゲインを決めるために対応する画像成分リファインメントモジュールに送られる。本実施形態において、上記画像成分におけるそれぞれの色彩値に対して、上記リファインメントモジュールは、対応するゲインを決定する。それぞれの色彩値が、例えば、0から255の範囲にある値を有してからあとに、上記対応するゲインは、それに応じて変化している。例えば、Y色彩値に対して、対応するゲインは1−Ythから1+Ythの範囲にある。
【0061】
ブロック435において、画像成分におけるそれぞれの色彩値について、上記対応するリファインメントモジュールは、上記ゲインをあるゲイン一組に加え、上記ゲインを2D画像のピクセルに対応づける。したがって、上記ゲイン一組は、対応するゲインが決定されるピクセルが提供するピクセルの位置を含む。
【0062】
ブロック437において、デプスリファインメントエンジンは、すべての画像成分が調節されているかどうかを測定する。答えが「NO」ならば、プロセス401はブロック431に進み、その他の画像成分が、さらに処理するための2D画像から抽出される。ブロック437における答えが「YES」ならば、プロセス401は、ブロック450に進む。
【0063】
ブロック450において、デプス生成モジュールは、ブロック429で生成されたデプスグラディエントマップと、ブロック431−433−435−437のルートを通って生成された一組のゲインとに基づいてデプス融合を実行することによって、デプスマップを生成する。本実施形態において、デプス融合は、乗法公式に基づいて実行される。上記生成されたデプスマップは、2D画像のそれぞれのピクセルに対する対応するデプス値を有する。
【0064】
ブロック460において、3D変換エンジンは、上記デプスマップに基づいて2D画像を3D画像に変換する。
【0065】
図5は、3Dビデオ変換プロセスを最適化するためのプロセスの実例となる実施形態のフローチャートを示す。プロセス501は、様々な機能的ブロックまたはアクションを表記する。この機能的ブロックまたはアクションは、処理ステップとして、機能的オペレーションとして、イベントとして、そして/または動作として記載されていて、ハードウェア、ソフトウェア、そして/またはファームウェアにより実行される。本願開示を踏まえた当業者は、図5に示された機能的ブロックの多数の代替手段が、様々な実施において実行される可能性があることを認識するだろう。本実施形態において、プロセス501について機械が実行可能なインストラクションは、メモリーに保存され、処理ユニットによって実行され、そして/または図1のデプス生成モジュール130に実装される。
【0066】
ブロック510において、デプス生成モジュールは、3D変換のために2Dビデオから第1の2D画像を選択する。上記2Dビデオは、デプス生成モジュールがすばやく1以上の2D画像を抽出することができるように、フレームバッファに読み込まれる。
【0067】
ブロック520において、デプス生成モジュールのデプスグラディエントマップジェネレータは、第1の2D画像を処理し、第1の2D画像に対応する第1デプスグラディエントマップを生成する。
【0068】
ブロック530において、デプス生成モジュールは、3D変換のために2Dビデオから第2の2D画像を選択する。本実施形態において、第2の2D画像は、2Dビデオにおいて、第1の2D画像のその後に続く画像である。上記第2の2D画像もまた、第1の2D画像と第2の2D画像との間に著しい差異がない限りは、上記2Dビデオのその他の2D画像である。
【0069】
ブロック540において、デプス生成モジュールのデプス融合モジュールは、第1デプスグラディエントマップと第2の2D画像とを用いてデプス融合を実行することにより、第1デプスマップを生成する。特に、デプス生成モジュールのデプスリファインメントエンジンは、最初に第2の2D画像の画像成分を処理して、複数の画像成分のゲイン一組を生成する。デプス融合モジュールは、そのとき、第1デプスマップを生成するために画像成分のゲイン一組とデプスグラディエントマップを用いる。言い換えれば、デプス生成モジュールは、第1の2D画像に基づいて、第1の2D画像そして/または第2の2D画像に対するデプスマップを生成するために生成されたデプスグラディエントマップを用いる。このようなアプローチは、ビデオの連続した画像が、一の画像から他の画像まで大きく変化しないため、有利である。したがって、第1の2D画像と第2の2D画像との両方を処理するために、第1の2D画像から生成されたデプスグラディエントマップを用いることで、デプス生成モジュールの能力は、非常に強化される。
【0070】
ブロック550において、3D変換エンジンは、ブロック540で生成された第1デプスマップを用いて、第2の2D画像を第1の3D画像に変換する。上記3D変換エンジンは、第1の2D画像と第2の2D画像との間に著しい変化がなければ、第1デプスマップを用いて第1の2D画像を別の3D画像に変換することもできる。ブロック560において、デプス生成モジュールは、2Dビデオから第3の2D画像を選択する。ブロック570において、ブロック520と同様に、デプス生成モジュールは、第2の2D画像に対応する第2デプスグラディエントマップを生成する。
【0071】
ブロック580において、ブロック540と同様に、デプス生成モジュールのデプス融合モジュールは、第2デプスグラディエントマップと第3の2D画像とを用いてデプス融合を実行することで、第2デプスマップを生成する。本実施形態において、ブロック540そして/またはブロック550は、ブロック570が実行中に同時に実行される。このとき、デプス生成モジュールのデプスグラディエントマップジェネレータは、第2の2D画像から第2デプスグラディエントマップを生成する(ブロック570)。上記第2デプスグラディエントマップの生成は、デプス生成モジュールのデプスリファインメントエンジンとデプス融合モジュールとが、第2の2D画像に対する第1デプスマップを生成するとき(ブロック540)、そして/または、3D変換エンジンが第2の2D画像を第1の3D画像に変換するとき(ブロック550)と、実質上同時に実行される。このようなアプローチは、2ステップ(デプスグラディエントマップ生成ステップとデプス融合ステップ)の順次オペレーションを同時処理される2つのシングルステップオペレーションへ転換するので、有利である。シングルステップオペレーションのそれぞれは、2ステップの順次オペレーションの長さの半分であり、その結果、3D変換プロセスの性能が大きく向上する。
【0072】
ブロック590において、3D変換エンジンは、ブロック550で生成された第2デプスマップを用いて、第3の2D画像を第2の3D画像に変換する。したがって、一の2D画像から生成されるデプスグラディエントマップは、3Dビデオにおいて、その次の2D画像を変換するために用いられる。本実施形態において、デプス生成モジュールは、2つの隣接した2D画像が互いに似ているかどうかを決定するために比較オペレーションを用いる。上記比較オペレーションが2つの隣接する2D画像が類似であると決定する場合、そのとき、デプス生成モジュールは、最適化された処理のためにプロセス501を利用する。そうでなければ、デプス生成モジュールは、選択された2D画像から生成されたデプスグラディエントマップだけを用いて選択された2D画像を変換する。
【0073】
上述のとおり、デプスマップ生成のための方法とシステムとを記述してきた。上述の記載を取り入れた技術は、特殊用途のハード・ワイヤード回路に、プログラム可能な回路と連動するソフトウェアそして/またはファームウェアに、あるいはこれらの結合に実装されうる。特殊目的のハード・ワイヤード回路は、例えば、1以上の、特定用途向け集積回路(ASICs)、プログラム可能論理回路(PLDs)、フィールド・プログラマブル・ゲート・アレイ(FPGAs)等の形式であってもよい。
【0074】
上述の詳細な説明は、ブロック図、フローチャート、実例の使用を通して、本発明の装置そして/またはプロセスの様々な実施形態を説明してきた。上記ブロック図、フローチャート、そして/または実例が、1以上の機能そして/またはオペレーションを含む限りにおいて、上記ブロック図、フローチャート、そして/または実例の中でそれぞれの機能そして/またはオペレーションは、ハードウェア、ソフトウェア、ファームウェア、あるいはコンピュータ上のこれらの組み合わせの広い範囲で、個別にそして/またはまとめて実施されうることが、当該技術分野の範囲内でのブロック図、フローチャート、実例の使用により理解されるであろう。全体的にあるいは一部分において、本願に記載されている実施形態のあらゆる状況は、1以上のコンピュータ上で走る1以上のコンピュータプログラムとして(例えば、1以上のコンピュータシステム上で走る1以上のプログラムとして)、1以上のプロセッサ上で走る1以上のプログラムとして(例えば、1以上のマイクロプロセッサ上で走る1以上のプログラムとして)、ファームウェアとして、あるいはコンピュータ上のこれらの組み合わせとして同等に集積回路に実施されうることを当業者は認識するであろう。そして、回路の設計、そして/またはソフトウェアそして/またはファームウェアのコードを書くことは、本願の開示を考慮すると、本願発明の属する技術分野の1つの技術の範囲内であろうことを当業者は認識するであろう。
【0075】
本願記載で導入された技術を実施するためのソフトウェアそして/またはファームウェアは、一時的ではないコンピュータが解読できる記録媒体に保存され、汎用のあるいは特殊目的のプログラムで制御できる1以上のマイクロプロセッサによって実行される。ここで用いられている「コンピュータが解読できる記録媒体」は、マシン(例えば、コンピュータ、ネットワークデバイス、携帯端末(PDA)、モバイルデバイス、製造ツール、1以上のプロセッサのセットを有するデバイス等)によって、アクセス可能な形式で情報を提供する(例えば、保存そして/または送信)あらゆるメカニズムを含む。例えば、マシンにアクセス可能な記録媒体は、書き込み可能な/書き込み不可能な媒体(例えば、リードオンリーメモリー(ROM)、ランダムアクセスメモリー(RAM)、磁気ディスク記録媒体、光学記録媒体、フラッシュメモリーデバイス等)を含む。
【0076】
本願開示は、特定の例となる実施形態を参照して記載されているけれども、本願開示は、記載された実施形態に限定されないが、しかし、添付の請求項の精神と範囲の中で修正、変更して実施されることが可能であることが認識されるであろう。それに応じて、本願明細書および図面は、限定的な意味というよりはむしろ説明的な意味に考えられるべきである。

【特許請求の範囲】
【請求項1】
2次元画像を3次元画像に変換するためのデプスマップを生成するための方法であって、
2次元画像から、1以上のエッジカウントを1以上のデプス値に対応づけるように構成されているデプスグラディエントマップを生成し、
上記2次元画像から、色空間の色成分に対応する画像成分を抽出し、
上記画像成分に基づいて、上記デプスグラディエントマップを調整するための一組のゲインを決定し、
上記デプスグラディエントマップと上記一組のゲインとに基づいてデプス融合を実行することによって、デプスマップを生成すること
を特徴とする方法。
【請求項2】
請求項1に記載の方法において、
上記デプスマップに基づいて2次元画像を3次元画像に変換することを特徴とする方法。
【請求項3】
請求項1に記載の方法において、
上記デプスグラディエントマップを生成することにおいては、
2次元画像における複数の画像線から規則的に抽出される画像線について、
上記画像線における1以上のエッジを検出することによって、上記画像線に対するエッジカウントを決定し、
上記複数の画像線に対して決定された上記エッジカウントに基づいて上記デプスグラディエントマップを生成することを特徴とする方法。
【請求項4】
請求項3に記載の方法において、
上記画像線における隣接するピクセル間の色彩変化の数をカウントすることにより、上記1以上のエッジが上記エッジカウントとして検出され、
上記色彩変化のそれぞれが、既定の色彩変動閾値を超えることを特徴とする方法。
【請求項5】
請求項3に記載の方法において、
上記画像線における隣接するピクセル間の明度変化の数をカウントすることにより、上記1以上のエッジが上記エッジカウントとして検出され、
明度変化のそれぞれが、既定の明度変動閾値を超えることを特徴とする方法。
【請求項6】
請求項3に記載の方法において、
上記デプスグラディエントマップは、複数のデプスグラディエント値を有しており、
上記複数のデプスグラディエント値は、上記エッジカウントに対する累算オペレーションを実行することにより得られることを特徴とする方法。
【請求項7】
請求項6に記載の方法において、
上記複数のデプスグラディエント値のそれぞれは、対応する画像線に対する対応するエッジカウントと、上記2次元画像の画像線の部分集合に対するエッジカウントの小計とを加えることにより得られ、
上記画像線の部分集合における画像線のそれぞれは、上記対応する画像線よりも上記2次元画像の視点からさらに離れているとみなされることを特徴とする方法。
【請求項8】
請求項6に記載の方法において、
上記デプスグラディエントマップは、上記複数のデプスグラディエント値を正規化した後で生成されることを特徴とする方法。
【請求項9】
請求項1に記載の方法において、
上記画像成分は、上記2次元画像の複数のピクセルから抽出された複数の色彩値を有しており、
上記複数の色彩値は、上記色成分に属することを特徴とする方法。
【請求項10】
請求項1に記載の方法において、
上記一組のゲインを決定することにおいては、
上記画像成分から選択され、上記2次元画像のピクセルに対応する色彩値について、
上記色彩値に基づいて、上記ピクセルの深度特性を減少させる第1の値から、上記ピクセルの深度特性を増加させる第2の値の範囲にある対応するゲインを決定し、
上記対応するゲインを上記一組のゲインの上記ピクセルに対応づけることを特徴とする方法。
【請求項11】
請求項1に記載の方法において、
上記デプス融合を実行することにおいては、
上記デプスグラディエントマップから選択されたデプスグラディエント値に上記一組のゲインから選択された対応するゲインを掛けることによって、上記デプスマップに対するデプス値を規則正しく生成し、
上記デプスグラディエント値は、上記2次元画像の特定の画像線に対応すると共に、上記対応するゲインは、上記特定の画像線における特定のピクセルの色彩値に対応していることを特徴とする方法。
【請求項12】
請求項1に記載の方法において、
上記方法は、コンピュータが読み取り可能な記憶媒体において、一組のインストラクションとして具体化されており、上記一組のインストラクションは、コンピューティングプロセッサによって実行されたときに、上記コンピューティングプロセッサに上記方法を実行させることを特徴とする方法。
【請求項13】
2次元ビデオを3次元ビデオへ変換するための方法であって、
2次元ビデオから第1の2次元画像を選択し、
上記第1の2次元画像に対応する第1デプスグラディエントマップを生成し、
上記2次元ビデオから、上記第1の2次元画像の後に続く第2の2次元画像を選択し、
上記第1デプスグラディエントマップと上記第2の2次元画像とを用いてデプス融合を実行することにより、第1デプスマップを生成し、
上記第1デプスマップを用いて、上記第2の2次元画像を3次元ビデオのための第1の3次元画像に変換することを特徴とする方法。
【請求項14】
請求項13に記載の方法において、
上記第2の2次元画像に対応する第2デプスグラディエントマップを生成し、
上記2次元ビデオから、上記第2の2次元画像の後に続く第3の2次元画像を選択し、
上記第2デプスグラディエントマップと上記第3の2次元画像とに基づいてデプス融合を実行することにより第2デプスマップを生成し、
上記第2デプスマップを用いて、上記第3の2次元画像を上記3次元ビデオのための第2の3次元画像に変換する
ことを特徴とする方法。
【請求項15】
請求項14に記載の方法において、
上記第2デプスグラディエントマップの生成と上記第1デプスマップの生成とが、同時に実行されることを特徴とする方法。
【請求項16】
ビデオ変換のためのデプスマップを生成するために構成されたシステムであって、
2次元画像に基づいてデプスグラディエントマップを生成するためのデプスグラディエントマップジェネレータと、
上記2次元画像から1以上の画像成分を抽出し、それぞれ上記1以上の画像成分に基づいて、それぞれ一組以上のゲインを決定するためのデプスリファインメントエンジンと、
上記デプスグラディエントマップと上記一組以上のゲインとに基づいてデプス融合を実行することによって、上記デプスマップを生成するための、上記デプスグラディエントマップジェネレータおよび上記デプスリファインメントエンジンと結合されたデプス融合エンジンと
を備えることを特徴とするシステム。
【請求項17】
請求項16に記載のシステムにおいて、
上記2次元画像を保存するために、上記デプスグラディエントマップジェネレータおよびデプスリファインメントエンジンと結合されたフレームバッファを備えることを特徴とするシステム。
【請求項18】
請求項16に記載のシステムにおいて、
上記デプスマップに基づいて上記2次元画像を3次元画像に変換するための、上記デプス融合エンジンと結合された3次元変換エンジンを備えることを特徴とするシステム。
【請求項19】
請求項16に記載のシステムにおいて、
上記デプスマップジェネレータは、
上記2次元画像のそれぞれの画像線についてエッジカウントを生成するためのエッジフィルタと、
上記エッジカウントを蓄積することにより上記デプスグラディエントマップを生成するための、上記エッジフィルタと結合されたエッジアキュムレータと
をさらに備えることを特徴とするシステム。
【請求項20】
請求項19に記載のシステムにおいて、
上記デプスグラディエントマップは、複数のデプスグラディエント値を有しており、
上記エッジアキュムレータは、上記それぞれの画像線に対する上記エッジカウントと、上記2次元画像の画像線の部分集合に対するエッジカウントの小計とを加えることによって、上記それぞれの画像線に対するデプスグラディエント値を得ることを特徴とするシステム。
【請求項21】
請求項20に記載のシステムにおいて、
上記デプスグラディエントマップジェネレータは、
上記複数のデプスグラディエント値を正規化することによって上記デプスグラディエントマップを生成するための、上記エッジアキュムレータと結合されたシーンデプスアサインメントをさらに備え、
上記複数のデプスグラディエント値は、上記2次元画像の画像線についての複数の蓄積されたエッジカウントに基づいて、それぞれ正規化されることを特徴とするシステム。
【請求項22】
請求項16に記載のシステムにおいて、
上記デプスリファインメントエンジンは、
それぞれが色空間の色成分に対応する上記1以上の画像成分を上記2次元画像から抽出するための色空間エクストラクタと、
上記1以上の画像成分にそれぞれ対応する上記一組以上のゲインを生成するための、上記色空間エクストラクタと結合された1以上のデプスリファインメントモジュールとをさらに備えることを特徴とするシステム。
【請求項23】
請求項16に記載のシステムにおいて、
上記デプス融合エンジンは、上記デプスグラディエントマップと上記一組以上のゲインとを用いて、乗算オペレーションを対応して実行することにより、上記デプスマップに対する複数のデプス値を生成することを特徴とするシステム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公開番号】特開2011−129116(P2011−129116A)
【公開日】平成23年6月30日(2011.6.30)
【国際特許分類】
【外国語出願】
【出願番号】特願2010−275990(P2010−275990)
【出願日】平成22年12月10日(2010.12.10)
【出願人】(502016219)ハイマックス テクノロジーズ リミテッド (1)
【出願人】(503209342)ナショナル タイワン ユニバーシティ (9)
【Fターム(参考)】