説明

画像合成装置、画像合成方法及び画像合成プログラム

【課題】人物と背景を動画像に合成する装置を提供する。
【解決手段】人物実動画像入力・記憶手段、背景実動画像入力・記憶手段、光環境実動画像入力・記憶手段、人物の顔の表面反射特性情報入力・記憶手段、人物画像抽出手段、人物および顔の三次元形状情報に基づいて顔の追跡情報を求める追跡処理手段、背景の実動画像に応じた光環境情報を求める光環境情報処理手段、顔の陰影情報及び顔の表面反射情報を求める合成顔画像情報処理手段、顔画像から肌情報を求める肌情報処理手段、肌情報と顔の陰影情報と顔の表面反射情報に基づき顔の合成画像を合成する顔画像合成処理手段、顔の合成画像と人物画像及び背景の実動画像に基づいて人物背景合成動画像を合成する人物背景動画像合成処理手段とを具備する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、別々に撮像した人物の動画像と背景動画像とを合成する画像合成装置、方法及びプログラムに関する。
【背景技術】
【0002】
画像合成技術の進歩に伴って、テレビジョン撮影等においては、人物画像と背景画像とを別々に撮像し、人物画像に対して特定の閾値で該人物画像の人物領域のみを抽出し、抽出した人物領域と前記背景画像とをクロマキー合成し、該人物があたかもその背景の撮像場所にいるかのように合成する技術が実用化されている。しかし、この技術においては、人物の表面に現れる陰影が、背景画像の照明条件に応じて現れていないため、不自然な画像となる一つの課題を有していた。
【0003】
このような課題を改善する技術として、例えば、特許文献1に記載の技術が提案されている。この技術は、対象となる物体の表面色を拡散反射成分と鏡面反射成分に分離するとともに、それらの信頼度を計算した上で、反射モデルを適用して各画像における法線方向を復元し、該法線方向により与えられた照明方向と前記反射モデルによって照明方向、すなわち陰影を修正した画像を生成するものである。
【0004】
【特許文献1】特開平5−233826号公報
【発明の開示】
【発明が解決しようとする課題】
【0005】
しかしながら、上記特許文献1に記載の技術は、画像中のまとまった領域に対する統計処理で対象物の色を推定するため、例えば車のようにある程度広い領域で均一な色になっていることが期待できる対象物に対してはうまく機能するが、人の肌のように細かな周期で色合いが変化し、それが見る人の印象に影響を与える対象物に対してはうまく機能させることができなかった。
【0006】
本発明は、上記従来の課題に鑑みてなされたものであり、別々に撮像された人物と背景とを、あたかも同じ場所で撮像されたと同様の自然な動画像に合成することができる画像合成装置、画像合成方法及び画像合成プログラムを提供することを目的とする。
【課題を解決するための手段】
【0007】
本発明は、人物の実動画像に基づいて合成された該人物の顔の合成画像を、前記人物の実動画像とは別に撮像された背景の実動画像と合成する画像合成装置であって、
前記人物の実動画像を入力又は記憶する人物実動画像入力・記憶手段と、
前記背景の実動画像を入力又は記憶する背景実動画像入力・記憶手段と、
前記背景の実動画像とともに撮像された該背景の光環境実動画像を入力又は記憶する光環境実動画像入力・記憶手段と、
前記人物の顔の三次元形状情報、法線情報及び光反射特性情報からなる前記人物の顔の表面反射特性情報を入力又は記憶する表面反射特性情報入力・記憶手段と、
前記人物実動画像入力・記憶手段に記憶された前記人物の実動画像の各フレーム画像から人物画像を抽出する人物画像抽出処理手段と、
抽出された前記人物画像、及び前記表面反射特性情報入力・記憶手段が入力又は記憶した前記顔の三次元形状情報に基づいて、前記人物の顔画像、並びに前記人物の顔の特定部位の位置情報及び該顔の方向情報からなる顔の追跡情報を求める追跡処理手段と、
前記光環境実動画像入力・記憶手段が入力又は記憶した光環境実動画像の各フレーム画像に基づいて、前記背景の実動画像の各フレーム画像に応じた光環境情報を求める光環境情報処理手段と、
前記顔の表面反射特性情報、前記顔の追跡情報、及び前記光環境情報に基づいて、前記顔の陰影情報及び表面反射情報を求める合成顔画像情報処理手段と、
前記人物の顔画像の各フレーム画像から、色成分情報及び陰影成分情報からなる肌情報を求める肌情報処理手段と、
前記肌情報、前記顔の陰影情報、及び前記顔の表面反射情報に基づいて、前記顔の合成画像を合成する顔画像合成処理手段と、
前記顔の合成画像、前記人物画像、及び前記背景実動画像に基づいて、人物背景合成動画像を合成する人物背景合成動画像合成処理手段とを具備する画像合成装置を提供することにより、前記目的を達成したものである。
【0008】
また、本発明は、人物の実動画像、前記人物の実動画像とは別に撮像された背景の実動画像、前記背景の実動画像とともに撮像された該背景の光環境実動画像、並びに前記人物の顔の三次元形状情報、法線情報及び光反射特性情報からなる該人物の顔の表面反射特性情報を入力又は記憶するデータ入力・記憶処理ステップと、
前記光環境実動画像の各フレーム画像に基づいて、前記背景の実動画像の各フレーム画像に応じた光環境情報を求める光環境情報処理ステップと、
前記人物の実動画像の各フレーム画像から人物画像を抽出する人物画像抽出処理ステップと、
前記人物画像及び前記顔の三次元形状情報に基づいて、前記人物の顔画像及び前記人物の顔の追跡情報を求める追跡処理ステップと、
前記顔の表面反射特性情報、前記顔の追跡情報、及び前記光環境情報に基づいて、前記顔の陰影情報及び表面反射情報を求める合成顔画像情報処理ステップと、
前記人物の顔画像から、色成分情報及び陰影成分情報からなる肌情報を求める肌情報処理ステップと、
前記肌情報、前記顔の陰影情報、及び前記顔の表面反射情報に基づいて、前記顔の合成画像を合成する顔画像合成処理ステップと、
前記顔の合成画像、前記人物画像、及び前記背景の実動画像に基づいて、人物背景合成動画像を合成する人物背景合成動画像合成処理ステップとを具備する画像合成方法を提供するものである。
【0009】
また、本発明は、コンピュータに、人物の実動画像、前記人物の実動画像とは別に撮像された背景の実動画像、前記背景の実動画像とともに撮像された該背景の光環境実動画像、並びに前記人物の顔の三次元形状情報、法線情報及び光反射特性情報からなる該人物の顔の表面反射特性情報を入力又は記憶手段に記憶させるデータ入力・記憶処理機能と、人物の実動画像の各フレーム画像から人物画像を抽出する人物画像抽出処理機能と、前記人物画像及び前記顔の三次元形状情報に基づいて、前記人物の顔画像及び前記人物の顔の追跡情報を求める追跡処理機能と、光環境実動画像の各フレーム画像に基づいて、記憶された前記背景の実動画像の各フレーム画像に応じた光環境情報を求める光環境情報処理機能と、前記顔の表面反射特性情報、前記顔の追跡情報、及び前記光環境情報に基づいて、前記顔の陰影情報及び表面反射情報を求める合成顔画像情報処理機能と、前記人物の顔画像から、色成分情報及び陰影成分情報からなる肌情報を求める肌情報処理機能と、前記肌情報、前記顔の陰影情報、及び前記顔の表面反射情報に基づいて、前記顔の合成画像を合成する顔画像合成処理機能と、前記顔の合成画像、前記人物画像、及び前記背景実動画像に基づいて、人物背景合成動画像を合成する人物背景合成動画像合成処理機能とを実現させる画像合成プログラムを提供するものである。
【発明の効果】
【0010】
本発明によれば、別々の場所で撮像された人物の顔画像と背景画像とを、背景画像と略同じ照明条件で合成することができるので、得られた合成動画像は、人物と背景との間の光の反射具合等に違和感がなく、当該人物と背景とがあたかも同じ撮影場所で自然に撮像されたような動画像を合成することができる。
【発明を実施するための最良の形態】
【0011】
以下、本発明の画像合成装置を、その好ましい一実施形態に基づいて説明する。
【0012】
図1は、本発明の画像合成装置の一実施形態を示すものである。本実施形態の画像合成装置は、人物の実動画像(以下、人物実動画像ともいう。)に基づいて合成された該人物の顔の合成画像を含む人物画像を、前記人物実動画像とは別に撮像された背景の実動画像(以下、背景実動画像ともいう。)と合成するものである。
【0013】
図1に示すように、画像合成装置1は、前記人物実動画像を入力又は記憶する人物実動画像入力・記憶手段11と、前記背景実動画像を入力又は記憶する背景実動画像入力・記憶手段12と、前記背景の実動画像とともに撮像した該背景の光環境実動画像を入力又は記憶する光環境実動画像入力・記憶手段13と、前記人物の顔の三次元形状情報、法線情報及び光反射特性情報からなる前記人物の顔の表面反射特性情報を入力又は記憶する顔の表面反射特性情報入力・記憶手段14と、人物実動画像入力・記憶手段11に記憶された前記人物実動画像の各フレーム画像から前記人物画像(人物領域画像)を抽出する人物画像抽出処理手段21と、抽出された前記人物画像、及び表面反射特性情報入力・記憶手段14が入力又は記憶した前記顔の三次元形状情報に基づいて、前記人物の顔画像(顔領域画像)、並びに前記人物の顔の特定部位の位置情報及び該顔の方向情報からなる顔の追跡情報を求める追跡処理手段22と、前記光環境実動画像入力・記憶手段13が入力又は記憶した光環境実動画像の各フレーム画像に基づいて、前記背景実動画像の各フレーム画像に応じて光源を点光源に近似させた光環境情報を求める光環境情報処理手段23と、前記顔の表面反射特性情報、前記顔の追跡情報、及び前記光環境情報に基づいて、前記顔の陰影情報及び表面反射情報を求める合成顔画像情報処理手段24と、前記人物の顔画像から、色成分情報及び陰影成分情報からなる肌情報を求める肌情報処理手段25と、前記陰影成分情報からその高周波陰影成分情報を求めた上で、前記肌情報、前記高周波陰影成分情報、前記顔の陰影情報及び表面反射情報に基づいて、前記顔の合成画像を合成する陰影成分情報処理手段26兼顔画像合成処理手段27と、前記顔の合成画像、前記人物画像、及び前記背景実動画像に基づいて、人物背景合成動画像を合成する人物背景合成動画像合成処理手段28と、前記人物背景合成動画像を表示する動画像表示処理手段29とを具備している。
【0014】
以下、本実施形態の画像合成装置1を更に詳しく説明する。
上記各手段11〜14及び21〜29を具備する本実施形態の画像合成装置1は、図2に示すように、コンピュータ10における中央処理装置(以下「CPU」という)10Aが、基本ソフトウェア(OS)とともに作動する画像合成プログラム(以下、単にプログラムともいう。)100に基づいて実行するように構成されている。
【0015】
プログラム100は、コンピュータ10に、前記各手段11〜14及び21〜29を実行させるために、前記各実動画像及び前記表面反射特性情報を前記各入力・記憶手段11〜14にそれぞれ入力又は記憶させるデータ入力・記憶処理機能101と、人物実動画像の各フレーム画像から前記人物画像を抽出する人物画像抽出処理機能102と、前記人物画像及び前記顔の三次元形状情報に基づいて、前記人物の顔画像及び前記顔の追跡情報を求める追跡処理機能103と、光環境実動画像の各フレーム画像に基づいて、前記背景実動画像の各フレーム画像に応じて、光源を点光源に近似させた光環境情報を求める光環境情報処理機能104と、前記顔の表面反射特性情報、前記顔の追跡情報、及び前記光環境情報に基づいて、前記顔の陰影情報及び表面反射情報を求める合成顔画像情報処理機能105と、前記人物の顔画像から、色成分情報及び陰影成分情報からなる前記肌情報を求める肌情報処理機能106と、前記陰影成分情報から高周波陰影成分情報を求める陰影成分情報処理機能107と、前記肌情報、前記高周波陰影成分情報、前記顔の陰影情報、及び前記顔の表面反射情報に基づいて、前記顔の合成画像を合成する顔画像合成処理機能108と、前記顔の合成画像、前記人物画像、及び前記背景実動画像に基づいて、人物背景合成動画像を合成する人物背景合成動画像合成処理機能109と、人物背景合成動画像を表示手段に表示させる動画像表示処理機能110とを実現させたプログラムである。
【0016】
画像合成装置1は、中央演算処理装置(CPU)10A、メインメモリ(RAM)10B、画像処理プロセッサ(GPU)10C、ビデオメモリ(VRAM)10D、チップセット10E、ファイル記憶装置(HDD)10F、表示装置(モニター)10G、表面反射特性情報入力装置10H、入力装置10I及びこれらの間を接続するバス10Jを備えたコンピュータ10と、人物実動画像入力装置(ビデオカメラ)10Kと、背景実動画像入力装置(ビデオカメラ)10L、光環境実動画像入力装置(ビデオカメラ)10Mとで構成されている。画像合成装置1は、本実施形態のように、汎用のCPUを備えた汎用のコンピュータで構成してもよいし、専用のCPUを備えた画像合成処理専用のコンピュータとして構成してもよい。
【0017】
人物実動画像入力装置10K、背景実動画像入力装置10L及び光環境実動画像入力装置10Mは、それぞれビデオカメラ等の撮像手段で構成し、画像合成に使用される実動画像を各装置からリアルタイムに取得することもできるし、ファイル記憶装置10Fに格納可能な動画ファイルにコンピュータ10ないしこれとは別に用意したコンピュータを用いて変換しておき、画像合成に使用されるデータをファイル記憶装置10Fから取得することもできるし、これらの取得法を組み合わせることもできる。
本実施形態においては、以下に説明するように、人物実動画像入力装置10Kからは動画像をリアルタイムに取得し、背景実動画像入力装置10L、光環境実動画像入力装置10M及び表面反射特性情報入力装置10Hからは実動画像を所定の動画ファイルとして予めファイル記憶装置10Fに格納し、これらのデータによって画像合成を行う。このようなデータ取得法の組み合わせは、コンピュータによる演算処理の負荷を軽減することができるので、リアルタイム処理を実現する上で好ましい。本実施形態におけるようなリアルタイムな処理は、画像処理系記述言語(例えばOpenGL(米国シリコングラフィックス社の登録商標)やDirectX(米国マイクロソフト社の登録商標))を用い、GPU10Cの機能を利用することで、実装が可能となる。
【0018】
CPU10Aは、メインメモリ10Bに記憶されたプログラム100を解釈してその指令内容を実行する所定の演算処理回路を備えている。メインメモリ10Bは、基本ソフトウェアOS、プログラム100並びにCPU10A及びGPU10Cで使用される処理用データ等が記憶される記憶装置である。本実施形態では、GPU10Cの演算処理用にメモリ(図示せず)を備えているので、GPU10Cでの処理用データはこのメモリに記憶される。GPU10Cは、最終的な動画像の合成を含む画像処理をCPU10Aに代わって行う専用の演算処理回路を備えた演算処理装置である。ビデオメモリ10Dは、GPU10Cで行った画像処理の結果最終的に表示される画像を記憶するメモリである。チップセット10Eは、制御回路が集積された複数の集積回路(LSI)であり、CPU10Aとそれに接続される周辺デバイスとの間に介装される。ファイル記憶装置10Fは、画像処理に必要な各情報が所定のファイル形式で記憶された補助記憶装置である。表示装置10Gは、GPU10Cで画像処理された画像がビデオメモリ10Dを介して表示される表示装置である。人物実動画像入力装置10Kは、合成対象となる人物の実動画像をリアルタイムで入力する装置である。背景実動画像入力装置10L、光環境実動画像入力装置10M及び表面反射特性情報入力装置10Hは、所定のファイル形式でファイル記憶装置10Fに取り込まれて蓄積されるべき各動画像及び情報を入力する装置である。入力装置10Iは、オペレータによる各種の入力操作行う装置である。バス10Jは、それぞれの通信プロトコルに応じて各回路・装置を通信可能に接続している。
本実施形態の画像合成装置1においては、基本ソフトウェアOS及びプログラム100と協働することにより、CPU10A及び/又はGPU10Cが主として上記各処理手段21〜28として機能し、人物実動画像入力装置10K及び/又はファイル記憶装置10Fが主として上記各入力・記憶手段11〜14として機能する。
動画像を記憶装置に保存する際のファイル形式には、MPEG形式やQuick Time形式、AVI形式等の様々なファイル形式を採用することができるが、画質の劣化が起こらない可逆変換に基づくファイル形式が好ましく、その中でも一般的に用いられており、汎用性に優れている非圧縮AVI形式がより好ましい。
【0019】
プログラム100は、CPU10A、メインメモリ10B、ファイル記憶装置10F、人物実動画像入力装置10K、及び表面反射特性情報入力装置10H等と協働し、データ入力・記憶処理機能101により、人物実動画像入力装置10Kから前記人物実動画像、ファイル記憶装置10Fから前記背景実動画像、前記背景の光環境動画像、及び前記人物の顔の表面反射特性情報をGPU10C上のデータ記憶部にそれぞれ記憶させることを実現させている。
【0020】
プログラム100は、CPU10A、メインメモリ10B、GPU10C等と協働し、人物画像抽出処理機能102により、人物実動画像の各フレーム画像から前記人物画像を抽出することを実現させている。
【0021】
プログラム100は、CPU10A、メインメモリ10B、GPU10C及びファイル記憶装置10F等と協働し、追跡処理機能103により、前記人物画像及び前記顔の三次元形状情報に基づいて、前記人物の顔画像及び前記顔の追跡情報を求めることを実現させている。
【0022】
プログラム100は、CPU10A、メインメモリ10B、GPU10C及びファイル記憶装置10F等と協働し、光環境情報処理機能104により、光環境実動画像の各フレーム画像に基づいて、前記背景実動画像の各フレーム画像に応じて、光源を点光源に近似させた光環境情報を求めることを実現させている。
【0023】
プログラム100は、CPU10A、メインメモリ10B、GPU10C及びファイル記憶装置10F等と協働し、合成顔画像情報処理機能105により、前記顔の表面反射特性情報、前記顔の追跡情報、及び前記光環境情報に基づいて、前記顔の陰影情報及び表面反射情報を求めることを実現させている。
【0024】
プログラム100は、CPU10A、メインメモリ10B、GPU10C及びファイル記憶装置10F等と協働し、肌情報処理機能106により、前記人物の顔画像から、前記色成分情報及び前記陰影成分情報からなる肌情報を求めることを実現させている。
【0025】
プログラム100は、CPU10A、メインメモリ10B、GPU10C及びファイル記憶装置10F等と協働し、陰影成分情報処理機能107により、前記陰影成分情報から前記高周波陰影成分情報を求めることを実現させている。
【0026】
プログラム100は、CPU10A、メインメモリ10B、GPU10C及びファイル記憶装置10F等と協働し、顔画像合成処理機能108により、前記肌情報、前記高周波陰影成分情報、前記顔の陰影情報及び前記顔の表面反射情報に基づいて、前記顔の合成画像を合成することを実現している。
【0027】
プログラム100は、CPU10A、メインメモリ10B、GPU10C及びファイル記憶装置10F等と協働し、人物背景合成動画像合成処理機能109により、前記顔の合成画像、前記人物画像、及び前記背景実動画像から前記人物背景合成動画像を合成することを実現している。
【0028】
プログラム100は、CPU10A、メインメモリ10B、GPU10C、ビデオメモリ10D、ファイル記憶装置10F及び表示装置10Gと協働し、動画像表示処理機能110により、前記人物背景合成動画像を表示装置10Gに表示させることを実現させている。
プログラム100は、本実施形態のように汎用のコンピュータシステムにインストールされて使用される場合には、プログラムのインストーラーとともに記録媒体に記録されて提供される。また、画像合成処理専用の専用コンピュータに組み込まれる場合には、不揮発メモリに記録されて提供される。
【0029】
次に、本発明の画像合成方法を好ましい実施形態に基づいて説明する。
図3〜図7に示すように、本実施形態の画像合成方法は、人物実動画像とは別に撮像された背景実動画像、前記背景実動画像とともに撮像された該背景の光環境実動画像、並びに前記人物の顔の三次元形状情報、法線情報及び光反射特性情報からなる該人物の顔の表面反射特性情報を入力し記憶するデータ入力・記憶処理ステップS1と、前記光環境実動画像の各フレーム画像に基づいて、前記背景実動画像の各フレーム画像に応じた光環境情報を求める光環境情報処理ステップS2と、前記人物実動画像の各フレーム画像から人物画像を抽出する人物画像抽出処理ステップS3と、前記人物画像及び前記顔の三次元形状情報に基づいて、前記人物の顔画像及び前記人物の顔の追跡情報を求める追跡処理ステップS4と、前記人物の顔画像の各フレーム画像から、色成分情報及び陰影成分情報からなる肌情報を求める肌情報処理ステップS5と、前記顔の表面反射特性情報、前記顔の追跡情報、及び前記光環境情報に基づいて、前記顔の陰影情報及び顔の表面反射情報を求める合成顔画像情報処理ステップS6と、前記肌情報、前記顔の陰影情報、及び前記顔の表面反射情報に基づいて、前記顔の合成画像を合成する顔画像合成処理ステップS7と、前記顔の合成画像、前記人物画像、及び前記背景実動画像に基づいて、人物背景合成動画像を合成する人物背景合成動画像合成処理ステップS8とを具備する。
【0030】
以下、本実施形態の画像合成方法を、前記画像合成装置1を使用した画像合成方法に基づいて詳しく説明する。
画像合成装置1では、図3に示すように、先ず、データ入力・記憶処理ステップS1において、CPU10Aが、プログラム100におけるデータ入力・記憶処理機能101により、対象となる人物の実動画像とは別に撮像された背景の実動画像、前記背景の実動画像とともに撮像された該背景の光環境実動画像、並びに前記人物の顔の三次元形状情報、法線情報及び光反射特性情報からなる該人物の顔の表面反射特性情報を、背景実動画像入力装置10L、光環境実動画像入力装置10M及び表面反射特性情報入力装置10Hから得た上で、所定のファイル形式にてファイル記憶装置10Fに予め記憶させる。
【0031】
背景実動画像入力装置10L及び光環境実動画像力装置10Mによって入力される背景実動画像及び光環境実動画像は以下のようにして取得される。
【0032】
図8に示すように、背景の実動画像を撮像する背景撮像用のビデオカメラV1と、該背景の光環境実動画像を撮像するビデオカメラV2とを、それらのレンズの光軸Xが同一直線状に位置するように前後に間隔をおいて設置する。これらのビデオカメラV1、V2の間に、表面が鏡面加工された球体Sをその中心に前記光軸Xが通るように設置する。カメラV2のフォーカスは、球体S上に映る像が最も鮮明になるように合わせる。カメラV1及びV2、球体Sは、撮像中は互いの相対位置が変わらないように固定される。背景実動画像は、定点に静止した状態で撮像してもよいし、移動しながら撮像してもよい。ビデオカメラV1は、後に人物実動画像を撮影するカメラと同じ機種であることが好ましい。ビデオカメラV1及びV2は、カラー(RGB)での撮像が可能であれば、アナログ式、ディジタル式の何れのビデオカメラでも良いが、後のデータの取り扱い等を考慮すると、ディジタル式のビデオカメラが好ましい。
【0033】
ビデオカメラV2で撮像される光環境実動画像は、中央に大きく球体Sが撮像され、その周辺に背景も撮像されるが、後述する光環境情報処理に用いられるのは、球体Sの部分の画像である。撮像された画像中、球体Sには、周囲の風景が歪んで映し出される。球体Sの表面では鏡面反射(入射角と反射角が完全に等しい反射)が起こっていることから、球体Sの部分の画像は、各対応する方向からどれだけの光が入ってきたかを表している。球体Sの形状は完全に幾何学的に表現できるので、球体Sの各部位を通してビデオカメラV2に入ってくる光が、どの方角から来た光であるかは、完全に特定することができる。
【0034】
本実施形態においては、背景実動画像及び光環境実動画像は、予め動画ファイルとしてファイル記憶装置10Fに記憶されるので、ビデオカメラV1及びV2は、コンピュータ10に接続されていなくてもよいが、これらのビデオカメラを前記背景実動画像入力装置10L及び光環境実動画像入力装置10Mとし、それらから実動画像を取り込んでリアルタイム処理により画像合成を行うこともできる。この場合には、これらのビデオカメラV1及びV2は、IEEE1394等のインターフェースを介してコンピュータ10に接続される。また、ビデオカメラV1及びV2から取得される各動画像は、同期が取れている必要がある。この同期させる方法に特に制限はないが、簡便な方法としては、例えば、撮像の前後にストロボを光らせた画像も取得し、該ストロボが光った時間が揃うように同期させる方法がとられる。
【0035】
画像合成装置1では、光環境情報処理ステップS2(図3参照)において、CPU10Aが、プログラム100における光環境情報処理機能104により、光環境情報を求める。本実施形態では、ファイル記憶装置10Fに記憶された前記光環境実動画像の各フレーム画像について、仰角・方位角が二次元(x、y)座標となるように座標変換を行った後、前記背景実動画像の各フレーム画像に応じて光源を点光源に近似させた光環境情報を求める。背景実動画像から前記球体Sの領域を抽出する方法に特に制限はない。本実施形態では、前記球体Sの境界が明瞭に見えるような条件で予め撮影を行い、そのときに得られる1フレーム画像から市販の画像処理ソフトウェアを使用して前記境界がなす円周の前記画像中における位置を取得することにより行う。前記ビデオカメラV2と前記球体Sの相対位置が変わらなければ、前記背景実動画像中における前記球体Sが占める位置も変わらないので、前記球体Sの領域は、前記円周により抽出することができる。
【0036】
本実施形態では、この光環境情報は、メジアンカット法(Debevec,P. 2005. A median cut algorithm for light probe sampling. In Proceedings of SIGGRAPH 2005 Conference Abstracts and Applications(Poster), ACM Press/ACM SIGGRAPH, Computer Graphics Proceedings, Annual Conference Series, ACM.)に基づいて次のように求められる。
【0037】
先ず、近似に用いる点光源の数を設定する。この点光源の数は、光環境実動画像の構造の細かさ及び合成する顔の光反射特性における光沢の幅に基づいて2n(2、4、8、16、32、64、・・・)の中から予め設定される。そして、図9に示したように、CPU10Aが、設定された光源の数に応じて下記処理1〜処理4を行う。
処理1:画像全体を唯一の矩形領域としてリストに載せる。つまり、プログラム中において、要素数が可変で、各要素が画像中の任意の矩形領域を表す配列を用意し、その一つ目の要素に画像全体を割り当てる。具体的には、ピクセル数で数えたときに画像の幅がW、画像の高さがHであったとき、画像中の各ピクセルの座標を(x,y)で表現し、画像全体の左上を(1,1)、右下を(W,H)となるように座標系をとることで配列の各要素に任意の矩形領域を割り当てる。任意の矩形領域の左上の座標が(x1,y1)、右下の座標が(x2,y2)であった場合、(x1,y1,x2,y2)の4要素の数列によりこの矩形領域を特定することができるので、各要素に4つの数列を格納できるようにしておけばよい。画像全体を唯一の矩形領域としてリストに載せるとは、前記手法に従えば、要素数がただ1つの配列を用意し、その唯一の要素を(1,1,W,H)とすればよい。
処理2:前記リストに載っている各矩形領域をその領域の短辺に平行な境界線で2つに分割(区分)する。前記境界線による分割は、分割後の各領域の光量が等しくなるように行われる。本実施形態では、光環境実動画像はRGBの3チャンネルで得られており、各ピクセルにおける光量Yは、ITU−RのBT.709に従うものとされ、RGBとの関係で、次式(1)によって求められる。
Y=0.2125R+0.7154G+0.0721B (1)
処理3:上記処理2が点光源の数に応じてn回繰り返され、その結果もとの画像は2nの領域に分割される。
処理4:各領域内の光の重心を求め、そこに該領域中の光量の総和に相当する点光源があると近似する。ここで、光の重心とは具体的には、前記座標系における座標(x,y)の前記光量をY(x,y)で表すとき、重心xc、ycは、xc=Σ(x×Y(x,y)
)/ΣY(x,y)及びyc=Σ(y×Y(x,y))/ΣY(x,y)で求まる。ただ
し、Σは該領域の全てのピクセルにわたる総和を表す。
本実施形態のように、光環境実動画像を予め取得し、動画ファイルとして格納しておく場合には、この処理は予め済ませておくことができる。これにより処理を行うときのコンピュータに対する計算負荷を軽減させることができる。
【0038】
顔の表面反射特性情報には、顔の三次元形状情報、法線情報、及び光反射特性情報(光沢の光反射特性情報)が含まれている。該光反射特性情報を表す関数は双方向反射関数(BRDF)と呼ばれており、ある方向から光を照射したときにどの向きにどの程度光が反射するかを表す関数で、一般には入射方向と出射方向に依存した複雑な形となる。ただし知覚的には、光沢は強度及び幅でほぼ表現できることが知られているので、実用上はBRDFの光沢成分を強度及び幅の2つのパラメータを含むモデルで近似したときのそれぞれのパラメータの値を光反射特性情報としても差し支えなく、本実施形態においても光沢の強度及び幅を光反射特性情報とする。本実施形態では、表面反射特性情報は、以下に説明する表面反射特性測定装置(以下、測定装置という。)Aにより測定されるデータに基づいて算出される。
【0039】
図10に示したように、本実施形態の測定装置Aは、顔の光反射特性情報測定手段1Aと、顔の三次元形状情報測定手段1Bと、顔の法線情報測定手段1Cとを具備している。
【0040】
光反射特性情報測定手段1Aは、顔Fを臨む軌道上で移動可能に垂設され、顔Fに線状の光を照射する可動光源2と、前記軌道に沿って移動させながら可動光源2から顔Fに光が照射された状態を撮像するように配設された撮像手段3と、撮像手段3で撮像された顔Fの前記状態の画像データに基づいて、顔Fの光反射特性を求める情報処理手段4とを備えている。
【0041】
三次元形状情報測定手段1Bは、明暗の繰り返しからなる光学パターンを顔Fに投影する投影手段5を備えている。本実施形態では、撮像手段3は、顔Fに前記光学パターンが投影された状態を撮像するように配設されている。また、情報処理手段4は、撮像手段3で撮像された前記光学パターンが投影された状態の顔Fの画像データに基づいて、顔Fの三次元形状情報を求めるように設けられている。
【0042】
法線情報測定手段1Cは、定位置に固定され顔に光を照射する複数の固定光源6を備えている。本実施形態では、撮像手段3は、前記測定対象に前記各固定光源から光が照射された状態を撮像するように配設されている。また、情報処理手段4は、撮像手段3で撮像された固定光源6から顔Fに光が照射された状態の画像データに基づいて顔の法線情報を求めるように設けられている。
【0043】
<光反射特性情報測定手段1A>
測定装置は、可動光源2の位置移動、各固定光源6の点灯及び消灯、投影手段5による前記光学パターンの投影及び該光学パターンの切り替え、並びに撮像手段3での前記各状態の顔の撮像及び撮像された前記各状態の画像データの情報処理手段4への取り込みを制御する制御手段7を備えている。本実施形態では、情報処理手段4及び制御手段7は、情報処理手段4及び制御手段7として機能するコンピュータシステム(以下、単にコンピュータともいう。)8で構成されている。
【0044】
測定装置は、測定対象となる人が座った状態で収容できる空間を形成し、且つ可動光源2の軌道となる可動ステージ及び各固定光源6が取り付けられたフレーム9を備えている。
【0045】
可動光源2の光源は、その軌道上の任意の位置から、撮像手段3で撮像できる強度の光を測定対象に照射できるものであれば、その光源の種類に特に制限はないが、蛍光灯、発光ダイオードアレイ、ネオン管などが好ましく、さらには線光源の軸を中心に考えたときに放射光量の軸対象性に優れており、細い形態のものが容易に入手できることを考慮すると、ネオン管が好ましい。可動光源2の光源の長さは、測定対象を含んで余りある上下に充分な長さであればよい。
【0046】
可動光源2の軌道は、測定対象の外形、光源の形状、光源を動かす可動ステージの形態に応じて設定される。本実施形態では、可動光源2の軌道は、測定装置を平面視したときに測定対象に対して左右対称で且つ測定対象に対して開く略V字状の2本の軌道とされている。可動ステージとしては直線状に動かすものが容易に入手可能であり、それらを2つ組み合わせて測定対象を取り囲むように配置することで、可動光源2を測定対象の周囲で動かすことを実現している。可動光源をこのような略V字状の軌道に沿って移動させることによって、測定対象に向かって単に直線的に動かしたときには光沢を観察することができない部分からの光沢情報を得ることができる。なお、可動光源2の軌道は、曲線であっても良く、略円形であっても良い。
【0047】
本実施形態では、可動光源2は、測定対象の左側を移動する光源2Aと、測定対象の右側を移動する光源2Bとの二つの光源を備えている。測定開始時には、これらの光源は測定対象から見てそれぞれ左後方、右後方の定位置にある。ネオン管は点灯直後には光強度の安定性があまりよくなく、光源点灯直後は揺らぎは大きくなってしまうが、光源の強度の揺らぎは取得する光反射特性情報に強く影響を与える。そのため、これらの光源は装置起動時に点灯しておき、使用していない間は定位置に配置しておく。さらに、この定位置から測定対象を見込む方向には遮蔽板21A及び21Bを設置しておき、光源が定位置にある間は点灯していても測定対象を照らさないようにしておく。
【0048】
光源2A、2Bは、前記可動ステージに沿って移動するキャリッジ(図示せず)に取り付けられている。該キャリッジは、制御手段7に電気的に接続されており、その駆動手段が制御手段7によって制御されることによって、光源2A、2Bの所定の静止位置に応じて静止したり移動したりする。
【0049】
光源2A、2Bの測定対象への光照射のための静止位置の間隔は、光反射特性の精度を高める観点からは、短ければ短いほど良いが、それに伴い測定時間も増加するため、本実施形態のように、測定対象が人の場合など、ある場所に長時間静止し続けることが困難なものの場合は、実用上は測定時間との兼ね合いで決める。静止位置の間隔の上限は以下のようにして決める。測定対象の任意の部位の撮像手段からの見えに着目したとき、光源を移動させると光沢が認められる角度条件近傍では暗かったものが明るくなり、再び暗くなるという現象が見られる。静止位置の間隔の上限は、この明るくなる領域の幅に比べて充分に短くなる範囲で設定するのが好ましい。本実施形態においては、静止位置の間隔は前記可動ステージ上で1cmとした。
【0050】
撮像手段3は、測定対象である顔に対峙するように顔の略正面に固定される。撮像手段3は、前記各状態の測定対象である顔の全像を所定の画角に収めて撮像できるもので、充分な空間分解能を有するものであれば、特に制限はない。異なる露出で撮像できることが好ましく、さらに動画と静止画の何れも撮像できるものが好ましい。また、制御手段7によって、撮像及び撮像した画像を画像データ(電子データ)としてコンピュータ8への取り込みの制御が可能な、荷電結合素子(CCD)や相補型酸化物半導体(CMOS)素子を備えたビデオカメラが好ましい。可動光源2を連続的に移動させても、露出を異にしての一連の撮像の時間の間に光源の移動が殆ど起こっていないとみなせる程度に撮像手段が高速な場合には、光源は静止することなく移動させても構わない。また、撮像手段の光量に対するダイナミックレンジが光沢の強い部分に対応するのに充分な広さを持っており、かつ光量に対する分解能が光沢の弱い部分を表すのに充分な細かさを持っている場合には、異なる露出で撮像する必要はなく、単一の露出で撮像すれば充分である。
【0051】
撮像手段3は、後のデータ処理が簡単になるように、画素値が入射光量に対して線形になるものを用いており、さらに反射光量の大きなレンジに対応するために露出を変えて撮像できる機能を有している。
【0052】
<三次元形状情報測定手段1B>
投影手段5は、顔に白黒(明暗)の横縞の繰り返しからなる光学パターンを投影する装置である。投影手段5は、その投影位置から撮像手段3で撮像できる強度の光を任意のパターンで測定対象に投影できるものであれは、その種類に特に制限はないが、容易に安価に入手できること、投影パターンを容易に設定できることを考慮すると、コンピュータに接続可能な市販のプロジェクターが好ましい。また、投影手段5は、本実施形態のように投影する光学パターンを制御手段7において自動的に変更可能なものが好ましい。
【0053】
投影手段5の配置は、測定対象の測定したい領域中に投影パターンが投影されず影になってしまうことが起こらない範囲で、測定対象に対する撮像手段3の向きと投影手段5の向きがなるべく異なっていることが望ましい。鼻の影が発生しにくいこと、投影パターンが左右均等に投影されることを考慮すると、測定対象から見て撮像手段の下方に設置することが好ましい。
【0054】
光学パターンにおける明暗の幅の切り替えは、制御手段7において自動的に行われる。光学パターンにおける明暗の繰り返しをどこまで細かくするかについては、得られる形状の精度向上のためには細かければ細かいほど望ましいが、投影手段の分解能、撮像手段の分解能によって限界がある。目的を考慮すると、測定対象に投影される最も細かいパターンの繰返し幅を20mm以下とすることが好ましく、5mm以下とすることがより好ましい。投影手段及び撮像手段の分解能は、これを実現するのに充分な性能を有する必要がある。具体的には、例えば、投影パターンは空間を上下2分割したものから始めて順次分割数を倍に増やしていき、最終的には210(=1024)分割したものまでの10のパターンを投影する。
【0055】
<法線情報測定手段1C>
固定光源6の光源には、点光源が用いられる。固定光源6の光源は、その固定位置から撮像手段3で撮像できる強度の光を測定対象に照射できるものであれば、その光源の種類に特に制限はないが、点灯後すぐに強度が安定すること、耐久性に優れていることを考慮すると、発光ダイオード(LED)が好ましい。
【0056】
固定光源6の向きとそのときの撮像装置3に入ってくる光量の複数の関係からフィッティングを行って法線を求めることになるので、固定光源6の数は多ければ多いほど好ましく、さらに測定対象から見て均等に配置されていることが好ましい。一方で測定時間を短縮するためには光源の数は少ないほど好ましく、少ない数で効率的にデータを取得することを考慮すると、測定対象に対して前方に、測定対象を取り囲むようにリング状に配置することが好ましい。本実施形態においては、表面反射特性に必要な精度を確保するためには、固定光源6は9個で充分であった。
【0057】
固定光源6は、個々の光源が接続されるリレー回路(図示せず)を備えている。該リレー回路は、制御手段7に接続されており、制御手段7によって該リレー回路のオン・オフスイッチが制御されることによって、個々の光源が点灯・消灯する。
【0058】
測定装置においては、測定対象である顔と、撮像手段3及び各固定光源6との間に、それぞれ偏光子3A、6Aが配されている。ここで、これらの偏光子は、光源側の偏光子と、撮像手段側の偏光子とで、偏光面が互いに交差するように配置されている。ここで、偏光面が互いに交差するとは、光源から照射され測定対象にあたって反射し、撮像手段に入射してくる光の光量が最も小さくなる関係にあることをいう。撮像手段側の偏光子の向きを固定し、光源側の偏光子を回転させながら撮像手段から得られる映像が最も暗くなる条件を満たす光源側の偏光子の向きをもって交差しているとみなすことができる。測定対象に対して光源と撮像手段がほぼ同じ方向にある場合、それぞれの偏光子は直交することになる。この条件のとき、光沢は表面で一回のみ反射するため、光源側の偏光子を通り測定対象で反射した光沢の偏光の向きは保たれることになり、それと直交している撮像手段側の偏光子を通過することはできない。本実施形態では、一連の操作を簡単にするために、他の撮像時にも撮像手段側の偏光子を配置したまま撮像しているが、他の撮像に用いる各光源には偏光子が配置されておらず、そのとき撮像手段側に入ってくる光は殆ど偏光していないため、他の撮像には影響しないとみなせる。
【0059】
情報処理手段4及び制御手段7は、上述のように、これら各手段として機能するコンピュータ8で構成されている。コンピュータ8は、中央演算処理装置(CPU)、主記憶装置、補助記憶装置、入力装置、出力装置を備えたハードウェアと、基本ソフトウェア及び基本ソフトウェアと連動して下記ステップに従って測定装置に顔の表面反射特性を算出させるプログラムを備えたソフトウェアを具備している。コンピュータ8は、CPUが前記主記憶装置に保持された前記各プログラムを解釈してその指令内容を実行し、下記ステップに従ってコンピュータ8を前記情報処理手段4及び制御手段7として機能させる。
【0060】
<測定手法>
次に、前記測定装置による顔の表面反射特性の測定手法について図10〜図14を参照しながら説明する。
先ず、ステップS11(図11参照)において、制御手段7の制御下、投影手段5によって測定対象者の顔に前述の白黒の繰り返しからなる横縞の光学パターンが投影される。光学パターンの周期は、制御手段7によって連続的に変更され、その投影状態が撮像手段3によって連続的に撮像される。全ての光学パターンの投影状態を撮像した後、投影手段5による顔への光学パターンの投影が停止される。
【0061】
前記光学パターンが投影された状態の顔の投影画像データは、制御手段7の制御下、情報処理手段4に取り込まれる。
【0062】
次に、ステップS12(図11参照)において、各固定光源6が、制御手段7の制御下、所定の順番で1回ずつ点灯・消灯され、各固定光源6による顔の固定光源光照射画像が撮像手段3によって撮像される。全ての固定光源6による1回ずつの点灯・消灯が終わると、光源6の点灯・消灯が完了する。
【0063】
各固定光源6による顔の固定光源光照射画像は、電子データ(固定光源光照射画像データ、以下、固定光源画像データともいう。)として、制御手段7の制御下、情報処理手段4に取り込まれる。
【0064】
次に、ステップS13(図11参照)において、可動光源2の光源2Aが、制御手段7の制御下、顔の左後方の定位置から略V字状の軌道の尖端側まで移動し、その間において所定位置で静止し、顔の可動光源光照射画像が撮像手段3によって2種類の露出条件で撮像される。光源2Aによる光の照射及び撮影が終わると、光源2Aは左後方の定位置に戻り、その光は遮蔽板21Aで遮られる。次いで、光源2Bが、制御手段7の制御によってまず略V字状の軌道の尖端側に移動し、しかる後V字状の軌道の尖端側から顔の右後方まで移動し、その間において所定位置で停止し、顔の可動光照射画像が撮像手段3によって2種類の露出条件で撮像される。光源2Bによる光の照射及び撮影が終わると、光源2Bは定位置に戻り、その光は遮蔽板21Bで遮られる。
【0065】
光源2A、2Bによる顔の可動光源光照射画像は、電子データ(可動光源光照射画像データ、以下、可動光源画像データともいう。)として、制御手段7の制御下に情報処理手段4に取り込まれる。
【0066】
上述のようにして情報処理手段4に取り込まれた投影画像データ、固定光源光照射画像データ及び可動光源光照射画像データに基づいて、顔の表面光反射特性が情報処理手段4において以下のように求められる。
【0067】
即ち、ステップS14(図11参照)において、情報処理手段4が、該投影画像データに基づいて顔の三次元形状情報(三次元基準座標における座標情報)を演算する。測定対象に光学パターンを投影して三次元形状情報を得る方法には、光切断法、イメージエンコーダ法などがあるが、装置及び解析プログラムの構成を比較的簡単にできることから、前記投影画像データから三次元形状情報を算出する空間コード化法が好ましい。
【0068】
本実施形態の測定装置において、上記三次元形状情報は、本実施形態では、空間コード化法(Valkenburg,R.J., et al., 1998, Accurate 3D measurement using a structured light system. Image and Vision Computing 16, 2, 99-110)によって求められる。
【0069】
投影手段5は、1回目に上半分が暗、下半分が明のパターンを投影する。撮像手段から見える測定対象の中で、暗の状態になっている領域は上半分の空間に属し、明の状態になっている領域は下半分の空間に属していることになる。2回目に上半分、下半分をそれぞれ二分して上から順に暗−明−暗−明なる光学パターンを投影したとき、1、2回目共に暗となった領域は1番上の四分の一、1回目に暗、2回目に明となった領域は上から2番目の四分の一といったように、測定対象の各位置が属している空間を絞り込むことができる。
このことを利用して具体的には、以下のようにして形状を求める。図12に示したように、撮像された一連の画像を元に、測定対象の各位置の状態を2進数で表す。一の位は、1回目のパターンを投影したときに撮像された画像で着目している位置が暗の状態のとき0、明の状態のとき1とする。十の位は、2回目のパターンを投影したときに撮像された画像で着目している位置が暗の状態のとき0、明の状態のとき1とする。以下、3回目のパターンを投影したときの画像と百の位、4回目のパターンを投影したときの画像と千の位というように対応させていく。これを続けていくと、撮像手段3に映し出される測定対象の各微小面に対して一つの2進数が対応することになる。この結果得られる2進数はそれぞれ、空間を横向きに薄く切断していったときの一つと対応する。一方で、測定対象のある微小面が撮像された画像のあるピクセルに現れたとき、当該微小面はそのピクセルに対応する、撮像装置から延びる直線上のどこかに属することになる。先に述べた薄く切断された空間を平面と近似した場合、得られた2進数と対応するピクセルの位置から、前記平面と前記直線の交点として測定対象の当該微小面の空間的な位置を求めることができる。
【0070】
次に、ステップS15(図11参照)において、情報処理手段4が、該固定光源画像データ及び前記三次元形状情報に基づいて顔の法線情報を演算する。測定対象の法線を求める方法としては、三次元形状の各面の傾きから求める方法等が挙げられる。測定精度を考慮すると、法線を形状とは別の方法で求めることが望ましく、具体的にはフォトメトリックステレオ法が好ましいが、装置規模の小型化を考慮すると、前記固定光源画像データ及び前記三次元形状情報から、修正フォトメトリックステレオ法を用いるのがより好ましい。以下にその具体的な方法を説明する。
【0071】
本実施形態の測定装置において、前記法線情報は、法線情報の算出方法(Woodha, R.J. 1980. Photometric method for determining surface orientation from multiple images. Optical Engineering 19, 1, 139-144)を元にした方法によって求められる。この算出方法において、法線情報は、具体的に以下のようにして求められる。
【0072】
前記固定光源画像データの任意の点(座標)の法線を、顔全面に亘って、以下のようにして求める。
【0073】
各光源6(本実施形態では9個)がそれぞれ点灯したときの固定光源画像データにおける任意の点の強度をIn(n=1〜9)とし、着目点の法線ベクトルをNとする。また、着目点に対する各光源の方向ベクトルをDn(n=1〜9)とする。さらに、各光源6と着目点との距離をLn(n=1〜9)とする。また、光の強度が、その点の法線と光源の向きとの内積に比例する(ランバーシアン(Lambertian))と仮定すると、光の強度の理論値Itnは、その点の法線ベクトルNとその点からの光源への方向ベクトルDnとによって、下記式(2)で表される。ただし、cは定数であり、単位系の取り方や光源の強度、撮像手段の露出条件などにより決まる。また、max(a,b)は、a、bの何れか大きなほうの値をとることを意味する。また、dot(A,B)は、ベクトルAとベクトルBの内積を表す。右辺を除するLn2は、光源から発せられた光の距離による減衰の効果を表している。
Itn=max(0,c×dot(N,Dn))/Ln2 (nは1〜9) (2)
そして、Nをフィッティングパラメータとしたときに、この式の値が実測と最も近いときのNの値が真値であると考え、Σ(In − max(0,c×dot(N,Dn))/Ln22が最小となるように、最小自乗法によって、法線ベクトルNを求める。
【0074】
上述のようにして求められた三次元形状情報及び法線情報は、ステップS16(図11参照)において、ハイブリッド法と呼ばれる修正処理によってさらに修正されることが好ましい。この修正によって、三次元形状情報と法線情報の整合性が確保でき、さらに三次元形状情報と法線情報の正確さが向上する。異なる方法で得られた三次元形状情報及び法線情報の整合性を確保し、正確さを向上させる方法は現時点ではハイブリッド法が唯一の方法であるが、今後新しい方法が開発された際にはそのような方法で置き換えても良い。
【0075】
本実施形態の測定装置Aでは、前記三次元形状情報及び法線情報の修正方法として、ハイブリッド法(Nehab,D.,Rusinkiewicz, et al., 2005, Efficiently Efficiently combining position and normals for precise3D geometry. ACM Transactions on Graphics 24, 3, 536-543.)によって行われる。
【0076】
具体的には、図13に示すように、前記三次元形状情報におけるあるピクセル近傍での形状に着目したとき、該ピクセル及びそれと接している上下左右のピクセルで形成される4つの三角形を考える。それぞれのピクセルには3次元空間での位置情報が含まれているので、各三角形の法線ベクトルを求めることができる。各三角形の法線ベクトルを平均したものを該ピクセルでの法線ベクトルN’とする。このようにして求めた法線ベクトルN’は、当該文献中にも指摘されている通り、法線ベクトルNに比べて高周波成分は精度が低く、低周波成分は精度が高いので、正確さを増すためにNの高周波成分とN’の低周波成分を組み合わせて新しい法線ベクトルとする。具体的には、先ず細かな変化の情報が失われるように法線ベクトルN’を平滑化し、その結果をNs’とする。平滑化には一般的なガウシアンフィルタを用いるが、そのフィルタの幅(すなわちカットオフ周波数)は測定対象の凹凸の細かさの程度に応じて最適な値が異なることになるので、平滑化の出力を見ながら毛穴や細かなシワに由来すると思われる構造が失われ、かつ全体の平均的な形状が歪まない値を予め選んでおく。この条件は、例えば測定対象が人の顔であれば細かな凹凸の空間周波数はあまり変わらないので、ある人の顔に関して一旦この値を選んでおけば、別の人の顔を計測する際にも同じ値を使用して構わない。本実施形態においては、1024×678ピクセルに測定対象全体が含まれる条件で撮像して取得したデータに対して、分散値が12となるガウシアンフィルタを用いて平滑化を行っている。法線ベクトルNも法線ベクトルN’と同じ平滑化条件で平滑化し、その結果をNsとする。そして、得られた平滑化法線ベクトルNsを法線ベクトルNに一致させる回転変換を、各点について求め、この回転変換を前記平滑化法線ベクトルNs’に適用し、法線ベクトルN”を求める。
【0077】
次に、測定対象である顔の実形状を想定し、それと実測値すなわち前記三次元形状情報及び法線ベクトルN”との誤差が最小となるように形状を修正する。具体的には、実形状として最もありうる形状を修正形状情報としたときに、該修正形状情報と前記三次元形状情報との誤差の自乗和と、修正形状情報から求めた修正法線情報と前記法線ベクトルN”との誤差の自乗和との重み付けした和が最小となるように、修正形状情報及び修正法線情報(修正法線ベクトルN)を求める。重み付けの値は、測定系や測定対象により異なるので、予め当該ステップがうまく機能するように、値を設定しておく。
本実施例において、以後使用する前記顔の光反射特性情報及び前記顔の法線情報はそれぞれ、ここで求めた前記修正形状情報及び前記修正法線情報を指す。
【0078】
次に、ステップS17において、情報処理手段4が、該可動光源画像データに基づいて顔の光反射特性情報を求める。
情報処理手段4によって求められる光反射特性情報は、双方向反射関数(BRDF)またはそれから派生する様々な特徴量を取り得るが、本実施例においては特に、照射される光の強さが一定である場合における、光沢の強度及び幅を言い、具体的には、以下のようにして求められる。
【0079】
先ず、予め可動光源の光源2A、2Bが点灯したときに、各光源をm個の仮想点光源の連続体として近似したときに、一つの仮想点光源から発せられる光が空間中のどの方向にどれくらいの強度で放射するかを計測しておく。即ち、一つの仮想点光源に相当する長さの要素以外を遮蔽し、そのとき各方向に放射される光量を計測する。本実施例においては取り扱いを簡単にするために、光源の特性が線光源の軸に対して軸対象で、線光源中の各要素の放射特性は光源の部分によらず(中央部でも端部でも)一定であることを仮定した。各光源を高さ方向にm個の単位に分割したときにおける各分割単位に対する方向及び強度を計測する。分割単位の個数mは、光源の長さ、測定対象の大きさ、光源と測定対象の距離などに応じて設定され、精度向上の点ではmは大きければ大きいほど好ましいが、一方で計算コストが上昇してしまうことから、総合的には精度を悪化させない範囲で小さいことが好ましく、本実施形態の場合では、mは100程度であることが好ましい。
【0080】
次に、顔の光反射特性が、Torrance−Sparrowモデル(以下、TSモデルという。)に従うと仮定する。
即ち、光反射率fは、皮膚の屈折率をn、光沢の強度をα、広がりをMとすると、下記式(3)により求められるとする。
f=α×(F・G・D)/(4cosθicosθr) (3)
ただし、フレネル項Fは、垂直入射に対しては下記式(4)、垂直入射以外は、式(5)で表される。
F=(n−1)2/(n+1)2 (4)
F=(1/2)〔tan2(θi−θt)/tan2(θi+θt)+
sin2(θi−θt)/sin2(θi+θt)〕 (5)
また、表面粗さ項Dは、下記式(6)で表される。
D=exp(−tan2β/M2)/πM2cos4β (6)
また、形状項Gは、下記式(7)で表される。ここで、min(a,b,c)はa,b,cの中で最も小さい値を意味する。
G=min(Gs,Gm,1) (7)
ここで、 Gs=2(N・H)・(N・S)/(S・H)
Gm=2(N・H)・(N・V)/(V・H)
H=(S・V)/|S・V|
θi=acos(dot(N,S))
θr=acos(dot(N,V))
(dot(A,B)は、ベクトルAとベクトルBの内積)
θt=asin(sinθi/n)
(nは皮膚表面の屈折率)
であり、Nは、修正法線ベクトル、Sは光源方向の単位ベクトル、Vは撮像手段方向の単位ベクトル、HはSとVを2等分する単位ベクトル、βはNとHが成す角度、θiは入射角、θrは受光角、θtは屈折角である。
【0081】
次に、前記可動光源画像データの顔の表面に対応する各点に対して、光反射特性を、次のようにして、顔の全面に亘って求める。
即ち、先ず、顔の中のある点に着目し、可動光源がそれぞれの静止位置(P1〜Pnのn箇所)において光を照射したときの該点の画像の明るさ(実測値)I1〜Inを求める。
そして、可動光源がそれぞれの静止位置に来たときの該点に照射される光の各前記仮想点光源の向きV11〜V1m〜・・・〜Vn1〜Vnmと光量L1(V11)〜・・・〜L1(V1m)〜Ln(Vn1)〜・・・〜Ln(Vnm)を前記計測した方向及び強度のデータから求める。
【0082】
次に、可動光源の各光源が所定の静止位置において光を照射したとき画像の明るさIc1〜Icnを、TSモデルに従うと仮定してV11〜Vnm及びL1(V11)〜Ln(Vnm)から求める。この計算結果には、光沢の強度と幅を表す変数(光反射特性情報)α、Mが含まれているので、図14に示すように、Ic1〜Icnが実測値のI1〜Inと最も一致するように、変数α、Mを変数としてシンプレックス法を用いてフィットさせ、光反射特性情報α、Mを求める。ここで前記実測値I1〜Inは、2種類の露出条件で撮影した画像から値を読み取る。具体的には、あらかじめ明るい露出条件で撮影した画像の画素値が同じ場所を暗い露出条件で撮影したときに比べて何倍になるか係数Cとして求めておく。そして、暗い露出条件で撮影したj番目の静止位置における画像の該画素値がI1j、明るい露出条件で撮影したj番目の静止位置における画像の該画素値がI2jであったとき、画像中の明るい領域(明るい露出条件では画素値が飽和してしまう領域)ではIj=C×I1j、暗い領域ではIj=I2jとする。
【0083】
上述のように求めた光反射特性情報α、Mのマップの中で、鼻の陰になってしまう等の影響で明らかに数値が正しくない場合には、その値を破棄し、周囲の値で補間する。このようにして求められた表面反射特性情報は、CPU10Aによって、ファイル装置10FからGPU10C内の処理用データ記憶領域に記憶される。
【0084】
図4〜図7におけるS3〜S8のリアルタイム処理に先立ち、CPU10Aは、プログラム100における人物画像抽出処理機能102、追跡処理機能103、合成顔画像情報処理機能105、肌情報処理機能106、陰影成分情報処理機能107、顔画像合成処理機能108、人物背景合成動画像合成処理機能109、動画像表示処理機能110をGPU10Cのプログラム領域にロードする。
【0085】
本実施形態では、人物実動画像を取り込んでリアルタイム処理を行うため、人物実動画像入力装置10Kは、IEEE1394インターフェースを介してコンピュータに接続されたビデオカメラで構成される。該ビデオカメラは、画素の縦横比、周辺部での歪みなど、各機種固有の特性を相殺させるため、背景実動画像入力装置10Lで用いたビデオカメラV1と同一機種のビデオカメラを用いるのが好ましい。人物の撮像に際しては、図15に示すように、ビデオカメラV3のレンズに偏光板P3を取り付ける。また、人物を照らす照明L3にも偏光板P3を取り付ける。人物の背後には、従来からクロマキー合成処理を行うために使用されているスクリーン(緑色又は青色)SCを配する。撮像したときに画像上で単一色に映るように、照明L3の向きやスクリーンSCの張り方に配慮する。人物は、顔以外の部分(首から下及び髪の毛)を黒くて光沢があまり出ない衣装で覆う。これは、後述するように、顔の皮膚領域の処理のみを行うので、処理の結果得られる合成映像のうち、人物画像で顔以外の部分が、顔との対比で不自然に見えないようにするためである。前記人物実動画像の冒頭には、後述する追跡処理に使用するために、ビデオカメラV3に対して顔を正対させて静止させた状態の画像(正面画像)を一定時間(数秒間)撮像することが好ましい。
【0086】
図4に示すように、先ず、データ入力・記憶処理ステップS1’において、CPU10Aが、プログラム100におけるデータ入力・記憶処理機能101により、撮像された人物動画像を人物実動画像入力装置10Kからコンピュータ10に取り込む。取り込まれた人物動画像は、後述するGPU10Cによるリアルタイムの画像処理に使用される。
【0087】
画像合成処理装置1では、人物画像抽出処理ステップS3(図4参照)において、GPU10Cが、あらかじめロードされたプログラム100における人物画像抽出処理機能102を実行し、前記人物実動画像入力装置10Kから取り込まれた前記人物実動画像の各フレーム画像から人物画像のみを抽出する。人物画像のみの抽出処理は、従来からクロマキー合成処理において行われている通常の手法で行われ、人物領域と背景のスクリーン領域とを特定の画素値を閾値として分離して抽出し、抽出した人物画像をGPU10C内の処理用データ記憶部の領域に記憶させる。前記抽出は具体的には、前記人物実動画像のフレーム画像を記憶させると共に、前記フレーム画像に対して、対応するピクセル値が、背景では0、人物領域では1となるようなマスク画像を作成して記憶させ、前記フレーム画像を取り出す際に、前記マスク画像も合わせて参照することで実現する。
【0088】
画像合成処理装置1では、追跡処理(トラッキング処理)ステップS4(図4参照)において、GPU10Cは、プログラム100における追跡処理機能103を実行し、GPU10C上の記憶領域に記憶された前記人物画像及び前記顔の三次元形状情報に基づいて、前記人物の顔画像及び前記人物の顔の追跡情報を求める。
【0089】
本実施形態においては、前記人物の顔の追跡情報は、パーティクル・フィルタリング(Oka,K.,and Sato,Y. 2005. Real-time modeling of face deformation for 3-d head pose estimation. In Proceedings of the IEEE International Workshop on Analysis and Modeling of Faces and Gestures, 308-320.)に基づいて、以下のようにして求められる。ただし、本実施形態では、処理を簡素化するために、顔の表情による形状の変化は考慮されていない。より自然な結果を得るためには、顔の表情による形状の変化を考慮することが好ましい。
【0090】
先ず、追跡処理に使用するための顔画像における特徴点の初期座標を取得するために、GPU10Cは、前記GPU10C上の記憶領域に記憶された前記人物画像の最初のフレームを表示装置10Gの画面上に表示させるとともに、前記GPU10C上の記憶領域に記憶された前記顔の三次元形状情報に基づいて、予め設定した人物の顔を正面から見たときの特徴点(の一群)を表示装置10Gの画面上に表示させる。顔の特徴点としては、左右両目の目頭、目尻、鼻孔、唇の境界位置、眉頭、眉尻等が挙げられる。本実施形態では、処理の簡素化と追跡情報の精度を考慮し、前記特徴点として、左右両目の目頭、目尻、及び両鼻穴、唇の上下左右境界の位置、計10点の特徴点が設定されている。本実施形態のプログラム100においては、特徴点の一群は、表示装置10Gの画面上において、入力装置10Iによる平行移動、拡大縮小表示が可能とされており、前記人物の画像との位置合わせが精度良く行われる。
【0091】
オペレータは、前記入力装置10Iによって前記特徴点の一群を平行移動又は拡大縮小し、前記人物の画像中の特徴点に対応する座標とを位置合わせする。位置合わせが済むと、オペレータは、前記入力装置10Iからの入力操作によってCPU10Aにその旨の信号を送る。この信号を受けると、CPU10Aが、画像上での特徴点の位置情報をGPU10Cに送る。それを受けたGPU10Cは、各特徴点に対応する位置近傍の画像を取得し、それをテンプレートとして特徴点の位置情報と合わせて記憶領域に記憶する。GPU10Cは、前記信号をトリガーとして、図16にフローチャートで示す追跡処理を開始する。
【0092】
前述のように、本実施形態では、顔の表情による変化を考慮しないことから、前記人物の画像中の顔の位置の移動は、平行移動(3次元)と回転(3次元)の6次元による表記が可能となる。
GPU10Cは、前記GPU10C上の記憶領域に記憶された前記人物の画像中の二つ前及び一つ前のフレーム画像の顔における前記特徴点の位置情報から、現在のフレーム画像の顔の位置情報として考えられる候補を複数用意する。候補は、顔が加速しなかったときに予想される位置を中心に選ばれる。
【0093】
前記中心は、具体的には、次式(8)で表される。
(現在フレーム画像における位置・回転の値)=(一つ前のフレーム画像における位置・回転の値)+((一つ前のフレーム画像における位置・回転の値)−(二つ前のフレーム画像における位置・回転値)) (8)
ただし、式(8)の右辺第2項は顔の動きの速度に関する項である。追跡処理開始時には、二つ前のフレーム画像の各値は取得できないので、速度に関する項が0とされる。
【0094】
GPU10Cは、揺らぎ幅が前記速度に関する項の値に比例するようなガウスノイズ(乱数)を発生させ、それを前記中心に加算することで、前記候補として、前記中心を中心に複数の位置情報を用意する。揺らぎ幅が一定値以下になったときには、揺らぎ幅をその値とすることで、速度に関する項が0でもガウスノイズが発生するようにされている。
【0095】
GPU10Cは、前記候補に対して、特徴点付近の画像と前記テンプレートとの一致度πを求める。一致度πは、ある候補に対して、前記特徴点付近の画像と前記テンプレートとを、特徴点ごと、ピクセルごと、RGBのチャネルごとに引き算を行い、各ピクセルの差異の自乗和を求め、さらにそれの逆数を求めたものを指す。一致度πは、具体的には、下記式(9)で表される。
π=1/Σ(Ir(x,y,λ)−It(x,y,λ))2 (9)
ここで、x、yは画像中のピクセルの座標、λはR/G/Bのいずれか、Ir(x,y,λ)は人物実動画像の該ピクセル、該チャネルの画素値、Itは前記候補の動きに従ってテンプレートを動かしたときの前記人物実動画像の該ピクセルに対応する位置のテンプレート上のピクセルの該チャネルの画素値、Σはテンプレートの存在する全ピクセル及び
全チャネルにわたる総和を表す。
【0096】
前記人物実動画像中の各ピクセルに対して対応するテンプレートの有無をマスク画像で表すこともでき、対応するテンプレートがあるピクセルの値を1、ないピクセルの値を0としてマスク画像を作成した上で、前記一致度πの計算式(9)は、下記式(10)で表される。
π=1/Σ(マスク画像(x,y)×(Ir(x,y,λ)−It(x,y,λ))2
) (10)
ここで、Σは画像中の全ピクセルにわたる総和を表す。
この値が大きければ大きいほど特徴点付近の画像と前記テンプレートとが一致していることになる。
【0097】
前記6次元のうち、ある次元xに着目すると、i番目の候補の次元xの値をb(i,x)、前記一致度をπ(i)としたとき、現在フレーム画像における次元xの値は、次式(11)で求められる。
b(x)=Σb(i,x)π(i)/Σπ(i) (11)
ここで、Σは選んだ候補全てにわたる総和を表す。
【0098】
画像合成処理装置1では、肌情報処理ステップS5(図4参照)において、GPU10Cは、あらかじめロードされたプログラム100の肌情報処理機能106を実行し、前記GPU10C上の記憶領域に記憶された人物実動画像の各フレーム画像から、色成分情報及び陰影成分情報からなる肌情報を求める。本実施形態では、該肌情報は、Norimichi,T., Ojima,N., Sato,K., Shiraishi,M., Shimizu,H., Nabeshima,H., Akazaki,S., Hori,K., and Miyake,Y. 2003. Image-based skin color and texture analysis/synthesis by extracting hemoglobin and melanin information in the skin. ACM Transactions on Graphics 22, 3, 770-779.等で述べられている下記のような主成分分析法に基づいて、求められる。
【0099】
RGBチャネルの各値の対数をとり、その符号を反転させたR’=−log(R)、G’=−log(G)、B’=−log(B)からなる3次元空間を考え、この3次元空間に、撮像した肌の画像の各ピクセルの値を射影すると、肌の色は前記3次元空間中の、ある色成分平面上にほぼ集まることが知られており、また、この色成分平面からのズレは肌の各部位における照度のムラ、つまり陰影により生じることも知られている。本実施形態では、このことを利用して前記各フレーム画像から、次のようにして色成分情報と陰影成分情報を分離する。
【0100】
先ず、統計的手法により、前記3次元空間上での前記色成分平面を求める。この統計的手法は具体的には主成分分析法及び/又は独立成分分析法を採用することができる。本実施形態では、計算結果が安定して求まることなどから、主成分分析により主成分を求める。具体的には、前記3次元空間に射影した肌の各ピクセルの値に対して主成分分析を行い、その第一主成分ベクトル及び第二主成分ベクトルにより張られる平面を前記色成分平面とする。陰影の効果はRGBの値それぞれにRGBによらない値を乗じることで表せることから、第三のベクトルとして、(1,1,1)なる陰影単位ベクトルを選び、前記3次元空間をこれら3つのベクトルを軸とする斜交座標系で表す。
【0101】
対象となる人物の肌の色を色黒、色白にするなどの画像効果を実現するためには、前記斜交座標系における前記色成分平面上への前記各ピクセルの値の射影に対してさらに独立成分分析を行い、2つの独立成分ベクトルを求め、それらを前記第一、第二主成分ベクトルの代わりに用いることが好ましい。この2つの独立成分ベクトルは、肌の色をもたらす2種類の色素、即ちメラニン色素及びヘモグロビン色素に対応し、例えばメラニン色素に対応する軸のスケール変換を行うことで、その後逆変換を行うと、肌の色を自然な色合いに保ちながら色黒にしたり色白にしたりすることができる。このことは前記独立成分分析法に関する文献に詳細に述べられている。
【0102】
前記各ピクセルの値は、相対的に比較できれば充分なので、前記斜交座標系の取り方及びその原点の取り方には任意性があるが、非負であったほうが画像データとして扱いやすく、また肌の色を変える等の用途への拡張を考慮すると、本実施形態では、主成分分析を行った後、独立成分分析によりメラニン色素軸、ヘモグロビン色素軸を求めた上で、図17のように、肌の色の各ピクセルの値に各3成分の最小値が0より小さくならないようにオフセットを設けることが好ましい。前記独立成分ベクトル及び前記オフセットは、事前に数例のテスト撮影を行い、それら画像の解析から求めておく。
このようにして求められた座標系により、人物の顔画像の各フレーム画像から、色成分情報と陰影成分情報を分離し、これらの情報からなる肌情報を求め、該情報をGPU10C内の処理用データ記憶領域に記憶する。
【0103】
画像合成処理装置1では、合成顔画像情報処理ステップS6(図5参照)において、GPU10Cは、あらかじめロードされたプログラム100の合成顔画像情報処理機能105を実行し、前記GPU10C上の記憶領域に記憶された前記顔の表面反射特性情報における顔の法線情報、前記各ステップで求められた前記顔の追跡情報及び前記光環境情報における前記点光源の位置、強度情報(光量)に基づいて、図18に示すように、フレーム毎に前記顔の陰影情報を求める。
【0104】
前記各フレーム画像上の任意のピクセルに対して、その位置における顔表面の法線ベクトルをN、そこから見たときの各点光源の方向ベクトルをS(i)、各点光源の強度をI(i)としたとき、そのピクセルの照度に比例した値、即ち陰影成分情報Lは、次式(12)で表される。
L=Σdot(N,S(i))I(i) (12)
ここで、Σは全ての点光源(n個の点近似光源)にわたる総和、dot(A,B)はA
とBの内積を表す。後に計算する陰影を取り除いた肌情報にこれを乗ずることで、陰影を考慮した肌色を求めることができる。
【0105】
画像合成処理装置1では、合成顔画像情報処理ステップS6において、GPU10Cはプログラム100の合成顔画像情報処理機能105を実行し、前記GPU上の記憶領域に記憶された前記顔の表面反射特性情報、前記各ステップで求められた前記顔の追跡情報及び前記光環境情報に基づき、前記顔の表面反射情報を求める。ただし、本実施形態では、ここでも、顔の光反射特性情報がTSモデルに従うと仮定して、顔の表面反射情報が求められる。
【0106】
TSモデルは、前述と同様に、皮膚の屈折率をn、光沢の強度をα、広がり(幅)をMとしたときに、光反射率fが下記式(13)により求められるとするものである。
f=α×(F・G・D)/(4cosθicosθr) (13)
ただし、Fはフレネル項、Gは形状項、Dは表面粗さ項である。
フレネル項Fは、垂直入射に対しては下記式(14)、垂直入射以外は、下記式(15)で表される。
F=(n−1)2/(n+1)2 (14)
F=(1/2)〔tan2(θi−θt)/tan2(θi+θt)+
sin2(θi−θt)/sin2(θi+θt)〕 (15)
また、表面粗さ項Dは、下記式(16)で表される。
D=exp(−tan2β/M2)/πM2cos4β (16)
また、形状項Gは、下記式(17)で表される。ここで、min(a,b,c)はa,b,cの中で最も小さい値を意味する。
G=min(Gs,Gm,1) (17)
ここで、 Gs=2(N・H)・(N・S)/(S・H)
Gm=2(N・H)・(N・V)/(V・H)
H=(S・V)/|S・V|
であり、Nは、修正法線ベクトル、Sは光源方向の単位ベクトル、Vは撮像手段方向の単位ベクトル、HはSとVを2等分する単位ベクトル、βはNとHが成す角度、θiは入射角、θrは受光角、θtは屈折角である。θtは皮膚の屈折率をnとして次式(18)から求める。ここでも、前述したとおり、法線ベクトルはハイブリッド法で修正した修正法線ベクトルを用いる。
n=sinθi/sinθt (18)
【0107】
前記顔の実動画像の各フレーム画像上の任意ピクセルに対して、その位置における顔表面の法線ベクトルをN、そこから見たときの各点光源の方向ベクトルをS(i)、各点光源の強度をI(i)、そこから見たときのカメラの方向ベクトルをVとしたとき、そのピクセルの光反射率Fは次式(19)で表せる。ただし前記各点光源は、前記光環境情報処理手段によりフレームごとに求めた近似点光源のうち、前記顔の実動画像のフレームに対応したもののことで、前記光環境情報として格納されている。
F=Σf(i) (19)
ただし、Σは全ての点光源にわたる計算値の総和、f(i)はi番目の点光源に対して
TSモデルに従って求められる反射光量の値である。i番目の点光源に対する反射光量は、前記TSモデルの定義式中の各入力パラメータとして、SにS(i)、cosθi=dot(N,S)、cosθr=dot(N,V)、α、Mとして前記顔の表面反射特性の該位置の強度、広がりを代入して求めることができる。
【0108】
画像合成処理装置1では、顔動画像合成処理ステップS7(図6参照)において、GPU10Cは、あらかじめロードされたプログラム100の陰影成分情報処理機能107兼顔画像合成処理機能108を実行し、前記肌情報、顔の陰影情報、及び顔の表面反射情報に基づいて、前記顔の合成画像を合成する。
【0109】
本実施形態では、図19に示すように、前記陰影成分情報にローパスフィルタをかけたものを低周波陰影成分情報とし、前記陰影成分情報を低周波陰影成分情報で除した結果を前記陰影成分情報の高周波陰影成分情報とする。前記高周波陰影成分情報は、各情報の取得方法の相違により生じる、顔の色成分(ヘモグロビン成分、メラニン成分)情報と顔の陰影成分の間で高周波での周波数特性が異なってしまうことにより合成画像が不自然になることを防ぐために用いられる。
本実施形態では、前記顔の陰影情報と前記陰影成分情報の高周波陰影成分情報とを乗じたものを最終的な顔の陰影情報とし、これを前記独立成分分析法で求めた陰影成分情報に代えて、メラニン成分情報、ヘモグロビン成分情報と共に、前記独立成分分析法で行った変換の逆変換を行うことで、陰影を考慮した色成分情報を得る。この結果に、前記顔の表面反射光成分情報を加算する。加算する前に、各々の画像には、最終的に背景と合成したときに自然な画像となるように、適切な定数を乗じておく。この定数は、表面反射情報を求めるプロセスと色成分情報を求めるプロセス、及び背景画像を取得するプロセスの各プロセスの結果画像それぞれの単位画素値が表す光量が異なるために必要となる。
【0110】
画像合成処理装置1では、人物背景合成動画像合成処理ステップS8(図7参照)において、GPU10Cは、プログラム100の人物背景合成動画像合成処理機能109を実行し、前記各ステップで求めた前記顔の合成画像及び前記人物画像、並びに前記ファイル記憶装置10Fに記憶された前記背景実動画像に基づいて、人物背景合成動画像(最終合成画像)を合成する。具体的には、顔の合成画像とそれに対応する前記人物実動画像中の1フレーム画像、及び前記背景実動画像の対応する1フレーム画像をフレームごとに順次合成した後、連結して動画像にする。そして、この人物の合成動画像、前記人物画像及び本実施形態では、図20に示すように、前記顔の合成画像の背景に相当するスクリーンSCの領域を、前記背景実動画像と差し替えることで最終的な合成画像を得る。
【0111】
以上説明したように、本実施形態の画像合成装置及び方法では、合成の対象とする人物実動画像と、これとは別に撮像される背景実動画像とを合成するに当たって、予め該人物の顔について前記顔の表面反射特性情報を求めておくとともに、前記背景実動画像の撮像とともに該背景の光環境実動画像を撮像しておき、該顔の表面反射特性情報と、前記光環境実動画像から光源を点近似して求めた光環境情報と、前記人物実動画像から抽出した顔の追跡情報とをリアルタイム処理により合成して顔の陰影情報及び顔の表面反射情報を求め、これらの各情報と、前記人物の顔画像から求めた肌情報及び高周波陰影成分情報とともに合成した上で、前記背景実動画像と合成するので、人物と背景の動画像における照明条件を略同じにすることができ、あたかも同じ場所で撮像されたと同様の自然な動画像を得ることができる。
【0112】
本発明は、前記実施形態に制限されない。
例えば、画像合成に使用する表面反射特性情報は、他の方法で得られた情報を採用することができる。
【0113】
また、肌情報処理手段では、前記色成分平面を導くための解析手法として主成分分析法に変えて、独立成分分析法を用いることができる。また光環境情報処理手段では、光環境実動画像を適切に変換できれば、点光源の代わりに面光源、線光源などを使ってもよい。各情報取得、処理を工夫することで、顔の色成分(ヘモグロビン成分、メラニン成分)情報と顔の陰影成分の間で周波数特性を一致させることができれば、陰影成分の高周波陰影成分情報は使わなくても良い。
【0114】
本発明の表面反射特性測定装置の測定対象に特に制限はない。顔以外の身体の各部位の表面反射特性の他、物品の表面反射特性を測定することができる。
【0115】
本発明により得られる人物背景合成動画像は、例えば、アミューズメント施設におけるアトラクション、テレビなどにおけるリアルタイム合成処理等に利用される。
【図面の簡単な説明】
【0116】
【図1】本発明の画像合成装置の一実施形態の概略を示すデータフローを含むブロック図である。
【図2】本発明の画像合成装置の一実施形態を汎用のコンピュータに適用したブロック図である。
【図3】本発明の画像合成方法の処理ステップを示すデータフロー図である。
【図4】本発明の画像合成方法の処理ステップを示すデータフロー図である。
【図5】本発明の画像合成方法の処理ステップを示すデータフロー図である。
【図6】本発明の画像合成方法の処理ステップを示すデータフロー図である。
【図7】本発明の画像合成方法の処理ステップを示すデータフロー図である。
【図8】本発明の画像合成方法において背景実画像及び光環境実動画像の撮像に使用される撮像手段の模式図である。
【図9】本発明の画像合成方法において使用される光環境情報を求めるための光源の点近似方法におけるフローを示す図である。
【図10】本発明の画像合成方法において使用される表面反射特性の測定装置の一実施形態を示す模式図であり、(a)は平面図、(b)は側面図である。
【図11】前記実施形態の表面反射特性測定装置における測定手順の概略を示すフローチャートである。
【図12】前記実施形態の表面反射特性測定装置の情報処理手段における、空間コード化法による三次元形状情報の算出ステップを説明するための図である。
【図13】前記実施形態の表面反射特性測定装置の情報処理手段における、ハイブリッド法による三次元形状情報及び法線情報の修正ステップを説明するための図である。
【図14】前記実施形態の表面反射特性測定装置の情報処理手段における、シンプレックス法による光反射特性情報の算出ステップを説明するための概念図であり、(a)は撮像される一連のフレーム画像、(b)は一連のフレーム画像中の特定の位置に着目したときの画素値のグラフ(点)と、反射強度及び幅をパラメータとしてフィッティングを行った結果グラフ(破線)とを示す図である。
【図15】本発明の画像合成方法において人物実動画像の撮像に使用される装置を示す図であり、(a)は平面図、(b)は側面図である。
【図16】前記実施形態の画像合成方法における追跡処理ステップを説明するフローチャートである。
【図17】主成分分析法及び独立成分分析法によって人物の顔画像から色成分情報(ヘモグロビン成分とメラニン成分)と陰影成分情報からなる肌情報を求めるステップを説明する概略図である。
【図18】前記実施形態の画像合成方法における合成顔画像情報処理ステップを説明するフローチャートである。
【図19】前記実施形態の画像合成方法における顔画像合成処理ステップを説明するフローチャートである。
【図20】前記実施形態の画像合成方法における人物背景合成動画像合成処理ステップを説明するフローチャートである。
【符号の説明】
【0117】
1 画像合成装置
11 人物実動画像入力・記憶手段
12 背景実動画像入力・記憶手段
13 光環境実動画像入力・記憶手段
14 表面反射特性情報入力・記憶手段
21 人物画像抽出処理手段
22 追跡処理手段
23 光環境情報処理手段
24 合成顔情報処理手段
25 肌情報処理手段
26 陰影成分情報処理手段
27 顔画像合成処理手段
28 人物背景合成動画像合成処理手段
29 動画像表示処理手段
10 コンピュータシステム
100 画像合成プログラム
A 表面反射特性測定装置
1A 光反射特性情報測定手段
1B 三次元形状情報測定手段
1C 法線情報測定手段
2 可動光源
2A、2B 光源
21A、21B 遮蔽板
3 撮像手段
3A 偏光子
4 情報処理手段
5 投影手段
6 固定光源
6A 偏光子
7 制御手段
8 コンピュータシステム
9 フレーム

【特許請求の範囲】
【請求項1】
人物の実動画像に基づいて合成された該人物の顔の合成画像を、前記人物の実動画像とは別に撮像された背景の実動画像と合成する画像合成装置であって、
前記人物の実動画像を入力又は記憶する人物実動画像入力・記憶手段と、
前記背景の実動画像を入力又は記憶する背景実動画像入力・記憶手段と、
前記背景の実動画像とともに撮像された該背景の光環境実動画像を入力又は記憶する光環境実動画像入力・記憶手段と、
前記人物の顔の三次元形状情報、法線情報及び光反射特性情報からなる前記人物の顔の表面反射特性情報を入力又は記憶する表面反射特性情報入力・記憶手段と、
前記人物実動画像入力・記憶手段に記憶された前記人物の実動画像の各フレーム画像から人物画像を抽出する人物画像抽出処理手段と、
抽出された前記人物画像、及び前記表面反射特性情報入力・記憶手段が入力又は記憶した前記顔の三次元形状情報に基づいて、前記人物の顔画像、並びに前記人物の顔の特定部位の位置情報及び該顔の方向情報からなる顔の追跡情報を求める追跡処理手段と、
前記光環境実動画像入力・記憶手段が入力又は記憶した光環境実動画像の各フレーム画像に基づいて、前記背景の実動画像の各フレーム画像に応じた光環境情報を求める光環境情報処理手段と、
前記顔の表面反射特性情報、前記顔の追跡情報、及び前記光環境情報に基づいて、前記顔の陰影情報及び表面反射情報を求める合成顔画像情報処理手段と、
前記人物の顔画像の各フレーム画像から、色成分情報及び陰影成分情報からなる肌情報を求める肌情報処理手段と、
前記肌情報、前記顔の陰影情報、及び前記顔の表面反射情報に基づいて、前記顔の合成画像を合成する顔画像合成処理手段と、
前記顔の合成画像、前記人物画像、及び前記背景実動画像に基づいて、人物背景合成動画像を合成する人物背景合成動画像合成処理手段とを具備する画像合成装置。
【請求項2】
前記肌情報処理手段は、前記人物の顔画像の各フレーム画像から、主成分分析法及び/又は独立成分分析法を用いて前記色成分情報及び陰影成分情報からなる肌情報を求める請求項1に記載の画像合成装置。
【請求項3】
前記光環境情報処理手段は、前記光環境実動画像入力・記憶手段が入力又は記憶した光環境実動画像の各フレーム画像に基づいて、前記背景の実動画像の各フレーム画像に応じて光源を点光源に近似させた光環境情報を求める請求項1又は2に記載の画像合成装置。
【請求項4】
前記顔画像合成処理手段は、前記陰影成分情報から高周波陰影成分情報を求める陰影成分情報処理手段を具備し、前記肌情報、前記顔の陰影情報、及び前記顔の表面反射光情報に加えて前記高周波陰影成分情報にも基づいて前記顔の合成画像を合成する請求項1〜3の何れかに記載の画像合成装置。
【請求項5】
前記光環境実動画像が、前記背景の実動画像を撮像する背景撮像用のビデオカメラの背後に配設され且つ互いのレンズの光軸が同一直線状に位置するように設定された光環境撮像用のビデオカメラにより撮像された、該光環境撮像用のビデオカメラの前方に配され且つ前記光軸が中心を通る表面が鏡面加工された球又は球殻を含む動画像である請求項1〜4の何れかに記載の画像合成装置。
【請求項6】
人物の実動画像、前記人物の実動画像とは別に撮像された背景の実動画像、前記背景の実動画像とともに撮像された該背景の光環境実動画像、並びに前記人物の顔の三次元形状情報、法線情報及び光反射特性情報からなる該人物の顔の表面反射特性情報を入力又は記憶するデータ入力・記憶処理ステップと、
前記光環境実動画像の各フレーム画像に基づいて、前記背景の実動画像の各フレーム画像に応じた光環境情報を求める光環境情報処理ステップと、
前記人物の実動画像の各フレーム画像から人物画像を抽出する人物画像抽出処理ステップと、
前記人物画像及び前記顔の三次元形状情報に基づいて、前記人物の顔画像及び前記人物の顔の追跡情報を求める追跡処理ステップと、
前記顔の表面反射特性情報、前記顔の追跡情報、及び前記光環境情報に基づいて、前記顔の陰影情報及び表面反射情報を求める合成顔画像情報処理ステップと、
前記人物の顔画像から、色成分情報及び陰影成分情報からなる肌情報を求める肌情報処理ステップと、
前記肌情報、前記顔の陰影情報、及び前記顔の表面反射情報に基づいて、前記顔の合成画像を合成する顔画像合成処理ステップと、
前記顔の合成画像、前記人物画像、及び前記背景の実動画像に基づいて、人物背景合成動画像を合成する人物背景合成動画像合成処理ステップとを具備する画像合成方法。
【請求項7】
コンピュータに、人物の実動画像、前記人物の実動画像とは別に撮像された背景の実動画像、前記背景の実動画像とともに撮像された該背景の光環境実動画像、並びに前記人物の顔の三次元形状情報、法線情報及び光反射特性情報からなる該人物の顔の表面反射特性情報を入力又は記憶手段に記憶させるデータ入力・記憶処理機能と、人物の実動画像の各フレーム画像から人物画像を抽出する人物画像抽出処理機能と、前記人物画像及び前記顔の三次元形状情報に基づいて、前記人物の顔画像及び前記人物の顔の追跡情報を求める追跡処理機能と、光環境実動画像の各フレーム画像に基づいて、記憶された前記背景の実動画像の各フレーム画像に応じた光環境情報を求める光環境情報処理機能と、前記顔の表面反射特性情報、前記顔の追跡情報、及び前記光環境情報に基づいて、前記顔の陰影情報及び表面反射情報を求める合成顔画像情報処理機能と、前記人物の顔画像から、色成分情報及び陰影成分情報からなる肌情報を求める肌情報処理機能と、前記肌情報、前記顔の陰影情報、及び前記顔の表面反射情報に基づいて、前記顔の合成画像を合成する顔画像合成処理機能と、前記顔の合成画像、前記人物画像、及び前記背景実動画像に基づいて、人物背景合成動画像を合成する人物背景合成動画像合成処理機能とを実現させる画像合成プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate


【公開番号】特開2009−21964(P2009−21964A)
【公開日】平成21年1月29日(2009.1.29)
【国際特許分類】
【出願番号】特願2007−184979(P2007−184979)
【出願日】平成19年7月13日(2007.7.13)
【出願人】(000000918)花王株式会社 (8,290)
【出願人】(304021831)国立大学法人 千葉大学 (601)
【Fターム(参考)】