説明

顔の3次元モデル生成装置、顔の3次元モデル生成方法および顔の3次元モデル生成プログラム

【課題】眼鏡をかけている人物の顔の3次元モデルの生成時においても、裸眼の人物の顔の3次元モデル生成と同様に、一回の画像撮影と1つの画像列入力から、顔の3次元モデルの生成を可能にする。
【解決手段】複数枚のデジタル画像データを入力する画像入力部11と、前記入力画像内の眼鏡フレーム部分の画素値を除去する眼鏡除去部12と、前記入力画像列から裸眼の顔の3次元モデルを生成する裸眼の顔モデル生成部13と、前記入力画像列から眼鏡の3次元モデルを生成する眼鏡モデル生成部14と、前記裸眼の顔の3次元モデルと前記眼鏡の3次元モデルの相対3次元位置を計算する相対位置計算部15と、前記裸眼の顔の3次元モデルの座標系と前記眼鏡の3次元モデルの座標系を、前記相対3次元位置情報をもとに統合するモデル統合部16と、前記統合結果をデジタルデータとして出力する出力部17とを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、2次元画像から顔の3次元モデルを生成する技術に係り、顔の3次元モデル生成装置、顔の3次元モデル生成方法および顔の3次元モデル生成プログラムに関するものである。
【背景技術】
【0002】
古くから、コンピュータビジョンの分野では顔の3次元モデルの生成に関する技術は研究されており、近年では、容易にかつ個人性を強く反映した顔の3次元モデルを生成する技術が開発されつつあり、顔の3次元モデルはアバターや顔認識などの用途のために頻繁に使用されている。しかし一般に、顔の3次元モデルの生成技術では、眼鏡のような顔の一部を覆い隠す遮蔽物を含む顔は対象とされていない。
【0003】
顔の3次元モデルを生成する方法としては、レンジファインダのような3次元形状計測機器を使用して、取り込んだ3次元形状情報から顔の3次元モデルを生成する方法がある(例えば、非特許文献1参照)。基本的に、3次元形状計測機器使用して顔の3次元モデルを生成する際は裸眼であることを前提としており、眼鏡をかけた人の顔の3次元モデルを生成したい場合は、はじめに裸眼の顔の3次元形状を測定し、次に、眼鏡をかけて再び3次元形状の測定を行い、その差分から眼鏡の3次元モデルを作成し、裸眼の顔の3次元モデルと合成する方法が一般的である。しかし、非特許文献1に記載の技術では、高価で特殊な機器が必要とされる。
【0004】
一方、特別な3次元形状計測機器を用いずに、容易に顔の3次元モデルを生成する方法として、あらかじめ汎用の顔の3次元モデルを用いる方法が提案されている(例えば、非特許文献2参照)。非特許文献2に記載の技術では、手動で特徴点を付与した画像1枚を入力とし、あらかじめデータベースに保持しておいたMorphable Modelと呼ばれる特徴点データとテクスチャ情報を持つ汎用の3次元モデルを用いてフィッテングを行う。即ち、手動で与えた入力画像の特徴点と、Morphable Modelの特徴点、およびそれぞれのテクスチャの残差が小さくなるように最小化を行い、Morphable Modelの3次元形状および、テクスチャを変形させることで顔の3次元モデルを生成する。
【非特許文献1】石山塁,坂本静生,北野昌秀,童衛青,田島譲二:“顔用レンジファインダ”,信学技報,PRMU99−24,1999,pp.35−42
【非特許文献2】V.Blanz,T.Vetter:“Face Recognition Based on Fitting a 3D Morphable Model”,PAMI vol.25 No.9,2003
【非特許文献3】山田貢己、中島朗子、福井和弘:“因子分解法と部分空間法による顔向き推定”,PRMU2001−194,vol.101,pp.1−8(2001)
【非特許文献4】Nello Cristianini,John Shawe−Taylor,“An Introduction to Support Vector Machines:And Ohter Kernel−Based Learning Methods”,Cambridge Univ Press,2000
【非特許文献5】齋藤康之、剣持雪子、小谷一孔:“パラメトリックな眼鏡フレームモデルを用いた顔画像内の眼鏡フレーム領域の抽出と除去”,信学論誌,D−II,J82−D−II,5,pp.880−890,1999
【非特許文献6】T.F.Cootes,G.J.Edwards,and C.J.Taylor.Active appearance models.IEEE TPAMI,23(6):681−685,2001
【非特許文献7】C.Tomasi and T.Kanade:“Shape and motion from image streams under orthography:afactorization method”International Journal of Computer Vision,9(2),pp.137−154(1992)
【非特許文献8】Ahsan Ullah,Koichi Harada:“A study on Surface Subdivision”,Proc.Int.Conf.Adv.Comm.Tech.2006 pp.1409−1412(2006)
【特許文献1】特開2007−4578号公報
【発明の開示】
【発明が解決しようとする課題】
【0005】
しかしながら、上記非特許文献1、2に開示された技術では眼鏡をかけている人物の顔の3次元モデルの生成方法および、3次元モデル生成の簡易性は考慮されていない。即ち、非特許文献2では生成する3次元モデルは裸眼の人物のものであることが前提とされており、入力画像は裸眼の顔画像でなくてはならない。
【0006】
また、非特許文献1のように3次元計測機器を使用する場合においては、眼鏡をかけた人物の裸眼時と眼鏡使用時の2回の計測が必要となり、二度手間になるという問題点がある。
【0007】
本発明は上記の問題点に鑑みてなされたものであり、その目的は、眼鏡をかけている人物の顔の3次元モデルの生成時においても、裸眼の人物の顔の3次元モデル生成と同様に、一回の画像撮影と1つの画像列入力から、顔の3次元モデルの生成を可能にするための、裸眼の顔の3次元モデル生成方法および、眼鏡の3次元モデル生成方法、および異なる座標系の複数の3次元モデルの統合方法を備えた、顔の3次元モデル生成装置、方法およびプログラムを提供することにある。
【課題を解決するための手段】
【0008】
上記目的を達成するため、請求項1に記載の顔の3次元モデル生成装置は、画像データに含まれる眼鏡の有無を識別し、眼鏡をかけている顔画像の場合、顔と眼鏡の両方の3次元モデルを生成し、眼鏡をかけていない顔画像の場合、顔だけの3次元モデルを生成する顔の3次元モデル生成装置であって、複数枚のデジタル画像データを入力する画像入力手段と、前記画像入力手段により入力された画像内の眼鏡フレーム部分の画素値を任意の画素値に変換して除去する眼鏡除去手段と、前記画像入力手段により入力された入力画像列から裸眼の顔の3次元モデルを生成する裸眼の顔モデル生成手段と、前記画像入力手段により入力された入力画像列から眼鏡の3次元モデルを生成する眼鏡モデル生成手段と、前記裸眼の顔の3次元モデルと前記眼鏡の3次元モデルの相対3次元位置を計算する相対位置計算手段と、前記裸眼の顔の3次元モデルの座標系と前記眼鏡の3次元モデルの座標系を、前記相対位置計算手段により計算された相対3次元位置情報をもとに統合するモデル統合手段と、前記統合結果をデジタルデータとして出力する出力手段とを備えることを特徴としている。
【0009】
また請求項2に記載の顔の3次元モデル生成装置は、請求項1において、前記眼鏡除去手段は、前記入力画像列から任意の画像を選択する画像選択手段と、事前に学習しておいた学習パターンを蓄積しておく学習パターン記憶手段と、前記学習パターン記憶手段から学習パターンを読み込み、前記画像選択手段により選択された画像内の眼鏡の有無を識別する識別手段と、前記画像選択手段により選択された画像中の眼鏡フレーム部分の画素値を任意の画素値に変換して除去するフレーム除去処理手段とを有することを特徴としている。
【0010】
また請求項3に記載の顔の3次元モデル生成装置は、請求項1又は2において、前記裸眼の顔モデル生成手段は、事前に作成した一つないしは複数の顔データを蓄積しておく顔データ記憶手段と、前記顔データ記憶手段から顔データを読み込み、前記画像入力手段により入力された入力画像列の特徴点追跡を行う顔の特徴点追跡手段と、前記顔の特徴点追跡手段による特徴点の追跡結果から顔の3次元形状情報を算出する顔形状情報生成手段と、前記算出された顔の3次元形状情報に基づく3次元形状モデルに、前記眼鏡除去手段によりフレームが除去された顔画像のテクスチャを貼り付ける顔形状モデル生成手段とを有することを特徴としている。
【0011】
また請求項4に記載の3次元モデル生成装置は、請求項1ないし3のいずれか1項において、前記眼鏡モデル生成手段は、事前に作成した一つないしは複数の眼鏡データを蓄積しておく眼鏡データ記憶手段と、前記眼鏡データ記憶手段から眼鏡データを読み込み、前記画像入力手段により入力された入力画像列の特徴点追跡を行う眼鏡フレームの特徴点追跡手段と、前記眼鏡フレームの特徴点追跡手段による特徴点の追跡結果から眼鏡フレームの3次元形状情報を算出するフレーム形状生成手段と、前記算出された眼鏡フレームの3次元形状情報に基づく眼鏡フレームの3次元形状モデルに、眼鏡フレームのテクスチャを貼り付け、眼鏡フレーム内部に眼鏡のレンズ形状を生成する後処理手段とを有することを特徴としている。
【0012】
また、請求項5に記載の顔の3次元モデル生成方法は、画像データに含まれる眼鏡の有無を識別し、眼鏡をかけている顔画像の場合、顔と眼鏡の両方の3次元モデルを生成し、眼鏡をかけていない顔画像の場合、顔だけの3次元モデルを生成する顔の3次元モデル生成方法であって、画像入力手段が、複数枚のデジタル画像データを入力する画像入力ステップと、眼鏡除去手段が、前記画像入力ステップにより入力された画像内の眼鏡フレーム部分の画素値を任意の画素値に変換して除去する眼鏡除去ステップと、裸眼の顔モデル生成手段が、前記画像入力ステップにより入力された入力画像列から裸眼の顔の3次元モデルを生成する裸眼の顔モデル生成ステップと、眼鏡モデル生成手段が、前記画像入力ステップにより入力された入力画像列から眼鏡の3次元モデルを生成する眼鏡モデル生成ステップと、相対位置計算手段が、前記裸眼の顔の3次元モデルと前記眼鏡の3次元モデルの相対3次元位置を計算する相対位置計算ステップと、モデル統合手段が、前記裸眼の顔の3次元モデルの座標系と前記眼鏡の3次元モデルの座標系を、前記相対位置計算ステップにより計算された相対3次元位置情報をもとに統合するモデル統合ステップと、出力手段が、前記統合結果をデジタルデータとして出力する出力ステップとを備えることを特徴としている。
【0013】
また請求項6に記載の顔の3次元モデル生成方法は、請求項5において、前記眼鏡除去ステップは、画像選択手段が、前記入力画像列から任意の画像を選択する画像選択ステップと、識別手段が、事前に学習しておいた学習パターンを蓄積しておく学習パターン記憶手段から学習パターンを読み込み、前記画像選択ステップにより選択された画像内の眼鏡の有無を識別する識別ステップと、フレーム除去処理手段が、前記画像選択ステップにより選択された画像中の眼鏡フレーム部分の画素値を任意の画素値に変換して除去するフレーム除去処理ステップとを有することを特徴としている。
【0014】
また請求項7に記載の顔の3次元モデル生成方法は、請求項5又は6において、前記裸眼の顔モデル生成ステップは、顔の特徴点追跡手段が、事前に作成した一つないしは複数の顔データを蓄積しておく顔データ記憶手段から顔データを読み込み、前記画像入力ステップにより入力された入力画像列の特徴点追跡を行う顔の特徴点追跡ステップと、顔形状情報生成手段が、前記顔の特徴点追跡ステップによる特徴点の追跡結果から顔の3次元形状情報を算出する顔形状情報生成ステップと、顔形状モデル生成手段が、前記算出された顔の3次元形状情報に基づく3次元形状モデルに、前記眼鏡除去ステップによりフレームが除去された顔画像のテクスチャを貼り付ける顔形状モデル生成ステップとを有することを特徴としている。
【0015】
また請求項8に記載の顔の3次元モデル生成方法は、請求項5ないし7のいずれか1項において、前記眼鏡モデル生成ステップは、眼鏡フレームの特徴点追跡手段が、事前に作成した一つないしは複数の眼鏡データを蓄積しておく眼鏡データ記憶手段から眼鏡データを読み込み、前記画像入力ステップにより入力された入力画像列の特徴点追跡を行う眼鏡フレームの特徴点追跡ステップと、フレーム形状生成手段が、前記眼鏡フレームの特徴点追跡ステップによる特徴点の追跡結果から眼鏡フレームの3次元形状情報を算出するフレーム形状生成ステップと、後処理手段が、前記算出された眼鏡フレームの3次元形状情報に基づく眼鏡フレームの3次元形状モデルに、眼鏡フレームのテクスチャを貼り付け、眼鏡フレーム内部に眼鏡のレンズ形状を生成する後処理ステップとを有することを特徴としている。
【0016】
また、請求項9に記載の顔の3次元モデル生成プログラムは、コンピュータを請求項1ないし4のいずれか1項に記載の各手段として機能させる顔の3次元モデル生成プログラムである。
【0017】
上記手段を実現することによって、ビデオカメラなどの画像入力装置により撮影された入力画像中の人物の眼鏡の有無に関わらず、裸眼または眼鏡付きの顔の3次元モデルを生成することが可能となる。
【発明の効果】
【0018】
本発明によれば、眼鏡の有無を判断し、眼鏡がある場合には眼鏡除去の画像処理を行うため、入力に眼鏡をかけた人物の顔の画像列を用いても、裸眼の人物の顔画像を用いても3次元顔モデルが作成できるようになる。また眼鏡モデルの作成を可能にし、2つのモデルの位置関係を調節することにより、眼鏡をかけた人物の顔の3次元モデルは、眼鏡付きの顔の3次元モデルとすることができる。
【発明を実施するための最良の形態】
【0019】
以下、図面を参照しながら本発明の実施の形態を説明するが、本発明は下記の実施形態例に限定されるものではない。図1は本発明に係る実施形態の顔の3次元モデル生成装置の構成を示すブロック図であり、図2は本発明に係る実施形態の顔の3次元モデル生成方法のフローチャートである。
【0020】
図1において、本実施形態例の顔の3次元モデル生成装置は、画像入力手段としての画像入力部11、眼鏡除去手段としての眼鏡除去部12、裸眼の顔モデル生成手段としての裸眼の顔モデル生成部13、眼鏡モデル生成手段としての眼鏡モデル生成部14、相対位置計算手段としての相対位置計算部15、モデル統合手段としてのモデル統合部16および出力手段としての出力部17を備えている。
【0021】
前記眼鏡除去部12は、画像選択手段としての画像選択部18、学習パターン記憶手段としての学習パターン記憶部19、識別手段としての識別部20およびフレーム除去処理手段としてのフレーム除去処理部21を備えている。
【0022】
前記裸眼の顔モデル生成部13は、顔データ記憶手段としての顔データ記憶部22、顔の特徴点追跡手段としての顔の特徴点追跡部23、顔形状情報生成手段としての顔形状情報生成部24および顔形状モデル生成手段としての顔形状モデル生成部25を備えている。
【0023】
前記眼鏡モデル生成部14は、眼鏡データ記憶手段としての眼鏡データ記憶部26、眼鏡フレームの特徴点追跡手段としての眼鏡フレームの特徴点追跡部27、フレーム形状生成手段としてのフレーム形状生成部28および後処理手段としての後処理部29を備えている。
【0024】
前記図1の各部11〜29の、後述する各機能は、例えばコンピュータによって達成される。
【0025】
尚、以下で説明する図2、図4〜図6のフローチャートにおいて、「S」で示す各処理は、本発明の請求項5〜8の各ステップを示している。
【0026】
画像入力部11は、ビデオカメラ等で撮像されたデジタル画像列を入力し、眼鏡除去部12と裸眼の顔モデル生成部13と眼鏡モデル生成部14の3つに伝送する。
【0027】
眼鏡除去部12では、画像入力部11より入力された画像列から眼鏡の有無を判断し、眼鏡があると判断された場合、画像中から眼鏡フレーム部分を除去した画像を生成し、生成した画像を裸眼の顔モデル作成部13へ送り、眼鏡の有無の識別結果を眼鏡モデル生成部14へ送る(図2の眼鏡除去処理S1)。
【0028】
裸眼の顔モデル作成部13は、顔の3次元形状情報から顔の3次元形状モデルを生成し、眼鏡除去部12にて生成された眼鏡フレームを除去した画像のテクスチャを用いて裸眼の顔の3次元モデルを作成し、モデル統合部16へ送るとともに、顔の特徴点を追跡し相対位置計算部15へ送る(図2の裸眼の顔モデル生成処理S3)。
【0029】
眼鏡モデル生成部14では、眼鏡フレームの3次元形状モデルを作成し、眼鏡のレンズ形状やテクスチャを貼り付けた眼鏡の3次元モデルを生成して、モデル統合部16へ送るとともに、眼鏡フレームの特徴点を追跡し相対位置計算部15へ送る(図2の眼鏡モデル生成処理S2)。
【0030】
一方、相対位置計算部15では画像内における顔の特徴点と眼鏡の特徴点の相対位置を計算し、モデル統合部16へ伝送する(図2の相対位置計算処理S4)。
【0031】
モデル統合部16では、裸眼の顔モデル作成部13で生成された裸眼の顔の3次元モデルの座標系と眼鏡モデル生成部14で生成された眼鏡の3次元モデルの座標系を相対位置計算部15から入力される位置関係情報をもとに統合し、出力部17へ送る(図2のモデル統合処理S5)。出力部17はモデル統合部16で生成された顔と眼鏡の3次元モデルを出力する。
【0032】
画像入力部11に入力される動画列の例としては、例えば図3(a),(b)のように固定されたカメラ1台の正面に被写体となる人物が立ち、カメラに対し顔を右から左、または左から右へ回させる一連の動作を撮影した映像を用いる。また入力画像列の例として、任意の台数のカメラで被写体となる人物を囲むように配置して撮影した複数枚の顔画像などを用いてもよい。
【0033】
眼鏡除去部12は、画像入力部11より入力された画像列中から正面顔が写っている画像を選択する画像選択部18と、あらかじめ学習により作成したデータを保持しておく学習パターン記憶部19と、画像内の眼鏡の有無を識別する識別部20と、画像選択部18にて選択された画像内の眼鏡フレーム部分のみを画像処理により除去するフレーム除去処理部21から構成される。具体的な眼鏡除去部12の処理手順を図4のフローチャートに示す。
【0034】
まず、画像選択部18が行う正面顔画像取得処理S101における正面顔画像を選ぶ手段としては、画像中の顔の向きを推定する技術を使用する(例えば、非特許文献3参照)。入力画像列全ての顔向きを推定し、顔向きが最も正面に近い画像を1枚選択し、これを正面顔画像とする。
【0035】
次に、識別部20が行う識別処理S102では、前記選択した正面顔画像を用いて眼鏡の有無を識別する。識別方法としては、SVMを使用する(SVMの詳細については、例えば非特許文献4参照)。あらかじめ訓練セットとして眼鏡の画像と眼鏡ではない画像の2種類を用意しておき、これを用いた学習を行い生成した識別パラメータを学習パターン記憶部19に蓄積しておく。識別の際には、学習パターン記憶部19より呼び出した識別パラメータを使用して、眼鏡の有無を判断する(処理S103)。
【0036】
ここで、正面顔画像中に眼鏡があると判断された場合のみ、フレーム除去処理部21が眼鏡フレーム除去処理S104を行う。眼鏡フレーム除去処理S104の手段としては、例えばパラメトリック眼鏡フレームモデルを用いた眼鏡除去方法を用いる(非特許文献5参照)。正面顔画像内における眼鏡フレーム部分だけを除去した画像を生成し、出力する。
【0037】
本実施例の説明では正面顔画像の選択の例に顔向き推定技術を用いて説明したが、手動で画像列中から探し出してもよい。また、前記識別手法においてはSVM以外にも例えば最近傍法、フィッシャーの線形識別法、ニューラルネットワークや部分空間法等を用いても良い。
【0038】
裸眼の顔モデル作成部13は、画像入力部11より入力された画像に顔の形状を表すための特徴点を発生させ、画像列中の他の全ての画像上での対応付けを行う(以下、特徴点追跡と呼ぶ)顔の特徴点追跡部23と、画像中の顔の特徴点を発生させるためのデータを保持しておく顔データ記憶部22と、特徴点の3次元位置情報を算出する顔形状情報生成部24と、顔の3次元形状モデルを生成する顔形状モデル生成部25から構成される。具体的な裸眼の顔モデル作成部13における処理の実行方法を図5のフローチャートに示す。
【0039】
まず、顔の特徴点追跡部23が、画像入力部11より入力された画像列を用いて顔の特徴点追跡処理S201を行う。特徴点追跡にはActive Appearance Model(AAM)を使用する。AAMはアピアランスモデルと呼ばれる統計的なモデルの作成と、モデル探索によるパラメータ調節の2つの工程から構成される生成モデルと未知画像のマッチング手法である。
【0040】
アピアランスモデルの作成工程では、物体の形状を表す特徴点の座標値と見えを表す輝度値の相関をパラメータとして持つ統計的モデルを作成し、モデル探索によるパラメータ調節工程では、生成したアピアランスモデルと入力した未知画像とのイメージ残差を最小化するように生成したアピアランスモデルのパラメータを変化させる最適化問題に帰着し、その最適化問題を解くことで入力未知画像と生成したモデルのマッチングを行うものである。
【0041】
以下で、アピアランスモデル作成について簡単に概説する。アピアランスモデルは特徴点を配置した学習画像データセットを使用して作成する。
【0042】
【数1】

【0043】
ここでQs,Qgは固有ベクトルであり、cは形状とテクスチャの両方をコントロールするアピアランスパラメータである。アピアランスパラメータcを用いることで、形状だけでなくテクスチャも表現することができる。また逆に、cが求まれば、形状およびテクスチャを算出することが可能となる。
【0044】
また、AAMの第2工程であるモデル探索によるパラメータ調節により未知画像と作成したアピアランスモデルのマッチングを行う。画像内から作成したアピアランスモデルと同じ形状、同じテクスチャを探索する際には、モデルの形状とテクスチャをあらわすアピアランスパラメータcに加え、画像内におけるモデルの位置、大きさ、回転を考慮した新しいパラメータpを用いる。
【0045】
【数2】

【0046】
【数3】

【0047】
ただし、(uij,vij)はi番目の画像のj番目の特徴点の画像座標値を表している。因子分解法は、(2)式の行列より各特徴点の3次元位置とカメラ運動を同時に算出できる手法である。一般に、因子分解法により算出される3次元位置情報の座標系の各軸の並びは入力する計測行列により変わる。そこで、算出した顔の3次元位置の座標系におけるz軸をカメラに向かって撮影された入力画像列のz軸(図3参照)と同様になるようにあわせる。具体的な座標系のあわせ方としては、図3の入力画像列の撮影状況の座標系から例えば、z軸方向は上向きなどの制約条件を与えることで回転行列を生成して調整することが可能である。少なくとも、ここでは算出した3次元位置の座標系のz軸は上向きになるように調節する。また、各軸の並びは手動で調節してもよい。
【0048】
さらに3次元形状生成処理S202では、各特徴点の3次元位置から三角パッチなどのメッシュを作成し、顔の3次元形状モデルを作成する。ここで、画像中の特徴点の数Nが小さい場合、作成した顔モデルが粗いメッシュで作成される。このような場合には、非特許文献8にあるようにメッシュを細かく分割する細分割曲面を生成して3次元形状モデルに丸みを帯びさせてもよい。この時点で作成された顔の3次元形状モデルは、顔の特徴点の3次元位置情報と各特徴点によるパッチの張り方(メッシュの連結情報)をあらわす情報を持つモデルである。そこで顔形状モデル生成部25が、眼鏡除去部12から入力される、眼鏡フレームを除去した画像を用いてテクスチャマッピング処理S203を行う。
【0049】
以上により、顔の3次元形状情報、特徴点によって張られるパッチ構成の情報、および裸眼の顔画像のテクスチャ情報を持つ裸眼の顔の3次元モデルが生成される。本実施例の説明には、AAMによる特徴点追跡を行う例を使用したが、AAMの代わりにActive Shape Modelやあらかじめ保持しておいた3次元モデルを使用したモデル当てはめを用いてもよい。
【0050】
また因子分解法は時系列画像列中の1枚の画像中に発生させた特徴点が全てのフレームにおいて追跡できていないと3次元復元できないという問題点を持つ。本実施例での入力画像列のように撮影された映像では、例えば、入力画像列の1番目の画像と最後の画像は、人物の右真横からの顔画像と左真横の顔画像になることが考えられる。このような場合、1番目の画像中に発生させた特徴点がフレームアウトし、特徴点追跡に失敗する可能性がある。
【0051】
そこで、入力画像列を、特徴点追跡が失敗しない範囲でサブ画像列に分割し、分割した複数の画像列を用いて、おのおのに因子分解法を適用し、3次元形状を復元し、それらを接合することでひとつの大きな3次元形状モデルを作成してもよい。
【0052】
具体的には、今入力画像列は、図3のように人物がカメラに向かい、右から左へ顔を回して撮影したものとする。この入力画像列を1番目の画像から正面顔画像までを1つのサブ画像列A、その正面顔画像から最後の画像までをもう1つのサブ画像列Bとして2つに分割する。特徴点の発生方法としては、あらかじめAAMを用いて顔の右半面のアピアランスモデルと顔の左半面のアピアランスモデルを作成しておき、顔データ記憶部22に蓄積しておく。これら2つのアピアランスモデルには一部に重複する特徴点を含むモデルを作成しておくものとする。特徴点追跡の際には、サブ画像列Aには顔の左半面のアピアランスモデルを用い、サブ画像列Bには、顔の右半面のアピアランスモデルを用いる。それぞれの特徴点追跡結果から、先述のとおり、因子分解法を用いて3次元復元を行い、z軸をそろえておく。
【0053】
次に、重複している特徴点(以下、重複点)の3次元位置の情報から2つの3次元復元結果を統合する。重複点の位置をひとつに統合するための手段としては、たとえば最小二乗近似やクォータニオンがある。また特徴点追跡が失敗する可能性のあるような広域の画像列からの3次元復元手法としては、特許文献1のような手法を用いてもよい。
【0054】
眼鏡モデル生成部14は、画像入力部11より入力された画像に眼鏡フレームの形状を表すための特徴点の特徴点追跡を行う眼鏡フレームの特徴点追跡部27と、画像中の眼鏡フレームの特徴点を発生させるためのデータを保持しておく眼鏡データ記憶部26と、特徴点の3次元位置を算出するフレーム形状生成部28と、テクスチャマッピングと眼鏡フレーム内のレンズの位置の算出を行う後処理部29から構成される。具体的な眼鏡モデル生成部14における処理の実行方法を図6のフローチャートに示す。
【0055】
まず、前記識別部20の結果を用いて眼鏡の存在を判定する(処理S301)。ここで眼鏡が存在しないと判断された場合は、処理を終了し、眼鏡が存在すると判断された場合は、眼鏡フレームの特徴点追跡部27が、画像入力部11より入力された画像列を用いて眼鏡フレームの特徴点追跡処理S302を行う。
【0056】
特徴点追跡手法は、前記顔の特徴点追跡処理S201と同様にAAMを使用する。あらかじめ眼鏡の映っている画像に特徴点を配置した学習画像を多数用いて作成したアピアランスモデルを、眼鏡データ記憶部26に蓄積しておく。例えば、図7のように眼鏡フレーム外周特徴点x。とレンズ側特徴点xlを持つ眼鏡のアピアランスモデルを用いる。このときの形状ベクトルxはxoとxlを並べたベクトルである。
【0057】
次に、画像入力部11より入力された画像列の最初の1枚に、事前に作成しておいた眼鏡のアピアランスモデルを眼鏡データ記憶部26から読み出してマッチングを行う。そして、マッチングにより得られたアピアランスパラメータから形状ベクトルxを算出し、特徴点の画像内位置を得る。これを入力画像列全てにおいて行い、得られた形状ベクトルを時系列に並べることで特徴点追跡の結果とする。
【0058】
次に、フレーム形状生成部28が行う3次元形状生成処理S303において、前記得られた特徴点の追跡結果から眼鏡フレームの3次元形状情報を算出する。この3次元形状情報の算出方法も前記顔の3次元復元と同様に、因子分解法を用いる。また特徴点追跡の手段として、前記裸眼の顔モデル作成部13にて記載したように、ひとつの入力画像列を複数に分割してから3次元形状を復元し、その後、複数の3次元復元結果を統合してもよい。続いて、得られた特徴点の3次元形状情報から眼鏡フレームの3次元形状モデルを作成し、必要に応じて細分割曲面を生成する。
【0059】
次に、後処理部29が行うテクスチャマッピング処理S304において、前記作成した眼鏡フレームの3次元形状モデルに眼鏡フレームのテクスチャを貼り付ける。この際の、テクスチャマッピングには入力画像列の任意の画像を用いることができるが、精度の良い顔のモデルを生成したい場合には正面顔画像を用いる。入力画像列から正面顔画像の選択方法は先述のとおり、非特許文献3のような顔向き推定技術を用いても、手動で正面顔画像を選択してもよい。テクスチャマッピングにより、眼鏡フレームの3次元形状情報と、特徴点によって張られるパッチ構成の情報、およびテクスチャの情報を持った眼鏡フレームの3次元モデルが生成される。
【0060】
次に、後処理部29が行うレンズのはめ込み処理S305により、生成した眼鏡フレームの3次元モデルに眼鏡のレンズ部分の形状情報を与える。今、生成した眼鏡フレームの3次元モデルの3次元位置情報は次の(3)式で示される形のベクトルで与えられているものとする。
【0061】
【数4】

【0062】
ただし(3)式において、添え字のoとlは眼鏡フレームの特徴点追跡処理S302に使用した眼鏡のアピアランスモデルの2種類の特徴点、すなわち図7の眼鏡フレーム外周特徴点xoとレンズ側特徴点xlに対応しており、soは眼鏡フレーム外周特徴点の3次元位置であり、slはレンズ側特徴点の3次元位置である。また、眼鏡フレーム外周特徴点の数をi個、レンズ側特徴点の数をj個とする。例えば、j個のレンズ側特徴点のうち、図7のように1番目からj/2番目の特徴点が1つのレンズを囲むように右回りに配置し、j/2+1番目からj番目の特徴点がもうひとつのレンズを囲むように配置しておく。このときのレンズの形状はレンズ側特徴点の1番目からj/2番目の特徴点の3次元位置から生成した三角パッチなどのメッシュで表現したものを眼鏡のレンズ形状とする。もう片方のレンズも同様に、j/2+1番目の特徴点からj番目の特徴点で生成されるメッシュで表現される3次元モデルを作成する。レンズ部分には透過性のテクスチャを貼る。
【0063】
相対位置計算部15では裸眼の顔モデル作成部13の顔の特徴点追跡処理部23の特徴点追跡結果と、眼鏡モデル生成部14の眼鏡フレームの特徴点追跡部27の特徴点追跡結果が入力され、これらから画像内の顔の特徴点と眼鏡の特徴点の相対位置を計算する。例えば、入力画像列の任意の画像における顔の特徴点位置をxf、同じ画像における眼鏡の特徴点位置をxgとし、相対位置を表すベクトル[xf|xg]を作成し、モデル統合部16へ出力する。
【0064】
モデル統合部16では、入力された裸眼の顔の3次元モデルと眼鏡の3次元モデルの座標系の統一を行う。具体的には、入力される裸眼の顔の3次元モデルの特徴点の3次元位置情報をs1=(x1,y1,z1)、眼鏡の3次元モデルの特徴点の3次元位置情報をs2=(x2,y2,z2)として、次の(4)式、(5)式で表される2行2列の回転行列R1,R2を算出する。
【0065】
【数5】

【0066】
回転行列R1,R2は最小二乗近似によって算出できる。これより顔の形状の3次元位置にR11、眼鏡の3次元モデルの3次元位置にR22で表される位置情報を持つ眼鏡付きの顔の3次元モデルが生成される。
【0067】
また、本実施形態の顔の3次元モデル生成装置における各手段の一部もしくは全部の機能をコンピュータのプログラムで構成し、そのプログラムをコンピュータを用いて実行して本発明を実現することができること、本実施形態の3次元モデル生成方法における手順をコンピュータのプログラムで構成し、そのプログラムをコンピュータに実行させることができることは言うまでもなく、コンピュータでその機能を実現するためのプログラムを、そのコンピュータが読み取り可能な記録媒体、例えばFD(Floppy(登録商標) Disk)や、MO(Magneto−Optical disk)、ROM(Read Only Memory)、メモリカード、CD(Compact Disk)−ROM、DVD(Digital Versatile Disk)−ROM、CD−R、CD−RW、HDD、リムーバブルディスクなどに記録して、保存したり、配布したりすることが可能である。また、上記のプログラムをインターネットや電子メールなど、ネットワークを通して提供することも可能である。
【図面の簡単な説明】
【0068】
【図1】本発明に係る実施形態の顔の3次元モデル生成装置の構成を示すブロック図である。
【図2】本発明に係る実施形態の顔の3次元モデル生成方法のフローチャートである。
【図3】図1中の画像入力部11の入力画像列撮影状況を説明する概念図である。
【図4】図1中の眼鏡除去部12における処理の実行方法を示すフローチャートである。
【図5】図1中の裸眼の顔モデル作成部13における処理の実行方法を示すフローチャートである。
【図6】図1中の眼鏡モデル生成部14における処理の実行方法を示すフローチャートである。
【図7】図1中の眼鏡モデル生成部14で使用される眼鏡のアピアランスモデルを説明する概念図である。
【符号の説明】
【0069】
11…画像入力部、12…眼鏡除去部、13…裸眼の顔モデル生成部、14…眼鏡モデル生成部、15…相対位置計算部、16…モデル統合部、17…出力部、18…画像選択部、19…学習パターン記憶部、20…識別部、21…フレーム除去処理部、22…顔データ記憶部、23…顔の特徴点追跡部、24…顔形状情報生成部、25…顔形状モデル生成部、26…眼鏡データ記憶部、27…眼鏡フレームの特徴点追跡部、28…フレーム形状生成部、29…後処理部。

【特許請求の範囲】
【請求項1】
画像データに含まれる眼鏡の有無を識別し、眼鏡をかけている顔画像の場合、顔と眼鏡の両方の3次元モデルを生成し、眼鏡をかけていない顔画像の場合、顔だけの3次元モデルを生成する顔の3次元モデル生成装置であって、
複数枚のデジタル画像データを入力する画像入力手段と、
前記画像入力手段により入力された画像内の眼鏡フレーム部分の画素値を任意の画素値に変換して除去する眼鏡除去手段と、
前記画像入力手段により入力された入力画像列から裸眼の顔の3次元モデルを生成する裸眼の顔モデル生成手段と、
前記画像入力手段により入力された入力画像列から眼鏡の3次元モデルを生成する眼鏡モデル生成手段と、
前記裸眼の顔の3次元モデルと前記眼鏡の3次元モデルの相対3次元位置を計算する相対位置計算手段と、
前記裸眼の顔の3次元モデルの座標系と前記眼鏡の3次元モデルの座標系を、前記相対位置計算手段により計算された相対3次元位置情報をもとに統合するモデル統合手段と、
前記統合結果をデジタルデータとして出力する出力手段とを備えることを特徴とする顔の3次元モデル生成装置。
【請求項2】
請求項1に記載の顔の3次元モデル生成装置において、
前記眼鏡除去手段は、
前記入力画像列から任意の画像を選択する画像選択手段と、
事前に学習しておいた学習パターンを蓄積しておく学習パターン記憶手段と、
前記学習パターン記憶手段から学習パターンを読み込み、前記画像選択手段により選択された画像内の眼鏡の有無を識別する識別手段と、
前記画像選択手段により選択された画像中の眼鏡フレーム部分の画素値を任意の画素値に変換して除去するフレーム除去処理手段とを有することを特徴とする顔の3次元モデル生成装置。
【請求項3】
請求項1又は2に記載の顔の3次元モデル生成装置において、
前記裸眼の顔モデル生成手段は、
事前に作成した一つないしは複数の顔データを蓄積しておく顔データ記憶手段と、
前記顔データ記憶手段から顔データを読み込み、前記画像入力手段により入力された入力画像列の特徴点追跡を行う顔の特徴点追跡手段と、
前記顔の特徴点追跡手段による特徴点の追跡結果から顔の3次元形状情報を算出する顔形状情報生成手段と、
前記算出された顔の3次元形状情報に基づく3次元形状モデルに、前記眼鏡除去手段によりフレームが除去された顔画像のテクスチャを貼り付ける顔形状モデル生成手段とを有することを特徴とする顔の3次元モデル生成装置。
【請求項4】
請求項1ないし3のいずれか1項に記載の顔の3次元モデル生成装置において、
前記眼鏡モデル生成手段は、
事前に作成した一つないしは複数の眼鏡データを蓄積しておく眼鏡データ記憶手段と、
前記眼鏡データ記憶手段から眼鏡データを読み込み、前記画像入力手段により入力された入力画像列の特徴点追跡を行う眼鏡フレームの特徴点追跡手段と、
前記眼鏡フレームの特徴点追跡手段による特徴点の追跡結果から眼鏡フレームの3次元形状情報を算出するフレーム形状生成手段と、
前記算出された眼鏡フレームの3次元形状情報に基づく眼鏡フレームの3次元形状モデルに、眼鏡フレームのテクスチャを貼り付け、眼鏡フレーム内部に眼鏡のレンズ形状を生成する後処理手段とを有することを特徴とする顔の3次元モデル生成装置。
【請求項5】
画像データに含まれる眼鏡の有無を識別し、眼鏡をかけている顔画像の場合、顔と眼鏡の両方の3次元モデルを生成し、眼鏡をかけていない顔画像の場合、顔だけの3次元モデルを生成する顔の3次元モデル生成方法であって、
画像入力手段が、複数枚のデジタル画像データを入力する画像入力ステップと、
眼鏡除去手段が、前記画像入力ステップにより入力された画像内の眼鏡フレーム部分の画素値を任意の画素値に変換して除去する眼鏡除去ステップと、
裸眼の顔モデル生成手段が、前記画像入力ステップにより入力された入力画像列から裸眼の顔の3次元モデルを生成する裸眼の顔モデル生成ステップと、
眼鏡モデル生成手段が、前記画像入力ステップにより入力された入力画像列から眼鏡の3次元モデルを生成する眼鏡モデル生成ステップと、
相対位置計算手段が、前記裸眼の顔の3次元モデルと前記眼鏡の3次元モデルの相対3次元位置を計算する相対位置計算ステップと、
モデル統合手段が、前記裸眼の顔の3次元モデルの座標系と前記眼鏡の3次元モデルの座標系を、前記相対位置計算ステップにより計算された相対3次元位置情報をもとに統合するモデル統合ステップと、
出力手段が、前記統合結果をデジタルデータとして出力する出力ステップとを備えることを特徴とする顔の3次元モデル生成方法。
【請求項6】
請求項5に記載の顔の3次元モデル生成方法において、
前記眼鏡除去ステップは、
画像選択手段が、前記入力画像列から任意の画像を選択する画像選択ステップと、
識別手段が、事前に学習しておいた学習パターンを蓄積しておく学習パターン記憶手段から学習パターンを読み込み、前記画像選択ステップにより選択された画像内の眼鏡の有無を識別する識別ステップと、
フレーム除去処理手段が、前記画像選択ステップにより選択された画像中の眼鏡フレーム部分の画素値を任意の画素値に変換して除去するフレーム除去処理ステップとを有することを特徴とする顔の3次元モデル生成方法。
【請求項7】
請求項5又は6に記載の顔の3次元モデル生成方法において、
前記裸眼の顔モデル生成ステップは、
顔の特徴点追跡手段が、事前に作成した一つないしは複数の顔データを蓄積しておく顔データ記憶手段から顔データを読み込み、前記画像入力ステップにより入力された入力画像列の特徴点追跡を行う顔の特徴点追跡ステップと、
顔形状情報生成手段が、前記顔の特徴点追跡ステップによる特徴点の追跡結果から顔の3次元形状情報を算出する顔形状情報生成ステップと、
顔形状モデル生成手段が、前記算出された顔の3次元形状情報に基づく3次元形状モデルに、前記眼鏡除去ステップによりフレームが除去された顔画像のテクスチャを貼り付ける顔形状モデル生成ステップとを有することを特徴とする顔の3次元モデル生成方法。
【請求項8】
請求項5ないし7のいずれか1項に記載の顔の3次元モデル生成方法において、
前記眼鏡モデル生成ステップは、
眼鏡フレームの特徴点追跡手段が、事前に作成した一つないしは複数の眼鏡データを蓄積しておく眼鏡データ記憶手段から眼鏡データを読み込み、前記画像入力ステップにより入力された入力画像列の特徴点追跡を行う眼鏡フレームの特徴点追跡ステップと、
フレーム形状生成手段が、前記眼鏡フレームの特徴点追跡ステップによる特徴点の追跡結果から眼鏡フレームの3次元形状情報を算出するフレーム形状生成ステップと、
後処理手段が、前記算出された眼鏡フレームの3次元形状情報に基づく眼鏡フレームの3次元形状モデルに、眼鏡フレームのテクスチャを貼り付け、眼鏡フレーム内部に眼鏡のレンズ形状を生成する後処理ステップとを有することを特徴とする顔の3次元モデル生成方法。
【請求項9】
コンピュータを請求項1ないし4のいずれか1項に記載の各手段として機能させる顔の3次元モデル生成プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2010−72910(P2010−72910A)
【公開日】平成22年4月2日(2010.4.2)
【国際特許分類】
【出願番号】特願2008−239169(P2008−239169)
【出願日】平成20年9月18日(2008.9.18)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】