肌色領域の抽出方法
【課題】対象画像に多様な肌色が含まれる場合でも、精度良く肌色領域を抽出しうる方法を提供する。
【解決手段】サンプル画像中の肌色領域における各画素について、色相Hおよび彩度Sに関してヒストグラムを生成する。ついで、ヒストグラムを、複数のガウスモデルを有するガウス混合モデルにより近似する。ついで、対象画像中の画素についての色差信号(H,S)を、ガウスモデルにおける対応値を用いて1次元情報に変換する。ついで、この1次元情報の値を変化させる。このときの、当該ガウスモデルにおいて対応する画素数の増加量を計算する。この増加量がほぼ最小となる1次元情報の値をしきい値とする。しきい値で決定される範囲に含まれる一次元情報を有する画素を、対象画像から選択する。これにより、対象画像から肌色領域を抽出できる。
さらに、抽出した肌色領域の構造情報を用いることにより、肌色領域から顔領域を選別することもできる。
【解決手段】サンプル画像中の肌色領域における各画素について、色相Hおよび彩度Sに関してヒストグラムを生成する。ついで、ヒストグラムを、複数のガウスモデルを有するガウス混合モデルにより近似する。ついで、対象画像中の画素についての色差信号(H,S)を、ガウスモデルにおける対応値を用いて1次元情報に変換する。ついで、この1次元情報の値を変化させる。このときの、当該ガウスモデルにおいて対応する画素数の増加量を計算する。この増加量がほぼ最小となる1次元情報の値をしきい値とする。しきい値で決定される範囲に含まれる一次元情報を有する画素を、対象画像から選択する。これにより、対象画像から肌色領域を抽出できる。
さらに、抽出した肌色領域の構造情報を用いることにより、肌色領域から顔領域を選別することもできる。
【発明の詳細な説明】
【0001】
【発明の属する技術分野】
本発明は、画像から肌色領域を抽出する方法に関するものである。
【0002】
【背景技術】
写真などの画像から顔の領域を検出する技術は、既に知られている。この検出によって、個人認証や、顔を含む画像の検索が可能になると考えられる。
【0003】
従来提案されている検出技術としては、顔の構造情報や肌の色情報を用いるものがある。肌色情報を用いる検出技術は、顔領域の候補を選別する手段として優れている。しかしながら、従来の技術では、人種や陰影に基づく色の変動があると、顔領域の検出精度がかなり低下してしまうという問題があった。
【0004】
【発明が解決しようとする課題】
本発明は、前記の事情に鑑みてなされたものである。本発明の目的は、対象画像の条件が多様であっても、精度良く肌色領域を抽出しうる方法を提供することである。
【0005】
【課題を解決するための手段】
本発明に係る肌色領域の抽出方法は、次のステップを含んでいる。
(1)サンプル画像中の肌色領域における各画素について、二つの色差信号に関してヒストグラムを生成するステップ;
(2)前記ヒストグラムを、複数のガウスモデルを有するガウス混合モデルにより近似するステップ;
(3)対象画像中の画素についての、二つの色差信号を、ガウスモデルにおける対応値を用いて1次元情報に変換し、ついで、前記1次元情報の値を変化させたときの画素数の増加量がほぼ最小となる前記1次元情報の値をしきい値とするステップ;および
(4)前記しきい値で決定される範囲に含まれる前記1次元情報を有する画素を、前記対象画像から選択することにより、前記対象画像から肌色領域を抽出するステップ。
【0006】
前記1次元情報は、前記ガウスモデルにおける値であって、かつ、前記対象画像の画素における二つの色差信号に対応する値が最大となるものとすることができる。
【0007】
前記ステップ(3)における前記画素数の増加量を、互いに同じガウスモデルにより1次元情報に変換された画素におけるものとし、
前記しきい値を、このガウスモデルを示す情報と関連付け、
前記ステップ(4)において対象画像から選択される画素を、互いに同じガウスモデルにより1次元情報に変換された画素中から、このガウスモデルと関連づけられたしきい値によって選択する、
ことができる。
【0008】
本発明に係る肌色領域の抽出方法は、次のステップを含む構成であってもよい。
(1)対象画像の全部または一部の領域における各画素を、その画素におけるCbおよびCrの値を用いて複数のクラスタに分解するステップ;および
(2)前記複数のクラスタのうち、他に比較してCrが大でCbが小であるクラスタに属する画素が位置する領域を前記肌色領域とするステップ。
このステップ(1)における一部の領域は、前記した本発明の方法により抽出された肌色領域であってもよい。
前記対象画像は、RGB空間からYCbCr空間に変換されることにより得られたものであってもよい。
前記複数のクラスタの数は例えば2である。
【0009】
前記した本発明の抽出方法により抽出された肌色領域の構造情報を用いて、顔領域である肌色領域を抽出することもできる。
【0010】
本発明に係る肌色領域の抽出方法は、次のステップを含む構成であってもよい。
(1)サンプル画像中の肌色領域における各画素について、二つの色差信号に関してヒストグラムを生成するステップ;
(2)前記ヒストグラムを、複数のガウスモデルを有するガウス混合モデルにより近似するステップ;
(3)対象画像中の画素における前記色差信号に対応する、前記ガウスモデルでの値に基づいて、しきい値を生成するステップ;および
(4)前記しきい値で決定される範囲に含まれる前記画素を、前記対象画像から選択することにより、前記対象画像から肌色領域を抽出するステップ。
【0011】
本発明に係るコンピュータプログラムは、前記したいずれかの抽出方法におけるステップをコンピュータで実行するためのものである。
本発明に係る記録媒体は、このコンピュータプログラムを記録し、かつ、コンピュータで読み取り可能なものである。
【0012】
本発明に係る肌色領域の抽出装置は、しきい値生成部と、皮膚領域候補抽出部とを備えており、前記しきい値生成部は、下記(1)〜(3)のステップを実行し、前記皮膚領域候補抽出部は、下記(4)のステップを実行することを特徴とするものである。
(1)サンプル画像中の肌色領域における各画素について、二つの色差信号に関してヒストグラムを生成するステップ;
(2)前記ヒストグラムを、複数のガウスモデルを有するガウス混合モデルにより近似するステップ;
(3)対象画像中の画素についての、二つの色差信号を、ガウスモデルにおける対応値を用いて1次元情報に変換し、ついで、前記1次元情報の値を変化させたときの画素数の増加量がほぼ最小のときの前記しきい値候補をしきい値とするステップ;
(4)前記しきい値で決定される範囲に含まれる前記一次元情報を有する画素を、前記対象画像から選択することにより、前記対象画像から肌色領域を抽出するステップ。
【0013】
本発明に係る肌色領域の抽出装置は、対象画像における画素を判定するためのしきい値を生成するしきい値生成部を備え、前記しきい値生成部は、下記(1)〜(3)のステップを実行することを特徴とするものであってもよい。
(1)サンプル画像中の肌色領域における各画素について、二つの色差信号に関してヒストグラムを生成するステップ;
(2)前記ヒストグラムを、複数のガウスモデルを有するガウス混合モデルにより近似するステップ;および
(3)対象画像中の画素についての、二つの色差信号を、ガウスモデルにおける対応値を用いて1次元情報に変換し、ついで、前記1次元情報の値を変化させたときの画素数の増加量がほぼ最小のときの前記しきい値候補をしきい値とするステップ。
【0014】
本発明に係る肌色領域の抽出装置は、以下のステップを実行する顔領域候補抽出部を備えた構成であってもよい。
(1)対象画像の全部または一部の領域における各画素を、各画素におけるCbおよびCrの値を用いて複数のクラスタに分解するステップ;および
(2)前記複数のクラスタのうち、他に比較してCrが大でCbが小であるクラスタに属する画素が位置する領域を前記肌色領域とするステップ。
【0015】
前記抽出装置は、さらに顔領域抽出部を備えていてもよい。この顔領域抽出部は、肌色領域における構造情報を用いて、顔領域である肌色領域を抽出するものである。
【0016】
【発明の実施の形態】
本発明の一実施形態に係る、肌色領域の抽出方法を、添付の図面を参照しながら説明する。まず、本実施形態の抽出方法に用いる装置の構成を図1に基づいて説明する。なお、この明細書では、用語の概念として、肌色領域は皮膚領域候補を含み、皮膚領域候補は顔領域候補(すなわち皮膚領域)を含み、顔領域候補は顔領域を含む意味で用いる。
【0017】
この装置は、画像情報取得部1と、色空間変換部2と、しきい値生成部3と、皮膚領域候補抽出部4と、顔領域候補抽出部5と、顔領域抽出部6とを備えている。画像情報取得部1は、対象画像の情報を入力として取得する部分である。対象画像情報としては、通常は、RGB空間におけるRGB信号である。色空間変換部2は、対象画像を、輝度信号と二つの色差信号とを持つ色空間に変換する部分である。色空間としては、二つの色差信号を持つものであればよい。本実施形態では、そのような色空間としてHSV空間を用い、二つの色差信号としてH(色相)、S(彩度)を用いる例を説明する。二つの色差信号を持つ色空間としては、HSVの他にも、均等色空間としてのCIE LAB(L*a*b*)、CIE LUV(L*u*v*)や、さらには、[Y,R−Y,B−Y]、[Y,I,Q]などを用いることができる。
【0018】
しきい値生成部3は、画像情報を構成する画素を、肌色領域のものとそうでないものとに区別するためのしきい値を生成するものである。このしきい値の生成方法は後述する。
【0019】
皮膚領域候補抽出部4は、しきい値で規定される範囲に含まれる画素を対象画像から選択することにより、前記対象画像から肌色領域を抽出する機能を実行するものである。この動作の詳細も後述する。
【0020】
顔領域候補抽出部5は、皮膚領域候補抽出部4で得られた皮膚領域候補を絞り込むとともに、顔領域と髪領域とを判別するものである。その方法については後述する。
【0021】
顔領域抽出部6は、顔領域候補抽出部5で得られた顔領域候補(すなわち皮膚領域)から、構造的な特徴に基づいて、顔領域を抽出(選別)するものである。具体的な抽出方法は後述する。
【0022】
つぎに、本実施形態における肌色領域の抽出方法を説明する。まず、画像情報取得部1が、入力としての対象画像を取得する。この対象画像は、この実施形態では、RGB空間におけるRGB信号で表されているものとする。ついで、色空間変換部2により、RGB信号をHSV信号に変換する。これにより、対象画像から二つの色差信号(H,S)を生成することができる。RGB空間からHSV空間への変換式は周知であるが、念のため下記に示す。
【0023】
ついで、皮膚領域候補抽出部4において、HSV信号としての対象画像を用いて、皮膚領域候補を抽出する。本実施形態では、この抽出の前に、しきい値生成部3により、しきい値を生成する。そこで、まず、しきい値の生成方法を図2に基づいて説明する。
【0024】
(しきい値の生成)
まず、RGB空間における、複数のサンプル画像を取得する(ステップ2−1)。サンプル画像としては、人の顔を含むものを用いる。また、サンプル画像に含まれる顔としては、人種、年齢、性別、日焼けの程度、陰影などの条件がなるべく多様であることが好ましい。ついで、RGB信号をHSV信号に変換する(ステップ2−2)。この変換式は前記したものと同様である。
【0025】
ついで、サンプル画像のなかで、顔領域(すなわち肌色領域)における画素を選択する(ステップ2−3)。サンプル画像においては、顔領域は既知である。
【0026】
ついで、サンプル画像中の顔領域における各画素について、二つの色差信号である色相(H)および彩度(S)に関してヒストグラムを生成する(ステップ2−4)。ヒストグラムの例を図3に示す。図3(b)および(c)は、図3(a)のグラフを色相または彩度のみの一次元で表したものである。
【0027】
ついで、ヒストグラムをガウス混合モデルにより近似する(ステップ2−5)。ガウス混合モデルは以下のように表される。
ここで、
k:ガウスモデルの混合数(この実施形態では4)、
θ:一つのガウスモデルに対応するパラメータαi、μi等のセット(この実施形態では4セット)、
である。
【0028】
ヒストグラムをガウス混合モデルで近似した結果を図4に示す。この例では、ガウスモデルの混合数を4としている。HまたはSについてガウス混合モデル(図4(b)および(c)参照)を生成した後、それを組み合わせることで、図4(a)に示すような3次元のガウス混合モデルを得ることができる。
ガウス混合モデルは、例えば
(1)S. McKenna, S. Gong, and Y. Raja. Modelling Facial Colour and Identity with Gaussian Mixtures. Pattern Recognition, 31(12):1883−1892, 1998.
(2)H.P. Graf, E. Cosatto, D. Gibbon, M. Kocheisen, and E. Petajan. Multimodel System for Locating Heads and Faces. In Proceedings of the Second IEEE International Conference on Automatic Face and Gesture Recognition, pages 88−93, 1996.
に記載されているように、良く知られているので、これ以上詳細な説明は省略する。
【0029】
ついで、対象画像中の各画素xiについての、二つの色差信号(H,S)を、ガウスモデルにおける対応値を用いて1次元情報に変換する(ステップ2−6)。具体的には、画素xiにおける色差信号の組(H,S)に対し、ガウス混合モデルにおいて最も大きい値φiを求める。このφiが、この実施形態における1次元情報となる。φiは、ヒストグラムの値をそのまま用いれば頻度値となる。ただし、φiとしては、頻度値から得られる他の値であっても良い。例えば、頻度値をヒストグラムの最大値で正規化した値をφiとして用いても良い。この場合は、φiは確率を表すことになる。φiは、それ自体が頻度値であるか正規化された確率であるかに拘わらず、実質的には、肌色である確率を示す尤度値を意味することになる。よって、この明細書では、φiを尤度値と称することがある。さらに、このφiを与えるガウスモデルを示す情報(すなわちガウスモデルのラベル)l(lは1〜kのいずれかの整数)を求める。この実施形態では、前記した通り、k=4である。これにより、各画素xiについて、尤度値φiとラベルlの組を情報として付与する(ステップ2−7)。具体的には、例えば、φiとlとをxiに対応させて、テーブルに格納する。
【0030】
ついで、1次元情報におけるしきい値候補の値を変化させたときの画素数の増加量がほぼ最小のときのしきい値候補をしきい値とする(ステップ2−8)。このステップを、図5および図6を参照しながら、以下に詳述する。
【0031】
まず、ガウスモデルのラベルlに関連づけられた画素(群)xiを考える。ついで、これらの画素xiについての尤度値φiの最大値(またはそれに近い値)φimaxからΔTlだけ小さい値をしきい値候補Tlとする(図5参照)。ついで、しきい値候補Tl以上の尤度値φiを持つ、ラベルlの画素xiの数を数える。例えば、このときの画素の例は、図6(a)のようになる。ついで、しきい値候補TlをΔTlだけずらし、再び、しきい値候補Tl以上の尤度値φiを有する、ラベルlの画素xiを数える。例えば、このときの画素の例は、図6(b)のようになる。ΔTlは、この実施形態では一定量とする。ΔTlだけしきい値候補Tlをずらしながら、前記の計算を行う。このようにして、1次元情報φiを用いて、しきい値候補Tlの値に対応する画素の増加量をそれぞれ求めることができる。例えば、図6(a)における画素数をA1、図6(b)における画素数をA2とすれば、増加量はA2−A1として求めることができる。このようにして求めた、しきい値候補と画素の増加量との関係を図5に示す。
【0032】
ついで、画素数の増加量がほぼ最小となる尤度値(つまり1次元情報の値)をしきい値Tl0とする。この実施形態では、しきい値候補Tlと画素増加量との関係を求めているが、これと等価な方法として、しきい値候補Tlの変化量ΔTlと、その範囲に含まれる画素数との関係を求めることにより、しきい値Tl0を求めることもできる。この場合は、変化量ΔTlの幅に含まれる画素数が、前記した画素数の増加量を意味することになる。
【0033】
本実施形態では、結局、対象画像中の画素における色差信号(H,S)に対応する、ガウスモデルでの値φiに基づいて、しきい値が生成されていることになる。
【0034】
(皮膚候補領域の抽出)
ついで、このしきい値を用いて、皮膚領域候補抽出部4(図1参照)において、対象画像から皮膚領域候補を抽出する。この抽出は、しきい値Tl0で決定される範囲に含まれる一次元情報(尤度値)を有する、ラベルlを有する画素xiを、対象画像から選択することにより行われる。
【0035】
この抽出手順を図7に示す。まず、ラベルlと関連づけられた画素xiに対して、そのラベルlに対応するしきい値Tlを適用する(ステップ7−1)。ここでは、画素xiの尤度値がしきい値Tlより大きければ1、小さければ0を出力することで2値化する。また、例えば、画素xiの尤度値がしきい値Tlより大きければ、1でなくlを出力することもできる。このようにすれば、2値化と同時に、ラベルの情報も出力できるという利点がある。
【0036】
ついで、2値化の結果が1であるか否かを判断する(ステップ7−2)。もちろん0であるか否かを判断しても良いことは当然である。1であれば、その画素を皮膚領域候補の画素とする(ステップ7−3)。1でなければ皮膚領域候補としない(ステップ7−4)。この判定を各画素について行う。
【0037】
本実施形態によれば、しきい値に基づいて対象画像から画素を選択することにより、この画素に基づいて、対象画像から肌色領域(皮膚領域候補)を抽出することができる。従来は、皮膚領域かどうかを判定するしきい値を固定していたために、対象画像における条件が変化すると検出精度が劣化するという問題があった。これに対して、この実施形態の方法では、前記のように、対象画像から適応的にしきい値を生成している。例えば、この実施形態では、対象画像が異なれば、しきい値候補Tlの変化量ΔTlに対応する画素数は異なる。したがって、対象画像毎に、各ガウスモデルlに対応して別のしきい値を決めることができる。この結果、対象画像の明るさが変動したり、様々な肌色の人物が存在しても、それらの条件に対応してしきい値を生成することができる。これにより、この実施形態では、肌色領域を適切に抽出することが可能となる。
【0038】
このようにして画素を選択した結果を図8(b)に示す。同図(a)は対象画像である。図8(b)では、選択された画素を白で示し、選択されなかった画素を黒で示している。
【0039】
(顔領域候補の抽出…絞り込み)
つぎに、顔領域候補抽出部5において、皮膚領域候補の絞り込みを行う。絞り込みの手順を図9に基づいて説明する。まず、メディアンフィルタ(図示せず)により、孤立画素を除去する(ステップ9−1)。メディアンフィルタとしては、例えば3×3画素の範囲でのものを用いることができる。これにより皮膚領域候補の画像からノイズを除去することができる。処理結果の例を図8(c)に示す。ついで、各領域についてラベルを付与するというラベリングを行う(ステップ9−2)。ついで、各領域について画素数を算出し、面積の小さい領域を除去する(ステップ9−3)。具体的には、例えば、各領域内の面積(例えば画素数)を求める。ついで、それらの平均値を計算する。ついで、平均値のa%(aは例えば3)よりも面積が小さい領域を除去する。小領域を除去した結果の例を図8(d)に示す。
【0040】
ついで、領域に対してモルフォロジー処理を行う(ステップ9−4)。モルフォロジー処理は、幅の狭い凹部を除去して、輪郭を滑らかにするものである。処理結果の例を図8(e)に示す。ついで、穴埋め処理を行う(ステップ9−5)。穴埋め処理とは、領域内にある穴(例えば目や鼻の穴に相当する)を埋めておく処理である。処理結果の例を図8(f)に示す。また、このようにして抽出された領域の画像を図8(g)に示す。
これらの、図9に示した各処理は、いずれもそれ自体としては周知なので、これ以上の説明は省略する。
【0041】
これらの処理により、皮膚領域候補を、一定以上の大きさの領域とする(つまり絞り込む)ことができる。絞り込まれた皮膚領域候補の画像は、この実施形態では、RGB信号で保存しておく。
【0042】
(顔領域候補の抽出…髪領域と皮膚領域との分離)
ついで、顔領域候補抽出部5において、さらに、絞り込まれた皮膚領域候補画像における髪の毛の領域と皮膚領域とを分離する。分離する手順を図10を用いて説明する。このような分離を行う理由は、色相と彩度を用いた分離方法では、髪の毛の領域と皮膚領域との分離が難しいためである。例えば、図11(a)、図12(a)および図13(a)に示した画像例では、色相と彩度を用いた場合、前記した手順を適用すると、図11(b)、図12(b)および図13(b)に示されるような領域が抽出される。これらの図において、顔の周囲における白線が領域を示している。また、これらの画像における色相と彩度の関係を図11(c)、図12(c)および図13(c)に示す。図中、毛髪部分の画素を十字で、皮膚部分の画素をドット(図においてはつぶれている)で示している。これらからも、色相と彩度とを用いた場合、髪の毛と皮膚とを分離しがたいことが判る。
【0043】
そこで、この実施形態では、まず、RGB空間における皮膚領域候補の画像をYCbCr空間における画像に変換する(ステップ10−1)。つまり、RGB信号をYCbCr信号に変換する。変換式は周知なので説明を省略する。
【0044】
ついで、各画素について、CbおよびCrにおけるヒストグラムを生成する(ステップ10−2)。例えば、図11、図12および図13に示した各画像におけるヒストグラムの例を図14〜図16に示す。ここでも、髪の毛部分の画素を十字で、皮膚部分の画素をドットで示している。このように、CbおよびCrにおけるヒストグラムを用いると、複数(ここでは二つ)のクラスタに分解することができる。
【0045】
ついで、一方のクラスタを選択する(ステップ10−3)。図14〜図16の例から明らかなように、一般に、肌色領域は、Crが大でCbが小となるので、その性質を有するクラスタを選択する。
【0046】
ついで、選択したクラスタに属する画素を抽出する(ステップ10−4)。ついで、抽出した画素から孤立画素を除去することにより、ノイズを除去する(ステップ10−5)。これにより、顔領域候補を抽出することができる(ステップ10−6)。
【0047】
このように、本実施形態によれば、顔領域と毛髪領域とを、CbおよびCrの値に対応したクラスタを用いて分別しているので、顔領域の候補画像を精度良く抽出することが可能となる。
【0048】
(顔領域の抽出)
以上の段階では、色情報に基づいて肌色領域を抽出した。しかし、以上の処理だけでは、顔以外の皮膚領域(例えば腕)を除外することは難しい。そこで、顔領域検出部6において、顔領域を抽出(選別)する。その手順を図17に基づいて説明する。
【0049】
まず、領域の形状が、所定の範囲内の楕円形か否かを判定する(ステップ17−1)。つまり、(短軸長さ/長軸長さ)が所定値の範囲内(例えば0.4より大きい)か否かを判断する。範囲外であれば、その領域は顔領域としない(ステップ17−2)。
【0050】
領域形状が所定範囲内の楕円であれば、両眼が存在するか否かを判定する(ステップ17−3)。ここでは、まず、色情報から、眼の候補領域を求める。通常、前記したYCbCr信号におけるクラスタリングを用いると、眼領域は、髪領域と同様に、肌色領域から区別できる。さらに、眼領域は、大きさ等の構造情報を用いて髪領域から分離できる。こうして得た眼領域が、所定の規則に合致するかどうかを判断する。規則とは、例えば、眼領域が短軸の上方にあるか、眼領域は短軸とほぼ平行な線上にあるか、両眼が長軸の一側に寄っていないか等の構造的な規則である。このようにして、色情報に基づいて抽出した領域を候補として、眼領域の有無を調べる。眼領域が存在すれば、その顔領域候補を顔領域とする(ステップ17−4)。
【0051】
色情報に基づいて眼領域を検出できないときは、ステップ17−3において、輝度情報に基づいてさらに眼領域を検出する。ここでは、輝度が低い領域を候補として抽出し、その領域の大きさや配置等の構造情報に基づいて判断する。これにより眼領域が検出できれば、その顔領域候補を顔領域とする(ステップ17−4)。
【0052】
以上の手順で眼領域が検出できなければ、その顔領域候補は顔領域としない(ステップ17−2)。
【0053】
このようにして、本実施形態により、対象画像から顔領域を抽出することができる。顔領域が決定すれば、その領域に含まれる画素から、顔の画像を得ることができる。
【0054】
前記した各実施形態の実行は、当業者にはコンピュータを用いて容易に実行可能である。そのためのプログラムは、コンピュータで読み取り可能な記録媒体、例えばHD、FD、CD、MOなど、任意のものに格納できる。
【0055】
なお、前記各実施形態の記載は単なる一例に過ぎず、本発明に必須の構成を示したものではない。各部の構成は、本発明の趣旨を達成できるものであれば、上記に限らない。
また、各実施形態を実現するための各部(機能ブロックを含む)の具体的手段は、ハードウエア、ソフトウエア、ネットワーク、これらの組み合わせ、その他の任意の手段を用いることができ、このこと自体は当業者において自明である。さらに、機能ブロックどうしが複合して一つの機能ブロックに集約されても良い。また、一つの機能ブロックの機能が複数の機能ブロックの協働により実現されても良い。
【0056】
【発明の効果】
本発明によれば、対象画像の条件が多様であっても、精度良く肌色領域を抽出しうる方法を提供できる。
【図面の簡単な説明】
【図1】本発明の一実施形態に係る肌色領域抽出方法を実施するための装置の概略を示すブロック図である。
【図2】本発明の一実施形態に係る肌色領域抽出方法における、しきい値の生成手順を示すフローチャートである。
【図3】色相(H)および彩度(S)についての画素毎のヒストグラムを示すグラフであって、図(a)は2次元、図(b)は色相のみの1次元、図(c)は彩度のみの1次元で示したものである。
【図4】色相(H)および彩度(S)についての画素毎のヒストグラムをガウス混合モデルで近似した状態を示すグラフであって、図(a)は2次元、図(b)は色相のみの1次元、図(c)は彩度のみの1次元で示したものである。
【図5】しきい値生成方法を説明するためのグラフであって、縦軸は画素の増加量、横軸はしきい値(尤度値)である。
【図6】しきい値候補に対応する画素数を説明するための図であって、図(a)と図(b)は、互いに異なるしきい値候補以上の尤度値を有する画素の例を示している。
【図7】しきい値に基づく画素の抽出方法を説明するためのフローチャートである。
【図8】対象画像から肌色領域の抽出を行う過程を説明するための画像例であって、図(a)は対象画像、図(b)はしきい値を用いて抽出された領域を白色で示す図、図(c)はメディアンフィルタで処理された後の領域を示す図、図(d)は小領域を除去した後の図、図(e)はモルフォロジー処理後の図、図(f)は穴埋め後の図、図(g)は絞り込まれた領域における画像である。
【図9】皮膚領域候補の絞り込みの手順を説明するためのフローチャートである。
【図10】毛髪部分と顔部分の領域を分離する手順を説明するためのフローチャートである。
【図11】毛髪部分と顔部分の領域を分離する手順を説明するための説明図であって、図(a)は対象画像の例、図(b)は抽出された皮膚領域候補、図(c)は、皮膚領域候補における画素のヒストグラムであって、縦軸は彩度、横軸は色相である。
【図12】毛髪部分と顔部分の領域を分離する手順を説明するための説明図であって、図(a)は対象画像の他の例、図(b)は抽出された皮膚領域候補、図(c)は、皮膚領域候補における画素のヒストグラムであって、縦軸は彩度、横軸は色相である。
【図13】毛髪部分と顔部分の領域を分離する手順を説明するための説明図であって、図(a)は対象画像のさらに他の例、図(b)は抽出された皮膚領域候補、図(c)は、皮膚領域候補における画素のヒストグラムであって、縦軸は彩度、横軸は色相である。
【図14】図11に示す皮膚領域候補における画素のヒストグラムであって、縦軸はCr、横軸はCbである。
【図15】図12に示す皮膚領域候補における画素のヒストグラムであって、縦軸はCr、横軸はCbである。
【図16】図13に示す皮膚領域候補における画素のヒストグラムであって、縦軸はCr、横軸はCbである。
【図17】顔領域候補から顔領域を抽出する手順を説明するためのフローチャートである。
【0001】
【発明の属する技術分野】
本発明は、画像から肌色領域を抽出する方法に関するものである。
【0002】
【背景技術】
写真などの画像から顔の領域を検出する技術は、既に知られている。この検出によって、個人認証や、顔を含む画像の検索が可能になると考えられる。
【0003】
従来提案されている検出技術としては、顔の構造情報や肌の色情報を用いるものがある。肌色情報を用いる検出技術は、顔領域の候補を選別する手段として優れている。しかしながら、従来の技術では、人種や陰影に基づく色の変動があると、顔領域の検出精度がかなり低下してしまうという問題があった。
【0004】
【発明が解決しようとする課題】
本発明は、前記の事情に鑑みてなされたものである。本発明の目的は、対象画像の条件が多様であっても、精度良く肌色領域を抽出しうる方法を提供することである。
【0005】
【課題を解決するための手段】
本発明に係る肌色領域の抽出方法は、次のステップを含んでいる。
(1)サンプル画像中の肌色領域における各画素について、二つの色差信号に関してヒストグラムを生成するステップ;
(2)前記ヒストグラムを、複数のガウスモデルを有するガウス混合モデルにより近似するステップ;
(3)対象画像中の画素についての、二つの色差信号を、ガウスモデルにおける対応値を用いて1次元情報に変換し、ついで、前記1次元情報の値を変化させたときの画素数の増加量がほぼ最小となる前記1次元情報の値をしきい値とするステップ;および
(4)前記しきい値で決定される範囲に含まれる前記1次元情報を有する画素を、前記対象画像から選択することにより、前記対象画像から肌色領域を抽出するステップ。
【0006】
前記1次元情報は、前記ガウスモデルにおける値であって、かつ、前記対象画像の画素における二つの色差信号に対応する値が最大となるものとすることができる。
【0007】
前記ステップ(3)における前記画素数の増加量を、互いに同じガウスモデルにより1次元情報に変換された画素におけるものとし、
前記しきい値を、このガウスモデルを示す情報と関連付け、
前記ステップ(4)において対象画像から選択される画素を、互いに同じガウスモデルにより1次元情報に変換された画素中から、このガウスモデルと関連づけられたしきい値によって選択する、
ことができる。
【0008】
本発明に係る肌色領域の抽出方法は、次のステップを含む構成であってもよい。
(1)対象画像の全部または一部の領域における各画素を、その画素におけるCbおよびCrの値を用いて複数のクラスタに分解するステップ;および
(2)前記複数のクラスタのうち、他に比較してCrが大でCbが小であるクラスタに属する画素が位置する領域を前記肌色領域とするステップ。
このステップ(1)における一部の領域は、前記した本発明の方法により抽出された肌色領域であってもよい。
前記対象画像は、RGB空間からYCbCr空間に変換されることにより得られたものであってもよい。
前記複数のクラスタの数は例えば2である。
【0009】
前記した本発明の抽出方法により抽出された肌色領域の構造情報を用いて、顔領域である肌色領域を抽出することもできる。
【0010】
本発明に係る肌色領域の抽出方法は、次のステップを含む構成であってもよい。
(1)サンプル画像中の肌色領域における各画素について、二つの色差信号に関してヒストグラムを生成するステップ;
(2)前記ヒストグラムを、複数のガウスモデルを有するガウス混合モデルにより近似するステップ;
(3)対象画像中の画素における前記色差信号に対応する、前記ガウスモデルでの値に基づいて、しきい値を生成するステップ;および
(4)前記しきい値で決定される範囲に含まれる前記画素を、前記対象画像から選択することにより、前記対象画像から肌色領域を抽出するステップ。
【0011】
本発明に係るコンピュータプログラムは、前記したいずれかの抽出方法におけるステップをコンピュータで実行するためのものである。
本発明に係る記録媒体は、このコンピュータプログラムを記録し、かつ、コンピュータで読み取り可能なものである。
【0012】
本発明に係る肌色領域の抽出装置は、しきい値生成部と、皮膚領域候補抽出部とを備えており、前記しきい値生成部は、下記(1)〜(3)のステップを実行し、前記皮膚領域候補抽出部は、下記(4)のステップを実行することを特徴とするものである。
(1)サンプル画像中の肌色領域における各画素について、二つの色差信号に関してヒストグラムを生成するステップ;
(2)前記ヒストグラムを、複数のガウスモデルを有するガウス混合モデルにより近似するステップ;
(3)対象画像中の画素についての、二つの色差信号を、ガウスモデルにおける対応値を用いて1次元情報に変換し、ついで、前記1次元情報の値を変化させたときの画素数の増加量がほぼ最小のときの前記しきい値候補をしきい値とするステップ;
(4)前記しきい値で決定される範囲に含まれる前記一次元情報を有する画素を、前記対象画像から選択することにより、前記対象画像から肌色領域を抽出するステップ。
【0013】
本発明に係る肌色領域の抽出装置は、対象画像における画素を判定するためのしきい値を生成するしきい値生成部を備え、前記しきい値生成部は、下記(1)〜(3)のステップを実行することを特徴とするものであってもよい。
(1)サンプル画像中の肌色領域における各画素について、二つの色差信号に関してヒストグラムを生成するステップ;
(2)前記ヒストグラムを、複数のガウスモデルを有するガウス混合モデルにより近似するステップ;および
(3)対象画像中の画素についての、二つの色差信号を、ガウスモデルにおける対応値を用いて1次元情報に変換し、ついで、前記1次元情報の値を変化させたときの画素数の増加量がほぼ最小のときの前記しきい値候補をしきい値とするステップ。
【0014】
本発明に係る肌色領域の抽出装置は、以下のステップを実行する顔領域候補抽出部を備えた構成であってもよい。
(1)対象画像の全部または一部の領域における各画素を、各画素におけるCbおよびCrの値を用いて複数のクラスタに分解するステップ;および
(2)前記複数のクラスタのうち、他に比較してCrが大でCbが小であるクラスタに属する画素が位置する領域を前記肌色領域とするステップ。
【0015】
前記抽出装置は、さらに顔領域抽出部を備えていてもよい。この顔領域抽出部は、肌色領域における構造情報を用いて、顔領域である肌色領域を抽出するものである。
【0016】
【発明の実施の形態】
本発明の一実施形態に係る、肌色領域の抽出方法を、添付の図面を参照しながら説明する。まず、本実施形態の抽出方法に用いる装置の構成を図1に基づいて説明する。なお、この明細書では、用語の概念として、肌色領域は皮膚領域候補を含み、皮膚領域候補は顔領域候補(すなわち皮膚領域)を含み、顔領域候補は顔領域を含む意味で用いる。
【0017】
この装置は、画像情報取得部1と、色空間変換部2と、しきい値生成部3と、皮膚領域候補抽出部4と、顔領域候補抽出部5と、顔領域抽出部6とを備えている。画像情報取得部1は、対象画像の情報を入力として取得する部分である。対象画像情報としては、通常は、RGB空間におけるRGB信号である。色空間変換部2は、対象画像を、輝度信号と二つの色差信号とを持つ色空間に変換する部分である。色空間としては、二つの色差信号を持つものであればよい。本実施形態では、そのような色空間としてHSV空間を用い、二つの色差信号としてH(色相)、S(彩度)を用いる例を説明する。二つの色差信号を持つ色空間としては、HSVの他にも、均等色空間としてのCIE LAB(L*a*b*)、CIE LUV(L*u*v*)や、さらには、[Y,R−Y,B−Y]、[Y,I,Q]などを用いることができる。
【0018】
しきい値生成部3は、画像情報を構成する画素を、肌色領域のものとそうでないものとに区別するためのしきい値を生成するものである。このしきい値の生成方法は後述する。
【0019】
皮膚領域候補抽出部4は、しきい値で規定される範囲に含まれる画素を対象画像から選択することにより、前記対象画像から肌色領域を抽出する機能を実行するものである。この動作の詳細も後述する。
【0020】
顔領域候補抽出部5は、皮膚領域候補抽出部4で得られた皮膚領域候補を絞り込むとともに、顔領域と髪領域とを判別するものである。その方法については後述する。
【0021】
顔領域抽出部6は、顔領域候補抽出部5で得られた顔領域候補(すなわち皮膚領域)から、構造的な特徴に基づいて、顔領域を抽出(選別)するものである。具体的な抽出方法は後述する。
【0022】
つぎに、本実施形態における肌色領域の抽出方法を説明する。まず、画像情報取得部1が、入力としての対象画像を取得する。この対象画像は、この実施形態では、RGB空間におけるRGB信号で表されているものとする。ついで、色空間変換部2により、RGB信号をHSV信号に変換する。これにより、対象画像から二つの色差信号(H,S)を生成することができる。RGB空間からHSV空間への変換式は周知であるが、念のため下記に示す。
【0023】
ついで、皮膚領域候補抽出部4において、HSV信号としての対象画像を用いて、皮膚領域候補を抽出する。本実施形態では、この抽出の前に、しきい値生成部3により、しきい値を生成する。そこで、まず、しきい値の生成方法を図2に基づいて説明する。
【0024】
(しきい値の生成)
まず、RGB空間における、複数のサンプル画像を取得する(ステップ2−1)。サンプル画像としては、人の顔を含むものを用いる。また、サンプル画像に含まれる顔としては、人種、年齢、性別、日焼けの程度、陰影などの条件がなるべく多様であることが好ましい。ついで、RGB信号をHSV信号に変換する(ステップ2−2)。この変換式は前記したものと同様である。
【0025】
ついで、サンプル画像のなかで、顔領域(すなわち肌色領域)における画素を選択する(ステップ2−3)。サンプル画像においては、顔領域は既知である。
【0026】
ついで、サンプル画像中の顔領域における各画素について、二つの色差信号である色相(H)および彩度(S)に関してヒストグラムを生成する(ステップ2−4)。ヒストグラムの例を図3に示す。図3(b)および(c)は、図3(a)のグラフを色相または彩度のみの一次元で表したものである。
【0027】
ついで、ヒストグラムをガウス混合モデルにより近似する(ステップ2−5)。ガウス混合モデルは以下のように表される。
ここで、
k:ガウスモデルの混合数(この実施形態では4)、
θ:一つのガウスモデルに対応するパラメータαi、μi等のセット(この実施形態では4セット)、
である。
【0028】
ヒストグラムをガウス混合モデルで近似した結果を図4に示す。この例では、ガウスモデルの混合数を4としている。HまたはSについてガウス混合モデル(図4(b)および(c)参照)を生成した後、それを組み合わせることで、図4(a)に示すような3次元のガウス混合モデルを得ることができる。
ガウス混合モデルは、例えば
(1)S. McKenna, S. Gong, and Y. Raja. Modelling Facial Colour and Identity with Gaussian Mixtures. Pattern Recognition, 31(12):1883−1892, 1998.
(2)H.P. Graf, E. Cosatto, D. Gibbon, M. Kocheisen, and E. Petajan. Multimodel System for Locating Heads and Faces. In Proceedings of the Second IEEE International Conference on Automatic Face and Gesture Recognition, pages 88−93, 1996.
に記載されているように、良く知られているので、これ以上詳細な説明は省略する。
【0029】
ついで、対象画像中の各画素xiについての、二つの色差信号(H,S)を、ガウスモデルにおける対応値を用いて1次元情報に変換する(ステップ2−6)。具体的には、画素xiにおける色差信号の組(H,S)に対し、ガウス混合モデルにおいて最も大きい値φiを求める。このφiが、この実施形態における1次元情報となる。φiは、ヒストグラムの値をそのまま用いれば頻度値となる。ただし、φiとしては、頻度値から得られる他の値であっても良い。例えば、頻度値をヒストグラムの最大値で正規化した値をφiとして用いても良い。この場合は、φiは確率を表すことになる。φiは、それ自体が頻度値であるか正規化された確率であるかに拘わらず、実質的には、肌色である確率を示す尤度値を意味することになる。よって、この明細書では、φiを尤度値と称することがある。さらに、このφiを与えるガウスモデルを示す情報(すなわちガウスモデルのラベル)l(lは1〜kのいずれかの整数)を求める。この実施形態では、前記した通り、k=4である。これにより、各画素xiについて、尤度値φiとラベルlの組を情報として付与する(ステップ2−7)。具体的には、例えば、φiとlとをxiに対応させて、テーブルに格納する。
【0030】
ついで、1次元情報におけるしきい値候補の値を変化させたときの画素数の増加量がほぼ最小のときのしきい値候補をしきい値とする(ステップ2−8)。このステップを、図5および図6を参照しながら、以下に詳述する。
【0031】
まず、ガウスモデルのラベルlに関連づけられた画素(群)xiを考える。ついで、これらの画素xiについての尤度値φiの最大値(またはそれに近い値)φimaxからΔTlだけ小さい値をしきい値候補Tlとする(図5参照)。ついで、しきい値候補Tl以上の尤度値φiを持つ、ラベルlの画素xiの数を数える。例えば、このときの画素の例は、図6(a)のようになる。ついで、しきい値候補TlをΔTlだけずらし、再び、しきい値候補Tl以上の尤度値φiを有する、ラベルlの画素xiを数える。例えば、このときの画素の例は、図6(b)のようになる。ΔTlは、この実施形態では一定量とする。ΔTlだけしきい値候補Tlをずらしながら、前記の計算を行う。このようにして、1次元情報φiを用いて、しきい値候補Tlの値に対応する画素の増加量をそれぞれ求めることができる。例えば、図6(a)における画素数をA1、図6(b)における画素数をA2とすれば、増加量はA2−A1として求めることができる。このようにして求めた、しきい値候補と画素の増加量との関係を図5に示す。
【0032】
ついで、画素数の増加量がほぼ最小となる尤度値(つまり1次元情報の値)をしきい値Tl0とする。この実施形態では、しきい値候補Tlと画素増加量との関係を求めているが、これと等価な方法として、しきい値候補Tlの変化量ΔTlと、その範囲に含まれる画素数との関係を求めることにより、しきい値Tl0を求めることもできる。この場合は、変化量ΔTlの幅に含まれる画素数が、前記した画素数の増加量を意味することになる。
【0033】
本実施形態では、結局、対象画像中の画素における色差信号(H,S)に対応する、ガウスモデルでの値φiに基づいて、しきい値が生成されていることになる。
【0034】
(皮膚候補領域の抽出)
ついで、このしきい値を用いて、皮膚領域候補抽出部4(図1参照)において、対象画像から皮膚領域候補を抽出する。この抽出は、しきい値Tl0で決定される範囲に含まれる一次元情報(尤度値)を有する、ラベルlを有する画素xiを、対象画像から選択することにより行われる。
【0035】
この抽出手順を図7に示す。まず、ラベルlと関連づけられた画素xiに対して、そのラベルlに対応するしきい値Tlを適用する(ステップ7−1)。ここでは、画素xiの尤度値がしきい値Tlより大きければ1、小さければ0を出力することで2値化する。また、例えば、画素xiの尤度値がしきい値Tlより大きければ、1でなくlを出力することもできる。このようにすれば、2値化と同時に、ラベルの情報も出力できるという利点がある。
【0036】
ついで、2値化の結果が1であるか否かを判断する(ステップ7−2)。もちろん0であるか否かを判断しても良いことは当然である。1であれば、その画素を皮膚領域候補の画素とする(ステップ7−3)。1でなければ皮膚領域候補としない(ステップ7−4)。この判定を各画素について行う。
【0037】
本実施形態によれば、しきい値に基づいて対象画像から画素を選択することにより、この画素に基づいて、対象画像から肌色領域(皮膚領域候補)を抽出することができる。従来は、皮膚領域かどうかを判定するしきい値を固定していたために、対象画像における条件が変化すると検出精度が劣化するという問題があった。これに対して、この実施形態の方法では、前記のように、対象画像から適応的にしきい値を生成している。例えば、この実施形態では、対象画像が異なれば、しきい値候補Tlの変化量ΔTlに対応する画素数は異なる。したがって、対象画像毎に、各ガウスモデルlに対応して別のしきい値を決めることができる。この結果、対象画像の明るさが変動したり、様々な肌色の人物が存在しても、それらの条件に対応してしきい値を生成することができる。これにより、この実施形態では、肌色領域を適切に抽出することが可能となる。
【0038】
このようにして画素を選択した結果を図8(b)に示す。同図(a)は対象画像である。図8(b)では、選択された画素を白で示し、選択されなかった画素を黒で示している。
【0039】
(顔領域候補の抽出…絞り込み)
つぎに、顔領域候補抽出部5において、皮膚領域候補の絞り込みを行う。絞り込みの手順を図9に基づいて説明する。まず、メディアンフィルタ(図示せず)により、孤立画素を除去する(ステップ9−1)。メディアンフィルタとしては、例えば3×3画素の範囲でのものを用いることができる。これにより皮膚領域候補の画像からノイズを除去することができる。処理結果の例を図8(c)に示す。ついで、各領域についてラベルを付与するというラベリングを行う(ステップ9−2)。ついで、各領域について画素数を算出し、面積の小さい領域を除去する(ステップ9−3)。具体的には、例えば、各領域内の面積(例えば画素数)を求める。ついで、それらの平均値を計算する。ついで、平均値のa%(aは例えば3)よりも面積が小さい領域を除去する。小領域を除去した結果の例を図8(d)に示す。
【0040】
ついで、領域に対してモルフォロジー処理を行う(ステップ9−4)。モルフォロジー処理は、幅の狭い凹部を除去して、輪郭を滑らかにするものである。処理結果の例を図8(e)に示す。ついで、穴埋め処理を行う(ステップ9−5)。穴埋め処理とは、領域内にある穴(例えば目や鼻の穴に相当する)を埋めておく処理である。処理結果の例を図8(f)に示す。また、このようにして抽出された領域の画像を図8(g)に示す。
これらの、図9に示した各処理は、いずれもそれ自体としては周知なので、これ以上の説明は省略する。
【0041】
これらの処理により、皮膚領域候補を、一定以上の大きさの領域とする(つまり絞り込む)ことができる。絞り込まれた皮膚領域候補の画像は、この実施形態では、RGB信号で保存しておく。
【0042】
(顔領域候補の抽出…髪領域と皮膚領域との分離)
ついで、顔領域候補抽出部5において、さらに、絞り込まれた皮膚領域候補画像における髪の毛の領域と皮膚領域とを分離する。分離する手順を図10を用いて説明する。このような分離を行う理由は、色相と彩度を用いた分離方法では、髪の毛の領域と皮膚領域との分離が難しいためである。例えば、図11(a)、図12(a)および図13(a)に示した画像例では、色相と彩度を用いた場合、前記した手順を適用すると、図11(b)、図12(b)および図13(b)に示されるような領域が抽出される。これらの図において、顔の周囲における白線が領域を示している。また、これらの画像における色相と彩度の関係を図11(c)、図12(c)および図13(c)に示す。図中、毛髪部分の画素を十字で、皮膚部分の画素をドット(図においてはつぶれている)で示している。これらからも、色相と彩度とを用いた場合、髪の毛と皮膚とを分離しがたいことが判る。
【0043】
そこで、この実施形態では、まず、RGB空間における皮膚領域候補の画像をYCbCr空間における画像に変換する(ステップ10−1)。つまり、RGB信号をYCbCr信号に変換する。変換式は周知なので説明を省略する。
【0044】
ついで、各画素について、CbおよびCrにおけるヒストグラムを生成する(ステップ10−2)。例えば、図11、図12および図13に示した各画像におけるヒストグラムの例を図14〜図16に示す。ここでも、髪の毛部分の画素を十字で、皮膚部分の画素をドットで示している。このように、CbおよびCrにおけるヒストグラムを用いると、複数(ここでは二つ)のクラスタに分解することができる。
【0045】
ついで、一方のクラスタを選択する(ステップ10−3)。図14〜図16の例から明らかなように、一般に、肌色領域は、Crが大でCbが小となるので、その性質を有するクラスタを選択する。
【0046】
ついで、選択したクラスタに属する画素を抽出する(ステップ10−4)。ついで、抽出した画素から孤立画素を除去することにより、ノイズを除去する(ステップ10−5)。これにより、顔領域候補を抽出することができる(ステップ10−6)。
【0047】
このように、本実施形態によれば、顔領域と毛髪領域とを、CbおよびCrの値に対応したクラスタを用いて分別しているので、顔領域の候補画像を精度良く抽出することが可能となる。
【0048】
(顔領域の抽出)
以上の段階では、色情報に基づいて肌色領域を抽出した。しかし、以上の処理だけでは、顔以外の皮膚領域(例えば腕)を除外することは難しい。そこで、顔領域検出部6において、顔領域を抽出(選別)する。その手順を図17に基づいて説明する。
【0049】
まず、領域の形状が、所定の範囲内の楕円形か否かを判定する(ステップ17−1)。つまり、(短軸長さ/長軸長さ)が所定値の範囲内(例えば0.4より大きい)か否かを判断する。範囲外であれば、その領域は顔領域としない(ステップ17−2)。
【0050】
領域形状が所定範囲内の楕円であれば、両眼が存在するか否かを判定する(ステップ17−3)。ここでは、まず、色情報から、眼の候補領域を求める。通常、前記したYCbCr信号におけるクラスタリングを用いると、眼領域は、髪領域と同様に、肌色領域から区別できる。さらに、眼領域は、大きさ等の構造情報を用いて髪領域から分離できる。こうして得た眼領域が、所定の規則に合致するかどうかを判断する。規則とは、例えば、眼領域が短軸の上方にあるか、眼領域は短軸とほぼ平行な線上にあるか、両眼が長軸の一側に寄っていないか等の構造的な規則である。このようにして、色情報に基づいて抽出した領域を候補として、眼領域の有無を調べる。眼領域が存在すれば、その顔領域候補を顔領域とする(ステップ17−4)。
【0051】
色情報に基づいて眼領域を検出できないときは、ステップ17−3において、輝度情報に基づいてさらに眼領域を検出する。ここでは、輝度が低い領域を候補として抽出し、その領域の大きさや配置等の構造情報に基づいて判断する。これにより眼領域が検出できれば、その顔領域候補を顔領域とする(ステップ17−4)。
【0052】
以上の手順で眼領域が検出できなければ、その顔領域候補は顔領域としない(ステップ17−2)。
【0053】
このようにして、本実施形態により、対象画像から顔領域を抽出することができる。顔領域が決定すれば、その領域に含まれる画素から、顔の画像を得ることができる。
【0054】
前記した各実施形態の実行は、当業者にはコンピュータを用いて容易に実行可能である。そのためのプログラムは、コンピュータで読み取り可能な記録媒体、例えばHD、FD、CD、MOなど、任意のものに格納できる。
【0055】
なお、前記各実施形態の記載は単なる一例に過ぎず、本発明に必須の構成を示したものではない。各部の構成は、本発明の趣旨を達成できるものであれば、上記に限らない。
また、各実施形態を実現するための各部(機能ブロックを含む)の具体的手段は、ハードウエア、ソフトウエア、ネットワーク、これらの組み合わせ、その他の任意の手段を用いることができ、このこと自体は当業者において自明である。さらに、機能ブロックどうしが複合して一つの機能ブロックに集約されても良い。また、一つの機能ブロックの機能が複数の機能ブロックの協働により実現されても良い。
【0056】
【発明の効果】
本発明によれば、対象画像の条件が多様であっても、精度良く肌色領域を抽出しうる方法を提供できる。
【図面の簡単な説明】
【図1】本発明の一実施形態に係る肌色領域抽出方法を実施するための装置の概略を示すブロック図である。
【図2】本発明の一実施形態に係る肌色領域抽出方法における、しきい値の生成手順を示すフローチャートである。
【図3】色相(H)および彩度(S)についての画素毎のヒストグラムを示すグラフであって、図(a)は2次元、図(b)は色相のみの1次元、図(c)は彩度のみの1次元で示したものである。
【図4】色相(H)および彩度(S)についての画素毎のヒストグラムをガウス混合モデルで近似した状態を示すグラフであって、図(a)は2次元、図(b)は色相のみの1次元、図(c)は彩度のみの1次元で示したものである。
【図5】しきい値生成方法を説明するためのグラフであって、縦軸は画素の増加量、横軸はしきい値(尤度値)である。
【図6】しきい値候補に対応する画素数を説明するための図であって、図(a)と図(b)は、互いに異なるしきい値候補以上の尤度値を有する画素の例を示している。
【図7】しきい値に基づく画素の抽出方法を説明するためのフローチャートである。
【図8】対象画像から肌色領域の抽出を行う過程を説明するための画像例であって、図(a)は対象画像、図(b)はしきい値を用いて抽出された領域を白色で示す図、図(c)はメディアンフィルタで処理された後の領域を示す図、図(d)は小領域を除去した後の図、図(e)はモルフォロジー処理後の図、図(f)は穴埋め後の図、図(g)は絞り込まれた領域における画像である。
【図9】皮膚領域候補の絞り込みの手順を説明するためのフローチャートである。
【図10】毛髪部分と顔部分の領域を分離する手順を説明するためのフローチャートである。
【図11】毛髪部分と顔部分の領域を分離する手順を説明するための説明図であって、図(a)は対象画像の例、図(b)は抽出された皮膚領域候補、図(c)は、皮膚領域候補における画素のヒストグラムであって、縦軸は彩度、横軸は色相である。
【図12】毛髪部分と顔部分の領域を分離する手順を説明するための説明図であって、図(a)は対象画像の他の例、図(b)は抽出された皮膚領域候補、図(c)は、皮膚領域候補における画素のヒストグラムであって、縦軸は彩度、横軸は色相である。
【図13】毛髪部分と顔部分の領域を分離する手順を説明するための説明図であって、図(a)は対象画像のさらに他の例、図(b)は抽出された皮膚領域候補、図(c)は、皮膚領域候補における画素のヒストグラムであって、縦軸は彩度、横軸は色相である。
【図14】図11に示す皮膚領域候補における画素のヒストグラムであって、縦軸はCr、横軸はCbである。
【図15】図12に示す皮膚領域候補における画素のヒストグラムであって、縦軸はCr、横軸はCbである。
【図16】図13に示す皮膚領域候補における画素のヒストグラムであって、縦軸はCr、横軸はCbである。
【図17】顔領域候補から顔領域を抽出する手順を説明するためのフローチャートである。
【特許請求の範囲】
【請求項1】
次のステップを含むことを特徴とする、肌色領域の抽出方法:
(1)サンプル画像中の肌色領域における各画素について、二つの色差信号に関してヒストグラムを生成するステップ;
(2)前記ヒストグラムを、複数のガウスモデルを有するガウス混合モデルにより近似するステップ;
(3)対象画像中の画素についての、二つの色差信号を、ガウスモデルにおける対応値を用いて1次元情報に変換し、ついで、前記1次元情報の値を変化させたときの画素数の増加量がほぼ最小となる前記1次元情報の値をしきい値とするステップ;
(4)前記しきい値で決定される範囲に含まれる前記1次元情報を有する画素を、前記対象画像から選択することにより、前記対象画像から肌色領域を抽出するステップ。
【請求項2】
前記1次元情報は、前記ガウスモデルにおける値であって、かつ、前記対象画像の画素における二つの色差信号に対応する値が最大となるものであることを特徴とする請求項1記載の抽出方法。
【請求項3】
前記ステップ(3)における前記画素数の増加量とは、互いに同じガウスモデルにより1次元情報に変換された画素におけるものであり、
前記しきい値は、このガウスモデルを示す情報と関連付けられており、
前記ステップ(4)において対象画像から選択される画素は、互いに同じガウスモデルにより1次元情報に変換された画素中から、このガウスモデルと関連づけられたしきい値によって選択される
ことを特徴とする請求項1または2に記載の抽出方法。
【請求項4】
次のステップを含むことを特徴とする、肌色領域の抽出方法:
(1)対象画像の全部または一部の領域における各画素を、その画素におけるCbおよびCrの値を用いて複数のクラスタに分解するステップ;
(2)前記複数のクラスタのうち、他に比較してCrが大でCbが小であるクラスタに属する画素が位置する領域を前記肌色領域とするステップ。
【請求項5】
前記一部の領域とは、請求項1〜3のいずれか1項の抽出方法により抽出された肌色領域であることを特徴とする請求項4記載の抽出方法。
【請求項6】
前記対象画像は、RGB空間からYCbCr空間に変換されることにより得られたものであることを特徴とする請求項4または5に記載の抽出方法。
【請求項7】
前記複数のクラスタの数は2であることを特徴とする請求項4〜6のいずれか1項に記載の抽出方法。
【請求項8】
請求項1〜7のいずれか1項記載の抽出方法により抽出された肌色領域の構造情報を用いて、顔領域である肌色領域を抽出するステップを含むことを特徴とする抽出方法。
【請求項9】
次のステップを含むことを特徴とする、肌色領域の抽出方法:
(1)サンプル画像中の肌色領域における各画素について、二つの色差信号に関してヒストグラムを生成するステップ;
(2)前記ヒストグラムを、複数のガウスモデルを有するガウス混合モデルにより近似するステップ;
(3)対象画像中の画素における前記色差信号に対応する、前記ガウスモデルでの値に基づいて、しきい値を生成するステップ;
(4)前記しきい値で決定される範囲に含まれる前記画素を、前記対象画像から選択することにより、前記対象画像から肌色領域を抽出するステップ。
【請求項10】
請求項1〜9のいずれか1項に記載のステップをコンピュータで実行するためのコンピュータプログラム。
【請求項11】
請求項10記載のコンピュータプログラムを記録した、コンピュータで読み取り可能な記録媒体。
【請求項12】
しきい値生成部と、皮膚領域候補抽出部とを備えており、前記しきい値生成部は、下記(1)〜(3)のステップを実行し、前記皮膚領域候補抽出部は、下記(4)のステップを実行することを特徴とする、肌色領域の抽出装置:
(1)サンプル画像中の肌色領域における各画素について、二つの色差信号に関してヒストグラムを生成するステップ;
(2)前記ヒストグラムを、複数のガウスモデルを有するガウス混合モデルにより近似するステップ;
(3)対象画像中の画素についての、二つの色差信号を、ガウスモデルにおける対応値を用いて1次元情報に変換し、ついで、前記1次元情報の値を変化させたときの画素数の増加量がほぼ最小のときの前記しきい値候補をしきい値とするステップ;
(4)前記しきい値で決定される範囲に含まれる前記一次元情報を有する画素を、前記対象画像から選択することにより、前記対象画像から肌色領域を抽出するステップ。
【請求項13】
対象画像における画素を判定するためのしきい値を生成するしきい値生成部を備え、前記しきい値生成部は、下記(1)〜(3)のステップを実行することを特徴とする、肌色領域の抽出装置:
(1)サンプル画像中の肌色領域における各画素について、二つの色差信号に関してヒストグラムを生成するステップ;
(2)前記ヒストグラムを、複数のガウスモデルを有するガウス混合モデルにより近似するステップ;
(3)対象画像中の画素についての、二つの色差信号を、ガウスモデルにおける対応値を用いて1次元情報に変換し、ついで、前記1次元情報の値を変化させたときの画素数の増加量がほぼ最小のときの前記しきい値候補をしきい値とするステップ。
【請求項14】
以下のステップを実行する顔領域候補抽出部を備えたことを特徴とする、肌色領域の抽出装置:
(1)対象画像の全部または一部の領域における各画素を、各画素におけるCbおよびCrの値を用いて複数のクラスタに分解するステップ;
(2)前記複数のクラスタのうち、他に比較してCrが大でCbが小であるクラスタに属する画素が位置する領域を前記肌色領域とするステップ。
【請求項15】
請求項12〜14のいずれか1項記載の抽出装置であって、さらに顔領域抽出部を備え、前記顔領域抽出部は、肌色領域における構造情報を用いて、顔領域である肌色領域を抽出するステップを実行するものであることを特徴とする抽出装置。
【請求項1】
次のステップを含むことを特徴とする、肌色領域の抽出方法:
(1)サンプル画像中の肌色領域における各画素について、二つの色差信号に関してヒストグラムを生成するステップ;
(2)前記ヒストグラムを、複数のガウスモデルを有するガウス混合モデルにより近似するステップ;
(3)対象画像中の画素についての、二つの色差信号を、ガウスモデルにおける対応値を用いて1次元情報に変換し、ついで、前記1次元情報の値を変化させたときの画素数の増加量がほぼ最小となる前記1次元情報の値をしきい値とするステップ;
(4)前記しきい値で決定される範囲に含まれる前記1次元情報を有する画素を、前記対象画像から選択することにより、前記対象画像から肌色領域を抽出するステップ。
【請求項2】
前記1次元情報は、前記ガウスモデルにおける値であって、かつ、前記対象画像の画素における二つの色差信号に対応する値が最大となるものであることを特徴とする請求項1記載の抽出方法。
【請求項3】
前記ステップ(3)における前記画素数の増加量とは、互いに同じガウスモデルにより1次元情報に変換された画素におけるものであり、
前記しきい値は、このガウスモデルを示す情報と関連付けられており、
前記ステップ(4)において対象画像から選択される画素は、互いに同じガウスモデルにより1次元情報に変換された画素中から、このガウスモデルと関連づけられたしきい値によって選択される
ことを特徴とする請求項1または2に記載の抽出方法。
【請求項4】
次のステップを含むことを特徴とする、肌色領域の抽出方法:
(1)対象画像の全部または一部の領域における各画素を、その画素におけるCbおよびCrの値を用いて複数のクラスタに分解するステップ;
(2)前記複数のクラスタのうち、他に比較してCrが大でCbが小であるクラスタに属する画素が位置する領域を前記肌色領域とするステップ。
【請求項5】
前記一部の領域とは、請求項1〜3のいずれか1項の抽出方法により抽出された肌色領域であることを特徴とする請求項4記載の抽出方法。
【請求項6】
前記対象画像は、RGB空間からYCbCr空間に変換されることにより得られたものであることを特徴とする請求項4または5に記載の抽出方法。
【請求項7】
前記複数のクラスタの数は2であることを特徴とする請求項4〜6のいずれか1項に記載の抽出方法。
【請求項8】
請求項1〜7のいずれか1項記載の抽出方法により抽出された肌色領域の構造情報を用いて、顔領域である肌色領域を抽出するステップを含むことを特徴とする抽出方法。
【請求項9】
次のステップを含むことを特徴とする、肌色領域の抽出方法:
(1)サンプル画像中の肌色領域における各画素について、二つの色差信号に関してヒストグラムを生成するステップ;
(2)前記ヒストグラムを、複数のガウスモデルを有するガウス混合モデルにより近似するステップ;
(3)対象画像中の画素における前記色差信号に対応する、前記ガウスモデルでの値に基づいて、しきい値を生成するステップ;
(4)前記しきい値で決定される範囲に含まれる前記画素を、前記対象画像から選択することにより、前記対象画像から肌色領域を抽出するステップ。
【請求項10】
請求項1〜9のいずれか1項に記載のステップをコンピュータで実行するためのコンピュータプログラム。
【請求項11】
請求項10記載のコンピュータプログラムを記録した、コンピュータで読み取り可能な記録媒体。
【請求項12】
しきい値生成部と、皮膚領域候補抽出部とを備えており、前記しきい値生成部は、下記(1)〜(3)のステップを実行し、前記皮膚領域候補抽出部は、下記(4)のステップを実行することを特徴とする、肌色領域の抽出装置:
(1)サンプル画像中の肌色領域における各画素について、二つの色差信号に関してヒストグラムを生成するステップ;
(2)前記ヒストグラムを、複数のガウスモデルを有するガウス混合モデルにより近似するステップ;
(3)対象画像中の画素についての、二つの色差信号を、ガウスモデルにおける対応値を用いて1次元情報に変換し、ついで、前記1次元情報の値を変化させたときの画素数の増加量がほぼ最小のときの前記しきい値候補をしきい値とするステップ;
(4)前記しきい値で決定される範囲に含まれる前記一次元情報を有する画素を、前記対象画像から選択することにより、前記対象画像から肌色領域を抽出するステップ。
【請求項13】
対象画像における画素を判定するためのしきい値を生成するしきい値生成部を備え、前記しきい値生成部は、下記(1)〜(3)のステップを実行することを特徴とする、肌色領域の抽出装置:
(1)サンプル画像中の肌色領域における各画素について、二つの色差信号に関してヒストグラムを生成するステップ;
(2)前記ヒストグラムを、複数のガウスモデルを有するガウス混合モデルにより近似するステップ;
(3)対象画像中の画素についての、二つの色差信号を、ガウスモデルにおける対応値を用いて1次元情報に変換し、ついで、前記1次元情報の値を変化させたときの画素数の増加量がほぼ最小のときの前記しきい値候補をしきい値とするステップ。
【請求項14】
以下のステップを実行する顔領域候補抽出部を備えたことを特徴とする、肌色領域の抽出装置:
(1)対象画像の全部または一部の領域における各画素を、各画素におけるCbおよびCrの値を用いて複数のクラスタに分解するステップ;
(2)前記複数のクラスタのうち、他に比較してCrが大でCbが小であるクラスタに属する画素が位置する領域を前記肌色領域とするステップ。
【請求項15】
請求項12〜14のいずれか1項記載の抽出装置であって、さらに顔領域抽出部を備え、前記顔領域抽出部は、肌色領域における構造情報を用いて、顔領域である肌色領域を抽出するステップを実行するものであることを特徴とする抽出装置。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【公開番号】特開2004−246424(P2004−246424A)
【公開日】平成16年9月2日(2004.9.2)
【国際特許分類】
【出願番号】特願2003−32864(P2003−32864)
【出願日】平成15年2月10日(2003.2.10)
【出願人】(503056469)
【出願人】(500082506)株式会社キャンパスクリエイト (2)
【Fターム(参考)】
【公開日】平成16年9月2日(2004.9.2)
【国際特許分類】
【出願日】平成15年2月10日(2003.2.10)
【出願人】(503056469)
【出願人】(500082506)株式会社キャンパスクリエイト (2)
【Fターム(参考)】
[ Back to top ]