目状態検出装置及び方法
【解決手段】本発明は、目状態検出装置及び方法に関するのである。つまり、本発明の目状態検出方法は、目領域から自動的な臨界値を設定し、イメージを分割し、分割された区域の境界点を獲得して、前記境界点に最も適合して一致させた楕円を用いて目開き及び目閉じを予備判別した後、目閉じと予備判別された場合、目閉じ時間が予め設定された臨界値時間より大きいときは、目閉じと判別し、大きくないときは、瞬きと判別するステップを含む。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、目状態検出装置及び方法に関するものである。
【背景技術】
【0002】
居眠り運転を防止する運転者モニタリングシステム、目の運動を用いるコンピュータゲーム及び写真撮影のためのカメラなど目状態検出が求められる分野は多様である。従来の目状態検出は、能動的赤外線基盤接近法(Active infrared (IR) based approaches)及び可視スペクトル/特徴−基盤接近法(Visible spectrum/Feature-based approaches)の二つの範疇に分類することができる。可視スペクトル/特徴−基盤接近法は、テンプレート(template)基盤法、 顔付(appearance)基盤法及び特徴(feature)基盤法に分類される。近赤外線基盤法(NIR based methods)は、実用的であり、また光学像スペクトル法(Visual spectrum methods)を追求するにおいて重要である。
【0003】
テンプレート基盤法は目の形態に基づいて考案されており、テンプレートマッチングは目のイメージを検出するために用いられる。このような方法は、顔全体を、目テンプレートとピクセル同士をマッチングしなければならない。また、入力した顔イメージに対する目の大きさが分からないため、他の大きさの目テンプレートとマッチング過程を数回繰り返さなければならない。よって、目を正確に検出することはできるものの、時間が多く要される短所がある。顔付基盤法は、光度の状況に基づいて目を検出する。このような方法は、通常、他の顔の傾向及び他の照明条件下で他の主題の目を示し、大量の操作データを収集しなければならない煩わしさがある。特徴基盤法は、目もとのいくつかの区別される特徴を識別するために目の特徴を調査する。このような方法は効率的であるが、高い対照性を持たないイメージに対して正確性が劣る、例えば、目と眉毛を混同し得る短所がある。
【0004】
イメージ基盤の目検出接近法は、顔の残りから顔付及び形態で目の差異を開発して目を位置させる。黒い瞳、白い鞏膜、円形の虹彩、目の角、目の形態などのような目の特別な特徴は人の目と他の物体とを区分するために用いられる。このような方法は効率性や正確性が劣り、実効性がないという短所がある。
【発明の概要】
【発明が解決しようとする課題】
【0005】
本発明は、リアルタイムで高い正確性と効率性を有しながら目の状態を判別することができる装置及び方法を提供する。
【課題を解決するための手段】
【0006】
本発明の一実施例による目状態検出方法は、顔を含む連続映像から、目開き、目閉じ及び瞬きとして目の状態を検出する方法であって、(a)前記連続映像から停止した初期映像を入力するステップ、(b)前記停止した初期映像から顔領域を検出するステップ、(c)前記顔領域から目領域を検出するステップ、(d)前記目領域から自動的な臨界値を設定し、イメージを分割し、分割された区域の境界点を獲得して、前記境界点に最も適合して一致させた楕円を用いて目開き及び目閉じを予備判別するステップ、及び(e)前記ステップ(d)で目閉じと予備判別された場合、予め設定された回数だけ前記ステップ(a)ないし前記ステップ(d)を繰り返して、計算された目閉じ時間が予め設定された臨界値時間より大きいときは、目閉じと判別し、大きくないときは、瞬きと判別するステップを含む。
【0007】
本発明の一実施例による目状態検出装置は、顔を含む連続映像から、目開き、目閉じ及び瞬きとして目の状態を検出する装置であって、前記連続映像を撮影するカメラ部、及び前記連続映像から本発明の一実施例による目状態検出方法によって目状態検出を行って、目開き、目閉じ及び瞬きとして目の状態を判別する信号処理部を含む。
【0008】
本発明の他の実施例による目状態検出方法は、顔を含む連続映像から、目開き、目閉じ及び瞬きとして目の状態を検出する方法であって、(a)前記連続映像から停止した初期映像を入力するステップ、(b)前記停止した初期映像から顔領域及び目領域を検出するステップ、(c)前記検出された目領域をログガボール(Log Gabor)フィルタリングするステップ、(d)前記目領域から自動的な臨界値を設定するステップ、(e)前記目領域の二進化されたイメージを分割し、分割された区域の境界点を獲得するステップ、(f)前記境界点に最も適合する楕円を一致させるステップ、及び(g)前記楕円を用いて目開き及び目閉じを予備判別するステップ、及び(h)前記ステップ(g)で目閉じと予備判別された場合、予め設定された回数だけ前記ステップ(a)ないし前記ステップ(g)を繰り返して、計算された目閉じ時間が予め設定された臨界値時間より大きいときは、目閉じと判別し、大きくないときは、瞬きと判別するステップを含む。
【発明の効果】
【0009】
本実施例による目状態検出方法は、高い正確性と効率性を有しながらリアルタイムで目の状態を判別することができる。また、リアルタイムで目を追跡するための目状態検出、運転者モニタリングシステム、スクリーンを介してナビゲートし、他のアイテムを選択するマウスポイントのように、目をポインティング器具として用いる、目の移動に基づく情報ディスプレイシステム、目の運動を用いるコンピュータゲーム及び瞬きを検出することのできる写真機などに応用することができる。
【図面の簡単な説明】
【0010】
【図1】多様な目の状態を示すイメージである。
【図2】本実施例による目状態検出方法を示す手順図である。
【図3】本実施例によって顔領域を検出した結果を示す図である。
【図4】本実施例によって目領域を検出するアルゴリズムの一例を示す図である。
【図5】本実施例によって目領域を検出した結果を示す図である。
【図6】本実施例によって目開閉判別ステップを示す手順図である。
【図7】本実施例によってクロッピングした目領域を示す図である。
【図8】本実施例によって80 60にリサイズされた目領域を示す図である。
【図9】本実施例に用いられたコンボリューションのためのログガボールカーネルを示す図である。
【図10】本実施例によってフィルタリングされた目領域を示す図である。
【図11】本実施例によって自動臨界値設定ステップを示す手順図である。
【図12】本実施例によって2Dヒストグラムのエントロピーを計算するアルゴリズムの一例を示す図である。
【図13】本実施例によって自動的な臨界値の設定前及び後の結果を示す図である。
【図14】本実施例によって二進化されたイメージ分割及び分割された各区域の境界点の獲得ステップを行った結果を示す図である。
【図15】本実施例によって各区域の境界点に楕円を一致させたステップを行った結果を示す図である。
【図16】本実施例によって目の開閉状態を判別する一例を示すアルゴリズムである。
【図17】本実施例による目状態検出装置を示すブロック図である。
【発明を実施するための形態】
【0011】
本発明は、多様な変更を加えることができ、様々な実施例を有し得るところ、特定の実施例を図面に例示し、詳細な説明において詳細に説明しようとする。しかし、これは、本発明を特定の実施形態に対して限定しようとするものではなく、本発明の思想及び技術の範囲に含まれるすべての変更、均等物ないし代替物を含むものと理解しなければならない。
【0012】
ある構成要素が他の構成要素に「連結されて」いる、または「接続されて」いると言及された場合には、その他の構成要素に直接的に連結または接続されていることもあるが、その間に他の構成要素が存在することもあるものと理解しなければならない。
【0013】
以下、添付された図面を参照しながら本発明による好ましい実施例について詳しく説明するが、図面符号に構わず、同一または対応する構成要素には同一の参照番号を付与し、これに対する重複される説明は省略する。
【0014】
図1は、多様な目の状態示すイメージである。本実施例は、図1に示されたような多様な目の状態を、目開き、目閉じ及び瞬き状態と判別することができる。
【0015】
図2は、本実施例による目状態検出方法を示す手順図である。
【0016】
連続映像から停止した初期映像を入力する(S110)。このような停止した初期映像はグレー(grey)映像であり得る。
【0017】
その後、停止した初期映像から顔領域を検出する(S120)。ここで、顔領域の検出は顔境界の座標を獲得することで行われる。顔領域の検出は、haar基盤の顔検出法(haar based face detection)またはテンプレートマッチング法など多様な方法を用いることができる。例えば、テンプレートマッチング法を用いる場合、入力された初期映像と多重スケールテンプレートでテンプレートマッチング演算を行う。入力された初期映像と多重スケールテンプレートでテンプレートマッチング演算を行った後、顔イメージの位置を出力する。ここで、多重スケールテンプレートは、10個の同一でない大きさにおける平均の顔テンプレートである。顔テンプレートの数は、上記のほかにも多様である。
【0018】
図3は、本実施例によって顔領域を検出した結果を示す図である。
【0019】
再び図2を参照すると、顔領域から目領域を検出する(S130)。ここで、目領域の検出は目境界の座標を獲得することで行われる。目領域とは、目を示す正確な領域ではなく、目を中心に上下左右で余裕のある領域をいう。このような目領域は、目幾何学(eye geometry)を用いて検出することができる。例えば、通常、顔の横長さをX、縦長さをYとするとき、左目の位置は(1/4X、1/5Y)となり、右目の位置は(3/16X、1/5Y)となる。このような位置を中心に余裕をもって設定された領域で目領域を検出することができる。
【0020】
図4は、本実施例によって目領域を検出するアルゴリズムの一例を示す図であり、図5は、本実施例によって目領域を検出した結果を示す図である。
【0021】
その後、目閉じと目開きを予備判別する(S140)。ここで、目閉じと目開きの予備判別は、目閉じ及び目開きを判別して、目開きと判別される場合は、目の状態を目開きと最終判断し、目閉じと判別される場合は、また目閉じであるかまたは瞬きであるかを判別しなければならないため、目閉じと予備判別してから、また目閉じまたは瞬きを判別するステップに進むことをいう。S140は、以下で詳しく説明する。S140で目開き状態と判別されることがある(S190)。S140で目閉じ状態と判別されると、設定された回数だけS110ないしS140を繰り返す(S150)。設定された回数だけS110ないしS140を繰り返した後、目閉じと判別される時間が設定された臨界値時間(ms)より大きいか否かを判断する(S160)。目閉じと判別される時間が設定された臨界値時間(ms)より大きいときは、目閉じ状態と判別する(S170)。目閉じと判別される時間が設定された臨界値時間(ms)より大きくないときは、瞬き(eye blink)状態と判別する(S180)。
【0022】
ここで、繰り返されるステップは、本実施例ではS110ないしS140であるが、S110から、以下に説明するS141〜S147のいずれか一つのステップまで繰り返すこともできる。例えば、S110から、以下に説明するS145まで設定された回数だけ繰り返すことができる。
【0023】
以下で、目閉じと目開きを判別するS140を詳しく説明する。
【0024】
図6は、本実施例によって目開閉判別ステップを示す手順図である。まず、S130によって獲得された目領域を切り取る(S141)。ISP(Image Signal Processor)のイメージクロッピング機能を用いて行うことができる。図7は、本実施例によってクロッピングした目領域を示す図である。
【0025】
その後、切り取られた目領域をリサイズする(S142)。例えば、目領域を80 60にリサイズする。図8は、本実施例によって80 60にリサイズした目領域を示す図である。
【0026】
次に、リサイズした目領域をフィルタリングする(S143)。例えば、コンボリューション(convolution)を用いてログガボール(Log Gabor)フィルタリングする。線形周波数スケール上にログガボール関数は、次の数式1のような移動関数である。
【数1】
ここで、w0は、フィルタ中心周波数である。
【0027】
一定の形態の非フィルタを得るために、用語k/w0は多様なw0に対して一定に維持されることができる。例えば、0.74のk/w0は、略1オクターブ(octave)のフィルタ帯域幅であり、0.55のk/w0は、略2オクターブのフィルタ帯域幅であり、0.41のk/w0は、略3オクターブのフィルタ帯域幅であり得る。図9は、本実施例に用いられたコンボリューションのためのログガボールカーネルを示し、図10は、本実施例によってフィルタリングされた目領域を示す図である。
【0028】
本実施例でコンボリューションを用いたフィルタリングは、次の数式2を用いて行うことができる。
【数2】
ここで、hは、コンボリューションカーネルマトリクス、m及びnは、コンボリューションカーネルマトリクス次元、I′(x、y)は、新しいイメージ、及び、I(x、y)は、入力イメージを示す。
【0029】
その後、自動臨界値を設定する(S144)。
【0030】
以下で、自動臨界値設定ステップであるS144を詳しく説明する。図11は、本実施例によって自動臨界値設定ステップを示す手順図である。
【0031】
図11を参照すると、目領域の2Dヒストグラムを計算する(S144−1)。ここで、ヒストグラムは、イメージ内において他のイメージのピクセル周波数の統計的表現である。2Dヒストグラムは、他の光源水準を有する、相応するピクセルの数を示す。イメージヒストグラムは、原本イメージにおいて正確な光源強度を有するピクセルがいくつあるのかを示すことができる。本実施例に適用されるイメージがサイズ面において多様であるため、ヒストグラム値を保存するために一次元整数配列を用いることができる。2Dヒストグラム計算は、イメージピクセル内のループ及びインデックス256要素の整数配列を用いて行うことができる。ここで、配列の数は、上記のほかにも多様であることは当業者にとって自明なものである。次は、本実施例によって2Dヒストグラムを計算する一例を示すアルゴリズムである。
【数3】
ここで、pucGrey[usIndexX]は、2Dイメージ輝度に対する情報を保有するバイト配列であり、gssHistogramGray[0]は、2Dイメージヒストグラムを保有する256要素の整数配列である。
【0032】
その後、2Dヒストグラムを正規化する(S144−2)。すなわち、ヒストグラムの256要素の整数配列内に保存された2Dヒストグラムを正規化する。正規化されたヒストグラムは、他のピクセル値の確率分布を示す。正規化の過程は、各一つのヒストグラムの256配列要素をイメージ内の全体ピクセル数で分けて行われる。次は、本実施例によって2Dヒストグラムを正規化する一例を示すアルゴリズムである。
【数4】
【0033】
その後、2Dヒストグラムのエントロピー(entropy)を計算する(S144−3)。ここで、エントロピーは、不確実性(uncertainty)の平均値を示す数値である。
【0034】
図12は、本実施例によって2Dヒストグラムのエントロピーを計算するアルゴリズムの一例を示す図である。図12を参照すると、2Dヒストグラムのエントロピー関数を行った後、イメージエントロピーは2D 256要素の二重正確性配列gdEntropyGrey[k]内に保有される。このような関数は、どのピクセルがイメージ内の大部分の情報用量を有しているのかを決定するに用いられる。
【0035】
その後、2段階(2nd stage)の最大エントロピー値のインデックスを獲得する(S144−4)。次に、2段階の最大エントロピー値に基づく自動的な臨界値を設定する(S144−5)。2Dヒストグラムのエントロピー値を計算した後、最大値を検出してから、これに基づく臨界値を獲得することができる。検出された最大値を中心に予め設定されたパーセント内に臨界値を獲得することができる。
【0036】
ここで、多段階(multistage)の2Dエントロピー関数が用いられることもある。多段階のエントロピー関数は、繰り返しの数及びパートA及びBによるヒストグラム分割で単一段階と異なることがある。例えば、4段階のエントロピー関数は、4層上に自動に臨界値入力イメージに対する確率を提供することができる。ヒストグラム内に選択された地域にわたってエントロピーの最大値計算を用いて、数回ヒストグラムを分割することが求められる。一次エントロピーの最大値を計算した後、0と一次最大地点との間のエントロピーの最大値を計算してから、一次最大値とヒストグラムの255要素との間のエントロピーの最大地点を計算することができる。
【0037】
また、臨界値のイメージ上にヒストグラム均等化(equalization)を用いることもできる。「ヒストグラム均等化」は、すべての小さいヒストグラムコラムを一つにグルーピングする簡単な過程である。このようなグルーピング後、ヒストグラム変化に関するイメージピクセル置換を行うことができる。2Dヒストグラム均等化のためにヒストグラムの平均値を計算することができる。その後、ループを作って、ポジション0から255まですべてのヒストグラムコラムをチェックし、該当ヒストグラムコラムが平均値を超えるグローバルヒストグラムの平均値より小さいか否かをチェックする。そうであれば、次のコラムに進んで、この値をac一次値として扱う。追加するすべてのポジションは、グレー水準の置換候補としてマーキングされる。次のコラムが平均値よりもさらに大きい値を有すると、その値に一次値を追加せずに、次のコラムに進む。図13は、本実施例によって自動的な臨界値の設定前及び後の結果を示す図である。
【0038】
再び図6を参照すると、二進化されたイメージを分割し、分割された各区域の境界点を獲得する(S145)。二進化されたイメージ分割は、次のように行われる。まず、使用しないイメージの部分を初期化する。その後、4個の連結された成分を用いて、イメージを分割する。分割されたものをラベリングして、区域IDを固定する。その後、区域サイズを計算し、サイズ順に、区域に対して新しいIDを計算する。次に、中心と周辺のボックスを計算し、区域エッジ点を計算する。図14は、本実施例によって二進化されたイメージ分割及び分割された各区域の境界点の獲得ステップを行った結果を示す図である。
【0039】
その後、各区域の境界点に楕円を一致させる(S146)。すなわち、境界点のセットに最もよく一致する楕円を計算する。例えば、6個の境界点を用いて、最もよく一致する楕円を計算することができる。図15は、本実施例によって各区域の境界点に楕円を一致させたステップを行った結果を示す図である。
【0040】
その後、獲得された楕円をもって目の開閉状態を判別する(S147)。例えば、楕円の円形度または面積を計算して、目の開閉状態を判別することができる。楕円の面積で目の開閉状態を判別する場合、目閉じと判別する楕円の面積の範囲を設定することができる。例えば、楕円の面積が5mm2から30mm2内の場合、目閉じと判別することができる。また、目とまぶたの幾何学に起因して目閉じを判別することもできる。
【0041】
図16は、本実施例によって目の開閉状態を判別する一例を示すアルゴリズムである。
【0042】
図17は、本実施例による目状態検出装置を示すブロック図である。
【0043】
図17を参照すると、目状態検出装置は、カメラ部110、メモリ120、信号処理部130及び制御部140を含む。カメラ部110は、連続映像を撮影して、撮影したイメージをメモリ120に出力する。メモリ120は、撮影されたイメージを入力されて保存する。信号処理部130は、メモリ120に保存されたデジタルイメージに対して本実施例によって目状態検出を行い、目閉じ、瞬きまたは目開きとして目の状態を判断して、その結果をメモリ120または制御部140に出力する。制御部140は、目状態の判断結果に応じて、制御が必要なモジュールに制御信号を出力する。ここで、制御部140は、示されたものと異なって、無いこともある。制御部140がない場合は、信号処理部130は、判断された目の状態を外部に出力する。
【0044】
例えば、目状態検出装置が運転者モニタリングシステムの警報発生部に連結された場合、信号処理部130で被写体が目閉じと判断されると、制御部140は、警報発生部に警報音を発生する信号を送ることができる。また他の例として、目状態検出装置がカメラに連結された場合、信号処理部130で被写体が瞬きと判断されると、制御部140は、最適の撮影時点を捕捉できるように制御信号をカメラに送ることができる。
【0045】
本実施例で示すアルゴリズムは、本実施例を具現するために多様に表現できるアルゴリズムの一例に過ぎず、このような一例とは異なるアルゴリズムも本実施例を具現することができることは当業者にとって自明なものである。
【0046】
本実施例で使用される「〜部」という用語は、ソフトウェアまたはFPGA(field-programmable gate array)またはASICのようなハードウェア構成要素を意味し、「〜部」はある種類の役割を果たす。ところが、「〜部」は、ソフトウェアまたはハードウェアに限定される意味ではない。「〜部」は、アドレッシングすることのできる保存媒体にあるように構成されることもでき、あるいは、一つまたはそれ以上のプロセッサを再生させるように構成されることもできる。よって、一例として「〜部」は、ソフトウェアの構成要素、客体志向ソフトウェアの構成要素、クラスの構成要素及びタスクの構成要素のような構成要素と、プロセス、関数、属性、プロシージャ、サブルーチン、プログラムコードのセグメント、ドライバ、ファームウエア、マイクロコード、回路、データ、データベース、データ構造、テーブル、配列、及び変数を含む。構成要素と「〜部」の中で提供される機能は、さらに小さい数の構成要素及び「〜部」に結合されるか、または追加的な構成要素と「〜部」とにさらに分離できる。それだけでなく、構成要素及び「〜部」は、デバイスまたは保安マルチメディアカード内の一つまたはそれ以上のCPUを再生させるように具現できる。
【0047】
上述したすべての機能は、上記機能を行うようにコーディングされたソフトウェアやプログラムコードなどによるマイクロプロセッサ、制御機、マイクロ制御機、ASIC(Application Specific Integrated Circuit)などのようなプロセッサによって行われることができる。前記コードの設計、開発及び具現は、本発明の説明に基づいて当業者に自明であるといえる。
【0048】
以上、本発明について実施例を参照しながら説明したが、当該技術分野における通常の知識を有する者は、本発明の技術的思想及び領域から外れない範囲内で本発明を多様に修正及び変更させて実施することができることを理解できるだろう。したがって、上述した実施例に限定されずに、本発明は、以下の特許請求の範囲の範囲内におけるすべての実施例を含むといえる。
【産業上の利用可能性】
【0049】
本発明は、リアルタイムで目を追跡するための目の状態を検出する方法及び装置であって、運転者モニタリングシステム、目の移動に基づく情報ディスプレイシステム、目の運動を用いるコンピュータゲーム及び瞬きを検出することのできる写真機などに上記の目の状態を検出する方法及び装置を適用することができる。
【技術分野】
【0001】
本発明は、目状態検出装置及び方法に関するものである。
【背景技術】
【0002】
居眠り運転を防止する運転者モニタリングシステム、目の運動を用いるコンピュータゲーム及び写真撮影のためのカメラなど目状態検出が求められる分野は多様である。従来の目状態検出は、能動的赤外線基盤接近法(Active infrared (IR) based approaches)及び可視スペクトル/特徴−基盤接近法(Visible spectrum/Feature-based approaches)の二つの範疇に分類することができる。可視スペクトル/特徴−基盤接近法は、テンプレート(template)基盤法、 顔付(appearance)基盤法及び特徴(feature)基盤法に分類される。近赤外線基盤法(NIR based methods)は、実用的であり、また光学像スペクトル法(Visual spectrum methods)を追求するにおいて重要である。
【0003】
テンプレート基盤法は目の形態に基づいて考案されており、テンプレートマッチングは目のイメージを検出するために用いられる。このような方法は、顔全体を、目テンプレートとピクセル同士をマッチングしなければならない。また、入力した顔イメージに対する目の大きさが分からないため、他の大きさの目テンプレートとマッチング過程を数回繰り返さなければならない。よって、目を正確に検出することはできるものの、時間が多く要される短所がある。顔付基盤法は、光度の状況に基づいて目を検出する。このような方法は、通常、他の顔の傾向及び他の照明条件下で他の主題の目を示し、大量の操作データを収集しなければならない煩わしさがある。特徴基盤法は、目もとのいくつかの区別される特徴を識別するために目の特徴を調査する。このような方法は効率的であるが、高い対照性を持たないイメージに対して正確性が劣る、例えば、目と眉毛を混同し得る短所がある。
【0004】
イメージ基盤の目検出接近法は、顔の残りから顔付及び形態で目の差異を開発して目を位置させる。黒い瞳、白い鞏膜、円形の虹彩、目の角、目の形態などのような目の特別な特徴は人の目と他の物体とを区分するために用いられる。このような方法は効率性や正確性が劣り、実効性がないという短所がある。
【発明の概要】
【発明が解決しようとする課題】
【0005】
本発明は、リアルタイムで高い正確性と効率性を有しながら目の状態を判別することができる装置及び方法を提供する。
【課題を解決するための手段】
【0006】
本発明の一実施例による目状態検出方法は、顔を含む連続映像から、目開き、目閉じ及び瞬きとして目の状態を検出する方法であって、(a)前記連続映像から停止した初期映像を入力するステップ、(b)前記停止した初期映像から顔領域を検出するステップ、(c)前記顔領域から目領域を検出するステップ、(d)前記目領域から自動的な臨界値を設定し、イメージを分割し、分割された区域の境界点を獲得して、前記境界点に最も適合して一致させた楕円を用いて目開き及び目閉じを予備判別するステップ、及び(e)前記ステップ(d)で目閉じと予備判別された場合、予め設定された回数だけ前記ステップ(a)ないし前記ステップ(d)を繰り返して、計算された目閉じ時間が予め設定された臨界値時間より大きいときは、目閉じと判別し、大きくないときは、瞬きと判別するステップを含む。
【0007】
本発明の一実施例による目状態検出装置は、顔を含む連続映像から、目開き、目閉じ及び瞬きとして目の状態を検出する装置であって、前記連続映像を撮影するカメラ部、及び前記連続映像から本発明の一実施例による目状態検出方法によって目状態検出を行って、目開き、目閉じ及び瞬きとして目の状態を判別する信号処理部を含む。
【0008】
本発明の他の実施例による目状態検出方法は、顔を含む連続映像から、目開き、目閉じ及び瞬きとして目の状態を検出する方法であって、(a)前記連続映像から停止した初期映像を入力するステップ、(b)前記停止した初期映像から顔領域及び目領域を検出するステップ、(c)前記検出された目領域をログガボール(Log Gabor)フィルタリングするステップ、(d)前記目領域から自動的な臨界値を設定するステップ、(e)前記目領域の二進化されたイメージを分割し、分割された区域の境界点を獲得するステップ、(f)前記境界点に最も適合する楕円を一致させるステップ、及び(g)前記楕円を用いて目開き及び目閉じを予備判別するステップ、及び(h)前記ステップ(g)で目閉じと予備判別された場合、予め設定された回数だけ前記ステップ(a)ないし前記ステップ(g)を繰り返して、計算された目閉じ時間が予め設定された臨界値時間より大きいときは、目閉じと判別し、大きくないときは、瞬きと判別するステップを含む。
【発明の効果】
【0009】
本実施例による目状態検出方法は、高い正確性と効率性を有しながらリアルタイムで目の状態を判別することができる。また、リアルタイムで目を追跡するための目状態検出、運転者モニタリングシステム、スクリーンを介してナビゲートし、他のアイテムを選択するマウスポイントのように、目をポインティング器具として用いる、目の移動に基づく情報ディスプレイシステム、目の運動を用いるコンピュータゲーム及び瞬きを検出することのできる写真機などに応用することができる。
【図面の簡単な説明】
【0010】
【図1】多様な目の状態を示すイメージである。
【図2】本実施例による目状態検出方法を示す手順図である。
【図3】本実施例によって顔領域を検出した結果を示す図である。
【図4】本実施例によって目領域を検出するアルゴリズムの一例を示す図である。
【図5】本実施例によって目領域を検出した結果を示す図である。
【図6】本実施例によって目開閉判別ステップを示す手順図である。
【図7】本実施例によってクロッピングした目領域を示す図である。
【図8】本実施例によって80 60にリサイズされた目領域を示す図である。
【図9】本実施例に用いられたコンボリューションのためのログガボールカーネルを示す図である。
【図10】本実施例によってフィルタリングされた目領域を示す図である。
【図11】本実施例によって自動臨界値設定ステップを示す手順図である。
【図12】本実施例によって2Dヒストグラムのエントロピーを計算するアルゴリズムの一例を示す図である。
【図13】本実施例によって自動的な臨界値の設定前及び後の結果を示す図である。
【図14】本実施例によって二進化されたイメージ分割及び分割された各区域の境界点の獲得ステップを行った結果を示す図である。
【図15】本実施例によって各区域の境界点に楕円を一致させたステップを行った結果を示す図である。
【図16】本実施例によって目の開閉状態を判別する一例を示すアルゴリズムである。
【図17】本実施例による目状態検出装置を示すブロック図である。
【発明を実施するための形態】
【0011】
本発明は、多様な変更を加えることができ、様々な実施例を有し得るところ、特定の実施例を図面に例示し、詳細な説明において詳細に説明しようとする。しかし、これは、本発明を特定の実施形態に対して限定しようとするものではなく、本発明の思想及び技術の範囲に含まれるすべての変更、均等物ないし代替物を含むものと理解しなければならない。
【0012】
ある構成要素が他の構成要素に「連結されて」いる、または「接続されて」いると言及された場合には、その他の構成要素に直接的に連結または接続されていることもあるが、その間に他の構成要素が存在することもあるものと理解しなければならない。
【0013】
以下、添付された図面を参照しながら本発明による好ましい実施例について詳しく説明するが、図面符号に構わず、同一または対応する構成要素には同一の参照番号を付与し、これに対する重複される説明は省略する。
【0014】
図1は、多様な目の状態示すイメージである。本実施例は、図1に示されたような多様な目の状態を、目開き、目閉じ及び瞬き状態と判別することができる。
【0015】
図2は、本実施例による目状態検出方法を示す手順図である。
【0016】
連続映像から停止した初期映像を入力する(S110)。このような停止した初期映像はグレー(grey)映像であり得る。
【0017】
その後、停止した初期映像から顔領域を検出する(S120)。ここで、顔領域の検出は顔境界の座標を獲得することで行われる。顔領域の検出は、haar基盤の顔検出法(haar based face detection)またはテンプレートマッチング法など多様な方法を用いることができる。例えば、テンプレートマッチング法を用いる場合、入力された初期映像と多重スケールテンプレートでテンプレートマッチング演算を行う。入力された初期映像と多重スケールテンプレートでテンプレートマッチング演算を行った後、顔イメージの位置を出力する。ここで、多重スケールテンプレートは、10個の同一でない大きさにおける平均の顔テンプレートである。顔テンプレートの数は、上記のほかにも多様である。
【0018】
図3は、本実施例によって顔領域を検出した結果を示す図である。
【0019】
再び図2を参照すると、顔領域から目領域を検出する(S130)。ここで、目領域の検出は目境界の座標を獲得することで行われる。目領域とは、目を示す正確な領域ではなく、目を中心に上下左右で余裕のある領域をいう。このような目領域は、目幾何学(eye geometry)を用いて検出することができる。例えば、通常、顔の横長さをX、縦長さをYとするとき、左目の位置は(1/4X、1/5Y)となり、右目の位置は(3/16X、1/5Y)となる。このような位置を中心に余裕をもって設定された領域で目領域を検出することができる。
【0020】
図4は、本実施例によって目領域を検出するアルゴリズムの一例を示す図であり、図5は、本実施例によって目領域を検出した結果を示す図である。
【0021】
その後、目閉じと目開きを予備判別する(S140)。ここで、目閉じと目開きの予備判別は、目閉じ及び目開きを判別して、目開きと判別される場合は、目の状態を目開きと最終判断し、目閉じと判別される場合は、また目閉じであるかまたは瞬きであるかを判別しなければならないため、目閉じと予備判別してから、また目閉じまたは瞬きを判別するステップに進むことをいう。S140は、以下で詳しく説明する。S140で目開き状態と判別されることがある(S190)。S140で目閉じ状態と判別されると、設定された回数だけS110ないしS140を繰り返す(S150)。設定された回数だけS110ないしS140を繰り返した後、目閉じと判別される時間が設定された臨界値時間(ms)より大きいか否かを判断する(S160)。目閉じと判別される時間が設定された臨界値時間(ms)より大きいときは、目閉じ状態と判別する(S170)。目閉じと判別される時間が設定された臨界値時間(ms)より大きくないときは、瞬き(eye blink)状態と判別する(S180)。
【0022】
ここで、繰り返されるステップは、本実施例ではS110ないしS140であるが、S110から、以下に説明するS141〜S147のいずれか一つのステップまで繰り返すこともできる。例えば、S110から、以下に説明するS145まで設定された回数だけ繰り返すことができる。
【0023】
以下で、目閉じと目開きを判別するS140を詳しく説明する。
【0024】
図6は、本実施例によって目開閉判別ステップを示す手順図である。まず、S130によって獲得された目領域を切り取る(S141)。ISP(Image Signal Processor)のイメージクロッピング機能を用いて行うことができる。図7は、本実施例によってクロッピングした目領域を示す図である。
【0025】
その後、切り取られた目領域をリサイズする(S142)。例えば、目領域を80 60にリサイズする。図8は、本実施例によって80 60にリサイズした目領域を示す図である。
【0026】
次に、リサイズした目領域をフィルタリングする(S143)。例えば、コンボリューション(convolution)を用いてログガボール(Log Gabor)フィルタリングする。線形周波数スケール上にログガボール関数は、次の数式1のような移動関数である。
【数1】
ここで、w0は、フィルタ中心周波数である。
【0027】
一定の形態の非フィルタを得るために、用語k/w0は多様なw0に対して一定に維持されることができる。例えば、0.74のk/w0は、略1オクターブ(octave)のフィルタ帯域幅であり、0.55のk/w0は、略2オクターブのフィルタ帯域幅であり、0.41のk/w0は、略3オクターブのフィルタ帯域幅であり得る。図9は、本実施例に用いられたコンボリューションのためのログガボールカーネルを示し、図10は、本実施例によってフィルタリングされた目領域を示す図である。
【0028】
本実施例でコンボリューションを用いたフィルタリングは、次の数式2を用いて行うことができる。
【数2】
ここで、hは、コンボリューションカーネルマトリクス、m及びnは、コンボリューションカーネルマトリクス次元、I′(x、y)は、新しいイメージ、及び、I(x、y)は、入力イメージを示す。
【0029】
その後、自動臨界値を設定する(S144)。
【0030】
以下で、自動臨界値設定ステップであるS144を詳しく説明する。図11は、本実施例によって自動臨界値設定ステップを示す手順図である。
【0031】
図11を参照すると、目領域の2Dヒストグラムを計算する(S144−1)。ここで、ヒストグラムは、イメージ内において他のイメージのピクセル周波数の統計的表現である。2Dヒストグラムは、他の光源水準を有する、相応するピクセルの数を示す。イメージヒストグラムは、原本イメージにおいて正確な光源強度を有するピクセルがいくつあるのかを示すことができる。本実施例に適用されるイメージがサイズ面において多様であるため、ヒストグラム値を保存するために一次元整数配列を用いることができる。2Dヒストグラム計算は、イメージピクセル内のループ及びインデックス256要素の整数配列を用いて行うことができる。ここで、配列の数は、上記のほかにも多様であることは当業者にとって自明なものである。次は、本実施例によって2Dヒストグラムを計算する一例を示すアルゴリズムである。
【数3】
ここで、pucGrey[usIndexX]は、2Dイメージ輝度に対する情報を保有するバイト配列であり、gssHistogramGray[0]は、2Dイメージヒストグラムを保有する256要素の整数配列である。
【0032】
その後、2Dヒストグラムを正規化する(S144−2)。すなわち、ヒストグラムの256要素の整数配列内に保存された2Dヒストグラムを正規化する。正規化されたヒストグラムは、他のピクセル値の確率分布を示す。正規化の過程は、各一つのヒストグラムの256配列要素をイメージ内の全体ピクセル数で分けて行われる。次は、本実施例によって2Dヒストグラムを正規化する一例を示すアルゴリズムである。
【数4】
【0033】
その後、2Dヒストグラムのエントロピー(entropy)を計算する(S144−3)。ここで、エントロピーは、不確実性(uncertainty)の平均値を示す数値である。
【0034】
図12は、本実施例によって2Dヒストグラムのエントロピーを計算するアルゴリズムの一例を示す図である。図12を参照すると、2Dヒストグラムのエントロピー関数を行った後、イメージエントロピーは2D 256要素の二重正確性配列gdEntropyGrey[k]内に保有される。このような関数は、どのピクセルがイメージ内の大部分の情報用量を有しているのかを決定するに用いられる。
【0035】
その後、2段階(2nd stage)の最大エントロピー値のインデックスを獲得する(S144−4)。次に、2段階の最大エントロピー値に基づく自動的な臨界値を設定する(S144−5)。2Dヒストグラムのエントロピー値を計算した後、最大値を検出してから、これに基づく臨界値を獲得することができる。検出された最大値を中心に予め設定されたパーセント内に臨界値を獲得することができる。
【0036】
ここで、多段階(multistage)の2Dエントロピー関数が用いられることもある。多段階のエントロピー関数は、繰り返しの数及びパートA及びBによるヒストグラム分割で単一段階と異なることがある。例えば、4段階のエントロピー関数は、4層上に自動に臨界値入力イメージに対する確率を提供することができる。ヒストグラム内に選択された地域にわたってエントロピーの最大値計算を用いて、数回ヒストグラムを分割することが求められる。一次エントロピーの最大値を計算した後、0と一次最大地点との間のエントロピーの最大値を計算してから、一次最大値とヒストグラムの255要素との間のエントロピーの最大地点を計算することができる。
【0037】
また、臨界値のイメージ上にヒストグラム均等化(equalization)を用いることもできる。「ヒストグラム均等化」は、すべての小さいヒストグラムコラムを一つにグルーピングする簡単な過程である。このようなグルーピング後、ヒストグラム変化に関するイメージピクセル置換を行うことができる。2Dヒストグラム均等化のためにヒストグラムの平均値を計算することができる。その後、ループを作って、ポジション0から255まですべてのヒストグラムコラムをチェックし、該当ヒストグラムコラムが平均値を超えるグローバルヒストグラムの平均値より小さいか否かをチェックする。そうであれば、次のコラムに進んで、この値をac一次値として扱う。追加するすべてのポジションは、グレー水準の置換候補としてマーキングされる。次のコラムが平均値よりもさらに大きい値を有すると、その値に一次値を追加せずに、次のコラムに進む。図13は、本実施例によって自動的な臨界値の設定前及び後の結果を示す図である。
【0038】
再び図6を参照すると、二進化されたイメージを分割し、分割された各区域の境界点を獲得する(S145)。二進化されたイメージ分割は、次のように行われる。まず、使用しないイメージの部分を初期化する。その後、4個の連結された成分を用いて、イメージを分割する。分割されたものをラベリングして、区域IDを固定する。その後、区域サイズを計算し、サイズ順に、区域に対して新しいIDを計算する。次に、中心と周辺のボックスを計算し、区域エッジ点を計算する。図14は、本実施例によって二進化されたイメージ分割及び分割された各区域の境界点の獲得ステップを行った結果を示す図である。
【0039】
その後、各区域の境界点に楕円を一致させる(S146)。すなわち、境界点のセットに最もよく一致する楕円を計算する。例えば、6個の境界点を用いて、最もよく一致する楕円を計算することができる。図15は、本実施例によって各区域の境界点に楕円を一致させたステップを行った結果を示す図である。
【0040】
その後、獲得された楕円をもって目の開閉状態を判別する(S147)。例えば、楕円の円形度または面積を計算して、目の開閉状態を判別することができる。楕円の面積で目の開閉状態を判別する場合、目閉じと判別する楕円の面積の範囲を設定することができる。例えば、楕円の面積が5mm2から30mm2内の場合、目閉じと判別することができる。また、目とまぶたの幾何学に起因して目閉じを判別することもできる。
【0041】
図16は、本実施例によって目の開閉状態を判別する一例を示すアルゴリズムである。
【0042】
図17は、本実施例による目状態検出装置を示すブロック図である。
【0043】
図17を参照すると、目状態検出装置は、カメラ部110、メモリ120、信号処理部130及び制御部140を含む。カメラ部110は、連続映像を撮影して、撮影したイメージをメモリ120に出力する。メモリ120は、撮影されたイメージを入力されて保存する。信号処理部130は、メモリ120に保存されたデジタルイメージに対して本実施例によって目状態検出を行い、目閉じ、瞬きまたは目開きとして目の状態を判断して、その結果をメモリ120または制御部140に出力する。制御部140は、目状態の判断結果に応じて、制御が必要なモジュールに制御信号を出力する。ここで、制御部140は、示されたものと異なって、無いこともある。制御部140がない場合は、信号処理部130は、判断された目の状態を外部に出力する。
【0044】
例えば、目状態検出装置が運転者モニタリングシステムの警報発生部に連結された場合、信号処理部130で被写体が目閉じと判断されると、制御部140は、警報発生部に警報音を発生する信号を送ることができる。また他の例として、目状態検出装置がカメラに連結された場合、信号処理部130で被写体が瞬きと判断されると、制御部140は、最適の撮影時点を捕捉できるように制御信号をカメラに送ることができる。
【0045】
本実施例で示すアルゴリズムは、本実施例を具現するために多様に表現できるアルゴリズムの一例に過ぎず、このような一例とは異なるアルゴリズムも本実施例を具現することができることは当業者にとって自明なものである。
【0046】
本実施例で使用される「〜部」という用語は、ソフトウェアまたはFPGA(field-programmable gate array)またはASICのようなハードウェア構成要素を意味し、「〜部」はある種類の役割を果たす。ところが、「〜部」は、ソフトウェアまたはハードウェアに限定される意味ではない。「〜部」は、アドレッシングすることのできる保存媒体にあるように構成されることもでき、あるいは、一つまたはそれ以上のプロセッサを再生させるように構成されることもできる。よって、一例として「〜部」は、ソフトウェアの構成要素、客体志向ソフトウェアの構成要素、クラスの構成要素及びタスクの構成要素のような構成要素と、プロセス、関数、属性、プロシージャ、サブルーチン、プログラムコードのセグメント、ドライバ、ファームウエア、マイクロコード、回路、データ、データベース、データ構造、テーブル、配列、及び変数を含む。構成要素と「〜部」の中で提供される機能は、さらに小さい数の構成要素及び「〜部」に結合されるか、または追加的な構成要素と「〜部」とにさらに分離できる。それだけでなく、構成要素及び「〜部」は、デバイスまたは保安マルチメディアカード内の一つまたはそれ以上のCPUを再生させるように具現できる。
【0047】
上述したすべての機能は、上記機能を行うようにコーディングされたソフトウェアやプログラムコードなどによるマイクロプロセッサ、制御機、マイクロ制御機、ASIC(Application Specific Integrated Circuit)などのようなプロセッサによって行われることができる。前記コードの設計、開発及び具現は、本発明の説明に基づいて当業者に自明であるといえる。
【0048】
以上、本発明について実施例を参照しながら説明したが、当該技術分野における通常の知識を有する者は、本発明の技術的思想及び領域から外れない範囲内で本発明を多様に修正及び変更させて実施することができることを理解できるだろう。したがって、上述した実施例に限定されずに、本発明は、以下の特許請求の範囲の範囲内におけるすべての実施例を含むといえる。
【産業上の利用可能性】
【0049】
本発明は、リアルタイムで目を追跡するための目の状態を検出する方法及び装置であって、運転者モニタリングシステム、目の移動に基づく情報ディスプレイシステム、目の運動を用いるコンピュータゲーム及び瞬きを検出することのできる写真機などに上記の目の状態を検出する方法及び装置を適用することができる。
【特許請求の範囲】
【請求項1】
顔を含む連続映像から、目開き、目閉じ及び瞬きとして目の状態を検出する方法であって、
(a)前記連続映像から停止した初期映像を入力するステップ、
(b)前記停止した初期映像から顔領域を検出するステップ、
(c)前記顔領域から目領域を検出するステップ、
(d)前記目領域から自動的な臨界値を設定し、イメージを分割し、分割された区域の境界点を獲得して、前記境界点に最も適合して一致させた楕円を用いて目開き及び目閉じを予備判別するステップ、及び
(e)前記ステップ(d)で目閉じと予備判別された場合、予め設定された回数だけ前記ステップ(a)ないし前記ステップ(d)を繰り返して、計算された目閉じ時間が予め設定された臨界値時間より大きいときは、目閉じと判別し、大きくないときは、瞬きと判別するステップ、
を含むことを特徴とする目状態検出方法。
【請求項2】
前記ステップ(b)は、haar基盤の顔検出法(haar based face detection)またはテンプレートマッチング法を用いて顔領域を検出することを特徴とする請求項1に記載の目状態検出方法。
【請求項3】
前記ステップ(c)は、目幾何学(eye geometry)を用いて目領域を検出することを特徴とする請求項1に記載の目状態検出方法。
【請求項4】
前記ステップ(d)は、
(d−1)前記目領域をフィルタリングするステップ、
(d−2)前記目領域から自動的な臨界値を設定するステップ、
(d−3)前記目領域の二進化されたイメージを分割し、分割された区域の境界点を獲得するステップ、
(d−4)前記境界点に最も適合する楕円を一致させるステップ、及び
(d−5)前記楕円を用いて目開き及び目閉じを予備判別するステップ、
を含むことを特徴とする請求項1に記載の目状態検出方法。
【請求項5】
前記ステップ(d−1)の前に、前記目領域をクロップ(crop)し、リサイズするステップをさらに含むことを特徴とする請求項4に記載の目状態検出方法。
【請求項6】
前記ステップ(d−1)は、コンボリューションを用いてログガボール(Log Gabor)フィルタリングすることを特徴とする請求項4に記載の目状態検出方法。
【請求項7】
前記コンボリューションを用いるログガボールフィルタリングは、
【数5】
(ここで、hは、コンボリューションカーネルマトリクス、m及びnは、コンボリューションカーネルマトリクス次元、I′(x、y)は、新しいイメージ、及び、I(x、y)は、入力イメージである。)
を用いることを特徴とする請求項6に記載の目状態検出方法。
【請求項8】
前記ステップ(d−2)は、
(dd−1)前記目領域のイメージ内における他のイメージのピクセル周波数の統計的表現である2Dヒストグラムを計算するステップ、
(dd−2)前記2Dヒストグラムを他のピクセル値の確率分布に正規化するステップ、
(dd−3)前記正規化された2Dヒストグラムから不確実性(uncertainty)の平均値を示す数値であるエントロピーを計算するステップ、
(dd−4)2段階の最大エントロピー値のインデックスを獲得するステップ、及び
(dd−5)2段階の最大エントロピー値に基づく自動的な臨界値を設定するステップ、
を含むことを特徴とする請求項4に記載の目状態検出方法。
【請求項9】
前記ステップ(dd−2)は、各一つのヒストグラム要素をイメージ内の全体ピクセル数で分けて正規化することを特徴とする請求項8に記載の目状態検出方法。
【請求項10】
前記ステップ(dd−1)で計算された2Dヒストグラムを保存するために、一次元整数配列を用いることを特徴とする請求項8に記載の目状態検出方法。
【請求項11】
前記ステップ(dd−5)は、前記検出された最大エントロピー値を中心に、予め設定されたパーセント内に臨界値を獲得することを特徴とする請求項8に記載の目状態検出方法。
【請求項12】
前記ステップ(dd−3)の次に、すべての小さいヒストグラムコラムを一つにグルーピングするヒストグラム均等化(equalization)を行うことを特徴とする請求項8に記載の目状態検出方法。
【請求項13】
前記ステップ(d−4)で、少なくとも6個の境界点を用いて、最も適合する楕円を一致させることを特徴とする請求項4に記載の目状態検出方法。
【請求項14】
前記ステップ(d−5)で、前記楕円の円形度または面積を用いて、目開き及び目閉じを予備判別することを特徴とする請求項4に記載の目状態検出方法。
【請求項15】
前記停止した初期映像は、グレー映像であることを特徴とする請求項1に記載の目状態検出方法。
【請求項16】
請求項1ないし請求項15のいずれか1項に記載の目状態検出方法を行うために、デジタル処理装置によって実行できる命令語のプログラムが具現されており、前記デジタル処理装置によって読み取り可能なプログラムを記録したことを特徴とする記録媒体。
【請求項17】
顔を含む連続映像から、目開き、目閉じ及び瞬きとして目の状態を検出する装置であって、
前記連続映像を撮影するカメラ部、及び
前記連続映像から第1項ないし第15項のいずれか1項に記載の目状態検出方法によって目状態検出を行って、目開き、目閉じ及び瞬きとして目の状態を判別する信号処理部、
を含むことを特徴とする目状態検出装置。
【請求項18】
顔を含む連続映像から、目開き、目閉じ及び瞬きとして目の状態を検出する方法であって、
(a)前記連続映像から停止した初期映像を入力するステップ、
(b)前記停止した初期映像から顔領域及び目領域を検出するステップ、
(c)前記検出された目領域をログガボールフィルタリングするステップ、
(d)前記目領域から自動的な臨界値を設定するステップ、
(e)前記目領域の二進化されたイメージを分割し、分割された区域の境界点を獲得するステップ、
(f)前記境界点に最も適合する楕円を一致させるステップ、
(g)前記楕円を用いて目開き及び目閉じを予備判別するステップ、及び
(h)前記ステップ(g)で目閉じと予備判別された場合、予め設定された回数だけ前記ステップ(a)ないし前記ステップ(g)を繰り返して、計算された目閉じ時間が予め設定された臨界値時間より大きいときは、目閉じと判別し、大きくないときは、瞬きと判別するステップ、
を含むことを特徴とする目状態検出方法。
【請求項19】
前記ステップ(c)は、コンボリューションを用いてログガボールフィルタリングすることを特徴とする請求項18に記載の目状態検出方法。
【請求項20】
前記コンボリューションを用いたログガボールフィルタリングは、
【数6】
(ここで、hは、コンボリューションカーネルマトリクス、m及びnは、コンボリューションカーネルマトリクス次元、I′(x、y)は、新しいイメージ、及び、I(x、y)は、入力イメージである。)
を用いることを特徴とする請求項19に記載の目状態検出方法。
【請求項21】
前記ステップ(d)は、
(d−1)前記目領域のイメージ内における他のイメージのピクセル周波数の統計的表現である2Dヒストグラムを計算するステップ、
(d−2)前記2Dヒストグラムを他のピクセル値の確率分布に正規化するステップ、
(d−3)前記正規化された2Dヒストグラムから不確実性(uncertainty)の平均値を示す数値であるエントロピーを計算するステップ、
(d−4)2段階の最大エントロピー値のインデックスを獲得するステップ、及び
(d−5)2段階の最大エントロピー値に基づく自動的な臨界値を設定するステップ、
を含むことを特徴とする請求項18に記載の目状態検出方法。
【請求項22】
前記ステップ(d−2)は、各一つのヒストグラム要素をイメージ内の全体ピクセル数で分けて正規化することを特徴とする請求項21に記載の目状態検出方法。
【請求項23】
前記ステップ(d−1)で計算された2Dヒストグラムを保存するために、一次元整数配列を用いることを特徴とする請求項21に記載の目状態検出方法。
【請求項24】
前記ステップ(d−5)は、前記検出された最大エントロピー値を中心に、予め設定されたパーセント内に臨界値を獲得することを特徴とする請求項21に記載の目状態検出方法。
【請求項25】
前記ステップ(d−3)の次に、すべての小さいヒストグラムコラムを一つにグルーピングするヒストグラム均等化(equalization)を行うことを特徴とする請求項21に記載の目状態検出方法。
【請求項26】
前記ステップ(f)で、少なくとも6個の境界点を用いて、最も適合する楕円を一致させることを特徴とする請求項18に記載の目状態検出方法。
【請求項27】
前記ステップ(g)で、前記楕円の円形度または面積を用いて、目開き及び目閉じを予備判別することを特徴とする請求項18に記載の目状態検出方法。
【請求項28】
前記停止した初期映像は、グレー映像であることを特徴とする請求項18に記載の目状態検出方法。
【請求項29】
請求項18ないし請求項28のいずれか1項に記載の目状態検出方法を行うために、デジタル処理装置によって実行できる命令語のプログラムが具現されており、前記デジタル処理装置によって読み取り可能なプログラムを記録したことを特徴とする記録媒体。
【請求項1】
顔を含む連続映像から、目開き、目閉じ及び瞬きとして目の状態を検出する方法であって、
(a)前記連続映像から停止した初期映像を入力するステップ、
(b)前記停止した初期映像から顔領域を検出するステップ、
(c)前記顔領域から目領域を検出するステップ、
(d)前記目領域から自動的な臨界値を設定し、イメージを分割し、分割された区域の境界点を獲得して、前記境界点に最も適合して一致させた楕円を用いて目開き及び目閉じを予備判別するステップ、及び
(e)前記ステップ(d)で目閉じと予備判別された場合、予め設定された回数だけ前記ステップ(a)ないし前記ステップ(d)を繰り返して、計算された目閉じ時間が予め設定された臨界値時間より大きいときは、目閉じと判別し、大きくないときは、瞬きと判別するステップ、
を含むことを特徴とする目状態検出方法。
【請求項2】
前記ステップ(b)は、haar基盤の顔検出法(haar based face detection)またはテンプレートマッチング法を用いて顔領域を検出することを特徴とする請求項1に記載の目状態検出方法。
【請求項3】
前記ステップ(c)は、目幾何学(eye geometry)を用いて目領域を検出することを特徴とする請求項1に記載の目状態検出方法。
【請求項4】
前記ステップ(d)は、
(d−1)前記目領域をフィルタリングするステップ、
(d−2)前記目領域から自動的な臨界値を設定するステップ、
(d−3)前記目領域の二進化されたイメージを分割し、分割された区域の境界点を獲得するステップ、
(d−4)前記境界点に最も適合する楕円を一致させるステップ、及び
(d−5)前記楕円を用いて目開き及び目閉じを予備判別するステップ、
を含むことを特徴とする請求項1に記載の目状態検出方法。
【請求項5】
前記ステップ(d−1)の前に、前記目領域をクロップ(crop)し、リサイズするステップをさらに含むことを特徴とする請求項4に記載の目状態検出方法。
【請求項6】
前記ステップ(d−1)は、コンボリューションを用いてログガボール(Log Gabor)フィルタリングすることを特徴とする請求項4に記載の目状態検出方法。
【請求項7】
前記コンボリューションを用いるログガボールフィルタリングは、
【数5】
(ここで、hは、コンボリューションカーネルマトリクス、m及びnは、コンボリューションカーネルマトリクス次元、I′(x、y)は、新しいイメージ、及び、I(x、y)は、入力イメージである。)
を用いることを特徴とする請求項6に記載の目状態検出方法。
【請求項8】
前記ステップ(d−2)は、
(dd−1)前記目領域のイメージ内における他のイメージのピクセル周波数の統計的表現である2Dヒストグラムを計算するステップ、
(dd−2)前記2Dヒストグラムを他のピクセル値の確率分布に正規化するステップ、
(dd−3)前記正規化された2Dヒストグラムから不確実性(uncertainty)の平均値を示す数値であるエントロピーを計算するステップ、
(dd−4)2段階の最大エントロピー値のインデックスを獲得するステップ、及び
(dd−5)2段階の最大エントロピー値に基づく自動的な臨界値を設定するステップ、
を含むことを特徴とする請求項4に記載の目状態検出方法。
【請求項9】
前記ステップ(dd−2)は、各一つのヒストグラム要素をイメージ内の全体ピクセル数で分けて正規化することを特徴とする請求項8に記載の目状態検出方法。
【請求項10】
前記ステップ(dd−1)で計算された2Dヒストグラムを保存するために、一次元整数配列を用いることを特徴とする請求項8に記載の目状態検出方法。
【請求項11】
前記ステップ(dd−5)は、前記検出された最大エントロピー値を中心に、予め設定されたパーセント内に臨界値を獲得することを特徴とする請求項8に記載の目状態検出方法。
【請求項12】
前記ステップ(dd−3)の次に、すべての小さいヒストグラムコラムを一つにグルーピングするヒストグラム均等化(equalization)を行うことを特徴とする請求項8に記載の目状態検出方法。
【請求項13】
前記ステップ(d−4)で、少なくとも6個の境界点を用いて、最も適合する楕円を一致させることを特徴とする請求項4に記載の目状態検出方法。
【請求項14】
前記ステップ(d−5)で、前記楕円の円形度または面積を用いて、目開き及び目閉じを予備判別することを特徴とする請求項4に記載の目状態検出方法。
【請求項15】
前記停止した初期映像は、グレー映像であることを特徴とする請求項1に記載の目状態検出方法。
【請求項16】
請求項1ないし請求項15のいずれか1項に記載の目状態検出方法を行うために、デジタル処理装置によって実行できる命令語のプログラムが具現されており、前記デジタル処理装置によって読み取り可能なプログラムを記録したことを特徴とする記録媒体。
【請求項17】
顔を含む連続映像から、目開き、目閉じ及び瞬きとして目の状態を検出する装置であって、
前記連続映像を撮影するカメラ部、及び
前記連続映像から第1項ないし第15項のいずれか1項に記載の目状態検出方法によって目状態検出を行って、目開き、目閉じ及び瞬きとして目の状態を判別する信号処理部、
を含むことを特徴とする目状態検出装置。
【請求項18】
顔を含む連続映像から、目開き、目閉じ及び瞬きとして目の状態を検出する方法であって、
(a)前記連続映像から停止した初期映像を入力するステップ、
(b)前記停止した初期映像から顔領域及び目領域を検出するステップ、
(c)前記検出された目領域をログガボールフィルタリングするステップ、
(d)前記目領域から自動的な臨界値を設定するステップ、
(e)前記目領域の二進化されたイメージを分割し、分割された区域の境界点を獲得するステップ、
(f)前記境界点に最も適合する楕円を一致させるステップ、
(g)前記楕円を用いて目開き及び目閉じを予備判別するステップ、及び
(h)前記ステップ(g)で目閉じと予備判別された場合、予め設定された回数だけ前記ステップ(a)ないし前記ステップ(g)を繰り返して、計算された目閉じ時間が予め設定された臨界値時間より大きいときは、目閉じと判別し、大きくないときは、瞬きと判別するステップ、
を含むことを特徴とする目状態検出方法。
【請求項19】
前記ステップ(c)は、コンボリューションを用いてログガボールフィルタリングすることを特徴とする請求項18に記載の目状態検出方法。
【請求項20】
前記コンボリューションを用いたログガボールフィルタリングは、
【数6】
(ここで、hは、コンボリューションカーネルマトリクス、m及びnは、コンボリューションカーネルマトリクス次元、I′(x、y)は、新しいイメージ、及び、I(x、y)は、入力イメージである。)
を用いることを特徴とする請求項19に記載の目状態検出方法。
【請求項21】
前記ステップ(d)は、
(d−1)前記目領域のイメージ内における他のイメージのピクセル周波数の統計的表現である2Dヒストグラムを計算するステップ、
(d−2)前記2Dヒストグラムを他のピクセル値の確率分布に正規化するステップ、
(d−3)前記正規化された2Dヒストグラムから不確実性(uncertainty)の平均値を示す数値であるエントロピーを計算するステップ、
(d−4)2段階の最大エントロピー値のインデックスを獲得するステップ、及び
(d−5)2段階の最大エントロピー値に基づく自動的な臨界値を設定するステップ、
を含むことを特徴とする請求項18に記載の目状態検出方法。
【請求項22】
前記ステップ(d−2)は、各一つのヒストグラム要素をイメージ内の全体ピクセル数で分けて正規化することを特徴とする請求項21に記載の目状態検出方法。
【請求項23】
前記ステップ(d−1)で計算された2Dヒストグラムを保存するために、一次元整数配列を用いることを特徴とする請求項21に記載の目状態検出方法。
【請求項24】
前記ステップ(d−5)は、前記検出された最大エントロピー値を中心に、予め設定されたパーセント内に臨界値を獲得することを特徴とする請求項21に記載の目状態検出方法。
【請求項25】
前記ステップ(d−3)の次に、すべての小さいヒストグラムコラムを一つにグルーピングするヒストグラム均等化(equalization)を行うことを特徴とする請求項21に記載の目状態検出方法。
【請求項26】
前記ステップ(f)で、少なくとも6個の境界点を用いて、最も適合する楕円を一致させることを特徴とする請求項18に記載の目状態検出方法。
【請求項27】
前記ステップ(g)で、前記楕円の円形度または面積を用いて、目開き及び目閉じを予備判別することを特徴とする請求項18に記載の目状態検出方法。
【請求項28】
前記停止した初期映像は、グレー映像であることを特徴とする請求項18に記載の目状態検出方法。
【請求項29】
請求項18ないし請求項28のいずれか1項に記載の目状態検出方法を行うために、デジタル処理装置によって実行できる命令語のプログラムが具現されており、前記デジタル処理装置によって読み取り可能なプログラムを記録したことを特徴とする記録媒体。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【公表番号】特表2013−504114(P2013−504114A)
【公表日】平成25年2月4日(2013.2.4)
【国際特許分類】
【出願番号】特願2012−527821(P2012−527821)
【出願日】平成22年9月1日(2010.9.1)
【国際出願番号】PCT/KR2010/005934
【国際公開番号】WO2011/028023
【国際公開日】平成23年3月10日(2011.3.10)
【出願人】(510039426)エルジー イノテック カンパニー リミテッド (279)
【Fターム(参考)】
【公表日】平成25年2月4日(2013.2.4)
【国際特許分類】
【出願日】平成22年9月1日(2010.9.1)
【国際出願番号】PCT/KR2010/005934
【国際公開番号】WO2011/028023
【国際公開日】平成23年3月10日(2011.3.10)
【出願人】(510039426)エルジー イノテック カンパニー リミテッド (279)
【Fターム(参考)】
[ Back to top ]