説明

顔画像特徴量生成装置および顔画像特徴量生成プログラム

【課題】光の影響にロバストであって且つ高精度に顔画像特徴量を生成する。
【解決手段】画像データを取り込む画像データ取得部10と、画像データ取得部10が取り込んだ画像データに対して顔検出処理を実行し、その画像データから顔領域を抽出する顔領域抽出部20と、顔領域抽出部20が抽出した顔領域から、円形または楕円形の解析領域を二分する第1の領域および第2の領域を決定する解析領域決定部30と、解析領域決定部30が決定した第1の領域および第2の領域それぞれについて特徴量を計算し、これら計算した特徴量を連結して顔画像特徴量を生成する顔画像特徴量計算部40とを備えた。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、顔画像特徴量生成装置および顔画像特徴量生成プログラムに関する。
【背景技術】
【0002】
ビデオカメラで撮影された映像データの各フレーム画像から、人物の顔領域をロバストに検出する技術が知られている(例えば、非特許文献1参照)。
また、人物の顔画像から顔の目部分や口部分等の位置を検出し、これらの位置に基づいて顔画像を分割して分割領域ごとの画像特徴ベクトルを計算し、これら画像特徴ベクトルを連結して顔画像特徴量を生成する技術が知られている(例えば、非特許文献2参照)。
【先行技術文献】
【非特許文献】
【0003】
【非特許文献1】PAUL VIOLA, MICHAEL J. JONES, "Robust Real-Time Face Detection", International Journal of Computer Vision, 2004, Vol. 57, No. 2, pp. 137-154.
【非特許文献2】Zisheng Li, Jun-ichi Imai, Masahide Kaneko, "Facial Expression Recognition Using Facial-component-based Bag of Words and PHOG Descriptors", 映像情報メディア学会誌, 2010, Vol. 64, No.2, pp. 230-236.
【発明の概要】
【発明が解決しようとする課題】
【0004】
非特許文献1記載の技術では、顔領域をロバストに検出することが可能である。しかしながら、非特許文献1記載の技術は、人物の顔を含む画像から顔領域を矩形で検出するものであり、顔の背景、髪の毛、アクセサリ等、顔認識や顔表情認識に必要がない情報をも含めて認識対象とするため、認識精度を落とす要因となる。
また、非特許文献2記載の技術では、顔の目部分や口部分の位置を検出し、顔認識や顔表情認識を行う上で重要となる領域のみで顔画像特徴量を生成するものである。しかしながら、外光や室内照明の状態が変化する撮影環境において撮影された人物の画像から、顔の目部分や口部分等の位置をロバストに検出することは難しい。よって、光の影響を受けずに人物の顔画像特徴量を安定して生成することは困難である。
【0005】
そこで、本発明は上記問題点を解決するためになされたものであり、光の影響にロバストであって且つ高精度に顔画像特徴量を生成する、顔画像特徴量生成装置および顔画像特徴量生成プログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
[1]上記の課題を解決するため、本発明の一態様である顔画像特徴量生成装置は、画像データを取り込む画像データ取得部と、前記画像データ取得部が取り込んだ前記画像データに対して顔検出処理を実行し、前記画像データから顔領域を抽出する顔領域抽出部と、前記顔領域抽出部が抽出した前記顔領域から、円形または楕円形の解析領域を二分する第1の領域および第2の領域を決定する解析領域決定部と、前記解析領域決定部が決定した前記第1の領域および前記第2の領域それぞれについて特徴量を計算し、これら計算した特徴量を連結して顔画像特徴量を生成する顔画像特徴量計算部と、を備えることを特徴とする。
[2]上記[1]記載の顔画像特徴量生成装置において、前記顔領域抽出部は、顔を含む矩形の顔領域を前記画像データから抽出し、前記解析領域決定部は、前記顔領域に内接する円形または楕円形よりも小さな円形または楕円形の前記解析領域を縦方向に二分して前記第1の領域および第2の領域を決定することを特徴とする。
[3]上記[2]記載の顔画像特徴量生成装置において、前記顔領域抽出部は、前記矩形の顔領域を所定サイズの顔領域に正規化することを特徴とする。
[4]上記の課題を解決するため、本発明の一態様である顔画像特徴量生成プログラムは、コンピュータを、画像データを取り込む画像データ取得部と、前記画像データ取得部が取り込んだ前記画像データに対して顔検出処理を実行し、前記画像データから顔領域を抽出する顔領域抽出部と、前記顔領域抽出部が抽出した前記顔領域から、円形または楕円形の解析領域を二分する第1の領域および第2の領域を決定する解析領域決定部と、前記解析領域決定部が決定した前記第1の領域および前記第2の領域それぞれについて特徴量を計算し、これら計算した特徴量を連結して顔画像特徴量を生成する顔画像特徴量計算部と、として機能させる。
【発明の効果】
【0007】
本発明によれば、光の影響にロバストであって且つ高精度に顔画像特徴量を生成することができる。
【図面の簡単な説明】
【0008】
【図1】本発明の一実施形態である顔画像特徴量生成装置の機能構成を示すブロック図である。
【図2】フレーム画像と、このフレーム画像から抽出された矩形の顔領域と、この顔領域を正規化して得られた正規化顔領域との例を模式的に示す図である。
【図3】正規化顔領域に基づき、解析領域決定部によって決定された解析領域を視覚的に分かり易く線描画した図である。
【図4】顔画像特徴量計算部によって得られた、上部解析領域における特徴量のヒストグラムと、下部解析領域における特徴量のヒストグラムと、これら二つのヒストグラムが連結された、解析領域全体における特徴量のヒストグラムとを模式的に示した図である。
【図5】同実施形態である顔画像特徴量生成装置の処理手順を示すフローチャートである。
【発明を実施するための形態】
【0009】
以下、本発明を実施するための形態について、図面を参照して詳細に説明する。
図1は、本発明の一実施形態である顔画像特徴量生成装置の機能構成を示すブロック図である。同図に示すように、顔画像特徴量生成装置1は、画像データ取得部10と、顔領域抽出部20と、解析領域決定部30と、顔画像特徴量計算部40とを備える。
【0010】
画像データ取得部10は、図示しない外部装置から供給される画像データを取り込む。画像データは、静止画像データまたは動画像データである。画像データが静止画像データである場合、画像データ取得部10は、取り込んだ画像データをフレーム画像データとして顔領域抽出部20に供給する。また、画像データが動画像データである場合、画像データ取得部10は、取り込んだ動画像データからキーフレームを検出し、このキーフレームのデータをフレーム画像データとして、順次またはあらかじめ決定された所定フレーム数おきに顔領域抽出部20に供給する。
外部装置は、例えば、撮影装置や記録装置である。
【0011】
顔領域抽出部20は、画像データ取得部10から供給されるフレーム画像データを取り込む。顔領域抽出部20は、取り込んだフレーム画像データに対して顔検出処理を実行し、そのフレーム画像データから人物の顔領域を検出する。この顔領域は、人物の顔を含む矩形の画像領域である。顔検出処理のアルゴリズムとして、顔領域抽出部20は、公知の顔検出アルゴリズム、例えばAdaBoostを用いる。
なお、公知の顔検出アルゴリズムについては、例えば、前記の非特許文献1に詳細が開示されている。
【0012】
顔領域抽出部20は、検出した顔領域のデータをフレーム画像データから抽出し、その顔領域データを、所定サイズ(例えば、128画素×128画素)の画像データに正規化する。正規化の処理として、顔領域抽出部20は、顔領域を所定サイズの矩形領域に拡大させたり、縮小させたりする画像処理を実行する。つまり、フレーム画像に含まれる顔のサイズは様々であるため、顔領域抽出部20は、顔領域のサイズを拡大または縮小して、全ての顔領域の解像度を同程度にする。これにより、後段の顔画像特徴量計算部40によって検出される局所特徴量の数や特徴のレベルが合い、顔認識処理や顔表情認識処理で、これらの局所特徴量を利用したときに、認識率の向上に繋がる。顔領域抽出部20は、正規化した画像データである正規化顔領域データを解析領域決定部30に供給する。
【0013】
解析領域決定部30は、顔領域検出部20から供給される正規化顔領域データを取り込み、この正規化顔領域データに基づき、顔画像特徴量を計算するための解析領域を決定する。解析領域は、例えば、正規化顔領域の中心位置を中心として設けられる、正規化顔領域に含まれる円(楕円または真円)領域である。解析領域決定部30は、例えば、正規化顔領域の水平方向であって且つその中心を通る直線で解析領域を二分し、その上部の領域を上部解析領域(第1の領域)、下部の領域を下部解析領域(第2の領域)として決定する。言い換えると、解析領域決定部30は、正規化顔領域に内接する円形または楕円形よりも小さな円形または楕円形の解析領域を上下(縦)方向に二分して上部解析領域および下部解析領域を決定する。
なお、上部解析領域および下部解析領域の面積は同一であってもよいし、異なっていてもよい。
【0014】
顔画像特徴量計算部40は、解析領域抽出部30が決定した正規化顔領域における上部解析領域および下部解析領域それぞれについて、特徴量であるBag−of−Keypointsを計算する。具体的には、顔画像特徴量計算部40は、上部解析領域からSIFT(Scale Invariant Feature Transformation)特徴量、またはSURF(Speeded Up Robust Features)等の局所特徴量(Keypoints)を計算する。顔画像特徴量計算部40は、これら特徴量についてクラスタ分析処理を実行することによってクラス分類し、クラスタに対する出現頻度のヒストグラムを生成する。クラスタ分析処理として、顔画像特徴量計算部40は、例えばK平均法を用いる。顔画像特徴量計算部40は、生成したヒストグラムをBag−of−Keypointsとする。顔画像特徴量計算部40は、下部解析領域についても上部解析領域と同様にBag−of−Keypointsを求める。
【0015】
顔画像特徴量計算部40は、それぞれ計算した二つのBag−of−Keypointsを連結して解析領域全体としてのBag−of−Keypointsを生成し、このBag−of−Keypointsを顔画像特徴量として出力する。例えば、顔画像特徴量計算部40は、上部解析領域に対する175次元のBag−of−Keypointsに、下部解析領域に対する125次元のBag−of−Keypointsを連結し、解析領域全体として300次元のBag−of−Keypointsを生成する。
【0016】
図2は、フレーム画像と、このフレーム画像から抽出された矩形の顔領域と、この顔領域を正規化して得られた正規化顔領域との例を模式的に示す図である。符号2はフレーム画像であり、符号2aは顔領域抽出部20によってフレーム画像2から検出された顔領域であり、符号2bは顔領域抽出部20によって顔領域が正規化(ここでは、縮小)された正規化顔領域である。同図に示すように、正規化顔領域2bは、顔のパーツである、両眉毛、両目、鼻、口を含むようにL×Lに正規化されている。LとLとの長さの関係は、例えば、L=Lである。
【0017】
図3は、正規化顔領域2bに基づき、解析領域決定部30によって決定された解析領域を視覚的に分かり易く線描画した図である。同図に示すように、解析領域決定部30は、L×Lの正規化顔領域2bの中心位置を中心として、正規化顔領域2bに含まれる円形の解析領域3を決定する。解析領域3の水平方向の径は、例えば、Lの0.8倍の長さであり、垂直方向の径は、例えば、Lの0.8倍の長さである。このように、解析領域3の径を正規化顔領域2bの内接円の径よりも小さくすることにより、人物の顔認識や顔表情認識にとって重要度が低い髪の毛や、イヤリング等の情報を除外することができる。解析領域決定部30は、解析領域3の水平方向であって且つその中心を通る直線で、解析領域3を上部解析領域3Uと下部解析領域3Dとに区分する。このように区分することにより、上部解析領域3Uは顔の両眉毛や両目を含み、下部解析領域3Dは鼻頭や口を含むこととなる。
【0018】
図4は、顔画像特徴量計算部40によって得られた、上部解析領域における特徴量のヒストグラムと、下部解析領域における特徴量のヒストグラムと、これら二つのヒストグラムが連結された、解析領域全体における特徴量のヒストグラムとを模式的に示した図である。同図は、上部解析領域における特徴量のヒストグラムの後に、下部解析領域における特徴量のヒストグラムを連結した例である。このように、領域を分割してクラス分類することにより、Bag−of−Keypointsに位置情報(上部解析領域または下部解析領域)を対応付けることができる。
以上により、光の影響にロバストな顔認識処理や顔表情認識処理を可能にすることができる。
なお、顔画像特徴量計算部40は、下部解析領域における特徴量のヒストグラムの後に、上部解析領域における特徴量のヒストグラムを連結することによって、解析領域全体における特徴量のヒストグラムを得てもよい。
【0019】
図5は、本実施形態である顔画像特徴量生成装置1の処理手順を示すフローチャートである。このフローチャートは、1つのフレーム画像データについての処理手順を示したものである。
ステップS1において、画像データ取得部10は、外部装置から供給される画像データを取り込む。画像データが静止画像データである場合、画像データ取得部10は、取り込んだ画像データをフレーム画像データとして顔領域抽出部20に供給する。また、画像データが動画像データである場合、画像データ取得部10は、取り込んだ動画像データからキーフレームを検出し、このキーフレームのデータをフレーム画像データとして顔領域抽出部20に供給する。
【0020】
次に、ステップS2において、顔領域抽出部20は、画像データ取得部10から供給されるフレーム画像データを取り込み、この取り込んだフレーム画像データに対して顔検出処理を実行し、そのフレーム画像データから人物の顔領域を検出する。
【0021】
次に、ステップS3において、顔領域抽出部20は、検出した顔領域のデータをフレーム画像データから抽出し、その顔領域データを、所定サイズ(例えば、128画素×128画素)の画像データに正規化し、この正規化顔領域データを解析領域決定部30に供給する。
【0022】
次に、ステップS4において、解析領域決定部30は、顔領域検出部20から供給される正規化顔領域データを取り込み、この正規化顔領域データに基づき、顔画像特徴量を計算するための解析領域を決定する。具体的には、解析領域決定部30は、例えば、正規化顔領域の中心位置を中心として設けられる、正規化顔領域に含まれる円(楕円または真円)領域を解析領域として決定する。
次に、解析領域決定部30は、正規化顔領域の水平方向の直線で解析領域を二分し、その上部の領域を上部解析領域、下部の領域を下部解析領域として決定する。例えば、解析領域決定部30は、正規化顔領域の水平方向であって且つその中心を通る直線で解析領域を二分し、その上部の領域を上部解析領域、下部の領域を下部解析領域として決定する。
【0023】
次に、ステップS5において、顔画像特徴量計算部40は、解析領域抽出部30が決定した正規化顔領域における上部解析領域および下部解析領域それぞれについて、特徴量であるBag−of−Keypointsを計算する。
次に、顔画像特徴量計算部40は、それぞれ計算した二つのBag−of−Keypointsを連結して解析領域全体としてのBag−of−Keypointsを生成し、顔画像特徴量として出力する。
【0024】
以上、説明したとおり、本発明の一実施形態である顔画像特徴量生成装置1を、画像データを取り込む画像データ取得部10と、画像データに対して顔検出処理を実行し、画像データから顔領域を抽出する顔領域抽出部20と、顔領域から、円形または楕円形の解析領域を上下(縦)方向に二分する上部解析領域および下部解析領域を決定する解析領域決定部30と、上部解析領域および下部解析領域それぞれについて特徴量であるBag−of−Keypointsを計算し、これら計算したBag−of−Keypointsを連結して顔画像特徴量を生成する顔画像特徴量計算部40とを備えるように構成した。
【0025】
このように構成したことにより、本実施形態である顔画像特徴量生成装置1は、顔領域から、人物の顔認識や顔表情認識にとって重要度が低い髪の毛や、イヤリング等の情報を除外するため、高精度な顔画像特徴量を生成することができる。また、顔画像特徴量生成装置1は、解析領域を上部解析領域と下部解析領域とに区分することによって、例えば、上部解析領域に顔の両眉毛や両目を含ませ、下部解析領域に鼻頭や口を含ませることができる。これにより、顔画像特徴量生成装置1が生成する顔画像特徴量には、位置情報が対応付けされることとなる。よって、顔画像特徴量生成装置1によれば、光の影響にロバストな顔認識処理や顔表情認識処理を可能にすることができる。
したがって、本実施形態によれば、顔画像特徴量生成装置1は、光の影響にロバストであって且つ高精度に顔画像特徴量を生成することができる。
【0026】
なお、上述した実施形態である顔画像特徴量生成装置1の一部の機能をコンピュータで実現するようにしてもよい。この場合、その機能を実現するための顔画像特徴量生成プログラムをコンピュータ読み取り可能な記録媒体に記録し、この記録媒体に記録された顔画像特徴量生成プログラムをコンピュータシステムに読み込ませて、このコンピュータシステムが実行することによって実現してもよい。なお、このコンピュータシステムとは、オペレーティング・システム(Operating System;OS)や周辺装置のハードウェアを含むものである。また、コンピュータ読み取り可能な記録媒体とは、フレキシブルディスク、光磁気ディスク、光ディスク、メモリカード等の可搬型記録媒体、コンピュータシステムに備えられる磁気ハードディスクやソリッドステートドライブ等の記憶装置のことをいう。さらに、コンピュータ読み取り可能な記録媒体とは、インターネット等のコンピュータネットワーク、および電話回線や携帯電話網を介してプログラムを送信する場合の通信回線のように、短時間の間、動的にプログラムを保持するもの、さらには、その場合のサーバ装置やクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持するものを含んでもよい。また上記の顔画像特徴量生成プログラムは、前述した機能の一部を実現するためのものであってもよく、さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせにより実現するものであってもよい。
【0027】
以上、本発明の実施の形態について図面を参照して詳述したが、具体的な構成はその実施形態に限られるものではなく、本発明の要旨を逸脱しない範囲の設計等も含まれる。
【符号の説明】
【0028】
1 顔画像特徴量生成装置
10 画像データ取得部
20 顔領域抽出部
30 解析領域決定部
40 顔画像特徴量計算部

【特許請求の範囲】
【請求項1】
画像データを取り込む画像データ取得部と、
前記画像データ取得部が取り込んだ前記画像データに対して顔検出処理を実行し、前記画像データから顔領域を抽出する顔領域抽出部と、
前記顔領域抽出部が抽出した前記顔領域から、円形または楕円形の解析領域を二分する第1の領域および第2の領域を決定する解析領域決定部と、
前記解析領域決定部が決定した前記第1の領域および前記第2の領域それぞれについて特徴量を計算し、これら計算した特徴量を連結して顔画像特徴量を生成する顔画像特徴量計算部と、
を備えることを特徴とする顔画像特徴量生成装置。
【請求項2】
前記顔領域抽出部は、顔を含む矩形の顔領域を前記画像データから抽出し、
前記解析領域決定部は、前記顔領域に内接する円形または楕円形よりも小さな円形または楕円形の前記解析領域を縦方向に二分して前記第1の領域および第2の領域を決定する
ことを特徴とする請求項1記載の顔画像特徴量生成装置。
【請求項3】
前記顔領域抽出部は、前記矩形の顔領域を所定サイズの顔領域に正規化する
ことを特徴とする請求項2記載の顔画像特徴量生成装置。
【請求項4】
コンピュータを、
画像データを取り込む画像データ取得部と、
前記画像データ取得部が取り込んだ前記画像データに対して顔検出処理を実行し、前記画像データから顔領域を抽出する顔領域抽出部と、
前記顔領域抽出部が抽出した前記顔領域から、円形または楕円形の解析領域を二分する第1の領域および第2の領域を決定する解析領域決定部と、
前記解析領域決定部が決定した前記第1の領域および前記第2の領域それぞれについて特徴量を計算し、これら計算した特徴量を連結して顔画像特徴量を生成する顔画像特徴量計算部と、
として機能させるための顔画像特徴量生成プログラム

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公開番号】特開2013−41493(P2013−41493A)
【公開日】平成25年2月28日(2013.2.28)
【国際特許分類】
【出願番号】特願2011−178829(P2011−178829)
【出願日】平成23年8月18日(2011.8.18)
【出願人】(000004352)日本放送協会 (2,206)
【Fターム(参考)】