説明

パターン特徴抽出方法及びその装置

【課題】本発明は、入力のパターン特徴ベクトルから、判別に有効な特徴ベクトルを抽出
し、特徴次元を圧縮する際に、判別に有効な特徴量の削減を抑制し、より効率の良い特徴
抽出を行うための特徴ベクトルの変換技術を提供することにある。
【解決手段】入力のパターンの特徴量をその要素のベクトルに分解し、それぞれの特徴
ベクトルについて各々判別分析によって得られる判別行列を予め用意し、その判別行列に
よって規定される判別空間に各特徴ベクトルを射影して次元を圧縮した後に、得られた特
徴ベクトルを合わせて、再度判別行列によって再度射影 することによって、特徴ベクト
ルを算出する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、パターン認識の分野における画像特徴抽出方法および画像特徴抽出装置、な
らびにそのプログラムに関し、入力特徴ベクトルから、認識に有効な特徴ベクトルを抽出
し、特徴次元を圧縮するための特徴ベクトルの変換技術に関する。
【背景技術】
【0002】
従来より、パターン認識の分野では、入力されたパターンから特徴ベクトルを抽出し、
その特徴ベクトルから識別に有効な特徴ベクトルを抽出し、各々のパターンから得られた
特徴ベクトルを比較することによって、例えば、文字や人物の顔などのパターンの類似度
を判定することが行われている。
【0003】
例えば、顔認識の場合では、目の位置等によって正規化された顔画像の画素値をラスタ
ー走査することで、一次元特徴ベクトルに変換し、この特徴ベクトルを入力特徴ベクトル
として用い、主成分分析(非特許文献1:Moghaddam他, ”Probabil
istic Visual Learning for Object Detecti
on”, IEEE Transactions onPattern Analysi
s and Machine Intelligence, Vol. 17, No.
7, pp.696−710, 1997)や特徴ベクトルの主成分に対して線形判別
分析(非特許文献2:W. Zhao他, ”Discriminant Analys
is of Principal Components for Face Reco
gnition,” Proceedings of the IEEE Third
International Conference on Automatic Fa
ce and Gesture Recognition, pp. 336−341,
1998)を行うことで次元を削減し、得られた特徴ベクトルを用いて、顔による個人
の同定等を行う。
【0004】
これらの方法では、予め用意した学習サンプルに対して、共分散行列やク ラス内共分
散行列・クラス間共分散行列を計算し、それらの共分散行列における固有値問題の解とし
て得られる基底ベクトルを求め、これらの基底ベクトルを用いて、入力特徴ベクトルの特
徴を変換する。
【0005】
ここで、線形判別分析についてより詳しく説明する。
線形判別分析は、N次元特徴ベクトルxがあるときに、この特徴ベクトルをある変換行
列Wによって変換したときに得られるM次元ベクトルy(=WTx)のクラス内共分散行
列 SWに対するクラス間共分散行列SBの比を最大化するような変換行列Wを求める方
法である。このような分散比の評価関数として、行列式を用いて評価式の(数1)が定
義される。
【0006】
【数1】

【0007】
ここで、クラス内共分散行列ΣWおよびクラス間共分散行列ΣBは、学習サンプルにお
ける特徴ベクトルxの集合におけるC個のクラスωi(i=1,2,...,C;それら
のデータ数ni)のそれぞれの内部における共分散行列Σiとクラスの間の共分散行列で
あり、それぞれ(数2)および(数3)によって表される。
【0008】
【数2】

【0009】
【数3】

【0010】
ここで、miはクラスωiの平均ベクトル(数4)、mはパターン全体におけるxの平
均ベクトルである(数5)。
【0011】
【数4】

【0012】
【数5】

【0013】
各クラスωiの事前確率P(ωi)が、予めサンプル数niを反映しているならば、P
(ω i)=ni/nを仮定すれ ばよい。そうでなく等確率を仮定できるならば、P(
ωi)=1/Cとすればよい。
【0014】
(数1)を最大にする変換行列Wは、列ベクトルwiの固有値問題である(数6)のM
個の大きい固有値に対応する一般化された固有ベクトルのセットとして求められる。この
ようにして求められた変換行列Wを判別行列と呼ぶ。
【0015】
【数6】

【0016】
なお従来の線形判別分析法については、例えば、非特許文献5:「パターン識別」 (
Richard O. Duda他、尾上守夫監訳、新技術コミュニケーションズ,20
01年, pp.113−122)に記載されている。
【0017】
入力特徴ベクトルxの次元数が特に大きい場合、少ない学習データを用いた場合にはΣ
Wが正則ではなくなり、(数6)の固有値問題を通常の方法では解くことができなくなる

【0018】
また、特許文献1:特開平7−296169号公報でも述べられているように、共分散
行列の固有値が小さい高次成分は、パラメータの推定誤差が大きいことが知られており、
これが認識精度に悪影響を与える。
【0019】
このため、前述のW. Zhaoらの論文では入力特徴ベクトルの主成分分析を行い、
固有値が大きな主成分に対して、判別分析を適用している。つまり、図2に示すように、
主成分分析によって得られる基底行列を用いて入力特徴ベクトルを射影することで主成分
を抽出した後に、判別分析によって得られる判別行列を基底行列として、主成分を射影す
ることで、識別に有効な特徴ベクトルの抽出を行う。
【0020】
また、特許文献1:特開平7−296169号公報に記載されている特徴変換行列の演
算方式では、 全共分散行列ΣTの高次の固有値及び対応する固有ベクトルを削除等する
ことによって、次元数を削減し、削減された特徴空間において、判別分析を適用している
。これも全共分散行列の高次の固有値及び対応する固有ベクトルを削除することが主成分
分析によって、固有値が大きな主成分のみの空間で判別分析を行うという意味では、W.
Zhaoの方法と同様に 高次特徴を除去し、安定なパラメータ推定を行う効果をもた
らす。
【先行技術文献】
【特許文献】
【0021】
【特許文献1】特開平7−296169号公報
【非特許文献】
【0022】
【非特許文献1】Moghaddam他, ”Probabilistic Visual Learning for Object Detection”,IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 17, No. 7, pp.696−710, 1997)
【0023】
【非特許文献2】W. Zhao他,”Discriminant Analysis of Principal Components for Face Recognition,” Proceedings of the IEEE Third International Conference on Automatic Face and Gesture Recognition, pp. 336−341, 1998)
【0024】
【非特許文献3】Kernel−based Optimized Feature Vectors Selection and Discriminant Analysis for Face Recognition,”Proceeding of IAPR International Conferenceon Pattern Recognition(ICPR), Vol.II, pp. 362−365, 2002
【0025】
【非特許文献4】Generalized Disciminant Analysis Using a Kernel Approach,”Nueural Computation, Vol.12, pp2385−2404, 2000
【0026】
【非特許文献5】「パターン識別」 (Richard O. Duda他、尾上守夫監訳、新技術コミュニケーションズ,2001年, pp.113−122)
【発明の概要】
【発明が解決しようとする課題】
【0027】
しかしながら、全共分散行列ΣTを用いた主成分分析は、特徴空間内での分散が大きい
軸方向に順番に直交する軸を選択しているに過ぎず、パターン識別の性能とは無関係に特
徴軸の選択が行われる。このために、パターン識別に有効な特徴軸が失われる。
【0028】
例えば、特徴ベクトルxが3つの要素からなっており(x= (x1,x2,x3)T
)、x1やx2の分散は大きいが、パターン識別には無関係な特徴であり、x3 はパタ
ーン識別には有効だが、分散が小さい場合(クラス間分散/クラス内分散、つまりフィッ
シャ比が大きいが、それぞれの分散の値自体はx1やx2に比較して十分に小さい場合)
に主成分分析を行ない、2次元だけを選択すると、x1やx2に関わる特徴空間が選択さ
れてしまい、識別に有効なx3の寄与は無視されてしまう。
【0029】
この現象を図を用いて説明すれば、図3の(a)が x1とx2が張る平面におおよそ
垂直な方向から見たデータの分布で、黒丸と白丸がクラスの違うデータ点を表していると
する。x1と x2が張る空間(この図では、平面)で見た場合、黒丸と白丸を識別でき
ないが、図3(b)のようにこの平面と直交するx3の特徴軸で見ると、黒丸の白丸は分
離すること ができる。しかし、分散の大きい軸を選択してしまうと、x1とx2で張る
平面が 特徴空間として選ばれ図3の(a)を見て判別を行おうとすることに等しく、判
別を行うことが困難となる。
【0030】
これは、従来の技術で、主成分分析や(全)共分散行列の固有値の小さい空間を削除す
るという技術では避けられない現象である。
【0031】
本発明は、前述のような従来技術の問題点に鑑み、入力のパターン特徴ベクトルから、
判別に有効な特徴ベクトルを抽出し、特徴次元を圧縮する際に、判別に有効な特徴量の削
減を抑制し、より効率の良い特徴抽出を行うための特徴ベクトルの変換技術を提供するこ
とにある。
【課題を解決するための手段】
【0032】
本発明によれば、パターン特徴を線形変換を用いて特徴次元を圧縮するパターン特徴抽
出方法において、パターン特徴を複数の特徴ベクトルxiで表現し、それぞれの特徴ベク
トルxiに対して、線形判別分析により求められる各特徴ベクトルの判別行列Wiを予め
求め、さらにそれらの判別行列を用いてベクトルxiを線形変換することによって得られ
る各ベクトルyiを合わせた特徴ベクトルyについて、線形判別分析により判別行列WT
を予め求めておき、前記の判別行列Wiおよび判別行列WTによって特定される線形変換
によって、パターンの特徴ベクトルを変換することで、特徴次元を圧縮することを特徴と
する。
【0033】
前記のパターン特徴抽出方法において、パターン特徴を複数の特徴ベクトルxiに分割
し、それぞれの特徴ベクトルxiについて、判別行列Wiを用いて、線形変換yi=Wi
Txiを行い特徴ベクトルyiを算出し、算出された特徴ベクトルyiを合わせたベクト
ルyについて、判別行列WTを用いて、線形変換z=WTTyを計算し、特徴ベクトルz
を算出することで、パターン特徴の次元数を圧縮することを特徴とする。
【0034】
また、前記のパターン特徴抽出方法において、それぞれの判別行列WiおよびW Tに
よって特定される行列Wを予め計算しておき、前記行列Wを用いて、入力特徴ベクトルx
iを合わせた特徴ベクトルxと行列Wの線形変換z=WTxを計算し、特徴ベクトルzを
算出することで、パターン特徴の次元数を圧縮してもよい。
【0035】
この発明を画像に対して適用する場合には、画像から特徴量を抽出し、得られた特徴を
線形変換を用いて特徴次元を圧縮することで画像特徴を抽出することを特徴とする画像特
徴抽出方法において、画像中の予め定めた複数のサンプル点集合Siについて、複数のサ
ンプル点から得られる画素値からなる特徴ベクトルxiとして抽出し、それぞれの特徴ベ
クトルxiに対して、線形 判別分析により求められる各特徴ベクトルの判別行列Wiを
予め求め、さらにそれらの判別行列を用いて ベクトルxiを線形変換することによって
得られる各ベクトルyiを合わせた特徴ベクトルyについて、線形判別分析により判別行
列WTを予め求めておき、前記判別行列Wiおよび前記判別行列WTによって特定される
線形変換によって、画像サンプル集合毎の特徴ベクトルを変換することで、画像から特徴
量を抽出することを特徴とする。
【0036】
その一つの方法として、複数のサンプル点からなる複数の特徴ベクトルxiについて、
判別行列Wiを用いて、線形変換yi=WiTxiを行い特徴ベクトルyiを算出し、算
出された特徴ベクトルyiを合わせたベクトルyについて、判別行列WTを用いて、線形
変換z=WTTyを計算し、特徴ベクトルzを算出することで、画像から特徴量を抽出す
ればよい。
【0037】
また、前述の画像特徴抽出方法において、それぞれの判別行列WiおよびWTによって
特定される行列Wを予め計算しておき、前記行列Wを用いて、特徴ベクトルxiを合わせ
たベクトルxと行列Wの線形変換z=WTxを計算し、特徴ベクトルzを算出することで
、画像から特徴量を抽出してもよい。
【0038】
また、画像を予め定めた複数の局所領域に分割し、その複数の局所領域毎に特徴量を抽
出し、それらの特徴量を特徴ベクトルxiとして表現し、それぞれの特徴ベクトルxiに
対して、線形判別分析により求められる各特徴ベクトルの判別行列Wiを予め求め、さら
にそれらの判別行列を用いてベクトルxiを線形変換することによって得られる各ベクト
ルyiを合わせた特徴ベクトルyについて、線形判別分析により判別行列WTを予め求め
ておき、前記判別行列Wiおよび前記判別行列WTによって特定される線形変換によって
、局所領域の特徴ベクトルを変換することで、画像から特徴量を抽出すればよい。
【0039】
前述の画像特徴抽出方法において、画像の局所領域の特徴ベクトルxiについて、 判
別行列Wiを用いて、線形変換yi=WiTxiを行い特徴ベクトルyiを算出し、算出
された特徴ベクトルyiを合わせたベクトルyについて、判別行列WTを用いて、線形変
換z=WTTyを計算 し、特徴ベクトルzを算出することで、画像から特徴量を抽出す
る。
【0040】
あるいは、前述の画像特徴抽出方法において、それぞれの判別行列WiおよびWTによ
って特定される行列Wを予め計算しておき、前記行列Wを用いて、特徴ベクトルxiを合
わせたベクトルxと行列Wの線形変換z=WTxを計算し、特徴ベクトルzを算出するこ
とで、画像から特徴量を抽出してもよい。
【0041】
本発明の画像から特徴量を抽出することを特徴とする画像特徴抽出方法の有効な実施方
法として、画像から特徴量を抽出し、得られた特徴を線形変換を用いて特徴次元を圧縮す
ることで画像特徴を抽出することを特徴とする画像特徴抽出方法において、画像を二次元
フーリエ変換し、二次元フーリエ変換の実数成分と虚数成分を特徴ベクトルx1として抽
出し、二次元フーリエ変換のパワースペクトラムを算出し、そのパワースペクトラムを特
徴ベクトルx2として抽出し、それぞれの特徴ベクトルxi(i=1,2)に対して、線
形判別分析により求められる各特徴ベクトルの判別行列Wiを求め、さらにそれらの判別
行列を用いてベクトルxiを線形変換することによって得られる各ベクトルyiを合わせ
た特徴ベクトルyについて、線形判別分析により判別行列WTを予め求めておき、前記判
別行列Wiおよび前記判別行列WTによって特定される線形変換によって特徴ベクトルを
変換することを特徴とする。
【0042】
また、画像から特徴量を抽出し、得られた特徴を線形変換を用いて特徴次元を圧縮する
ことで画像特徴を抽出することを特徴とする画像特徴特徴抽出方法において、画像を二次
元フーリエ変換し、二次元フーリエ変換の実数成分と虚数成分を特徴ベクトルx1として
抽出し、二次元フーリエ変換のパワースペクトラムを算出し、そのパワースペクトラムを
特徴ベクトルx2として抽出し、それぞれの特徴ベクトルxi(i=1,2)の主成分に
対して、線形判別分析により求められる各特徴ベクトルの判別行列Wiを求め、さらにそ
れらの判別行列を用いてベクトルxiを線形変換することによって得られる各ベクトルy
iを合わせた特徴ベクトルyについて、線形判別分析により判別行列WTを予め求めてお
き、特徴ベクトルxiの主成分に対する判別行列 Wiおよび判別行列WTによって特定
される線形変換によって、フーリエ成分の実成分と虚成分に対する特徴ベクトルx1とフ
ーリエ成分のパワースペクトラムに対する特徴ベクトルx2を次元削減するように変換す
ることで、画像から特徴量を抽出することを特徴とする。
【0043】
前述の画像特徴抽出方法において、 フーリエ変換による実数成分と虚数成分による特
徴ベクトルx1を主成分に変換する変換行列Ψ1と、その主成分に対する判別行列W1に
よって表される基底行列Φ1(=(W1TΨ1T)T)を用いて、特徴ベクトルx1の主
成分の判別特徴を線形変換y1=Φ1Tx1により算出し、得られた特徴ベクトルy1の
大きさを予め定めた大きさに正規化し、また、フーリエ変換によるパワースペクトラムに
よる特徴ベクトルx2を主成分に変換する変換行列Ψ2と、その主成分に対する判別行列
W2によって表される基底行列Φ2(=(W2TΨ2T)T)を用いて、特徴ベクトルx
2の主成分の判別特徴を線形変換y2=Φ2Tx2により算出し、得られた特徴ベクトル
y2の大きさを予め定めた大きさに正規化し、二つの特徴ベクトルy1とy2を合わせた
特徴ベクトルyについて、判別行列WTを用いて、線形変換z=WTTyを計算し、特徴
ベクトルzを算出することで、画像から特徴量を抽出することを特徴とする。
【発明の効果】
【0044】
本発明によるパターン特徴抽出により、入力のパターン特徴ベクトルから、その要素ベ
クトル毎に判別分析による判別に有効な特徴ベクトルを抽出し、得られた特徴ベクトルを
再度判別分析による判別行列を用いた特徴抽出を行うことで、特徴次元を圧縮する際に、
判別に有効な特徴量の削減を抑制し、より効率の良い特徴抽出を行うための特徴ベクトル
の変換を行うことができる。
【0045】
特にパターンの特徴量が多いにも関わらず、判別分析を行う際に必要な学習サンプル数
が限られているような場合に特に有効であり、必ずしも主成分分析を用いることなく、識
別に有効な特徴の損失を抑えた上で特徴次元数を削減することができる。
【図面の簡単な説明】
【0046】
【図1】本発明の実施形態によるパターン特徴抽出装置の構成を示すブロック図である。
【図2】従来技術を説明するための図である。
【図3】パターン特徴の分布を説明するための図である。
【図4】本発明による第二の実施形態によるパターン特徴抽出装置の構成を示すブロック図である。
【図5】本発明による実施形態を説明するための図である。
【図6】本発明による実施形態を説明するための図である。
【図7】本発明による第三の実施形態による顔画像マッチングシステムの 構成を示すブロック図である。
【図8】本発明による実施形態を説明するための図である。
【図9】本発明による実施形態を説明するための図である。
【図10】本発明による実施形態を説明するための図である。
【図11】本発明による実施形態を説明するための図である。
【図12】本発明による実施形態を説明するための図である。
【図13】本発明による実施形態を説明するための図である。
【図14】本発明による実施形態を説明するための図である。
【図15】本発明の第五の実施の形態における顔記述の一例を示すための図である。
【図16】本発明の第五の実施の形態におけるバイナリー表現文法(Binary RepresentationSyntax)を用いた場合の規則の一例を示す図である。
【図17】本発明の第5の実施の形態におけるフーリエ特徴(FourierFeature)を抽出するための説明図である。
【図18】本発明の第5の実施の形態におけるフーリエスペクトルの走査方法の一例を示すための図である。
【図19】本発明の第5の実施の形態におけるフーリエスペクトルの走査規則の一例を示すためのテーブルである。
【図20】本発明の第5の実施の形態におけるCentralFourierFeature要素のためのフーリエ空間における走査領域の一例を示すテーブルである。
【図21】本発明の第5の実施の形態におけるブロック図の一例を示す図である。
【発明を実施するための形態】
【0047】
(第一の実施の形態)
本発明の実施の形態について図面を参照して詳細に説明する。図1は、本発明のパター
ン特徴抽出装置を用いたパターン特徴抽出装置を示すブロック図である。
【0048】
以下、パターン特徴抽出装置について詳細に説明する。
図1に示すように、本発明によるパターン特徴抽出装置は、入力特徴ベクトルx1を線形
変換する第1の線形変換手段11と、入力特徴ベクトルx2を線形変換する第2の線形変
換手段12と、線形変換手段11と線形変換手段12によって変換し、次元削減された特
徴ベクトルを入力として、線形変換を行う第3の線形変換手段13を備える。前述のそれ
ぞれの線形変換手段は、それぞれ対応した判別行列記憶手段14、15、16に記憶され
ている予め学習によって求めておいた判別行列を用いて、判別分析による基底変換を行う

【0049】
入力される特徴ベクトルx1、x2は、文字認識や顔認識などでそれらの目的に応じて
抽出される特徴量であり、例えば画像の勾配特性から計算される方向特徴や画像の画素値
そのものである濃淡特徴等で、複数の要素がある。この際に、例えば、N1個の方向特徴
を一方の特徴ベクトルx1として、もう一方のN2個の濃淡値を特徴ベクトルx2として
入力する。
【0050】
判別行列記憶手段14や判別行列記憶手段15は、特徴ベクトルx1および特徴ベクト
ルx2について、線形判別分析を行い、これにより得られる判別行列W1、W2をそれぞ
れ記憶する。
【0051】
判別行列は、前述したように予め用意した学習サンプルにおける特徴ベクトルについて
、そのクラスに応じて、クラス内共分散行列ΣW((数2))、クラス間共分散行列ΣB
((数3))を計算すればよい。また、各クラスωiの事前確率P(ωi)は、サンプル
数niを反映させて、P(ωi)=ni/nとすればよい。
【0052】
これらの共分散行列に対して、(数6)で表される固有値問題の大きい固有値に対応す
る固有ベクトルwiを選択することで、判別行列を予め求めておくことができる。
【0053】
それぞれの特徴ベクトルx1、x2について、入力特徴次元N1やN2よりも小さいM
1次元、M2次元の基底を選ぶとすると、判別基底への射影変換によってそれぞれM1、
M2次元の特徴ベクトルy1、y2を得ることができる。
【0054】
【数7】

【0055】
ここで、W1、W2の行列の大きさは、それぞれM1×N1、M2×N2となる。
射影する特徴空間の次元数M1、M2を大幅に小さくすることによって、効率良く特徴次
元数を削減でき、データ量の削減や高速化に効果があるが、特徴次元数を大幅に小さくし
すぎる場合には、判別性能の劣化をもたらす。これは、特徴次元数を削減することによっ
て、判別に有効な特徴量が失われるためである。
【0056】
このため、特徴ベクトルの次元数M1やM2等は、学習サンプル数との兼ね合いに影響
されやすい量であり、実験に基づいて定めることが望ましい。
【0057】
第3の線形変換手段13では、第1および第2の線形変換手段によって計算されたy1
、y2を入力特徴ベクトルyとして、判別空間への射影を行う。判別行列記憶手段16に
登録しておく判別行列W3は、第1、第2の判別行列を計算した場合と同様に学習サンプ
ルから求める。但し、入力特徴ベクトルyは次の(数8)で表されるように、要素を並べ
たベクトルである。
【0058】
【数8】

【0059】
(数7)と同様に基底行列W3(行列の大きさは、L×(M1+M2))によって、L
次元の特徴ベクトルyを(数9)により射影し、出力となる特徴ベクトルzを得る。
【0060】
【数9】

【0061】
このように特徴ベクトルをそれぞれ分割して、少ない次元数の特徴ベクトルの学習サン
プルに対して、線形判別分析を行うことによって、高い次元の特徴成分で生じやすい推定
誤りを抑制し、且つ、判別に有効な特徴を捉えることができる。
【0062】
前述の例では、3つの線形変換手段を備えて、並列的・段階的に処理を行う場合につい
て示したが、線形判別手段は、基本的に積和演算器を備えていれば実現できるので、線形
変換を行う入力特徴ベクトルに合わせて、読み出す判別行列を切替え線形変換手段を使い
回すように実現することも可能である。このように一つの線形変換手段を使うことで、必
要な演算器の規模を小さくすることができる。
【0063】
さらに、出力特徴ベクトルzの演算は、(数7)、(数8)、(数9)から分かるよう
に、(数10)と書き表すことができる。
【0064】
【数10】

【0065】
つまり、各判別行列を用いた線形変換は、一つの行列による線形変換にまとめることが
できる。段階的な演算を行う場合の積和演算回数は、L×(M1+M2)+M1N1+M
2N2であり、一つの行列にまとめた場合には、L×(N1+N2)となり、例えば、N
1=N2=500、M1=M2=200、L=100 とした場合には、段階的な演算で
240,000回の積和演算が必要となり、後者の演算では100,000回の積和演算
が必要となり、後者のような一括演算を行う場合の方が演算量が少なく、高速な演算が可
能となる。式からも分かるように最終的な次元数Lを小さくする場合には、一括的な演算
方法を用いた方が演算量を削減することができ、有効である。
【0066】
(第二の実施の形態)
さて、前述の例では、方向特徴と濃淡特徴というように特徴の種類が異なる場合の特徴
を融合する際に、それぞれの特徴毎に判別分析を施した特徴ベクトルに対して、繰り返し
判別分析を行っているが、一つの特徴に対する複数要素を複数の特徴ベクトルに分割して
、それぞれの要素集合を入力特徴として判別分析し、その射影されたベクトルをさらに判
別分析しても構わない。
【0067】
第二の実施例では、顔画像の特徴抽出装置について説明する。
第二の発明による顔画像特徴抽出装置では、図4に示すように入力顔画像の濃淡特徴を
分解する画像特徴分解手段41と、特徴ベクトルに対応する判別行列に従って特徴ベクト
ルを射影する線形変換手段42と、前記のそれぞれの判別行列を記憶する判別行列記憶手
段43を備えている。
【0068】
顔画像の特徴抽出する技術については、前述のW.Zhaoらの論文に示されているよ
うに、顔画像を目位置などで位置合わせした後に、その濃淡値をベクトル特徴とする方法
がある。
【0069】
第二の発明でも原特徴としてはどうように画像の画素の濃淡値を入力特徴として取り扱
うが、画像サイズが例えば左右の目の中心位置を(14,23)、(29,23)の座標
に正規化した42×54画素=2352次元と大きな画像特徴となる。このような大きな
特徴次元では、限られた学習サンプルを用いて直接的に線形判別分析を行っても精度良い
特徴抽出を行うことは困難であり、画像特徴の要素を分解し、その分解された特徴に対し
て判別分析を行い、判別行列を求めることで、主成分分析等を適用した場合に生じる特徴
の劣化を抑制する。
【0070】
画像特徴を分解するための方法の一つが画像を分割することであり、例えば、図5に示
すように画像を一つの大きさが14×18画素(=252次元)の大きさに9分割し、そ
れぞれの大きさの局所画像を特徴ベクトルxi(i=1,2,3,...,9)とし、そ
れぞれの部分画像に対して学習サンプルを用いて判別分析を行い、それぞれの特徴ベクト
ルに対応する判別行列Wiを求めておく。
【0071】
なお、画像を分割する際に領域間にオーバーラップを持たせておくことで、その境界領
域の画素間の相関に基づく特徴量を特徴ベクトルに反映させることができるので、オーバ
ーラップをさせてサンプルするようにしておいてもよい。
【0072】
特徴次元数が252次元と原画像より大幅に少なくなることで、人数で数百人程度の各
人の画像を数枚、計数千枚程度の顔画像をサンプルとすることで、判別分析による基底行
列を精度を保って計算することができる。これが原特徴のまま(2352次元)と大きい
場合には、判別分析による特徴で性能を得るためには、数千名以上の顔画像サンプルを必
要となることが予想されるが、実際問題としてこのような大規模な画像データを収集する
ことは困難であるために、実現できない。
【0073】
第一段階の判別特徴によって、例えば、各局所領域毎に20次元の特徴に 圧縮すると
すると、それらの出力特徴ベクトルは、9領域×20次元=180次元の特徴ベクトルと
なる。この特徴ベクトルに対してさらに判別分析を行うことで、次元数を例えば50次元
程度に効率的に圧縮できる。この第二段階目の判別行列も判別行列記憶手段43に記憶し
、線形変換手段42により、第一段階の判別特徴の180次元ベクトルを入力として、再
度判別分析を行う。なお、予め第一段目の判別行列と第二段目の判別行列を(数10)で
示したように予め計算しておいてもよいが、252次元×9領域を20次元×9領域に圧
縮し、その180次元を50次元に変換する場合では、二段階に分けて計算した方が使用
メモリも、演算量も半分以下となるので、効率的である。
【0074】
このように局所的・段階的に判別分析を適用することで、識別能力の高い顔特徴を抽出
することができるようになる。これは、文字認識でいえば、例えば「大」と「犬」の識別
を行おうとしたときに、文字画像全体を主成分分析して固有値が大きい成分抜き出すと、
「大」と「犬」を識別する「`」の特徴が失われてしまいやすい(このため、類似文字識
別では主成分分析による固有値が大きい部分の特徴よりも、ある特定の高次特徴を用いる
ことが行われる場合もある)。局所領域に分割して判別特徴を抜き出すことの有効性は、
文字認識 における類似文字識別における現象と類似しており、識別しやすい特徴を空間
的に限定することで、全体的に主成分の判別分析を行う場合よりも、単位次元 あたり
の精度を確保できるようになると考えられる。
【0075】
また、画像特徴分割手段41では、局所領域毎に画像を分割して、特徴ベクトルを構成
するのではなく、画像全体からサンプリングして分割してもよい。例えば、一次特徴を9
分の1の252次元の9つのベクトルに分割する場合には、図6に示すように3x3の領
域からサンプリングする。つまり、サンプリングされた画像は、僅かな位置の違いのある
縮小画像となる。この縮小画像をラスター走査することで、9つの特徴ベクトルに変換す
る。このような特徴ベクトルを一次ベクトルとして判別成分を計算し、その判別成分を統
合して再度判別分析を行ってもよい。
【0076】
(第三の実施の形態)
本発明による別の実施の形態について図面を参照して詳細に説明する。図7は、本発明
の顔メタデータ生成装置を用いた顔画像マッチングシステムを示すブロック図である。
【0077】
以下、顔画像マッチングシステムについて詳細に説明する。
図1に示すように、本発明による顔画像マッチングシステムでは、顔画像を入力する顔
画像入力部71と、顔メタデータを生成する顔メタデータ生成部72と、抽出された顔メ
タデータを蓄積する顔メタデータ蓄積部73と、顔メタデータから顔の類似度を算出する
顔類似度算出部74と、顔画像を蓄積する顔画像データベース75と、画像の登録要求・
検索要求に応じて、画像の入力・メタデータの生成・メタデータの蓄積・顔類似度の算出
の制御を行う制御部76と顔画像や他の情報を表示するディスプレイの表示部77と、が
設けられている。
【0078】
また、顔メタデータ生成部72は、入力された顔画像から顔領域を切り出す領域切り出
し手段721と、切り出された領域の顔特徴を抽出する顔パターン特徴抽出手段722に
よって構成され、顔の特徴ベクトルを抽出することで、顔画像に関するメタデータを生成
する。
【0079】
顔画像の登録時には、スキャナあるいはビデオカメラなどの画像入力部71で顔写真等
を顔の大きさや位置を合わせた上で入力する。あるいは、人物の顔を直接ビデオカメラな
どから入力しても構わない。この場合には、前述のMohaddamの文献に示されてい
るような顔検出技術を用いて、入力された画像の顔位置を検出し、顔画像の大きさ等を自
動的に正規化する方がよいであろう。
【0080】
また、入力された顔画像は必要に応じて顔画像データベース75に登録する。顔画像登
録と同時に、顔メタデータ生成部72によって顔メタデータを生成し、顔メタデータ蓄積
部73に蓄積する。
【0081】
検索時には登録時と同様に顔画像入力部71によって顔画像を入力し、顔メタデータ生
成部72にて顔メタデータを生成する。生成された顔メタデータは、一旦顔メタデータ蓄
積部73に登録するか、または、直接に顔類似度算出部74へ送られる。
【0082】
検索では、予め入力された顔画像がデータベース中にあるかどうかを確認する場合(顔
同定)には、顔メタデータ蓄積部73に登録されたデータの一つ一つとの類似度を算出す
る。最も類似度が高い結果に基づいて制御部76では、顔画像データベース75から、顔
画像を選び、表示部77等に顔画像の表示を行い、検索画像と登録画像における顔の同一
性を作業者が確認する。
【0083】
一方、予めID番号等で特定された顔画像と検索の顔画像が一致するかどうかを確認す
る場合(顔識別)では、特定されたID番号の顔画像と一致するか、否かを顔類似度算出
部74にて計算し、予め決められた類似度よりも類似度が低い場合には、一致しないと判
定し、類似度が高い場合には一致すると判定し、その結果を表示部77に表示する。この
システムを入室管理用に用いるならば、顔画像を表示する変わりに、制御部76から自動
ドアに対して、その開閉制御信号を送ることで、自動ドアの制御によって入室管理を行う
ことができる。
【0084】
上記のように、顔画像マッチングシステムは動作するが、このような動作はコンピュー
タシステム上で実現することもできる。例えば、次に詳述するようなメタデータ生成を実
行するメタデータ生成プログラム及び類似度算出プログラムをそれぞれメモリに格納して
おき、これらをプログラム制御プロセッサによってそれぞれ実行することで、顔画像マッ
チングを実現することができる。
【0085】
次に、この顔画像マッチングシステムの動作、特に顔メタデータ生成部72と顔類似度
算出部74について、詳細に説明する。
【0086】
(1)顔メタデータ生成
顔メタデータ生成部72では、位置と大きさを正規化した画像I(x,y)を用いて、
顔特徴量を抽出する。位置と大きさの正規化は、例えば、目位置が(16,24)、(3
1,24)、サイズが46×56画素となるように画像を正規化しておくとよい。以下で
は、このサイズに画像が正規化されている場合について説明する。
【0087】
次に、領域切り出し手段721によって顔画像の予め設定した顔画像の複数の局所領域
を切り出す。例えば、上記の画像を例えば、一つは正規化した画像全体(これをf(x,
y)とする)ともう一つは、顔を中心とした中心領域の32×32画素の領域g(x,y
)である。 これは、両目の位置が(9,12)と(24,12)の位置となるように切
り出せばよい。
【0088】
顔の中心領域を前述のように切り出すのは、これは髪型等に影響をされない範囲を切り
出すことで、髪型の変化するような場合(例えば、家庭内ロボットで顔照合を用いる際に
入浴前後で髪型が変化しても照合できるようにするため)でも安定な特徴を抽出するため
のものであるが、髪型等が変化しない場合 (映像クリップ中におけるシーン内の人物同
定などの場合)には、髪型を含んだ形で照合を行うことで照合性能の向上が期待できるの
で、髪型を含んだような 大きな顔画像と顔の中心部分の小さな顔画像に対して、顔画像
を切り出す。
【0089】
次に顔画像特徴抽出手段722では、切り出された二つの領域f(x,y)を2次元の
離散フーリエ変換によって、フーリエ変換し、顔画像の特徴を抽出する。
【0090】
図8に顔画像特徴抽出手段722のより詳しい構成について示す。この顔画像特徴抽出
手段では、正規化し切り出された画像を離散フーリエ変換するフーリエ変換手段81と、
フーリエ変換したフーリエ周波数成分のパワースペクトラムを算出するフーリエパワー算
出手段82と、フーリエ変換手段81によって算出されたフーリエ周波数成分の実成分と
虚成分をラスター走査した特徴ベクトルによって、1次元特徴ベクトルとみなして、その
特徴ベクトルの主成分に対して判別特徴を抽出する線形変換手段83とその変換のための
基底行列を記憶する基底行列記憶手段84、および、パワースペクトラムを同様に主成分
の判別特徴を抽出する線形変換手段85とその変換のための基底行列を記憶する基底行列
記憶手段86を備える。さらに、フーリエ特徴の実数成分と虚数成分の判別特徴、および
、パワースペクトルの判別特徴をそれぞれ大きさ1のベクトルに正規化し、その二つの特
徴ベクトルを統合したベクトルに対して、そのベクトルの判別特徴を算出する線形変換手
段88とその判別特徴のための判別行列を記憶する判別行列記憶手段89を備える。
【0091】
このような構成によって、フーリエ周波数特徴を抽出した後に、フーリエ周波数成分の
実数部と虚数部を要素とした特徴ベクトルと、パワースペクトラムを要素とした特徴ベク
トルに対して、それぞれ主成分の判別特徴を計算し、それぞれを統合した特徴ベクトルに
対して再度判別特徴を計算することで、顔の特徴量を計算する。
【0092】
以下では、それぞれの動作についてより詳しく説明する。
フーリエ変換手段81では、入力された画像f(x,y)(x=0,1,2,...M
−1,y=0,1,2,...,N−1)に対して、(数11)に従って、2次元の離散
フーリエ変換し、そのフーリエ特徴F(u,v)を計算する。この方法は広く知られてお
り、例えば、文献(Rosenfeldら、”ディジタル画像処理”、pp.20−26
,近代科学社)に述べられているので、ここでは説明を省略する。
【0093】
【数11】

【0094】
フーリエパワー算出手段では、(数12)に従ってフーリエ特徴F(u,v)の大きさ
を求めフーリエパワースペクトラム|F(u,v)|を算出する。
【0095】
【数12】

【0096】
このようにして得られる二次元のフーリエスペクトルF(u,v)や|F(u,v)|
は2次元の実成分のみの画像を変換しているので、得られるフーリエ周波数成分は対称
なものとなる。このため、これらのスペクトル画像F(u,v)、|F(u,v)| は
u=0,1,...,M−1; v=0,1,...,N−1のM×N個の成分を持つが
、その半分の成分 u=0,1,...,M−1; v=0,1,...,N−1のM×
N/2個の成分と、残りの半分の成分は、実質的に同等な成分となる。このため、特徴ベ
クトルとしては、半分の成分を用いて、以降の処理を行えばよい。当然のことながら、特
徴ベクトルの要素として用いられない成分をフーリエ変換手段81やフーリエパワー算出
手段82の演算で省略することで、演算の簡略化を図ることができる。
【0097】
次に、線形変換手段83では、周波数特徴として抽出された特徴量をベクトルとして取
り扱う。予め規定しておく部分空間は、学習用の顔画像セットを用意し、対応する切り出
し領域の周波数特徴ベクトルの主成分の判別分析によって得られる基底ベクトル(固有ベ
クトル)によって定める。この基底ベクトルの求め方については、W. Zhaoの文献
をはじめとして様々は文献で説明されている一般的に広く知られた方法であるので、ここ
では説明を省略する。ここで判別分析を直接行わないのは、フーリエ変換によって得られ
る特徴ベクトルの次元数が判別分析を直接取り扱うには大きすぎるためであり、既に指摘
したような主成分判別分析における問題点は残るものの第一段階目の特徴ベクトルの抽出
としては、一つの選択ではある。また、ここに判別分析を繰り返す方法による基底行列を
用いて構わない。
【0098】
つまり、基底行列記憶手段84に記憶する主成分の判別行列Φ1は、周波数特徴の実成
分と虚成分をラスター走査によって1次元化した特徴ベクトルx1の主成分の判別分析を
行うことによって予め学習サンプルから求めることができる。ここで、フーリエ特徴は複
素数として取り扱う必要は必ずしもなく、虚数成分も単なる別の特徴要素として、実数と
して取り扱って構わない。
【0099】
主成分への基底行列をΨ1、その主成分のベクトルを判別分析した判別行列をW1とす
れば、主成分の判別行列Φ1は、(数13)によって書き表される。
【0100】
【数13】

【0101】
なお、主成分分析によって削減する次元数は、もとの特徴フーリエ特徴の1/10程度
(200次元前後)にすればよく、その後、この判別行列によって70次元程度に削減す
る。この基底行列を予め学習サンプルから計算しておき、 基底行列記憶手段84に記憶
される情報として用いる。
【0102】
フーリエパワースペクトラム|F(u,v)|についても同様にそのスペクトルをラス
ター走査によって、1次元特徴ベクトルx2として表し、その特徴ベクトルの主成分の判
別分析を行うことによって得られる基底行列Φ2T=Ψ2TW 2Tを学習サンプルから
予め求めておく。
【0103】
このように、フーリエ特徴のそれぞれの成分について主成分判別特徴を計算することで
、フーリエ成分の実成分と虚成分の特徴ベクトルx1の主成分の判別特徴y1と、パワー
スペクトルの特徴ベクトルx2の主成分の判別特徴y2を得ることができる。
【0104】
正規化手段87では、得られた特徴ベクトルの大きさをそれぞれ例えば長さ1の単位ベ
クトルに正規化する。ここで、ベクトルを測る原点をどこにするかで、ベクトル長は変わ
るので、その基準位置も予め定めておく必要があるが、これは射影された特徴ベクトルy
iの学習サンプルから求めた平均ベクトルmiを用いて、基準点とすればよい。平均ベク
トルを基準点とすることで、基準点の周りに特徴ベクトルが分布するようになり、特にガ
ウシアン分布であるならば、等方的に分布するようになるので、特徴ベクトルを最終的に
量子化するような場合の分布域 の領域を限定することが容易にできるようになる。
【0105】
つまり、特徴ベクトルyiをその平均ベクトルmiによって、単位ベクトルに正規化し
たベクトルyioは、(数14)と表される。
【0106】
【数14】

【0107】
このように正規化手段を設け、フーリエパワーの実数と虚数に関わる特徴ベクトルy1
と、パワーに関わる特徴ベクトルy2を単位ベクトルに正規化しておくことで、異種の特
徴量である二つの特徴量の間の大きさの正規化をしておき、特徴ベクトルの分布特性を安
定化させることができる。また、既に次元削減の過程で判別に 必要な特徴空間の中での
大きさを正規化しているので、削除された雑音をより多く含む特徴空間で正規化する場合
よりも、雑音に影響されにくい正規化が実 現できるためである。この正規化により、単
なる線形変換では除去が難しい全体的な照明強度に比例する変動成分のような変動要素の
影響をとり除くことができる。
【0108】
このように正規化した特徴ベクトルy1oとy2oを(数8)と同様 に一つの特徴ベ
クトルyに統合し、統合された特徴ベクトルyに対して、線形判別分析を行い得られる基
底行列W3を用いて判別空間に射影することで、出力特徴ベクトルzを得ることができる
。このための判別行列W3を判別行列記憶手段89に記憶し ておき、線形変換手段88
では、このための射影の演算を行い、例えば、24次元の特徴ベクトルzを算出する。
【0109】
なお、出力特徴ベクトルzを、一要素あたり例えば5ビットに量子化する場合には、各
要素の大きさを正規化しておく必要があるが、例えば、各要素の分散値に応じて、正規化
を施しておく。
【0110】
つまり、特徴ベクトルzの各要素ziの学習サンプルにおける標準偏差の値σiを求め
ておき、zo = 16zi/3σiというように正規化を施し、これを例えば5ビッ
トなら、−16から15の値に量子化すればよい。
【0111】
この際の正規化は、各要素に標準偏差の逆数をかけている演算となるので、σiを対角
要素とする行列Σを考えると、正規化されたベクトルzoは、zo=Σzとなる。つまり
、単なる線形変換であるので、予め、判別行列W3に対してΣを(数15)のように施し
ておいてもよい。
【0112】
【数15】

【0113】
このように正規化しておくことで、量子化に必要な値域補正を行うことができる利点が
あるばかりではなく、標準偏差値による正規化であるので、照合時にパターン間距離のノ
ルムを演算する際に単なるL2ノルムを計算するだけで、マハラノビス距離による演算を
行うことが可能となり、照合時における演算量を削減することが可能となる。
【0114】
このように顔画像特徴抽出手段122では、正規化された画像f(x,y)に対して特
徴ベクトルzfを抽出する際の説明を行ったが、顔の中心部分のみを切り出した画像g(
x,y)に対しても、前述と同様に顔画像特徴抽出手段122によって特徴ベクトルzg
を抽出する。二つの特徴ベクトルzfと特徴ベクトルzgを顔メタデータ生成部を顔特徴
量zとして抽出する。
【0115】
なお、前述したように上記顔メタデータ生成手順をコンピュータプログラ ムによって
コンピュータに実行させることもできる。
【0116】
(2)顔類似度算出
次に顔類似度算出部74の動作について説明する。
【0117】
顔類似度算出部74では、二つの顔メタデータから得られるそれぞれK次 元特徴ベク
トルz1、z2を用いて、二つの顔の間の類似度d(z1,z2)を算出する。
【0118】
例えば、(数16)の二乗距離によって類似度を算出する。
【0119】
【数16】

【0120】
αiは重み係数で例えば各特徴次元ziの標準偏差の逆数等を用いればマハラノビス距
離による計算となり、予め(数15)等によって特徴ベクトルを正規化してある場合には
、基底行列が予め分散値によって正規化してあるので、前述の通り マハラノビス距離と
なっている。また、(数3)の比較する各特徴ベクトルのなす余弦によって類似度を算出
してもよい。
【0121】
【数17】

【0122】
なお、距離を用いた場合には値が大きいほど類似度は小さいこと(顔が似ていない)を
意味し、余弦を用いた場合には値が大きいほど類似度が大きいこと(顔が似ている)を意
味する。
【0123】
ここまでの説明では、一枚の顔画像が登録され、一枚の顔画像を用いて検索する場合に
ついて説明したが、一人の顔に対して複数の画像が登録され、一枚の顔画像を用いて検索
する場合には、例えば、登録側の複数の顔メタデータをそれぞれ、類似度の算出をすれば
よい。
【0124】
同様に1つの顔当たりの複数枚の画像登録と複数画像による検索の場合も、 各組み合
わせの類似度の平均や最小値を求めることで、類似度を算出することで、一つの顔データ
に対する類似度を算出することができる。これは、動画像を複数画像と見倣すことで、本
発明のマッチングシステムを動画像における顔認識に対しても適用できることを意味する

【0125】
以上、本発明を実施の形態を適宜図面を参照して説明したが、本発明は、コンピュータ
が実行可能なプログラムによっても実現できることは言うまでもない。
【0126】
(第四の実施の形態)
本発明による別の実施の形態について図面を参照して詳細に説明する。本発明は、第3
の発明における顔メタデータ生成部72を改良するものである。第3の発明では、入力顔
画像をフーリエ変換を行うことで得られるフーリエ周波数成分の実数部と虚数部を要素と
した特徴ベクトルと、パワースペクトラムを要素とした特徴ベクトルに対して、それぞれ
の主成分の判別特徴を計算し、それぞれを統合した特徴ベクトルに対して再度判別特徴を
計算することで、顔の特徴量を計算している。この場合、フーリエパワースペクトルが入
力画像全体の特徴量を反映しているために、入力画素にノイズが多い成分(例えば、相対
的な位置が変化しやすい口の周りの画素など)もパワースペクトルの中に他の画素と等し
く反映されてしまい、判別分析によって有効な特徴量を選択しても、十分な性能が得られ
ない場合があった。このような場合には入力画像を領域分割し、その局所領域毎にフーリ
エ変換し、各局所領域毎のパワースペクトルを特徴量として、判別分析することで、局所
的に判別性能が悪い(クラス内分散が大きい)領域の特徴量の影響を判別分析によって、
低減することができる。
【0127】
図9は実施例を説明するための図で、特徴抽出処理のフローを表している。この実施例
では、例えば、32x32画素の領域を16x16画素の4領域、8x8画素の16領域
、4x4画素の64領域、2x2画素の256領域、1x1画素の1024領域(実質的
に入力画像と同じなので、入力画像そのままでよい)に分割し、その各々の分割された領
域でフーリエ変換を行う。この処理フローをまとめた図が図10である。このようにして
得られた各領域のパワースペクトル全ての1024x5次元=5120次元の特徴量を抽
出する。この次元数では通常の学習データが少ない場合では次元数が多いので、予め主成
分分析を行い、次元数を削減するような主成分分析の基底を求めておく。例えば、次元数
としては300次元程度が適当である。この次元数の特徴ベクトルについてさらに判別分
析を行い、次元数を削減し、判別性能のよい特徴軸に対応する基底を求める。主成分分析
と判別分析に対応する基底を予め計算しておく(これをPCLDA射影基底Ψとする)。
【0128】
5120次元の特徴をこのPCLDA基底を用いた射影基底Ψを用いて線形演算によっ
て射影することで、判別特徴zを得ることができる。さらに量子化等を施すことで、顔の
特徴量となる。なお、5120次元の特徴量はフーリエパワースペクトルの対称性等を考
慮したり、高周波成分を除去して、予め使わないことにすれば、次元数を削減でき、高速
な学習、必要とされるデータ量の削減、高速な特徴抽出を可能とすることができるので、
適宜次元数を削減することが望ましい。
【0129】
このように領域をブロック化し、フーリエスペクトラムを多重化することで、画像特徴
と同値な特徴量(1024分割の場合)から、順に平行移動の普遍性を持った特徴量と局
所的な特徴量の表現を多重に持つことができる。その多重で冗長な特徴表現の中から、判
別分析によって、識別に有効な特徴量を選択することで、コンパクトで識別性能のよい特
徴量を得ることができる。フーリエパワースペクトルは、画像に対して非線形な演算であ
り、これは画像を単に線形演算によって処理する判別分析を適用するだけでは得られない
有効な特徴量を計算することができる。ここでは主成分に対して線形判別分析を行う場合
について説明したが、カーネル判別分析(Kernel Fisher Discrim
inant Analysis,KFDAあるいはKernelDiscriminan
t Analysis: KDA 、Generalized Discriminan
t Analysis: GDAなどと呼ばれるカーネルテクニックを用いた判別分析)
を用いて、2段階目の特徴抽出を行っても構わない。例えば、カーネル判別分析について
は、Q. Liu らの文献(非特許文献3:”Kernel−based Optim
ized Feature Vectors Selection and Discr
iminant Analysis for Face Recognition,”P
roceeding of IAPR International Conferen
ce on Pattern Recognition(ICPR), Vol.II,
pp. 362−365, 2002)やG. Baudat の文献(非特許文献4
:”Generalized Disciminant Analysis Using
a Kernel Approach,”Neural Computation,
Vol.12, pp2385−2404,2000)に詳しく解説されているので、そ
れらを参照されたい。 このようにカーネル判別分析を用いて特徴を抽出することで、非
線形による特徴抽出の効果をさらに発揮することができ、有効な特徴を抽出することがで
きる。
【0130】
しかし、この場合、5120次元と大きな特徴ベクトルを取り扱うので、主成分分析を
行う場合でも、大量のメモリ、大量の学習データが必要となる。図11は、このような問
題を避けるべく、各ブロック毎に主成分分析・判別分析を個別に行い、その後、2段階で
判別分析(Linear Discriminant Analysis: LDA)を
行うことで、演算量を削減することができる。この場合には、各領域毎に1024次元(
対称性を考慮して半分にすると、512次元)の特徴量を用いて、主成分分析と判別分析
を行い基底行列Ψi(i=0,1,2,..,5)を求めておく。そして、その後それぞ
れの平均値を用いて特徴ベクトルを正規化し、二段階目のLDA射影を行う。このように
ブロック毎に処理を行うことで、学習の際に要求されるデータ数や計算機資源を減少させ
ることができ、学習の最適化の時間削減等を行うことできる。なお、高速に演算を行いた
い場合には、ベクトル正規化の処理を省き、予めPCLDA射影の基底行列とLDA射影
の基底行列を計算しておくことで、演算の高速化を図ることができる。
【0131】
図12はまた別の実施例を説明するための図で、特徴抽出処理のフローを表している。
この実施例では、このような領域分割を複数段階(図では2段階)で行い、局所領域のフ
ーリエパワースペクトルが持つ並進普遍性と、局所領域の信頼性を考慮するように多重に
パワースペクトラムを多重な解像度で抽出し、判別分析のための特徴量として抽出し、そ
の中で判別分析で求められた最も優れた特徴空間利用して、特徴抽出を行う。
【0132】
例えば、入力画像f(x,y)が32x32画素の場合には、図10に示すように全体
画像のパワースペクトル|F(u,v)|とそれを4分割した16x16画素の4つの領
域のそれぞれのパワースペクトラム|F11(u,v)|, |F12(u,v)| ,
|F13(u,v)| ,|F14(u,v)|、8x8画素の16個の領域に分割した
|F21(u,v)|, |F21(u,v)|,・・・,|F216(u,v)|を特
徴ベクトルを抽出する。但し、実画像のフーリエパワースペクトルの対称性を考慮して、
その1/2を抽出すればよい。また、判別分析における特徴ベクトルの大きさが大きくな
ることを避けるために、判別に対して高周波成分をサンプリングしないで、特徴ベクトル
を構成してもよい。例えば、低周波成分に対応する1/4のスペクトルをサンプリングし
て特徴ベクトルを構成することで、必要となる学習サンプル数を低減したり、学習や認識
に必要な処理時間の軽減を行うことができる。また、学習データ数が少ない場合には、予
め主成分分析して特徴次元数を減らした後に判別分析を行っても良い。
【0133】
さて、このように抽出した特徴ベクトルx2fを用いて、予め用意した学習セットを用
いて判別分析を行い、その基底行列Ψ2fを求めておく。図9では主成分に対する判別特
徴の抽出(Principal Component Linear Discrimi
nant Analysis: PCLDA)の射影を行っている例を示している。特徴
ベクトルx2fを基底行列Ψ2fを用いて射影し、その射影された特徴ベクトルの平均と
大きさを正規化し、特徴ベクトルy2fを算出する。
【0134】
同様にフーリエ周波数の実数成分と虚数成分を統合した特徴ベクトルx2fについても
、基底行列Ψ1fを用いて線形演算処理により特徴ベクトルを射影し、次元数を削減した
特徴ベクトルを求め、そのベクトルの平均と大きさを正規化した特徴ベクトルy1fを算
出する。これらを統合した特徴ベクトルを判別基底Ψ3fを用いて、再度射影し、特徴ベ
クトルzfを得る。これを例えば5bitに量子化することで、顔特徴量を抽出する。
【0135】
なお、入力が44x56画素の大きさに正規化された顔画像である場合には、中心部分
の32x32画素に上述の処理を施して、顔特徴量を抽出するとともに、顔全体の44x
56画素の領域についても、44x56画素の全体領域と、22x28画素の4領域、1
1x14画素の16画素に多重に分割した領域についてそれぞれ顔特徴量を抽出する。図
13は、別の実施例を表しており、各局所領域毎に実数成分と虚数成分とパワースペクト
ルを合わせてPCLDAを行う場合や、図14のように実数成分と虚数成分を合わせた特
徴とパワースペクトルとを個別にPCLDA射影し、最後にLDA射影を行っている例で
ある。
【0136】
(第五の実施の形態)
本発明による別の実施の形態について図面を用いて詳細に説明する。
【0137】
本発明を用いた顔特徴記述方法および顔特徴の記述子の実施例を表わす。図15には、
顔の特徴記述の一例として、ISO/IEC FDIS 15938−3“Inform
ation technology Multimedia content des
cription interface− Part3: Visual”におけるDD
L表現文法(Description Definition Language Re
presentation Syntax)を用いて顔特徴量の記述について表わしてい
る。
【0138】
ここでは、AdvancedFaceRecognitionと名付けた顔特徴の記述
について、それぞれ”FourierFeature”,”CentralFourie
rFeature”と名付ける要素を有しており、FouirerFeatureやCe
ntralFourierFeatureは、符号なし5ビットの整数でそれぞれ24次
元から63次元の要素を持つことができることを表わしている。図16は、そのデータ表
現に対してバイナリー表現文法(Binary Representation Syn
tax)を用いた場合の規則を表わしており、FourierFeature、Cent
ralFourierFeatureの配列要素の大きさを符号なし6ビットの整数でn
umOfFourierFeature、numOfCentralFourierに格
納し、FourierFeature、CentralFoureirFeatureの
それぞれの要素が5ビットの符号なし整数で格納されることを表わしている。
【0139】
本発明を用いたこのような顔特徴の記述子について、より詳細に説明する。
●numOfFourierFeature
このフィールドは、FourierFeatureの配列の大きさを規定する。値の許容
範囲は、24から63である。
●numOfCentralFourierFeature
このフィールドは、CentralFourierFeatureの配列の大きさを規定
する。値の許容範囲は、24から63である。
●FourierFeature
この要素は、正規化顔画像のフーリエ特性の階層的LDAに基づく顔特徴を表している。
正規化顔画像は、原画像を各行46個の輝度値を持つ56行の画像に大きさを変換するこ
とによって得られる。正規化画像における両目の中心位置は、右目、左目がそれぞれ、2
4行目の16列目及び31列目に位置していなければならない。
【0140】
FourierFeatureの要素は、二つの特徴ベクトルから抽出される。一つは
、フーリエスペクトルベクトルx1fであり、もう一つは、マルチブロックフーリエ強度
ベクトルx2fである。図17は、フーリエ特徴の抽出過程を図示している。正規化画像
が与えられたら、その要素を抽出するために、次の5つの処理ステップを実行しなければ
ならない。
【0141】
(1)フーリエスペクトルベクトルx1fの抽出
(2)マルチブロックフーリエ強度ベクトルx2fの抽出
(3)PCLDA基底行列Ψ1f、Ψ2fを用いた特徴ベクトルの射影と、単位ベクト
ルy1f、y2fへの正規化
(4)LDA基底行列Ψ3fを用いた、単位ベクトルの結合フーリエベクトルの射影
(5)射影ベクトルZfの量子化
【0142】
STEP−1) フーリエスペクトルベクトルの抽出
与えられた正規化画像f(x,y)に対するフーリエスペクトルF(u,v)を(数1
8)式により計算する。
【0143】
【数18】

【0144】
ここで、M=46、N=56である。フーリエスペクトルベクトルx1fは、フーリエ
スペクトルを走査して得られる成分の集合によって定義される。図18は、フーリエスペ
クトルの走査方法を示している。走査は、フーリエ空間における二つの領域、領域Aと領
域B、に対して実行される。走査規則を図19にまとめる。ここで、SR(u, v)は
、領域Rの左上の座標を表し、ER(u,v) は領域Rの右下の点をそれぞれ表す。そ
れ故に、フーリエスペクトルベクトルx1fは(数19)式によって表現される。
【0145】
【数19】

x1fの次元数は644次元である。
【0146】
STEP 2) マルチブロックフーリエ強度ベクトルの抽出
マルチブロックフーリエ強度ベクトルを正規化顔画像の部分画像のフーリエ強度から抽
出する。部分画像としては、(a) 全体画像、(b) 4分の1画像、(c) 16分
の1画像の3つのタイプの画像が使われる。
【0147】
(a)全体画像
全体画像f10(x,y)は、正規化画像f(x,y)の画像境界の両側の列を取り除
き、44x56の画像サイズに切り出すことで得ることができる。これは、(数20)式
によって与えられる。
【0148】
【数20】

【0149】
(b)4分の1画像
4分の1画像は、全体画像f10(x,y)を4ブロックfk1(x,y)(k=1,
2,3,4)に等分割することによって、得ることができる。
【0150】
【数21】

ここで、sk1=(k−1)%2、tk1=(k−1)/2 である。
【0151】
(c)16分の1画像
16分の1画像は、f10(x,y)を16ブロックfk2(x,y)(k=1,2,
3,・・・,16)に等分割することによって得られ、次式によって与えられる。
【0152】
【数22】

ここで、sk2=(k−1)%4、tk2=(k−1)/4 である。
【0153】
これらの画像から、フーリエ強度|Fkj(u,v)|を次の(数23)式のように計
算する。
【0154】
【数23】

Mjは各々の部分画像の幅を表し、M0=44, M1=22, M2=11である。
Njは部分画像の高さを表し、N0=56, N1=28, N2=14である。
【0155】
マルチブロックフーリエ強度ベクトルは、1) 全体画像(k=1), 2) 4分の
1画像(k=1,2,3,4), 及び 3) 16分の1画像(k=1,2,・・・,
16)の順に、各々の強度|Fkj(u,v)|の低周波数領域を走査することによって
得られる。走査領域は、図19に定義している。
【0156】
それ故に、マルチブロックフーリエ強度ベクトルx2fは、(数24)式で表現される

【0157】
【数24】

x2fの次元数は856次元である。
【0158】
STEP 3) PCLDA 射影とベクトル正規化
フーリエスペクトルベクトルx1fとマルチブロックフーリエ強度ベクトルx2fをそ
れぞれPCLDA基底行列Ψ1fとΨ2fを用いて射影し、単位ベクトルy1fとy2f
に正規化する。正規化ベクトルykf (k=1,2) は次式によって与えられる。
【0159】
【数25】

ここで、PCLDA 基底行列Ψkfと平均ベクトルmkfは、xkfの主成分の判別
分析によって得られる基底行列と射影して得られる平均ベクトルであり、予め計算してあ
るテーブルを参照する。y1fとy2f の次元数はそれぞれ70次元と80次元である

【0160】
STEP 4) 結合フーリエベクトルのLDA射影
正規化ベクトルy1fとy2fを150次元の結合フーリエベクトルy3fを成すよう
に連結し、LDA基底行列を用いて射影する。射影ベクトルzfは次式で与えられる。
【0161】
【数26】

【0162】
STEP 5) 量子化
zfの要素を次式を用いて5ビットの符号なし整数の範囲に丸める。
【0163】
【数27】

【0164】
量子化された要素は、FourierFeatureの配列として保存する。Four
ierFeature[0] は、量子化された第一要素w0fを表し、Fourier
Feature[numOfFourierFeature−1] は、第numOfF
ourierFeature番目の要素wfnumOfFourierFeature−
1に対応する。
【0165】
●CentralFourierFeature
この要素は、正規化顔画像の中心部分のフーリエ特性の階層的LDAに基づく顔特徴を
表している。CentralFourierFeatureはFourierFeatu
reと同様な方法により抽出する。
【0166】
中心部分g(x,y)は、次式に示すように画像f(x,y)の始点(7,12)から
32x32画素の大きさに切り出すことによって得られる。
【0167】
【数28】

【0168】
STEP 1) フーリエスペクトルベクトルの抽出
g(x,y) のフーリエスペクトルG(u,v)を(数29)式によって計算する。
【0169】
【数29】

ここで、M=32, N=32である。256次元のフーリエスペクトルベクトルx1
g は、フーリエスペクトルG(u,v)を図20で定義したように走査することによっ
て得ることができる。
【0170】
STEP 2) マルチブロックフーリエ強度ベクトルの抽出
マルチブロックフーリエ強度ベクトルx2gを(a) 中心部分g10(x,y),
(b) 4分の1画像gk1(x,y)(k=1,2,3,4), 及び(c) 16分
の1画像gk2(x,y)(k=1,2,3,・・・,16)のフーリエ強度から抽出す
る。
【0171】
(a)中心部分
【0172】
【数30】

【0173】
(b)4分の1画像
【0174】
【数31】

ここで、sk1=(k−1)%2、tk1(k−1)/2 である。
【0175】
(c)16分の1画像
【0176】
【数32】

ここで、sk2=(k−1)%4、tk2=(k−1)/4 である。
【0177】
それぞれの画像のフーリエ強度|Gkj(u,v)|を、(数33)式のように計算す
る。
【0178】
【数33】

ここで、M0=32,M1=16, M2=8, N0=32, N1=16, N2
=8である。マルチブロックフーリエ強度ベクトルx2gは、図20に定義するようにそ
れぞれの強度|Gkj(u,v)|を走査することによって得られる。
【0179】
STEP 3−5)の処理は、FourierFeatureと同じである。Cent
ralFourierFeatureのための基底行列Ψ1g,Ψ2g,Ψ3g および
平均ベクトルm1g,m2g もまたそれぞれの予め計算してテーブルとして用意してお
いたものを参照する。
【0180】
CentralFourierFeatureの配列の大きさは、numOfCent
ralFourierFeatureに制限される。
【0181】
このようにして得られた顔特徴記述データは、記述長がコンパクトでありながら、高い
認識性能を有する顔特徴の記述データとなり、データの保存や伝送に効率的な表現となる

【0182】
なお、本発明をコンピュータで動作可能なプログラムで実現してもかまわない。この場
合、第五の実施の形態であれば、図17中のステップ1〜ステップ5で示された機能をコ
ンピュータが読み取り可能なプログラムで記述し、このプログラムをコンピュータ上で機
能させることで本発明を実現可能である。また図17に記載された例を装置として構成す
る場合は、図21のブロック図に記載された機能の全部または一部を実現すればよい。
【符号の説明】
【0183】
11: 第一の線形変換手段11
12: 第二の線形変換手段12
13: 第三の線形変換手段13
14: 第一の判別行列記憶手段14
15: 第二の判別行列記憶手段15
16: 第三の判別行列記憶手段16

【特許請求の範囲】
【請求項1】
入力正規化画像から顔特徴を抽出するパターン特徴抽出方法であって、
予め定められた計算式を用いて入力正規化顔画像に対するフーリエスペクトルを計算することで、フーリエスペクトルベクトルを求めるステップと、
正規化画像の部分画像のフーリエ強度から、マルチブロックフーリエ強度ベクトルの抽出を行うステップと、
フーリエスペクトルベクトルと前記マルチブロック強度ベクトルとを線形判別分析して求められる判別行列を用いた特徴ベクトルの射影を行い、それぞれの正規化ベクトルを得るステップと、
それぞれの正規化ベクトルを連結し、連結された結合フーリエベクトルを線形判別分析して求められる第2の判別行列を用いて射影を行い、射影により得られる射影ベクトルを得るステップと、
を含むことを特徴とするパターン特徴抽出方法。
【請求項2】
前記フーリエスペクトルベクトルを求めるステップは、前記入力正規化画像をフーリエ変換し、得られるフーリエスペクトルの実成分と虚成分をサンプリングした成分を要素とするベクトルをフーリエスペクトルベクトルとして抽出することを特徴とする請求項2に記載のパターン特徴抽出方法。
【請求項3】
前記マルチブロックフーリエ強度ベクトルの抽出を行うステップは、前記入力正規化画像を複数の部分画像の分割し、各々の部分画像のフーリエ強度を算出し、それぞれの部分画像のフーリエ強度を要素とするベクトルをマルチブロックフーリエ強度ベクトルとして抽出することを特徴とする請求項1または2に記載のパターン特徴抽出方法。
【請求項4】
前記正規化ベクトルを得るステップは、前記フーリエスペクトルベクトルの主成分の線形判別分析によって得られる判別行列を用いて、フーリエスペクトルベクトルを射影し、射影されたベクトルの大きさを正規化するステップと、
前記マルチブロックフーリエ強度ベクトルの主成分の線形判別分析によって得られる判別行列を用いて、マルチブロックフーリエ強度ベクトルを射影し、射影されたベクトルの大きさを正規化するステップとからなることを特徴とする請求項1乃至3のいずれか1項に記載のパターン特徴抽出方法。
【請求項5】
入力正規化画像から顔特徴を抽出するパターン特徴抽出装置であって、
予め定められた計算式を用いて入力正規化顔画像に対するフーリエスペクトルを計算することで、フーリエスペクトルベクトルを求めるフーリエスペクトル生成手段と、
正規化画像の部分画像のフーリエ強度から、マルチブロックフーリエ強度ベクトルの抽出を行うマルチブロックフーリエ強度ベクトル抽出手段と、
フーリエスペクトルベクトルと前記マルチブロック強度ベクトルとを線形判別分析して求められる判別行列を用いた特徴ベクトルの射影を行い、それぞれの正規化ベクトルを得る正規化ベクトル生成手段と、
それぞれの正規化ベクトルを連結し、連結された結合フーリエベクトルを線形判別分析して求められる第2の判別行列を用いて射影を行い、射影により得られる射影ベクトルを得る射影ベクトル生成手段と、
を含むことを特徴とするパターン特徴抽出装置。
【請求項6】
前記フーリエスペクトルベクトル生成手段は、前記入力正規化画像をフーリエ変換し、得られるフーリエスペクトルの実成分と虚成分をサンプリングした成分を要素とするベクトルをフーリエスペクトルベクトルとして抽出することを特徴とする請求項5に記載のパターン特徴抽出装置。
【請求項7】
前記マルチブロックフーリエ強度ベクトル抽出手段は、前記入力正規化画像を複数の部分画像の分割し、各々の部分画像のフーリエ強度を算出し、それぞれの部分画像のフーリエ強度を要素とするベクトルをマルチブロックフーリエ強度ベクトルとして抽出することを特徴とする請求項5または6に記載のパターン特徴抽出装置。
【請求項8】
前記正規化ベクトル生成手段は、前記フーリエスペクトルベクトルの主成分の線形判別分析によって得られる判別行列を用いて、フーリエスペクトルベクトルを射影し、射影されたベクトルの大きさを正規化するフーリエスペクトルベクトル正規化手段と、
前記マルチブロックフーリエ強度ベクトルの主成分の線形判別分析によって得られる判別行列を用いて、マルチブロックフーリエ強度ベクトルを射影し、射影されたベクトルの大きさを正規化するマルチブロックフーリエ強度ベクトル手段とからなることを特徴とする請求項5乃至7のいずれか1項に記載のパターン特徴抽出装置。
【請求項9】
コンピュータに
予め定められた計算式を用いて入力正規化顔画像に対するフーリエスペクトルを計算することで、フーリエスペクトルベクトルを求める処理と、
正規化画像の部分画像のフーリエ強度から、マルチブロックフーリエ強度ベクトルの抽出を行う処理と、
フーリエスペクトルベクトルと前記マルチブロック強度ベクトルとを線形判別分析して求められる判別行列を用いた特徴ベクトルの射影を行い、それぞれの正規化ベクトルを得る処理と、
それぞれの正規化ベクトルを連結し、連結された結合フーリエベクトルを線形判別分析して求められる第2の判別行列を用いて射影を行い、射影により得られる射影ベクトルを得る処理と、
を実行させるためのパターン特徴抽出プログラム。
【請求項10】
前記フーリエスペクトルベクトルを求める処理は、前記入力正規化画像をフーリエ変換し、得られるフーリエスペクトルの実成分と虚成分をサンプリングした成分を要素とするベクトルをフーリエスペクトルベクトルとして抽出することを特徴とする請求項9に記載のパターン特徴抽出プログラム。
【請求項11】
前記マルチブロックフーリエ強度ベクトルの抽出を行う処理は、前記入力正規化画像を複数の部分画像の分割し、各々の部分画像のフーリエ強度を算出し、それぞれの部分画像のフーリエ強度を要素とするベクトルをマルチブロックフーリエ強度ベクトルとして抽出することを特徴とする請求項9または10に記載のパターン特徴抽出プログラム。
【請求項12】
前記正規化ベクトルを得る処理は、前記フーリエスペクトルベクトルの主成分の線形判別分析によって得られる判別行列を用いて、フーリエスペクトルベクトルを射影し、射影されたベクトルの大きさを正規化する処理と、
前記マルチブロックフーリエ強度ベクトルの主成分の線形判別分析によって得られる判別行列を用いて、マルチブロックフーリエ強度ベクトルを射影し、射影されたベクトルの大きさを正規化する処理とからなることを特徴とする請求項9乃至11のいずれか1項に記載のパターン特徴抽出プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate


【公開番号】特開2009−140513(P2009−140513A)
【公開日】平成21年6月25日(2009.6.25)
【国際特許分類】
【出願番号】特願2009−13764(P2009−13764)
【出願日】平成21年1月26日(2009.1.26)
【分割の表示】特願2003−68916(P2003−68916)の分割
【原出願日】平成15年3月13日(2003.3.13)
【出願人】(000004237)日本電気株式会社 (19,353)
【Fターム(参考)】