説明

物体認識装置及びその方法

【課題】ぼけ画像に対し頑健な物体認識装置を提供する。
【解決手段】動きぼけ、または、焦点ぼけにより劣化した劣化画像から、認識したい物体の物体領域画像を検出し、物体領域画像をそれぞれ周波数領域へ変換し、ぼけ量を表す特徴ベクトルを抽出し、複数のPSFにおける各PSFを、ぼけのない複数枚の訓練画像にそれぞれ適用して生成された複数枚のぼけた画像を1個のクラスとして構成し、前記各クラスを前記各PSFにそれぞれ対応させて格納し、特徴ベクトルと各クラスに属する複数枚のぼけた画像とを比較して、特徴ベクトルと最も類似するクラスを求め、この最も類似するクラスに対応するPSFを一つ選択する。

【発明の詳細な説明】
【技術分野】
【0001】
顔認識などの物体認識において、劣化した画像からぼけを表す点拡がり関数(Point Spread Function;PSF)を推定し、この推定されたPSFに基づいて画像を復元し、復元された画像を用いて物体認識を行う物体認識装置及びその方法に関する。
【背景技術】
【0002】
顔認識により、個人を識別する技術は、生体認識において重要な研究分野の一つである。個人識別の性能を低下させる大きな問題として画像に写った顔の見え方の変動がある。この見え方の変動の主な要因に、照明、姿勢、画像劣化が挙げられる。画像劣化には、低解像度、ぼけ、ノイズ、などが含まれる。ぼけは顔認識において2つの問題を引き起こす。
【0003】
第1の問題は、画像の変動により、画像と本人とが類似せず、本人であるにも拘らず正しく識別されない場合である。すなわち、FRR(False Rejection Rate)が高まる場合である。
【0004】
第2の問題は、異なる人物間で画像の状態が類似し、他人と誤って識別される割合である。すなわち、FAR(False Acceptance Rate)が高まる場合である。
【0005】
これらの問題を解決するために次の二つの方法(I),(II)が提案されている。方法(I)では、画像を擬似的にぼかすことで画像の変動を学習する。方法(II)では、画像復元の方法でぼけを除去し識別に用いる。
【0006】
方法(I)では、参照画像はぼけていないと仮定し、参照画像をぼかすことで参照データを増加させる。これによりFRRを抑えることはできる。しかし、参照データが他人と類似するため、FARが高くなる問題は残る。さらに、参照データの記憶容量が増加する問題もある。
【0007】
方法(II)では、画像復元の方法であるブラインドデコンボルーションや超解像で、ぼける以前の状態まで画像を復元し、その画像を用いて個人を識別することが一般的に考えられている。方法(II)は参照画像がぼけている場合にも適用でき個人識別に有効である。画像復元において、ぼけによる劣化過程はPSFによって表される。個人識別の性能を得るためには、劣化画像から精度よくPSFを推定することが重要である。
【0008】
PSF推定のため、特許文献1では、物体輪郭上のエッジ幅を用いる方法が提案されている。ぼけていない画像のエッジは鋭くその幅は短くなり、ぼけた画像のエッジは滑らかでその幅は長くなる現象を利用する。この特許文献1では、ぼけた画像から顔領域、または、瞳を検出した後、それらの輪郭を検出する。輪郭上のエッジ断面からエッジ幅を求め、事前にぼけ画像から学習したエッジ幅のヒストグラムと比較する。
【特許文献1】特開2005−332382公報
【発明の開示】
【発明が解決しようとする課題】
【0009】
しかしながら、特許文献1の方法では、画像がぼけると輪郭がはっきりしないため、顔領域や瞳の検出と比べて輪郭の検出は難しい。また、輪郭の検出結果に誤差が含まれると、エッジ断面は形状が大きく変わる。
【0010】
このため、エッジ断面から求めるエッジ幅はPSFを推定するための安定な特徴量とは言えないという問題点がある。また、画像にノイズが含まれる場合にもエッジ幅は不安定な特徴量となるという問題点がある。
【0011】
そこで、本発明は、物体認識のために安定なPSFを推定することができる物体認識装置及びその方法を提供する。
【課題を解決するための手段】
【0012】
本発明は、動きぼけ、または、焦点ぼけにより劣化した劣化画像から、認識したい物体の物体領域画像を検出する領域獲得部と、前記物体領域画像をそれぞれ周波数領域へ変換し、ぼけ量を表す特徴ベクトルを抽出するベクトル生成部と、予め記憶した複数の点拡がり関数(PSF)における各点拡がり関数を、予め記憶したぼけのない複数枚の訓練画像にそれぞれ適用して生成された複数枚のぼけた画像を1個のクラスとして構成し、前記各クラスを前記各点拡がり関数にそれぞれ対応させて格納する格納部と、前記特徴ベクトルと、前記各クラスに属する複数枚の前記ぼけた画像とをパターン認識することにより比較して、前記特徴ベクトルと最も類似する前記クラスを求め、この最も類似する前記クラスに対応する前記点拡がり関数を一つ選択する推定部と、選択された前記点拡がり関数を用いて前記物体領域画像をぼける前の画像に復元する復元部と、前記復元された画像と前記参照画像とを比較して前記物体を識別する識別部と、を有する物体認識装置である。
【発明の効果】
【0013】
本発明によれば、ノイズに頑健なPSFの推定ができる。
【発明を実施するための最良の形態】
【0014】
以下、本発明の一実施形態について図面に基づいて説明する。
【0015】
(1)実施形態の概念
具体的な実施形態を説明する前に、本実施形態の概念について説明する。
【0016】
あるPSFによってぼけた顔が写った画像の見え方は、異なる人物間で類似する。また、異なるPSFによってぼけた顔が写った画像の見え方は、同一人物でも類似しない。このことから、様々なPSFにより生成された画像の状態は、PSF毎のクラスへ分類できる。本実施形態では、これらのクラスの集合を、ぼけによる見え方の変動と呼び、PSF推定のときに利用する。
【0017】
本実施形態では、劣化画像が与えられると、ぼけによる画像の変動と比較することでPSFを選択的に推定し、そのPSFで復元された画像を用いて個人を識別する。ぼけによる画像の変動は、次の二つの仮定(a1),(a2)をおくことで、個人識別に用いる人物以外から事前に学習する。
【0018】
(a1) PSFが変化し得る範囲は、顔認識の使用環境に応じて仮定できる。
【0019】
(a2) ぼけによる顔の見えの劣化は、人物に依存せず同じ傾向をもつと仮定できる。
【0020】
ぼけによる画像の劣化過程は式(1)で定義される。
【数1】

【0021】
ここで、gは劣化画像g(u,v)を表す輝度値のベクトル、または、RGBのそれぞれの輝度値のベクトル、u、vは画像上の画素位置、HはPSFを表す行列、fは原画像を表す輝度値、または、RGBのそれぞれの輝度値のベクトル、nはノイズを表すベクトルである。なお、g、fは顔領域のみを含むと仮定する。
【0022】
図4に本実施形態の概念図を示す。本実施形態は図4(a)のぼけによる見え変動の学習、図4(b)の劣化画像が与えられた時の認識の二つの処理をもつ。
【0023】
(1−1)学習処理
まず、図4(a)の学習処理について述べる。
【0024】
顔認識の使用環境において、ある範囲内で連続的に変化するPSFをサンプリングし、式(2)のように、N個のPSFを用意する。
【数2】

【0025】
これにより、未知変数が大量にあるPSF推定の問題を、n個のPSFの中から適切なPSFを選択する問題へ置き換える。PSFを選択するときに、式(3)のぼけによる画像の見え方の変動Φを用いる。
【数3】

【0026】
φはH∈Ωによりぼかされた見えが属するクラスとする。同一クラス内には、PSFが同じ顔の見え方が属する。各クラスは、式(4)のM枚のぼけていない訓練画像Ψから事前に学習する。
【数4】

【0027】
訓練画像は、個人識別に用いる参照画像とは異なる人物から撮影する。
【0028】
(1−2)認識処理
次に、図4(b)の認識処理について述べる。
【0029】
PSFが未知のgが与えられると、gとφ∈Φとを比較することで、gの見え方が属するクラスを選択する。
【0030】
選択するために、gの見え方がどのクラスの見え方と類似するかをパターン認識の方法で計る。選択されたクラスに対するPSFがgのHとなる。
【0031】
(1−3)復元処理
選択されたHを用いて、ぼける前の画像をgから復元する。
【0032】
(1−4)識別処理
復元された画像から個人を識別するための特徴量を算出し、各人物の参照画像と比較することで個人を同定する。
【0033】
(2)顔認識装置100
次に、本実施形態の顔認識装置100について図1〜図3に基づいて説明する。本実施形態は、見え方の変動モデルに基づくPSF推定を用いて個人識別を行うものである。図1に顔認識装置100の構成を示す。
【0034】
顔認識装置100は、顔領域獲得部101、特徴ベクトル生成部102、ぼけモデル格納部103、PSF推定部104、復元部105、個人識別部106からなる。
【0035】
(3)顔領域獲得部101
顔領域獲得部101は、カメラから出力された画像から顔領域を検出し、顔領域のみからなる画像g(u,v)を獲得する(図2のステップ201)。
【0036】
このため、例えば、顔の特徴点を検出して、3次元形状モデルにあてはめることで顔の向きと大きさを補正する。
【0037】
(4)特徴ベクトル生成部102
特徴ベクトル生成部102は、g(u,v)からぼけ量を表す特徴ベクトルxを生成する(図2のステップ202)。
【0038】
まず、g(u,v)を式(5)で特徴画像x(ξ´,η´)に変換する。
【数5】

【0039】
ここで、g(ξ,η)はg(u,v)の2次元フーリエ変換、||は振幅を表す。
【0040】
フーリエ変換による振幅値は、各周波数成分の強度を表しており、ぼけ量を表す特徴として適切であると考えられる。
【0041】
前記各周波数成分の強度の中の直流成分の振幅値は、高周波成分に比べて非常に大きな値をとるため対数変換を適用する。ダウンサンプリングは後処理の計算量削減のために用いる。
【0042】
なお、フーリエ変換により位相も得られる。位相は個人性の影響が大きく個人識別には有効な特徴であるものの、PSF推定には不必要な特徴である。
【0043】
この変換した特徴画像x(ξ´,η´)をラスタースキャンで特徴ベクトルxに変換する。PSF推定で用いる部分空間法は、ベクトルと部分空間との角度を計る方法なのでノルムを正規化する。例えば、L2ノルムを用いて||x||=1とする。
【0044】
図3に、ぼけた状態とぼけていない状態の特徴ベクトルの波形例を示す。波形301は劣化画像、波形302はフーリエ変換,波形303は対数変換,波形304はノルム正規化を適用した後の画像断面である。実線がぼけていない状態、破線がぼけた状態を表す。波形301では波形がほぼ同じであるが、波形304ではぼけ量の違いが明確に表れる。
【0045】
(5)ぼけモデル格納部103
ぼけモデル格納部103には、PSF推定に用いる式(3)のΦが格納される。φ∈Φを式(6)で定義する。
【数6】

【0046】
ここで、bijは部分空間の基底ベクトル、Dは部分空間の次元数を表す。
【0047】
以下では、部分空間の基底ベクトルを求める方法について述べる。
【0048】
まず、ぼけていない訓練画像ΨとH∈Ωを用いて、式(7)で擬似的にぼけを付加する。
【数7】

【0049】
ここで、nは訓練画像に与えるノイズを表すベクトルである。nはカメラ系から事前に測定する。
【0050】
次に、hikに変換する。推定性能を上げるために全訓練パターン{t|k=1,...,M}から求めた平均特徴ベクトルをyikから引いてもよい。
【0051】
次に、式(8)の自己相関行列の固有値と固有ベクトルを求め、固有値の大きいものから順に選んだD本の固有ベクトルbijとする。
【数8】

【0052】
(6)PSF推定部104
PSF推定部104では、特徴ベクトル生成部102から出力されたxとぼけモデル格納部103のΦとを部分空間法を用いて比較し、PSFを推定する(図2のステップ203)。
【0053】
部分空間法は、多クラスの識別問題が容易に実装でき、安定した識別性能を得ることができる。PSFが未知のxが与えられると、式(9)でラベルsを選択する。
【数9】

【0054】
ここで、xはgのぼけ量を表す特徴ベクトル、θは部分空間と特徴ベクトルがなす角度である。sに対応するHsが、xから推定されたPSFとなる。
【0055】
(7)復元部105
復元部105では、顔領域獲得部101から出力されたgに対して、PSF推定部104から出力されたHsを用いて、画像を復元する(図2のステップ204)。
【0056】
単純にHsの逆行列を適用することも考えられるが、式(1)のノイズの存在は無視できない。
【0057】
本実施形態では例えば、ウィーナフィルタ、もしくは、BTV正則化を用いて画像を復元する。BTVとは、Bilateral Total Variationであり、このBTV正則化は、文献[S. Farsiu, M. D. Robinson, M. Elad,P. Milanfar, Fast and robust multiframe super resolution, IEEE Trans. Image Processing, Vol. 13, No. 10, pp. 1327 - 1344, 2004.]に記載されている。
【0058】
これらの方法ではノイズの取り扱いが異なる。ウィーナフィルタに比べてBTV正則化は、ノイズ耐性は強いが計算量は多くなる。劣化画像のノイズの性質に応じて使い分けるとよい。
【0059】
例えば、ウィーナフィルタにより復元された画像aは式(10)で求まる。
【数10】

【0060】
ここで、原画像の自己相関行列をR、ノイズの自己相関行列をRとする。
【0061】
原画像の自己相関行列は訓練パターンΨから推定する。
【0062】
ノイズの自己相関行列はカメラ系から事前に推定する。
【0063】
なお、上記説明では、顔領域獲得部101から出力された、3次元形状モデル向きと大きさが補正されたgを用いた。
【0064】
しかしながら、gではなく、カメラから出力された画像に対して同様の処理を行ってもよい。その場合、PSF推定部104で推定されたPSFには大きさの不定性が残る。不定性を取り除くために、例えば、顔特徴点の位置関係を用いればよい。
【0065】
(8)個人識別部106
個人識別部106では、復元部105から出力されたaを用いて個人を識別する(図2のステップ205)。
【0066】
例えば、最近傍決定則を用いてaと参照画像との距離を比較することで人物を決定する。他にも一般的なパターン認識の方法を用いて個人識別を行うことができる。
【0067】
(9)効果
本実施形態によれば、ぼけた画像が与えられると、ぼけによる顔の見え方の変動モデルと比較することでPSFを推定し、そのPSFで復元された画像を用いて個人を識別する。輪郭上のエッジではなく、顔全体の見え方を用いるためPSFを安定に推定できる。ぼけによる顔の見え方の変動モデルは、個人識別に用いる参照画像とは別の人物から学習できる。
【0068】
また、ノイズも含めてモデルを学習することで、ノイズに頑健なPSFの推定ができる。本実施形態によりぼけの影響を抑えることで、個人識別のFAR,FRRを低下させることができる。
【0069】
(10)変更例
本発明は上記実施形態に限らず、その主旨を逸脱しない限り種々に変更することができる。
【0070】
例えば、PSF推定には部分空間法を用いたが、最近傍決定則など、他のパターン認識の方法を用いてもよい。
【0071】
最近傍決定則を用いる場合を説明する。訓練画像をそれぞれのPSFでぼかし、ぼけた画像の集合を生成する。PSFが未知の画像が与えられると、ぼけた画像の集合に含まれる全ての画像と類似度を計算する。類似度が最も高い画像を生成するときに用いたPSFが、PSF推定の結果となる。
【0072】
また、上記実施形態では、顔による個人認識で説明したが、顔に限らず、他の物体、例えば、自動車などの認識に適用してもよい。
【図面の簡単な説明】
【0073】
【図1】本発明の一実施形態の顔認識装置の構成図である。
【図2】顔認識の流れを表す図である。
【図3】特徴ベクトルの比較図である。
【図4】本実施形態の概念図である。
【符号の説明】
【0074】
101 顔領域獲得部
102 特徴ベクトル生成部
103 ぼけモデル格納部
104 PSF推定部
105 復元部
106 個人識別部
301 劣化画像
302 フーリエ変換
303 対数変換
304 ノルム正規化

【特許請求の範囲】
【請求項1】
動きぼけ、または、焦点ぼけにより劣化した劣化画像から、認識したい物体の物体領域画像を検出する領域獲得部と、
前記物体領域画像をそれぞれ周波数領域へ変換し、ぼけ量を表す特徴ベクトルを抽出するベクトル生成部と、
予め記憶した複数の点拡がり関数(PSF)における各点拡がり関数を、予め記憶したぼけのない複数枚の訓練画像にそれぞれ適用して生成された複数枚のぼけた画像を1個のクラスとして構成し、前記各クラスを前記各点拡がり関数にそれぞれ対応させて格納する格納部と、
前記特徴ベクトルと、前記各クラスに属する複数枚の前記ぼけた画像とをパターン認識することにより比較して、前記特徴ベクトルと最も類似する前記クラスを求め、この最も類似する前記クラスに対応する前記点拡がり関数を一つ選択する推定部と、
選択された前記点拡がり関数を用いて前記物体領域画像をぼける前の画像に復元する復元部と、
前記復元された画像と前記参照画像とを比較して前記物体を識別する識別部と、
を有する物体認識装置。
【請求項2】
前記ベクトル生成部は、
前記物体領域画像に対してフーリエ変換で振幅値を求め、前記振幅値に対数変換を適用した後に、ダウンサンプリングとノルムの正規化を行って前記特徴ベクトルを算出する、
請求項1記載の物体認識装置。
【請求項3】
前記格納部は、前記各クラスに属する複数枚の前記ぼけた画像から生成された部分空間を、前記クラス毎に格納し、
前記推定部は、前記クラス毎の前記部分空間と前記特徴ベクトルとを部分空間法により比較する、
請求項1記載の物体認識装置。
【請求項4】
前記領域獲得部は、
前記劣化画像から前記物体領域の前記特徴点を検出し、前記特徴点を平均物体領域形状にあてはめることで前記物体領域画像を獲得する、
請求項1記載の物体認識装置。
【請求項5】
動きぼけ、または、焦点ぼけにより劣化した劣化画像から、認識したい物体の物体領域画像を検出する領域獲得ステップと、
前記物体領域画像をそれぞれ周波数領域へ変換し、ぼけ量を表す特徴ベクトルを抽出するベクトル生成ステップと、
予め記憶した複数の点拡がり関数(PSF)における各点拡がり関数を、予め記憶したぼけのない複数枚の訓練画像にそれぞれ適用して生成された複数枚のぼけた画像を1個のクラスとして構成し、前記各クラスを前記各点拡がり関数にそれぞれ対応させて格納する格納ステップと、
前記特徴ベクトルと、前記各クラスに属する複数枚の前記ぼけた画像とをパターン認識することにより比較して、前記特徴ベクトルと最も類似する前記クラスを求め、この最も類似する前記クラスに対応する前記点拡がり関数を一つ選択する推定ステップと、
選択された前記点拡がり関数を用いて前記物体領域画像をぼける前の画像に復元する復元ステップと、
前記復元された画像と前記参照画像とを比較して前記物体を識別する識別ステップと、
を有する物体認識方法。
【請求項6】
前記ベクトル生成ステップは、
前記物体領域画像に対してフーリエ変換で振幅値を求め、前記振幅値に対数変換を適用した後に、ダウンサンプリングとノルムの正規化を行って前記特徴ベクトルを算出する、
請求項5記載の物体認識方法。
【請求項7】
前記格納ステップは、前記各クラスに属する複数枚の前記ぼけた画像から生成された部分空間を、前記クラス毎に格納し、
前記推定ステップは、前記クラス毎の前記部分空間と前記特徴ベクトルとを部分空間法により比較する、
請求項5記載の物体認識方法。
【請求項8】
前記領域獲得ステップは、
前記劣化画像から前記物体領域の前記特徴点を検出し、前記特徴点を平均物体領域形状にあてはめることで前記物体領域画像を獲得する、
請求項5記載の物体認識方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate


【公開番号】特開2009−110349(P2009−110349A)
【公開日】平成21年5月21日(2009.5.21)
【国際特許分類】
【出願番号】特願2007−282932(P2007−282932)
【出願日】平成19年10月31日(2007.10.31)
【出願人】(000003078)株式会社東芝 (54,554)
【Fターム(参考)】