説明

物体識別装置、物体識別方法、及びプログラム

【課題】 識別対象物体の識別精度を向上することを目的とする。
【解決手段】 入力画像内の物体を識別する物体識別装置であって、入力画像から予め定められたサイズの複数の部分画像を分割して生成する生成部と、生成部により生成されたすべて各部分画像について各部分画像間の非類似度を算出する第1算出部と、第1算出部により算出された非類似度に基づいて、物体の特徴領域として物体の部位領域及び部位領域以外の領域である模様領域を検出する検出部と、検出部により検出された特徴領域に対する特徴量のヒストグラムを作成する作成部と、作成部により作成されたヒストグラムから、部分画像が部位領域であるか模様領域であるかを識別するための弱仮説を設定する設定部と、設定部により設定された弱仮説から、物体の部位を識別するための識別情報を算出する第2算出部と、識別情報に基づいて入力画像内における物体を識別する識別部と、を備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理における物体識別装置、物体識別方法、及びプログラムに関する。
【背景技術】
【0002】
画像中から識別対象物体を検出する方法として、所定の画素間の差分値を特徴量として、識別対象物体に対応する領域を画像中から推定するアルゴリズムがある(例えば、特許文献1)。これは、物体を識別するための特徴量として、識別対象物体領域内の画素間の差分値を用いるものであり、処理画像中における所定領域内の画素間の差分値と照合することで、処理画像中における識別対象物体位置を検出する方法である。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2005-284348号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかし、所定の画素間の差分値を特徴量に用いた物体識別方法の場合、一般に、複雑背景下における識別対象物体領域と、その他の背景画像領域との差分値が類似する場合、識別対象物体とその背景画像領域との識別精度が低下するという問題があった。また、入力画像の面内回転や照明変動により、識別精度が低下するという問題があった。
【0005】
上記の課題に鑑み、本発明は識別対象物体の識別精度を向上することを目的とする。
【課題を解決するための手段】
【0006】
上記の目的を達成する、本発明に係る物体識別装置は、入力画像内の物体を識別する物体識別装置であって、
前記入力画像から予め定められたサイズの複数の部分画像を分割して生成する生成手段と、
前記生成手段により生成されたすべて各部分画像について各部分画像間の非類似度を算出する第1算出手段と、
前記第1算出手段により算出された非類似度に基づいて、前記物体の特徴領域として物体の部位領域及び前記部位領域以外の領域である模様領域を検出する検出手段と、
前記検出手段により検出された特徴領域に対する特徴量のヒストグラムを作成する作成手段と、
前記作成手段により作成されたヒストグラムから、部分画像が前記部位領域であるか前記模様領域であるかを識別するための弱仮説を設定する設定手段と、
前記設定手段により設定された弱仮説から、物体の部位を識別するための識別情報を算出する第2算出手段と、
前記識別情報に基づいて入力画像内における物体を識別する識別手段と、
を備えることを特徴とする。
【発明の効果】
【0007】
本発明によれば、識別対象物体の識別精度を向上することができる。
【図面の簡単な説明】
【0008】
【図1】(a)物体識別装置の概略構成図、(b)物体識別装置の概略構成を示すフローチャート。
【図2】物体識別装置の部分画像生成部の機能についての説明図。
【図3】(a)非類似度算出部の機能についての説明図、(b)及び(c)構造的特徴領域設定部の機能についての説明図。
【図4】(a)特徴ヒストグラム生成部の概略構成図、(b)特徴ヒストグラム生成部におけるテクスチャヒストグラム生成部の機能についての説明図、(c)物体識別装置の弱仮説設定部の概略構成図。
【図5】(a)特徴ヒストグラム生成部におけるパーツヒストグラム生成部の機能についての説明図、(b)特徴ヒストグラム生成部における非類似度ヒストグラム生成部の機能についての説明図、(c)特徴ヒストグラム生成部におけるテクスチャヒストグラム生成部の機能についての説明図。
【図6】(a)弱仮説設定部におけるパーツ弱仮説設定部の機能についての説明図、(b)弱仮説設定部における非類似度弱仮説設定部の機能についての説明図、(c)弱仮説設定部におけるテクスチャ弱仮説設定部の機能についての説明図。
【図7】(a)第2実施形態に係る外観検査装置の概略構成図、(b)第2実施形態に係る外観検査装置の識別部の機能についての説明図。
【図8】第2実施形態に係る外観検査装置の概略構成を示すフローチャート。
【発明を実施するための形態】
【0009】
(第1実施形態)
図1(a)を参照して、本発明の第1実施形態に係る物体識別装置101の概略構成について説明する。物体識別装置101は、半導体集積回路(LSI)等により構成される。
【0010】
図1(a)に示すように物体識別装置101は、学習用画像データベース111と、部分画像生成部112と、非類似度算出部113と、構造的特徴領域設定部114と、特徴ヒストグラム生成部115と、弱仮説設定部116と、学習部117と、識別部118と、識別用画像データベース119とを備える。これらの構成要素は物体識別装置101が果たす各機能に対応している。
【0011】
物体識別装置101が果たす機能を大別すると2種類に分けられる。一つは学習機能であり、学習用画像データベース111、部分画像生成部112、非類似度算出部113、構造的特徴領域設定部114、特徴ヒストグラム生成部115、弱仮説設定部116、学習部117により実行される。もう一つは識別機能であり、識別用画像データベース119、部分画像生成部112、非類似度算出部113、構造的特徴領域設定部114、特徴ヒストグラム生成部115、識別部118により実行される。
【0012】
学習用画像データベース111は、学習用の画像をデータベースとして保存する。部分画像生成部112は、入力画像を所定サイズの部分に分割した部分画像を生成する。非類似度算出部113は、部分画像生成部112で生成された全ての部分画像について、部分画像同士の非類似度を算出する。構造的特徴領域設定部114は、識別対象領域がパーツ領域(部位領域)又はパーツ領域(部位領域)以外の領域であるテクスチャ領域(模様領域)を検出する。特徴ヒストグラム生成部115は、構造的特徴領域設定部114で検出された各領域について後述の特徴量のヒストグラムを作成する。弱仮説設定部116は、特徴ヒストグラム生成部115により作成された特徴量のヒストグラムに基づいて部分画像が部位領域であるか模様領域であるかを識別するための後述の弱仮説を設定する。学習部117は、弱仮説設定部116により設定された弱仮説から、物体の部位を識別するための強判別器(識別情報)を算出し、また識別対象物体を識別するのに必要十分な性能が得られた、部分画像に分割する階層数で学習動作を打ち切る。識別部118は、学習部117で生成された強判別器を識別情報として、識別用画像データベース119から入力される画像が識別対象物体かどうか識別する。
【0013】
図1(b)を参照して、物体識別装置101の概略構成を示すフローチャートについて説明する。物体識別装置101は、ステップS151において、現在の機能が識別モードでであるか学習モードであるかを判別する。学習モードであると判別された場合、ステップS152に進む。ステップS152において、画像の分割が所定の階層に達したか否かを判定する。所定の階層に達していない場合(ステップS152;NO)、ステップS153に進む。ステップS153において、学習用画像データベース111からの複数の入力画像を、部分画像生成部112により所定サイズの部分画像に分割し、部分画像を生成する。次にステップS154において、第1算出手段として機能する非類似度算出部113により全ての部分画像間の非類似度を算出する。非類似度の算出には、部分画像間の差分(N対N比較値(N>0))等を用いる。さらにステップS155において、構造的特徴領域設定部114により識別対象物体のパーツ領域(部位領域)と、パーツ領域以外(部位領域以外)の領域であるテクスチャ領域(模様領域)とに分類する。そしてステップS156において、作成手段として機能する特徴ヒストグラム生成部115で所定の特徴量に対するヒストグラムを作成する。
【0014】
次に、識別対象物体のより詳細な情報を抽出するために、構造的特徴領域設定部114によりパーツ(部位)に分類された部分画像に対してのみ、図1(b)で示したフローと同様の手順により、所定の特徴量に対するヒストグラムを生成する。ここで1回目に得られたヒストグラムを第1階層のヒストグラム、2回目に得られたヒストグラムを第2階層のヒストグラム、以下同様にN回目に得られたヒストグラムを第N階層のヒストグラムと称する。階層数Nは識別対象物体が複雑なもの程多くなり、学習部117により一意に決定される。すなわち、k(k<=N)回目に得られる構造的特徴領域は、j(j<k)回目に得られる構造的特徴領域より、識別対象物体のパーツ(部位)に関するより詳細な情報を有する。学習部117は識別対象物体を識別するのに必要十分な性能が得られた階層数Nで学習動作を打ち切る。
【0015】
一方、物体識別装置101は、ステップS151において、識別モードであると判別した場合、ステップS159へ進む。識別用画像データベース119からの入力画像を、部分画像生成部112、非類似度算出部113、構造的特徴領域設定部114、特徴ヒストグラム生成部115を用いて、所定の特徴量に対するヒストグラムを生成する。さらに、ステップS160において、予め学習部117により生成された強判別機を用いて識別対象物体であるか否かを判定する。ここで得られた判定結果は物体識別装置101のさらに上位階層に伝達され、様々なアプリケーションに適用される。
【0016】
図2を参照して、部分画像生成部112により各階層における部分画像が生成されていく一例について説明する。図2(a)は第1階層における分割図である。第1階層では、入力画像そのものを所定サイズの部分画像に分割する。この例では一辺が8画素の部分画像に分割し、合計16個の部分画像を生成している。ここで、構造的特徴領域設定部114を用いて、これらの部分画像を識別対象物体のパーツ(部位)に対応するものと、テクスチャ(模様)に対応するものとに分類する。ここでは、第1階層における番号3、5、9、及び11の部分画像が識別対象物体のパーツ(部位)に対応するものとして分類されたと仮定する。
【0017】
図2(b)は第2階層における分割図である。第2階層では、第1階層においてパーツ(部位)に対応すると判定された部分画像のみ、再度所定サイズの部分画像に分割する。この例では第1階層における番号3、5、9、及び11の部分画像に対して、一辺が4画素の部分画像に分割し、合計16個の部分画像を生成している。ここで同様に、構造的特徴領域設定部114を用いて、これらの部分画像をパーツ(部位)に対応するものとテクスチャ(模様)に対応するものとに分類する。ここでは、第2階層における番号1、3、10、12の部分画像が識別対象物体のパーツ(部位)に対応するものに分類されたと仮定する。
【0018】
図2(c)は第3階層における分割図である。第3階層では、同様に第2階層においてパーツ(部位)に対応すると判定された部分画像のみ、再度所定サイズの部分画像に分割する。この例では第2階層における番号1、3、10、及び12の部分画像に対して、一辺が2画素の部分画像に分割し、合計16個の部分画像を生成している。ここでも同様に、構造的特徴領域設定部114を用いてこれらの部分画像をパーツ(部位)に対応するものとテクスチャ(模様)に対応するものとに分類する。
【0019】
ここで、各階層における部分画像サイズは、一意に決まるものではなく、予めいくつかの部分画像サイズによる識別精度と処理速度を計測しておき、その中で最も使用環境に合ったものが選択される。
【0020】
次に、非類似度算出部113は、部分画像生成部112で生成されたすべての部分画像間の非類似度を算出する。図3(a)を参照して、I番目の部分画像とJ番目の部分画像の非類似度D(I、J)の算出について説明する。非類似度D(I、J)は次式で与えられる。
【0021】
【数1】

【0022】
ここで、式(1)における(R、G、B)は、部分画像の構成要素である画素値(Red、Green、Blue)を表し、k、tは、部分画像Iにおけるk番目の画素値と、部分画像Jにおけるt番目の画素値を表す。また、入力画像がグレイスケールの場合、非類似度D(I、J)は次式で与えればよい。
【0023】
【数2】

【0024】
ここで、式(2)におけるY、Yは、それぞれ部分画像Iにおけるk番目の輝度値、部分画像Jにおけるt番目の輝度値を表す。
第1算出手段として機能する非類似度算出部113は、式(1)又は式(2)を用いて、全ての部分画像間の非類似度D(I、J)を算出し、後述の構造的特徴領域設定部114に出力する。
【0025】
構造的特徴領域設定部114は、従来技術である多次元尺度構成法(MDS)等を用いて、識別対象物体の構造的特徴を各階層別に低次元空間に埋め込む。多次元尺度構成法は、以下に示す手順により実行される。
【0026】
<多次元尺度構成法>
まず、入力データとして与えられるN個の分類対象(n、n、n、…、n)から、非類似度δ(n、n’)を算出し、式(3)で与えられる順位統計量を求める。ここで、非類似度δ(n、n’)は、n番目とn’番目の分類対象の相違を定量化したものであり、ユーザによって適宜定義される。例えば、上記入力データを入力画像内の画素値とした場合、非類似度δ(n、n’)はn番目とn’番目の画素値の差分絶対値で与えてもよい。非類似度δ(n、n’)を、式(3)のように昇順に並べる。ここで得られた各非類似度δ(n、n’)は後述の順位相関Cnn’の算出に用いる。
【0027】
【数3】

【0028】
一方、N個の点をユークリッド空間に配置して初期点群をr (ただしn=0、1、2、…、N)とする。この各点郡は各部分画像に対応している。この初期点群r (ただしn=0、1、2、…、N)を式(4)を用いて規格化する。
【0029】
【数4】

【0030】
式(4)による規格化後の点群におけるn番目とn’番目の点のユークリッド距離d(n、n’)を算出し、式(5)のように昇順に並べる。ここで得られた各ユークリッド距離d(n、n’)は後述の順位相関Cnn’の算出に用いる。
【0031】
【数5】

【0032】
式(3)及び式(5)から順位相関Cnn’を算出する。ここで、Cnn’は、δ(n、n’)がk番目に大きく、d(n、n’)がT番目に大きい場合、Cnn’=T−kで与えられる。
【0033】
ここでCnn’が正であれば、ユークリッド空間においてn番目の点をn’番目の点に近づけるようにs|Cnn’|だけ移動する。ここで、sは適当な小さな値を持つ定数である。
【0034】
一方、Cnn’が負であれば、ユークリッド空間Rにおいてn番目の点をn’番目の点から遠ざかるようにs|Cnn’|だけ移動する。従って、n番目の点の移動量をベクトルで表記すると式(6)のように表せる。
【0035】
【数6】

【0036】
以下に示す式(7)で表される順位相関Cnn’の合計値Sが所定閾値εより小さくなるまで、上述した初期点群r (ただしn=0、1、2、…、N)を式(4)を用いて規格化する手順に戻る。
【0037】
【数7】

【0038】
ただし、上記手順における分類対象(n、n’)は、部分画像生成部112で生成された部分画像(I、J)に対応する。同様に、上記手順における非類似度δ(n、n’)は、非類似度算出部113で算出された部分画像間の非類似度D(I、J)に対応する。
【0039】
ここで、上記手順により、低次元空間に点群を埋め込むと、図3(b)に示すように、直線状の構造を成す点群と、これと相対的に離れた点群とに埋め込まれる。このとき、前者(直線状の構造)に対応する点群は、入力画像内のテクスチャ(模様)を構成する部分画像に対応し、相対的に高い明度の部分画像から、低い明度の部分画像の順に並んでいる。一方、後者に属する点群(相対的に離れた点群)は、入力画像内のパーツ(部位)を構成する部分画像に対応している。これを図示すると図3(c)のようになる。例えば、入力画像に人物の顔画像を用いた場合、直線状の構造を成す点は、顔画像内の頬や額の領域に対応し、それ以外の点は、顔画像内の目、鼻、口といった部位に対応する。
【0040】
さらに、構造的特徴領域設定部114は、従来技術である最小メディアン二乗法を用いて、得られた点群を直線状の構造を成す点と、これと相対的に離れた点とに分類する。最小メディアン二乗法は、以下に示す手順により実行される。
【0041】
<最小メディアン二乗法>
まず、点群から任意の2点を選択し、この2点を結ぶ直線の方程式ax+by+c=0を求める。そして点群から直線ax+by+c=0に対する垂線の距離の合計値Sを算出する。これらの操作を全ての2点に対して実行し、合計値Sの最小値Mを求める。次に、ロバスト標準偏差σを次式により算出する。ここでNは、点群の個数を表しており、Mは垂線の距離の合計値Sの最小値である。
【0042】
【数8】

【0043】
式(8)と、次式を満たす(x、y)を直線状の構造を成す点と判定する。ここで式(9)における(a、b、c)はで最小値Mが得られた直線の方程式の各係数を表す。
【0044】
【数9】

【0045】
また、構造的特徴領域設定部114は、ここで得られた入力画像内のテクスチャ(模様)に対応する点群と、パーツ(部位)に対応する点群を、後述の特徴ヒストグラム生成部115に出力する。特徴ヒストグラム生成部115は、構造的特徴領域設定部114で得られた点群から、所定の特徴量を算出し、これをヒストグラム化する。特徴ヒストグラム生成部115は、図4(a)に示すように、パーツヒストグラム生成部401と、非類似度ヒストグラム生成部402と、テクスチャヒストグラム生成部403とを備える。これらの構成要素は特徴ヒストグラム生成部115が果たす各機能にそれぞれ対応している。
【0046】
パーツヒストグラム生成部401は、図5(a)に示すように、各階層(第1階層、第2階層、…、第N階層)別に所定の部分画像が識別対象物体のパーツ(部位)に対応すると判定された回数を頻度として計測し、ヒストグラム化する。ここで、横軸の部分画像番号とは、図2に示すように、各階層における部分画像の識別番号を意味している。本ヒストグラムにより、各階層においてどの部分画像が識別対象物体のパーツ(部位)に対応するか分析することができる。また、パーツヒストグラム生成部401は、ここで得られたヒストグラムを、後述の弱仮説設定部116に出力する。
【0047】
非類似度ヒストグラム生成部402は、図5(b)に示すように、各階層別に所定の部分画像が識別対象物体のパーツ(部位)に対応すると判定された際、これらの部分画像間の非類似度をヒストグラム化する。縦軸が頻度であり、横軸が非類似度である。ここで、部分画像ペア番号とは、各階層における部分画像ペアの識別番号を意味する。部分画像ペア番号は、領域画像をM個の部分画像に分割した場合、合計個存在することになる。これら各部分画像のペアを識別するための番号を意味している。本ヒストグラムにより、各階層における部分画像ペアの非類似性を分析することができる。また、非類似度ヒストグラム生成部402は、ここで得られたヒストグラムを、後述の弱仮説設定部116に出力する。
【0048】
テクスチャヒストグラム生成部403は、図5(c)に示すように、各階層別に所定の部分画像が識別対象物体のテクスチャ(模様)に対応すると判定された際、これらの部分画像の相対明度をヒストグラム化する。縦軸が頻度であり、横軸が相対明度である。ここで、相対明度とは、テクスチャ(模様)に対応すると判定された部分画像の中で、最も明度の低いものを基準値(例えば、零)とした場合の相対的な明度を意味する。具体的には、図4(b)に示すように、点aに対応する部分画像の相対明度は、最も明度の低い部分画像に対応する点bからの距離Lで与えられる。また、テクスチャヒストグラム生成部403は、ここで得られたヒストグラムを、後述の弱仮説設定部116に出力する。
【0049】
弱仮説設定部116は、特徴ヒストグラム生成部115を用いて、識別対象物体(イントラ)に対するヒストグラムと、識別対象物体以外(エクストラ)のヒストグラムとを作成し、後述の学習部117で用いられる弱仮説を設定する。ここで、弱仮説とは、ランダムに推測するよりは正答率の高い(50%を超える)識別器のことを意味する。弱仮説設定部116は、3つの弱仮説、すなわち、パーツ弱仮説(m、p/t)と、非類似度弱仮説(d、1/−1)と、テクスチャ弱仮説(d、1/−1)とを設定する。ここで、pは「パーツ(部位)」を、tは「テクスチャ(模様)」を、/は「又は」を表している。また、識別対象物体(イントラ)と識別対象物体以外(エクストラ)を最も精度よく識別する閾値を設定した場合に、識別対象物体が閾値以上の領域に属する場合に1を、閾値以下の領域に属する場合には−1を設定する。
【0050】
弱仮説設定部116は、図4(c)に示すように、パーツ弱仮説設定部451と、非類似度弱仮説設定部452と、テクスチャ弱仮説設定部453とを備える。これらの各構成要素は弱仮説設定部116が果たす機能にそれぞれ対応している。
【0051】
パーツ弱仮説設定部451は、図6(a)に示すように、各階層別に識別対象物体(イントラ)と識別対象物体以外(エクストラ)のパーツヒストグラムを生成し、パーツ弱仮説(m、p/t)を設定する。パーツ弱仮説設定部451は、部分画像番号mの部分画像における識別対象物体(イントラ)の頻度と、識別対象物体以外(エクストラ)の頻度を比較する。そして、識別対象物体(イントラ)の頻度が識別対象物体以外(エクストラ)の頻度より多い場合、部分画像番号mの部分画像が識別対象物体のパーツ(部位)に対応するというパーツ弱仮説(m、p)を設定する。
【0052】
一方、部分画像番号m’の部分画像における識別対象物体(イントラ)の頻度が識別対象物体以外(エクストラ)の頻度より少ない場合、部分画像番号m’の部分画像が識別対象物体のテクスチャ(模様)に対応するというパーツ弱仮説(m’、t)を設定する。
【0053】
例えば、人物の顔画像を識別対象物体とした場合、前者の弱仮説が設定される部分画像は、顔画像における目、鼻、口といったパーツ(部位)に対応する。一方、後者の弱仮説が設定される部分画像は、顔画像における頬、額といったテクスチャ(模様)に対応する。また、パーツ弱仮説設定部451は、ここで得られたパーツ弱仮説を後述の学習部117に出力する。
【0054】
非類似度弱仮説設定部452は、図6(b)のように、各階層別に識別対象物体(イントラ)と識別対象物体以外(エクストラ)との各非類似度ヒストグラムを生成し、非類似度弱仮説(d、1/−1)を設定する。非類似度弱仮説設定部452は、生成された非類似度ヒストグラムごとに、識別対象物体(イントラ)と識別対象物体以外(エクストラ)を最も精度よく識別する閾値と、その閾値極性とを非類似度弱仮説に設定する。ここで、閾値極性とは、任意の閾値を設定した場合に、識別対象物体が閾値以上の非類似度領域に属するのか(=1)、閾値以下の非類似度領域に属するのか(=−1)の何れに属する可能性が高いかを表す。例えば、図6(b)の第2階層における部分画像ペア番号1の場合、(閾値、閾値極性)=(d、−1)が非類似度弱仮説に設定される。同様に、第N階層における部分画像ペア番号の場合、(閾値、閾値極性)=(d’、+1)が非類似度弱仮説に設定される。また、非類似度弱仮説設定部452は、ここで得られた非類似度弱仮説を後述の学習部117に出力する。
【0055】
テクスチャ弱仮説設定部453は、図6(c)に示すように、各階層別に識別対象物体(イントラ)と識別対象物体以外(エクストラ)との相対明度ヒストグラムを生成し、テクスチャ弱仮説(d、1/−1)を設定する。テクスチャ弱仮説設定部453は、生成された相対明度ヒストグラムごとに、識別対象物体(イントラ)と識別対象物体以外(エクストラ)を最も精度よく識別する閾値と、その閾値極性をテクスチャ弱仮説に設定する。ここで、閾値極性とは、任意の閾値を設定した場合に、識別対象物体が閾値以上の相対明度領域に属するのか(=1)、閾値以下の相対明度領域に属するのか(=−1)の何れに属する可能性が高いかを表す。例えば、図6(c)の第1階層における部分画像番号Mの場合、(閾値、閾値極性)=(d、−1)がテクスチャ弱仮説に設定される。同様に、第1階層における部分画像番号1の場合、(閾値、閾値極性)=(d’、+1)がテクスチャ弱仮説に設定される。また、テクスチャ弱仮説設定部453は、ここで得られたテクスチャ弱仮説を後述の学習部117に出力する。
【0056】
学習部117は、従来技術の機械学習の一つであるAdaBoostを用いて、強判別器F(x)を生成する。AdaBoostは以下に示す手順により実行される。ここで、ベクトルxは学習用データを、yはt番目の弱仮説f(x)によるxの識別結果を表す。また、yはi番目の学習用データのラベルを、Dt、iはt番目の弱仮説におけるi番目の学習用データのデータ重みを、αはt番目の弱仮説に対する信頼度を表す。
【0057】
<AdaBoostを用いた強判別器F(x)の生成>
まず、式(10)を用いてデータ重みD1、iを初期化する。
【0058】
【数10】

【0059】
次に、以下の手順1から手順3までの操作をt=0からt=Tまで繰り返し実行する。手順1;弱仮説y=f(x)を学習する。手順2;弱仮説y=f(x)による誤認識率eを式(11)により算出する。
【0060】
【数11】

【0061】
手順3;データ重みDt、iを式(12)により更新する。すなわち、式(12)の左辺を新たに右辺に置き換える。
【0062】
【数12】

【0063】
以上より、強判別器F(x)を式(13)により生成する。入力データベクトルxが識別対象物体と判定された場合、正値が出力される。
【0064】
【数13】

【0065】
ここで、上記手順における学習データxは、パーツ(部位)に分類された部分画像番号P、パーツ(部位)に分類された部分画像間の非類似度D、さらに、テクスチャ(模様)に分類された部分画像の相対明度Bをベクトル表記したものである。すなわち、3次元の特徴ベクトル(P、D、B)に対応するものである。但し、ここでのPはパーツ弱仮説での部分画像番号mに、Dは非類似度弱仮説での閾値dに、Bはテクスチャ弱仮説での閾値dにそれぞれ対応する。なお、3次元の特徴ベクトル(P、D、B)は、学習用画像データベース111から入力される学習用画像に対して構造的特徴領域設定部114を適用して得られる。同様に、上記手順における弱仮説f(x)(但しt=0、1、…、k、…、N)は、弱仮説設定部116で設定されたパーツ弱仮説、非類似度弱仮説、テクスチャ弱仮説のいずれかに対応する。各弱仮説ごとに関数形f(x)は異なり、3次元の特徴ベクトル(P、D、B)のうち、例えば1番目ではPを、2番目ではBを、k番目ではDを用いて、各弱仮設に対応する公知の関数形に代入する。なお、パーツ(部位)であるかテクスチャ(模様)であるかという情報(p/t)、閾値極性(±1)の情報も公知の関数形に反映される。また、各弱仮説の中でどの弱仮説を使用するかはAdaBoostにより自動的に決定される。
【0066】
学習部117は、ここで得られた強判別器F(x)を後述の識別部118に出力する。識別部118は、第2算出手段として機能する学習部117で生成された強判別器F(x)を識別情報として、識別用画像データベース119から入力される画像が識別対象物体かどうか識別する。識別部118は、識別用画像データベース119から入力される識別用画像に対して構造的特徴領域設定部114を適用して得られる、3次元の特徴ベクトル(P、D、B)を生成する。そして、式(13)による強判別器を適用する。ここで得られた判定結果は、物体識別装置101のさらに上位階層に伝達され、様々なアプリケーションに適用される。例えば、人物の顔画像を識別対象物体とした場合、物体識別装置101は、顔検出や個人認識といったアプリケーションに適用され、デジタルスチルカメラやカムコーダーのようなエレクトロニクス機器に実装される。
【0067】
本実施形態によれば、識別対象物体の識別精度を向上することができる。
【0068】
(第2実施形態)
本発明の第2の実施形態について、図7及び図8を参照して説明する。図7(a)は本発明の第2実施形態に係る外観検査装置701の概略構成を示すブロック図である。本実施形態に係る外観検査装置701は、半導体集積回路(LSI)を用いて実現される。
【0069】
図7(a)に示すように、外観検査装置701は主に、識別用画像データベース721と、部分画像生成部722と、非類似度算出部723と、構造的特徴領域設定部724と、識別部725と、登録用画像データベース726とから構成される。これらの各構成要素は外観検査装置701が果たす各機能にそれぞれ対応している。
【0070】
外観検査装置701が果たす機能を大別すると2つ存在する。その1つは構造的特徴領域設定機能であり、識別用画像データベース721と、部分画像生成部722と、非類似度算出部723と、構造的特徴領域設定部724とを用いて実行される。もう1つは識別機能であり、登録用画像データベース726と、識別部725を用いて実行される。ここで、登録用画像データベース726には、検査対象物体を構成する部品各種の画像が格納されており、識別部725は、これらの登録画像と所定の部分画像との類似度を算出し、検査対象物体に異常がないか判定する。また、部分画像生成部722、非類似度算出部723、及び構造的特徴領域設定部724は、第1実施形態で説明した物体識別装置101における部分画像生成部112、非類似度算出部113、構造的特徴領域設定部114と同一の機能を有する。本実施形態では、第1実施形態との相違に関して詳述する。
【0071】
図8を参照して外観検査装置701の概略構成を示すフローチャートについて説明する。外観検査装置701は、構造的特徴領域の検出時に、識別用画像データベース721からの入力画像を、部分画像生成部722により所定サイズの部分画像に分割し、非類似度算出部723によりすべての部分画像間の非類似度を算出する。さらに、構造的特徴領域設定部724により識別対象物体のパーツ(部位)、すなわち検査対象物体の一部に対応する部分画像と、テクスチャ(模様)、すなわち検査対象物体以外に対応する部分画像とに分類する。
【0072】
次に、検査対象物体のより詳細な情報を抽出するために、構造的特徴領域設定部724によりテクスチャ(模様)に分類された部分画像に対してのみ、同様の手順でパーツ(部位)に対応する部分画像と、テクスチャ(模様)に対応する部分画像とに分類する。ここで第1回目の構造的特徴領域検出で得られたテクスチャを第1階層のテクスチャと称する。同様に、第2回目の構造的特徴領域検出で得られたテクスチャを第2階層のテクスチャと、以下同様に第N回目の構造的特徴領域検出で得られたテクスチャを第N階層のテクスチャと称する。ここで、階層数Nは、構造的特徴領域設定部724を繰り返し適用することにより、パーツ(部位)に分類される部分画像が無くなったときの階層数で一意に与えられる。
【0073】
一方、外観検査装置701は、識別時に、構造的特徴領域設定部724においてパーツ(部位)に対応すると判定された部分画像と、登録用画像データベースに格納された画像との類似度Sを式(14)により算出する。
【0074】
【数14】

【0075】
ここで、図7(b)に示すように、式(14)におけるベクトルIはパーツ(部位)に対応すると判定された部分画像の構成要素である画素値をベクトル化したものに対応する。また、ベクトルJは、登録用画像データベースに格納された画像の構成要素である画素値をベクトル化したものに対応する。
【0076】
このとき、式(14)により得られた類似度Sが正値の場合、この部分画像は外観検査装置701に登録済であると判定される。一方、得られた類似度Sが負値の場合、この部分画像は外観検査装置701に未登録であると判定される。ここで、登録用画像データベース726には、予め検査対象物体を構成する部品各種の正常データのみが格納されているため、未登録と判定された場合には、所定の部分画像において異常データ、すなわち欠陥となる部位が検出されたことになる。さらに、異常データが検出された部分画像の部分画像番号は、外観検査装置701のさらに上位階層に伝達され、印刷物や機械部品といった工業製品の外観検査に適用される。
【0077】
(第3実施形態)
第1実施形態では、学習機能及び識別機能の両者を実行する物体識別装置に関するものについて説明したが、学習機能及び識別機能のいずれか一方のみを実行する物体識別装置についても本発明の実施形態に含まれる。また、第1実施形態における構造的特徴領域設定部114において、最小メディアン二乗法の代わりに、主成分分析(PCA)又は局所性保存射影(LPP)を用いても良い。
【0078】
(その他の実施形態)
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。

【特許請求の範囲】
【請求項1】
入力画像内の物体を識別する物体識別装置であって、
前記入力画像から予め定められたサイズの複数の部分画像を分割して生成する生成手段と、
前記生成手段により生成されたすべて各部分画像について各部分画像間の非類似度を算出する第1算出手段と、
前記第1算出手段により算出された非類似度に基づいて、前記物体の特徴領域として物体の部位領域及び前記部位領域以外の領域である模様領域を検出する検出手段と、
前記検出手段により検出された特徴領域に対する特徴量のヒストグラムを作成する作成手段と、
前記作成手段により作成されたヒストグラムから、部分画像が前記部位領域であるか前記模様領域であるかを識別するための弱仮説を設定する設定手段と、
前記設定手段により設定された弱仮説から、物体の部位を識別するための識別情報を算出する第2算出手段と、
前記識別情報に基づいて入力画像内における物体を識別する識別手段と、
を備えることを特徴とする物体識別装置。
【請求項2】
前記特徴量には、
複数の入力画像内の部分画像が物体の前記部位領域または前記模様領域に対応すると判定された頻度と、
前記部位領域または前記模様領域に対応すると判定された部分画像間の非類似度と、
前記部位領域または前記模様領域に対応すると判定された部分画像の中で、最も明度の低いものを基準値とする相対明度と、
の少なくとも何れかが含まれることを特徴とする請求項1に記載の物体識別装置。
【請求項3】
前記作成手段は、
複数の入力画像内の部分画像が前記部位領域または前記模様領域に対応すると判定された頻度のヒストグラムと、
前記部位領域または前記模様領域に対応すると判定された部分画像間の非類似度のヒストグラムと、
前記部位領域または前記模様領域に対応すると判定された部分画像の中で最も明度の低いものを基準値とする相対明度のヒストグラムと、
の少なくとも何れかを作成することを特徴とする請求項1又は2に記載の物体識別装置。
【請求項4】
前記設定手段は、前記作成手段により作成されたヒストグラムに基づいて、
部分画像が識別対象物体の部位領域と模様領域との何れに対応するかと、
部分画像間の非類似度に対する閾値及び識別対象物体が閾値以上の非類似度領域に属するのか閾値以下の非類似度領域に属するのか何れの領域に属する可能性が高いかを示す閾値極性と、
部分画像間の中で最も明度の低いものを基準値とする相対明度に対する閾値及び識別対象物体が閾値以上の相対明度領域に属するのか閾値以下の相対明度領域に属するのか何れの領域に属する可能性が高いかを示す閾値極性と、
の少なくとも何れかを設定することを特徴とする請求項3に記載の物体識別装置。
【請求項5】
入力画像内の物体を識別する物体識別方法であって、
生成手段が、前記入力画像から予め定められたサイズの複数の部分画像を分割して生成する生成工程と、
第1算出手段が、前記生成工程により生成されたすべて各部分画像について各部分画像間の非類似度を算出する第1算出工程と、
検出手段が、前記第1算出工程により算出された非類似度に基づいて、前記物体の特徴領域として物体の部位領域及び前記部位領域以外の領域である模様領域を検出する検出工程と、
作成手段が、前記検出工程により検出された特徴領域に対する特徴量のヒストグラムを作成する作成工程と、
設定手段が、前記作成工程により作成されたヒストグラムから、部分画像が前記部位領域であるか前記模様領域であるかを識別するための弱仮説を設定する設定工程と、
第2算出手段が、前記設定工程により設定された弱仮説から、物体の部位を識別するための識別情報を算出する第2算出工程と、
識別手段が、前記識別情報に基づいて入力画像内における物体を識別する識別工程と、
を備えることを特徴とする物体識別方法。
【請求項6】
請求項5に記載の物体識別方法をコンピュータに実行させるためのプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate