情報処理装置、およびその処理方法

【課題】画像データ中のサンプリングデータを用いて、高速に特定のパターンの識別を行い、種々の変動に対しても高速に識別を行う情報処理装置およびその方法を提供する。
【解決手段】画像処理装置は、画像における少なくとも１つの特定パターンに関して判定のための情報を登録し、画像データを入力し、入力した画像データから所定の特徴の分布を抽出し、特徴の分布を示す第１特徴分布マップを生成し、第１特徴分布マップの局在性を緩和させる変換を第１特徴分布マップに適用して第２特徴分布マップを生成し、第２特徴分布マップ上のサンプリングデータと登録された情報とを用いて、画像データが前記特定パターンのうちいずれのパターンかを判定する。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、高速に情報のパターン識別を行う情報処理装置およびその処理方法に関する。
【背景技術】
【０００２】
高速にパターンを識別する方法について、これまで様々な手法が提案されてきている。例えば、対象物の判別方法に関して特許文献１は、入力された濃淡画像に対し、２つの位置における画素輝度値の差からなる特徴量に基づき、濃淡画像が対象物であるかどうかを判別する方法を提案している。この方法では、入力された濃淡画像データの内、２つの位置における画素輝度値という、データ中のサンプリングデータを用いて高速な弱判別器を利用することで、高速にパターン識別を行うことを可能にしている。しかし、この方法では、特徴量として用いる２つの位置における画素輝度値の差は、輝度値のバイアス的な変動に対しロバストではあるが、例えば、シェーディングに起因するコントラスト等の変動に対してロバストではない。
【０００３】
このようなコントラストの変動に対してロバストにパターン識別に関し、例えば、特許文献２は、入力された濃淡画像データに対してエッジ抽出を行うことにより生成されたエッジ画像を用いて、パターン識別を行う方法を提案している。この方法では、予めエッジ等の特徴を抽出しておき、そのデータに対してパターン識別処理を行うことで、種々の変動にロバストなパターン識別を行うことができる。しかし、エッジのような特徴量は、一般的に疎な分布である傾向がある。したがって、サンプリングされたデータの様々な組み合わせ情報に、有意な差が無くなるので、その結果、充分なパターン識別性能が得られなくなるという課題がある。
【０００４】
以上のように、画像データにおけるシェーディングに起因するコントラストの変動等に対してロバストで、高速に処理可能なパターン識別方法が望まれている。
【先行技術文献】
【特許文献】
【０００５】
【特許文献１】特開２００９−２６３２６号公報
【特許文献２】特開２００９−４３１８４号公報
【特許文献３】特開２００５−０３６７６号公報
【発明の概要】
【発明が解決しようとする課題】
【０００６】
本発明は、このような課題に鑑み、画像データ中のサンプリングデータを用いて、高速に特定のパターンの識別を行い、種々の変動に対しても高速に識別を行う情報処理装置およびその方法を提供する。
【課題を解決するための手段】
【０００７】
本発明の画像処理装置は、画像における少なくとも１つの特定パターンに関して判定のための情報を登録する登録手段と、画像データを入力する入力手段と、前記入力した画像データから所定の特徴の分布を抽出し、該特徴の分布を示す第１特徴分布マップを生成する第１生成手段と、前記第１特徴分布マップの局在性を緩和させる変換を該第１特徴分布マップに適用して第２特徴分布マップを生成する第２生成手段と、前記第２特徴分布マップ上のサンプリングデータと前記登録された情報とを用いて、前記画像データが前記特定パターンのうちいずれのパターンかを判定する判定手段と、を備えることを特徴とする。
【発明の効果】
【０００８】
本発明によれば、データ中のサンプリングデータを用いて、高速にパターン識別を行い、種々の変動に対して高速にパターン識別を行うことが可能となる。
【図面の簡単な説明】
【０００９】
【図１】実施形態１におけるパターン識別方法の処理に関する構成図。
【図２】実施形態１におけるパターン識別方法の処理を示すフローチャート。
【図３】実施形態１における入力画像および処理結果の例を示す図。
【図４】実施形態１におけるエッジ抽出画像とエッジ分布拡散画像を模式的に示す図。
【図５】実施形態２におけるパターン識別方法の処理に関する構成図。
【図６】実施形態２におけるパターン識別方法の処理を示すフローチャート。
【図７】実施形態２における入力画像および処理結果の例を示す図。
【図８】実施形態２、３における決定木の構造の模式図。
【図９】実施形態３におけるパターン識別方法の処理に関する構成図。
【図１０】実施形態３におけるパターン識別方法の処理を示すフローチャート。
【図１１】第３の実施形態における入力画像および処理結果の例を示す図。
【図１２】実施形態２における距離マップの具体例を示す図。
【図１３】実施形態２におけるエッジ抽出画像と距離マップを模式的に示す図。
【図１４】実施形態３における特徴分布マップ生成の処理を示すフローチャート。
【図１５】実施形態３における特徴分布拡散マップ生成の処理を示すフローチャート。
【発明を実施するための形態】
【００１０】
＜実施形態１＞
実施形態１では、入力データとして２０×２０画素の２次元グレースケール画像データを用い、その画像データが、ある特定のカテゴリの画像であるかどうかを識別するパターン識別方法について説明する。特定のカテゴリとしては、例えば人間の顔のカテゴリや、ある欠陥を有するパーツのカテゴリなどが挙げられる。本実施形態では、人間の顔の中心付近が入力画像のほぼ中央に存在する特定パターン（以下「顔パターン」）を、特定のカテゴリとした場合について説明する。
【００１１】
図１は、実施形態１における、特定パターンの識別を行う情報処理装置の機能の構成を示す。また、図２は、実施形態１における、特定パターンの識別方法の処理フローを示す。図１の各構機能は、ハードウェアによる実現以外に、例えばコンピュータがメモリに格納されたプログラムを実行することで実現しても良い。以下、図１と図２を用いて、パターン識別を行う情報処理装置の例について説明する。
【００１２】
図１において、登録パターン情報入力部１００は、特定のカテゴリ、即ち、顔パターンに関する情報を入力する。登録パターン情報データベース１０１はその顔パターンに関する情報を記録して保持する。本実施形態では、弱判別器が特徴量として２つの位置における画素輝度値の差分値が所定の閾値以上であるか否かの判別を行い、その判別結果を統合して最終的なパターン識別を行う。そこで、登録パターン情報入力部１００は、弱判別器の情報として、以下の３つの情報を１セットとし、この複数セットの情報を入力して、登録パターン情報データベース１０１に記録して保持する。
（１）差分を求めるべき２点の位置情報
（２）そのときの差分に対する閾値
（３）弱判別器の判別に関するスコア
また、登録パターン情報入力部１００は、特定のカテゴリのパターンであるか否かを最終的に判定するための累積スコア閾値も入力し、登録パターン情報データベース１０１に記録して保持しておく。ここでの処理は、図２のＳ２００にける登録パターン情報入力に対応する。
【００１３】
弱判別器の複数の情報には、多数の顔パターンと、顔パターンではないパターン（以下、「非顔パターン」）を用いたアンサンブル学習により予め学習した情報が用いられる。ただし、アンサンブル学習では、２次元グレースケール画像データそのままを用いるのではなく、２次元グレースケール画像に対して、後述する、エッジ抽出処理と、平滑化処理を適用したデータを用いる。本実施形態では、アンサンブル学習の手法として、ＡｄａＢｏｏｓｔの手法を用いる。しかし、本発明はこれに限るものではなく、例えば、ＲｅａｌＡｄａＢｏｏｓｔ等の他の手法を用いても構わない。
【００１４】
特定のカテゴリのパターンであるか否かを最終的に判定するための累積スコア閾値には、ＡｄａＢｏｏｓｔの場合、一般に累積スコア閾値として０が用いられる。しかし、例えば誤検出、つまり顔パターンでないパターンを誤って顔パターンと検出することを抑制したい場合は、累積スコアを高めに設定してもよい。このように累積スコアは、求める性能に応じて適切に設定すればよい。
【００１５】
画像入力部１０は、特定のカテゴリ、つまり顔パターンであるか否かを識別する対象となる２０×２０画素のグレースケール画像（以下、「入力画像」）を入力する。具体的には、図３の顔パターン３０に示すようなグレースケール画像の顔パターンを入力する。ここでの処理は、図２のＳ２０における画像入力のステップに対応する。
【００１６】
エッジ抽出処理部１１は、画像入力部１０で入力された入力画像に対し、エッジ抽出処理を行ったエッジ抽出画像の生成（第１生成）を行う。このエッジ抽出処理の例として、Laplacian of Gaussian（ＬｏＧ）フィルタを用いる。具体的には、入力画像に対し、ガウシアンフィルタを用いたノイズ除去を行い、ノイズ除去を行った画像に対し、ラプラシアンフィルタを適用する。ガウシアンフィルタとラプラシアンフィルタを合成したフィルタを適用しても構わない。ＬｏＧフィルタを用いた一般的なエッジ抽出では、ＬｏＧフィルタ適用後のゼロ交差点をエッジとして抽出する。しかし、本実施形態では、単純に、ＬｏＧフィルタの出力値が、所定の閾値以上のものをエッジとして抽出する。
【００１７】
具体的には、ＬｏＧフィルタを適用した後の画像に対し、その画像の各画素において、その画素値と、予め定めた所定の閾値とを比較し、その画素値が閾値より小さい場合、その位置の画素値を０に変更する処理を行う。尚、本実施形態では、ここで用いる所定の閾値を０としている。
【００１８】
このエッジ抽出処理を、図３の３０に示した画像に対して適用した例を、図３の顔パターン３１（第１特徴分布マップ）に示す。一般の画像に対して、ＬｏＧフィルタを適用した場合、その出力値の凡そ半数以上は０以下の値となる傾向がある。そのため、ここでの処理により、図３の顔パターン３１に示すように、エッジ位置以外の、画像上（第１特徴分布マップ上）の多数の位置において、画素の値が０となるようなエッジ抽出画像が得られる。ここでの処理は、図２におけるＳ２１のエッジ抽出処理のステップに対応する。本実施形態では、このように、ＬｏＧフィルタを用いたエッジ抽出を行うが、これに限るものではなく、例えば、Ｓｏｂｅｌフィルタ等を用いたエッジ抽出を行っても構わない。
【００１９】
次に、平滑化処理部１２は、エッジ抽出処理部１１において生成したエッジ抽出画像に対し、ガウシアンフィルタによる平滑化処理を行い、エッジ分布拡散画像、すなわちエッジ特徴の局在性の程度を緩和したエッジ画像（第２特徴分布マップ）を生成（第２生成）する。このガウシアンフィルタによる平滑化処理では、前述のＬｏＧフィルタにおける、ノイズ除去のための一般的なガウシアンフィルタに比べて、平滑化幅の大きいガウシアンフィルタが適用される。通常、２０×２０画素程度の画像のノイズ除去を目的とした場合、フィルタサイズが３×３画素程度で、σ＝０．５程度のガウシアンフィルタを適用するのが一般的である。これに対し、本実施形態では、フィルタサイズが７×７画素で、σ＝１．５という、前述のガウシアンフィルタの、凡そ３倍の幅を持つガウシアンフィルタを用いた平滑化処理を行う。ここでの処理は、図２におけるＳ２２の平滑化処理のステップに対応する。
【００２０】
図３の顔パターン３２（第２特徴分布マップ）が、顔パターン３１に示したエッジ抽出画像に対し、平滑化処理を適用した画像である。この例に示すように、この平滑化処理では、ノイズ除去等を主たる目的とした平滑化処理に比べて、幅の大きい平滑化処理を行う。すなわち、ここでの平滑化処理の目的は、ノイズ除去にもあるが、主たる目的は、先に抽出したエッジ、つまり特徴情報を、空間的に拡散させ、特徴の局在性を緩和させることにある。
【００２１】
局在性とは、特徴信号、すなわち、特徴の存在の有無を数値的に表現した信号が、特徴の存在する局所的な範囲にのみ存在する性質である。先に抽出したエッジのような特徴は、このような局在性を有しているが、上記の平滑化処理により、特徴信号が存在しない位置であっても、その近傍に存在する特徴の影響を受けた信号値を持つようになる。従って、この特徴情報の局在性が緩和されることになる。そのため、ここでの平滑化の幅の幅は、ノイズを除去する程度の幅ではなく、例えば、登録パターンの標準的な特徴の分布、すなわち、顔パターンの標準的なエッジの分布の特性に基づいた幅を設定するようにする。
【００２２】
具体的には、例えば、標準的な特徴の分布が、図３における顔パターン３１の例のように疎であるような場合、元の特徴抽出結果上において、周辺に特徴が存在しないような位置まで、平滑化の幅を大きく設定する。例えば、顔パターン３２の例のように、画像上（第２特徴分布マップ上）で顔の頬付近の領域まで特徴情報の裾が拡散する程度に、平滑化の幅を大きく設定する。
【００２３】
ただし、あまりに幅の大きい平滑化を適用した場合、空間的に充分離れて存在していた特徴までもが、平滑化処理により混同され、結果として最終的な識別精度が劣化してしまう可能性がある。そのため、特に、標準的な特徴の分布の密度に応じて、空間的に充分離れて存在している特徴が、１つの特徴として合成されてしまわない程度に、平滑化の幅を小さく設定する。このような平滑化の幅は、登録パターンの標準的な特徴の分布や、求めるパターン識別精度に応じて、予め実験的に設定してやればよい。
【００２４】
具体的には、例えば、本実施形態のように、２点の差分値を弱判別器の情報として用いる場合には、この２点の距離の最小値より大きく、最大値より小さい範囲で、平滑化の幅（拡散させた特徴情報の裾が到達する範囲）を探索するようにすればよい。尚、本実施形態では、特徴の局在性の程度を緩和させる変換に用いるパラメータ（平滑化の幅）を、予め、固定のパラメータとして設定しておくようにする。しかし、特徴の局在性の程度を緩和させる変換に用いるパラメータを、パターン識別の処理対象のデータに依存させ、動的に設定するようにしても構わない。例えば、パターン識別の処理対象である入力画像から抽出されたエッジ強度の平均ピーク間の距離に応じて、動的にパラメータを設定するようにしてもよい。このような、パラメータを動的に設定する方法は、実施形態３において説明する。
【００２５】
このように、本発明のパターン識別方法では、上述の平滑化処理のように、抽出した特徴情報を用いて、空間的に拡散させたエッジ分布拡散画像を生成し、そのエッジ分布拡散画像を用いてパターン識別を行う。尚、本実施形態においては、ガウシアンフィルタを用いた平滑化処理を行うが、本発明はこれに限るものではなく、抽出した特徴情報を、空間的に拡散させ、特徴の局在性を緩和させるような方法であれば、どのような方法を用いても構わない。ただし、空間フィルタを用いた平滑化処理に関しては、中心に比べて周辺の重みが小さくなるようなフィルタを用いて平滑化処理を行うのがよい。また、本実施形態では、等方的な平滑化フィルタを用いているが、これに限るものではない。例えば、標準的な特徴分布が、縦方向は疎で、横方向が密であるような場合、縦長のガウシアンフィルタを用いる等、標準的な特徴分布に基づいた形状の平滑化フィルタを用いてもよい。
【００２６】
上述した、エッジ抽出処理部１１と平滑化処理部１２での処理は、アンサンブル学習において用いる多数の顔パターンと非顔パターンそれぞれに対しても適用され、これらの処理が適用されデータを用いて学習が行われる。この際、学習に用いる多数のパターンに適用されたこれらの処理における平滑化幅等のパラメータと実際にパターン識別を行う段階で適用する処理のパラメータとは、一致していることが望ましい。
【００２７】
図１の平滑化処理部１２でのエッジ分布拡散画像の生成処理が終了すると、このエッジ分布拡散画像を用いたパターン識別の処理を行う。図１の２点比較部１３では、登録パターン情報データベース１０１に保持されている弱判別器の情報に基づき、エッジ分布拡散画像中の２点の画素における輝度値の差分値と閾値との比較が行われる。そして、２点の画素における輝度の差分値が閾値以上の場合には、その弱判別器に対応するスコアを、スコア加減算部１４に送る。そして、スコア加減算部１４では、そのスコアを累積スコアに加算する。逆に、２点の差分値が閾値以下の場合には、対応するスコアの符号を反転させたものを、スコア加減算部１４に送り、スコア加減算部１４では、そのスコアを、累積スコアに加算する。この処理は、符号が反転しているので、元のスコアを減算することに相当する。
【００２８】
図２を用いて、２点比較部１３とスコア加減算部１４での処理フローを説明する。まずＳ２３０において、２点比較部１３は、仮説数を０に初期化し、累積スコアも０に初期化する。次に、２点比較部１３は、Ｓ２３１において、２点比較部１３は、登録パターン情報データベース１０１に保持されている複数の弱判別器の情報から、弱判別器の複数の情報を順番に選択する（順序は任意で構わないが、重複選択はしない）。そして、２点比較部１３は、選択した弱判別器の情報に基づいて、エッジ分布拡散画像の中で、予め設定されたサンプリング点の内、所定の２点の位置における画素の輝度の差分値と閾値との比較を行う。
【００２９】
続いて、Ｓ２４において、スコア加減算部１４は、Ｓ２３１での比較の結果に基づいて、差分値が閾値以上の場合に、累積スコアに対応するスコアを加算し、閾値以下の場合に、対応するスコア分を累積スコアから減算する。更に、Ｓ２３２において、スコア加減算部１４は、仮説数を１だけ増加させる。
【００３０】
そして、スコア加減算部１４は、Ｓ２３３において、仮説数が、登録パターン情報データベース１０１に保持されている弱判別器の総数（Ｎ）まで達しているか否かの判定を行う。仮説数が総数Ｎまで達している場合には、次のＳ２５に進む。仮説数が総数Ｎに達していない場合には、Ｓ２３１に戻り、新たに弱判別器の情報を、登録パターン情報データベース１０１から選択し、上述の処理を繰り返す。
【００３１】
つまり、Ｓ２３１、Ｓ２４、およびＳ２３２までの処理を、登録パターン情報データベース１０１に保持されている弱判別器の総数回だけ繰り返す。そして、次のパターン判定ステップＳ２５に進むことになる。以上が、２点比較部１３とスコア加減算部１４での処理のフローである。
【００３２】
最後に、パターン判定部１５では、スコア加減算部１４において加減算された累積スコアが、登録パターン情報データベース１０１に保持されている累積スコア閾値以上であるか否かを判定する。そして、パターン判定部１５は、累積スコアが累積スコア閾値以上の場合には、画像入力部１０において入力された画像が、特定カテゴリのパターン、即ち、本実施形態では、顔パターンであると判定する。また、閾値以下の場合には、非顔パターンであると判定する。ここでの処理は、図２のＳ２５のパターン判定のステップに対応する。ここでの処理が終了することにより、本実施形態のパターン識別方法の処理が終了となる。
【００３３】
このように、本実施形態のパターン識別方法では、まず、入力されたデータ上に存在する特徴を抽出し、その特徴情報の局在性を緩和させたデータを生成する。そして、このデータに対し、データ中のサンプリングデータを用いて識別を行う識別器によりパターンの識別処理を行う。この識別器は、同様の特徴抽出および特徴情報の拡散処理を行った多数のデータで学習したデータを備え、この識別器でサンプリングデータの識別処理を行うことで、種々のデータ変動に対してロバストで、高速なパターン識別が可能となる。ここで、本実施形態のパターン識別方法において、最も特徴的である、特徴情報を拡散させ、特徴の局在性を緩和させることにより得られる３つの効果について説明する。第１の効果は、一般的な平滑化処理の効果と同様な、ノイズ除去（実際は抑制）の効果である。このようなノイズ除去により、一般的に、パターン識別における識別性能が高まる。この効果は、平滑化処理を適用することによる一般的な効果といえる。第２の効果は、特徴統合層におけるプーリング処理による効果と同様な、抽出した特徴の位置等の変動に対するロバスト性向上である。このような、抽出した特徴の位置等の変動に対するロバスト性の向上により、パターン識別における汎化性能の向上が期待できる。この効果も、平滑化処理を適用することによる一般的な効果といえる。
【００３４】
最後の第３の効果は、本実施形態のパターン識別方法において特徴的な効果であり、この効果について、図４を用いて説明する。図４の横軸は、位置を示し、縦軸は、特徴の分布の度合いを示す。前述のように、本実施形態で特徴として抽出するエッジは、種々の変動に対するロバスト性向上のために有効であるが、このような特徴は、一般的に疎な分布、つまり、局在性が高い傾向がある。図４（ａ）に、この傾向を模式的に表したものを示す。本実施形態では、２次元のデータに対する処理の例を示したが、説明を簡略にするため、この図では、１次元のデータを例として示している。前述のように、エッジのように疎の分布傾向のある特徴信号は、図４（ａ）に示すように、位置４１０に局在し、その他の位置、つまり、特徴信号が存在しない位置においては、特徴信号が現れていない。
【００３５】
この場合、高速なパターン識別を実行することを目的とした、サンプリングデータを用いたパターン識別方法、つまり２点の画素における輝度の差分値を用いるような方法の場合、次のような現象が発生する。例えば、図４（ａ）の位置４１１に示したような２点の差分値は、位置４１１の、右側の点の位置に、特徴信号が存在する可能性が高いという有意な情報となり得る。
【００３６】
しかし、図４（ａ）の位置４１２や位置４１３に示したような２点の差分値は、各点の位置に、特徴信号が存在しない可能性があるという情報にはなり得るが、位置４１２と位置４１３の、それぞれにおける２点の差分値は、この２つの違いを区別可能な情報を有していない。しかも、疎な分布である特徴、つまり、特徴信号が限られた位置に局在するような状況の場合、大多数の２点の組み合わせが、位置４１２や位置４１３の差分値のように、情報の差が無くなってしまう。このため、識別において有用な情報が得られる２点の組み合わせの総数が相対的に少なくなってしまい、その結果、充分なパターン識別性能を得られなくなってしまう可能性がある。
【００３７】
これに対し、図４（ｂ）に示したように、平滑化処理により、位置４２０のように特徴信号を拡散させ、特徴の局在性を緩和させた場合、位置４１２と位置４１３に対応する位置である、位置４２２と位置４２３の、それぞれにおける２点の差分値に違いが生じることになる。この例が示すように、特徴の局在性を緩和させた場合、特徴の局在性を緩和させなかった場合と比べて、多数の２点の組み合わせが、様々なバリエーションの情報を持つようになる。このため、識別において有用な可能性がある情報が得られる２点の組み合わせの総数が相対的に多くなり、その結果、パターン識別の性能を向上させられる可能性が高くなる。
【００３８】
具体的には、位置４２３の２点の差分値は、特徴信号を拡散させなかった場合と同様に０となるが、特徴信号の拡散により、位置４１２の２点の差分値が０であったのに対し、対応する位置４２２の２点の差分値は、ピーク４２０の画素の位置からの距離に応じた非零の値となる。このように、位置４２３のような差分値０となるその他の２点の組み合わせが減り、その結果として、位置４２３の２点の差分値が０であるという情報は、ユニークな情報になるため、情報量が増えることになる。
【００３９】
定性的には、位置４２３の２点の近傍には、特徴が存在しない可能性が高いという情報になり得る。また、例えば、位置４２２の２点の差分値は、２点の内、右側の点の位置に特徴が存在するか、あるいは右側の点の方向に特徴が存在するという情報になり得る。このように、位置４２２の２点の差分値は、位置４１２の２点の差分値と比較すると、右側の方に特徴が存在する可能性があるという情報が増加しているといえる。
【００４０】
本実施形態では、図２のＳ２３１の２点比較のステップでの複数の結果に従って、スコア加減算ステップＳ２４において加減算を行ったスコアに基づき、Ｓ２５のパターン判定のステップによりパターンの判定を行った。ここで用いたＡｄａＢｏｏｓｔのような、複数の情報を統合してパターン識別を行う場合には、それぞれの情報が持つ情報量が増えることにより、高い性能を実現できる傾向がある。そのため、位置４２２や位置４２３の２点の差分値が持つ情報量が増えることにより、より高いパターン識別性能を実現できる可能性が高くなる。
【００４１】
このように、特徴情報を拡散させ、特徴の局在性を緩和させることで、サンプリングデータの組み合わせ情報に、様々なバリエーションの情報を持たせることが可能になり、それにより、パターン識別性能の向上が期待できる。この効果が、本発明のパターン識別方法における、特徴情報を拡散させ、特徴の局在性を緩和させる処理による特徴的なものである。
【００４２】
尚、本実施形態では、サンプリングデータを用いるパターン識別方法として、２点の差分値を用いる手法について説明したが、本発明はこれに限るものではない。例えば、ある１点と、所定の閾値との比較や、逆にサンプリング数を増やし、ある２点の和と、その他の２点の和との差分値を用いるといった手法であっても構わない。このように、パターン識別において用いるサンプリングデータの数は任意の数で構わない。また、本実施形態では、入力されたパターンが、特定のカテゴリであるかどうかを識別する方法の例を示した。しかし、入力された画像に対し、上述の処理をラスタスキャン的に行うことにより、入力画像中から特定のカテゴリのパターンを検出することも可能である。
【００４３】
＜実施形態２＞
実施形態２では、実施形態１で示したパターン識別方法の別形態として、特定物体を撮影した画像を入力し、その特定物体がどのような方向から撮影されたものであるのかを識別するパターン識別方法の例を示す。
【００４４】
図５に、実施形態２におけるパターン識別方法の処理の構成図を示す。また図６には、実施形態２におけるパターン識別方法の処理フローを示す。図５における登録パターン情報入力部５００は、特定物体を様々な方向から撮影したパターンに関する情報を入力する。登録パターン情報データベース５０１は、その撮影したパターンに関する情報を記録して保持する。本実施形態では、実施形態１とは異なり、２点の値の比較により分岐する決定木を複数用い、その結果を統合して最終的なパターン識別を行う。そこで、この登録パターン情報入力部５００では、複数の決定木の情報を入力する処理を行う。本実施形態においては、決定木として二分木を用い、１つの決定木の情報は、複数の分岐ノード情報と複数のリーフ情報とからなる。
【００４５】
図８は、本実施形態で用いる決定木の構造の模式図を示す。図８を用いて、本実施形態の決定木が持つ、複数の分岐ノード情報と複数のリーフ情報について説明する。図８中、分岐ノード８００、８０１、８０２、および８０ｎは、丸で示され、それぞれが１つの分岐ノード情報を持つ。また、リーフ８１０および８１ｍは、四角で示され、それぞれが１つのリーフ情報を持つ。
【００４６】
分岐ノード情報は、２点の輝度値を比較する際の、第１の点の位置と、第２の点の位置、および分岐先がいずれであるかの情報を備える。実際の処理では、分岐ノード情報に基づき、第１の点と第２の点の位置における画素の輝度値の大小関係を求め、その結果に従って、どちらの分岐先に進むかが決定される。
【００４７】
本実施形態では、第１の点の位置における輝度値の方が、第２の点の位置における輝度値より大きい場合に、図中で、左側の分岐先に進み、そうでなければ右側の分岐先に進むようにする。分岐先がいずれであるかの情報は、例えば、分岐ノード８００であれば、左側の分岐先が、分岐ノード８０１、右側の分岐先が８０２であるという情報である。
【００４８】
よって、実際の処理では、分岐ノード８００の情報に基づき２点の値を比較し、第１の点の位置における値の方が大きければ、分岐ノード８０１の方に進み、そうでなければ、分岐ノード８０２の方向に進むことになる。以下では、このようなプロセスを、決定木の探索と呼ぶ。ちなみに、分岐ノード８００は、ルートノードと呼ばれ、決定木の探索は、必ずこのルートノードから始めることになる。
【００４９】
リーフ情報は、この決定木における結果、つまり、本実施形態においては、特定物体がどのような方向から撮影されたものであるのか、という識別結果の情報である。本実施形態では、本来は連続的な情報である、どのような方向から撮影されたものであるのかという情報を量子化して、１６２個の、１から１６２までのインデックスで表現する。この１６２個のインデックスは、１６２個の頂点を持つ、いわゆる測地ドームの各頂点位置に対応する。これは、この測地ドームの中心位置に特定物体があるとしたとき、特定物体を撮影した画像がどの頂点位置に近い位置で撮影されたものであるのかを意味する。このため、リーフ情報は、単純に、１から１６２の中の、１つの数値の情報となる。本実施形態では、１つのリーフが１つの結果のみを持つようにしている。本実施形態では、決定木の末端は、必ずリーフとしているが、実際の処理では、いずれかのリーフに到達するまで決定木を探索していき、そのリーフ情報である、インデックスの値を、その決定木の結果とする。
【００５０】
このような決定木の情報は、特定物体を様々な方向から予め撮影した多数の画像データを用いた学習により生成しておく。本実施形態では、様々な種類の決定木の情報を統合する認識手法を用いるため、複数の異なる決定木を生成する必要がある。そこで、本実施形態では、バギングの手法を用いて、複数の異なる決定木を生成する。即ち、学習に用いる多数の画像データから、無作為にサンプリングした画像データのサブセットを複数生成し、それらを用いて決定木の生成を行う。決定木の生成に用いるデータは、実施形態１と同様に、後述するエッジ抽出処理と距離マップ生成処理を適用した後のデータとを用いる。
【００５１】
尚、本実施形態では、バギングの手法を用いて複数の異なる決定木を生成するが、本発明はこれに限るものではなく、多様な複数の決定木を生成できるような方法であれば、その他の方法であっても構わない。例えば、実施形態１と同様に、ＡｄａＢｏｏｓｔの手法を用いて生成する方法や、特許文献３に開示の手法のように、各分岐ノードにおいて、無作為にデータを選択することにより、多様な決定木を生成するような方法でも構わない。
【００５２】
登録パターン情報入力部５００は、以上のような決定木の情報を、決定木の個数（＝Ｎ）分だけ入力し、それらを登録パターン情報データベース５０１に記録して保持する処理を行う。ここでの処理は、図６のＳ６００における登録パターン情報入力のステップに対応する。
【００５３】
画像入力部５０は、どのような方向から撮影された画像であるのかを判定する対象となる、特定物体を撮影した画像（以下、「入力画像」）を入力する。図７は、入力画像および処理結果の例を示す図である。この実施形態では、図７の画像７０に示すようなグレースケール画像が入力される。ここでの処理は、図６の画像入力ステップＳ６０に対応する。
【００５４】
図５のエッジ抽出処理部５１は、実施形態１におけるエッジ抽出処理部１１と同様に、入力画像からエッジ抽出画像を生成する処理部である。本実施形態では、エッジ抽出処理として、Ｃａｎｎｙエッジ検出処理を行う。ここでの処理は、図６のＳ６１におけるエッジ抽出処理のステップに対応する。このＣａｎｎｙエッジ抽出処理を図７の画像７０に対して適用した例が、画像７１である。この画像７１に示すように、Ｃａｎｎｙエッジ検出処理では、エッジ抽出画像として、強いエッジが存在している位置と連結されたエッジが存在する位置が１で、それ以外の位置は０という二値の画像が得られる。このように、本実施形態におけるエッジ抽出処理も、実施形態１でのエッジ抽出処理と同様に、抽出される特徴の局在性が高く、エッジの特徴抽出結果が疎な分布となっている。
【００５５】
次に、距離マップ生成処理部５２は、エッジ抽出部５１において生成したエッジ抽出画像に基づき、距離マップを生成する。ここでの処理は、実施形態１における平滑化処理部１２での、ガウシアンフィルタを用いた平滑化処理と同様に、抽出した特徴の局在性を緩和させたデータを生成するための処理である。この処理は、図６のＳ６２における距離マップ生成処理のステップに対応する。距離マップとは、最近傍の特徴までの距離を各位置の値としたマップで、具体的には、画像上の各位置において、最も近い位置に存在するエッジの特徴を探索し、探索された最近傍の特徴までの距離を、その位置における値とするマップである。
【００５６】
図１２は、距離マップの具体例を示す。例えば、図１２に示した１２０の位置であれば、１２１の位置にあるエッジが最も近い特徴であり、位置１２０から位置１２１までの距離がｄ１であったとすると、位置１２０に対応する位置の距離マップの値はｄ１となる。尚、このような通常の距離マップでも構わない。しかし本実施形態では、距離マップの値に予め上限値を設定しておき、最近傍の特徴までの距離が、この上限値以上である場合に、その位置における値をこの上限値とするマップを生成する。
【００５７】
例えば、図１２に示した位置１２２の場合、位置１２３にあるエッジが最も近い特徴であり、位置１２２から位置１２３までの距離がｄ２であって、このｄ２が予め定めた上限値ＤＴより大きい場合、位置１２２に対応する位置の距離マップの値を一定の値ＤＴとする。このような上限値を用いた処理により、設定した上限値以上の距離に、特徴が存在するような位置の値は、一定の値に抑えることができる。
【００５８】
図１３に、エッジ抽出画像と、それに対応する距離マップを模式的に示す。説明を簡略にするため、この図では１次元のデータを例として示している。図１３（ａ）のように、エッジ抽出画像において特性１３１０は棒状となり、エッジが抽出されている。図１３（ｂ）に示すように、ここで生成される距離マップは、図１３（ａ）のエッジが抽出された特性１３１０の位置に対応する、特性１３２０の位置の値がゼロになっていることを示している。そして、そのゼロの位置から離れるに従って、特性１３２０は距離に比例して値が大きくなり、距離がＤ_Ｔになった位置から一定値Ｄ_Ｔとなる。これにより、図１３に示したように、位置１３１２と位置１３１３にそれぞれ対応する位置１３２２と位置１３２３の、それぞれの２点の組み合わせが持つ情報、本実施形態では、２点の位置における画素の輝度値の大小関係に違いが生じることになる。
【００５９】
定性的な情報の違いとしては、位置１３２２の２点の組み合わせでは、２点の内、右側の点の方向に特徴が存在する可能性が高いという情報になる。また、位置１３２３の２点の組み合わせでは、位置１３２３の２点の近傍には特徴が存在しない可能性が高いという情報になるという違いが生じる。
【００６０】
本実施形態で用いる２点の輝度値の大小関係という情報で、このような上限値を設定しない場合、位置１３１０に対応する位置以外の位置に存在する特徴の影響が無い限り、位置１３２２と位置１３２３の、それぞれにおける２点の組み合わせが持つ情報に違いが生じない。しかし実際には、様々な位置に存在する特徴の影響を受けるので、上限値を設定しなくても、情報に違いが発生することはある。つまり、上限値を設定しない場合には、位置１３２３の２点の組み合わせから、位置１３２３の２点の近傍には特徴が存在しない可能性が高いという情報は得られない。
【００６１】
このように、上限値を予め設定した処理により、近傍には特徴が存在しない可能性が高いといった情報が得られることになる。この上限値は、実施形態１と同様に、例えば、登録パターンの標準的な特徴の分布の特性に基づいて設定すればよい。具体的には、例えば、設定は、充分に離れた位置にあると見なせる２点の特徴の間の距離の１／２に上限値を設定すればよい。あるいは、決定木において比較する２点の距離に基づいて、この上限値を設定してもよい。この場合、決定木において比較する２点の距離の、最小値と最大値の中間値に設定すればよい。
【００６２】
尚、実施形態１と同様に、特徴の局在性の程度を緩和させる変換に用いるパラメータ、すなわち距離マップの上限値を、固定のパラメータとして予め設定したが、パターン識別の処理対象のデータに依存させ、このパラメータを動的に設定してもよい。例えば、パターン識別の処理対象である入力画像から、エッジとして抽出された点の総数に応じて、動的にパラメータを設定できる。
【００６３】
また、この上限値は、必ずしも全ての位置において同一の値を用いなくてもよく、例えば、エッジ抽出部５１において生成したエッジ抽出画像の、各位置における局所的な分布特性に従ってこの上限値を設定しても構わない。具体的には、ある位置の近傍、例えば、半径ｒ画素の領域内のエッジ抽出画像の密度を求め、密度が高い場合に、その位置の上限値を小さめに設定し、密度が低い場合は、上限値を大きめに設定できる。このように、この上限値は、各位置に対して個別の値を設定することも可能である。
【００６４】
図７の画像７２に、画像７１に示したエッジ抽出画像に基づいて生成した距離マップの例を示す。この例に示すように、ここで生成する距離マップでは、エッジ抽出画像においてエッジが抽出されている位置、例えば、画像７１において白（値が１）となっている位置では、黒（値が０）でエッジ位置から離れるに従って値が高くなる。そして、最も近いエッジからの距離が上限値以上の位置では一定の値（上限値）となる。
【００６５】
このように、この処理により生成される距離マップは、実施形態１におけるエッジ分布拡散画像と同様に、特徴の存在しない位置であっても、様々なバリエーションの値を持ち、元のエッジ抽出画像と比べ特徴の局在性が緩和されたデータとなる。このため、実施形態１の説明において述べたと同様の特徴的な効果が得られることになる。尚、本実施形態においては、距離マップを生成する際の距離尺度として、通常のユークリッド距離を用いるが、本発明はこれに限るものではなく、例えば、マンハッタン距離等の距離尺度を用いてもよい。また、本実施形態では、最近傍に存在する特徴までの距離に基づいて、距離マップを生成したが、例えば、近傍に存在する複数の特徴までの距離の平均値に基づいて、距離マップを生成してもよい。
【００６６】
また、実施形態１と同様に、エッジ抽出処理部５１と距離マップ生成処理部５２での処理は、決定木の生成において用いる多数の画像それぞれに対しても適用され、適用後のデータを用いて決定木の生成を行う。この場合、実施形態１と同様に、決定木の生成に用いる多数の画像に適用したこれらの処理のパラメータ、例えば、上限値の設定等は、実際にパターン識別を行う段階で適用する処理のパラメータと一致していることが望ましい。
【００６７】
図５の距離マップ生成処理部５２で距離マップの生成処理が終了した後、この距離マップを用いたパターン識別の処理を行う。図５の決定木探索処理部５３は、登録パターン情報データベース５０１に保持された複数の決定木を探索し、１つの決定木につき１つの識別結果、すなわち、１から１６２までのいずれかのインデックスを求め、その識別結果をスコア加算部５４に送る。図５のスコア加算部５４では、決定木探索処理部５３から送られた結果に基づき、その結果に対応するインデックスの累積スコアに１を加算する。
【００６８】
決定木探索処理部５３とスコア加算部５４での処理フローを、図６を用いて説明する。まず、Ｓ６３０において、決定木探索処理部５３は、決定木数を０に初期化し、同時に、累積スコアの全ての要素も０に初期化する。ここで、本実施形態における累積スコアは、１６２個の要素を持つテーブルであり、各要素が、識別結果である上述の１から１６２のインデックスに対応している。
【００６９】
次にＳ６３１において、決定木探索処理部５３は、登録パターン情報データベース５０１に保持されている複数の決定木の情報から、１つの決定木の情報を順番に選択する（順序は任意で構わないが、重複選択はしない）。そして、決定木探索処理部５３は、選択した決定木の情報に基づいて、距離マップ上の、２点の画素における輝度値の大小比較を行っていき、１つのリーフに到達するまで決定木を探索し、識別結果である１つのインデックスを求める。
【００７０】
続いて、Ｓ６４において、スコア加算部５４は、Ｓ６３１での結果に基づき、そのインデックスに対応する累積スコアの要素に１を加算する。例えば、識別結果のインデックスがｋであったら、テーブルである累積スコアのｋ番目の要素に１を加算する処理を行う。その後、Ｓ６３２において、決定木数を１だけ増加させる。
【００７１】
そして、Ｓ６３３において、スコア加算部５４は決定木数が、登録パターン情報データベース５０１に保持されている決定木の総数（Ｎ）まで達しているか否かを判定する。決定木数が総数Ｎまで達している場合には、次のＳ６５におけるパターン判定のステップに進む。決定木数が総数Ｎに達していない場合には、Ｓ６３１に戻り、新たに１つの決定木の情報を、登録パターン情報データベース５０１から選択し、上述の処理を繰り返す。以上が、決定木探索処理部５３とスコア加算部５４での処理フローの説明である。
【００７２】
最後に、図５のパターン判定部５５は、スコア加算部５４において加算された累積スコアの各要素の中から、最大のスコアであった要素を抽出し、その要素に対応するインデックスを求める。そして、図５の画像入力部５０において入力された画像、つまり、特定物体を撮影した画像が、求めたインデックスに対応する方向から、対象物体を撮影した画像であると判定する。ここでの処理は、図６のＳ６５におけるパターン判定のステップに対応する。ここでの処理が終了することにより、本実施形態のパターン識別方法の処理が終了となる。
【００７３】
このように、本実施形態のパターン識別方法では、まず、入力されたデータ上に存在する特徴を抽出し、距離マップ生成処理により、抽出した特徴の局在性を緩和させた距離マップを生成する。そして各分岐ノードにおいて、この距離マップ中のサンプリングデータを用いて分岐を行う決定木を複数用い、それらの結果を統合してパターン識別の処理を行った。これにより、入力されたデータの種々の変動に対してロバストで、高速なパターン識別が可能となる。
【００７４】
尚、本実施形態では、サンプリングデータを用いるパターン識別方法として、２点の大小比較結果を用いる手法について説明したが、実施形態１と同様に、本発明はこれに限るものではない。例えば、決定木の分岐ノードにおいて、ある１点の値と所定の閾値との比較結果に基づいて分岐を行うような手法や、複数のデータに基づいて分岐するような方法でも構わない。また、本実施形態でも、パターン識別において用いるサンプリングデータの数は任意の数で構わない。
【００７５】
本実施形態では、特定物体を撮影した画像を入力し、その特定物体がどのような方向から撮影されたものであるのかを識別する方法の例を説明したが、本実施形態の構成は、このような用途に限るものではない。例えば、実施形態１と同様に、入力された画像が、顔パターンであるか否か等、入力されたデータが、ある特定のカテゴリであるかどうかを識別するような手法にも適用可能である。また、実施形態１と同様に、ラスタスキャン的な処理により、入力画像中から特定のカテゴリのパターンを検出するといった手法にも適用可能である。
【００７６】
＜実施形態３＞
実施形態３では、実施形態２と同様に、特定物体を撮影した画像を入力し、その特定物体がどのような方向から撮影されたものであるのかを識別するパターン識別方法の例を示す。
【００７７】
図９に実施形態３におけるパターン識別する装置の機能構成を示す。また図１０は、本実施形態における、パターン識別方法の処理フローを示す。以下、図９と図１０を用いてパターンを識別する装置の例について説明するが、実施形態２と同じ部分については、説明を省略する。
【００７８】
登録パターン情報入力部９００は、実施形態２における登録パターン情報５００と同様である。ここでは、複数の決定木の情報を入力する。また、登録パターン情報データベース９０１も登録パターン情報データベース５０１と同様で、複数の決定木を記録して保持する。登録パターン情報入力部９００は、図１０のＳ１０００における登録パターン情報入力のステップに対応する。
【００７９】
本実施形態で用いる複数の決定木は、基本的に実施形態２と同様であるが、分岐ノードで比較する２点の情報が異なる。本実施形態では、後述する特徴分布マップ生成処理部９１１と平滑化処理部９２での処理により、１枚の入力画像から複数の特徴分布拡散マップが生成される。そのため、本実施形態の分岐ノードで比較する２点の情報は、それぞれの点が、どの特徴分布拡散マップの、どの位置であるかという情報となる。この差異以外は、実施形態２と同様であるので説明を省略する。また、決定木の生成に用いるデータも、実施形態２と同様であるが、予めコーナーエッジ抽出処理、特徴分布マップ生成処理、および平滑化処理を適用した後のデータを用いるのが異なる。
【００８０】
図９の画像入力部９０での処理は、Ｓ１００１における画像入力のステップに対応し、実施形態２における画像入力部５０と同様の処理であるので説明を省略する。コーナー検出処理部９１は、入力画像に対してコーナー検出処理を行い、入力画像上に存在するコーナーの位置を求める。
【００８１】
本実施形態では、コーナー検出処理として、Ｈａｒｒｉｓコーナー検出処理を用いる。ここでの処理は、図１０のＳ１０１０におけるコーナー検出処理のステップに対応する。このＨａｒｒｉｓコーナー検出処理を、図１１の画像１１０に適用した例を、図１１の画像１１１に示す。図１１の画像１１１において、白丸で示した位置が、コーナーとして検出された位置である。尚、本実施形態では、Ｈａｒｒｉｓコーナー検出処理を用いて、コーナーの検出を行うが、本発明はこれに限るものではなく、例えば、Ｍｏｒａｖｅｃコーナー検出処理等の他のコーナー検出処理を用いてもよい。
【００８２】
次に、特徴分布マップ生成処理部９１１は、コーナー検出処理部９１で検出された、それぞれのコーナー位置における輝度勾配方向を求め、その結果に基づいて、複数の特徴分布マップを生成する。ここで、各特徴分布マップは、０度から１８０度の勾配方向を複数の領域に分割した範囲の各々に対応する。本実施形態では、０度から１８０度の勾配方向を、３０度ごと、６個の領域に分割する。したがって、０度から３０度未満、３０度から６０度未満、・・・、１５０度から１８０度未満の、それぞれの範囲１つに付き、１つの特徴分布マップが存在する。
【００８３】
図１４に、ここでの特徴分布マップ生成の処理フローを示す。以下、図９の特徴分布マップ生成処理部９１１における複数の特徴分布マップ生成処理について、図１４を用いて説明する。まず、Ｓ１４０において、特徴分布マップ生成処理部９１１は、複数の特徴分布マップ上の、全ての位置の値を０に初期化する。
【００８４】
次に、Ｓ１４１において、特徴分布マップ生成処理部９１１は、コーナー検出処理部９１で検出された複数のコーナーから、１つのコーナーを順に選択する（順序は任意で構わないが、重複選択はしない）。続いて、Ｓ１４２において、特徴分布マップ生成処理部９１１は、Ｓ１４１で選択したコーナー位置における、入力画像の輝度勾配方向を求める。
【００８５】
輝度勾配方向は、本実施形態では、Ｓｏｂｅｌフィルタを用いて求める。具体的には、コーナー位置における、入力画像に対する横方向Ｓｏｂｅｌフィルタの出力をＧｘ、縦方向Ｓｏｂｅｌフィルタの出力をＧｙとしたとき、勾配方向θが、θ＝ａｔａｎ（Ｇｙ／Ｇｘ）で求められる。ここで、ａｔａｎは、正接関数の逆関数で、値域が０度から１８０度のものとする。
【００８６】
次に、Ｓ１４３において、特徴分布マップ生成処理部９１１は、Ｓ１４２で求めた輝度勾配方向が、０度から１８０度を、６個の領域に分割したときの、どの領域に該当するかに基づき、その領域に対応する特徴分布マップを選択する。そして、Ｓ１４４において、特徴分布マップ生成処理部９１１は、Ｓ１４３で選択した特徴分布マップの、Ｓ１４１で選択したコーナー位置に対応する位置の値を１とする。そして、Ｓ１４５で、特徴分布マップ生成処理部９１１は、Ｓ１４１においてコーナー検出処理部９１で検出された全てのコーナーを選択したか否かの判定を行い、全てのコーナーを選択していた場合には、この特徴分布マップ生成の処理が終了となる。全てのコーナーを選択していない場合、Ｓ１４１のコーナー選択のステップに戻り、新たに１つのコーナーを選択し、上述の処理を繰り返す。
【００８７】
つまり、Ｓ１４１からＳ１４４までの処理を、コーナー検出処理部９１０で検出された全てのコーナーに対して行うことで、この特徴分布マップ生成の処理、つまり、特徴分布マップ生成処理部９１１での、複数の特徴分布マップ生成処理が終了となる。ここでの処理は、図１０のＳ１０１１における特徴分布マップ生成処理のステップに対応する。
【００８８】
この処理により生成される複数の特徴分布マップそれぞれは、コーナー検出処理部９１で検出されたコーナーの内、その特徴分布マップに対応する範囲の輝度勾配方向であったコーナー位置のみが１で、それ以外は０という、極めて疎な分布となる。具体的には、例えば、コーナーとして検出された位置は、図１１の画像１１１に示した４６個であり、その各コーナー位置の内、０度から３０度未満の輝度勾配方向であるコーナー位置は、１０個となる。その結果、０度から３０度未満の範囲に対応する特徴分布マップは、マップ中の１０点のみが１で、それ以外の位置は０という、非常に疎な分布となる。したがって、この特徴も局在性が高いといえる。
【００８９】
そのため、上述したように、この特徴分布マップをそのまま用いて、サンプリングデータを用いたパターン識別を行うと、充分な識別性能を実現できない可能性が高い。そこで、本実施形態でも、図９の平滑化処理部９２における処理により、この複数の特徴分布マップに対し、特徴の局在性を緩和させる変換を行う。
【００９０】
平滑化処理部９２は、前述のように、特徴の局在性を緩和させる変換を、特徴分布マップ生成処理部９１１において生成した複数の特徴分布マップに対して行うことにより、複数の特徴分布拡散マップを生成する。本実施形態では、平滑化処理部９２は、特徴の局在性を緩和させる２つの変換を２段階に分けて行う。
【００９１】
図１５は、平滑化処理部９２の処理フローを示す。図１５の中で、Ｓ１５５の空間フィルタリング処理のステップが２段階の変換の内、１段階目の変換に対応する。また、その後のＳ１５６における、輝度勾配方向空間フィルタリング処理のステップが、２段階の変換の内の２段階目の変換に対応する。
【００９２】
この平滑化処理部９２で行う、特徴の局在性を緩和させる２つの変換は、いずれも実施形態１における平滑化処理による変換と同様である。しかし、１段階目の変換は、変換に用いるパラメータが固定ではなく、パターン識別の処理対象であるデータに依存し、動的にパラメータを設定するという部分が実施形態１のパラメータ設定と異なる。ここでの変換に用いるパラメータを、処理対象データに依存して動的に設定する処理は、図１５のＳ１５１からＳ１５３までの繰り返し処理に対応する。また、図１０の場合には、Ｓ１０２０の変換パラメータ決定処理のステップに対応する。
【００９３】
以下、この平滑化処理部９２における、複数の特徴分布拡散マップ生成処理について、図１５を用いて説明する。まず、Ｓ１５０において、平滑化処理部９２は、複数の特徴分布拡散マップ上の、全ての位置の値を０に初期化する。次に、Ｓ１５１おいて、平滑化処理部９２は、コーナー検出処理部９１で検出された複数のコーナーから１つのコーナーを順に選択する（順序は任意で構わないが、重複選択はしない）。
【００９４】
続いて、Ｓ１５２において、平滑化処理部９２は、Ｓ１５１で選択したコーナーを中心とした、所定半径内の領域、例えば、画像幅の１／１０程度の半径内の領域において検出されたコーナーの個数（＝Ｃ）を算出する。次に、Ｓ１５３において、平滑化処理部９２は、Ｓ１５２で算出したコーナーの個数Ｃに基づいて、Ｓ１５１で選択したコーナー位置で用いる空間フィルタを、以下の（１）式のようにように設定する。
【００９５】
【数１】

【００９６】
ここで、ｘとｙは、空間フィルタの中心を原点としたときの、空間フィルタにおける位置を示す。またαは、空間フィルタの幅に関する定数である。このαの値は、ここでの空間フィルタリング処理により、隣接する特徴情報が混同してしまわない程度の大きさに、予め実験的に定めておけばよい。本実施形態では、αの値を上記半径の３／４としている。このような空間フィルタを用いることにより、検出されたコーナーが少ない場合、つまり、Ｃが小さい場合には、適用する空間フィルタの幅が大きくなり、逆に、検出されたコーナーが多い場合には、空間フィルタの幅が小さくなる。
【００９７】
Ｓ１５４で、平滑化処理部９２は、Ｓ１５１においてコーナー検出処理部９１で検出された全てのコーナーを選択したか否かの判定を行う。全てのコーナーを選択した場合には、Ｓ１５５の空間フィルタリング処理のステップに進む。全てのコーナーを選択していない場合には、Ｓ１５１のコーナー選択のステップに戻り、新たに１つのコーナーを選択し、上述の処理を繰り返す。つまり、Ｓ１５１からＳ１５３までの処理を、コーナー検出処理部９１で検出された全てのコーナーに対して行い、次の空間フィルタリング処理ステップＳ１５５に進むことになる。
【００９８】
ここまでの処理により、コーナー検出処理部９１で検出された全てのコーナーに対し、その近傍領域（所定半径内の領域）に存在するコーナーの個数に応じた空間フィルタが設定されることになる。このように、本実施形態においては、特徴の局在性を緩和させる変換のパラメータ、すなわち、本実施形態の平滑化処理に用いる空間フィルタが、パターン識別の処理対象であるデータに依存して動的に設定されることになる。
【００９９】
次に、Ｓ１５５において、平滑化処理部９２は、特徴分布マップ生成処理部９１１で生成した特徴分布マップを用い、いわゆる投射野型の空間フィルタリング処理を行うことで、位置空間における特徴の局在性を緩和させる変換を行う。
【０１００】
通常の受容野型の空間フィルタリング処理では、フィルタリング処理に用いる空間フィルタの値で、フィルタリング適用対象データの対応する位置の値を重み付けして加算した値を、フィルタリング処理後の各位置の値とする処理を行う。これに対し、投射野型の空間フィルタリング処理では、フィルタリング適用対象データ（ここでは、特徴分布マップ生成処理部９１１で生成した特徴分布マップ）の値を、フィルタリング処理に用いる空間フィルタの値で重み付けする。そして、フィルタリング処理後の対応する位置の値（ここでは、特徴分布拡散マップの各位置の値）に順次、重み付けられた空間フィルタの値を加算するという処理を行う。
【０１０１】
このような投射野型の空間フィルタリング処理は、フィルタリング適用対象データが非常に疎である場合、フィルタリング適用対象データ上の、信号が存在する位置（特徴分布マップ上の、値が１である位置）でのみ実行されればよい。したがって、高速な処理が可能となる。より具体的には、コーナー検出処理部９１で検出されたコーナー位置において、値が１である特徴分布マップに対してのみ、Ｓ１５３で設定された空間フィルタを用いて、上述の投射野型の空間フィルタリング処理を行えばよい。
【０１０２】
この投射野型の空間フィルタリングで用いる空間フィルタは、前述のように、その近傍領域に存在するコーナーの個数に応じて、上記（１）式に従って設定した。このような空間フィルタを用いることにより、近傍領域において、検出されたコーナーが少ない、つまり、Ｃが小さい場合、適用する空間フィルタの幅が大きくなり、逆に、コーナーが多い場合、空間フィルタの幅が小さくなる。このため、コーナーが密に存在するような場所では、ここでの処理により拡散させる特徴情報が、その他の特徴情報と混同されてしまわないように、小さい幅で拡散させ、コーナーの存在が疎である場所では、大きい幅で拡散させることが可能になる。
【０１０３】
このように、実施形態３のパターンを識別する方法では、特徴の局在性を緩和させる変換を、それぞれの位置ごとに、例えば、その位置付近における特徴の分布等に応じたものとしても構わない。また、本実施形態では、その位置付近における特徴の分布に従って、空間フィルタの幅を変更したが、本発明はこれに限るものではなく、例えば、分布の主軸方向に応じて、空間フィルタの形状を変更しても構わない。また、本実施形態では、その位置近傍における特徴の個数、即ち、近傍領域における特徴分布の密度に基づいて、空間フィルタを設定したが、これに限るものではない。例えば、最も近い位置にある特徴（自身を除いて）までの距離に基づいて、空間フィルタを設定してもよい。
【０１０４】
図１１は、複数の特徴分布拡散マップの例を示す。特徴分布拡散マップ１１２１から１１２６は、Ｓ１５５の空間フィルタリング処理のステップ、すなわち１段階目の特徴局在性緩和処理を行った、特徴分布拡散マップの例である。特徴分布拡散マップ１１２１は、輝度勾配方向が、０度から３０度未満の範囲に対応する不図示の特徴分布マップに対し、Ｓ１５５の処理により、位置空間における特徴の局在性を緩和させた結果である。また同様に、特徴分布拡散マップ１１２２から１１２６までは、それぞれ、３０度から６０度未満の範囲から、１５０度から１８０度未満の範囲それぞれに対応した、処理結果である。この図に示すように、Ｓ１５５の処理により、コーナーが密に分布している位置では、小さい幅で特徴情報が拡散され、コーナーの分布が疎な位置では、大きい幅で特徴情報が拡散されることになる。これにより、近い位置の特徴情報は適度に混同されることなく、また特徴が存在しない位置にも、ある程度拡散させた特徴情報の裾が到達するようになるので、元のデータに比べて、大幅に、特徴の局在性を緩和させることができる。
【０１０５】
しかしながら、例えば、図１１の特徴分布拡散マップ１１２２では、まだ特徴信号が存在しない領域が多く、充分な局在性の緩和ができているとは言えない。そこで、特徴の局在性を緩和させる第２段階の変換として、Ｓ１５６の輝度勾配方向空間フィルタリング処理のステップにより、今度は、輝度勾配方向空間にも、特徴情報を拡散させる処理を行い、輝度勾配方向空間における特徴の局在性をも緩和させる。
【０１０６】
より具体的には、近傍の輝度勾配方向の範囲に対応する、Ｓ１５５での処理の結果に、所定の重み付けて加算することにより、輝度勾配方向空間に特徴情報を拡散させる。ここでの具体的な処理結果を、図１１の特徴分布拡散マップ１１３１から１１３６に示した。
【０１０７】
このＳ１５６の処理結果の内、輝度勾配方向が６０度から９０度未満の範囲に対応する特徴分布拡散マップ１１３３の結果を生成する処理の手順について説明する。まず、同じ輝度勾配方向の範囲に対応する特徴分布拡散マップ１１２３の結果については、そのまま１．０の重み付けで加算する（図中、太い下方向への矢印に対応）。そして、隣接する輝度勾配方向の範囲に対応する、特徴分布拡散マップ１１２２と、特徴分布拡散マップ１１２４のそれぞれの結果に、重み付けとして０．６を乗じたものを加算する（図中、斜め方向への実線矢印に対応）。最後に、もう１つ離れた輝度勾配方向の範囲に対応する、特徴分布拡散マップ１１２１と特徴分布拡散マップ１１２５のそれぞれの結果に重み付けとして０．２を乗じたものを加算することで、輝度勾配方向空間にも特徴情報を拡散させた特徴分布拡散マップ１１３３が得られる。
【０１０８】
本実施形態においては、輝度勾配方向の０度と１８０度が一致するため、例えば、０度から３０度未満の範囲の、隣接する輝度勾配方向は、３０度から６０度未満の範囲と、１５０度から１８０度未満の範囲となる。すなわち、特徴分布拡散マップ１１３１の輝度勾配方向は、１．０の重み付けの特徴分布拡散マップ１１２１とそれぞれ０．６の重み付けの特徴分布拡散マップ１１２２、１１２６とそれぞれ０．２の重み付けの特徴分布拡散マップ１１２３、１１２５とを加算したものとなる。このように、本発明における特徴の局在性を緩和させる変換は、位置空間における局在性を緩和させるものに限らず、その他の空間における局在性を緩和させるような変換であっても構わない。
【０１０９】
このＳ１５６での処理により生成した、図１１の特徴分布拡散マップ１１３１から１１３６までが、図９の平滑化処理部９２において生成する複数の特徴分布拡散マップの例である。このように、平滑化処理部９２は、第１段階目の変換におけるパラメータ決定と、第１段階の変換、および第２段階の変換を行い、複数の特徴分布拡散マップを生成する。ここでの処理は、図１０のＳ１０２０、およびＳ１０２１に対応する。この処理により、図１１の特徴分布拡散マップ１１３１から１１３６に示したように、元の複数の特徴分布マップに比べ、大幅に、特徴の局在性を緩和させることができる。このようにして、実施形態１の説明において述べた同様な、本発明の特徴的な効果が得られる。
【０１１０】
これ以降の、決定木探索処理部９３、スコア加算部９４、およびパターン判定部９５の処理部は、実施形態２と比べたとき、決定木探索処理部９３での処理対象データが、距離マップではなく、複数の特徴分布拡散マップであるという違いがある。しかし、それ以外は、実施形態２における、決定木探索処理部５３、スコア加算部５４、およびパターン判定部５５の処理部とほぼ同様の処理であるので、これらの説明を省略する。
【０１１１】
このように、本実施形態のパターン識別方法では、まず、入力されたデータ上に存在する特徴を抽出した。そして上述した、位置空間と輝度勾配方向空間の２段階で、特徴情報を拡散させる処理を行い、抽出した特徴の局在性を緩和させた、複数の特徴分布拡散マップを生成した。また、複数の特徴分布拡散マップを用いる点は異なるが、実施形態２と同様に、各分岐ノードにおいて、この複数の特徴分布拡散マップ中のサンプリングデータを用いて分岐を行う決定木を複数用い、それらの結果を統合してパターン識別の処理を行った。これにより、種々の変動にロバストで、且つ、高速なパターン識別が可能となることを示した。
【０１１２】
尚、本実施形態では、コーナー検出処理の結果に基づき、その点における特徴を抽出するようにした。しかし、本発明はこれに限るものではなく、例えば、Difference of Gaussians（ＤｏＧ）を用いたブロッブ検出の結果に基づく方法等のその他の特徴検出方法であっても構わない。また、他の実施形態と同様に、サンプリングデータを用いるパターン識別方法としては、２点の大小比較結果を用いる手法だけでなく、ある１点の値と、所定の閾値との比較結果を用いる方法でも構わない。また、本実施形態の構成においても、入力されたデータが、ある特定のカテゴリであるかどうかを識別するような手法や、ラスタスキャン的な処理により入力画像中から特定のカテゴリのパターンを検出するような手法にも適用可能である。
【０１１３】
＜その他の実施形態＞
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア（プログラム）を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ（またはＣＰＵやＭＰＵ等）がプログラムを読み出して実行する処理である。

【特許請求の範囲】
【請求項１】
画像における少なくとも１つの特定パターンに関して判定のための情報を登録する登録手段と、
画像データを入力する入力手段と、
前記入力した画像データから所定の特徴の分布を抽出し、該特徴の分布を示す第１特徴分布マップを生成する第１生成手段と、
前記第１特徴分布マップの局在性を緩和させる変換を該第１特徴分布マップに適用して第２特徴分布マップを生成する第２生成手段と、
前記第２特徴分布マップ上のサンプリングデータと前記登録された情報とを用いて、前記画像データが前記特定パターンのうちいずれのパターンかを判定する判定手段と、
を備えることを特徴とする情報処理装置。
【請求項２】
前記変換は、所定の平滑化フィルタによる空間フィルタリング処理であることを特徴とする請求項１に記載の情報処理装置。
【請求項３】
前記所定の平滑化フィルタは、所定の分布特性に従う空間フィルタであることを特徴とする請求項２に記載の情報処理装置。
【請求項４】
前記所定の平滑化フィルタは、前記所定の分布特性に従った分布の幅を有するか、または分布の形状を有する空間フィルタであることを特徴とする請求項３に記載の情報処理装置。
【請求項５】
前記変換は、前記第１特徴分布マップ上の各点から最近傍の特徴までの距離を算出し、各点の値を該算出した距離に置き換えることを特徴とする請求項１に記載の情報処理装置。
【請求項６】
前記変換は、前記第２特徴分布マップにおける各点の距離の値に上限値を設定し、前記最近傍の特徴までの距離が前記上限値以上の場合、その位置における前記第２特徴分布マップの値を前記上限値とすることを特徴とする請求項５に記載の情報処理装置。
【請求項７】
前記上限値は、前記第１特徴分布マップの各位置における局所的な分布特性に従って設定することを特徴とする請求項６に記載の情報処理装置。
【請求項８】
前記上限値は、第１特徴分布マップ上の各位置の周りの所定の領域内における特徴の密度に基づいて設定されることを特徴とする請求項７に記載の情報処理装置。
【請求項９】
前記第１生成手段は、前記画像データにおけるエッジの分布マップを生成することを特徴とする請求項１に記載の情報処理装置。
【請求項１０】
前記第２生成手段は、前記画像データにおける複数のコーナーエッジを抽出し、コーナーエッジに対して輝度勾配方向を求め、輝度勾配に従って該コーナーエッジを分けることで、複数の特徴分布マップを生成することを特徴とする請求項１に記載の情報処理装置。
【請求項１１】
前記第２生成手段は、前記複数の特徴分布マップの各々に対して、輝度勾配方向が隣接する特徴分布マップに重み付けをして、該特徴分布マップに加算することを特徴とする請求項１０に記載の情報処理装置。
【請求項１２】
情報処理装置のパターン識別の方法であって
登録手段が、画像における少なくとも１つの特定パターンに関して判定のための情報を登録する登録工程と、
入力手段が、画像データを入力する入力工程と、
第１生成手段が、前記入力した画像データから所定の特徴の分布を抽出し、該特徴の分布を示す第１特徴分布マップを生成する第１生成工程と、
第２生成手段が、前記第１特徴分布マップの局在性を緩和させる変換を該第１特徴分布マップに適用して第２特徴分布マップを生成する第２生成工程と、
判定手段が、前記第２特徴分布マップ上のサンプリングデータと前記登録された情報とを用いて、前記画像データが前記特定パターンのうちいずれのパターンかを判定する判定工程と、
を有することを特徴とする方法。
【請求項１３】
請求項１２に記載の各工程をコンピュータに実行させるためのプログラム。

【図１】