画像分類学習処理システム及び画像識別処理システム
【課題】 画像のクラス分類学習処理システム及びその学習結果を用いた画像識別処理システムであって、画像の解像度の違い、対象物体の変化、オクルージョンや環境の突然な変化などに対してロバストなクラス分類学習及び画像識別を行うことができるシステムを提供する。
【解決手段】 画像の大きさに比べて十分に小さく予め定められた形状の領域(窓)を、この窓が画像全体を覆うように設定し、各窓から画像の小領域を切り出した部分画像の集合を作成し、切り出されたすべての部分画像同士の間にそれらの間の非類似度に相当するような順序関係を定義し、この順序関係のみに基づいて各部分画像を任意の距離空間における点へと写像し、写像された距離空間における点の位置座標ベクトルの直積又はテンソル積を画像についての特徴量として用いて、画像のクラス分類学習およびクラス識別を行う。
【解決手段】 画像の大きさに比べて十分に小さく予め定められた形状の領域(窓)を、この窓が画像全体を覆うように設定し、各窓から画像の小領域を切り出した部分画像の集合を作成し、切り出されたすべての部分画像同士の間にそれらの間の非類似度に相当するような順序関係を定義し、この順序関係のみに基づいて各部分画像を任意の距離空間における点へと写像し、写像された距離空間における点の位置座標ベクトルの直積又はテンソル積を画像についての特徴量として用いて、画像のクラス分類学習およびクラス識別を行う。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像の特徴量に注目した画像分類学習処理システム及びその学習結果を利用した画像識別処理システムに関するものである。
【背景技術】
【0002】
画像のクラス分類を学習し、その学習結果に基づいて画像中の対象物体を識別するための方法として、画像を特徴付ける情報(特徴量)に基づくものがある。このような方法では、特徴量を入力としクラスを出力とするパラメタ表示された写像(クラス識別写像)を用いるが、そのクラス識別写像のパラメタは、既にクラス分類されている学習用画像を教師データ(モデル)として与え、この学習用画像に対する経験リスクが最小化されるようにして定義され(ニューラルネットワーク)、あるいは構造リスクを最大化するようにして定義される(サポートベクターマシン)。いずれの場合にも、画像からヒューリスティックな方法で抽出された特徴量を用いている。ところが、このようにして抽出される特徴量が画像を分類及び識別するにあたって最適な基準となるかどうかは自明ではないので、客観的な評価に基づいて真に最適な特徴量を求めることが重要である。
【0003】
特徴量に基づいて画像のクラス分類を学習し、対象物体を識別するプロセスにおいては、統計的手法によって有用な特徴量を抽出するアプローチが知られている。特に、画像から線形変換によって得られるような特徴量を抽出するものとして、(1)主成分分析(Principal Component Analysis;PCA)や重判別分析(Multiple Discriminant Analysis;MDA)を用いるものなどが一般的である。例えば、特許文献1や特許文献2には、適応学習型汎用画像計測方法及び適応学習型汎用画像計測装置が記載されている。ところが、対象物体や背景(環境)の条件などによっては、線形性の仮定が成り立たないこともあり、画像からの線形変換によって常に画像の分類及び識別に有用な特徴量が得られるとは限らない。このような場合に対処する方法としては、(2)ニューラルネットワークや非線形変換を行った後に主成分分析を行う方法がある。但し、これらの手法では、非線形変換の形を予め仮定する必要があるが、抽出すべき特徴量が予め仮定した非線形変換と異なる場合には、適切な特徴量を得ることができない。そこで、どのような非線形変換を行うかを予め仮定しない手法として、(3)自己組織化写像(Self-Organizing Maps;SOM)を用いる手法や、計量的多次元尺度構成法(Multi Dimensional Scaling;MDS)などのクラスタリングを行う手法がある。例えば、特許文献3には、特徴空間の階層的クラスタリングを行う類似画像表示方法が記載されている。
【特許文献1】特許第2982814号公報。
【特許文献2】特許第2834153号公報。
【特許文献3】特開2000−311246号公報。
【非特許文献1】田口善弘他,2001年,「非計量多次元尺度構成法への期待と新しい視点」,統計数理第49巻第1号,p133-153。
【発明の開示】
【発明が解決しようとする課題】
【0004】
しかしながら、従来技術(1)で説明した手法では、特徴量が画像情報に関する線形変換として与えられることを仮定しているが、そのような仮定が一般的に成り立つとは限らないので、適用できる対象が限られてしまうという問題がある。
【0005】
また、従来技術(2)で説明した手法では、非線形変換によって得られる特徴量を扱うことができるが、抽出すべき特徴量が予め仮定した特徴量と異なる場合には、適切な結果を得ることができないという問題がある。
【0006】
また、従来技術(3)で説明した手法では、非線形変換を予め仮定する必要はないが、特徴量の成す空間に計量を与えなければならず、解析結果はこの計量に大きく影響される。しかしながら、求めるべき特徴空間に計量をどのように与えれば良いかは自明ではないので、設定した計量が不適切であった場合には、精度が悪くなるという問題がある。さらに、SOMの場合には、特徴空間が離散的な格子によって表されるため、離散化に伴う誤差が大きく影響する可能性がある。
【0007】
また、画像処理において、画像計測装置による解像度などの違い、対象物体の変化、オクルージョンや環境(背景)の突然の変化などによるノイズが発生するが、これらは統計的に扱うことは困難である。上記した従来技術はずれもデータを計量的に扱っているため、このようなノイズの発生に対するロバスト性が低いという問題がある。また、このような大きなノイズの影響を画像に対する前処理において十分に補正することも困難である場合が多い。
【0008】
さらに、MRI画像のような3次元画像に対して、従来の手法を適用する際には、特徴量を抽出するために、一度、2次元の断面画像を取ってから解析を行い、再度3次元の情報に組み直す必要性があるが、このような場合には、断面間のグローバルな特徴を抽出するのが困難である。また、近年のMRI画像計測技術の発展によって、テンソル値の3次元画像を取得することも出来るようになっているが、テンソル値(行列値)のデータは色相や輝度のようなデータとは異なり、各成分自体の値よりも、行列式、固有値およびトレースなどの量の方に本質的な意味があり、従来手法のような平均輝度やエッジ強度のような特徴量は有効な特徴量とはならない場合が多い。
【0009】
本発明は、このような従来技術における問題点に鑑みてなされたものであり、画像のクラス分類学習処理システム及びその学習結果を用いた画像識別処理システムであって、適切な特徴量をより客観的な規準によって抽出することにより、画像の解像度の違い、対象物体の変化、オクルージョンや環境の突然な変化などに対してロバストなクラス分類学習及び画像識別を行うことができるシステムを提供しようとするものである。
【課題を解決するための手段】
【0010】
本発明者は、上記の課題を解決するために、まず画像の大きさに比べて十分に小さく予め定められた形状の領域(窓)を、この窓が画像全体を覆うように設定し(窓はお互いに重なりあっても良いし、重なりがないようにしても良い)、それぞれの窓から画像の小領域を切り出した部分画像の集合を作成し、切り出されたすべての部分画像同士の間にそれらの間の非類似度(あるいは類似度)に相当するような順序関係を定義し、この順序関係のみに基づいて各部分画像を任意の距離空間における点へと写像し、このようにして写像された距離空間における点の位置座標ベクトルの直積又はテンソル積を画像についての特徴量とすることにより、統計的に客観的であり、かつ、ノイズ、環境変動、画像中の識別対象のオクルージョンなどに対してロバストである画像のクラス分類学習およびクラス識別を行うことができることに想到した。
【0011】
従来技術で説明した手法に比べ、本発明では、特に、従来技術(1)で説明した手法に比べ、写像元における非類似度あるいは類似度といった量の間の順序関係のみを使用すること、順序関係のみが大切なので、ノイズや環境の明るさの変動などに対してロバスト性が高いこと、先の非類似度あるいは類似度のスケールの選び方にも依存しないため、写像先の空間における距離スケールすなわち計量の定義に影響されずに、精度高く写像を構成することができること、かつ写像が非線形であっても適用することができること、さらに、従来技術(2)で説明した手法に比べ、予め非線形写像の形を決めておく必要がないため、任意の形の非線形写像を構成することができること、また、従来技術(3)で説明した手法に比べ、写像先の空間は連続空間として扱うことができ、自己組織化写像のように空間を離散化することによる写像の精度の悪化はないこと、かつ、距離スケールすなわち計量の定義に依存しないため、自己組織化写像及び計量的多次元尺度構成法のように精度良く写像を構成するためには、距離スケールを非常に正確に調整しなければならないというような問題に影響されなくなることに特徴を有している。
【0012】
さらに、ノイズ削除、輝度補正、背景変動補正などの画像に対する前処理を実行しなくとも、これらの影響を受けずに処理を行うことが出来るため、計算コストを大きく削減することが可能であることにおいても特徴を有している。
【0013】
さらに、MRI画像のような3次元画像に対しても、本発明では、3次元画像を2次元の断面に分割する必要性はなく、3次元画像のまま、解析を行うことが可能であり、また、近年のMRI画像計測技術の発展によって、テンソル値の3次元画像を取得することも出来るようになっているが、このようなテンソル値のデータであっても客観的に本質な特徴量を抽出することができるようになることにおいても特徴を有している。
【0014】
以上のような特徴を実現するための手段として、本発明は、画像のクラス分類を学習するシステムであって、学習用画像の対象領域に対して、該対象領域全体を覆うようにして1以上の所定形状の窓領域を設定する窓領域設定手段と、前記各窓領域に含まれる部分画像の集合から、互いに異なる2つの部分画像の組を生成し、各組の部分画像間における類似度又は非類似度を、各部分画像から抽出される特徴量に基づいて計算する部分画像間類似度計算手段と、前記部分画像間の類似度又は非類似度に基づいて前記各部分画像の組の間での順序関係を決定する第1の順序関係決定手段と、前記各部分画像の組の間で決定された順序関係が保存されるようにして、前記各部分画像を第1の距離空間上に写像する第1の写像手段と、前記第1の距離空間に写像された各点の位置座標の直積又はテンソル積を各学習用画像の第1種特徴量とし、各学習用画像の第1種特徴量に基づいて、画像間の非類似度又は類似度を計算する画像間類似度計算手段と、前記学習用画像間の非類似度又は類似度に基づいて前記各学習用画像の組の間での順序関係を決定する第2の順序関係決定手段と、前記各学習用画像の組の間で決定された順序関係が保存されるようにして、前記各学習用画像を第2の距離空間上に写像する第2の写像手段と、前記第2の距離空間に写像された各点の位置座標ベクトルを各学習用画像の第2種特徴量とし、前記第2の距離空間上に写像された点から、前記第2の距離空間における距離又は分布密度に基づいてクラスタを構成するクラスタリング手段と、各クラスタをクラス分類するとともに、各クラスタに属する点に対応する学習用画像を前記第2の写像手段による写像の逆写像によって求めることにより、各学習用画像がどのクラスに属するかを判定するクラス分類判定手段と、を含むことを特徴とするシステムを提供するものである。
【0015】
本発明のシステムにおいて、前記クラスタリング手段は、全クラスタ数を予め指定せず、あるいは、全クラスタ数を予め指定してクラスタリングを行うことを特徴とする。
【0016】
本発明は、また、上記の画像クラス分類学習システムにおいて、学習用画像について計算された第1特徴量及び第2特徴量と、クラス分類の判定結果とを予め記憶しておき、前記画像間類似度計算手段により、前記入力画像の第1種特徴量を計算し、該第1種特徴量と学習用画像の第1種特徴量とを用いて、前記入力画像と前記学習用画像との間の非類似度又は類似度を計算し、前記第2の順序関係決定手段により、該非類似度又は類似度に基づいて前記入力画像と前記学習用画像との間の順序関係を決定し、前記第2の写像手段により、前記入力画像と前記学習用画像との間で決定された順序関係が保存されるようして、前記入力画像を第2の距離空間上に写像し、前記画像間類似度計算手段により、前記入力画像が前記第2の距離空間に写像された各点の位置座標ベクトルを前記入力画像の第2種特徴量とし、前記入力画像の第2種特徴量と前記記憶してある学習用画像の第2特徴量との間の非類似度又は類似度を計算し、該非類似度又は類似度に基づいて、入力画像が学習用画像のいずれのクラスに該当するかを識別することを特徴とするシステムを提供するものである。
【0017】
本発明は、また、上記の画像クラス分類学習システムにおいて、学習用画像について計算された第1特徴量及び第2特徴量と、クラス分類の判定結果とを予め記憶しておき、前記画像間類似度計算手段により、前記入力画像の第1種特徴量を計算し、該第1種特徴量と学習用画像の第1種特徴量とを用いて、前記入力画像と前記学習用画像との間の非類似度又は類似度を計算し、前記第2の順序関係決定手段により、該非類似度又は類似度に基づいて前記入力画像と前記学習用画像との間の順序関係を決定し、前記第2の写像手段により、前記入力画像と前記学習用画像との間で決定された順序関係が保存されるようして、前記入力画像を第2の距離空間上に写像し、前記第2の距離空間において前記入力画像が写像された点と距離が近い順に所定数の学習用画像を選択し、選択された学習用画像のうち最も多くの学習用画像が属するクラスを入力画像のクラスとして識別することを特徴とするシステムを提供するものである。
【0018】
本発明は、また、上記の画像クラス分類学習システムにおいて、クラス分類済みの学習用画像の第1種特徴量を計算し、該第1種特徴量を入力して得られるクラス分類判定結果と、クラス分類済み学習用画像のクラスとの差に関する関数を全てのクラス分類済み学習用画像について足し上げた誤差関数を算出し、該誤差関数が最小化されるように前記第2の写像手段による写像のパラメタを定めることを特徴とする。
【0019】
本発明のシステムにおいて、前記第2の写像手段による写像は、ニューラルネットワークを用いて構成されることを特徴とする。
【0020】
本発明は、また、上記のシステムにおいて、さらに、入力画像の第1種特徴量を計算し、該第1種特徴量を入力して得られるクラス分類判定結果に従って前記入力画像のクラスを識別することを特徴とするシステムを提供するものである。
【0021】
本発明は、また、上記のシステムにおいて、クラス分類済みの学習用画像の第1種特徴量を計算し、該第1種特徴量を入力して得られるクラス分類判定結果における各クラスについて、クラス分類済み学習用画像をそのクラスに属する群と他のクラスに属する群とに分け、それぞれの群について、各学習用画像の第1特徴量を第3の距離空間に写像し、その写像された像を第3種特徴量とし、該第3種特徴量に関する線形な判別関数であって、一方の群に属する学習用画像の第3特徴量に関しては、前記判別関数の値がある定められた正の定数以上の値となり、他方の群に属する学習用画像の第3特徴量に関しては、前記判別関数の値が前記正の定数と絶対値が等しい負の定数以下の値となり、かつ、前記判別関数の値を0と置いた方程式により表される第3の距離空間上の超平面と各学習用画像の第3特徴量との間の距離を最小化するようパラメタをとった判別関数を定めることを特徴とするシステムを提供するものである。
【0022】
本発明は、また、上記のシステムにおいて、入力画像の第1種特徴量を計算し、該第1種特徴量から得られる第3種特徴量についての前記判別関数の値が最大値となることを基準として、前記入力画像のクラスを識別することを特徴とするシステムを提供するものである。
【0023】
本発明のシステムにおいて、前記第3の距離空間への写像は、サポートベクターマシン、非線形サポートベクターマシン又はカーネルサポートベクターマシンを用いて構成されることを特徴とする。
【0024】
本発明のシステムにおいて、前記クラスタリング手段は、混合確率分布を用いた尤度あるいは対数尤度最大化する処理、事後確率を最大化する処理、あるいは予め与えられた事前分布に基づく期待値を計算する処理のいずれかの処理を実行することを特徴とする。
【0025】
本発明のシステムにおいて、前記クラスタリング手段は、混合ガウス分布に関する最尤推定法、事後確率最大化法あるいはベイズ推定法を適用することによって定まる各ガウス成分が1つのクラスを表すとし、各部分画像が属するクラスタをその部分画像に対応する距離空間における点の各ガウス成分に関するマハラノビス距離が最小となるガウス成分として定めることを特徴とする。
【0026】
本発明のシステムにおいて、前記クラスタリング手段は、初期状態として全データを含む1つのクラスタから開始し、同じクラスタに属する2点間の距離が最大となる2点組を選択し、その距離が予め定められた閾値以上である場合に、そのクラスタを2分し、選択された2点をそれぞれのクラスタの種とし、同じクラスタに属していた全ての点に関して、これらのクラスタの種との間の距離を計算し、距離が小さい方のクラスタに属するように分類する処理を各クラスタにおけるクラスタ分割条件が満たされなくなるまで実行する分割クラスタリングを適用することを特徴とする。
【0027】
本発明のシステムにおいて、前記クラスタリング手段は、K-最近接法又はK-平均法を実行するクラスタリングを行うことを特徴とする。
【0028】
本発明のシステムにおいて、前記第1の写像手段及び第2の写像手段のうち少なくとも一方は、前記部分画像/学習用画像の組の間で決定された順序関係のみに基づいて写像を行うことを特徴とする。
【0029】
本発明のシステムにおいて、前記第1の写像手段及び第2の写像手段のうち少なくとも一方は、前記部分画像/学習用画像の組の間で決定された順序関係に基づいて各部分画像/学習用画像の組に自然数による番号付けを行い、それらの番号の差の大きさのみに基づいて写像を行うことを特徴とする。
【0030】
本発明のシステムにおいて、前記第1の写像手段及び第2の写像手段のうち少なくとも一方は、前記部分画像/学習用画像の組が前記第1の距離空間/第2の距離空間に写像された点の組の2点間距離を計算するとともに、前記写像された点の組について補助距離の大小関係によって定められる順序関係が、前記部分画像/学習用画像の組の間で決定された順序関係と一致するようにして、前記2点間距離の補助距離を計算し、前記写像される点の組における2点間距離と補助距離との差の自乗を全ての前記写像される点の組について足し合わせた値が最小化されるようにして写像を行うことを特徴とする。
【0031】
本発明のシステムにおいて、各組の部分画像間における類似度又は非類似度は、各部分画像上の各画素の位置情報と、画素上の色相又は濃淡値とを与える関数の汎関数として定義されていることを特徴とする。
【0032】
本発明のシステムにおいて、各組の部分画像間における類似度又は非類似度は、画像が画像間の差分又はマッチングによって生成された差分画像、オプティカルフロー画像、ステレオ画像のいずれかである場合には、各部分画像上の各画素の位置情報と、画素上の差分値、ベクトル値又は距離値とを与える関数の汎関数として定義されていることを特徴とする。
【0033】
本発明のシステムにおいて、各組の部分画像間における類似度又は非類似度は、各部分画像上の各画素の位置情報と、画素上の色相又は濃淡値とについてのヒストグラム関数の汎関数として定義されていることを特徴とする。
【0034】
本発明のシステムにおいて、各組の部分画像間における類似度又は非類似度は、各部分画像上の各画素の位置情報と、画素上の色相又は濃淡値とを与える関数に画像上の空間座標に関する微分演算子を作用させることで得られるベクトル値関数に関する汎関数として定義されていることを特徴とする。
【0035】
本発明のシステムにおいて、各組の部分画像間における類似度又は非類似度は、各部分画像上の各画素の位置情報と、画素上の色相又は濃淡値とを与える関数に画像上の空間座標に関する積分演算子を作用させることで得られる関数に関する汎関数として定義されていることを特徴とする。
【0036】
本発明のシステムにおいて、各組の部分画像間における類似度又は非類似度は、各部分画像上の各画素の位置情報と、画素上の色相又は濃淡値とを与える関数に画像上の空間座標に関する微分演算子をさせることで得られるベクトル値関数を引数とする2階テンソル値関数に関して、その各成分に画像上の空間座標に関する積分演算子を作用させることで得られる2階テンソル値関数に関する汎関数として定義されていることを特徴とする。
【0037】
本発明のシステムにおいて、各組の部分画像間における類似度又は非類似度は、各部分画像上の各画素の位置情報と、画素上の色相又は白黒の濃淡値とを与える関数の自己相関関数に関する汎関数として定義されていることを特徴とする。
【0038】
本発明のシステムにおいて、各組の部分画像間における類似度又は非類似度は、各部分画像上の各画素の位置情報と、画素上の色相又は濃淡値とを与える関数に画像上の空間座標に関する微分演算子を作用させることで得られるベクトル値関数に関する自己相関関数に関する汎関数として定義されていることを特徴とする。
【発明の効果】
【0039】
以上、説明したように、本発明の画像分類学習処理システム及び画像識別処理システムによれば、客観性の高い規準に従って画像が持つ統計的な特徴量が抽出されるので、この特徴量を用いて対象画像のクラス分類の教師あり学習又は教師なし学習処理やクラス識別処理を行うと、画像に含まれる対象物体の違い、変化、オクルージョン及び環境の変動に対してロバスト性が高い画像処理を行うことができる。また、そのロバスト性の高さから、画像の解像度の違いや、各種の統計的又は非統計的なノイズ、環境の状態の大きな変化があっても、特別な前処理を行う必要はないため、広範囲の対象画像について適用することができる。
【0040】
また、3次元以上の画像中における空間的な構造を特徴づける特徴量を抽出することができるようになる。さらには、テンソル値(行列値)の画像(2次元及び3次元以上)であっても、画像を特徴づける特徴量を抽出することができるようになる。
【発明を実施するための最良の形態】
【0041】
以下、添付図面を参照しながら、本発明の画像分類学習処理システム及び画像識別処理システムを実施するための最良の形態を詳細に説明する。図1〜図13は、本発明の実施の形態を例示する図であり、これらの図において、同一の符号を付した部分は同一物を表わし、基本的な構成及び動作は同様であるものとする。
【0042】
図1は、本発明の一実施形態として構築される画像クラス分類学習及び画像認識を行う画像処理システムの内部構成を概略的に示す機能ブロック図である。この画像処理システムは、画像データを保存する記録装置100、ユーザに対するインタフェース画面や画像データを分類又は認識した結果などを表示するための表示装置101、ユーザからの操作入力を受け付けるためのキーボード102とマウスなどのポインティングデバイス103、画像クラス分類学習及び画像認識に必要な演算処理、制御処理等を行う中央処理装置104、画像クラス分類学習及び画像認識の処理に必要なプログラムを格納するプログラムメモリ105、処理の対象となる画像データ110を格納するデータメモリ106を備えている。
【0043】
プログラムメモリ105は、データ入出力ユニット111、画像特徴量抽出ユニット112、教師なし画像クラス分類・識別ユニット113、教師あり画像クラス分類・識別ユニット114、データ記憶ユニット115を含んでいる。これらのプログラムユニットの機能ブロック図を図2に示す。
【0044】
図2において、プログラムメモリ105のデータ入出力ユニットは、画像入力処理部B1、クラス識別結果出力部B13、クラス分類結果出力処理部B15を含んでおり、画像特徴量抽出ユニット、データ記憶ユニットは、画像処理部B2、部分画像構成処理部B4、部分画像間非類似度計算処理部B5、順序関係保存写像構成処理部B6、画像間非類似度計算処理部B8を含んでおり、教師なし画像クラス分類・識別ユニットは、クラスタリング処理部B10、クラス識別処理部B12、クラス識別写像構成処理部B14を含んでおり、教師あり画像クラス分類・識別ユニットは、学習処理部B16、識別処理部B19を含んでおり、データ記憶ユニットは、入力画像記憶部B3、第1種特徴量記憶部B7、第2種特徴量記憶部B9、クラスタデータ記憶部B11、学習器パラメタ記憶部B17、学習器状態記憶部B18、を含んでいる。
【0045】
以下において、これらの処理部における処理を詳細に説明する。まず、教師なしで画像クラス分類学習及び画像認識を行う処理について説明し、続いて、教師ありで画像クラス分類学習及び画像認識を行う処理について説明する。
【0046】
画像入力処理部B1は、記録装置100などから処理対象となる画像データをデータメモリ106に取得する。以下においては、2次元画像を処理対象とする場合について説明するが、本発明の画像処理システムでは3次元画像であってもこれと同様に処理を実行することができる。
【0047】
画像処理部B2は、取得した対象画像がカラー画像である場合には、グレースケール画像への変換、輝度正規化、ヒストグラム平滑化、サイズ変更、ノイズ低減などの各種フィルタリング処理を行うものとする。但し、これらの画像処理は必ずしも行う必要があるものではなく、画像入力処理部B1により取得した画像データをそのまま用いて以下の処理を行ってもよい。従来技術では、ここで輝度の正規化処理などを行わないと以下の処理に重大な影響を与えることとなるが、本発明の画像処理システムは、ここで輝度の正規化処理を行わなくとも以下の処理に問題が生じないという点でロバスト性が高いシステムである。ここでは、取得した画像データはRGB値で表されるカラー画像データであり、画像処理部B2では特に上記したような画像処理を行わないものとする。画像処理部B2による処理後の画像は、入力画像記憶部B3により記憶される。
【0048】
部分画像構成処理部B4は、画像データ全体を覆うように窓を設定して、複数の部分画像を構成する。ここで、画像データに対する窓の設定方法を図9に示す。図9に示す窓の設定方法は、注目領域が画像全体であり窓が矩形である場合の例であり、図9(a)に示すように窓はお互いに交差しないように設定されていても良く、あるいは図9(b)に示すようにお互いに交差するものがあるように設定されていても良い。また、窓の形も図9のような矩形ではなくても、注目領域全体を覆うことができるようになっていれば、形は任意で構わない。以下の処理では、図9(a)に示すような窓の設定方法を採用するが、部分画像の大きさは原理的にはかならずしも全て同じではなくても良い。
【0049】
部分画像間非類似度計算処理部B5は、構成された各部分画像からヒストグラムやエッジ強度などの特徴量を抽出する。但し、特に特徴抽出せずに、与えられた部分画像そのものを特別な場合における特徴量として使用してもよい(その場合、ここでは一切処理は行うことはない)。非類似度の計算用に良く利用される特徴量としては、平均輝度と分散又はエッジ強度やテクスチャー構造を特徴づける共起(co-occurrence)行列、ランレングス・コード(run-length code)、フラクタル次元、窓フーリエ変換係数、ウェーブレット変換係数、輝度や色相のヒストグラムなどがある。
【0050】
部分画像間非類似度計算処理部B5は、さらに、お互いに異なるように選ばれた2つの部分画像からなる組全体について、各組に属する2つの部分画像間の非類似度を計算する。非類似度としては、部分画像組全体から順序集合上への任意の写像を使用することができる。対象画像に応じて、適切な非類似度が与えられれば良い。以下の説明では、順序集合として、特に、実数を使用するものとする。今、各部分画像をCi (i=1,2,...,N) と表す。Nは部分画像構成処理部B4において、切り出された部分画像の数(すなわち設定された窓の数)を表す。部分画像Ciに属する画素をkと表し、部分画像Cj に属する画素をlと表し、画素kにおけるRGBの値をそれぞれRk 、Gk、Bk と表すことにする。非類似度としては、2つの部分画像それぞれに属する画素値すべてから実数への任意の関数が使用できる。例えば、画像の領域の平行移動や回転に対して不変性が高い非類似度の与え方としては、(1)式に示すような関数dが使用できる。
【0051】
【数1】
あるいは、部分画像内の画素値に関する直積ベクトルを作成して、(12)式に示すような正規化ベクトル距離、カラーヒストグラムに関するハミング距離又はユークリッド距離、カラーヒストグラムインターセクションのような量を非類似度として用いてもよい。このようにして与えられた非類似度に基づいて、部分画像組全体からなる集合の上に順序関係が、非類似度が写像する順序集合上において定義されている順序関係によって自然に定義される。このように、部分画像間非類似度計算処理部B5では、各部分画像の組の間に順序関係が定義される。この順序関係を与える順序関数δを(2)式のように表す。
【0052】
【数2】
順序関数は(3)式のような関係を満たすものである。
【0053】
【数3】
【0054】
このように任意の2つのお互いに異なる部分画像の組の間に順序関係が定義された部分画像の集合は、順序関係保存特徴写像構成処理部B6において写像処理されることとなる。
【0055】
順序関係保存特徴写像構成処理部B6は、部分画像の集合をある距離空間の点の集合に1対1で写像する。ここで写像に関しては、写像によって写される距離空間上の点全体からなる集合から選ばれるお互いに異なる2点の組合せ全体がなす集合上に、2点間の距離に基づいて与えられる、お互いに異なる2点の組の全体からなる集合上に定義される順序関係が、写像元の部分画像のお互いに異なる2つの部分画像の組全体からなる集合対して、部分画像間非類似度計算処理部B5において計算される順序関係と一致するように選ばれていれば、任意の写像を使用することができる。以下では、このような写像を「特徴写像」と呼ぶ。例えば、非計量多次元尺度構成法を用いて、このような写像の一つを構成することができる。特に、以下の処理では、非計量的多次元尺度構成法を部分画像の全体からなる集合上から選ばれたお互いに異なる2つの部分画像の組合せ全体からなる集合上に定義される順序関係のみを用いて特徴写像を構成する方法(非特許文献1参照)に従う。
【0056】
特徴写像を構成するために、まず、部分画像Ci が写される距離空間上の点の位置座標をランダムに初期状態として選び、ベクトル
【0057】
【数4】
で表す。お互いに異なる2つの部分画像の組から成る集合上における順序関係を順序が小さいものから順に1,2,...,Nと番号をつけるものとする。つまり、ある部分画像組(Ci, Cj)の写像元での順番がmであったとき、順序関数δ(Ci, Cj)の値はmで与えられ、(4)式のように表すことができる。
【0058】
【数5】
同様に、位置ベクトル
【0059】
【数6】
から選ばれるお互いに異なる2つの位置ベクトルの組合せ全体から成る集合上に、位置ベクトル
【0060】
【数7】
間の距離
【0061】
【数8】
の大小関係に基づいて順序関係を定義し、順序が小さいものから順に1,2,...,N番号が付けるものとする。この順序関係を与える順序関数をηとおく。つまり、位置ベクトルの組
【0062】
【数9】
の順序がnであったとき、順序関数
【0063】
【数10】
の値はnで与えられ、(5)式のように表すことができる。
【0064】
【数11】
部分画像組(Ci, Cj)の写像元での順位がmで与えられるとき、写像先での位置座標の組
【0065】
【数12】
の順位をTm と置く。つまり、(6)式のように表すことができる。
【0066】
【数13】
目的の特徴写像を構成するためには、以下の手順(ア)〜(オ)に従う。
(ア)以下の(7)式に定義する行列の成分を対角成分以外のすべてについて計算する。(対角成分はすべて0と置いても良い。)ここで、mは部分画像の組(Ci, Cj)の順位を表し、Tm は(6)式で定義される位置ベクトルの組
【0067】
【数14】
の順位を表す。
【0068】
【数15】
【0069】
(イ)位置ベクトル
【数16】
それぞれについて以下の(8)式で与えられる差分ベクトル
【0070】
【数17】
を計算する。
【0071】
【数18】
(8)式におけるμは更新率で小さい正の数である。
【0072】
(ウ)手順(イ)で求めた差分ベクトルによって、位置ベクトルを以下の(9)式のように更新する。
【数19】
【0073】
(エ)更新された位置ベクトル
【数20】
を
【0074】
【数21】
と置きなおし、以下の(10)式が満たされるように、位置ベクトル
【0075】
【数22】
のスケールを変換する。
【0076】
【数23】
【0077】
(オ)手順(ア)〜(エ)を終了条件が満たされるまで繰返し行う。例えば、(7)式で与えられる行列Di,j の全ての非対角成分がすべて0となるか、予め決めた最大繰返し数に達するまで繰り返す。
【0078】
以上のようにして、順序関係保存特徴写像構成処理部B6により特徴写像が構成される。この処理の様子を図10に示す。図10(b)は、2次元のユークリッド空間に写像する特徴写像の例である。本画像処理システムでは、このようにして対象画像の各部分画像から写像された距離空間上の点の位置座標ベクトルの直積又はテンソル積を取ったものを、その対象画像についての第1種特徴量と定義する。順序関係保存特徴写像構成処理部B6は、写像結果から対象画像の第1種特徴量を計算し、第1種特徴量記憶部B7に出力する。第1種特徴量記憶部B7はこの第1種特徴量を記憶する。
【0079】
画像間非類似度計算処理部B8は、第1種特徴量記憶部B7により記憶されている画像の第1種特徴量から、それらの画像間の非類似度を計算する。画像間の非類似度としては、部分画像組全体から順序集合上への任意の写像を使用することができる。対象画像に応じて、適切な非類似度が与えられれば良い。以下の説明では、順序集合として、特に、実数を使用するものとする。今、A番目の画像に対する第1種特徴量を(11)式に示すような直積であるとすると、
【0080】
【数24】
画像IA とIB の間の非類似度として、例えば、(12)式に示すような各画像に対する第1種特徴量間の差分ベクトルの大きさ(但し、ここでは大きさを規格化してベクトル間の角度に相当する量に置き換えている)を表す関数eを使用することができる。
【0081】
【数25】
ここで、(10)式の規格化処理によって、(12)式ではゼロによる割算の問題は生じないことに注意する。(11)式の直積の各成分を一様に回転することで得られるものは同等であるという同値関係を使用する場合には、(12)を(13)式のように修正しても良い。
【0082】
【数26】
(13)式において、Tは(11)式の直積の各成分に関する回転を行う行列を表し、
【0083】
【数27】
は(14)式で示すように、直積ベクトル
【0084】
【数28】
の各成分に回転Tを作用させることで得られる直積ベクトルを表す。
【0085】
【数29】
【0086】
再び順序関係保存写像構成処理部B6は、上記のようにして(12)式又は(13)式により定義される画像間の非類似度に基いて、上記で第1種特徴量を計算したのと同じ手順により、各画像を距離空間における点へと写像(特徴写像)する。これにより距離空間において得られる点の集合の例を図11に示す。本画像処理システムでは、このようにして写像された点の位置座標ベクトルを、画像についての第2種特徴量と定義する。この第2種特徴量は、第2種特徴量記憶部B9により記憶されるとともに、クラスタリング処理部B10に出力される。
【0087】
クラスタリング処理部B10は、入力された画像についての第2種特徴量を表すベクトル
【0088】
【数30】
の配置に関するクラスタリングを行う。クラスタリング手法としてはクラスタ数を予め与える必要のない混合ガウス分布などの混合確率分布を用いた最尤推定法のようなクラスタリング手法が良いが、位置ベクトル間の距離を用いたdivisive clusteringなどを用いても良い。
【0089】
混合ガウス分布を使用する場合には、第2種特徴量の配置
【数31】
は、(15)式で表されるような混合ガウス分布からランダムに選ばれたI個の点であると見なす。
【0090】
【数32】
(15)式において、Jは特徴写像の写像先の距離空間の次元を表し、Lはガウス分布の成分数を表し、
【0091】
【数33】
は各ガウス分布成分のそれぞれ平均値ベクトル、共分散行列を表し、Θl-1 は共分散行列Θl の逆行列を表し、|Θl|は共分散行列Θlの行列式を表し、λl は各ガウス分布成分の重みを表し、以下の(16)式を満たす。
【0092】
【数34】
【0093】
各ガウス分布成分が1つのクラスタを表す。このとき、位置ベクトルの配置
【数35】
に関する対数尤度関数
【0094】
【数36】
は(17)式で表される。
【0095】
【数37】
【0096】
この対数尤度関数
【数38】
をパラメタ
【0097】
【数39】
について最適化することで、目的のクラスタ数およびクラスタ位置とサイズとが計算される。最適化手法としては、例えば、Greedy-EMアルゴリズム(J. Verbeek, N. Vlassis, and B. Krose, Neural Computation Vol.15, No.2, pages 469-485, 2003.)が使用できる。
【0098】
この混合ガウス分布によるクラスタリング結果の例を図12に示す。図12において、楕円は同一のクラスタに属する点を囲んでいる。以上のようにして、クラスタリング処理部B10は、順序関係保存写像構成処理部B6により計算された各画像についての第2種特徴量
【0099】
【数40】
の配置に関するクラスタリングを行う。クラスタリングを行った結果は、クラスタデータ記憶部B11により記憶され、各画像についての第2種特徴量
【0100】
【数41】
及びクラスタリング結果はクラス識別処理部B12に出力される。
【0101】
クラス識別処理部B12は、入力された画像についての第2種特徴量及びクラスタリング結果及びに基づいて、各画像がどのクラスタに属するかを計算する。各画像が属するクラスタは、その第2種特徴量
【0102】
【数42】
の各ガウス分布成分に関するマハラノビス距離を計算し、もっともマハラノビス距離が小さくなるガウス成分として決めることができる。第lガウス分布成分で表されるクラスタから位置ベクトル
【0103】
【数43】
までのマハラノビス距離は(18)式で計算される。
【数44】
【0104】
クラス識別処理部B12は、全画像について、それらがどのクラスタに属するかを表すリストを構成し、そのリストをクラス識別結果出力部B13に出力し、クラス分類結果出力処理部B15にクラスタデータを出力する。以上のようにして、本画像処理システムは、教師なしで入力画像のクラスを分類・識別し、その結果を出力することができる。入力画像のクラス分類・識別結果の出力例を図13に示す。
【0105】
尚、以上の処理は、図3に示すフローチャートの手順に従って実行することができる。図3において、Iは入力画像の数を表す。また、図3のステップS3−3における第1種特徴量計算処理は、図4に示すフローチャートの手順に従って実行され、ステップS3−6における第2種特徴量計算処理は、図5に示すフローチャートの手順に従って実行されるものとする。
【0106】
以下に、本画像処理システムにおいて、教師なしで入力画像のクラスを分類・識別する他の処理方法について、図6を参照しながら説明する。本方法では、まず、対象画像を読み込み(ステップS6−1)、その画像の第1種特徴量を計算する(ステップS6−2)。これらの処理は、上記と同様にして実行されるものとする。本画像処理システムの順序関係保存写像構成処理部B6において計算された対象画像の第1種特徴量はクラス識別写像構成処理部B14に出力される。クラス識別写像構成処理部B14は、入力された第1種特徴量に基づいて画像のクラス識別特徴量を計算する(ステップS6−3)。この計算処理は、図5のステップS5−1からS5−3の処理に順ずるものであるが、本方法では、既に学習している画像についての第2種特徴量は学習時に得られた値に固定しておき、対象画像についての第2種特徴量のみを、上記した順序関係保存写像構成処理部B6による(ア)〜(オ)の処理に従って計算することを特徴としている。このように計算された識別画像についての第2種特徴量は、クラス識別処理部B12に出力される。クラス識別処理部B12は、上記と同様に、入力された第2種特徴量に基づいて、対象画像がどのクラスタに属するかを判定する(ステップS6−4)。対象画像のクラス識別処理については、学習用画像に対して与えられたクラス分類結果に基づいて、第2種特徴量の空間におけるK最近傍法により対象画像のクラスを判定することもできる。この判定結果は、クラス識別結果出力部B13に出力される(ステップS6−5)。
【0107】
以下に、本画像処理システムにおいて、(準)教師ありで入力画像のクラスを分類・識別する処理方法について、図7及び図8を参照しながら説明する。図7において、Iは入力画像の数を表す。本方法では、学習器のタイプは、学習用画像に対する第1種特徴量から予め与えられた学習用画像に対するクラスを与える写像を学習することができる教師あり学習アルゴリズムが適用されてさえいれば、ニューラルネットワークやサポートベクターマシン、あるいはK最近傍法やK平均法に基づく学習器などから任意のものを選択できる。また、オンライン学習とバッチ学習のどちらにも使用することができる。
【0108】
まず、学習用画像を読み込み(ステップS7−3)、その画像の第1種特徴量を計算する(ステップS7−4)。これらの処理は、上記と同様にして実行されるものとする。本画像処理システムは、順序関係保存写像構成処理部B6により学習用画像の第1種特徴量を計算した後、適用されている学習アルゴリズムがオンライン学習であるかどうかを判断し(ステップS7−5)、オンライン学習である場合には、計算した学習用画像の第1種特徴量を学習処理部B16に出力する。学習処理部B16は、学習用画像の第1種特徴量が入力されるごとに、オンライン学習処理を行い、その時点で学習されている学習器のパラメタ値を学習器パラメタ記憶部B17に出力する。また、学習処理部B16は、学習器が内部状態を持つ場合には、学習器の内部状態の値を学習器状態記憶部B18に出力する(ステップS7−7)。適用されている学習アルゴリズムがバッチ学習である場合には、学習用画像の第1種特徴量は第1種特徴量記憶部B7に出力されるとともに、画像数Iがカウントアップされる(ステップS7−8)。
【0109】
すべての学習用画像が読み込まれて、ステップS7−3からステップS7−8までの処理が行われた後、バッチ学習アルゴリズムを適用している場合には、すべての学習用画像に対して一括してバッチ学習処理を行い(ステップS7−10)、その結果を学習器パラメタ記憶部B17及び学習器状態記憶部B18に出力する。最後に、学習結果の保存処理が行われて(ステップS7−11)処理が終了する。
【0110】
次に、クラス分類学習処理を行う方法について説明する。図8において、まず、識別の対象とする画像を読み込み(ステップS8−1)、その画像の第1種特徴量を計算する(ステップS8−2)。これらの処理は、上記と同様にして実行されるものとする。順序関係保存写像構成処理部B6により計算された対象画像の第1種特徴量は、識別処理部B19に出力される。識別処理部B19は、学習器パラメタ記憶部B17及び学習器状態記憶部B18から教師あり学習で得られたパラメタを取得し、これを用いて入力された対象画像の第1種特徴量を特徴写像することにより、画像クラスを識別することができる(ステップS8−3)。
【0111】
このとき、オンライン学習アルゴリズムを適用している場合には、この時点で学習器のパラメタ学習処理を行い、その結果を学習器パラメタ記憶部B17に出力する。また、学習器が内部状態を持っている場合には、現在の学習器の状態を学習器状態記憶部B18に出力する。識別処理部B19によるクラス識別結果は、クラス識別結果出力部へ送られ、処理が終了する。
【0112】
以上、本発明の画像分類学習処理システム及び画像識別処理システムについて、具体的な実施の形態を示して説明したが、本発明はこれらに限定されるものではない。当業者であれば、本発明の要旨を逸脱しない範囲内において、上記各実施形態又は他の実施形態にかかる発明の構成及び機能に様々な変更・改良を加えることが可能である。
【産業上の利用可能性】
【0113】
本発明の画像分類学習処理システム及び画像識別処理システムは、医療システム、監視システム、検査システムおよび高度道路交通システム(Intelligent Transportation Systems;ITS)などにおいて、計測された画像の分類を学習することにより画像中の物体の検出及び認識を可能にするシステムとして利用可能である。
【図面の簡単な説明】
【0114】
【図1】本発明の一実施形態として構築される画像処理システムの内部構成を概略的に示す機能ブロック図である。
【図2】図1に示す画像処理システムのプログラムメモリに含まれる各種のプログラムユニットを概略的に示す機能ブロック図である。
【図3】図1に示す画像処理システムにより教師なしで入力画像のクラスを分類・識別し、その結果を出力するする処理の流れを示すフローチャートである。図中のIは入力画像の数を表す。
【図4】図3のステップS3−3における第1種特徴量計算処理の流れを示すフローチャートである。
【図5】図3のステップS3−6における第2種特徴量計算処理の流れを示すフローチャートである。
【図6】図1に示す画像処理システムにおいて、教師なしで入力画像のクラスを分類・識別する他の処理方法を示すフローチャートである。
【図7】図1に示す画像処理システムにおいて、(準)教師ありで入力画像のクラスを分類・識別する処理方法を示すフローチャートである。図中のIは入力画像の数を表す。
【図8】図1に示す画像処理システムにおいて、(準)教師ありで入力画像のクラスを分類・識別する処理方法を示すフローチャートである。
【図9】図1に示す画像処理システムの部分画像構成処理部により画像データに対する窓を設定する方法を示す図である。
【図10】図1に示す画像処理システムの順序関係保存特徴写像構成処理部により特徴写像が構成される様子を示す図である。
【図11】図1に示す画像処理システムの順序関係保存特徴写像構成処理部により各画像を距離空間における点へと写像した結果の例を示す図である。
【図12】図1に示す画像処理システムのクラスタリング処理部により混合ガウス分布によるクラスタリングを行った結果の例を示す図である。
【図13】図1に示す画像処理システムのクラス識別処理部による入力画像のクラス分類・識別結果の出力例を示す図である。
【符号の説明】
【0115】
100 記録装置
101 表示装置
102 キーボード
103 ポインティングデバイス
104 中央処理装置
105 プログラムメモリ
106 データメモリ
110 画像データ
111 データ入出力ユニット
112 画像特徴量抽出ユニット
113 教師なし画像クラス分類・識別ユニット
114 教師あり画像クラス分類・識別ユニット
115 データ記憶ユニット
【技術分野】
【0001】
本発明は、画像の特徴量に注目した画像分類学習処理システム及びその学習結果を利用した画像識別処理システムに関するものである。
【背景技術】
【0002】
画像のクラス分類を学習し、その学習結果に基づいて画像中の対象物体を識別するための方法として、画像を特徴付ける情報(特徴量)に基づくものがある。このような方法では、特徴量を入力としクラスを出力とするパラメタ表示された写像(クラス識別写像)を用いるが、そのクラス識別写像のパラメタは、既にクラス分類されている学習用画像を教師データ(モデル)として与え、この学習用画像に対する経験リスクが最小化されるようにして定義され(ニューラルネットワーク)、あるいは構造リスクを最大化するようにして定義される(サポートベクターマシン)。いずれの場合にも、画像からヒューリスティックな方法で抽出された特徴量を用いている。ところが、このようにして抽出される特徴量が画像を分類及び識別するにあたって最適な基準となるかどうかは自明ではないので、客観的な評価に基づいて真に最適な特徴量を求めることが重要である。
【0003】
特徴量に基づいて画像のクラス分類を学習し、対象物体を識別するプロセスにおいては、統計的手法によって有用な特徴量を抽出するアプローチが知られている。特に、画像から線形変換によって得られるような特徴量を抽出するものとして、(1)主成分分析(Principal Component Analysis;PCA)や重判別分析(Multiple Discriminant Analysis;MDA)を用いるものなどが一般的である。例えば、特許文献1や特許文献2には、適応学習型汎用画像計測方法及び適応学習型汎用画像計測装置が記載されている。ところが、対象物体や背景(環境)の条件などによっては、線形性の仮定が成り立たないこともあり、画像からの線形変換によって常に画像の分類及び識別に有用な特徴量が得られるとは限らない。このような場合に対処する方法としては、(2)ニューラルネットワークや非線形変換を行った後に主成分分析を行う方法がある。但し、これらの手法では、非線形変換の形を予め仮定する必要があるが、抽出すべき特徴量が予め仮定した非線形変換と異なる場合には、適切な特徴量を得ることができない。そこで、どのような非線形変換を行うかを予め仮定しない手法として、(3)自己組織化写像(Self-Organizing Maps;SOM)を用いる手法や、計量的多次元尺度構成法(Multi Dimensional Scaling;MDS)などのクラスタリングを行う手法がある。例えば、特許文献3には、特徴空間の階層的クラスタリングを行う類似画像表示方法が記載されている。
【特許文献1】特許第2982814号公報。
【特許文献2】特許第2834153号公報。
【特許文献3】特開2000−311246号公報。
【非特許文献1】田口善弘他,2001年,「非計量多次元尺度構成法への期待と新しい視点」,統計数理第49巻第1号,p133-153。
【発明の開示】
【発明が解決しようとする課題】
【0004】
しかしながら、従来技術(1)で説明した手法では、特徴量が画像情報に関する線形変換として与えられることを仮定しているが、そのような仮定が一般的に成り立つとは限らないので、適用できる対象が限られてしまうという問題がある。
【0005】
また、従来技術(2)で説明した手法では、非線形変換によって得られる特徴量を扱うことができるが、抽出すべき特徴量が予め仮定した特徴量と異なる場合には、適切な結果を得ることができないという問題がある。
【0006】
また、従来技術(3)で説明した手法では、非線形変換を予め仮定する必要はないが、特徴量の成す空間に計量を与えなければならず、解析結果はこの計量に大きく影響される。しかしながら、求めるべき特徴空間に計量をどのように与えれば良いかは自明ではないので、設定した計量が不適切であった場合には、精度が悪くなるという問題がある。さらに、SOMの場合には、特徴空間が離散的な格子によって表されるため、離散化に伴う誤差が大きく影響する可能性がある。
【0007】
また、画像処理において、画像計測装置による解像度などの違い、対象物体の変化、オクルージョンや環境(背景)の突然の変化などによるノイズが発生するが、これらは統計的に扱うことは困難である。上記した従来技術はずれもデータを計量的に扱っているため、このようなノイズの発生に対するロバスト性が低いという問題がある。また、このような大きなノイズの影響を画像に対する前処理において十分に補正することも困難である場合が多い。
【0008】
さらに、MRI画像のような3次元画像に対して、従来の手法を適用する際には、特徴量を抽出するために、一度、2次元の断面画像を取ってから解析を行い、再度3次元の情報に組み直す必要性があるが、このような場合には、断面間のグローバルな特徴を抽出するのが困難である。また、近年のMRI画像計測技術の発展によって、テンソル値の3次元画像を取得することも出来るようになっているが、テンソル値(行列値)のデータは色相や輝度のようなデータとは異なり、各成分自体の値よりも、行列式、固有値およびトレースなどの量の方に本質的な意味があり、従来手法のような平均輝度やエッジ強度のような特徴量は有効な特徴量とはならない場合が多い。
【0009】
本発明は、このような従来技術における問題点に鑑みてなされたものであり、画像のクラス分類学習処理システム及びその学習結果を用いた画像識別処理システムであって、適切な特徴量をより客観的な規準によって抽出することにより、画像の解像度の違い、対象物体の変化、オクルージョンや環境の突然な変化などに対してロバストなクラス分類学習及び画像識別を行うことができるシステムを提供しようとするものである。
【課題を解決するための手段】
【0010】
本発明者は、上記の課題を解決するために、まず画像の大きさに比べて十分に小さく予め定められた形状の領域(窓)を、この窓が画像全体を覆うように設定し(窓はお互いに重なりあっても良いし、重なりがないようにしても良い)、それぞれの窓から画像の小領域を切り出した部分画像の集合を作成し、切り出されたすべての部分画像同士の間にそれらの間の非類似度(あるいは類似度)に相当するような順序関係を定義し、この順序関係のみに基づいて各部分画像を任意の距離空間における点へと写像し、このようにして写像された距離空間における点の位置座標ベクトルの直積又はテンソル積を画像についての特徴量とすることにより、統計的に客観的であり、かつ、ノイズ、環境変動、画像中の識別対象のオクルージョンなどに対してロバストである画像のクラス分類学習およびクラス識別を行うことができることに想到した。
【0011】
従来技術で説明した手法に比べ、本発明では、特に、従来技術(1)で説明した手法に比べ、写像元における非類似度あるいは類似度といった量の間の順序関係のみを使用すること、順序関係のみが大切なので、ノイズや環境の明るさの変動などに対してロバスト性が高いこと、先の非類似度あるいは類似度のスケールの選び方にも依存しないため、写像先の空間における距離スケールすなわち計量の定義に影響されずに、精度高く写像を構成することができること、かつ写像が非線形であっても適用することができること、さらに、従来技術(2)で説明した手法に比べ、予め非線形写像の形を決めておく必要がないため、任意の形の非線形写像を構成することができること、また、従来技術(3)で説明した手法に比べ、写像先の空間は連続空間として扱うことができ、自己組織化写像のように空間を離散化することによる写像の精度の悪化はないこと、かつ、距離スケールすなわち計量の定義に依存しないため、自己組織化写像及び計量的多次元尺度構成法のように精度良く写像を構成するためには、距離スケールを非常に正確に調整しなければならないというような問題に影響されなくなることに特徴を有している。
【0012】
さらに、ノイズ削除、輝度補正、背景変動補正などの画像に対する前処理を実行しなくとも、これらの影響を受けずに処理を行うことが出来るため、計算コストを大きく削減することが可能であることにおいても特徴を有している。
【0013】
さらに、MRI画像のような3次元画像に対しても、本発明では、3次元画像を2次元の断面に分割する必要性はなく、3次元画像のまま、解析を行うことが可能であり、また、近年のMRI画像計測技術の発展によって、テンソル値の3次元画像を取得することも出来るようになっているが、このようなテンソル値のデータであっても客観的に本質な特徴量を抽出することができるようになることにおいても特徴を有している。
【0014】
以上のような特徴を実現するための手段として、本発明は、画像のクラス分類を学習するシステムであって、学習用画像の対象領域に対して、該対象領域全体を覆うようにして1以上の所定形状の窓領域を設定する窓領域設定手段と、前記各窓領域に含まれる部分画像の集合から、互いに異なる2つの部分画像の組を生成し、各組の部分画像間における類似度又は非類似度を、各部分画像から抽出される特徴量に基づいて計算する部分画像間類似度計算手段と、前記部分画像間の類似度又は非類似度に基づいて前記各部分画像の組の間での順序関係を決定する第1の順序関係決定手段と、前記各部分画像の組の間で決定された順序関係が保存されるようにして、前記各部分画像を第1の距離空間上に写像する第1の写像手段と、前記第1の距離空間に写像された各点の位置座標の直積又はテンソル積を各学習用画像の第1種特徴量とし、各学習用画像の第1種特徴量に基づいて、画像間の非類似度又は類似度を計算する画像間類似度計算手段と、前記学習用画像間の非類似度又は類似度に基づいて前記各学習用画像の組の間での順序関係を決定する第2の順序関係決定手段と、前記各学習用画像の組の間で決定された順序関係が保存されるようにして、前記各学習用画像を第2の距離空間上に写像する第2の写像手段と、前記第2の距離空間に写像された各点の位置座標ベクトルを各学習用画像の第2種特徴量とし、前記第2の距離空間上に写像された点から、前記第2の距離空間における距離又は分布密度に基づいてクラスタを構成するクラスタリング手段と、各クラスタをクラス分類するとともに、各クラスタに属する点に対応する学習用画像を前記第2の写像手段による写像の逆写像によって求めることにより、各学習用画像がどのクラスに属するかを判定するクラス分類判定手段と、を含むことを特徴とするシステムを提供するものである。
【0015】
本発明のシステムにおいて、前記クラスタリング手段は、全クラスタ数を予め指定せず、あるいは、全クラスタ数を予め指定してクラスタリングを行うことを特徴とする。
【0016】
本発明は、また、上記の画像クラス分類学習システムにおいて、学習用画像について計算された第1特徴量及び第2特徴量と、クラス分類の判定結果とを予め記憶しておき、前記画像間類似度計算手段により、前記入力画像の第1種特徴量を計算し、該第1種特徴量と学習用画像の第1種特徴量とを用いて、前記入力画像と前記学習用画像との間の非類似度又は類似度を計算し、前記第2の順序関係決定手段により、該非類似度又は類似度に基づいて前記入力画像と前記学習用画像との間の順序関係を決定し、前記第2の写像手段により、前記入力画像と前記学習用画像との間で決定された順序関係が保存されるようして、前記入力画像を第2の距離空間上に写像し、前記画像間類似度計算手段により、前記入力画像が前記第2の距離空間に写像された各点の位置座標ベクトルを前記入力画像の第2種特徴量とし、前記入力画像の第2種特徴量と前記記憶してある学習用画像の第2特徴量との間の非類似度又は類似度を計算し、該非類似度又は類似度に基づいて、入力画像が学習用画像のいずれのクラスに該当するかを識別することを特徴とするシステムを提供するものである。
【0017】
本発明は、また、上記の画像クラス分類学習システムにおいて、学習用画像について計算された第1特徴量及び第2特徴量と、クラス分類の判定結果とを予め記憶しておき、前記画像間類似度計算手段により、前記入力画像の第1種特徴量を計算し、該第1種特徴量と学習用画像の第1種特徴量とを用いて、前記入力画像と前記学習用画像との間の非類似度又は類似度を計算し、前記第2の順序関係決定手段により、該非類似度又は類似度に基づいて前記入力画像と前記学習用画像との間の順序関係を決定し、前記第2の写像手段により、前記入力画像と前記学習用画像との間で決定された順序関係が保存されるようして、前記入力画像を第2の距離空間上に写像し、前記第2の距離空間において前記入力画像が写像された点と距離が近い順に所定数の学習用画像を選択し、選択された学習用画像のうち最も多くの学習用画像が属するクラスを入力画像のクラスとして識別することを特徴とするシステムを提供するものである。
【0018】
本発明は、また、上記の画像クラス分類学習システムにおいて、クラス分類済みの学習用画像の第1種特徴量を計算し、該第1種特徴量を入力して得られるクラス分類判定結果と、クラス分類済み学習用画像のクラスとの差に関する関数を全てのクラス分類済み学習用画像について足し上げた誤差関数を算出し、該誤差関数が最小化されるように前記第2の写像手段による写像のパラメタを定めることを特徴とする。
【0019】
本発明のシステムにおいて、前記第2の写像手段による写像は、ニューラルネットワークを用いて構成されることを特徴とする。
【0020】
本発明は、また、上記のシステムにおいて、さらに、入力画像の第1種特徴量を計算し、該第1種特徴量を入力して得られるクラス分類判定結果に従って前記入力画像のクラスを識別することを特徴とするシステムを提供するものである。
【0021】
本発明は、また、上記のシステムにおいて、クラス分類済みの学習用画像の第1種特徴量を計算し、該第1種特徴量を入力して得られるクラス分類判定結果における各クラスについて、クラス分類済み学習用画像をそのクラスに属する群と他のクラスに属する群とに分け、それぞれの群について、各学習用画像の第1特徴量を第3の距離空間に写像し、その写像された像を第3種特徴量とし、該第3種特徴量に関する線形な判別関数であって、一方の群に属する学習用画像の第3特徴量に関しては、前記判別関数の値がある定められた正の定数以上の値となり、他方の群に属する学習用画像の第3特徴量に関しては、前記判別関数の値が前記正の定数と絶対値が等しい負の定数以下の値となり、かつ、前記判別関数の値を0と置いた方程式により表される第3の距離空間上の超平面と各学習用画像の第3特徴量との間の距離を最小化するようパラメタをとった判別関数を定めることを特徴とするシステムを提供するものである。
【0022】
本発明は、また、上記のシステムにおいて、入力画像の第1種特徴量を計算し、該第1種特徴量から得られる第3種特徴量についての前記判別関数の値が最大値となることを基準として、前記入力画像のクラスを識別することを特徴とするシステムを提供するものである。
【0023】
本発明のシステムにおいて、前記第3の距離空間への写像は、サポートベクターマシン、非線形サポートベクターマシン又はカーネルサポートベクターマシンを用いて構成されることを特徴とする。
【0024】
本発明のシステムにおいて、前記クラスタリング手段は、混合確率分布を用いた尤度あるいは対数尤度最大化する処理、事後確率を最大化する処理、あるいは予め与えられた事前分布に基づく期待値を計算する処理のいずれかの処理を実行することを特徴とする。
【0025】
本発明のシステムにおいて、前記クラスタリング手段は、混合ガウス分布に関する最尤推定法、事後確率最大化法あるいはベイズ推定法を適用することによって定まる各ガウス成分が1つのクラスを表すとし、各部分画像が属するクラスタをその部分画像に対応する距離空間における点の各ガウス成分に関するマハラノビス距離が最小となるガウス成分として定めることを特徴とする。
【0026】
本発明のシステムにおいて、前記クラスタリング手段は、初期状態として全データを含む1つのクラスタから開始し、同じクラスタに属する2点間の距離が最大となる2点組を選択し、その距離が予め定められた閾値以上である場合に、そのクラスタを2分し、選択された2点をそれぞれのクラスタの種とし、同じクラスタに属していた全ての点に関して、これらのクラスタの種との間の距離を計算し、距離が小さい方のクラスタに属するように分類する処理を各クラスタにおけるクラスタ分割条件が満たされなくなるまで実行する分割クラスタリングを適用することを特徴とする。
【0027】
本発明のシステムにおいて、前記クラスタリング手段は、K-最近接法又はK-平均法を実行するクラスタリングを行うことを特徴とする。
【0028】
本発明のシステムにおいて、前記第1の写像手段及び第2の写像手段のうち少なくとも一方は、前記部分画像/学習用画像の組の間で決定された順序関係のみに基づいて写像を行うことを特徴とする。
【0029】
本発明のシステムにおいて、前記第1の写像手段及び第2の写像手段のうち少なくとも一方は、前記部分画像/学習用画像の組の間で決定された順序関係に基づいて各部分画像/学習用画像の組に自然数による番号付けを行い、それらの番号の差の大きさのみに基づいて写像を行うことを特徴とする。
【0030】
本発明のシステムにおいて、前記第1の写像手段及び第2の写像手段のうち少なくとも一方は、前記部分画像/学習用画像の組が前記第1の距離空間/第2の距離空間に写像された点の組の2点間距離を計算するとともに、前記写像された点の組について補助距離の大小関係によって定められる順序関係が、前記部分画像/学習用画像の組の間で決定された順序関係と一致するようにして、前記2点間距離の補助距離を計算し、前記写像される点の組における2点間距離と補助距離との差の自乗を全ての前記写像される点の組について足し合わせた値が最小化されるようにして写像を行うことを特徴とする。
【0031】
本発明のシステムにおいて、各組の部分画像間における類似度又は非類似度は、各部分画像上の各画素の位置情報と、画素上の色相又は濃淡値とを与える関数の汎関数として定義されていることを特徴とする。
【0032】
本発明のシステムにおいて、各組の部分画像間における類似度又は非類似度は、画像が画像間の差分又はマッチングによって生成された差分画像、オプティカルフロー画像、ステレオ画像のいずれかである場合には、各部分画像上の各画素の位置情報と、画素上の差分値、ベクトル値又は距離値とを与える関数の汎関数として定義されていることを特徴とする。
【0033】
本発明のシステムにおいて、各組の部分画像間における類似度又は非類似度は、各部分画像上の各画素の位置情報と、画素上の色相又は濃淡値とについてのヒストグラム関数の汎関数として定義されていることを特徴とする。
【0034】
本発明のシステムにおいて、各組の部分画像間における類似度又は非類似度は、各部分画像上の各画素の位置情報と、画素上の色相又は濃淡値とを与える関数に画像上の空間座標に関する微分演算子を作用させることで得られるベクトル値関数に関する汎関数として定義されていることを特徴とする。
【0035】
本発明のシステムにおいて、各組の部分画像間における類似度又は非類似度は、各部分画像上の各画素の位置情報と、画素上の色相又は濃淡値とを与える関数に画像上の空間座標に関する積分演算子を作用させることで得られる関数に関する汎関数として定義されていることを特徴とする。
【0036】
本発明のシステムにおいて、各組の部分画像間における類似度又は非類似度は、各部分画像上の各画素の位置情報と、画素上の色相又は濃淡値とを与える関数に画像上の空間座標に関する微分演算子をさせることで得られるベクトル値関数を引数とする2階テンソル値関数に関して、その各成分に画像上の空間座標に関する積分演算子を作用させることで得られる2階テンソル値関数に関する汎関数として定義されていることを特徴とする。
【0037】
本発明のシステムにおいて、各組の部分画像間における類似度又は非類似度は、各部分画像上の各画素の位置情報と、画素上の色相又は白黒の濃淡値とを与える関数の自己相関関数に関する汎関数として定義されていることを特徴とする。
【0038】
本発明のシステムにおいて、各組の部分画像間における類似度又は非類似度は、各部分画像上の各画素の位置情報と、画素上の色相又は濃淡値とを与える関数に画像上の空間座標に関する微分演算子を作用させることで得られるベクトル値関数に関する自己相関関数に関する汎関数として定義されていることを特徴とする。
【発明の効果】
【0039】
以上、説明したように、本発明の画像分類学習処理システム及び画像識別処理システムによれば、客観性の高い規準に従って画像が持つ統計的な特徴量が抽出されるので、この特徴量を用いて対象画像のクラス分類の教師あり学習又は教師なし学習処理やクラス識別処理を行うと、画像に含まれる対象物体の違い、変化、オクルージョン及び環境の変動に対してロバスト性が高い画像処理を行うことができる。また、そのロバスト性の高さから、画像の解像度の違いや、各種の統計的又は非統計的なノイズ、環境の状態の大きな変化があっても、特別な前処理を行う必要はないため、広範囲の対象画像について適用することができる。
【0040】
また、3次元以上の画像中における空間的な構造を特徴づける特徴量を抽出することができるようになる。さらには、テンソル値(行列値)の画像(2次元及び3次元以上)であっても、画像を特徴づける特徴量を抽出することができるようになる。
【発明を実施するための最良の形態】
【0041】
以下、添付図面を参照しながら、本発明の画像分類学習処理システム及び画像識別処理システムを実施するための最良の形態を詳細に説明する。図1〜図13は、本発明の実施の形態を例示する図であり、これらの図において、同一の符号を付した部分は同一物を表わし、基本的な構成及び動作は同様であるものとする。
【0042】
図1は、本発明の一実施形態として構築される画像クラス分類学習及び画像認識を行う画像処理システムの内部構成を概略的に示す機能ブロック図である。この画像処理システムは、画像データを保存する記録装置100、ユーザに対するインタフェース画面や画像データを分類又は認識した結果などを表示するための表示装置101、ユーザからの操作入力を受け付けるためのキーボード102とマウスなどのポインティングデバイス103、画像クラス分類学習及び画像認識に必要な演算処理、制御処理等を行う中央処理装置104、画像クラス分類学習及び画像認識の処理に必要なプログラムを格納するプログラムメモリ105、処理の対象となる画像データ110を格納するデータメモリ106を備えている。
【0043】
プログラムメモリ105は、データ入出力ユニット111、画像特徴量抽出ユニット112、教師なし画像クラス分類・識別ユニット113、教師あり画像クラス分類・識別ユニット114、データ記憶ユニット115を含んでいる。これらのプログラムユニットの機能ブロック図を図2に示す。
【0044】
図2において、プログラムメモリ105のデータ入出力ユニットは、画像入力処理部B1、クラス識別結果出力部B13、クラス分類結果出力処理部B15を含んでおり、画像特徴量抽出ユニット、データ記憶ユニットは、画像処理部B2、部分画像構成処理部B4、部分画像間非類似度計算処理部B5、順序関係保存写像構成処理部B6、画像間非類似度計算処理部B8を含んでおり、教師なし画像クラス分類・識別ユニットは、クラスタリング処理部B10、クラス識別処理部B12、クラス識別写像構成処理部B14を含んでおり、教師あり画像クラス分類・識別ユニットは、学習処理部B16、識別処理部B19を含んでおり、データ記憶ユニットは、入力画像記憶部B3、第1種特徴量記憶部B7、第2種特徴量記憶部B9、クラスタデータ記憶部B11、学習器パラメタ記憶部B17、学習器状態記憶部B18、を含んでいる。
【0045】
以下において、これらの処理部における処理を詳細に説明する。まず、教師なしで画像クラス分類学習及び画像認識を行う処理について説明し、続いて、教師ありで画像クラス分類学習及び画像認識を行う処理について説明する。
【0046】
画像入力処理部B1は、記録装置100などから処理対象となる画像データをデータメモリ106に取得する。以下においては、2次元画像を処理対象とする場合について説明するが、本発明の画像処理システムでは3次元画像であってもこれと同様に処理を実行することができる。
【0047】
画像処理部B2は、取得した対象画像がカラー画像である場合には、グレースケール画像への変換、輝度正規化、ヒストグラム平滑化、サイズ変更、ノイズ低減などの各種フィルタリング処理を行うものとする。但し、これらの画像処理は必ずしも行う必要があるものではなく、画像入力処理部B1により取得した画像データをそのまま用いて以下の処理を行ってもよい。従来技術では、ここで輝度の正規化処理などを行わないと以下の処理に重大な影響を与えることとなるが、本発明の画像処理システムは、ここで輝度の正規化処理を行わなくとも以下の処理に問題が生じないという点でロバスト性が高いシステムである。ここでは、取得した画像データはRGB値で表されるカラー画像データであり、画像処理部B2では特に上記したような画像処理を行わないものとする。画像処理部B2による処理後の画像は、入力画像記憶部B3により記憶される。
【0048】
部分画像構成処理部B4は、画像データ全体を覆うように窓を設定して、複数の部分画像を構成する。ここで、画像データに対する窓の設定方法を図9に示す。図9に示す窓の設定方法は、注目領域が画像全体であり窓が矩形である場合の例であり、図9(a)に示すように窓はお互いに交差しないように設定されていても良く、あるいは図9(b)に示すようにお互いに交差するものがあるように設定されていても良い。また、窓の形も図9のような矩形ではなくても、注目領域全体を覆うことができるようになっていれば、形は任意で構わない。以下の処理では、図9(a)に示すような窓の設定方法を採用するが、部分画像の大きさは原理的にはかならずしも全て同じではなくても良い。
【0049】
部分画像間非類似度計算処理部B5は、構成された各部分画像からヒストグラムやエッジ強度などの特徴量を抽出する。但し、特に特徴抽出せずに、与えられた部分画像そのものを特別な場合における特徴量として使用してもよい(その場合、ここでは一切処理は行うことはない)。非類似度の計算用に良く利用される特徴量としては、平均輝度と分散又はエッジ強度やテクスチャー構造を特徴づける共起(co-occurrence)行列、ランレングス・コード(run-length code)、フラクタル次元、窓フーリエ変換係数、ウェーブレット変換係数、輝度や色相のヒストグラムなどがある。
【0050】
部分画像間非類似度計算処理部B5は、さらに、お互いに異なるように選ばれた2つの部分画像からなる組全体について、各組に属する2つの部分画像間の非類似度を計算する。非類似度としては、部分画像組全体から順序集合上への任意の写像を使用することができる。対象画像に応じて、適切な非類似度が与えられれば良い。以下の説明では、順序集合として、特に、実数を使用するものとする。今、各部分画像をCi (i=1,2,...,N) と表す。Nは部分画像構成処理部B4において、切り出された部分画像の数(すなわち設定された窓の数)を表す。部分画像Ciに属する画素をkと表し、部分画像Cj に属する画素をlと表し、画素kにおけるRGBの値をそれぞれRk 、Gk、Bk と表すことにする。非類似度としては、2つの部分画像それぞれに属する画素値すべてから実数への任意の関数が使用できる。例えば、画像の領域の平行移動や回転に対して不変性が高い非類似度の与え方としては、(1)式に示すような関数dが使用できる。
【0051】
【数1】
あるいは、部分画像内の画素値に関する直積ベクトルを作成して、(12)式に示すような正規化ベクトル距離、カラーヒストグラムに関するハミング距離又はユークリッド距離、カラーヒストグラムインターセクションのような量を非類似度として用いてもよい。このようにして与えられた非類似度に基づいて、部分画像組全体からなる集合の上に順序関係が、非類似度が写像する順序集合上において定義されている順序関係によって自然に定義される。このように、部分画像間非類似度計算処理部B5では、各部分画像の組の間に順序関係が定義される。この順序関係を与える順序関数δを(2)式のように表す。
【0052】
【数2】
順序関数は(3)式のような関係を満たすものである。
【0053】
【数3】
【0054】
このように任意の2つのお互いに異なる部分画像の組の間に順序関係が定義された部分画像の集合は、順序関係保存特徴写像構成処理部B6において写像処理されることとなる。
【0055】
順序関係保存特徴写像構成処理部B6は、部分画像の集合をある距離空間の点の集合に1対1で写像する。ここで写像に関しては、写像によって写される距離空間上の点全体からなる集合から選ばれるお互いに異なる2点の組合せ全体がなす集合上に、2点間の距離に基づいて与えられる、お互いに異なる2点の組の全体からなる集合上に定義される順序関係が、写像元の部分画像のお互いに異なる2つの部分画像の組全体からなる集合対して、部分画像間非類似度計算処理部B5において計算される順序関係と一致するように選ばれていれば、任意の写像を使用することができる。以下では、このような写像を「特徴写像」と呼ぶ。例えば、非計量多次元尺度構成法を用いて、このような写像の一つを構成することができる。特に、以下の処理では、非計量的多次元尺度構成法を部分画像の全体からなる集合上から選ばれたお互いに異なる2つの部分画像の組合せ全体からなる集合上に定義される順序関係のみを用いて特徴写像を構成する方法(非特許文献1参照)に従う。
【0056】
特徴写像を構成するために、まず、部分画像Ci が写される距離空間上の点の位置座標をランダムに初期状態として選び、ベクトル
【0057】
【数4】
で表す。お互いに異なる2つの部分画像の組から成る集合上における順序関係を順序が小さいものから順に1,2,...,Nと番号をつけるものとする。つまり、ある部分画像組(Ci, Cj)の写像元での順番がmであったとき、順序関数δ(Ci, Cj)の値はmで与えられ、(4)式のように表すことができる。
【0058】
【数5】
同様に、位置ベクトル
【0059】
【数6】
から選ばれるお互いに異なる2つの位置ベクトルの組合せ全体から成る集合上に、位置ベクトル
【0060】
【数7】
間の距離
【0061】
【数8】
の大小関係に基づいて順序関係を定義し、順序が小さいものから順に1,2,...,N番号が付けるものとする。この順序関係を与える順序関数をηとおく。つまり、位置ベクトルの組
【0062】
【数9】
の順序がnであったとき、順序関数
【0063】
【数10】
の値はnで与えられ、(5)式のように表すことができる。
【0064】
【数11】
部分画像組(Ci, Cj)の写像元での順位がmで与えられるとき、写像先での位置座標の組
【0065】
【数12】
の順位をTm と置く。つまり、(6)式のように表すことができる。
【0066】
【数13】
目的の特徴写像を構成するためには、以下の手順(ア)〜(オ)に従う。
(ア)以下の(7)式に定義する行列の成分を対角成分以外のすべてについて計算する。(対角成分はすべて0と置いても良い。)ここで、mは部分画像の組(Ci, Cj)の順位を表し、Tm は(6)式で定義される位置ベクトルの組
【0067】
【数14】
の順位を表す。
【0068】
【数15】
【0069】
(イ)位置ベクトル
【数16】
それぞれについて以下の(8)式で与えられる差分ベクトル
【0070】
【数17】
を計算する。
【0071】
【数18】
(8)式におけるμは更新率で小さい正の数である。
【0072】
(ウ)手順(イ)で求めた差分ベクトルによって、位置ベクトルを以下の(9)式のように更新する。
【数19】
【0073】
(エ)更新された位置ベクトル
【数20】
を
【0074】
【数21】
と置きなおし、以下の(10)式が満たされるように、位置ベクトル
【0075】
【数22】
のスケールを変換する。
【0076】
【数23】
【0077】
(オ)手順(ア)〜(エ)を終了条件が満たされるまで繰返し行う。例えば、(7)式で与えられる行列Di,j の全ての非対角成分がすべて0となるか、予め決めた最大繰返し数に達するまで繰り返す。
【0078】
以上のようにして、順序関係保存特徴写像構成処理部B6により特徴写像が構成される。この処理の様子を図10に示す。図10(b)は、2次元のユークリッド空間に写像する特徴写像の例である。本画像処理システムでは、このようにして対象画像の各部分画像から写像された距離空間上の点の位置座標ベクトルの直積又はテンソル積を取ったものを、その対象画像についての第1種特徴量と定義する。順序関係保存特徴写像構成処理部B6は、写像結果から対象画像の第1種特徴量を計算し、第1種特徴量記憶部B7に出力する。第1種特徴量記憶部B7はこの第1種特徴量を記憶する。
【0079】
画像間非類似度計算処理部B8は、第1種特徴量記憶部B7により記憶されている画像の第1種特徴量から、それらの画像間の非類似度を計算する。画像間の非類似度としては、部分画像組全体から順序集合上への任意の写像を使用することができる。対象画像に応じて、適切な非類似度が与えられれば良い。以下の説明では、順序集合として、特に、実数を使用するものとする。今、A番目の画像に対する第1種特徴量を(11)式に示すような直積であるとすると、
【0080】
【数24】
画像IA とIB の間の非類似度として、例えば、(12)式に示すような各画像に対する第1種特徴量間の差分ベクトルの大きさ(但し、ここでは大きさを規格化してベクトル間の角度に相当する量に置き換えている)を表す関数eを使用することができる。
【0081】
【数25】
ここで、(10)式の規格化処理によって、(12)式ではゼロによる割算の問題は生じないことに注意する。(11)式の直積の各成分を一様に回転することで得られるものは同等であるという同値関係を使用する場合には、(12)を(13)式のように修正しても良い。
【0082】
【数26】
(13)式において、Tは(11)式の直積の各成分に関する回転を行う行列を表し、
【0083】
【数27】
は(14)式で示すように、直積ベクトル
【0084】
【数28】
の各成分に回転Tを作用させることで得られる直積ベクトルを表す。
【0085】
【数29】
【0086】
再び順序関係保存写像構成処理部B6は、上記のようにして(12)式又は(13)式により定義される画像間の非類似度に基いて、上記で第1種特徴量を計算したのと同じ手順により、各画像を距離空間における点へと写像(特徴写像)する。これにより距離空間において得られる点の集合の例を図11に示す。本画像処理システムでは、このようにして写像された点の位置座標ベクトルを、画像についての第2種特徴量と定義する。この第2種特徴量は、第2種特徴量記憶部B9により記憶されるとともに、クラスタリング処理部B10に出力される。
【0087】
クラスタリング処理部B10は、入力された画像についての第2種特徴量を表すベクトル
【0088】
【数30】
の配置に関するクラスタリングを行う。クラスタリング手法としてはクラスタ数を予め与える必要のない混合ガウス分布などの混合確率分布を用いた最尤推定法のようなクラスタリング手法が良いが、位置ベクトル間の距離を用いたdivisive clusteringなどを用いても良い。
【0089】
混合ガウス分布を使用する場合には、第2種特徴量の配置
【数31】
は、(15)式で表されるような混合ガウス分布からランダムに選ばれたI個の点であると見なす。
【0090】
【数32】
(15)式において、Jは特徴写像の写像先の距離空間の次元を表し、Lはガウス分布の成分数を表し、
【0091】
【数33】
は各ガウス分布成分のそれぞれ平均値ベクトル、共分散行列を表し、Θl-1 は共分散行列Θl の逆行列を表し、|Θl|は共分散行列Θlの行列式を表し、λl は各ガウス分布成分の重みを表し、以下の(16)式を満たす。
【0092】
【数34】
【0093】
各ガウス分布成分が1つのクラスタを表す。このとき、位置ベクトルの配置
【数35】
に関する対数尤度関数
【0094】
【数36】
は(17)式で表される。
【0095】
【数37】
【0096】
この対数尤度関数
【数38】
をパラメタ
【0097】
【数39】
について最適化することで、目的のクラスタ数およびクラスタ位置とサイズとが計算される。最適化手法としては、例えば、Greedy-EMアルゴリズム(J. Verbeek, N. Vlassis, and B. Krose, Neural Computation Vol.15, No.2, pages 469-485, 2003.)が使用できる。
【0098】
この混合ガウス分布によるクラスタリング結果の例を図12に示す。図12において、楕円は同一のクラスタに属する点を囲んでいる。以上のようにして、クラスタリング処理部B10は、順序関係保存写像構成処理部B6により計算された各画像についての第2種特徴量
【0099】
【数40】
の配置に関するクラスタリングを行う。クラスタリングを行った結果は、クラスタデータ記憶部B11により記憶され、各画像についての第2種特徴量
【0100】
【数41】
及びクラスタリング結果はクラス識別処理部B12に出力される。
【0101】
クラス識別処理部B12は、入力された画像についての第2種特徴量及びクラスタリング結果及びに基づいて、各画像がどのクラスタに属するかを計算する。各画像が属するクラスタは、その第2種特徴量
【0102】
【数42】
の各ガウス分布成分に関するマハラノビス距離を計算し、もっともマハラノビス距離が小さくなるガウス成分として決めることができる。第lガウス分布成分で表されるクラスタから位置ベクトル
【0103】
【数43】
までのマハラノビス距離は(18)式で計算される。
【数44】
【0104】
クラス識別処理部B12は、全画像について、それらがどのクラスタに属するかを表すリストを構成し、そのリストをクラス識別結果出力部B13に出力し、クラス分類結果出力処理部B15にクラスタデータを出力する。以上のようにして、本画像処理システムは、教師なしで入力画像のクラスを分類・識別し、その結果を出力することができる。入力画像のクラス分類・識別結果の出力例を図13に示す。
【0105】
尚、以上の処理は、図3に示すフローチャートの手順に従って実行することができる。図3において、Iは入力画像の数を表す。また、図3のステップS3−3における第1種特徴量計算処理は、図4に示すフローチャートの手順に従って実行され、ステップS3−6における第2種特徴量計算処理は、図5に示すフローチャートの手順に従って実行されるものとする。
【0106】
以下に、本画像処理システムにおいて、教師なしで入力画像のクラスを分類・識別する他の処理方法について、図6を参照しながら説明する。本方法では、まず、対象画像を読み込み(ステップS6−1)、その画像の第1種特徴量を計算する(ステップS6−2)。これらの処理は、上記と同様にして実行されるものとする。本画像処理システムの順序関係保存写像構成処理部B6において計算された対象画像の第1種特徴量はクラス識別写像構成処理部B14に出力される。クラス識別写像構成処理部B14は、入力された第1種特徴量に基づいて画像のクラス識別特徴量を計算する(ステップS6−3)。この計算処理は、図5のステップS5−1からS5−3の処理に順ずるものであるが、本方法では、既に学習している画像についての第2種特徴量は学習時に得られた値に固定しておき、対象画像についての第2種特徴量のみを、上記した順序関係保存写像構成処理部B6による(ア)〜(オ)の処理に従って計算することを特徴としている。このように計算された識別画像についての第2種特徴量は、クラス識別処理部B12に出力される。クラス識別処理部B12は、上記と同様に、入力された第2種特徴量に基づいて、対象画像がどのクラスタに属するかを判定する(ステップS6−4)。対象画像のクラス識別処理については、学習用画像に対して与えられたクラス分類結果に基づいて、第2種特徴量の空間におけるK最近傍法により対象画像のクラスを判定することもできる。この判定結果は、クラス識別結果出力部B13に出力される(ステップS6−5)。
【0107】
以下に、本画像処理システムにおいて、(準)教師ありで入力画像のクラスを分類・識別する処理方法について、図7及び図8を参照しながら説明する。図7において、Iは入力画像の数を表す。本方法では、学習器のタイプは、学習用画像に対する第1種特徴量から予め与えられた学習用画像に対するクラスを与える写像を学習することができる教師あり学習アルゴリズムが適用されてさえいれば、ニューラルネットワークやサポートベクターマシン、あるいはK最近傍法やK平均法に基づく学習器などから任意のものを選択できる。また、オンライン学習とバッチ学習のどちらにも使用することができる。
【0108】
まず、学習用画像を読み込み(ステップS7−3)、その画像の第1種特徴量を計算する(ステップS7−4)。これらの処理は、上記と同様にして実行されるものとする。本画像処理システムは、順序関係保存写像構成処理部B6により学習用画像の第1種特徴量を計算した後、適用されている学習アルゴリズムがオンライン学習であるかどうかを判断し(ステップS7−5)、オンライン学習である場合には、計算した学習用画像の第1種特徴量を学習処理部B16に出力する。学習処理部B16は、学習用画像の第1種特徴量が入力されるごとに、オンライン学習処理を行い、その時点で学習されている学習器のパラメタ値を学習器パラメタ記憶部B17に出力する。また、学習処理部B16は、学習器が内部状態を持つ場合には、学習器の内部状態の値を学習器状態記憶部B18に出力する(ステップS7−7)。適用されている学習アルゴリズムがバッチ学習である場合には、学習用画像の第1種特徴量は第1種特徴量記憶部B7に出力されるとともに、画像数Iがカウントアップされる(ステップS7−8)。
【0109】
すべての学習用画像が読み込まれて、ステップS7−3からステップS7−8までの処理が行われた後、バッチ学習アルゴリズムを適用している場合には、すべての学習用画像に対して一括してバッチ学習処理を行い(ステップS7−10)、その結果を学習器パラメタ記憶部B17及び学習器状態記憶部B18に出力する。最後に、学習結果の保存処理が行われて(ステップS7−11)処理が終了する。
【0110】
次に、クラス分類学習処理を行う方法について説明する。図8において、まず、識別の対象とする画像を読み込み(ステップS8−1)、その画像の第1種特徴量を計算する(ステップS8−2)。これらの処理は、上記と同様にして実行されるものとする。順序関係保存写像構成処理部B6により計算された対象画像の第1種特徴量は、識別処理部B19に出力される。識別処理部B19は、学習器パラメタ記憶部B17及び学習器状態記憶部B18から教師あり学習で得られたパラメタを取得し、これを用いて入力された対象画像の第1種特徴量を特徴写像することにより、画像クラスを識別することができる(ステップS8−3)。
【0111】
このとき、オンライン学習アルゴリズムを適用している場合には、この時点で学習器のパラメタ学習処理を行い、その結果を学習器パラメタ記憶部B17に出力する。また、学習器が内部状態を持っている場合には、現在の学習器の状態を学習器状態記憶部B18に出力する。識別処理部B19によるクラス識別結果は、クラス識別結果出力部へ送られ、処理が終了する。
【0112】
以上、本発明の画像分類学習処理システム及び画像識別処理システムについて、具体的な実施の形態を示して説明したが、本発明はこれらに限定されるものではない。当業者であれば、本発明の要旨を逸脱しない範囲内において、上記各実施形態又は他の実施形態にかかる発明の構成及び機能に様々な変更・改良を加えることが可能である。
【産業上の利用可能性】
【0113】
本発明の画像分類学習処理システム及び画像識別処理システムは、医療システム、監視システム、検査システムおよび高度道路交通システム(Intelligent Transportation Systems;ITS)などにおいて、計測された画像の分類を学習することにより画像中の物体の検出及び認識を可能にするシステムとして利用可能である。
【図面の簡単な説明】
【0114】
【図1】本発明の一実施形態として構築される画像処理システムの内部構成を概略的に示す機能ブロック図である。
【図2】図1に示す画像処理システムのプログラムメモリに含まれる各種のプログラムユニットを概略的に示す機能ブロック図である。
【図3】図1に示す画像処理システムにより教師なしで入力画像のクラスを分類・識別し、その結果を出力するする処理の流れを示すフローチャートである。図中のIは入力画像の数を表す。
【図4】図3のステップS3−3における第1種特徴量計算処理の流れを示すフローチャートである。
【図5】図3のステップS3−6における第2種特徴量計算処理の流れを示すフローチャートである。
【図6】図1に示す画像処理システムにおいて、教師なしで入力画像のクラスを分類・識別する他の処理方法を示すフローチャートである。
【図7】図1に示す画像処理システムにおいて、(準)教師ありで入力画像のクラスを分類・識別する処理方法を示すフローチャートである。図中のIは入力画像の数を表す。
【図8】図1に示す画像処理システムにおいて、(準)教師ありで入力画像のクラスを分類・識別する処理方法を示すフローチャートである。
【図9】図1に示す画像処理システムの部分画像構成処理部により画像データに対する窓を設定する方法を示す図である。
【図10】図1に示す画像処理システムの順序関係保存特徴写像構成処理部により特徴写像が構成される様子を示す図である。
【図11】図1に示す画像処理システムの順序関係保存特徴写像構成処理部により各画像を距離空間における点へと写像した結果の例を示す図である。
【図12】図1に示す画像処理システムのクラスタリング処理部により混合ガウス分布によるクラスタリングを行った結果の例を示す図である。
【図13】図1に示す画像処理システムのクラス識別処理部による入力画像のクラス分類・識別結果の出力例を示す図である。
【符号の説明】
【0115】
100 記録装置
101 表示装置
102 キーボード
103 ポインティングデバイス
104 中央処理装置
105 プログラムメモリ
106 データメモリ
110 画像データ
111 データ入出力ユニット
112 画像特徴量抽出ユニット
113 教師なし画像クラス分類・識別ユニット
114 教師あり画像クラス分類・識別ユニット
115 データ記憶ユニット
【特許請求の範囲】
【請求項1】
画像のクラス分類を学習するシステムであって、
学習用画像の対象領域に対して、該対象領域全体を覆うようにして1以上の所定形状の窓領域を設定する窓領域設定手段と、
前記各窓領域に含まれる部分画像の集合から、互いに異なる2つの部分画像の組を生成し、各組の部分画像間における類似度又は非類似度を、各部分画像から抽出される特徴量に基づいて計算する部分画像間類似度計算手段と、
前記部分画像間の類似度又は非類似度に基づいて前記各部分画像の組の間での順序関係を決定する第1の順序関係決定手段と、
前記各部分画像の組の間で決定された順序関係が保存されるようにして、前記各部分画像を第1の距離空間上に写像する第1の写像手段と、
前記第1の距離空間に写像された各点の位置座標の直積又はテンソル積を各学習用画像の第1種特徴量とし、各学習用画像の第1種特徴量に基づいて、画像間の非類似度又は類似度を計算する画像間類似度計算手段と、
前記学習用画像間の非類似度又は類似度に基づいて前記各学習用画像の組の間での順序関係を決定する第2の順序関係決定手段と、
前記各学習用画像の組の間で決定された順序関係が保存されるようにして、前記各学習用画像を第2の距離空間上に写像する第2の写像手段と、
前記第2の距離空間に写像された各点の位置座標ベクトルを各学習用画像の第2種特徴量とし、前記第2の距離空間上に写像された点から、前記第2の距離空間における距離又は分布密度に基づいてクラスタを構成するクラスタリング手段と、
各クラスタをクラス分類するとともに、各クラスタに属する点に対応する学習用画像を前記第2の写像手段による写像の逆写像によって求めることにより、各学習用画像がどのクラスに属するかを判定するクラス分類判定手段と、を含むことを特徴とするシステム。
【請求項2】
前記クラスタリング手段は、全クラスタ数を予め指定せずにクラスタリングを行うことを特徴とする請求項1に記載のシステム。
【請求項3】
前記クラスタリング手段は、全クラスタ数を予め指定してクラスタリングを行うことを特徴とする請求項1に記載のシステム。
【請求項4】
請求項1に記載のシステムを利用して入力画像のクラスを識別するシステムであって、
学習用画像について計算された第1特徴量及び第2特徴量と、クラス分類の判定結果とを予め記憶しておき、
前記画像間類似度計算手段により、前記入力画像の第1種特徴量を計算し、該第1種特徴量と学習用画像の第1種特徴量とを用いて、前記入力画像と前記学習用画像との間の非類似度又は類似度を計算し、
前記第2の順序関係決定手段により、該非類似度又は類似度に基づいて前記入力画像と前記学習用画像との間の順序関係を決定し、
前記第2の写像手段により、前記入力画像と前記学習用画像との間で決定された順序関係が保存されるようして、前記入力画像を第2の距離空間上に写像し、
前記画像間類似度計算手段により、前記入力画像が前記第2の距離空間に写像された各点の位置座標ベクトルを前記入力画像の第2種特徴量とし、前記入力画像の第2種特徴量と前記記憶してある学習用画像の第2特徴量との間の非類似度又は類似度を計算し、
該非類似度又は類似度に基づいて、入力画像が学習用画像のいずれのクラスに該当するかを識別することを特徴とするシステム。
【請求項5】
請求項1に記載のシステムを利用して入力画像のクラスを識別するシステムであって、
学習用画像について計算された第1特徴量及び第2特徴量と、クラス分類の判定結果とを予め記憶しておき、
前記画像間類似度計算手段により、前記入力画像の第1種特徴量を計算し、該第1種特徴量と学習用画像の第1種特徴量とを用いて、前記入力画像と前記学習用画像との間の非類似度又は類似度を計算し、
前記第2の順序関係決定手段により、該非類似度又は類似度に基づいて前記入力画像と前記学習用画像との間の順序関係を決定し、
前記第2の写像手段により、前記入力画像と前記学習用画像との間で決定された順序関係が保存されるようして、前記入力画像を第2の距離空間上に写像し、
前記第2の距離空間において前記入力画像が写像された点と距離が近い順に所定数の学習用画像を選択し、選択された学習用画像のうち最も多くの学習用画像が属するクラスを入力画像のクラスとして識別することを特徴とするシステム。
【請求項6】
請求項1に記載のシステムにおいて、
クラス分類済みの学習用画像の第1種特徴量を計算し、
該第1種特徴量を入力して得られるクラス分類判定結果と、クラス分類済み学習用画像のクラスとの差に関する関数を全てのクラス分類済み学習用画像について足し上げた誤差関数を算出し、
該誤差関数が最小化されるように前記第2の写像手段による写像のパラメタを定めることを特徴とするシステム。
【請求項7】
請求項6に記載のシステムにおいて、前記第2の写像手段による写像は、ニューラルネットワークを用いて構成されることを特徴とするシステム。
【請求項8】
請求項6又は7に記載のシステムを利用して入力画像のクラスを識別するシステムであって、
入力画像の第1種特徴量を計算し、該第1種特徴量を入力して得られるクラス分類判定結果に従って前記入力画像のクラスを識別することを特徴とするシステム。
【請求項9】
請求項1に記載のシステムにおいて、
クラス分類済みの学習用画像の第1種特徴量を計算し、
該第1種特徴量を入力して得られるクラス分類判定結果における各クラスについて、クラス分類済み学習用画像をそのクラスに属する群と他のクラスに属する群とに分け、それぞれの群について、各学習用画像の第1特徴量を第3の距離空間に写像し、その写像された像を第3種特徴量とし、
該第3種特徴量に関する線形な判別関数であって、
一方の群に属する学習用画像の第3特徴量に関しては、前記判別関数の値がある定められた正の定数以上の値となり、
他方の群に属する学習用画像の第3特徴量に関しては、前記判別関数の値が前記正の定数と絶対値が等しい負の定数以下の値となり、かつ、
前記判別関数の値を0と置いた方程式により表される第3の距離空間上の超平面と各学習用画像の第3特徴量との間の距離を最小化するようパラメタをとった判別関数を定めることを特徴とするシステム。
【請求項10】
請求項9に記載のシステムを利用して入力画像のクラスを識別するシステムであって、
入力画像の第1種特徴量を計算し、
該第1種特徴量から得られる第3種特徴量についての前記判別関数の値が最大値となることを基準として、前記入力画像のクラスを識別することを特徴とするシステム。
【請求項11】
請求項9又は10に記載のシステムにおいて、前記第3の距離空間への写像は、サポートベクターマシン、非線形サポートベクターマシン又はカーネルサポートベクターマシンを用いて構成されることを特徴とするシステム。
【請求項12】
前記クラスタリング手段は、混合確率分布を用いた尤度あるいは対数尤度最大化する処理、事後確率を最大化する処理、あるいは予め与えられた事前分布に基づく期待値を計算する処理のいずれかの処理を実行することを特徴とする請求項2又は4に記載のシステム。
【請求項13】
前記クラスタリング手段は、混合ガウス分布に関する最尤推定法、事後確率最大化法あるいはベイズ推定法を適用することによって定まる各ガウス成分が1つのクラスを表すとし、各部分画像が属するクラスタをその部分画像に対応する距離空間における点の各ガウス成分に関するマハラノビス距離が最小となるガウス成分として定めることを特徴とする請求項12に記載のシステム。
【請求項14】
前記クラスタリング手段は、初期状態として全データを含む1つのクラスタから開始し、同じクラスタに属する2点間の距離が最大となる2点組を選択し、その距離が予め定められた閾値以上である場合に、そのクラスタを2分し、選択された2点をそれぞれのクラスタの種とし、同じクラスタに属していた全ての点に関して、これらのクラスタの種との間の距離を計算し、距離が小さい方のクラスタに属するように分類する処理を各クラスタにおけるクラスタ分割条件が満たされなくなるまで実行する分割クラスタリングを適用することを特徴とする請求項12に記載のシステム。
【請求項15】
前記クラスタリング手段は、K-最近接法を実行するクラスタリングを行うことを特徴とする請求項3又は4に記載のシステム。
【請求項16】
前記クラスタリング手段は、K-平均法を実行するクラスタリングを行うことを特徴とする請求項3又は4に記載のシステム。
【請求項17】
前記第1の写像手段及び第2の写像手段のうち少なくとも一方は、前記部分画像/学習用画像の組の間で決定された順序関係のみに基づいて写像を行うことを特徴とする請求項1から16のいずれか1項に記載のシステム。
【請求項18】
前記第1の写像手段及び第2の写像手段のうち少なくとも一方は、前記部分画像/学習用画像の組の間で決定された順序関係に基づいて各部分画像/学習用画像の組に自然数による番号付けを行い、それらの番号の差の大きさのみに基づいて写像を行うことを特徴とする請求項1から16のいずれか1項に記載のシステム。
【請求項19】
前記第1の写像手段及び第2の写像手段のうち少なくとも一方は、前記部分画像/学習用画像の組が前記第1の距離空間/第2の距離空間に写像された点の組の2点間距離を計算するとともに、前記写像された点の組について補助距離の大小関係によって定められる順序関係が、前記部分画像/学習用画像の組の間で決定された順序関係と一致するようにして、前記2点間距離の補助距離を計算し、前記写像される点の組における2点間距離と補助距離との差の自乗を全ての前記写像される点の組について足し合わせた値が最小化されるようにして写像を行うことを特徴とする請求項1から16のいずれか1項に記載のシステム。
【請求項20】
各組の部分画像間における類似度又は非類似度は、各部分画像上の各画素の位置情報と、画素上の色相又は濃淡値とを与える関数の汎関数として定義されていることを特徴とする請求項1から19のいずれか1項に記載のシステム。
【請求項21】
各組の部分画像間における類似度又は非類似度は、画像が画像間の差分又はマッチングによって生成された差分画像、オプティカルフロー画像、ステレオ画像のいずれかである場合には、各部分画像上の各画素の位置情報と、画素上の差分値、ベクトル値又は距離値とを与える関数の汎関数として定義されていることを特徴とする請求項1〜19のいずれか1項に記載のシステム。
【請求項22】
各組の部分画像間における類似度又は非類似度は、各部分画像上の各画素の位置情報と、画素上の色相又は濃淡値とについてのヒストグラム関数の汎関数として定義されていることを特徴とする請求項1〜19のいずれか1項に記載のシステム。
【請求項23】
各組の部分画像間における類似度又は非類似度は、各部分画像上の各画素の位置情報と、画素上の色相又は濃淡値とを与える関数に画像上の空間座標に関する微分演算子を作用させることで得られるベクトル値関数に関する汎関数として定義されていることを特徴とする請求項20に記載のシステム。
【請求項24】
各組の部分画像間における類似度又は非類似度は、各部分画像上の各画素の位置情報と、画素上の色相又は濃淡値とを与える関数に画像上の空間座標に関する積分演算子を作用させることで得られる関数に関する汎関数として定義されていることを特徴とする請求項20に記載のシステム。
【請求項25】
各組の部分画像間における類似度又は非類似度は、各部分画像上の各画素の位置情報と、画素上の色相又は濃淡値とを与える関数に画像上の空間座標に関する微分演算子をさせることで得られるベクトル値関数を引数とする2階テンソル値関数に関して、その各成分に画像上の空間座標に関する積分演算子を作用させることで得られる2階テンソル値関数に関する汎関数として定義されていることを特徴とする請求項20に記載のシステム。
【請求項26】
各組の部分画像間における類似度又は非類似度は、各部分画像上の各画素の位置情報と、画素上の色相又は白黒の濃淡値とを与える関数の自己相関関数に関する汎関数として定義されていることを特徴とする請求項20に記載のシステム。
【請求項27】
各組の部分画像間における類似度又は非類似度は、各部分画像上の各画素の位置情報と、画素上の色相又は濃淡値とを与える関数に画像上の空間座標に関する微分演算子を作用させることで得られるベクトル値関数に関する自己相関関数に関する汎関数として定義されていることを特徴とする請求項20に記載のシステム。
【請求項1】
画像のクラス分類を学習するシステムであって、
学習用画像の対象領域に対して、該対象領域全体を覆うようにして1以上の所定形状の窓領域を設定する窓領域設定手段と、
前記各窓領域に含まれる部分画像の集合から、互いに異なる2つの部分画像の組を生成し、各組の部分画像間における類似度又は非類似度を、各部分画像から抽出される特徴量に基づいて計算する部分画像間類似度計算手段と、
前記部分画像間の類似度又は非類似度に基づいて前記各部分画像の組の間での順序関係を決定する第1の順序関係決定手段と、
前記各部分画像の組の間で決定された順序関係が保存されるようにして、前記各部分画像を第1の距離空間上に写像する第1の写像手段と、
前記第1の距離空間に写像された各点の位置座標の直積又はテンソル積を各学習用画像の第1種特徴量とし、各学習用画像の第1種特徴量に基づいて、画像間の非類似度又は類似度を計算する画像間類似度計算手段と、
前記学習用画像間の非類似度又は類似度に基づいて前記各学習用画像の組の間での順序関係を決定する第2の順序関係決定手段と、
前記各学習用画像の組の間で決定された順序関係が保存されるようにして、前記各学習用画像を第2の距離空間上に写像する第2の写像手段と、
前記第2の距離空間に写像された各点の位置座標ベクトルを各学習用画像の第2種特徴量とし、前記第2の距離空間上に写像された点から、前記第2の距離空間における距離又は分布密度に基づいてクラスタを構成するクラスタリング手段と、
各クラスタをクラス分類するとともに、各クラスタに属する点に対応する学習用画像を前記第2の写像手段による写像の逆写像によって求めることにより、各学習用画像がどのクラスに属するかを判定するクラス分類判定手段と、を含むことを特徴とするシステム。
【請求項2】
前記クラスタリング手段は、全クラスタ数を予め指定せずにクラスタリングを行うことを特徴とする請求項1に記載のシステム。
【請求項3】
前記クラスタリング手段は、全クラスタ数を予め指定してクラスタリングを行うことを特徴とする請求項1に記載のシステム。
【請求項4】
請求項1に記載のシステムを利用して入力画像のクラスを識別するシステムであって、
学習用画像について計算された第1特徴量及び第2特徴量と、クラス分類の判定結果とを予め記憶しておき、
前記画像間類似度計算手段により、前記入力画像の第1種特徴量を計算し、該第1種特徴量と学習用画像の第1種特徴量とを用いて、前記入力画像と前記学習用画像との間の非類似度又は類似度を計算し、
前記第2の順序関係決定手段により、該非類似度又は類似度に基づいて前記入力画像と前記学習用画像との間の順序関係を決定し、
前記第2の写像手段により、前記入力画像と前記学習用画像との間で決定された順序関係が保存されるようして、前記入力画像を第2の距離空間上に写像し、
前記画像間類似度計算手段により、前記入力画像が前記第2の距離空間に写像された各点の位置座標ベクトルを前記入力画像の第2種特徴量とし、前記入力画像の第2種特徴量と前記記憶してある学習用画像の第2特徴量との間の非類似度又は類似度を計算し、
該非類似度又は類似度に基づいて、入力画像が学習用画像のいずれのクラスに該当するかを識別することを特徴とするシステム。
【請求項5】
請求項1に記載のシステムを利用して入力画像のクラスを識別するシステムであって、
学習用画像について計算された第1特徴量及び第2特徴量と、クラス分類の判定結果とを予め記憶しておき、
前記画像間類似度計算手段により、前記入力画像の第1種特徴量を計算し、該第1種特徴量と学習用画像の第1種特徴量とを用いて、前記入力画像と前記学習用画像との間の非類似度又は類似度を計算し、
前記第2の順序関係決定手段により、該非類似度又は類似度に基づいて前記入力画像と前記学習用画像との間の順序関係を決定し、
前記第2の写像手段により、前記入力画像と前記学習用画像との間で決定された順序関係が保存されるようして、前記入力画像を第2の距離空間上に写像し、
前記第2の距離空間において前記入力画像が写像された点と距離が近い順に所定数の学習用画像を選択し、選択された学習用画像のうち最も多くの学習用画像が属するクラスを入力画像のクラスとして識別することを特徴とするシステム。
【請求項6】
請求項1に記載のシステムにおいて、
クラス分類済みの学習用画像の第1種特徴量を計算し、
該第1種特徴量を入力して得られるクラス分類判定結果と、クラス分類済み学習用画像のクラスとの差に関する関数を全てのクラス分類済み学習用画像について足し上げた誤差関数を算出し、
該誤差関数が最小化されるように前記第2の写像手段による写像のパラメタを定めることを特徴とするシステム。
【請求項7】
請求項6に記載のシステムにおいて、前記第2の写像手段による写像は、ニューラルネットワークを用いて構成されることを特徴とするシステム。
【請求項8】
請求項6又は7に記載のシステムを利用して入力画像のクラスを識別するシステムであって、
入力画像の第1種特徴量を計算し、該第1種特徴量を入力して得られるクラス分類判定結果に従って前記入力画像のクラスを識別することを特徴とするシステム。
【請求項9】
請求項1に記載のシステムにおいて、
クラス分類済みの学習用画像の第1種特徴量を計算し、
該第1種特徴量を入力して得られるクラス分類判定結果における各クラスについて、クラス分類済み学習用画像をそのクラスに属する群と他のクラスに属する群とに分け、それぞれの群について、各学習用画像の第1特徴量を第3の距離空間に写像し、その写像された像を第3種特徴量とし、
該第3種特徴量に関する線形な判別関数であって、
一方の群に属する学習用画像の第3特徴量に関しては、前記判別関数の値がある定められた正の定数以上の値となり、
他方の群に属する学習用画像の第3特徴量に関しては、前記判別関数の値が前記正の定数と絶対値が等しい負の定数以下の値となり、かつ、
前記判別関数の値を0と置いた方程式により表される第3の距離空間上の超平面と各学習用画像の第3特徴量との間の距離を最小化するようパラメタをとった判別関数を定めることを特徴とするシステム。
【請求項10】
請求項9に記載のシステムを利用して入力画像のクラスを識別するシステムであって、
入力画像の第1種特徴量を計算し、
該第1種特徴量から得られる第3種特徴量についての前記判別関数の値が最大値となることを基準として、前記入力画像のクラスを識別することを特徴とするシステム。
【請求項11】
請求項9又は10に記載のシステムにおいて、前記第3の距離空間への写像は、サポートベクターマシン、非線形サポートベクターマシン又はカーネルサポートベクターマシンを用いて構成されることを特徴とするシステム。
【請求項12】
前記クラスタリング手段は、混合確率分布を用いた尤度あるいは対数尤度最大化する処理、事後確率を最大化する処理、あるいは予め与えられた事前分布に基づく期待値を計算する処理のいずれかの処理を実行することを特徴とする請求項2又は4に記載のシステム。
【請求項13】
前記クラスタリング手段は、混合ガウス分布に関する最尤推定法、事後確率最大化法あるいはベイズ推定法を適用することによって定まる各ガウス成分が1つのクラスを表すとし、各部分画像が属するクラスタをその部分画像に対応する距離空間における点の各ガウス成分に関するマハラノビス距離が最小となるガウス成分として定めることを特徴とする請求項12に記載のシステム。
【請求項14】
前記クラスタリング手段は、初期状態として全データを含む1つのクラスタから開始し、同じクラスタに属する2点間の距離が最大となる2点組を選択し、その距離が予め定められた閾値以上である場合に、そのクラスタを2分し、選択された2点をそれぞれのクラスタの種とし、同じクラスタに属していた全ての点に関して、これらのクラスタの種との間の距離を計算し、距離が小さい方のクラスタに属するように分類する処理を各クラスタにおけるクラスタ分割条件が満たされなくなるまで実行する分割クラスタリングを適用することを特徴とする請求項12に記載のシステム。
【請求項15】
前記クラスタリング手段は、K-最近接法を実行するクラスタリングを行うことを特徴とする請求項3又は4に記載のシステム。
【請求項16】
前記クラスタリング手段は、K-平均法を実行するクラスタリングを行うことを特徴とする請求項3又は4に記載のシステム。
【請求項17】
前記第1の写像手段及び第2の写像手段のうち少なくとも一方は、前記部分画像/学習用画像の組の間で決定された順序関係のみに基づいて写像を行うことを特徴とする請求項1から16のいずれか1項に記載のシステム。
【請求項18】
前記第1の写像手段及び第2の写像手段のうち少なくとも一方は、前記部分画像/学習用画像の組の間で決定された順序関係に基づいて各部分画像/学習用画像の組に自然数による番号付けを行い、それらの番号の差の大きさのみに基づいて写像を行うことを特徴とする請求項1から16のいずれか1項に記載のシステム。
【請求項19】
前記第1の写像手段及び第2の写像手段のうち少なくとも一方は、前記部分画像/学習用画像の組が前記第1の距離空間/第2の距離空間に写像された点の組の2点間距離を計算するとともに、前記写像された点の組について補助距離の大小関係によって定められる順序関係が、前記部分画像/学習用画像の組の間で決定された順序関係と一致するようにして、前記2点間距離の補助距離を計算し、前記写像される点の組における2点間距離と補助距離との差の自乗を全ての前記写像される点の組について足し合わせた値が最小化されるようにして写像を行うことを特徴とする請求項1から16のいずれか1項に記載のシステム。
【請求項20】
各組の部分画像間における類似度又は非類似度は、各部分画像上の各画素の位置情報と、画素上の色相又は濃淡値とを与える関数の汎関数として定義されていることを特徴とする請求項1から19のいずれか1項に記載のシステム。
【請求項21】
各組の部分画像間における類似度又は非類似度は、画像が画像間の差分又はマッチングによって生成された差分画像、オプティカルフロー画像、ステレオ画像のいずれかである場合には、各部分画像上の各画素の位置情報と、画素上の差分値、ベクトル値又は距離値とを与える関数の汎関数として定義されていることを特徴とする請求項1〜19のいずれか1項に記載のシステム。
【請求項22】
各組の部分画像間における類似度又は非類似度は、各部分画像上の各画素の位置情報と、画素上の色相又は濃淡値とについてのヒストグラム関数の汎関数として定義されていることを特徴とする請求項1〜19のいずれか1項に記載のシステム。
【請求項23】
各組の部分画像間における類似度又は非類似度は、各部分画像上の各画素の位置情報と、画素上の色相又は濃淡値とを与える関数に画像上の空間座標に関する微分演算子を作用させることで得られるベクトル値関数に関する汎関数として定義されていることを特徴とする請求項20に記載のシステム。
【請求項24】
各組の部分画像間における類似度又は非類似度は、各部分画像上の各画素の位置情報と、画素上の色相又は濃淡値とを与える関数に画像上の空間座標に関する積分演算子を作用させることで得られる関数に関する汎関数として定義されていることを特徴とする請求項20に記載のシステム。
【請求項25】
各組の部分画像間における類似度又は非類似度は、各部分画像上の各画素の位置情報と、画素上の色相又は濃淡値とを与える関数に画像上の空間座標に関する微分演算子をさせることで得られるベクトル値関数を引数とする2階テンソル値関数に関して、その各成分に画像上の空間座標に関する積分演算子を作用させることで得られる2階テンソル値関数に関する汎関数として定義されていることを特徴とする請求項20に記載のシステム。
【請求項26】
各組の部分画像間における類似度又は非類似度は、各部分画像上の各画素の位置情報と、画素上の色相又は白黒の濃淡値とを与える関数の自己相関関数に関する汎関数として定義されていることを特徴とする請求項20に記載のシステム。
【請求項27】
各組の部分画像間における類似度又は非類似度は、各部分画像上の各画素の位置情報と、画素上の色相又は濃淡値とを与える関数に画像上の空間座標に関する微分演算子を作用させることで得られるベクトル値関数に関する自己相関関数に関する汎関数として定義されていることを特徴とする請求項20に記載のシステム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【公開番号】特開2006−39658(P2006−39658A)
【公開日】平成18年2月9日(2006.2.9)
【国際特許分類】
【出願番号】特願2004−214538(P2004−214538)
【出願日】平成16年7月22日(2004.7.22)
【出願人】(000233055)日立ソフトウエアエンジニアリング株式会社 (1,610)
【出願人】(502324066)株式会社デンソーアイティーラボラトリ (332)
【Fターム(参考)】
【公開日】平成18年2月9日(2006.2.9)
【国際特許分類】
【出願日】平成16年7月22日(2004.7.22)
【出願人】(000233055)日立ソフトウエアエンジニアリング株式会社 (1,610)
【出願人】(502324066)株式会社デンソーアイティーラボラトリ (332)
【Fターム(参考)】
[ Back to top ]