パターン認識装置およびパターン認識方法

【課題】より高い識別精度を得ることが可能なパターン認識装置および方法を提供する。
【解決手段】パターン認識方法は、各特徴項目の項目値の平均値ｍ_１，ｍ_２，・・・，ｍ_ｋに対する、ｉ番目のデータセットｙ_ｉ１，ｙ_ｉ１，・・・，ｙ_ｉｋのゼロ点比例回帰直線ｙ＝β_ｉｍの傾きβ_ｉを第一の縮約特徴項目として算出するステップ（ＳＢ）と、ゼロ点比例回帰直線ｙ＝β_ｉｍとｉ番目のデータセットとの偏差を標準偏差ｓ_ｊで除した値の二乗和Ｓｅ_ｉ’＝Σ（（ｙ_ｉｊ−β_ｉｍ_ｊ）／ｓ_ｊ）^２を、各データセットについて算出して、Ｓｅ_ｉ’の平方根に比例する量であるσ_ｉ’を第二の縮約特徴項目として算出するステップ（ＳＣ）と、第一の縮約特徴項目と、各データセットに対する第二の縮約特徴項目とに基づいて評価距離Ｄを算出して、評価距離Ｄに基づいて判断を行なうステップ（ＳＤ）とを備える。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、多次元情報からパターン認識を行なうパターン認識装置およびパターン認識方法に関する。本発明は特に、画像や波形データのように多数の特徴項目を持つ対象に対して短時間にパターン認識を行なう分野に関する。
【背景技術】
【０００２】
多次元情報から予測および診断を行なうパターン認識の方法の一つとして、田口玄一博士から提案されたＭＴシステムがある。ＭＴシステムにおいては、ＭＴ法（マハラノビス距離を利用する方法）、ＭＴＡ法（マハラノビス・タグチ・アジョイント法；ＭＴ法での相関係数行列を分散共分散行列で代替する方法）、ＴＳ法（特徴項目による直交展開を利用する方法）、Ｔ法（１）（Ｔ法と呼ばれる手法のうち、特に、単位空間が集団の中央の場合の手法）、およびＴ法（３）などが提案されている（たとえば非特許文献１，２，３を参照）。Ｔ法（３）とは、Ｔ法のうち、たとえば画像や文字の認識のように真値がなく、かつ複数の種類の単位空間がありうる場合に用いられる方法であり、ＲＳ法、ＲＴ法とも呼ばれる。また、上記のＭＴシステムを画像認識などに応用した装置もこれまでに提案されている（たとえば特許文献１，２を参照）。
【０００３】
単位空間とは、目的に対して均質な集団に属するデータセットを意味する。健康診断（病気の発見）という目的に対して均質な集団とは、健康人の集団である。健康人の集団は、健康状態に関する特徴項目の値の分散が比較的小さいために、ある特定のパターンを形成していると考えられている。一方、後で説明する信号空間とは、予測精度を評価するときの基準になるものであり、上記の例では、健康状態がさまざまな（健康から重篤な不健康状態まで）集団に属するデータセットである。
【０００４】
また、文字の認識の場合においては、「あ」という文字の単位空間には、人が「あ」と読める文字の平均画像（画素ごとの濃度）、または理想的な「あ」の文字の画像データを用いる。一方、信号空間のデータは、「お」、「ぬ」、「め」などといった「あ」と似た文字であり、それらの違いを判別するためのデータベースを作るのに用いる。似た文字を判別することができれば、「あ」とは全く異なる文字、たとえば「い」、「う」などの文字は容易に判別ができる（たとえば非特許文献３を参照）。
【０００５】
ＭＴシステムにおけるこれらの手法群は、（Ａ）真値がない場合で、主に判別・識別に使用するＭＴ法、ＭＴＡ法、Ｔ法（３）のグループと、（Ｂ）真値が明確で、真値そのものを予測するＴＳ法、Ｔ法（１）のグループとに分けられる。また、同一グループ内において、単位空間として用意することのできるデータセット数、多重共線性の有無などといった条件によって、手法が選択される。たとえばグループ（Ａ）において、特徴項目数が膨大なことによる計算時間の問題、あるいは多重共線性の問題がある場合には、Ｔ法（３）が選択される。
【０００６】
以下、いずれも（Ａ）のグループに属するＭＴ法とＴ法（３）とを取り上げて比較説明する。ＭＴ法では、単位空間データにおける相関係数行列の逆行列を演算する過程で相関係数が１となるような２つの特徴項目の組み合わせがある場合、あるいは特徴項目数ｋがデータセット数Ｎより大きい場合には、逆行列を計算できないという課題がある。また、ＭＴ法の場合、特徴項目数が膨大になると逆行列の計算自体に時間がかかるために、製造工程などのオンラインでＭＴ法を使用する場合には、リアルタイムでの判定ができないなどといった問題もある。
【０００７】
一方、Ｔ法（３）では、それらの問題を克服するために、簡単な演算で多数の特徴項目を２つの直交する特徴量（β、σで表す）に縮約して判別するという方法が採用される。したがって画像あるいは波形データの処理のように、特徴項目が非常に多く（画像の場合、数百万画素の濃度データを扱う場合もある）、かつデータ処理速度が求められる場合には、Ｔ法（３）が一般に用いられている。
【先行技術文献】
【特許文献】
【０００８】
【特許文献１】特開２０１０−２８７１７９号公報
【特許文献２】特開２０１０−２８６３５３号公報
【非特許文献】
【０００９】
【非特許文献１】田口玄一、品質工学便覧、日刊工業新聞社、２００７年
【非特許文献２】田口玄一、ＭＴシステムによる予測と推定、標準化と品質管理、Ｖｏｌ．５８，Ｎｏ．８，ｐｐ．６８−７６，２００５年
【非特許文献３】田口玄一、目的機能と基本機能（１１）―認識のためのＴ法―、品質工学、Ｖｏｌ．１４，Ｎｏ．２，ｐｐ．５−９，２００６年
【発明の概要】
【発明が解決しようとする課題】
【００１０】
図１２および図１３を用いて、非特許文献３に記載の方法（以下、Ｔ法（３）という）を説明する。図１２は、特徴項目ｊのデータ例と、そのデータ例の平均値および標準偏差とを示した概念図である。
【００１１】
図１２を参照して、ｙ_１ｊ，ｙ_２ｊ，・・・，ｙ_ｉｊ，・・・ｙ_ｋｊは、特徴項目ｊのデータ（単位空間に属するデータ）を示す。添字ｉは、データセット番号（１≦ｉ≦ｎ）を示す。ｍ_ｊは特徴項目ｊのデータの平均値であり、ｓ_ｊは特徴項目ｊのデータの標準偏差である。
【００１２】
Ｔ法（３）では、単位空間の特徴項目データの平均値が求められて、その平均値が標準条件のデータとされる。文字や画像の認識の場合には、濃度データあるいは微分・積分特性が単位空間の特徴項目データとして用いられることが多い。
【００１３】
図１３は、各特徴項目のデータの平均値ｍ_ｊと、データセット番号ｉの特徴項目の値との関係をプロットした図である。図１３を参照して、グラフの横軸は、単位空間における各特徴項目のデータの平均値ｍ_ｊを示す。単位空間における各特徴項目のデータは、標準条件のデータに対応する。一方、グラフの縦軸は、標準条件のデータとは別のデータ（信号データとも呼ぶ）を示す。グラフ中の直線は、ゼロ点比例回帰直線を示す。この直線の傾きはβ_ｉである。
【００１４】
信号データが単位空間に近い性質を有する場合、信号データは、傾き１の回帰直線（図示せず）の近くにプロットされるとともに、ばらつきが小さくなる。一方、信号データが単位空間から遠い場合には、グラフ上にプロットされた信号データは傾き１の回帰直線からはずれるだけでなく、そのばらつきも大きくなる。信号データが単位空間と異なる文字の場合、あるいは異常な画像などの場合には、信号データが単位空間から遠くなる。
【００１５】
Ｔ法（３）は、「回帰直線の傾き＝β」と「回帰直線からのばらつき＝σ」の２つの縮約された特徴量（縮約特徴量）から、単位空間（β＝１、σ＝０の場合）からの乖離度としての評価距離Ｄを計測しようという方法である。しかしながらＴ法（３）には以下に説明するような課題がある。
【００１６】
図１４は、Ｔ法（３）におけるデータ模型を示す図である。図１４を参照して、Ｔ法（３）における、傾きβとばらつきσとは以下のようにして演算される。まず、ｊ番目の特徴項目ｊの項目値のデータｙ_１ｊ，ｙ_２ｊ，・・・，ｙ_ｎｊに対して以下の演算を行ない、特徴項目ｊの項目値の平均値ｍ_ｊを求める（ｊ＝１からｋまで順次）。ここでｎはデータセットの数である。
【００１７】
ｍ_ｊ＝（ｙ_１ｊ＋ｙ_２ｊ＋・・・＋ｙ_ｎｊ）/ｎ
次に各特徴項目の平均値ｍ_１，ｍ_２，・・・，ｍ_ｋに対して、単位空間に属するｉ番目のデータセットｙ_ｉ１，ｙ_ｉ２，・・・，ｙ_ｉｋのゼロ点比例回帰直線の傾きβ_ｉ（第一縮約特徴項目）を以下の式に従って算出する（ｉ＝１からｎまで順次）。
【００１８】
ｒ＝ｍ_１^２＋ｍ_２^２＋・・・＋ｍ_ｋ^２
β_ｉ＝（ｍ_１ｙ_ｉ１＋ｍ_２ｙ_ｉ２＋・・・＋ｍ_ｋｙ_ｉｋ）/ｒ
ここでｒはｉによらず共通の値である。
【００１９】
次に、単位空間に属するｉ番目のデータセットについて、ゼロ点比例回帰直線ｙ＝β_ｉｍおよびｉ番目のデータセットｙ_ｉ１，ｙ_ｉ２，・・・，ｙ_ｉｋを用いて以下の演算を行ない、偏差二乗和Ｓｅ_ｉを求める（ｉ＝１からｎまで順次）。
【００２０】
Ｓｅ_ｉ＝Σ_ｊ（ｙ_ｉｊ−β_ｉｍ_ｊ）^２
第二縮約特徴項目σ_ｉは、偏差二乗和Ｓｅ_ｉの平方根に比例する量として与えられる。たとえば非特許文献３では、第二縮約特徴項目σ_ｉは以下のように演算される。
【００２１】
σ_ｉ＝√（Ｓｅ_ｉ／(ｋ−１)）
ここでは単位空間データの平均値ｍ_iを用いて、単位空間に属するｉ番目のデータセットの第一縮約特徴項目Ｙ_１（＝β_ｉ）および第二縮約特徴項目Ｙ_２（σ_ｉ）を求める方法を示した。判別の際には、単位空間に属するデータとは別のデータ（信号データ）が使用される。この場合にも、単位空間に属するデータとは別のデータの項目値と、単位空間データの平均値ｍ_ｊとを用いて同様の演算を行ない、第一縮約特徴項目Ｙ_１および第二縮約特徴項目Ｙ_２を求める。
【００２２】
次に、偏差二乗和Ｓｅ_ｉの性質を考える。偏差二乗和Ｓｅは信号データｉの各データと回帰直線との間の距離の二乗和である。しかしながら、上記の方法では、横軸の値（特徴項目）の違いを考慮せずに単純に偏差二乗和Ｓｅを求めている。これは、各特徴項目における状況の違いを考慮していないことを意味している。このような方法で問題が生じる場合の例としては、たとえば、対象データが画像・文字であったり、波形のデータであったりした場合があげられる。
【００２３】
図１５は、画像データから波形データを抽出して、その波形データから特徴項目を抽出する方法を示した図である。図１５を参照して、（Ａ）は原画像の模式図であり、（Ｂ）は、画像データから抽出された一部の画像の波形データを示した図である。図１５（Ａ）において、濃度をハッチの粗さで示す。ハッチが細かいほど濃度が高い。
【００２４】
原画像のうちの一部の領域Ａ（図１５（Ａ）において破線の枠で示す）の画像が切り出されて、その領域Ａの画像に対応する波形データが抽出される。図１５（Ａ）では、原画像の横方向に沿って画像を切り出した場合を示しているが、原画像の横方向および縦方向に沿ってそれぞれ画像の切り出しが行なわれて、切り出された画像から波形データが抽出される。
【００２５】
特徴項目としては、公知の微分特性および積分特性が採用される。微分特性は、波形とレベル線（図１５（Ｂ）において点線で示す水平線）との交点Ｐの数（交差数）である。積分特性とは、存在量であり、波形データの値がレベル線以上となっている部分の横軸の量の合計である。なお、図１５（Ｂ）においてレベル線と重なっている実線は、波形データの値がレベル線以上となっている部分の横軸の量を示している。これらの特徴項目は非負であり、かつ上限のない量である。レベル線を様々に設定することで、交差数と存在量とが特徴として抽出される。
【００２６】
図１６は、従来技術の課題を説明するために、単位空間のデータと、単位空間とは別のデータの一部とをプロットした図である。図１６を参照して、単位空間における項目平均値ｍ_１，ｍ_２，・・・，ｍ_ｋに対して単位空間の各データをプロットした場合。そのデータのばらつきは、入力の大きさにほぼ比例すると予測される。
【００２７】
ここで単位空間データとは別の新しいデータがプロットされた場合を仮定する。図１６では、データＸ，Ｙが単位空間データとは別のデータとしてプロットされている。簡単のために、回帰直線の傾きβは信号データに対しても同じく１であるとする。データＸとデータＹとは、回帰直線からの偏差がいずれも同じである。
【００２８】
データＸは単位空間のデータの集団の内部に位置するので、単位空間の分布の中のデータとみなせる。これに対してデータＹは単位空間の分布からはずれたデータとみなされる。すなわち図１６は、回帰直線からの偏差が同じデータでも、単位空間からの乖離度が異なる場合が生じることを示している。
【００２９】
Ｔ法（３）において第二縮約特徴項目σを求める演算では、偏差二乗和Ｓｅを求めるときに、データＸ，Ｙに例示されるような状況の異なる偏差を区別なく合計している。このため、偏差二乗和Ｓｅは正常（単位空間に近い）と異常（単位空間から遠い）との違いを十分区別できる特徴となっていない。したがって判別精度が低下する可能性がある。このためには特徴項目を作成するにあたって、単位空間の状況を加味した補正が必要となる。
【００３０】
なお、上記の問題は、特徴項目が微分特性や積分特性の場合に限られる問題ではない。さらに、上記の問題は、図１６に示したような、データのばらつきが入力に比例する場合に限った問題でもないことも容易に理解される。
【００３１】
本発明の目的は、画像や波形データのように多数の特徴項目をもつ対象に対するパターン認識を短時間に行なう分野において、より高い識別精度を得ることが可能なパターン認識装置および方法を提供することである。
【課題を解決するための手段】
【００３２】
本発明のある局面に係るパターン認識装置は、複数の特徴項目を各々有する複数のデータセットに基づいてパターン認識を行なうパターン認識装置である。パターン認識装置は、統計量算出部と、第一縮約特徴項目算出部と、第二縮約特徴項目算出部と、評価距離算出部とを備える。統計量算出部は、単位空間に属する、特徴項目ｊのデータｙ_ｉｊ(１≦ｉ≦ｎ，１≦ｊ≦ｋ)を用いて、各特徴項目の項目値の平均値ｍ_ｊと、各特徴項目の項目値の標準偏差ｓ_ｊとを算出する。第一縮約特徴項目算出部は、各特徴項目の項目値の平均値ｍ_１，ｍ_２，・・・，ｍ_ｋに対する、ｉ番目のデータセットｙ_ｉ１，ｙ_ｉ１，・・・，ｙ_ｉｋのゼロ点比例回帰直線ｙ＝β_ｉｍの傾きβ_ｉを、第一の縮約特徴項目として算出する。第二縮約特徴項目算出部は、ゼロ点比例回帰直線ｙ＝β_ｉｍとｉ番目のデータセットｙ_ｉ１，ｙ_ｉ１，・・・，ｙ_ｉｋとの偏差を標準偏差ｓ_ｊで除した値の二乗和Ｓｅ_ｉ’＝Σ（（ｙ_ｉｊ−β_ｉｍ_ｊ）／ｓ_ｊ）^２を、各データセットについて算出して、Ｓｅ_ｉ’の平方根に比例する量であるσ_ｉ’を第二の縮約特徴項目として算出する。評価距離算出部は、各データセットに対する第一の縮約特徴項目と、各データセットに対する第二の縮約特徴項目とに基づいて、評価距離Ｄを算出する。
【００３３】
本発明の他の局面に係るパターン認識方法は、複数の特徴項目を各々有する複数のデータセットに基づいてパターン認識を行なうパターン認識方法である。パターン認識方法は、単位空間に属するデータセットｙ_ｉｊ(１≦ｉ≦ｎ，1≦ｊ≦ｋ)を用いて、各特徴項目の項目値の平均値ｍ_ｊと、各特徴項目の項目値の標準偏差ｓ_ｊとを算出するステップと、各特徴項目の項目値の平均値ｍ_１，ｍ_２，・・・，ｍ_ｋに対する、ｉ番目のデータセットｙ_ｉ１，ｙ_ｉ１，・・・，ｙ_ｉｋのゼロ点比例回帰直線ｙ＝β_ｉｍの傾きβ_ｉを、第一の縮約特徴項目として算出するステップと、ゼロ点比例回帰直線ｙ＝β_ｉｍとｉ番目のデータセットｙ_ｉ１，ｙ_ｉ１，・・・，ｙ_ｉｋとの偏差を標準偏差ｓ_ｊで除した値の二乗和Ｓｅ_ｉ’＝Σ（（ｙ_ｉｊ−β_ｉｍ_ｊ）／ｓ_ｊ）^２を、各データセットについて算出して、Ｓｅ_ｉ’の平方根に比例する量であるσ_ｉ’を第二の縮約特徴項目として算出するステップと、各データセットに対する第一の縮約特徴項目と、各データセットに対する第二の縮約特徴項目とに基づいて、評価距離Ｄを算出するステップとを備える。
【発明の効果】
【００３４】
本発明によれば、画像や波形データのように多数の特徴項目をもつ対象に対するパターン認識を短時間に行なう分野において、より高い識別精度を得ることが可能な装置および方法を提供することができる。
【図面の簡単な説明】
【００３５】
【図１】本発明の実施の形態に係るパターン認識装置の概略構成を示した図である。
【図２】図１に示したパターン認識装置の実施の形態１に係る構成を示した機能ブロック図である。
【図３】実施の形態１に係るパターン認識処理の流れを説明するためのフローチャートである。
【図４】実施の形態２に係るパターン認識装置の機能ブロック図である。
【図５】実施の形態２に係るパターン認識処理の流れを説明するためのフローチャートである。
【図６】実施の形態３に係る画像認識に用いられる数字の「５」の画像の例を示した図である。
【図７】各データセットの特徴項目値を示した図である。
【図８】信号データを説明した図である。
【図９】図８に示した信号データの特徴項目の値を示す図である。
【図１０】従来の方法および本発明の実施の形態に係る方法の各方法による評価距離を対比して示した図である。
【図１１】従来の方法および本発明の実施の形態に係る方法によって得られたＤｍｉｎ／Ｄｍａｘの値を対比して示した図である。
【図１２】特徴項目ｊのデータ例と、そのデータ例の平均値および標準偏差とを示した概念図である。
【図１３】各特徴項目のデータの平均値ｍｊと、データセット番号ｉの特徴項目の値との関係をプロットした図である。
【図１４】Ｔ法（３）におけるデータ模型を示す図である。
【図１５】画像データから波形データを抽出して、その波形データから特徴項目を抽出する方法を示した図である。
【図１６】従来技術の課題を説明するために、単位空間のデータと、単位空間とは別のデータの一部とをプロットした図である。
【発明を実施するための形態】
【００３６】
以下、この発明の実施の形態について図面を参照して詳しく説明する。なお、同一または相当する部分には同一の参照符号を付して、その説明を繰り返さない。
【００３７】
図１は、本発明の実施の形態に係るパターン認識装置の概略構成を示した図である。図１を参照して、パターン認識装置５０は、コンピュータシステムによって実現可能である。パターン認識装置５０は、ＣＰＵ（中央演算処理装置）５１と、ＲＡＭ（Random Access Memory）などの主記憶装置５２と、ＨＤＤ（Hard Disk Drive）などの補助記憶装置５３と、キーボードやマウスなどの入力装置５４と、モニタやプリンタなどの出力装置５５と、外部の機器と情報の授受を行なう通信装置５６とを備える。
【００３８】
補助記憶装置５３は、後述するパターン認識方法をコンピュータシステムに実行させるためのプログラムを格納する。ＣＰＵ５１が補助記憶装置５３から当該プログラムを読み出し、主記憶装置５２にプログラムをロードする。そしてＣＰＵ５１が主記憶装置５２にロードされたプログラムを実行することによってパターン認識方法が実行される。
【００３９】
パターン認識方法をコンピュータシステムに実行させるためのプログラムを提供するための手段は特に限定されるものではない。たとえばＣＰＵ５１がＣＤ−ＲＯＭ等の記憶媒体に記録されたプログラムを読み出して、そのプログラムを補助記憶装置５３に格納してもよい。また、ＣＰＵ５１が通信回線を通じて提供されたプログラムを、通信装置５６を介して受信し、その受信したプログラムを補助記憶装置５３に格納してもよい。
【００４０】
また、プログラムが記録された記録媒体は、コンピュータが読み取り可能な記録媒体であればよく、ＣＤ−ＲＯＭに限定されるものではない。
【００４１】
［実施の形態１］
図２は、図１に示したパターン認識装置の実施の形態１に係る構成を示した機能ブロック図である。図２を参照して、パターン認識装置５０は、記憶部６０と、データ入力部６１と、特徴項目生成部６２と、統計量算出部６３と、第一縮約特徴量算出部６４と、第二縮約特徴量算出部６５と、評価距離算出部６６と、判断部６７と、出力部６８とを備える。
【００４２】
記憶部６０は、パターン認識のための単位空間のデータ、判別のためのしきい値等、本発明の実施の形態に係るパターン認識に必要な情報を記憶する。データ入力部６１は、判別対象となるパターンデータ（文字パターンあるいは画像）を装置の外部から受付ける。データ入力部６１にデータを入力するための方法および手段は特に限定されるものではない。
【００４３】
特徴項目生成部６２は、データ入力部６１に入力されたパターンデータから、特徴項目データを抽出する。たとえば特徴項目生成部６２は、パターンデータ（画像データ）の一部の画像を切り出して、その一部画像に基づいて画素座標に対する濃度の波形データ（図１５（ｂ）を参照）を抽出する。そして、特徴項目生成部６２は、その波形データの微分特性と積分特性とを特徴項目データとして生成する。波形データの微分特性と積分特性とを特徴項目データとして生成するための方法は、図１５により説明された方法を適用することができる。
【００４４】
統計量算出部６３は、単位空間に属する特徴項目ｊの項目値ｙ_ｉｊ（１≦ｉ≦ｎ、１≦ｊ≦ｋ）を用いて、特徴項目ｊの項目値の平均値ｍ_ｊおよび標準偏差ｓ_ｊを算出する（ｊ＝１からｋまで順次）。単位空間に属するデータセットｙ_ｉｊは、たとえば記憶部６０から読み出される。これにより、各特徴項目の項目値の平均値ｍ_１，ｍ_２，・・・，ｍ_ｋと、各特徴項目の項目値の標準偏差ｓ_１，ｓ_２，・・・，ｓ_ｋとが算出される。
【００４５】
第一縮約特徴量算出部６４は、各特徴項目の平均値ｍ_１，ｍ_２，・・・，ｍ_ｋと、単位空間に属するｉ番目のデータセットｙ_ｉ１，ｙ_ｉ２，・・・、ｙ_ｉｋとの相関を示すゼロ点比例回帰直線の傾きβ_ｉ（第一縮約特徴項目）を算出する（ｉ＝１からｎまで順次）。各特徴項目の平均値ｍ_１，ｍ_２，・・・，ｍ_ｋは統計量算出部６３によって算出される。単位空間に属するｉ番目のデータセットは、たとえば記憶部６０から読み出される。
【００４６】
第二縮約特徴量算出部６５は、二乗和Ｓｅ_ｉ’を算出する。この二乗和Ｓｅ_ｉ’は、ゼロ点比例回帰直線と各項目値ｙ_ｉｊとの偏差を標準偏差ｓ_ｊで除した値である。さらに第二縮約特徴量算出部６５は、二乗和Ｓｅ_ｉ’の平方根に比例する量として第二縮約特徴量σ_ｉを算出する（ｉ＝１からｎまで順次）。
【００４７】
評価距離算出部６６は、第一縮約特徴量β_ｉおよび第二縮約特徴量σ_ｉから評価距離Ｄを計算する。第一縮約特徴量β_ｉおよび第二縮約特徴量σ_ｉは、以下に説明されるＭＴＡ法の距離、マハラノビス距離あるいはユークリッド距離などを用いて１つの尺度にまとめることができる。
【００４８】
しきい値Ｄ_ｔｈは、単位空間のデータセットから求めた評価距離Ｄの集合を基準としたしきい値である。たとえば、しきい値Ｄ_ｔｈは、予め算出されるとともに記憶部６０に記憶される。判断部６７は、評価距離算出部６６によって算出された評価距離Ｄと、しきい値Ｄ_ｔｈとを比較して、目的に対する判断を行なう。出力部６８は、判断部６７が判断した結果を装置の外部に出力する。
【００４９】
図３は、実施の形態１に係るパターン認識処理の流れを説明するためのフローチャートである。図２および図３を参照して、ステップＳ０において、データ入力部６１は、入力パターンデータ（文字パターンあるいは画像）を装置の外部から受付ける。特徴項目生成部６２は、データ入力部６１に入力されたパターンデータから、特徴項目データを抽出する。これによって判別の対象となるパターンデータのデータセットが準備される。
【００５０】
（ステップＳＡ）
ステップＳＡにおいて、統計量算出部６３は、単位空間に属するデータセットｙ_ｉｊ（１≦ｉ≦ｎ、１≦ｊ≦ｋ）を用いて、各特徴項目について、項目値の平均値ｍ_ｊおよび標準偏差ｓ_ｊを算出する。具体的には、特徴項目ｊの項目値ｙ_１ｊ，ｙ_２ｊ，・・・，ｙ_ｎｊに対して、以下の式（１）に従う演算を行なう（ｊ＝１からｋまで順次）。
【００５１】
ｍ_ｊ＝（ｙ_１ｊ＋ｙ_２ｊ＋・・・＋ｙ_ｎｊ）/ｎ・・・（１）
次に、以下の式（２）に従って、各項目番号ｊについて、単位空間に属するデータの標準偏差ｓ_ｊを算出する（ｊ＝１からｋまで順次）。
【００５２】
ｓ_ｊ＝（１／ｎ）Σ_ｉ（ｙ_１ｊ−ｍ_ｊ）^２・・・（２）
ここで式（２）では、偏差二乗和Σ_ｉ（ｙ_１ｊ−ｍ_ｊ）^２をｎで除しているが（ｎ−１）で除してもよい。ｊによって除する値が共通であれば、判別精度には影響しない。
【００５３】
（ステップＳＢ）
ステップＳＢにおいて、第一縮約特徴量算出部６４は、ゼロ点比例回帰直線の傾きβ_ｉ（第一縮約特徴項目）を算出する。ステップＳＢの処理の詳細は以下の通りである。
【００５４】
第一縮約特徴量算出部６４は、単位空間に属するｉ番目のデータセットｙ_ｉ１，ｙ_ｉ２，・・・、ｙ_ｉｋに対して、以下の式（３）および（４）に従う演算を行なう（ｉ＝１からｎまで順次）。
【００５５】
ｒ＝ｍ_１^２＋ｍ_２^２＋・・・＋ｍ_ｋ^２・・・（３）
β_ｉ＝（ｍ_１ｙ_ｉ１＋ｍ_２ｙ_ｉ２＋・・・＋ｍ_ｋｙ_ｉｋ）/ｒ・・・（４）
ここでｒはｉによらず共通である。上記の演算によって、単位空間の各データセットに対して第一縮約特徴量β_１，β_２，・・・，β_ｎが算出される。
【００５６】
同様に、ステップＳ０で準備されたｉ番目のデータセット（判別対象パターンから抽出）と、単位空間データの平均値ｍ_ｊ（１≦ｊ≦ｋ）とを用いて、上述の式（３）、（４）にしたがって、判別対象パターンから抽出された特徴項目データについて、第一縮約特徴項目（単位空間の場合と同じくβ_１，β_２，・・・，β_ｎと表わす）が求められる。
【００５７】
（ステップＳＣ）
ステップＳＣにおいて、第二縮約特徴量算出部６５は、まず二乗和Ｓｅ_ｉ’を算出する、具体的には、ゼロ点比例回帰直線ｙ＝β_iｍおよび単位空間のｉ番目のデータセットｙ_ｉ１，ｙ_ｉ２，・・・、ｙ_ｉｋを用いて、以下の式（５）に従う演算を行なう（ｉ＝１からｎまで順次）。
【００５８】
Ｓｅ_ｉ’＝Σ（（ｙ_ｉｊ−β_ｉｍ_ｊ）／ｓ_ｊ）^２・・・（５）
次に第二縮約特徴量算出部６５は、第二縮約特徴項目σ_ｉ’を演算する。第二縮約特徴項目σ_ｉ’は、Ｓｅ_ｉ’の平方根に比例する量として与えられる。たとえば第二縮約特徴項目は以下の式（６）に従って演算される。１／√ｋは比例定数である。ただしデータセットに共通であれば、比例定数は１／√ｋに限らない。
【００５９】
σ_ｉ’＝√（Ｓｅ_ｉ’／ｋ）・・・（６）
これにより、単位空間の各データセットに対して第二縮約特徴量σ_１’，σ_２’，・・・，σ_ｎ’が算出される。
【００６０】
同様に、判別対象用パターンから抽出された特徴項目データ、およびその特徴項目データに対する第一縮約特徴項目（ステップＳＢにおいて算出）を用いて、上記式（５），（６）に従って、第二縮約特徴項目（単位空間の場合と同じくσ_１’，σ_２’，・・・，σ_ｎ’と表わす）が算出される。
【００６１】
判別の際には、単位空間とは異なるデータ、すなわち特徴項目生成部６２で抽出された特徴項目の値を使用することになる。したがって上記のように、特徴項目の値と、単位空間データの平均値ｍ_ｊおよび標準偏差ｓ_ｊとを用いてステップＳＢ，ＳＣでの演算が行なわれる。これにより、単位空間とは別のデータセットに対する第一縮約特徴項目および第二縮約特徴項目を求めることができる。
【００６２】
（ステップＳＤ）
ステップＳＤでは、評価距離Ｄを算出する処理を実行することができる。第一縮約特徴項目、第二縮約特徴項目が計算済みであれば評価距離Ｄを算出できる。したがって、単位空間データおよび単位空間以外のデータ（判別対象用のデータ）のいずれに対しても下記の処理によって評価距離Ｄを算出することができる。
【００６３】
ステップＳＤにおいて評価距離Ｄを算出する処理を説明する。この実施の形態では、以下に説明する三種類の評価距離のいずれも算出可能である。
【００６４】
第一の評価距離Ｄは、ＭＴＡ法の距離である。第一縮約特徴項目Ｙ_１＝β、第二縮約特徴項目Ｙ_２＝σ’（いずれもデータセット番号ｉを省略）とおくと、評価距離Ｄは以下の式（７）に従って計算される。
【００６５】
Ｄ＝Ｖ_１(Ｙ_１−μ_１)^２−２Ｖ_１２(Ｙ_１−μ_１)(Ｙ_２−μ_２)＋Ｖ_２(Ｙ_２−μ_２)^２・・・（７）
ここにＶ_１、Ｖ_２は、それぞれ第一縮約特徴量および第二縮約特徴量の分散であり、Ｖ_１２は第一縮約特徴量と第二縮約特徴量との共分散であり、μ_１、μ_２はそれぞれ第一縮約特徴量および第二縮約特徴量の平均値（データセット１からｎまで）である。
【００６６】
第二の評価距離Ｄは、マハラノビスの距離である。この場合の評価距離Ｄは、以下の式（８）に従って計算される。
【００６７】
Ｄ＝（Ｚ_１，Ｚ_２）・Ｒ^−１・（Ｚ_１，Ｚ_２）^Ｔ・・・（８）
ここに、Ｚ_１はＹ_１の基準化値であり、第一縮約特徴項目Ｙ_１の平均値（データセット１からｎまで）μ_１を引いてＹ_１の標準偏差√Ｖ_１で割ったものである。同様に、Ｚ_２はＹ_２の基準化値で、Ｙ_２の平均値μ_２を引いて、Ｙ₂の標準偏差√Ｖ₂で割ったものである。またＲ^−１はＺ_１，Ｚ_２に関する相関係数行列の逆行列である。添字のＴは転置を示す。このＤの値を項目数２で除したり、またさらに平方根をとったりする場合もあるが、データセットによって共通であればどの方法でもよい。
【００６８】
第三の評価距離Ｄは、ユークリッドの距離である。この場合の評価距離Ｄは以下の式（９）に従って計算される。
【００６９】
Ｄ＝Ｙ_１^２＋Ｙ_２^２・・・（９）
式（９）の計算ではＹ_１とＹ_２と共分散および相関は考慮されていない。データのゼロ点比例回帰の係数であるＹ_１＝βと、その残差であるばらつきＹ_２＝σ’とはほぼ直交する（相関係数が０に近い）性質がある。したがってＹ_１とＹ_２の共分散および相関を考慮しなくても、考慮した場合と同様の結果が得られることが多い。
【００７０】
単位空間におけるＹ_１の理想状態は１であり、単位空間におけるＹ_２の理想状態は０である。理想状態での距離を最小（＝０）と定義したい場合は、第三の評価距離Ｄを以下のように計算してもよい。以下の式（１０）によれば、Ｄの値が単位空間内で極値をとることがなく、理想状態に近いほど小さい距離を与えることができる。
【００７１】
Ｄ＝（Ｙ_１−１）^２＋Ｙ_２^２・・・（１０）
なお、これらのＤの値を項目数２で除したり、さらに平方根をとったりする場合もあるが、データセットによって共通であればどの方法でもよい。
【００７２】
（ステップＳＥ）
ステップＳＥにおける判別処理を説明する。単位空間のデータセットから求めた評価距離の集合を基準とした、しきい値Ｄ_ｔｈをあらかじめ定めておく。たとえば、単位空間の評価距離をＤ_１，Ｄ_２，・・，Ｄ_ｎ、その平均値をμ_Ｄ、標準偏差をσ_Ｄとした場合、評価距離の２シグマ値（μ_Ｄ＋２σ_Ｄ）をＤ_ｔｈと定めるなどである。また、目標の誤判別率を設けて、しきい値を決める方法も適用できる。いずれにしても、各々の判別対象の固有の問題であるので、しきい値の決定方法は、これらに限るものではない。
【００７３】
つぎに、単位空間とは別のデータセット（判別対象用パターンから抽出された特徴項目のデータセット）について算出された評価距離Ｄ’の大きさと、しきい値Ｄ_ｔｈとを比較して、目的に対する判断を行なう。たとえば評価距離Ｄ’と、しきい値Ｄ_ｔｈとの大小関係に基づいて、目的に対する判断（文字の認識、パターンの識別）が行なわれる。出力部６８は、判断部６７が判断した結果を装置の外部に出力する。
【００７４】
実施の形態１に係る方法によれば、ステップＳＣの処理によって、項目ごとのばらつきで補正した第二縮約特徴項目を生成する。すなわち、偏差の２乗値ではなく、偏差（ｙ_ｉｊ−β_ｉｍ_ｊ）を単位空間項目値の標準偏差ｓ_ｊで割った値の２乗値が総和される。これにより、第二縮約特徴項目を算出する過程で、単位空間における信号ごとの特徴量ばらつきに応じた異常の度合いを加味することができる。すなわち、単位空間でばらつきが大きい部分は偏差が大きくとも乖離は大きく、逆に単位空間でばらつきが小さい部分は偏差が小さくても乖離が大きいと考える。
【００７５】
実施の形態１によれば、偏差の異常度を標準偏差ｓ_ｊに対して相対的に評価することができる。したがって非特許文献３による方法での不具合、すなわち、単位空間における特徴項目ごとの状況が加味されておらず、判別精度が低下するという問題を回避できる。実施の形態１に係る方法によれば、判別精度を向上させることができるので、パターン認識の精度を向上させることができる。さらに誤判別による損失を低減することができる。
【００７６】
また、実施の形態１によれば、評価距離ＤにＭＴＡ法の距離あるいはマハラノビスの距離を用いる。この場合、第一縮約特徴項目Ｙ_１と第二縮約特徴項目Ｙ_２との相関の情報が考慮されるので、より精度の高いパターン認識が可能となる。
【００７７】
また、実施の形態１によれば、評価距離にユークリッドの距離を用いることもできる。ＭＴＡ法の距離の場合には、分散・共分散、マハラノビスの距離の場合には相関係数の計算が必要となる。したがってデータセット数が低い場合には統計的な信頼性が低くなる可能性がある。これに対して、評価距離にユークリッドの距離を用いた場合には、単位空間のデータセット数が極端に少ない場合（１つでもよい）でも評価距離を求めることができる点でメリットがある。さらに、評価距離にユークリッドの距離を用いた場合には、計算式が簡単になるので、少ない容量のメモリでプログラムが実装可能になる点でメリットがある。
【００７８】
なお、上記の説明では、ステップＳＣ，ＳＤにおいて、ステップＳＡにおいて算出された単位空間項目値の標準偏差ｓ_ｊが用いられるが、ステップＳＣ，ＳＤの各々において単位空間項目値の標準偏差ｓ_ｊを算出してもよい。
【００７９】
［実施の形態２］
図４は、実施の形態２に係るパターン認識装置の機能ブロック図である。図２および図４を参照して、実施の形態２では、パターン認識装置５０は、補正部６９をさらに備える点で実施の形態１と異なる。なお、図４に示したパターン認識装置５０の他の部分の構成は、図２に示した構成と同様であるので以後の説明は繰り返さない。
【００８０】
上記の実施の形態１においては、式（５）において、項目ごとの標準偏差ｓ_ｊが０のときに偏差二乗和Ｓｅ_ｉ’が計算できなくなることが想定される。実施の形態２では、補正部６９が、項目ｊのｎ個のデータのうち１つに補正を加える。これにより、統計量算出部６３が標準偏差ｓ_ｊを算出する際に標準偏差ｓ_ｊが０とならないようにすることができる。
【００８１】
計算上の標準偏差ｓ_ｊが０であっても、実際には計測の最小目盛りや分解能などの有効数字以下ではばらつきが存在していると考えられる。したがって、補正部６９は、項目ｊのｎ個のデータのうち１つにΔ/２を加える処理を行なう。ｎ個のデータのうちの１つであれば、どのデータにΔ/２を加えてもよい。Δは最小目盛りや分解能である。
【００８２】
実施の形態２では、１つのサンプルで最小目盛りや分解能の半分だけばらついていたと考えるのである。これによって、項目ｊの標準偏差ｓ_ｊは以下の式（１１）に従って表わされる。
【００８３】
ｓ_ｊ＝Δ／２／√ｎ・・・（１１）
実施の形態２では、補正前の標準偏差ｓ_ｊが０である場合には、上記の式（１１）に従って標準偏差ｓ_ｊが補正され、その補正された標準偏差ｓ_ｊを用いて実施の形態１と同様の計算が実行される。図５は、実施の形態２に係るパターン認識処理の流れを説明するためのフローチャートである。
【００８４】
図２および図５を参照して、実施の形態２に係るパターン認識処理では、ステップＳ０の処理とステップＳＡの処理との間にステップＳ１の処理が追加される。ステップＳ１において、補正部６９は、記憶部６０に記憶された単位空間のデータを用いて標準偏差ｓ_ｊを一旦計算する。補正部６９は、計算上の標準偏差ｓ_ｊが０になった場合に、項目ｊのｎ個のデータのうちの１つにΔ／２を加える。実施の形態２に係るパターン認識処理の他のステップの処理に関しては、実施の形態１と同様であるので以後の説明は繰り返さない。
【００８５】
実施の形態２によれば、偏差二乗和Ｓｅ_ｉ’の演算時に演算が停止する、あるいはエラーが発生するといったことを回避できるので、判別処理を遂行することができる。また、偏差二乗和Ｓｅ_ｉ’の演算時にエラーが発生した場合の処理を設けることなく判別処理を遂行することもできる。
【００８６】
［実施の形態３］
実施の形態３は、パターン認識装置および方法の具体的な適用である。なお以下の説明は、本発明の各実施の形態による効果を具体的に説明できる一例を示すものであり、本発明の範囲を限定するものではない。
【００８７】
実施の形態３に係るパターン認識装置は、図２または図４に示した構成のいずれの構成を有してもよい。実施の形態３に係るパターン認識装置が図２に示す構成を有する場合には、図３に示したフローチャートに従って処理が実行される。実施の形態３に係るパターン認識装置が図４に示す構成を有する場合には、図５に示したフローチャートに従って処理が実行される。
【００８８】
この実施の形態では、簡単な画像認識の例として数字の「５」を他の数字「１，２，３，４，６，７，８，９，０」と判別した。図６は、実施の形態３に係る画像認識に用いられる数字の「５」の画像の例を示した図である。
【００８９】
図６を参照して、数字の「５」に対応する４種類の画像が、５×７の画素に２階調（濃度０か１）で描かれている。実施の形態３では、画像の各行、各列の微分特性および積分特性を特徴項目として用いた。
【００９０】
この場合、数字の「５」の真値（その数字らしさ）の定量化は難しい。しかし、あらかじめテスターの目視によって、数字の「５」と読める画像とそうでない画像（つまり、「５」以外の数字）とがデータとして区別されている。このような判別技術は、画像認識における熟練者やプロの目視検査、診断を省略することができる可能性がある。したがって検査・診断などの工数削減、および生産性向上に寄与するものである。
【００９１】
図７は、各データセットの特徴項目値を示した図である。図７を参照して、単位空間として、４つのデータセットの特徴量を準備した。それぞれのデータセットは（５列＋７行）×（積分特性＋微分特性）＝２４項目の特徴項目をもっている。
【００９２】
つぎに信号データを準備した。図８は、信号データを説明した図である。図８（Ａ）は、単位空間とは別の「５」と読める文字の画像を示している。図８（Ｂ）は、典型的な「１，２，３，４，６，７，８，９，０」の文字の画像を示している。３種類の「５」の画像および「１，２，３，４，６，７，８，９，０」の各数字の画像について、単位空間データと同様に特徴項目の値を求めた。
【００９３】
図９は、図８に示した信号データの特徴項目の値を示す図である。図８および図９を参照して「歪んだ５」は図８（Ａ）に示した数字「５」の画像を表わす。それぞれのデータセットは（５列＋７行）×（積分特性＋微分特性）＝２４項目の特徴項目をもっている。
【００９４】
続いて、（ａ）従来のＴ法（３）で評価距離にＭＴＡ法の距離を用いた場合、（ｂ）実施の形態１でＭＴＡ法の距離を用いた場合、（ｃ）実施の形態１でマハラノビス距離を用いた場合、（ｄ）実施の形態１でユークリッド距離（（Ｙ_１−１）^２＋Ｙ_２^２）を用いた場合について比較した。ただし（ｂ），（ｃ），（ｄ）の場合において、標準偏差ｓ_ｊ＝０となるときには実施の形態２に従う標準偏差ｓ_ｊの補正をおこなった。
【００９５】
図１０は、従来の方法および本発明の実施の形態に係る方法の各方法による評価距離を対比して示した図である。図１０を参照して、（ａ），（ｂ），（ｃ），（ｄ）は、上記の各場合を示している。
【００９６】
次に、これら４つのケースの判別精度を比較するために、信号空間における「５」のうち評価距離が最も大きかったものＤｍａｘと、単位空間における「５」以外の文字のなかで評価距離が最も小さかったものＤｍｉｎとを考えた。ここにＤｍａｘ＜Ｄｍｉｎであれば、使用したデータの範囲内は「５」の文字とそれ以外の文字が判別できることを示す。
【００９７】
よって、これらＤｍａｘ，Ｄｍｉｎの比（＝Ｄｍｉｎ／Ｄｍａｘ）の値が大きいほど、「５」の文字とそれ以外の文字が顕著に区別できることになる。したがって未知の文字に対しても誤判別を起こしにくく、より優秀なパターン認識システムであるといえる。
【００９８】
図１１は、従来の方法および本発明の実施の形態に係る方法によって得られたＤｍｉｎ／Ｄｍａｘの値を対比して示した図である。図１１を参照して、従来技術である（ａ）の場合に比べて、本発明の実施の形態に係る（ｂ），（ｃ），（ｄ）の各場合のほうがＤｍｉｎ／Ｄｍａｘの値が大きい。すなわち従来の方法に比べて、本発明の実施の形態に係る方法のほうが高い判別率を得ることができることを示している。この理由は、上述の通り、本発明の実施の形態では、単位空間における信号ごとの特徴量ばらつきに応じた異常の度合いを加味しているので、偏差（データと回帰直線との差）の異常度を、標準偏差ｓ_ｊに対して相対的に評価することができるためである。
【００９９】
なお、ＤｍｉｎおよびＤｍａｘの決定ならびにＤｍｉｎ／Ｄｍａｘの算出は、図２および図４に示した判断部６７によって実現可能である。
【０１００】
今回開示された実施の形態はすべての点で例示であって制限的なものでないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
【符号の説明】
【０１０１】
５０パターン認識装置、５１ＣＰＵ、５２主記憶装置、５３補助記憶装置、５４入力装置、５５出力装置、５６通信装置、６０記憶部、６１データ入力部、６２特徴項目生成部、６３統計量算出部、６４，６５特徴量算出部、６６評価距離算出部、６７判断部、６８出力部、６９補正部。

【特許請求の範囲】
【請求項１】
複数の特徴項目を各々有する複数のデータセットに基づいてパターン認識を行なうパターン認識装置であって、
単位空間に属する、特徴項目ｊのデータｙ_ｉｊ(１≦ｉ≦ｎ，１≦ｊ≦ｋ)を用いて、各特徴項目の項目値の平均値ｍ_ｊと、各特徴項目の項目値の標準偏差ｓ_ｊとを算出する統計量算出部と、
前記各特徴項目の項目値の平均値ｍ_１，ｍ_２，・・・，ｍ_ｋに対する、ｉ番目のデータセットｙ_ｉ１，ｙ_ｉ１，・・・，ｙ_ｉｋのゼロ点比例回帰直線ｙ＝β_ｉｍの傾きβ_ｉを、第一の縮約特徴項目として算出する第一縮約特徴項目算出部と、
前記ゼロ点比例回帰直線ｙ＝β_ｉｍと前記ｉ番目のデータセットｙ_ｉ１，ｙ_ｉ１，・・・，ｙ_ｉｋとの偏差を前記標準偏差ｓ_ｊで除した値の二乗和Ｓｅ_ｉ’＝Σ（（ｙ_ｉｊ−β_ｉｍ_ｊ）／ｓ_ｊ）^２を各データセットについて算出して、Ｓｅ_ｉ’の平方根に比例する量であるσ_ｉ’を第二の縮約特徴項目として算出する第二縮約特徴項目算出部と、
前記各データセットに対する第一の縮約特徴項目と、前記各データセットに対する第二の縮約特徴項目とに基づいて、評価距離Ｄを算出する評価距離算出部とを備える、パターン認識装置。
【請求項２】
前記評価距離算出部は、前記評価距離ＤをＭＴＡ法の距離として算出する、請求項１に記載のパターン認識装置。
【請求項３】
前記評価距離算出部は、前記評価距離Ｄをマハラノビス距離として算出する、請求項１に記載のパターン認識装置。
【請求項４】
前記評価距離算出部は、前記評価距離Ｄをユークリッド距離として算出する、請求項１に記載の記載のパターン認識装置。
【請求項５】
前記標準偏差ｓ_ｊが０の場合に、前記標準偏差ｓ_ｊをｓ_ｊ＝Δ／２／√ｎで補正する補正部をさらに備え、
Δは最小目盛りまたは分解能であり、ｎはデータセット数である、請求項１から４のいずれか１項に記載のパターン認識装置。
【請求項６】
複数の特徴項目を各々有する複数のデータセットに基づいてパターン認識を行なうパターン認識方法であって、
単位空間に属するデータセットｙ_ｉｊ(１≦ｉ≦ｎ，1≦ｊ≦ｋ)を用いて、各特徴項目の項目値の平均値ｍ_ｊと、各特徴項目の項目値の標準偏差ｓ_ｊとを算出するステップと、
前記各特徴項目の項目値の平均値ｍ_１，ｍ_２，・・・，ｍ_ｋに対する、ｉ番目のデータセットｙ_ｉ１，ｙ_ｉ１，・・・，ｙ_ｉｋのゼロ点比例回帰直線ｙ＝β_ｉｍの傾きβ_ｉを、第一の縮約特徴項目として算出するステップと、
前記ゼロ点比例回帰直線ｙ＝β_ｉｍと前記ｉ番目のデータセットｙ_ｉ１，ｙ_ｉ１，・・・，ｙ_ｉｋとの偏差を前記標準偏差ｓ_ｊで除した値の二乗和Ｓｅ_ｉ’＝Σ（（ｙ_ｉｊ−β_ｉｍ_ｊ）／ｓ_ｊ）^２を、各データセットについて算出して、Ｓｅ_ｉ’の平方根に比例する量であるσ_ｉ’を第二の縮約特徴項目として算出するステップと、
前記各データセットに対する第一の縮約特徴項目と、前記各データセットに対する第二の縮約特徴項目とに基づいて、評価距離Ｄを算出するステップとを備える、パターン認識方法。
【請求項７】
前記評価距離Ｄは、ＭＴＡ法の距離である、請求項６に記載のパターン認識方法。
【請求項８】
前記評価距離Ｄは、マハラノビス距離である、請求項６に記載のパターン認識方法。
【請求項９】
前記評価距離Ｄは、ユークリッド距離である、請求項６に記載のパターン認識方法。
【請求項１０】
前記標準偏差ｓ_ｊが０の場合に、前記標準偏差ｓ_ｊをｓ_ｊ＝Δ／２／√ｎで補正するステップをさらに備え、
Δは最小目盛りまたは分解能であり、ｎはデータセット数である、請求項６から９のいずれか１項に記載のパターン認識方法。

【図１】