説明

パターン認識装置およびパターン認識方法

【課題】より高い識別精度を得ることが可能なパターン認識装置および方法を提供する。
【解決手段】パターン認識方法は、各特徴項目の項目値の平均値m,m,・・・,mに対する、i番目のデータセットyi1,yi1,・・・,yikのゼロ点比例回帰直線y=βmの傾きβを第一の縮約特徴項目として算出するステップ(SB)と、ゼロ点比例回帰直線y=βmとi番目のデータセットとの偏差を標準偏差sで除した値の二乗和Se’=Σ((yij−β)/sを、各データセットについて算出して、Se’の平方根に比例する量であるσ’を第二の縮約特徴項目として算出するステップ(SC)と、第一の縮約特徴項目と、各データセットに対する第二の縮約特徴項目とに基づいて評価距離Dを算出して、評価距離Dに基づいて判断を行なうステップ(SD)とを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、多次元情報からパターン認識を行なうパターン認識装置およびパターン認識方法に関する。本発明は特に、画像や波形データのように多数の特徴項目を持つ対象に対して短時間にパターン認識を行なう分野に関する。
【背景技術】
【0002】
多次元情報から予測および診断を行なうパターン認識の方法の一つとして、田口玄一博士から提案されたMTシステムがある。MTシステムにおいては、MT法(マハラノビス距離を利用する方法)、MTA法(マハラノビス・タグチ・アジョイント法;MT法での相関係数行列を分散共分散行列で代替する方法)、TS法(特徴項目による直交展開を利用する方法)、T法(1)(T法と呼ばれる手法のうち、特に、単位空間が集団の中央の場合の手法)、およびT法(3)などが提案されている(たとえば非特許文献1,2,3を参照)。T法(3)とは、T法のうち、たとえば画像や文字の認識のように真値がなく、かつ複数の種類の単位空間がありうる場合に用いられる方法であり、RS法、RT法とも呼ばれる。また、上記のMTシステムを画像認識などに応用した装置もこれまでに提案されている(たとえば特許文献1,2を参照)。
【0003】
単位空間とは、目的に対して均質な集団に属するデータセットを意味する。健康診断(病気の発見)という目的に対して均質な集団とは、健康人の集団である。健康人の集団は、健康状態に関する特徴項目の値の分散が比較的小さいために、ある特定のパターンを形成していると考えられている。一方、後で説明する信号空間とは、予測精度を評価するときの基準になるものであり、上記の例では、健康状態がさまざまな(健康から重篤な不健康状態まで)集団に属するデータセットである。
【0004】
また、文字の認識の場合においては、「あ」という文字の単位空間には、人が「あ」と読める文字の平均画像(画素ごとの濃度)、または理想的な「あ」の文字の画像データを用いる。一方、信号空間のデータは、「お」、「ぬ」、「め」などといった「あ」と似た文字であり、それらの違いを判別するためのデータベースを作るのに用いる。似た文字を判別することができれば、「あ」とは全く異なる文字、たとえば「い」、「う」などの文字は容易に判別ができる(たとえば非特許文献3を参照)。
【0005】
MTシステムにおけるこれらの手法群は、(A)真値がない場合で、主に判別・識別に使用するMT法、MTA法、T法(3)のグループと、(B)真値が明確で、真値そのものを予測するTS法、T法(1)のグループとに分けられる。また、同一グループ内において、単位空間として用意することのできるデータセット数、多重共線性の有無などといった条件によって、手法が選択される。たとえばグループ(A)において、特徴項目数が膨大なことによる計算時間の問題、あるいは多重共線性の問題がある場合には、T法(3)が選択される。
【0006】
以下、いずれも(A)のグループに属するMT法とT法(3)とを取り上げて比較説明する。MT法では、単位空間データにおける相関係数行列の逆行列を演算する過程で相関係数が1となるような2つの特徴項目の組み合わせがある場合、あるいは特徴項目数kがデータセット数Nより大きい場合には、逆行列を計算できないという課題がある。また、MT法の場合、特徴項目数が膨大になると逆行列の計算自体に時間がかかるために、製造工程などのオンラインでMT法を使用する場合には、リアルタイムでの判定ができないなどといった問題もある。
【0007】
一方、T法(3)では、それらの問題を克服するために、簡単な演算で多数の特徴項目を2つの直交する特徴量(β、σで表す)に縮約して判別するという方法が採用される。したがって画像あるいは波形データの処理のように、特徴項目が非常に多く(画像の場合、数百万画素の濃度データを扱う場合もある)、かつデータ処理速度が求められる場合には、T法(3)が一般に用いられている。
【先行技術文献】
【特許文献】
【0008】
【特許文献1】特開2010−287179号公報
【特許文献2】特開2010−286353号公報
【非特許文献】
【0009】
【非特許文献1】田口玄一、品質工学便覧、日刊工業新聞社、2007年
【非特許文献2】田口玄一、MTシステムによる予測と推定、標準化と品質管理、Vol.58,No.8,pp.68−76,2005年
【非特許文献3】田口玄一、目的機能と基本機能(11)―認識のためのT法―、品質工学、Vol.14,No.2,pp.5−9,2006年
【発明の概要】
【発明が解決しようとする課題】
【0010】
図12および図13を用いて、非特許文献3に記載の方法(以下、T法(3)という)を説明する。図12は、特徴項目jのデータ例と、そのデータ例の平均値および標準偏差とを示した概念図である。
【0011】
図12を参照して、y1j,y2j,・・・,yij,・・・ykjは、特徴項目jのデータ(単位空間に属するデータ)を示す。添字iは、データセット番号(1≦i≦n)を示す。mは特徴項目jのデータの平均値であり、sは特徴項目jのデータの標準偏差である。
【0012】
T法(3)では、単位空間の特徴項目データの平均値が求められて、その平均値が標準条件のデータとされる。文字や画像の認識の場合には、濃度データあるいは微分・積分特性が単位空間の特徴項目データとして用いられることが多い。
【0013】
図13は、各特徴項目のデータの平均値mと、データセット番号iの特徴項目の値との関係をプロットした図である。図13を参照して、グラフの横軸は、単位空間における各特徴項目のデータの平均値mを示す。単位空間における各特徴項目のデータは、標準条件のデータに対応する。一方、グラフの縦軸は、標準条件のデータとは別のデータ(信号データとも呼ぶ)を示す。グラフ中の直線は、ゼロ点比例回帰直線を示す。この直線の傾きはβである。
【0014】
信号データが単位空間に近い性質を有する場合、信号データは、傾き1の回帰直線(図示せず)の近くにプロットされるとともに、ばらつきが小さくなる。一方、信号データが単位空間から遠い場合には、グラフ上にプロットされた信号データは傾き1の回帰直線からはずれるだけでなく、そのばらつきも大きくなる。信号データが単位空間と異なる文字の場合、あるいは異常な画像などの場合には、信号データが単位空間から遠くなる。
【0015】
T法(3)は、「回帰直線の傾き=β」と「回帰直線からのばらつき=σ」の2つの縮約された特徴量(縮約特徴量)から、単位空間(β=1、σ=0の場合)からの乖離度としての評価距離Dを計測しようという方法である。しかしながらT法(3)には以下に説明するような課題がある。
【0016】
図14は、T法(3)におけるデータ模型を示す図である。図14を参照して、T法(3)における、傾きβとばらつきσとは以下のようにして演算される。まず、j番目の特徴項目jの項目値のデータy1j,y2j,・・・,ynjに対して以下の演算を行ない、特徴項目jの項目値の平均値mを求める(j=1からkまで順次)。ここでnはデータセットの数である。
【0017】
=(y1j+y2j+・・・+ynj)/n
次に各特徴項目の平均値m,m,・・・,mに対して、単位空間に属するi番目のデータセットyi1,yi2,・・・,yikのゼロ点比例回帰直線の傾きβ(第一縮約特徴項目)を以下の式に従って算出する(i=1からnまで順次)。
【0018】
r=m+m+・・・+m
β=(mi1+mi2+・・・+mik)/r
ここでrはiによらず共通の値である。
【0019】
次に、単位空間に属するi番目のデータセットについて、ゼロ点比例回帰直線y=βmおよびi番目のデータセットyi1,yi2,・・・,yikを用いて以下の演算を行ない、偏差二乗和Seを求める(i=1からnまで順次)。
【0020】
Se=Σ(yij−β
第二縮約特徴項目σは、偏差二乗和Seの平方根に比例する量として与えられる。たとえば非特許文献3では、第二縮約特徴項目σは以下のように演算される。
【0021】
σ=√(Se/(k−1))
ここでは単位空間データの平均値miを用いて、単位空間に属するi番目のデータセットの第一縮約特徴項目Y(=β)および第二縮約特徴項目Y(σ)を求める方法を示した。判別の際には、単位空間に属するデータとは別のデータ(信号データ)が使用される。この場合にも、単位空間に属するデータとは別のデータの項目値と、単位空間データの平均値mとを用いて同様の演算を行ない、第一縮約特徴項目Yおよび第二縮約特徴項目Yを求める。
【0022】
次に、偏差二乗和Seの性質を考える。偏差二乗和Seは信号データiの各データと回帰直線との間の距離の二乗和である。しかしながら、上記の方法では、横軸の値(特徴項目)の違いを考慮せずに単純に偏差二乗和Seを求めている。これは、各特徴項目における状況の違いを考慮していないことを意味している。このような方法で問題が生じる場合の例としては、たとえば、対象データが画像・文字であったり、波形のデータであったりした場合があげられる。
【0023】
図15は、画像データから波形データを抽出して、その波形データから特徴項目を抽出する方法を示した図である。図15を参照して、(A)は原画像の模式図であり、(B)は、画像データから抽出された一部の画像の波形データを示した図である。図15(A)において、濃度をハッチの粗さで示す。ハッチが細かいほど濃度が高い。
【0024】
原画像のうちの一部の領域A(図15(A)において破線の枠で示す)の画像が切り出されて、その領域Aの画像に対応する波形データが抽出される。図15(A)では、原画像の横方向に沿って画像を切り出した場合を示しているが、原画像の横方向および縦方向に沿ってそれぞれ画像の切り出しが行なわれて、切り出された画像から波形データが抽出される。
【0025】
特徴項目としては、公知の微分特性および積分特性が採用される。微分特性は、波形とレベル線(図15(B)において点線で示す水平線)との交点Pの数(交差数)である。積分特性とは、存在量であり、波形データの値がレベル線以上となっている部分の横軸の量の合計である。なお、図15(B)においてレベル線と重なっている実線は、波形データの値がレベル線以上となっている部分の横軸の量を示している。これらの特徴項目は非負であり、かつ上限のない量である。レベル線を様々に設定することで、交差数と存在量とが特徴として抽出される。
【0026】
図16は、従来技術の課題を説明するために、単位空間のデータと、単位空間とは別のデータの一部とをプロットした図である。図16を参照して、単位空間における項目平均値m,m,・・・,mに対して単位空間の各データをプロットした場合。そのデータのばらつきは、入力の大きさにほぼ比例すると予測される。
【0027】
ここで単位空間データとは別の新しいデータがプロットされた場合を仮定する。図16では、データX,Yが単位空間データとは別のデータとしてプロットされている。簡単のために、回帰直線の傾きβは信号データに対しても同じく1であるとする。データXとデータYとは、回帰直線からの偏差がいずれも同じである。
【0028】
データXは単位空間のデータの集団の内部に位置するので、単位空間の分布の中のデータとみなせる。これに対してデータYは単位空間の分布からはずれたデータとみなされる。すなわち図16は、回帰直線からの偏差が同じデータでも、単位空間からの乖離度が異なる場合が生じることを示している。
【0029】
T法(3)において第二縮約特徴項目σを求める演算では、偏差二乗和Seを求めるときに、データX,Yに例示されるような状況の異なる偏差を区別なく合計している。このため、偏差二乗和Seは正常(単位空間に近い)と異常(単位空間から遠い)との違いを十分区別できる特徴となっていない。したがって判別精度が低下する可能性がある。このためには特徴項目を作成するにあたって、単位空間の状況を加味した補正が必要となる。
【0030】
なお、上記の問題は、特徴項目が微分特性や積分特性の場合に限られる問題ではない。さらに、上記の問題は、図16に示したような、データのばらつきが入力に比例する場合に限った問題でもないことも容易に理解される。
【0031】
本発明の目的は、画像や波形データのように多数の特徴項目をもつ対象に対するパターン認識を短時間に行なう分野において、より高い識別精度を得ることが可能なパターン認識装置および方法を提供することである。
【課題を解決するための手段】
【0032】
本発明のある局面に係るパターン認識装置は、複数の特徴項目を各々有する複数のデータセットに基づいてパターン認識を行なうパターン認識装置である。パターン認識装置は、統計量算出部と、第一縮約特徴項目算出部と、第二縮約特徴項目算出部と、評価距離算出部とを備える。統計量算出部は、単位空間に属する、特徴項目jのデータyij(1≦i≦n,1≦j≦k)を用いて、各特徴項目の項目値の平均値mと、各特徴項目の項目値の標準偏差sとを算出する。第一縮約特徴項目算出部は、各特徴項目の項目値の平均値m,m,・・・,mに対する、i番目のデータセットyi1,yi1,・・・,yikのゼロ点比例回帰直線y=βmの傾きβを、第一の縮約特徴項目として算出する。第二縮約特徴項目算出部は、ゼロ点比例回帰直線y=βmとi番目のデータセットyi1,yi1,・・・,yikとの偏差を標準偏差sで除した値の二乗和Se’=Σ((yij−β)/sを、各データセットについて算出して、Se’の平方根に比例する量であるσ’を第二の縮約特徴項目として算出する。評価距離算出部は、各データセットに対する第一の縮約特徴項目と、各データセットに対する第二の縮約特徴項目とに基づいて、評価距離Dを算出する。
【0033】
本発明の他の局面に係るパターン認識方法は、複数の特徴項目を各々有する複数のデータセットに基づいてパターン認識を行なうパターン認識方法である。パターン認識方法は、単位空間に属するデータセットyij(1≦i≦n,1≦j≦k)を用いて、各特徴項目の項目値の平均値mと、各特徴項目の項目値の標準偏差sとを算出するステップと、各特徴項目の項目値の平均値m,m,・・・,mに対する、i番目のデータセットyi1,yi1,・・・,yikのゼロ点比例回帰直線y=βmの傾きβを、第一の縮約特徴項目として算出するステップと、ゼロ点比例回帰直線y=βmとi番目のデータセットyi1,yi1,・・・,yikとの偏差を標準偏差sで除した値の二乗和Se’=Σ((yij−β)/sを、各データセットについて算出して、Se’の平方根に比例する量であるσ’を第二の縮約特徴項目として算出するステップと、各データセットに対する第一の縮約特徴項目と、各データセットに対する第二の縮約特徴項目とに基づいて、評価距離Dを算出するステップとを備える。
【発明の効果】
【0034】
本発明によれば、画像や波形データのように多数の特徴項目をもつ対象に対するパターン認識を短時間に行なう分野において、より高い識別精度を得ることが可能な装置および方法を提供することができる。
【図面の簡単な説明】
【0035】
【図1】本発明の実施の形態に係るパターン認識装置の概略構成を示した図である。
【図2】図1に示したパターン認識装置の実施の形態1に係る構成を示した機能ブロック図である。
【図3】実施の形態1に係るパターン認識処理の流れを説明するためのフローチャートである。
【図4】実施の形態2に係るパターン認識装置の機能ブロック図である。
【図5】実施の形態2に係るパターン認識処理の流れを説明するためのフローチャートである。
【図6】実施の形態3に係る画像認識に用いられる数字の「5」の画像の例を示した図である。
【図7】各データセットの特徴項目値を示した図である。
【図8】信号データを説明した図である。
【図9】図8に示した信号データの特徴項目の値を示す図である。
【図10】従来の方法および本発明の実施の形態に係る方法の各方法による評価距離を対比して示した図である。
【図11】従来の方法および本発明の実施の形態に係る方法によって得られたDmin/Dmaxの値を対比して示した図である。
【図12】特徴項目jのデータ例と、そのデータ例の平均値および標準偏差とを示した概念図である。
【図13】各特徴項目のデータの平均値mjと、データセット番号iの特徴項目の値との関係をプロットした図である。
【図14】T法(3)におけるデータ模型を示す図である。
【図15】画像データから波形データを抽出して、その波形データから特徴項目を抽出する方法を示した図である。
【図16】従来技術の課題を説明するために、単位空間のデータと、単位空間とは別のデータの一部とをプロットした図である。
【発明を実施するための形態】
【0036】
以下、この発明の実施の形態について図面を参照して詳しく説明する。なお、同一または相当する部分には同一の参照符号を付して、その説明を繰り返さない。
【0037】
図1は、本発明の実施の形態に係るパターン認識装置の概略構成を示した図である。図1を参照して、パターン認識装置50は、コンピュータシステムによって実現可能である。パターン認識装置50は、CPU(中央演算処理装置)51と、RAM(Random Access Memory)などの主記憶装置52と、HDD(Hard Disk Drive)などの補助記憶装置53と、キーボードやマウスなどの入力装置54と、モニタやプリンタなどの出力装置55と、外部の機器と情報の授受を行なう通信装置56とを備える。
【0038】
補助記憶装置53は、後述するパターン認識方法をコンピュータシステムに実行させるためのプログラムを格納する。CPU51が補助記憶装置53から当該プログラムを読み出し、主記憶装置52にプログラムをロードする。そしてCPU51が主記憶装置52にロードされたプログラムを実行することによってパターン認識方法が実行される。
【0039】
パターン認識方法をコンピュータシステムに実行させるためのプログラムを提供するための手段は特に限定されるものではない。たとえばCPU51がCD−ROM等の記憶媒体に記録されたプログラムを読み出して、そのプログラムを補助記憶装置53に格納してもよい。また、CPU51が通信回線を通じて提供されたプログラムを、通信装置56を介して受信し、その受信したプログラムを補助記憶装置53に格納してもよい。
【0040】
また、プログラムが記録された記録媒体は、コンピュータが読み取り可能な記録媒体であればよく、CD−ROMに限定されるものではない。
【0041】
[実施の形態1]
図2は、図1に示したパターン認識装置の実施の形態1に係る構成を示した機能ブロック図である。図2を参照して、パターン認識装置50は、記憶部60と、データ入力部61と、特徴項目生成部62と、統計量算出部63と、第一縮約特徴量算出部64と、第二縮約特徴量算出部65と、評価距離算出部66と、判断部67と、出力部68とを備える。
【0042】
記憶部60は、パターン認識のための単位空間のデータ、判別のためのしきい値等、本発明の実施の形態に係るパターン認識に必要な情報を記憶する。データ入力部61は、判別対象となるパターンデータ(文字パターンあるいは画像)を装置の外部から受付ける。データ入力部61にデータを入力するための方法および手段は特に限定されるものではない。
【0043】
特徴項目生成部62は、データ入力部61に入力されたパターンデータから、特徴項目データを抽出する。たとえば特徴項目生成部62は、パターンデータ(画像データ)の一部の画像を切り出して、その一部画像に基づいて画素座標に対する濃度の波形データ(図15(b)を参照)を抽出する。そして、特徴項目生成部62は、その波形データの微分特性と積分特性とを特徴項目データとして生成する。波形データの微分特性と積分特性とを特徴項目データとして生成するための方法は、図15により説明された方法を適用することができる。
【0044】
統計量算出部63は、単位空間に属する特徴項目jの項目値yij(1≦i≦n、1≦j≦k)を用いて、特徴項目jの項目値の平均値mおよび標準偏差sを算出する(j=1からkまで順次)。単位空間に属するデータセットyijは、たとえば記憶部60から読み出される。これにより、各特徴項目の項目値の平均値m,m,・・・,mと、各特徴項目の項目値の標準偏差s,s,・・・,sとが算出される。
【0045】
第一縮約特徴量算出部64は、各特徴項目の平均値m,m,・・・,mと、単位空間に属するi番目のデータセットyi1,yi2,・・・、yikとの相関を示すゼロ点比例回帰直線の傾きβ(第一縮約特徴項目)を算出する(i=1からnまで順次)。各特徴項目の平均値m,m,・・・,mは統計量算出部63によって算出される。単位空間に属するi番目のデータセットは、たとえば記憶部60から読み出される。
【0046】
第二縮約特徴量算出部65は、二乗和Se’を算出する。この二乗和Se’は、ゼロ点比例回帰直線と各項目値yijとの偏差を標準偏差sで除した値である。さらに第二縮約特徴量算出部65は、二乗和Se’の平方根に比例する量として第二縮約特徴量σを算出する(i=1からnまで順次)。
【0047】
評価距離算出部66は、第一縮約特徴量βおよび第二縮約特徴量σから評価距離Dを計算する。第一縮約特徴量βおよび第二縮約特徴量σは、以下に説明されるMTA法の距離、マハラノビス距離あるいはユークリッド距離などを用いて1つの尺度にまとめることができる。
【0048】
しきい値Dthは、単位空間のデータセットから求めた評価距離Dの集合を基準としたしきい値である。たとえば、しきい値Dthは、予め算出されるとともに記憶部60に記憶される。判断部67は、評価距離算出部66によって算出された評価距離Dと、しきい値Dthとを比較して、目的に対する判断を行なう。出力部68は、判断部67が判断した結果を装置の外部に出力する。
【0049】
図3は、実施の形態1に係るパターン認識処理の流れを説明するためのフローチャートである。図2および図3を参照して、ステップS0において、データ入力部61は、入力パターンデータ(文字パターンあるいは画像)を装置の外部から受付ける。特徴項目生成部62は、データ入力部61に入力されたパターンデータから、特徴項目データを抽出する。これによって判別の対象となるパターンデータのデータセットが準備される。
【0050】
(ステップSA)
ステップSAにおいて、統計量算出部63は、単位空間に属するデータセットyij(1≦i≦n、1≦j≦k)を用いて、各特徴項目について、項目値の平均値mおよび標準偏差sを算出する。具体的には、特徴項目jの項目値y1j,y2j,・・・,ynjに対して、以下の式(1)に従う演算を行なう(j=1からkまで順次)。
【0051】
=(y1j+y2j+・・・+ynj)/n ・・・(1)
次に、以下の式(2)に従って、各項目番号jについて、単位空間に属するデータの標準偏差sを算出する(j=1からkまで順次)。
【0052】
=(1/n)Σ(y1j−m ・・・(2)
ここで式(2)では、偏差二乗和Σ(y1j−mをnで除しているが(n−1)で除してもよい。jによって除する値が共通であれば、判別精度には影響しない。
【0053】
(ステップSB)
ステップSBにおいて、第一縮約特徴量算出部64は、ゼロ点比例回帰直線の傾きβ(第一縮約特徴項目)を算出する。ステップSBの処理の詳細は以下の通りである。
【0054】
第一縮約特徴量算出部64は、単位空間に属するi番目のデータセットyi1,yi2,・・・、yikに対して、以下の式(3)および(4)に従う演算を行なう(i=1からnまで順次)。
【0055】
r=m+m+・・・+m ・・・(3)
β=(mi1+mi2+・・・+mik)/r ・・・(4)
ここでrはiによらず共通である。上記の演算によって、単位空間の各データセットに対して第一縮約特徴量β,β,・・・,βが算出される。
【0056】
同様に、ステップS0で準備されたi番目のデータセット(判別対象パターンから抽出)と、単位空間データの平均値m(1≦j≦k)とを用いて、上述の式(3)、(4)にしたがって、判別対象パターンから抽出された特徴項目データについて、第一縮約特徴項目(単位空間の場合と同じくβ,β,・・・,βと表わす)が求められる。
【0057】
(ステップSC)
ステップSCにおいて、第二縮約特徴量算出部65は、まず二乗和Se’を算出する、具体的には、ゼロ点比例回帰直線y=βimおよび単位空間のi番目のデータセットyi1,yi2,・・・、yikを用いて、以下の式(5)に従う演算を行なう(i=1からnまで順次)。
【0058】
Se’=Σ((yij−β)/s ・・・(5)
次に第二縮約特徴量算出部65は、第二縮約特徴項目σ’を演算する。第二縮約特徴項目σ’は、Se’の平方根に比例する量として与えられる。たとえば第二縮約特徴項目は以下の式(6)に従って演算される。1/√kは比例定数である。ただしデータセットに共通であれば、比例定数は1/√kに限らない。
【0059】
σ’=√(Se’/k) ・・・(6)
これにより、単位空間の各データセットに対して第二縮約特徴量σ’,σ’,・・・,σ’が算出される。
【0060】
同様に、判別対象用パターンから抽出された特徴項目データ、およびその特徴項目データに対する第一縮約特徴項目(ステップSBにおいて算出)を用いて、上記式(5),(6)に従って、第二縮約特徴項目(単位空間の場合と同じくσ’,σ’,・・・,σ’と表わす)が算出される。
【0061】
判別の際には、単位空間とは異なるデータ、すなわち特徴項目生成部62で抽出された特徴項目の値を使用することになる。したがって上記のように、特徴項目の値と、単位空間データの平均値mおよび標準偏差sとを用いてステップSB,SCでの演算が行なわれる。これにより、単位空間とは別のデータセットに対する第一縮約特徴項目および第二縮約特徴項目を求めることができる。
【0062】
(ステップSD)
ステップSDでは、評価距離Dを算出する処理を実行することができる。第一縮約特徴項目、第二縮約特徴項目が計算済みであれば評価距離Dを算出できる。したがって、単位空間データおよび単位空間以外のデータ(判別対象用のデータ)のいずれに対しても下記の処理によって評価距離Dを算出することができる。
【0063】
ステップSDにおいて評価距離Dを算出する処理を説明する。この実施の形態では、以下に説明する三種類の評価距離のいずれも算出可能である。
【0064】
第一の評価距離Dは、MTA法の距離である。第一縮約特徴項目Y=β、第二縮約特徴項目Y=σ’(いずれもデータセット番号iを省略)とおくと、評価距離Dは以下の式(7)に従って計算される。
【0065】
D=V(Y−μ)−2V12(Y−μ)(Y−μ)+V(Y−μ) ・・・(7)
ここにV、Vは、それぞれ第一縮約特徴量および第二縮約特徴量の分散であり、V12は第一縮約特徴量と第二縮約特徴量との共分散であり、μ、μはそれぞれ第一縮約特徴量および第二縮約特徴量の平均値(データセット1からnまで)である。
【0066】
第二の評価距離Dは、マハラノビスの距離である。この場合の評価距離Dは、以下の式(8)に従って計算される。
【0067】
D=(Z,Z)・R−1・(Z,Z ・・・(8)
ここに、ZはYの基準化値であり、第一縮約特徴項目Yの平均値(データセット1からnまで)μを引いてYの標準偏差√Vで割ったものである。同様に、ZはYの基準化値で、Yの平均値μを引いて、Y2の標準偏差√V2で割ったものである。またR−1はZ,Zに関する相関係数行列の逆行列である。添字のTは転置を示す。このDの値を項目数2で除したり、またさらに平方根をとったりする場合もあるが、データセットによって共通であればどの方法でもよい。
【0068】
第三の評価距離Dは、ユークリッドの距離である。この場合の評価距離Dは以下の式(9)に従って計算される。
【0069】
D=Y+Y ・・・(9)
式(9)の計算ではYとYと共分散および相関は考慮されていない。データのゼロ点比例回帰の係数であるY=βと、その残差であるばらつきY=σ’とはほぼ直交する(相関係数が0に近い)性質がある。したがってYとYの共分散および相関を考慮しなくても、考慮した場合と同様の結果が得られることが多い。
【0070】
単位空間におけるYの理想状態は1であり、単位空間におけるYの理想状態は0である。理想状態での距離を最小(=0)と定義したい場合は、第三の評価距離Dを以下のように計算してもよい。以下の式(10)によれば、Dの値が単位空間内で極値をとることがなく、理想状態に近いほど小さい距離を与えることができる。
【0071】
D=(Y−1)+Y ・・・(10)
なお、これらのDの値を項目数2で除したり、さらに平方根をとったりする場合もあるが、データセットによって共通であればどの方法でもよい。
【0072】
(ステップSE)
ステップSEにおける判別処理を説明する。単位空間のデータセットから求めた評価距離の集合を基準とした、しきい値Dthをあらかじめ定めておく。たとえば、単位空間の評価距離をD,D,・・,D、その平均値をμ、標準偏差をσとした場合、評価距離の2シグマ値(μ+2σ)をDthと定めるなどである。また、目標の誤判別率を設けて、しきい値を決める方法も適用できる。いずれにしても、各々の判別対象の固有の問題であるので、しきい値の決定方法は、これらに限るものではない。
【0073】
つぎに、単位空間とは別のデータセット(判別対象用パターンから抽出された特徴項目のデータセット)について算出された評価距離D’の大きさと、しきい値Dthとを比較して、目的に対する判断を行なう。たとえば評価距離D’と、しきい値Dthとの大小関係に基づいて、目的に対する判断(文字の認識、パターンの識別)が行なわれる。出力部68は、判断部67が判断した結果を装置の外部に出力する。
【0074】
実施の形態1に係る方法によれば、ステップSCの処理によって、項目ごとのばらつきで補正した第二縮約特徴項目を生成する。すなわち、偏差の2乗値ではなく、偏差(yij−β)を単位空間項目値の標準偏差sで割った値の2乗値が総和される。これにより、第二縮約特徴項目を算出する過程で、単位空間における信号ごとの特徴量ばらつきに応じた異常の度合いを加味することができる。すなわち、単位空間でばらつきが大きい部分は偏差が大きくとも乖離は大きく、逆に単位空間でばらつきが小さい部分は偏差が小さくても乖離が大きいと考える。
【0075】
実施の形態1によれば、偏差の異常度を標準偏差sに対して相対的に評価することができる。したがって非特許文献3による方法での不具合、すなわち、単位空間における特徴項目ごとの状況が加味されておらず、判別精度が低下するという問題を回避できる。実施の形態1に係る方法によれば、判別精度を向上させることができるので、パターン認識の精度を向上させることができる。さらに誤判別による損失を低減することができる。
【0076】
また、実施の形態1によれば、評価距離DにMTA法の距離あるいはマハラノビスの距離を用いる。この場合、第一縮約特徴項目Yと第二縮約特徴項目Yとの相関の情報が考慮されるので、より精度の高いパターン認識が可能となる。
【0077】
また、実施の形態1によれば、評価距離にユークリッドの距離を用いることもできる。MTA法の距離の場合には、分散・共分散、マハラノビスの距離の場合には相関係数の計算が必要となる。したがってデータセット数が低い場合には統計的な信頼性が低くなる可能性がある。これに対して、評価距離にユークリッドの距離を用いた場合には、単位空間のデータセット数が極端に少ない場合(1つでもよい)でも評価距離を求めることができる点でメリットがある。さらに、評価距離にユークリッドの距離を用いた場合には、計算式が簡単になるので、少ない容量のメモリでプログラムが実装可能になる点でメリットがある。
【0078】
なお、上記の説明では、ステップSC,SDにおいて、ステップSAにおいて算出された単位空間項目値の標準偏差sが用いられるが、ステップSC,SDの各々において単位空間項目値の標準偏差sを算出してもよい。
【0079】
[実施の形態2]
図4は、実施の形態2に係るパターン認識装置の機能ブロック図である。図2および図4を参照して、実施の形態2では、パターン認識装置50は、補正部69をさらに備える点で実施の形態1と異なる。なお、図4に示したパターン認識装置50の他の部分の構成は、図2に示した構成と同様であるので以後の説明は繰り返さない。
【0080】
上記の実施の形態1においては、式(5)において、項目ごとの標準偏差sが0のときに偏差二乗和Se’が計算できなくなることが想定される。実施の形態2では、補正部69が、項目jのn個のデータのうち1つに補正を加える。これにより、統計量算出部63が標準偏差sを算出する際に標準偏差sが0とならないようにすることができる。
【0081】
計算上の標準偏差sが0であっても、実際には計測の最小目盛りや分解能などの有効数字以下ではばらつきが存在していると考えられる。したがって、補正部69は、項目jのn個のデータのうち1つにΔ/2を加える処理を行なう。n個のデータのうちの1つであれば、どのデータにΔ/2を加えてもよい。Δは最小目盛りや分解能である。
【0082】
実施の形態2では、1つのサンプルで最小目盛りや分解能の半分だけばらついていたと考えるのである。これによって、項目jの標準偏差sは以下の式(11)に従って表わされる。
【0083】
=Δ/2/√n ・・・(11)
実施の形態2では、補正前の標準偏差sが0である場合には、上記の式(11)に従って標準偏差sが補正され、その補正された標準偏差sを用いて実施の形態1と同様の計算が実行される。図5は、実施の形態2に係るパターン認識処理の流れを説明するためのフローチャートである。
【0084】
図2および図5を参照して、実施の形態2に係るパターン認識処理では、ステップS0の処理とステップSAの処理との間にステップS1の処理が追加される。ステップS1において、補正部69は、記憶部60に記憶された単位空間のデータを用いて標準偏差sを一旦計算する。補正部69は、計算上の標準偏差sが0になった場合に、項目jのn個のデータのうちの1つにΔ/2を加える。実施の形態2に係るパターン認識処理の他のステップの処理に関しては、実施の形態1と同様であるので以後の説明は繰り返さない。
【0085】
実施の形態2によれば、偏差二乗和Se’の演算時に演算が停止する、あるいはエラーが発生するといったことを回避できるので、判別処理を遂行することができる。また、偏差二乗和Se’の演算時にエラーが発生した場合の処理を設けることなく判別処理を遂行することもできる。
【0086】
[実施の形態3]
実施の形態3は、パターン認識装置および方法の具体的な適用である。なお以下の説明は、本発明の各実施の形態による効果を具体的に説明できる一例を示すものであり、本発明の範囲を限定するものではない。
【0087】
実施の形態3に係るパターン認識装置は、図2または図4に示した構成のいずれの構成を有してもよい。実施の形態3に係るパターン認識装置が図2に示す構成を有する場合には、図3に示したフローチャートに従って処理が実行される。実施の形態3に係るパターン認識装置が図4に示す構成を有する場合には、図5に示したフローチャートに従って処理が実行される。
【0088】
この実施の形態では、簡単な画像認識の例として数字の「5」を他の数字「1,2,3,4,6,7,8,9,0」と判別した。図6は、実施の形態3に係る画像認識に用いられる数字の「5」の画像の例を示した図である。
【0089】
図6を参照して、数字の「5」に対応する4種類の画像が、5×7の画素に2階調(濃度0か1)で描かれている。実施の形態3では、画像の各行、各列の微分特性および積分特性を特徴項目として用いた。
【0090】
この場合、数字の「5」の真値(その数字らしさ)の定量化は難しい。しかし、あらかじめテスターの目視によって、数字の「5」と読める画像とそうでない画像(つまり、「5」以外の数字)とがデータとして区別されている。このような判別技術は、画像認識における熟練者やプロの目視検査、診断を省略することができる可能性がある。したがって検査・診断などの工数削減、および生産性向上に寄与するものである。
【0091】
図7は、各データセットの特徴項目値を示した図である。図7を参照して、単位空間として、4つのデータセットの特徴量を準備した。それぞれのデータセットは(5列+7行)×(積分特性+微分特性)=24項目の特徴項目をもっている。
【0092】
つぎに信号データを準備した。図8は、信号データを説明した図である。図8(A)は、単位空間とは別の「5」と読める文字の画像を示している。図8(B)は、典型的な「1,2,3,4,6,7,8,9,0」の文字の画像を示している。3種類の「5」の画像および「1,2,3,4,6,7,8,9,0」の各数字の画像について、単位空間データと同様に特徴項目の値を求めた。
【0093】
図9は、図8に示した信号データの特徴項目の値を示す図である。図8および図9を参照して「歪んだ5」は図8(A)に示した数字「5」の画像を表わす。それぞれのデータセットは(5列+7行)×(積分特性+微分特性)=24項目の特徴項目をもっている。
【0094】
続いて、(a)従来のT法(3)で評価距離にMTA法の距離を用いた場合、(b)実施の形態1でMTA法の距離を用いた場合、(c)実施の形態1でマハラノビス距離を用いた場合、(d)実施の形態1でユークリッド距離((Y−1)+Y)を用いた場合について比較した。ただし(b),(c),(d)の場合において、標準偏差s=0となるときには実施の形態2に従う標準偏差sの補正をおこなった。
【0095】
図10は、従来の方法および本発明の実施の形態に係る方法の各方法による評価距離を対比して示した図である。図10を参照して、(a),(b),(c),(d)は、上記の各場合を示している。
【0096】
次に、これら4つのケースの判別精度を比較するために、信号空間における「5」のうち評価距離が最も大きかったものDmaxと、単位空間における「5」以外の文字のなかで評価距離が最も小さかったものDminとを考えた。ここにDmax<Dminであれば、使用したデータの範囲内は「5」の文字とそれ以外の文字が判別できることを示す。
【0097】
よって、これらDmax,Dminの比(=Dmin/Dmax)の値が大きいほど、「5」の文字とそれ以外の文字が顕著に区別できることになる。したがって未知の文字に対しても誤判別を起こしにくく、より優秀なパターン認識システムであるといえる。
【0098】
図11は、従来の方法および本発明の実施の形態に係る方法によって得られたDmin/Dmaxの値を対比して示した図である。図11を参照して、従来技術である(a)の場合に比べて、本発明の実施の形態に係る(b),(c),(d)の各場合のほうがDmin/Dmaxの値が大きい。すなわち従来の方法に比べて、本発明の実施の形態に係る方法のほうが高い判別率を得ることができることを示している。この理由は、上述の通り、本発明の実施の形態では、単位空間における信号ごとの特徴量ばらつきに応じた異常の度合いを加味しているので、偏差(データと回帰直線との差)の異常度を、標準偏差sに対して相対的に評価することができるためである。
【0099】
なお、DminおよびDmaxの決定ならびにDmin/Dmaxの算出は、図2および図4に示した判断部67によって実現可能である。
【0100】
今回開示された実施の形態はすべての点で例示であって制限的なものでないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
【符号の説明】
【0101】
50 パターン認識装置、51 CPU、52 主記憶装置、53 補助記憶装置、54 入力装置、55 出力装置、56 通信装置、60 記憶部、61 データ入力部、62 特徴項目生成部、63 統計量算出部、64,65 特徴量算出部、66 評価距離算出部、67 判断部、68 出力部、69 補正部。

【特許請求の範囲】
【請求項1】
複数の特徴項目を各々有する複数のデータセットに基づいてパターン認識を行なうパターン認識装置であって、
単位空間に属する、特徴項目jのデータyij(1≦i≦n,1≦j≦k)を用いて、各特徴項目の項目値の平均値mと、各特徴項目の項目値の標準偏差sとを算出する統計量算出部と、
前記各特徴項目の項目値の平均値m,m,・・・,mに対する、i番目のデータセットyi1,yi1,・・・,yikのゼロ点比例回帰直線y=βmの傾きβを、第一の縮約特徴項目として算出する第一縮約特徴項目算出部と、
前記ゼロ点比例回帰直線y=βmと前記i番目のデータセットyi1,yi1,・・・,yikとの偏差を前記標準偏差sで除した値の二乗和Se’=Σ((yij−β)/sを各データセットについて算出して、Se’の平方根に比例する量であるσ’を第二の縮約特徴項目として算出する第二縮約特徴項目算出部と、
前記各データセットに対する第一の縮約特徴項目と、前記各データセットに対する第二の縮約特徴項目とに基づいて、評価距離Dを算出する評価距離算出部とを備える、パターン認識装置。
【請求項2】
前記評価距離算出部は、前記評価距離DをMTA法の距離として算出する、請求項1に記載のパターン認識装置。
【請求項3】
前記評価距離算出部は、前記評価距離Dをマハラノビス距離として算出する、請求項1に記載のパターン認識装置。
【請求項4】
前記評価距離算出部は、前記評価距離Dをユークリッド距離として算出する、請求項1に記載の記載のパターン認識装置。
【請求項5】
前記標準偏差sが0の場合に、前記標準偏差sをs=Δ/2/√nで補正する補正部をさらに備え、
Δは最小目盛りまたは分解能であり、nはデータセット数である、請求項1から4のいずれか1項に記載のパターン認識装置。
【請求項6】
複数の特徴項目を各々有する複数のデータセットに基づいてパターン認識を行なうパターン認識方法であって、
単位空間に属するデータセットyij(1≦i≦n,1≦j≦k)を用いて、各特徴項目の項目値の平均値mと、各特徴項目の項目値の標準偏差sとを算出するステップと、
前記各特徴項目の項目値の平均値m,m,・・・,mに対する、i番目のデータセットyi1,yi1,・・・,yikのゼロ点比例回帰直線y=βmの傾きβを、第一の縮約特徴項目として算出するステップと、
前記ゼロ点比例回帰直線y=βmと前記i番目のデータセットyi1,yi1,・・・,yikとの偏差を前記標準偏差sで除した値の二乗和Se’=Σ((yij−β)/sを、各データセットについて算出して、Se’の平方根に比例する量であるσ’を第二の縮約特徴項目として算出するステップと、
前記各データセットに対する第一の縮約特徴項目と、前記各データセットに対する第二の縮約特徴項目とに基づいて、評価距離Dを算出するステップとを備える、パターン認識方法。
【請求項7】
前記評価距離Dは、MTA法の距離である、請求項6に記載のパターン認識方法。
【請求項8】
前記評価距離Dは、マハラノビス距離である、請求項6に記載のパターン認識方法。
【請求項9】
前記評価距離Dは、ユークリッド距離である、請求項6に記載のパターン認識方法。
【請求項10】
前記標準偏差sが0の場合に、前記標準偏差sをs=Δ/2/√nで補正するステップをさらに備え、
Δは最小目盛りまたは分解能であり、nはデータセット数である、請求項6から9のいずれか1項に記載のパターン認識方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate


【公開番号】特開2013−89064(P2013−89064A)
【公開日】平成25年5月13日(2013.5.13)
【国際特許分類】
【出願番号】特願2011−229525(P2011−229525)
【出願日】平成23年10月19日(2011.10.19)
【出願人】(000006013)三菱電機株式会社 (33,312)
【Fターム(参考)】