説明

表面欠陥の分布形態解析装置、方法、及びプログラム

【課題】散発的な点を除いた自然な形で薄板の表面欠陥をグループ化できるようにする。
【解決手段】薄板コイルのプロセスラインや検査ラインに設置された自動疵検査装置で測定された疵データ(座標データを含む)を入力する疵データ入力部101と、疵データ入力部101によって入力された疵データに基づいて、例えばK-means法を用いて、薄板コイルの疵の分布形態を表わす初期クラスタを生成する初期クラスタ生成部103aと、初期クラスタ生成部103aによって生成された初期クラスタから散発的な分布をなすデータを分離して、集中的な分布をなすデータを含むクラスタを生成する分離部103cと、分離部103cによって生成された集中的な分布をなすデータを含むクラスタ同士を結合する結合部103dとを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、薄板の表面欠陥の分布形態解析装置、方法、プログラムに関し、例えば自動車や家電製品の外板等、良好な外観を要求される薄板製品に発生する疵や汚れ等の表面欠陥について、その発生個数や発生位置、更にはその分布形態から、表面欠陥の発生要因を分析するために用いて好適な技術に属する。
【背景技術】
【0002】
薄板コイルのような鉄鋼製品に発生する疵や汚れ等の表面欠陥の発生要因を分析するために、例えば光学式の自動疵検査装置を用いて、プロセスラインを通過するコイルの表面欠陥を検出し、検出した表面欠陥に関する情報を保存することが行われている。
【0003】
特許文献1には、薄板コイルに発生し、自動疵検査装置等によって収集・蓄積された少なくとも発生位置を含む疵データから、疵の分布形態に関する情報を定量的な指標として自動的に抽出し、提示するようにした薄板の表面欠陥の分布形態解析手法について開示されている。
【0004】
特許文献1に開示された薄板の表面欠陥の分布形態解析手法では、自動疵検出装置で採取された疵データに基づいて、疵同士を自動的にグループ化する。その場合に、直線状の分布と楕円状の分布とが混在した状況を統一した指標で扱うことができれば有用であることから、直線と楕円とを近似的に表現し得る手法として、各疵グループの分布形態を二次元のガウス関数で表現するようにしている。
【0005】
非特許文献1に開示されたクラスタリング手法では、ノイズと考えられる部分を分離したクラスタを生成する方法である。
【0006】
【特許文献1】特開2005−257660号公報
【非特許文献1】C.Bohm,C.Faloutsos,J.Pan,and C.Plant. Robust Information-theoretic Clustering. In KDD Conference,pages 65-75,2006.
【非特許文献2】D.Chakrabarti,S.Papafimitriou,D.S.Modha,and C.Faloutsos.Fully automatic cross-associations.In KDD Conference,pages 79-88,2004.
【非特許文献3】D.A.Huffman,"A Method for the Construction of Minimum-Redundancy Codes", Proceedings of the I.R.E., sept 1952, pp 1098-1102
【発明の開示】
【発明が解決しようとする課題】
【0007】
ところで、薄板コイルにおいては密集する分布形態と散発的な分布形態を区別して扱う必要がある。疵同士のグループ化の際に、上述したような散発的な分布形態を別個に扱えないクラスタリングの手法をそのまま利用すると、発生要因分析で誤った解析結果となることになる。非特許文献1の手法を適用することで、薄板コイルにおいて区別して扱う必要がある密集する分布形態と散発的な分布形態を表わすことができるが、初期クラスタ数が少なければ適切なクラスタが生成されない、多ければ計算時間がクラスタ数の3乗のオーダーで増加する問題がある。
【0008】
本発明は、散発的な分布形態を区別し、自然な形で薄板の表面欠陥をグループ化する際に、初期クラスタ数が異なっていても適切なクラスタを生成することができるようにすることを目的とする。
【課題を解決するための手段】
【0009】
本発明の表面欠陥の分布形態解析装置は、薄板に発生する表面欠陥の分布形態を解析する表面欠陥の分布形態解析装置において、少なくとも解析対象の薄板の表面欠陥の発生位置に関する座標データを入力する入力手段と、前記入力手段によって入力された集中的な分布と散発的な分布が混在した表面欠陥の座標データに基づいて、所定のクラスタリング手法を用いて、前記薄板の表面欠陥の分布形態を表わす初期クラスタを生成する初期クラスタ生成手段と、生成したクラスタの良さを評価する指標である圧縮コストを、クラスタの分布形態に応じて座標データの情報圧縮を行った際の情報量として算出する圧縮コスト算出手段と、前記初期クラスタ生成手段によって生成された初期クラスタを、前記圧縮コストに基づいて、集中的な分布と散発的な分布をなす座標データの組み合わせに分離したクラスタを生成する分離手段と、前記分離手段によって生成された集中的な分布をなす座標データを含むクラスタ同士を、前記圧縮コストを結合判断基準に用いて結合する結合手段とを備え、前記分離手段においてクラスタから分離された散発的な分布をなす座標データを、新規の又は別のクラスタの集中的な分布をなす座標データとして組み入れることを特徴とする。
本発明の表面欠陥の分布形態解析方法は、薄板に発生する表面欠陥の分布形態を解析する表面欠陥の分布形態解析方法において、少なくとも解析対象の薄板の表面欠陥の発生位置に関する座標データを入力する入力手順と、前記入力手順によって入力された集中的な分布と散発的な分布が混在した表面欠陥の座標データに基づいて、所定のクラスタリング手法を用いて、前記薄板の表面欠陥の分布形態を表わす初期クラスタを生成する初期クラスタ生成手順と、生成したクラスタの良さを評価する指標である圧縮コストを、クラスタの分布形態に応じて座標データの情報圧縮を行った際の情報量として算出する圧縮コスト算出手順と、前記初期クラスタ生成手順によって生成された初期クラスタを、前記圧縮コストに基づいて、集中的な分布と散発的な分布をなす座標データの組み合わせに分離したクラスタを生成する分離手順と、前記分離手順によって生成された集中的な分布をなす座標データを含むクラスタ同士を、前記圧縮コストを結合判断基準に用いて結合する結合手順とを有し、前記分離手順においてクラスタから分離された散発的な分布をなす座標データを、新規の又は別のクラスタの集中的な分布をなす座標データとして組み入れることを特徴とする。
本発明のプログラムは、薄板に発生する表面欠陥の分布形態を解析する処理をコンピュータに実行させるためのプログラムにおいて、少なくとも解析対象の薄板の表面欠陥の発生位置に関する座標データを入力する入力処理と、前記入力処理によって入力された集中的な分布と散発的な分布が混在した表面欠陥の座標データに基づいて、所定のクラスタリング手法を用いて、前記薄板の表面欠陥の分布形態を表わす初期クラスタを生成する初期クラスタ生成処理と、生成したクラスタの良さを評価する指標である圧縮コストを、クラスタの分布形態に応じて座標データの情報圧縮を行った際の情報量として算出する圧縮コスト算出処理と、前記初期クラスタ生成処理によって生成された初期クラスタを、前記圧縮コストに基づいて、集中的な分布と散発的な分布をなす座標データの組み合わせに分離したクラスタを生成する分離処理と、前記分離処理によって生成された集中的な分布をなす座標データを含むクラスタ同士を、前記圧縮コストを結合判断基準に用いて結合する結合処理とをコンピュータに実行させ、前記分離処理においてクラスタから分離された散発的な分布をなす座標データを、新規の又は別のクラスタの集中的な分布をなす座標データとして組み入れることを特徴とする。
【発明の効果】
【0010】
本発明によれば、分布の疎密に応じた自然な形で薄板の表面欠陥をグループ化することができる。また、初期クラスタ数が異なっていても適切なクラスタを生成することができる。これにより、薄板の表面欠陥の分布形態の解析精度を高めるとともに、例えば表面欠陥グループの重心位置、空間サイズ、表面欠陥個数密度といった表面欠陥の分布に係わる特徴量抽出を高速かつ大量に、そして正確に行うことが可能になる。
【発明を実施するための最良の形態】
【0011】
以下、添付図面を参照して、本発明の好適な実施形態について説明する。
図1は、本実施の形態の薄板の表面欠陥の分布形態解析装置の構成の一例を示す図である。以降では、欠陥を疵と記す。101は疵データ入力部であり、鉄鋼製品である薄板コイルのプロセスラインや検査ラインに設置された自動疵検査装置で測定された少なくとも発生位置情報(座標データ)を含む疵データを、コンピュータネットワークやコンピュータ読み取り可能な記録媒体を介して本装置に入力するための入力手段として機能する。疵データには、薄板コイルの二次元平面内のある基準位置を原点とする疵の発生位置に関する座標データが含まれる。薄板コイルの圧延方向の座標をx、幅方向の座標をyとし、当該薄板コイル内にN個の欠陥が発生した場合、座標データは、N行2列の行列で表現することができる。また、疵データには、各疵が薄板コイルの表面、及び裏面のいずれに発生しているかを識別するための情報や、薄板コイルの圧延方向の長さや幅等、疵が発生したコイルに関する寸法情報が含まれている。更に、疵の圧延方向の寸法値と幅方向の寸法値、疵の種類、及び疵の有害度等の情報が含まれる場合もある。
【0012】
102は疵データ蓄積部であり、疵データ入力部101によって入力された疵データを保存、蓄積する。そして、解析を行う際に、外部から入力される疵分布出力指示に応じて、コイル単位で疵データを取り出す機能を有する。また、薄板コイルの表面と裏面とで、疵データをそれぞれ別個に解析したい場合には、各疵の発生面情報(疵が表面及び裏面のいずれにあるかに関する情報)を用いて疵データを分離することによって、解析したい面の情報のみを取り出す。
【0013】
103は演算部であり、疵データ入力部101によって入力され、疵データ蓄積部102に蓄積された疵データに基づいてクラスタリングを行い、得られたクラスタから疵の分布形態を特徴量化する演算処理を実行する。演算部103は、初期クラスタ生成部103aと、圧縮コスト算出部103bと、分離部103cと、結合部103dとを含み、これら各部103a〜103dによって疵同士をグループ化(クラスタリング)し、更にはそれら疵グループ(クラスタ)の重心位置、空間サイズ、個数密度といった疵の分布に係わる特徴量を求める特徴量算出手段としても機能する。なお、疵グループの重心位置、空間サイズ、個数密度の求め方については、例えば特許文献1に開示されているように、重心位置を座標データの平均により求め、空間サイズを分布するデータを覆う重心位置を中心とした二次元ガウス関数のパラメータである2つの標準偏差とし、個数密度をグループ内の疵個数を空間サイズを示すそれぞれの標準偏差で除算した値とするように、既存の技術を用いればよい。
【0014】
初期クラスタ生成部103aは、疵データ入力部101によって入力され、疵データ蓄積部102に蓄積された疵データに基づいて、例えばK-means法といったクラスタリング手法を用いて、期待するクラスタ数を下限として、疵の分布形態を表わす初期クラスタを生成する初期クラスタ生成手段として機能する。K-means法の詳細な説明は省略するが、K-means法は、各クラスタの中心点を定め、クラスタ内の各疵データと中心点との距離を求め、その距離の2乗の総和を最小化するように疵データの各クラスタへの再割り当てと再割り当てによるクラスタの中心点の修正を繰り返し行う方法である。
【0015】
圧縮コスト算出部103bは、詳細は後述するが、生成したクラスタの良さを評価する指標である圧縮コストを、クラスタの分布形態に応じて座標データの情報圧縮を行った際の情報量として算出する圧縮コスト算出手段として機能する。
【0016】
分離部103cは、詳しくは後述するが、初期クラスタ生成部103aによって生成された初期クラスタを、圧縮コストに基づいて、集中的な分布と散発的な分布をなす座標データの組みに分離したクラスタを生成する分離手段として機能する。
【0017】
結合部103dは、詳細は後述するが、分離部103cによって生成された集中的な分布をなす座標データを含むクラスタ同士を、圧縮コストを結合判断基準に用いて結合する結合手段として機能する。
【0018】
104は解析結果表示部であり、指定された薄板コイルに関する演算部103による演算結果に基づいて、クラスタリングされた疵の分布に係わる特徴量を表示する解析結果表示手段として機能する。
【0019】
ここで、本発明で導入するクラスタリング手法の概要について説明する。
【0020】
あるデータ集合を考えた場合、図2(a)は、多くの人間の感覚として良いと思われるクラスタリングの例を示し、ガウス分布状の1つのクラスタ、直線分布状の1つのクラスタ及び散発的に発生している点(以降、外れ点と呼ぶ)が含まれている。それに対して、図2(b)は、一般的なクラスタリング手法(例えばK-means法)によるクラスタリングの例を示し、散発的に発生している外れ点を含むガウス分布状の5つのクラスタが生成されている。
【0021】
本発明で導入するクラスタリング手法は、教師なしクラスタ分割法であり、図2(a)に示すようなクラスタリングを実現すべく、圧縮コストなる新たな指標を導入する。圧縮コストは、1つの点が2つのクラスタのいずれに属するのが適当であるかを表わす指標として用いる。そして、例えばK-means法(クラスタ数kを指定)によるグループ化の後、圧縮コストに基づいて、外れ点分離及びクラスタ結合というアルゴリズムを実行する。
【0022】
換言すれば、クラスタの良さを示す圧縮コストなる指標を使用して、
(M1)外れ点の存在下におけるクラスタ形状のロバストな評価
(M2)圧縮コストに基づく外れ点の識別、分離
(M3)圧縮コストに従った結合によるクラスタの構築
というアルゴリズムを実行する。
【0023】
<圧縮コスト>
圧縮コストは、情報量圧縮方法の1つのハフマン符号化(非特許文献3を参照)を利用し、圧縮前の符号の出現確率を用いて圧縮した場合に平均符号長(単位はビット)が最小となる特長を応用したものである。
【0024】
クラスタ内の発生位置の出現確率の代わりに予め用意した複数の確率分布(例えば、ガウス分布、ラプラス分布、一様分布等の任意の分布)を用いて符号化を行った場合、符号長が最小となった確率分布がクラスタの形状(特徴)を最も良く表わしている分布である
ことを示す。
【0025】
更に、個々のクラスタの確率分布による圧縮コストに加え、クラスタの中心位置、確率分布の形態を示す情報、平均や分散等の確率分布を示すパラメータ、クラスタ内のデータ個数等といった複数のクラスタを識別するための情報も符号化及び情報圧縮を行い圧縮コストに加える。これにより過度に複数のクラスタに分離されることを防ぐことができる。
【0026】
本発明では、クラスタの形状を示す確率分布の利用によって情報量圧縮を行い、その際のクラスタ番号及びデータ点の座標のための符号長と符号化に必要なその他の情報量に相当する符号長を合わせて圧縮コストとして定義し、圧縮コストを最小化することで所望のクラスタを生成する手法を提示するものである。
【0027】
符号化に必要なその他の情報量に相当する圧縮コストには、クラスタ数kを示す符号長、各クラスタの形状を示すパラメータ(例えばそれがガウス分布形状のクラスタである場合、平均及び分散)を示す符号長等が含まれる。詳細は以下で触れて行く。
【0028】
ここで扱う座標データはすべて有限精度しか取り扱わないので、整数であると仮定して符号化を行う。すなわち、データ点はd次元のグリッド上に存在するものとする。グリッドの分解能は任意に選択できる。例えば、座標データの有効数字が小数点第1桁までであった場合は、グリッド定数で表わすグリットの分解能を、小数点第1桁の最小値である0.1とするとよい。
【0029】
以下の本願の手法は、(a)整数の符号化手法、(b)一旦クラスタに属するとされた点の符号化手法からなる。
【0030】
いま、図2に示したデータ集合を持っているとする。ここでは、ガウス分布及び一様分布(最小外接長方形を範囲とした一様分布)といった2つの分布が利用可能であるものとする。一旦、点をクラスタに割り当てれば、クラスタ中心からの偏差に対し、ハフマン符号化(非特許文献3を参照)を適用することにより、少ないデータ量で効率的に記録する
ことができる。
【0031】
(整数の符号化)
小さい整数にはより少ないビット数で、大きい整数にはより多いビット数で符号化を行う為に1進数表記にて整数の符号化を行う。1進数表記における基本の表記方法は、自然数の大きさに応じて零を並べるものである。本願では0と1を用いた1進数表記法であるイライアスコード或いはSelf-delimiting法と呼ばれる1進数符号化(非特許文献2を参照)を用いる。これらの符号化の方法では、正の整数iをO(log(i))のビット数を使用して表わすために、整数値が一定量変化しても符号化後のビット数の変化は変化前の整数値が小さいほど大きく変化する。下記の表1に示すように符号化できる。1進数表記では、整数iの符号化した長さ(符号長)を示す部分と、符号化した値(符号値)を示す部分からなる。ここで注意すべきことは、符号値の最初のビットを常に「1」で示すことである。整数iの符号化後の長さを示す符号長は連続する零のビット数で示すために、符号値を示す部分はビットが最初に「1」となる部分から符号長の零と同じビット数の範囲である。正の整数ではない零を扱うためには、値に1を加えて符号化を行うことで扱える。また、負の数を扱うためには、値の正負を示すビットを追加することで拡張できる。
【0032】
【表1】

【0033】
(点の符号化)
各クラスタCには、クラスタ無相関化の必要性の有無を示すフラグRと、無相関化を行う行列Σ*、クラスタのデータ分布の形状を示すフラグT(形状は任意の確率分布を予め用意する。例えば、ガウス分布、ラプラス分布、一様分布)とその中心座標及びデータ分布のパラメータが関係する。一旦、点PがクラスタCに属すると決定すれば、点PがクラスタCの分布に従うことを利用して、点の座標を符号化できる。点Pのi番目の座標Piの確率の値がpである場合、座標の符号化によってO(log(1/p))ビットを必要とする。
【0034】
確率が一定値となる一様分布にて符号化した際のビット数を、最小外接長方形(第i次元目が下限lbiと、上限ubiで表わされる範囲)の範囲を定め、最小外接長方形の範囲に比例するO(log(1/(ubi−lbi)))のビット数で定める。
【0035】
点の符号化の目的は、点がクラスタ部分空間及びクラスタ特有の確率分布に従う場合に、圧縮コストが最小となるクラスタCの点x→(本明細書においてa→との表記はaの上に→が付され、ベクトルであることを意味するものとする)の符号化手法を提案することである。後述するが、正しい選択により圧縮コストを最小化する確率密度関数を得ることになる。
【0036】
ここでは、クラスタの点の座標が主成分分析(PCA)による座標変換によって無相関化され、各座標から対応するパラメータと共に確率分布が既に選択されているとする。図3の例については、横座標をラプラス分布とし、縦座標をガウス分布とする。両分布は、平均μ=3.5及び標準偏差σ=1を仮定している。座標値を符号化し必要なビット数を割り当てる必要がある。すなわち、高い確率(例えば3<x<4)に相当する座標値には短いビット数(符号)を割り当て、低い確率(極端な例としてy=12)に相当する座標値には長いビット数(符号)を割り当てる。
【0037】
クラスタのデータ分布の形状を示すフラグTで示される確率分布がデータの分布に一致していれば、ハフマン符号化によるビット数(符号長=圧縮コスト)が最小化される。ハフマン符号化は、P(xi)が各座標値の確率密度関数の値である場合、個々の座標xiに長さlog2(1/P(xi))のビット数を割り当てる。
【0038】
(圧縮コストの算出方法)
ここで、クラスタCの圧縮コストを以下の4つの定義に沿って定義する。
・定義1(点x→の圧縮コストE)
x→∈RdがクラスタCに属するとし、pdf→(x→)はクラスタCの確率密度関数のd次元のベクトルである。各座標の確率密度関数pdfi(xi)は、対応するパラメータ(すなわち、PDF={pdfカ゛ウス(ui,σi),pdf一様(lbi,ubi),pdfラフ゜ラス(ai,bi),・・・}、平均ui、下限lbi、上限ubi、片側平均ai∈R、標準偏差σi、√2の標準偏差bi∈R+)を有する1セットの予め定められた確率密度関数から選択される。γをグリッド定数(グリッドの分解能、すなわちグリッド間の距離)とし、点x→の座標軸iでの圧縮コストEiは下式(1)で表わされ、点x→の圧縮コストは下式(2)で表わされる。
【0039】
【数1】

【0040】
図3のハッチングした例示位置において、x座標(2と3の間)の確率は19%であり、ハフマン符号化ではlog2(1/0.19)=2.3ビットが必要となる。y座標はより低い確率(5%)にあり、より大きいビット数(4.3ビット)が必要となる。点x→の圧縮コストは、x座標とy座標のビット数の合計である6.6ビットに加えて、どのクラスタに所属するかをハフマン符号化されたクラスタ番号を表わすlog2(n/|C|)ビットが加えられる。
【0041】
(クラスタに適合する確率密度関数の決定)
次に、クラスタCにどの確率密度関数を割り当てるかを示す。最終的な目的は圧縮コスト(ビット数)の最小化である。従って、各座標軸にクラスタの圧縮コストを最小化する確率密度関数pdf(及び対応するパラメータ)を選択する必要がある。ガウス分布等の確率密度関数pdfについては、最適なパラメータがデータ集合の統計量(例えば平均、分散σi2、上下限値)に相当することが知られている。
【0042】
したがって、座標軸iの確率密度関数pdfとしてガウス分布を選択する場合、確率密度関数のパラメータとして、点の座標軸iの平均ui及び分散σi2を使用する。同様に、ラプラス分布については、平均ui及び分散2σi2を適用する。一様分布については、座標値の範囲の上限ubiと下限lbiを適用する。予め用意したガウス分布、ラプラス分布、一様分布等、これらの確率密度関数PDFの中からクラスタの圧縮コストが最小となる確率密度関数を選択する。
【0043】
・定義2(クラスタCのpdf→(x→))
Cを点x→∈Cからなるクラスタとする。Stat=(ui、σi、lbi、ubi・・・)を予め用意した確率密度関数PDFで必要とされる統計量とする。このとき、pdf→は下式(3)に示すように、pdfi∈PDFから圧縮コストが最小となる確率密度関数が選択される。
【0044】
【数2】

【0045】
図3のx座標について、統計として平均(3.5)、分散(1.0)、上下限(1.4、6.2)を計算する。その後、x座標の圧縮コストExは予め用意した確率密度関数に適切な統計量を適用したpdf一様(1.4,6.2)、pdfカ゛ウス(3.5,1.0)、pdfラフ゜ラス(3.5,0.7)の中から最小の圧縮コストExとなる確率密度関数を選択する。y座標についての圧縮コストEyについても同様の手順で確率密度関数を選択する。なお、ここでは、ガウス分布、ラプラス分布、一様分布といった3つの分布を取り上げているが、他の確率密度関数も用いることができる。
【0046】
(無相関化行列を用いた符号化)
クラスタが異なる座標軸で互いに相関のあるクラスタである場合、すなわち、クラスタの点のある座標値が少なくとも1つの他の座標値に依存する場合、無相関化行列により新たな座標軸に変換することで圧縮コストを縮小することができる場合がある。無相関化行列は、例えばクラスタの分散共分散行列Σの主成分分析(PCA)で算出する主成分からなる行列やクラスタの分散共分散行列Σの固有行列Vとして計算することができる。外れ点(1つの座標軸に着目すれば外れ値)に影響されにくいロバストな方法での分散共分散行列の評価方法は後述する。
【0047】
データを無相関化することは、クラスタの圧縮コストを縮小させるために必要である。大きい分散及び高い相関のある2つの座標を持つ代わりに、互いに相関のない2つの新しい座標を生成し、例えば一方の新しい座標が0に近い分散を持つ座標値に変換できれば、1つのグリッドの確率が大きくなるため、平均符号長がほぼ0ビットの圧縮コストとなることが期待される。そのため、圧縮コストの改善を考慮する場合、無相関化行列を使用する。
【0048】
・定義3(クラスタの無相関化)
無相関化行列は、Cを点x(無相関化を行っていない元々の座標)から成るクラスタとし、クラスタCの共分散行列Σとしたときに、クラスタCの主成分分析(PCA)で算出する主成分(Σ=VΛVT)からなる行列VΛ-1/2とする。若しくは、クラスタCの分散共分散行列Σの固有値と固有行列による対角化(Σ=VΛVT)で得られた行列を無相関化行列Vと定めるとする。Yを無相関化された点yの集合、すなわちy→∈Y:y→=VT・x→として表わされるものとする。pdf→(x→)を元々の座標系の、pdf→(y→)を無相関化された集合Yを特徴付ける確率密度関数(確率分布)とする。最終的に用いられる無相関化行列は、圧縮コストを基準に定まり、クラスタCの無相関化行列dec(C)は下式(4)で、それに対応する圧縮コストは下式(5)で表わされる。
【0049】
【数3】

【0050】
d行×d列の無相関化行列Vを符号化する際に、少数を符号長fビットで表わすとすると、各要素を合計d2fビットで符号化する。そのため、無相関化による圧縮コストの減少分がこれを上回った場合に無相関化を行う。無相関化不要の場合は、無相関化行列の代わりに単位行列を用いて、無相関化の有無を表わすフラグに相当する1ビットだけを圧縮コストに加える。
【0051】
・定義4(クラスタの圧縮コスト)
定義4は上述した事項を総括したものである。クラスタCを符号化する際には無相関化行列dec(C)及び無相関化された各座標y→を代表する確率密度関数pdf→(y→)を用いて行う。クラスタCの圧縮コストは、下式(6)で表わす。
【0052】
【数4】

【0053】
圧縮コスト算出部103bは、以上説明したように、疵データ入力部101によって入力され、疵データ蓄積部102に蓄積された疵データに基づいて、上式(6)等に示した圧縮コストを算出する。
【0054】
<外れ点の分離>
本願では、従来手法で得られるクラスタを2つの部分集合からなるとして捉える。一つは集中的な分布の中核をなすを示すデータ(中核点)の集合、もう一方は散発的な分布をなすデータ(外れ点)の集合である。
【0055】
一般的なクラスタリング手法のK-means法やK-medoids法では、中核点と外れ点とが混合したクラスタが生成されてしまい、特徴を捉え難いクラスタとなるおそれがある。
【0056】
そこで、一旦生成したクラスタ(初期クラスタ)から外れ点を分離する。
【0057】
最も確実な方法は、N点の座標データがあった場合、中核点と外れ点に分類する組み合わせは2N通りある。それぞれの組み合わせに対して圧縮コストを算出し、圧縮コストが最小となる中核点と外れ点の組み合わせを採用することである。しかしながら、計算量は、座標データ数に対して指数関数的に増加する為に、ある程度の数を超えると現実的な時間で計算を終了することは困難になる。
【0058】
以降では、ある程度の数を超えても現実的な時間で計算を終了するように、座標データに中核点に取り入れる順位付けを行い、中核点と外れ点の分離に要する計算量をNに比例する方法を提供する。
【0059】
順位付けの方法として中核点の中心からの距離を元に算出する方法である。以下では順位の代わりに距離で定めた境界によって中核点と外れ点を選択している。距離の定義は、中核点の外形を決めるために複数の定義を用いる。
【0060】
クラスタ内の座標データの分布のばらつきを示す重み行列による距離によって中核点と外れ点の分離をする方法は、任意のクラスタリング手法(例えばK-means法)により算出したクラスタ群C={C1,・・・,Ck}のクラスタCiについて部分空間を定める正規直交行列V(「無相関化行列V」と称する)を算出する。無相関化行列Vを用いた重み行列を算出し、中核点と外れ点とを分離する境界を決定する距離を定めるものである。クラスタCi中の中核点と外れ点の圧縮コストの合計が最小値となるクラスタの中心から等距離となる境界(楕円)を選択し、その結果、クラスタから外れ点を分離した新たなクラスタを生成する。このときのクラスタの中心は、座標データの平均又は、調整平均によって求めた座標を用いる。
【0061】
以下、更に距離を定めるための重み行列について詳しく説明する。まず重み行列の評価方法の1つについて述べる。クラスタCiの重み行列は、クラスタCiに属する点が含まれる空間を定めるものとして分散共分散行列の逆行列(Σ-1=V∧-1T)を用いる。逆
行列が直接算出できない場合は、主成分分析(PCA)による主成分を用いる等して、これに変わる行列を算出する。また、別の方法としてクラスタCiに属する点の分散共分散行列Σを固有値による対角行列を用いて表すと、固有ベクトルからなる正規直交行列Vが
得られる。この行列Vが上記で述べた無相関化行列である。無相関化行列Vは、クラスタCiの点が含まれる空間(新たな座標軸)を定め、固有値は後で述べる等距離からなる境界の楕円(楕円球)の形状を決める。また、対角行列∧の全固有値は正である為、分散共分散行列Σ及びその逆行列Σ-1は半正定行列である。すなわち、2点間を結ぶベクトルを
xとしたときにxtΣ-1xの様に、2次形式で表した際に必ず正となり、多次元空間にお
いても、あたかも2点間の距離ような値(擬距離)を定めることができる。例えば、クラスタの構造(共分散)を考慮して、2つの点であるx→及びy→間の距離を、下式(7)に示すようにマハラノビス距離として定義できる。
【0062】
【数5】

【0063】
クラスタCの中心をμ→として与えると、分散共分散行列Σは、下式(8)により行列ΣCを計算することで評価することができる。なお、|C|はクラスタCのデータ点数である。(x→−μ→)・(x→−μ→)Tはベクトルの外積であり、d×dの行列となる。x→(∈C)すべてについて計算し、クラスタCのデータ点数|C|で平均化するので、ΣCは、行列のi行j列の要素(ΣCijは第iの座標と第jの座標の共分散であって、(xi−ui)・(xj−uj)となる。
【0064】
【数6】

【0065】
ここで、上記計算法で外れ点が含まれることにより、中核点と外れ点を希望通りに分離できない問題が生じる。希望通りの分割を行うためには、詳細は後述するが中核点の中心と分散共分散行列を的確に推定する必要がある。しかしながら、単純な平均で計算されるクラスタCの中心は、外れ点の存在により中核点の中心からずれることがある。また、中心核点の中心と異なる中心に従えば分散共分散行列による無相関化行列Vによって生成される空間、すなわち中核点と外れ点の境界の候補となる「中核点の広がり」を評価する楕円の方向にも外れ点が影響することがある。外れ点の数が1つの場合でも、推定する中核点の中心や無相関化行列に大きく影響を与えることがある。図4には、従来の評価により中心が間違って推定され、データの共分散を表わす楕円が中核点とずれている様子を示す。
【0066】
(中核点のロバストな中心μR→の推定方法)
中心を定めるに際して、外れ点に影響されにくいという意味でのロバストさのある中心を、各座標のα調整平均を独立して決定する。ここでα調整平均は、対象データからデータ数の上位α/2%と下位α/2%に相当するデータを除いた部分を用いて平均を行う方法である。すなわち中央値はαを100に近づけてゆき最後の1点だけが残る場合に相当する。αの値は、想定される初期クラスタに占める中核点の比率に設定するとよい。これにより、中央値によるデータの原点(μR→)が、全点の中心(μ→)に比べて、クラスタの中核点の中心の近傍となる。
【0067】
(中核点のロバストな重み行列(分散共分散行列)ΣR推定方法)
同様に、ロバス分散ト共分散行列(ΣRijは、クラスタの全点x→についての(xi−μRi)・(xj−μRj)のα調整平均により生成されるようにしている。調整平均とは、平均を算出しようとする数値を大きさ順に並べ、先頭又は最後尾から一定割合αのデータを除き中央値付近のデータを用いて求める平均である。αの値は、初期クラスタに占める中核点の想定される割合の2乗に設定するとよい。行列ΣRには、算術平均による共分散行列と比較して、中核点の共分散が反映されることが期待できる。
【0068】
算術平均による共分散行列ΣCは対角優勢(=正定行列)である。すなわち、各対角成分Σi,iが他の要素Σ*,iの合計よりも大きい。また、対応する対角行列Λの全固有値は正となる。
【0069】
一方、ロバスト分散共分散行列ΣRが対角優勢行列ではない場合は、2次形式で表した値が負となる場合が発生し、距離を定義できなくなる。そのためにφ倍された単位行列φ・Iを付加することで、無相関化行列Vに影響を与えることなく計算を可能とする。φは、下式(9)に示すように与えられる。φの値は、縦列の合計と対角成分との極大差(10%程度の値を付加してもよい)で表わされる。
【0070】
【数7】

【0071】
行列φ・Iを付加することにより、固有値には影響を与えるが、固有ベクトルに影響を与えない。Σ=VΛVTである場合、Σ+φ・I=VΛVT+φ・Iとなる。Vは正規直交であるので、φ・IもまたVφIVTと記述でき、また、分配則に従えば、Σ+φ・I=V(Λ+φ・I)VTとなる、すなわち各固有値が増加しても、無相関化行列Vには影響を与えない。
【0072】
(重み行列に中核点の特徴を反映させる変換)
上記では、分散共分散行列を元に距離を定めて中核点を距離の短い順に選択する為、クラスタ(中核点)の外形となる境界が楕円(楕円球)となる。そのため、直線等、楕円で表現しにくい形状のクラスタ(中核点)を分離する際に、外れ点を一部分離しきれない場合がある。本願では、クラスタ(中核点)の圧縮コスト算出に用いる確率分布に応じた重み行列の変換方法を提供する。
【0073】
楕円状以外の形状をしたクラスタを抽出する為に、重み行列を修正することで抽出する方法を示す。重み行列の固有値は、クラスタの外形を示す楕円の長軸と短軸の長さに比例する値となる。そのため、固有値を変化させて長軸と短軸の長さの比を変化させることで、境界の形状を変化させることで、外れ点としたい点の中核点への、又は中核点としたい点の外れ点への混入を減らす。
【0074】
重み行列を対角化によって分解し、クラスタの分布形態に応じた関数により変換した対角要素を用いて重み行列の再構成を行った行列を用いて距離を定め中核点の候補を選択する。具体的には、重み行列を固有行列と固有値を対角要素とする行列とに分解し、圧縮コスト算出時に用いるクラスタの分布形態に応じた関数により固有値を変換する。変換した値を新たな対角行列の要素として、重み行列を再構成し、距離算出に用いる。
【0075】
重み行列Σを対角化した場合、固有値を対角要素とする行列∧と、固有行列Vを用いて
下式(10)と示す。
Σ=V∧VT・・・(10)
【0076】
このとき、重み行列Σが対角優位でなければ固有値を対角要素とする行列∧にφ倍され
た単位行列φ・Iを付加する。値φは、この操作で各固有値間の比率が、それほど変化しない程度にする。
【0077】
圧縮コスト算出時には、固有値に対応する固有ベクトル毎に確率分布を定めている。固有値の比率を変化させる際に、圧縮コスト算出時に用いる確率分布に応じて固有値を変化させる。このとき、中核点を選択する順序を決める距離を算出する場合には重み行列の逆行列を用いるため、重み行列の固有値が大きい程固有値の逆数が小さくなり、対応する方向への距離の変化が小さくなる。
【0078】
比率を変化させる場合に正規分布を基準としたときに、一様分布であれば平均からの偏差が大きい場合でも確率が変わらないすなわち距離の差が無くしたいので、距離の算出に必要な分散を単調増加する関数(例えば1次関数で定数倍すること)で見かけの分散を大きくするか、さらには影響しないように距離の算出に用いないことで、一様分布の両端においても距離を短く見積もることができる。ラプラス分布であれば、平均から僅かに外れた場合に確率が大きく変化する、すなわち距離を大きく変えたいため、見かけの分散を単調減少する関数で変換する(例えば定数で徐算し小さくする)ことで、平均から僅かに外れた場合でも大きく距離を変化させることができる。ここで定数は1を超える正の実数であり、抽出したい中核点の形状に応じて設定する。場合により定数を確率分布毎に定めてもよい。
【0079】
また、固有値を変換する別の方法として圧縮コスト算出時に用いるクラスタの分布形態に依らずに共通した関数を用意し適用する方法がある。圧縮コストが最小となる場合、おおよそ分散(又は固有値)の大小によって適用される確率分布が決まる傾向がある。その為、大きい固有値をさらに大きく、小さな固有値をさらに小さくなるように比率が変化する関数を用意すればよい。例えば冪関数f(x)=xrを用いてよい。累乗の係数rは1より大きい正の実数に決める。
【0080】
以上によって、重み行列に中核点の特徴を反映させる変換を行うことができる。
【0081】
図7に直線のクラスタ(400点)とそれ以外の外れ値(100点)が分布している3次元の座標データを2次元で示す。まず上記の方法で中核点と外れ点の分離を行い、圧縮コストを算出する際の中核点に適用すべき確率分布を決める。
【0082】
以上のロバストな評価手法により、図4に示すように、中心を正確に定め、分散共分散行列により表わされる楕円を中核点の分布とすることができる。図5に示すように、適正な無相関化行列Vは、クラスタの中核点の分散方向を示す固有ベクトルにより構成される。VTの乗算により座標の変換を行い座標間の相関を取り除くことができる。
【0083】
(中核点と外れ点との分離)
次に、中核点と外れ点との分離について述べる。上述した各種分散共分散行列を重み行列として用いて距離を定める。次に、中心から定めた距離(境界)までを中核点、それ以外を外れ点として仮に定め、それぞれ境界を変化させた場合において圧縮コストを算出することを繰り返す。その中で、最も圧縮コストが最小となる境界を用いて中核点と外れ点に分離する。
【0084】
以下に詳細を述べる。まずは、境界を定める適正な無相関化行列を求める。すなわち、候補となる分散共分散行列から、圧縮コストが最適となる1つを選択する。候補となる分散共分散行列には、通常の分散共分散行列に加え、上述したロバストな手法による行列ΣR、従来の手法による行列ΣC、それぞれを確率分布に応じた変換を行った重み行列が含まれる。
【0085】
更に、ロバストに評価された中心μR→とロバストな分散共分散行列ΣRで定義されたマハラノビス距離を用いて、クラスタの中心に近い点を選択した上で、無相関化行列算出の元となる分散共分散行列として算出し、候補に加える。対象のクラスタから中心μR→に近い点よりクラスタ内のある割合(例えば50%)に相当する数を選択し、選択した点を元に従来の共分散による候補である行列ΣC,50とロバストなα調整平均による候補である行列ΣR,50を算出する。更に無相関化を行わない場合の無相関化行列の候補として単位行列Iがある。これらの行列{ΣC、ΣR、ΣC,50、ΣR,50、I}の中で、最適な(最小の)圧縮コストを与える行列Σ*が選択される。図4の例では、従来の評価では圧縮コストの最小値が1600であるのに対して、ロバストな評価では圧縮コストの最小値が1480となる。
【0086】
続いて、クラスタ内の外れ点を見つける。ここまでに中核点の中心μR→を求めると共に、候補となる分散共分散行列Σ*(対応する無相関化行列V*)を選択している。最終的な目的は、クラスタを新たな2つの集合、すなわち中核点の集合(クラスタ)C中核点と外れ点の集合C外レ点に分けることである。分散共分散行列Σ*により定められるマハラノビス距離に基づいて両者の境界を定め、2つの集合に分割する。最初に全点を外れ点として(C外レ点=C,C中核点={})、マハラノビス距離に基づいて、中核点の中心μR→に近い距離にある点x→を集合C外レ点から取り除き、集合C中核点に取り入れていくことを繰り返す。その際に、点x→の移動前後における圧縮コストを算出する。
【0087】
各繰り返しにおいて、集合C外レ点から集合C中核点に移動した点x→は、選択された無相関化行列V*により定められる空間に移る。そして、集合の新たな分割(C中核点∪{x→},C外レ点−{x→})による圧縮コストは、最小の圧縮コストを導く確率分布を使用して決定する。外れ点に対する圧縮コストは一様分布を用いて符号化する。
【0088】
このような集合の選び方は、中核点と外れ点を分離する境界を無相関化行列によるマハラノビス距離が一定となる楕円として定め、その内外に分けることで2つの集合を定める。図4では、最小(1480)にて中核点が24個、外れ点が6個となる集合からなる。
【0089】
図4には、従来の無相関化行列Vc及びロバストな無相関化行列VRに対応する2つの圧縮コストの推移を示す。初期段階では、全点が外れ点とされ、いずれの圧縮コストも1800程度となっている。集合C外レ点から集合C中核点に点が移動するに従って、圧縮コストは減少する。ロバストな無相関化行列VRに対応する圧縮コストでは、中核点が24個となったときに、最小値である1480になる。その後、圧縮コストは再び1800程度まで増加する。
【0090】
分離部103cは、以上説明したように、圧縮コストに基づいて、初期クラスタ生成部103aによって生成された初期クラスタを分離して、集中的な分布をなすデータ(中核点)を含む集合C中核点と、散発的な分布をなすデータ(外れ点)を含む集合C外レ点とを生成する。
【0091】
<クラスタ結合>
クラスタの結合は、任意のクラスタリング・アルゴリズム(例えばK-means法)による分割位置及び分割数を変更することである。アルゴリズムに起因するクラスタの欠点により、本来は別のクラスタの一部である点を含んだクラスタが生成されることがある。そこで、従来のクラスタリング手法に起因する間違った分割をクラスタ結合により修正する手法について説明する。
【0092】
例えばK-means法では、本来は1つであるはずのクラスタを誤って複数に分離することがある。提案する方法のアルゴリズムでは、クラスタ結合を行うことにより誤った分離を正すものである。
【0093】
ここでも、2つのクラスタを結合する際に圧縮コストを利用し、一対のクラスタを結合させることにより圧縮コストが減少するかどうかを判定する。すなわち、一対のクラスタ(Ci,Cj)について、下式(11)に示すようにクラスタ結合による圧縮コストの低減量reducecost(Ci,Cj)を定義する。
【0094】
【数8】

【0095】
クラスタ結合による圧縮コストの低減量reducecost(Ci,Cj)>0である場合、一対のクラスタ(Ci,Cj)に結合の可能性があるものとする。
【0096】
この手順は欲張り法に従い、圧縮コストの低減量がある限り繰り返し行われる。各繰り返しにおいて、reducecost(Ci,Cj)が最大となる2つのクラスタを結合し、圧縮コストが最小コストとなるクラスタリングを探索する。更には、局所的な最小により計算が行き詰るのを避けるために、reducecost(Ci,Cj)の減少がなくなっても計算をすぐには止めない。すなわち、reducecost(Ci,Cj)≦0となってもアルゴリズムを止めず、その代わりに、アルゴリズムを別のtの繰り返しにおいて続け、reducecost(Ci,Cj)が負になって、つまりCi及びCjの結合により圧縮コストが増加する場合でも、最大のreducecost(Ci,Cj)でクラスタ(Ci,Cj)の結合を継続する。
【0097】
結合部103dは、以上説明したように、圧縮コストに基づいて、分離部103cによって生成された集中的な分布をなすデータを含むクラスタC中核点同士を結合する。
【0098】
また、初期クラスタ数が適切な初期クラスタ数に比べ多い場合において計算時間を減少させるための本願独自のアルゴリズムとして、上述した計算によるクラスタ結合の前段階で、結合するクラスタの候補をドロネー図に基づいて隣接するクラスタの組を決めることを行う。本発明で取り扱う薄板の表面欠陥は2次元上に分布しているので、ドロネー図を利用することが可能である。具体的には、クラスタの中心を母点として用いて、最初に母点を4点選び2つの三角形を作る、それぞれの三角形がドロネー三角分割であることを外接円に他の三角形の頂点が入っていないことで確認し、そうでなければ三角形の分割方法を変える。さらに1点加え、加えた1点を含む三角形に着目し三角形に分割しドロネー三角分割であること確認する。そうでなれば三角形の分割方法を変える。さらに逐次母点を追加し、追加すべき母点がなくなり、ドロネー三角分割となるまで繰り返すことでドロネー図を生成する。そのドロネー図に表われるドロネー辺によりつながる母点に相当するクラスタ同士を結合の候補とする。このようにドロネー図を利用して候補を決めることで、計算量を大幅に軽減させることができる。
【0099】
また、初期クラスタ数が適切な初期クラスタ数に比べ少ない場合において本願発明の独自のアルゴリズムとして、外れ点の分離やクラスタ結合の段階でクラスタから分離した外れ点を別のクラスタに組み入れるようにする。そのために、外れ点として分離されたものを集め仮想的な新たなクラスタとして扱い、中核点に組み入れ可能な点があるかを、仮想的なクラスタと中核点からなるクラスタの圧縮コストの低減量reducecostにて判断し、これが大きくなれば外れ点の一部を別クラスタの中核点として再度取り入れる。また、仮想的なクラスタから中核点からなるクラスタが生成できれば新たなクラスタとすることができる。
【0100】
以上に述べたように、自動疵検査装置で採取された疵データの発生位置に関する座標データに基づいて、疵同士を自動的にグループ化することができ、例えば疵グループの重心位置、空間サイズ、疵個数密度といった疵の分布に係わる特徴量抽出を高速かつ大量に行うことが可能になる。この場合に、指標に基づいて最適となるように計算処理が行われるので、人間による分析処理に比べて、再現性の高い客観的かつ定量的な特徴量を抽出することが可能である。したがって、例えば疵の発生位置と操業条件の相関解析等、大量の疵の分布データを用いた解析を迅速に行うことができる。
【0101】
しかも、上述したように初期クラスタから散発的な分布をなすデータ(外れ点)を分離して、集中的な分布をなすデータを含むクラスタを生成し、クラスタ同士を結合する手法により、外れ点を除いた自然な形で疵同士をグループ化することができる。これにより、疵の分布形態の解析精度を高めるとともに、疵の分布に係わる特徴量抽出を高速かつ大量に、そして正確に行うことが可能になる。
【0102】
図6には薄板コイルに発生した疵の分布の一例を示す図であり、横軸が薄板コイルの長手方向位置、縦軸が幅方向位置を示す。図6(a)が特許文献1に開示された手法による結果であり、□を中心とする3つの楕円状の分布が抽出されている。それに対して、図6(b)が本発明を適用した手法による結果であり、集中的な分布をなす中核点・と、散発的な分布をなす外れ点×とに分離され、直線状に発生する疵グループを的確に抽出することができている。これに基づいて、疵の発生の原因となる工程で対策を行い、大量の品質不良品を出すことを防ぐことができた。
【0103】
(本発明の他の実施形態)
上述した実施形態の機能を実現するべく各種のデバイスを動作させるように、該各種デバイスと接続された装置あるいはシステム内のコンピュータに対し、前記実施形態の機能を実現するためのソフトウェアのプログラムコードを供給し、そのシステム或いは装置のコンピュータ(CPU又はMPU)に格納されたプログラムに従って前記各種デバイスを動作させることによって実施したものも、本発明の範疇に含まれる。
【0104】
また、この場合、上記ソフトウェアのプログラムコード自体が上述した実施形態の機能を実現することになり、そのプログラムコード自体、及びそのプログラムコードをコンピュータに供給するための手段、例えば、かかるプログラムコードを格納した記録媒体は本発明を構成する。かかるプログラムコードを記憶する記録媒体としては、例えばフレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、磁気テープ、不揮発性のメモリカード、ROM等を用いることができる。
【0105】
また、コンピュータが供給されたプログラムコードを実行することにより、上述の実施形態の機能が実現されるだけでなく、そのプログラムコードがコンピュータにおいて稼働しているOS(オペレーティングシステム)あるいは他のアプリケーションソフト等と共同して上述の実施形態の機能が実現される場合にもかかるプログラムコードは本発明の実施形態に含まれることは言うまでもない。
【産業上の利用可能性】
【0106】
本技術は、主として、鉄鋼製品の薄板製品の製造における表面欠陥起因の不良品発生原因を解析することに利用される。
【図面の簡単な説明】
【0107】
【図1】本実施の形態の薄板の表面欠陥の分布形態解析装置の構成の一例を示す図である。
【図2】クラスタリングの例を示す図である。
【図3】圧縮コストの例を説明するための図である。
【図4】従来の手法とロバストな手法とを比較した結果を示す図であり、(a)がデータとその共分散を表わす楕円との関係を示す図、(b)が中核点の数と圧縮コストとの関係を示す特性図である。
【図5】無相関化行列を説明するための図である。
【図6】薄板コイルに発生した疵の分布の一例を示す図である。
【図7】直線のクラスタ(400点)とそれ以外の外れ値(100点)が分布している3次元の座標データを表す図である。
【符号の説明】
【0108】
101 疵データ入力部
102 疵データ蓄積部
103 演算部
103a 初期クラスタ生成部
103b 圧縮コスト算出部
103c 分離部
103d 結合部
104 解析結果表示部

【特許請求の範囲】
【請求項1】
薄板に発生する表面欠陥の分布形態を解析する表面欠陥の分布形態解析装置において、
少なくとも解析対象の薄板の表面欠陥の発生位置に関する座標データを入力する入力手段と、
前記入力手段によって入力された集中的な分布と散発的な分布が混在した表面欠陥の座標データに基づいて、所定のクラスタリング手法を用いて、前記薄板の表面欠陥の分布形態を表わす初期クラスタを生成する初期クラスタ生成手段と、
生成したクラスタの良さを評価する指標である圧縮コストを、クラスタの分布形態に応じて座標データの情報圧縮を行った際の情報量として算出する圧縮コスト算出手段と、
前記初期クラスタ生成手段によって生成された初期クラスタを、前記圧縮コストに基づいて、集中的な分布と散発的な分布をなす座標データの組み合わせに分離したクラスタを生成する分離手段と、
前記分離手段によって生成された集中的な分布をなす座標データを含むクラスタ同士を、前記圧縮コストを結合判断基準に用いて結合する結合手段とを備え、
前記分離手段においてクラスタから分離された散発的な分布をなす座標データを、新規の又は別のクラスタの集中的な分布をなす座標データとして組み入れることを特徴とする表面欠陥の分布形態解析装置。
【請求項2】
前記各手段によって生成されたクラスタの重心位置、空間サイズ及び個数密度のうち少なくともいずれか一つを特徴量として算出する特徴量算出手段と、
前記特徴量算出手段による算出結果を表示する解析結果表示手段とを更に備えたことを特徴とする請求項1に記載の表面欠陥の分布形態解析装置。
【請求項3】
前記分離手段は、集中的な分布をなす座標データを選択する手順として、個々の座標データについて集中的か散発的な分布に属するかを指定して得られる組み合わせから選択することを特徴とする請求項1又は2に記載の表面欠陥の分布形態解析装置。
【請求項4】
前記分離手段は、クラスタ内の座標データの調整平均によって求めた座標を中心とし、クラスタ内の座標データのばらつきを示す重み行列を用いて中心からの距離を定め、集中的な分布をなす座標データを距離が短い順に選択することを特徴とする請求項1又は2に記載の表面欠陥の分布形態解析装置。
【請求項5】
前記分離手段は、前記重み行列にクラスタ内の座標データの分散共分散行列の逆行列を用いることを特徴とする請求項4に記載の表面欠陥の分布形態解析装置。
【請求項6】
前記分離手段は、前記重み行列に行列要素が2つの変数を用いて平均からの偏差の積を求めた値の調整平均である行列の逆行列を用いることを特徴とする請求項4に記載の表面欠陥の分布形態解析装置。
【請求項7】
前記分離手段は、前記重み行列を固有行列と固有値を対角要素とする行列とに分解し、前記圧縮コスト算出時に用いるクラスタの分布形態に応じた関数により固有値を変換した値を用いて再構成した行列を用いることを特徴とする請求項4〜6のいずれか1項に記載の表面欠陥の分布形態解析装置。
【請求項8】
前記結合手段は、結合するクラスタの候補をクラスタの隣接関係を示すドロネー図に基づいて決めることを特徴とする請求項1〜7のいずれか1項に記載の表面欠陥の分布形態解析装置。
【請求項9】
薄板に発生する表面欠陥の分布形態を解析する表面欠陥の分布形態解析方法において、
少なくとも解析対象の薄板の表面欠陥の発生位置に関する座標データを入力する入力手順と、
前記入力手順によって入力された集中的な分布と散発的な分布が混在した表面欠陥の座標データに基づいて、所定のクラスタリング手法を用いて、前記薄板の表面欠陥の分布形態を表わす初期クラスタを生成する初期クラスタ生成手順と、
生成したクラスタの良さを評価する指標である圧縮コストを、クラスタの分布形態に応じて座標データの情報圧縮を行った際の情報量として算出する圧縮コスト算出手順と、
前記初期クラスタ生成手順によって生成された初期クラスタを、前記圧縮コストに基づいて、集中的な分布と散発的な分布をなす座標データの組み合わせに分離したクラスタを生成する分離手順と、
前記分離手順によって生成された集中的な分布をなす座標データを含むクラスタ同士を、前記圧縮コストを結合判断基準に用いて結合する結合手順とを有し、
前記分離手順においてクラスタから分離された散発的な分布をなす座標データを、新規の又は別のクラスタの集中的な分布をなす座標データとして組み入れることを特徴とする表面欠陥の分布形態解析方法。
【請求項10】
薄板に発生する表面欠陥の分布形態を解析する処理をコンピュータに実行させるためのプログラムにおいて、
少なくとも解析対象の薄板の表面欠陥の発生位置に関する座標データを入力する入力処理と、
前記入力処理によって入力された集中的な分布と散発的な分布が混在した表面欠陥の座標データに基づいて、所定のクラスタリング手法を用いて、前記薄板の表面欠陥の分布形態を表わす初期クラスタを生成する初期クラスタ生成処理と、
生成したクラスタの良さを評価する指標である圧縮コストを、クラスタの分布形態に応じて座標データの情報圧縮を行った際の情報量として算出する圧縮コスト算出処理と、
前記初期クラスタ生成処理によって生成された初期クラスタを、前記圧縮コストに基づいて、集中的な分布と散発的な分布をなす座標データの組み合わせに分離したクラスタを生成する分離処理と、
前記分離処理によって生成された集中的な分布をなす座標データを含むクラスタ同士を、前記圧縮コストを結合判断基準に用いて結合する結合処理とをコンピュータに実行させ、
前記分離処理においてクラスタから分離された散発的な分布をなす座標データを、新規の又は別のクラスタの集中的な分布をなす座標データとして組み入れることを特徴とするプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2009−133843(P2009−133843A)
【公開日】平成21年6月18日(2009.6.18)
【国際特許分類】
【出願番号】特願2008−278634(P2008−278634)
【出願日】平成20年10月29日(2008.10.29)
【出願人】(000006655)新日本製鐵株式会社 (6,474)
【Fターム(参考)】