バッチプロセスデータの解析装置およびそれを用いた異常検出/品質推定装置
【課題】バッチ同士が互いに紐付けられ、サンプリング周期が異なる、又は、異なる工程にまたがったデータであってもそれらを一まとめにして統一的に扱い、サンプリング周期が異なる変数同士や工程をまたがる変数同士の相関を的確に調べることが可能なデータ解析装置を提供する。
【解決手段】バッチプロセスデータ1や品質データ4はデータ格納手段3からモデル作成手段10に入力される。入力されたバッチプロセスデータ1や品質データ4は、データ入力手段5を経てデータ解析手段6に入力される。データ解析手段6においてはマルチウェイ多変量解析手法の適用によりモデル化を行う。データ判定/予測手段9では、モデル格納手段8に格納された「モデル」(係数行列)と、データ収集手段2でオンラインによりデータ収集されたバッチプロセスデータ1とに基づいて演算を実施し、実施した演算結果に基づいてアラームや予測値を出力し、異常検出または品質推定を行う。
【解決手段】バッチプロセスデータ1や品質データ4はデータ格納手段3からモデル作成手段10に入力される。入力されたバッチプロセスデータ1や品質データ4は、データ入力手段5を経てデータ解析手段6に入力される。データ解析手段6においてはマルチウェイ多変量解析手法の適用によりモデル化を行う。データ判定/予測手段9では、モデル格納手段8に格納された「モデル」(係数行列)と、データ収集手段2でオンラインによりデータ収集されたバッチプロセスデータ1とに基づいて演算を実施し、実施した演算結果に基づいてアラームや予測値を出力し、異常検出または品質推定を行う。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、バッチプロセスデータの解析装置およびそれを用いた異常検出/品質推定装置に関するものである。
【背景技術】
【0002】
図10は、従来の一般的なプラントによる製品製造システムにおける製造データ管理システムの構成概要を示す図である。例えば食品プラント等においては、タンクの温度,圧力,流量等を計測するためにセンサ等が設置され、センサ等で計測された情報をコントローラ500、ネットワーク510を介してDCS(Distributed Control System)(分散制御システム)520に送信して制御に供している。またDCS520の上位階層にはそれらのセンサ情報等の操業データや品質データを取得して格納し操業実績の管理を行ったり、生産計画の立案を行ったりするMES(Manufacturing Execution System)(製造実行システム)530が設けられている。MES530においてはバッチ・ロット(以下では、単に‘バッチ’ともいう)ごとにどの装置を経由したかやその経由時刻等を管理しており、これにより工程をまたぐバッチの紐付けを行っている(非特許文献1参照)。
【0003】
品質データが取得される場合、プラントの種類にもよるが、分析設備を備えたいわゆる「ラボ」と呼ばれる施設に持ち込んで微生物数の計測による品質の計測540や分析計を使用した濃度計測550による検査が行われる場合が多い。「ラボ」における品質の計測や検査は時間やコストがかかる場合が多いこともあり、一部の抜取り検査しか行われないのが通常である。
【0004】
図11は、従来の或る製品(食品)の製造工程を示す図である。この製造工程は複数の工程からなり、その中で2つの工程、例として「工程A」560,「工程B」570、を選んで詳しく説明する。図11に示す製造工程では「バッチ」単位で製品が製造処理されているものとする。すなわち1つのバッチが図11に示される各工程に投入され、当該工程での処理・加工完了後、その結果(中間製品)が出力される。出力された中間製品はまた同じバッチ単位で次工程に投入され、これを各工程につき繰り返す。
【0005】
工程A560においては、その前工程で製造された中間製品に対してタンク内にて例えば1時間程度処理加工が行われる。次に工程A560の製造結果である中間製品は工程B570に投入される。工程B570においてはまた別のタンクにおいて例えば2時間程度の別の処理加工が行われる。工程A560,工程B570それぞれにおける処理加工時間は中間製品の処理量等によって定まる。工程A560,工程B570のいずれでも使用されるタンクには温度センサ,圧力センサが設置されており、それぞれの工程での各バッチの処理加工時間中の温度,圧力が一定のサンプリング周期で計測され、その計測データはデータベース580に格納される。また工程A560,工程B570の結果として得られる中間製品における微生物数も計測され、当該中間製品を評価する要素として同様にデータベース580に格納される。また、あるバッチ(バッチ1とする)を図11に示す製造工程に流した場合の、工程A560と工程B570の温度ならびに圧力データも図11に示している。これらの温度ならびに圧力データを「バッチプロセスデータ」という。当該バッチについて品質データを得るために計測される微生物数の計測もここでは1箇所だけ示されている。
【0006】
多数のバッチ(バッチ1〜N)の工程A560,工程B570の温度・圧力計測値時系列データと、品質データとしての微生物数計測値とが得られ、その微生物数計測値から中間製品の良・不良(正常・異常)を判定している。ただし、微生物数の計測には時間がかかるため、異常・正常の判定にも時間がかかることになる。そこで、従来より実際に微生物数を計測する前に工程A560,工程B570での温度や圧力の計測データからそのバッチの中間製品の正常・異常を判定(検出)するような装置(システム)が活用されている。このような装置(システム)のことをここでは「異常検出装置」と呼ぶことにしている。
【0007】
上記したプラントに関するいわゆる連続系のデータに対して主成分分析(Principal Component Analysis:PCA)や部分的最小二乗法(Partial Least Squares:PLS)等の多変量解析手法を適用して異常検出や品質推定を行うことは従来から行われている(非特許文献2参照)。
【0008】
連続系のデータとは、一定の変数の組(例えば、温度,圧力などの組)について一定のタイミングで収集したデータを1組のサンプルとし、それが複数集められた「変数」×「サンプル」の2次元データの構造をしている。一般にサンプルの収集タイミングはすべての変数について同時刻であることが多いが、一部の変数については一定時間の時間差を持った(遅れた)時間を用いる場合もありうる。なお、一般に収集タイミングは等間隔(サンプリング周期)である必要はなく、各サンプルが揃っていればよい。
【0009】
以下では、主成分分析(PCA)による多変量解析を例に従来の解析手順(モデル作成)について説明する。なお、x,yは、一般的に計測データを平均値0,標準偏差1に規格化(標準化)後のデータである。元の2次元データをXとすると、2次元データXは、2次元の行列式で表され、行列の各要素X(i,j)について、iがサンプル番号,jが変数番号を表すものとすると、主成分分析(PCA)により、元のデータXは以下の式1のように表される。
【0010】
X = T* PT+ E (1)
ここでTは主成分スコア,Pはローディング(負荷量)行列,Eはモデル化誤差行列であり、またPの右肩のTは行列の転置を表している。また主成分スコアTは元の変数Xを、その中で互いに相関のある変数同士にまとめ、より少ない数の「主成分」として集約したものであり、主成分スコアTは以下の式2のようにして求められる。
【0011】
T = X* P (2)
このようにして、元の変数は行列Pを用いて主成分に集約することができる。行列P自体を一般に「異常検出モデル」と呼んでいる。
【0012】
主成分スコアTは集約された主成分であって、詳細にはデータ行列Xの各サンプル(Xの各行)に対応する横ベクトルxkから計算される主成分のベクトル(主成分スコアベクトル)tk(横ベクトル)はtk= xk Pにより計算される。
【0013】
主成分ベクトルtk (横ベクトル)を用いて、データ行列Xの各サンプルxkに対するT2統計量(T2値)は以下のように計算される。
Xの特異値をsi(i=1…N,NはPの列数)、tkはN次元の横ベクトルなのでそのi番目の要素をtk,iとして、
【0014】
【数1】
またxkに対するQ統計量(Q値)については,xkから以下により計算される。なおQ統計量は元のデータxにおける変数間の相関に対してどれだけ外れているかを表すものである。
【0015】
Q=xk(I-PPT)(I-PPT)TxkT (4)
T2統計量やQ統計量は必ず正の値をとるが、正常(通常)時は一定の範囲内に収まっているものの異常時には大きな値をとることが多い。したがって、既存のデータ行列Xから計算された各サンプル(Xの各行に対応)に対するT2統計量やQ統計量をユーザが見て正常と異常の境界となるしきい値を定め、x(既知の計測データ)や新しい計測データ(後述のxnew)について、T2統計量やQ統計量がこのしきい値を超えた値をとった場合に異常と判定する(T2統計量やQ統計量については非特許文献2参照)。この定め方としては、Xから算出されたXの各サンプルに対するT2統計量やQ統計量のそれぞれに対して例えばデータの95%が含まれる値等を自動的に設定することもできる。
【0016】
また、ここでXは過去のデータの蓄積を想定しており、Pはそこから計算された行列であるが、これに対して新しいデータ(Xの列の数(横の長さ)と同じ長さの横ベクトル)xnewに対して行列Pを用いて、tnew = xnew Pを計算すると tnew は xnewに対してこれを集約した主成分を表す。
【0017】
xnew,tnewから計算される、xnewに対するT2統計量やQ統計量は、xnew が過去のデータ群Xからどれだけ離れているかを示すため、この値が大きければ異常なデータと判定することで異常検出を行うことができる。
【0018】
またQ統計量の計算過程で得られるベクトルxnew(I-PPT) は、「寄与プロット」を表している。これはこのベクトルの各要素が、元のベクトルxnewの対応する要素の「異常の度合い」(通常時からどれくらい離れているか)を表しており、これを用いて異常に影響を与えている要因となる入力データを特定することも可能である。
【0019】
独立成分分析(Independent Component Analysis:ICA)は、近年研究が進められてきた新しい多変量解析手法であるが、主成分分析(PCA)と同様に独立成分分析(ICA)も異常検出に適用できるものである(非特許文献4参照)。このようにプラントプロセス計測データの統計量とその上下限を用いたプロセス異常の検出等の管理を統計的プロセス管理(SPC)と云い、特に当該例のように多変量解析による統計的プロセス管理が用いられるようになってきている。
【0020】
Xの各サンプル(行)xに対して、これに対応する品質データがあれば、それを縦に並べた縦ベクトルyとし、部分的最小二乗法を適用してxとyを以下のようにして誤差Eを最小化するように関係付ける行列P,Q,Wを得ることができる(非特許文献3参照)。
【0021】
Y = XW(PTW)-1Q + E (5)
(ここでEは、誤差ベクトルを表す)
部分的最小二乗法(Partial Least Squares:PLS)は、入力データXの各変数間に多重共線性(Multi-co-linearity)があっても安定なモデルを作ることができる有力な手法として知られている。
【0022】
これらの行列により、新しいデータxnewが得られれば、これに対応する品質データの推定値yeは以下のようにして得られることになる。
ye = xnew W(PTW)-1Q (6)
(ここでyeは、xnewに対する品質データ推定値)
上記式6に基づいて品質推定を行うことができる。
【0023】
また、判別分析(Discriminant Analysis)は、品質変数yとして例えば良・不良や○・×のように2値として表される場合に、入力データXから出力データyを推定するモデルを作成する手法として知られている。
【0024】
以上の説明は、もっぱら「サンプル」×「変数」の2次元データに対する主成分分析(PCA)による多変量解析手法についてのものであったが、バッチプロセスデータに対して多変量解析手法を適用してバッチ・ロットの異常検出や品質推定を行うことも知られている(特許文献1参照)。バッチ・ロットのデータは、複数のバッチの各々について複数の変数があり、さらに各変数について時系列データが含まれるためデータの構造としては、「バッチ」×「変数」×「時刻」の3次元データとなる。
【0025】
一般に主成分分析(PCA)や部分的最小二乗法(PLS)等の多変量解析手法は、「変数」×「サンプル」の2次元データに対して基本的に適用する手法である。そのためバッチ・ロットのデータのような3次元データに対して多変量解析手法を適用する場合には、従来では「マルチウェイ手法」(図12参照)と呼ばれる方法を用いている。これはバッチ・ロットのような3次元データについて各バッチにおける「変数」×「時刻」を1次元に並べ直した後にこれらのデータ全体を新たに1組の「サンプル」とし、1組の「サンプル」に含まれる変数全体を「変数」として、「変数」×「サンプル」の2次元データにした後で多変量解析手法を適用する方法である。
【0026】
図12は、従来のマルチウェイ手法を説明する図である。図12に示すように、バッチプロセスの3次元データは以下のように表される。
x3(i,j,k) (7)
ここでi=1…Iはバッチ, j=1…Jはバッチ内の変数, k=1…Kはバッチ内の変数の時系列(時間)のそれぞれのインデクスを表す。
【0027】
なお、一般にバッチプロセスにおいては、すべてのバッチについて時系列の長さが揃っているとは限らない。そこで非特許文献5に示されるように「データ長調整(length adjustment)」または「データアラインメント(data alignment)」と呼ばれる手法を用いてすべてのバッチの時系列の長さを揃える処理が行われている。
【0028】
バッチの時系列長を揃えた後の3次元データx3(i,j,k)(バッチ内の時刻k,変数番号j,バッチ番号i)に対し、3次元データx3(i,j,k)を2次元化する手順を以下に説明する。
図12左部に示すバッチプロセスデータの1つのバッチiに着目して、3次元データ:x3(i,j,k)の各時間Kの変数Jの組を1次元に並べなおす(図12下部に示す2次元データの最上部から順に下方参照)。並べなおした結果をx2(i,l)とすると、i=1…I,l = j + (k-1)*Jまたはl = k + (j-1)*Kとなる。ここで、l=1…Lと表すと、L=J*Kと表すことができる。
【0029】
l = j + (k-1)*Jとする場合には、l(1≦l≦L)に対して、l/Jの整数部分(l/Jを越えない最大の整数)をk-1、l−(k-1)*Jをjとする。またl = k + (j-1)*Kとする場合には、l(1≦l≦L)に対して、l/Kの整数部分(l/Kを越えない最大の整数)をj-1、l−(j-1)*Kをkとする。これによりlと(j,k)との間に1対1の対応が付けられる。
【0030】
各バッチに対して、すなわち、バッチi=1…Iに対して上述した1次元に並べなおす手順を実行して「サンプル」を生成する(図12下部参照)。これにより、x2(i,l)は、iを「サンプル」のインデクス、lを「変数」のインデクスとする、2次元データになる。
【0031】
上述した主成分分析(PCA)は、(入力)データのみから特徴量の算出モデルを作成するために用いられ、この手法を用いて上記2次元データx2(i,l)から特徴量の算出モデルを算出することになる。(つまり上に述べた主成分分析とそれから計算されるT2統計量やQ統計量を用いて異常検出を行うことができる。)
一方、部分的最小二乗法(PLS)は、入力データから出力データの推定モデルを作成するために用いられ、この手法を用いる場合に一般に入力データは上記のような3次元データであるが出力データはもともとバッチに対して1つ定まる1次元または2次元データである場合が多い。具体的には、1バッチについての品質データが1種類の場合は1次元データ、1バッチについての品質データが2種類以上(例えば、微生物数と濃度)の場合は2次元データとなる。上記のようにして2次元化した入力データと出力データとに基づいて部分的最小二乗法による推定モデルすなわち出力データの推定モデルを得ることができる。また出力データが3次元データである場合にはこれを上記した方法と同様に2次元化して部分的最小二乗法を適用することで出力データの推定モデルを得ることができる。
【0032】
このように3次元データを2次元データに変換した上で主成分分析(PCA)や部分的最小二乗法(PLS)等の多変量解析手法を適用する方法は「マルチウェイ主成分分析」「マルチウェイ部分的最小二乗法」等(以下、マルチウェイ多変量解析手法)と呼ばれて、当該技術分野の技術者には知られているものである。
【0033】
図13は、従来のマルチウェイ多変量解析手法を用いた異常検出例を示す図である。このマルチウェイ多変量解析による従来手法においては、1つの工程内の共通のサンプリング周期のデータのみに対して適用可能であった。すなわち、図13に示すように工程A560のみ、または工程B570のみのデータを対象にして、マルチウェイ主成分分析(PCA)によりQ統計量やT2統計量等の指標を算出して統計的プロセス管理手法(Statistical Process Control:SPC)590を適用して異常検出を行っていたが、工程A560,工程B570の両者の相関(例えば「工程A560での製造条件(温度や圧力)の製品品質への影響」と「工程B570での製造条件(温度や圧力)の製品品質への影響」の間における)がある場合などについては考慮されておらず、両者に相関がある場合、それを考慮した管理(異常検出)ができなかった。
【特許文献1】特開平10-228312号公報
【非特許文献1】東谷直紀、中村光広「バッチプロセス向けトレーサビリティ支援システム」計装 、Vol.7, No.7、 pp81-84 、2004
【非特許文献2】加納 学「プロセスケモメトリクスによる統計的プロセス管理」システム/制御/情報、Vol. 7, No. 13、 pp.1- 6、 1996
【非特許文献3】宮下,佐々木 「ケモメトリックス 化学パターン認識と多変量解析」 コンピュータ・ケミストリー シリーズ3 共立出版 1995
【非特許文献4】村田 昇 入門「独立成分分析」 東京電機大学出版局 2004
【非特許文献5】「Comparison of Methods for Handling Unequal Length Batches」IFAC DYCOPS-5 ,1998,pp.66-71,
【発明の開示】
【発明が解決しようとする課題】
【0034】
図13に示す従来手法のように、単一工程内の製造条件と製品品質への影響だけを考慮するのでは不十分であり、これに基づいた異常検出や品質推定ではその精度が落ちる可能性が高いということが近年になってわかってきた。
【0035】
また従来、マルチウェイ多変量解析手法において扱われるバッチプロセスデータの各バッチ内の変数の時系列データを得るための各サンプル(上記の1バッチを1「サンプル」とする「サンプル」ではなく時系列の各サンプル)は、等間隔(サンプリング周期)で収集されている必要があった。しかしバッチプロセスですべての変数のデータが同一サンプリング周期で収集されているとは限らず、一般的には変数の特性によって異なるサンプリング周期で収集されているものや、各種「イベント」に関連したデータや、バッチの処理量、バッチを処理した設備等の属性等、バッチに対して1つだけ得られる(定まる)データもある。
【0036】
さらにプロセスデータの異常検出や品質推定等においては、できるだけ多くの情報から異常検出や品質推定を行い、そして異常や品質の良否に影響を与えている要因を解析・抽出したいという要求がある。多くの情報に基づいてプロセスデータを総合的に解析することで幅広い範囲の変数間の相関(相互関係)がわかり、それを元に異常検出や品質推定を行うことで異常検出や品質推定の精度を向上させられる可能性がある。
【0037】
また同じサンプリング周期の変数をグルーピングしてそれぞれのグループ内で個別に多変量解析手法を適用しても、それぞれのグループ内で個別に扱う範囲の変数のみによる異常検出や品質推定になってしまうため、異常検出や品質推定の精度が低くなり、またそれぞれのグループ内で個別に扱う範囲の異常や品質の良否に影響を与えている要因解析においてもサンプリング周期の異なる変数間の関係がわからないこと、さらにサンプリング周期ごとに個々に多変量解析手法を適用しないといけないために煩雑であること、等の問題点があった。
【0038】
通常、バッチは複数の工程で処理されて最終製品に加工され、各バッチについて工程をまたがったデータを紐付けにより抽出できる仕組み(非特許文献1参照)ができているが、従来は、1バッチの、工程をまたがったデータをグラフに表示してその関連を見る等の、定性的な分析は行われているが、工程間の各変数等について異常や品質の良否に影響を与えている要因の因果関係等の解析を定量的に評価する方法については提案されていない。
【0039】
そこで本発明は、上記課題を解決するためになされたものであり、バッチ同士が互いに紐付けられ、サンプリング周期が異なる、又は、異なる工程にまたがったデータであってもそれらを一まとめにして統一的に扱い、サンプリング周期が異なる変数同士や工程をまたがる変数同士の相関を的確に調べることが可能なデータ解析装置およびそれを用いた異常検出/品質推定装置を提供することを目的とするものである。
【課題を解決するための手段】
【0040】
本発明のバッチプロセスデータの解析装置は、各バッチに関するサンプリング周期の異なる時系列データを、バッチ単位でまとめてプロセスデータのグループとして扱うバッチプロセスデータの解析装置であって、前記グループのそれぞれに対してデータアラインメント処理を行った後、各グループから、各バッチに紐付けされたバッチデータを抽出するバッチデータ抽出手段と、該バッチデータ抽出手段により抽出されたバッチデータから、各グループについてマルチウェイ手法により1次元化し、これをすべてのグループから抽出されたデータに対して行うグループデータ1次元化手段と、該グループデータ1次元化手段によりすべてのグループについて1次元化を行った後、該すべてのグループの1次元化されたこれらのデータを結合して全体として1次元データの配列とする全体1次元データ配列手段と、該全体1次元データ配列手段により得られた各バッチについての1次元データの各要素を「変数」,1次元データ(ベクトル)を1つの「サンプル」とする「変数」×「サンプル」の2次元化データを得るデータ2次元化手段と、該データ2次元化手段により得られた2次元データに対して多変量解析手法を適用して、解析処理を実行する多変量解析処理手段と、を備える。
【0041】
また本発明のバッチプロセスデータの解析装置は、各バッチに関する複数の工程のデータを、バッチ単位でまとめてプロセスデータのグループとして扱うバッチプロセスデータの解析装置であって、前記グループのそれぞれに対してデータアラインメント処理を行った後、各グループから、各バッチに紐付けされたバッチデータを抽出するバッチデータ抽出手段と、該バッチデータ抽出手段により抽出されたバッチデータから、各グループについてマルチウェイ手法により1次元化し、これをすべてのグループから抽出されたデータに対して行うグループデータ1次元化手段と、該グループデータ1次元化手段によりすべてのグループについて1次元化を行った後、該すべてのグループの1次元化されたこれらのデータを結合して全体として1次元データの配列とする全体1次元データ配列手段と、該全体1次元データ配列手段により得られた各バッチについての1次元データの各要素を「変数」,1次元データ(ベクトル)を1つの「サンプル」とする「変数」×「サンプル」の2次元化データを得るデータ2次元化手段と、該データ2次元化手段により得られた2次元データに対して多変量解析手法を適用して、解析処理を実行する多変量解析処理手段と、を備える。
【0042】
また本発明のバッチプロセスデータの異常検出装置は、上述したデータ解析装置を用いて異常検出モデルを生成しておき、新たに取得されたバッチプロセスデータに対して、データアラインメント処理,2次元化処理を行った上で前記異常検出モデルとの行列演算を行って、T2統計量およびQ統計量を出力し、これがあらかじめ設定したしきい値を超えるかを検出して異常検出を行う。
【0043】
また本発明のバッチプロセスデータの品質推定装置は、上述したデータ解析装置を用いて品質推定モデルを生成しておき、新たに取得されたバッチプロセスデータに対して、データアラインメント処理,2次元化処理を行った上で前記異常検出モデルとの行列演算を行って、品質データ推定値を出力して品質予測を行う。
【発明の効果】
【0044】
本発明によれば、複数のバッチに関するバッチプロセスデータについて、サンプリング周期が異なる、又は、異なる工程にまたがったデータであってもそれらを統一的に扱ってサンプリング周期が異なる変数同士や工程をまたがる変数同士の相関を的確に調べることができる。
【0045】
また本発明によれば、上述したバッチプロセスデータの解析装置を用いることで、サンプリング周期が異なる変数同士や工程をまたがる変数同士の相関を的確に調べることができるので、異常検出精度/品質予測精度の大幅な向上を図ることができる。
【発明を実施するための最良の形態】
【0046】
以下、本発明を実施するための最良の形態について図面を参照しながら説明する。
図1は、本発明の実施形態に係るバッチプロセスデータの解析装置およびそれを用いた異常検出/品質推定装置の構成概要を示すブロック図である。
【0047】
図1において本発明の実施形態に係るバッチプロセスデータの解析装置およびそれを用いた異常検出/品質推定装置は、データ収集手段2により収集したバッチプロセスデータ1をデータ格納手段3に格納する。データ格納手段3は品質データ4があればこれも格納して以降において品質予測のためのデータに供する。これらのデータはデータ格納手段3からモデル作成手段10に入力される。モデル作成手段10は、データ入力手段5、データ解析手段6及びデータ出力手段7から構成される。データ入力手段5に入力されたバッチプロセスデータ1や品質データ4は、データ入力手段5を経てデータ解析手段6に入力される。データ入力手段5は、データアラインメント処理を適宜行ってデータ解析手段6に出力する。データ解析手段6においては上述したマルチウェイ多変量解析手法の適用によりモデル化を行う。これについては後述する。
【0048】
データ解析手段6により解析された結果は「モデル」(係数行列)としてデータ出力手段(結果出力手段)7からモデル格納手段8に出力され、そこで結果出力が格納される。以上までの構成をもってバッチプロセスデータの解析装置を構成する。詳細は後述する。
【0049】
そしてデータ判定/予測手段9では、モデル格納手段8に格納された「モデル」(係数行列)と、データ収集手段2でオンラインによりデータ収集されたバッチプロセスデータ1とに基づいて演算を実施し、実施した演算結果に基づいてアラームや予測値を出力し、異常検出または品質推定を行う。したがって、上述したバッチプロセスデータの解析装置を用いてバッチプロセスデータの異常検出装置または品質推定装置を構成することになる。
【0050】
図2は、図1に示した本発明の実施形態に係るバッチプロセスデータの解析装置およびそれを用いた異常検出/品質推定装置の制御の流れおよびデータの流れを示すフロー図であり、異常検出に適用した場合の例を示すものである。図1と同じ構成要素には同一の番号を付けて説明する。なお、ここでは多変量解析として主成分分析(PCA)を用いる場合について説明する。
【0051】
データ収集手段2で収集したプラントデータ(バッチプロセスデータ)1をデータ格納手段(プラントデータデータベース)3に格納する。(異常検出)モデル作成手段10は、プラントデータデータベース3から、過去の複数のバッチで、各バッチについて紐付けされた複数のバッチプロセスデータのセット(以下「グループ」という)を読み込む(図5参照)。そしてデータアラインメント処理11,2次元化処理12,主成分分析による多変量解析処理13を実施して(異常検出)モデル(具体的には係数行列値としきい値)14を作成し、モデル格納手段(モデルデータベース)8に格納する。ここまでの制御の流れおよびデータの流れ(すなわち図2の左半)は、オフラインで実施され、本発明の実施形態に係るバッチプロセスデータの解析装置としての制御の流れおよびデータの流れである。
【0052】
モデル格納手段8に格納された当該モデル(係数行列値としきい値)を用いて異常検出を行う場合には、新たに取得されたプラントデータ(バッチプロセスデータ)1に対して、異常検出手段(図1のデータ判定/予測手段9に相当)20は、データアラインメント処理21,2次元化処理22を行った上でモデルである行列との演算を行列演算処理23にて実施し、上述したT2統計量やQ統計量を出力24して、これに基づいて異常検出を行う。つまり、モデル中に設定されたしきい値を超えた場合には「異常」と判定し、アラームなどを表示装置(図示せず)に表示する。ここまでの制御の流れおよびデータの流れ(すなわち図2の右半)は、オンラインで実施され、図2の左半に示された本発明の実施形態に係るバッチプロセスデータの解析装置を用いた異常検出処理を行う制御の流れおよびデータの流れである。
【0053】
T2統計量やQ統計量から異常検出を行うことについては、上述したように従来の主成分分析の説明においてすでに述べた。そしてしきい値の設定は、既存のデータからユーザが手動で行うか或いは上述したように各サンプルに対するT2統計量やQ統計量のそれぞれに対して例えばデータの95%が含まれる値をしきい値として自動的に行う。
【0054】
図3は、図1に示した本発明の実施形態に係るバッチプロセスデータの解析装置およびそれを用いた異常検出/品質推定装置の制御の流れおよびデータの流れを示すフロー図であり、品質推定に適用した場合の例を示すものである。図1と同じ構成要素には同一の番号を付けて説明する。なお、ここでは多変量解析として部分的最小二乗法(PLS)を用いる場合について説明する。
【0055】
データ収集手段2で収集したプラントデータ(バッチプロセスデータ)1をデータ格納手段(プラントデータデータベース)3に格納する。(品質推定)モデル作成手段10は、プラントデータデータベース3から、過去の複数のバッチで、各バッチについて紐付けされた複数のバッチプロセスデータのセット(「グループ」)ならびにそれぞれのバッチに対応する品質データ4を読み込む(図5,図11参照)。そしてデータアラインメント処理11,2次元化処理12,部分的最小二乗法による多変量解析処理13を実施して(品質推定)モデル(具体的には係数行列値)15を作成し、モデル格納手段(モデルデータベース)8に格納する。ここまでの制御の流れおよびデータの流れ(すなわち図3の左半)は、オフラインで実施され、本発明の実施形態に係るバッチプロセスデータの解析装置としての制御の流れおよびデータの流れである。
【0056】
モデル格納手段8に格納された当該モデル(係数行列値)を用いて品質推定を行う場合には、新たに取得されたプラントデータ(バッチプロセスデータ)1に対して、品質推定手段(図1のデータ判定/予測手段9に相当)30は、データアラインメント処理31,2次元化処理32を行った上でモデルである行列との演算を行列演算処理33にて実施して、品質データ推定値34を出力する。出力した品質データ推定値34を表示装置(図示せず)などに表示することができる。ここまでの制御の流れおよびデータの流れ(すなわち図3の右半)は、オンラインで実施され、図3の左半に示された本発明の実施形態に係るバッチプロセスデータの解析装置を用いた品質推定処理を行う制御の流れおよびデータの流れである。
【0057】
ここで図2及び図3の説明における「データアラインメント」および「2次元化処理」について、図4のフローチャートを用いながら説明する。図4の処理フローの説明開始にあたり、各グループに属する各バッチのデータは互いにそれぞれ紐付けられている同じバッチに関するデータ(図5参照)ではあるが、バッチに関して時系列の長さが揃っていない場合にすべてのバッチの時系列の長さを揃えるために「データアラインメント」を実行する(非特許文献5参照) 。この処理によりまずバッチの時系列の長さを揃える。
【0058】
このように各バッチプロセスデータのセット(グループ)に対して上記データアラインメント処理を行った後、各バッチについて以下の処理を行う。
バッチのループ処理(ステップS1)では、各グループから、各バッチに紐付けされたバッチデータを抽出する。
【0059】
次に各バッチのグループのループ処理(ステップS2)では、抽出されたバッチデータから各グループについて、ステップS3において図12に示したようなマルチウェイ手法により1次元化する。これをすべてのグループから抽出されたデータに対して行う。
【0060】
次いですべてのグループについて1次元化を行った後、ステップS4においてすべてのグループの1次元化されたこれらのデータを結合して全体として1次元データ(配列)とする(図6参照)。
【0061】
上記処理をすべてのバッチについて行う(図4のステップS1の終了)ことにより、各バッチについて1次元化されたデータができる(図7参照)。
こうして、各バッチについての1次元データの各要素を「変数」,1次元データ(ベクトル)を1つの「サンプル」とする「変数」×「サンプル」の2次元化処理を終了する。
【0062】
そして2次元化処理された2次元データに対して図2,図3に示したように、主成分分析や部分的最小二乗法などによる多変量解析手法を適用して、多変量解析処理を実行することができる。これが本発明の実施形態に係るバッチプロセスデータの解析装置の処理概要である。
【0063】
次に本発明の実施形態に係るバッチプロセスデータの解析装置の処理内容の詳細を説明する。いま図5に示すように、互いに紐付けられた複数のバッチデータについて同じバッチのサンプリング周期の異なる時系列の変数をまとめて変数のグループとする。なお、図5はバッチのインデクスi=2に係るバッチ同士について互いに紐付いている様子を例示している。
【0064】
これにより複数のサンプリング周期のそれぞれについて変数のグループができる。変数のg番目のグループ「グループg」について各データは以下のように4次元データとして表される。
【0065】
x4(i,g, j,k) (8)
ここで、g=1…G はグループ,i=1…Iはバッチ,j=1…Jgはバッチ内のグループ内の変数,k=1…Kgはバッチ内のグループ内の変数の時系列(時刻),のそれぞれのインデクスを表す。またバッチ数はグループ共通であるが、変数の数と時系列の長さ(サンプリング時刻点数)はグループごとに異なるためそれぞれJg,Kgと添え数gを付ける。
【0066】
次に上記式8で表された4次元データを、以下の図6,図7に示すようにして「サンプル」化して2次元データとすることで多変量解析手法を適用し、バッチについての異常検出や品質推定を行えるようにする。
【0067】
具体的には、各バッチiについて、各グループから各時刻の変数の組を1次元に並べたベクトルをまず作成する(図6の下部参照)。さらにこれをすべてのグループについて並べたベクトルを作成する。これが1つの「サンプル」となり、2次元データx2(i,m)と表される(図7の下部参照)。詳しく説明すると、上記mは、以下の式9のように表される。
【0068】
【数2】
逆にm(1≦m≦M)が与えられた場合、以下のようにしてg,j,kを得る。
【0069】
いま、上記したMを式10で表して、
【0070】
【数3】
m=1…Mについて、以下の式11を満たす整数をgとする。
【0071】
【数4】
次に、以下の式12の整数部分(式12を越えない最大の整数)を(k−1)とする。
【0072】
【数5】
上記した式9を式13のように変形して式13よりjを求める。
【0073】
【数6】
これを各iについて1次元とすることで、2次元データx2(i,m)を得る(図7参照)。ここでi=1…Iは「サンプル」,m=1…M(Mは式10で定義)は「変数」のそれぞれのインデクスである。
【0074】
上記した式9〜13により、g,j,kが一意に定まり、この(g,j,k)とmの間に1対1の対応が付けられる。これにより、各iを「サンプル」のインデクス,mを「変数」のインデクスとする2次元データx2(i,m)に対して多変量解析手法を適用する。この2次元データx2(i,m)に対して多変量解析手法を適用する手段として図1に示したデータ解析手段6を含むモデル作成手段10が設けられている。そしてモデル作成手段10の出力として、作成されたモデルをモデル格納手段8に格納し、モデル格納手段8に格納されたモデル、例えば上述した異常検出モデルと、オンラインでデータ収集した現実のバッチプロセスデータ1とで演算を実施し、データ判定/予測手段9において各バッチについての特徴量算出による異常検出を行う。
【0075】
また部分的最小二乗法等の品質推定手法を適用する場合には、上記した従来技術の場合と同様に、品質データ4をデータ格納手段3に格納しつつ、出力が(異なるサンプリング周期の)変数であった場合についてもこれを図1に示したモデル作成手段10により上記した方法で同じく2次元化することで部分的最小二乗法等を適用してモデル(品質推定モデル)を作成し、作成されたモデルをモデル格納手段8に格納し、このモデル(品質推定モデル)と、オンラインでデータ収集した現実のバッチプロセスデータ1とで演算を実施し、データ判定/予測手段9において各バッチについての特徴量算出による品質推定を行う。
【0076】
ところで複数のバッチについて各バッチの工程をまたがるデータを得た場合に、これらは各工程についてのバッチデータであり、それぞれ3次元データとして得られる。ここで各工程において複数の異なるサンプリング周期で取得されている変数があってもよい。
【0077】
これらは工程をまたがった場合や、同一工程内でも異なるサンプリング周期である場合でも、みなバッチに関連付け(紐付け) (図5参照)されており、サンプリング周期ごとにグルーピングし、グループごとに4次元データとして表すことができる。つまり共通のバッチiに対して各工程で得られたバッチデータをそれぞれ「グループ」として4次元データx4(i,g,j,k)として定義することができる。
【0078】
そして上述した式9〜13および図6,図7で説明した方法により2次元化し、この2次元データに対して上述したように主成分分析や部分的最小二乗法等による多変量解析手法を適用することができる。具体的には各工程で得られたバッチプロセスデータを図6,図7における各グループとし、これを図7におけるように2次元化データすることで上記の処理を行うことができる。またこれらの処理を実行する具体的構成は図1〜3に示したものを使用することができる。
【0079】
以上のように複数のバッチデータについて、これらのデータが工程をまたがった場合や、同一工程内でも異なるサンプリング周期である場合でも、みなバッチに関連付け(紐付け)されており、サンプリング周期ごとにグルーピングし、グループごとに3次元データとして表され、これが共通のバッチiに対して各工程で得られたバッチデータをそれぞれ「グループ」として4次元データx4(i,g,j,k)として定義されることから、複数のバッチデータを一まとめにして統合的に扱い、上述した式9〜13および図6,図7で説明した方法によりすべて「サンプル」×「変数」の2次元データに変換できる。そして「サンプル」×「変数」の2次元データに対して主成分分析、部分的最小二乗法、独立成分分析など各種の多変量解析手法をプラントにおけるバッチプロセスデータの性質に応じて適宜適用することができる。
【0080】
すなわち、「サンプル」×「変数」の2次元データに対して、主成分分析又は独立成分分析を適用すれば異常検出を、また部分的最小二乗法又は判別分析を適用すれば品質推定を行うことが可能で、これらをプラントにおけるバッチプロセスデータの性質に応じて適宜適用する。
【0081】
図8は、本発明手法を適用した場合の実例を示す図である。図8に示す実例においては、工程A60,工程B70の両方のデータを入力データとして取り込むことで、工程A60と工程B70のそれぞれだけを見ていたのではわからない、両工程間の相関を考慮した異常検出や品質推定を行うことができる。具体的には、工程A60のデータを、図5に示す、「グループ1」として、工程B70のデータを「グループ2」にとして適用すればよい。そして、本発明手法による異常検出装置での処理では、複数工程をまとめてマルチウェイ手法PCA(主成分分析)によるSPC(統計的プロセス管理)90を実施する。
【0082】
図9は、本発明手法を適用した場合の実例と従来手法を適用した場合の実例とを比較する図である。図9に示す従来手法を適用した場合の実例において、通常のバッチでは工程A560の圧力データの処理終了時付近は平坦であるが、たまに変動する場合がある。このような変動の結果として品質不良となる場合と、正常な製品ができる場合がある。一方で、工程B570の圧力データの処理終了時付近においても、通常は平坦であるが、たまに変動する場合がある。
【0083】
工程A560と工程B570のこれらの部分のデータは実は互いに関係があり、工程A560で変動した場合に工程B570でも変動していれば工程A560での影響が工程B570で打ち消されて異常(不良)でなくなることが確認されている。
【0084】
このような場合、従来手法では工程ごとにしか適用できないため、工程A560の処理終了時付近での変動または工程B570の処理終了時付近での変動があるバッチはすべて「異常(不良)」と判定されてしまう。
【0085】
しかし、実際には1つのバッチにおいて、工程A560の処理終了時付近での変動と工程B570の処理終了時付近での変動が両方起こった場合には良品が得られているのでこれを不良として扱うのは明らかに誤検出ということになり、著しく異常検出精度が劣化していることになる。
【0086】
一方、図9に示す本発明手法を適用した場合の実例においては、工程A60と工程B70の両方のデータを用いることで、工程をまたがったデータ間の相関を考慮することが簡単に可能となるため、異常検出精度や品質推定精度の大幅な向上を図ることができる。
【図面の簡単な説明】
【0087】
【図1】本発明の実施形態に係るバッチプロセスデータの解析装置およびそれを用いた異常検出/品質推定装置の構成概要を示すブロック図である。
【図2】図1に示した装置の制御の流れおよびデータの流れを示すフロー図である。
【図3】図1に示した装置の制御の流れおよびデータの流れを示すフロー図である。
【図4】図2及び図3に示した「2次元化処理」を説明するフロー図である。
【図5】互いに紐付けられた複数のバッチデータの関係を示す図である。
【図6】複数のグループの1次元化を説明する図である。
【図7】複数のバッチデータの2次元化を説明する図である。
【図8】本発明手法を適用した場合の実例を示す図である。
【図9】本発明手法を適用した場合の実例と従来手法を適用した場合の実例とを比較する図である。
【図10】従来の一般的なプラントによる製品製造システムにおける製造データ管理システムの構成概要を示す図である。
【図11】従来の或る製品(食品)の製造工程を示す図である。
【図12】従来のマルチウェイ手法を説明する図である。
【図13】従来のマルチウェイ多変量解析手法を用いた異常検出例を示す図である。
【符号の説明】
【0088】
1 バッチプロセスデータ(プラントデータ)
2 データ収集手段
3 データ格納手段(プラントデータDB)
4 品質データ
5 データ入力手段
6 データ解析手段
7 データ出力手段
8 モデル格納手段(モデルDB)
9 データ判定/予測手段
10 モデル作成手段
11,21,31 データアラインメント部
12,22,32 2次元処理部
13 多変量解析処理部
14 異常検出モデル
15 品質推定モデル
20 異常検出手段
23,33 行列演算処理部
24 出力(T2/Q)
30 品質推定手段
34 品質データ推定値
60 工程A
70 工程B
80 プラントデータDB(データベース)
90 本発明手法によるSPC(統計的プロセス管理)
【技術分野】
【0001】
本発明は、バッチプロセスデータの解析装置およびそれを用いた異常検出/品質推定装置に関するものである。
【背景技術】
【0002】
図10は、従来の一般的なプラントによる製品製造システムにおける製造データ管理システムの構成概要を示す図である。例えば食品プラント等においては、タンクの温度,圧力,流量等を計測するためにセンサ等が設置され、センサ等で計測された情報をコントローラ500、ネットワーク510を介してDCS(Distributed Control System)(分散制御システム)520に送信して制御に供している。またDCS520の上位階層にはそれらのセンサ情報等の操業データや品質データを取得して格納し操業実績の管理を行ったり、生産計画の立案を行ったりするMES(Manufacturing Execution System)(製造実行システム)530が設けられている。MES530においてはバッチ・ロット(以下では、単に‘バッチ’ともいう)ごとにどの装置を経由したかやその経由時刻等を管理しており、これにより工程をまたぐバッチの紐付けを行っている(非特許文献1参照)。
【0003】
品質データが取得される場合、プラントの種類にもよるが、分析設備を備えたいわゆる「ラボ」と呼ばれる施設に持ち込んで微生物数の計測による品質の計測540や分析計を使用した濃度計測550による検査が行われる場合が多い。「ラボ」における品質の計測や検査は時間やコストがかかる場合が多いこともあり、一部の抜取り検査しか行われないのが通常である。
【0004】
図11は、従来の或る製品(食品)の製造工程を示す図である。この製造工程は複数の工程からなり、その中で2つの工程、例として「工程A」560,「工程B」570、を選んで詳しく説明する。図11に示す製造工程では「バッチ」単位で製品が製造処理されているものとする。すなわち1つのバッチが図11に示される各工程に投入され、当該工程での処理・加工完了後、その結果(中間製品)が出力される。出力された中間製品はまた同じバッチ単位で次工程に投入され、これを各工程につき繰り返す。
【0005】
工程A560においては、その前工程で製造された中間製品に対してタンク内にて例えば1時間程度処理加工が行われる。次に工程A560の製造結果である中間製品は工程B570に投入される。工程B570においてはまた別のタンクにおいて例えば2時間程度の別の処理加工が行われる。工程A560,工程B570それぞれにおける処理加工時間は中間製品の処理量等によって定まる。工程A560,工程B570のいずれでも使用されるタンクには温度センサ,圧力センサが設置されており、それぞれの工程での各バッチの処理加工時間中の温度,圧力が一定のサンプリング周期で計測され、その計測データはデータベース580に格納される。また工程A560,工程B570の結果として得られる中間製品における微生物数も計測され、当該中間製品を評価する要素として同様にデータベース580に格納される。また、あるバッチ(バッチ1とする)を図11に示す製造工程に流した場合の、工程A560と工程B570の温度ならびに圧力データも図11に示している。これらの温度ならびに圧力データを「バッチプロセスデータ」という。当該バッチについて品質データを得るために計測される微生物数の計測もここでは1箇所だけ示されている。
【0006】
多数のバッチ(バッチ1〜N)の工程A560,工程B570の温度・圧力計測値時系列データと、品質データとしての微生物数計測値とが得られ、その微生物数計測値から中間製品の良・不良(正常・異常)を判定している。ただし、微生物数の計測には時間がかかるため、異常・正常の判定にも時間がかかることになる。そこで、従来より実際に微生物数を計測する前に工程A560,工程B570での温度や圧力の計測データからそのバッチの中間製品の正常・異常を判定(検出)するような装置(システム)が活用されている。このような装置(システム)のことをここでは「異常検出装置」と呼ぶことにしている。
【0007】
上記したプラントに関するいわゆる連続系のデータに対して主成分分析(Principal Component Analysis:PCA)や部分的最小二乗法(Partial Least Squares:PLS)等の多変量解析手法を適用して異常検出や品質推定を行うことは従来から行われている(非特許文献2参照)。
【0008】
連続系のデータとは、一定の変数の組(例えば、温度,圧力などの組)について一定のタイミングで収集したデータを1組のサンプルとし、それが複数集められた「変数」×「サンプル」の2次元データの構造をしている。一般にサンプルの収集タイミングはすべての変数について同時刻であることが多いが、一部の変数については一定時間の時間差を持った(遅れた)時間を用いる場合もありうる。なお、一般に収集タイミングは等間隔(サンプリング周期)である必要はなく、各サンプルが揃っていればよい。
【0009】
以下では、主成分分析(PCA)による多変量解析を例に従来の解析手順(モデル作成)について説明する。なお、x,yは、一般的に計測データを平均値0,標準偏差1に規格化(標準化)後のデータである。元の2次元データをXとすると、2次元データXは、2次元の行列式で表され、行列の各要素X(i,j)について、iがサンプル番号,jが変数番号を表すものとすると、主成分分析(PCA)により、元のデータXは以下の式1のように表される。
【0010】
X = T* PT+ E (1)
ここでTは主成分スコア,Pはローディング(負荷量)行列,Eはモデル化誤差行列であり、またPの右肩のTは行列の転置を表している。また主成分スコアTは元の変数Xを、その中で互いに相関のある変数同士にまとめ、より少ない数の「主成分」として集約したものであり、主成分スコアTは以下の式2のようにして求められる。
【0011】
T = X* P (2)
このようにして、元の変数は行列Pを用いて主成分に集約することができる。行列P自体を一般に「異常検出モデル」と呼んでいる。
【0012】
主成分スコアTは集約された主成分であって、詳細にはデータ行列Xの各サンプル(Xの各行)に対応する横ベクトルxkから計算される主成分のベクトル(主成分スコアベクトル)tk(横ベクトル)はtk= xk Pにより計算される。
【0013】
主成分ベクトルtk (横ベクトル)を用いて、データ行列Xの各サンプルxkに対するT2統計量(T2値)は以下のように計算される。
Xの特異値をsi(i=1…N,NはPの列数)、tkはN次元の横ベクトルなのでそのi番目の要素をtk,iとして、
【0014】
【数1】
またxkに対するQ統計量(Q値)については,xkから以下により計算される。なおQ統計量は元のデータxにおける変数間の相関に対してどれだけ外れているかを表すものである。
【0015】
Q=xk(I-PPT)(I-PPT)TxkT (4)
T2統計量やQ統計量は必ず正の値をとるが、正常(通常)時は一定の範囲内に収まっているものの異常時には大きな値をとることが多い。したがって、既存のデータ行列Xから計算された各サンプル(Xの各行に対応)に対するT2統計量やQ統計量をユーザが見て正常と異常の境界となるしきい値を定め、x(既知の計測データ)や新しい計測データ(後述のxnew)について、T2統計量やQ統計量がこのしきい値を超えた値をとった場合に異常と判定する(T2統計量やQ統計量については非特許文献2参照)。この定め方としては、Xから算出されたXの各サンプルに対するT2統計量やQ統計量のそれぞれに対して例えばデータの95%が含まれる値等を自動的に設定することもできる。
【0016】
また、ここでXは過去のデータの蓄積を想定しており、Pはそこから計算された行列であるが、これに対して新しいデータ(Xの列の数(横の長さ)と同じ長さの横ベクトル)xnewに対して行列Pを用いて、tnew = xnew Pを計算すると tnew は xnewに対してこれを集約した主成分を表す。
【0017】
xnew,tnewから計算される、xnewに対するT2統計量やQ統計量は、xnew が過去のデータ群Xからどれだけ離れているかを示すため、この値が大きければ異常なデータと判定することで異常検出を行うことができる。
【0018】
またQ統計量の計算過程で得られるベクトルxnew(I-PPT) は、「寄与プロット」を表している。これはこのベクトルの各要素が、元のベクトルxnewの対応する要素の「異常の度合い」(通常時からどれくらい離れているか)を表しており、これを用いて異常に影響を与えている要因となる入力データを特定することも可能である。
【0019】
独立成分分析(Independent Component Analysis:ICA)は、近年研究が進められてきた新しい多変量解析手法であるが、主成分分析(PCA)と同様に独立成分分析(ICA)も異常検出に適用できるものである(非特許文献4参照)。このようにプラントプロセス計測データの統計量とその上下限を用いたプロセス異常の検出等の管理を統計的プロセス管理(SPC)と云い、特に当該例のように多変量解析による統計的プロセス管理が用いられるようになってきている。
【0020】
Xの各サンプル(行)xに対して、これに対応する品質データがあれば、それを縦に並べた縦ベクトルyとし、部分的最小二乗法を適用してxとyを以下のようにして誤差Eを最小化するように関係付ける行列P,Q,Wを得ることができる(非特許文献3参照)。
【0021】
Y = XW(PTW)-1Q + E (5)
(ここでEは、誤差ベクトルを表す)
部分的最小二乗法(Partial Least Squares:PLS)は、入力データXの各変数間に多重共線性(Multi-co-linearity)があっても安定なモデルを作ることができる有力な手法として知られている。
【0022】
これらの行列により、新しいデータxnewが得られれば、これに対応する品質データの推定値yeは以下のようにして得られることになる。
ye = xnew W(PTW)-1Q (6)
(ここでyeは、xnewに対する品質データ推定値)
上記式6に基づいて品質推定を行うことができる。
【0023】
また、判別分析(Discriminant Analysis)は、品質変数yとして例えば良・不良や○・×のように2値として表される場合に、入力データXから出力データyを推定するモデルを作成する手法として知られている。
【0024】
以上の説明は、もっぱら「サンプル」×「変数」の2次元データに対する主成分分析(PCA)による多変量解析手法についてのものであったが、バッチプロセスデータに対して多変量解析手法を適用してバッチ・ロットの異常検出や品質推定を行うことも知られている(特許文献1参照)。バッチ・ロットのデータは、複数のバッチの各々について複数の変数があり、さらに各変数について時系列データが含まれるためデータの構造としては、「バッチ」×「変数」×「時刻」の3次元データとなる。
【0025】
一般に主成分分析(PCA)や部分的最小二乗法(PLS)等の多変量解析手法は、「変数」×「サンプル」の2次元データに対して基本的に適用する手法である。そのためバッチ・ロットのデータのような3次元データに対して多変量解析手法を適用する場合には、従来では「マルチウェイ手法」(図12参照)と呼ばれる方法を用いている。これはバッチ・ロットのような3次元データについて各バッチにおける「変数」×「時刻」を1次元に並べ直した後にこれらのデータ全体を新たに1組の「サンプル」とし、1組の「サンプル」に含まれる変数全体を「変数」として、「変数」×「サンプル」の2次元データにした後で多変量解析手法を適用する方法である。
【0026】
図12は、従来のマルチウェイ手法を説明する図である。図12に示すように、バッチプロセスの3次元データは以下のように表される。
x3(i,j,k) (7)
ここでi=1…Iはバッチ, j=1…Jはバッチ内の変数, k=1…Kはバッチ内の変数の時系列(時間)のそれぞれのインデクスを表す。
【0027】
なお、一般にバッチプロセスにおいては、すべてのバッチについて時系列の長さが揃っているとは限らない。そこで非特許文献5に示されるように「データ長調整(length adjustment)」または「データアラインメント(data alignment)」と呼ばれる手法を用いてすべてのバッチの時系列の長さを揃える処理が行われている。
【0028】
バッチの時系列長を揃えた後の3次元データx3(i,j,k)(バッチ内の時刻k,変数番号j,バッチ番号i)に対し、3次元データx3(i,j,k)を2次元化する手順を以下に説明する。
図12左部に示すバッチプロセスデータの1つのバッチiに着目して、3次元データ:x3(i,j,k)の各時間Kの変数Jの組を1次元に並べなおす(図12下部に示す2次元データの最上部から順に下方参照)。並べなおした結果をx2(i,l)とすると、i=1…I,l = j + (k-1)*Jまたはl = k + (j-1)*Kとなる。ここで、l=1…Lと表すと、L=J*Kと表すことができる。
【0029】
l = j + (k-1)*Jとする場合には、l(1≦l≦L)に対して、l/Jの整数部分(l/Jを越えない最大の整数)をk-1、l−(k-1)*Jをjとする。またl = k + (j-1)*Kとする場合には、l(1≦l≦L)に対して、l/Kの整数部分(l/Kを越えない最大の整数)をj-1、l−(j-1)*Kをkとする。これによりlと(j,k)との間に1対1の対応が付けられる。
【0030】
各バッチに対して、すなわち、バッチi=1…Iに対して上述した1次元に並べなおす手順を実行して「サンプル」を生成する(図12下部参照)。これにより、x2(i,l)は、iを「サンプル」のインデクス、lを「変数」のインデクスとする、2次元データになる。
【0031】
上述した主成分分析(PCA)は、(入力)データのみから特徴量の算出モデルを作成するために用いられ、この手法を用いて上記2次元データx2(i,l)から特徴量の算出モデルを算出することになる。(つまり上に述べた主成分分析とそれから計算されるT2統計量やQ統計量を用いて異常検出を行うことができる。)
一方、部分的最小二乗法(PLS)は、入力データから出力データの推定モデルを作成するために用いられ、この手法を用いる場合に一般に入力データは上記のような3次元データであるが出力データはもともとバッチに対して1つ定まる1次元または2次元データである場合が多い。具体的には、1バッチについての品質データが1種類の場合は1次元データ、1バッチについての品質データが2種類以上(例えば、微生物数と濃度)の場合は2次元データとなる。上記のようにして2次元化した入力データと出力データとに基づいて部分的最小二乗法による推定モデルすなわち出力データの推定モデルを得ることができる。また出力データが3次元データである場合にはこれを上記した方法と同様に2次元化して部分的最小二乗法を適用することで出力データの推定モデルを得ることができる。
【0032】
このように3次元データを2次元データに変換した上で主成分分析(PCA)や部分的最小二乗法(PLS)等の多変量解析手法を適用する方法は「マルチウェイ主成分分析」「マルチウェイ部分的最小二乗法」等(以下、マルチウェイ多変量解析手法)と呼ばれて、当該技術分野の技術者には知られているものである。
【0033】
図13は、従来のマルチウェイ多変量解析手法を用いた異常検出例を示す図である。このマルチウェイ多変量解析による従来手法においては、1つの工程内の共通のサンプリング周期のデータのみに対して適用可能であった。すなわち、図13に示すように工程A560のみ、または工程B570のみのデータを対象にして、マルチウェイ主成分分析(PCA)によりQ統計量やT2統計量等の指標を算出して統計的プロセス管理手法(Statistical Process Control:SPC)590を適用して異常検出を行っていたが、工程A560,工程B570の両者の相関(例えば「工程A560での製造条件(温度や圧力)の製品品質への影響」と「工程B570での製造条件(温度や圧力)の製品品質への影響」の間における)がある場合などについては考慮されておらず、両者に相関がある場合、それを考慮した管理(異常検出)ができなかった。
【特許文献1】特開平10-228312号公報
【非特許文献1】東谷直紀、中村光広「バッチプロセス向けトレーサビリティ支援システム」計装 、Vol.7, No.7、 pp81-84 、2004
【非特許文献2】加納 学「プロセスケモメトリクスによる統計的プロセス管理」システム/制御/情報、Vol. 7, No. 13、 pp.1- 6、 1996
【非特許文献3】宮下,佐々木 「ケモメトリックス 化学パターン認識と多変量解析」 コンピュータ・ケミストリー シリーズ3 共立出版 1995
【非特許文献4】村田 昇 入門「独立成分分析」 東京電機大学出版局 2004
【非特許文献5】「Comparison of Methods for Handling Unequal Length Batches」IFAC DYCOPS-5 ,1998,pp.66-71,
【発明の開示】
【発明が解決しようとする課題】
【0034】
図13に示す従来手法のように、単一工程内の製造条件と製品品質への影響だけを考慮するのでは不十分であり、これに基づいた異常検出や品質推定ではその精度が落ちる可能性が高いということが近年になってわかってきた。
【0035】
また従来、マルチウェイ多変量解析手法において扱われるバッチプロセスデータの各バッチ内の変数の時系列データを得るための各サンプル(上記の1バッチを1「サンプル」とする「サンプル」ではなく時系列の各サンプル)は、等間隔(サンプリング周期)で収集されている必要があった。しかしバッチプロセスですべての変数のデータが同一サンプリング周期で収集されているとは限らず、一般的には変数の特性によって異なるサンプリング周期で収集されているものや、各種「イベント」に関連したデータや、バッチの処理量、バッチを処理した設備等の属性等、バッチに対して1つだけ得られる(定まる)データもある。
【0036】
さらにプロセスデータの異常検出や品質推定等においては、できるだけ多くの情報から異常検出や品質推定を行い、そして異常や品質の良否に影響を与えている要因を解析・抽出したいという要求がある。多くの情報に基づいてプロセスデータを総合的に解析することで幅広い範囲の変数間の相関(相互関係)がわかり、それを元に異常検出や品質推定を行うことで異常検出や品質推定の精度を向上させられる可能性がある。
【0037】
また同じサンプリング周期の変数をグルーピングしてそれぞれのグループ内で個別に多変量解析手法を適用しても、それぞれのグループ内で個別に扱う範囲の変数のみによる異常検出や品質推定になってしまうため、異常検出や品質推定の精度が低くなり、またそれぞれのグループ内で個別に扱う範囲の異常や品質の良否に影響を与えている要因解析においてもサンプリング周期の異なる変数間の関係がわからないこと、さらにサンプリング周期ごとに個々に多変量解析手法を適用しないといけないために煩雑であること、等の問題点があった。
【0038】
通常、バッチは複数の工程で処理されて最終製品に加工され、各バッチについて工程をまたがったデータを紐付けにより抽出できる仕組み(非特許文献1参照)ができているが、従来は、1バッチの、工程をまたがったデータをグラフに表示してその関連を見る等の、定性的な分析は行われているが、工程間の各変数等について異常や品質の良否に影響を与えている要因の因果関係等の解析を定量的に評価する方法については提案されていない。
【0039】
そこで本発明は、上記課題を解決するためになされたものであり、バッチ同士が互いに紐付けられ、サンプリング周期が異なる、又は、異なる工程にまたがったデータであってもそれらを一まとめにして統一的に扱い、サンプリング周期が異なる変数同士や工程をまたがる変数同士の相関を的確に調べることが可能なデータ解析装置およびそれを用いた異常検出/品質推定装置を提供することを目的とするものである。
【課題を解決するための手段】
【0040】
本発明のバッチプロセスデータの解析装置は、各バッチに関するサンプリング周期の異なる時系列データを、バッチ単位でまとめてプロセスデータのグループとして扱うバッチプロセスデータの解析装置であって、前記グループのそれぞれに対してデータアラインメント処理を行った後、各グループから、各バッチに紐付けされたバッチデータを抽出するバッチデータ抽出手段と、該バッチデータ抽出手段により抽出されたバッチデータから、各グループについてマルチウェイ手法により1次元化し、これをすべてのグループから抽出されたデータに対して行うグループデータ1次元化手段と、該グループデータ1次元化手段によりすべてのグループについて1次元化を行った後、該すべてのグループの1次元化されたこれらのデータを結合して全体として1次元データの配列とする全体1次元データ配列手段と、該全体1次元データ配列手段により得られた各バッチについての1次元データの各要素を「変数」,1次元データ(ベクトル)を1つの「サンプル」とする「変数」×「サンプル」の2次元化データを得るデータ2次元化手段と、該データ2次元化手段により得られた2次元データに対して多変量解析手法を適用して、解析処理を実行する多変量解析処理手段と、を備える。
【0041】
また本発明のバッチプロセスデータの解析装置は、各バッチに関する複数の工程のデータを、バッチ単位でまとめてプロセスデータのグループとして扱うバッチプロセスデータの解析装置であって、前記グループのそれぞれに対してデータアラインメント処理を行った後、各グループから、各バッチに紐付けされたバッチデータを抽出するバッチデータ抽出手段と、該バッチデータ抽出手段により抽出されたバッチデータから、各グループについてマルチウェイ手法により1次元化し、これをすべてのグループから抽出されたデータに対して行うグループデータ1次元化手段と、該グループデータ1次元化手段によりすべてのグループについて1次元化を行った後、該すべてのグループの1次元化されたこれらのデータを結合して全体として1次元データの配列とする全体1次元データ配列手段と、該全体1次元データ配列手段により得られた各バッチについての1次元データの各要素を「変数」,1次元データ(ベクトル)を1つの「サンプル」とする「変数」×「サンプル」の2次元化データを得るデータ2次元化手段と、該データ2次元化手段により得られた2次元データに対して多変量解析手法を適用して、解析処理を実行する多変量解析処理手段と、を備える。
【0042】
また本発明のバッチプロセスデータの異常検出装置は、上述したデータ解析装置を用いて異常検出モデルを生成しておき、新たに取得されたバッチプロセスデータに対して、データアラインメント処理,2次元化処理を行った上で前記異常検出モデルとの行列演算を行って、T2統計量およびQ統計量を出力し、これがあらかじめ設定したしきい値を超えるかを検出して異常検出を行う。
【0043】
また本発明のバッチプロセスデータの品質推定装置は、上述したデータ解析装置を用いて品質推定モデルを生成しておき、新たに取得されたバッチプロセスデータに対して、データアラインメント処理,2次元化処理を行った上で前記異常検出モデルとの行列演算を行って、品質データ推定値を出力して品質予測を行う。
【発明の効果】
【0044】
本発明によれば、複数のバッチに関するバッチプロセスデータについて、サンプリング周期が異なる、又は、異なる工程にまたがったデータであってもそれらを統一的に扱ってサンプリング周期が異なる変数同士や工程をまたがる変数同士の相関を的確に調べることができる。
【0045】
また本発明によれば、上述したバッチプロセスデータの解析装置を用いることで、サンプリング周期が異なる変数同士や工程をまたがる変数同士の相関を的確に調べることができるので、異常検出精度/品質予測精度の大幅な向上を図ることができる。
【発明を実施するための最良の形態】
【0046】
以下、本発明を実施するための最良の形態について図面を参照しながら説明する。
図1は、本発明の実施形態に係るバッチプロセスデータの解析装置およびそれを用いた異常検出/品質推定装置の構成概要を示すブロック図である。
【0047】
図1において本発明の実施形態に係るバッチプロセスデータの解析装置およびそれを用いた異常検出/品質推定装置は、データ収集手段2により収集したバッチプロセスデータ1をデータ格納手段3に格納する。データ格納手段3は品質データ4があればこれも格納して以降において品質予測のためのデータに供する。これらのデータはデータ格納手段3からモデル作成手段10に入力される。モデル作成手段10は、データ入力手段5、データ解析手段6及びデータ出力手段7から構成される。データ入力手段5に入力されたバッチプロセスデータ1や品質データ4は、データ入力手段5を経てデータ解析手段6に入力される。データ入力手段5は、データアラインメント処理を適宜行ってデータ解析手段6に出力する。データ解析手段6においては上述したマルチウェイ多変量解析手法の適用によりモデル化を行う。これについては後述する。
【0048】
データ解析手段6により解析された結果は「モデル」(係数行列)としてデータ出力手段(結果出力手段)7からモデル格納手段8に出力され、そこで結果出力が格納される。以上までの構成をもってバッチプロセスデータの解析装置を構成する。詳細は後述する。
【0049】
そしてデータ判定/予測手段9では、モデル格納手段8に格納された「モデル」(係数行列)と、データ収集手段2でオンラインによりデータ収集されたバッチプロセスデータ1とに基づいて演算を実施し、実施した演算結果に基づいてアラームや予測値を出力し、異常検出または品質推定を行う。したがって、上述したバッチプロセスデータの解析装置を用いてバッチプロセスデータの異常検出装置または品質推定装置を構成することになる。
【0050】
図2は、図1に示した本発明の実施形態に係るバッチプロセスデータの解析装置およびそれを用いた異常検出/品質推定装置の制御の流れおよびデータの流れを示すフロー図であり、異常検出に適用した場合の例を示すものである。図1と同じ構成要素には同一の番号を付けて説明する。なお、ここでは多変量解析として主成分分析(PCA)を用いる場合について説明する。
【0051】
データ収集手段2で収集したプラントデータ(バッチプロセスデータ)1をデータ格納手段(プラントデータデータベース)3に格納する。(異常検出)モデル作成手段10は、プラントデータデータベース3から、過去の複数のバッチで、各バッチについて紐付けされた複数のバッチプロセスデータのセット(以下「グループ」という)を読み込む(図5参照)。そしてデータアラインメント処理11,2次元化処理12,主成分分析による多変量解析処理13を実施して(異常検出)モデル(具体的には係数行列値としきい値)14を作成し、モデル格納手段(モデルデータベース)8に格納する。ここまでの制御の流れおよびデータの流れ(すなわち図2の左半)は、オフラインで実施され、本発明の実施形態に係るバッチプロセスデータの解析装置としての制御の流れおよびデータの流れである。
【0052】
モデル格納手段8に格納された当該モデル(係数行列値としきい値)を用いて異常検出を行う場合には、新たに取得されたプラントデータ(バッチプロセスデータ)1に対して、異常検出手段(図1のデータ判定/予測手段9に相当)20は、データアラインメント処理21,2次元化処理22を行った上でモデルである行列との演算を行列演算処理23にて実施し、上述したT2統計量やQ統計量を出力24して、これに基づいて異常検出を行う。つまり、モデル中に設定されたしきい値を超えた場合には「異常」と判定し、アラームなどを表示装置(図示せず)に表示する。ここまでの制御の流れおよびデータの流れ(すなわち図2の右半)は、オンラインで実施され、図2の左半に示された本発明の実施形態に係るバッチプロセスデータの解析装置を用いた異常検出処理を行う制御の流れおよびデータの流れである。
【0053】
T2統計量やQ統計量から異常検出を行うことについては、上述したように従来の主成分分析の説明においてすでに述べた。そしてしきい値の設定は、既存のデータからユーザが手動で行うか或いは上述したように各サンプルに対するT2統計量やQ統計量のそれぞれに対して例えばデータの95%が含まれる値をしきい値として自動的に行う。
【0054】
図3は、図1に示した本発明の実施形態に係るバッチプロセスデータの解析装置およびそれを用いた異常検出/品質推定装置の制御の流れおよびデータの流れを示すフロー図であり、品質推定に適用した場合の例を示すものである。図1と同じ構成要素には同一の番号を付けて説明する。なお、ここでは多変量解析として部分的最小二乗法(PLS)を用いる場合について説明する。
【0055】
データ収集手段2で収集したプラントデータ(バッチプロセスデータ)1をデータ格納手段(プラントデータデータベース)3に格納する。(品質推定)モデル作成手段10は、プラントデータデータベース3から、過去の複数のバッチで、各バッチについて紐付けされた複数のバッチプロセスデータのセット(「グループ」)ならびにそれぞれのバッチに対応する品質データ4を読み込む(図5,図11参照)。そしてデータアラインメント処理11,2次元化処理12,部分的最小二乗法による多変量解析処理13を実施して(品質推定)モデル(具体的には係数行列値)15を作成し、モデル格納手段(モデルデータベース)8に格納する。ここまでの制御の流れおよびデータの流れ(すなわち図3の左半)は、オフラインで実施され、本発明の実施形態に係るバッチプロセスデータの解析装置としての制御の流れおよびデータの流れである。
【0056】
モデル格納手段8に格納された当該モデル(係数行列値)を用いて品質推定を行う場合には、新たに取得されたプラントデータ(バッチプロセスデータ)1に対して、品質推定手段(図1のデータ判定/予測手段9に相当)30は、データアラインメント処理31,2次元化処理32を行った上でモデルである行列との演算を行列演算処理33にて実施して、品質データ推定値34を出力する。出力した品質データ推定値34を表示装置(図示せず)などに表示することができる。ここまでの制御の流れおよびデータの流れ(すなわち図3の右半)は、オンラインで実施され、図3の左半に示された本発明の実施形態に係るバッチプロセスデータの解析装置を用いた品質推定処理を行う制御の流れおよびデータの流れである。
【0057】
ここで図2及び図3の説明における「データアラインメント」および「2次元化処理」について、図4のフローチャートを用いながら説明する。図4の処理フローの説明開始にあたり、各グループに属する各バッチのデータは互いにそれぞれ紐付けられている同じバッチに関するデータ(図5参照)ではあるが、バッチに関して時系列の長さが揃っていない場合にすべてのバッチの時系列の長さを揃えるために「データアラインメント」を実行する(非特許文献5参照) 。この処理によりまずバッチの時系列の長さを揃える。
【0058】
このように各バッチプロセスデータのセット(グループ)に対して上記データアラインメント処理を行った後、各バッチについて以下の処理を行う。
バッチのループ処理(ステップS1)では、各グループから、各バッチに紐付けされたバッチデータを抽出する。
【0059】
次に各バッチのグループのループ処理(ステップS2)では、抽出されたバッチデータから各グループについて、ステップS3において図12に示したようなマルチウェイ手法により1次元化する。これをすべてのグループから抽出されたデータに対して行う。
【0060】
次いですべてのグループについて1次元化を行った後、ステップS4においてすべてのグループの1次元化されたこれらのデータを結合して全体として1次元データ(配列)とする(図6参照)。
【0061】
上記処理をすべてのバッチについて行う(図4のステップS1の終了)ことにより、各バッチについて1次元化されたデータができる(図7参照)。
こうして、各バッチについての1次元データの各要素を「変数」,1次元データ(ベクトル)を1つの「サンプル」とする「変数」×「サンプル」の2次元化処理を終了する。
【0062】
そして2次元化処理された2次元データに対して図2,図3に示したように、主成分分析や部分的最小二乗法などによる多変量解析手法を適用して、多変量解析処理を実行することができる。これが本発明の実施形態に係るバッチプロセスデータの解析装置の処理概要である。
【0063】
次に本発明の実施形態に係るバッチプロセスデータの解析装置の処理内容の詳細を説明する。いま図5に示すように、互いに紐付けられた複数のバッチデータについて同じバッチのサンプリング周期の異なる時系列の変数をまとめて変数のグループとする。なお、図5はバッチのインデクスi=2に係るバッチ同士について互いに紐付いている様子を例示している。
【0064】
これにより複数のサンプリング周期のそれぞれについて変数のグループができる。変数のg番目のグループ「グループg」について各データは以下のように4次元データとして表される。
【0065】
x4(i,g, j,k) (8)
ここで、g=1…G はグループ,i=1…Iはバッチ,j=1…Jgはバッチ内のグループ内の変数,k=1…Kgはバッチ内のグループ内の変数の時系列(時刻),のそれぞれのインデクスを表す。またバッチ数はグループ共通であるが、変数の数と時系列の長さ(サンプリング時刻点数)はグループごとに異なるためそれぞれJg,Kgと添え数gを付ける。
【0066】
次に上記式8で表された4次元データを、以下の図6,図7に示すようにして「サンプル」化して2次元データとすることで多変量解析手法を適用し、バッチについての異常検出や品質推定を行えるようにする。
【0067】
具体的には、各バッチiについて、各グループから各時刻の変数の組を1次元に並べたベクトルをまず作成する(図6の下部参照)。さらにこれをすべてのグループについて並べたベクトルを作成する。これが1つの「サンプル」となり、2次元データx2(i,m)と表される(図7の下部参照)。詳しく説明すると、上記mは、以下の式9のように表される。
【0068】
【数2】
逆にm(1≦m≦M)が与えられた場合、以下のようにしてg,j,kを得る。
【0069】
いま、上記したMを式10で表して、
【0070】
【数3】
m=1…Mについて、以下の式11を満たす整数をgとする。
【0071】
【数4】
次に、以下の式12の整数部分(式12を越えない最大の整数)を(k−1)とする。
【0072】
【数5】
上記した式9を式13のように変形して式13よりjを求める。
【0073】
【数6】
これを各iについて1次元とすることで、2次元データx2(i,m)を得る(図7参照)。ここでi=1…Iは「サンプル」,m=1…M(Mは式10で定義)は「変数」のそれぞれのインデクスである。
【0074】
上記した式9〜13により、g,j,kが一意に定まり、この(g,j,k)とmの間に1対1の対応が付けられる。これにより、各iを「サンプル」のインデクス,mを「変数」のインデクスとする2次元データx2(i,m)に対して多変量解析手法を適用する。この2次元データx2(i,m)に対して多変量解析手法を適用する手段として図1に示したデータ解析手段6を含むモデル作成手段10が設けられている。そしてモデル作成手段10の出力として、作成されたモデルをモデル格納手段8に格納し、モデル格納手段8に格納されたモデル、例えば上述した異常検出モデルと、オンラインでデータ収集した現実のバッチプロセスデータ1とで演算を実施し、データ判定/予測手段9において各バッチについての特徴量算出による異常検出を行う。
【0075】
また部分的最小二乗法等の品質推定手法を適用する場合には、上記した従来技術の場合と同様に、品質データ4をデータ格納手段3に格納しつつ、出力が(異なるサンプリング周期の)変数であった場合についてもこれを図1に示したモデル作成手段10により上記した方法で同じく2次元化することで部分的最小二乗法等を適用してモデル(品質推定モデル)を作成し、作成されたモデルをモデル格納手段8に格納し、このモデル(品質推定モデル)と、オンラインでデータ収集した現実のバッチプロセスデータ1とで演算を実施し、データ判定/予測手段9において各バッチについての特徴量算出による品質推定を行う。
【0076】
ところで複数のバッチについて各バッチの工程をまたがるデータを得た場合に、これらは各工程についてのバッチデータであり、それぞれ3次元データとして得られる。ここで各工程において複数の異なるサンプリング周期で取得されている変数があってもよい。
【0077】
これらは工程をまたがった場合や、同一工程内でも異なるサンプリング周期である場合でも、みなバッチに関連付け(紐付け) (図5参照)されており、サンプリング周期ごとにグルーピングし、グループごとに4次元データとして表すことができる。つまり共通のバッチiに対して各工程で得られたバッチデータをそれぞれ「グループ」として4次元データx4(i,g,j,k)として定義することができる。
【0078】
そして上述した式9〜13および図6,図7で説明した方法により2次元化し、この2次元データに対して上述したように主成分分析や部分的最小二乗法等による多変量解析手法を適用することができる。具体的には各工程で得られたバッチプロセスデータを図6,図7における各グループとし、これを図7におけるように2次元化データすることで上記の処理を行うことができる。またこれらの処理を実行する具体的構成は図1〜3に示したものを使用することができる。
【0079】
以上のように複数のバッチデータについて、これらのデータが工程をまたがった場合や、同一工程内でも異なるサンプリング周期である場合でも、みなバッチに関連付け(紐付け)されており、サンプリング周期ごとにグルーピングし、グループごとに3次元データとして表され、これが共通のバッチiに対して各工程で得られたバッチデータをそれぞれ「グループ」として4次元データx4(i,g,j,k)として定義されることから、複数のバッチデータを一まとめにして統合的に扱い、上述した式9〜13および図6,図7で説明した方法によりすべて「サンプル」×「変数」の2次元データに変換できる。そして「サンプル」×「変数」の2次元データに対して主成分分析、部分的最小二乗法、独立成分分析など各種の多変量解析手法をプラントにおけるバッチプロセスデータの性質に応じて適宜適用することができる。
【0080】
すなわち、「サンプル」×「変数」の2次元データに対して、主成分分析又は独立成分分析を適用すれば異常検出を、また部分的最小二乗法又は判別分析を適用すれば品質推定を行うことが可能で、これらをプラントにおけるバッチプロセスデータの性質に応じて適宜適用する。
【0081】
図8は、本発明手法を適用した場合の実例を示す図である。図8に示す実例においては、工程A60,工程B70の両方のデータを入力データとして取り込むことで、工程A60と工程B70のそれぞれだけを見ていたのではわからない、両工程間の相関を考慮した異常検出や品質推定を行うことができる。具体的には、工程A60のデータを、図5に示す、「グループ1」として、工程B70のデータを「グループ2」にとして適用すればよい。そして、本発明手法による異常検出装置での処理では、複数工程をまとめてマルチウェイ手法PCA(主成分分析)によるSPC(統計的プロセス管理)90を実施する。
【0082】
図9は、本発明手法を適用した場合の実例と従来手法を適用した場合の実例とを比較する図である。図9に示す従来手法を適用した場合の実例において、通常のバッチでは工程A560の圧力データの処理終了時付近は平坦であるが、たまに変動する場合がある。このような変動の結果として品質不良となる場合と、正常な製品ができる場合がある。一方で、工程B570の圧力データの処理終了時付近においても、通常は平坦であるが、たまに変動する場合がある。
【0083】
工程A560と工程B570のこれらの部分のデータは実は互いに関係があり、工程A560で変動した場合に工程B570でも変動していれば工程A560での影響が工程B570で打ち消されて異常(不良)でなくなることが確認されている。
【0084】
このような場合、従来手法では工程ごとにしか適用できないため、工程A560の処理終了時付近での変動または工程B570の処理終了時付近での変動があるバッチはすべて「異常(不良)」と判定されてしまう。
【0085】
しかし、実際には1つのバッチにおいて、工程A560の処理終了時付近での変動と工程B570の処理終了時付近での変動が両方起こった場合には良品が得られているのでこれを不良として扱うのは明らかに誤検出ということになり、著しく異常検出精度が劣化していることになる。
【0086】
一方、図9に示す本発明手法を適用した場合の実例においては、工程A60と工程B70の両方のデータを用いることで、工程をまたがったデータ間の相関を考慮することが簡単に可能となるため、異常検出精度や品質推定精度の大幅な向上を図ることができる。
【図面の簡単な説明】
【0087】
【図1】本発明の実施形態に係るバッチプロセスデータの解析装置およびそれを用いた異常検出/品質推定装置の構成概要を示すブロック図である。
【図2】図1に示した装置の制御の流れおよびデータの流れを示すフロー図である。
【図3】図1に示した装置の制御の流れおよびデータの流れを示すフロー図である。
【図4】図2及び図3に示した「2次元化処理」を説明するフロー図である。
【図5】互いに紐付けられた複数のバッチデータの関係を示す図である。
【図6】複数のグループの1次元化を説明する図である。
【図7】複数のバッチデータの2次元化を説明する図である。
【図8】本発明手法を適用した場合の実例を示す図である。
【図9】本発明手法を適用した場合の実例と従来手法を適用した場合の実例とを比較する図である。
【図10】従来の一般的なプラントによる製品製造システムにおける製造データ管理システムの構成概要を示す図である。
【図11】従来の或る製品(食品)の製造工程を示す図である。
【図12】従来のマルチウェイ手法を説明する図である。
【図13】従来のマルチウェイ多変量解析手法を用いた異常検出例を示す図である。
【符号の説明】
【0088】
1 バッチプロセスデータ(プラントデータ)
2 データ収集手段
3 データ格納手段(プラントデータDB)
4 品質データ
5 データ入力手段
6 データ解析手段
7 データ出力手段
8 モデル格納手段(モデルDB)
9 データ判定/予測手段
10 モデル作成手段
11,21,31 データアラインメント部
12,22,32 2次元処理部
13 多変量解析処理部
14 異常検出モデル
15 品質推定モデル
20 異常検出手段
23,33 行列演算処理部
24 出力(T2/Q)
30 品質推定手段
34 品質データ推定値
60 工程A
70 工程B
80 プラントデータDB(データベース)
90 本発明手法によるSPC(統計的プロセス管理)
【特許請求の範囲】
【請求項1】
各バッチに関するサンプリング周期の異なる時系列データを、バッチ単位でまとめてプロセスデータのグループとして扱うバッチプロセスデータの解析装置であって、
前記グループのそれぞれに対してデータアラインメント処理を行った後、各グループから、各バッチに紐付けされたバッチデータを抽出するバッチデータ抽出手段と、
該バッチデータ抽出手段により抽出されたバッチデータから、各グループについてマルチウェイ手法により1次元化し、これをすべてのグループから抽出されたデータに対して行うグループデータ1次元化手段と、
該グループデータ1次元化手段によりすべてのグループについて1次元化を行った後、該すべてのグループの1次元化されたこれらのデータを結合して全体として1次元データの配列とする全体1次元データ配列手段と、
該全体1次元データ配列手段により得られた各バッチについての1次元データの各要素を「変数」,1次元データ(ベクトル)を1つの「サンプル」とする「変数」×「サンプル」の2次元化データを得るデータ2次元化手段と、
該データ2次元化手段により得られた2次元データに対して多変量解析手法を適用して、解析処理を実行する多変量解析処理手段と、
を備えることを特徴とするバッチプロセスデータの解析装置。
【請求項2】
各バッチに関する複数の工程のデータを、バッチ単位でまとめてプロセスデータのグループとして扱うバッチプロセスデータの解析装置であって、
前記グループのそれぞれに対してデータアラインメント処理を行った後、各グループから、各バッチに紐付けされたバッチデータを抽出するバッチデータ抽出手段と、
該バッチデータ抽出手段により抽出されたバッチデータから、各グループについてマルチウェイ手法により1次元化し、これをすべてのグループから抽出されたデータに対して行うグループデータ1次元化手段と、
該グループデータ1次元化手段によりすべてのグループについて1次元化を行った後、該すべてのグループの1次元化されたこれらのデータを結合して全体として1次元データの配列とする全体1次元データ配列手段と、
該全体1次元データ配列手段により得られた各バッチについての1次元データの各要素を「変数」,1次元データ(ベクトル)を1つの「サンプル」とする「変数」×「サンプル」の2次元化データを得るデータ2次元化手段と、
該データ2次元化手段により得られた2次元データに対して多変量解析手法を適用して、解析処理を実行する多変量解析処理手段と、
を備えることを特徴とするバッチプロセスデータの解析装置。
【請求項3】
前記多変量解析処理手段として、主成分分析、独立成分分析、部分的最小二乗法、判別分析のいずれか一つを用いる請求項1または2記載のバッチプロセスデータの解析装置。
【請求項4】
請求項1または2記載のデータ解析装置を用いて異常検出モデルを生成しておき、新たに取得されたバッチプロセスデータに対して、データアラインメント処理,2次元化処理を行った上で前記異常検出モデルとの行列演算を行って、T2統計量およびQ統計量を出力し、これがあらかじめ設定したしきい値を超えるかを検出して異常検出を行うバッチプロセスデータの異常検出装置。
【請求項5】
前記異常検出モデルを生成する際、前記請求項1または2記載のデータ解析装置は前記多変量解析処理手段として、主成分分析又は独立成分分析のいずれか一つを用いることを特徴とする請求項4記載のバッチプロセスデータの異常検出装置。
【請求項6】
請求項1または2記載のデータ解析装置を用いて品質推定モデルを生成しておき、新たに取得されたバッチプロセスデータに対して、データアラインメント処理,2次元化処理を行った上で前記異常検出モデルとの行列演算を行って、品質データ推定値を出力して品質予測を行うバッチプロセスデータの品質推定装置。
【請求項7】
前記品質推定モデルを生成する際、前記請求項1または2記載のデータ解析装置は前記多変量解析処理手段として、部分的最小二乗法又は判別分析のいずれか一つを用いることを特徴とする請求項6記載のバッチプロセスデータの品質推定装置。
【請求項1】
各バッチに関するサンプリング周期の異なる時系列データを、バッチ単位でまとめてプロセスデータのグループとして扱うバッチプロセスデータの解析装置であって、
前記グループのそれぞれに対してデータアラインメント処理を行った後、各グループから、各バッチに紐付けされたバッチデータを抽出するバッチデータ抽出手段と、
該バッチデータ抽出手段により抽出されたバッチデータから、各グループについてマルチウェイ手法により1次元化し、これをすべてのグループから抽出されたデータに対して行うグループデータ1次元化手段と、
該グループデータ1次元化手段によりすべてのグループについて1次元化を行った後、該すべてのグループの1次元化されたこれらのデータを結合して全体として1次元データの配列とする全体1次元データ配列手段と、
該全体1次元データ配列手段により得られた各バッチについての1次元データの各要素を「変数」,1次元データ(ベクトル)を1つの「サンプル」とする「変数」×「サンプル」の2次元化データを得るデータ2次元化手段と、
該データ2次元化手段により得られた2次元データに対して多変量解析手法を適用して、解析処理を実行する多変量解析処理手段と、
を備えることを特徴とするバッチプロセスデータの解析装置。
【請求項2】
各バッチに関する複数の工程のデータを、バッチ単位でまとめてプロセスデータのグループとして扱うバッチプロセスデータの解析装置であって、
前記グループのそれぞれに対してデータアラインメント処理を行った後、各グループから、各バッチに紐付けされたバッチデータを抽出するバッチデータ抽出手段と、
該バッチデータ抽出手段により抽出されたバッチデータから、各グループについてマルチウェイ手法により1次元化し、これをすべてのグループから抽出されたデータに対して行うグループデータ1次元化手段と、
該グループデータ1次元化手段によりすべてのグループについて1次元化を行った後、該すべてのグループの1次元化されたこれらのデータを結合して全体として1次元データの配列とする全体1次元データ配列手段と、
該全体1次元データ配列手段により得られた各バッチについての1次元データの各要素を「変数」,1次元データ(ベクトル)を1つの「サンプル」とする「変数」×「サンプル」の2次元化データを得るデータ2次元化手段と、
該データ2次元化手段により得られた2次元データに対して多変量解析手法を適用して、解析処理を実行する多変量解析処理手段と、
を備えることを特徴とするバッチプロセスデータの解析装置。
【請求項3】
前記多変量解析処理手段として、主成分分析、独立成分分析、部分的最小二乗法、判別分析のいずれか一つを用いる請求項1または2記載のバッチプロセスデータの解析装置。
【請求項4】
請求項1または2記載のデータ解析装置を用いて異常検出モデルを生成しておき、新たに取得されたバッチプロセスデータに対して、データアラインメント処理,2次元化処理を行った上で前記異常検出モデルとの行列演算を行って、T2統計量およびQ統計量を出力し、これがあらかじめ設定したしきい値を超えるかを検出して異常検出を行うバッチプロセスデータの異常検出装置。
【請求項5】
前記異常検出モデルを生成する際、前記請求項1または2記載のデータ解析装置は前記多変量解析処理手段として、主成分分析又は独立成分分析のいずれか一つを用いることを特徴とする請求項4記載のバッチプロセスデータの異常検出装置。
【請求項6】
請求項1または2記載のデータ解析装置を用いて品質推定モデルを生成しておき、新たに取得されたバッチプロセスデータに対して、データアラインメント処理,2次元化処理を行った上で前記異常検出モデルとの行列演算を行って、品質データ推定値を出力して品質予測を行うバッチプロセスデータの品質推定装置。
【請求項7】
前記品質推定モデルを生成する際、前記請求項1または2記載のデータ解析装置は前記多変量解析処理手段として、部分的最小二乗法又は判別分析のいずれか一つを用いることを特徴とする請求項6記載のバッチプロセスデータの品質推定装置。
【図1】
【図4】
【図5】
【図12】
【図2】
【図3】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図13】
【図4】
【図5】
【図12】
【図2】
【図3】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図13】
【公開番号】特開2009−187175(P2009−187175A)
【公開日】平成21年8月20日(2009.8.20)
【国際特許分類】
【出願番号】特願2008−24983(P2008−24983)
【出願日】平成20年2月5日(2008.2.5)
【出願人】(591083244)富士電機システムズ株式会社 (1,717)
【Fターム(参考)】
【公開日】平成21年8月20日(2009.8.20)
【国際特許分類】
【出願日】平成20年2月5日(2008.2.5)
【出願人】(591083244)富士電機システムズ株式会社 (1,717)
【Fターム(参考)】
[ Back to top ]