バッチプロセスデータの解析装置およびそれを用いた異常検出／品質推定装置

【課題】バッチ同士が互いに紐付けられ、サンプリング周期が異なる、又は、異なる工程にまたがったデータであってもそれらを一まとめにして統一的に扱い、サンプリング周期が異なる変数同士や工程をまたがる変数同士の相関を的確に調べることが可能なデータ解析装置を提供する。
【解決手段】バッチプロセスデータ１や品質データ４はデータ格納手段３からモデル作成手段１０に入力される。入力されたバッチプロセスデータ１や品質データ４は、データ入力手段５を経てデータ解析手段６に入力される。データ解析手段６においてはマルチウェイ多変量解析手法の適用によりモデル化を行う。データ判定／予測手段９では、モデル格納手段８に格納された「モデル」（係数行列）と、データ収集手段２でオンラインによりデータ収集されたバッチプロセスデータ１とに基づいて演算を実施し、実施した演算結果に基づいてアラームや予測値を出力し、異常検出または品質推定を行う。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、バッチプロセスデータの解析装置およびそれを用いた異常検出／品質推定装置に関するものである。
【背景技術】
【０００２】
図１０は、従来の一般的なプラントによる製品製造システムにおける製造データ管理システムの構成概要を示す図である。例えば食品プラント等においては、タンクの温度，圧力，流量等を計測するためにセンサ等が設置され、センサ等で計測された情報をコントローラ500、ネットワーク510を介してDCS(Distributed Control System)（分散制御システム）520に送信して制御に供している。またDCS520の上位階層にはそれらのセンサ情報等の操業データや品質データを取得して格納し操業実績の管理を行ったり、生産計画の立案を行ったりするMES(Manufacturing Execution System)（製造実行システム）530が設けられている。MES530においてはバッチ・ロット（以下では、単に‘バッチ’ともいう）ごとにどの装置を経由したかやその経由時刻等を管理しており、これにより工程をまたぐバッチの紐付けを行っている（非特許文献１参照）。
【０００３】
品質データが取得される場合、プラントの種類にもよるが、分析設備を備えたいわゆる「ラボ」と呼ばれる施設に持ち込んで微生物数の計測による品質の計測540や分析計を使用した濃度計測550による検査が行われる場合が多い。「ラボ」における品質の計測や検査は時間やコストがかかる場合が多いこともあり、一部の抜取り検査しか行われないのが通常である。
【０００４】
図１１は、従来の或る製品（食品）の製造工程を示す図である。この製造工程は複数の工程からなり、その中で２つの工程、例として「工程Ａ」560，「工程Ｂ」570、を選んで詳しく説明する。図１１に示す製造工程では「バッチ」単位で製品が製造処理されているものとする。すなわち１つのバッチが図１１に示される各工程に投入され、当該工程での処理・加工完了後、その結果（中間製品）が出力される。出力された中間製品はまた同じバッチ単位で次工程に投入され、これを各工程につき繰り返す。
【０００５】
工程Ａ560においては、その前工程で製造された中間製品に対してタンク内にて例えば１時間程度処理加工が行われる。次に工程Ａ560の製造結果である中間製品は工程Ｂ570に投入される。工程Ｂ570においてはまた別のタンクにおいて例えば２時間程度の別の処理加工が行われる。工程Ａ560，工程Ｂ570それぞれにおける処理加工時間は中間製品の処理量等によって定まる。工程Ａ560，工程Ｂ570のいずれでも使用されるタンクには温度センサ，圧力センサが設置されており、それぞれの工程での各バッチの処理加工時間中の温度，圧力が一定のサンプリング周期で計測され、その計測データはデータベース580に格納される。また工程Ａ560，工程Ｂ570の結果として得られる中間製品における微生物数も計測され、当該中間製品を評価する要素として同様にデータベース580に格納される。また、あるバッチ（バッチ１とする）を図１１に示す製造工程に流した場合の、工程Ａ560と工程Ｂ570の温度ならびに圧力データも図１１に示している。これらの温度ならびに圧力データを「バッチプロセスデータ」という。当該バッチについて品質データを得るために計測される微生物数の計測もここでは１箇所だけ示されている。
【０００６】
多数のバッチ（バッチ１〜Ｎ）の工程Ａ560，工程Ｂ570の温度・圧力計測値時系列データと、品質データとしての微生物数計測値とが得られ、その微生物数計測値から中間製品の良・不良（正常・異常）を判定している。ただし、微生物数の計測には時間がかかるため、異常・正常の判定にも時間がかかることになる。そこで、従来より実際に微生物数を計測する前に工程Ａ560，工程Ｂ570での温度や圧力の計測データからそのバッチの中間製品の正常・異常を判定（検出）するような装置（システム）が活用されている。このような装置（システム）のことをここでは「異常検出装置」と呼ぶことにしている。
【０００７】
上記したプラントに関するいわゆる連続系のデータに対して主成分分析(Principal Component Analysis：PCA)や部分的最小二乗法(Partial Least Squares：PLS)等の多変量解析手法を適用して異常検出や品質推定を行うことは従来から行われている（非特許文献２参照）。
【０００８】
連続系のデータとは、一定の変数の組（例えば、温度，圧力などの組）について一定のタイミングで収集したデータを１組のサンプルとし、それが複数集められた「変数」×「サンプル」の２次元データの構造をしている。一般にサンプルの収集タイミングはすべての変数について同時刻であることが多いが、一部の変数については一定時間の時間差を持った（遅れた）時間を用いる場合もありうる。なお、一般に収集タイミングは等間隔（サンプリング周期）である必要はなく、各サンプルが揃っていればよい。
【０００９】
以下では、主成分分析(PCA)による多変量解析を例に従来の解析手順(モデル作成)について説明する。なお、ｘ，ｙは、一般的に計測データを平均値０，標準偏差１に規格化（標準化）後のデータである。元の２次元データをXとすると、２次元データXは、２次元の行列式で表され、行列の各要素X(i,j)について、iがサンプル番号，jが変数番号を表すものとすると、主成分分析(PCA)により、元のデータXは以下の式１のように表される。
【００１０】
X = T* P^T+ E （１）
ここでTは主成分スコア，Pはローディング(負荷量)行列，Eはモデル化誤差行列であり、またPの右肩のTは行列の転置を表している。また主成分スコアTは元の変数Xを、その中で互いに相関のある変数同士にまとめ、より少ない数の「主成分」として集約したものであり、主成分スコアTは以下の式２のようにして求められる。
【００１１】
T = X* P （２）
このようにして、元の変数は行列Pを用いて主成分に集約することができる。行列P自体を一般に「異常検出モデル」と呼んでいる。
【００１２】
主成分スコアTは集約された主成分であって、詳細にはデータ行列Xの各サンプル（Xの各行）に対応する横ベクトルx_kから計算される主成分のベクトル（主成分スコアベクトル）t_k（横ベクトル）はt_k= x_k Pにより計算される。
【００１３】
主成分ベクトルt_k (横ベクトル)を用いて、データ行列Xの各サンプルx_kに対するT²統計量（T²値）は以下のように計算される。
Xの特異値をs_i（i=1…N，NはPの列数）、t_kはN次元の横ベクトルなのでそのi番目の要素をt_k,iとして、
【００１４】
【数１】

またx_kに対するQ統計量（Q値）については，x_kから以下により計算される。なおＱ統計量は元のデータｘにおける変数間の相関に対してどれだけ外れているかを表すものである。
【００１５】
Q=x_k(I-PP^T)(I-PP^T)^Tx_k^T （４）
T²統計量やQ統計量は必ず正の値をとるが、正常（通常）時は一定の範囲内に収まっているものの異常時には大きな値をとることが多い。したがって、既存のデータ行列Xから計算された各サンプル（Xの各行に対応）に対するT²統計量やQ統計量をユーザが見て正常と異常の境界となるしきい値を定め、ｘ（既知の計測データ）や新しい計測データ（後述のｘ_ｎｅｗ）について、T²統計量やQ統計量がこのしきい値を超えた値をとった場合に異常と判定する（T²統計量やQ統計量については非特許文献２参照）。この定め方としては、Xから算出されたXの各サンプルに対するT²統計量やQ統計量のそれぞれに対して例えばデータの９５％が含まれる値等を自動的に設定することもできる。
【００１６】
また、ここでXは過去のデータの蓄積を想定しており、Pはそこから計算された行列であるが、これに対して新しいデータ（Xの列の数（横の長さ）と同じ長さの横ベクトル）x_newに対して行列Pを用いて、t_new = x_new Pを計算すると t_new は x_newに対してこれを集約した主成分を表す。
【００１７】
x_new，t_newから計算される、x_newに対するT²統計量やQ統計量は、x_new が過去のデータ群Xからどれだけ離れているかを示すため、この値が大きければ異常なデータと判定することで異常検出を行うことができる。
【００１８】
またQ統計量の計算過程で得られるベクトルx_new(I-PP^T) は、「寄与プロット」を表している。これはこのベクトルの各要素が、元のベクトルx_newの対応する要素の「異常の度合い」（通常時からどれくらい離れているか）を表しており、これを用いて異常に影響を与えている要因となる入力データを特定することも可能である。
【００１９】
独立成分分析(Independent Component Analysis：ＩＣＡ)は、近年研究が進められてきた新しい多変量解析手法であるが、主成分分析(PCA)と同様に独立成分分析(ICA)も異常検出に適用できるものである（非特許文献４参照）。このようにプラントプロセス計測データの統計量とその上下限を用いたプロセス異常の検出等の管理を統計的プロセス管理（ＳＰＣ）と云い、特に当該例のように多変量解析による統計的プロセス管理が用いられるようになってきている。
【００２０】
Xの各サンプル（行）ｘに対して、これに対応する品質データがあれば、それを縦に並べた縦ベクトルyとし、部分的最小二乗法を適用してｘとyを以下のようにして誤差Eを最小化するように関係付ける行列P,Q,Wを得ることができる（非特許文献３参照）。
【００２１】
Y = XW(P^TW)^-1Q + E （５）
（ここでEは、誤差ベクトルを表す）
部分的最小二乗法(Partial Least Squares：PLS)は、入力データXの各変数間に多重共線性(Multi-co-linearity)があっても安定なモデルを作ることができる有力な手法として知られている。
【００２２】
これらの行列により、新しいデータx_newが得られれば、これに対応する品質データの推定値y_eは以下のようにして得られることになる。
y_e = x_new W(P^TW)^-1Q （６）
（ここでy_eは、x_newに対する品質データ推定値）
上記式６に基づいて品質推定を行うことができる。
【００２３】
また、判別分析(Discriminant Analysis)は、品質変数yとして例えば良・不良や○・×のように２値として表される場合に、入力データXから出力データyを推定するモデルを作成する手法として知られている。
【００２４】
以上の説明は、もっぱら「サンプル」×「変数」の２次元データに対する主成分分析(PCA)による多変量解析手法についてのものであったが、バッチプロセスデータに対して多変量解析手法を適用してバッチ・ロットの異常検出や品質推定を行うことも知られている（特許文献１参照）。バッチ・ロットのデータは、複数のバッチの各々について複数の変数があり、さらに各変数について時系列データが含まれるためデータの構造としては、「バッチ」×「変数」×「時刻」の３次元データとなる。
【００２５】
一般に主成分分析(PCA)や部分的最小二乗法(PLS)等の多変量解析手法は、「変数」×「サンプル」の２次元データに対して基本的に適用する手法である。そのためバッチ・ロットのデータのような３次元データに対して多変量解析手法を適用する場合には、従来では「マルチウェイ手法」（図１２参照）と呼ばれる方法を用いている。これはバッチ・ロットのような３次元データについて各バッチにおける「変数」×「時刻」を１次元に並べ直した後にこれらのデータ全体を新たに１組の「サンプル」とし、１組の「サンプル」に含まれる変数全体を「変数」として、「変数」×「サンプル」の２次元データにした後で多変量解析手法を適用する方法である。
【００２６】
図１２は、従来のマルチウェイ手法を説明する図である。図１２に示すように、バッチプロセスの３次元データは以下のように表される。
x3(i,j,k) （７）
ここでi=1…Iはバッチ， j=1…Jはバッチ内の変数， k=1…Kはバッチ内の変数の時系列(時間)のそれぞれのインデクスを表す。
【００２７】
なお、一般にバッチプロセスにおいては、すべてのバッチについて時系列の長さが揃っているとは限らない。そこで非特許文献５に示されるように「データ長調整（length adjustment）」または「データアラインメント（data alignment）」と呼ばれる手法を用いてすべてのバッチの時系列の長さを揃える処理が行われている。
【００２８】
バッチの時系列長を揃えた後の３次元データx3(i,j,k)（バッチ内の時刻k，変数番号j，バッチ番号i）に対し、３次元データx3(i,j,k)を２次元化する手順を以下に説明する。
図１２左部に示すバッチプロセスデータの１つのバッチiに着目して、３次元データ：x3(i,j,k)の各時間Kの変数Jの組を１次元に並べなおす（図１２下部に示す２次元データの最上部から順に下方参照）。並べなおした結果をx2(i,l)とすると、i=1…I，l = j + (k-1)*Jまたはl = k + (j-1)*Kとなる。ここで、l=1…Lと表すと、L=J*Kと表すことができる。
【００２９】
l = j + (k-1)*Jとする場合には、l（1≦l≦L）に対して、l/Jの整数部分（l/Jを越えない最大の整数）をk-1、l−(k-1)*Jをjとする。またl = k + (j-1)*Kとする場合には、l（1≦l≦L）に対して、l/Kの整数部分（l/Kを越えない最大の整数）をj-1、l−(j-1)*Kをkとする。これによりlと(j,k)との間に１対１の対応が付けられる。
【００３０】
各バッチに対して、すなわち、バッチi=1…Iに対して上述した１次元に並べなおす手順を実行して「サンプル」を生成する（図１２下部参照）。これにより、x2(i,l)は、iを「サンプル」のインデクス、lを「変数」のインデクスとする、２次元データになる。
【００３１】
上述した主成分分析(PCA)は、（入力）データのみから特徴量の算出モデルを作成するために用いられ、この手法を用いて上記２次元データx2(i,l)から特徴量の算出モデルを算出することになる。（つまり上に述べた主成分分析とそれから計算されるT²統計量やQ統計量を用いて異常検出を行うことができる。）
一方、部分的最小二乗法(PLS)は、入力データから出力データの推定モデルを作成するために用いられ、この手法を用いる場合に一般に入力データは上記のような３次元データであるが出力データはもともとバッチに対して１つ定まる１次元または２次元データである場合が多い。具体的には、１バッチについての品質データが１種類の場合は１次元データ、１バッチについての品質データが２種類以上（例えば、微生物数と濃度）の場合は２次元データとなる。上記のようにして２次元化した入力データと出力データとに基づいて部分的最小二乗法による推定モデルすなわち出力データの推定モデルを得ることができる。また出力データが３次元データである場合にはこれを上記した方法と同様に２次元化して部分的最小二乗法を適用することで出力データの推定モデルを得ることができる。
【００３２】
このように３次元データを２次元データに変換した上で主成分分析(PCA)や部分的最小二乗法(PLS)等の多変量解析手法を適用する方法は「マルチウェイ主成分分析」「マルチウェイ部分的最小二乗法」等（以下、マルチウェイ多変量解析手法）と呼ばれて、当該技術分野の技術者には知られているものである。
【００３３】
図１３は、従来のマルチウェイ多変量解析手法を用いた異常検出例を示す図である。このマルチウェイ多変量解析による従来手法においては、１つの工程内の共通のサンプリング周期のデータのみに対して適用可能であった。すなわち、図１３に示すように工程Ａ560のみ、または工程Ｂ570のみのデータを対象にして、マルチウェイ主成分分析(PCA)によりQ統計量やT²統計量等の指標を算出して統計的プロセス管理手法(Statistical Process Control：SPC)590を適用して異常検出を行っていたが、工程Ａ560，工程Ｂ570の両者の相関（例えば「工程Ａ560での製造条件（温度や圧力）の製品品質への影響」と「工程Ｂ570での製造条件（温度や圧力）の製品品質への影響」の間における）がある場合などについては考慮されておらず、両者に相関がある場合、それを考慮した管理（異常検出）ができなかった。
【特許文献１】特開平10-228312号公報
【非特許文献１】東谷直紀、中村光広「バッチプロセス向けトレーサビリティ支援システム」計装、Vol.7, No.7、 pp81-84 、2004
【非特許文献２】加納学「プロセスケモメトリクスによる統計的プロセス管理」システム／制御／情報、Vol. 7, No. 13、 pp.1- 6、 1996
【非特許文献３】宮下，佐々木「ケモメトリックス化学パターン認識と多変量解析」コンピュータ・ケミストリーシリーズ３共立出版 1995
【非特許文献４】村田昇入門「独立成分分析」東京電機大学出版局 2004
【非特許文献５】「Comparison of Methods for Handling Unequal Length Batches」IFAC DYCOPS-5 ，1998，pp.66-71，
【発明の開示】
【発明が解決しようとする課題】
【００３４】
図１３に示す従来手法のように、単一工程内の製造条件と製品品質への影響だけを考慮するのでは不十分であり、これに基づいた異常検出や品質推定ではその精度が落ちる可能性が高いということが近年になってわかってきた。
【００３５】
また従来、マルチウェイ多変量解析手法において扱われるバッチプロセスデータの各バッチ内の変数の時系列データを得るための各サンプル（上記の１バッチを１「サンプル」とする「サンプル」ではなく時系列の各サンプル）は、等間隔（サンプリング周期）で収集されている必要があった。しかしバッチプロセスですべての変数のデータが同一サンプリング周期で収集されているとは限らず、一般的には変数の特性によって異なるサンプリング周期で収集されているものや、各種「イベント」に関連したデータや、バッチの処理量、バッチを処理した設備等の属性等、バッチに対して１つだけ得られる（定まる）データもある。
【００３６】
さらにプロセスデータの異常検出や品質推定等においては、できるだけ多くの情報から異常検出や品質推定を行い、そして異常や品質の良否に影響を与えている要因を解析・抽出したいという要求がある。多くの情報に基づいてプロセスデータを総合的に解析することで幅広い範囲の変数間の相関（相互関係）がわかり、それを元に異常検出や品質推定を行うことで異常検出や品質推定の精度を向上させられる可能性がある。
【００３７】
また同じサンプリング周期の変数をグルーピングしてそれぞれのグループ内で個別に多変量解析手法を適用しても、それぞれのグループ内で個別に扱う範囲の変数のみによる異常検出や品質推定になってしまうため、異常検出や品質推定の精度が低くなり、またそれぞれのグループ内で個別に扱う範囲の異常や品質の良否に影響を与えている要因解析においてもサンプリング周期の異なる変数間の関係がわからないこと、さらにサンプリング周期ごとに個々に多変量解析手法を適用しないといけないために煩雑であること、等の問題点があった。
【００３８】
通常、バッチは複数の工程で処理されて最終製品に加工され、各バッチについて工程をまたがったデータを紐付けにより抽出できる仕組み（非特許文献１参照）ができているが、従来は、１バッチの、工程をまたがったデータをグラフに表示してその関連を見る等の、定性的な分析は行われているが、工程間の各変数等について異常や品質の良否に影響を与えている要因の因果関係等の解析を定量的に評価する方法については提案されていない。
【００３９】
そこで本発明は、上記課題を解決するためになされたものであり、バッチ同士が互いに紐付けられ、サンプリング周期が異なる、又は、異なる工程にまたがったデータであってもそれらを一まとめにして統一的に扱い、サンプリング周期が異なる変数同士や工程をまたがる変数同士の相関を的確に調べることが可能なデータ解析装置およびそれを用いた異常検出／品質推定装置を提供することを目的とするものである。
【課題を解決するための手段】
【００４０】
本発明のバッチプロセスデータの解析装置は、各バッチに関するサンプリング周期の異なる時系列データを、バッチ単位でまとめてプロセスデータのグループとして扱うバッチプロセスデータの解析装置であって、前記グループのそれぞれに対してデータアラインメント処理を行った後、各グループから、各バッチに紐付けされたバッチデータを抽出するバッチデータ抽出手段と、該バッチデータ抽出手段により抽出されたバッチデータから、各グループについてマルチウェイ手法により１次元化し、これをすべてのグループから抽出されたデータに対して行うグループデータ１次元化手段と、該グループデータ１次元化手段によりすべてのグループについて１次元化を行った後、該すべてのグループの１次元化されたこれらのデータを結合して全体として１次元データの配列とする全体１次元データ配列手段と、該全体１次元データ配列手段により得られた各バッチについての１次元データの各要素を「変数」，１次元データ（ベクトル）を１つの「サンプル」とする「変数」×「サンプル」の２次元化データを得るデータ２次元化手段と、該データ２次元化手段により得られた２次元データに対して多変量解析手法を適用して、解析処理を実行する多変量解析処理手段と、を備える。
【００４１】
また本発明のバッチプロセスデータの解析装置は、各バッチに関する複数の工程のデータを、バッチ単位でまとめてプロセスデータのグループとして扱うバッチプロセスデータの解析装置であって、前記グループのそれぞれに対してデータアラインメント処理を行った後、各グループから、各バッチに紐付けされたバッチデータを抽出するバッチデータ抽出手段と、該バッチデータ抽出手段により抽出されたバッチデータから、各グループについてマルチウェイ手法により１次元化し、これをすべてのグループから抽出されたデータに対して行うグループデータ１次元化手段と、該グループデータ１次元化手段によりすべてのグループについて１次元化を行った後、該すべてのグループの１次元化されたこれらのデータを結合して全体として１次元データの配列とする全体１次元データ配列手段と、該全体１次元データ配列手段により得られた各バッチについての１次元データの各要素を「変数」，１次元データ（ベクトル）を１つの「サンプル」とする「変数」×「サンプル」の２次元化データを得るデータ２次元化手段と、該データ２次元化手段により得られた２次元データに対して多変量解析手法を適用して、解析処理を実行する多変量解析処理手段と、を備える。
【００４２】
また本発明のバッチプロセスデータの異常検出装置は、上述したデータ解析装置を用いて異常検出モデルを生成しておき、新たに取得されたバッチプロセスデータに対して、データアラインメント処理，２次元化処理を行った上で前記異常検出モデルとの行列演算を行って、T²統計量およびQ統計量を出力し、これがあらかじめ設定したしきい値を超えるかを検出して異常検出を行う。
【００４３】
また本発明のバッチプロセスデータの品質推定装置は、上述したデータ解析装置を用いて品質推定モデルを生成しておき、新たに取得されたバッチプロセスデータに対して、データアラインメント処理，２次元化処理を行った上で前記異常検出モデルとの行列演算を行って、品質データ推定値を出力して品質予測を行う。
【発明の効果】
【００４４】
本発明によれば、複数のバッチに関するバッチプロセスデータについて、サンプリング周期が異なる、又は、異なる工程にまたがったデータであってもそれらを統一的に扱ってサンプリング周期が異なる変数同士や工程をまたがる変数同士の相関を的確に調べることができる。
【００４５】
また本発明によれば、上述したバッチプロセスデータの解析装置を用いることで、サンプリング周期が異なる変数同士や工程をまたがる変数同士の相関を的確に調べることができるので、異常検出精度／品質予測精度の大幅な向上を図ることができる。
【発明を実施するための最良の形態】
【００４６】
以下、本発明を実施するための最良の形態について図面を参照しながら説明する。
図１は、本発明の実施形態に係るバッチプロセスデータの解析装置およびそれを用いた異常検出／品質推定装置の構成概要を示すブロック図である。
【００４７】
図１において本発明の実施形態に係るバッチプロセスデータの解析装置およびそれを用いた異常検出／品質推定装置は、データ収集手段２により収集したバッチプロセスデータ１をデータ格納手段３に格納する。データ格納手段３は品質データ４があればこれも格納して以降において品質予測のためのデータに供する。これらのデータはデータ格納手段３からモデル作成手段１０に入力される。モデル作成手段１０は、データ入力手段５、データ解析手段６及びデータ出力手段７から構成される。データ入力手段５に入力されたバッチプロセスデータ１や品質データ４は、データ入力手段５を経てデータ解析手段６に入力される。データ入力手段５は、データアラインメント処理を適宜行ってデータ解析手段６に出力する。データ解析手段６においては上述したマルチウェイ多変量解析手法の適用によりモデル化を行う。これについては後述する。
【００４８】
データ解析手段６により解析された結果は「モデル」（係数行列）としてデータ出力手段（結果出力手段）７からモデル格納手段８に出力され、そこで結果出力が格納される。以上までの構成をもってバッチプロセスデータの解析装置を構成する。詳細は後述する。
【００４９】
そしてデータ判定／予測手段９では、モデル格納手段８に格納された「モデル」（係数行列）と、データ収集手段２でオンラインによりデータ収集されたバッチプロセスデータ１とに基づいて演算を実施し、実施した演算結果に基づいてアラームや予測値を出力し、異常検出または品質推定を行う。したがって、上述したバッチプロセスデータの解析装置を用いてバッチプロセスデータの異常検出装置または品質推定装置を構成することになる。
【００５０】
図２は、図１に示した本発明の実施形態に係るバッチプロセスデータの解析装置およびそれを用いた異常検出／品質推定装置の制御の流れおよびデータの流れを示すフロー図であり、異常検出に適用した場合の例を示すものである。図１と同じ構成要素には同一の番号を付けて説明する。なお、ここでは多変量解析として主成分分析(PCA)を用いる場合について説明する。
【００５１】
データ収集手段２で収集したプラントデータ(バッチプロセスデータ)１をデータ格納手段（プラントデータデータベース）３に格納する。（異常検出）モデル作成手段１０は、プラントデータデータベース３から、過去の複数のバッチで、各バッチについて紐付けされた複数のバッチプロセスデータのセット（以下「グループ」という）を読み込む（図５参照）。そしてデータアラインメント処理１１，２次元化処理１２，主成分分析による多変量解析処理１３を実施して（異常検出）モデル(具体的には係数行列値としきい値)１４を作成し、モデル格納手段（モデルデータベース）８に格納する。ここまでの制御の流れおよびデータの流れ（すなわち図２の左半）は、オフラインで実施され、本発明の実施形態に係るバッチプロセスデータの解析装置としての制御の流れおよびデータの流れである。
【００５２】
モデル格納手段８に格納された当該モデル（係数行列値としきい値）を用いて異常検出を行う場合には、新たに取得されたプラントデータ（バッチプロセスデータ）１に対して、異常検出手段（図１のデータ判定／予測手段９に相当）２０は、データアラインメント処理２１，２次元化処理２２を行った上でモデルである行列との演算を行列演算処理２３にて実施し、上述したT²統計量やQ統計量を出力２４して、これに基づいて異常検出を行う。つまり、モデル中に設定されたしきい値を超えた場合には「異常」と判定し、アラームなどを表示装置(図示せず)に表示する。ここまでの制御の流れおよびデータの流れ（すなわち図２の右半）は、オンラインで実施され、図２の左半に示された本発明の実施形態に係るバッチプロセスデータの解析装置を用いた異常検出処理を行う制御の流れおよびデータの流れである。
【００５３】
T²統計量やQ統計量から異常検出を行うことについては、上述したように従来の主成分分析の説明においてすでに述べた。そしてしきい値の設定は、既存のデータからユーザが手動で行うか或いは上述したように各サンプルに対するT²統計量やQ統計量のそれぞれに対して例えばデータの９５％が含まれる値をしきい値として自動的に行う。
【００５４】
図３は、図１に示した本発明の実施形態に係るバッチプロセスデータの解析装置およびそれを用いた異常検出／品質推定装置の制御の流れおよびデータの流れを示すフロー図であり、品質推定に適用した場合の例を示すものである。図１と同じ構成要素には同一の番号を付けて説明する。なお、ここでは多変量解析として部分的最小二乗法(PLS)を用いる場合について説明する。
【００５５】
データ収集手段２で収集したプラントデータ(バッチプロセスデータ)１をデータ格納手段（プラントデータデータベース）３に格納する。（品質推定）モデル作成手段１０は、プラントデータデータベース３から、過去の複数のバッチで、各バッチについて紐付けされた複数のバッチプロセスデータのセット（「グループ」）ならびにそれぞれのバッチに対応する品質データ４を読み込む（図５，図１１参照）。そしてデータアラインメント処理１１，２次元化処理１２，部分的最小二乗法による多変量解析処理１３を実施して（品質推定）モデル(具体的には係数行列値)１５を作成し、モデル格納手段（モデルデータベース）８に格納する。ここまでの制御の流れおよびデータの流れ（すなわち図３の左半）は、オフラインで実施され、本発明の実施形態に係るバッチプロセスデータの解析装置としての制御の流れおよびデータの流れである。
【００５６】
モデル格納手段８に格納された当該モデル（係数行列値）を用いて品質推定を行う場合には、新たに取得されたプラントデータ（バッチプロセスデータ）１に対して、品質推定手段（図１のデータ判定／予測手段９に相当）３０は、データアラインメント処理３１，２次元化処理３２を行った上でモデルである行列との演算を行列演算処理３３にて実施して、品質データ推定値３４を出力する。出力した品質データ推定値３４を表示装置(図示せず)などに表示することができる。ここまでの制御の流れおよびデータの流れ（すなわち図３の右半）は、オンラインで実施され、図３の左半に示された本発明の実施形態に係るバッチプロセスデータの解析装置を用いた品質推定処理を行う制御の流れおよびデータの流れである。
【００５７】
ここで図２及び図３の説明における「データアラインメント」および「２次元化処理」について、図４のフローチャートを用いながら説明する。図４の処理フローの説明開始にあたり、各グループに属する各バッチのデータは互いにそれぞれ紐付けられている同じバッチに関するデータ（図５参照）ではあるが、バッチに関して時系列の長さが揃っていない場合にすべてのバッチの時系列の長さを揃えるために「データアラインメント」を実行する(非特許文献５参照) 。この処理によりまずバッチの時系列の長さを揃える。
【００５８】
このように各バッチプロセスデータのセット（グループ）に対して上記データアラインメント処理を行った後、各バッチについて以下の処理を行う。
バッチのループ処理(ステップS1)では、各グループから、各バッチに紐付けされたバッチデータを抽出する。
【００５９】
次に各バッチのグループのループ処理(ステップS2)では、抽出されたバッチデータから各グループについて、ステップS3において図１２に示したようなマルチウェイ手法により１次元化する。これをすべてのグループから抽出されたデータに対して行う。
【００６０】
次いですべてのグループについて１次元化を行った後、ステップS4においてすべてのグループの１次元化されたこれらのデータを結合して全体として１次元データ（配列）とする（図６参照）。
【００６１】
上記処理をすべてのバッチについて行う（図４のステップS1の終了）ことにより、各バッチについて１次元化されたデータができる（図７参照）。
こうして、各バッチについての１次元データの各要素を「変数」，１次元データ（ベクトル）を１つの「サンプル」とする「変数」×「サンプル」の２次元化処理を終了する。
【００６２】
そして２次元化処理された２次元データに対して図２，図３に示したように、主成分分析や部分的最小二乗法などによる多変量解析手法を適用して、多変量解析処理を実行することができる。これが本発明の実施形態に係るバッチプロセスデータの解析装置の処理概要である。
【００６３】
次に本発明の実施形態に係るバッチプロセスデータの解析装置の処理内容の詳細を説明する。いま図５に示すように、互いに紐付けられた複数のバッチデータについて同じバッチのサンプリング周期の異なる時系列の変数をまとめて変数のグループとする。なお、図５はバッチのインデクスi=2に係るバッチ同士について互いに紐付いている様子を例示している。
【００６４】
これにより複数のサンプリング周期のそれぞれについて変数のグループができる。変数のg番目のグループ「グループg」について各データは以下のように４次元データとして表される。
【００６５】
x4(i,g, j,k) （８）
ここで、g=1…G はグループ，i=1…Iはバッチ，j=1…Jgはバッチ内のグループ内の変数，k=1…Kgはバッチ内のグループ内の変数の時系列（時刻），のそれぞれのインデクスを表す。またバッチ数はグループ共通であるが、変数の数と時系列の長さ（サンプリング時刻点数）はグループごとに異なるためそれぞれJg，Kgと添え数gを付ける。
【００６６】
次に上記式８で表された４次元データを、以下の図６，図７に示すようにして「サンプル」化して２次元データとすることで多変量解析手法を適用し、バッチについての異常検出や品質推定を行えるようにする。
【００６７】
具体的には、各バッチiについて、各グループから各時刻の変数の組を１次元に並べたベクトルをまず作成する（図６の下部参照）。さらにこれをすべてのグループについて並べたベクトルを作成する。これが１つの「サンプル」となり、２次元データx2(i,m)と表される（図７の下部参照）。詳しく説明すると、上記ｍは、以下の式９のように表される。
【００６８】
【数２】

逆にm（1≦m≦M）が与えられた場合、以下のようにしてg，j，kを得る。
【００６９】
いま、上記したＭを式１０で表して、
【００７０】
【数３】

m=1…Mについて、以下の式１１を満たす整数をｇとする。
【００７１】
【数４】

次に、以下の式１２の整数部分（式１２を越えない最大の整数)を（ｋ−１）とする。
【００７２】
【数５】

上記した式９を式１３のように変形して式１３よりｊを求める。
【００７３】
【数６】

これを各iについて１次元とすることで、２次元データx2(i,m)を得る（図７参照）。ここでi=1…Iは「サンプル」，m=1…M（Mは式１０で定義）は「変数」のそれぞれのインデクスである。
【００７４】
上記した式９〜１３により、g，j，kが一意に定まり、この(g,j,k)とmの間に１対１の対応が付けられる。これにより、各iを「サンプル」のインデクス，mを「変数」のインデクスとする２次元データx2(i,m)に対して多変量解析手法を適用する。この２次元データx2(i,m)に対して多変量解析手法を適用する手段として図１に示したデータ解析手段６を含むモデル作成手段１０が設けられている。そしてモデル作成手段１０の出力として、作成されたモデルをモデル格納手段８に格納し、モデル格納手段８に格納されたモデル、例えば上述した異常検出モデルと、オンラインでデータ収集した現実のバッチプロセスデータ１とで演算を実施し、データ判定／予測手段９において各バッチについての特徴量算出による異常検出を行う。
【００７５】
また部分的最小二乗法等の品質推定手法を適用する場合には、上記した従来技術の場合と同様に、品質データ４をデータ格納手段３に格納しつつ、出力が（異なるサンプリング周期の）変数であった場合についてもこれを図１に示したモデル作成手段１０により上記した方法で同じく２次元化することで部分的最小二乗法等を適用してモデル（品質推定モデル）を作成し、作成されたモデルをモデル格納手段８に格納し、このモデル（品質推定モデル）と、オンラインでデータ収集した現実のバッチプロセスデータ１とで演算を実施し、データ判定／予測手段９において各バッチについての特徴量算出による品質推定を行う。
【００７６】
ところで複数のバッチについて各バッチの工程をまたがるデータを得た場合に、これらは各工程についてのバッチデータであり、それぞれ３次元データとして得られる。ここで各工程において複数の異なるサンプリング周期で取得されている変数があってもよい。
【００７７】
これらは工程をまたがった場合や、同一工程内でも異なるサンプリング周期である場合でも、みなバッチに関連付け(紐付け) （図５参照）されており、サンプリング周期ごとにグルーピングし、グループごとに４次元データとして表すことができる。つまり共通のバッチiに対して各工程で得られたバッチデータをそれぞれ「グループ」として４次元データx4(i,g,j,k)として定義することができる。
【００７８】
そして上述した式９〜１３および図６，図７で説明した方法により２次元化し、この２次元データに対して上述したように主成分分析や部分的最小二乗法等による多変量解析手法を適用することができる。具体的には各工程で得られたバッチプロセスデータを図６，図７における各グループとし、これを図７におけるように２次元化データすることで上記の処理を行うことができる。またこれらの処理を実行する具体的構成は図１〜３に示したものを使用することができる。
【００７９】
以上のように複数のバッチデータについて、これらのデータが工程をまたがった場合や、同一工程内でも異なるサンプリング周期である場合でも、みなバッチに関連付け(紐付け)されており、サンプリング周期ごとにグルーピングし、グループごとに３次元データとして表され、これが共通のバッチiに対して各工程で得られたバッチデータをそれぞれ「グループ」として４次元データx4(i,g,j,k)として定義されることから、複数のバッチデータを一まとめにして統合的に扱い、上述した式９〜１３および図６，図７で説明した方法によりすべて「サンプル」×「変数」の２次元データに変換できる。そして「サンプル」×「変数」の２次元データに対して主成分分析、部分的最小二乗法、独立成分分析など各種の多変量解析手法をプラントにおけるバッチプロセスデータの性質に応じて適宜適用することができる。
【００８０】
すなわち、「サンプル」×「変数」の２次元データに対して、主成分分析又は独立成分分析を適用すれば異常検出を、また部分的最小二乗法又は判別分析を適用すれば品質推定を行うことが可能で、これらをプラントにおけるバッチプロセスデータの性質に応じて適宜適用する。
【００８１】
図８は、本発明手法を適用した場合の実例を示す図である。図８に示す実例においては、工程Ａ60，工程Ｂ70の両方のデータを入力データとして取り込むことで、工程Ａ60と工程Ｂ70のそれぞれだけを見ていたのではわからない、両工程間の相関を考慮した異常検出や品質推定を行うことができる。具体的には、工程Ａ60のデータを、図５に示す、「グループ１」として、工程Ｂ70のデータを「グループ２」にとして適用すればよい。そして、本発明手法による異常検出装置での処理では、複数工程をまとめてマルチウェイ手法ＰＣＡ（主成分分析）によるＳＰＣ（統計的プロセス管理）９０を実施する。
【００８２】
図９は、本発明手法を適用した場合の実例と従来手法を適用した場合の実例とを比較する図である。図９に示す従来手法を適用した場合の実例において、通常のバッチでは工程Ａ560の圧力データの処理終了時付近は平坦であるが、たまに変動する場合がある。このような変動の結果として品質不良となる場合と、正常な製品ができる場合がある。一方で、工程Ｂ570の圧力データの処理終了時付近においても、通常は平坦であるが、たまに変動する場合がある。
【００８３】
工程Ａ560と工程Ｂ570のこれらの部分のデータは実は互いに関係があり、工程Ａ560で変動した場合に工程Ｂ570でも変動していれば工程Ａ560での影響が工程Ｂ570で打ち消されて異常（不良）でなくなることが確認されている。
【００８４】
このような場合、従来手法では工程ごとにしか適用できないため、工程Ａ560の処理終了時付近での変動または工程Ｂ570の処理終了時付近での変動があるバッチはすべて「異常（不良）」と判定されてしまう。
【００８５】
しかし、実際には１つのバッチにおいて、工程Ａ560の処理終了時付近での変動と工程Ｂ5７0の処理終了時付近での変動が両方起こった場合には良品が得られているのでこれを不良として扱うのは明らかに誤検出ということになり、著しく異常検出精度が劣化していることになる。
【００８６】
一方、図９に示す本発明手法を適用した場合の実例においては、工程Ａ60と工程Ｂ70の両方のデータを用いることで、工程をまたがったデータ間の相関を考慮することが簡単に可能となるため、異常検出精度や品質推定精度の大幅な向上を図ることができる。
【図面の簡単な説明】
【００８７】
【図１】本発明の実施形態に係るバッチプロセスデータの解析装置およびそれを用いた異常検出／品質推定装置の構成概要を示すブロック図である。
【図２】図１に示した装置の制御の流れおよびデータの流れを示すフロー図である。
【図３】図１に示した装置の制御の流れおよびデータの流れを示すフロー図である。
【図４】図２及び図３に示した「２次元化処理」を説明するフロー図である。
【図５】互いに紐付けられた複数のバッチデータの関係を示す図である。
【図６】複数のグループの１次元化を説明する図である。
【図７】複数のバッチデータの２次元化を説明する図である。
【図８】本発明手法を適用した場合の実例を示す図である。
【図９】本発明手法を適用した場合の実例と従来手法を適用した場合の実例とを比較する図である。
【図１０】従来の一般的なプラントによる製品製造システムにおける製造データ管理システムの構成概要を示す図である。
【図１１】従来の或る製品（食品）の製造工程を示す図である。
【図１２】従来のマルチウェイ手法を説明する図である。
【図１３】従来のマルチウェイ多変量解析手法を用いた異常検出例を示す図である。
【符号の説明】
【００８８】
１バッチプロセスデータ（プラントデータ）
２データ収集手段
３データ格納手段（プラントデータＤＢ）
４品質データ
５データ入力手段
６データ解析手段
７データ出力手段
８モデル格納手段（モデルＤＢ）
９データ判定／予測手段
１０モデル作成手段
１１，２１，３１データアラインメント部
１２，２２，３２２次元処理部
１３多変量解析処理部
１４異常検出モデル
１５品質推定モデル
２０異常検出手段
２３，３３行列演算処理部
２４出力（T²／Q）
３０品質推定手段
３４品質データ推定値
６０工程Ａ
７０工程Ｂ
８０プラントデータＤＢ（データベース）
９０本発明手法によるＳＰＣ（統計的プロセス管理）

【特許請求の範囲】
【請求項１】
各バッチに関するサンプリング周期の異なる時系列データを、バッチ単位でまとめてプロセスデータのグループとして扱うバッチプロセスデータの解析装置であって、
前記グループのそれぞれに対してデータアラインメント処理を行った後、各グループから、各バッチに紐付けされたバッチデータを抽出するバッチデータ抽出手段と、
該バッチデータ抽出手段により抽出されたバッチデータから、各グループについてマルチウェイ手法により１次元化し、これをすべてのグループから抽出されたデータに対して行うグループデータ１次元化手段と、
該グループデータ１次元化手段によりすべてのグループについて１次元化を行った後、該すべてのグループの１次元化されたこれらのデータを結合して全体として１次元データの配列とする全体１次元データ配列手段と、
該全体１次元データ配列手段により得られた各バッチについての１次元データの各要素を「変数」，１次元データ（ベクトル）を１つの「サンプル」とする「変数」×「サンプル」の２次元化データを得るデータ２次元化手段と、
該データ２次元化手段により得られた２次元データに対して多変量解析手法を適用して、解析処理を実行する多変量解析処理手段と、
を備えることを特徴とするバッチプロセスデータの解析装置。
【請求項２】
各バッチに関する複数の工程のデータを、バッチ単位でまとめてプロセスデータのグループとして扱うバッチプロセスデータの解析装置であって、
前記グループのそれぞれに対してデータアラインメント処理を行った後、各グループから、各バッチに紐付けされたバッチデータを抽出するバッチデータ抽出手段と、
該バッチデータ抽出手段により抽出されたバッチデータから、各グループについてマルチウェイ手法により１次元化し、これをすべてのグループから抽出されたデータに対して行うグループデータ１次元化手段と、
該グループデータ１次元化手段によりすべてのグループについて１次元化を行った後、該すべてのグループの１次元化されたこれらのデータを結合して全体として１次元データの配列とする全体１次元データ配列手段と、
該全体１次元データ配列手段により得られた各バッチについての１次元データの各要素を「変数」，１次元データ（ベクトル）を１つの「サンプル」とする「変数」×「サンプル」の２次元化データを得るデータ２次元化手段と、
該データ２次元化手段により得られた２次元データに対して多変量解析手法を適用して、解析処理を実行する多変量解析処理手段と、
を備えることを特徴とするバッチプロセスデータの解析装置。
【請求項３】
前記多変量解析処理手段として、主成分分析、独立成分分析、部分的最小二乗法、判別分析のいずれか一つを用いる請求項１または２記載のバッチプロセスデータの解析装置。
【請求項４】
請求項１または２記載のデータ解析装置を用いて異常検出モデルを生成しておき、新たに取得されたバッチプロセスデータに対して、データアラインメント処理，２次元化処理を行った上で前記異常検出モデルとの行列演算を行って、T²統計量およびQ統計量を出力し、これがあらかじめ設定したしきい値を超えるかを検出して異常検出を行うバッチプロセスデータの異常検出装置。
【請求項５】
前記異常検出モデルを生成する際、前記請求項１または２記載のデータ解析装置は前記多変量解析処理手段として、主成分分析又は独立成分分析のいずれか一つを用いることを特徴とする請求項４記載のバッチプロセスデータの異常検出装置。
【請求項６】
請求項１または２記載のデータ解析装置を用いて品質推定モデルを生成しておき、新たに取得されたバッチプロセスデータに対して、データアラインメント処理，２次元化処理を行った上で前記異常検出モデルとの行列演算を行って、品質データ推定値を出力して品質予測を行うバッチプロセスデータの品質推定装置。
【請求項７】
前記品質推定モデルを生成する際、前記請求項１または２記載のデータ解析装置は前記多変量解析処理手段として、部分的最小二乗法又は判別分析のいずれか一つを用いることを特徴とする請求項６記載のバッチプロセスデータの品質推定装置。

【図１】