説明

欠陥検出方法及び装置

【課題】半導体などの回路パターンの検査は、高感度化と高速化が絶えず追求されているが、パターンの微細化に伴い、パターンのラフネス等の違いに起因して、欠陥と正常部の識別が困難となり、検査感度が大きく不足している。
【解決手段】正常事例からなる学習データを対象に、観測データと類似したデータを探索し、探索した正常データからの乖離度の大小によって、欠陥を認識するものであり、高感度検査を実現し得る。具体的には、(1)主に正常事例からなる学習データを準備、(2)観測データと類似する学習データの部分空間を生成、(3)観測データから部分空間までの距離を算出、(4)距離の大小により欠陥かどうか判定、からなる手順により実現され、画素ごとにラフネス等に対応した、適切な感度設定が可能となる。なお、上記部分空間以外の方法にても、類似性判断を行う。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、LSI、液晶やプラズマディスプレイなどのFPD基板を製造する際に生じる欠陥の検査方法及びその装置に関する。
【背景技術】
【0002】
日本国特許第3,566,589号公報(特許文献1)において、LSIや液晶基板を製造する際に生じる異物または欠陥の検査に関して、長手方向にはほぼ平行光からなるスリット状ビームを形成し、回路パターンが形成された被検査対象基板に対して、基板の法線方向から所定の傾きを有し、更に、回路パターンの主要な直線群に対して平面上所定の傾きを有するように、かつビームの長手方向が被検査対象基板を載置して走行させるステージの走行方向に対してほぼ直角になるように照明し、このようにして照明された被検査対象基板上に存在する異物等の欠陥から得られる反射散乱光をイメージセンサで受光して信号に変換し、検出された信号に基づいて異物等の欠陥を示す信号を抽出することにより欠陥を検出する欠陥検査方法が述べられている。また、被検査対象基板上に存在する回路パターンの繰返しパターン(密な繰返しであり、ダイのような繰返しではない)からの回折光パターンを空間フィルタによって遮光することも述べられている。更には、欠陥判定過程において、本来同一の回路パターンが形成された箇所またはその近傍から得られる信号を基にしてばらつきを算出し、算出されたばらつきに基づいて判定基準(しきい値)を設定し、異物等の欠陥を示す信号を抽出することが述べられている。
【0003】
また、日本国特許第4,001,653号公報(特許文献2)において、サンプル上の第1パターンの検査点に存在する欠陥を探索する為に、同じデザインの第2パターンの少なくとも1つの既知の検査応答を参照する事を特徴とした欠陥検査方法とその装置について述べられている。検査に当っては、サンプル上の第1及び第2パターン上では互いに同等の観察点を用いる事が重要であり、少なくとも1回の探索を行いそれに依って少なくとも2つの検査応答を発生させ、その2つの応答(暗視野と明視野からの応答信号が代表的である)は、光電的手法で別々に検出し、別々に比較して、個別に差分信号(第1と第2パターン間の)を形成している。即ち、第1パターンに於ける第1と第2応答を検出しその結果を各々対応する第2パターンのそれぞれの同じ検査点からの2つの応答との間でそれぞれ位置合せを行い、比較処理を実施し、その結果として応答の第1と第2の差分信号を形成する。
【0004】
個別に作られた差分信号は、一元的に第1パターン欠陥のリストを決定するためにデータ処理をする。具体的には、この第1及び第2の差分信号をまとめてデータ処理を施し、一元的な第1パターンの欠陥リストを決定する事が出来る。または、第1パターン欠陥リストにはその後データ処理を実行する。そして、既知で無害なサンプル表面に見られる虚偽欠陥を抽出してそれを排除する。或いは、その様な既知の無害な虚偽欠陥は参考としてユーザーに提供する。
【0005】
また、M.Zontak,I.Cohen:Defect Detection in Pattern -ed Wafers Using Anisotropic Kernels, Machine Vision and Applications(June 2008)によれば、取得画像と参照パターン画像を特徴空間にマッピングし、取得画像の特徴量を、参照パターン画像からの近傍の特徴量の重み付き和として推定し、欠陥部では、これが再構成できないことを利用して、欠陥として認識する手法が提案されている。ここでは、密度の高い周期パターンを対象にしている。
【0006】
パターン検査以外の分野では、米国のSmartSignal社が、米国特許6,952,662号や米国特許6,975,962号に記載のように、おもにエンジンを対象に、異常検知の業務をサービスしている。そこでは、過去のデータをデータベース(DB)としてもっておき、観測データと過去の学習データとの類似度を独自の方法で計算し、類似度の高いデータの線形結合により推定値を算出して、推定値と観測データのはずれ度合いを出力する。General Electric社のように、米国特許6,216,066号には、異常検知をk-meansクラスタリングにより検出している例もある。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】日本国特許第3,566,589号公報
【特許文献2】日本国特許第4,001,653号公報
【特許文献3】米国特許6,952,662号
【特許文献4】米国特許6,975,962号
【特許文献5】米国特許6,216,066号
【非特許文献】
【0008】
【非特許文献1】M.Zontak,I.Cohen:Defect Detection in Pattern -ed Wafers Using Anisotropic Kernels, Machine Vision and Applications(June 2008)
【非特許文献2】Stephan W. Wegerich;Nonparametric modeling of vibration signal features for equipment health monitoring、Aerospace Conference, 2003. Proceedings. 2003 IEEE,Volume 7, Issue, 2003 Page(s):3113 - 3121
【発明の概要】
【発明が解決しようとする課題】
【0009】
LSIやFPD基板を製造する際に、被加工対象物(例えば半導体ウェーハ)上に形成されるパターンとしては、DRAM(Dynamic Random Access Memory)部に代表されるような繰返しパターン(密な繰返し)や、ロジックに代表されるようなランダムパターン(非繰返しパターン)がある。そして、後に切断されてひとつのメモリ素子やプロセッサ素子を形成する単位であるダイが、ウェーハ基板上に形成される。このようなLSIやFPD基板の製造において、被加工対象物の表面に異物が付着したりまたは欠陥が発生すると、例えば、配線の絶縁不良や短絡などの不良原因となる。回路パターンの微細化に伴い、回路パターン形成前の鏡面ウェーハにおいても検出すべき欠陥は微細なものとなり、高感度が望まれている。そして、回路パターン形成後においてはパターン(非欠陥部)と、微細な異物や欠陥を弁別することが困難になってきており、例えば、異物や各種の欠陥(配線ショート、断線、パターン細り、パターン太り、スクラッチ、穴非開口など)によって、検出可能な光学条件(照明の波長、照明の偏光、照明方位、照明仰角、照明ビームの開口数、検出方位、検出仰角、検出する偏光、および検出開口数など)が異なることがあり、欠陥種やその寸法ごとに光学条件を変える必要がある。更には、単一の光学条件では非欠陥部との弁別が困難な場合があり、この場合には、同一種の欠陥についても、複数の光学条件で検査を実施する必要があり、検査速度(スループット)の低下を余儀なくされる場合が生じるようになってきている。
【0010】
さらに、パターンのラフネスや膜厚の変動などにより、欠陥に比べて、正常部の違いが相対的に大きく、光学条件を適切に選んだとしても、欠陥判定を行うしきい値の設定が困難になりつつある。特に、光学条件ごとに、しきい値を設定する必要があり、検査レシピの作成に時間を要する。
【0011】
さらに、従来技術の共通課題は、着目画素において、対応する画素を精度高く求めることが必要なことも挙げられる。精度高く求められた対応画素、及びその近傍を用いて、着目画素の欠陥判定を行っている。
【0012】
そこで、本発明の目的は、上記課題を解決すべく、LSIやFPD基板の製造において、被加工対象物に形成される様々なパターン上に生じる欠陥または異物を、光学条件に依存せず、正常な回路パターンと弁別して欠陥を検出する方法を提供することにある。また、着目画素において、対応する画素を精度高く求めることも必ずしも必要としない。
【0013】
さらに、高感度化のための検出画素寸法の縮小(これによりスループット低下を招く)、φ300mmからφ450mmへと言ったウェーハ径の大口径化、露光やエッチングの際のマージンが不足する箇所であるホットスポットに代表される問題箇所の限定検査などに伴い、ウェーハ全面でなく、部分検査が必須になっており、従来方式では効果的な対応ができないが、これを対応可能とする。
光学条件が多数あっても、比較相手が少ない場合でも、安定に検査することを可能とする。パターン形成基板以外の無地基板をも対象にする。
【課題を解決するための手段】
【0014】
上記目的を達成するために、本発明は、着目画素を、決められた対応画素と照合して、対応画素を含む、その近傍と比較するのではなく(比較される場合も結果としてはあるが)、位置関係とはほぼ無関係に、ほぼ正常からなる学習データの集団、特に類似度の高いデータ集合と比較する。具体的には、(1)主に正常事例からなる学習データを準備、(2)観測データと類似する学習データの部分空間を生成、(3)観測データから部分空間までの距離を算出、(4)距離の大小により欠陥かどうか判定、からなる手順により実現される。
【0015】
すなわち、本発明では、欠陥を検査する方法において、試料を検査して得られた検出信号から観測データを取得し、検出信号から試料上の欠陥のほぼ無い部分を検査して得られる検出信号を学習データとして作成し、作成した学習データから統計モデルを生成し、統計モデルと観測データとの類似度を求め、求めた類似度に基づいて取得した観測データの中の欠陥の位置を判定するようにした。
また、本発明では、欠陥を検査する装置を、試料を検査して検出された検出信号から観測データを取得する観測データ取得部と、検出信号から試料上の欠陥のほぼ無い部分を検査して得られる検出信号を学習データとして作成し該作成した学習データから統計モデルを生成する統計モデル生成部と、統計モデル生成部で生成した統計モデルと観測データ取得部で取得した観測データとの類似度を算出する類似度算出部と、類似度算出部で算出した類似度に基づいて観測データ取得部で取得した観測データの中から欠陥の位置を判定する欠陥判定部とを備えて構成した。
【発明の効果】
【0016】
本発明によれば、画素ごとにラフネス等に対応した、適切な感度設定が可能となる。特に、対象の変動を有効に吸収でき、正常部からなるゴールデンと比較するゴールデン比較や、設計データやその変形パターンと比較する設計データ比較以上の検査感度を、設計上の事前情報なしで、複雑なレシピ設定なしで実現できる。鏡面ウェーハやロジックに代表されるようなランダムパターン(非繰返しパターン)にも適用可能である。光学条件などの検査条件に依存せず、正常な回路パターンと弁別して欠陥を検出できる。
【0017】
ウェーハやダイの全面でなく、部分検査にも対応できる。これは、対応相手の画素が固定されておらず、類似度に基づいて選択され、部分空間が形成されるため、ダイ間の共通パターン部を狙って画像を検出する必要がなく(画像検出の無駄を減らすことができ)、着目画素を類似度に基づいて自由に選んでも何ら問題が生ぜず(類似度が高い画素を選択的に選ぶことができ)、ホットスポットと呼ばれるような歩留りに影響を与える危険箇所のような部分検査にも、効果的に対応できるためである。
検査の手段にも、これを選ばない。すなわち、明視野方式や暗視野方式の光学式検査装置のみならず、電子線式の検査などに適用可能である。
【図面の簡単な説明】
【0018】
【図1】本発明の適用対象の検査装置の一例である。
【図2】本発明の適用対象の検査装置の一例である。
【図3A】本発明の適用対象の検査装置の一例で、集光系により、照明スポットの像がセンサの受光面あるいはその近傍に結像されるように構成した集光系の概略構成図である。
【図3B】本発明の適用対象の検査装置の一例で、集光系を楕円面鏡による反射光学系により構成した例を示す集光系の概略構成図である。
【図3C】本発明の適用対象の検査装置の一例で、複数の方向から散乱光を集光し、イメージセンサに結像するように構成した検出部の概略構成図である。
【図3D】本発明の適用対象の検査装置の一例で、シュバルツシルト光学系による反射光学系の概略の構成を示す概略構成図である。
【図4】本発明の識別手順の例である。
【図5】時系列信号の例である。
【図6A】時間軸方向にM個づつデータをまとめ、ベクトルとして扱い、多次元時系列信号を得るベクトル化の例を示す図である。
【図6B】周回遅れ(空間的隣接方向)の1次元時系列信号を複数まとめ、多次元時系列信号を得るベクトル化の例を示す図である。
【図7】主成分の例である。
【図8】部分空間法の一例である。
【図9】鏡面ウェハ検査装置を対象にした、本発明に基づく局所部分空間法の適用例である。
【図10】本発明の識別手順の例である。
【図11】Wavelet(変換)解析の例である。
【図12】本発明の識別手順の例である。
【図13】散布図解析および相互相関解析の例である。
【図14】本発明の識別手順の例である。
【図15】時間・周波数解析の例である。
【図16】本発明の識別手順の例である。
【図17】本発明の識別手順の例である。
【図18】Wavelet(変換)解析の例である。
【図19】ハードウェア構成図である。
【図20】複数識別器の統合による識別例である。
【図21】複数識別器の統合による異常検知例である。
【図22】評価ツールの構成例である。
【図23】線形特徴変換の一例である。
【図24A】学習データの編集のフローを示す図である。
【図24B】学習データを編集する部分の概略構成を示すブロック図である。
【図25A】学習データの編集のフローを示す図である。
【図25B】学習データを編集する部分の概略構成を示すブロック図である。
【図26A】正常事例からなる学習データを用いた異常検知システムの例である。
【図26B】正常事例からなる学習データを用いた異常検知システムの操作画面の例である。
【図27】パターン付きウェーハ検査装置の例である。
【図28A】パターン付きウェハ検査装置で検出したスクラッチ欠陥の画像である。
【図28B】パターン付きウェハ検査装置を対象にして本発明に基づく局所部分空間法を適用した例を示す信号波形のグラフである。
【図29】パターン付きウェハ検査装置を対象にした、本発明に基づく類似度算出箇所の説明である。
【図30】学習パターンからなるクラスAの部分空間を2本の直線で挟むようにしてしきい値を設定した場合のGUI画面上に表示されるグラフの例を示す図である。
【図31】クラスAの部分空間全体を円又は楕円で囲むようにしてしきい値を設定した場合のGUI画面上に表示されるグラフの例を示す図である。
【図32】クラスAを正常部とし、未知パターンqからクラスAまでの距離(dA)を求めて画面上に表示した例を示すグラフの例を示す図である。
【図33】欠陥検出時の比較対象パターンとして同一ダイ内の類似パターンが存在する状態を示すパターン付きウェハの隣り合う二つのダイの平面図である。
【発明を実施するための形態】
【0019】
以下実施例に従って、本発明の内容を詳細に説明する。
【実施例1】
【0020】
本発明の対象装置の構成を図1により説明する。照明部101、検出部102(102a、102b、102c)、試料1を載置可能なステージ103、信号処理部105、全体制御部53、表示部54、入力部55から構成される。信号処理部105は欠陥判定部50、特徴量抽出部51、および欠陥種寸法判定部52からなる。正反射光検出部104は大面積欠陥検査あるいは試料表面計測などの目的で必要に応じて設置される。
【0021】
照明部101はレーザ光源2、アッテネータ3、偏光素子4、ビームエキスパンダ7、照度分布制御素子5、反射ミラーm、集光レンズ6より構成される。レーザ光源2から射出されたレーザ光は、アッテネータ3で所望のビーム強度に調整され、偏光素子4で所望の偏光状態に調整され、ビームエキスパンダ7で所望のビーム径に調整され、反射ミラーmおよび集光レンズ6を介して、試料1の被検査領域に照明される。照度分布制御素子5は、試料1上における照明の強度分布を制御するために用いられる。図1では照明部101が試料1の法線に対して傾斜した斜方から光を照射する構成を示したが、試料1の表面に対して垂直に光を照射することを可能とする図1に図示しない別の照明光路を有する。照明光路は切替えることが可能である。
【0022】
レーザ光源2としては、試料表面近傍の微小な欠陥を検出するには、試料内部に浸透しづらい波長として、短波長の紫外または真空紫外のレーザビームを発振し、かつ出力1W以上の高出力のものが用いられる。試料内部の欠陥を検出するには、試料内部に浸透しやすい波長として、可視あるいは赤外のレーザビームを発振するものが用いられる。ステージ103は、並進ステージ11、回転ステージ10、Zステージ(図示せず)からなる。
図2に、試料1上の照明領域(照明スポット20)と、回転ステージ10および並進ステージ11の運動による走査方向との関係およびそれにより試料1上に描かれる照野20の軌跡を示す。図2では、照明部101における照度分布制御あるいは斜方からの照明によって、1方向に長くそれに直交する方向に短い楕円形状に形成された照野20の形状を示す。照野20は、回転ステージ10の回転運動によって、回転ステージ10の回転軸を中心とした円の円周方向S1に、並進ステージ11の並進運動によって、並進ステージ11の並進方向S2に走査される。照明スポット20の長手方向が走査方向S2と平行となり、かつ走査方向S2の走査によって回転ステージ10の回転軸を照明スポット20がほぼ通過するように、照明部101が構成される。Zステージの移動は、試料1の高さ、すなわち試料1表面の法線方向の移動に対応する。以上の構成において、走査方向S1の走査により試料を1回転する間に、走査方向S2の走査を照明スポット20の長手方向の長さ以下の距離だけ行うことにより、照明スポットがらせん状の軌跡Tを描き、試料1の全面が走査される。
【0023】
検出部102a、102b、および102cは互いに異なる方位、角度に発生する散乱光を集光して検出するよう構成される。
図3Aに検出部102aの構成を示す。検出部102b、102cの構成要素は検出部102aと共通であるため説明を省略する。広い角度範囲の散乱光を検出するため、検出部102a、102b、102c以外に、図1に図示していない互いに検出方向の異なる複数の検出部が配置される。検出部102aは、集光系8、偏光フィルタ13、およびセンサ9から構成される。集光系8により、照明スポット20の像がセンサ9の受光面あるいはその近傍に結像される。結像位置に適当な径の視野絞り(図示せず)を設置することで、照明スポット以外の位置から発生する背景光を除去、低減することができる。偏光フィルタ13は結像系8の光軸上へ着脱および検光方位の回転が可能であり、ノイズ要因となる試料ラフネス等による散乱光成分を低減する目的で用いる。偏光フィルタ13として、紫外光等の短波長においても透過率、消光比の高いワイヤグリッド偏光板、あるいは偏光ビームスプリッタが用いられる。ワイヤグリッド偏光板として、アルミニウムや銀などの金属の薄膜を縞状に微細加工した構造のものがある。微弱な異物散乱光の検出を可能にするため、センサ9として、光電子増倍管、アバランシェフォトダイオード、イメージインテンシファイアと結合した半導体光検出器などを用いる。高感度、高精度を実現するための光電子増倍管としては、量子効率の高いウルトラバイアルカリ型あるいはスーパーバイアルカリ型のものが望ましい。
【0024】
図3Bに、集光系を楕円面鏡による反射光学系により構成した例を示す。集光系701は楕円の第一焦点位置を照明光の照射位置とし、第二焦点位置をセンサ9bの受光面に配置する。集光系701はウェーハ1の表面に対して浅い角度を含む高NAをもって散乱光を集光しセンサ9bに導くのに適する。これに加え、集光系8およびセンサ9aからなる上方散乱光を検出する検出部を有し、複数の方向の散乱光を同時に検出することが可能な構成である。図3Cは、複数の方向から散乱光を集光し、イメージセンサに結像する検出部の構成例である。方位あるいは仰角の異なる複数の方向の散乱光を、集光結像系88a、88b、88cにより、イメージセンサ99a、99b、99c上に結像する構成である。ウェーハ1の表面の散乱光を画像として検出し画像処理を行うことで、回路パターンが形成された半導体ウェーハやマスクなどにおいて回路パターンに生じた欠陥を検出することが可能であるため、パターンの形成された試料の検査に有効である。イメージセンサ99a、99b、99cとしては、CCDやCMOSで構成されたリニアアレイセンサや二次元アレイセンサ、あるいはイメージインテンシファイアをこれらと結合した高感度なイメージセンサ、あるいはマルチアノード光電子増倍管が用いられる。図3Dは、シュバルツシルト光学系による反射光学系を用いた構成例である。波長200nm以下の短波長で照明する場合にウェーハ1の表面のからの散乱光をミラー系702,703で反射集光させてセンサ9に結像するのに適する。
【0025】
検出部102a〜cにおいて検出された散乱光信号に基づいて欠陥判定部50において試料面上における欠陥の存在箇所が判定され、欠陥と判定された箇所については特徴量抽出部51において特徴量が抽出される。検出された各欠陥に対応する特徴量が欠陥種寸法判定部52に入力され、これに基づいて検出された各欠陥の欠陥種と欠陥寸法が判定される。欠陥種および寸法の判定結果は各欠陥の試料面上における位置(欠陥座標)と対応付けられ、全体制御部に送られ、装置ユーザが確認可能な形で表示部より出力される。
対象試料1が半導体鏡面(ミラー)ウェーハの場合、鏡面ウェーハ検査装置となり、パターンが形成されている場合、マクロ検査装置やミクロ検査装置と呼ばれるものになる、
次に、欠陥判定部50に適用する実施の形態を説明する。
【0026】
本発明による信号処理手順の実施の一形態を図4に、対象とするセンサ信号の例を図5に示す。試料1は、ウェーハである。対象信号は、図5に示すような、光電子増倍管から得られた時系列信号である。同図中央に、欠陥が存在する。目視では確認困難な、微弱な信号をもっている。
この1次元時系列信号を多次元時系列信号にするため、図6Aに示すように、時間軸方向にM個づつデータをまとめ、ベクトルとして扱い、多次元時系列信号を得る。または、図6Bに示すように、周回遅れ(空間的隣接方向)の1次元時系列信号を複数まとめ、多次元時系列信号を得る。さらには、複数のセンサ9a、9b、9c、104から取得されるデータを、各時刻のものをまとめて、M次元としてもよい。さらには、時間軸、周回、複数センサなど、これらの組み合わせでもよい。
【0027】
図4に示した異常検知方法について説明する。以下、異常とは欠陥と同義語である。まず、多次元時系列信号を取得する(S101)。次に、取得した多次元時系列信号が、欠損している場合があるため、欠損値の修正・削除を欠損値の修正・削除処理(S102)を行う。欠損の修正は、例えば、前後のデータの置換えや移動平均の置換えが一般的である。削除は、多くのデータが同時に0にリセットされた時など、データとしての異常を排除するものである。
【0028】
次に、データの次元削減を行うために主成分分析処理(S105)を行う。ここでは、主成分分析により、M次元の多次元時系列信号を、次元数rのr次元多次元時系列信号に線形変換する。主成分分析は、ばらつき最大となる軸を生成するものである。KL変換でも構わない。次元数rは、主成分分析により求めた固有値を降順に並べ、大きい方から加算した固有値を全固有値の和で割り算した累積寄与率なる値に基づいて決める。図7にその模様を示す。図7の3次元表示(特徴空間と呼ぶ)は、主成分分析後のr次元の多次元時系列信号を寄与率の高い3次元で表示したものである。
【0029】
次に、r次元の多次元時系列信号に対して、軌跡分割によるクラスタリングを軌跡分割によるクラスタリング処理(S106)を行う。クラスタリングは、時間に沿ってデータ間の距離が定めたしきい値を超えれば、別のクラスタとし、しきい値を超えなければ、同じクラスタとして扱うものである。
【0030】
次に、クラスタリングされた各クラスタを対象に、低次元部分空間でのモデル化を、各クラスタを対象にモデル化処理(S108)を行う。正常部限定である必要はなく、異常が混入することは問題ない。ここでは、例えば、回帰分析によりモデル化を行う。回帰分析の一般式は、下記のとおりである。「y」が、クラスタごとのr次元の多次元時系列信号に相当する。「X」が、yを説明する変数である。「y~」がモデルになる。「e」は偏差である。
y:目的変数(r列)
b:回帰係数(1+p列)
X:説明変数行列(r行、1+p列)
||y-Xb||⇒min
b=(X'X)-1X'y('は転置を表す)
y~=Xb=X(X'X) -1X'y(説明変数の影響を表す部分)
e=y-y~(y~で近似できない部分。説明変数の影響を取り除いた部分)
ただし、rank X=p+1
ここでは、各クラスタのr次元の多次元時系列信号に対し、データのN個抜き(N=0,1,2,・・・)の回帰分析を行う。例えばN=1の場合は、異常信号が1種混入していると考え、これを除いた信号を「X」としてモデル化する。N=0の場合は、全r次元多次元時系列信号を扱うことになる。
【0031】
回帰分析以外に、CLAFIC法や投影距離法等の部分空間法を適用してもよい。そして、モデルからの偏差算出処理(S109)を行う。図8に一般的なCLAFIC法を図解して示す。classAとclassBとの2クラス、特徴αの軸と特徴βの軸とを有する2次元パターンの場合を示す。各クラスの部分空間、即ち、ここでは1次元の直線として表される部分空間を求める。
【0032】
一般的には、各クラスのデータの自己相関行列を固有値分解して、固有ベクトルを基底として求める。値が大きい、上位何個かの固有値に対応する固有ベクトルを用いる。未知パターンq(最新の観測パターン)が入力されると、部分空間への正射影の長さ、或いは部分空間への投影距離を求める。そして、正射影の長さが最大、或いは投影距離が短いクラスに、未知パターン(最新の観測パターン)qを分類する。
【0033】
図8では未知パターンq(最新の観測パターン)は、クラスAに分類される。図5に示した時系列信号では、基本的に正常部を対象とするため、1クラス識別の問題になるので、クラスAを正常部とし、未知パターンq(最新の観測パターン)からクラスAまでの距離(dA)を求めて画面上に表示し(図32参照)、これを偏差とする。そして、この求めた偏差を予め設定した値と比較し、比較した結果、偏差が予め設定した値よりも大きいと、異常として特定され(S110)、異常に関する情報が出力される(S111)。このような部分空間法では、異常値が若干混ざっていても、次元削減し、部分空間にした時点で、その影響が緩和される。部分空間法適用のメリットである。
【0034】
なお、投影距離法では各クラスの重心を原点とする。各クラスの共分散行列にKL展開を適用して得られた固有ベクトルを基底として用いる。いろいろな部分空間法が立案されているが、距離尺度を有するものならば、はずれ度合いが算出可能である。図30には、学習パターンからなるクラスAの部分空間を2本の直線で挟むようにしてしきい値を設定した場合のGUI(Graphic User Interface)画面上に表示されるグラフの例を示し、図31にはクラスAの部分空間全体を円又は楕円で囲むようにしてしきい値を設定した場合のGUI画面上に表示されるグラフの例を示す。なお、密度の場合も、その大小により、はずれ度合いを判断可能である。CLAFIC法は、正射影の長さを求めることから、類似度尺度である。
【0035】
このように、部分空間にて距離や類似度を計算し、はずれ度合いを評価することになる。投影距離法などの部分空間法は、距離に基づく識別器のため、異常データが利用できる場合の学習法として、辞書パターンを更新するベクトル量子化や距離関数を学習するメトリック学習を使うことができる。
【0036】
また、局所部分空間法と呼ぶ、未知パターンq(最新の観測パターン)に近いk個の多次元時系列信号を求め、各クラスの最近傍パターンが原点となるような線形多様体を生成し、その線形多様体への投影距離が最小となるクラスに未知パターンを分類する方法も適用できる(図21の局所部分空間法の枠内参照)。局所部分空間法も部分空間法の一種である。
【0037】
既に説明したクラスタリング後の各クラスタに対して、局所部分空間法を適用することになる。kは、パラメータである。異常検知では、先ほどと同様に、1クラス識別の問題になるので、大多数のデータが属するクラスAを正常部とし、未知パターンq(最新の観測パターン)からクラスAまでの距離を求めて、これを偏差とする。
【0038】
この手法では、例えば、k個の多次元時系列信号を用いて形成される部分空間への、未知パターンq(最新の観測パターン)からの正射影した点を推定値として算出することもできる(図21の局所部分空間法の枠内に説明した推定値なるデータ)。また、k個の多次元時系列信号を、未知パターンq(最新の観測パターン)に近い順に並べ替え、その距離に反比例した重み付けを行って、各信号の推定値を算出することもできる。投影距離法などでも、同様に推定値を算出できる。
【0039】
パラメータkは通常は1種類に定めるが、パラメータkをいくつか変えて実行すると、類似度に応じて対象データを選択することになり、それらの結果から総合的に判断できるため、一層効果的である。局所部分空間法では、クラスタ内の選択したデータを対象とするため、異常値が若干混ざっていても、局所部分空間にした時点で、その影響が大きく緩和される。
【0040】
クラスタに無関係に、未知パターンq(最新の観測パターン)に近いk個の多次元時系列信号を求め、k個のうち最も多くが属すクラスタが、未知パターンqが属すクラスタであると判定し、このクラスタが属す学習データを対象に、再度、未知パターンqに近いL個の多次元時系列信号を求め、これを用いて局所部分空間法を適用することもできる。
【0041】
局所部分空間法の「局所」という概念は、回帰分析にも適用可能である。即ち、「y」として、観測未知パターンqに近いk個の多次元時系列信号を求め、このyのモデルとして、「y~」を求め、偏差「e」を算出する。
【0042】
なお、単に、1クラス識別の問題と考えれば、1クラスサポートベクターマシンなどの識別器も適用可能である。この場合、高次空間に写像する、radial basis functionなどのカーネル化が使えることになる。1クラスサポートベクターマシンでは、原点に近い側が、はずれ値、即ち異常になる。ただし、サポートベクターマシンは、特徴量の次元は大きくても対応できるが、学習データ数が増えると計算量が膨大となるという欠点もある。
【0043】
このため、MIRU2007(画像の認識・理解シンポジウム、Meeting on Image Recognition and Understanding 2007)にて発表されている、「IS-2-10 加藤丈和,野口真身,和田俊和(和歌山大),酒井薫,前田俊二(日立);パターンの近接性に基づく1クラス識別器」などの手法も適用可能であり、この場合、学習データ数が増えても、計算量は膨大なものとならないというメリットがある。
【0044】
次に、局所部分空間法を例にとり、実施例を説明する。
【0045】
図9に、局所部分空間法の適用例を示す。対象は、図5に示した、検査装置の光電子増倍管のセンサデータである。試料1は、ウェーハである。ほぼ30nmの異物がウェーハ上に付着しているが、目視では検知不能である。ここでは、安定な結果を得るべく(後述するバギングという手法と同様の考えに基づく)、パラメータkは、最大を15とし、kをこの範囲で変えて、距離の最小値を出力した。同図適用例では、下段に異常測度として、距離の最小値を示すが、欠陥部で値が大きくなり、極めてS/N高く欠陥が検知されていることがわかる。バンドパスフィルタや、異物信号をガウシアンと見てガウシアンとのフィッティングなどの結果よりも、感度が高いことを確認した。設計上の事前情報は、何ら使っていないにも拘らず、本発明により、優れた感度を提供し得ることが分かる。
【0046】
上記例では、観測データが属しているクラスタ以外を学習データとし、このデータと観測データに局所部分空間法を適用した。すなわち、検査中に観測データから学習データを生成するものとしている。この方法によれば、事前の学習データの準備が不要である。鏡面ウェーハの場合、近接するスキャンの観測データを、学習データとしてもよい。このようにすれば、ウェーハの回転数が一定で半径方向で周速が異なる場合でも、半径方向の位置に依存せず、学習データを使用できる。
検査中に観測データから学習データを生成する方法では、同質のデータであるが、別クラスタに見えるデータ群からの乖離度を評価していることになる。もちろん、投影距離法も同様な概念を適用できる。
【0047】
このように、部分空間法では、低次元モデルで多次元時系列信号を表現することにより、複雑な状態を分解でき、簡単なモデルで表現できるため、現象を理解しやすいという利点がある。また、モデルを設定するため、SmartSignal社の方法のように完全に、データを完備する必要はなく、データの欠落があっても良いというメリットがある。
なお、ほぼ正常データからなる学習データ(統計モデル)は、検査中に観測データから生成するか、検査に先立ち事前に生成しておくことになるが、後者の場合、学習データは、検査条件、例えば、光学倍率(検出画素寸法)、ウェーハの回転速度、レーザのスポット径や、レーザ照度、照明と受光の偏光状態などに応じて、個別にもち、選択して使用するものとする。
【0048】
図10に別の信号処理手順の実施例を示す。図4において説明した処理と同じ処理を行うところは、同じ番号で示す。図4に示した処理手順と異なる点は、Wavelet(変換)解析を付加した点である。
まず、多次元時系列信号を取得し(S101)、次に、取得した多次元時系列信号が、欠損している場合があるため、欠損値の修正・削除を欠損値の修正・削除処理(S102)を行う。次に、Wavelet解析信号付与処理(S114)において、M次元の多次元時系列信号を対象に、図11に示すWavelet解析を行い、これらの信号をM次元の多次元時系列信号に加える。M次元の多次元時系列信号と置換することも可能である。このような新規に加えられたり、置換されたりした多次元時系列信号を対象に、主成分分析処理、(S105)、奇跡分割によるクラスタリング処理(S106)、各クラスタを対象に低次元部分空間でのモデル化処理(S108)を行い、局所部分空間法などの識別器によりモデルからの偏差(逸脱)を算出し(S109)、この算出した偏差を予め設定した値と比較し、比較した結果、偏差が予め設定した値よりも大きい場合には異常として特定され(S110)、異常に関する情報が出力される(S111)。
【0049】
Wavelet解析は、多重解像度表現を与えるものである。図18にWavelet解析を図解して示す。図18(a)のスケール1の信号がもとの信号である。これを順次隣と加算して図18(b)に示すようなスケール2の信号を作り、元の信号との差を算出して、スケール2の変動信号を生成する。更に、図18(c)に示すようなスケール4の信号を作り、元の信号との差を算出して、スケール4の変動信号を生成する。最後に、図18(d)に示すようなスケール8の一定値の信号とその変動信号が得られ、結局、元の信号は、スケール2、4、8の各変動信号とスケール8の直流信号に分解できる。従って、このようなスケール2、4、8の各変動信号を、新たな特徴的信号とみなして、多次元時系列信号に追加して扱う。
【0050】
パルスやインパルスなどの非定常信号では、フーリエ変換を行って得られる周波数スペクトルは全域に広がり、個々の信号について特徴を抽出することが困難である。時間に局在したスペクトルを得ることができるWavelet変換は、化学プロセスのような、パルスやインパルスなどを含む、非定常な信号を多く含むデータを対象にした場合に都合がよい。
【0051】
また、一次遅れをもつ系では、時系列の状態だけでは、そのパターンを観測困難であるが、時間・周波数領域上では、識別可能な特徴が現れることがあり、Wavelet変換が有効な場合が多い。
【0052】
なお、Wavelet解析の応用は、電気学会編集で、新誠一著の「ウェーブレット解析の産業応用」2005年、朝倉出版にくわしい。化学プラントの制御系診断、空調プラント制御における異常検知、セメントの焼成プロセスの異常監視、ガラス溶解炉制御など、多くの対象に適用されている。
【0053】
本実施例における、従来技術との相違点は、Wavelet解析を多重解像度表現として扱い、もとの多次元時系列信号の情報を、Wavelet変換により顕在化した点にある。その上で、これらを多変量として扱うことにより、微弱な異常が高感度に検知できる。
図12に別の信号処理手順の実施例を示す。図12に示した処理手順は、図4で説明した処理手順に対して、各クラスタを対象にモデル化する工程(S108)を、散布図・相関解析処理(S115)する工程に置き換えたものである。
【0054】
r次元の多次元時系列信号を対象に、散布図・相関解析を行った例を図13に示す。図13の相互相関解析では、遅れのラグ(lag)を考慮している。通常、相互相関関数の最大値の位置をラグと呼ぶ。この定義に従えば、二つの現象に関する時間のずれは、相互相関関数のラグに等しい。図13において、横軸が遅れのラグ(lag)を表し、縦軸が相互相関関数の値を示す。同図は、いくつかの信号間に相互相関解析を適用した結果である。
【0055】
ラグの正負は、二つの現象のどちらが早く起こるかにより決まる。このような散布図解析や相互相関解析の結果は、時系列信号間の相関を表すものであるが、各クラスタの特徴付けにも活用でき、クラスタ間の類似性の判断指標となり得るものである。例えば、ラグの量の一致度により、クラスタ間の類似性を判断する。
【0056】
図14に別の信号処理手順の実施例を示す。図14に示した処理手順は、図4で説明した処理手順に対して、各クラスタを対象にモデル化する工程(S108)を、各クラスタ毎に時間・周波数解析処理(S115)を施す工程に置き換えたものである。r次元の多次元時系列信号を対象に、時間・周波数解析を行った例を図15に示す。
図15の(a)に示す信号に対し、同図の(c)は周波数の時間変化量を、(b)に示す信号に対し(d)は周波数の時間変化量をプロットしたものである。縦軸が周波数を表し、横軸が時間を表す。時間・周波数解析、或いは散布図・相関解析を行い、これらの信号をM次元の多次元時系列信号に加える、またはM次元の多次元時系列信号と置換することも可能である。
【0057】
図16に更に別の信号処理手順の実施例を示す。図16に示した処理手順は、図4で説明した処理手順に対して、欠損値の修正・削除工程S102において状態データS103を用いて処理し、学習データをデータベース(DB)化し(S117)、このDB化した学習データをモデル化(1)する工程(S118)を付加した例である。
【0058】
図17に、その詳細を示す。データベース(DB)化(S1702)した学習データを対象にモデル化(1)(S1703)により複数のモデルとしてモデル化し、観測データとの類似性を判断して該当モデルを当てはめ、観測データとの偏差を算出する(S1705)。軌跡分割によるクラスタリング処理(S1701)をしてモデル化(2)(S1707)する工程は、図4のS106とS108の処理と同様の部分であり、これから、観測データから得られるモデルとの偏差を算出する(S1708)。
【0059】
そして、モデル化(1)(2)のそれぞれの偏差から、状態変化を算出し、総合偏差を算出する(S1706)。ここで、モデル化(1)(2)を均等に扱うことも可能であるが、重み付けをしてもよい。即ち、学習データを基本と考えれば、モデル(1)の重みを大きくし、観測データを基本と考えれば、モデル(2)の重みを大きくする。
【0060】
モデル(1)で構成した部分空間モデルをクラスタ間で比較すれば、そしてそれらが本来同一状態のクラスタならば、その状態変化を知ることができる。そして、観測データの部分空間モデルがそれから移動していれば、状態変化を読み取ることができる。状態変化が、装置の部品交換など意図するものであれば、即ち、設計側が知っており、それによる変化を許容すべきであれば、モデル(1)の重みを小さくし、モデル(2)の重みを大きくする。状態変化が、意図しないものであれば、モデル(1)の重みを大きくする。例えば、パラメータαを、モデル(1)の重みとして使えば、
α×モデル(1)+(1−α)×モデル(2)
として定式化できる。
【0061】
モデル(1)の重みを、古いものほど小さくするという忘却形のものでもよい。この場合、最近のデータに基づくモデルが重視されることになる。
【0062】
図17において、S1704のステップで作成する物理モデルは、光学シミュレーションにより対象パターンと撮像系などを模擬したモデルである。対象知識が十分にある場合は、対象パターンの見え方などをモデルで表現できるので、各種情報を利用可能となる。従って、この物理モデルに従えば、このモデルからの偏差に基づいて、異常検知を行うことも可能となる。特に、モデル化(1)により生成されたモデル、この場合は統計モデルに対し、シミュレーションモデルは、これに意味付けができ、統計モデルの振る舞いの拘束条件ともなり、より強力なモデリングが実現できる。
【0063】
もちろん、物理モデルに従って、学習データのモデル(1)を修正することも可能である。或いは、逆に、学習データのモデル(1)に従って、物理モデルを修正することも可能である。物理モデルの変形として、過去の実績としての知見を、物理モデルとして組み込むことも可能である。アラームの発生や部品交換(S1709)に伴うデータの遷移を、物理モデルに組み込むことも可能である。或いは、データベース化(S1702)する学習データ(個々のデータや重心位置など)を、アラームの発生や部品交換の情報を受けて(S1709)、移動させてもよい。
【0064】
なお、図17に対して、図4から図16までに示したように、物理モデルに対して、統計モデルを主に使うのは、データを生み出すプロセスについての理解が少ない場合に、統計モデルが有効であることによる。距離や類似性は、データの生成過程が不明瞭でも、定義できる。画像が対象である場合も、画像生成過程が不明瞭なとき、統計モデルは有効である。対象に関する知識が、すこしでも利用できる場合には、物理モデル22が活用できることになる。
【0065】
図19に、図1の欠陥判定部50に相当するハードウェア構成を示す。異常検知を実行するプロセッサ19に、対象とするセンサ9a,9b,9cからのセンサデータを入力し、欠損値の修復などを行って、データベース(DB)21に格納する。プロセッサ19は、取得してデータベース21に格納された観測センサデータ、学習データからなるDBデータを用いて、異常検知を行う。表示部20では、実施例において述べたような各種表示を行う。異常検知の有無や、後述する異常説明のメッセージを出力する。トレンドを表示することも可能とする。
【0066】
データベースDB21は、熟練エンジニアらがDBを操作できる。特に、異常事例や対策事例を教示でき、格納できる。(1)学習データ(正常)、(2)異常データ、(3)対策内容が、格納される。データベースDBを、熟練エンジニアらが手を加えられる構造にすることにより、洗練された、有用なデータベースができあがることになる。データ操作は、学習データ(個々のデータや重心位置など)を、アラームの発生や部品交換に伴い、移動させることにより行う。また、取得データを追加することも可能である。異常データがあれば、データの移動に、一般化ベクトル量子化などの手法も適用できる。
【0067】
上記実施例では、検査装置を対象に説明したが、時系列信号のたぐいならば、対象にこだわらない。検査装置以外の製造設備や、ひいては人体の測定データへも適用可能である。本実施例に従えば、状態の数、遷移の回数が多くても、対応可能である。
【0068】
また、実施例にて説明した各機能、例えばクラスタリング、主成分分析や、Wavelet解析などは、必ず実施するというものでもなく、対象の信号の性質に応じて、適宜実施すればよい。
【0069】
クラスタリングも、時間軌跡のみならず、混合分布に対するEM(Expectation-Maximization )アルゴリズムやk-meansクラスタリングなどを含め、データマイニング分野における手法が使えることは言うまでもない。得られたクラスタは、これを対象に識別器を適用してもよいが、クラスタをグルーピングして、これを対象に識別器を適用してもよい。最も簡単な例は、観測データが属するクラスタと、それが属するクラスタ以外に分けることである。また、センサ信号(特徴量)の選択は、ラッパー法(例えば、backward stepwise selectionにより、全ての特徴量がある状態から、最も不要な特徴を一つずつ取り除く)など、既存の手法が適用可能である。
【0070】
さらに、識別器は、いくつかの識別器を準備し、それらの多数決をとることも可能である。即ち、異なる識別器群を用いたアンサンブル(集団)学習が適用できる。図20にその構成例を示す。例えば、識別器h1(201)は投影距離法、識別器h2(202)は局所部分空間法、識別器h3(203)は線形回帰法と言ったものである。事例データに基づくものならば、任意の識別器が適用可能である。
【0071】
複数の識別器h1、h2、h3・・・(201,202,203、・・・)を使う理由は、識別器はそれぞれ異なる基準、異なる対象データ範囲(セグメント分けやその統合に依存)で、はずれ具合いを求めるため、その結果に微妙な違いが生まれるためである。このため、統合処理部204で複数の識別器からの出力に対して多数決をとって安定化するか、OR(はずれ値そのもの、すなわち多値の場合は最大値検出)論理で、いずれかの識別器で異常が検知されれば異常が発生したとして出力し、異常をのこらず検知しようとするか、AND(多値の場合は最小値検出)論理で、いずれの識別器でも同時に異常が検知されれば異常が発生したとして出力し、誤検知を最小限にするといった、上位基準で識別器を構成する。
【0072】
複数の識別器h1、h2、・・・(201,202,203、・・・)をすべて同じ識別器とし、対象データ範囲(セグメント分けやその統合に依存)を変えて学習することも可能である。例えば、パターン認識の代表的手法であるバギングやブースティングなどの手法も適用できる。この手法の適用により、異常検知に関して、より高い正解率が確保できる。ここで、バギングは、N個のデータから重複を許してデータをK個取ってきて(復元抽出)、このK個を元に1個目の識別器h1(201)を作り、またN個のデータから重複を許してデータをK個取ってきて、このK個(1個目の識別器と中身が違う)を元に2個目の学習器h2(202)を作ることを続け、異なるデータからいくつかの識別器を作り、実際に判別器として使う時は多数決を取る方法である。
【0073】
ブースティング(Adaboostと呼ぶ手法)は、N個のデータに均等な重み 1/N をまずは割り当て、1個目の識別器h1(201)はN個全てのデータを用いて学習し、学習した後、データN個に関して正解率を調べ、それを元に信頼度β1(>0)を求める。1個目の識別器が正解したデータの重みをexp(-β1)倍して重みを減らし、正解できなかったデータの重みをexp(β1)倍して重みを増やす。
【0074】
2個目の識別器h2(202)はN個全てのデータを用いて重み付きの学習を行い、信頼度β2(>0)を求め、データの重みを更新する。2個とも正解したデータの重みは軽く、2個とも間違えたデータの重みは重くなる。以降、これを繰返してM個の識別器を作り、実際に判別器として使う時は信頼度付き多数決を取るものである。これらの手法を、クラスタ群を対象に適用することにより、性能向上が期待できる。
【0075】
図21に、図20に示した識別器を含んだ、異常検知全体の構成例の一例を示す。多次元時系列信号210を受けて軌跡クラスタリング・特徴選択など処理211を経て、局所部分空間法2121、部分空間法2122、線形回帰法2123、線形予測法2124などのアンサンブル学習を行ってモデル化212し、統合処理213を行うことにより高い識別率を達成するものである。線形予測法212−4は、現在までの時系列データを用いて、次の時刻のデータを予測するものであり、この予測値を現在までのデータの一次結合で表し、Yule Walker方程式に基づいて予測する方式である。予測値との誤差が、乖離度になる。
【0076】
統合処理部204で実行する各識別器h1、h2、・・・(201,202,203、・・・)からの出力を統合する方法は上述した通りであるが、軌跡クラスタリング・特徴選択処理211でクラスタリングされたクラスタについてどのクラスタに、どの識別器を適用するかという組み合わせは、いくつか存在する。例えば、観測データとは異なるクラスタに対して局所部分空間法212−1を適用して、異なるクラスタからのはずれ具合いを把握し(推定値も算出する)、観測データと同じクラスタに対しては回帰分析法(線形回帰法212−3と同じ)を適用して、自クラスタからのはずれ具合いを把握する。
【0077】
そして、それらの識別器出力を統合処理213で統合して、異常判定を行うことができる。他のクラスタからのはずれ具合いを、投影距離法(部分空間法212−2)や回帰分析法(線形回帰法212−3と同じ)により行うことも可能である。自クラスタからのはずれ具合いを投影距離法(部分空間法212−2)により行うこともできる。クラスタ間の類似性を判断し、類似クラスタを統合して、これを対象にすることもできる。識別器出力の統合は、はずれ値の加算、最大・最小、OR/ANDなどのスカラー変換処理でもよいし、識別器の出力をベクトル的に、多次元として扱うこともできる。もちろん、識別器出力のスケールは、極力一致させることとする。
【0078】
上述したクラスタとの関連の持たせ方に関して、さらに、他クラスタを対象にして第1報の異常検知を行い、自クラスタのデータが収集された時点で自クラスタを対象にして第2報の異常検知を行ってもよい。このように、本実施例は、対象クラスタ群との関係において、信号の振舞い、behaviorに、より着目した実施例と言える。
【0079】
次に、正常事例を主に格納した学習データの蓄積と更新、及び改良について、説明する。検査に先立ち事前に生成しておく例を説明する。
図25AおよびBは、最も簡単な例である。図25Aに、動作フローを示し、図25Bにブロック図を示す。いずれも、図19に示したプロセッサ19にて実行される内容である。学習データの重複を減らし、適切なデータ量にするものである。このため、データ間の類似度を用いる。先ず学習データ記憶部2501に記憶されている学習データをデータ間の類似度算出演算部2502に読み出し(S251)、データ間の類似度算出演算部2502で学習データに含まれるデータに対して、逐次、データ間の類似度を算出し(S252)、類似度判定部2503で類似度が近いと判定した(S253)に場合には、データ削除判断部2504でデータが重複していると判断してデータ削除支持部2505に判断結果を送り、学習データからデータ削除(S254)することによりデータ量を削減して、容量を最小限にするものである。類似度が、いくつかのクラスタ、グループに分かれる場合は、ベクトル量子化と呼ばれる手法になる。類似度の分布を求め、分布が混合分布のときは、各分布の中心を残す手法も考えられ、一方、各分布のすそを残すという手法も考えられる。こういった種々の手法により、データ量を減らすことができる。学習データの量が減れば、観測データとの照合の負荷も小さくなる。
【0080】
なお、入力情報である設計データ情報2502’は、類似度算出を行う学習データの使用範囲を定めるために使われる。すなわち、設計データにより、パターン情報を抽出し、パターンの類似性を前もって判断し、これにより学習データを類似性によりクラスタに分けておく。この分けたクラスタに基づき、学習データを随時選んで、更新する。
次に、図24A及びBを用いて、データを増やす場合を含む例を説明する。図24Aに、動作フローを示し、図24Bにブロック図を示す。いずれも、図19に示したプロセッサ19にて実行される内容である。図24Aにおいて、図25Aと同様に、観測データ取得部2401で観測データを取得し(S242)、学習データ記憶・更新部2402に記憶されている学習データを読み出し(S243),データ間の類似度算出演算部2403で観測データと学習データとのデータ間の類似度を算出する(S244)。次に、類似度判定部2404でデータ間の類似度を判定し(S245)、データ削除、追加判定部2405で類似度に基づいて、そのデータの異常の有無(入力)を用いて、学習データからデータ削除・追加を判断し(S246)、削除・追加が必要と判断したときにはデータ削除・追加指示部2406から学習データ記憶・更新部2402に指示して学習データの削除・追加を行う(S247)。
【0081】
すなわち、類似度が低い場合には、そのデータが正常であるが、既存の学習データに包含されていないデータであるか、そのデータが異常であるという二通りのケースがある。前者の場合は、学習データに追加し、後者の場合には、観測データを学習データに追加しない。類似度が高い場合には、そのデータが正常であれば、学習データにはそのデータが包含されていると考え、観測データは学習データに追加せず、データが異常の場合は、学習データから選択したデータも異常と考え、これを削除する。このようにして、更新した学習データを用いて、あらたに取得した観測データと、学習データに含まれる個々のデータの乖離度に基づいて、観測データの異常を検知する。学習データにクラスタを属性として付加することもできる。クラスタ毎に学習データが生成・更新されることになる。
なお、設計データ情報2403’は、図25AおよびBで説明した設計データ情報2502’と同様である。
【0082】
学習データ(統計モデル)は、検査中に観測データから生成するか、検査に先立ち事前に生成しておくことになるが、図25A及びB、図24A及びBは、いずれの場合にも適用可能である。
図26Aは、図21の変形である。正常事例からなる学習データ2611を用いてモデル化部262で局所部分投影法2621、投影距離法2622、線形回帰法2623、線形予測法2624などでモデル化し、多次元時系列信号260から特徴抽出/選択/変換部261で抽出した観測データとの乖離度を求め、統合処理部263でモデル化部で算出された乖離度のデータを統合して異常264を検知する。また、異常の説明メッセージ265を出力する。正常事例からなる学習データの生成や更新は、上述したとおりである。図26Bに、ユーザが入力のするパラメータ入力画面265の一例を図示する。ユーザ入力のパラメータは、データのサンプリング間隔2651、観測データの選択2652、異常判定のしきい値2653などである。観測データの選択は、センサ信号のどれをおもに使うかを指示するものである。異常判定のしきい値2653は、算出した、モデルからの偏差・逸脱、はずれ値、乖離度、異常測度などと表現した、異常らしさの値を2値化するしきい値である。
【0083】
図23は、図26(b)の特徴抽出/選択/変換部261にて使われる特徴変換の一例を表形式に示したものである。種類の欄に記載したように、主成分分析以外にも、独立成分分析、非負行列因子分解、潜在構造射影、正準相関分析など、いくつかの手法が適用可能である。同図に機能を併せて示した。主成分分析は、PCAと呼ばれ、次元削減におもに使われる手法である。独立成分分析は、ICAと呼ばれ、非ガウス分布を顕在化する手法として効果がある。非負行列因子分解は、NMFと呼ばれ、行列で与えられるセンサ信号を、非負の成分に分解する。教師なしとしたものは、本実施例のように、異常事例が少なく、活用できない場合に、有効な変換手法である。ここでは、線形変換の例を示した。非線形の変換も適用可能である。
【0084】
図22は、手法の評価システム(オフラインとして、検査装置の動きをシミュレートする)をまとめたものである。異常の測度や、検知の的中率、虚報率を評価する。異常の説明性も評価対象である。同図において、センサデータが入力されると、特徴抽出・選択・変換部2202により、センサデータに対する特徴抽出・選択・変換が行われる。次に、この出力データに対して、クラスタリング部2203においてクラスタリングがなされ、いくつかのグループに分けられる。このとき、分析部2205において、センサデータに対する分析が行われ、クラスタリング部に伝達され、有効なクラスタリングが行われるよう支援する。
【0085】
グループごとに、学習データ選択部2204において、学習データとして適したデータが選ばれる。学習データを用いて、特徴抽出・選択・変換部2202の出力データに対する識別が、識別部2211にて行われる。識別部2211は、異常の度合いを表す異常測度を出力する。ここでは、複数の識別器が準備され、その結果が統合部2209にて統合される。統合部2209でも、異常測度が出力される(図示せず)。統合結果は、次の異常診断部2210に送られ、異常診断のトリガーになる。照合評価部2206は、識別結果の良否を判断するものである。ここでは、的中率や虚報率が出力される。また、異常予兆の説明も行われる。
【実施例2】
【0086】
次に、本発明を第1の実施例とは異なるタイプの検査装置を用いた欠陥の検出に適用した例を、図27を用いて示す。
【0087】
本発明が対象とする検査装置は、検査対象物(半導体ウェーハ11)に対して照明光を斜方から照射する複数の照明部15a,15bと、半導体ウェーハ11からの垂直方向への散乱光を結像させる複数のレンズや光学素子を備えた検出光学系(上方検出系)16と、斜方向への散乱光を結像させる複数のレンズや光学素子を備えた検出光学系(斜方検出系)130と,それぞれの検出光学系により結像された光学像を受光し、画像信号に変換する検出部17,131と、得られた画像信号を処理する画像処理部18と、全体制御部19とを適宜含んで構成される。半導体ウェーハ11はXY平面内の移動及び微小回転とZ方向への移動が可能なステージ(X-Y-Z-θステージ)12に搭載され、X-Y-Z-θステージ12はメカニカルコントローラ13により駆動される。このとき、半導体ウェーハ11をX-Y-Z-θステージ12に搭載し、該X-Y-Z-θステージ12を水平方向に移動させながら被検査対象物上の異物からの散乱光を検出することで、検出結果を二次元画像として得る。
【0088】
照明部15a,15bの照明光源は、レーザを用いても,ランプやLEDを用いてもよい。また、照明光源の波長の光は短波長であってもよく、また、広帯域の波長の光(白色光)であってもよい。短波長の光を用いる場合、検出する画像の分解能を上げる(微細な欠陥を検出する)ために、紫外領域の波長の光(Ultra Violet Light:UV光)を用いることもできる。レーザを光源として用いる場合、それが単波長のレーザである場合には、可干渉性を低減する手段(図示していない)を照明部15a,15bに備えることも可能である。
【0089】
半導体ウェーハ11から発した散乱光は光路が分岐され,一方は検出光学系16を介して検出部17にて画像信号に変換される。また,一方は検出光学系130を介して検出部131にて画像信号に変換される。
【0090】
検出部17は、イメージセンサに複数の1次元イメージセンサを2次元に配列して構成した時間遅延積分型のイメージセンサ(Time Delay Integration Image Sensor:TDIイメージセンサ)を採用し、X-Y-Z-θステージ12の移動と同期して各1次元イメージセンサが検出した信号を次段の1次元イメージセンサに転送して加算することにより、比較的高速で高感度に2次元画像を得ることが可能になる。このTDIイメージセンサとして複数の出力タップを備えた並列出力タイプのセンサを用いることにより、センサからの出力を並列に処理することができ、より高速な検出が可能になる。もちろん、TDIイメージセンサ以外の、EBCCDやEMCCDであってもよい。EBCCDは、光電面からの光電子を数kVに加速してCCDに衝突させることにより、1200倍程度のゲインを得ることができる。EMCCDは、CCDに電子増倍転送部を設けることにより2000倍程度のゲインを得ることができる。
【0091】
検出部131は、1次元イメージセンサであり、EBCCDやEMCCDであってもよい。
画像処理部18は被検査対象物である半導体ウェーハ11上の欠陥を抽出するものであって、検出部17,131から入力された画像信号に対してシェーディング補正、暗レベル補正等の画像補正を行い、一定単位の大きさの画像に分割する前処理部18−1、補正、分割された画像から欠陥候補を検出する欠陥候補検出部18−2、検出された欠陥候補からユーザ指定の不要欠陥やノイズ以外の欠陥を抽出する欠陥抽出部18−3、抽出された欠陥を欠陥種に応じて分類する欠陥分類部18−4、外部から入力されるパラメータなどを受け付けて、欠陥候補検出部18−2および欠陥抽出部18−3へセットするパラメータ設定部18−5を適宜含んで構成される。
【0092】
全体制御部19は、各種制御を行うCPU(全体制御部19に内蔵)を備え、ユーザからのパラメータなどを受け付け、検出された欠陥候補の画像、最終的に抽出された欠陥の画像等を表示する表示手段と入力手段を持つユーザインターフェース部19−1、検出された欠陥候補の特徴量や画像等を記憶する記憶装置19−2と適宜接続されている。メカニカルコントローラ13は、全体制御部19からの制御指令に基づいてX-Y-Z-θステージ12を駆動する。尚、画像処理部18、検出光学系16,130等も全体制御部19からの指令により駆動される。
【0093】
ここで,本発明では,半導体ウェーハ11からの散乱光像である画像信号に加え,半導体ウェーハ11の設計情報30も画像処理部18に入力される。そして,画像処理部18では,二つの画像信号に加え,設計情報も統合して,欠陥抽出処理を行う。設計情報は、類似度算出を行う学習データの使用範囲を定めるために使われる。すなわち、設計データにより、パターン情報を抽出し、パターンの類似性を前もって判断し、これにより学習データを類似性によりクラスタに分けておく。この分けたクラスタに基づき、学習データを随時選んで、使用する。
【0094】
図26(a)に示した本発明の異常検知システムは、図27に示した構成における画像から欠陥候補を検出する欠陥候補検出部18−2、検出された欠陥候補からユーザ指定の不要欠陥やノイズ以外の欠陥を抽出する欠陥抽出部18−3において適用される。すなわち、図19に示した構成は、欠陥候補検出部18−2や欠陥抽出部18−3に含まれるものとなる。
部分空間法は、ゴールデン画像を用いたゴールデン比較手法とは異なる。ここで、ゴールデン比較とは、複数ダイなどの繰返しパターン間で、対応画像の平均などを計算して、良品画像としてゴールデン画像を取得し、これと比較するものである。部分空間は、対象の変動を数学的に、より効果的に表現できるため、ゴールデン比較とは異なり、パターンの膜厚変動や、ウェーハのラフネスや、観測時の画像劣化などを反映でき、これらを吸収できるため、高い感度を実現できる。なお、ゴールデン比較では、明るさ変動などを画素の明るさの分散などで表現することもあるが、劣化や変動の状態を数学的に表現できるという意味で、部分空間法に及ばない。局所部分空間法に従えば、さらに類似度の高い画素で部分空間を形成するため、モデル(正常部)の表現能力が高いものとなる。要は、モデルの表現能力がより高いものを採用すべきと考える。
【0095】
また、従来法では、対応画素は、ダイ比較では隣接するダイの一箇所であり、ゴールデン比較でも代表値という一点であり(標準偏差を併用することもあるが)、部分空間法のように複数画素の多次元レベルの統計的集団と比較することはしない。このため、従来法では、対応画素の明るさという1次元尺度に依存したものとなり、モデル(正常部)の表現能力が乏しいため、検査感度に制限が生じる。本発明では、これらの制約から解き放つものであり、高感度な比較が実現できる。
なお、欠陥抽出部18−3に本発明が適用される場合には、イメージセンサによる画像検出と同期する必要はなく、オンザフライとも見なされ、欠陥の検出と同期するため、処理時間に余裕があり、学習データとしてより多くが対象にできる。
【0096】
図4に示した処理フローにおいて、軌跡分割によるクラスタリングを軌跡分割によるクラスタリングステップS106にて行い、時間に沿ってデータ間の距離が定めたしきい値を超えれば、別のクラスタとし、しきい値を超えなければ、同じクラスタとして扱うと説明したが、パターン付きのウェハを検査する場合には、クラスタリングにより、パターンの状態に応じて自動的にセグメンテーションがなされ、類似度の高い学習データが自動的に選択されることになる。
【0097】
図28A,Bに、上記検査装置のセンサ17のデータ(画像)に対して、本発明を適用した結果を示す。図28Aに示すような画像を、5×5画素ずつ縦方向にスキャンし、下端までいくと、重複なしで、右上に移動し、同様にスキャンして、多次元時系列信号を生成した。これにより、25次元ベクトルが、6000個弱並んだものになる。図28Bにそのときに得られる信号波形を示すが、図中の縦長の楕円で囲んだ部分の黒丸の点のように、微弱なスクラッチ欠陥が感度高く検出できていることがわかる。
【0098】
本発明によれば、ウェーハやダイの全面でなく、部分検査にも対応できる。これは、対応相手の画素が固定されておらず、類似度に基づいて選択され、部分空間が形成されるため、ダイ間の共通パターン部を狙って画像を検出する必要がなく(画像検出の無駄を減らすことができ)、着目画素を類似度に基づいて自由に選んでも何ら問題が生ぜず(類似度が高い画素を選択的に選ぶことができ)、ホットスポットと呼ばれるような歩留りに影響を与える危険箇所のような部分検査にも、効果的に対応できるためである。
【0099】
図29に別の例を示す。ウェーハ上には、複数のダイが規則的に並んでいる。これを利用し、ダイ間の共通パターン部を狙って対応箇所を設定し、部分空間を形成し、これとの類似度を算出するものである。図29の例では、k=5にて、局所部分空間を形成できる。これにより、学習データを限定できるため、処理時間が大幅に削減できる。さらに、事前に学習データを準備する必要がなく、オンラインで学習データ生成と比較が実行できる。対応箇所は、ダイ間で位置合せされていることが望ましい。
【0100】
図33に更に別の例を示す。欠陥検出時の比較対象パターンとして同一ダイ内の類似パターンとの比較を含んでよいことにすると、パターンの変動が小さく、より高感度な検査が実現できることになる。図33に、その処理手順を示す。即ち、信号処理部18で実行する処理手順は次の通りである。
【0101】
隣接ダイ33a及び着目ダイ33bにて類似対応局所領域を探索し(S331)、類似度に基づき並べ替えを行い(S332)、隣接ダイ33a及び着目ダイ33bにて、着目画素(着目局所領域)に類似している対応局所領域R1、R2、R3、・・・を決定し(S333)、着目画素(着目局所領域)と対応局所領域R1、R2、R3との比較を行い(S334)、多数決など多値論理にて、欠陥判定を行う(S335)。
【0102】
着目ダイ内の比較では、局所領域間の類似度が高いと予想される。このため、例えば、重みを設定する場合、着目ダイ内で比較するときにはその差に対する重みが大きいことになる。
【0103】
上述した第2の実施の形態は、図27に示した暗視野検査の画像を対象にしたものである。異物や各種の欠陥(配線ショート、断線、パターン細り、パターン太り、スクラッチ、穴非開口など)を検出可能な光学条件(照明の波長、照明の偏光、照明方位、照明仰角、照明ビームの開口数、検出方位、検出仰角、検出する偏光、および検出開口数など)が欠陥ごとに異なるため、欠陥種ごとに光学条件を変える必要があるが、条件を変えても、何ら問題なく本第2の実施の形態は適用可能である。
また、上述した暗視野式の検査装置のみならず、明視野式検査装置、電子線式の検査装置などにも適用可能である。
【0104】
上述したいくつかの実施例に関する総合的効果をさらに補足する。本発明では、設計上の情報をほとんど使わないでも、高感度か検査が実現できることを示した。現場での検査装置の種々の検査条件にも適合できる。さらに、異なる検査装置にも適用できる。上述したいくつかの実施例によれば、
ほぼ正常なデータから、異常を検知できる、
データ収集が不完全でも精度の高い異常検知が可能となる、
異常データが包含されていても、この影響を許容できる、
といった直接的効果に加え、ユーザにとって
異常検出のプロセスを理解しやすい、
検査条件、検査装置に依存せず、複雑なパラメータ設定を必要としない、
物理モデルも併用できる、
と言った効果がある。
【符号の説明】
【0105】
15a,15b・・・照明部 16,130・・・検出光学系 17,131・・・検出部 18・・・画像処理部 19・・・全体制御部 50・・・欠陥判定部 51・・・特徴量抽出部 52・・・欠陥種寸法判定部 53・・・全体制御部 54・・・表示部 55・・・入力部 101・・・照明部 102・・・検出部 103・・・ステージ 105・・・信号処理部。

【特許請求の範囲】
【請求項1】
欠陥を検査する方法であって、
試料を検査して得られた検出信号から観測データを取得し、
前記検出信号から前記試料上の欠陥の無い部分を検査して得られる検出信号を学習データとして作成し
該作成した学習データから統計モデルを生成し、
前記統計モデルと前記観測データとの類似度を求め、
該求めた類似度に基づいて前記取得した観測データの中から欠陥の位置を判定する
ことを特徴とする欠陥検査方法。
【請求項2】
前記統計モデルを特徴量空間でクラスタリングし、該特徴量空間における前記クラスタリングした前記統計モデルからの前記観察データの偏差を算出し、該算出した偏差を予め設定したしきい値と比較して前記偏差が前記しきい値よりも大きいときに前記観察データを欠陥として該欠陥の位置を判定することを特徴とする請求項1記載の欠陥検査方法。
【請求項3】
前記統計モデルを、前記試料を検査中に得られる観測データから生成することを特徴とする請求項1記載の欠陥検査方法。
【請求項4】
前記統計モデルを、前記試料を検査する前に予め生成しておくことを特徴とする請求項1記載の欠陥検査方法。
【請求項5】
前記統計モデルを前記試料を検査する検査条件ごとに作成することを特徴とする請求項3又は4に記載の欠陥検査方法。
【請求項6】
欠陥を検査する装置であって、
試料を検査して検出された検出信号から観測データを取得する観測データ取得部と、
前記検出信号から前記試料上の欠陥の無い部分を検査して得られる検出信号を学習データとして作成し該作成した学習データから統計モデルを生成する統計モデル生成部と、
該統計モデル生成部で生成した統計モデルと前記観測データ取得部で取得した観測データとの類似度を算出する類似度算出部と、
該類似度算出部で算出した類似度に基づいて前記観測データ取得部で取得した観測データの中から欠陥の位置を判定する欠陥判定部と
を備えたことを特徴とする欠陥検査装置。
【請求項7】
前記統計モデル生成部は前記生成した統計モデルを更に特徴量空間でクラスタリングし、前記類似度算出部は前記統計モデル生成部で前記クラスタリングした統計モデルからの前記観察データの偏差を類似度として算出し、前記欠陥判定部において前記類似度算出部で算出した前記偏差を予め設定したしきい値と比較して前記偏差が前記しきい値よりも大きいときに前記観察データを欠陥として該欠陥の位置を判定することを特徴とする請求項6記載の欠陥検査装置。
【請求項8】
前記統計モデル生成部は、前記統計モデルを前記欠陥検出部で前記試料を検査中に得られる観測データから生成することを特徴とする請求項6記載の欠陥検査装置。
【請求項9】
前記統計モデル生成部は、前記統計モデルを、前記欠陥検出部で前記試料を検査する前に予め生成して記憶しておくことを特徴とする請求項6記載の欠陥検査装置。
【請求項10】
前記統計モデル生成部は、前記統計モデルを前記試料を検査する検査条件ごとに作成することを特徴とする請求項8又は9に記載の欠陥検査装置。
【請求項11】
前記試料を検査して検出信号を取得する検査部を更に備え、該検査部は、前記試料に光を照射して該光の照射による前記試料からの散乱光を検出することにより前記検出信号を取得することを特徴とする請求項6記載の欠陥検査装置。

【図1】
image rotate

【図2】
image rotate

【図3A】
image rotate

【図3B】
image rotate

【図3C】
image rotate

【図3D】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6A】
image rotate

【図6B】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate

【図24A】
image rotate

【図24B】
image rotate

【図25A】
image rotate

【図25B】
image rotate

【図26A】
image rotate

【図26B】
image rotate

【図27】
image rotate

【図28A】
image rotate

【図28B】
image rotate

【図29】
image rotate

【図30】
image rotate

【図31】
image rotate

【図32】
image rotate

【図33】
image rotate


【公開番号】特開2011−7553(P2011−7553A)
【公開日】平成23年1月13日(2011.1.13)
【国際特許分類】
【出願番号】特願2009−149763(P2009−149763)
【出願日】平成21年6月24日(2009.6.24)
【出願人】(501387839)株式会社日立ハイテクノロジーズ (4,325)
【Fターム(参考)】