反復学習制御回路を備える位置制御装置
【課題】 反復学習制御は試行を繰り返すことにより追従誤差の少ない制御入力を得ることができるが、制御対象にパラメータ変動がある場合には、学習性能が劣化し試行の回数が多くなってしまう。
【解決手段】 本発明の位置決め装置は、制御対象の位置を検出する検出部と、前記検出部の出力を目標値から減算する減算部と、前記検出部の出力と前記目標値との偏差が入力されるフィルタを含み、前記制御対象に制御入力をフィードフォワードする反復学習制御回路と、を備える位置制御装置であって、前記制御対象のパラメータ変動を算出する算出手段を備え、前記制御対象のパラメータ変動に応じて前記フィルタの特性が変更されることを特徴としている。
【解決手段】 本発明の位置決め装置は、制御対象の位置を検出する検出部と、前記検出部の出力を目標値から減算する減算部と、前記検出部の出力と前記目標値との偏差が入力されるフィルタを含み、前記制御対象に制御入力をフィードフォワードする反復学習制御回路と、を備える位置制御装置であって、前記制御対象のパラメータ変動を算出する算出手段を備え、前記制御対象のパラメータ変動に応じて前記フィルタの特性が変更されることを特徴としている。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は反復学習制御回路を備える位置制御装置に関するものである。好適には、位置制御装置は露光装置や工作機械におけるステージ装置に適用される。
【背景技術】
【0002】
反復学習制御とは、制御対象の目標軌道に対する追従制御(試行)を繰り返し行うことで、目標軌道に対する偏差を少なくし、高精度な制御を実現するものである。一般に、制御対象に加えた入力と、それに対する出力のみを用いて学習が行えるため、制御モデルに含めることが難しい非線形性や、量子化誤差などを補償することができる。制御対象には、同じ入力に対して同じ出力が得られるような再現性が要求されるが、スキャン方式の半導体露光装置や産業ロボットなどはこの条件を概ね満たしている。そのため、反復学習制御による制御性能の向上が期待され、すでにいくつかの例が示されている。
【0003】
反復学習制御において、ある試行によって得られた出力にもとづいて次の試行の入力を更新するアルゴリズムを学習則という。学習則の代表的なものとして、偏差の2回微分値に定数行列を乗じて入力値を生成するものがある。また、学習則としてPD補償器のようなものを用いることによって制御対象のモデルを求めずに反復学習制御を行う方法も知られている。
【0004】
また、Mooreらはモデルベースの学習則を提案している。この学習則は、学習フィルタと安定化フィルタを備えている。さらに、De Rooverらは、この学習フィルタをH∞制御理論を利用して求めている(非特許文献1)。
【0005】
また、特許文献1には上述のモデルベースの学習則に加えて、偏差の時間−周波数解析を導入して、安定化フィルタを時間とともに変化させることが記載されている。これによりノイズが学習に与える影響を抑えて、学習の効率化を図っている。
【非特許文献1】Synthesis of robust multivariable iterative learning controllers with application to a wafer stage motionsystem,DICK DE ROOVER and OKKO H.BOSGRA,INT.J.CONTROL,2000,VOL.73,NO.10,968−979
【特許文献1】US 7,181,296 B2
【発明の開示】
【発明が解決しようとする課題】
【0006】
反復学習制御は試行を反復することによって適切な入力を得るため、目標軌道に高精度に追従するための入力を得るためには時間を要する。例えば、半導体露光装置では処理時間(スループット)が装置にとって重要な性能であるため、この学習時間をできるだけ短くすることが望まれる。
【0007】
試行回数を減らして適切な入力を得るためには、制御対象のモデルの情報を積極的に活用することが考えられる。しかしながら、上述の文献において学習フィルタは線形時不変のモデルを用いて導出されており、学習フィルタは線形時不変である。
【0008】
そのため、試行の最中にモデルのパラメータが変動すると、モデルと学習フィルタとの整合がとれなくなってしまう。その結果として学習性能が劣化して、かえって試行回数が多くなってしまう。
【0009】
本発明は、上述の点に鑑みなされたものであり、反復学習制御において試行回数を低減し、反復学習にかかる時間を短縮することを目的とする。
【課題を解決するための手段】
【0010】
本発明の位置制御装置は、制御対象の位置を検出する検出部と、前記検出部の出力を目標値から減算する減算部と、前記検出部の出力と前記目標値との偏差が入力されるフィルタを含み、前記制御対象に制御入力をフィードフォワードする反復学習制御回路と、を備える位置制御装置であって、前記制御対象のパラメータ変動を算出する算出手段を備え、前記制御対象のパラメータ変動に応じて前記フィルタの特性が変更されることを特徴としている。
【発明の効果】
【0011】
本発明によれば、制御対象にパラメータ変動が生じた場合であっても、反復学習にかかる時間を短縮しつつ、高精度な位置制御を行うことができる。
【発明を実施するための最良の形態】
【0012】
図1は本発明の例示的な位置制御装置の制御ブロック図である。位置制御装置7は制御対象P(p)の位置を制御する。位置制御装置7は、フィードバック制御器Kと、制御対象P(p)の位置ykを検出する検出部1と、目標値rから検出部1の出力を減算する減算部2とを備える。また位置制御装置7は、制御対象P(p)に反復学習された制御入力を与える反復学習制御回路6を備える。
【0013】
反復学習制御は、目標軌跡に対する追従動作を反復して行うことによって、目標軌跡に対する偏差を低減するものである。以下の説明において試行回数をkとして表す。
【0014】
反復学習制御回路6は、制御入力を生成する学習フィルタL(p)(第1フィルタ)と、学習フィルタL(p)の学習に不要な周波数帯域を遮断する安定化フィルタQ(第2フィルタ)と、生成された制御入力を記憶するメモリ5とを備える。
【0015】
目標値rと検出部1の出力との偏差ek(k回目の偏差)は学習フィルタL(p)に入力され、学習フィルタL(p)の出力が加算部4に入力される。また、k回目の制御入力fkが加算部4に入力される。加算部4からの出力は、安定化フィルタQに入力される。安定化フィルタQの出力はk+1回目の制御入力fk+1としてメモリ5に記憶される。メモリ5に記憶された制御入力fk+1はk+1回目の追従制御において制御対象にフィードフォワード入力として加えられる。すなわち、フィードバック制御器Kの出力uk+1に加算部3で加算される。
【0016】
本発明の特徴として、制御対象P(p)のパラメータpの変動を検出または推定するパラメータ変動算出部Zを備える。そして、このパラメータ変動に応じて学習フィルタL(p)の特性が変更される。
【0017】
パラメータ変動を検出または推定するためには、例えば、予めメモリ(不図示)に制御対象の物理量とパラメータ変動との相関関係を情報(例えばテーブルや関数)として記憶しておき、追従制御中にこの物理量をセンサなどで検出してパラメータ変動を求めればよい。
【0018】
つぎに、学習フィルタL(p)の導出方法について説明をする。
【0019】
学習フィルタL(p)を導出するために、まず、制御対象P(p)をパラメータ変動を含む線形パラメータ変動系(Linear Parameter Varying、以下LPVと略する)のモデルとして表す。
【0020】
一般にLPV系はその状態空間行列がパラメータpの関数となっているプラントであり、以下のように表される。
【0021】
【数1】
【0022】
ここで、図1に示されるフィードバック制御系において、制御対象P(p)とフィードバック制御器Kとの閉ループ系Pcl(p)を以下のように定義する。ここで、フィードバック制御器Kはパラメータ変動に応じて変動することのない固定フィードバック制御器を用いている。
【0023】
【数2】
【0024】
本形態では、学習フィルタL(p)を以下のようにLPV系として表す。
【0025】
【数3】
【0026】
また、図1に示される反復学習制御回路の場合、制御入力は以下のように定義される。
【0027】
【数4】
【0028】
以上の式より、偏差ek+1とekの関係は以下のように表される。
【0029】
【数5】
【0030】
反復学習により偏差が収束するためには、以下の条件を満たせばよい。
【0031】
【数6】
【0032】
この条件を満たすように学習フィルタL(p)を導出することが必要となるが、上記問題は、図3の制御ブロック図(図1を等価変換した図)で表すことができる。図3において、破線で囲まれた部分をPh(p)とすると、Ph(p)の変動に対してL(p)を変動させるゲインスケジュールドH∞制御問題として扱うことができる。したがって、線形行列不等式を用いることで、変動するパラメータのi個の点に対応した線形時不変学習フィルタLiを求めることができる。なお、以下の説明では、線形行列不等式(Linear Matrix Inequality)をLMIと略し、線形時不変学習フィルタ(Linear Time Invariant)をLTI 学習フィルタと略す。LTI学習フィルタLiは以下の行列として表される。
【0033】
【数7】
【0034】
例えば、変動するパラメータの数が1のときは、パラメータの端点の数は2であるので、各端点のLTI学習フィルタL1,L2(不変フィルタ)が求まる。
【0035】
ここで、以下のような補間演算式を用いて2つのLTI学習フィルタ間を補うことで、パラメータpの変動に応じて学習フィルタL(p)の特性を変更することができる。すなわち、学習フィルタL(p)が補間演算部を備える。
【0036】
【数8】
【0037】
ここで、pminは下限値、pmaxは上限値を表す。
【0038】
図4に式(10)の制御ブロック図を示す。ここでL1の係数を定数C1として、L2の係数を定数C2として表している。定数C1と学習フィルタL1の積と、定数C2と学習フィルタL2の積とが加算されて、LPV学習フィルタL(p)が求まる。
【0039】
つぎに、図1の位置制御装置を用いた場合の反復学習制御のフローについて説明する。
【0040】
図2は反復学習制御のフローを示す図である。
【0041】
ステップS1において、1回目の試行を行う。ここでは、反復学習制御回路からの入力を行わずに制御を行う。偏差e1が学習フィルタL(p)に入力され、その出力が安定化フィルタQを通過してf2としてメモリ5に記憶される。
【0042】
ステップS2において、k回目(k>1)の試行を開始する。なお、制御はディジタル制御で行われるので、k回目の試行におけるiサンプル目の制御入力および偏差をfki,ekiと表す。ここで、1回の試行の総サンプル数をjとする。初期条件として、偏差の最大値emax=0として、サンプル数i=0とする。
【0043】
ステップS3において、前回メモリに記憶された制御入力fkを制御器からの出力ukに加える。このようにしてk回目の試行において制御対象は制御される。
【0044】
また、k回目の試行において、k+1回目の制御入力が以下ステップS4〜S5の手順で生成される。
【0045】
ステップS5において、パラメータ変動算出部Zはiサンプル目のパラメータpiを検出または推定し、その結果にもとづいて学習フィルタLi(pi)が算出される。算出方法として例えば上述した数式(10)が用いられる。このようにして学習フィルタLi(pi)が変更される。
【0046】
ステップS5において、偏差ekiが学習フィルタLi(pi)に入力され、その出力が制御入力fkiと加算された後に安定化フィルタQを通過してf(k+1)iとしてメモリ5に記憶される。
【0047】
ステップS6において、偏差ekiと偏差の最大値emaxを比較し、偏差eki>emaxの場合にemaxが更新される。
【0048】
ステップS7において、j<iであればステップS8にすすみ、j≧iであればi=i+1としてステップS2にすすむ。
【0049】
ステップS8において、k回目の試行を終了する。
【0050】
ステップS9において、偏差の最大値emaxを予め設定した設定値と比較し、設定値よりも小さい場合に偏差が十分小さいと判断して学習を終了する。偏差の最大値emaxが設定値よりも大きい場合には、k=k+1としてステップS2にすすむ。
【0051】
以上の反復学習制御を用いて位置を制御することにより、従来の学習フィルタを変動させない反復学習制御と比べて、所定の偏差以下にするために要する試行回数を低減することが可能であり、反復学習にかかる時間を短縮できる。
【0052】
なお、以下の実施例1乃至3において好適なパラメータの例と、効果を示すデータについて説明を行う。
【実施例1】
【0053】
実施例1ではパラメータが制御対象を駆動する駆動手段の推力定数を含む例を説明する。
【0054】
図1を用いて本実施例の位置制御装置について説明する。図1で説明した箇所については重複をさけるため説明を省略する。パラメータ変動算出部Zはパラメータ変動を算出する。具体的には、パラメータ変動算出部Zは、予め求めた制御対象の位置と推力定数との相関関係を表す情報を不図示のメモリに格納し、この情報と、センサ1によって検出された制御対象Pの位置とにもとづいて、推力定数の変動を算出する。後述するようにパラメータは推力定数を含む式で表されるため、推力定数の変動からパラメータ変動を算出することができる。
【0055】
ここで、制御対象の位置と推力定数との相関関係を表す情報は、例えば制御対象を移動させながら図5に示すような推力リプルを検出して、この推力リプルから推力定数を求めることによって得ることができる。
【0056】
つぎに、パラメータpが推力定数を含む場合のLPV系のモデルの導出方法および学習フィルタL(p)の導出方法について説明をする。
【0057】
制御対象の質量をm、変位をx、制御対象への力入力をuu、制御対象を駆動する駆動手段の推力定数をaとしたときに、制御対象は以下のようにモデリングされる。
【0058】
【数9】
【0059】
このモデルをLPVモデルの一形式であるアフィンパラメータ依存モデルに変形する手順を以下に示す。まず、状態ベクトルを
【0060】
【数10】
【0061】
として、式(11)より状態方程式を求めると、
【0062】
【数11】
【0063】
となる。ここで、
【0064】
【数12】
【0065】
とおくと、
【0066】
【数13】
【0067】
となる。ここで、出力方程式を以下のものとする。
【0068】
【数14】
【0069】
さらに、アクチュエータのアンプ特性を以下のような状態方程式、出力方程式とする。
【0070】
【数15】
【0071】
ここで、xw=[xxf]Tとして、式(15),式(16)との拡大形を構成すると、
【0072】
【数16】
【0073】
となる。ここで、システム行列は以下のようになる。
【0074】
【数17】
【0075】
このように、パラメータpを含まない行列A0と、パラメータpの係数のみの行列A1に分割して表すことができる。これより、式(21)は以下のようなアフィンパラメータ依存モデルとなる。
【0076】
【数18】
【0077】
式(22)のモデルとフィードバック制御器を用いた閉ループ系Pcl(P)と、安定化フィルタQとを含む制御系に、重み関数Wと定数δと制御量Z2を導入して一般化プラントを構成すると、図6のようになる。したがって、LMIに基づくゲインスケジュールドH∞制御理論により変動するパラメータのi個の点に対応したLTI学習フィルタLiを導出することができる。ここで、安定化フィルタQをカットオフ周波数350Hzの1次のローパスフィルタとする。
【0078】
また、重み関数Wは、
【0079】
【数19】
【0080】
とする。また、δは微小な定数である。
【0081】
推力定数aの変動の幅を以下のようにする。
【0082】
【数20】
【0083】
そうすると、パラメータpは以下の範囲で変動する。
【0084】
【数21】
【0085】
導出されたLPV学習フィルタを図7に示す。実線と破線はそれぞれ、パラメータpが上限値pmaxの時と下限値pminとなったときの学習フィルタを示す。学習フィルタをそれぞれL1,L2とすると、推力リプルによるパラメータpの変動に適応するLPV学習フィルタは式(10)から求められる。
【0086】
また、この実施例では、安定化フィルタQには、零位相ローパスフィルタを用いている。零位相ローパスフィルタは実時間での処理が行えないため、図9に示すように、制御誤差ekとパラメータpについてもメモリに蓄積する。そして、学習は一回の試行が終了する度ごとに行われる。具体的なフローについて以下に説明する。手順を図10のフローチャートに示す。
【0087】
ステップS11において、1回目の試行を行う。ここでは、反復学習制御回路からの入力を行わずに制御を行う。偏差e1がメモリ11に記憶される。また、パラメータp1がパラメータ変動算出部Zにより算出され、メモリ12に記憶される。偏差e1が学習フィルタL(p)に入力され、その出力が安定化フィルタQを通過してf2としてメモリ5に記憶される。
【0088】
ステップS12において、k回目(k>1)の試行を開始する。このとき、前回メモリ5に記憶された制御入力fkを制御器からの出力ukに加える。このようにしてk回目の試行において制御対象は制御される。また、k回目の試行において、k+1回目(k>1)の制御入力fk+1が以下のS15〜S18でオフライン生成される。なお、制御はディジタル制御で行われるので、k回目の試行におけるiサンプル目の制御入力および偏差をfki,ekiと表す。ここで、1回の動作の総サンプル数をjとする。初期条件として、偏差の最大値emax=0として、サンプル数i=0とする。
【0089】
ステップS13において、偏差ekがメモリ11に記憶される。また、パラメータpkがパラメータ変動算出部Zにより算出され、メモリ12に記憶される。さらに、偏差ekの最大値emaxが検出される。
【0090】
ステップS14において、偏差の最大値emaxを予め設定した設定値と比較し、設定値よりも小さい場合に偏差が十分小さいと判断して学習を終了する。偏差の最大値emaxが設定値よりも大きい場合には、k=k+1としてステップS15にすすむ。
【0091】
ステップS15において、iサンプル目のパラメータpkiをメモリ12から呼び出し、その結果にもとづいて学習フィルタLi(pi)が算出される。具体的には学習フィルタは式(10)により算出される。
【0092】
ステップS16において、メモリからiサンプル目の偏差ekiが呼び出され学習フィルタLi(pi)に入力され、その出力が制御入力fkiに加算される。このようにして出力gkiが算出される。
【0093】
ステップS17において、j<iであればステップS18にすすみ、j≧iであればi=i+1としてステップS15にすすむ。
【0094】
ステップS18において、出力gkは零位相ローパスフィルタである安定化フィルタQを通過してf(k+1)としてメモリに記憶される。
【0095】
ステップS19において、k=k+1としてS12に進み、次の試行を開始する。以上のステップを繰り返すことによって学習制御を行う。
【0096】
以下、本実施例のシミュレーション結果について説明する。
【0097】
シミュレーションとして、図8に示した目標軌跡(位置プロファイル)に制御対象を追従制御させる。なお、上述の反復学習による制御入力、フィードバック入力に加えて、位置プロファイルから求めた加速度を定数倍したフィードフォワード入力を与えている。
【0098】
図11は10回の試行を行った場合の偏差を示す図である。LPV学習フィルタを用いた反復学習制御を実線で示し、学習フィルタとして固定パラメータを用いた反復学習制御(以下、LTI反復学習制御と略す)を破線で示す。LTI反復学習制御に比べてLPV反復学習制御の方が、偏差を小さくできることが分かる。これは、LPV反復学習制御が、変位xにおける推力定数aの値を図5に示す関係から求め、式(14)のようにパラメータpを求め、LPV学習フィルタを変動させることにより推力変動に適応しているためである。
【0099】
図12は、LTI反復学習制御で40回の試行を行った場合の偏差と、LPV反復学習制御で10回の試行を行った場合の偏差を比較する図である。前者を実線で示し、後者を破線で示す。LPV反復学習制御を用いることによって、LTI反復学習制御の五分の一程度の反復回数で偏差を抑えることができている。
【0100】
また、推力変動の補償方法として、得られている推力リプルのデータをもとに
【0101】
【数22】
【0102】
のように制御入力を補正する方法が考えられる。しかし、この手法はフィードバック制御系を直接補正しているため、推力リプルのデータが実際と異なっていたときに安定性を損なう可能性がある。LPV反復学習制御は反復試行によりフィードフォワード入力を生成するため、閉ループ系の安定性を損なうことはない。
【0103】
図13に実際の推力変動が事前に得られた推力リプルのデータより3mmずれているときのシミュレーション結果を示す。LPV学習フィルタを用いて10回の試行を行った場合の偏差を実線で示し、上述の推力定数の直接補償とLTI反復学習制御を用いた場合の偏差を破線で示す。LTI反復学習制御はフィードバック制御系の性能劣化により偏差が大きくなっているが、LPV反復学習制御は図11の応答と比べてほとんど劣化していない。これより、LPV反復学習制御のロバスト性が確認できる。
【実施例2】
【0104】
実施例2ではパラメータが制御対象への外乱力を含む例を説明する。外乱力は本来モデルのパラメータではないため、外乱力を等価的にシステムの減衰力として扱う。
【0105】
図1を用いて本実施例の位置制御装置について説明する。図1で説明した箇所については重複をさけるため説明を省略する。パラメータ変動算出部Zは、外乱オブザーバを有し、この外乱オブザーバにより制御入力と変位から外乱力を推定し、この外乱力を用いてパラメータ変動を算出することができる。
【0106】
つぎに、パラメータが外乱力を含む場合のLPV系のモデルの導出方法について説明する。
【0107】
制御対象の質量をm、変位をx、制御対象への力入力をuu、外乱力をgとすると、制御対象のモデルは以下のようにモデリングされる。
【0108】
【数23】
【0109】
ここで、
【0110】
【数24】
【0111】
のように拡張線形化を行い、式(27)の状態方程式を求めると、
【0112】
【数25】
【0113】
のように、外乱力をシステム行列に入れることができる。ここで、
【0114】
【数26】
【0115】
とおく。ただし、
【0116】
【数27】
【0117】
のときは、
【0118】
【数28】
【0119】
とする。そして、[実施例1]と同じく、アクチュエータのアンプ特性との拡大形を構成すると、以下のような外乱力によってモデルが変動するアフィンパラメータ依存モデルとなる。
【0120】
【数29】
【0121】
そして、[実施例1]と同様の一般化プラントを用いて、LPV学習フィルタを導出する。このとき、パラメータpの変動範囲を
【0122】
【数30】
【0123】
とし、pが変動の範囲の上限値pmax、下限値pminを超えた場合には、それぞれpmax,pminを用いる。
【0124】
以下、本実施例のシミュレーション結果について説明する。
【0125】
図14はシミュレーションの条件として制御対象に加わる外乱を示す図である。外乱力は外乱オブザーバを用いて推定され、推定された外乱力と速度を用いて式(30)からパラメータpが算出される。そして、パラメータpに対応するように、LPV学習フィルタを変動させる。
【0126】
具体的な学習のフローは、実施例1と同様であるため省略する。
【0127】
なお、図14の外乱と図8のプロファイルを用いたシミュレーションでは、パラメータpは変動の上下限値を超えることはなかった。
【0128】
図15は4回の試行を行った場合の偏差を示す図である。LPV学習フィルタを用いた反復学習制御を実線で示し、LTI反復学習制御を破線で示す。LPV反復学習制御では、0.03秒から0.05秒にかけて追従性能が高いことがわかる。LTI反復学習制御ではさらに2回の試行を行わなければ、LPV反復学習制御と同様の性能は得られなかった。このように、LPV反復学習制御は外乱力を推定して適応するように学習フィルタを変動させるため、学習効果が高く、反復回数を低減させることができる。
【実施例3】
【0129】
実施例3ではパラメータが制御対象の姿勢角変動を含む例を説明する。図1を用いて位置制御装置について説明する。図1で説明した箇所については重複をさけるため説明を省略する。
【0130】
パラメータ変動算出部Zは制御対象の姿勢角を検出するセンサ(姿勢検出部)を有する。
【0131】
パラメータpが制御対象の姿勢角を含む場合のLPV系のモデルの導出方法について説明する。図16は制御対象としての移動体86が制御入力uuを受けて移動する様子を示す図である。図において、横軸をx軸、紙面に垂直な軸をy軸とし、移動体86のy軸回りの回転角をθyとしている。
【0132】
図16のように、制御対象の底面に平行に推力が発生するとき、x軸方向の推力は制御入力のuuのx軸に水平な方向の分力であるので、uu cosθy となる。制御対象の状態方程式は、
【0133】
【数31】
【0134】
となる。ここで、
【0135】
【数32】
【0136】
とおく。そして、[実施例1]と同じく、アクチュエータのアンプ特性との拡大形を構成すると、以下のような回転角によって変動するアフィンパラメータ依存モデルとなる。
【0137】
【数33】
【0138】
つぎに、[実施例1]と同様の一般化プラントを用いて、LPV学習フィルタを導出する。このとき、パラメータpの変動範囲を
【0139】
【数34】
【0140】
とする。
【0141】
以下、本実施例のシミュレーション結果を示す。
【0142】
回転角θyの制御はx軸方向とは別の制御系で制御されているものとする。そこでは、回転角θyはセンサで直接計測されている。そのため、そのセンサ情報から、式(38)のようにパラメータ変動を算出し、LPV学習フィルタを変動させることができる。
【0143】
具体的な学習のフローは、実施例1と同様である。
【0144】
図18は4回の試行を行った場合の偏差を示す図である。LPV学習フィルタを用いた反復学習制御を実線で示し、LTI反復学習制御を破線で示す。LPV反復学習制御では、0.03秒から0.07秒にかけて偏差が小さくなっている。LTI反復学習制御ではさらに3回の試行を行わなければLPV反復学習制御と同様の性能は得られなかった。このように、LPV反復学習制御はセンサで計測した出力を用いてパラメータ変動を算出し、この算出結果にもとづいて学習フィルタを変動させるため学習効果が高く、試行回数を低減させることができる。
【0145】
(露光装置に適用した例)
図19は、本発明の位置制御装置を適用した露光装置の概念図である。なお、本実施例では露光装置について例示的に説明するものであり、露光装置の構成はこの記述により限定されないものとする。
【0146】
露光装置100は、照明光学系81と、レチクル82を搭載して移動するレチクルステージ83と、投影光学系84と、ウエハ85を搭載して移動するウエハステージ86を備える。また、ウエハステージ86の位置を検出するセンサ88を備える。
【0147】
照明光学系81からの光はレチクル82(原版)及び投影光学系84を介してウエハ85(基板)上に照射される。これにより、レチクル82のパターンは投影光学系84によって縮小投影されてウエハ上に結像する。
【0148】
また、露光装置は制御ボックスに配置された制御基板80を備え、この制御基板80が上述の実施例における位置制御装置7を含む。制御基板80として例えば公知のDSPシステムを適用しうる。制御基板80は、センサ88、露光装置のメインCPU(不図示)、ステージ駆動用のドライバ(不図示)と通信可能に接続される。
【0149】
以上の構成により、例えばセンサ88から出力される位置信号にもとづいてパラメータ変動の検出または推定を行い、パラメータ変動を考慮して反復学習制御を行ってウエハステージの位置を制御する。
【0150】
ここで、実際の露光を開始する前にステージをk回駆動して、偏差の最大値emaxが十分に小さくなってから露光を開始すればよい。偏差の最大値が十分小さくなった後は、制御入力fkの更新を行ってもよいし行わなくてもよい。
【0151】
また、ウエハステージ86ではなく、レチクルステージ83の制御において本発明の位置制御装置を適用してもよい。
【0152】
また、上述の露光装置を用いてデバイス(半導体集積回路素子、液晶表示素子等)が製造される。ここで、デバイス製造方法は、上述の露光装置を使用して感光剤を塗布したウエハ(基板)を露光する工程と、その基板を現像する工程と、他の周知の工程と、を備える。
【図面の簡単な説明】
【0153】
【図1】LPV反復学習制御を用いた位置制御回路を示す制御ブロック線図である。
【図2】LPV反復学習制御を用いた位置制御のフローチャート図である。
【図3】LPV学習フィルタの導出をゲインスケジュールドH∞制御問題に置き換えて示したブロック線図である。
【図4】学習フィルタL(p)を表すブロック線図である。
【図5】制御対象の位置と推力リプルとの関係を表す図である。
【図6】制御対象の変動を考慮した閉ループ系と安定化フィルタと重み関数を含む一般化プラントを表す図である。
【図7】LPV反復学習フィルタを表すゲイン線図である。
【図8】制御対象の目標軌跡を表す図である。
【図9】LPV型反復学習制御において零位相ローパスフィルタを安定化フィルタとして用いた場合の位置制御回路を示す制御ブロック線図である。
【図10】LPV型反復学習制御において零位相ローパスフィルタを安定化フィルタとして用いた場合の位置制御のフローチャート図である。
【図11】実施例1のシミュレーション結果を示す図である。
【図12】実施例1のシミュレーション結果を示す図である。
【図13】実施例1のシミュレーション結果を示す図である。
【図14】制御対象に加わる外乱力を表す図である。
【図15】実施例2のシミュレーション結果を示す図である。
【図16】実施例3における制御対象の座標を示す説明図である。
【図17】実施例における制御対象の移動および回転を示す図である。
【図18】実施例3のシミュレーション結果を示す図である。
【図19】反復学習制御装置を用いた露光装置を示す図である。
【符号の説明】
【0154】
1 検出部
2 減算部
3,4 加算部
5,11,12 メモリ
6 反復学習制御回路
7 位置制御装置
80 制御基板
81 照明光学系
82 レチクル
83 レチクルステージ
84 投影光学系
85 ウエハ
86 ウエハステージ
88 センサ
【技術分野】
【0001】
本発明は反復学習制御回路を備える位置制御装置に関するものである。好適には、位置制御装置は露光装置や工作機械におけるステージ装置に適用される。
【背景技術】
【0002】
反復学習制御とは、制御対象の目標軌道に対する追従制御(試行)を繰り返し行うことで、目標軌道に対する偏差を少なくし、高精度な制御を実現するものである。一般に、制御対象に加えた入力と、それに対する出力のみを用いて学習が行えるため、制御モデルに含めることが難しい非線形性や、量子化誤差などを補償することができる。制御対象には、同じ入力に対して同じ出力が得られるような再現性が要求されるが、スキャン方式の半導体露光装置や産業ロボットなどはこの条件を概ね満たしている。そのため、反復学習制御による制御性能の向上が期待され、すでにいくつかの例が示されている。
【0003】
反復学習制御において、ある試行によって得られた出力にもとづいて次の試行の入力を更新するアルゴリズムを学習則という。学習則の代表的なものとして、偏差の2回微分値に定数行列を乗じて入力値を生成するものがある。また、学習則としてPD補償器のようなものを用いることによって制御対象のモデルを求めずに反復学習制御を行う方法も知られている。
【0004】
また、Mooreらはモデルベースの学習則を提案している。この学習則は、学習フィルタと安定化フィルタを備えている。さらに、De Rooverらは、この学習フィルタをH∞制御理論を利用して求めている(非特許文献1)。
【0005】
また、特許文献1には上述のモデルベースの学習則に加えて、偏差の時間−周波数解析を導入して、安定化フィルタを時間とともに変化させることが記載されている。これによりノイズが学習に与える影響を抑えて、学習の効率化を図っている。
【非特許文献1】Synthesis of robust multivariable iterative learning controllers with application to a wafer stage motionsystem,DICK DE ROOVER and OKKO H.BOSGRA,INT.J.CONTROL,2000,VOL.73,NO.10,968−979
【特許文献1】US 7,181,296 B2
【発明の開示】
【発明が解決しようとする課題】
【0006】
反復学習制御は試行を反復することによって適切な入力を得るため、目標軌道に高精度に追従するための入力を得るためには時間を要する。例えば、半導体露光装置では処理時間(スループット)が装置にとって重要な性能であるため、この学習時間をできるだけ短くすることが望まれる。
【0007】
試行回数を減らして適切な入力を得るためには、制御対象のモデルの情報を積極的に活用することが考えられる。しかしながら、上述の文献において学習フィルタは線形時不変のモデルを用いて導出されており、学習フィルタは線形時不変である。
【0008】
そのため、試行の最中にモデルのパラメータが変動すると、モデルと学習フィルタとの整合がとれなくなってしまう。その結果として学習性能が劣化して、かえって試行回数が多くなってしまう。
【0009】
本発明は、上述の点に鑑みなされたものであり、反復学習制御において試行回数を低減し、反復学習にかかる時間を短縮することを目的とする。
【課題を解決するための手段】
【0010】
本発明の位置制御装置は、制御対象の位置を検出する検出部と、前記検出部の出力を目標値から減算する減算部と、前記検出部の出力と前記目標値との偏差が入力されるフィルタを含み、前記制御対象に制御入力をフィードフォワードする反復学習制御回路と、を備える位置制御装置であって、前記制御対象のパラメータ変動を算出する算出手段を備え、前記制御対象のパラメータ変動に応じて前記フィルタの特性が変更されることを特徴としている。
【発明の効果】
【0011】
本発明によれば、制御対象にパラメータ変動が生じた場合であっても、反復学習にかかる時間を短縮しつつ、高精度な位置制御を行うことができる。
【発明を実施するための最良の形態】
【0012】
図1は本発明の例示的な位置制御装置の制御ブロック図である。位置制御装置7は制御対象P(p)の位置を制御する。位置制御装置7は、フィードバック制御器Kと、制御対象P(p)の位置ykを検出する検出部1と、目標値rから検出部1の出力を減算する減算部2とを備える。また位置制御装置7は、制御対象P(p)に反復学習された制御入力を与える反復学習制御回路6を備える。
【0013】
反復学習制御は、目標軌跡に対する追従動作を反復して行うことによって、目標軌跡に対する偏差を低減するものである。以下の説明において試行回数をkとして表す。
【0014】
反復学習制御回路6は、制御入力を生成する学習フィルタL(p)(第1フィルタ)と、学習フィルタL(p)の学習に不要な周波数帯域を遮断する安定化フィルタQ(第2フィルタ)と、生成された制御入力を記憶するメモリ5とを備える。
【0015】
目標値rと検出部1の出力との偏差ek(k回目の偏差)は学習フィルタL(p)に入力され、学習フィルタL(p)の出力が加算部4に入力される。また、k回目の制御入力fkが加算部4に入力される。加算部4からの出力は、安定化フィルタQに入力される。安定化フィルタQの出力はk+1回目の制御入力fk+1としてメモリ5に記憶される。メモリ5に記憶された制御入力fk+1はk+1回目の追従制御において制御対象にフィードフォワード入力として加えられる。すなわち、フィードバック制御器Kの出力uk+1に加算部3で加算される。
【0016】
本発明の特徴として、制御対象P(p)のパラメータpの変動を検出または推定するパラメータ変動算出部Zを備える。そして、このパラメータ変動に応じて学習フィルタL(p)の特性が変更される。
【0017】
パラメータ変動を検出または推定するためには、例えば、予めメモリ(不図示)に制御対象の物理量とパラメータ変動との相関関係を情報(例えばテーブルや関数)として記憶しておき、追従制御中にこの物理量をセンサなどで検出してパラメータ変動を求めればよい。
【0018】
つぎに、学習フィルタL(p)の導出方法について説明をする。
【0019】
学習フィルタL(p)を導出するために、まず、制御対象P(p)をパラメータ変動を含む線形パラメータ変動系(Linear Parameter Varying、以下LPVと略する)のモデルとして表す。
【0020】
一般にLPV系はその状態空間行列がパラメータpの関数となっているプラントであり、以下のように表される。
【0021】
【数1】
【0022】
ここで、図1に示されるフィードバック制御系において、制御対象P(p)とフィードバック制御器Kとの閉ループ系Pcl(p)を以下のように定義する。ここで、フィードバック制御器Kはパラメータ変動に応じて変動することのない固定フィードバック制御器を用いている。
【0023】
【数2】
【0024】
本形態では、学習フィルタL(p)を以下のようにLPV系として表す。
【0025】
【数3】
【0026】
また、図1に示される反復学習制御回路の場合、制御入力は以下のように定義される。
【0027】
【数4】
【0028】
以上の式より、偏差ek+1とekの関係は以下のように表される。
【0029】
【数5】
【0030】
反復学習により偏差が収束するためには、以下の条件を満たせばよい。
【0031】
【数6】
【0032】
この条件を満たすように学習フィルタL(p)を導出することが必要となるが、上記問題は、図3の制御ブロック図(図1を等価変換した図)で表すことができる。図3において、破線で囲まれた部分をPh(p)とすると、Ph(p)の変動に対してL(p)を変動させるゲインスケジュールドH∞制御問題として扱うことができる。したがって、線形行列不等式を用いることで、変動するパラメータのi個の点に対応した線形時不変学習フィルタLiを求めることができる。なお、以下の説明では、線形行列不等式(Linear Matrix Inequality)をLMIと略し、線形時不変学習フィルタ(Linear Time Invariant)をLTI 学習フィルタと略す。LTI学習フィルタLiは以下の行列として表される。
【0033】
【数7】
【0034】
例えば、変動するパラメータの数が1のときは、パラメータの端点の数は2であるので、各端点のLTI学習フィルタL1,L2(不変フィルタ)が求まる。
【0035】
ここで、以下のような補間演算式を用いて2つのLTI学習フィルタ間を補うことで、パラメータpの変動に応じて学習フィルタL(p)の特性を変更することができる。すなわち、学習フィルタL(p)が補間演算部を備える。
【0036】
【数8】
【0037】
ここで、pminは下限値、pmaxは上限値を表す。
【0038】
図4に式(10)の制御ブロック図を示す。ここでL1の係数を定数C1として、L2の係数を定数C2として表している。定数C1と学習フィルタL1の積と、定数C2と学習フィルタL2の積とが加算されて、LPV学習フィルタL(p)が求まる。
【0039】
つぎに、図1の位置制御装置を用いた場合の反復学習制御のフローについて説明する。
【0040】
図2は反復学習制御のフローを示す図である。
【0041】
ステップS1において、1回目の試行を行う。ここでは、反復学習制御回路からの入力を行わずに制御を行う。偏差e1が学習フィルタL(p)に入力され、その出力が安定化フィルタQを通過してf2としてメモリ5に記憶される。
【0042】
ステップS2において、k回目(k>1)の試行を開始する。なお、制御はディジタル制御で行われるので、k回目の試行におけるiサンプル目の制御入力および偏差をfki,ekiと表す。ここで、1回の試行の総サンプル数をjとする。初期条件として、偏差の最大値emax=0として、サンプル数i=0とする。
【0043】
ステップS3において、前回メモリに記憶された制御入力fkを制御器からの出力ukに加える。このようにしてk回目の試行において制御対象は制御される。
【0044】
また、k回目の試行において、k+1回目の制御入力が以下ステップS4〜S5の手順で生成される。
【0045】
ステップS5において、パラメータ変動算出部Zはiサンプル目のパラメータpiを検出または推定し、その結果にもとづいて学習フィルタLi(pi)が算出される。算出方法として例えば上述した数式(10)が用いられる。このようにして学習フィルタLi(pi)が変更される。
【0046】
ステップS5において、偏差ekiが学習フィルタLi(pi)に入力され、その出力が制御入力fkiと加算された後に安定化フィルタQを通過してf(k+1)iとしてメモリ5に記憶される。
【0047】
ステップS6において、偏差ekiと偏差の最大値emaxを比較し、偏差eki>emaxの場合にemaxが更新される。
【0048】
ステップS7において、j<iであればステップS8にすすみ、j≧iであればi=i+1としてステップS2にすすむ。
【0049】
ステップS8において、k回目の試行を終了する。
【0050】
ステップS9において、偏差の最大値emaxを予め設定した設定値と比較し、設定値よりも小さい場合に偏差が十分小さいと判断して学習を終了する。偏差の最大値emaxが設定値よりも大きい場合には、k=k+1としてステップS2にすすむ。
【0051】
以上の反復学習制御を用いて位置を制御することにより、従来の学習フィルタを変動させない反復学習制御と比べて、所定の偏差以下にするために要する試行回数を低減することが可能であり、反復学習にかかる時間を短縮できる。
【0052】
なお、以下の実施例1乃至3において好適なパラメータの例と、効果を示すデータについて説明を行う。
【実施例1】
【0053】
実施例1ではパラメータが制御対象を駆動する駆動手段の推力定数を含む例を説明する。
【0054】
図1を用いて本実施例の位置制御装置について説明する。図1で説明した箇所については重複をさけるため説明を省略する。パラメータ変動算出部Zはパラメータ変動を算出する。具体的には、パラメータ変動算出部Zは、予め求めた制御対象の位置と推力定数との相関関係を表す情報を不図示のメモリに格納し、この情報と、センサ1によって検出された制御対象Pの位置とにもとづいて、推力定数の変動を算出する。後述するようにパラメータは推力定数を含む式で表されるため、推力定数の変動からパラメータ変動を算出することができる。
【0055】
ここで、制御対象の位置と推力定数との相関関係を表す情報は、例えば制御対象を移動させながら図5に示すような推力リプルを検出して、この推力リプルから推力定数を求めることによって得ることができる。
【0056】
つぎに、パラメータpが推力定数を含む場合のLPV系のモデルの導出方法および学習フィルタL(p)の導出方法について説明をする。
【0057】
制御対象の質量をm、変位をx、制御対象への力入力をuu、制御対象を駆動する駆動手段の推力定数をaとしたときに、制御対象は以下のようにモデリングされる。
【0058】
【数9】
【0059】
このモデルをLPVモデルの一形式であるアフィンパラメータ依存モデルに変形する手順を以下に示す。まず、状態ベクトルを
【0060】
【数10】
【0061】
として、式(11)より状態方程式を求めると、
【0062】
【数11】
【0063】
となる。ここで、
【0064】
【数12】
【0065】
とおくと、
【0066】
【数13】
【0067】
となる。ここで、出力方程式を以下のものとする。
【0068】
【数14】
【0069】
さらに、アクチュエータのアンプ特性を以下のような状態方程式、出力方程式とする。
【0070】
【数15】
【0071】
ここで、xw=[xxf]Tとして、式(15),式(16)との拡大形を構成すると、
【0072】
【数16】
【0073】
となる。ここで、システム行列は以下のようになる。
【0074】
【数17】
【0075】
このように、パラメータpを含まない行列A0と、パラメータpの係数のみの行列A1に分割して表すことができる。これより、式(21)は以下のようなアフィンパラメータ依存モデルとなる。
【0076】
【数18】
【0077】
式(22)のモデルとフィードバック制御器を用いた閉ループ系Pcl(P)と、安定化フィルタQとを含む制御系に、重み関数Wと定数δと制御量Z2を導入して一般化プラントを構成すると、図6のようになる。したがって、LMIに基づくゲインスケジュールドH∞制御理論により変動するパラメータのi個の点に対応したLTI学習フィルタLiを導出することができる。ここで、安定化フィルタQをカットオフ周波数350Hzの1次のローパスフィルタとする。
【0078】
また、重み関数Wは、
【0079】
【数19】
【0080】
とする。また、δは微小な定数である。
【0081】
推力定数aの変動の幅を以下のようにする。
【0082】
【数20】
【0083】
そうすると、パラメータpは以下の範囲で変動する。
【0084】
【数21】
【0085】
導出されたLPV学習フィルタを図7に示す。実線と破線はそれぞれ、パラメータpが上限値pmaxの時と下限値pminとなったときの学習フィルタを示す。学習フィルタをそれぞれL1,L2とすると、推力リプルによるパラメータpの変動に適応するLPV学習フィルタは式(10)から求められる。
【0086】
また、この実施例では、安定化フィルタQには、零位相ローパスフィルタを用いている。零位相ローパスフィルタは実時間での処理が行えないため、図9に示すように、制御誤差ekとパラメータpについてもメモリに蓄積する。そして、学習は一回の試行が終了する度ごとに行われる。具体的なフローについて以下に説明する。手順を図10のフローチャートに示す。
【0087】
ステップS11において、1回目の試行を行う。ここでは、反復学習制御回路からの入力を行わずに制御を行う。偏差e1がメモリ11に記憶される。また、パラメータp1がパラメータ変動算出部Zにより算出され、メモリ12に記憶される。偏差e1が学習フィルタL(p)に入力され、その出力が安定化フィルタQを通過してf2としてメモリ5に記憶される。
【0088】
ステップS12において、k回目(k>1)の試行を開始する。このとき、前回メモリ5に記憶された制御入力fkを制御器からの出力ukに加える。このようにしてk回目の試行において制御対象は制御される。また、k回目の試行において、k+1回目(k>1)の制御入力fk+1が以下のS15〜S18でオフライン生成される。なお、制御はディジタル制御で行われるので、k回目の試行におけるiサンプル目の制御入力および偏差をfki,ekiと表す。ここで、1回の動作の総サンプル数をjとする。初期条件として、偏差の最大値emax=0として、サンプル数i=0とする。
【0089】
ステップS13において、偏差ekがメモリ11に記憶される。また、パラメータpkがパラメータ変動算出部Zにより算出され、メモリ12に記憶される。さらに、偏差ekの最大値emaxが検出される。
【0090】
ステップS14において、偏差の最大値emaxを予め設定した設定値と比較し、設定値よりも小さい場合に偏差が十分小さいと判断して学習を終了する。偏差の最大値emaxが設定値よりも大きい場合には、k=k+1としてステップS15にすすむ。
【0091】
ステップS15において、iサンプル目のパラメータpkiをメモリ12から呼び出し、その結果にもとづいて学習フィルタLi(pi)が算出される。具体的には学習フィルタは式(10)により算出される。
【0092】
ステップS16において、メモリからiサンプル目の偏差ekiが呼び出され学習フィルタLi(pi)に入力され、その出力が制御入力fkiに加算される。このようにして出力gkiが算出される。
【0093】
ステップS17において、j<iであればステップS18にすすみ、j≧iであればi=i+1としてステップS15にすすむ。
【0094】
ステップS18において、出力gkは零位相ローパスフィルタである安定化フィルタQを通過してf(k+1)としてメモリに記憶される。
【0095】
ステップS19において、k=k+1としてS12に進み、次の試行を開始する。以上のステップを繰り返すことによって学習制御を行う。
【0096】
以下、本実施例のシミュレーション結果について説明する。
【0097】
シミュレーションとして、図8に示した目標軌跡(位置プロファイル)に制御対象を追従制御させる。なお、上述の反復学習による制御入力、フィードバック入力に加えて、位置プロファイルから求めた加速度を定数倍したフィードフォワード入力を与えている。
【0098】
図11は10回の試行を行った場合の偏差を示す図である。LPV学習フィルタを用いた反復学習制御を実線で示し、学習フィルタとして固定パラメータを用いた反復学習制御(以下、LTI反復学習制御と略す)を破線で示す。LTI反復学習制御に比べてLPV反復学習制御の方が、偏差を小さくできることが分かる。これは、LPV反復学習制御が、変位xにおける推力定数aの値を図5に示す関係から求め、式(14)のようにパラメータpを求め、LPV学習フィルタを変動させることにより推力変動に適応しているためである。
【0099】
図12は、LTI反復学習制御で40回の試行を行った場合の偏差と、LPV反復学習制御で10回の試行を行った場合の偏差を比較する図である。前者を実線で示し、後者を破線で示す。LPV反復学習制御を用いることによって、LTI反復学習制御の五分の一程度の反復回数で偏差を抑えることができている。
【0100】
また、推力変動の補償方法として、得られている推力リプルのデータをもとに
【0101】
【数22】
【0102】
のように制御入力を補正する方法が考えられる。しかし、この手法はフィードバック制御系を直接補正しているため、推力リプルのデータが実際と異なっていたときに安定性を損なう可能性がある。LPV反復学習制御は反復試行によりフィードフォワード入力を生成するため、閉ループ系の安定性を損なうことはない。
【0103】
図13に実際の推力変動が事前に得られた推力リプルのデータより3mmずれているときのシミュレーション結果を示す。LPV学習フィルタを用いて10回の試行を行った場合の偏差を実線で示し、上述の推力定数の直接補償とLTI反復学習制御を用いた場合の偏差を破線で示す。LTI反復学習制御はフィードバック制御系の性能劣化により偏差が大きくなっているが、LPV反復学習制御は図11の応答と比べてほとんど劣化していない。これより、LPV反復学習制御のロバスト性が確認できる。
【実施例2】
【0104】
実施例2ではパラメータが制御対象への外乱力を含む例を説明する。外乱力は本来モデルのパラメータではないため、外乱力を等価的にシステムの減衰力として扱う。
【0105】
図1を用いて本実施例の位置制御装置について説明する。図1で説明した箇所については重複をさけるため説明を省略する。パラメータ変動算出部Zは、外乱オブザーバを有し、この外乱オブザーバにより制御入力と変位から外乱力を推定し、この外乱力を用いてパラメータ変動を算出することができる。
【0106】
つぎに、パラメータが外乱力を含む場合のLPV系のモデルの導出方法について説明する。
【0107】
制御対象の質量をm、変位をx、制御対象への力入力をuu、外乱力をgとすると、制御対象のモデルは以下のようにモデリングされる。
【0108】
【数23】
【0109】
ここで、
【0110】
【数24】
【0111】
のように拡張線形化を行い、式(27)の状態方程式を求めると、
【0112】
【数25】
【0113】
のように、外乱力をシステム行列に入れることができる。ここで、
【0114】
【数26】
【0115】
とおく。ただし、
【0116】
【数27】
【0117】
のときは、
【0118】
【数28】
【0119】
とする。そして、[実施例1]と同じく、アクチュエータのアンプ特性との拡大形を構成すると、以下のような外乱力によってモデルが変動するアフィンパラメータ依存モデルとなる。
【0120】
【数29】
【0121】
そして、[実施例1]と同様の一般化プラントを用いて、LPV学習フィルタを導出する。このとき、パラメータpの変動範囲を
【0122】
【数30】
【0123】
とし、pが変動の範囲の上限値pmax、下限値pminを超えた場合には、それぞれpmax,pminを用いる。
【0124】
以下、本実施例のシミュレーション結果について説明する。
【0125】
図14はシミュレーションの条件として制御対象に加わる外乱を示す図である。外乱力は外乱オブザーバを用いて推定され、推定された外乱力と速度を用いて式(30)からパラメータpが算出される。そして、パラメータpに対応するように、LPV学習フィルタを変動させる。
【0126】
具体的な学習のフローは、実施例1と同様であるため省略する。
【0127】
なお、図14の外乱と図8のプロファイルを用いたシミュレーションでは、パラメータpは変動の上下限値を超えることはなかった。
【0128】
図15は4回の試行を行った場合の偏差を示す図である。LPV学習フィルタを用いた反復学習制御を実線で示し、LTI反復学習制御を破線で示す。LPV反復学習制御では、0.03秒から0.05秒にかけて追従性能が高いことがわかる。LTI反復学習制御ではさらに2回の試行を行わなければ、LPV反復学習制御と同様の性能は得られなかった。このように、LPV反復学習制御は外乱力を推定して適応するように学習フィルタを変動させるため、学習効果が高く、反復回数を低減させることができる。
【実施例3】
【0129】
実施例3ではパラメータが制御対象の姿勢角変動を含む例を説明する。図1を用いて位置制御装置について説明する。図1で説明した箇所については重複をさけるため説明を省略する。
【0130】
パラメータ変動算出部Zは制御対象の姿勢角を検出するセンサ(姿勢検出部)を有する。
【0131】
パラメータpが制御対象の姿勢角を含む場合のLPV系のモデルの導出方法について説明する。図16は制御対象としての移動体86が制御入力uuを受けて移動する様子を示す図である。図において、横軸をx軸、紙面に垂直な軸をy軸とし、移動体86のy軸回りの回転角をθyとしている。
【0132】
図16のように、制御対象の底面に平行に推力が発生するとき、x軸方向の推力は制御入力のuuのx軸に水平な方向の分力であるので、uu cosθy となる。制御対象の状態方程式は、
【0133】
【数31】
【0134】
となる。ここで、
【0135】
【数32】
【0136】
とおく。そして、[実施例1]と同じく、アクチュエータのアンプ特性との拡大形を構成すると、以下のような回転角によって変動するアフィンパラメータ依存モデルとなる。
【0137】
【数33】
【0138】
つぎに、[実施例1]と同様の一般化プラントを用いて、LPV学習フィルタを導出する。このとき、パラメータpの変動範囲を
【0139】
【数34】
【0140】
とする。
【0141】
以下、本実施例のシミュレーション結果を示す。
【0142】
回転角θyの制御はx軸方向とは別の制御系で制御されているものとする。そこでは、回転角θyはセンサで直接計測されている。そのため、そのセンサ情報から、式(38)のようにパラメータ変動を算出し、LPV学習フィルタを変動させることができる。
【0143】
具体的な学習のフローは、実施例1と同様である。
【0144】
図18は4回の試行を行った場合の偏差を示す図である。LPV学習フィルタを用いた反復学習制御を実線で示し、LTI反復学習制御を破線で示す。LPV反復学習制御では、0.03秒から0.07秒にかけて偏差が小さくなっている。LTI反復学習制御ではさらに3回の試行を行わなければLPV反復学習制御と同様の性能は得られなかった。このように、LPV反復学習制御はセンサで計測した出力を用いてパラメータ変動を算出し、この算出結果にもとづいて学習フィルタを変動させるため学習効果が高く、試行回数を低減させることができる。
【0145】
(露光装置に適用した例)
図19は、本発明の位置制御装置を適用した露光装置の概念図である。なお、本実施例では露光装置について例示的に説明するものであり、露光装置の構成はこの記述により限定されないものとする。
【0146】
露光装置100は、照明光学系81と、レチクル82を搭載して移動するレチクルステージ83と、投影光学系84と、ウエハ85を搭載して移動するウエハステージ86を備える。また、ウエハステージ86の位置を検出するセンサ88を備える。
【0147】
照明光学系81からの光はレチクル82(原版)及び投影光学系84を介してウエハ85(基板)上に照射される。これにより、レチクル82のパターンは投影光学系84によって縮小投影されてウエハ上に結像する。
【0148】
また、露光装置は制御ボックスに配置された制御基板80を備え、この制御基板80が上述の実施例における位置制御装置7を含む。制御基板80として例えば公知のDSPシステムを適用しうる。制御基板80は、センサ88、露光装置のメインCPU(不図示)、ステージ駆動用のドライバ(不図示)と通信可能に接続される。
【0149】
以上の構成により、例えばセンサ88から出力される位置信号にもとづいてパラメータ変動の検出または推定を行い、パラメータ変動を考慮して反復学習制御を行ってウエハステージの位置を制御する。
【0150】
ここで、実際の露光を開始する前にステージをk回駆動して、偏差の最大値emaxが十分に小さくなってから露光を開始すればよい。偏差の最大値が十分小さくなった後は、制御入力fkの更新を行ってもよいし行わなくてもよい。
【0151】
また、ウエハステージ86ではなく、レチクルステージ83の制御において本発明の位置制御装置を適用してもよい。
【0152】
また、上述の露光装置を用いてデバイス(半導体集積回路素子、液晶表示素子等)が製造される。ここで、デバイス製造方法は、上述の露光装置を使用して感光剤を塗布したウエハ(基板)を露光する工程と、その基板を現像する工程と、他の周知の工程と、を備える。
【図面の簡単な説明】
【0153】
【図1】LPV反復学習制御を用いた位置制御回路を示す制御ブロック線図である。
【図2】LPV反復学習制御を用いた位置制御のフローチャート図である。
【図3】LPV学習フィルタの導出をゲインスケジュールドH∞制御問題に置き換えて示したブロック線図である。
【図4】学習フィルタL(p)を表すブロック線図である。
【図5】制御対象の位置と推力リプルとの関係を表す図である。
【図6】制御対象の変動を考慮した閉ループ系と安定化フィルタと重み関数を含む一般化プラントを表す図である。
【図7】LPV反復学習フィルタを表すゲイン線図である。
【図8】制御対象の目標軌跡を表す図である。
【図9】LPV型反復学習制御において零位相ローパスフィルタを安定化フィルタとして用いた場合の位置制御回路を示す制御ブロック線図である。
【図10】LPV型反復学習制御において零位相ローパスフィルタを安定化フィルタとして用いた場合の位置制御のフローチャート図である。
【図11】実施例1のシミュレーション結果を示す図である。
【図12】実施例1のシミュレーション結果を示す図である。
【図13】実施例1のシミュレーション結果を示す図である。
【図14】制御対象に加わる外乱力を表す図である。
【図15】実施例2のシミュレーション結果を示す図である。
【図16】実施例3における制御対象の座標を示す説明図である。
【図17】実施例における制御対象の移動および回転を示す図である。
【図18】実施例3のシミュレーション結果を示す図である。
【図19】反復学習制御装置を用いた露光装置を示す図である。
【符号の説明】
【0154】
1 検出部
2 減算部
3,4 加算部
5,11,12 メモリ
6 反復学習制御回路
7 位置制御装置
80 制御基板
81 照明光学系
82 レチクル
83 レチクルステージ
84 投影光学系
85 ウエハ
86 ウエハステージ
88 センサ
【特許請求の範囲】
【請求項1】
制御対象の位置を検出する検出部と、
前記検出部の出力を目標値から減算する減算部と、
前記検出部の出力と前記目標値との偏差が入力されるフィルタを含み、前記制御対象に制御入力をフィードフォワードする反復学習制御回路と、を備える位置制御装置であって、
前記制御対象のパラメータ変動を算出する算出手段を備え、
前記制御対象のパラメータ変動に応じて前記フィルタの特性が変更されることを特徴とする位置制御装置。
【請求項2】
前記フィルタは、線形パラメータ変動系のモデルから導出されることを特徴とする請求項1に記載の位置制御装置。
【請求項3】
前記反復学習制御回路は、所定の帯域を遮断する第2フィルタをさらに含むことを特徴とする請求項1または2に記載の位置制御装置。
【請求項4】
前記パラメータは前記制御対象を駆動する駆動手段の推力定数を含み、
前記算出手段は、予め記憶された前記制御対象の位置と前記推力定数との関係を用いて、前記検出部の出力にもとづいて前記推力定数の変動を算出することを特徴とする請求項1乃至3のいずれか1項に記載の位置制御装置。
【請求項5】
外乱オブザーバを備え、
該外乱オブザーバの出力にもとづいて前記パラメータ変動が算出されることを特徴とする請求項1乃至3のいずれか1項に記載の位置制御装置。
【請求項6】
前記パラメータは前記制御対象の姿勢を含み、
前記制御対象の姿勢を検出する姿勢検出部を備えることを特徴とする請求項1乃至3のいずれか1項に記載の位置制御装置。
【請求項7】
前記フィルタは、特性が不変である2つの不変フィルタをもち、前記2つの不変フィルタの間を補間する補間演算部と、を備えることを特徴とする請求項1に記載の位置制御装置。
【請求項8】
請求項1乃至7のいずれか1項に記載の位置制御装置を用いて、基板または原版を搭載するステージの位置を制御することを特徴とする露光装置。
【請求項9】
請求項8に記載の露光装置を用いて基板にパターンを露光する工程と、
露光された基板を現像する工程とを備えることを特徴とするデバイス製造方法。
【請求項1】
制御対象の位置を検出する検出部と、
前記検出部の出力を目標値から減算する減算部と、
前記検出部の出力と前記目標値との偏差が入力されるフィルタを含み、前記制御対象に制御入力をフィードフォワードする反復学習制御回路と、を備える位置制御装置であって、
前記制御対象のパラメータ変動を算出する算出手段を備え、
前記制御対象のパラメータ変動に応じて前記フィルタの特性が変更されることを特徴とする位置制御装置。
【請求項2】
前記フィルタは、線形パラメータ変動系のモデルから導出されることを特徴とする請求項1に記載の位置制御装置。
【請求項3】
前記反復学習制御回路は、所定の帯域を遮断する第2フィルタをさらに含むことを特徴とする請求項1または2に記載の位置制御装置。
【請求項4】
前記パラメータは前記制御対象を駆動する駆動手段の推力定数を含み、
前記算出手段は、予め記憶された前記制御対象の位置と前記推力定数との関係を用いて、前記検出部の出力にもとづいて前記推力定数の変動を算出することを特徴とする請求項1乃至3のいずれか1項に記載の位置制御装置。
【請求項5】
外乱オブザーバを備え、
該外乱オブザーバの出力にもとづいて前記パラメータ変動が算出されることを特徴とする請求項1乃至3のいずれか1項に記載の位置制御装置。
【請求項6】
前記パラメータは前記制御対象の姿勢を含み、
前記制御対象の姿勢を検出する姿勢検出部を備えることを特徴とする請求項1乃至3のいずれか1項に記載の位置制御装置。
【請求項7】
前記フィルタは、特性が不変である2つの不変フィルタをもち、前記2つの不変フィルタの間を補間する補間演算部と、を備えることを特徴とする請求項1に記載の位置制御装置。
【請求項8】
請求項1乃至7のいずれか1項に記載の位置制御装置を用いて、基板または原版を搭載するステージの位置を制御することを特徴とする露光装置。
【請求項9】
請求項8に記載の露光装置を用いて基板にパターンを露光する工程と、
露光された基板を現像する工程とを備えることを特徴とするデバイス製造方法。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【公開番号】特開2009−205641(P2009−205641A)
【公開日】平成21年9月10日(2009.9.10)
【国際特許分類】
【出願番号】特願2008−50126(P2008−50126)
【出願日】平成20年2月29日(2008.2.29)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】
【公開日】平成21年9月10日(2009.9.10)
【国際特許分類】
【出願日】平成20年2月29日(2008.2.29)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】
[ Back to top ]