説明

プラントの制御装置及びプラントの制御方法

【課題】本発明はプラントの制御を行う複数の操作端の動作速度にばらつきがある場合でもプラントを良好に制御できるプラントの制御装置を提供することにある。
【解決手段】本発明のプラント制御装置は、プラントの制御特性を模擬するモデルと、プラントに対する操作信号を演算する操作信号生成部と、制御パラメータを含む制御ロジックデータを保存する制御ロジックデータベースと、プラントを操作する操作端の操作端仕様データを保存する操作端仕様データベースと、過去の操作信号を保存する操作信号データベースと、過去の計測信号を保存する計測信号データベースと、学習パラメータの初期値の決定と学習パラメータを更新する機能を持つ学習条件決定部と、学習パラメータの制限値を拘束条件としてモデルを用いてプラントの操作方法を学習する学習部と、学習した学習情報データを保存する学習情報データベースを備えるように構成した。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は火力発電プラント等のプラントの制御装置及びプラントの制御方法に関する。
【背景技術】
【0002】
プラントの制御装置では、制御対象であるプラントから得られる計測信号を処理し、制御対象に与える操作信号を算出する。制御装置には、プラントの計測信号が運転目標を達成するように、操作信号を計算するアルゴリズムが実装されている。
【0003】
プラントの制御に用いられている制御アルゴリズムとして、PI(比例・積分)制御アルゴリズムがある。PI制御では、運転目標値とプラントの計測信号との偏差に比例ゲインを乗じた値に、偏差を時間積分した値を加算し、プラントを制御する制御装置の操作信号を導出する。また、学習アルゴリズムを用いて、プラントを制御する制御装置の操作信号を導出する場合もある。
【0004】
学習アルゴリズムを用いてプラントを制御する制御装置の操作信号を導出する方法として、特開2000−35956号公報にはエージェント学習装置に関する技術が記載されている。
【0005】
技術文献の強化学習(Reinforcement Learning)の247頁〜253頁にはDyna−アーキテクチャを用いる方法に関する技術が記載されている。
【0006】
これらの技術による方法では、制御装置に制御対象の特性を予測するモデルと、このモデルの予測結果であるモデル出力がモデル出力目標を達成するようなモデル入力の生成方法を予め学習する学習部を持ち、学習部による学習結果に従って制御対象に与える操作信号を生成している。
【0007】
そして、モデルと制御対象の制御特性との間に誤差がある場合には、制御対象を操作した結果である計測信号を用いてモデルを修正し、この修正されたモデルを対象に操作信号の生成方法を再度学習するようになっている。
【0008】
【特許文献1】特開2000−35956号公報
【非特許文献1】強化学習(Reinforcement Learning)、三上貞芳・皆川雅章共訳、森北出版株式会社、2000年12月20日出版
【発明の開示】
【発明が解決しようとする課題】
【0009】
特許文献1、及び非特許文献1に記載の方法を用いて制御装置に対する操作信号の生成方法を学習する際に、学習の拘束条件を決定する必要がある。例えば、制御対象のプラントの操作端の動作速度が変わると、1回の操作で動かすことのできる操作量の幅が変わるため、学習の結果も変化する。従って、学習結果を得るためには、操作端の動作速度に関する情報を用いて学習の拘束条件を適切に設定する必要がある。
【0010】
しかしながら、このような学習の拘束条件を事前に設定することは難しい。プラントの制御では制御装置の複数の操作端を用いてプラントが運転されており、同じ設計仕様の操作端であっても実際の動作速度にばらつきがある場合が多い。また、これらの操作端が経年劣化して動作速度が低下する可能性もある。
【0011】
操作端に動作速度のばらつきや動作速度の低下が発生すると、学習したモデル入力の生成方法に従って生成した操作信号を制御対象のプラントに与えても、望ましい制御結果が得られないことになる。
【0012】
本発明の目的は、プラントの制御に使用する複数の操作端の動作速度にはばらつきがある場合や、操作端が経年劣化し動作速度が劣化した場合でも、プラントを良好に制御することができるように学習の拘束条件を適切に決定する機能を持つプラントの制御装置及びプラントの制御方法を提供することにある。
【課題を解決するための手段】
【0013】
本発明のプラントの制御装置は、プラントの運転状態量である計測信号を用いてプラントに与える制御指令となる操作信号を算出する操作信号生成部を備えたプラントの制御装置において、制御装置には、制御対象となるプラントの制御特性を模擬するモデルと、操作信号生成部で操作信号の算出に使用する制御パラメータを含む制御ロジックデータが保存されている制御ロジックデータベースと、プラントの状態量を制御する操作端の操作端仕様データが保存されている操作端仕様データベースと、過去の操作信号が保存されている操作信号データベースと、過去の計測信号が保存されている計測信号データベースと、制御ロジックデータベースと操作端仕様データベースに保存されているデータを用いて学習パラメータの初期値を決定する機能と制御ロジックデータベースと操作信号データベースと計測信号データベースに保存されているデータを用いて前記学習パラメータを更新する機能とを持つ学習条件決定部と、学習パラメータに含まれている単位時間当たりの操作信号変化幅の制限値を学習の拘束条件に設定して前記モデルを用いてプラントの操作方法を学習する学習部と、学習部で学習した学習情報データが保存されている学習情報データベースを夫々備えさせ、操作信号生成部にはプラントの運転状態量である計測信号と学習情報データベースに保存されている学習情報データを用いてプラントに対する操作信号を算出する学習信号生成部を備えるように構成したことを特徴とする。
【0014】
また、本発明のプラントの制御方法は、プラントの運転状態量である計測信号を用いてプラントに与える制御指令となる操作信号を算出してプラントを制御するプラントの制御方法において、プラントの制御装置によって制御対象となるプラントの制御特性を模擬するモデルを形成し、操作信号の算出に使用する制御パラメータを含む制御ロジックデータを制御装置の制御ロジックデータベースに保存し、プラントの状態量を制御する操作端の操作端仕様データを操作端仕様データベースに保存し、過去の操作信号を操作信号データベースに保存し、過去の計測信号を計測信号データベースに保存し、制御ロジックデータベースと操作端仕様データベースに保存されているデータを用いて学習パラメータの初期値を決定すると共に、制御ロジックデータベースと操作信号データベースと計測信号データベースに保存されているデータを用いて学習パラメータを更新するようにし、学習パラメータに含まれている単位時間当たりの操作信号変化幅の制限値を学習の拘束条件に設定して前記モデルを用いてプラントの特性を模擬してプラントの操作方法を学習し、学習した結果である学習情報データを学習情報データベースに保存するように構成し、プラントの運転状態量である計測信号と学習情報データベースに保存されている学習情報データを用いてプラントに与える制御指令となる操作信号を算出して、プラントを制御するように構成したことを特徴とする。
【発明の効果】
【0015】
本発明によれば、プラントの制御に使用する複数の操作端の動作速度にはばらつきがある場合や操作端が経年劣化し動作速度が劣化した場合でも、プラントを良好に制御することができるように学習の拘束条件を適切に決定する機能を持つプラントの制御装置及びプラントの制御方法を実現することができる。
【発明を実施するための最良の形態】
【0016】
次に、本発明の実施例であるプラントの制御装置について図面を参照して説明する。
【実施例1】
【0017】
図1は、本発明の一実施例であるプラントの制御装置を示す制御システム図である。
【0018】
図1において、プラント100は制御装置200によって制御されるように構成されている。
【0019】
制御対象のプラント100の制御を行う制御装置200には、演算装置として、操作信号生成部300、学習部400、モデル500、評価値計算部600、学習条件決定部700、及び学習情報追加部800が夫々設けられている。
【0020】
また、制御装置200には、データーベースとして、計測信号データベース210、操作端仕様データベース220、操作信号データベース230、制御ロジックデータベース240、学習パラメータデータベース250、評価値計算パラメータデータベース260、モデルパラメータデータベース270、及び学習情報データベース280が夫々設けられている。
【0021】
また、制御装置200には、外部とのインターフェイスとして、外部入力インターフェイス201及び外部出力インターフェイス202が設けられている。
【0022】
そして、前記制御装置200では、外部入力インターフェイス201を介してプラント100からプラント100の制御出力である計測信号1を制御装置200に取り込む。また、外部出力インターフェイス202を介して制御対象100に制御装置200から制御指令となる操作信号24を送信するようになっている。
【0023】
次に制御装置200における制御の詳細を説明すると、プラント100の計測信号1として外部入力インターフェイス201に取り込んだ計測信号2は、操作信号生成部300に伝送されると共に、計測信号データベース210に保存される。また、操作信号生成部300にて生成する操作信号23は、外部出力インターフェイス202に伝送されると共に、操作信号データベース230に保存される。
【0024】
操作信号生成部300では、制御ロジックデータベース240に保存されている制御ロジックデータ11、及び学習情報データベース280に保存されている学習情報データ22を用いて、プラント100の計測信号1が運転目標値を達成するように、操作信号23を生成する。
【0025】
この制御ロジックデータベース240には操作信号生成部300に制御ロジックデータ11を出力するため、制御ロジックデータ11を算出する制御回路及び制御パラメータが保存されている。
【0026】
学習情報データベース280に保存される学習情報データは、学習部400、もしくは学習情報追加部800にて生成される。学習部400は、モデル500、評価値計算部600、及び学習条件決定部700と夫々接続されている。
【0027】
モデル500は、プラント100の制御特性を模擬する機能を持つものである。すなわち、制御指令となる操作信号24をプラント100に与え、その制御結果の計測信号1を得るのと同じことを模擬演算するものである。
この模擬演算のために、モデル500を動作させるモデル入力17を学習部400から受け、モデル500にてプラント100の制御動作を模擬演算して、その模擬演算結果のモデル出力18を得るように構成されている。ここで、モデル出力18は、プラント100の計測信号1の予測値となる。
【0028】
このモデル500は、プラント100の制御特性を模擬演算するモデルを有しており、物理法則に基づくモデル式用いた物理モデル、ニューラルネットワークなどの統計的手法を用いた統計モデル、あるいは、物理モデルと統計モデルを併用して、モデル入力17に対するモデル出力18を計算する機能を持っている。
【0029】
モデル500では、モデル入力17に基づいてプラント100の制御を模擬演算してモデル出力18を計算する際に必要な他のデータは、モデルパラメータデータベース270に保存されているデータをモデル500に入力させて使用する。
【0030】
評価値計算部600は、評価値計算パラメータデータベース260に保存されている評価値計算パラメータ15とモデル500から入力したモデル出力18を用いて、評価値19を計算する。
【0031】
学習部400は、学習情報データベース280に保存されている学習情報データ21と、学習パラメータデータベース250に保存されている学習パラメータ14を用いて、モデル500に入力すべきモデル入力17を生成する。
【0032】
モデル500ではモデル入力17を入力して内部の模擬モデルを使用して模擬演算したモデル出力18を出力する。
【0033】
評価値計算部600ではモデル500で模擬演算したモデル出力18から評価値19を計算し、この評価値19を学習部400に入力する。
【0034】
学習部400では、学習パラメータに含まれている単位時間当たりの操作信号変化幅の制限値を学習の拘束条件に設定してモデルを用いてプラントの操作方法を学習するために、モデル500で模擬演算されるモデル出力18がモデル出力目標値を達成するようなモデル入力の生成方法を、モデル出力18、あるいは評価値19を用いて学習する。学習結果である学習情報データ20は、学習情報データベース280に保存される。
【0035】
学習条件決定部700では、操作端仕様データベース220に保存されているプラントの操作端の動作可能範囲及び動作速度の操作端仕様データ4、及び制御ロジックデータベース240に保存されている制御ロジックデータ6を用いて、単位時間当たりの操作信号変化幅の制限値が含まれている学習パラメータ8の初期値を生成する。
【0036】
また、学習条件決定部700では、計測信号データベース210に保存されている過去の計測信号である計測信号データ3、操作信号データベース230に保存されている過去の操作信号である操作信号データ5、及び学習パラメータデータベース250に保存されている学習パラメータ9を用いて、学習パラメータ8を更新する。
【0037】
学習パラメータ9と学習パラメータ8の値が異なる場合には学習トリガ7を「1」とし、この値を学習部400、及び学習情報追加部800に送信する。それ以外の場合は、学習トリガ7は「0」の値である。
【0038】
学習情報追加部800では、学習トリガ7が「1」となった時に、学習パラメータデータベース250に保存されている学習パラメータ10、及び学習情報データベース280に保存されている学習情報データ12を用いて、追加学習情報データ13を生成する。この追加学習情報データ13は、学習情報データベース280に保存される。
【0039】
プラント100の運転員は、キーボード901とマウス902で構成される外部入力装置900、制御装置200とデータを送受信できるデータ送受信処理部930を備えた保守ツール910、及び画像表示装置950を用いることにより、制御装置200に備えられている種々のデータベースに保存されている情報にアクセスすることができる。
【0040】
保守ツール910は、外部入力インターフェイス920、データ送受信処理部930、外部出力インターフェイス940で構成される。
【0041】
入力装置900で生成した保守ツール入力信号31は、外部入力インターフェイス920を介して保守ツール910に取り込まれる。保守ツール910のデータ送受信処理部930では、保守ツール入力信号32の情報に従って、制御装置200に備えられているデータベース情報30を取得する。
【0042】
データ送受信処理部930では、データベース情報30を処理した結果得られる保守ツール出力信号33を、外部出力インターフェイス940に送信する。保守ツール出力信号34は、画像表示装置950に表示される。
【0043】
尚、上記した本発明の実施例の制御装置200では、計測信号データベース210、操作端仕様データベース220、操作信号データベース230、制御ロジックデータベース240、学習パラメータデータベース250、評価値計算パラメータデータベース260、モデルパラメータデータベース270、及び学習情報データベース280が制御装置200の内部に配置されているが、これらの全て、あるいは一部を制御装置200の外部に配置することもできる。
【0044】
また同様に、学習部400、モデル500、評価値計算部600、学習条件決定部700、学習情報追加部800が制御装置200の内部に配置されているが、これらの全て、あるいは一部を制御装置200の外部に配置することもできる。
【0045】
例えば、学習部400、モデル500、評価値計算部600、学習パラメータデータベース250、評価値計算パラメータデータベース260、及びモデルパラメータデータベース270を外部のシステムとして構成し、この外部のシステムと制御装置200とをインターネットで接続して、外部のシステムの学習部400で生成された学習情報データ20をインターネット経由で制御装置200に送信するようにしても良い。
【0046】
また、評価値計算部600及び学習情報追加部800の一方、或いは両方を用いずに、制御装置200を構築すれば、高度な制御機能は低下するがプラントの制御は可能である。
【0047】
また、プラント100とモデル500の特性が一致するように、モデルパラメータデータベース270に保存されているモデルパラメータ16を修正する機能を付け加えるように構成しても良い。
【0048】
以下では、本発明の実施例であるプラントに対する制御装置200を、火力発電プラント100aに適用した場合について説明する。尚、火力発電プラント以外のプラントを制御する際にも、本発明の実施例の制御装置200を使用することができることはいうまでもない。
【0049】
図2は、火力発電プラント100aを制御対象のプラントにした場合のプラントの概略システムを示す図である。まず、火力発電プラント100aにおける発電の仕組みについて説明する。
【0050】
火力発電プラント100aを構成するボイラ101には、ミル110で石炭を細かく粉砕した燃料となる微粉炭と、微粉炭搬送用の1次空気、及び燃焼調整用の2次空気を供給するバーナー102が設けられており、このバーナー102を介して供給した微粉炭をボイラ101の内部で燃焼させる。尚、微粉炭と1次空気は配管134から、2次空気は配管141からバーナー102に導かれる。
【0051】
また、ボイラ101には2段燃焼用のアフタエアをボイラ101に投入するアフタエアポート103が設けられており、アフタエアは配管142からアフタエアポート103に導かれる。
【0052】
微粉炭の燃焼により発生した高温の燃焼ガスは、ボイラ101の内部の経路に沿って下流側に流れた後、ボイラ101に配設された熱交換器106を通過して熱交換し、このエアーヒーター104にて高温・高圧の蒸気を発生させる。その後は、排ガス処理した後に煙突から大気に放出される。
【0053】
ボイラ101の熱交換器106を循環する給水は、給水ポンプ105を介して熱交換器106に給水を供給し、熱交換器106においてボイラ101を流下する燃焼ガスによって過熱され、高温高圧の蒸気となる。尚、本実施例では熱交換器106の数を1つとしているが、熱交換器106を複数個配置してもよい。
【0054】
熱交換器106を通過した高温高圧の蒸気はタービンガバナ107を介して蒸気タービン108に導かれ、蒸気の持つエネルギーによって蒸気タービン108を駆動して発電機109で発電する。
【0055】
火力発電プラント100aには火力発電プラントの運転状態を検出する様々な計測器が配置されており、これらの計測器から取得されたプラントの制御出力に関する情報は、計測情報1として制御装置200に送信される。例えば、図2には、プラントの制御出力に関する情報を検出するものとして、流量計測器150、温度計測器151、圧力計測器152、発電出力計測器153、及び濃度計測器154が図示されている。
【0056】
流量計測器150では、給水ポンプ105からボイラ101に供給される給水の流量を計測する。また、温度計測器151及び圧力計測器152は、熱交換器106から蒸気タービン108に供給される蒸気の温度、圧力を計測する。
【0057】
発電機109で発電された電力量は、発電出力計測器153で計測する。ボイラ101を通過する燃焼ガスに含まれている成分(CO、NOxなど)の濃度に関する情報は、ボイラ101の下流側に設けた濃度計測器154で計測することができる。
【0058】
尚、一般的には、図2に図示した以外にも多数の計測器が火力発電プラントに配置されているが、ここでは図示を省略する。
【0059】
次に、ボイラ101の内部にバーナー102から投入される1次空気と2次空気の経路、及びアフタエアポート103から投入されるアフタエアの経路について説明する。
【0060】
1次空気は、ファン120から配管130に導かれ、途中でボイラ101の下流側に設置されたエアーヒーター104を通過する配管132と通過せずにバイパスする配管131とに分岐して再び配管133にて合流し、バーナー102の上流側に設置されたミル110に導かれる。
【0061】
エアーヒーター104を通過する空気は、ボイラ101を流下する燃焼ガスにより加熱される。この1次空気を用いてミル110において粉砕した微粉炭を1次空気と共にバーナー102に搬送する。
【0062】
2次空気及びアフタエアは、ファン121から配管140に導かれ、エアーヒーター104で同様にして加熱された後に、2次空気用の配管141とアフタエア用の配管142とに分岐して、それぞれバーナー102とアフタエアポート103に導かれる。
【0063】
図3は、図2に示した1次空気、2次空気、及びアフタエアの通過する配管130、131、132、133、140、141、142の配管部、並びにエアーヒーター104を表した拡大図である。
【0064】
図3に示すように、これらの配管のうち、配管131、132、141、142にはエアダンパ160、161、162、163が夫々配置されている。これらのエアダンパ160、161、162、163を夫々操作することにより、前記各配管131、132、141、142における空気が通過する面積を変更することできるので、配管131、132、141、142を通過する空気流量を夫々個別に調整できる。
【0065】
制御装置200によって生成された各種の操作信号24を用いて、制御対象の火力発電プラント100aの状態量を制御する操作端を構成する給水ポンプ105、ミル110、エアダンパ160、161、162、163などの機器を夫々操作する。尚、本実施例では給水ポンプ105、ミル110、エアダンパ160、161、162、163などの機器のことを操作端と呼び、これを操作するのに必要な指令信号を操作信号24と呼ぶ。
【0066】
また、燃焼用等の空気、或いは微粉炭等の燃料をボイラ101に投入する際に、その吐出角度を上下に動かすことのできる機能をバーナー102及びアフタエアポート103に付加して、これらの角度を操作信号24に含めることもできる。
【0067】
図4は、制御装置200の操作信号生成部300における信号処理を説明する詳細図である。図4において、操作信号生成部300では、プラント100の計測信号1を外部入力インターフェイス201を介して収集した計測信号2、学習情報データベース280に保存されている学習情報データ22、及び制御ロジックデータベース240に保存されている制御ロジックデータ11が夫々入力され、これらの信号及びデータを参照して操作信号生成部300にて演算したプラント100に対する制御指令である操作信号24を外部入力インターフェイス202を介して出力する操作信号23を生成する。
【0068】
操作信号生成部300には、学習信号生成部310、運転目標値320、加減算器330、331、332、比例積分制御器340、変化率制限器350、351、高値選択器360、361、低値選択器370、371が夫々配置されており、これらの各機器は図4に図示されている態様に接続されている。
【0069】
そして、操作信号生成部300の前記各機器を動作させるのに必要な制御パラメータは、制御ロジックデータベース240及び学習情報データベース280に保存されているものを入力して使用する。尚、操作信号生成部300の構成は図4に示した機器構成以外のものを用いてもよい。
【0070】
加減算器330、331、332では、入力された2つの信号を用いてゼロの値に信号値を加算、或いは減算の演算を夫々行なう。図4では加算する信号を「+」、減算する信号を「−」で表記している。
【0071】
前記加減算器330では、加減算器330に組み込まれた(1)式の関数に基づいて、操作信号生成部300に取り込まれた計測信号2及び運転目標値信号380を用いて信号381を計算する。
【0072】
【数1】

【0073】
ここで、χ1は信号381の値、χ2は運転目標値信号380、χ3は計測信号2の値である。
【0074】
次に比例積分制御器340では、比例積分制御器340に組み込まれた(2)式の関数に基づいて、信号381、信号381の前回値と、基準信号382の前回値を用いて基準信号382を計算する。尚、前回値とは、1サンプル制御周期前の値であることを意味する。
【0075】
【数2】

【0076】
ここで、P1、及びP2は制御パラメータ、χ4は基準信号382の値、χ5は信号381、χ6は信号381の前回値、χ7は基準信号382の前回値である。
【0077】
また、学習信号生成部310では、学習情報データベース280に保存されている学習情報データ22を参照しながら、計測信号2を用いて推奨信号383を導出する。この推奨信号383は操作信号23の推奨値である。
【0078】
学習情報データベース280保存されている学習情報データ22は、学習部400で評価値19からモデル入力17を生成する関数を構築するのに必要なデータである。学習部400で評価値19からモデル入力17を生成するのと同じように、学習信号生成部310では計測信号2から推奨信号383を生成する。
【0079】
加減算器331では、加減算器331に組み込まれた(3)式の関数に基づいて、基準信号382と推奨信号383を用いて信号384を計算する。
【0080】
【数3】

【0081】
ここで、χ8は信号384、χ9は推奨信号383、χ10は基準信号382の値である。
【0082】
変化率制限器350では、1サンプル制御周期あたりに変化する信号384の値を制限する。この変化率制限器350では、変化率制限器350に組み込まれた(4)式の関数に基づいて、信号385を計算する。
【0083】
【数4】

【0084】
ここで、P3、P4は制御パラメータであり、χ11は信号385、χ12は信号384の前回値、χ13は信号384の値である。P3、P4はそれぞれ、増レートパラメータ、減レートパラメータと呼ぶ。
【0085】
変化率制限器350を用いることにより、1サンプル制御周期あたりに変化する操作信号384の値が、増レートパラメータの値と減レートパラメータの範囲内になるように、信号385の値を制限できる。
【0086】
高値選択器360は、信号386がある閾値以下の値にならないようにする機能を持つ。高値選択器360では、高値選択器360に組み込まれた(5)式の関数に基づいて、信号386を計算する。
【0087】
【数5】

【0088】
ここで、P5は制御パラメータであり、χ14は信号386、χ15は信号385の値である。P5は下減パラメータと呼ぶ。高値選択器360を用いることにより、信号386の値がP5の値以下にならないようにすることができる。
【0089】
低値選択器370は、補正信号387がある閾値以上の値にならないようにする機能を持つ。低値選択器370では、低値選択器370に組み込まれた(6)式の関数に基づいて、補正信号387を計算する。
【0090】
【数6】

【0091】
ここでP6は制御パラメータであり、χ16は補正信号387、χ17は信号386の値である。P6は上限パラメータと呼ぶ。低値選択器370を用いることにより、信号387の値がP6の値以上にならないようにすることができる。
【0092】
図4では、変化率制限器(RL)、高値選択器(HL)、低値選択器(LL)が複数用いられているが、動作内容は(4)式〜(6)式の関数と同じである。尚、変化率制限器350、351、高値選択器360、361、低値選択器370、371の制御パラメータは個別に設定することができる。
【0093】
これらの制御パラメータの設定は、プラント100の運転員が外部入力装置900、保守ツール910、及び画像表示装置950を用いて設定する。
【0094】
以上の各機器で計算で算出された基準信号382と補正信号387を用いて、加減算器332ではこの2つの信号を加算して信号388を計算する。変化率制限器351を用いて信号388から信号389を計算し、高値選択器361を用いて信号389から信号390を計算し、最後に低値選択器371を用いて信号390から操作信号23が計算され、この操作信号23が外部インタフェース202からプラント100に対する指令信号24となって制御装置200から出力される。
【0095】
制御装置200の操作信号生成部300を図4で示したように構成することで、以下に述べる作用効果が得られる。
【0096】
まず、操作信号生成部300に変化率制限器351、高値選択器361、低値選択器362を備えることにより、操作信号23が予め設定された許容範囲内に制限され、さらに予め設定された値以上に急激に変化することを抑止できる。
【0097】
従って、操作端の動作速度、動作範囲を逸脱した操作信号23が計算されて指令信号24として出力されることを防止できる。
【0098】
また、プラント100の運転状況によっては、指令信号24となる操作信号23を大きく変化させるとプラント100の安全運転に支障が出る場合がある。このような場合でも、変化率制限器351の制御パラメータを適切に設定することにより、プラント100を安全に運転することができる。
【0099】
ところで、図4に示した操作信号生成部300では、学習信号生成部310にて計算した推奨信号383を用いて直接操作信号23を計算せずに、加減算器331にて推奨信号383から基準信号382を減算し、変化率制限器350、高値選択器360、低値選択器370を適用した後、再び基準信号382を加算している。
【0100】
学習信号生成部310では、モデル500を用いて学習した結果が保存されている学習情報データベース280を参照して推奨信号383を生成しているので、仮にモデル500とプラント100の特性が異なる場合には推奨信号383を指令信号24としてプラント100に与えても、所望の性能を得ることができない可能性がある。
【0101】
また、推奨信号383を指令信号24としてプラント100に与えることにより、プラント100を安全に運転できなくなる可能性もある。
【0102】
このような事態を回避するため、操作信号生成部300では、変化率制限器350、高値選択器360、低値選択器370を用い、この制御パラメータを適切に設定することにより、学習信号生成部310が生成する推奨信号383が操作信号23に寄与する度合いを調整できるように構成している。
【0103】
例えば、学習信号生成部310を導入した当初は、モデル500とプラント100の特性の違いに関する情報がないので、推奨信号383が操作信号23に与える影響が小さくなるように制御パラメータを設定しておき、特性が一致することを確認した後、推奨信号383が操作信号23に与える影響が大きくなるように制御パラメータを再設定するなどの対応を実施できる。
【0104】
火力発電プラント100aでは、発電出力を一定に保つ発電出力一定運転、発電出力を変化させる発電出力変化運転、ボイラ101のバーナーの点火を切り替えるバーナー切り替え運転、燃料とする石炭の種類を切り替える炭種切り替え運転など、様々な運転形態がある。また、発電出力一定運転であっても、燃料とする炭種が異なる場合もある。
【0105】
本発明の実施例である火力発電プラント100aの制御装置200では、このような様々な運転形態毎に、制御パラメータを決定できるため、プラントの運転形態に合致した指令信号を生成できる。
【0106】
図5は、本発明の実施例であるプラントの制御装置200による制御パラメータ設定画面の1例を示している。図5では、火力発電プラント100aの制御装置200が備えている操作信号生成部300が有する変化率制限器350において、制御パラメータを設定する画面を示している。
【0107】
図5に示すように、操作信号生成部300が有する変化率制限器350において、火力発電プラント100aの運転形態毎に増レートの各パラメータ、及び減レートの各パラメータを設定する状況を表している。
【0108】
次に、図1に示す制御装置200が備えている学習パラメータデータベース250に保存される学習パラメータを決定する学習条件決定部700について説明する。学習条件決定部700では、学習部400が学習を実施する際に参照する学習パラメータ14を決定する。
【0109】
学習部400が学習を実施する際には、1サンプリング制御周期あたりに動かすことのできるモデル入力17の変化幅、モデル入力17の上限値、モデル入力17の下限値が夫々必要である。
【0110】
制御装置200の学習条件決定部700では、制御ロジックデータベース240に保存されている制御ロジックデータ6、操作端仕様データベース220に保存されている操作端仕様データ4、及び計測信号データベース210に保存されている計測信号データ3を参照して、学習パラメータデータベース250に保存する学習パラメータ8を決定する。
【0111】
プラント100を運転する前は計測信号を得ることはできないので、学習条件決定部700では制御ロジックデータ6、及び操作端仕様データ4から学習パラメータ8の初期値を決定し、プラント100を運転し、計測信号を得た後は計測信号データ3も用いて、学習パラメータ8を更新していく。
【0112】
図6は、本発明の実施例であるプラントの制御装置200が備えている学習条件決定部700において、学習パラメータ8の初期値を決定する方法を説明する図である。
【0113】
図6では、操作端毎に、その変化率制限、上限、及び下限に関するデータが記載されている。制御ロジックデータ6の値はRL、LL、HLの欄に反映されて表示され、操作端仕様データ4の値は仕様の欄に反映されて表示されている。制御ロジックデータ6の値とは、例えば図5で示した操作信号生成部300が有する変化率制限器350にて設定された制御パラメータのことである。また、操作端仕様データ4の値とは、例えば操作端の動作限界速度、上限値、下限値のことであり、これらの値はプラント100の運転員によって設定される。
【0114】
学習条件決定部700では、図6に記載された値の中から、モデル入力17を生成する際に自由度が最小となる値を選択し、この値を学習パラメータ8の初期値として学習パラメータデータベース250に送信する。例えば、変化率制限パラメータの増レート、及び減レートは、その絶対値が大きいほど1サンプル制御周期で動かせるモデル入力の変化幅を大きくすることができるので、自由度も大きくなる。
【0115】
逆に、変化率制限パラメータの絶対値が小さいと、自由度も小さくなる。従って、変化率制限パラメータの増レート、及び減レートは、その絶対値が小さい値を学習パラメータ8の初期値として、学習パラメータデータベース250に送信する。
【0116】
また、上限値については最小値、下限値については最大値を選択することで、モデル入力17を生成する際の自由度を最小にできる。
【0117】
尚、本実施例ではモデル入力17を生成する際の自由度が最小となる値を選択し、学習パラメータ8の初期値を決定したが、操作端仕様データベース220に保存されている操作端仕様データ4の値をそのまま学習パラメータ8の初期値に決定するなど、様々な選択方法を設定することもできる。
【0118】
また、学習条件決定部700では、制御ロジックデータ6に含まれている信号、あるいは計測信号データ3を処理することにより、現状のプラント100の運転形態を推定する機能がある。この機能を用いることにより、プラントの運転形態別に設定されている制御パラメータのうち、現在どの値が使用されているかを判定できる。
【0119】
次に、学習パラメータ8の更新方法について説明する。まず、プラント100の運転形態が変化し、制御ロジックデータ6の値が変化した場合、この変化した制御ロジックデータ6の値を用いて、図6にて説明した方法を用いて学習パラメータ8を決定する。
【0120】
また、学習条件決定部700では、計測信号データ3と操作信号データ5を用いて学習パラメータ8を更新する。この学習条件決定部700における学習パラメータ8の更新方法について、図7を用いて説明する。
【0121】
図7は学習条件決定部700における学習パラメータ8の更新方法の一例を示すものであり、図7では時刻t1、t2における操作端Aに関する操作信号データ3と計測信号データ5を表している。Δtは1サンプル制御周期の時間であり、C1は時刻t1における操作信号Aの値、C2は時刻t2における操作信号データ3の値、C3は時刻t2における計測信号データ5の値である。
【0122】
図7において、時刻t1から時刻t2に至るΔtの時間の間に操作信号Aである操作信号データ3はC2−C1の差信号分だけ変化しているのに対して、計測信号データ5はC3−C1の差信号分しか変化しておらず、操作信号データの変化幅に比べて計測信号データの変化幅が小さい。
【0123】
これは、操作端Aが1サンプル制御周期あたりの動作限界速度よりも、操作信号の変化幅の方が大きい場合に生じる事象である。このような場合、操作信号Aの増レートに関する学習パラメータ8の値を、C3−C1の差信号の値に設定する。
【0124】
以上の方法で学習条件決定部700にて学習パラメータ8を決定し、この学習パラメータ8を学習パラメータデータベース250に保存する。また、運転形態が変化して、制御パラメータが変化した場合も、学習パラメータ8を更新する。
【0125】
次に、制御装置200の学習部400において、モデル500に対するモデル入力17を決定して、モデル500から出力するモデル出力18の1つである窒素酸化物(NOx)を低減することを例として説明する。
【0126】
尚、モデル出力18として、窒素酸化物のほかにも一酸化炭素(CO)、二酸化炭素濃度、硫化酸化物、水銀、蒸気温度、蒸気圧力などを所望の値に制御する場合にも、本発明の実施例のプラントの制御装置を用いることにより制御可能である。
【0127】
図8は、モデル500に入力するモデル入力17と、モデル500から出力するモデル出力18との関係を図示したものである。尚、図8ではモデル入力Aとモデル入力Bの2種類をモデル入力17とし、NOxをモデル出力18としている。
【0128】
図8のように、モデル入力AをA1、モデル入力BをB1とすると、モデル出力18のNOxはNOx高となり、モデル入力AをA2、モデル入力BをB2とすると、モデル出力18のNOxはNOx低となる。このように、学習部400では、図8に示すように、初期状態からNOx低の領域に到達するための方法を学習することができる。
【0129】
図9は、学習部400にてモデルを対象にモデル入力の生成方法を学習した結果の一例を図示したものであり、図9では可能な限り少ない操作回数でNOx低の領域に到達し、かつNOx高の領域に状態遷移しないという条件で学習した結果を表している。
【0130】
尚、一度の操作で直接NOx低の領域に到達しないのは、1サンプル制御周期あたりに動かすことのできるモデル入力Aとモデル入力Bの値が制限されているためである。
【0131】
1サンプルあたりに動かすことのできるモデル入力17の値は、図6で説明した操作端の増レート、減レートなどの学習パラメータ8(学習パラメータ14)に基づいて、操作端とモデル入力の項目が対応するように決定される。
【0132】
図9に示すように、1回操作後の状態を経て2回操作後の状態でNOx低の領域に達したことを示すように、学習部400では2回の操作でNOx低の領域に到達する方法を学習した。
【0133】
図10は図9と同様に学習部400にて操作信号の生成方法を学習した結果の一例である操作信号Aと操作信号Bの関係を図示したものであり、モデル力Aと操作信号A、モデル入力Bと操作信号Bがそれぞれ対応している。
【0134】
図10にて点線矢印で示した操作方法が、制御装置200の学習部400にて学習した結果を表すものである。図10では操作信号Aの動作速度が小さい場合、1回の操作後にNOx高の領域に状態遷移してしまう。
【0135】
これは、操作信号24とモデル入力17の動作限界速度が異なる場合には、学習部400にて可能な限り少ない操作回数でNOx低の領域に到達し、かつNOx高の領域に状態遷移しないという条件でモデル入力17の生成方法を学習した結果に従って操作信号24を生成し、これをプラントに与えてしまうと、学習の際に設定した条件を満足できなくなる可能性があることを意味している。
【0136】
本発明の実施例では、このような事態を回避するため、次のような工夫がなされている。つまり、本実施例では、制御装置200に学習条件決定部700が設けられており、プラント100の操作端の動作限界速度を含む学習パラメータ8を前述したように決定し、学習パラメータ8を学習パラメータデータベース250に保存する。学習部400において、学習パラメータデータベース250に保存されている学習パラメータ14を参照することにより、操作信号24とモデル入力17の動作限界速度が一致することを前提に学習を実施する。
【0137】
次に、制御装置200の制御動作を図11に示すフローチャートを用いて説明する。
【0138】
図11は、図1に記載の本発明の実施例におけるプラントの制御装置200でのプラントのモデルの模擬と学習の内容についての演算プロセスを示すフローチャートである。
【0139】
図11に示めした制御装置200の制御動作のフローチャートは、図1に記載の学習情報追加部800が備えられていない場合にも適用することができる。学習部情報追加部800の動作内容と、これが備えられている場合のフローチャートについては、後述する。
【0140】
図11に示したように、制御装置200の制御動作のフローチャートは、ステップ1010、1020、1030、1040、1050、及び1060を組み合わせて実行する。以下ではそれぞれのステップについて、説明する。
【0141】
まず、ステップ1010では、学習部400とモデル500を動作させ、モデル出力18がモデル出力目標値を達成するようなモデル入力17の生成方法を学習する。
【0142】
尚、評価値計算部600において、評価値計算パラメータデータ15を使用しながら、モデル出力18がモデル出力目標値を達成しているかどうか、もしくはモデル出力18とモデル出力目標値が近い値となっているかどうかについて、定量的に評価された値である評価値19を用いて学習を実施してもよい。
【0143】
評価値計算パラメータデータベース260には、モデル出力目標値など、評価値19を計算するのに必要なパラメータ値が保存されている。学習には、遺伝的アルゴリズム、動的計画法、強化学習法などの最適化手法を適用することができる。
【0144】
次に、ステップ1020では、学習部400を動作させ、ステップ1010にて学習した結果を学習情報データ20として学習部400から学習情報データベース280に送信する。この学習情報データ20とは、例えばモデル出力18からモデル入力17を生成するのに必要な関数に関する情報である。
【0145】
次に、ステップ1030において、操作信号生成部300を動作させて操作信号23を生成する。操作信号23は操作信号データベース230と外部出力インターフェイス202に送信され、外部出力インターフェイス202からプラント100に制御指令となる操作信号24が与えられる。
【0146】
次に、ステップ1040では、外部入力インターフェイス201を動作させ、プラント100の制御出力である計測信号1を制御装置200の内部に取り込み、計測信号2を操作信号生成部300と計測信号データベース210に送信する。
【0147】
次に、ステップ1050では、学習条件決定部700にて学習条件となる学習パラメータ8を決定し、この学習パラメータ8を学習パラメータデータベース260に送信する。
【0148】
そして、ステップ1060では、学習条件決定部700において、学習パラメータデータベース250に保存されている学習パラメータの前回値である学習パラメータ9と学習パラメータ8を比較し、その値が同じ場合には学習トリガ7を「0」、異なる場合は学習トリガ7を「1」とし、学習部400に送信する。
【0149】
学習トリガ7が「1」となることは、学習パラメータの値が変更されたことを意味しており、ステップ1010に戻って新しい学習パラメータ14を用いて学習を実施する。これを再学習と呼ぶ。
【0150】
尚、学習部400では前回の学習結果である学習情報データ21を用いて、再学習することもできる。学習トリガ7が「0」で、再学習しない場合には、ステップ1030に戻る。
【0151】
図12は、図11に示した本発明の一実施例である制御装置200による制御動作のフローチャートに示す演算方法を用いて学習した学習効果を説明する図である。
【0152】
図12において、制御装置200の学習条件決定部700では、操作信号24の動作限界速度を考慮して、モデル入力17の動作限界速度を学習パラメータ8とする。そのため、制御装置200のモデル500を用いて学習部400にて学習したモデル入力17の生成方法(図12の上図)に従って制御指令となる操作信号24をプラント100に与えることで、図12の下図に示すようにNOx高の領域に状態遷移することなく、初期状態から4回操作後の状態でNOx低の領域に到達することができることを示している。
【0153】
また、同じ設計仕様データの操作端を複数使用しているものの、実際の動作速度にはばらつきがある場合でも、個々の操作端の動作限界速度を考慮して学習できるようになる。また、操作端が経年劣化し動作速度が低下した場合も、低下した動作速度を学習する際の条件とすることができる。
【0154】
さらに、発電出力変化運転、バーナー切り替え運転、炭種切り替え運転など、プラントの運転状態が変化して、変化率制限器などの制御パラメータが変更された場合も、その変更された条件で学習することができる。また、制御パラメータをプラント100の運転員が変更した場合にも、その変更された条件で学習することができる。
【0155】
その結果、学習したモデル入力17の生成方法に従って生成した操作信号24をプラント100に制御指令として与えることによって、プラントの制御として所望の制御結果を得ることができる。
【0156】
また、制御装置200の学習条件決定部700において学習の拘束条件を自動的に決定するため、プラントの運転員が学習の拘束条件を決定する作業が不要になり、制御装置の使い勝手が向上する、学習のための条件設定期間が短縮できる、という効果も得られる。
【0157】
ところで、図11に示した制御装置200の制御動作のフローチャートでは、学習条件決定部700にて学習パラメータがその前回値と違う値となった場合に、ステップ1010にて再学習を実施する必要がある。この学習には計算資源を要するので、高速演算可能な制御装置を用いるか、学習に時間をかける必要がある。
【0158】
高速演算可能な制御装置を使用するにはコストがかかる。また、学習に時間をかける場合、学習している期間は学習信号生成部310の動作を停止する必要があり、学習部400とモデル500で学習した結果を操作信号24の生成に反映できなくなる。
【0159】
そこで、その対策として、本発明の実施例では、図1に示す制御装置200に学習情報追加部800を設けている。学習情報追加部800では、学習トリガ7が「1」となった場合に、学習パラメータデータ14と学習情報データ12を用いて、学習情報データ13を生成し、学習情報データベース280に送信する。学習情報追加部800を用いることで、再学習を実施することなく、学習パラメータ14を学習の条件とした場合の学習結果である学習情報データ13を生成することができる。
【0160】
従って、学習条件決定部700にて学習パラメータが変更された場合を考慮して、高速演算可能な制御装置を用いることや、あるいは学習条件決定部700にて学習パラメータが変更された場合に学習信号生成部310の機能が停止することはない。
【0161】
次に、制御装置200に学習情報追加部800を設けた場合における制御動作を図13に示すフローチャートを用いて説明する。
【0162】
図13は、本発明の一実施例であるプラントの制御装置に学習情報追加部800を設置した場合における制御装置200でのプラントのモデルの模擬と学習の内容についての演算処理内容を示すフローチャートである。
【0163】
図13に示したように、制御装置200の制御動作のフローチャートは、ステップ1110、1120、1130、1140、1150、1160、1170を組み合わせて実行する。以下ではそれぞれのステップについて、説明する。
【0164】
まず、ステップ1110では、学習部400において、モデル500を対象にモデル出力18がモデル出力目標値を達成するようなモデル入力17の生成方法を学習する。尚、図11のローチャートのステップ1010と同じように、評価値計算部600を用いて学習してもよい。また、ステップ1010と同じような最適化手法を用いることもできる。
【0165】
ステップ1110で学習する際に、モデル入力17の変化幅の最小設定値を用いて入力空間を領域に分割して学習を実施する。モデル入力17の変化幅の最小設定値は、プラント100の運転員が設定する値である。
【0166】
図14はステップ1110で学習部400においてモデル入力17の生成方法を学習する際に、その入力空間を領域に分割した場合の説明図である。
【0167】
図14に示すように、学習部400では、モデル入力A、及びモデル入力Bの動作可能範囲をモデル入力変化幅の最小設定値に分割する。次に、1回の操作で変化できるモデル入力の変化幅を、モデル入力変化幅の最小設定値に制限して学習を実施する。
【0168】
つまり、個々の領域では、隣接する領域に移動する操作方法を学習することになる。例えば、操作回数が最小で、NOx高の領域に状態遷移しない条件で学習した結果を用いて初期状態から操作を開始すると、図14に示した経路である、操作回数最小でNOx低の領域に到達、の経路をたどってNOx低の領域に到達する。
【0169】
次に、ステップ1120では、学習部400を動作させ、ステップ1210にて学習した結果を学習情報データ20として学習部400から学習情報データベース280に送信する。
【0170】
次に、ステップ1130では、学習条件決定部700を動作させて学習条件を決定し、学習パラメータ8を学習パラメータデータベース250に送信する。
【0171】
ステップ1140では、学習条件決定部700において、学習パラメータデータベース250に保存されている学習パラメータの前回値である学習パラメータ9と学習パラメータ8を比較し、その値が同じ場合には学習トリガ7を「0」、異なる場合は学習トリガ7を「1」とし、学習トリガが「1」の場合はステップ1150に、学習トリガ7が「0」の場合はステップ1160に進む。
【0172】
次に、ステップ1150では、学習情報追加部800を動作させ、学習情報データベースに保存されている学習情報データ12と、学習パラメータデータベース250に保存されている学習パラメータ10を用いて、追加学習情報データ13を生成し、学習情報データベース280に送信する。
【0173】
尚、ステップ1150で用いる学習情報データ12は、ステップ1110にて学習した結果である。
【0174】
次に、制御装置200に設けた学習情報追加部800の制御動作について説明する。
【0175】
図15は、図1に示す制御装置200に設けた学習情報追加部800の動作内容を説明するもので、図13に示すフローチャートにおけるステップ1150の詳細を説明するフローチャートである。
【0176】
図15において、ステップ810では、ステップ1110にて学習した結果である学習情報データ12を用いて、領域毎に目標状態に到達するのに要する操作回数を導出する。これは、ある領域を初期状態に設定し、そこから目標状態に到達するまでの操作回数を求める、という作業を全ての領域で実行すること等により、導出することができる。
【0177】
次に、ステップ820において、領域毎に、学習パラメータ10を用いて1回の操作で遷移できる状態の範囲(操作可能範囲)を決定し、操作可能範囲内の領域について、ステップ810で求めた操作回数の値を全て抽出する。
【0178】
次に、ステップ830では、ある1つの領域において、ステップ820で抽出した操作回数の値が最小となる領域に遷移する操作方法が最適な操作方法であると判断し、その操作方法を追加学習情報データ13として、学習情報追加部800から学習情報データベース280に送信するものである。
【0179】
図16は学習情報追加部800の動作内容を説明した図15のフローチャートにて学習した結果を説明する説明図である。図16に示すように、初期状態では図中の矢印のように操作することが、学習情報追加部800にて生成される追加学習情報データ13に含まれる。
【0180】
図16の初期状態からの矢印に従って操作すると、初期状態における操作可能範囲の中から、NOx低の領域に到達するのに要する操作回数が最小となる領域に到達できる。
【0181】
以上の説明内容が図13に示すステップ1150の動作説明である。
【0182】
次に、ステップ1160では、操作信号生成部300を動作させ、ステップ1150にて生成された学習情報データ22と制御ロジックデータ11を用いて操作信号23を生成する。この操作信号23は外部出力インターフェイス202を介して、制御指令となる操作信号24としてプラント100に送信される。
【0183】
次に、ステップ1170では、外部入力インターフェイス201を動作させ、プラントの制御出力である計測信号1を制御装置200の内部に取り込む。その後、ステップ1130に進み、上記したステップ1130〜ステップ1170の動作を繰り返す。
【0184】
ところで、図11に示す制御装置200の制御動作のフローチャートでは、制御装置200の学習条件決定部700にて学習トリガ7が「1」となった場合に、ステップ1010に進み再学習する必要があった。
【0185】
これに対して、図13に示す制御装置200の制御動作のフローチャート図では、学習トリガ7が「1」となった場合でも、ステップ1110にて学習した結果を用いて学習情報追加部800を動作させることで、学習パラメータ14(学習パラメータ10)を学習条件とした場合のモデル入力17の生成方法を学習した場合と同じ学習情報データを生成できる。
【0186】
その結果、図11のフローチャートを用いることによる効果のほかに、高速演算可能な制御装置を用いない場合でも、学習信号生成部310の機能を停止させずにプラントを制御することが可能になるとの効果が得られる。
【0187】
本発明のプラントの制御装置及び制御方法を火力発電プラントに適用する実施例の効果として、火力発電プラントから排出される排ガス中のNOxの濃度を低減できることがあげられる。
【0188】
更に、NOxの濃度の低減に伴って、排ガス中からNOxを低減するために必要な脱硝装置でのアンモニアの使用量が削減でき、脱硝装置の触媒活性が長時間持続できる効果も得られる。
【0189】
また、本発明の実施例のプラントの制御装置によれば、学習の拘束条件の決定に用いる学習パラメータの初期値を操作端の動作限界速度に関する事前情報(仕様)を用いて決定する。また、計測信号を用いてこの学習パラメータを逐次修正するため、プラントの操作端の動作速度を学習パラメータに反映することができる。
【0190】
例えば、設計仕様の操作端を複数使用し、実際の動作速度にはばらつきがある場合は、個々の操作端の動作速度を考慮した学習を実施できるようになる。また、操作端が経年劣化し動作速度が低下した場合でも、低下した動作速度を拘束条件として学習してプラントを良好に制御することができるので、プラントを安全に運転することが可能となるという効果が得られる。
【0191】
また、本実施例のプラントの制御装置を用いることにより、プラントの運転員が学習の拘束条件を決定する作業が不要になるため、制御装置の使い勝手の向上、学習のための条件設定期間の短縮という効果も得られる。
【産業上の利用可能性】
【0192】
本発明は火力発電プラント等のプラントの制御装置及びプラントの制御方法に適用可能である。
【図面の簡単な説明】
【0193】
【図1】本発明の一実施例であるプラントの制御装置の全体構成を示すブロック図。
【図2】本発明の一実施例であるプラントの制御装置が適用される火力発電プラントの構成図。
【図3】図2に示した火力発電プラントの配管部とエアーヒーター部の拡大図。
【図4】図1に示したプラントの制御装置における操作信号生成部のブロック図。
【図5】図1に示したプラントの制御装置における制御パラメータ設定画面の説明図。
【図6】図1に示したプラントの制御装置における学習条件決定部の機能の説明図。
【図7】図1に示したプラントの制御装置における学習条件決定部の学習パラメータ更新方法の一例を示す説明図。
【図8】図1に示したプラントの制御装置におけるモデルのモデル入力とモデル出力の関係を示す説明図。
【図9】図1に示したプラントの制御装置における学習部のモデルを対象にモデル入力の生成方法を学習した学習結果を示す説明図。
【図10】図1に示したプラントの制御装置における学習部で学習して生成した操作信号の学習結果を示す説明図。
【図11】本発明の一実施例であるプラントの制御装置の演算処理内容を示すフローチャート。
【図12】図11に示すフローチャートに基づいて学習したモデル入力及び操作信号の学習結果を示す説明図。
【図13】本発明の一実施例であるプラントの制御装置に学習情報追加部を設置した場合の演算処理内容を示すフローチャート。
【図14】図13に示すフローチャートに基づいて学習したモデル入力の入力空間を領域に分割する方法の説明図。
【図15】図13に示すフローチャートにおけるステップ1150の詳細を示すフローチャート。
【図16】図15に示すフローチャートを用いて学習した学習結果を示す説明図。
【符号の説明】
【0194】
1、2:計測信号、3:計測信号データ、8、9、10:学習パラメータ、17:モデル入力、18:モデル出力、19:評価値、23:操作信号、24:指令信号、100:プラント、100a:火力発電プラント、101:微粉炭をボイラ、200:制御装置、201:外部入力インターフェイス、202:外部出力インターフェイス、210:計測信号データベース、220:操作端仕様データベース、230:操作信号データベース、240:制御ロジックデータベース、250:学習パラメータデータベース、260:評価値計算パラメータデータベース、270:モデルパラメータデータベース、280:学習情報データベース、300:操作信号生成部、400:学習部、500:モデル、600:評価値計算部、700:学習条件決定部、800:学習情報追加部、900:外部入力装置、901:キーボード、902:マウス、910:保守ツール、920:外部入力インターフェイス、930:データ送受信処理部、940:外部出力インターフェイス、950:画像表示装置。

【特許請求の範囲】
【請求項1】
プラントの運転状態量である計測信号を用いてプラントに与える制御指令となる操作信号を算出する操作信号生成部を備えたプラントの制御装置において、制御装置には、制御対象となるプラントの制御特性を模擬するモデルと、操作信号生成部で操作信号の算出に使用する制御パラメータを含む制御ロジックデータが保存されている制御ロジックデータベースと、プラントの状態量を制御する操作端の操作端仕様データが保存されている操作端仕様データベースと、過去の操作信号が保存されている操作信号データベースと、過去の計測信号が保存されている計測信号データベースと、制御ロジックデータベースと操作端仕様データベースに保存されているデータを用いて学習パラメータの初期値を決定する機能と制御ロジックデータベースと操作信号データベースと計測信号データベースに保存されているデータを用いて前記学習パラメータを更新する機能とを持つ学習条件決定部と、学習パラメータに含まれている単位時間当たりの操作信号変化幅の制限値を学習の拘束条件に設定して前記モデルを用いてプラントの操作方法を学習する学習部と、学習部で学習した学習情報データが保存されている学習情報データベースを夫々備えさせ、操作信号生成部にはプラントの運転状態量である計測信号と学習情報データベースに保存されている学習情報データを用いてプラントに対する操作信号を算出する学習信号生成部を備えさせたことを特徴とするプラントの制御装置。
【請求項2】
請求項1に記載のプラントの制御装置において、学習情報データベースに保存されている学習情報データを用いて学習パラメータに含まれている単位時間当たりの操作信号変化幅の制限値を学習の拘束条件に設定して学習部にて学習を実施した場合の学習情報データを推定し、この推定結果である追加学習情報データを学習情報データベースに送信する機能を持つ学習情報追加部が備えられていることを特徴とするプラントの制御装置。
【請求項3】
火力発電プラントの運転状態量である計測信号を用いて火力発電プラントに与える制御指令となる操作信号を算出して火力発電プラントを制御するプラントの制御装置において、制御装置には、制御対象となる火力発電プラントの制御特性を模擬するモデルと、操作信号生成部で操作信号の算出に使用する制御パラメータを含む制御ロジックデータが保存されている制御ロジックデータベースと、火力発電プラントの状態量を制御する操作端の操作端仕様データが保存されている操作端仕様データベースと、過去の操作信号が保存されている操作信号データベースと、過去の計測信号が保存されている計測信号データベースと、制御ロジックデータベースと操作端仕様データベースに保存されているデータを用いて学習パラメータの初期値を決定する機能と、制御ロジックデータベースと操作信号データベースと計測信号データベースに保存されているデータを用いて前記学習パラメータを更新する機能を持つ学習条件決定部と、学習パラメータに含まれている単位時間当たりの操作信号変化幅の制限値を学習の拘束条件に設定して前記モデルを用いて火力発電プラントの操作方法を学習する学習部と、学習部で学習した学習情報データが保存されている学習情報データベースを夫々備えさせ、操作信号生成部にはプラントの運転状態量である計測信号と学習情報データベースに保存されている学習情報データを用いて火力発電プラントに対する操作信号を算出する学習信号生成部を備えさせたことを特徴とするプラントの制御装置。
【請求項4】
請求項3に記載のプラントの制御装置において、計測信号に窒素酸化物濃度、一酸化炭素濃度、二酸化炭素濃度、硫化酸化物、及び水銀の少なくとも1つを含み、操作信号に空気ダンパの開度、空気流量、燃料流量の少なくとも1つを決定する信号を含み、制御装置に備えた学習条件決定部に制御ロジックデータベースと操作信号データベースと計測信号データベースに保存されているデータを用いて火力発電プラントがバーナー切り替え運転、炭種切り替え運転、及び負荷変化運転の少なくとも1つを含む運転を実施しているかどうかを推定してこの推定結果に基づいて学習パラメータを更新する機能と、操作信号データベースと計測信号データベースに保存されているデータを用いて操作端の動作速度を推定してこの推定結果に基づいて学習パラメータを更新する機能を備えさせたことを特徴とするプラントの制御装置。
【請求項5】
請求項4に記載のプラントの制御装置において、制御装置に、学習情報データベースに保存されている学習情報データを用いて学習パラメータに含まれている単位時間当たりの操作信号変化幅の制限値を学習の拘束条件に設定して学習部にて学習を実施した場合の学習情報データを推定して、この推定結果である追加学習情報データを学習情報データベースに送信する機能を持つ学習情報追加部を備えさせ、前記操作信号生成部の学習信号生成部では、学習情報データベースに保存されている追加学習情報データを用いて操作信号を算出するように構成したことを特徴とするプラントの制御装置。
【請求項6】
請求項1又は請求項3に記載されたプラントの制御装置において、制御装置の学習条件決定部に、制御ロジックデータベースに保存されている制御パラメータのうち、単位時間当たりの信号の変化幅を制限するために設定されたパラメータと、操作端仕様データベースに保存されている操作端の動作速度の値を比較して、絶対値が小さい値を学習パラメータの初期値とする機能を持たせるように構成したことを特徴とするプラントの制御装置。
【請求項7】
請求項5に記載されたプラントの制御装置において、制御装置の学習部には、操作端の動作領域を予め設定された領域に分割して、分割した各領域からは隣接する領域にのみ操作できることを学習の拘束条件に設定する機能と、モデルによる模擬の予測結果であるモデル出力がその目標値を達成する領域に到達するのに要する操作回数を算出する機能を持つように構成し、制御装置の学習情報追加部には、予め設定された領域に分割した操作端の動作領域でのある領域の操作方法が、単位時間後に到達できる領域の中で、操作回数の値が最小となる領域に移動する操作方法とする機能を持つように構成したことを特徴とするプラントの制御装置。
【請求項8】
請求項3に記載されたプラントの制御装置において、火力発電プラントの運転形態である通常運転、バーナー切り替え運転、炭種切り替え運転又は負荷変化運転毎に、前記制御装置で使用する制御パラメータを設定するユーザーインターフェイスが設けられていることを特徴とするプラントの制御装置。
【請求項9】
プラントの運転状態量である計測信号を用いてプラントに与える制御指令となる操作信号を算出してプラントを制御するプラントの制御方法において、プラントの制御装置によって制御対象となるプラントの制御特性を模擬するモデルを形成し、操作信号の算出に使用する制御パラメータを含む制御ロジックデータを制御装置の制御ロジックデータベースに保存し、プラントの状態量を制御する操作端の操作端仕様データを操作端仕様データベースに保存し、過去の操作信号を操作信号データベースに保存し、過去の計測信号を計測信号データベースに保存し、制御ロジックデータベースと操作端仕様データベースに保存されているデータを用いて学習パラメータの初期値を決定すると共に、制御ロジックデータベースと操作信号データベースと計測信号データベースに保存されているデータを用いて学習パラメータを更新するようにし、学習パラメータに含まれている単位時間当たりの操作信号変化幅の制限値を学習の拘束条件に設定して前記モデルを用いてプラントの特性を模擬してプラントの操作方法を学習し、学習した結果である学習情報データを学習情報データベースに保存するように構成し、プラントの運転状態量である計測信号と学習情報データベースに保存されている学習情報データを用いてプラントに与える制御指令となる操作信号を算出して、プラントを制御するようにしたことを特徴とするプラントの制御方法。
【請求項10】
請求項9に記載されたプラントの制御方法において、プラントの特性を模擬してプラントの操作方法を学習するに際して、学習情報データベースに保存されている学習情報データを用いて学習パラメータに含まれている単位時間当たりの操作信号変化幅の制限値を学習の拘束条件に設定して学習を実施した場合の学習情報データを推定し、この推定結果である追加学習情報データを学習情報データベースの学習情報データに加えてプラントに与える制御指令となる操作信号を算出して、プラントを制御するようにしたことを特徴とするプラントの制御方法。
【請求項11】
火力発電プラントの運転状態量である計測信号を用いて火力発電プラントに与える制御指令となる操作信号を算出して火力発電プラントを制御するプラントの制御方法において、プラントの制御装置によって制御対象となるプラントの制御特性を模擬するモデルを形成し、操作信号の算出に使用する制御パラメータを含む制御ロジックデータを制御装置の制御ロジックデータベースに保存し、プラントの状態量を制御する操作端の操作端仕様データを操作端仕様データベースに保存し、過去の操作信号を操作信号データベースに保存し、過去の計測信号を計測信号データベースに保存し、制御ロジックデータベースと前記操作端仕様データベースに保存されているデータを用いて学習パラメータの初期値を決定すると共に、制御ロジックデータベースと前記操作信号データベースと前記計測信号データベースに保存されているデータを用いて前記学習パラメータを更新するようにし、学習パラメータに含まれている単位時間当たりの操作信号変化幅の制限値を学習の拘束条件に設定して前記モデルを用いてプラントの特性を模擬してプラントの操作方法を学習し、学習した結果である学習情報データを学習情報データベースに保存するように構成し、プラントの運転状態量である計測信号と学習情報データベースに保存されている学習情報データを用いてプラントに与える制御指令となる操作信号を算出して、プラントを制御するようにしたことを特徴とするプラントの制御方法。
【請求項12】
請求項11に記載のプラントの制御方法において、計測信号に窒素酸化物濃度、一酸化炭素濃度、二酸化炭素濃度、硫化酸化物、及び水銀の少なくとも1つを含み、操作信号に空気ダンパの開度、空気流量、燃料流量の少なくとも1つを決定する信号を含み、制御ロジックデータベースと操作端仕様データベースに保存されているデータを用いて学習パラメータの初期値を決定し、制御ロジックデータベースと操作信号データベースと計測信号データベースに保存されているデータを用いて火力発電プラントがバーナー切り替え運転、炭種切り替え運転、及び負荷変化運転の少なくとも1つを含む運転を実施しているかどうかを推定してこの推定結果に基づいて学習パラメータを更新するか、或いは操作信号データベースと計測信号データベースに保存されているデータを用いて操作端の動作を推定してこの推定結果に基づいて学習パラメータを更新することで学習パラメータを決定し、学習パラメータに含まれている単位時間当たりの操作信号変化幅の制限値を学習の拘束条件に設定して火力発電プラントの特性を模擬するモデルを用いて火力発電プラントの操作方法を学習し、学習した結果である学習情報データを学習情報データベースに保存し、プラントの運転状態量である計測信号と学習情報データベースに保存されている学習情報データを用いて火力発電プラントに対する操作信号を算出するようにしたことを特徴とするプラントの制御方法。
【請求項13】
請求項12に記載のプラントの制御方法において、学習情報データベースに保存されている学習情報データを用いて、学習パラメータに含まれている単位時間当たりの操作信号変化幅の制限値を学習の拘束条件に設定して学習部にて学習を実施した場合の学習情報データを推定し、この推定結果である追加学習情報データを用いて火力発電プラントに対する操作信号を算出するようにしたことを特徴とするプラントの制御方法。
【請求項14】
請求項9又は請求項11に記載されたプラントの制御方法において、制御ロジックデータベースに保存されている制御パラメータのうち、単位時間当たりの信号の変化幅を制限するために設定されたパラメータと、操作端仕様データベースに保存されている操作端の動作速度の値を比較して、絶対値が小さい値を学習パラメータの初期値とするようにしたことを特徴とするプラントの制御方法。
【請求項15】
請求項9又は請求項11に記載されたプラントの制御方法において、操作端の動作領域を予め設定された領域に分割して、分割した各領域からは隣接する領域にのみ操作できることを学習の拘束条件に設定し、モデルによる模擬の予測結果であるモデル出力が、その目標値を達成する領域に到達するのに要する操作回数を算出し、予め設定された領域に分割した操作端の動作領域でのある領域の操作方法が、単位時間後に到達できる領域の中で、前記操作回数の値が最小となる領域に移動する操作方法としたことを特徴とするプラントの制御方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate


【公開番号】特開2007−265212(P2007−265212A)
【公開日】平成19年10月11日(2007.10.11)
【国際特許分類】
【出願番号】特願2006−91672(P2006−91672)
【出願日】平成18年3月29日(2006.3.29)
【出願人】(000005108)株式会社日立製作所 (27,607)
【Fターム(参考)】