説明

制御パラメータの適合化システム

【課題】事前に目標となる数値を定めることが困難な制御システムにおいても、最適な適合値を自動的に推定する。
【解決手段】エンジン1から排出される排気ガスの各成分量を分析する排気ガス分析計20の出力に基づいてECU10による空燃比制御における目標空燃比の指示値を制御部40で生成し、排気ガス分析計20及びエンジン1のO2センサの出力に基づいて状態評価部30で空燃比の制御状態を評価する。そして、状態評価部30の評価結果に基づいて制御部40で生成した指示値を適合値推定部50で調整して目標空燃比が最適な値となるように適合させ、最終的にECU10に格納される目標空燃比を確定する。これにより、空燃比目標値を予めマップに格納しておく場合等に、開発者の経験が必要なマップ作成作業を自動的且つ効率的に行なうことが可能となり、車両開発時における工数を低減してコスト低減を図ることができる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ターゲットシステムの制御パラメータを最適状態に適合させる制御パラメータの適合化システムに関する。
【背景技術】
【0002】
一般に、制御システムにおいては、開発段階での制御パラメータの適合作業が重要な位置を占めており、この制御パラメータの適合度合いによってシステムの品質が大きく左右される。この制御パラメータの適合作業は、専門家の技量に負うところが大きく、工数削減及びコスト低減を図る上での支障となっているところから、自動化が望まれており、従来から各種提案がなされている。
【0003】
例えば、特許文献1には、組立完了後の自動車用エンジンのアイドル回転数の調整や排気ガス濃度の調整を自動化する技術が提案されている。この提案技術では、テストベンチに設置したエンジンを回転させながら特性値を検出して初期値として記憶し、エンジンに所定量の予備調整を施して予備調整後のエンジンの特性値を予備調整値として検出し、初期値と予備調整値とから所望の特性値を得るための本調整量を演算してエンジン調整を行うといった一連の工程を全自動化し、調整の簡素化を可能としている。
【特許文献1】特開平1−121550号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
しかしながら、初期値と予備調整値とから一義的に本調整を行うことは、一部の限られたシステムにのみ適用可能であり、一般的には、系の応答や安定に要する時間等の制約から、調整の自動化が困難なシステムが多い。
【0005】
例えば、エンジンの空燃比制御システムでは、触媒で最も高い排気ガス浄化率が得られる空燃比を目標空燃比としており、厳密には触媒の仕様や通過ガス量で最適な目標値が異なることから、車両開発時に各運転領域に対して最適な目標空燃比を決定し、マップとしてエンジン制御装置に記憶させている。
【0006】
このような空燃比制御システムをターゲットとして目標空燃比を最適な値に自動で適合させようとする場合、事前に目標となる数値を定めて排気ガス分析計の出力結果やエンジンに備えられたセンサの出力値を見ながら調整を行なう必要がある。
【0007】
しかしながら、排気ガスの分析結果の応答は数十〜百秒程度と非常に長く、安定状態を判断するのが難しいことから、事前に目標となる数値を定めることは現実的に困難であり、自動化を阻む要因となっている。しかも、排気ガス成分の中でも全炭化水素THCと窒素酸化物NOxとは応答が相反的であるため、安定状態の判断が一層困難となっており、目標空燃比の調整は、経験豊富な開発者が行なっても時間のかかる作業となっている。
【0008】
本発明は上記事情に鑑みてなされたもので、事前に目標となる数値を定めることが困難な制御システムにおいても、最適な適合値を自動的に推定することのできる制御パラメータの適合化システムを提供することを目的としている。
【課題を解決するための手段】
【0009】
上記目的を達成するため、本発明による制御パラメータの適合化システムは、ターゲットシステムの制御パラメータを最適状態に適合させる制御パラメータの適合化システムであって、上記ターゲットシステムの動作状態を観測する観測器の出力に基づいて、上記ターゲットシステムの制御パラメータに対する指示値を生成する制御部と、上記観測器からの出力に基づいて、上記ターゲットシステムの制御状態の良否を評価する状態評価部と、上記状態評価部の出力に基づいて、上記制御部で生成した指示値を調整し、上記ターゲットシステムを最適な制御状態とする適合値を推定する適合値推定部とを備えたことを特徴とする。
【発明の効果】
【0010】
本発明によれば、事前に目標となる数値を定めることが困難な制御システムにおいても最適な適合値を自動的に推定することができ、システム開発時におけるパラメータの適合作業に要する工数や時間を削減し、品質向上を図りつつコスト低減を図ることが可能となる。
【発明を実施するための最良の形態】
【0011】
以下、図面を参照して本発明の実施の形態を説明する。図1〜図5は本発明の実施の一形態に係り、図1は制御パラメータ適合化システムの構成図、図2はエンジンの空燃比制御系を示す説明図、図3は吸入空気に対する排気ガスの応答を示す説明図、図4はニューラルネットワークの説明図、図5は調整過程例を示す説明図である。
【0012】
本発明による制御パラメータの適合化システムは、ターゲットシステムにおける制御パラメータを最適値に適合させるための開発ツールとして構成されるものであり、ハードウエア的には、単一のコンピュータシステム或いはネットワーク等を介して接続された複数のコンピュータシステムによって構成される。以下、本実施の形態においては、自動車等の車両に搭載されるエンジンの空燃比制御システムをターゲットシステムとする例について説明する。
【0013】
図1に示すように、本実施の形態の制御パラメータ適合化システム100は、車両に踏搭載されるエンジン1及びエンジン制御装置(ECU)10をターゲットシステムとする各機能部を備えている。各機能部としては、エンジン1から排出される排気ガスの各成分量(一酸化炭素CO,全炭化水素THC,窒素酸化物NOx)を分析する排気ガス分析計20、及び排気ガスの酸素濃度に応じた信号を出力するエンジン1のセンサ(後述するO2センサ5)を観測器として、この観測器の出力に基づいて空燃比の制御状態を評価する状態評価部30、観測器の出力に基づいてECU10による空燃比制御の制御パラメータに対する指示値を生成する制御部40、状態評価部30の評価結果に基づいて制御部40で生成した指示値を調整し、ターゲットシステムを最適な制御状態とする適合値を推定する適合値推定部50が備えられている。
【0014】
ここで、本実施の形態におけるターゲットシステム、すなわちECU10によるエンジン1の空燃比制御システムについて説明する。
【0015】
図2に示すように、エンジン1は、排気管2に介装された触媒3の上流側に、空燃比に対してリニアな出力特性を有する空燃比センサ4を配設している。また、触媒3の下流側には、理論空燃比を基準にしてリッチ側とリーン側とで出力が急変する出力特性を有するO2センサ5が配設されている。
【0016】
ECU10による空燃比制御システムは、エンジン1の吸気管6に介装されたインジェクタ7からの燃料噴射量を制御して混合気の空燃比を目標空燃比とし、点火プラグ8の火花放電で燃焼した混合気の排気ガスに対する触媒3の浄化率が最大となるように制御するシステムである。尚、符号8は、点火プラグである。本実施の形態においては、ECU10による空燃比制御は、触媒3上流側の空燃比センサ4の出力に基づくメインフィードバック系と、触媒3下流側のO2センサ5の出力に基づくサブフィードバック系との2重フィードバック系で構成されている。
【0017】
メインフィードバック系の制御は、空燃比センサ4の出力信号と目標空燃比(通常は理論空燃比)に応じた目標信号との偏差に基づく制御である。また、サブフィードバック系の制御は、O2センサ5の出力と理論空燃比に応じた基準信号との偏差に基づいて、空燃比センサ4のゼロ出力点のズレや出力特性の変化等を補正する制御である。
【0018】
目標空燃比は、各運転領域において触媒3が最も効率的に排気ガスを浄化することのできる空燃比(基本的には理論空燃比)であり、ECU10内のマップに運転領域毎に格納されている。ECU10は、エンジン回転数と吸入空気量等の負荷とによる各運転領域毎に目標空燃比のマップを参照し、マップから得られる目標空燃比への制御を行う。
【0019】
従来、マップに格納される目標空燃比は、最適な目標空燃比が触媒の仕様や通過ガス量で異なることから、車両開発時に実車試験やシミュレーション等を行って各運転領域毎に空燃比を調整しながら最適値を決定している。この目標空燃比の調整・決定は、排気ガス分析計の出力結果及びO2センサ値を見ながらの調整となるが、分析結果の応答は数十〜百秒程度と非常に長く、安定状態を判断するのは容易ではない。さらに、排気ガス成分中のTHCとNOxは応答が相反的であるため、安定状態の判断が一層難しく、目標空燃比の調整・決定は、経験豊富な開発者が行なっても時間のかかる作業となっている。
【0020】
本実施の形態の制御パラメータ適合化システム100は、このような目標空燃比を自動的に最適値に適合させ、効率的なマップ作成を可能としている。具体的には、制御パラメータ適合化システム100は、制御部40において、排気ガス分析計20及びO2センサ5の出力に基づいて、ECU10からのエンジン回転数及び負荷から定まる運転領域毎に目標空燃比の指示値(指示A/F値)を生成し、この指示A/F値を、適合値推定部50を介してECU10内の目標空燃比のマップに仮のマップ値として書き込む。
【0021】
そして、状態評価部30において、マップに書き込まれた指示A/F値を用いたECU10によるエンジン1の空燃比制御状態を、排気ガス分析計20の出力及びO2センサ5の出力に基づいて評価し、適合値推定部50において、状態評価部30の評価結果に基づいて最適な制御状態となる適合値を推定する。このような各機能部の処理過程を経て指示A/F値が最適な値となるように自動調整され、最終的にECU10のマップに格納される目標空燃比が確定される。
【0022】
以下、制御パラメータ適合化システム100の各機能部による処理について詳細に説明する。
【0023】
一般に、目標空燃比を自動的に定めるためには、触媒の排気ガス浄化率が最大となる状態、つまり排気ガス3成分(一酸化炭素CO,全炭化水素THC,窒素酸化物NOx)が最小となる状態を目標として、最適となる空燃比の値を制御的に探索すれば良い。このような手法としては、従来から、応答遅れの長い系においての制御として、PID制御のゲインをニューラルネットワーク等を用いて調整しながら行なう手法が挙げられる。
【0024】
しかしながら、従来の手法を適用するためには、目標とする数値を定める必要があり、触媒の仕様や運転領域によって目標となる排気ガス量が異なる空燃比制御に適用する場合、適合前に目標とする数値を定めることは現実的に困難である。
【0025】
これに対して、本実施の形態の制御パラメータ適合化システム100は、制御部40で浄化率最大時の排気ガス量を曖昧な目標として扱いながら、状態評価部30及び適合値推定部50で所望のA/F値を探索し、目標空燃比を決定するようにしている。
【0026】
すなわち、制御部40で排気ガス量から指示A/F値を生成する際の制御方式は、単にCO,THCが多ければ指示A/F値をリーン方向の値に設定し、単にNOxが多ければ指示A/F値をリッチ方向の値に設定すると言ったように、排気ガス量から指示A/F値を求められれば良く、例えば、単純な比例制御やPID制御等を採用することができる。比例制御やPID制御では、目標となる値を指示しなければならないが、適当な値で良いため、当初は各成分が低くなるように仮に0とする。
【0027】
例えば、PID制御を用いて排気ガス量から指示A/F値を求める場合、エンジンの吸入空気量によって排気ガスの応答時間(指示A/F値の変化→排気ガス変化)が異なるため、図3に示すように、各吸入空気量での応答時間を計測し、その累乗近似から適合時の吸入空気量に応じた応答時間を推定し、吸入空気量に合わせた制御ゲインを決定する。具体的には、所定の空気量を基準として、ECU10で計測されるエンジンの吸入空気量の基準空気量に対する比率に基づいてゲインを変化させる。
【0028】
次に、制御部40からの指示A/F値に対して、状態評価部30及び適合値推定部50で所望のA/F値を探索する処理について説明する。
【0029】
状態評価部30は、排気ガス分析計20の出力及びO2センサ5の出力に基づいて、ECU10によるエンジン1の空燃比制御状態の良否を、強化学習における状態の良否を示す状態価値関数を用いて評価する。本実施の形態においては、状態価値関数をニューラルネットワークを用いて関数近似し、また、強化学習手法の一つであるTD学習によって学習を行う。
【0030】
尚、強化学習は、その時々の状態に対しての明示的な行動の指示ではなく、行った行動に対しての報酬によって学習を行い、この先得られるであろう報酬の総和が最大となる行動をその時々で選択する学習法であり、TD学習は、時刻tにおける実際の報酬と報酬の予測値との差をTD誤差(Temporal Difference Error)として、これを0とするような学習である。
【0031】
具体的には、図4に示すように、例えば3層のニューラルネットワークを用い、或る時刻tにおける状態(THC,CO,NOxの各排気ガス成分値、O2センサ5のセンサ値)を入力とし、出力を状態価値Vtとする。ここで、状態価値Vtとは、以下の(1)式に示すように、適時得られる報酬rtに割引率γをかけて定義されるものであり、割引率γは、将来の報酬に対してどの程度割り引いて評価するかを決定するものである。尚、本実施の形態では、報酬rtは、各成分値を正規化したものの和として与えるものとする。
Vt=Σγit+i …(1)
但し、Σ:i=1〜∞
また、rt=−KNOx×rNOx−KTHC×rTHC−KCO×rCO+KO2×rO2
NOx,rTHC,rCO:排気ガスの各3成分の量を基にした報酬(明らかにNGな量を最大として0〜1で正規化)
O2:O2センサ値をもとにした報酬(目標範囲にあれば1、範囲外では−1)
NOx,KTHC,KCO,KO2:重み係数
【0032】
また、TD学習におけるTD誤差εtは、以下の(2)式によって定義される。本実施の形態の状態価値関数であるニューラルネットワークの学習はVt+εtを教師信号としてバックプロパゲーション法で結合加重を学習する。
εt={rt+γVt+1}−Vt …(2)
【0033】
すなわち、排気ガス分析計20からのTHC,CO,NOxの各排気ガス成分値に対応する出力D1,D2,D3と、O2センサ5から出力D4とをニューラルネットワークの入力層へ入力し、中間層、出力層を得て出力(状態価値)Vtを計算する。この場合、各層の1つのニューロンへの入力Uは、上流側の各ニューロンの出力u1,u2,u3,…を結合荷重w1,w2,w3,…で重み付けした総和となり、以下の(3)式で与えられる。
U=Σwi×ui …(3)
【0034】
(3)式で与えられる各ニューロンへの入力Uiは、所定の伝達関数で処理され、1つの出力Yiとして出力される。伝達関数としては、例えば、以下の(4)式で表されるシグモイド関数を用いることができる。
Yi=1/(1+e(−ui)) …(4)
【0035】
そして、適合値推定部50を介して指示A/F値が調整される毎に、最急降下法を用いて実際の出力と希望の出力との誤差が最小になるように結合荷重を変更するバックプロパゲーション(Back Propagation;BP:誤差逆伝搬法)法により、出力層からの出力値Vtと教師信号(rt+γVt+1)とが比較されて各層の結合荷重w1,w2,w3,…が学習(更新)される。
【0036】
この場合、TD誤差は、正の場合、予測よりも好ましい方向へ調整を行なったことを示し、負であれば逆を意味する。従って、適合値推定部50は、TD誤差と適合値の推定を行なうと共に、これらの情報に基づいて指示A/F値のゲインを調整する等して、制御部40からの出力の抑制・制御を行なう。適合値の推定は、例えば、所定期間内においてTD誤差が正のときの指示A/F値の平均値を算出することによって行う。平均値以外にも、中央値、最頻値等でも推定することができる。また、所定期間とは、所望のA/F値を探索する処理を開始してからの推定する時点まででも良いし、適宜、途中段階からの期間でも良い。制御部40からの出力の抑制・制御は、以下に説明する各ステージによって動作を変更する。
【0037】
<ステージ1(広域探索)>
ステージ1は、排気ガスの3成分が発生する領域を網羅するために広域探索を行い、制御部40の出力をそのまま指示A/F値として出力するステージである。尚、このステージ1中でCOが発生しない状態になってしまった場合は、制御部40の出力とは無関係にCOが発生するように強制的に指示A/F値を変更する。
【0038】
<ステージ2(詳細探索)>
ステージ2は、排気ガス3成分が実際に最小(且つO2センサ5の出力が目標値)となるよう詳細な探索を行い、指示A/F値を変動させるステージである。このステージ2では、上述の推定値を基準とし、制御部40の出力が基準値から大きく離れる方向へ変更しようとする場合には、以下の(a)〜(c)に示すような抑制を行なう。
【0039】
(a)連続してTD誤差が正のときは、1制御周期毎に指示A/F値を0として変化を抑制する。
(b)指示A/F値が推定値から一定値以上離れないように、TD誤差が正のときの指示A/F値の標準偏差σを超える変化を抑制する。
(c)指示A/F値が推定値をまたいで変化する場合は一定時間指示A/F値を0として変化を抑制する。
【0040】
<ステージ3(終了判定)>
TD誤差が正のときの指示A/F値の統計値(標準偏差)が閾値を下回った場合、適合終了と判定する(最終的な推定値を適合値とする)。若しくは、指示A/F値が一定時間(例えば3分)変化せず且つTD誤差が正の状態が継続したとき、適合終了と判定し、そのときの指示A/F値を適合値とする。その他、各排気ガス成分を最小としてバランスさせた状態で安定したと推定できたときに、適合終了と判定し、そのときの指示A/F値を適合値とすることができる。
【0041】
以上の各機能を有する制御パラメータ適合化システム100による調整過程は、図5に例示される。
【0042】
先ず、ステージ1において、制御部40で排気ガスの各成分の量に応じて指示A/F値を決定し、決定した指示A/F値を、ECU10のマップに書き込むことで荒調整を行う。ここで、CO,THCは、燃料をリーンにすると減少し、NOxはリッチにすると減少する方向であり、指示A/F値を変更してからの排気ガス発生の応答は、各成分によって異なる。このため、ステージ1の荒調整では、例えば、NOxが減少するまでリッチ側に調整してもCOやTHCが遅れて発生し、これを抑えられるまでリーンにすると逆にNOxが発生し、そのままでは、指示A/F値はハンチングする虞がある。
【0043】
従って、ステージ1の調整に続いてステージ2の調整に移行し、適合値推定部50で、状態評価部30による評価結果(TD誤差)を基にした推定値を算出し、この推定値を基準として制御部40からの指示A/F値を変化させる。これにより、ハンチングを生じることなく、且つ最終的に各排気ガス成分を最小としてバランスさせた状態で安定させることができる。そして、この安定したときの推定値を適合値、すなわち最適化された最終的な目標空燃比として、ECU10のマップに記憶させていく。
【0044】
以上のように、本実施の形態においては、空燃比制御システムをターゲットとして、応答が長く事前に目標となる数値を定めることの困難な排気ガス分析に基づいて目標空燃比を最適な値に適合させる際に、浄化率最大時の排気ガス量を曖昧な目標として扱いながら、所望の空燃比指示値を探索して最適な適合値を自動的に推定することができる。これにより、空燃比目標値を予めマップに格納しておく場合に、開発者の経験が必要なマップ作成作業を自動的且つ効率的に行なうことが可能となり、車両開発時における工数を低減してコスト低減を図ることができる。
【図面の簡単な説明】
【0045】
【図1】制御パラメータ適合化システムの構成図
【図2】エンジンの空燃比制御系を示す説明図
【図3】吸入空気に対する排気ガスの応答を示す説明図
【図4】ニューラルネットワークの説明図
【図5】調整過程例を示す説明図
【符号の説明】
【0046】
1 エンジン(ターゲットシステム)
10 エンジン制御装置(ターゲットシステム)
20 排気ガス分析計(観測器)
30 状態評価部
40 制御部
50 適合値推定部
100 制御パラメータ適合化システム

【特許請求の範囲】
【請求項1】
ターゲットシステムの制御パラメータを最適状態に適合させる制御パラメータの適合化システムであって、
上記ターゲットシステムの動作状態を観測する観測器の出力に基づいて、上記ターゲットシステムの制御パラメータに対する指示値を生成する制御部と、
上記観測器からの出力に基づいて、上記ターゲットシステムの制御状態の良否を評価する状態評価部と、
上記状態評価部の出力に基づいて、上記制御部で生成した指示値を調整し、上記ターゲットシステムを最適な制御状態とする適合値を推定する適合値推定部と
を備えたことを特徴とする制御パラメータの適合化システム。
【請求項2】
上記状態評価部は、上記観測器からの出力を状態量として、該状態量と該状態量から決定される報酬量とにより定義される状態価値関数を用いて上記ターゲットシステムの状態の良否を評価することを特徴とする請求項1記載の制御パラメータの適合化システム。
【請求項3】
上記状態価値関数を、ニューラルネットワークを用いて関数近似することを特徴とする請求項2記載の制御パラメータの適合化システム。
【請求項4】
上記ニューラルネットワークの学習の教師信号として、上記報酬量に基づくTD誤差を用いることを特徴とする請求項3記載の制御パラメータの適合化システム。
【請求項5】
上記適合値推定部は、上記報酬量に基づくTD誤差が正のときの上記指示値の統計値を用いて上記適合値を推定することを特徴とする請求項4記載の制御パラメータの適合化システム。
【請求項6】
上記指示値の標準偏差が一定値を下回ったときの上記統計値を、上記適合値とすることを特徴とする請求項5記載の制御パラメータの適合化システム。
【請求項7】
上記制御部は、上記指示値をPID制御により生成することを特徴とする請求項1〜6のいずれか一つに記載の制御パラメータの適合化システム。
【請求項8】
上記PID制御のゲインを、上記観測器の出力から推定した応答時間によって変化させることを特徴とする請求項7記載の制御パラメータの適合化システム。
【請求項9】
上記ターゲットシステムはエンジンの空燃比制御システムであり、
上記制御部は、上記エンジンの排気ガス成分の観測値に基づいて空燃比制御における目標値を生成し、
上記状態評価部は、上記エンジンの排気ガス成分の観測値に基づいて空燃比制御状態の良否を評価し、
上記適合値推定部は、上記状態評価部の評価結果に基づいて上記目標値を調整し、上記空燃比制御システムを最適な制御状態とする空燃比目標値を適合値として推定することを特徴とする請求項1〜8の何れか一に記載の制御パラメータの適合化システム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公開番号】特開2010−86405(P2010−86405A)
【公開日】平成22年4月15日(2010.4.15)
【国際特許分類】
【出願番号】特願2008−256541(P2008−256541)
【出願日】平成20年10月1日(2008.10.1)
【出願人】(000005348)富士重工業株式会社 (3,010)
【Fターム(参考)】