説明

学習装置

【課題】学習値がハンチングすることの回避を図った学習装置を提供する。
【解決手段】燃料噴射弁(制御対象)の制御内容を決定するのに用いる制御パラメータ(例えば噴射開始応答遅れ時間td等)を、基準変数(例えば燃圧p等)と関連付けて学習する学習装置において、制御パラメータ及び基準変数を要素とした学習ベクトルTDiを記憶する記憶手段と、制御パラメータの計測値及び基準変数の計測値を要素とした計測ベクトルTDを取得する計測ベクトル取得手段と、計測ベクトルTDに基づき学習ベクトルTDiを補正して記憶手段に記憶更新させる補正手段と、を備えることを特徴とする。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、制御対象の制御内容を決定するのに用いる制御パラメータを、基準変数と関連付けて学習する学習装置に関する。
【背景技術】
【0002】
この種の学習装置の一例として、内燃機関の燃料噴射弁に噴射指令を出力してから、実際に噴射が為されるまでの噴射開始遅れ時間tdを計測し、個々の燃料噴射弁に対する制御パラメータとしてその計測値を記憶更新して学習する装置がある(例えば特許文献1参照)。そして、このように記憶更新された遅れ時間tdを用いて、噴射指令を出力するタイミング等を制御する。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2009−57924号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
上記遅れ時間tdは、燃料噴射弁に供給されている燃料圧力(噴射開始時点での燃圧)に応じて異なる値となる。そこで本発明者らは、遅れ時間td(制御パラメータ)を燃料圧力(基準変数)と関連付けて以下のように学習することを検討した。
【0005】
すなわち、燃料圧力の特定値(図7(a)の例では30MPa、50MPa、80MPa)に対する遅れ時間td(30)、td(50)、td(80)を学習値として記憶更新していく。例えば、計測した遅れ時間が図7(a)中の符号A0に示す点であった場合には、その点に最も近い学習値td(50)を線形補間して更新する。具体的には、学習値td(30)と計測値A0とを結ぶ直線Lが燃圧50MPaと交わる点を、学習値td(50)として更新する。
【0006】
しかしながら、燃圧と遅れ時間tdとの関係を表す特性が直線ではなく曲線(図7(b)中の曲線R参照)であり、その曲線R上の点A1,A2,A3が繰り返し計測された場合には、先述した線形補間を実施すると学習値td(50)はB1,B2,B3に逐次更新される。つまり、学習値td(50)は増加と減少を繰り返してハンチングしてしまう。また、燃圧と遅れ時間tdとの関係を表す特性が直線であったとしても、現在の学習値td(30)が真の特性値からずれている場合には、そのずれた学習値td(30)から線形補間される学習値td(50)は、同様にハンチングしてしまう。
【0007】
本発明は、上記課題を解決するためになされたものであり、学習値がハンチングすることの回避を図った学習装置を提供することにある。
【課題を解決するための手段】
【0008】
以下、上記課題を解決するための手段、及びその作用効果について記載する。
【0009】
請求項1記載の発明では、制御対象の制御内容を決定するのに用いる制御パラメータを、基準変数と関連付けて学習する学習装置において、前記制御パラメータ及び前記基準変数を要素とした学習ベクトルを記憶する記憶手段と、前記制御パラメータの計測値及び前記基準変数の計測値を要素とした計測ベクトルを取得する計測ベクトル取得手段と、前記計測ベクトルに基づき前記学習ベクトルを補正して前記記憶手段に記憶更新させる補正手段と、を備えることを特徴とする。
【0010】
これによれば、基準変数の特定値に対する制御パラメータを記憶するのではなく、制御パラメータ及び基準変数を要素とした学習ベクトルを記憶する。そして、制御パラメータの計測値及び基準変数の計測値を要素とした計測ベクトルに基づき学習ベクトルを補正するので、基準変数と制御パラメータとの関係を表す特性が直線ではなく曲線であったとしても、記憶更新される学習ベクトルの値がハンチングすることを抑制できる。
【0011】
また、前記特性が直線であった場合において、更新前の学習ベクトルが真の特性値からずれていたとしても、計測ベクトルに基づき学習ベクトルを補正するので、学習を繰り返す毎に更新後の学習ベクトルは真値に徐々に近づいていくこととなる。よってこの場合においても、記憶更新される学習ベクトルの値がハンチングすることを抑制できる。
【0012】
請求項2記載の発明では、前記補正手段は、取得した前記計測ベクトルと前記学習ベクトルとの差分に、所定割合を乗じて補正ベクトルを算出する補正ベクトル算出手段を有するとともに、学習前の前記学習ベクトルに前記補正ベクトルを加算して前記学習ベクトルの記憶更新を行うことを特徴とする。
【0013】
これによれば、所定割合を調節することで、記憶更新を繰り返していくことにより学習ベクトルが真値に近づいてくスピード及び精度を調節できる。例えば、学習ベクトルが真値から大きくずれていると想定される場合には、前記所定割合を大きく設定して前記スピードを優先させることが望ましい。一方、学習ベクトルの真値からのずれが小さいと想定される場合には、前記所定割合を小さく設定して、計測値の計測誤差による影響を小さくすることで前記精度を優先させることが望ましい。
【0014】
請求項3記載の発明では、学習回数に応じて前記所定割合を可変設定することを特徴とする。
【0015】
学習回数が多いほど学習ベクトルが真値に近づいていると想定されるので、複数の学習ベクトルのうち、例えば学習回数が多い学習ベクトルについて記憶更新する時には前記所定割合を小さくし、学習回数が少ない学習ベクトルについて記憶更新する時には前記所定割合を大きくすることが望ましい。
【0016】
請求項4記載の発明では、前記制御対象の始動開始からの経過時間に応じて前記所定割合を可変設定することを特徴とする。
【0017】
経過時間が長いほど学習回数が多いと想定されるので、経過時間が長いほど学習ベクトルが真値に近づいているとみなして、前記所定割合を小さくすることが望ましい。
【0018】
上記請求項1記載の発明を実施するにあたり、請求項5記載の如く、前記制御パラメータ及び前記基準変数を軸とするマップ領域を複数領域に区分けし、区分けされた領域毎に前記学習ベクトルを1つ割り当て、取得した前記計測ベクトルに該当する領域の学習ベクトルを補正して記憶更新させることが具体例として挙げられる。
【0019】
請求項6記載の発明では、複数の前記学習ベクトルの前記マップ領域における分布形状に応じて、複数の前記領域を異なる間隔に区分けすることを特徴とする。
【0020】
例えば、学習ベクトルの分布形状が曲線形状となっている領域については、直線形状となっている領域に比べてその領域の間隔を小さく設定することで、きめ細かく学習ベクトルを記憶更新させることが望ましい。
【0021】
請求項7記載の発明では、複数の前記学習ベクトルのうち前記制御内容の決定に用いられた使用頻度に応じて、複数の前記領域を異なる間隔に区分けすることを特徴とする。
【0022】
例えば、使用頻度の多い領域については、使用頻度の少ない領域に比べてその領域の間隔を小さく設定することで、きめ細かく学習ベクトルを記憶更新させることが望ましい。
【0023】
請求項8記載の発明では、複数の前記領域を等間隔に区分けすることを特徴とする。これによれば、上記請求項6,7記載の発明の如く領域を異なる間隔に区分けする場合に比べて、学習装置の処理負荷を軽減できる。
【0024】
上記請求項1記載の発明を実施するにあたり、請求項9記載の如く、前記制御パラメータ及び前記基準変数を軸とするマップ領域において、取得した前記計測ベクトルに最も近い位置の学習ベクトルを補正して記憶更新させることが具体例として挙げられる。
【0025】
また、上記請求項1記載の発明を実施するにあたり、請求項10記載の如く、前記制御パラメータ及び前記基準変数を軸とするマップ領域において、前記学習ベクトルの個数を可変設定することが具体例として挙げられる。
【0026】
請求項11記載の発明では、複数の前記学習ベクトルの前記マップ領域における分布形状に応じて、前記学習ベクトルの個数を可変設定することを特徴とする。
【0027】
例えば、学習ベクトルの分布形状が曲線形状となっている領域については、直線形状となっている領域に比べてその領域の学習ベクトルの個数を多くすることで、きめ細かく学習ベクトルを記憶更新させることが望ましい。
【0028】
請求項12記載の発明では、複数の前記学習ベクトルのうち前記制御内容の決定に用いられた使用頻度に応じて、前記学習ベクトルの個数を可変設定することを特徴とする。
【0029】
例えば、使用頻度の多い領域については、使用頻度の少ない領域に比べて学習ベクトルの個数を多くすることで、きめ細かく学習ベクトルを記憶更新させることが望ましい。
【0030】
請求項13記載の発明では、隣り合う前記学習ベクトルの距離が所定値以下である場合に、隣り合う前記学習ベクトルのうちいずれか一方を削除することを特徴とする。
【0031】
上記発明では、隣り合う前記学習ベクトルの距離が近い場合には、学習ベクトルの数が不必要に多いとみなしていずれか一方を削除するので、記憶手段の記憶容量を軽減できる。
【0032】
請求項14記載の発明では、隣り合う前記学習ベクトルの距離が所定値以下である場合に、隣り合う前記学習ベクトルの間に新たな学習ベクトルを追加することを特徴とする。
【0033】
上記発明では、隣り合う前記学習ベクトルの距離が近い場合には、制御パラメータの計測頻度が多く使用頻度が多い領域であるとみなし、さらに新たな学習ベクトルを追加するので、使用頻度の多い領域に対してきめ細かく学習ベクトルを記憶更新させることができる。
【0034】
請求項15記載の発明では、所定回数以上の記憶更新が為された前記学習ベクトルについては、学習を終了させることを特徴とする。
【0035】
記憶更新の回数が多い学習ベクトルは真値に十分に近づいていると想定されるので、このような学習ベクトルについては学習を終了させる上記発明によれば、過剰な回数を学習させることを回避でき、学習装置の処理負荷を軽減できる。
【0036】
請求項16記載の発明では、前記学習ベクトルの学習期間が所定期間を超えた場合には、全ての前記学習ベクトルについて、その学習を終了させることを特徴とする。
【0037】
学習期間が長ければ、全ての学習ベクトルは真値に十分に近づいていると想定されるので、このような場合に学習を終了させる上記発明によれば、過剰な回数を学習させることを回避でき、学習装置の処理負荷を軽減できる。
【0038】
請求項17記載の発明では、学習が終了した前記学習ベクトルに基づき、前記基準変数の特定値に対する前記制御パラメータの値を線形補間により算出し、その算出値を前記特定値と関連付けて制御マップを作成し、前記制御マップに記憶された前記制御パラメータを用いて前記制御内容を決定することを特徴とする。
【0039】
これによれば、学習が終了するまでは、制御パラメータ及び基準変数を要素とした学習ベクトルを記憶することで学習ベクトルのハンチング抑制を図る一方で、学習が終了した後は、基準変数の特定値に対する制御パラメータを制御マップとして作成して制御に用いるので、制御対象を制御するにあたり特定値に対する制御パラメータが要求される場合に本発明を用いて好適である。
【0040】
請求項18記載の発明では、学習が終了した前記学習ベクトルの前記制御パラメータの値を、その学習ベクトルの基準変数と関連付けて制御マップを作成し、前記制御マップに記憶された前記制御パラメータを用いて前記制御内容を決定することを特徴とする。
【0041】
上記発明では要するに、学習した学習ベクトルの制御パラメータの値をそのまま用いて制御マップを作成する。制御対象を制御するにあたり特定値に対する制御パラメータが要求されない場合に本発明を用いて好適である。
【0042】
請求項19記載の発明では、前記学習ベクトルは、複数の前記制御パラメータ及び前記基準変数を要素とした3次元以上のベクトルであることを特徴とする。
【0043】
上記発明によれば、制御パラメータが複数の場合であっても、学習ベクトルの次元を上げるだけでよく、計測ベクトルに基づき学習ベクトルを補正するための演算式はそのまま次元を上げるだけでよいので、大幅なプログラム変更を要することなく複数の制御パラメータに対応できる。
【0044】
請求項20記載の発明では、前記制御対象は、内燃機関の燃焼に供する燃料を噴射する燃料噴射弁であり、前記燃料噴射弁には、燃料圧力を検出する燃圧センサが搭載されており、前記計測ベクトル取得手段は、前記燃圧センサの検出値に基づき、前記燃料噴射弁の噴射特性を定量化したパラメータを前記制御パラメータとして取得することを特徴とする。
【0045】
上記制御パラメータの具体例としては、以下に説明する噴射開始遅れ時間td等が挙げられる。すなわち、噴射開始に伴い燃圧センサの検出圧力が低下を開始するため、その低下開始時期を検出すれば実噴射開始時期を検出できる。よって、燃料噴射弁に噴射指令信号を出力してから実噴射開始が検出されるまでの遅れ時間tdを検出できる。但し、その時の噴射開始時点における燃料圧力に応じて遅れ時間tdは変化するので、燃料圧力(基準変数)と関連付けて遅れ時間td(制御パラメータ)を学習しておき、その学習した遅れ時間tdに基づき、噴射指令信号の出力タイミングを制御する。
【図面の簡単な説明】
【0046】
【図1】本発明の第1実施形態にかかる学習装置の、制御対象となる燃料噴射弁の概略を示す図。
【図2】(a)は図1に示すインジェクタへの指令信号、(b)は指令信号に伴い変化する噴射率、(c)は図1に示す燃圧センサにより検出された検出圧力を示すタイムチャート。
【図3】図1のECUにより燃料噴射弁を制御する処理内容を示すブロック図。
【図4】第1実施形態において、学習ベクトルを補正して更新する一態様を示す図。
【図5】第1実施形態における学習手順を示すフローチャート。
【図6】本発明の第3実施形態において、燃圧(基準変数)を複数の領域に区分けする一態様を示す図。
【図7】従来の学習手法を説明する図。
【発明を実施するための形態】
【0047】
以下、本発明に係る学習装置を具体化した各実施形態を図面に基づいて説明する。以下に説明する各実施形態の学習装置は、車両用のエンジン(内燃機関)に搭載されたものであり、当該エンジンには、複数の気筒#1〜#4について高圧燃料を噴射して圧縮自着火燃焼させるディーゼルエンジンを想定している。
【0048】
(第1実施形態)
図1は、上記エンジンの各気筒に搭載された燃料噴射弁10(制御対象)、燃料噴射弁10に搭載された燃圧センサ20、及び車両に搭載された電子制御装置であるECU30(制御装置に相当)等を示す模式図である。
【0049】
先ず、燃料噴射弁10を含むエンジンの燃料噴射系について説明する。燃料タンク40内の燃料は、高圧ポンプ41によりコモンレール42(蓄圧容器)に圧送されて蓄圧され、各気筒の燃料噴射弁10へ分配供給される。
【0050】
燃料噴射弁10は、以下に説明するボデー11、ニードル12(弁体)及びアクチュエータ13等を備えて構成されている。ボデー11は、内部に高圧通路11aを形成するとともに、燃料を噴射する噴孔11bを形成する。ニードル12は、ボデー11内に収容されて噴孔11bを開閉する。アクチュエータ13は、ニードル12を開閉作動させる。
【0051】
そして、ECU30がアクチュエータ13の駆動を制御することで、ニードル12の開閉作動が制御される。これにより、コモンレール42から高圧通路11aへ供給された高圧燃料は、ニードル12の開閉作動に応じて噴孔11bから噴射される。例えばECU30は、エンジン出力軸の回転速度及びエンジン負荷等に基づき、噴射開始時期、噴射終了時期及び噴射量等の噴射態様を算出し、算出した噴射態様となるよう、アクチュエータ13の駆動を制御する。
【0052】
次に、燃圧センサ20のハード構成について説明する。
【0053】
燃圧センサ20は、以下に説明するステム21(起歪体)、圧力センサ素子22及びモールドIC23等を備えて構成されている。ステム21はボデー11に取り付けられており、ステム21に形成されたダイヤフラム部21aが高圧通路11aを流通する高圧燃料の圧力を受けて弾性変形する。
【0054】
圧力センサ素子22はダイヤフラム部21aに取り付けられており、ダイヤフラム部21aで生じた弾性変形量に応じて圧力検出信号を出力する。モールドIC23は、圧力センサ素子22から出力された圧力検出信号を増幅する増幅回路、書き換え可能な不揮発性メモリであるEEPROM25a等の電子部品を樹脂モールドして形成されており、ステム21とともに燃料噴射弁10に搭載されている。ボデー11上部にはコネクタ14が設けられており、コネクタ14に接続されたハーネス15により、モールドIC23及びアクチュエータ13とECU30とはそれぞれ電気接続される。
【0055】
ここで、噴孔11bから燃料の噴射を開始することに伴い高圧通路11a内の燃料の圧力(燃圧)は低下し、噴射を終了することに伴い燃圧は上昇する。つまり、燃圧の変化と噴射率(単位時間当たりに噴射される噴射量)の変化とは相関があり、燃圧変化から噴射率変化を推定できると言える。そこで本実施形態では、燃圧変化を検出することで噴射率モデルを算出し、この噴射率モデルを用いて、噴射指令信号に対する実際の噴射率変化を推定する。そして、推定される噴射率変化を加味して噴射指令信号を設定し、所望の噴射率変化となるよう噴射制御する。
【0056】
したがって、燃圧センサ20による検出圧力に基づき、噴射率モデルを生成するのに必要となる噴射率モデルパラメータ(制御パラメータ)を算出して記憶し、この噴射率モデルパラメータを算出する毎に記憶更新して学習することが必要となる。なお、燃料噴射弁10に供給されている燃圧、つまりコモンレール42内の燃圧であって、噴射開始時点での燃圧センサ20の燃圧が異なれば、噴射率モデルパラメータも異なる値となる。そこで本実施形態では、噴射開始時の燃圧(基準変数)と関連付けて噴射率モデルパラメータを学習する。
【0057】
以下、取得した燃圧変化から算出される上記噴射率モデルパラメータについて、図2を用いて説明する。
【0058】
図2(a)は、燃料噴射弁10のアクチュエータ13へECU30から出力される噴射指令信号を示しており、この指令信号のパルスオンによりアクチュエータ13が作動して噴孔11bが開弁する。つまり、噴射指令信号のパルスオン時期t1により噴射開始が指令され、パルスオフ時期t2により噴射終了が指令される。よって、指令信号のパルスオン期間(噴射指令期間)により噴孔11bの開弁時間Tqを制御することで、噴射量Qを制御している。
【0059】
図2(b)は、上記噴射指令に伴い生じる噴孔11bからの燃料噴射率の変化(推移)を示し、図2(c)は、噴射率の変化に伴い生じる検出圧力の変化(変動波形)を示す。検出圧力の変動と噴射率の変化とは以下に説明する相関があるため、検出圧力の変動波形から噴射率の推移波形を推定することができる。
【0060】
すなわち、先ず、図2(a)に示すように噴射開始指令がなされたt1時点の後、噴射率がR1の時点で上昇を開始して噴射が開始される。一方、検出圧力は、R1の時点で噴射率が上昇を開始したことに伴い変化点P1にて下降を開始する。その後、R2の時点で噴射率が最大噴射率に到達したことに伴い、検出圧力の下降は変化点P2にて停止する。次に、R2の時点で噴射率が下降を開始したことに伴い、検出圧力は変化点P2にて上昇を開始する。その後、R3の時点で噴射率がゼロになり実際の噴射が終了したことに伴い、検出圧力の上昇は変化点P3にて停止する。
【0061】
以上により、燃圧センサ20による検出圧力の変動のうち変化点P1及びP3を検出することで、噴射率の上昇開始時点R1(実噴射開始時点)及び下降終了時点R3(実噴射終了時点)を算出することができる。また、以下に説明する検出圧力の変動と噴射率の変化との相関関係に基づき、検出圧力の変動から噴射率の変化を推定できる。
【0062】
つまり、検出圧力の変化点P1からP2までの圧力下降率Pαと、噴射率の変化点R1からR2までの噴射率上昇率Rαとは相関がある。変化点P2からP3までの圧力上昇率Pγと変化点R2からR3までの噴射率下降率Rγとは相関がある。変化点P1からP2までの圧力下降量Pβ(最大落込量)と変化点R1からR2までの噴射率上昇量Rβとは相関がある。よって、検出圧力の変動から圧力下降率Pα、圧力上昇率Pγ及び圧力下降量Pβを検出することで、噴射率上昇率Rα、噴射率下降率Rγ及び噴射率上昇量Rβを算出することができる。以上の如く噴射率の各種状態R1,R3,Rα,Rβ,Rγを算出することができ、よって、図2(b)に示す燃料噴射率の変化(推移波形)を推定することができる。
【0063】
さらに、実噴射開始から終了までの噴射率の積分値(斜線を付した符号Sに示す部分の面積)は噴射量に相当する。そして、検出圧力の変動波形のうち実噴射開始から終了までの噴射率変化に対応する部分(変化点P1〜P3の部分)の圧力の積分値と噴射率の積分値Sとは相関がある。よって、検出圧力の変動から圧力積分値を算出することで、噴射量Qに相当する噴射率積分値Sを算出することができる。
【0064】
噴射指令信号のパルスオン時期t1、パルスオフ時期t2及びパルスオン期間Tqと、上記各種状態R1,R3,Rα,Rβ,Rγ、及び噴射量Qとの関係を、噴射率モデルパラメータとしてEEPROM25a(記憶手段)に記憶更新して学習する。
【0065】
より具体的には、以下に説明するtd,te,dqmax等を噴射率モデルパラメータとして学習する。すなわち、パルスオン時期t1から実噴射開始時点R1までの時間を噴射開始応答遅れ時間tdとして学習する。噴射指令による開弁時間Tqと、R1からR3までの時間である実噴射時間との偏差を噴射時間偏差teとして学習する。噴射指令による開弁時間Tqと噴射率上昇量Rβとの比率を上昇量比率dqmaxとして学習する。
【0066】
ECU30のマイコンは、基本的にはアクセル操作量等から算出されるエンジン負荷やエンジン回転速度に基づき要求噴射量及び要求噴射時期を算出する。そして、学習した噴射率モデルパラメータにより算出される噴射率モデルを用いて、要求噴射量及び要求噴射時期を満たすよう噴射指令信号t1、t2、Tqを設定する。これにより、燃料噴射状態(噴射タイミング及び噴射量等)を制御する。
【0067】
図3はECU30が有するマイコンにより燃料噴射弁10を制御する処理内容(制御内容)を示すブロック図であり、当該マイコンは、以下に説明するパラメータ算出手段32(計測ベクトル取得手段)、学習手段33、及び噴射指令信号設定手段34としての機能を有する。
【0068】
先ずECU30は、燃圧センサ20から検出圧力(図2(c)参照)を取得する。パラメータ算出手段32では、取得した検出圧力に基づき、上述した各種の噴射率モデルパラメータ(td,te,dqmax等)を算出する。これらのパラメータは、燃圧センサ20により計測した計測値であると言える。また、取得した検出圧力に基づき噴射開始時の燃圧p(図2(c)中の符号P1参照)を読み取る。
【0069】
学習手段33では、計測値としての各種パラメータを、噴射開始時の燃圧p(以下、単に「燃圧p」と記載する)と関連付けて、EEPROM25aに記憶更新して学習する。この記憶では、噴射率モデルパラメータ及び燃圧pを軸とするマップM上に、算出手段32で算出した計測値としてのパラメータを記憶させる。なお、マップMは、各種の噴射率モデルパラメータ(td,te,dqmax等)毎に設けられている。
【0070】
噴射指令信号設定手段34では、学習手段33により学習された噴射率モデルパラメータ(td,te,dqmax等)と、燃圧センサ20の検出圧力により取得した燃料噴射弁10に供給されている燃圧(噴射開始時燃圧P1)と、エンジン負荷等に基づき算出した要求噴射量及び要求噴射時期と、に基づき、要求噴射量及び要求噴射時期を満たすよう噴射指令信号t1、t2、Tqを設定する。燃料噴射弁10は、このように設定された噴射指令信号に応じて作動して、噴孔11bから燃料を噴射する。
【0071】
要するに、燃圧センサ20から取得した検出圧力に基づき噴射率モデルパラメータを算出し、その算出値(計測値)を記憶更新して学習し、その学習値を用いて次回以降の噴射指令信号を設定することで、要求する噴射状態と実際の噴射状態との偏差がゼロに近づくようフィードバック制御する。
【0072】
次に、噴射率モデルパラメータの学習手法について、噴射開始遅れ時間tdを一例として取り上げて説明する。図4は、遅れ時間tdが燃圧pと関連付けて記憶されたマップMを示しており、縦軸を遅れ時間td、横軸を燃圧pとしたマップ領域全体を、燃圧の領域i−1,i,i+1毎に複数に区分けしている。そして、それらの領域i−1,i,i+1毎に1つの遅れ時間tdを割り当てて記憶更新させている。ただし、遅れ時間tdを燃圧pと関連付けて記憶させるべく、遅れ時間td及び燃圧pを要素とした学習ベクトルを定義し、この学習ベクトルを領域i−1,i,i+1毎に記憶更新させている。
【0073】
例えば、図4に示すように、領域i−1の学習ベクトルはTDi−1(pi−1,tdi−1)で定義され、領域iの学習ベクトルはTDi(pi,tdi)で定義され、領域i+1の学習ベクトルはTDi+1(pi+1,tdi+1)で定義される。したがって、学習ベクトルは特定の燃圧pに対する遅れ時間tdを示すものではなく、領域内の任意の燃圧pに対する遅れ時間tdを示す。そのため、特定の燃圧pとなるよう高圧ポンプ41を駆動させ、その時の燃圧を燃圧センサ20で検出する、といった学習用の駆動を必要とせず、成り行きで噴射した時の燃圧検出値に基づき学習することができる。
【0074】
そして、パラメータ算出手段32において、取得した検出圧力に基づき計測値としての遅れ時間td及び燃圧pを算出した場合に、これらの計測値td,pを要素とした計測ベクトルTD(td,p)を定義する。この計測ベクトルTD(td,p)の燃圧pが領域iに該当する場合、領域iの学習ベクトルTDi(pi,tdi)を、計測ベクトルTD(td,p)に基づき補正して記憶更新(学習)させる。
【0075】
以下、この学習手順について図5を用いて説明する。図5は、ECU30が備えるマイコンにより、IGオンをトリガとして繰り返し実行される処理である。
【0076】
先ず、ステップS10(計測ベクトル取得手段)において、燃圧センサ20から検出圧力を取得する。続くステップS20(計測ベクトル取得手段)では、噴射率モデルパラメータ(td,te等)、及び噴射開始時の燃圧p(図2(c)中の符号P1参照)を算出する。以下、噴射率モデルパラメータとして遅れ時間tdを例に説明する。続くステップS30では、遅れ時間tdの学習回数が所定回数未満であるか否かを判定する。
【0077】
学習回数が所定回数以上であると判定されれば(S30:NO)、これ以上の学習が不要であるとみなして、図5の処理を終了する。これにより、ECU30の学習処理負荷を軽減する。遅れ時間tdの学習回数が所定回数未満であると判定されれば(S30:YES)、以降のステップS40〜S70において、遅れ時間tdの学習処理を実行する。
【0078】
先ずステップS40では、ステップS20で算出した遅れ時間td及び燃圧pを要素としたベクトルを、計測ベクトルTD(td,p)として定義する。要するに、燃圧センサ20により計測された燃圧に基づき計測ベクトルTD(td,p)を取得していると言える。
【0079】
続くステップS50では、ステップS20で算出した燃圧pに基づき、更新する学習ベクトルを探索する。つまり、前記燃圧pが、複数に区分けされた領域i−1,i,i+1のいずれに該当するかを探索し、該当する領域に割り当てられた学習ベクトルを、更新対象の学習ベクトルとする。図4の例では、図中の△印に示す計測ベクトルTD(td,p)を取得した場合であり、計測ベクトルTD(td,p)の要素である燃圧pが領域iに該当するため、図中の○印に示す、領域iの学習ベクトルTDi(pi,tdi)を更新対象としている。
【0080】
続くステップS60(補正ベクトル算出手段(補正手段))では、更新対象の学習ベクトルTDi(pi,tdi)及び計測ベクトルTD(td,p)に基づき、補正ベクトルTDiamを算出する。具体的には、計測ベクトルTD(td,p)から更新対象学習ベクトルTDi(pi,tdi)を減算し、その減算結果に所定割合G(0<G<1)を乗算して得られたベクトルを補正ベクトルTDiamとして算出する。つまり、TDiam={TD(td,p)−TDi(pi,tdi)}×Gとの式により算出する。
【0081】
本実施形態にかかる所定割合Gは、いずれの領域においても同じ値に設定されているが、領域毎に異なる値に設定してもよい。例えば、学習回数が少ない場合であるほど所定割合Gを大きい値に設定することで、学習ベクトルを早期に真値に近づけると共に、ある程度真値に近づいた学習ベクトルに対してハンチング抑制を図る。また、本実施形態にかかる所定割合Gは、予め設定された値に固定されているが、可変設定してもよい。例えば学習回数に応じて所定割合Gの値を可変設定してもよい。
【0082】
続くステップS70(補正手段)では、ステップS60で算出した補正ベクトルTDiamを更新対象学習ベクトルTDi(pi,tdi)に加算することで、領域iの学習ベクトルTDi(pi,tdi)を補正して記憶更新する。つまり、更新後の学習ベクトルTDinew(pinew,tdinew)を、TDinew(pinew,tdinew)=TDi(pi,tdi)+TDiamとの式により算出する。
【0083】
続くステップS80では、ステップS30の判定に用いる学習回数のカウンタをカウントアップする。なお、上記ステップS30では、全ての領域を含めたtdの学習回数について判定しているが、領域毎に学習回数をカウントし、領域毎に学習回数が所定回数以下であるか否かを判定するようにしてもよい。この場合ステップS80では、ステップS70で更新した学習ベクトルに該当する領域についての学習回数カウンタをカウントアップすることとなる。
【0084】
以上詳述した本実施形態によれば、以下の効果が得られるようになる。
【0085】
(1)本実施形態では、燃圧pの特定値(図7の例では30MPa,50MPa,80MPa)に対する応答遅れ時間td(図7の例ではtd(30),td(50),td(80))を記憶するのではなく、応答遅れ時間td及び燃圧pを要素とした学習ベクトル(図4の例ではTDi−1,TDi,TDi+1)を記憶する。そして、応答遅れ時間tdの計測値及び噴射開始時点での燃圧pの計測値を要素とした計測ベクトル(図4の例ではtd)に基づき学習ベクトルを補正するので、応答遅れ時間tdと燃圧pとの関係を表す特性が直線ではなく曲線であったとしても、記憶更新される学習ベクトルの値がハンチングすることを抑制できる。
【0086】
また、前記特性が直線であり、現在の学習ベクトルTDiが真の特性値からずれていたとしても、計測ベクトルTDに基づき現在の学習ベクトルTDiを補正することを繰り返していけば、更新後の学習ベクトルTDinewはハンチングすることなく真値に徐々に近づいていくこととなる。よってこの場合においても、記憶更新される学習ベクトルTDinewの値がハンチングすることを抑制できる。
【0087】
(2)計測ベクトルTDと学習ベクトルTDiとの差分に、所定割合Gを乗じて補正ベクトルTDiamを算出しており、その所定割合Gを0<G<1に設定しているので、前記差分をそのまま学習ベクトルTDiに加算して補正する場合に比べて、記憶更新される学習ベクトルの値がハンチングすることを抑制できる。
【0088】
(3)遅れ時間tdの学習回数が所定回数以上であれば(S30:NO)、これ以上の学習が不要であるとみなして、計測ベクトルの算出処理(S40)、補正ベクトルの算出処理(S60)、及び学習ベクトルの記憶更新処理(S70)等を実行せず、図5の処理を終了するので、過剰な回数の学習を回避してECU30の学習処理負荷を軽減できる。
【0089】
(第2実施形態)
上記第1実施形態では、全ての領域i−1,i,i+1において、補正ベクトルTDiamの算出に用いる所定割合Gを同一の値に設定しているが、本実施形態では、領域i−1,i,i+1毎に異なる値に所定割合Gを設定している。
【0090】
具体的には、学習回数に応じて所定割合Gを可変設定することが一例として挙げられる。この場合、学習回数が多い領域であるほど学習ベクトルが真値に近づいていると想定されるので、学習回数が多いほど所定割合Gを小さくしていくよう可変設定すればよい。
【0091】
また、制御対象となる燃料噴射弁10の初回使用時からの経過時間が長いほど、全ての領域についての学習回数が多くなっていると想定されるので、前記経過時間が長いほどいずれの領域においても学習ベクトルが真値に近づいているとみなして、いずれの領域においても経過時間とともに所定割合Gを小さくしていくようにしてもよい。
【0092】
(第3実施形態)
上記第1実施形態では、燃圧pの全領域を等間隔で区分けしているが、本実施形態では、複数の領域i−1,i,i+1を異なる間隔(図6中の符号Wi,Wi+1参照)に区分けしている。
【0093】
つまり、複数の学習ベクトルTDi−1,TDi,TDi+1のマップ領域における分布形状に応じて、複数の領域i−1,i,i+1を異なる間隔(図6中の符号Wi,Wi+1参照)に区分けすることが第1の具体例として挙げられる。
【0094】
例えば、学習ベクトルの分布形状が図6中の符号Rに示す形状である場合において、その分布形状Rのうち曲線形状となっている領域(符号Wi+1に示す領域)については、真値の分布も曲線形状になっていると想定されるため、直線形状となっている領域(図6中の符号Wiに示す領域)に比べてその領域の間隔を小さく設定する。或いは、前記分布形状Rのうち極値(符号Ra,Rb,Rc参照)近傍の領域については、真値の分布も極値を有する形状になっていると想定されるため、その領域の間隔を小さく設定する。これらによれば、真値が急激に変化する領域に対してきめ細かく学習ベクトルが記憶更新されるので、学習ベクトルを真値に精度良く近づけることができる。
【0095】
また、学習された噴射率モデルパラメータ(td,te,dqmax等)に基づき算出した噴射率モデルを用いて(つまり学習マップMを用いて)、噴射指令信号設定手段34が噴射指令信号t1、t2、Tqを設定するにあたり、マップM中の領域i−1,i,i+1毎に記憶された学習ベクトルTDi−1,TDi,TDi+1が前記噴射指令信号の設定に用いられる使用頻度は、領域によって異なる。そこで、その使用頻度に応じて複数の領域i−1,i,i+1を異なる間隔に区分けすることが第2の具体例として挙げられる。例えば、内燃機関のアイドル運転時の燃圧に対する学習ベクトルは使用頻度が高いので、このような領域は小さく設定することが望ましい。
【0096】
(第4実施形態)
上記第1実施形態では、td,te,dqmax等の噴射率モデルパラメータ(制御パラメータ)及び燃圧p(基準変数)を軸とするマップ領域を複数領域i−1,i,i+1に区分けし、区分けされた領域毎に学習ベクトルを1つ割り当てている。これに対し本実施形態では、噴射率モデルパラメータ及び燃圧pを軸とするマップ領域において、複数の領域に区分けすることを廃止して、取得した計測ベクトルTDに最も近い位置の既存の学習ベクトルを、更新対象として計測ベクトルTDに基づき補正して記憶更新させる。
【0097】
例えば、図4の例において、上記第1実施形態では領域iに位置していた計測ベクトルTDであっても、領域iに位置する学習ベクトルTDiよりも領域i+1に位置する学習ベクトルTDi+1の方が計測ベクトルTDに近ければ、学習ベクトルTDiではなく学習ベクトルTDi+1が、計測ベクトルTDに基づき補正して記憶更新されることとなる。
【0098】
したがって、本実施形態によれば、マップ領域中の計測ベクトルTDが頻繁に計測される領域に学習ベクトルが集まってくることとなり、ひいては、計測頻度の高い領域での学習ベクトルの点数が自然に増加していくこととなる。
【0099】
(第5実施形態)
上記第4実施形態では、上記マップ領域中に存在する学習ベクトルの個数を一定の個数に固定している。これに対し本実施形態では、上記第4実施形態と同様にして計測ベクトルTDに最も近い位置の学習ベクトルを更新対象とすることに加え、マップ領域中に存在する学習ベクトルの個数を可変設定する。
【0100】
第1具体例として、図6を用いて上述したように、学習ベクトルの分布形状Rのうち曲線形状となっている領域、極値Ra,Rb,Rc近傍の領域、或いは、使用頻度の高い領域については、学習ベクトルの個数を増加させるよう可変設定することが挙げられる。
【0101】
第2具体例として、隣り合う学習ベクトルの距離が所定値以下である場合に、隣り合う学習ベクトルのうちいずれか一方を削除することで、学習ベクトルの個数を減少させるよう可変設定することが挙げられる。このように隣り合う学習ベクトルの距離が近い場合には、学習ベクトルの数が不必要に多いとみなしていずれか一方を削除するので、EEPROM25aの記憶容量を軽減できる。
【0102】
第3具体例として、隣り合う学習ベクトルの距離が所定値以下である場合に、隣り合う学習ベクトルの間に新たな学習ベクトルを追加することで、学習ベクトルの個数を増加させるよう可変設定することが挙げられる。このように隣り合う学習ベクトルの距離が近い場合には、使用頻度が多い領域であるとみなして新たな学習ベクトルを追加するので、使用頻度の多い領域に対してきめ細かく学習ベクトルを記憶更新させることができる。
【0103】
(第6実施形態)
上記第1実施形態では、記憶更新した学習ベクトルをそのまま用いて学習マップMを作成し、当該学習マップMに基づき噴射指令信号t1、t2、Tqを設定している。これに対し本実施形態では、学習が終了した学習ベクトルに基づき、燃圧p(基準変数)の特定値(例えば図7中の30MPa,50MPa,80MPa)に対する遅れ時間td(制御パラメータ)の値を線形補間により算出し、その算出値を前記特定値と関連付けて制御マップを作成し、その制御マップに記憶された遅れ時間tdを用いて、噴射率モデルを算出して噴射指令信号を設定するようにしてもよい。
【0104】
要するに、学習自体は図4に示す学習マップMで実施するものの、噴射指令信号を設定に用いる制御マップには前記学習マップMをそのまま採用するのではなく、学習マップから作成した図7に示す形態のマップを採用する。
【0105】
(他の実施形態)
本発明は上記実施形態の記載内容に限定されず、以下のように変更して実施してもよい。また、各実施形態の特徴的構成をそれぞれ任意に組み合わせるようにしてもよい。
【0106】
・上記各実施形態では、噴射率モデルパラメータ(td,te,dqmax等)の各々について燃圧pに関連付けた学習マップを作成している。換言すれば、1つの噴射率モデルパラメータと燃圧pとを要素とした2次元の学習ベクトルを定義して、2次元の学習マップに学習ベクトルを記憶させている。これに対し、複数の噴射率モデルパラメータと燃圧pとを要素とした3次元以上の多次元学習ベクトルを定義して、3次元以上の多次元学習マップに多次元学習ベクトルを記憶させるようにしてもよい。
【0107】
例えば応答遅れ時間td、噴射時間偏差te及び燃圧pを要素とした3次元の学習ベクトルを定義した場合、図5の処理と同様に学習を実行する。つまり、計測ベクトルをTD(td,te,p)と定義し、補正ベクトルTDiamを{TD(td,te,p)−TDi(pi,tei,tdi)}×Gとの式により算出する。そして、更新後の学習ベクトルTDinew(pinew,teinew,tdinew)をTDi(pi,tei,tdi)+TDiamとの式により算出する。要するに、各算出式の次元を変更するだけでよいので、大幅なプログラム変更を要することなく複数の制御パラメータに対応できる。
【0108】
・上記各実施形態では、燃料噴射弁に搭載されたEEPROM25aに噴射率モデルパラメータ(制御パラメータ)の学習値を記憶させているが、ECU30のメモリ31に記憶させるようにしてもよい。
【0109】
・上記各実施形態では、補正ベクトルTDiamの算出に用いる所定割合Gを1未満としているが、1に設定してもいい。つまり、計測ベクトルTD(td,p)から更新対象学習ベクトルTDi(pi,tdi)を減算して得られたベクトルを、そのまま補正ベクトルTDiamとする。
【0110】
・上記第1実施形態では、図5のステップS30において学習回数が所定回数以上であることを条件として学習を終了させているが、学習ベクトルの学習期間が所定期間を超えたことを条件として学習を終了させるようにしてもよい。
【符号の説明】
【0111】
10…燃料噴射弁(制御対象)、20…燃圧センサ、25a…EEPROM(記憶手段)、32…パラメータ算出手段(計測ベクトル取得手段)、S10,S20…計測ベクトル取得手段、S60…補正ベクトル算出手段(補正手段)、S70…補正手段、td…噴射開始応答遅れ時間(制御パラメータ)、te…噴射時間偏差(制御パラメータ)、dqmax…上昇量比率(制御パラメータ)、p…燃圧(基準変数)、TD…計測ベクトル、TDi…学習ベクトル、TDiam…補正ベクトル。

【特許請求の範囲】
【請求項1】
制御対象の制御内容を決定するのに用いる制御パラメータを、基準変数と関連付けて学習する学習装置において、
前記制御パラメータ及び前記基準変数を要素とした学習ベクトルを記憶する記憶手段と、
前記制御パラメータの計測値及び前記基準変数の計測値を要素とした計測ベクトルを取得する計測ベクトル取得手段と、
前記計測ベクトルに基づき前記学習ベクトルを補正して前記記憶手段に記憶更新させる補正手段と、
を備えることを特徴とする学習装置。
【請求項2】
前記補正手段は、
取得した前記計測ベクトルと前記学習ベクトルとの差分に、所定割合を乗じて補正ベクトルを算出する補正ベクトル算出手段を有するとともに、
学習前の前記学習ベクトルに前記補正ベクトルを加算して前記学習ベクトルの記憶更新を行うことを特徴とする請求項1に記載の学習装置。
【請求項3】
学習回数に応じて前記所定割合を可変設定することを特徴とする請求項2に記載の学習装置。
【請求項4】
前記制御対象の始動開始からの経過時間に応じて前記所定割合を可変設定することを特徴とする請求項2又は3に記載の学習装置。
【請求項5】
前記制御パラメータ及び前記基準変数を軸とするマップ領域を複数領域に区分けし、区分けされた領域毎に前記学習ベクトルを1つ割り当て、取得した前記計測ベクトルに該当する領域の学習ベクトルを補正して記憶更新させることを特徴とする請求項1〜4のいずれか1つに記載の学習装置。
【請求項6】
複数の前記学習ベクトルの前記マップ領域における分布形状に応じて、複数の前記領域を異なる間隔に区分けすることを特徴とする請求項5に記載の学習装置。
【請求項7】
複数の前記学習ベクトルのうち前記制御内容の決定に用いられた使用頻度に応じて、複数の前記領域を異なる間隔に区分けすることを特徴とする請求項5又は6に記載の学習装置。
【請求項8】
複数の前記領域を等間隔に区分けすることを特徴とする請求項5に記載の学習装置。
【請求項9】
前記制御パラメータ及び前記基準変数を軸とするマップ領域において、取得した前記計測ベクトルに最も近い位置の学習ベクトルを補正して記憶更新させることを特徴とする請求項1〜4のいずれか1つに記載の学習装置。
【請求項10】
前記制御パラメータ及び前記基準変数を軸とするマップ領域において、前記学習ベクトルの個数を可変設定することを特徴とする請求項1〜9のいずれか1つに記載の学習装置。
【請求項11】
複数の前記学習ベクトルの前記マップ領域における分布形状に応じて、前記学習ベクトルの個数を可変設定することを特徴とする請求項10に記載の学習装置。
【請求項12】
複数の前記学習ベクトルのうち前記制御内容の決定に用いられた使用頻度に応じて、前記学習ベクトルの個数を可変設定することを特徴とする請求項10又は11に記載の学習装置。
【請求項13】
隣り合う前記学習ベクトルの距離が所定値以下である場合に、隣り合う前記学習ベクトルのうちいずれか一方を削除することを特徴とする請求項10〜12のいずれか1つに記載の学習装置。
【請求項14】
隣り合う前記学習ベクトルの距離が所定値以下である場合に、隣り合う前記学習ベクトルの間に新たな学習ベクトルを追加することを特徴とする請求項10〜12のいずれか1つに記載の学習装置。
【請求項15】
所定回数以上の記憶更新が為された前記学習ベクトルについては、学習を終了させることを特徴とする請求項1〜14のいずれか1つに記載の学習装置。
【請求項16】
前記学習ベクトルの学習期間が所定期間を超えた場合には、全ての前記学習ベクトルについて、その学習を終了させることを特徴とする請求項1〜15のいずれか1つに記載の学習装置。
【請求項17】
学習が終了した前記学習ベクトルに基づき、前記基準変数の特定値に対する前記制御パラメータの値を線形補間により算出し、その算出値を前記特定値と関連付けて制御マップを作成し、前記制御マップに記憶された前記制御パラメータを用いて前記制御内容を決定することを特徴とする請求項1〜16のいずれか1つに記載の学習装置。
【請求項18】
学習が終了した前記学習ベクトルの前記制御パラメータの値を、その学習ベクトルの基準変数と関連付けて制御マップを作成し、前記制御マップに記憶された前記制御パラメータを用いて前記制御内容を決定することを特徴とする請求項1〜16のいずれか1つに記載の学習装置。
【請求項19】
前記学習ベクトルは、複数の前記制御パラメータ及び前記基準変数を要素とした3次元以上のベクトルであることを特徴とする請求項1〜18のいずれか1つに記載の学習装置。
【請求項20】
前記制御対象は、内燃機関の燃焼に供する燃料を噴射する燃料噴射弁であり、
前記燃料噴射弁には、燃料圧力を検出する燃圧センサが搭載されており、
前記計測ベクトル取得手段は、前記燃圧センサの検出値に基づき、前記燃料噴射弁の噴射特性を定量化したパラメータを前記制御パラメータとして取得することを特徴とする請求項1〜19のいずれか1つに記載の学習装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2011−1916(P2011−1916A)
【公開日】平成23年1月6日(2011.1.6)
【国際特許分類】
【出願番号】特願2009−147013(P2009−147013)
【出願日】平成21年6月19日(2009.6.19)
【出願人】(000004260)株式会社デンソー (27,639)
【Fターム(参考)】