システムの最適制御方法
【課題】従来の理論では、解析的に最適制御則を導くことが困難であった非線形最適制御問題に対して、見通しの良い最適制御則を得るプロセスを明らかにすること.
【解決手段】入力に関する評価関数を制御装置から制御対象に伝達されるエネルギとし,これに制御性能を表現する関数を加えて全体の評価関数とする.さらに付帯条件として制御対象の完全なパワー収支の式を加えて汎関数とする.こうすると汎関数は制御変数に関して1次式となるので,制御対象が線形,非線形を問わず汎関数を最小化する条件から微分方程式を解かずに最適制御則を解析的に導くことができる.これにより、従来解析的に最適制御則を求めることが難しかったエネルギ回生制御や非ホロノミック拘束を有する非線形制御問題に対しても最適制御則を求めることができるようになった.
【解決手段】入力に関する評価関数を制御装置から制御対象に伝達されるエネルギとし,これに制御性能を表現する関数を加えて全体の評価関数とする.さらに付帯条件として制御対象の完全なパワー収支の式を加えて汎関数とする.こうすると汎関数は制御変数に関して1次式となるので,制御対象が線形,非線形を問わず汎関数を最小化する条件から微分方程式を解かずに最適制御則を解析的に導くことができる.これにより、従来解析的に最適制御則を求めることが難しかったエネルギ回生制御や非ホロノミック拘束を有する非線形制御問題に対しても最適制御則を求めることができるようになった.
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、主として機械力学系システムの実時間最適制御方法に関する.線形、非線形、ホロノミック、非ホロノミック系を問わず広範囲のシステムに適用できる.
【背景技術】
【0002】
ポントリャーギンが随伴変数を導入して最適制御問題をハミルトン形式に書き換えて最大原理を見出したことは,その後の最適制御理論の発展に大きな影響を与えた.しかし,現在でも随伴変数と状態変数についての連立微分方程式を解かねばならない状況は変わらず,特に非線形システムの最適制御則を解析的に導くことは容易ではない.そのため様々な数値探索的方法や推論的手法が工夫されてはいる.しかし制御則が数値解の場合は、制御系設計者が得られた制御則を改善しようとしても、制御対象システムのパラメータとの対応関係がわからず試行錯誤的にならざるを得ない.このような状況から脱却するためには見通しの良い解析的手法が必要である.
【発明が解決しようとする課題】
【0003】
このような背景から,本考案では,従来とは異なる手法で主として機械力学系システムの非線形系を含む比較的広範囲の最適制御問題に対して制御則を解析的に導く手法を提示する.制御対象のエネルギ収支に着目した受動性の概念によりシステムを漸近安定させる制御則が簡単に導かれるように(例えば非特許文献1参照),本考案でも制御対象のエネルギ収支に着目する.入力に関する評価関数を制御装置から制御対象に伝達されるエネルギとし,これに制御性能を表現する関数を加えて全体の評価関数とする.さらに付帯条件として制御対象の完全なエネルギ収支の式を加えて汎関数とする.こうすると汎関数は制御変数に関して1次式となるので,制御対象が線形,非線形を問わず汎関数を最小化する条件から微分方程式を解かずに最適制御則を解析的に導くことができる.
この汎関数を最小化する条件は,最適制御であるための必要条件であり,しかも未定定数を含む弱い条件であるが,制御対象の構造的性質をうまく活用することにより有益な制御則が得られる.後の事例によりその有用性を示す.
【0004】
最適制御問題を定式化する.まず制御対象の特性表現について述べる.制御理論では制御対象の特性を運動方程式で記述するが,ここでは制御対象の全入出力パワーの収支の式を用いる具体的には,システムの各自由度毎の運動方程式をベクトル表示しこれに速度ベクトルを乗じたものである.入力パワーは制御入力だけでなく外乱入力も含まれ,また制御対象は受動要素だけとは限らないため,内部にエネルギ源がありこれが運動に影響を与えていれば外乱入力として扱う.
【式1】
ここで,d,e,q,u,v,z ∈Rn ,M ∈Rn×n は正定対称な慣性マトリクス,nは制御対象の自由度である.qは一般化座標,uは制御入力,vは力入力の外乱,zは変位入力の外乱である.dはコリオリ力や遠心力やダンピング力など,eはポテンシャル力である.
制御対象が非線形であっても制御装置を合理的に設計すれば,式(1)のようにuを直接Mに作用させることができる.本論文では,このような合理的に設計された機械力学系システムを想定して最適制御則を導く.
上記のシステムに対し,次の評価関数を考える.
【式2】
置が御対象に加えるパワーである.rは重み係数である.
式(2)を最小化する制御u(t)を求めることが最適制御の課題である.
【非特許文献1】有本卓,新版ロボットの力学と制御,(2002),PP.68−69.朝倉書店.
【課題を解決するための手段】
【0005】
従来の最適制御理論では,随伴変数を導入して微分方程式を導きこれに元の状態方程式を連立させて解くことになるが,本論文ではこのような方法とは全く異なる手法を示す.最適制御の必要条件を求めるため次のスカラー関数Lを定義する.
【式3】
ここで,κは未定定数である.右辺の{}内は,式(1)の左辺と同じで制御対象の全パワー収支であるからエネルギ保存則を満たし常にゼロである.従って式(3)で表されるLの積分を最小化する条件は,式(2)も最小化する.
従って関数Lにqを変数とする変分原理を適用した次式はuが最適制御であるための必要条件を与える.Lはuに関して1次式であるから,∂L/∂uは意味がなく次式に制御に関するすべての情報が含まれる.
【式4】
Lにはqの2階の導関数が含まれるため一般的なオイラーの方程式に第3項が追加されている(例えば非特許文献2参照).
式(4)を積分し積分定数をゼロとすると次式になる.
【式5】
式(3)を式(5)に代入し左辺第1〜3項の順に記すと次のようになる.
【式6】
上式から制御則が次のように求まる.
【式7】
このように,本手法はJを最小化するqとuの関係を直接導くことができるため,従来のように2点境界値問題を最適性の原理を用いて解くプロセスが不要になる.κは未定定数であるが,κ=0の時はuが制御の評価関数のパラメータのみで定まり,κ=∞の時はuが制御対象のパラメータのみで定まることからuが最適であるためにはκはゼロでない有限値でなければならないことは明らかである.
上式の第1行は外力vと慣性のq依存性に対する制御,第2行はコリオリ力や遠心力やダンピング力に対する制御,第3行はポテンシャル力とそのq依存性および外力zに対する制御,第4行は評価関数を低減させる制御でありそれぞれ意味が明確である.式(7)には未実行の微積分項が含まれているが,全ての外力と状態量の検出あるいは推定が可能とすればこれらの実時間での実行は可能である.式(5)において積分定数をゼロとしたが,上記の結果より積分定数は制御則に一定のバイアスを与えることになるためゼロとすることが妥当であることがわかる.式(7)中の積分も同様である.
式(7)ではアクチュエータの数と系の自由度が同じであることを想定しているが,アクチュエータの数が少ない場合には次のような処置が必要になる.例えばアクチュエータが二つの独立な慣性Mi,Mi+1の間に置かれるような場合は,制御ベクトルuにその拘束条件を含めておき最適制御則は二つの制御則を重みを付けて加算したものにする.
【式8】
ここでui,ui+1はそれぞれが独立な制御として導いた場合の最適制御則であり,ρi,ρi+1は重み係数である.これらの重み係数や未定定数κの決定法については,次の具体例で示す.
【非特許文献2】L.E.エルスゴルツ,瀬川富士訳,科学者・技術者のための変分法,(1972),pp.34−37.ブレイン図書出版.
【発明の効果】
【0006】
ここでは,従来の最適制御理論では解析解を得ることができない問題に本手法を適用しその有効性を明らかにする.最初は評価関数が2次形式にならないアクティブサスペンションのエネルギ回生制御を扱い,次に未だに最適制御則の導出が困難とされている非ホロノミック系の制御への適用を試みる.
【0007】
まず、アクティブサスペンションのエネルギ回生制御への適用について具体的な定式化を行う.特許文献1では、図1に示すようなアクティブサスペンションのモデルを用いてエネルギ回生制御を考案し,近似解法により準最適制御則u*optを導いている.この事例では結果的に入力に関する評価関数が本論文の手法と同じく制御装置から制御対象に伝達されるエネルギ収支式となっているが,当時はまだ制御対象のエネルギ収支に着目した最適制御という認識はなく,従来の制御理論では解析的に解けないケースとして近似解法を試みたものであり,近似解法ながらほぼ最適制御であることを立証している.本考案では解析的に導いた最適制御則uoptが簡潔な表現ながらこの近似解u*optと同等の性能であることを確認する.
まず特許文献1の評価関数を変数qを用いて記述する.
【式9】
ここで,r1,rは重み係数である.重みr1はばね下質量の制振が従来車両と同程度になるようにr1=5×10−3 とし,rについては振動の評価とエネルギの評価が同程度の値になるようにr=10−5とした.
【0008】
続いて制御則を導出する.まず図1のモデルから式(1)の各要素を求めると次のようになる.
【式10】
【式11】
【式12】
【式13】
【式14】
【式15】
式(10)〜(15)を式(3)に代入することでLが求まる.
【式16】
式(16)を式(5)に代入すると,
【式17】
より次式が得られる.
【式18】
これより次の制御則が得られる.
【式19】
同様にして,
【式20】
より次式が得られる.
【式21】
これより次の制御則が得られる.
【式22】
従って最終的な制御則は次の形になる.
【式23】
ρ1,ρ2はそれぞれの重み係数で,その和は次式とする.
【式24】
評価関数の重みを考慮したM1,M2へのu1,u2の感度を等しいと考えると次のようになる.
【式25】
以上より最適制御則は次のように求まる.
【式26】
ここで,ρ1=2M1/(M1+r1M2),ρ2=2r1M2/(M1+r1M2)である.本手法から求まる必要条件はここまでであって,κの最適化は探索的に求める必要がある.
【0009】
MATLAB/SIMULINKによるランダム路面入力シミュレーションにより制御性能を評価する.以
一定でレベルは極良路(ISO/TC108/クラスA)を60Km/h程度での走行に相当するように設定した.シミュレーションは,10−4secの固定ステップで2sec間行った.
【0010】
上記シミュレーション条件において,Jを最小にするκ探索的に求めた結果を図2に示す.これより最適値は,κ=−3.6×10−7であることがわかる.
【0011】
シミュレーション結果を図3,4に示す.制御性能比較のため準最適制御以外にパッシブダン
した.パッシブダンパ制御は図1のパッシブダンパC2と同等の機能を制御で出すものである.スカイフックダンパ制御はばね下振動を押さえる機能がないためダンパが必要でありC2=1200Nsec/mとし,他はすべて C2=0とした.評価関数Jを振動に関する部分J1と制御入力エネルギに関する部分J2に分離すると次のようになる.
【式27】
【式28】
図3は各制御についてJ1,J2の比較を行ったものである.J2についてはuoptとu*optは同等であるが,J1ではuoptの方が若干優れることがわかる.
図4は,本制御と準最適制御について制御対象に伝達されるパワーのシミュレーション結果を示す.ともに大半の時間帯で伝達パワーは負の値を示しており,エネルギ回生を効果的に行っていることがわかる.
以上により,本制御則の式(26)は近似解法による準最適制御則(特許文献1の式(20))と比べ簡潔でありながら同等以上の効果があることが確認できた.
【0012】
次に非ホロノミック系システムの最適制御に適用した例を示す.近年,非ホロノミックな拘束をもつ非線形系のシステムへの関心が高まり各種の制御が研究されている.ここでは非特許文献3において解説されている転がるコインの制御を例題にとり,本手法により導いた最適制御則の検討を行う.
【0013】
転がるコインのモデルを図5に示す.平面上に直行座標x−yを取り,コインの転がっていく方向の角度をq1,平面上の位置を(q2,q3),コインの転がり角度をq4とする.q1,q4を増やす方向のトルクをu1,u2とする.さらにコインの半径や慣性モーメントを1とし質量はゼロとする.
まず図5のモデルから式(1)の各要素を求めると次のようになる.
【式29】
【式30】
【式31】
【式32】
さらに非ホロノミックな拘束条件として次式が加わる.
【式33】
【式34】
このようにuがMを直接制御する系ならば,非ホロノミック系であっても本手法により最適制御則を解析的に導くことが出来ることを次に示す.
【0014】
転がるコインの制御について具体的な定式化を行う.制御の目的は任意の初期状態からq1,q2,q3をゼロにすることであるが,モデルから明らかなように,q1はu1を2回積分するだけで
でよい.
【式35】
u1は振動的にする必要があることが既に知られているため,k1=0.3,k2=1とした.この制御則ではq1の初期値が小さいと振動が小さすぎてq2,q3の制御に支障をきたすが,この場合は例えば事前にq1をある値に設定してから全体の制御を開始するといった二段搆えの制御を行えば問題は回避できる.q2,q3に影響を与えずにq1を事前にある値に設定することは容易であるためこの方式は許容できよう.あるいはq1の初期値にかかわらずq1について式(35)の制御則と同様な次のような位置制御をプログラムしておくといった方法でもよい.
【式36】
以上の事前検討を基にu2についての最適制御を考え,評価関数を次式とする.
【式37】
ここで,r2,r3,r4,r5 は重み係数である.上式右辺第1,2項はq2,q3をゼロに収束させるという制御目的を表す項で,その意味をわかりやすくするため積分した結果を表示している.第3項がコインの回転運動に対する減衰を評価する項であり,第4項が制御対象への入力エネルギの項である.
【0015】
続いて制御則を導出する.式(29)〜(34),(37)を用いてLを求める.ここでgは,式(37)右辺第1,2項を積分の形に戻した後に第1〜3項の被積分関数を加算したものに式(33)(34)の拘束条件を加味している.
上式右辺第1行がパワー収支式から得られる項であり,第2,3行が評価関数から得られる項である.このケースではパワー収支式から得られる情報が少ないので評価関数に必要十分な情報を盛り込みこれを補っている.ここで,留意しなければならないのは,モデルから運動方程
小化する条件の一部として既に式(39)に含まれているためさらに代入することはLに余計な拘束を強いることになる.
u2を最適にするための必要条件は次の方程式から求めることができる.
【式39】
式(38)を代入すると,
【式40】
となりこれより次の制御則が得られる.
【式41】
【0016】
式(35),(41)の制御則を用いてシミュレーションによる評価を行う.
まず,重み係数r2,r3,r4の選定を行う.図5のモデルからわかるようにq1を早めにゼロに収束させるとq3の調整が出来なくなる.従ってq3を収束させた後にq2を収束させることが望ましくこのためr2よりr3を大きく設定する.またコインの回転のオーバーシュートを抑えるためr4は大き目の値に設定する.以上よりr2=0.25,r3=2.5,r4=1.0とした.このケースでは入力エネルギは最終的にゼロになるため,r5の値はさほど重要ではない.他の重みとレベルを合わせて,r5=0.5とした.
シミュレーション結果を図6〜9に示す.まず,κの最適化を行う.κを変化させた場合の式(37)の値の変化を図6に示す.これよりκ=−0.1が最適値であることがわかる.以後この値を用いてシミュレーションを行う.
図7は[q1,q2,q3]の初期値を[1,1,−1]としてシミュレーションを行った結果である.q1の振動を利用してまずq3が収束し続いてq2がゆっくり収束している様子がわかる.
図8は,このときのq2,q3の軌跡を示す.q2は一度の速度切り替えで目標に収束しており良好な結果が得られた.
図5のモデルを漸近安定させる一例として非特許文献3において紹介されている制御則を用いて,図7と同一条件でシミュレーションした結果を図9に示す.特に収束性を良くする工夫はされてなく,漸近安定させる例として示されたものなので,本提案の結果との直接性能比較の対象ではないが,参考として掲示する.
【0017】
続いて、本制御はロバスト性能が優れていることを示す.再び図1のモデルを用いて従来の代表的な最適制御理論であるLQ制御と比較する.
【0018】
LQ制御則を求めるためには,図1のモデルを状態方程式で記述し直し,評価関数を2次形式にする必要がある.図1において,q0をx0とし,q1−q0をx1とし,q2−q0をx2とし,ばね下速度をx3とし,ばね上速度をx4とすると状態方程式は以下のようになる.
【式42】
評価関数を次のような2次形式とする.
【式43】
式(43)の被積分関数の第1項は式(27)の性能評価項と同一であるが,第2項は異なりuの2乗になっている.無限評価区間であるから,LQ制御則は次のリカッチ代数方程式の解から求まる.
【式44】
本手法とLQ制御とは制御入力の評価関数が異なるため,性能比較を行うには性能評価値J1の値を基準値にとりこの値が同じになるようにして比較する必要がある.J1の値が図3に示す本手法の値と同じになるように,r1q=1.5×10−9とし,A,B,Qに数値を入れると制御則は次のようになる.
【式45】
である.これを式(26)と同じ形式で記述し両者を数値で比較すると次のようになる.
【式46】
【式47】
【0019】
本制御とLQ制御についてロバスト性能を比較する.式(46),(47)を比較すると,LQ制御はq0とq1のゲインが大きいため信号ノイズに対するロバスト性の低下が懸念される.現実の制御では,路面入力q0は推定値を用いることになるため,ある程度の推定誤差は前提とせざるをえない.q0の推定誤差の影響についてのシミュレーション評価を行った.路面入力q0とは無相関で統計的特性が同じ信号をy0とし,推定誤差相当のランダムノイズをαy0とした.αをパラメータとしたシミュレーション結果を図10に示す.色塗りで示した本手法のプロットはq0の推定誤差による影響をほとんど受けずロバスト性が高いことがわかる.評価値Jは本手法が,評価値JLQではLQ制御が優れるのは当然であるが,αが0.2以上では評価値JLQにおいても本制御がLQ制御より優れることがわかる.従って従って,本手法は外乱入力の推定誤差に対するロバスト性が優れるといえる.
【0020】
以上が今回の提案内容であるが、一般論としては式(2)が必ず最小値を持つことを証明しておく必要があるため、以下で確認する.
式(1)はパワー収支式であるが,変位入力の外乱によるパワーが陽に表されていない.これを明示し入力側を左辺に蓄積・散逸側を右辺に書き直せば,次式のようになる.
【式48】
ここで,fは変位入力外乱zに抗する制御対象側の反力,Uはポテンシャルエネルギである.式(1)との対応より次式の成立は明らかである.
【式49】
動方程式の記述を用いて書き直し,残りのダンピング力を改めてd’とすれば,式(48)の右辺は次のようになる.
【式50】
ここで,上式の第2項はコリオリ力によるもの,第3項は遠心力によるもの,第4項はダンピング力のみによるものである.式(50)を積分すると,
【式51】
となる.ここで上式の第2項と3項は相殺され,結局式(51)は次式になる.
【式52】
上式第1項は運動エネルギ,第2項は散逸エネルギ,第3項はポテンシャルエネルギであり,これは制御対象に蓄えられるエネルギと散逸するエネルギの総和である.式(48)の左辺の積分は,制御対象に加えられるエネルギの総和であるから,結局式(48)を積分したものがエネルギ保存則になっていることがわかる.
ここで式(52)の第1,3項の和をE1とする.外乱入力パワーの和の積分をE2とすると,式(48)において外乱入力項を右辺に移項して,左右辺を積分すれば,
【式53】
となる.ここで,対象が工学的に意味のあるシステムであれば外乱入力パワーは有界であるか
後の項は散逸エネルギで非負であり時間とともに単調増加する.よって,次式が導かれる.
【式54】
また工学的に意味のある評価関数なら,有界な状態変数に対してgは下限値を持つように選ばれているから,その有限評価区間の積分値も下限値cを持つ.
よって評価関数Jは次式を満たし最小値を持つ.
【式55】
【特許文献1】特願2005−175656システムの最適制御方法
【非特許文献3】藤本健治,ハミルトニアンシステムの制御,計測と制御Vol.39,No.2(2000),pp.99−104.
【発明を実施するための形態】
【0021】
以下に、本発明を実施するための最良の形態を図面に基づいて説明する.
【0022】
図11にアクティブサスペンションの構造図を示す.アクチュエータは車輪1と車体2との間に設置された油圧シリンダ3とピストンロッド4とアキュームレータ5で構成されている.センサは,上下Gセンサ6,7とストロークセンサ8とサスペンション伝達力センサ9で構成され,これらの信号により制御回路10により制御信号を発生させている.
双方向ポンプ11は誘導モータ12で回される.誘導モータ12が右回転する場合はポンプ11からシリンダ3の上室に作動油が送られ、左回転する場合は下室に作動油が送られる.誘導モータはインバータ13の3相出力で駆動され,この3相出力は制御指令値によって制御される.バッテリーもしくはキャパシタ15とインバータ13の間には可逆チョッパ回路14が設けられモータ駆動時にはバッテリー電圧を昇圧し,充電時にはモータからの電圧を調整しモータ電圧がバッテリー電圧を下回っても回生可能にする.
他の車輪も同様の構成である.
【0023】
次に、制御回路10について説明する.図12はセンサと制御回路10のブロック線図を示す.ばね上上下Gセンサ6、ばね下上下Gセンサ7、サスペンション伝達力センサ9、サスペンション変位センサ8からの信号が、制御回路10に伝送される.ばね上速度
【式56】
【0024】
制御則演算部20は、モータ制御部と回生制御部からなる.モータ制御部は上記ばね上速度
じてモータの電流を変えれば、制御指令値に応じて力を発生させる制御系が実現できる.回生
uoptとからモータ駆動時か回生時かを判断し、モータ駆動時にはバッテリー電圧を昇圧し,回生時にはモータ電圧を昇圧する指令値ueを出力する.
【産業上の利用可能性】
【0025】
本手法は、非ホロノミック拘束を含む非線形制御系の適用が可能であり、しかもシステムのエネルギ収支式から、微分方程式を解かずに最適制御則を得ることができるため有用性は高いものと考えられる.
【図面の簡単な説明】
【0026】
【図1】 車両のアクティブサスペンションの1輪モデル図である.
【図2】 パラメータκの最適化の説明図である.
【図3】 アクティブサスペンションについて本発明の制御と従来の制御方法の性能比較図である.
【図4】 本発明と特許文献1との制御入力パワーの比較図である.
【図5】 転がるコインのモデル図である.
【図6】 パラメータκの最適化の説明図である.
【図7】 本発明の制御効果を説明する図である.
【図8】 本発明の制御効果を説明する図である.
【図9】 従来技術の制御効果を説明する図である.
【図10】 本発明と従来制御のロバスト性の比較図である。
【図11】 本発明のアクテイブサスペンションの構成図である.
【図12】 本発明のアクティブサスペンションのセンサと制御回路の構成図である.
【符号の説明】
【0027】
1 車輪(ばね下質量)
2 車体(ばね上質量)
3 油圧シリンダ
4 ピストンロッド
5 アキュームレータ
6 上下Gセンサ(ばね上用)
7 上下Gセンサ(ばね下用)
8 サスペンション変位センサ
9 サスペンション伝達力センサ
10 制御回路
11 双方向ポンプ
12 誘導モータ
13 インバータ
14 可変チョッパ回路
15 バッテリもしくはキャパシタ
20 制御則演算部
21 ばね上速度演算部
22 ばね下速度演算部
23 タイヤ変位演算部
【技術分野】
【0001】
本発明は、主として機械力学系システムの実時間最適制御方法に関する.線形、非線形、ホロノミック、非ホロノミック系を問わず広範囲のシステムに適用できる.
【背景技術】
【0002】
ポントリャーギンが随伴変数を導入して最適制御問題をハミルトン形式に書き換えて最大原理を見出したことは,その後の最適制御理論の発展に大きな影響を与えた.しかし,現在でも随伴変数と状態変数についての連立微分方程式を解かねばならない状況は変わらず,特に非線形システムの最適制御則を解析的に導くことは容易ではない.そのため様々な数値探索的方法や推論的手法が工夫されてはいる.しかし制御則が数値解の場合は、制御系設計者が得られた制御則を改善しようとしても、制御対象システムのパラメータとの対応関係がわからず試行錯誤的にならざるを得ない.このような状況から脱却するためには見通しの良い解析的手法が必要である.
【発明が解決しようとする課題】
【0003】
このような背景から,本考案では,従来とは異なる手法で主として機械力学系システムの非線形系を含む比較的広範囲の最適制御問題に対して制御則を解析的に導く手法を提示する.制御対象のエネルギ収支に着目した受動性の概念によりシステムを漸近安定させる制御則が簡単に導かれるように(例えば非特許文献1参照),本考案でも制御対象のエネルギ収支に着目する.入力に関する評価関数を制御装置から制御対象に伝達されるエネルギとし,これに制御性能を表現する関数を加えて全体の評価関数とする.さらに付帯条件として制御対象の完全なエネルギ収支の式を加えて汎関数とする.こうすると汎関数は制御変数に関して1次式となるので,制御対象が線形,非線形を問わず汎関数を最小化する条件から微分方程式を解かずに最適制御則を解析的に導くことができる.
この汎関数を最小化する条件は,最適制御であるための必要条件であり,しかも未定定数を含む弱い条件であるが,制御対象の構造的性質をうまく活用することにより有益な制御則が得られる.後の事例によりその有用性を示す.
【0004】
最適制御問題を定式化する.まず制御対象の特性表現について述べる.制御理論では制御対象の特性を運動方程式で記述するが,ここでは制御対象の全入出力パワーの収支の式を用いる具体的には,システムの各自由度毎の運動方程式をベクトル表示しこれに速度ベクトルを乗じたものである.入力パワーは制御入力だけでなく外乱入力も含まれ,また制御対象は受動要素だけとは限らないため,内部にエネルギ源がありこれが運動に影響を与えていれば外乱入力として扱う.
【式1】
ここで,d,e,q,u,v,z ∈Rn ,M ∈Rn×n は正定対称な慣性マトリクス,nは制御対象の自由度である.qは一般化座標,uは制御入力,vは力入力の外乱,zは変位入力の外乱である.dはコリオリ力や遠心力やダンピング力など,eはポテンシャル力である.
制御対象が非線形であっても制御装置を合理的に設計すれば,式(1)のようにuを直接Mに作用させることができる.本論文では,このような合理的に設計された機械力学系システムを想定して最適制御則を導く.
上記のシステムに対し,次の評価関数を考える.
【式2】
置が御対象に加えるパワーである.rは重み係数である.
式(2)を最小化する制御u(t)を求めることが最適制御の課題である.
【非特許文献1】有本卓,新版ロボットの力学と制御,(2002),PP.68−69.朝倉書店.
【課題を解決するための手段】
【0005】
従来の最適制御理論では,随伴変数を導入して微分方程式を導きこれに元の状態方程式を連立させて解くことになるが,本論文ではこのような方法とは全く異なる手法を示す.最適制御の必要条件を求めるため次のスカラー関数Lを定義する.
【式3】
ここで,κは未定定数である.右辺の{}内は,式(1)の左辺と同じで制御対象の全パワー収支であるからエネルギ保存則を満たし常にゼロである.従って式(3)で表されるLの積分を最小化する条件は,式(2)も最小化する.
従って関数Lにqを変数とする変分原理を適用した次式はuが最適制御であるための必要条件を与える.Lはuに関して1次式であるから,∂L/∂uは意味がなく次式に制御に関するすべての情報が含まれる.
【式4】
Lにはqの2階の導関数が含まれるため一般的なオイラーの方程式に第3項が追加されている(例えば非特許文献2参照).
式(4)を積分し積分定数をゼロとすると次式になる.
【式5】
式(3)を式(5)に代入し左辺第1〜3項の順に記すと次のようになる.
【式6】
上式から制御則が次のように求まる.
【式7】
このように,本手法はJを最小化するqとuの関係を直接導くことができるため,従来のように2点境界値問題を最適性の原理を用いて解くプロセスが不要になる.κは未定定数であるが,κ=0の時はuが制御の評価関数のパラメータのみで定まり,κ=∞の時はuが制御対象のパラメータのみで定まることからuが最適であるためにはκはゼロでない有限値でなければならないことは明らかである.
上式の第1行は外力vと慣性のq依存性に対する制御,第2行はコリオリ力や遠心力やダンピング力に対する制御,第3行はポテンシャル力とそのq依存性および外力zに対する制御,第4行は評価関数を低減させる制御でありそれぞれ意味が明確である.式(7)には未実行の微積分項が含まれているが,全ての外力と状態量の検出あるいは推定が可能とすればこれらの実時間での実行は可能である.式(5)において積分定数をゼロとしたが,上記の結果より積分定数は制御則に一定のバイアスを与えることになるためゼロとすることが妥当であることがわかる.式(7)中の積分も同様である.
式(7)ではアクチュエータの数と系の自由度が同じであることを想定しているが,アクチュエータの数が少ない場合には次のような処置が必要になる.例えばアクチュエータが二つの独立な慣性Mi,Mi+1の間に置かれるような場合は,制御ベクトルuにその拘束条件を含めておき最適制御則は二つの制御則を重みを付けて加算したものにする.
【式8】
ここでui,ui+1はそれぞれが独立な制御として導いた場合の最適制御則であり,ρi,ρi+1は重み係数である.これらの重み係数や未定定数κの決定法については,次の具体例で示す.
【非特許文献2】L.E.エルスゴルツ,瀬川富士訳,科学者・技術者のための変分法,(1972),pp.34−37.ブレイン図書出版.
【発明の効果】
【0006】
ここでは,従来の最適制御理論では解析解を得ることができない問題に本手法を適用しその有効性を明らかにする.最初は評価関数が2次形式にならないアクティブサスペンションのエネルギ回生制御を扱い,次に未だに最適制御則の導出が困難とされている非ホロノミック系の制御への適用を試みる.
【0007】
まず、アクティブサスペンションのエネルギ回生制御への適用について具体的な定式化を行う.特許文献1では、図1に示すようなアクティブサスペンションのモデルを用いてエネルギ回生制御を考案し,近似解法により準最適制御則u*optを導いている.この事例では結果的に入力に関する評価関数が本論文の手法と同じく制御装置から制御対象に伝達されるエネルギ収支式となっているが,当時はまだ制御対象のエネルギ収支に着目した最適制御という認識はなく,従来の制御理論では解析的に解けないケースとして近似解法を試みたものであり,近似解法ながらほぼ最適制御であることを立証している.本考案では解析的に導いた最適制御則uoptが簡潔な表現ながらこの近似解u*optと同等の性能であることを確認する.
まず特許文献1の評価関数を変数qを用いて記述する.
【式9】
ここで,r1,rは重み係数である.重みr1はばね下質量の制振が従来車両と同程度になるようにr1=5×10−3 とし,rについては振動の評価とエネルギの評価が同程度の値になるようにr=10−5とした.
【0008】
続いて制御則を導出する.まず図1のモデルから式(1)の各要素を求めると次のようになる.
【式10】
【式11】
【式12】
【式13】
【式14】
【式15】
式(10)〜(15)を式(3)に代入することでLが求まる.
【式16】
式(16)を式(5)に代入すると,
【式17】
より次式が得られる.
【式18】
これより次の制御則が得られる.
【式19】
同様にして,
【式20】
より次式が得られる.
【式21】
これより次の制御則が得られる.
【式22】
従って最終的な制御則は次の形になる.
【式23】
ρ1,ρ2はそれぞれの重み係数で,その和は次式とする.
【式24】
評価関数の重みを考慮したM1,M2へのu1,u2の感度を等しいと考えると次のようになる.
【式25】
以上より最適制御則は次のように求まる.
【式26】
ここで,ρ1=2M1/(M1+r1M2),ρ2=2r1M2/(M1+r1M2)である.本手法から求まる必要条件はここまでであって,κの最適化は探索的に求める必要がある.
【0009】
MATLAB/SIMULINKによるランダム路面入力シミュレーションにより制御性能を評価する.以
一定でレベルは極良路(ISO/TC108/クラスA)を60Km/h程度での走行に相当するように設定した.シミュレーションは,10−4secの固定ステップで2sec間行った.
【0010】
上記シミュレーション条件において,Jを最小にするκ探索的に求めた結果を図2に示す.これより最適値は,κ=−3.6×10−7であることがわかる.
【0011】
シミュレーション結果を図3,4に示す.制御性能比較のため準最適制御以外にパッシブダン
した.パッシブダンパ制御は図1のパッシブダンパC2と同等の機能を制御で出すものである.スカイフックダンパ制御はばね下振動を押さえる機能がないためダンパが必要でありC2=1200Nsec/mとし,他はすべて C2=0とした.評価関数Jを振動に関する部分J1と制御入力エネルギに関する部分J2に分離すると次のようになる.
【式27】
【式28】
図3は各制御についてJ1,J2の比較を行ったものである.J2についてはuoptとu*optは同等であるが,J1ではuoptの方が若干優れることがわかる.
図4は,本制御と準最適制御について制御対象に伝達されるパワーのシミュレーション結果を示す.ともに大半の時間帯で伝達パワーは負の値を示しており,エネルギ回生を効果的に行っていることがわかる.
以上により,本制御則の式(26)は近似解法による準最適制御則(特許文献1の式(20))と比べ簡潔でありながら同等以上の効果があることが確認できた.
【0012】
次に非ホロノミック系システムの最適制御に適用した例を示す.近年,非ホロノミックな拘束をもつ非線形系のシステムへの関心が高まり各種の制御が研究されている.ここでは非特許文献3において解説されている転がるコインの制御を例題にとり,本手法により導いた最適制御則の検討を行う.
【0013】
転がるコインのモデルを図5に示す.平面上に直行座標x−yを取り,コインの転がっていく方向の角度をq1,平面上の位置を(q2,q3),コインの転がり角度をq4とする.q1,q4を増やす方向のトルクをu1,u2とする.さらにコインの半径や慣性モーメントを1とし質量はゼロとする.
まず図5のモデルから式(1)の各要素を求めると次のようになる.
【式29】
【式30】
【式31】
【式32】
さらに非ホロノミックな拘束条件として次式が加わる.
【式33】
【式34】
このようにuがMを直接制御する系ならば,非ホロノミック系であっても本手法により最適制御則を解析的に導くことが出来ることを次に示す.
【0014】
転がるコインの制御について具体的な定式化を行う.制御の目的は任意の初期状態からq1,q2,q3をゼロにすることであるが,モデルから明らかなように,q1はu1を2回積分するだけで
でよい.
【式35】
u1は振動的にする必要があることが既に知られているため,k1=0.3,k2=1とした.この制御則ではq1の初期値が小さいと振動が小さすぎてq2,q3の制御に支障をきたすが,この場合は例えば事前にq1をある値に設定してから全体の制御を開始するといった二段搆えの制御を行えば問題は回避できる.q2,q3に影響を与えずにq1を事前にある値に設定することは容易であるためこの方式は許容できよう.あるいはq1の初期値にかかわらずq1について式(35)の制御則と同様な次のような位置制御をプログラムしておくといった方法でもよい.
【式36】
以上の事前検討を基にu2についての最適制御を考え,評価関数を次式とする.
【式37】
ここで,r2,r3,r4,r5 は重み係数である.上式右辺第1,2項はq2,q3をゼロに収束させるという制御目的を表す項で,その意味をわかりやすくするため積分した結果を表示している.第3項がコインの回転運動に対する減衰を評価する項であり,第4項が制御対象への入力エネルギの項である.
【0015】
続いて制御則を導出する.式(29)〜(34),(37)を用いてLを求める.ここでgは,式(37)右辺第1,2項を積分の形に戻した後に第1〜3項の被積分関数を加算したものに式(33)(34)の拘束条件を加味している.
上式右辺第1行がパワー収支式から得られる項であり,第2,3行が評価関数から得られる項である.このケースではパワー収支式から得られる情報が少ないので評価関数に必要十分な情報を盛り込みこれを補っている.ここで,留意しなければならないのは,モデルから運動方程
小化する条件の一部として既に式(39)に含まれているためさらに代入することはLに余計な拘束を強いることになる.
u2を最適にするための必要条件は次の方程式から求めることができる.
【式39】
式(38)を代入すると,
【式40】
となりこれより次の制御則が得られる.
【式41】
【0016】
式(35),(41)の制御則を用いてシミュレーションによる評価を行う.
まず,重み係数r2,r3,r4の選定を行う.図5のモデルからわかるようにq1を早めにゼロに収束させるとq3の調整が出来なくなる.従ってq3を収束させた後にq2を収束させることが望ましくこのためr2よりr3を大きく設定する.またコインの回転のオーバーシュートを抑えるためr4は大き目の値に設定する.以上よりr2=0.25,r3=2.5,r4=1.0とした.このケースでは入力エネルギは最終的にゼロになるため,r5の値はさほど重要ではない.他の重みとレベルを合わせて,r5=0.5とした.
シミュレーション結果を図6〜9に示す.まず,κの最適化を行う.κを変化させた場合の式(37)の値の変化を図6に示す.これよりκ=−0.1が最適値であることがわかる.以後この値を用いてシミュレーションを行う.
図7は[q1,q2,q3]の初期値を[1,1,−1]としてシミュレーションを行った結果である.q1の振動を利用してまずq3が収束し続いてq2がゆっくり収束している様子がわかる.
図8は,このときのq2,q3の軌跡を示す.q2は一度の速度切り替えで目標に収束しており良好な結果が得られた.
図5のモデルを漸近安定させる一例として非特許文献3において紹介されている制御則を用いて,図7と同一条件でシミュレーションした結果を図9に示す.特に収束性を良くする工夫はされてなく,漸近安定させる例として示されたものなので,本提案の結果との直接性能比較の対象ではないが,参考として掲示する.
【0017】
続いて、本制御はロバスト性能が優れていることを示す.再び図1のモデルを用いて従来の代表的な最適制御理論であるLQ制御と比較する.
【0018】
LQ制御則を求めるためには,図1のモデルを状態方程式で記述し直し,評価関数を2次形式にする必要がある.図1において,q0をx0とし,q1−q0をx1とし,q2−q0をx2とし,ばね下速度をx3とし,ばね上速度をx4とすると状態方程式は以下のようになる.
【式42】
評価関数を次のような2次形式とする.
【式43】
式(43)の被積分関数の第1項は式(27)の性能評価項と同一であるが,第2項は異なりuの2乗になっている.無限評価区間であるから,LQ制御則は次のリカッチ代数方程式の解から求まる.
【式44】
本手法とLQ制御とは制御入力の評価関数が異なるため,性能比較を行うには性能評価値J1の値を基準値にとりこの値が同じになるようにして比較する必要がある.J1の値が図3に示す本手法の値と同じになるように,r1q=1.5×10−9とし,A,B,Qに数値を入れると制御則は次のようになる.
【式45】
である.これを式(26)と同じ形式で記述し両者を数値で比較すると次のようになる.
【式46】
【式47】
【0019】
本制御とLQ制御についてロバスト性能を比較する.式(46),(47)を比較すると,LQ制御はq0とq1のゲインが大きいため信号ノイズに対するロバスト性の低下が懸念される.現実の制御では,路面入力q0は推定値を用いることになるため,ある程度の推定誤差は前提とせざるをえない.q0の推定誤差の影響についてのシミュレーション評価を行った.路面入力q0とは無相関で統計的特性が同じ信号をy0とし,推定誤差相当のランダムノイズをαy0とした.αをパラメータとしたシミュレーション結果を図10に示す.色塗りで示した本手法のプロットはq0の推定誤差による影響をほとんど受けずロバスト性が高いことがわかる.評価値Jは本手法が,評価値JLQではLQ制御が優れるのは当然であるが,αが0.2以上では評価値JLQにおいても本制御がLQ制御より優れることがわかる.従って従って,本手法は外乱入力の推定誤差に対するロバスト性が優れるといえる.
【0020】
以上が今回の提案内容であるが、一般論としては式(2)が必ず最小値を持つことを証明しておく必要があるため、以下で確認する.
式(1)はパワー収支式であるが,変位入力の外乱によるパワーが陽に表されていない.これを明示し入力側を左辺に蓄積・散逸側を右辺に書き直せば,次式のようになる.
【式48】
ここで,fは変位入力外乱zに抗する制御対象側の反力,Uはポテンシャルエネルギである.式(1)との対応より次式の成立は明らかである.
【式49】
動方程式の記述を用いて書き直し,残りのダンピング力を改めてd’とすれば,式(48)の右辺は次のようになる.
【式50】
ここで,上式の第2項はコリオリ力によるもの,第3項は遠心力によるもの,第4項はダンピング力のみによるものである.式(50)を積分すると,
【式51】
となる.ここで上式の第2項と3項は相殺され,結局式(51)は次式になる.
【式52】
上式第1項は運動エネルギ,第2項は散逸エネルギ,第3項はポテンシャルエネルギであり,これは制御対象に蓄えられるエネルギと散逸するエネルギの総和である.式(48)の左辺の積分は,制御対象に加えられるエネルギの総和であるから,結局式(48)を積分したものがエネルギ保存則になっていることがわかる.
ここで式(52)の第1,3項の和をE1とする.外乱入力パワーの和の積分をE2とすると,式(48)において外乱入力項を右辺に移項して,左右辺を積分すれば,
【式53】
となる.ここで,対象が工学的に意味のあるシステムであれば外乱入力パワーは有界であるか
後の項は散逸エネルギで非負であり時間とともに単調増加する.よって,次式が導かれる.
【式54】
また工学的に意味のある評価関数なら,有界な状態変数に対してgは下限値を持つように選ばれているから,その有限評価区間の積分値も下限値cを持つ.
よって評価関数Jは次式を満たし最小値を持つ.
【式55】
【特許文献1】特願2005−175656システムの最適制御方法
【非特許文献3】藤本健治,ハミルトニアンシステムの制御,計測と制御Vol.39,No.2(2000),pp.99−104.
【発明を実施するための形態】
【0021】
以下に、本発明を実施するための最良の形態を図面に基づいて説明する.
【0022】
図11にアクティブサスペンションの構造図を示す.アクチュエータは車輪1と車体2との間に設置された油圧シリンダ3とピストンロッド4とアキュームレータ5で構成されている.センサは,上下Gセンサ6,7とストロークセンサ8とサスペンション伝達力センサ9で構成され,これらの信号により制御回路10により制御信号を発生させている.
双方向ポンプ11は誘導モータ12で回される.誘導モータ12が右回転する場合はポンプ11からシリンダ3の上室に作動油が送られ、左回転する場合は下室に作動油が送られる.誘導モータはインバータ13の3相出力で駆動され,この3相出力は制御指令値によって制御される.バッテリーもしくはキャパシタ15とインバータ13の間には可逆チョッパ回路14が設けられモータ駆動時にはバッテリー電圧を昇圧し,充電時にはモータからの電圧を調整しモータ電圧がバッテリー電圧を下回っても回生可能にする.
他の車輪も同様の構成である.
【0023】
次に、制御回路10について説明する.図12はセンサと制御回路10のブロック線図を示す.ばね上上下Gセンサ6、ばね下上下Gセンサ7、サスペンション伝達力センサ9、サスペンション変位センサ8からの信号が、制御回路10に伝送される.ばね上速度
【式56】
【0024】
制御則演算部20は、モータ制御部と回生制御部からなる.モータ制御部は上記ばね上速度
じてモータの電流を変えれば、制御指令値に応じて力を発生させる制御系が実現できる.回生
uoptとからモータ駆動時か回生時かを判断し、モータ駆動時にはバッテリー電圧を昇圧し,回生時にはモータ電圧を昇圧する指令値ueを出力する.
【産業上の利用可能性】
【0025】
本手法は、非ホロノミック拘束を含む非線形制御系の適用が可能であり、しかもシステムのエネルギ収支式から、微分方程式を解かずに最適制御則を得ることができるため有用性は高いものと考えられる.
【図面の簡単な説明】
【0026】
【図1】 車両のアクティブサスペンションの1輪モデル図である.
【図2】 パラメータκの最適化の説明図である.
【図3】 アクティブサスペンションについて本発明の制御と従来の制御方法の性能比較図である.
【図4】 本発明と特許文献1との制御入力パワーの比較図である.
【図5】 転がるコインのモデル図である.
【図6】 パラメータκの最適化の説明図である.
【図7】 本発明の制御効果を説明する図である.
【図8】 本発明の制御効果を説明する図である.
【図9】 従来技術の制御効果を説明する図である.
【図10】 本発明と従来制御のロバスト性の比較図である。
【図11】 本発明のアクテイブサスペンションの構成図である.
【図12】 本発明のアクティブサスペンションのセンサと制御回路の構成図である.
【符号の説明】
【0027】
1 車輪(ばね下質量)
2 車体(ばね上質量)
3 油圧シリンダ
4 ピストンロッド
5 アキュームレータ
6 上下Gセンサ(ばね上用)
7 上下Gセンサ(ばね下用)
8 サスペンション変位センサ
9 サスペンション伝達力センサ
10 制御回路
11 双方向ポンプ
12 誘導モータ
13 インバータ
14 可変チョッパ回路
15 バッテリもしくはキャパシタ
20 制御則演算部
21 ばね上速度演算部
22 ばね下速度演算部
23 タイヤ変位演算部
【特許請求の範囲】
【請求項1】
制御対象の全入出力パワーの収支の式が次式で近似される制御システムにおいて,
(ここで,d,e,q,u,v,z∈Rn,M∈Rn×nは正定対称な慣性マトリクス,nは制御対象の自由度である.qは一般化座標,uは制御入力,vは力入力の外乱,zは変位入力の外乱である.zはばねを介して慣性に作用するものとする.dはコリオリ力や遠心力やダンピング力など,eはポテンシャル力である.また制御対象は受動要素だけとは限らないため,内部にエネルギ源がありこれが運動に影響を与えていれば外乱入力として扱う.制御アクチュエータの数が制御対象の自由度nより少ない場合は、欠落したアクチュエータに対応するベクトルuの要素をゼロとする.また一つのアクチュエータが複数の慣性に作用する場合には、対応するベクトルuの要素にその条件を含めておく.変数qやzの上に付された記号“・”とその数は時間微分とその回数を表す.)次式であらわされる評価関数を最小にする制御方法.
ここで、gは制御対象の制御性能を表す関数、rは重み係数である.
【請求項2】
請求項1の制御システムにおいて、次のスカラー関数Lを定義し、
(ここで、κは定数である.)
制御則uは次式から導かれた関係式を含むことを特徴とする制御方法.
【請求項3】
請求項1において、制御則uが次式の各項の一部あるいは全部を含む制御方法.
(ここで、κは定数である.)
【請求項1】
制御対象の全入出力パワーの収支の式が次式で近似される制御システムにおいて,
(ここで,d,e,q,u,v,z∈Rn,M∈Rn×nは正定対称な慣性マトリクス,nは制御対象の自由度である.qは一般化座標,uは制御入力,vは力入力の外乱,zは変位入力の外乱である.zはばねを介して慣性に作用するものとする.dはコリオリ力や遠心力やダンピング力など,eはポテンシャル力である.また制御対象は受動要素だけとは限らないため,内部にエネルギ源がありこれが運動に影響を与えていれば外乱入力として扱う.制御アクチュエータの数が制御対象の自由度nより少ない場合は、欠落したアクチュエータに対応するベクトルuの要素をゼロとする.また一つのアクチュエータが複数の慣性に作用する場合には、対応するベクトルuの要素にその条件を含めておく.変数qやzの上に付された記号“・”とその数は時間微分とその回数を表す.)次式であらわされる評価関数を最小にする制御方法.
ここで、gは制御対象の制御性能を表す関数、rは重み係数である.
【請求項2】
請求項1の制御システムにおいて、次のスカラー関数Lを定義し、
(ここで、κは定数である.)
制御則uは次式から導かれた関係式を含むことを特徴とする制御方法.
【請求項3】
請求項1において、制御則uが次式の各項の一部あるいは全部を含む制御方法.
(ここで、κは定数である.)
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【公開番号】特開2007−233985(P2007−233985A)
【公開日】平成19年9月13日(2007.9.13)
【国際特許分類】
【出願番号】特願2006−92243(P2006−92243)
【出願日】平成18年3月2日(2006.3.2)
【出願人】(504088968)
【Fターム(参考)】
【公開日】平成19年9月13日(2007.9.13)
【国際特許分類】
【出願日】平成18年3月2日(2006.3.2)
【出願人】(504088968)
【Fターム(参考)】
[ Back to top ]