説明

行動経路探索装置及び方法並びにプログラム

【課題】リアルタイムで最適解を得ることができるとともに、教師データの影響を受けない最適解導出を実現する。
【解決手段】計算機が、複数の解候補を生成する解候補生成部11と、各解候補の適合評価を行う評価部12と、適合評価に基づいて解候補の選択を行う選択部13と、選択部13によって選択された解候補に遺伝的操作を行うことにより次世代の解候補を作成する遺伝的操作部14とを備え、解候補を構成する少なくとも1つの非終端記号には、動きを決定付けるパラメータが割り当てられている行動経路探索装置10を提供する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、遺伝的アルゴリズム(Genetic Algorithm、以下「GA」という。)を用いて行動経路を探索する行動経路探索装置及び方法並びにプログラムに関するものである。
【背景技術】
【0002】
GAは、生物の進化を模倣した確率的な最適化アルゴリズムである。以下、GAの概要について簡単に説明する。
まず、最適化問題の解候補を例えば、遺伝子の一次ストリングである染色体として表現し、様々な遺伝子をもつ解候補をランダムに選択して、初期世代の集団(母集団)を作成する。次に、各解候補の適合度(最適化問題での目的関数の値)を計算する。続いて、適合度に応じて複数の解候補を選択(複製選択)し、これらがもつ遺伝子の交叉(crossover;図5参照)、突然変異(mutation;図6参照)、逆位等の遺伝的操作を行うことにより、次世代の解候補の集団を作成する。このとき、解候補の選択では、環境(目的関数)への適合度が高い解候補ほど次の世代に高い確率で生き残るように選択される。そして、この世代交代を繰り返し行うことにより、適合度の低い遺伝子を持つ解候補は淘汰され、適合度の高い遺伝子を持つ解候補が生き残り、最終的に目的関数をより最適化する解を得ることができる。
【非特許文献1】伊庭斉志、「進化論的計算の方法」、東京大学出版会、1999年
【発明の開示】
【発明が解決しようとする課題】
【0003】
ところで、上述したようなGAを実際の最適化問題に運用する場合、運用の前段階として、様々な入力を教師データとして与え、それらの問題に適切な出力をすることのできるアルゴリズムを生成させる必要がある。換言すると、アルゴリズム自体を最適化対象として最適化を行うことにより、最適アルゴリズムを得る。このとき、解候補を構成する非終端記号には、条件分岐や演算子が割り当てられる。このようにして得られた最適アルゴリズムは、その後の最適化問題の運用時に用いられる。
【0004】
上述のようにアルゴリズムを最適化対象として最適化を行った場合、教師データとして与えられる入力データに限りがあるため、運用時において教師データとかけ離れた入力データが入力された場合には、最適な解を得ることができないという問題があった。
また、実際の運用の前段階として、最適化アルゴリズムを生成するための計算処理を行う必要があるため、実際の運用までに時間を要するという問題があった。
【0005】
本発明は、上記問題を解決するためになされたもので、リアルタイムで最適解を得ることができるとともに、教師データの影響を受けない最適解導出を実現することが可能な行動経路探索装置及び方法並びにプログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
上記課題を解決するために、本発明は以下の手段を採用する。
本発明は、計算機を備え、遺伝的アルゴリズムを用いて最適な行動経路を探索する行動経路探索装置であって、前記計算機が、複数の解候補を生成する解候補生成部と、各前記解候補の適合評価を行う評価部と、前記適合評価に基づいて前記解候補の選択を行う選択部と、前記選択部によって選択された前記解候補に遺伝的操作を行うことにより次世代の解候補を作成する遺伝的操作部とを備え、前記解候補を構成する少なくとも1つの非終端記号には、動きを決定付けるパラメータが割り当てられている行動経路探索装置を提供する。
【0007】
本発明によれば、評価部により各解候補の適合評価が行われ、この適合評価に基づいて選択部により複数の解候補が選択、複製される。そして、選択、複製された解候補に対して、遺伝的操作部により交叉率、突然変異率、逆位率等の遺伝的操作が行われ、次世代における解候補の集団が生成される。そして、上記各部が順番に処理を遂行することにより解候補の世代交代が繰り返し行われ、最適な行動経路の探索が進められる。この場合において、解候補を構成する少なくとも1つの非終端記号には、動きを決定付けるパラメータが割り当てられているので、解候補として行動経路を直接的に導くことができ、最終的に得られた解候補をそのまま出力データとして出力することが可能となる。このように、解候補の構成を工夫することで、従来のように、運用時に先駆けて行われていた最適アルゴリズムの計算処理を省略することができ、リアルタイムで行動経路を求めることが可能となる。更に、教師データなどが不要となるため、如何なる入力データに対しても適切な行動経路を求めることが可能となる。
【0008】
上記行動経路探索装置において、前記動きを決定付けるパラメータは、例えば、変針または変速である。
また、上記行動経路探索装置において、前記解候補を構成する少なくとも1つの非終端記号には、初期位置を設定するためのプログラムが割り当てられていてもよい。
【0009】
本発明は、計算機により遺伝的アルゴリズムを用いて最適な行動経路を探索する行動経路探索方法であって、複数の解候補を生成する工程と、各前記解候補の適合評価を行う工程と、前記適合評価に基づいて前記解候補の選択を行う工程と、選択された前記解候補に遺伝的操作を行うことにより次世代の解候補を作成する工程とを含み、前記解候補を構成する少なくとも1つの非終端記号には、動きを決定付けるパラメータが割り当てられている行動経路探索方法を提供する。
【0010】
本発明は、遺伝的アルゴリズムを用いて最適な行動経路を探索するための処理をコンピュータに実行させるための行動経路探索プログラムであって、複数の解候補を生成する処理と、各前記解候補の適合評価を行う処理と、前記適合評価に基づいて前記解候補の選択を行う処理と、選択された前記解候補に遺伝的操作を行うことにより次世代の解候補を作成する処理とを含み、前記解候補を構成する少なくとも1つの非終端記号には、動きを決定付けるパラメータが割り当てられている行動経路探索プログラムを提供する。
【0011】
また、本発明の行動経路探索装置及び方法並びにプログラムは、様々な技術分野に適用可能なものである。一例としては、例えば、カーナビゲーションにおける最適経路の探索、航空機、ヘリコプター、船舶、潜水艦等の最適な航路の探索等が挙げられる。
【発明の効果】
【0012】
本発明によれば、リアルタイムで最適解を得ることができるとともに、教師データの影響を受けない最適解導出を実現することができるという効果を奏する。
【発明を実施するための最良の形態】
【0013】
以下に、本発明に係る行動経路探索装置及び方法並びにプログラムの一実施形態について、図面を参照して説明する。
図1は、本実施形態に係る行動経路探索装置の概略構成を示したブロック図である。
図1に示すように、本実施形態に係る行動経路探索装置10は、コンピュータシステム(計算機システム)であり、CPU(中央演算処理装置)1、RAM(Random Access
Memory)などの主記憶装置2、ROM(Read Only Memory)、HDD(Hard Disk
Drive)などの補助記憶装置3、キーボードやマウスなどの入力装置4、及びモニタやプリンタなどの出力装置5などを備えて構成されている。
補助記憶装置3には、各種プログラムが格納されており、CPU1が補助記憶装置3からRAMなどの主記憶装置2にプログラムを読み出し、実行することにより種々の処理を実現させる。
【0014】
図2は、行動経路探索装置10が備える機能を展開して示した機能ブロック図である。図2に示されるように、行動経路探索装置10は、複数の解候補をランダムに生成して母集団を作成する解候補生成部11と、解候補の適合評価を行う評価部12と、評価部12による適合評価に基づいて解候補の選択を行う選択部13と、選択部13によって選択された解候補に複製、交叉、突然変異、逆位等の遺伝的操作等のアルゴリズムを実行する遺伝操作部14と、最適解を決定し出力する最適解決定部15とを備えている。
行動経路探索装置10は、解候補の評価、選択、及び遺伝的操作を繰り返し行うことで、適合度の高い解候補の探索を行う。
【0015】
次に、上述した行動経路探索装置10が備える各部において実行される処理内容について図3を参照して説明する。なお、図2に示した各部により実現される後述の各種処理は、CPU1が補助記憶装置3に記憶されている行動経路探索プログラムを主記憶装置2に読み出して実行することにより実現されるものである。
また、本実施形態では、航空機の最適航路を探索する場合を例示して説明する。
【0016】
まず、入力データとして、初期位置、目標位置、経由すべき中継点、速力、風速、風向等が与えられると、解候補生成部11は、これらの入力データに基づいて複数の解候補をランダムに生成する(図3のステップSA1)。ここで、解候補生成部11によって生成される解候補の一例を図4に示す。図4に示されるように、解候補は、非終端記号と終端記号とで表される複数のノードによって構成されており、非終端記号の少なくとも1つには動きを決定付けるパラメータが割り当てられる。動きを決定付けるパラメータは、行動経路を探索する対象物、すなわち、本実施形態においては、航空機がどのような行動をとるかを決定付ける情報となる。例えば、図5に示されるように、変速、変針等が挙げられる。
【0017】
非終端記号には、少なくとも1つの子ノードが接続される。これらの子ノードには、当該非終端記号に割り当てられた動きを決定付けるパラメータに応じた数値が任意に割り当てられる。例えば、変速が割り当てられた非終端記号20aには、どのような変速を行うかを示す子ノード21a、21b、例えば、+1kt/sec、5分間等の数値が割り当てられた子ノードが接続される。これは、毎秒1ノットで5分間変速することを示している。また、変速が割り当てられた他の非終端記号20bには、例えば、0kt/sec、10分間等の数値が割り当てられた子ノード22a、22bが接続される。これは、速度を変えずに移動することを示している。
また、変針が割り当てられた非終端記号20cには、どのような変針を行うかを示す子ノード23a、23b、例えば、−1deg/sec、7分間等の数値が割り当てられた子ノードが接続される。これは、毎秒−1度で7分間針路を変化させることを示している。
【0018】
そして、上述したような構成を持つ複数の解候補が生成されると、これらの解候補は評価部12(図2参照)に与えられる。評価部12は、各解候補の適合度評価を行う(図3のステップSA2)。例えば、評価部12は、飛行時間、消費燃費等を評価パラメータとした評価関数を用いて各解候補の適合度評価を行う。
選択部13は、評価部12によって得られた適合度評価に基づいて解候補の選択・複製を行う(ステップSA3)。遺伝的操作部14は、選択部13により選択・複製された解候補に対して交叉、突然変異、逆位等の遺伝的操作を行う(ステップSA4)。そして、上記適合度評価、解候補の選択・複製、並びに遺伝的操作が順番に繰り返し実行されることにより、解候補の世代交代が行われ、好ましくない行動経路は淘汰され、より最適な経路が残される。なお、このような解候補の探索手法については、公知の技術を採用することが可能であり、その手法については特に限定されない。
【0019】
次に、上述した解候補の世代交代が所定回数行われることにより、終了条件を満たした場合には(ステップSA5において「YES」)、評価部12から解候補とその適合評価値が最適解決定部15に出力される。ここで、終了条件とは、例えば、世代交代が予め設定されている所定の世代に到達したか、または、いずれかの解候補の適合評価値が予め設定されている最終適合評価値に到達したか、または、処理開始からの経過時間が所定の時間に達したか等である。
【0020】
最適解決定部15は、評価部12から取得した解候補の中から最高の適合評価値を持つ解候補を最適解として定め、この最適解を出力データとして出力し(ステップSA6)、当該処理を終了する。
【0021】
以上、説明してきたように、本実施形態に係る行動経路探索装置及び方法並びにプログラムによれば、解候補を構成する少なくとも1つの非終端記号には、動きを決定付けるパラメータが割り当てられているので、解候補として行動経路を直接的に導くことができ、最終的に得られた解候補をそのまま出力データとして出力することが可能となる。
このように、解候補の構成を工夫することで、従来のように、運用時に先駆けて行われていた最適アルゴリズムの計算処理を省略することができ、リアルタイムで行動経路を求めることが可能となる。更に、教師データなどが不要となるため、如何なる入力データに対しても適切な行動経路を求めることが可能となる。
【0022】
なお、上述した実施形態では、航空機の最適航路を探索する場合について例示して説明したが、本発明の行動経路探索装置及び方法並びにプログラムは、様々な分野において適用が可能であることはいうまでもない。この場合、各適用に応じて入力情報、評価関数等が与えられる。例えば、カーナビゲーションシステム等の車両の最適経路を探索する場合には、入力データとして、現在地、目的地等が与えられ、また、到達時間、消費燃費等を評価パラメータとした評価関数が与えられる。また、車両の場合には、航空機や船舶等と異なり、道がないところを走行できないという制約があるため、動きを決定付けるパラメータとしては、交差点では、右折、左折、直進する等、車両独特のパラメータを用いることとなる。このように、動きを決定付けるパラメータは、対象物に応じて決められる。
また、図4に例示した解候補の構成において、初期位置を設定するためのプログラムが割り当てられた非終端記号を更に付加してもよい。このように初期位置を設定するためのプログラムを付加することで、初期位置が不明である場合でも適用することが可能となる。
【0023】
以上、本発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、本発明の要旨を逸脱しない範囲の設計変更等も含まれる。
【図面の簡単な説明】
【0024】
【図1】本発明の一実施形態に係る行動経路探索装置の概略構成を示したブロック図である。
【図2】本発明の一実施形態に係る行動経路探索装置が備える機能を展開して示した機能ブロック図である。
【図3】本発明の一実施形態に係る行動経路探索装置によって実行される処理の手順を示したフローチャートである。
【図4】解候補の一構成例を示した図である。
【図5】交叉について説明するための図である。
【図6】突然変異について説明するための図である。
【符号の説明】
【0025】
1 CPU
2 主記憶装置
3 補助記憶装置
4 入力装置
5 出力装置
10 行動経路探索装置
11 解候補生成部
12 評価部
13 選択部
14 遺伝的操作部
15 最適解決定部

【特許請求の範囲】
【請求項1】
計算機を備え、遺伝的アルゴリズムを用いて最適な行動経路を探索する行動経路探索装置であって、
前記計算機が、
複数の解候補を生成する解候補生成部と、
各前記解候補の適合評価を行う評価部と、
前記適合評価に基づいて前記解候補の選択を行う選択部と、
前記選択部によって選択された前記解候補に遺伝的操作を行うことにより次世代の解候補を作成する遺伝的操作部と
を備え、
前記解候補を構成する少なくとも1つの非終端記号には、動きを決定付けるパラメータが割り当てられている行動経路探索装置。
【請求項2】
前記動きを決定付けるパラメータが、変針または変速である請求項1に記載の行動経路探索装置。
【請求項3】
前記解候補を構成する少なくとも1つの非終端記号には、初期位置を設定するためのプログラムが割り当てられている請求項1または請求項2に記載の行動経路探索装置。
【請求項4】
計算機により遺伝的アルゴリズムを用いて最適な行動経路を探索する行動経路探索方法であって、
複数の解候補を生成する工程と、
各前記解候補の適合評価を行う工程と、
前記適合評価に基づいて前記解候補の選択を行う工程と、
選択された前記解候補に遺伝的操作を行うことにより次世代の解候補を作成する工程と
を含み、
前記解候補を構成する少なくとも1つの非終端記号には、動きを決定付けるパラメータが割り当てられている行動経路探索方法。
【請求項5】
遺伝的アルゴリズムを用いて最適な行動経路を探索するための処理をコンピュータに実行させるための行動経路探索プログラムであって、
複数の解候補を生成する処理と、
各前記解候補の適合評価を行う処理と、
前記適合評価に基づいて前記解候補の選択を行う処理と、
選択された前記解候補に遺伝的操作を行うことにより次世代の解候補を作成する処理と
を含み、
前記解候補を構成する少なくとも1つの非終端記号には、動きを決定付けるパラメータが割り当てられている行動経路探索プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2009−69867(P2009−69867A)
【公開日】平成21年4月2日(2009.4.2)
【国際特許分類】
【出願番号】特願2007−234137(P2007−234137)
【出願日】平成19年9月10日(2007.9.10)
【出願人】(000006208)三菱重工業株式会社 (10,378)