進化アルゴリズムと模倣学習に基づくロボットの動作制御方法

【課題】ロボットが人間の動作を学習できる進化アルゴリズムに基盤したロボットの動作制御方法を提供する。
【解決手段】本発明は進化アルゴリズムを利用したロボットの動作制御方法に関するものである。本発明は人間の動作パターンを収集してデータベースを構築する段階と、主成分分析及び逆動力学基盤の補間法を利用した遺伝演算子を利用して前記データベースを進化させる段階と、前記進化したデータベースを利用してリアルタイムでロボットの動作を生成する段階を含むロボットの動作制御方法を提供する。
本発明によると進化したデータベースを利用してロボットが人間の運動を学習し、最適化した動作をリアルタイムで制御することができる。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明はロボットの動作制御方法に関し、特に、進化アルゴリズムを利用してロボットに人間の動作を学習させた後、リアルタイムでロボットの動作を制御する方法に関するものである。
【背景技術】
【０００２】
最近の人間型ロボットは機構的構造や外形だけでなく、歩くことや走ることなどのような動作制御能力においても人間に近くなっている。それはロボットに人間の動作と類似な動作を行うようにする試みが続いているためである。
【０００３】
例えば、人間の動作をデータベースに貯蔵し、貯蔵された動作をロボットが再現することによって人間の動作を模倣させることもできる。しかし、ロボットが必要とする幾多の動作を全て予め記録して蓄積し、これを活用するということは物理的に不可能である。
【０００４】
一方、モーションキャプチャー（motion capture）システムを利用することによってロボットに人間の動作を模倣して再現させる場合、キャプチャーされた人間の動作パターンをそのままロボットに適用するとロボットが人間のような自然な動作をすることもできる。しかし、質量、質量中心または慣性質量のような物性値が人間とロボットは互いに異なるためにキャプチャーされた動作がロボットに最適化されたということではない。
【発明の開示】
【発明が解決しようとする課題】
【０００５】
このような問題を解決するために本発明は、ロボットが人間の動作を学習できる進化アルゴリズムに基づいたロボットの動作制御方法を提供する。
【課題を解決するための手段】
【０００６】
本発明の特徴によるロボットの動作制御方法は、（ａ）人間の動作パターンを収集してデータベースを構築する段階;（ｂ）主成分分析及び逆動力学に基づいた補間法を適用した遺伝演算子を利用して前記データベースを進化させる段階;及び（ｃ）前記進化したデータベースを利用してリアルタイムでロボットの動作を生成する段階を含むことができる。
【０００７】
前記（ａ）段階は人間の動作をモーションキャプチャーする段階を含むことができる。
【０００８】
また、前記（ｂ）段階は、（ｂ−１）ロボットが行う任意の動作と類似な動作状態を有する基本動作を前記データベースから１つ以上選択する段階;及び（ｂ−２）主成分分析による主成分抽出及び前記主成分の結合を通じて最適動作を新たに生成することによって、前記選択された基本動作を再加工する段階を含むことができる。
【０００９】
前記（ｂ）段階は、前記（ｂ−１）段階と前記（ｂ−２）段階を繰り返して行って前記データベースを進化させる段階を含むことができる。
【００１０】
前記（ｂ−１）段階で、前記任意の動作は次の式（１１）で示すことができる。
【数１】

ここで、
【数２】

は前記任意の動作の関節角軌跡、
【数３】

は前記選択された基本動作の平均関節角軌跡、
【数４】

は前記選択された基本動作の関節角軌跡の中でｉ番目主成分軌跡、
【数５】

はスカラー係数である。
【００１１】
前記任意の動作の動作状態は次の式（１２）で示す境界条件を満足することができる。
【数６】

ここで、
【数７】

は開始時間
【数８】

における関節角、
【数９】

は開始時間
【数１０】

における関節角速度、
【数１１】

は終了時間
【数１２】

における関節角、
【数１３】

は終了時間
【数１４】

における関節角速度である。
【００１２】
前記（ｂ−２）段階で、前記選択された基本動作が１つ以上の関節角軌跡を含む時、前記関節角軌跡の平均軌跡
【数１５】

を次の式（１３）によって計算する。
【数１６】

ここで、ｋは選択された基本動作の数であり、
【数１７】

はｉ番目基本動作の関節角軌跡である。
【００１３】
また、次の式（１４）によって共分散行列（Ｓ）を計算し、
【数１８】

前記共分散行列から固有ベクターを得て、前記固有ベクターの中で前記関節角軌跡の主成分軌跡を得ることができる。
【００１４】
前記（ｂ−２）段階で、次の式（１５）を通じて前記選択された基本動作の関節トルク
【数１９】

を決める。
【数２０】

ここで、
【数２１】

は前記選択された基本動作の関節角、
【数２２】

は前記選択された基本動作の関節角速度、
【数２３】

は前記選択された基本動作の関節角加速度、
【数２４】

は質量マトリックス、
【数２５】

はコリオリベクターである。
【００１５】
また、
【数２６】

は重力及びその他の力を含む。
【００１６】
前記決められた関節トルクが次の式（１６）を最小にすると、前記選択された基本動作を前記最適動作に決めることができる。
【数２７】

前記（ｃ）段階は主成分分析及び機構学的補間による動作の再結合方法を利用することができる。
【００１７】
また、前記（ｃ）段階は、（ｃ−１）ロボットが生成する動作と類似な動作状態を有する基本動作を前記進化したデータベースから１つ以上選択する段階;及び（ｃ−２）主成分分析による主成分抽出及び前記主成分の結合を通じて最適動作を新たに生成することによって、前記選択された基本動作を再加工する段階を含むことができる。
【００１８】
前記（ｃ−１）段階で、前記ロボットが生成する動作は次の式（１７）で示すことができる。
【数２８】

ここで、
【数２９】

は前記ロボットが生成する動作の関節角軌跡、
【数３０】

は前記選択された基本動作の平均関節角軌跡、
【数３１】

は前記選択された基本動作の関節角軌跡の中でｉ番目主成分軌跡、
【数３２】

はスカラー係数である。
【００１９】
前記ロボットが生成する動作の動作状態は次の式（１８）で示す境界条件を満足することができる。
【数３３】

ここで、
【数３４】

は開始時間
【数３５】

における関節角、
【数３６】

は開始時間
【数３７】

における関節角速度、
【数３８】

は終了時間
【数３９】

における関節角、
【数４０】

は終了時間
【数４１】

における関節角速度である。
【００２０】
前記（ｃ−２）段階で、前記選択された基本動作が１つ以上の関節角軌跡を含む時、前記関節角軌跡の平均軌跡
【数４２】

を次の式（１９）によって計算する。
【数４３】

ここで、ｋは選択された基本動作の数であり、
【数４４】

はｉ番目基本動作の関節角軌跡である。
【００２１】
さらに次の式（２０）を通じて共分散行列（Ｓ）を計算する。
【数４５】

次に、前記共分散行列から固有ベクターを得て、前記固有ベクターの中で前記関節角軌跡の主成分軌跡を得ることができる。
【００２２】
本発明によると、人間の基本動作をロボットの特性に合わせて進化させることによってロボットに最適化した動作を行うようにすることができる。
【００２３】
また、本発明によると、進化した基本動作データベースに基づいてロボットがリアルタイムで動作を生成することができる。
【００２４】
また、本発明によると、モーションキャプチャーデータのみあればこれを容易にロボットに適用することができるので、ロボットが人間の多様な動作を模倣及び再現することができる。
【発明を実施するための最良の形態】
【００２５】
以下、添付した図面を参照して本発明の実施例について本発明が属する技術分野における通常の知識を有する者が容易に実施できるように詳しく説明する。しかし、本発明は多用で相異なる形態で実現することができ、ここで説明する実施例に限られない。さらに、図面で本発明を明確に説明するために説明と関係ない部分は省略し、明細書全体にわたって類似の部分については類似の図面符号を付けた。
【００２６】
ロボットの動作は作業（task）と状態（condition）からなる。例えば、手をテーブル上のカップへ持っていく動作があるとすると、手をカップに持っていくことがこの動作が属した作業であり、テーブル上のカップの位置がこの動作の状態である。しかし、すべての位置のカップに手を持っていく動作をいちいち蓄積しておいて、これを活用することは物理的に不可能である。
【００２７】
本発明の実施例では限定された数の動作のみを貯蔵し、１つ以上の関節角軌跡からなる動作を基本動作（movement primitive）と定義する。また、本発明の実施例では基本動作の補間（interpolation）を通じてカップの位置のような多様な動作状態に対するロボットの腕の動作を生成する。
【００２８】
１つの基本動作が進化アルゴリズムにおける１つの個体（individual）となる。例えば、１２０Ｈｚでサンプリングされた１２０秒長さを有する基本動作があるとすると、この個体の染色体形態（genotype）は１４４００行を有する実数ベクターである（１４４００=１２０秒×１２０Ｈｚ）。また、収集されて限定された数の基本動作が集団をなして両親個体として動作する。
【００２９】
図１は本発明の実施例による主成分分析基盤の遺伝演算子を示す図面である。
【００３０】
図１を参照すると、作業Ｔに属するｎ個の個体が両親個体をなしている。各個体をｍ_１からｍ_ｎと表示すると、各個体はそれぞれ自分の動作状態を有する。つまり、個体ｍ_ｉの動作状態はｃ_ｉと表示される。
【００３１】
もし、動作状態ｃ_３を有する動作が必要であれば、ｎ個の両親個体の中で動作状態ｃ_３と最も近い動作状態を有する個体をｋ個選択する。これは動作状態の類似性を比較する適切な尺度（distance metric）を導入して解決することができる。
【００３２】
例えば、カップが特定の位置に置かれている場合、この特定の位置へ手を持っていく腕の動作が必要である。この場合、カップの３次元位置ベクターを動作状態ｃ_３に定義することができ、動作状態の類似性を比較するために、次の式（２１）の形態で距離尺度を使用する。
【数４６】

このように選ばれたｋ個の動作個体を
【数４７】

と表示する。１つの動作個体はいくつかの関節角からなる。例えば、７自由度を有するマニピュレータの動作を記述すると動作個体１つは７個の関節角軌跡で構成される。
【００３３】
ｋ個の動作個体
【数４８】

から得られた最初（又は初期）自由度の関節角軌跡をそれぞれ
【数４９】

と表示する。この場合、次の式（２２）を通じて平均軌跡ｑ_ｍｅａｎを得ることができる。
【数５０】

一方、次の式（２３）を通じて共分散行列Ｓが得られる。
【数５１】

共分散行列Ｓから得られた固有ベクターと固有値をそれぞれ
【数５２】

と
【数５３】

と表示する。ここで、固有値は
【数５４】

と整列された。
【００３４】
固有ベクター
【数５５】

を主成分とし、これら固有ベクターはそれぞれ関節角軌跡を示す。主成分分析の特性に応じてｋ個の主成分の中で支配的ないくつかの主成分のみを有して全関節角軌跡の特性を知ることができる。それは主成分分析は高次元のデータを低次源の空間に投影させて次元を減らす機能をするためである。
【００３５】
結果的に、最初（初期）自由度の関節角
【数５６】

から平均軌跡ｑ_ｍｅａｎとｋ個の主成分軌跡
【数５７】

を得ることができる。一方、このような過程を第２、第３などの関節に対する軌跡に対しても同一に適用し、各関節に対して平均軌跡と主成分軌跡を得ることができる。
【００３６】
一方、任意のロボット動作は下記式（２４）のように平均軌跡と主成分軌跡の線状結合で示すことができる。
【数５８】

ここでｑ（ｔ）は関節角軌跡、ｑ_ｍｅａｎ（ｔ）は平均関節角軌跡、
【数５９】

はｉ番目主成分軌跡である。そしてｘ_ｉ（ｉ=１、２、３、４、５）はスカラー係数である。
【００３７】
一般に動作状態ｃ_３は開始時刻ｔ_０での関節角ｑ_０と関節角速度
【数６０】

、そして終了時刻ｔ_ｆでの関節角ｑ_ｆと関節角速度
【数６１】

で与えられる。
【００３８】
一方、未知数ｘ_ｉは５個であるので、４個の境界条件を満足する未知数５個を決めるために次の式（２５）、（２６）を通じて最適化過程を行う。
【数６２】

【数６３】

ここで、
【数６４】

は関節トルクである。この関節トルクは関節角ｑ、関節角速度
【数６５】

及び関節角加速度
【数６６】

が決められると前記式（２６）を通じて計算することができる。最小化しようとする目的関数である式（２５）は与えられた関節軌跡を動かす時、ロボットが必要とするトルクの合計である。
【００３９】
このような最適化過程を通じて最小のエネルギー（トルク）を必要としながら、与えられた動作状態ｃ_３を満足する動作個体、つまり、新たなｍ_３を生成することができる。この過程を‘逆動力学基盤の最適化を通じた動作の再結合（Reconstituting motion via dynamics−based optimization）’と言う。
【００４０】
新たに生成された子供個体ｍ_３は両親個体ｍ_３のような動作状態ｃ_３を持っている。しかし、子供個体ｍ_３は両親個体ｍ_３を含む複数固体の主成分を分解及び再結合して生成されたものであるので、両親個体のような動作軌跡を有しない。したがって、進化アルゴリズム内で２つの個体の優秀性を判断してさらに優れた個体が次代の両親集団に属する。このような過程がｃ_０からｃ_ｎまで適用されることによってｎ個の子供集団が生成される。
【００４１】
一方、両親集団に属するｍ_ｉと子供集団に属するｍ_ｉの中でさらに優れた動作個体を次代の両親集団に選定するために適合度関数（fitness function）が必要であるが、これは次の式（２７）で定義される。
【数６７】

つまり、２つの動作個体の中でトルク（エネルギー）を少なく消費するものが次代の両親個体となる。
【００４２】
式（２７）は式（２５）と同一である。つまり、遺伝演算子で使用された逆動力学基盤の最適化での目的関数と進化アルゴリズムで使用された目的関数が同一である。その理由は、遺伝演算子は局部的な最適化作用（local optimizer）をして進化アルゴリズムは全域的な最適化作用（global optimizer）をするように意図されたためである。つまり、局部的最適化と全域的最適化が同時に行われることによって、集団をなしている動作個体が次第に少ないトルクを必要とするエネルギー効率的な動作パターンへ進化して行くように意図されたものである。
【００４３】
図２は本発明の実施例による遺伝演算子と適合度関数を利用して基本動作が進化する過程を概略的に示す図面である。
【００４４】
まず、人間の動作を収集して１つの作業を行う反復動作で初期両親集団を選択する。これら反復動作は多様な動作条件を包括することに選定する。
【００４５】
次に、初期両親集団から動作個体を抽出し、抽出された動作個体は主成分分析基盤の遺伝演算子を通じて子供集団を形成する。
【００４６】
また、両親集団と子供集団の動作個体をそれぞれ比較してさらに優れた動作個体が次代の両親集団を形成し、劣等な動作個体は捨てる。この過程は遺伝演算子で使用された逆動力学基盤の最適化過程の計算量のために多くの時間がかかる。
【００４７】
次に、このように形成された進化した基本動作を利用して、その時その時必要とする動作をロボットがリアルタイムで生成することができる。この過程もまた基本動作の主成分分析とその再結合からなる。つまり、ロボットが任意の動作状態ｃ_ｉを有する動作を生成しなければならないと、動作状態ｃ_ｉと類似の動作状態を有する動作を進化した基本動作データベースから抽出し、主成分分析を通じて平均軌跡と主成分軌跡を得る。ここまでの過程は主成分分析基盤の遺伝演算子と同一である。
【００４８】
しかし、主成分分析基盤の遺伝演算子とは異なって、ここではロボットの動作を構成することにおいて次の式（２８）のように平均軌跡と３つの主成分軌跡のみを使用する。
【数６８】

ここでｑ（ｔ）は関節角軌跡、ｑ_ｍｅａｎ（ｔ）は平均関節角軌跡、
【数６９】

はｉ番目主成分軌跡である。そして、ｘ_ｉ（ｉ=１、２、３、４）はスカラー係数である。
【００４９】
一般に動作状態ｃ_３は開始時刻ｔ_０での関節角ｑ_０と関節角速度
【数７０】

、そして終了時刻ｔ_ｆでの関節角ｑ_ｆと関節角速度
【数７１】

の４つに与えられる。
【００５０】
しかし、主成分分析基盤の遺伝演算子とは異なって、ここでは未知数ｘ_ｉが４つであるために４つの境界条件を満足する未知数４つを決める過程は簡単な行列演算に過ぎないので、リアルタイムで動作を生成することができる。
【００５１】
一方、二過程は境界での関節角及び関節角速度のみを考慮して動作を生成するので、‘機構学的補間を通じた動作の再結合（Reconstituting motion via kinematic interpolation）’と言う。
【００５２】
本発明の実施例では基本動作に対する主成分分析と共に、逆動力学基盤の最適化を通じた動作の再結合方法と機構学的補間を通じた動作の再結合方法を使用する。
【００５３】
しかし、逆動力学基盤の最適化を通じた動作の再結合方法を使用する場合、ロボットの物理的特性に最適化した動作を生成することができるという長所がある反面、最適化に時間が長くかかるためにロボットがリアルタイムで動作を生成できない短所がある。
【００５４】
これに反し、機構学的補間を通じた動作の再結合方法は簡単な行列演算のみを経るためにリアルタイムで動作を生成することができるが、生成された動作はキャプチャーされた人間動作の数学的、そして機構学的補間に留まるので、ロボットに最適化されたことではない。
【００５５】
図３は従来の方法と本発明の実施例による方法を比較するための図面である。従来の方法１と方法２は人間のモーションキャプチャーデータに直接主成分分析と動作再結合方法を適用する。
【００５６】
これに反し、本発明の実施例による方法３は人間のモーションキャプチャーデータを進化させてロボットの物理的特性を反映させ、この進化した基本動作に基づいてリアルタイムでロボットが必要な動作を得る。
【００５７】
以下、本発明のロボット動作制御方法による実験例及び比較例を記述する。しかし、本発明は以下の実験例または比較例に限定されることではない。
【００５８】
（実験例）
図４Ａは本実験例で使用された人間型ロボット‘マル’の外観を示す図面であり、図４Ｂは腰関節と右腕を含む７自由度のマニピュレータを概略的に示す図面である。
【００５９】
投げられたボールをロボットが腕で取るためには、球の位置を追跡し、ボールを取る位置を予想しなければならない。また、ロボットが予想位置に腕を動かし、指でボールを取ることもしなければならない。しかし、本実験例ではロボットが人間のような自然な動作を生成するようにすることが目的であるので、残り能力は既に与えられていると仮定した。
【００６０】
図５Ａは実験者が自分に投げられたボールを取る前の姿を示す図面であり、図５Ｂ及び５Ｃは実験者が自分の正面及び肩の上側に投げられたボールを取る姿をそれぞれ示す図面である。また、図６Ａ及び６Ｂは実験者がボールを受けた１４０個の地点を表示する正面図及び側面図である。
【００６１】
実験者の頭とボディー近くの多様な地点にボールを投げ、全１４０個のボールを受ける実験者の動作をキャプチャーした。つまり、本実験例では１４０個の基本動作が初期両親世帯を構成した。
【００６２】
動作状態ｃ_ｉは次の式（２９）によって定義された。
【数７２】

ここで、Ｒ_ｉは実験者がボールを受けた瞬間の手の平の回転行列（rotation matrix）であり、ｐ_ｉはその瞬間の手の平の位置ベクター（position vector）である。一方、この行列とベクターは全て実験者の腰に位置した基準座標系から見た時の値である。
【００６３】
各動作状態の間の類似性を示す距離尺度として次の式（３０）が定義された。
【数７３】

ここで、Ｒ_ｉとｐ_ｉは動作状態ｃ_ｉに属し、Ｒ_ｊとｐ_ｊは動作状態ｃ_ｊに属する。また、ｗ_１とｗ_２はスカラー加重値であり、本実験例では１．０と０．５に定めた。
【００６４】
図７Ａと図７Ｂは基本動作に対する主成分分析の例を示す。つまり、図７Ａは任意に選択した１０個の基本動作の関節角軌跡を示す図面であり、図７Ｂは７Ａに図示された基本動作から支配的な主成分４つを抽出してこれを示す図面である。
【００６５】
本実験例では与えられた動作状態に最も近い２０個の基本動作を選択して主成分を抽出し、この主成分を新たな動作を生成するのに使用した。
【００６６】
図８Ａは進化過程でさらに優れた子供個体で代替される両親個体の個数を示すグラフである。また、図８Ｂは各世帯での個体の適合度関数値の平均を示すグラフである。
【００６７】
図８Ａを参照すると、１世代から２世代に進化する時は１４０個の両親個体の中で３８個の個体がさらに優れた子供個体で代替された。一方、代替される両親個体の個数は進化が進められることによって次第に減少したが、これは動作個体の最適化が一定の値で収斂するということを示す。
【００６８】
図８Ｂを参照すると、適合度関数値の平均が１世代では５６０に至り、進化が行われた１０世代では４６０以下に減った。
【００６９】
一方、１世代から１０世代まで進化させるのにかかった時間は２ＧＢのＲＡＭを有するペンティアム（登録商標）４コンピュータでほぼ９時間程度であった（以下、同一なコンピュータで遂行）。
【００７０】
（比較例１）
図９Ａ及び９Ｂはそれぞれ従来方法１及び本発明の実施例による方法３によって生成された動作の様相を示す正面図である。また、図９Ｃ及び９Ｄはそれぞれ従来方法１及び本発明の実施例による方法３によって生成された動作の様相を示す側面図である。また、図１０は従来方法１と本発明の実施例による方法３によって生成された動作の関節角をそれぞれ示す図面である。
【００７１】
２つの動作とも基本的には人間のモーションキャプチャーデータを使用するために外観は人間の動作のように自然である。また、同一な動作条件を持って動作を生成したので、開始時点と終了時点での関節角及び関節角速度がそれぞれ同一である。
【００７２】
しかし、開始時点から終了時点へ行く軌跡は同一な様相を示さないが、その効果は下記表１に示されている。
【表１】

【００７３】
表１を参照すると、動作生成時間は２つの方法でほぼ同一であり、リアルタイムに近い短時間がかかるだけであった。これは２つの方法が活用する基本動作データが人間動作であるか進化した動作であるかの差にあり、動作を生成するアルゴリズムは同一であるためである。
【００７４】
一方、適合度関数の値は方法３でさらに小さく示されるが、これは方法３によって生成された動作がより少ないトルクが所要される最適化した動作であり、エネルギー効率的であるという意味である。したがって、本発明の実施例による方法３で使用された進化した基本動作データベースが最適の動作生成に寄与したことを確認することができた。
【００７５】
（比較例２）
図１１Ａ及び１１Ｂはそれぞれ従来方法２及び本発明の実施例による方法３によって生成された動作の様相を示す正面図である。また、図１１Ｃ及び１１Ｄはそれぞれ従来方法２及び本発明の実施例による方法３によって生成された動作の様相を示す側面図である。
【００７６】
また、図１２は従来方法２と本発明の実施例による方法３によって生成された動作の関節角をそれぞれ示す図面である。
【００７７】
２つの動作もやはり基本的には人間のモーションキャプチャーデータを使用するために外観では人間の動作のように自然である。また、同一な動作条件を持って動作を生成したので、開始時点と終了時点での関節角及び関節角速度がそれぞれ同一である。
【００７８】
一方、動作の生成時間と適合度関数の値には差があるが、これは次の表２に示されている。
【表２】

【００７９】
表２を参照すると、従来方法２による場合、動作生成に１１．３２秒がかかり、本発明の実施例による方法３による場合には０．１２７秒しかかからなかったことが判る。
【００８０】
従来方法２による場合、逆動力学基盤の最適化過程を経るために計算に長時間がかかった。これに反し、従来方法２による場合には適合度関数の値は３４８．７で、本発明の実施例による方法３による場合に比べて最適化した様相を示す。つまり、従来方法２によって生成されたロボット動作は最もエネルギー効率的で最適化し、人間の動作と類似しているが、動作生成に長い時間がかかるためにリアルタイム動作生成には不適であった。
【００８１】
これに反し、本発明の実施例による方法３によって生成されたロボット動作は従来方法２によって生成されたことよりは最適化されていないが、迅速に動作を生成するという側面からリアルタイム動作生成に適した。
【００８２】
（比較例３）
動作条件１０個を有して方法１、２及び３全てを使用してそれぞれ動作を生成した。表３は生成されたそれぞれの動作１０個を平均して、その性能を比較した結果を表３に示す。
【表３】

【００８３】
表３を参照すると、従来方法１と本発明の実施例による方法３による場合、動作生成に非常に短い時間がかかるためにリアルタイム動作生成への適用が可能であった。
【００８４】
一方、従来方法２による場合には適合度関数の値が最も小さいために最適化した動作が作られたが、動作生成に時間が長く所要されてリアルタイム動作生成に適用することは難しかった。
【００８５】
要するに、本発明の実施例による方法３による場合、リアルタイムで動作を生成することができ、多くの時間が所要されて最適化させた動作と最適化側面でほぼ対等な性能を示した。
【００８６】
以上、本発明の実施例について説明したが、本発明の権利範囲はこれに限定されず、特許請求の範囲と発明の詳細な説明及び添付した図面の範囲内で多様に変形して実施することが可能であり、これもまた本発明の範囲に属するのは当然のことである。
【図面の簡単な説明】
【００８７】
【図１】本発明の実施例による主成分分析基盤の遺伝演算子を示す図である。
【図２】本発明の実施例による遺伝演算子と適合度関数を利用して基本動作が進化する過程を概略的に示す図である。
【図３】従来の方法と本発明の実施例による方法を比較するための図である。
【図４Ａ】本実験例で使用された人間型ロボット‘マル’の外観を示す図である。
【図４Ｂ】腰関節と右腕を含む７自由度のマニピュレータを概略的に示す図である。
【図５Ａ】実験者が自分に投げられたボールを取る前の姿を示す図である。
【図５Ｂ】実験者が自分の正面側に投げられたボールを取る姿を示す図である。
【図５Ｃ】実験者が自分の肩の上側で投げられたボールを取る姿を示す図である。
【図６Ａ】実験者がボールを受けた１４０個の地点を表示する正面図である。
【図６Ｂ】実験者がボールを受けた１４０個の地点を表示する側面図である。
【図７Ａ】任意に選択した１０個の基本動作の関節角軌跡を示す図である。
【図７Ｂ】図７Ａに示された基本動作から支配的な主成分４つを抽出してこれを示した図である。
【図８Ａ】進化過程でさらに優れた子供個体で代替される両親個体の個数を示すグラフである。
【図８Ｂ】各世帯における個体の適合度関数値の平均を示すグラフである。
【図９Ａ】従来方法１によって生成された動作の様相を示す正面図である。
【図９Ｂ】本発明の実施例による方法３によって生成された動作の様相を示す正面図である。
【図９Ｃ】従来方法１によって生成された動作の様相を示す側面図である。
【図９Ｄ】本発明の実施例による方法３によって生成された動作の様相を示す側面図である。
【図１０】従来方法１と本発明の実施例による方法３によって生成された動作の関節角をそれぞれ示す図面である。
【図１１Ａ】従来方法２によって生成された動作の様相を示す正面図である。
【図１１Ｂ】本発明の実施例による方法３によって生成された動作の様相を示す正面図である。
【図１１Ｃ】従来方法２によって生成された動作の様相を示す側面図である。
【図１１Ｄ】本発明の実施例による方法３によって生成された動作の様相を示す側面図である。
【図１２】従来方法２と本発明の実施例による方法３によって生成された動作の関節角をそれぞれ示す図面である。

【特許請求の範囲】
【請求項１】
ロボットの動作制御方法において、
（ａ）人間の動作パターンを収集してデータベースを構築する段階;
（ｂ）主成分分析及び逆動力学に基づいた補間法を利用した遺伝演算子を利用して前記データベースを進化させる段階;及び
（ｃ）前記進化したデータベースを利用してリアルタイムでロボットの動作を生成する段階を含むことを特徴とするロボットの動作制御方法。
【請求項２】
前記（ａ）段階は人間の動作をモーションキャプチャーする段階を含むことを特徴とする、請求項１に記載のロボットの動作制御方法。
【請求項３】
前記（ｂ）段階は、
（ｂ−１）ロボットが行う任意の動作と類似の動作状態を有する基本動作を前記データベースから１つ以上選択する段階;及び
（ｂ−２）主成分分析による主成分抽出及び前記主成分の結合を通じて最適動作を新たに生成することによって、前記選択された基本動作を再加工する段階を含むことを特徴とする、請求項１に記載のロボットの動作制御方法。
【請求項４】
前記（ｂ）段階は、
前記（ｂ−１）段階と前記（ｂ−２）段階を繰り返して行って前記データベースを進化させる段階を含むことを特徴とする、請求項３に記載のロボットの動作制御方法。
【請求項５】
前記（ｂ−１）段階で、
前記任意の動作は、
【数１】

を前記任意の動作の関節角軌跡、
【数２】

を前記選択された基本動作の平均関節角軌跡、
【数３】

を前記選択した基本動作の関節角軌跡の中でｉ番目主成分軌跡、
【数４】

をスカラー係数とすると、
【数５】

という式（１）で示されることを特徴とする、請求項３に記載のロボットの動作制御方法。
【請求項６】
前記任意の動作の動作状態は、
【数６】

を開始時間
【数７】

における関節角、
【数８】

を開始時間
【数９】

における関節角速度、
【数１０】

を終了時間
【数１１】

における関節角、
【数１２】

を終了時間
【数１３】

における関節角速度とすると、
【数１４】

という式（２）に示す境界条件を満足することを特徴とする請求項５に記載のロボットの動作制御方法。
【請求項７】
前記（ｂ−２）段階で、
前記選択された基本動作が１つ以上の関節角軌跡を含む時、前記関節角軌跡の平均軌跡
【数１５】

を、ｋを選択した基本動作の数とし、
【数１６】

をｉ番目基本動作の関節角軌跡とすると、
次の式（３）によって計算し、
【数１７】

さらに、次の式（４）を通じて共分散行列（Ｓ）を計算し、
【数１８】

この共分散行列から固有ベクターを得て、前記固有ベクターの中で前記関節角軌跡の主成分軌跡を得ることを特徴とする、請求項３に記載のロボットの動作制御方法。
【請求項８】
前記（ｂ−２）段階で、
【数１９】

を前記選択された基本動作の関節角、
【数２０】

を前記選択された基本動作の関節角速度、
【数２１】

を前記選択された基本動作の関節角加速度、
【数２２】

を質量マトリックス、
【数２３】

をコリオリベクターとし、
【数２４】

が重力及びその他の力を含むとき、次の式（５）を通じて前記選択された基本動作の関節トルク
【数２５】

を決め、
【数２６】

前記決められた関節トルクが、次の式（６）を最小にすると、
【数２７】

前記選択された基本動作を前記最適動作に決めることを特徴とする、請求項３に記載のロボットの動作制御方法。
【請求項９】
前記（ｃ）段階は、
主成分分析及び機構学的補間を通じた動作の再結合方法を利用することを特徴とする請求項１に記載のロボットの動作制御方法。
【請求項１０】
前記（ｃ）段階は、
（ｃ−１）ロボットが生成する動作と類似の動作状態を有する基本動作を前記進化したデータベースから１つ以上選択する段階;及び
（ｃ−２）主成分分析による主成分抽出及び前記主成分の結合を通じて最適動作を新たに生成することによって、前記選択された基本動作を再加工する段階を含むことを特徴とする、請求項９に記載のロボットの動作制御方法。
【請求項１１】
前記（ｃ−１）段階で、
前記ロボットが生成する動作は、
【数２８】

を前記ロボットが生成する動作の関節角軌跡、
【数２９】

を前記選択された基本動作の平均関節角軌跡、
【数３０】

を前記選択された基本動作の関節角軌跡の中でｉ番目主成分軌跡、
【数３１】

をスカラー係数とすると、
【数３２】

という式（７）で示すことができることを特徴とする、請求項１０に記載のロボットの動作制御方法。
【請求項１２】
前記ロボットが生成する動作の動作状態は、
【数３３】

を開始時間
【数３４】

における関節角、
【数３５】

を開始時間
【数３６】

における関節角速度、
【数３７】

を終了時間
【数３８】

における関節角、
【数３９】

を終了時間
【数４０】

における関節角速度とすると、
【数４１】

という式（８）で示す境界条件を満足することを特徴とする、請求項１１に記載のロボットの動作制御方法。
【請求項１３】
前記（ｃ−２）段階で、
前記選択された基本動作が１つ以上の関節角軌跡を含む時、前記関節角軌跡の平均軌跡
【数４２】

は、ｋを選択した基本動作の数とし、
【数４３】

をｉ番目基本動作の関節角軌跡とするときに、
次の式（９）によって計算され、
【数４４】

さらに、次の式（１０）を通じて共分散行列（Ｓ）を計算し、
【数４５】

前記共分散行列から固有ベクターを得て、前記固有ベクターの中で前記関節角軌跡の主成分軌跡を得ることを特徴とする、請求項１０に記載のロボットの動作制御方法。

【図１】

【図２】

【図３】

【図４Ｂ】

【図７Ａ】

【図７Ｂ】

【図８Ａ】

【図８Ｂ】

【図１０】

【図１２】

【図４Ａ】

【図５Ａ】

【図５Ｂ】

【図５Ｃ】

【図６Ａ】

【図６Ｂ】

【図９Ａ】

【図９Ｂ】

【図９Ｃ】

【図９Ｄ】

【図１１Ａ】

【図１１Ｂ】

【図１１Ｃ】

【図１１Ｄ】

【公開番号】特開２０１０−５８２６０（Ｐ２０１０−５８２６０Ａ）
【公開日】平成２２年３月１８日（２０１０．３．１８）
【国際特許分類】

処理操作；運輸 (1,245,546)
- 手工具；可搬型動力工具；手工具用の柄；作業場設備；マニプレータ (16,135)
  - マニプレータ；マニプレータ装置を持つ小室 (9,248)
    - マニプレータの制御 (2,176)
    - 車または搬送体に設置されているマニプレータ (1,079)

【出願番号】特願２００８−３０２４５７（Ｐ２００８−３０２４５７）
【出願日】平成２０年１１月２７日（２００８．１１．２７）
【新規性喪失の例外の表示】特許法第３０条第１項適用申請有り　〔研究集会名〕　２００８年度ＩＥＥＥ（電気電子学会）計算機知能に関する世界大会〔主催者名〕　ＩＥＥＥ（電気電子学会）〔開催日〕　平成２０年６月１日〜６日
【出願人】（５９１０７４１１６）韓国科学技術研究院 (17)
【氏名又は名称原語表記】ＫＯＲＥＡ　ＩＮＳＴＩＴＵＴＥ　ＯＦ　ＳＣＩＥＮＣＥ　ＡＮＤ　ＴＥＣＮＯＬＯＧＹ
【住所又は居所原語表記】３９−１　Ｈａｗｏｌｇｏｋ−ｄｏｎｇ，Ｓｅｏｎｇｂｕｋ−ｇｕ，Ｓｅｏｕｌ　１３６−７９１ＫＯＲＥＡ
【Ｆターム（参考）】

[ Back to top ]

進化アルゴリズムと模倣学習に基づくロボットの動作制御方法

メニュー

スポンサーリンク

次の公報 »

« 前の公報

進化アルゴリズムと模倣学習に基づくロボットの動作制御方法

メニュー

スポンサー リンク

次の公報 »

« 前の公報

スポンサーリンク