ロボットおよびその行動制御システム

【課題】上体の運動によって指定タスクを実行しながら、継続的に安定することができるロボット等を提供する。
【解決手段】本発明のロボット１または行動制御システム２によれば、確率遷移モデルにしたがって、腕体の運動状態を表わす「第１状態変数」の時系列的な変化態様が、第１状態変数のうち少なくとも１つがロボット１に指定タスクを実行させるための第１指定運動軌道｛ｒ｝に追従するように生成される。また、同じく確率遷移モデルにしたがって、上体の運動状態を表わす「第２状態変数」の時系列的な変化態様が、第２状態変数が継続的に安定な動力学的条件を充足するように生成される。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、上体と、当該上体に連結されている腕体と、当該上体を支持する複数の脚体とを有する脚式移動ロボットおよびその行動を制御するシステムに関する。
【背景技術】
【０００２】
脚式移動ロボットに、手部で台車を押す、または、手部により把持しているラケットでボールを打ち返すなどのタスクを実行させるシステムが提案されている（特許文献１〜３参照）。
【先行技術文献】
【特許文献】
【０００３】
【特許文献１】特開２００７−１６０４２８号公報
【特許文献２】特開２００８−３０７６４０号公報
【特許文献３】特開２０１０−００５７６１号公報
【発明の概要】
【発明が解決しようとする課題】
【０００４】
しかし、ロボットにタスクを実行させることを優先して上体および腕体の運動が制御されることにより、脚体に対する上体の位置および姿勢が当該エージェントの歩容を安定に継続させる観点から不適当になる可能性がある。
【０００５】
そこで、本発明は、上体の運動によって指定タスクを実行しながら、継続的に安定することができるロボット等を提供することを解決課題とする。
【課題を解決するための手段】
【０００６】
本発明は、上体と、前記上体に連結されている腕体と、前記上体を支持する複数の脚体と、前記上体、前記腕体および前記複数の脚体のそれぞれの運動を目標運動軌道にしたがって制御するように構成されている行動制御システムとを備えているロボットに関する。
【０００７】
前記課題を解決するための本発明のロボットは、前記行動制御システムが、前記腕体の運動状態を表わす第１状態変数と、前記第１状態変数の値の変動因子である前記上体の運動状態を表わす第２状態変数とのそれぞれを確率変数として表現する確率遷移モデルにしたがって、前記第１状態変数のうち少なくとも１つが前記ロボットに指定タスクを実行させるために定められている第１指定運動軌道に追従し、かつ、前記第２状態変数が前記ロボットに継続的に安定な動力学的条件を充足するように、前記第１状態変数および前記第２状態変数のそれぞれの時系列的な変化態様を前記目標運動軌道として生成するように構成されていることを特徴とする。
【０００８】
本発明のロボットまたはその制御システムによれば、確率遷移モデルにしたがって、腕体の運動状態を表わす「第１状態変数」の時系列的な変化態様（第１目標運動軌道）が、第１状態変数のうち少なくとも１つがロボットに指定タスクを実行させるための第１指定運動軌道に追従するように生成される。また、同じく確率遷移モデルにしたがって、上体の運動状態を表わす「第２状態変数」の時系列的な変化態様（第２目標運動軌道）が、第２状態変数が継続的に安定な動力学的条件を充足するように生成される。
【０００９】
第２状態変数は第１状態変数の値の変動因子であるため、継続的に安定な第２目標運動軌道が生成されることにより、第１状態変数を第１指定運動軌道に厳密に追従させることが困難となる可能性がある。しかるに、確率遷移モデルにおいて、第１状態変数が確率変数として表現されているため、第１状態変数のうち少なくとも１つの第１指定運動軌道に対する追従度（守りきり度合い）の高低が、ロボットに指定タスクを実行させるという条件下で柔軟に調節されうる。
【００１０】
具体的には、ロボットに指定タスクを実行させる観点から重要度が比較的高い時点においては、第１状態変数を第１指定運動軌道に比較的厳密に一致または近接させる必要がある。その一方、当該重要度が比較的低い時点においては、第１状態変数を第１指定運動軌道からある程度乖離させることが許容される。
【００１１】
これにより、ロボットに上体の運動によって指定タスクを実行させながら、これと同時に継続的に安定にすることができるようにロボットの全体的な動作が制御されうる。
【００１２】
前記行動制御システムが、前記ロボットに他の物体との相互作用を伴う前記指定タスクを実行させるように前記第１指定運動軌道が定められていることを認識した場合、前記上体と前記物体との相互作用期間において、前記ロボットが前記物体から受ける外力に応じた変動量が加えられた前記確率遷移モデルにしたがって前記目標運動軌道を生成するように構成されていてもよい。
【００１３】
当該構成のロボットによれば、ロボットに物体との相互作用を伴う指定タスクを実行させながら、これと同時に継続的に安定にすることができるようにロボットの全体的な動作が制御されうる。
【００１４】
前記行動制御システムが、確率変数のうち少なくとも１つの確率分布が切断分布により表現されている前記確率遷移モデルにしたがって前記目標運動軌道を生成するように構成されていてもよい。
【００１５】
当該構成のロボットによれば、確率遷移モデルにおいて確率変数として表現されている状態変数のうち少なくとも１つの確率分布が切断分布により表現される。切断分布とは、確率が正値である状態変数値範囲と、確率が０になる状態変数値範囲とが隣接するような確率分布を意味する。
【００１６】
このため、ロボットの構造的な制約条件または安定な歩容のための動力学的条件等に応じて、当該状態変数がとりえない数値範囲を、切断分布において確率が０になる状態変数値範囲に一致させることにより、当該条件が充足されるようにロボットの全体的な動作が制御されうる。
【図面の簡単な説明】
【００１７】
【図１】本発明の一実施形態としてのロボットの構成説明図。
【図２】本発明の一実施形態としてのロボットの制御システムの構成説明図。
【図３】ロボットの挙動を表わす簡易モデルに関する説明図。
【図４】第１実施形態における確率遷移モデルに関する説明図。
【図５】第１実施形態におけるロボットの行動制御方法に関する説明図。
【図６】目標運動軌道に関する説明図。
【図７】アーム長さ限界に関する説明図。
【図８】関節角度限界に関する説明図。
【図９】第１実施形態におけるロボットの指定タスクに関する説明図。
【図１０】第２実施形態における確率遷移モデルに関する説明図。
【図１１】第２実施形態におけるロボットの行動制御方法に関する説明図
【図１２】第２実施形態におけるロボットの指定タスクに関する説明図。
【図１３】ロボットの挙動を表わす他の簡易モデルに関する説明図。
【図１４】他の実施形態における確率遷移モデルに関する説明図。
【図１５】他の実施形態における目標運動軌道に関する説明図。
【発明を実施するための形態】
【００１８】
（ロボットの構成）
まず、本発明の一実施形態としてのロボットの構成について説明する。
【００１９】
図１に示されているロボット１は脚式移動ロボットであり、人間と同様に基体１０と、基体１０の上部に設けられた頭部１１と、基体１０の上部左右両側から延設された左右の腕体１２と、腕体１２の先端部に設けられた手部１３と、基体１０の下部から下方に延設された左右の脚体１４と、脚体１４の先端部に取り付けられている足平部１５とを備えている。ロボット１は、アクチュエータ２４から伝達される力によって、人間の肩関節、肘関節、手首関節、股関節、膝関節、足首関節等の複数の関節に相当する複数の関節機構において腕体１２や脚体１４を屈伸運動させることができる。
【００２０】
腕体１２は肩関節機構を介して基体１０に連結された第１腕リンクと、一端が第１腕リンクの端部に肘関節機構を介して連結され、他端が手首関節を介して手部１３の付根部に連結されている第２腕リンクとを備えている。肩関節機構は、ヨー軸およびピッチ軸のそれぞれの回りの２つの回転自由度を有する。肘関節機構は、ピッチ軸回りの１つの回転自由度を有する。手首関節機構は、ロール軸およびピッチ軸のそれぞれの回りの２つの回転自由度を有する。
【００２１】
脚体１４は股関節機構を介して基体１０に連結された第１脚リンクと、一端が第１脚リンクの端部に膝関節機構を介して連結され、他端が足首関節を介して足平部１５に連結されている第２脚リンクとを備えている。股関節機構は、ヨー軸、ピッチ軸およびロール軸のそれぞれの回りの３つの回転自由度を有する。膝関節機構は、ピッチ軸回りの１つの回転自由度を有する。足首関節機構は、ピッチ軸およびロール軸のそれぞれ回りの２つの回転自由度を有する。ロボット１は、左右の脚体１４のそれぞれの離床および着床の繰り返しを伴う動きによって自律的に移動することができる。
【００２２】
（行動制御システムの構成）
図２に示されている行動制御システム２はロボット１に搭載されている電子制御ユニット（ＣＰＵ，ＲＯＭ，ＲＡＭ，Ｉ／Ｏ回路等により構成されている。）またはコンピュータにより構成されている。
【００２３】
行動制御システム２は内部状態センサ群２１および外部状態センサ群２２のそれぞれの出力信号に基づいて種々の状態変数の値を認識するように構成されている。
【００２４】
内部状態センサ群２１にはロボット１の位置（重心位置）を測定するためのＧＰＳ測定装置または加速度センサのほか、基体１０の姿勢を測定するためのジャイロセンサ、各関節機構の屈曲角度等を測定するロータリーエンコーダ等が含まれている。
【００２５】
外部状態センサ群２２にはロボット１とは別個独立のモーションキャプチャーシステム（図示略）のほか、ボール等のタスク実行に関連する物体の位置軌道を測定するため、頭部１１に搭載されているステレオイメージセンサや、基体１０に搭載されている赤外光を用いたアクティブ型センサ等が含まれる。
【００２６】
行動制御システム２は、後述の確率遷移モデルにしたがって、第１状態変数および第２状態変数のそれぞれの時系列的な変化態様を目標運動軌道として生成するように構成されている。第１状態変数は、腕体１２および手部１３の運動状態を表わす。第２状態変数は、ロボット１の上体の運動状態を表わす。行動制御システム２は、状態変数の認識結果に基づき、アクチュエータ２４の動作を制御することにより、目標運動軌道にしたがってロボット１の運動態様を制御するように構成されている。
【００２７】
行動制御システム２が「構成されている」とは、行動制御システム２がメモリ等の記憶手段から必要なソフトウェアおよびデータを読み出し、当該データを対象として当該ソフトウェアにしたがった演算処理を実行すること、さらには当該演算処理の結果として制御指令信号を生成し、制御対象に宛てて当該信号を出力すること等により、ロボット１の行動制御等の目的を達成することを意味する。
【００２８】
本発明の構成要素が情報を「認識する」とは、当該構成要素が情報をデータベースから検索すること、メモリ等の記憶装置から情報を読み取ること、センサ等の出力信号に基づき情報を測定、算定、推定、判定すること、測定等された情報をメモリに格納すること等、当該情報をさらなる演算処理のために準備または用意するのに必要なあらゆる情報処理を実行することを意味する。
【００２９】
行動制御システム２のうち一部がロボット１の外部コンピュータにより構成され、残りの部分が当該外部コンピュータから演算結果を無線または有線方式で通信可能なコンピュータにより構成されていてもよい。
【００３０】
（本発明の第１実施形態における確率遷移モデル）
本発明の第１実施形態における確率遷移モデルは、ロボット１の挙動が、図３に示されているように倒立振子と、この倒立振子の質点または上端から延設されているアームとのそれぞれの挙動により簡素化して表現されているという考え方にしたがって構築されている。
【００３１】
倒立振子は、高さｈが一定であり、下端を支点としてロール軸およびピッチ軸のそれぞれ回りに揺動可能であると仮定されている。ロボット１の上体の仮想目標位置はｕ＝（ｕ_x，ｕ_y）により表わされている。ロボット１のＺＭＰの水平位置は、倒立振子の下端水平位置ｚ＝（ｚ_x，ｚ_y）により表わされている。ＺＭＰとは、足平部１５の全体に分布してかかっている床反力の法線成分を、ある一点にかかっているとして置き換えたときの作用点を意味する。ロボット１の上体質点または肩関節機構の水平位置および水平速度のそれぞれは、倒立振子の上端水平位置ｘ＝（ｘ_x，ｘ_y）および上端水平速度ｖ＝（ｖ_x，ｖ_y）により表わされている。
【００３２】
「水平」という記載は、対象物理量がグローバル座標系のヨー軸に対して垂直な２つの方向成分により表現されることを意味している。「水平」という記載が付されていない場合、対象物理量がグローバル座標系の相互に垂直な３つの方向成分により表現されることを意味している。
【００３３】
倒立振子の挙動状態を表わす状態変数（ｘ，ｖ）は、ロボット１の上体の運動状態を表わす「第２状態変数」に相当する。
【００３４】
アームは倒立振子の上端から順に連接された３つのリンクにより構成されている。当該３つのリンクは、ロボット１の腕体１２の第１腕リンクおよび第２腕リンクならびに手部１３のそれぞれに相当する。ロボット１の肘関節機構の位置は、第１リンクの先端位置ｙ₁＝（ｙ_1x，ｙ_1y，ｙ_1z）より表わされている。ロボット１の手首関節機構の位置は、第２リンクの先端位置ｙ₂＝（ｙ_2x，ｙ_2y，ｙ_2z）により表わされている。ロボット１の手部１３の先端位置は、第３リンクの先端位置ｙ₃＝（ｙ_3x，ｙ_3y，ｙ_3z）により表わされている。
【００３５】
基体１０に対する第１腕リンクの姿勢を定める肩関節機構の直交する２軸回りのそれぞれの回転角度は、倒立振子に対するアームの第１リンクの直交する２軸回りのそれぞれの回転角度（θ₁，ψ₁）により表わされている。第１腕リンクに対する第２腕リンクの姿勢を定める肘関節機構の１軸回りの回転角度は、アームの第１リンクに対する第２リンクの１軸回りの回転角度θ₂により表わされている。第２腕リンクに対する手部１３の姿勢を定める手首関節機構の直交する２軸回りのそれぞれの回転角度は、アームの第２リンクに対する第３リンクの直交する２軸回りのそれぞれの回転角度（θ₃，ψ₂）により表わされている。
【００３６】
アームの挙動に関して、その付け根から先端位置までの距離ｄが考慮される。
【００３７】
アームの挙動を表わす状態変数（ｙ₁，ｙ₂，ｙ₃）は、ロボット１の腕体１２の運動状態を表わす「第１状態変数」に相当する。
【００３８】
確率遷移モデルは、図４に示されているダイナミクスベイジアンネットワーク（ＤＢＮ）により表現される。このＤＢＮによれば、ロボット１の挙動を簡易表現する前述の倒立振子およびアームの運動方程式および制御則が、各時点ｔにおける状態変数を確率変数として表わす複数のノード（円）と、当該ノードをつなぐ矢印により表現されている。ロボット１の運動方程式および制御則は関係式（１１）〜（１４）のそれぞれにより表現される。
【００３９】
z[i]＝(-u[i]k/(k+1)+x[i-1]+v[i-1]/ω₀)(ω₀+kω₀)Δt/(1-exp(-ω₀Δt)) ..(11)。
【００４０】
v[i]＝v[i-1]+ω₀ω₀(x[i-1]-z[i])Δt ..(12)。
【００４１】
x[i]＝x[i-1]+v[i]Δt ..(13)。
【００４２】
y[i]＝x[i]+DK(θ₁, ψ₁, θ₂, θ₃, ψ₂) ..(14)。
【００４３】
関係式（１１）は、ロボット１が発散しないようにＺＭＰの水平位置ｚが上体の目標水平位置軌道ｕ（第２指定運動軌道に相当する。）に追従する制御則を表わしている。ロボット１が発散するとは、ロボット１が転倒する蓋然性が高くなる程度にその体勢が崩れてしまうことを意味し、この発散を抑制するために発散成分が考慮されている。ロボット１の発散成分の値とは、ロボット１の基体１０の位置が両足平部１５の位置（より具体的には、支持脚側足平部１５の接地面に設定されたグローバル座標系（支持脚座標系）の原点）からかけ離れていく具合を表す数値である（特許第３６７２１００号公報、第３６７４７８８号公報等、出願人の所有に係る公開公報参照）。
【００４４】
発散成分は、上体質点水平位置ｘ、上体質点水平速度ｖおよび所定の定数（たとえば倒立振子の固有振動数）ω₀を用いて関係式（０１）により表現される。
【００４５】
（発散成分）＝x＋v/ω₀ ..(01)。
【００４６】
ロボット１のＺＭＰの水平位置ｚは、上体の目標位置軌道ｕ、上体質点水平位置ｘ、上体質点水平速度ｖ、フィードバック係数ｋおよび倒立振子の固有振動数ω₀を用いて、関係式（０２）により表現される。
【００４７】
z=(-u・k/(k+1)+x+v/ω₀)(ω₀+k・ω₀)Δt/(1-exp(-ω₀Δt)) …(02)。
【００４８】
アームの付け根から先端位置までの距離ｄは、ロボット１の肩関節機構から手部１３の先端までの距離の許容範囲外で確率が０になる切断分布により確率分布が表わされる確率変数である。同様に、アームの姿勢を表わす関節角度ｐ＝（θ₁，ψ₁，θ₂，θ₃，ψ₂）は確率変数で、ロボット１の腕体１２の各関節機構の屈曲角度の許容範囲外で確率が０になる切断分布により確率分布が表わされる確率変数である。
【００４９】
関係式（１４）右辺におけるＤＫは、関節角度ｐに基づき、アームの第１〜第３リンクのそれぞれの先端位置を算出するための、順運動額的または幾何学的関係を表わす関数である。
【００５０】
（本発明の第１実施形態としてのロボットおよび行動制御システムの機能）
本発明の第１実施形態としての、前記構成を有するロボット１および行動制御システム２の機能について説明する。本発明の第１実施形態によれば、図９（ａ）〜（ｃ）に示されているように、一方の手部１３で把持しているラケットをフォアハンドストロークで素振りするという指定タスクをロボット１に実行させる。
【００５１】
まず、行動制御システム２（またはその構成要素である第１指定運動軌道認識要素）により、ロボット１に指定タスクを実行させるために定められている第１指定運動軌道｛ｒ｝＝［r(t₁), ..r(t₁+(i-1)Δt), r(t₁+iΔt), r(t₁+(i+1)Δt), .. r(t₂)］が認識される（図５／ＳＴＥＰ１１）。
【００５２】
第１指定運動軌道｛ｒ｝、すなわち、手部１３の先端位置の時系列的な模範変化態様は、特開２０１０−００５７６１号公報に開示されている手法と同様の手法にしたがって生成される。具体的には、まず、外部状態センサ２２を構成する光学式、機械式、磁気式または慣性式モーションキャプチャーシステムにより、インストラクタ（人間）が複数回にわたり指定タスクを実行する際の、手位置の時系列的な変化態様が測定される。そして、この観測結果に基づき、インストラクタおよびロボット１の身体サイズの相違に応じたスケーリングが実行されることにより、第１指定運動軌道が生成される。第１指定運動軌道は記憶装置に格納される。
【００５３】
なお、あらかじめ定められた第１指定運動軌道が、リモコン等の外部機器からロボット１に送信され、記憶装置に格納されてもよい。
【００５４】
また、第１状態変数の時系列的な目標変化態様を表わす「第１目標運動軌道」および第２状態変数の時系列的な目標変化態様を表わす「第２目標運動軌道」が、目標運動軌道として生成される（図５／ＳＴＥＰ１２）。
【００５５】
具体的には、行動制御システム２（またはその構成要素である目標運動軌道認識要素）により、第１基準時点ｔ＝ｔ₁から第２基準時点ｔ＝ｔ₂＝ｔ₁＋ＮΔｔまでのＮ＋１個のノードが、関係式（１１）〜（１４）により表現される確率遷移モデルにしたがって、順次推定される。ロボット１が指定タスクの実行開始時点ｔ₁におけるＤＢＮにおける各ノードの推定方法としてはギブスサンプリング等の方法が採用される。
【００５６】
これにより、図６に示されているような、肘関節機構の目標位置軌道｛ｙ₁｝、手首関節機構の目標位置軌道｛ｙ₂｝および手部１３の先端の目標位置軌道｛ｙ₃｝が第１目標運動軌道として生成される。手部１３の先端の目標位置軌道｛ｙ₃｝は、第１指定運動軌道｛ｒ｝にほぼ一致するように追従している。
【００５７】
また、同じく図６に示されているような、上体質点（または肩関節機構）の目標位置軌道｛ｘ｝およびＺＭＰの目標水平位置軌道｛ｚ｝が第２目標運動軌道として生成される。図７に示されているように肩関節機構と手部１３の先端との間隔ｄが、その許容範囲［ｄ_low，ｄ_up］に収まるように目標運動軌道が生成される。
【００５８】
同様に、確率遷移モデルによれば、図８（ａ）に示されているように肩関節機構の直交する２軸回りの回転角度θ₁およびψ₁と、肘関節機構の１軸回りの回転角度θ₂とのそれぞれが、その許容範囲［θ_1low，θ_1up］、［ψ_1low，ψ_1up］および［θ_2low，θ_2up］のそれぞれに収まるように目標運動軌道が生成される。さらに、確率遷移モデルによれば、図８（ｂ）に示されているように手首関節機構の直交する２軸回りの回転角度θ₃およびψ₂のそれぞれが、その許容範囲［θ_3low，θ_3up］および［ψ_2low，ψ_2up］のそれぞれに収まるように目標運動軌道が生成される。
【００５９】
これは、確率遷移モデルにおいて、当該許容範囲外では確率が０になるような切断分布を確率分布として有する確率変数として、当該間隔ｄおよび関節角度が表現されているからである。
【００６０】
そして、行動制御システム２により、目標運動軌道にしたがって、ロボット１の動作が制御される（図５／ＳＴＥＰ１３）。具体的には、肘関節機構、手首関節機構および手部１３の先端のそれぞれの位置が、第１目標運動軌道｛ｙ₁｝、｛ｙ₂｝および｛ｙ₃｝のそれぞれに追従し、かつ、肩関節機構およびＺＭＰのそれぞれの位置が第２目標運動軌道｛ｘ｝および｛ｚ｝のそれぞれに追従するように、アクチュエータ２４の動作が制御され、ロボット１の全身運動が制御される。
【００６１】
これにより、第１状態変数としての手部１３の先端位置は第１指定運動軌道｛ｒ｝にほぼ一致する程度に近接して時系列的に変化する。具体的には、図９（ａ）〜（ｃ）に順に示されているように腕体１２および脚体１４等が動かされ、ロボット１が片方の手部１３で持っているラケットをフォアハンドで素振りをするという指定タスクを実行させることができる。
【００６２】
（本発明の第１実施形態としてのロボットおよび行動制御システムの作用効果）
前記機能を発揮する本発明の第１実施形態としてのロボット１または行動制御システム２によれば、確率遷移モデルにしたがって、上体の運動状態を表わす「第１状態変数」の時系列的な変化態様（第１目標運動軌道）が、第１状態変数のうち少なくとも１つ（手位置またはラケット位置）がロボット１に指定タスクを実行させるための第１指定運動軌道｛ｒ｝に追従するように生成される（図６参照）。
【００６３】
また、同じく確率遷移モデルにしたがって、ロボット１の歩容状態を表わす「第２状態変数」の時系列的な変化態様（第２目標運動軌道）が、第２状態変数がロボット１を継続的に安定させる動力学的条件（関係式（１１）参照）を充足するように生成される。
【００６４】
第２状態変数は第１状態変数の値の変動因子であるため、ロボット１を継続的に安定にする第２目標運動軌道が生成されることにより、第１状態変数を第１指定運動軌道に厳密に追従させることが困難となる可能性がある。しかるに、確率遷移モデルにおいて、第１状態変数が確率変数として表現されているため、第１状態変数のうち少なくとも１つ（手位置）の第１指定運動軌道に対する追従度（守りきり度合い）の高低が、ロボット１に指定タスクを実行させるという条件下で柔軟に調節されうる。
【００６５】
具体的には、ロボット１に指定タスクを実行させる観点から重要度が比較的高い時点においては、第１状態変数を第１指定運動軌道｛ｒ｝に比較的厳密に一致または近接させる必要がある。その一方、当該重要度が比較的低い時点においては、第１状態変数を第１指定運動軌道からある程度乖離させることが許容される。
【００６６】
確率変数のうち少なくとも１つ（肩関節機構と手先端位置との間隔ｄおよび腕体の各関節角度）の確率分布が切断分布により表現されている確率遷移モデルにしたがって目標運動軌道が生成される。このため、ロボット１の構造的な制約条件または安定な歩容のための動力学的条件等に応じて、当該状態変数がとりえない数値範囲を、切断分布において確率が０になる状態変数値範囲に一致させることにより、当該条件が充足されるようにロボット１の全体的な動作が制御されうる（図７および図８（ａ）（ｂ）参照）。
【００６７】
（本発明の第２実施形態における確率遷移モデル）
本発明の第２実施形態における確率遷移モデルは、第１実施形態と同様にロボット１の挙動が、図３に示されているように倒立振子とアームとのそれぞれの挙動により簡素化して表現されているという考え方にしたがって構築されている。第２実施形態は、ロボット１に物体との相互作用を伴う指定タスクを実行させるため、当該相互作用によってロボット１が物体から受ける力が考慮される点で、第１実施形態と相違する。
【００６８】
この相違点は、確率遷移モデルを表現する関係式（１１）に代えて、指定タスクの実行時にロボット１が物体から受けた力ｆをＺＭＰ相当量に変換した結果ｅが右辺に追加されている新たな関係式（２１）により確率遷移モデルが表現されていることに反映されている。
【００６９】
z[i]＝(-u[i]k/(k+1)+x[i-1]+v[i-1]/ω₀)(ω₀+kω₀)Δt/(1-exp(-ω₀Δt))+e
-＝z[i]＝(-u[i]k/(k+1)+x[i-1]+v[i-1]/ω₀)(ω₀+kω₀)Δt/(1-exp(-ω₀Δt))+fh/mg ..(21)
ここで、ｈは倒立振子の高さであり、ｍは倒立振子の質量であり、ｇは重力加速度である。
【００７０】
（本発明の第２実施形態としてのロボットおよび行動制御システムの機能）
本発明の第２実施形態としての、前記構成を有するロボット１および行動制御システム２の機能について説明する。本発明の第１実施形態によれば、図１２（ａ）〜（ｃ）に示されているように、一方の手部１３で把持しているラケットをフォアハンドストロークで振り、ボール（物体）を打ち返すという指定タスクをロボット１に実行させる。
【００７１】
指定タスクの性質上、ラケットは手部１３の一部であるとみなされる。確率遷移モデルにおいて、手部１３により把持されているラケットのガット（ボールを当てる箇所）の位置（ラケット位置）が、当該手部１３の先端位置ｘとして扱われる。
【００７２】
まず、行動制御システム２（またはその構成要素であるボール位置軌道測定要素）により、外部状態センサ群２２の出力信号により表わされるボールの時系列的な位置に基づき、世界座標系またはロボット座標系におけるボールの位置が時系列的に測定される（図１１／ＳＴＥＰ２１、図１２（ａ）参照）。
【００７３】
続いて、行動制御システム２（またはその構成要素であるボール位置軌道予測要素）により、ボールの時系列的な推定位置x₁(k)に基づき、このボールの位置軌道が予測される（図１１／ＳＴＥＰ２２、図１２（ａ）破線参照）。ボールの予測位置x₁(t)は、現在時刻kにおけるボールの計測位置x₁(k)、速度v₁(k)＝{x₁(k)−x₁(k-1)}／Δtおよび加速度α₁(k)＝{v₁(k)−v₁(k-1)}／Δt（Δt：演算周期）に基づき、運動方程式にしたがって算出される。
【００７４】
さらに、行動制御システム２（またはその構成要素である相互作用点候補設定要素）により、ロボット１の運動によってラケット（そのガット）が到達可能な範囲において、ラケットとボールとの相互作用点または打点が設定される（図１１／ＳＴＥＰ２３、図１２（ａ）参照）。
【００７５】
ラケットの到達可能範囲は、内部状態センサ群２１の出力信号により表わされる各関節機構の屈曲角度、ならびに、手部１３に対するラケットの位置および姿勢等のキネマティクスパラメータに基づき、キネマティクス演算法にしたがって推定される。ラケットの到達可能範囲の推定に際して、ロボット１の基体１０および腕体１２など、異なる部分が相互に干渉または接触しないことが確認される。
【００７６】
手部１３の掌に対して位置および姿勢が固定されているハンド座標系におけるラケットの位置はあらかじめ定められていてもよいが、内部状態センサ群２１を構成する撮像装置によって撮像された手部１３に対するラケットのグリップの握り位置および姿勢に基づいて逐次算出されてもよい。
【００７７】
さらに、行動制御システム２により、ロボット１に指定タスクを実行させるために定められている、第１状態変数としてのラケット位置の時系列的な模範位置軌道を表わす第１指定運動軌道｛ｒ｝が認識される（図１１／ＳＴＥＰ２４）。たとえば、記憶装置に格納されている複数の第１指定運動軌道のうち、ボールの到達予測時刻において設定相互作用点を通る一の第１指定運動軌道が選定される。
【００７８】
また、第１状態変数の時系列的な目標変化態様を表わす「第１目標運動軌道」および第２状態変数の時系列的な目標変化態様を表わす「第２目標運動軌道」が、目標運動軌道として生成される（図１１／ＳＴＥＰ２５（図６参照））。
【００７９】
具体的には、行動制御システム２（またはその構成要素である目標運動軌道認識要素）により、第１基準時点ｔ＝ｔ₁から第２基準時点ｔ＝ｔ₂＝ｔ₁＋ＮΔｔまでのＮ＋１個のノードが、確率遷移モデルにしたがって順次推定される。この際、図１０に示されているように、確率遷移モデルを表わすＤＢＮにおいて、少なくともラケットとボールとの相互作用期間において当該力ｆおよびそのＺＭＰ換算結果ｅを表わすノードが追加されている。
【００８０】
そして、行動制御システム２により、目標運動軌道にしたがって、ロボット１の動作が制御される（図１１／ＳＴＥＰ２６）。具体的には、肘関節機構、手首関節機構およびラケットのそれぞれの位置が、第１目標運動軌道｛ｙ₁｝、｛ｙ₂｝および｛ｙ₃｝のそれぞれに追従し、かつ、肩関節機構およびＺＭＰのそれぞれの位置が第２目標運動軌道｛ｘ｝および｛ｚ｝のそれぞれに追従するように、アクチュエータ２４の動作が制御され、ロボット１の全身運動が制御される。
【００８１】
これにより、第１状態変数としてのラケット位置は第１指定運動軌道｛ｒ｝にほぼ一致する程度に近接して時系列的に変化する。具体的には、図１２（ａ）〜（ｃ）に順に示されているように腕体１２および脚体１４等が動かされ、ロボット１が片方の手部１３で持っているラケットをフォアハンドで振って、ボールを打ち返すという指定タスクを実行させることができる。
【００８２】
なお、ロボット１に向かってきたボール等の物体を手部１３でつかむ等、上体と物体との一時的な相互作用を伴う指定タスクのほか、物体を押しながら歩行する等、上体と物体との定常的な相互作用を伴う指定タスクが実行されうる。
【００８３】
（本発明の第２実施形態としてのロボットおよび行動制御システムの作用効果）
前記機能を発揮する本発明の第２実施形態としてのロボット１または行動制御システム２によれば、本発明の第１実施形態と同様の作用効果が奏される。そのほか、指定タスクの実行に際して上体（ラケット）と物体（ボール）との相互作用を伴うが、当該相互作用期間において、ロボット１がボールから受ける外力ｆに応じた変動量ｅが、第２状態変数のうち少なくとも１つ（ＺＭＰの水平位置ｚ）に加えられるような確率遷移モデルにしたがって目標運動軌道が生成される（関係式（２１）、図１０参照）。
【００８４】
これにより、ロボット１に上体の運動によって物体との相互作用を伴う指定タスクを実行させながら、これと同時に歩容を安定に継続させることができるようにロボット１の全体的な動作が制御されうる（図１２（ａ）〜（ｃ）参照）。
【００８５】
（本発明の他の実施形態）
本発明のさらなる実施形態における確率遷移モデルは、第１および第２実施形態と同様に、ロボット１の挙動が、図１３に示されている倒立振子と、この倒立振子の質点または上端から延設されているアームとのそれぞれの挙動により簡素化して表現されるという考え方にしたがって構築されている。第１および第２実施形態との相違点は、アームが真っ直ぐでその長さｄが可変であるという点である。
【００８６】
この場合の確率遷移モデルは、図１４に示されているダイナミクスベイジアンネットワーク（ＤＢＮ）により表現される。第１実施形態におけるロボット１２の運動方程式および制御則を表現する関係式（１４）に代えて関係式（３４）が適用される。
【００８７】
y[i]＝x[i]+DK(θ₁, ψ₁) ..(34)。
【００８８】
これにより、図１５に示されているような、手部１３の先端の目標位置軌道｛ｙ｝が第１目標運動軌道として生成される。手部１３の先端の目標位置軌道｛ｙ｝は、第１指定運動軌道｛ｒ｝にほぼ一致するように追従している。
【００８９】
また、同じく図１５に示されているような、上体質点（または肩関節機構）の目標位置軌道｛ｘ｝およびＺＭＰの目標水平位置軌道｛ｚ｝が第２目標運動軌道として生成される。図１５から、ＺＭＰの目標水平位置軌道｛ｚ｝は、第２指定運動軌道としての仮想的なＺＭＰの目標水平位置軌道｛ｕ｝に追従するように変化していることがわかる。
【００９０】
そして、行動制御システム２により、手部１３の先端の位置が、第１目標運動軌道｛ｙ｝に追従し、かつ、肩関節機構およびＺＭＰのそれぞれの位置が第２目標運動軌道｛ｘ｝および｛ｚ｝のそれぞれに追従するように、アクチュエータ２４の動作が制御され、ロボット１の全身運動が制御される。肩関節機構位置および手位置等から、肘関節機構および手首関節機構等のそれぞれの回転角度を算出しうるインバースキネマティクスモデルにしたがって、ロボット１に指定タスクを実行させるように肘関節機構および手首関節機構の動作が制御されうる。
【符号の説明】
【００９１】
１‥ロボット、２‥行動制御システム。

【特許請求の範囲】
【請求項１】
上体と、前記上体に連結されている腕体と、前記上体を支持する複数の脚体と、前記上体、前記腕体および前記複数の脚体のそれぞれの運動を目標運動軌道にしたがって制御するように構成されている行動制御システムとを備えているロボットであって、
前記行動制御システムが、前記腕体の運動状態を表わす第１状態変数と、前記第１状態変数の値の変動因子である前記上体の運動状態を表わす第２状態変数とのそれぞれを確率変数として表現する確率遷移モデルにしたがって、前記第１状態変数のうち少なくとも１つが前記ロボットに指定タスクを実行させるために定められている第１指定運動軌道に追従し、かつ、前記第２状態変数が前記ロボットに継続的に安定な動力学的条件を充足するように、前記第１状態変数および前記第２状態変数のそれぞれの時系列的な変化態様を前記目標運動軌道として生成するように構成されていることを特徴とするロボット。
【請求項２】
請求項１記載のロボットにおいて、
前記行動制御システムが、前記ロボットに他の物体との相互作用を伴う前記指定タスクを実行させるように前記第１指定運動軌道が定められていることを認識した場合、前記上体と前記物体との相互作用期間において、前記ロボットが前記物体から受ける外力に応じた変動量が加えられた前記確率遷移モデルにしたがって前記目標運動軌道を生成するように構成されていることを特徴とするロボット。
【請求項３】
請求項１または２記載のロボットにおいて、
前記行動制御システムが、確率変数のうち少なくとも１つの確率分布が切断分布により表現されている前記確率遷移モデルにしたがって前記目標運動軌道を生成するように構成されていることを特徴とするロボット。
【請求項４】
上体と、前記上体に連結されている腕体と、前記上体を支持する複数の脚体と、前記上体、前記腕体および前記複数の脚体のそれぞれの運動を目標運動軌道にしたがって制御するように構成されている行動制御システムであって、
前記腕体の運動状態を表わす第１状態変数と、前記第１状態変数の値の変動因子である前記上体の運動状態を表わす第２状態変数とのそれぞれを確率変数として表現する確率遷移モデルにしたがって、前記第１状態変数のうち少なくとも１つが前記ロボットに指定タスクを実行させるために定められている第１指定運動軌道に追従し、かつ、前記第２状態変数が前記ロボットに継続的に安定な動力学的条件を充足するように、前記第１状態変数および前記第２状態変数のそれぞれの時系列的な変化態様を前記目標運動軌道として生成するように構成されていることを特徴とする行動制御システム。

【図１】