ロボットおよびその行動制御システム
【課題】上体の運動によって指定タスクを実行しながら、継続的に安定することができるロボット等を提供する。
【解決手段】本発明のロボット1または行動制御システム2によれば、確率遷移モデルにしたがって、腕体の運動状態を表わす「第1状態変数」の時系列的な変化態様が、第1状態変数のうち少なくとも1つがロボット1に指定タスクを実行させるための第1指定運動軌道{r}に追従するように生成される。また、同じく確率遷移モデルにしたがって、上体の運動状態を表わす「第2状態変数」の時系列的な変化態様が、第2状態変数が継続的に安定な動力学的条件を充足するように生成される。
【解決手段】本発明のロボット1または行動制御システム2によれば、確率遷移モデルにしたがって、腕体の運動状態を表わす「第1状態変数」の時系列的な変化態様が、第1状態変数のうち少なくとも1つがロボット1に指定タスクを実行させるための第1指定運動軌道{r}に追従するように生成される。また、同じく確率遷移モデルにしたがって、上体の運動状態を表わす「第2状態変数」の時系列的な変化態様が、第2状態変数が継続的に安定な動力学的条件を充足するように生成される。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、上体と、当該上体に連結されている腕体と、当該上体を支持する複数の脚体とを有する脚式移動ロボットおよびその行動を制御するシステムに関する。
【背景技術】
【0002】
脚式移動ロボットに、手部で台車を押す、または、手部により把持しているラケットでボールを打ち返すなどのタスクを実行させるシステムが提案されている(特許文献1〜3参照)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2007−160428号公報
【特許文献2】特開2008−307640号公報
【特許文献3】特開2010−005761号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかし、ロボットにタスクを実行させることを優先して上体および腕体の運動が制御されることにより、脚体に対する上体の位置および姿勢が当該エージェントの歩容を安定に継続させる観点から不適当になる可能性がある。
【0005】
そこで、本発明は、上体の運動によって指定タスクを実行しながら、継続的に安定することができるロボット等を提供することを解決課題とする。
【課題を解決するための手段】
【0006】
本発明は、上体と、前記上体に連結されている腕体と、前記上体を支持する複数の脚体と、前記上体、前記腕体および前記複数の脚体のそれぞれの運動を目標運動軌道にしたがって制御するように構成されている行動制御システムとを備えているロボットに関する。
【0007】
前記課題を解決するための本発明のロボットは、前記行動制御システムが、前記腕体の運動状態を表わす第1状態変数と、前記第1状態変数の値の変動因子である前記上体の運動状態を表わす第2状態変数とのそれぞれを確率変数として表現する確率遷移モデルにしたがって、前記第1状態変数のうち少なくとも1つが前記ロボットに指定タスクを実行させるために定められている第1指定運動軌道に追従し、かつ、前記第2状態変数が前記ロボットに継続的に安定な動力学的条件を充足するように、前記第1状態変数および前記第2状態変数のそれぞれの時系列的な変化態様を前記目標運動軌道として生成するように構成されていることを特徴とする。
【0008】
本発明のロボットまたはその制御システムによれば、確率遷移モデルにしたがって、腕体の運動状態を表わす「第1状態変数」の時系列的な変化態様(第1目標運動軌道)が、第1状態変数のうち少なくとも1つがロボットに指定タスクを実行させるための第1指定運動軌道に追従するように生成される。また、同じく確率遷移モデルにしたがって、上体の運動状態を表わす「第2状態変数」の時系列的な変化態様(第2目標運動軌道)が、第2状態変数が継続的に安定な動力学的条件を充足するように生成される。
【0009】
第2状態変数は第1状態変数の値の変動因子であるため、継続的に安定な第2目標運動軌道が生成されることにより、第1状態変数を第1指定運動軌道に厳密に追従させることが困難となる可能性がある。しかるに、確率遷移モデルにおいて、第1状態変数が確率変数として表現されているため、第1状態変数のうち少なくとも1つの第1指定運動軌道に対する追従度(守りきり度合い)の高低が、ロボットに指定タスクを実行させるという条件下で柔軟に調節されうる。
【0010】
具体的には、ロボットに指定タスクを実行させる観点から重要度が比較的高い時点においては、第1状態変数を第1指定運動軌道に比較的厳密に一致または近接させる必要がある。その一方、当該重要度が比較的低い時点においては、第1状態変数を第1指定運動軌道からある程度乖離させることが許容される。
【0011】
これにより、ロボットに上体の運動によって指定タスクを実行させながら、これと同時に継続的に安定にすることができるようにロボットの全体的な動作が制御されうる。
【0012】
前記行動制御システムが、前記ロボットに他の物体との相互作用を伴う前記指定タスクを実行させるように前記第1指定運動軌道が定められていることを認識した場合、前記上体と前記物体との相互作用期間において、前記ロボットが前記物体から受ける外力に応じた変動量が加えられた前記確率遷移モデルにしたがって前記目標運動軌道を生成するように構成されていてもよい。
【0013】
当該構成のロボットによれば、ロボットに物体との相互作用を伴う指定タスクを実行させながら、これと同時に継続的に安定にすることができるようにロボットの全体的な動作が制御されうる。
【0014】
前記行動制御システムが、確率変数のうち少なくとも1つの確率分布が切断分布により表現されている前記確率遷移モデルにしたがって前記目標運動軌道を生成するように構成されていてもよい。
【0015】
当該構成のロボットによれば、確率遷移モデルにおいて確率変数として表現されている状態変数のうち少なくとも1つの確率分布が切断分布により表現される。切断分布とは、確率が正値である状態変数値範囲と、確率が0になる状態変数値範囲とが隣接するような確率分布を意味する。
【0016】
このため、ロボットの構造的な制約条件または安定な歩容のための動力学的条件等に応じて、当該状態変数がとりえない数値範囲を、切断分布において確率が0になる状態変数値範囲に一致させることにより、当該条件が充足されるようにロボットの全体的な動作が制御されうる。
【図面の簡単な説明】
【0017】
【図1】本発明の一実施形態としてのロボットの構成説明図。
【図2】本発明の一実施形態としてのロボットの制御システムの構成説明図。
【図3】ロボットの挙動を表わす簡易モデルに関する説明図。
【図4】第1実施形態における確率遷移モデルに関する説明図。
【図5】第1実施形態におけるロボットの行動制御方法に関する説明図。
【図6】目標運動軌道に関する説明図。
【図7】アーム長さ限界に関する説明図。
【図8】関節角度限界に関する説明図。
【図9】第1実施形態におけるロボットの指定タスクに関する説明図。
【図10】第2実施形態における確率遷移モデルに関する説明図。
【図11】第2実施形態におけるロボットの行動制御方法に関する説明図
【図12】第2実施形態におけるロボットの指定タスクに関する説明図。
【図13】ロボットの挙動を表わす他の簡易モデルに関する説明図。
【図14】他の実施形態における確率遷移モデルに関する説明図。
【図15】他の実施形態における目標運動軌道に関する説明図。
【発明を実施するための形態】
【0018】
(ロボットの構成)
まず、本発明の一実施形態としてのロボットの構成について説明する。
【0019】
図1に示されているロボット1は脚式移動ロボットであり、人間と同様に基体10と、基体10の上部に設けられた頭部11と、基体10の上部左右両側から延設された左右の腕体12と、腕体12の先端部に設けられた手部13と、基体10の下部から下方に延設された左右の脚体14と、脚体14の先端部に取り付けられている足平部15とを備えている。ロボット1は、アクチュエータ24から伝達される力によって、人間の肩関節、肘関節、手首関節、股関節、膝関節、足首関節等の複数の関節に相当する複数の関節機構において腕体12や脚体14を屈伸運動させることができる。
【0020】
腕体12は肩関節機構を介して基体10に連結された第1腕リンクと、一端が第1腕リンクの端部に肘関節機構を介して連結され、他端が手首関節を介して手部13の付根部に連結されている第2腕リンクとを備えている。肩関節機構は、ヨー軸およびピッチ軸のそれぞれの回りの2つの回転自由度を有する。肘関節機構は、ピッチ軸回りの1つの回転自由度を有する。手首関節機構は、ロール軸およびピッチ軸のそれぞれの回りの2つの回転自由度を有する。
【0021】
脚体14は股関節機構を介して基体10に連結された第1脚リンクと、一端が第1脚リンクの端部に膝関節機構を介して連結され、他端が足首関節を介して足平部15に連結されている第2脚リンクとを備えている。股関節機構は、ヨー軸、ピッチ軸およびロール軸のそれぞれの回りの3つの回転自由度を有する。膝関節機構は、ピッチ軸回りの1つの回転自由度を有する。足首関節機構は、ピッチ軸およびロール軸のそれぞれ回りの2つの回転自由度を有する。ロボット1は、左右の脚体14のそれぞれの離床および着床の繰り返しを伴う動きによって自律的に移動することができる。
【0022】
(行動制御システムの構成)
図2に示されている行動制御システム2はロボット1に搭載されている電子制御ユニット(CPU,ROM,RAM,I/O回路等により構成されている。)またはコンピュータにより構成されている。
【0023】
行動制御システム2は内部状態センサ群21および外部状態センサ群22のそれぞれの出力信号に基づいて種々の状態変数の値を認識するように構成されている。
【0024】
内部状態センサ群21にはロボット1の位置(重心位置)を測定するためのGPS測定装置または加速度センサのほか、基体10の姿勢を測定するためのジャイロセンサ、各関節機構の屈曲角度等を測定するロータリーエンコーダ等が含まれている。
【0025】
外部状態センサ群22にはロボット1とは別個独立のモーションキャプチャーシステム(図示略)のほか、ボール等のタスク実行に関連する物体の位置軌道を測定するため、頭部11に搭載されているステレオイメージセンサや、基体10に搭載されている赤外光を用いたアクティブ型センサ等が含まれる。
【0026】
行動制御システム2は、後述の確率遷移モデルにしたがって、第1状態変数および第2状態変数のそれぞれの時系列的な変化態様を目標運動軌道として生成するように構成されている。第1状態変数は、腕体12および手部13の運動状態を表わす。第2状態変数は、ロボット1の上体の運動状態を表わす。行動制御システム2は、状態変数の認識結果に基づき、アクチュエータ24の動作を制御することにより、目標運動軌道にしたがってロボット1の運動態様を制御するように構成されている。
【0027】
行動制御システム2が「構成されている」とは、行動制御システム2がメモリ等の記憶手段から必要なソフトウェアおよびデータを読み出し、当該データを対象として当該ソフトウェアにしたがった演算処理を実行すること、さらには当該演算処理の結果として制御指令信号を生成し、制御対象に宛てて当該信号を出力すること等により、ロボット1の行動制御等の目的を達成することを意味する。
【0028】
本発明の構成要素が情報を「認識する」とは、当該構成要素が情報をデータベースから検索すること、メモリ等の記憶装置から情報を読み取ること、センサ等の出力信号に基づき情報を測定、算定、推定、判定すること、測定等された情報をメモリに格納すること等、当該情報をさらなる演算処理のために準備または用意するのに必要なあらゆる情報処理を実行することを意味する。
【0029】
行動制御システム2のうち一部がロボット1の外部コンピュータにより構成され、残りの部分が当該外部コンピュータから演算結果を無線または有線方式で通信可能なコンピュータにより構成されていてもよい。
【0030】
(本発明の第1実施形態における確率遷移モデル)
本発明の第1実施形態における確率遷移モデルは、ロボット1の挙動が、図3に示されているように倒立振子と、この倒立振子の質点または上端から延設されているアームとのそれぞれの挙動により簡素化して表現されているという考え方にしたがって構築されている。
【0031】
倒立振子は、高さhが一定であり、下端を支点としてロール軸およびピッチ軸のそれぞれ回りに揺動可能であると仮定されている。ロボット1の上体の仮想目標位置はu=(ux,uy)により表わされている。ロボット1のZMPの水平位置は、倒立振子の下端水平位置z=(zx,zy)により表わされている。ZMPとは、足平部15の全体に分布してかかっている床反力の法線成分を、ある一点にかかっているとして置き換えたときの作用点を意味する。ロボット1の上体質点または肩関節機構の水平位置および水平速度のそれぞれは、倒立振子の上端水平位置x=(xx,xy)および上端水平速度v=(vx,vy)により表わされている。
【0032】
「水平」という記載は、対象物理量がグローバル座標系のヨー軸に対して垂直な2つの方向成分により表現されることを意味している。「水平」という記載が付されていない場合、対象物理量がグローバル座標系の相互に垂直な3つの方向成分により表現されることを意味している。
【0033】
倒立振子の挙動状態を表わす状態変数(x,v)は、ロボット1の上体の運動状態を表わす「第2状態変数」に相当する。
【0034】
アームは倒立振子の上端から順に連接された3つのリンクにより構成されている。当該3つのリンクは、ロボット1の腕体12の第1腕リンクおよび第2腕リンクならびに手部13のそれぞれに相当する。ロボット1の肘関節機構の位置は、第1リンクの先端位置y1=(y1x,y1y,y1z)より表わされている。ロボット1の手首関節機構の位置は、第2リンクの先端位置y2=(y2x,y2y,y2z)により表わされている。ロボット1の手部13の先端位置は、第3リンクの先端位置y3=(y3x,y3y,y3z)により表わされている。
【0035】
基体10に対する第1腕リンクの姿勢を定める肩関節機構の直交する2軸回りのそれぞれの回転角度は、倒立振子に対するアームの第1リンクの直交する2軸回りのそれぞれの回転角度(θ1,ψ1)により表わされている。第1腕リンクに対する第2腕リンクの姿勢を定める肘関節機構の1軸回りの回転角度は、アームの第1リンクに対する第2リンクの1軸回りの回転角度θ2により表わされている。第2腕リンクに対する手部13の姿勢を定める手首関節機構の直交する2軸回りのそれぞれの回転角度は、アームの第2リンクに対する第3リンクの直交する2軸回りのそれぞれの回転角度(θ3,ψ2)により表わされている。
【0036】
アームの挙動に関して、その付け根から先端位置までの距離dが考慮される。
【0037】
アームの挙動を表わす状態変数(y1,y2,y3)は、ロボット1の腕体12の運動状態を表わす「第1状態変数」に相当する。
【0038】
確率遷移モデルは、図4に示されているダイナミクスベイジアンネットワーク(DBN)により表現される。このDBNによれば、ロボット1の挙動を簡易表現する前述の倒立振子およびアームの運動方程式および制御則が、各時点tにおける状態変数を確率変数として表わす複数のノード(円)と、当該ノードをつなぐ矢印により表現されている。ロボット1の運動方程式および制御則は関係式(11)〜(14)のそれぞれにより表現される。
【0039】
z[i]=(-u[i]k/(k+1)+x[i-1]+v[i-1]/ω0)(ω0+kω0)Δt/(1-exp(-ω0Δt)) ..(11)。
【0040】
v[i]=v[i-1]+ω0ω0(x[i-1]-z[i])Δt ..(12)。
【0041】
x[i]=x[i-1]+v[i]Δt ..(13)。
【0042】
y[i]=x[i]+DK(θ1, ψ1, θ2, θ3, ψ2) ..(14)。
【0043】
関係式(11)は、ロボット1が発散しないようにZMPの水平位置zが上体の目標水平位置軌道u(第2指定運動軌道に相当する。)に追従する制御則を表わしている。ロボット1が発散するとは、ロボット1が転倒する蓋然性が高くなる程度にその体勢が崩れてしまうことを意味し、この発散を抑制するために発散成分が考慮されている。ロボット1の発散成分の値とは、ロボット1の基体10の位置が両足平部15の位置(より具体的には、支持脚側足平部15の接地面に設定されたグローバル座標系(支持脚座標系)の原点)からかけ離れていく具合を表す数値である(特許第3672100号公報、第3674788号公報等、出願人の所有に係る公開公報参照)。
【0044】
発散成分は、上体質点水平位置x、上体質点水平速度vおよび所定の定数(たとえば倒立振子の固有振動数)ω0を用いて関係式(01)により表現される。
【0045】
(発散成分)=x+v/ω0 ..(01)。
【0046】
ロボット1のZMPの水平位置zは、上体の目標位置軌道u、上体質点水平位置x、上体質点水平速度v、フィードバック係数kおよび倒立振子の固有振動数ω0を用いて、関係式(02)により表現される。
【0047】
z=(-u・k/(k+1)+x+v/ω0)(ω0+k・ω0)Δt/(1-exp(-ω0Δt)) …(02)。
【0048】
アームの付け根から先端位置までの距離dは、ロボット1の肩関節機構から手部13の先端までの距離の許容範囲外で確率が0になる切断分布により確率分布が表わされる確率変数である。同様に、アームの姿勢を表わす関節角度p=(θ1,ψ1,θ2,θ3,ψ2)は確率変数で、ロボット1の腕体12の各関節機構の屈曲角度の許容範囲外で確率が0になる切断分布により確率分布が表わされる確率変数である。
【0049】
関係式(14)右辺におけるDKは、関節角度pに基づき、アームの第1〜第3リンクのそれぞれの先端位置を算出するための、順運動額的または幾何学的関係を表わす関数である。
【0050】
(本発明の第1実施形態としてのロボットおよび行動制御システムの機能)
本発明の第1実施形態としての、前記構成を有するロボット1および行動制御システム2の機能について説明する。本発明の第1実施形態によれば、図9(a)〜(c)に示されているように、一方の手部13で把持しているラケットをフォアハンドストロークで素振りするという指定タスクをロボット1に実行させる。
【0051】
まず、行動制御システム2(またはその構成要素である第1指定運動軌道認識要素)により、ロボット1に指定タスクを実行させるために定められている第1指定運動軌道{r}=[r(t1), ..r(t1+(i-1)Δt), r(t1+iΔt), r(t1+(i+1)Δt), .. r(t2)]が認識される(図5/STEP11)。
【0052】
第1指定運動軌道{r}、すなわち、手部13の先端位置の時系列的な模範変化態様は、特開2010−005761号公報に開示されている手法と同様の手法にしたがって生成される。具体的には、まず、外部状態センサ22を構成する光学式、機械式、磁気式または慣性式モーションキャプチャーシステムにより、インストラクタ(人間)が複数回にわたり指定タスクを実行する際の、手位置の時系列的な変化態様が測定される。そして、この観測結果に基づき、インストラクタおよびロボット1の身体サイズの相違に応じたスケーリングが実行されることにより、第1指定運動軌道が生成される。第1指定運動軌道は記憶装置に格納される。
【0053】
なお、あらかじめ定められた第1指定運動軌道が、リモコン等の外部機器からロボット1に送信され、記憶装置に格納されてもよい。
【0054】
また、第1状態変数の時系列的な目標変化態様を表わす「第1目標運動軌道」および第2状態変数の時系列的な目標変化態様を表わす「第2目標運動軌道」が、目標運動軌道として生成される(図5/STEP12)。
【0055】
具体的には、行動制御システム2(またはその構成要素である目標運動軌道認識要素)により、第1基準時点t=t1から第2基準時点t=t2=t1+NΔtまでのN+1個のノードが、関係式(11)〜(14)により表現される確率遷移モデルにしたがって、順次推定される。ロボット1が指定タスクの実行開始時点t1におけるDBNにおける各ノードの推定方法としてはギブスサンプリング等の方法が採用される。
【0056】
これにより、図6に示されているような、肘関節機構の目標位置軌道{y1}、手首関節機構の目標位置軌道{y2}および手部13の先端の目標位置軌道{y3}が第1目標運動軌道として生成される。手部13の先端の目標位置軌道{y3}は、第1指定運動軌道{r}にほぼ一致するように追従している。
【0057】
また、同じく図6に示されているような、上体質点(または肩関節機構)の目標位置軌道{x}およびZMPの目標水平位置軌道{z}が第2目標運動軌道として生成される。図7に示されているように肩関節機構と手部13の先端との間隔dが、その許容範囲[dlow,dup]に収まるように目標運動軌道が生成される。
【0058】
同様に、確率遷移モデルによれば、図8(a)に示されているように肩関節機構の直交する2軸回りの回転角度θ1およびψ1と、肘関節機構の1軸回りの回転角度θ2とのそれぞれが、その許容範囲[θ1low,θ1up]、[ψ1low,ψ1up]および[θ2low,θ2up]のそれぞれに収まるように目標運動軌道が生成される。さらに、確率遷移モデルによれば、図8(b)に示されているように手首関節機構の直交する2軸回りの回転角度θ3およびψ2のそれぞれが、その許容範囲[θ3low,θ3up]および[ψ2low,ψ2up]のそれぞれに収まるように目標運動軌道が生成される。
【0059】
これは、確率遷移モデルにおいて、当該許容範囲外では確率が0になるような切断分布を確率分布として有する確率変数として、当該間隔dおよび関節角度が表現されているからである。
【0060】
そして、行動制御システム2により、目標運動軌道にしたがって、ロボット1の動作が制御される(図5/STEP13)。具体的には、肘関節機構、手首関節機構および手部13の先端のそれぞれの位置が、第1目標運動軌道{y1}、{y2}および{y3}のそれぞれに追従し、かつ、肩関節機構およびZMPのそれぞれの位置が第2目標運動軌道{x}および{z}のそれぞれに追従するように、アクチュエータ24の動作が制御され、ロボット1の全身運動が制御される。
【0061】
これにより、第1状態変数としての手部13の先端位置は第1指定運動軌道{r}にほぼ一致する程度に近接して時系列的に変化する。具体的には、図9(a)〜(c)に順に示されているように腕体12および脚体14等が動かされ、ロボット1が片方の手部13で持っているラケットをフォアハンドで素振りをするという指定タスクを実行させることができる。
【0062】
(本発明の第1実施形態としてのロボットおよび行動制御システムの作用効果)
前記機能を発揮する本発明の第1実施形態としてのロボット1または行動制御システム2によれば、確率遷移モデルにしたがって、上体の運動状態を表わす「第1状態変数」の時系列的な変化態様(第1目標運動軌道)が、第1状態変数のうち少なくとも1つ(手位置またはラケット位置)がロボット1に指定タスクを実行させるための第1指定運動軌道{r}に追従するように生成される(図6参照)。
【0063】
また、同じく確率遷移モデルにしたがって、ロボット1の歩容状態を表わす「第2状態変数」の時系列的な変化態様(第2目標運動軌道)が、第2状態変数がロボット1を継続的に安定させる動力学的条件(関係式(11)参照)を充足するように生成される。
【0064】
第2状態変数は第1状態変数の値の変動因子であるため、ロボット1を継続的に安定にする第2目標運動軌道が生成されることにより、第1状態変数を第1指定運動軌道に厳密に追従させることが困難となる可能性がある。しかるに、確率遷移モデルにおいて、第1状態変数が確率変数として表現されているため、第1状態変数のうち少なくとも1つ(手位置)の第1指定運動軌道に対する追従度(守りきり度合い)の高低が、ロボット1に指定タスクを実行させるという条件下で柔軟に調節されうる。
【0065】
具体的には、ロボット1に指定タスクを実行させる観点から重要度が比較的高い時点においては、第1状態変数を第1指定運動軌道{r}に比較的厳密に一致または近接させる必要がある。その一方、当該重要度が比較的低い時点においては、第1状態変数を第1指定運動軌道からある程度乖離させることが許容される。
【0066】
確率変数のうち少なくとも1つ(肩関節機構と手先端位置との間隔dおよび腕体の各関節角度)の確率分布が切断分布により表現されている確率遷移モデルにしたがって目標運動軌道が生成される。このため、ロボット1の構造的な制約条件または安定な歩容のための動力学的条件等に応じて、当該状態変数がとりえない数値範囲を、切断分布において確率が0になる状態変数値範囲に一致させることにより、当該条件が充足されるようにロボット1の全体的な動作が制御されうる(図7および図8(a)(b)参照)。
【0067】
(本発明の第2実施形態における確率遷移モデル)
本発明の第2実施形態における確率遷移モデルは、第1実施形態と同様にロボット1の挙動が、図3に示されているように倒立振子とアームとのそれぞれの挙動により簡素化して表現されているという考え方にしたがって構築されている。第2実施形態は、ロボット1に物体との相互作用を伴う指定タスクを実行させるため、当該相互作用によってロボット1が物体から受ける力が考慮される点で、第1実施形態と相違する。
【0068】
この相違点は、確率遷移モデルを表現する関係式(11)に代えて、指定タスクの実行時にロボット1が物体から受けた力fをZMP相当量に変換した結果eが右辺に追加されている新たな関係式(21)により確率遷移モデルが表現されていることに反映されている。
【0069】
z[i]=(-u[i]k/(k+1)+x[i-1]+v[i-1]/ω0)(ω0+kω0)Δt/(1-exp(-ω0Δt))+e
-=z[i]=(-u[i]k/(k+1)+x[i-1]+v[i-1]/ω0)(ω0+kω0)Δt/(1-exp(-ω0Δt))+fh/mg ..(21)
ここで、hは倒立振子の高さであり、mは倒立振子の質量であり、gは重力加速度である。
【0070】
(本発明の第2実施形態としてのロボットおよび行動制御システムの機能)
本発明の第2実施形態としての、前記構成を有するロボット1および行動制御システム2の機能について説明する。本発明の第1実施形態によれば、図12(a)〜(c)に示されているように、一方の手部13で把持しているラケットをフォアハンドストロークで振り、ボール(物体)を打ち返すという指定タスクをロボット1に実行させる。
【0071】
指定タスクの性質上、ラケットは手部13の一部であるとみなされる。確率遷移モデルにおいて、手部13により把持されているラケットのガット(ボールを当てる箇所)の位置(ラケット位置)が、当該手部13の先端位置xとして扱われる。
【0072】
まず、行動制御システム2(またはその構成要素であるボール位置軌道測定要素)により、外部状態センサ群22の出力信号により表わされるボールの時系列的な位置に基づき、世界座標系またはロボット座標系におけるボールの位置が時系列的に測定される(図11/STEP21、図12(a)参照)。
【0073】
続いて、行動制御システム2(またはその構成要素であるボール位置軌道予測要素)により、ボールの時系列的な推定位置x1(k)に基づき、このボールの位置軌道が予測される(図11/STEP22、図12(a)破線参照)。ボールの予測位置x1(t)は、現在時刻kにおけるボールの計測位置x1(k)、速度v1(k)={x1(k)−x1(k-1)}/Δtおよび加速度α1(k)={v1(k)−v1(k-1)}/Δt(Δt:演算周期)に基づき、運動方程式にしたがって算出される。
【0074】
さらに、行動制御システム2(またはその構成要素である相互作用点候補設定要素)により、ロボット1の運動によってラケット(そのガット)が到達可能な範囲において、ラケットとボールとの相互作用点または打点が設定される(図11/STEP23、図12(a)参照)。
【0075】
ラケットの到達可能範囲は、内部状態センサ群21の出力信号により表わされる各関節機構の屈曲角度、ならびに、手部13に対するラケットの位置および姿勢等のキネマティクスパラメータに基づき、キネマティクス演算法にしたがって推定される。ラケットの到達可能範囲の推定に際して、ロボット1の基体10および腕体12など、異なる部分が相互に干渉または接触しないことが確認される。
【0076】
手部13の掌に対して位置および姿勢が固定されているハンド座標系におけるラケットの位置はあらかじめ定められていてもよいが、内部状態センサ群21を構成する撮像装置によって撮像された手部13に対するラケットのグリップの握り位置および姿勢に基づいて逐次算出されてもよい。
【0077】
さらに、行動制御システム2により、ロボット1に指定タスクを実行させるために定められている、第1状態変数としてのラケット位置の時系列的な模範位置軌道を表わす第1指定運動軌道{r}が認識される(図11/STEP24)。たとえば、記憶装置に格納されている複数の第1指定運動軌道のうち、ボールの到達予測時刻において設定相互作用点を通る一の第1指定運動軌道が選定される。
【0078】
また、第1状態変数の時系列的な目標変化態様を表わす「第1目標運動軌道」および第2状態変数の時系列的な目標変化態様を表わす「第2目標運動軌道」が、目標運動軌道として生成される(図11/STEP25(図6参照))。
【0079】
具体的には、行動制御システム2(またはその構成要素である目標運動軌道認識要素)により、第1基準時点t=t1から第2基準時点t=t2=t1+NΔtまでのN+1個のノードが、確率遷移モデルにしたがって順次推定される。この際、図10に示されているように、確率遷移モデルを表わすDBNにおいて、少なくともラケットとボールとの相互作用期間において当該力fおよびそのZMP換算結果eを表わすノードが追加されている。
【0080】
そして、行動制御システム2により、目標運動軌道にしたがって、ロボット1の動作が制御される(図11/STEP26)。具体的には、肘関節機構、手首関節機構およびラケットのそれぞれの位置が、第1目標運動軌道{y1}、{y2}および{y3}のそれぞれに追従し、かつ、肩関節機構およびZMPのそれぞれの位置が第2目標運動軌道{x}および{z}のそれぞれに追従するように、アクチュエータ24の動作が制御され、ロボット1の全身運動が制御される。
【0081】
これにより、第1状態変数としてのラケット位置は第1指定運動軌道{r}にほぼ一致する程度に近接して時系列的に変化する。具体的には、図12(a)〜(c)に順に示されているように腕体12および脚体14等が動かされ、ロボット1が片方の手部13で持っているラケットをフォアハンドで振って、ボールを打ち返すという指定タスクを実行させることができる。
【0082】
なお、ロボット1に向かってきたボール等の物体を手部13でつかむ等、上体と物体との一時的な相互作用を伴う指定タスクのほか、物体を押しながら歩行する等、上体と物体との定常的な相互作用を伴う指定タスクが実行されうる。
【0083】
(本発明の第2実施形態としてのロボットおよび行動制御システムの作用効果)
前記機能を発揮する本発明の第2実施形態としてのロボット1または行動制御システム2によれば、本発明の第1実施形態と同様の作用効果が奏される。そのほか、指定タスクの実行に際して上体(ラケット)と物体(ボール)との相互作用を伴うが、当該相互作用期間において、ロボット1がボールから受ける外力fに応じた変動量eが、第2状態変数のうち少なくとも1つ(ZMPの水平位置z)に加えられるような確率遷移モデルにしたがって目標運動軌道が生成される(関係式(21)、図10参照)。
【0084】
これにより、ロボット1に上体の運動によって物体との相互作用を伴う指定タスクを実行させながら、これと同時に歩容を安定に継続させることができるようにロボット1の全体的な動作が制御されうる(図12(a)〜(c)参照)。
【0085】
(本発明の他の実施形態)
本発明のさらなる実施形態における確率遷移モデルは、第1および第2実施形態と同様に、ロボット1の挙動が、図13に示されている倒立振子と、この倒立振子の質点または上端から延設されているアームとのそれぞれの挙動により簡素化して表現されるという考え方にしたがって構築されている。第1および第2実施形態との相違点は、アームが真っ直ぐでその長さdが可変であるという点である。
【0086】
この場合の確率遷移モデルは、図14に示されているダイナミクスベイジアンネットワーク(DBN)により表現される。第1実施形態におけるロボット12の運動方程式および制御則を表現する関係式(14)に代えて関係式(34)が適用される。
【0087】
y[i]=x[i]+DK(θ1, ψ1) ..(34)。
【0088】
これにより、図15に示されているような、手部13の先端の目標位置軌道{y}が第1目標運動軌道として生成される。手部13の先端の目標位置軌道{y}は、第1指定運動軌道{r}にほぼ一致するように追従している。
【0089】
また、同じく図15に示されているような、上体質点(または肩関節機構)の目標位置軌道{x}およびZMPの目標水平位置軌道{z}が第2目標運動軌道として生成される。図15から、ZMPの目標水平位置軌道{z}は、第2指定運動軌道としての仮想的なZMPの目標水平位置軌道{u}に追従するように変化していることがわかる。
【0090】
そして、行動制御システム2により、手部13の先端の位置が、第1目標運動軌道{y}に追従し、かつ、肩関節機構およびZMPのそれぞれの位置が第2目標運動軌道{x}および{z}のそれぞれに追従するように、アクチュエータ24の動作が制御され、ロボット1の全身運動が制御される。肩関節機構位置および手位置等から、肘関節機構および手首関節機構等のそれぞれの回転角度を算出しうるインバースキネマティクスモデルにしたがって、ロボット1に指定タスクを実行させるように肘関節機構および手首関節機構の動作が制御されうる。
【符号の説明】
【0091】
1‥ロボット、2‥行動制御システム。
【技術分野】
【0001】
本発明は、上体と、当該上体に連結されている腕体と、当該上体を支持する複数の脚体とを有する脚式移動ロボットおよびその行動を制御するシステムに関する。
【背景技術】
【0002】
脚式移動ロボットに、手部で台車を押す、または、手部により把持しているラケットでボールを打ち返すなどのタスクを実行させるシステムが提案されている(特許文献1〜3参照)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2007−160428号公報
【特許文献2】特開2008−307640号公報
【特許文献3】特開2010−005761号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかし、ロボットにタスクを実行させることを優先して上体および腕体の運動が制御されることにより、脚体に対する上体の位置および姿勢が当該エージェントの歩容を安定に継続させる観点から不適当になる可能性がある。
【0005】
そこで、本発明は、上体の運動によって指定タスクを実行しながら、継続的に安定することができるロボット等を提供することを解決課題とする。
【課題を解決するための手段】
【0006】
本発明は、上体と、前記上体に連結されている腕体と、前記上体を支持する複数の脚体と、前記上体、前記腕体および前記複数の脚体のそれぞれの運動を目標運動軌道にしたがって制御するように構成されている行動制御システムとを備えているロボットに関する。
【0007】
前記課題を解決するための本発明のロボットは、前記行動制御システムが、前記腕体の運動状態を表わす第1状態変数と、前記第1状態変数の値の変動因子である前記上体の運動状態を表わす第2状態変数とのそれぞれを確率変数として表現する確率遷移モデルにしたがって、前記第1状態変数のうち少なくとも1つが前記ロボットに指定タスクを実行させるために定められている第1指定運動軌道に追従し、かつ、前記第2状態変数が前記ロボットに継続的に安定な動力学的条件を充足するように、前記第1状態変数および前記第2状態変数のそれぞれの時系列的な変化態様を前記目標運動軌道として生成するように構成されていることを特徴とする。
【0008】
本発明のロボットまたはその制御システムによれば、確率遷移モデルにしたがって、腕体の運動状態を表わす「第1状態変数」の時系列的な変化態様(第1目標運動軌道)が、第1状態変数のうち少なくとも1つがロボットに指定タスクを実行させるための第1指定運動軌道に追従するように生成される。また、同じく確率遷移モデルにしたがって、上体の運動状態を表わす「第2状態変数」の時系列的な変化態様(第2目標運動軌道)が、第2状態変数が継続的に安定な動力学的条件を充足するように生成される。
【0009】
第2状態変数は第1状態変数の値の変動因子であるため、継続的に安定な第2目標運動軌道が生成されることにより、第1状態変数を第1指定運動軌道に厳密に追従させることが困難となる可能性がある。しかるに、確率遷移モデルにおいて、第1状態変数が確率変数として表現されているため、第1状態変数のうち少なくとも1つの第1指定運動軌道に対する追従度(守りきり度合い)の高低が、ロボットに指定タスクを実行させるという条件下で柔軟に調節されうる。
【0010】
具体的には、ロボットに指定タスクを実行させる観点から重要度が比較的高い時点においては、第1状態変数を第1指定運動軌道に比較的厳密に一致または近接させる必要がある。その一方、当該重要度が比較的低い時点においては、第1状態変数を第1指定運動軌道からある程度乖離させることが許容される。
【0011】
これにより、ロボットに上体の運動によって指定タスクを実行させながら、これと同時に継続的に安定にすることができるようにロボットの全体的な動作が制御されうる。
【0012】
前記行動制御システムが、前記ロボットに他の物体との相互作用を伴う前記指定タスクを実行させるように前記第1指定運動軌道が定められていることを認識した場合、前記上体と前記物体との相互作用期間において、前記ロボットが前記物体から受ける外力に応じた変動量が加えられた前記確率遷移モデルにしたがって前記目標運動軌道を生成するように構成されていてもよい。
【0013】
当該構成のロボットによれば、ロボットに物体との相互作用を伴う指定タスクを実行させながら、これと同時に継続的に安定にすることができるようにロボットの全体的な動作が制御されうる。
【0014】
前記行動制御システムが、確率変数のうち少なくとも1つの確率分布が切断分布により表現されている前記確率遷移モデルにしたがって前記目標運動軌道を生成するように構成されていてもよい。
【0015】
当該構成のロボットによれば、確率遷移モデルにおいて確率変数として表現されている状態変数のうち少なくとも1つの確率分布が切断分布により表現される。切断分布とは、確率が正値である状態変数値範囲と、確率が0になる状態変数値範囲とが隣接するような確率分布を意味する。
【0016】
このため、ロボットの構造的な制約条件または安定な歩容のための動力学的条件等に応じて、当該状態変数がとりえない数値範囲を、切断分布において確率が0になる状態変数値範囲に一致させることにより、当該条件が充足されるようにロボットの全体的な動作が制御されうる。
【図面の簡単な説明】
【0017】
【図1】本発明の一実施形態としてのロボットの構成説明図。
【図2】本発明の一実施形態としてのロボットの制御システムの構成説明図。
【図3】ロボットの挙動を表わす簡易モデルに関する説明図。
【図4】第1実施形態における確率遷移モデルに関する説明図。
【図5】第1実施形態におけるロボットの行動制御方法に関する説明図。
【図6】目標運動軌道に関する説明図。
【図7】アーム長さ限界に関する説明図。
【図8】関節角度限界に関する説明図。
【図9】第1実施形態におけるロボットの指定タスクに関する説明図。
【図10】第2実施形態における確率遷移モデルに関する説明図。
【図11】第2実施形態におけるロボットの行動制御方法に関する説明図
【図12】第2実施形態におけるロボットの指定タスクに関する説明図。
【図13】ロボットの挙動を表わす他の簡易モデルに関する説明図。
【図14】他の実施形態における確率遷移モデルに関する説明図。
【図15】他の実施形態における目標運動軌道に関する説明図。
【発明を実施するための形態】
【0018】
(ロボットの構成)
まず、本発明の一実施形態としてのロボットの構成について説明する。
【0019】
図1に示されているロボット1は脚式移動ロボットであり、人間と同様に基体10と、基体10の上部に設けられた頭部11と、基体10の上部左右両側から延設された左右の腕体12と、腕体12の先端部に設けられた手部13と、基体10の下部から下方に延設された左右の脚体14と、脚体14の先端部に取り付けられている足平部15とを備えている。ロボット1は、アクチュエータ24から伝達される力によって、人間の肩関節、肘関節、手首関節、股関節、膝関節、足首関節等の複数の関節に相当する複数の関節機構において腕体12や脚体14を屈伸運動させることができる。
【0020】
腕体12は肩関節機構を介して基体10に連結された第1腕リンクと、一端が第1腕リンクの端部に肘関節機構を介して連結され、他端が手首関節を介して手部13の付根部に連結されている第2腕リンクとを備えている。肩関節機構は、ヨー軸およびピッチ軸のそれぞれの回りの2つの回転自由度を有する。肘関節機構は、ピッチ軸回りの1つの回転自由度を有する。手首関節機構は、ロール軸およびピッチ軸のそれぞれの回りの2つの回転自由度を有する。
【0021】
脚体14は股関節機構を介して基体10に連結された第1脚リンクと、一端が第1脚リンクの端部に膝関節機構を介して連結され、他端が足首関節を介して足平部15に連結されている第2脚リンクとを備えている。股関節機構は、ヨー軸、ピッチ軸およびロール軸のそれぞれの回りの3つの回転自由度を有する。膝関節機構は、ピッチ軸回りの1つの回転自由度を有する。足首関節機構は、ピッチ軸およびロール軸のそれぞれ回りの2つの回転自由度を有する。ロボット1は、左右の脚体14のそれぞれの離床および着床の繰り返しを伴う動きによって自律的に移動することができる。
【0022】
(行動制御システムの構成)
図2に示されている行動制御システム2はロボット1に搭載されている電子制御ユニット(CPU,ROM,RAM,I/O回路等により構成されている。)またはコンピュータにより構成されている。
【0023】
行動制御システム2は内部状態センサ群21および外部状態センサ群22のそれぞれの出力信号に基づいて種々の状態変数の値を認識するように構成されている。
【0024】
内部状態センサ群21にはロボット1の位置(重心位置)を測定するためのGPS測定装置または加速度センサのほか、基体10の姿勢を測定するためのジャイロセンサ、各関節機構の屈曲角度等を測定するロータリーエンコーダ等が含まれている。
【0025】
外部状態センサ群22にはロボット1とは別個独立のモーションキャプチャーシステム(図示略)のほか、ボール等のタスク実行に関連する物体の位置軌道を測定するため、頭部11に搭載されているステレオイメージセンサや、基体10に搭載されている赤外光を用いたアクティブ型センサ等が含まれる。
【0026】
行動制御システム2は、後述の確率遷移モデルにしたがって、第1状態変数および第2状態変数のそれぞれの時系列的な変化態様を目標運動軌道として生成するように構成されている。第1状態変数は、腕体12および手部13の運動状態を表わす。第2状態変数は、ロボット1の上体の運動状態を表わす。行動制御システム2は、状態変数の認識結果に基づき、アクチュエータ24の動作を制御することにより、目標運動軌道にしたがってロボット1の運動態様を制御するように構成されている。
【0027】
行動制御システム2が「構成されている」とは、行動制御システム2がメモリ等の記憶手段から必要なソフトウェアおよびデータを読み出し、当該データを対象として当該ソフトウェアにしたがった演算処理を実行すること、さらには当該演算処理の結果として制御指令信号を生成し、制御対象に宛てて当該信号を出力すること等により、ロボット1の行動制御等の目的を達成することを意味する。
【0028】
本発明の構成要素が情報を「認識する」とは、当該構成要素が情報をデータベースから検索すること、メモリ等の記憶装置から情報を読み取ること、センサ等の出力信号に基づき情報を測定、算定、推定、判定すること、測定等された情報をメモリに格納すること等、当該情報をさらなる演算処理のために準備または用意するのに必要なあらゆる情報処理を実行することを意味する。
【0029】
行動制御システム2のうち一部がロボット1の外部コンピュータにより構成され、残りの部分が当該外部コンピュータから演算結果を無線または有線方式で通信可能なコンピュータにより構成されていてもよい。
【0030】
(本発明の第1実施形態における確率遷移モデル)
本発明の第1実施形態における確率遷移モデルは、ロボット1の挙動が、図3に示されているように倒立振子と、この倒立振子の質点または上端から延設されているアームとのそれぞれの挙動により簡素化して表現されているという考え方にしたがって構築されている。
【0031】
倒立振子は、高さhが一定であり、下端を支点としてロール軸およびピッチ軸のそれぞれ回りに揺動可能であると仮定されている。ロボット1の上体の仮想目標位置はu=(ux,uy)により表わされている。ロボット1のZMPの水平位置は、倒立振子の下端水平位置z=(zx,zy)により表わされている。ZMPとは、足平部15の全体に分布してかかっている床反力の法線成分を、ある一点にかかっているとして置き換えたときの作用点を意味する。ロボット1の上体質点または肩関節機構の水平位置および水平速度のそれぞれは、倒立振子の上端水平位置x=(xx,xy)および上端水平速度v=(vx,vy)により表わされている。
【0032】
「水平」という記載は、対象物理量がグローバル座標系のヨー軸に対して垂直な2つの方向成分により表現されることを意味している。「水平」という記載が付されていない場合、対象物理量がグローバル座標系の相互に垂直な3つの方向成分により表現されることを意味している。
【0033】
倒立振子の挙動状態を表わす状態変数(x,v)は、ロボット1の上体の運動状態を表わす「第2状態変数」に相当する。
【0034】
アームは倒立振子の上端から順に連接された3つのリンクにより構成されている。当該3つのリンクは、ロボット1の腕体12の第1腕リンクおよび第2腕リンクならびに手部13のそれぞれに相当する。ロボット1の肘関節機構の位置は、第1リンクの先端位置y1=(y1x,y1y,y1z)より表わされている。ロボット1の手首関節機構の位置は、第2リンクの先端位置y2=(y2x,y2y,y2z)により表わされている。ロボット1の手部13の先端位置は、第3リンクの先端位置y3=(y3x,y3y,y3z)により表わされている。
【0035】
基体10に対する第1腕リンクの姿勢を定める肩関節機構の直交する2軸回りのそれぞれの回転角度は、倒立振子に対するアームの第1リンクの直交する2軸回りのそれぞれの回転角度(θ1,ψ1)により表わされている。第1腕リンクに対する第2腕リンクの姿勢を定める肘関節機構の1軸回りの回転角度は、アームの第1リンクに対する第2リンクの1軸回りの回転角度θ2により表わされている。第2腕リンクに対する手部13の姿勢を定める手首関節機構の直交する2軸回りのそれぞれの回転角度は、アームの第2リンクに対する第3リンクの直交する2軸回りのそれぞれの回転角度(θ3,ψ2)により表わされている。
【0036】
アームの挙動に関して、その付け根から先端位置までの距離dが考慮される。
【0037】
アームの挙動を表わす状態変数(y1,y2,y3)は、ロボット1の腕体12の運動状態を表わす「第1状態変数」に相当する。
【0038】
確率遷移モデルは、図4に示されているダイナミクスベイジアンネットワーク(DBN)により表現される。このDBNによれば、ロボット1の挙動を簡易表現する前述の倒立振子およびアームの運動方程式および制御則が、各時点tにおける状態変数を確率変数として表わす複数のノード(円)と、当該ノードをつなぐ矢印により表現されている。ロボット1の運動方程式および制御則は関係式(11)〜(14)のそれぞれにより表現される。
【0039】
z[i]=(-u[i]k/(k+1)+x[i-1]+v[i-1]/ω0)(ω0+kω0)Δt/(1-exp(-ω0Δt)) ..(11)。
【0040】
v[i]=v[i-1]+ω0ω0(x[i-1]-z[i])Δt ..(12)。
【0041】
x[i]=x[i-1]+v[i]Δt ..(13)。
【0042】
y[i]=x[i]+DK(θ1, ψ1, θ2, θ3, ψ2) ..(14)。
【0043】
関係式(11)は、ロボット1が発散しないようにZMPの水平位置zが上体の目標水平位置軌道u(第2指定運動軌道に相当する。)に追従する制御則を表わしている。ロボット1が発散するとは、ロボット1が転倒する蓋然性が高くなる程度にその体勢が崩れてしまうことを意味し、この発散を抑制するために発散成分が考慮されている。ロボット1の発散成分の値とは、ロボット1の基体10の位置が両足平部15の位置(より具体的には、支持脚側足平部15の接地面に設定されたグローバル座標系(支持脚座標系)の原点)からかけ離れていく具合を表す数値である(特許第3672100号公報、第3674788号公報等、出願人の所有に係る公開公報参照)。
【0044】
発散成分は、上体質点水平位置x、上体質点水平速度vおよび所定の定数(たとえば倒立振子の固有振動数)ω0を用いて関係式(01)により表現される。
【0045】
(発散成分)=x+v/ω0 ..(01)。
【0046】
ロボット1のZMPの水平位置zは、上体の目標位置軌道u、上体質点水平位置x、上体質点水平速度v、フィードバック係数kおよび倒立振子の固有振動数ω0を用いて、関係式(02)により表現される。
【0047】
z=(-u・k/(k+1)+x+v/ω0)(ω0+k・ω0)Δt/(1-exp(-ω0Δt)) …(02)。
【0048】
アームの付け根から先端位置までの距離dは、ロボット1の肩関節機構から手部13の先端までの距離の許容範囲外で確率が0になる切断分布により確率分布が表わされる確率変数である。同様に、アームの姿勢を表わす関節角度p=(θ1,ψ1,θ2,θ3,ψ2)は確率変数で、ロボット1の腕体12の各関節機構の屈曲角度の許容範囲外で確率が0になる切断分布により確率分布が表わされる確率変数である。
【0049】
関係式(14)右辺におけるDKは、関節角度pに基づき、アームの第1〜第3リンクのそれぞれの先端位置を算出するための、順運動額的または幾何学的関係を表わす関数である。
【0050】
(本発明の第1実施形態としてのロボットおよび行動制御システムの機能)
本発明の第1実施形態としての、前記構成を有するロボット1および行動制御システム2の機能について説明する。本発明の第1実施形態によれば、図9(a)〜(c)に示されているように、一方の手部13で把持しているラケットをフォアハンドストロークで素振りするという指定タスクをロボット1に実行させる。
【0051】
まず、行動制御システム2(またはその構成要素である第1指定運動軌道認識要素)により、ロボット1に指定タスクを実行させるために定められている第1指定運動軌道{r}=[r(t1), ..r(t1+(i-1)Δt), r(t1+iΔt), r(t1+(i+1)Δt), .. r(t2)]が認識される(図5/STEP11)。
【0052】
第1指定運動軌道{r}、すなわち、手部13の先端位置の時系列的な模範変化態様は、特開2010−005761号公報に開示されている手法と同様の手法にしたがって生成される。具体的には、まず、外部状態センサ22を構成する光学式、機械式、磁気式または慣性式モーションキャプチャーシステムにより、インストラクタ(人間)が複数回にわたり指定タスクを実行する際の、手位置の時系列的な変化態様が測定される。そして、この観測結果に基づき、インストラクタおよびロボット1の身体サイズの相違に応じたスケーリングが実行されることにより、第1指定運動軌道が生成される。第1指定運動軌道は記憶装置に格納される。
【0053】
なお、あらかじめ定められた第1指定運動軌道が、リモコン等の外部機器からロボット1に送信され、記憶装置に格納されてもよい。
【0054】
また、第1状態変数の時系列的な目標変化態様を表わす「第1目標運動軌道」および第2状態変数の時系列的な目標変化態様を表わす「第2目標運動軌道」が、目標運動軌道として生成される(図5/STEP12)。
【0055】
具体的には、行動制御システム2(またはその構成要素である目標運動軌道認識要素)により、第1基準時点t=t1から第2基準時点t=t2=t1+NΔtまでのN+1個のノードが、関係式(11)〜(14)により表現される確率遷移モデルにしたがって、順次推定される。ロボット1が指定タスクの実行開始時点t1におけるDBNにおける各ノードの推定方法としてはギブスサンプリング等の方法が採用される。
【0056】
これにより、図6に示されているような、肘関節機構の目標位置軌道{y1}、手首関節機構の目標位置軌道{y2}および手部13の先端の目標位置軌道{y3}が第1目標運動軌道として生成される。手部13の先端の目標位置軌道{y3}は、第1指定運動軌道{r}にほぼ一致するように追従している。
【0057】
また、同じく図6に示されているような、上体質点(または肩関節機構)の目標位置軌道{x}およびZMPの目標水平位置軌道{z}が第2目標運動軌道として生成される。図7に示されているように肩関節機構と手部13の先端との間隔dが、その許容範囲[dlow,dup]に収まるように目標運動軌道が生成される。
【0058】
同様に、確率遷移モデルによれば、図8(a)に示されているように肩関節機構の直交する2軸回りの回転角度θ1およびψ1と、肘関節機構の1軸回りの回転角度θ2とのそれぞれが、その許容範囲[θ1low,θ1up]、[ψ1low,ψ1up]および[θ2low,θ2up]のそれぞれに収まるように目標運動軌道が生成される。さらに、確率遷移モデルによれば、図8(b)に示されているように手首関節機構の直交する2軸回りの回転角度θ3およびψ2のそれぞれが、その許容範囲[θ3low,θ3up]および[ψ2low,ψ2up]のそれぞれに収まるように目標運動軌道が生成される。
【0059】
これは、確率遷移モデルにおいて、当該許容範囲外では確率が0になるような切断分布を確率分布として有する確率変数として、当該間隔dおよび関節角度が表現されているからである。
【0060】
そして、行動制御システム2により、目標運動軌道にしたがって、ロボット1の動作が制御される(図5/STEP13)。具体的には、肘関節機構、手首関節機構および手部13の先端のそれぞれの位置が、第1目標運動軌道{y1}、{y2}および{y3}のそれぞれに追従し、かつ、肩関節機構およびZMPのそれぞれの位置が第2目標運動軌道{x}および{z}のそれぞれに追従するように、アクチュエータ24の動作が制御され、ロボット1の全身運動が制御される。
【0061】
これにより、第1状態変数としての手部13の先端位置は第1指定運動軌道{r}にほぼ一致する程度に近接して時系列的に変化する。具体的には、図9(a)〜(c)に順に示されているように腕体12および脚体14等が動かされ、ロボット1が片方の手部13で持っているラケットをフォアハンドで素振りをするという指定タスクを実行させることができる。
【0062】
(本発明の第1実施形態としてのロボットおよび行動制御システムの作用効果)
前記機能を発揮する本発明の第1実施形態としてのロボット1または行動制御システム2によれば、確率遷移モデルにしたがって、上体の運動状態を表わす「第1状態変数」の時系列的な変化態様(第1目標運動軌道)が、第1状態変数のうち少なくとも1つ(手位置またはラケット位置)がロボット1に指定タスクを実行させるための第1指定運動軌道{r}に追従するように生成される(図6参照)。
【0063】
また、同じく確率遷移モデルにしたがって、ロボット1の歩容状態を表わす「第2状態変数」の時系列的な変化態様(第2目標運動軌道)が、第2状態変数がロボット1を継続的に安定させる動力学的条件(関係式(11)参照)を充足するように生成される。
【0064】
第2状態変数は第1状態変数の値の変動因子であるため、ロボット1を継続的に安定にする第2目標運動軌道が生成されることにより、第1状態変数を第1指定運動軌道に厳密に追従させることが困難となる可能性がある。しかるに、確率遷移モデルにおいて、第1状態変数が確率変数として表現されているため、第1状態変数のうち少なくとも1つ(手位置)の第1指定運動軌道に対する追従度(守りきり度合い)の高低が、ロボット1に指定タスクを実行させるという条件下で柔軟に調節されうる。
【0065】
具体的には、ロボット1に指定タスクを実行させる観点から重要度が比較的高い時点においては、第1状態変数を第1指定運動軌道{r}に比較的厳密に一致または近接させる必要がある。その一方、当該重要度が比較的低い時点においては、第1状態変数を第1指定運動軌道からある程度乖離させることが許容される。
【0066】
確率変数のうち少なくとも1つ(肩関節機構と手先端位置との間隔dおよび腕体の各関節角度)の確率分布が切断分布により表現されている確率遷移モデルにしたがって目標運動軌道が生成される。このため、ロボット1の構造的な制約条件または安定な歩容のための動力学的条件等に応じて、当該状態変数がとりえない数値範囲を、切断分布において確率が0になる状態変数値範囲に一致させることにより、当該条件が充足されるようにロボット1の全体的な動作が制御されうる(図7および図8(a)(b)参照)。
【0067】
(本発明の第2実施形態における確率遷移モデル)
本発明の第2実施形態における確率遷移モデルは、第1実施形態と同様にロボット1の挙動が、図3に示されているように倒立振子とアームとのそれぞれの挙動により簡素化して表現されているという考え方にしたがって構築されている。第2実施形態は、ロボット1に物体との相互作用を伴う指定タスクを実行させるため、当該相互作用によってロボット1が物体から受ける力が考慮される点で、第1実施形態と相違する。
【0068】
この相違点は、確率遷移モデルを表現する関係式(11)に代えて、指定タスクの実行時にロボット1が物体から受けた力fをZMP相当量に変換した結果eが右辺に追加されている新たな関係式(21)により確率遷移モデルが表現されていることに反映されている。
【0069】
z[i]=(-u[i]k/(k+1)+x[i-1]+v[i-1]/ω0)(ω0+kω0)Δt/(1-exp(-ω0Δt))+e
-=z[i]=(-u[i]k/(k+1)+x[i-1]+v[i-1]/ω0)(ω0+kω0)Δt/(1-exp(-ω0Δt))+fh/mg ..(21)
ここで、hは倒立振子の高さであり、mは倒立振子の質量であり、gは重力加速度である。
【0070】
(本発明の第2実施形態としてのロボットおよび行動制御システムの機能)
本発明の第2実施形態としての、前記構成を有するロボット1および行動制御システム2の機能について説明する。本発明の第1実施形態によれば、図12(a)〜(c)に示されているように、一方の手部13で把持しているラケットをフォアハンドストロークで振り、ボール(物体)を打ち返すという指定タスクをロボット1に実行させる。
【0071】
指定タスクの性質上、ラケットは手部13の一部であるとみなされる。確率遷移モデルにおいて、手部13により把持されているラケットのガット(ボールを当てる箇所)の位置(ラケット位置)が、当該手部13の先端位置xとして扱われる。
【0072】
まず、行動制御システム2(またはその構成要素であるボール位置軌道測定要素)により、外部状態センサ群22の出力信号により表わされるボールの時系列的な位置に基づき、世界座標系またはロボット座標系におけるボールの位置が時系列的に測定される(図11/STEP21、図12(a)参照)。
【0073】
続いて、行動制御システム2(またはその構成要素であるボール位置軌道予測要素)により、ボールの時系列的な推定位置x1(k)に基づき、このボールの位置軌道が予測される(図11/STEP22、図12(a)破線参照)。ボールの予測位置x1(t)は、現在時刻kにおけるボールの計測位置x1(k)、速度v1(k)={x1(k)−x1(k-1)}/Δtおよび加速度α1(k)={v1(k)−v1(k-1)}/Δt(Δt:演算周期)に基づき、運動方程式にしたがって算出される。
【0074】
さらに、行動制御システム2(またはその構成要素である相互作用点候補設定要素)により、ロボット1の運動によってラケット(そのガット)が到達可能な範囲において、ラケットとボールとの相互作用点または打点が設定される(図11/STEP23、図12(a)参照)。
【0075】
ラケットの到達可能範囲は、内部状態センサ群21の出力信号により表わされる各関節機構の屈曲角度、ならびに、手部13に対するラケットの位置および姿勢等のキネマティクスパラメータに基づき、キネマティクス演算法にしたがって推定される。ラケットの到達可能範囲の推定に際して、ロボット1の基体10および腕体12など、異なる部分が相互に干渉または接触しないことが確認される。
【0076】
手部13の掌に対して位置および姿勢が固定されているハンド座標系におけるラケットの位置はあらかじめ定められていてもよいが、内部状態センサ群21を構成する撮像装置によって撮像された手部13に対するラケットのグリップの握り位置および姿勢に基づいて逐次算出されてもよい。
【0077】
さらに、行動制御システム2により、ロボット1に指定タスクを実行させるために定められている、第1状態変数としてのラケット位置の時系列的な模範位置軌道を表わす第1指定運動軌道{r}が認識される(図11/STEP24)。たとえば、記憶装置に格納されている複数の第1指定運動軌道のうち、ボールの到達予測時刻において設定相互作用点を通る一の第1指定運動軌道が選定される。
【0078】
また、第1状態変数の時系列的な目標変化態様を表わす「第1目標運動軌道」および第2状態変数の時系列的な目標変化態様を表わす「第2目標運動軌道」が、目標運動軌道として生成される(図11/STEP25(図6参照))。
【0079】
具体的には、行動制御システム2(またはその構成要素である目標運動軌道認識要素)により、第1基準時点t=t1から第2基準時点t=t2=t1+NΔtまでのN+1個のノードが、確率遷移モデルにしたがって順次推定される。この際、図10に示されているように、確率遷移モデルを表わすDBNにおいて、少なくともラケットとボールとの相互作用期間において当該力fおよびそのZMP換算結果eを表わすノードが追加されている。
【0080】
そして、行動制御システム2により、目標運動軌道にしたがって、ロボット1の動作が制御される(図11/STEP26)。具体的には、肘関節機構、手首関節機構およびラケットのそれぞれの位置が、第1目標運動軌道{y1}、{y2}および{y3}のそれぞれに追従し、かつ、肩関節機構およびZMPのそれぞれの位置が第2目標運動軌道{x}および{z}のそれぞれに追従するように、アクチュエータ24の動作が制御され、ロボット1の全身運動が制御される。
【0081】
これにより、第1状態変数としてのラケット位置は第1指定運動軌道{r}にほぼ一致する程度に近接して時系列的に変化する。具体的には、図12(a)〜(c)に順に示されているように腕体12および脚体14等が動かされ、ロボット1が片方の手部13で持っているラケットをフォアハンドで振って、ボールを打ち返すという指定タスクを実行させることができる。
【0082】
なお、ロボット1に向かってきたボール等の物体を手部13でつかむ等、上体と物体との一時的な相互作用を伴う指定タスクのほか、物体を押しながら歩行する等、上体と物体との定常的な相互作用を伴う指定タスクが実行されうる。
【0083】
(本発明の第2実施形態としてのロボットおよび行動制御システムの作用効果)
前記機能を発揮する本発明の第2実施形態としてのロボット1または行動制御システム2によれば、本発明の第1実施形態と同様の作用効果が奏される。そのほか、指定タスクの実行に際して上体(ラケット)と物体(ボール)との相互作用を伴うが、当該相互作用期間において、ロボット1がボールから受ける外力fに応じた変動量eが、第2状態変数のうち少なくとも1つ(ZMPの水平位置z)に加えられるような確率遷移モデルにしたがって目標運動軌道が生成される(関係式(21)、図10参照)。
【0084】
これにより、ロボット1に上体の運動によって物体との相互作用を伴う指定タスクを実行させながら、これと同時に歩容を安定に継続させることができるようにロボット1の全体的な動作が制御されうる(図12(a)〜(c)参照)。
【0085】
(本発明の他の実施形態)
本発明のさらなる実施形態における確率遷移モデルは、第1および第2実施形態と同様に、ロボット1の挙動が、図13に示されている倒立振子と、この倒立振子の質点または上端から延設されているアームとのそれぞれの挙動により簡素化して表現されるという考え方にしたがって構築されている。第1および第2実施形態との相違点は、アームが真っ直ぐでその長さdが可変であるという点である。
【0086】
この場合の確率遷移モデルは、図14に示されているダイナミクスベイジアンネットワーク(DBN)により表現される。第1実施形態におけるロボット12の運動方程式および制御則を表現する関係式(14)に代えて関係式(34)が適用される。
【0087】
y[i]=x[i]+DK(θ1, ψ1) ..(34)。
【0088】
これにより、図15に示されているような、手部13の先端の目標位置軌道{y}が第1目標運動軌道として生成される。手部13の先端の目標位置軌道{y}は、第1指定運動軌道{r}にほぼ一致するように追従している。
【0089】
また、同じく図15に示されているような、上体質点(または肩関節機構)の目標位置軌道{x}およびZMPの目標水平位置軌道{z}が第2目標運動軌道として生成される。図15から、ZMPの目標水平位置軌道{z}は、第2指定運動軌道としての仮想的なZMPの目標水平位置軌道{u}に追従するように変化していることがわかる。
【0090】
そして、行動制御システム2により、手部13の先端の位置が、第1目標運動軌道{y}に追従し、かつ、肩関節機構およびZMPのそれぞれの位置が第2目標運動軌道{x}および{z}のそれぞれに追従するように、アクチュエータ24の動作が制御され、ロボット1の全身運動が制御される。肩関節機構位置および手位置等から、肘関節機構および手首関節機構等のそれぞれの回転角度を算出しうるインバースキネマティクスモデルにしたがって、ロボット1に指定タスクを実行させるように肘関節機構および手首関節機構の動作が制御されうる。
【符号の説明】
【0091】
1‥ロボット、2‥行動制御システム。
【特許請求の範囲】
【請求項1】
上体と、前記上体に連結されている腕体と、前記上体を支持する複数の脚体と、前記上体、前記腕体および前記複数の脚体のそれぞれの運動を目標運動軌道にしたがって制御するように構成されている行動制御システムとを備えているロボットであって、
前記行動制御システムが、前記腕体の運動状態を表わす第1状態変数と、前記第1状態変数の値の変動因子である前記上体の運動状態を表わす第2状態変数とのそれぞれを確率変数として表現する確率遷移モデルにしたがって、前記第1状態変数のうち少なくとも1つが前記ロボットに指定タスクを実行させるために定められている第1指定運動軌道に追従し、かつ、前記第2状態変数が前記ロボットに継続的に安定な動力学的条件を充足するように、前記第1状態変数および前記第2状態変数のそれぞれの時系列的な変化態様を前記目標運動軌道として生成するように構成されていることを特徴とするロボット。
【請求項2】
請求項1記載のロボットにおいて、
前記行動制御システムが、前記ロボットに他の物体との相互作用を伴う前記指定タスクを実行させるように前記第1指定運動軌道が定められていることを認識した場合、前記上体と前記物体との相互作用期間において、前記ロボットが前記物体から受ける外力に応じた変動量が加えられた前記確率遷移モデルにしたがって前記目標運動軌道を生成するように構成されていることを特徴とするロボット。
【請求項3】
請求項1または2記載のロボットにおいて、
前記行動制御システムが、確率変数のうち少なくとも1つの確率分布が切断分布により表現されている前記確率遷移モデルにしたがって前記目標運動軌道を生成するように構成されていることを特徴とするロボット。
【請求項4】
上体と、前記上体に連結されている腕体と、前記上体を支持する複数の脚体と、前記上体、前記腕体および前記複数の脚体のそれぞれの運動を目標運動軌道にしたがって制御するように構成されている行動制御システムであって、
前記腕体の運動状態を表わす第1状態変数と、前記第1状態変数の値の変動因子である前記上体の運動状態を表わす第2状態変数とのそれぞれを確率変数として表現する確率遷移モデルにしたがって、前記第1状態変数のうち少なくとも1つが前記ロボットに指定タスクを実行させるために定められている第1指定運動軌道に追従し、かつ、前記第2状態変数が前記ロボットに継続的に安定な動力学的条件を充足するように、前記第1状態変数および前記第2状態変数のそれぞれの時系列的な変化態様を前記目標運動軌道として生成するように構成されていることを特徴とする行動制御システム。
【請求項1】
上体と、前記上体に連結されている腕体と、前記上体を支持する複数の脚体と、前記上体、前記腕体および前記複数の脚体のそれぞれの運動を目標運動軌道にしたがって制御するように構成されている行動制御システムとを備えているロボットであって、
前記行動制御システムが、前記腕体の運動状態を表わす第1状態変数と、前記第1状態変数の値の変動因子である前記上体の運動状態を表わす第2状態変数とのそれぞれを確率変数として表現する確率遷移モデルにしたがって、前記第1状態変数のうち少なくとも1つが前記ロボットに指定タスクを実行させるために定められている第1指定運動軌道に追従し、かつ、前記第2状態変数が前記ロボットに継続的に安定な動力学的条件を充足するように、前記第1状態変数および前記第2状態変数のそれぞれの時系列的な変化態様を前記目標運動軌道として生成するように構成されていることを特徴とするロボット。
【請求項2】
請求項1記載のロボットにおいて、
前記行動制御システムが、前記ロボットに他の物体との相互作用を伴う前記指定タスクを実行させるように前記第1指定運動軌道が定められていることを認識した場合、前記上体と前記物体との相互作用期間において、前記ロボットが前記物体から受ける外力に応じた変動量が加えられた前記確率遷移モデルにしたがって前記目標運動軌道を生成するように構成されていることを特徴とするロボット。
【請求項3】
請求項1または2記載のロボットにおいて、
前記行動制御システムが、確率変数のうち少なくとも1つの確率分布が切断分布により表現されている前記確率遷移モデルにしたがって前記目標運動軌道を生成するように構成されていることを特徴とするロボット。
【請求項4】
上体と、前記上体に連結されている腕体と、前記上体を支持する複数の脚体と、前記上体、前記腕体および前記複数の脚体のそれぞれの運動を目標運動軌道にしたがって制御するように構成されている行動制御システムであって、
前記腕体の運動状態を表わす第1状態変数と、前記第1状態変数の値の変動因子である前記上体の運動状態を表わす第2状態変数とのそれぞれを確率変数として表現する確率遷移モデルにしたがって、前記第1状態変数のうち少なくとも1つが前記ロボットに指定タスクを実行させるために定められている第1指定運動軌道に追従し、かつ、前記第2状態変数が前記ロボットに継続的に安定な動力学的条件を充足するように、前記第1状態変数および前記第2状態変数のそれぞれの時系列的な変化態様を前記目標運動軌道として生成するように構成されていることを特徴とする行動制御システム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図6】
【図2】
【図3】
【図4】
【図5】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図6】
【公開番号】特開2012−71358(P2012−71358A)
【公開日】平成24年4月12日(2012.4.12)
【国際特許分類】
【出願番号】特願2010−216043(P2010−216043)
【出願日】平成22年9月27日(2010.9.27)
【出願人】(000005326)本田技研工業株式会社 (23,863)
【Fターム(参考)】
【公開日】平成24年4月12日(2012.4.12)
【国際特許分類】
【出願日】平成22年9月27日(2010.9.27)
【出願人】(000005326)本田技研工業株式会社 (23,863)
【Fターム(参考)】
[ Back to top ]