Core Concepts
ロボットデュエットは、移動と操作を同時に実現する2つの協調的な方策を採用することで、全身制御を可能にする。さらに、異なる四足ロボットや他の腕との連携も実現できる。
Abstract
ロボットデュエットは、移動と操作を同時に実現する2つの協調的な方策から成る。
ステージ1では、腕を固定したまま、四足ロボットに移動能力を身につけさせる。移動方策は、体の向きコマンド、固有感覚状態、特権情報を入力として、各関節の行動を出力する。
ステージ2では、ステージ1で得られた移動方策と腕の方策を同時に学習する。移動方策は同じ入力を受け取るが、体の向きコマンドは腕の方策から提供される。腕の方策は、目標の6次元エンドエフェクタ姿勢を達成するために、目標姿勢や他の観測値を入力とし、各関節の行動と移動方策への体の向きコマンドを出力する。
この2つの方策の相互作用により、移動方策は腕の行動をガイドとして姿勢を調整し、腕は移動方策の行動を補完して作業空間を拡大する。この枠組みにより、エンドエフェクタの6次元姿勢を正確に追跡できる。
さらに、移動方策をステージ2で固定できるため、ロボットデュエットは異種ロボットへの連携展開が可能になる。ステージ1で訓練した異なる四足ロボットの移動方策を、ステージ2で訓練した腕の方策と組み合わせることで、新しい組み合わせでも課題を遂行できる。これにより、訓練コストを大幅に削減でき、より汎用的な方策を得ることができる。
Stats
移動速度の追跡誤差は、静止時で0.49±0.07 m/s、移動時で10.16±1.05 m/s。
位置追跡誤差は、静止時で10.21±0.83 cm、移動時で10.16±0.71 cm。
姿勢追跡誤差は、静止時で84.08±3.13°、移動時で83.88±3.23°。