Conceitos essenciais
環境パラメータの低次元埋め込みを推定することで、ロボット操縦腕が様々な操作タスクに対して効率的に適応できる。
Resumo
本論文は、ロボット操縦腕の迅速な運動適応手法を提案している。
- 操縦タスクの目標や環境パラメータ(物体の形状、質量、摩擦係数など)を大幅にランダム化し、シミュレーション上で事前に学習を行う。
- 学習時には、これらの環境パラメータの低次元埋め込みを推定するアダプター部を同時に学習する。
- 実際の運用時には、アダプターがこの低次元埋め込みを観測履歴から推定し、事前に学習した操縦ポリシーに入力することで、様々な環境に迅速に適応できる。
- 提案手法は、ピック&プレース、ペグ挿入、蛇口操作などの4つの複雑な操縦タスクで評価され、ベースラインと比べて高い成功率と効率性を示した。
Estatísticas
物体の質量は0.1 ~ 1.0 kgの範囲でランダムに設定されている。
物体の摩擦係数は0.1 ~ 1.0の範囲でランダムに設定されている。
ペグ挿入タスクでは、ペグとホールの隙間が3mmと非常に狭い。