Kernkonzepte
異なるロボットエンボディメントに対して1つのポリシーを訓練し、実世界で様々なタスクを達成する能力を示す。
Zusammenfassung
近年のロボティクスと模倣学習において、大規模な基盤モデルのトレーニングが進歩し、多様なエンボディメント間でデータを活用することで、異なるドメイン間で知識転送が可能であることが示されています。本研究では、異質エンボディメントに焦点を当て、ナビゲーションと操作性のデータを組み合わせて1つの目標指向ポリシーを訓練しました。このポリシーは、ロボットアーム、ドローン、四足歩行ロボット、移動台座などさまざまなエンボディメントを制御する能力を持ちます。さらに、ナビゲーションデータと操作性データの共同トレーニングにより成功率が20%向上しました。これは、異なるエンボディメント間で収集されたデータが有益であることを示唆しています。
Statistiken
20%以上の成功率向上
ナビゲーションと操作性データの共同トレーニングにより5−7%改善
操作性ポリシーは新たなロボットでも50%成功率達成
Zitate
"Large-scale robotic policies can benefit from data collected across various embodiments."
"Training a single goal-conditioned policy that is capable of controlling robotic arms, quadcopters, quadrupeds, and mobile bases."
"Our results provide evidence that large-scale robotic policies can benefit from data collected across various embodiments."