핵심 개념
本研究提出了Opt2Skill框架,結合模型導向的軌跡優化和強化學習,實現了人形機器人在各種定位操作任務中的高效和穩健表現。
초록
本研究提出了Opt2Skill,一個結合模型導向的軌跡優化和強化學習的端到端管道,用於實現人形機器人在各種定位操作任務中的高效和穩健表現。
首先,研究團隊使用微分動態規劃(DDP)生成滿足機器人動力學和任務需求的全身運動參考軌跡。然後,他們利用強化學習(RL)訓練策略來精確跟蹤這些最優且動力學可行的運動軌跡。
實驗結果表明,Opt2Skill在訓練效率和任務性能方面都優於純RL方法。此外,考慮扭矩限制的軌跡優化可以增強軌跡跟蹤性能。研究團隊還成功將這些技能轉移到了真實世界的應用中。
Opt2Skill框架的主要貢獻包括:
- 首次採用基於全身動力學的軌跡優化來指導人形機器人的強化學習,實現了各種定位操作任務。
- 證明了運動數據的質量對於運動模仿至關重要,而基於全身動力學的軌跡優化是一種高質量的運動數據來源。此外,運動數據中的關節扭矩信息對於實現成功的運動跟蹤至關重要。
- 成功地將Opt2Skill框架應用於真實世界的人形機器人,展示了在各種定位操作任務中的強大能力,包括穩健的室外步行、樓梯和斜坡行走,以及複雜的多接觸全身操作。
통계
機器人基座在x軸和y軸上的位置跟蹤誤差小於0.05米/秒。
機器人腳在z軸上的高度跟蹤誤差小於3厘米。
機器人手臂在y軸上的位置跟蹤誤差小於12厘米。
인용구
"本研究提出了Opt2Skill,一個結合模型導向的軌跡優化和強化學習的端到端管道,用於實現人形機器人在各種定位操作任務中的高效和穩健表現。"
"實驗結果表明,Opt2Skill在訓練效率和任務性能方面都優於純RL方法。此外,考慮扭矩限制的軌跡優化可以增強軌跡跟蹤性能。"
"研究團隊還成功將這些技能轉移到了真實世界的應用中,展示了在各種定位操作任務中的強大能力。"