本研究探索了利用強化學習為人形機器人REEM-C學習滑板技能的可能性。研究團隊使用Brax和MJX這種高度並行的強化學習訓練管道,並擴展了之前用於學習步行的週期性獎勵機制。
具體來說,研究設計了一個單腳推動的週期性動作,其中右腳保持在滑板上,左腳重複地推動地面並抬起。為了加快學習和改善滑板的運動表現,研究團隔外加入了一些新的獎勵,如跟蹤目標速度、減少右腳相對於滑板的滑動和旋轉等。
在模擬結果中,可以看到REEM-C能夠順利完成滑板前進的動作,左腳用於推動,右腳保持在滑板上保持平衡。有趣的是,上半身會自然地向前傾斜,類似人類滑板時的動作。整體運動是平穩和平衡的,只有很小的轉向。
本研究是在之前工作的基礎上進行的擴展,未來的工作包括將學習到的滑板技能轉移到實際的REEM-C機器人上,並擴展到包括滑行和轉向等更複雜的動作。
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問