本研究では、デモンストレーション主導の自動カリキュラム強化学習手法であるDemoStartを提案した。DemoStartは、シミュレーション上で少数のデモンストレーションと疎報酬を用いて、複雑な操作行動を学習することができる。
具体的には以下の3つの特徴がある:
DemoStartを用いて、シミュレーション上で7自由度の腕と12自由度の多指ハンドを持つロボットに対して、プラグの持ち上げ・挿入、立方体の再配置、ナットとボルトのねじ込み、スクリュードライバーをカップに挿入するなどの複雑な操作課題を98%以上の成功率で解くことができた。
さらに、プラグの持ち上げ・挿入、立方体の再配置の課題について、シミュレーションから実世界への零細転移を実現し、97%、64%、97%の成功率を達成した。これは、デモンストレーションから直接学習した方策や、単純な強化学習ベースラインよりも優れた性能を示している。
Naar een andere taal
vanuit de broninhoud
arxiv.org
Belangrijkste Inzichten Gedestilleerd Uit
by Maria Bauza,... om arxiv.org 09-11-2024
https://arxiv.org/pdf/2409.06613.pdfDiepere vragen