本研究では、エアホッケーをロボット操作のテストベッドとして紹介する。エアホッケーは、到達、タッチ、打撃といった簡単なタスクから、ブロックを押し出すなどの複雑なタスクまで、幅広い課題を設定できる。このテストベッドは、シミュレーションと実環境の両方で評価できるようになっており、さらに人間の遠隔操作データも利用できる。
本研究では、行動クローニング、オフラインの強化学習、スクラッチからの強化学習の各手法を、シミュレーションと実環境で評価した。その結果、オフラインの強化学習が実環境でも良好な性能を示すことがわかった。一方、人間の遠隔操作データは必ずしも最適ではないため、強化学習が有効であることが示された。
このテストベッドは、動的で対話的な環境における強化学習の評価に適しており、ゴール条件付き学習、スキル転移学習、オフラインの強化学習など、様々な強化学習の手法を評価できる。
Іншою мовою
із вихідного контенту
arxiv.org
Ключові висновки, отримані з
by Caleb Chuck,... о arxiv.org 05-07-2024
https://arxiv.org/pdf/2405.03113.pdfГлибші Запити