이 논문은 로봇 에어 하키를 기반으로 한 동적이고 상호작용적인 RL 테스트베드를 소개한다. 이 테스트베드는 도달하기, 밀기, 목표 타격 등 다양한 작업을 포함하며, 시뮬레이션과 실제 로봇 시스템을 모두 지원한다. 또한 두 가지 원격 조종 시스템을 통해 수집된 데모 데이터를 활용하여 행동 모방, 오프라인 RL, 처음부터의 RL을 평가한다. 실험 결과, 온라인 RL이 시뮬레이션에서 가장 좋은 성능을 보였지만 실제 로봇에서는 모든 기준선이 인간 성능에 미치지 못했다. 이는 동적이고 상호작용적인 작업에서 RL이 여전히 과제가 있음을 보여준다.
Til et annet språk
fra kildeinnhold
arxiv.org
Viktige innsikter hentet fra
by Caleb Chuck,... klokken arxiv.org 05-07-2024
https://arxiv.org/pdf/2405.03113.pdfDypere Spørsmål