核心概念
효율적인 모델 기반 학습 방법으로 강건한 모터 스킬 획득
统计
시뮬레이션에서 10배의 효율성 향상을 보임
실제 로봇에서 2분의 데이터 수집으로 효과적인 명령 따르기 성능 달성
새로운 속도 명령 및 보이지 않는 경로에 대한 정책의 일반화 능력 확인
引用
"우리의 방법은 PPO 알고리즘과 비교하여 10배의 효율성 향상을 달성했습니다."
"실제 로봇에서 2분의 데이터 수집만으로 효과적인 명령 따르기 성능을 달성했습니다."
"새로운 속도 명령 및 보이지 않는 경로에 대한 정책의 일반화 능력을 확인했습니다."