이 연구는 사족 로봇의 에너지 효율적인 보행을 위한 강화 학습 접근법을 제안합니다. 기존 연구에서는 복잡한 보상 함수와 사전 정의된 보행 패턴을 사용했지만, 이 연구에서는 단순한 에너지 소비 최소화 보상 함수를 사용하여 로봇이 자율적으로 속도에 따른 최적의 보행 패턴을 선택할 수 있음을 보여줍니다.
실험 결과, 제안된 방법을 통해 훈련된 단일 정책은 속도에 따라 네 발 걸음 보행과 구르기 보행을 자율적으로 선택하여 에너지 효율성과 속도 추적 성능이 향상되었습니다. 또한 실제 Go1 로봇에 적용하여 안정적인 보행과 보행 전환 능력을 검증하였습니다.
핵심 기여사항은 다음과 같습니다:
To Another Language
from source content
arxiv.org
Głębsze pytania