본 연구는 양족 보행 제어기 설계의 핵심 문제인 발걸음 계획 문제를 다룬다. 발걸음 계획은 로봇이 목표 위치에 도달하기 위한 발걸음 순서를 결정하는 것이다. 기존 연구에서는 주로 탐색 기반 알고리즘(A* 등)을 사용했지만, 계산 비용이 높거나 많은 매개변수 튜닝이 필요했다.
본 연구에서는 상태 기반 심층 강화 학습 기술을 활용하여 장애물이 있는 국부적 환경에서 효율적으로 발걸음을 계획하는 방법을 제안한다. 이 방법은 휴리스틱 없이 연속적인 동작 집합을 사용하여 실행 가능한 발걸음을 생성한다. 기존 방법과 달리 특정 이산 동작 집합을 선택할 필요가 없다.
또한 배우자-비평가 구조를 활용하여 다양한 목표 지점에 도달하는데 필요한 예상 발걸음 수를 신속하게 추정할 수 있는 방법을 제안한다. 이를 통해 상위 의사결정 모듈에서 효과적으로 목표 지점을 선택할 수 있다.
시뮬레이션 결과와 실제 로봇 실험을 통해 제안 방법의 타당성을 입증했다. 특히 RoboCup 2023 대회에서 실제 로봇에 적용하여 우수한 성능을 보였다.
To Another Language
from source content
arxiv.org
Viktige innsikter hentet fra
by Clém... klokken arxiv.org 03-20-2024
https://arxiv.org/pdf/2403.12589.pdfDypere Spørsmål