본 연구는 양족 보행 제어기 설계의 핵심 문제인 발걸음 계획 문제를 다룬다. 발걸음 계획은 로봇이 목표 위치에 도달하기 위한 발걸음 순서를 결정하는 것이다. 기존 연구에서는 주로 탐색 기반 알고리즘(A* 등)을 사용했지만, 계산 비용이 높거나 많은 매개변수 튜닝이 필요했다.
본 연구에서는 상태 기반 심층 강화 학습 기술을 활용하여 장애물이 있는 국부적 환경에서 효율적으로 발걸음을 계획하는 방법을 제안한다. 이 방법은 휴리스틱 없이 연속적인 동작 집합을 사용하여 실행 가능한 발걸음을 생성한다. 기존 방법과 달리 특정 이산 동작 집합을 선택할 필요가 없다.
또한 배우자-비평가 구조를 활용하여 다양한 목표 지점에 도달하는데 필요한 예상 발걸음 수를 신속하게 추정할 수 있는 방법을 제안한다. 이를 통해 상위 의사결정 모듈에서 효과적으로 목표 지점을 선택할 수 있다.
시뮬레이션 결과와 실제 로봇 실험을 통해 제안 방법의 타당성을 입증했다. 특히 RoboCup 2023 대회에서 실제 로봇에 적용하여 우수한 성능을 보였다.
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問