이 논문은 자율주행 주차 작업을 위한 경로 계획 문제를 다룹니다. 자율주행 주차 작업은 일반적으로 인지, 위치 추정, 계획, 제어 등의 하위 모듈로 구성됩니다. 이 중 계획 모듈의 성능이 전체 작업 수행에 큰 영향을 미칩니다.
샘플링 기반 접근법은 주차 시나리오에서 가장 일반적으로 사용되는 경로 계획 방법입니다. 이 방법의 성능은 샘플링 밀도에 크게 의존하며, 복잡한 주차 환경에서는 높은 차원의 샘플링 공간과 효율적인 샘플링 전략이 필요합니다. 이는 계획 과정이 시간 소모적이라는 문제를 야기합니다.
이 논문에서는 몬테카를로 트리 탐색(MCTS)에 강화학습을 통합하여 이 문제를 해결합니다. MCTS는 탐색과 활용의 균형을 잡는 데 강점이 있지만, 사전 지식의 부족으로 인해 실시간 시스템에서 계획 시간이 너무 오래 걸리는 단점이 있습니다.
제안된 방법은 MCTS 과정에서 강화학습을 사용하여 상태 가치 평가기와 정책 생성기를 학습합니다. 이를 통해 탐색 과정을 가속화하고 균형을 유지할 수 있습니다. 실험 결과, 제안된 방법은 기존 Hybrid A* 알고리즘에 비해 계획 시간을 크게 단축할 수 있었으며, 실제 자율주행 차량에 성공적으로 적용되었습니다.
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Xinlong Zhen... a las arxiv.org 03-27-2024
https://arxiv.org/pdf/2403.17234.pdfConsultas más profundas