Core Concepts
강화 학습 에이전트를 사용하여 사회적 비용 함수의 가중치를 동적으로 조정함으로써 다양한 사회적 시나리오에서 효과적인 경로 계획을 달성하는 적응형 사회적 내비게이션 시스템을 제안합니다.
Abstract
이 연구는 사회적 내비게이션을 위한 적응형 계획자를 제안합니다. 기존의 동적 창 접근법(DWA)에 사회적 비용을 추가한 사회적 힘 창문(SFW) 계획자를 기반으로 합니다. 그리고 강화 학습 에이전트를 사용하여 상황에 따라 비용 함수의 가중치를 동적으로 조정합니다. 이를 통해 다양한 사회적 시나리오에서 안전하고 효율적이며 사회적으로 적절한 경로 계획을 달성할 수 있습니다.
실험 결과, 제안된 적응형 SFW-SAC 계획자가 기존의 DWA와 정적 비용 SFW 계획자에 비해 전반적으로 우수한 성능을 보였습니다. 특히 복잡한 환경에서 더 높은 성공률과 사회적 적합성을 달성했습니다. 이는 강화 학습 에이전트가 상황에 따라 비용 함수의 가중치를 효과적으로 조정할 수 있기 때문입니다.
Stats
로봇의 최대 선형 속도는 0.6 m/s입니다.
로봇의 최대 각속도는 1.5 rad/s입니다.
경로 계획 시뮬레이션 시간은 2.5초입니다.
Quotes
"강화 학습 기술은 복잡한 사회적 내비게이션 문제를 해결하는 데 있어 유망한 접근 방식입니다."
"적응형 파라미터 학습 방식은 기존 알고리즘의 강건성과 유연성을 향상시킬 수 있습니다."