이 연구는 메모리 기반 심층 강화 학습 (MeSA-DRL) 알고리즘을 제안한다. 이 알고리즘은 장기 메모리를 활용하여 주변 환경에 대한 필수 정보를 유지하고 순차적 의존성을 효과적으로 모델링한다. 또한 인간-로봇 상호작용의 중요성을 인코딩하여 이에 더 높은 주의를 기울인다.
글로벌 플래닝 메커니즘이 메모리 기반 아키텍처에 통합되어 있으며, 동적 경고 구역을 기반으로 한 다중 보상 시스템이 설계되어 장기적인 로봇 행동을 장려하고 부드러운 궤적을 유지하며 목표 도달 시간을 최소화한다.
광범위한 시뮬레이션 실험 결과, 제안된 접근 방식이 대표적인 최신 방법들을 능가하여 실제 시나리오에서의 네비게이션 효율성과 안전성을 입증한다.
To Another Language
from source content
arxiv.org
Djupare frågor