핵심 개념
분산형 강화 학습을 기반으로 한 다중 로봇 충돌 회피 정책은 해양 환경에서 안전한 항해를 제공하며 최소한의 시간과 에너지 소비를 요구합니다.
초록
해양 환경에서의 로봇 충돌 회피 정책에 대한 연구
다중 로봇 간의 상호작용과 정적 장애물을 고려한 분산형 로봇 훈련 프레임워크
분산형 강화 학습 정책의 성능 평가 및 비교
안전성 향상을 위한 위험 감수 민감 정책의 적용
실험 결과 및 성능 평가
통계
"우리의 분산형 의사 결정 프레임워크" (Fig. 1)
"우리의 분산형 의사 결정 프레임워크"의 변형
"로봇의 충돌 반대 행동을 선택하는 속도 장벽" (Eq. 22)
인용구
"우리의 분산형 의사 결정 프레임워크."
"분산형 강화 학습 정책은 항해 안전에서 우세한 성능을 보여줍니다."