이 연구는 자율 표면 선박(ASV)의 경로 추종 및 충돌 회피 작업을 위해 예측 안전 필터(PSF)와 모델 없는 강화 학습(RL) 기반 제어 정책을 결합하는 하이브리드 알고리즘을 제안합니다.
주요 내용은 다음과 같습니다:
PSF 설계 및 검증: 선박 충돌 회피 및 제어를 위한 PSF를 설계하고 검증합니다. PSF는 RL 에이전트의 제안 제어 입력을 수정하여 안전한 상태 궤적을 보장합니다.
성능 평가: 다양한 난이도의 무작위 시나리오에서 안전 준수 및 항해 품질을 평가하여 PSF 적용의 장점을 분석합니다. PSF가 적용된 RL 에이전트와 그렇지 않은 에이전트의 성능을 비교합니다.
학습 가속화: PSF를 통해 RL 에이전트의 학습 속도를 높이고 학습 시간을 단축할 수 있음을 보여줍니다.
이 연구는 RL을 ASV에 실용적으로 활용하기 위한 접근법을 제시하며, 기존 RL 방법에 비해 더 높은 수준의 투명성과 안전성을 제공합니다.
Vers une autre langue
à partir du contenu source
arxiv.org
Questions plus approfondies