전문가의 시연 데이터를 활용한 역강화 학습을 통해 자율 수상 선박의 자율 도킹 작업을 위한 보상 함수를 학습하고, 이를 기반으로 안전하고 효율적인 도킹 전략을 생성하는 방법을 제시한다.