비전 기반 UAV의 강변 자율 비행을 위해 강화 학습과 모방 학습을 통합한 접근법을 제안하여 학습 속도 향상과 성능 향상을 달성하였다.
적대적 역강화 학습(AIRL)은 정책 모방과 전이 가능한 보상 회복이라는 두 가지 다른 목표를 가지고 있다. 이 논문에서는 이 두 가지 목표를 달성하기 위한 최적의 해결책을 제시한다.
적대적 역강화 학습(AIRL)은 정책 모방과 전이 가능한 보상 회복이라는 두 가지 다른 목표를 가지고 있다. 이 논문에서는 이 두 가지 목표를 달성하기 위한 최적의 솔루션을 제시한다.