본 논문은 UAV 지원 무선 네트워크를 위한 새로운 자기 지도 학습 경로 계획 방법을 제안한다. 오프라인 최적화기를 통해 얻은 데모 솔루션을 활용하여 UAV가 환경을 이해하고 최적화기의 정책을 암시적으로 발견할 수 있다. 이를 통해 UAV는 실시간 자율 의사결정과 능동 추론을 기반으로 온라인 계획을 수행할 수 있다.