확산 모델을 사용하여 전역 경로를 생성하고 강화 학습 알고리즘을 사용하여 회피 행동을 학습함으로써, 부분적으로 관찰 가능한 대규모 적대적 환경에서 효과적으로 목표를 달성하고 탐지를 피할 수 있다.