방향성 그래디언트를 사용한 의사 결정 중심 학습 (Decision-Focused Learning with Directional Gradients) - 오류 지정 설정에서의 성능 보장
본 논문에서는 예측-최적화 프레임워크에서 기존의 서로게이트 손실 함수보다 우수한 성능을 보이는 새로운 서로게이트 손실 함수인 Perturbation Gradient (PG) 손실 함수를 제안하며, 특히 잘못 지정된 설정에서도 점근적으로 최상의 정책을 달성할 수 있음을 보여줍니다.