예산 제약 하에서 효과적으로 처리를 할당하는 것은 다양한 분야에서 중요한 과제이다. 기존 방법은 효과 추정에 초점을 맞추지만, 이는 운영 상황과 일치하지 않을 수 있다. 따라서 우리는 순위 매기기를 통해 이익 극대화 할당 정책을 직접 학습하는 대안적 접근법을 제안한다.