Keskeiset käsitteet
예산 제약 하에서 효과적으로 처리를 할당하는 것은 다양한 분야에서 중요한 과제이다. 기존 방법은 효과 추정에 초점을 맞추지만, 이는 운영 상황과 일치하지 않을 수 있다. 따라서 우리는 순위 매기기를 통해 이익 극대화 할당 정책을 직접 학습하는 대안적 접근법을 제안한다.
Tiivistelmä
이 논문은 예산 제약 하에서 처리를 할당하는 문제를 다룬다. 기존 연구는 먼저 각 인스턴스의 처리 효과를 추정하고, 이를 기반으로 할당 정책을 최적화한다. 그러나 이는 예측 모델과 최적화 문제 간의 불일치를 초래할 수 있다.
이 논문에서는 순위 매기기를 통해 효과 할당 정책을 직접 학습하는 대안적 접근법을 제안한다. 구체적으로 다음과 같은 내용을 다룬다:
- 순위 매기기 문제를 정의하고, 이를 해결하기 위한 가정을 분석한다.
- 순위 매기기를 위한 포인트와이즈, 페어와이즈, 리스트와이즈 목적 함수를 제안한다. 특히 리스트와이즈 목적 함수가 정책의 AUQC를 직접 최적화할 수 있음을 보인다.
- 다양한 메타러너에 순위 매기기 목적 함수를 통합하는 방법을 제안한다.
- 합성 데이터와 실제 데이터를 통해 제안 방법의 효과를 검증한다. 실험 결과, 순위 매기기 접근법이 기존 효과 추정 방법보다 우수한 성능을 보인다.
Tilastot
처리 효과 τ는 관찰되지 않으며, 대신 잠재적 결과 y(t)만 관찰된다.
예산 B는 알려지지 않으며, 균일 분포 U(1, n)을 따른다고 가정한다.
Lainaukset
"예산 제약 하에서 처리를 효과적으로 할당하는 것은 다양한 분야에서 중요한 과제이다."
"기존 방법은 효과 추정에 초점을 맞추지만, 이는 운영 상황과 일치하지 않을 수 있다."
"우리는 순위 매기기를 통해 이익 극대화 할당 정책을 직접 학습하는 대안적 접근법을 제안한다."