Core Concepts
데이터 학습 루프로 인한 A/B 테스트의 간섭 문제를 해결하기 위해 가중치 학습 접근법을 제안한다.
Abstract
이 논문은 A/B 테스트에서 데이터 학습 루프로 인한 간섭 문제를 다룬다.
추천 시스템의 표준 파이프라인에는 데이터 학습-추천 사이클이 포함되어 있는데, 이로 인해 A/B 테스트에서 간섭이 발생할 수 있다.
이를 해결하기 위해 가중치 학습 접근법을 제안한다. 이 방법은 각 데이터 포인트가 처리 그룹 또는 대조 그룹에 속할 확률을 예측하는 모델을 학습하고, 이를 기반으로 손실 함수에 가중치를 적용하여 모델을 학습한다.
이 접근법은 학습 분포의 변화 없이 가장 낮은 분산을 달성할 수 있음을 보였다.
시뮬레이션 연구를 통해 제안 방법이 다른 방법에 비해 편향과 분산이 낮음을 입증했다.
Stats
처리 그룹의 평균 실험값: 9.8827 ± 0.0006
대조 그룹의 평균 실험값: 9.3523 ± 0.0006