Untersuchung der Robustheit von Counterfactual Learning-to-Rank-Modellen: Eine Reproduzierbarkeitsstudie
Counterfactual Learning-to-Rank-Modelle (CLTR) zeigen unterschiedliche Robustheit unter verschiedenen Simulationseinstellungen. Die DLA-Modelle und IPS-DCM sind robuster als IPS-PBM und PRS mit offline-Propensitätsschätzung, insbesondere wenn der Produktionsranker eine relativ hohe Rankingleistung oder Zufälligkeit aufweist.