Core Concepts
Dieser Benchmark bietet eine umfassende Bewertung verschiedener Methoden zur Merkmalsauswahl für Deep-Recommender-Systeme, um praktische Erkenntnisse und Einblicke zu gewinnen.
Abstract
Dieser Benchmark, genannt ERASE, umfasst eine gründliche Evaluierung von elf Merkmalsauswahl-Methoden, die sowohl traditionelle als auch Deep-Learning-Ansätze abdecken. Die Experimente wurden auf vier öffentlichen Datensätzen, privaten Industriedatensätzen und einer kommerziellen Plattform durchgeführt, was zu signifikanten Verbesserungen führte.
Der Benchmark adressiert drei Kernherausforderungen in diesem Forschungsbereich:
Unterschiedliche experimentelle Setups in Forschungsarbeiten führen oft zu unfairen Vergleichen und verschleiern praktische Erkenntnisse.
Der Mangel an detaillierter Analyse zu Auswahlattributen, basierend auf großen Datensätzen und einem gründlichen Vergleich zwischen Auswahlverfahren und DRS-Rückgratmodellen, schränkt die Verallgemeinerbarkeit der Ergebnisse ein und behindert den Einsatz in DRS.
Die Forschung konzentriert sich oft auf den Vergleich der maximal erreichbaren Leistung von Merkmalsauswahlmethoden, was in der Regel rechnerisch nicht machbar ist, um die optimalen Hyperparameter zu identifizieren, und übersieht die Bewertung der Robustheit und Stabilität dieser Methoden.
Um diese Lücken zu schließen, führt ERASE eine neuartige Bewertungsmetrik, AUKC, ein, die speziell entwickelt wurde, um die Robustheit und Stabilität von Merkmalsauswahlmethoden über verschiedene Anzahlen von ausgewählten Merkmalen hinweg zu bewerten.
Die Ergebnisse zeigen, dass gate-basierte Methoden im Allgemeinen bessere Leistung zeigen als flache Merkmalsauswahl und sensitivitätsbasierte Methoden. Insbesondere erweisen sich AutoField, SHARK und SFS als überlegen in Bezug auf Robustheit und Stabilität über verschiedene Anzahlen von Auswahlen hinweg.
Stats
Die Auswahl von nur 50% der ursprünglichen Merkmale führt zu einer Latenzreduzierung von etwa 20% in einem Online-Empfehlungssystem, ohne die Effektivität zu beeinträchtigen.
Quotes
"Gate-basierte Methoden zeigen im Allgemeinen eine bessere Leistung im Vergleich zu flachen Merkmalsauswahl- und sensitivitätsbasierten Methoden."
"AutoField, SHARK und SFS erweisen sich als überlegen in Bezug auf Robustheit und Stabilität über verschiedene Anzahlen von Auswahlen hinweg."