Core Concepts
Eine neuartige Strategie zur Synthese harter negativer Instanzen, die von positiven Informationen dominiert werden, kann die Überanpassung in Empfehlungssystemen erheblich reduzieren und gleichzeitig die Vorhersagegenauigkeit deutlich verbessern.
Abstract
In dieser Arbeit wird zunächst untersucht, warum die Überanpassung in Empfehlungssystemen auftritt, wenn harte negative Stichprobenentnahme-Strategien verwendet werden. Es wird empirisch gezeigt, dass die falsche Auswahl von falschen negativen Instanzen während der harten negativen Stichprobenentnahme zu dieser Überanpassung beiträgt.
Daraufhin wird eine neuartige Strategie zur Synthese harter negativer Instanzen, die positive-dominierte negative Synthese (PDNS), vorgestellt. PDNS synthetisiert harte negative Instanzen, indem es positive Einbettungen in negative Einbettungen einbezieht, wobei die synthetischen Negativen von den positiven Informationen dominiert werden. Umfassende Experimente zeigen, dass PDNS nicht nur die Überanpassung erheblich abschwächt, sondern auch zu einer deutlichen Leistungssteigerung in Bezug auf die Effektivität führt.
Darüber hinaus wird eine theoretische Analyse des Mechanismus von PDNS durchgeführt, die nahelegt, dass PDNS die Zuweisung sehr großer Gradientengrößen zu den härtesten Negativen unter allen harten negativen Stichproben reduzieren kann. Dieses Verhalten verringert implizit das Risiko, dass die Härte der Stichproben beim Aktualisieren des Modells automatisch erhöht wird, wodurch PDNS robuster gegenüber falschen negativen Instanzen wird. Basierend auf dieser Analyse wird ein einfacher äquivalenter Algorithmus von PDNS präsentiert, bei dem lediglich das Verlustkriterium leicht modifiziert wird.
Stats
Die härtesten negativen Instanzen sind am wahrscheinlichsten falsche negative Instanzen.
Wenn mehr falsche negative Instanzen während der negativen Stichprobenentnahme vermieden werden, wird die Überanpassung des Empfehlungssystems konsistent abgemildert.
PDNS erzielt im Vergleich zum zweitbesten Verfahren eine relative Verbesserung von 3,10% bis 6,86% bei Recall@50 auf den Testdatensätzen.
Quotes
"Die härtesten negativen Instanzen sind am wahrscheinlichsten falsche negative Instanzen."
"Wenn mehr falsche negative Instanzen während der negativen Stichprobenentnahme vermieden werden, wird die Überanpassung des Empfehlungssystems konsistent abgemildert."