Eine neuartige Lernmethode, die die Lücke zwischen selbstüberwachtem Lernen und Selbstdistillation überbrückt, um die Empfehlungsleistung für Nutzer mit begrenzten Verhaltensweisen zu verbessern.
Das Ziel ist es, die Auswirkungen von zufälligen Aktionen auf die Optimierung von Empfehlungsmodellen durch die Nutzung stabilerer statistischer Informationen zu reduzieren.