Core Concepts
Eine Methode namens GRIP, die eine Gruppenregularisierungsstrategie und eine Instanzbereinigung verwendet, um die durch Rauschen in Webdaten verursachte Leistungsminderung erheblich zu verringern.
Abstract
Die Autoren präsentieren einen Ansatz namens GRIP (Group Regularization and Instance Purification), um das Problem des Rauschens in Webdaten für die Bildklassifizierung anzugehen.
Zunächst verwenden sie eine Gruppenregularisierungsstrategie, um Klassensoftlabels zu schätzen. Diese Softlabels dienen dazu, die Robustheit des Modells gegen Rauschen zu verbessern, indem Überfittung auf verrauschte Etiketten verhindert und Ähnlichkeiten zwischen Klassen gelernt werden.
Anschließend nutzen sie die geschätzten Klassensoftlabels, um eine globale Instanzbereinigung durchzuführen. Dabei werden verrauschte Proben identifiziert und entfernt, während revidierbare Proben mit Pseudolabeln neu beschriftet werden. Durch Operationen auf Gruppen- und Instanzebene integriert der Ansatz die Vorteile von rauschrobusten und rauschbereinigenden Methoden.
Umfangreiche Experimente auf synthetischen und realen Datensätzen zeigen, dass GRIP die Leistung deutlich verbessert und die bestehenden State-of-the-Art-Methoden übertrifft.
Stats
Die Verwendung von Webbildern als Trainingsdaten führt oft zu Rauschen in den Etiketten, was die Modellleistung beeinträchtigt.
Bestehende Methoden zur Bekämpfung von Rauschen in Etiketten sind oft auf synthetische Datensätze ausgelegt und erzielen auf realen Datensätzen keine zufriedenstellenden Ergebnisse.
Quotes
"Manuelle Annotierung von Datensätzen für das Training tiefer Modelle ist sehr arbeitsintensiv und zeitaufwendig."
"Direkte Nutzung von Webbildern zur Erstellung von Trainingsdaten ist eine naheliegende Wahl, aber die Präsenz von Rauschen in Webdaten beeinträchtigt normalerweise die Modellleistung."