核心概念
Eine neue Methode zur Verbesserung der Genauigkeit von Klassifikationsvorhersagen in der quellenfreien Domänenanpassung, indem eine Rauschübergangsmatrix gelernt wird, um die Verzerrung der Pseudo-Labels zu erfassen und eine genauere Schätzung der wahren Klassenzugehörigkeit zu ermöglichen.
要約
In diesem Artikel wird eine neue Methode namens DCPL (De-Confusing Pseudo-Labels) vorgestellt, die sich auf die Herausforderungen der quellenfreien Domänenanpassung (SFDA) konzentriert. SFDA zielt darauf ab, ein auf einer Quelldomäne trainiertes Modell an eine ungelabelte Zieldomäne anzupassen, ohne Zugriff auf die Quelldaten zu haben.
Ein Schlüsselproblem in SFDA ist die Reduzierung der Fehlerakkumulation, die durch Domänenverschiebungen verursacht wird. Bestehende Methoden konzentrieren sich auf Selbsttraining unter Verwendung von Ziel-Pseudo-Labels und Entropie-Minimierungstechniken. Diese generierten Pseudo-Labels neigen jedoch aufgrund der Domänenverschiebung zu Rauschen.
DCPL geht dieses Problem aus der Perspektive des Lernens mit Labelrauschen (LLN) an und schlägt einen neuartigen Ansatz vor, der speziell für Domänenanpassungsszenarien entwickelt wurde. DCPL lernt eine Rauschübergangsmatrix, um die Labelverzerrung der Pseudo-Labels zu erfassen und eine genauere Schätzung der wahren Klassenzugehörigkeit zu ermöglichen. Darüber hinaus wird Wissen aus dem Quellmodell in den Lernprozess der Übergangsmatrix integriert, um eine noch genauere Schätzung zu erzielen.
Die Leistungsfähigkeit von DCPL wird durch die Integration in verschiedene SFDA-Methoden wie SHOT, SHOT++ und AaD demonstriert. Die Ergebnisse zeigen, dass DCPL neue State-of-the-Art-Leistungen auf drei Domänenanpassungsdatensätzen erzielt: VisDA, DomainNet und OfficeHome.
統計
Die Pseudo-Labels neigen aufgrund von Domänenverschiebungen zu Rauschen.
Die Ausgaben des Quellmodells enthalten wertvolle Informationen über die Rauschverteilung, die zur Verbesserung der Schätzung der Übergangsmatrix genutzt werden können.
Durch die Minimierung der Spur der geschätzten Rauschübergangsmatrix wird sichergestellt, dass sie gegen die wahre Rauschübergangsmatrix konvergiert.
Die Verwendung eines robusten vortrainierten Netzwerks wie Swin-B zur Generierung der Pseudo-Labels verbessert deren Qualität.
引用
"In diesem spezifischen Kontext konzentriert sich unser Ansatz auf Lernmethoden, die auf der Schätzung einer Rauschübergangsmatrix (oder einer Verwechslungsmatrix) basieren und sich als sehr erfolgreich erwiesen haben, indem sie Spitzenergebnisse liefern."
"In unserem speziellen Szenario stammt das Labelrauschen aus Pseudo-Labels, die mit einem bestimmten Quellmodell generiert wurden. Dieses Labelrauschen entsteht aus Domänenverschiebungen, bei denen sich die Merkmale der Daten in der Zieldomäne von denen in der für das Training verwendeten Quelldomäne unterscheiden."
"Folglich enthalten die Ausgaben des Quellmodells wertvolle Informationen über die Rauschverteilung, die genutzt werden können, um die Schätzung der Übergangsmatrix zu verbessern."