Die Studie führt ein neuartiges und praxisrelevantes Problem der "Unified Source-Free Domain Adaptation" (Unified SFDA) ein, das verschiedene spezifische Szenarien wie geschlossene Mengen, offene Mengen, Teilmengen und verallgemeinerte Einstellungen in einem einheitlichen Rahmen umfasst.
Um dieses Unified SFDA-Problem zu lösen, wird ein neuer Ansatz namens "Latent Causal Factors Discovery" (LCFD) vorgestellt. Im Gegensatz zu herkömmlichen Methoden, die sich auf das statistische Lernen der Realität konzentrieren, wird LCFD aus einer Kausalitätsperspektive formuliert. Ziel ist es, die kausalen Beziehungen zwischen latenten Variablen und Modelentscheidungen aufzudecken, um die Zuverlässigkeit und Robustheit des erlernten Modells gegen Domänenverschiebungen zu verbessern.
Um umfangreiches Weltwissen zu integrieren, wird ein vortrainiertes Vision-Sprache-Modell wie CLIP verwendet. Dies unterstützt die Bildung und Entdeckung latenter kausaler Faktoren in Ermangelung von Überwachung bei der Verteilungs- und Semantikvariation, gekoppelt mit einem neu entworfenen Informationsflaschenhals mit theoretischen Garantien.
Umfangreiche Experimente zeigen, dass LCFD in verschiedenen SFDA-Szenarien sowie bei quellenfreier Out-of-Distribution-Generalisierung neue Spitzenergebnisse erzielen kann.
Naar een andere taal
vanuit de broninhoud
arxiv.org
Belangrijkste Inzichten Gedestilleerd Uit
by Song Tang,We... om arxiv.org 03-13-2024
https://arxiv.org/pdf/2403.07601.pdfDiepere vragen