Semantic-Aware Token Augmentation für Domain Generalisierung: Verbesserung der Formempfindlichkeit von Vision Transformern und MLP-Modellen
Die vorgeschlagene SETA-Methode verbessert die Formempfindlichkeit von Vision Transformern und MLP-Modellen, indem sie die Modelle dazu anregt, globale Formmerkmale aus kantengestörten Darstellungen zu lernen, was ihre Generalisierungsfähigkeit auf unbekannte Domänen erhöht.