Attribute-Gesteuerte Prompt-Feinabstimmung für Vision-Sprache-Modelle zur Verbesserung der Übertragbarkeit
Durch die Ausrichtung von Vision-Sprache-Modellen auf primitive visuelle Attribute anstelle von Klassennamen können die korrekten Begründungen für Entscheidungen erfasst und die Übertragbarkeit auf neue Klassen oder Verteilungen verbessert werden.