Entdeckung der zugrunde liegenden Fähigkeiten und Verzerrungen großer Vision-Sprache-Modelle durch Transferlernen
Durch eine umfangreiche Transferlernanalyse werden sechs interpretierbare Faktoren und Verzerrungen identifiziert, die die Leistung von Vision-Sprache-Modellen auf verschiedenen Tests beeinflussen.