Wie robust sind CLIP-Modelle gegenüber Scheinkorrelationen im Vergleich zu ImageNet-Modellen?
CLIP-Modelle, die auf großen Web-Datensätzen trainiert wurden, zeigen zwar eine beeindruckende Leistung bei Verteilungsverschiebungen, lernen aber immer noch Scheinkorrelationen, die ihre Robustheit beeinträchtigen können. Im Vergleich dazu sind konventionelle ImageNet-Modelle in manchen Fällen robuster gegenüber solchen Scheinkorrelationen.