Wie Sprache und visuelle Wahrnehmung das Lernen aus begrenzten Daten beeinflussen
Sprache allein kann einen Großteil der Leistung eines vollständigen Sprach-Bild-Modells erreichen, obwohl es keine visuellen Eingaben hat. Sprache scheint dies zu ermöglichen, indem es Zugriff auf Vorwissen und Reasoning bietet.