Visuelle Verankerung ermöglicht effizienteres Lernen von Wortbedeutungen und verbessert die Leistung von Sprachmodellen.