Große Sprachmodelle haben Schwierigkeiten, oberflächlich ähnliche Konstruktionen korrekt zu unterscheiden
Große Sprachmodelle wie GPT-3.5, GPT-4 und Llama 2 zeigen eine starke Tendenz, Sätze mit "so... that..." als kausal zu interpretieren, auch wenn die Adjektive keine kausale Beziehung zum Komplementsatz aufweisen.