Große Sprachmodelle (LLMs) haben Schwierigkeiten mit einfachen sprachlichen Schlussfolgerungen
Große Sprachmodelle zeigen moderate bis geringe Leistung bei einfachen Schlussfolgerungsaufgaben, die für Menschen trivial sind, wie grammatikalisch spezifizierte Implikationen, Prämissen mit Evidenzadverbien der Unsicherheit und Monotonie-Implikationen. Einbettung der Prämissen in syntaktische Konstruktionen, die die Implikationsbeziehungen erhalten oder ändern, verwirrt die Modelle weiter.