Eine umfassende Studie zur Erkennung und Klassifizierung logischer Fehlschlüsse
MAFALDA ist ein Benchmark für die Klassifizierung logischer Fehlschlüsse, der bestehende Datensätze zusammenführt und vereinheitlicht. Das Projekt umfasst eine Taxonomie zur Ausrichtung, Verfeinerung und Vereinheitlichung bestehender Klassifizierungen von Fehlschlüssen, eine manuelle Annotation eines Teils des Datensatzes mit Erklärungen, ein neues Annotationsschema für subjektive NLP-Aufgaben sowie eine neue Bewertungsmethode zur Handhabung von Subjektivität.