Eine umfassende Untersuchung der Selbstverifikationsfähigkeiten großer Sprachmodelle bei logischem Schlussfolgern
Große Sprachmodelle haben Schwierigkeiten, logische Fehlschlüsse in ihren eigenen Schlussfolgerungen genau zu identifizieren, was die Gültigkeit von Selbstverifikationsmethoden infrage stellt.