Effizientes Lernen aus Fehlschlägen: Feinabstimmung von LLMs mit Versuch-und-Irrtum-Daten für den Beweis der intuitionistischen Aussagenlogik
Der Einsatz von Versuch-und-Irrtum-Informationen während des Trainings und der Beweissuche verbessert die Leistung von Modellen für das automatische Beweisen von Theoremen der intuitionistischen Aussagenlogik im Vergleich zu Modellen, die nur auf korrekten Beweispfaden trainiert werden.