Основные понятия
Große Sprachmodelle können ihre eigenen Antworten oft nicht zuverlässig selbst evaluieren und korrigieren. Durch das Generieren und Kontrastieren verschiedener Lösungsperspektiven können ihre Selbstreflexionsfähigkeiten jedoch deutlich verbessert werden.
Аннотация
Die Untersuchung zeigt, dass Große Sprachmodelle Schwierigkeiten haben, ihre eigenen Antworten zuverlässig selbst zu evaluieren und zu korrigieren. Oft liefern sie entweder übermäßig selbstbewusste oder inkonsistente Rückmeldungen, was die Effektivität der Selbstreflexion stark beeinträchtigt.
Um dies zu verbessern, schlagen die Autoren den Ansatz "Self-Contrast" vor. Dabei generiert das Sprachmodell zunächst eigenständig mehrere unterschiedliche Lösungsperspektiven für eine Aufgabe. Diese Perspektiven werden dann miteinander kontrastiert, um Unterschiede und mögliche Fehlerquellen zu identifizieren. Aus diesen Erkenntnissen wird eine detaillierte Checkliste erstellt, anhand derer das Modell seine Antworten überprüfen und korrigieren kann.
Die Experimente zeigen, dass Self-Contrast im Vergleich zur Standard-Selbstreflexion zu deutlich stabileren und genaueren Ergebnissen führt, sowohl bei mathematischen Reasoning-Aufgaben als auch bei kreativen Übersetzungsaufgaben. Der Ansatz funktioniert über verschiedene Sprachmodelle hinweg und reduziert signifikant die Anzahl an fehlerhaften oder widersprüchlichen Selbstreflexionen.
Статистика
46,7% der Rückmeldungen des Sprachmodells waren übermäßig selbstbewusst und behaupteten, dass die vorherige Lösung korrekt sei.
45,7% der Rückmeldungen waren inkonsistent, wenn das Sprachmodell dieselbe Antwort mehrmals evaluierte.
Nur in 15,1% der Fälle mit einer anfänglich falschen Antwort konnte das Sprachmodell den Fehler durch Selbstreflexion korrigieren.
Цитаты
"Unsere Untersuchung zeigt, dass der Schlüsselengpass in der Qualität des selbst-evaluierten Feedbacks liegt. Wir stellen fest, dass Große Sprachmodelle oft Übervertrauen oder hohe Zufälligkeit bei der Selbstevaluierung aufweisen, was zu hartnäckigem oder inkonsistentem Feedback führt, was die Selbstreflexion beeinträchtigt."
"Um dies zu beheben, befürworten wir Self-Contrast: Es erforscht adaptiv diverse Lösungsperspektiven, die auf die Anfrage zugeschnitten sind, kontrastiert die Unterschiede und fasst diese Diskrepanzen in einer Checkliste zusammen, die zur Neuüberprüfung und Beseitigung von Diskrepanzen verwendet werden kann."