المفاهيم الأساسية
Große Sprachmodelle (LLMs) neigen dazu, durch unwahrheitsgemäße Kontextinformationen in die Irre geführt zu werden und Halluzinationen zu produzieren. Die Methode "Truth-Aware Context Selection" (TACS) ermöglicht es, unwahrheitsgemäße Kontextinformationen zu erkennen und zu filtern, um die Qualität der Antworten des LLMs zu verbessern.
الملخص
Die Studie untersucht das Problem, dass große Sprachmodelle (LLMs) leicht durch unwahrheitsgemäße Kontextinformationen in die Irre geführt werden können und dadurch Halluzinationen produzieren. Um dies zu adressieren, wird die Methode "Truth-Aware Context Selection" (TACS) vorgestellt:
- Zunächst wird die Wahrheitstreue der Kontextinformationen mithilfe von Klassifikatoren, die auf den internen Repräsentationen des LLMs trainiert wurden, detektiert.
- Basierend auf den Wahrheitsgraden der einzelnen Kontextpositionen wird dann eine Aufmerksamkeitsmaske erstellt, um wahrheitsgetreue Informationen beizubehalten und unwahrheitsgemäße Informationen zu verwerfen.
- Schließlich generiert das LLM die Antwort unter Verwendung des gefilterten Kontexts.
Zusätzlich wird eine neue Metrik, die "Disturbance Adaptation Rate", eingeführt, um die Fähigkeit des LLMs zu messen, wahrheitsgetreue Informationen zu akzeptieren und unwahrheitsgemäße Informationen zu ignorieren.
Die Experimente zeigen, dass TACS die Halluzinationen, die durch unwahrheitsgemäße Kontextinformationen verursacht werden, effektiv reduzieren kann, ohne die Fähigkeit des LLMs, wahrheitsgetreue Informationen zu nutzen, zu beeinträchtigen.
الإحصائيات
Der Anteil korrekter Antworten des LLMs ohne zusätzliche Informationen beträgt 56,7%.
Mit Hinzufügen wahrheitsgetreuer Informationen steigt der Anteil korrekter Antworten auf 88,8%.
Mit Hinzufügen unwahrheitsgemäßer Informationen sinkt der Anteil korrekter Antworten auf 10,3%.
اقتباسات
"LLMs neigen dazu, durch sorgfältig fabrizierte Informationen in die Irre geführt zu werden, was zu Halluzinationen führt."
"Die Möglichkeit einer Mischung aus Wahrheit und Unwahrheit innerhalb der Kontextinformationen unterstreicht die Notwendigkeit einer feingranularen Wahrheitserkennung."