Core Concepts
Eine Methode zur effizienten und übertragbaren Erkennung von nicht-faktischen Inhalten in Textgenerierungen von Großsprachmodellen, die auf einem Probe-Training mit Offline-Konsistenzprüfung basiert.
Abstract
Die Studie präsentiert PINOSE, eine Methode zur Erkennung von nicht-faktischen Inhalten in Textgenerierungen von Großsprachmodellen (LLMs). PINOSE umgeht die Notwendigkeit manuell annotierter Trainingsdaten, indem es stattdessen ein Offline-Konsistenzprüfungsverfahren verwendet, um Pseudo-Faktualitätsetiketten für die Trainingsinstanzen zu generieren.
Der Prozess besteht aus drei Hauptstufen:
In der Datenaufbereitungsphase werden natürlichsprachliche Fragen generiert und mehrere Antworten dazu erzeugt.
In der Offline-Konsistenzprüfungsphase werden die Antworten durch ein Peer-Review-Verfahren auf Konsistenz überprüft, um Pseudo-Faktualitätsetiketten zu erstellen.
In der Probekonstruktionsphase wird ein Probemodell trainiert, das die Faktualität von Antworten anhand der internen Repräsentationen des LLMs vorhersagt.
Im Vergleich zu bestehenden Methoden bietet PINOSE zwei Hauptvorteile:
Übertragbarkeit: PINOSE benötigt keine manuell annotierten Trainingsdaten und kann daher problemlos auf verschiedene Datendistributionen übertragen werden.
Effizienz und Effektivität: PINOSE vermeidet den Rechenaufwand für mehrfache Antwortgenerierungen während der Inferenz und nutzt stattdessen die internen Repräsentationen des LLMs, um die Faktualität effektiver vorherzusagen.
Die Experimente zeigen, dass PINOSE die Leistung bestehender Methoden zur Faktualitätserkennung übertrifft, sowohl in Bezug auf Genauigkeit als auch Effizienz. Darüber hinaus kann PINOSE erfolgreich auf verschiedene LLMs übertragen werden, indem es Konsistenzprüfungsdaten von einem LLM für das Training eines Probemodells für einen anderen LLM verwendet.
Stats
Etwa 71% der Erdoberfläche ist mit Wasser bedeckt.
Ungefähr ein Viertel der Erdoberfläche ist mit Wasser bedeckt.
Nahezu 71% der Erdoberfläche ist mit Wasser bedeckt.
Quotes
"Detecting non-factual content is a long-standing goal to increase the trustworthiness of large language models (LLMs) generations."
"PINOSE eliminates the need for human-annotated data and achieves transferability across diverse data distributions."
"PINOSE avoids the computational burden associated with multiple generations during inference, thus enhancing time efficiency."