Core Concepts
Durch den Einsatz eines Hypothesen-Verifikations-Modells (HVM) während des Decodierungsprozesses kann die Treue der Ausgabe von Wissens-zu-Text-Generatoren signifikant verbessert werden, ohne die Qualität stark zu beeinträchtigen.
Abstract
Der Artikel befasst sich mit dem Problem der Halluzinationen in Wissens-zu-Text-Generatoren (K2T), d.h. der Tendenz der Modelle, Ausgaben zu produzieren, die den Eingaben widersprechen oder nicht durch sie unterstützt werden.
Um dieses Problem anzugehen, schlagen die Autoren einen modell-agnostischen Decodierungs-Ansatz namens TWEAK vor. TWEAK behandelt die generierten Sequenzen in jedem Decodierungsschritt und mögliche zukünftige Sequenzen als Hypothesen und bewertet jede Kandidatengeneration basierend darauf, inwieweit ihre Hypothesen durch die Eingabefakten unterstützt werden, unter Verwendung eines Hypothesen-Verifikations-Modells (HVM).
Die Autoren testen zunächst einen NLI-Modell als HVM und berichten über eine verbesserte Treue mit minimalem Einfluss auf die Qualität. Sie ersetzen dann den NLI-Modell durch ein aufgabenspezifisches HVM, das mit einem neuartigen Datensatz namens FATE trainiert wird, der Eingabefakten mit ihren originalen und gestörten Beschreibungen paart. Tests mit zwei Generatoren zeigen, dass die besten TWEAK-Varianten die Treue im Durchschnitt um 2,24/7,17 Punkte verbessern (FactKB) in In-/Out-of-Distribution-Evaluierungen, bei nur einem Rückgang von 0,14/0,32 Punkten in der Qualität (BERTScore).
Stats
Die besten TWEAK-Varianten verbessern die Treue im Durchschnitt um 2,24/7,17 Punkte (FactKB) in In-/Out-of-Distribution-Evaluierungen.
Der Rückgang in der Qualität beträgt nur 0,14/0,32 Punkte (BERTScore).
Quotes
"Knowledge-to-text generators often struggle to faithfully generate descriptions for the input facts: they may produce hallucinations that contradict the input, or describe facts not present in the input."
"TWEAK treats the generated sequences at each decoding step and its future sequences as hypotheses, and ranks each generation candidate based on the extent to which their hypotheses are supported by the input facts using a Hypothesis Verification Model (HVM)."