Die Studie beschreibt den Aufbau einer großen Sammlung von widersprüchlichen und nicht-widersprüchlichen Antworten, die von verschiedenen leistungsfähigen Dialogmodellen generiert wurden. Die Antworten wurden von menschlichen Annotatorinnen und Annotatoren klassifiziert.
Die Analyse der Daten ergab zwei Haupttypen von Widersprüchen in den modellerzeugten Antworten:
Bestimmte Merkmale des Dialogkontextes, wie z.B. die Art der Frage, beeinflussen die Wahrscheinlichkeit, dass ein Modell eine widersprüchliche Antwort generiert.
Die Studie zeigt auch, dass ein Widerspruchserkennungsmodell, das auf den gesammelten Daten trainiert wurde, deutlich besser in der Lage ist, Widersprüche in Modellantworten zu identifizieren als ein Modell, das auf manuell erstellten Widersprüchen trainiert wurde.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Shiki Sato,R... at arxiv.org 03-20-2024
https://arxiv.org/pdf/2403.12500.pdfDeeper Inquiries