Die Studie beschreibt den Aufbau einer großen Sammlung von widersprüchlichen und nicht-widersprüchlichen Antworten, die von verschiedenen leistungsfähigen Dialogmodellen generiert wurden. Die Antworten wurden von menschlichen Annotatorinnen und Annotatoren klassifiziert.
Die Analyse der Daten ergab zwei Haupttypen von Widersprüchen in den modellerzeugten Antworten:
Bestimmte Merkmale des Dialogkontextes, wie z.B. die Art der Frage, beeinflussen die Wahrscheinlichkeit, dass ein Modell eine widersprüchliche Antwort generiert.
Die Studie zeigt auch, dass ein Widerspruchserkennungsmodell, das auf den gesammelten Daten trainiert wurde, deutlich besser in der Lage ist, Widersprüche in Modellantworten zu identifizieren als ein Modell, das auf manuell erstellten Widersprüchen trainiert wurde.
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Shiki Sato,R... a las arxiv.org 03-20-2024
https://arxiv.org/pdf/2403.12500.pdfConsultas más profundas