Die Studie beschreibt den Aufbau einer großen Sammlung von widersprüchlichen und nicht-widersprüchlichen Antworten, die von verschiedenen leistungsfähigen Dialogmodellen generiert wurden. Die Antworten wurden von menschlichen Annotatorinnen und Annotatoren klassifiziert.
Die Analyse der Daten ergab zwei Haupttypen von Widersprüchen in den modellerzeugten Antworten:
Bestimmte Merkmale des Dialogkontextes, wie z.B. die Art der Frage, beeinflussen die Wahrscheinlichkeit, dass ein Modell eine widersprüchliche Antwort generiert.
Die Studie zeigt auch, dass ein Widerspruchserkennungsmodell, das auf den gesammelten Daten trainiert wurde, deutlich besser in der Lage ist, Widersprüche in Modellantworten zu identifizieren als ein Modell, das auf manuell erstellten Widersprüchen trainiert wurde.
Ke Bahasa Lain
dari konten sumber
arxiv.org
Wawasan Utama Disaring Dari
by Shiki Sato,R... pada arxiv.org 03-20-2024
https://arxiv.org/pdf/2403.12500.pdfPertanyaan yang Lebih Dalam