Die Studie beschreibt den Aufbau einer großen Sammlung von widersprüchlichen und nicht-widersprüchlichen Antworten, die von verschiedenen leistungsfähigen Dialogmodellen generiert wurden. Die Antworten wurden von menschlichen Annotatorinnen und Annotatoren klassifiziert.
Die Analyse der Daten ergab zwei Haupttypen von Widersprüchen in den modellerzeugten Antworten:
Bestimmte Merkmale des Dialogkontextes, wie z.B. die Art der Frage, beeinflussen die Wahrscheinlichkeit, dass ein Modell eine widersprüchliche Antwort generiert.
Die Studie zeigt auch, dass ein Widerspruchserkennungsmodell, das auf den gesammelten Daten trainiert wurde, deutlich besser in der Lage ist, Widersprüche in Modellantworten zu identifizieren als ein Modell, das auf manuell erstellten Widersprüchen trainiert wurde.
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Shiki Sato,R... lúc arxiv.org 03-20-2024
https://arxiv.org/pdf/2403.12500.pdfYêu cầu sâu hơn