Die Studie beschreibt den Aufbau einer großen Sammlung von widersprüchlichen und nicht-widersprüchlichen Antworten, die von verschiedenen leistungsfähigen Dialogmodellen generiert wurden. Die Antworten wurden von menschlichen Annotatorinnen und Annotatoren klassifiziert.
Die Analyse der Daten ergab zwei Haupttypen von Widersprüchen in den modellerzeugten Antworten:
Bestimmte Merkmale des Dialogkontextes, wie z.B. die Art der Frage, beeinflussen die Wahrscheinlichkeit, dass ein Modell eine widersprüchliche Antwort generiert.
Die Studie zeigt auch, dass ein Widerspruchserkennungsmodell, das auf den gesammelten Daten trainiert wurde, deutlich besser in der Lage ist, Widersprüche in Modellantworten zu identifizieren als ein Modell, das auf manuell erstellten Widersprüchen trainiert wurde.
다른 언어로
소스 콘텐츠 기반
arxiv.org
핵심 통찰 요약
by Shiki Sato,R... 게시일 arxiv.org 03-20-2024
https://arxiv.org/pdf/2403.12500.pdf더 깊은 질문