Der FineFake-Datensatz wurde entwickelt, um die Herausforderungen bestehender Datensätze für die Erkennung von Falschnachrichten zu adressieren. Er umfasst 16.909 Datensätze aus sechs thematischen Bereichen und acht Plattformen. Jede Nachricht ist mit multimodalen Inhalten, möglichen sozialen Kontexten, halbautomatisch überprüftem Allgemeinwissen und feingranularen Annotationen angereichert, die über die üblichen binären Labels hinausgehen.
Der Datensatz enthält Nachrichten aus Fact-Checking-Websites, sozialen Medien und offiziellen Nachrichtenquellen. Die Nachrichten wurden mit Hilfe von Entitätsverknüpfung und manueller Überprüfung mit relevantem Hintergrundwissen angereichert. Darüber hinaus wurde ein neuartiges Annotationsschema mit sechs Kategorien entwickelt, um die Gründe für Falschaussagen detailliert zu erfassen.
Basierend auf FineFake wurden drei Aufgaben definiert: Binärklassifikation, feingranulare Klassifikation und Multi-Domänen-Anpassung. Umfangreiche Experimente zeigen, dass die Einbeziehung von Hintergrundwissen die Leistung der Modelle deutlich verbessert. Darüber hinaus wurde ein wissensbasiertes Domänen-Adaptations-Netzwerk (KEAN) entwickelt, das in den meisten Szenarien state-of-the-art-Ergebnisse erzielt.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Ziyi Zhou,Xi... at arxiv.org 04-03-2024
https://arxiv.org/pdf/2404.01336.pdfDeeper Inquiries