Core Concepts
Die Identifizierung impliziter Zielgruppen in Hassrede ist entscheidend, um subtilere Hassrede zu erkennen und die Erkennung schädlicher Inhalte in digitalen Plattformen zu verbessern.
Abstract
Die Studie führt eine neue Aufgabe zur Identifizierung impliziter Zielgruppen in Hassrede ein und stellt einen Datensatz namens Implicit-Target-Span (ITS) vor, der sowohl explizite als auch implizite Zielspannen enthält. Der Datensatz wurde durch eine innovative Pooling-Methode unter Verwendung von Bewertungen menschlicher Annotationen und Großen Sprachmodellen (LLMs) erstellt.
Die Experimente zeigen, dass ITS eine anspruchsvolle Testumgebung für Methoden zur Erkennung von Zielspannen bietet. Ein Baseline-Modell namens TargetDetect, das auf dem Sequenz-Tagging-Framework basiert, wurde entwickelt und auf verschiedenen Transformator-Encodern evaluiert. Die Ergebnisse und Analysen verdeutlichen die Bedeutung der impliziten Zielspannenidentifikation und des neuen Datensatzes, um wichtige Forschung in diesem Bereich zu unterstützen.
Stats
57.000 annotierte Proben mit durchschnittlich 1,7 Zielspannen pro Probe
Etwa 19.000 eindeutige Ziele über die IHC- und SBIC-Datensätze hinweg, was eine deutliche Steigerung gegenüber den ursprünglichen 1.000 Zielen bedeutet
Quotes
"Songwriters don't belong and never will, so let's just remove the piano brains from this place!"