Concetti Chiave
Ein einfaches und neuartiges unüberwachtes Verfahren zur Vorhersage, ob die Autoren zweier Beiträge übereinstimmen oder nicht, indem es die von ihren Beiträgen erhaltenen Standpunkte zu benannten Entitäten nutzt.
Sintesi
Die Studie präsentiert STEntConv, ein Modell, das einen Graphen von Nutzern und benannten Entitäten aufbaut, der nach Standpunkt gewichtet ist, und ein signiertes Graph-Convolutional-Netzwerk (SGCN) trainiert, um Meinungsverschiedenheiten zwischen Kommentar- und Antwortnachrichten zu erkennen.
Die Autoren führen Experimente und Ablationsstudien durch und zeigen, dass die Einbeziehung dieser Informationen die Leistung bei der Erkennung von Meinungsverschiedenheiten auf einem Datensatz von Reddit-Beiträgen für eine Reihe kontroverser Subreddit-Themen verbessert, ohne dass plattformspezifische Merkmale oder Nutzerhistorie erforderlich sind.
Statistiche
Die Studie verwendet einen Datensatz von 42.894 Reddit-Kommentar-Antwort-Paaren aus 5 verschiedenen Subreddits.
Der Datensatz enthält 16.723 Kommentar-Antwort-Paare, bei denen alle drei Crowdsourcer-Annotationen übereinstimmen.
Das vorgeschlagene Modell STEntConv erzielt eine durchschnittliche makro-F1-Punktzahl von 0,71 auf dem Testdatensatz, was eine Verbesserung von 7 Punkten gegenüber dem BERT-Basismodell und 6 Punkten gegenüber dem vorherigen besten Modell darstellt.
Citazioni
"Ein einfaches und neuartiges unüberwachtes Verfahren zur Vorhersage, ob die Autoren zweier Beiträge übereinstimmen oder nicht, indem es die von ihren Beiträgen erhaltenen Standpunkte zu benannten Entitäten nutzt."
"STEntConv, ein Modell, das einen Graphen von Nutzern und benannten Entitäten aufbaut, der nach Standpunkt gewichtet ist, und ein signiertes Graph-Convolutional-Netzwerk (SGCN) trainiert, um Meinungsverschiedenheiten zwischen Kommentar- und Antwortnachrichten zu erkennen."