Der Artikel untersucht, wie sich die Leistung verschiedener Arten von niedrig- und hochstufigen Merkmalen im Laufe der Zeit (während der Verbreitung von Gerüchten) ändert, um das Verständnis der Merkmalauswirkung und des Modelldesigns für die Gerüchteerkennung zu verschiedenen Zeitpunkten zu verbessern.
Zunächst wird ein neuronales Modell auf Einzeltweetebene entwickelt, um die Glaubwürdigkeit von Tweets zu bewerten. Dieses Modell nutzt Convolutional Neural Networks (CNN) und Long Short-Term Memory (LSTM) Netzwerke, um eine reichhaltige versteckte semantische Darstellung einzelner Tweets zu lernen.
Anschließend wird ein zeitabhängiges Klassifikationsmodell auf Basis einer Reihe von über 50 Merkmalen aus verschiedenen Kategorien wie Ensemble, Twitter und epidemiologische Merkmale entwickelt. Dieses Modell nutzt die Vorhersagen des Einzeltweetmodells als zusätzliches Merkmal.
Die umfangreichen Experimente zeigen, dass das resultierende Modell, das diese Merkmale nutzt, wettbewerbsfähig ist, eine Genauigkeit von über 90% erreicht und stärkere Basislinien in einem sorgfältig kuratierten Datensatz übertrifft. Insbesondere in den ersten 24 Stunden übertrifft das Modell deutlich die Leistung menschlicher Experten bei der Gerüchteaufklärung.
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Tu Nguyen alle arxiv.org 04-10-2024
https://arxiv.org/pdf/1711.00726.pdfDomande più approfondite