In dieser Arbeit entwickeln wir BotBuster For Everyone, einen Multi-Plattform-Bot-Detektor für soziale Medien. Dieses Modell identifiziert Bot-Konten von drei Hauptplattformen: Twitter, Reddit und Instagram.
Das Highlight unseres Bot-Erkennungsmodells ist seine Fähigkeit, Daten zu verarbeiten, bei denen nicht alle Felder vorhanden sind. Unsere Experimente zeigen, dass es zwar etwas genauer ist, wenn das Modell Datensätze mit vollständigen Datenfeldern verarbeitet, aber es ist es wert, etwas Genauigkeit zu opfern, um eine breitere Nutzung des Bot-Erkennungsalgorithmus zu ermöglichen.
Unser Bot-Erkennungsmodell kann Bots von mehreren sozialen Medienplattformen identifizieren, was die Notwendigkeit, mehrere Bot-Erkennungsmodelle für plattformübergreifende Studien zu beschaffen und auszuführen, reduziert und Zeit spart. Durch die Aggregation von Trainingsdaten aus verschiedenen Bot-Erkennungsrepositorys für Twitter, Reddit und Instagram lernt das Modell Bot/Mensch-Merkmale aus verschiedenen Zeiträumen und Verhaltensmustern, was es robuster und generalisierbarer macht.
Das Ensemble-basierte Bot-Erkennungsframework, das spezialisierte Klassifikatoren für jede Datenklasse fein abstimmt, bevor es die Wahrscheinlichkeiten aggregiert, ermöglicht es, Fälle mit unvollständigen Daten zu behandeln. Wenn Daten fehlen, können die übrigen spezialisierten Klassifikatoren immer noch eine Vorhersage treffen, da sie separat trainiert wurden und verschiedene Datenfelder analysieren.
Schließlich eliminiert unser Rahmenwerk die Notwendigkeit der Auswahl eines Schwellenwerts für die Bot/Mensch-Klassifizierung, indem es sowohl die Wahrscheinlichkeit eines Bots als auch eines Menschen als Ausgabe liefert. Dies beseitigt die Mehrdeutigkeit der Schwellenwertauswahl und erhöht die Konsistenz der Bot-Erkennung.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문