Core Concepts
Wir entwickeln eine Ensemble-Methode zur Bot-Erkennung, die eine Multi-Plattform-Bot-Erkennungsarchitektur entwirft, um mehrere Probleme entlang der Bot-Erkennungspipeline zu bewältigen: unvollständige Dateneingabe, minimale Merkmalsextraktion, optimierte Klassifikatoren für jedes Datenfeld und Eliminierung der Notwendigkeit eines Schwellenwerts für die Klassifizierungsbestimmung.
Abstract
In dieser Arbeit entwickeln wir BotBuster For Everyone, einen Multi-Plattform-Bot-Detektor für soziale Medien. Dieses Modell identifiziert Bot-Konten von drei Hauptplattformen: Twitter, Reddit und Instagram.
Das Highlight unseres Bot-Erkennungsmodells ist seine Fähigkeit, Daten zu verarbeiten, bei denen nicht alle Felder vorhanden sind. Unsere Experimente zeigen, dass es zwar etwas genauer ist, wenn das Modell Datensätze mit vollständigen Datenfeldern verarbeitet, aber es ist es wert, etwas Genauigkeit zu opfern, um eine breitere Nutzung des Bot-Erkennungsalgorithmus zu ermöglichen.
Unser Bot-Erkennungsmodell kann Bots von mehreren sozialen Medienplattformen identifizieren, was die Notwendigkeit, mehrere Bot-Erkennungsmodelle für plattformübergreifende Studien zu beschaffen und auszuführen, reduziert und Zeit spart. Durch die Aggregation von Trainingsdaten aus verschiedenen Bot-Erkennungsrepositorys für Twitter, Reddit und Instagram lernt das Modell Bot/Mensch-Merkmale aus verschiedenen Zeiträumen und Verhaltensmustern, was es robuster und generalisierbarer macht.
Das Ensemble-basierte Bot-Erkennungsframework, das spezialisierte Klassifikatoren für jede Datenklasse fein abstimmt, bevor es die Wahrscheinlichkeiten aggregiert, ermöglicht es, Fälle mit unvollständigen Daten zu behandeln. Wenn Daten fehlen, können die übrigen spezialisierten Klassifikatoren immer noch eine Vorhersage treffen, da sie separat trainiert wurden und verschiedene Datenfelder analysieren.
Schließlich eliminiert unser Rahmenwerk die Notwendigkeit der Auswahl eines Schwellenwerts für die Bot/Mensch-Klassifizierung, indem es sowohl die Wahrscheinlichkeit eines Bots als auch eines Menschen als Ausgabe liefert. Dies beseitigt die Mehrdeutigkeit der Schwellenwertauswahl und erhöht die Konsistenz der Bot-Erkennung.
Stats
Die Entropie von Benutzernamen und die Anzahl der Interaktionen (Retweets/Shares) sind wichtige Faktoren bei der Bot-Bestimmung.
Quotes
"Bots haben sich in den Fokus vieler Studien zu sozialen Medien gestellt, da beobachtet wurde, dass sie an der Manipulation von Informationen und Meinungen in sozialen Medien beteiligt sind."
"Bots, die in koordinierter Weise zusammenarbeiten, sind auch bekannt dafür, dass sie anderen Nutzern sozialen Druck ausüben, was dazu führen kann, dass sie ihre Meinung zu wichtigen Themen ändern."