Keskeiset käsitteet
Föderiertes Lernen kann Cyber-Bedrohungserkennungsmodelle mit vergleichbarer Leistung wie zentral trainierte Modelle erzielen, ist widerstandsfähig gegen Vergiftungsangriffe und kann durch eine Bootstrapping-Strategie effizient sein.
Tiivistelmä
Die Studie evaluiert die Effektivität, Byzantinische Widerstandsfähigkeit und Effizienz von föderiertem Lernen (FL) für zwei repräsentative Cyber-Bedrohungserkennungsaufgaben: SMS-Spam-Erkennung und Android-Malware-Erkennung.
Effektivität:
- FL-trainierte Bedrohungserkennungsmodelle können eine mit zentral trainierten Modellen vergleichbare Leistung erreichen.
- Ein hoher Grad an mengenbasierter nicht-IID-Verteilung der Daten über FL-Clients kann zu besserer Modellleistung und schnellerer Konvergenz führen, insbesondere bei Cross-Device-FL.
- Eine hohe Konsistenz der Etikettenungleichheit (CLI) in Richtung positiver (schädlicher) Samples kann zu einer nicht vernachlässigbaren Leistungseinbuße führen, während die Auswirkungen von CLI in Richtung negativer Samples gering sind.
Byzantinische Widerstandsfähigkeit:
- Datenvergiftungsangriffe mit einem praktischen Anteil kompromittierter Clients (≤5%) haben einen vernachlässigbaren Angriffseinfluss von bis zu 0,14% Genauigkeitsverringerung.
- Modellvergiftungsangriffe mit einem praktischen Anteil kompromittierter Clients (≤1%) haben ebenfalls einen vernachlässigbaren bis geringen Einfluss, der durch den Einsatz robuster Aggregationsregeln weiter reduziert werden kann.
Effizienz:
- Nicht-IID-Datenverteilungen können zu einer erheblichen Verzögerung bei der Konvergenz führen, was durch eine Bootstrapping-Strategie effektiv abgemildert werden kann.
Tilastot
"Die FL-trainierte Spam-Erkennungsmodelle haben eine Genauigkeit von 98,71% und eine Trefferquote von 98,45% erreicht, während die zentral trainierten Modelle 99,23% Genauigkeit und 98,79% Trefferquote aufweisen."
"Die FL-trainierten Malware-Erkennungsmodelle haben eine Genauigkeit von 98,49% und eine Trefferquote von 99,36% erreicht, während die zentral trainierten Modelle 99,41% Genauigkeit und 99,76% Trefferquote aufweisen."
Lainaukset
"Föderiertes Lernen kann Cyber-Bedrohungserkennungsmodelle mit vergleichbarer Leistung wie zentral trainierte Modelle erzielen."
"Datenvergiftungsangriffe mit einem praktischen Anteil kompromittierter Clients (≤5%) haben einen vernachlässigbaren Angriffseinfluss von bis zu 0,14% Genauigkeitsverringerung."
"Nicht-IID-Datenverteilungen können zu einer erheblichen Verzögerung bei der Konvergenz führen, was durch eine Bootstrapping-Strategie effektiv abgemildert werden kann."