Core Concepts
Für sicherheitskritische Anwendungen wie die Netzwerkeindringungserkennung sollten ML-Modelle nicht nur hinsichtlich ihrer Klassifikationsleistung, sondern auch hinsichtlich der Quantifizierung ihrer Vorhersageunsicherheit bewertet werden. Dies ermöglicht eine zuverlässigere Erkennung von Anomalien und unbekannten Angriffen.
Abstract
Der Artikel untersucht verschiedene ML-Modelle, die in der Lage sind, die Unsicherheit ihrer Vorhersagen zu quantifizieren und gleichzeitig Erkennungsleistung für bekannte Angriffe zu bieten.
Zunächst wird die Bedeutung der Unsicherheitsquantifizierung für Intrusion Detection Systeme (IDS) diskutiert. Typische ML-Modelle für IDS neigen dazu, überkonfidente Vorhersagen auch für falsch klassifizierte oder unbekannte Eingaben zu treffen, was die Zuverlässigkeit solcher Systeme einschränkt.
Der Artikel vergleicht verschiedene Ansätze zur Unsicherheitsquantifizierung und Out-of-Distribution-Erkennung, die speziell für den Bereich der Netzwerkeindringungserkennung entwickelt wurden. Dazu gehören Methoden basierend auf Neuronalen Netzen, Bayesschen Neuronalen Netzen und Zufallswäldern.
Darüber hinaus wird ein eigener Ansatz, basierend auf Bayesschen Neuronalen Netzen, vorgestellt. Dieser Ansatz zielt darauf ab, zuverlässige Unsicherheitsschätzungen zu liefern und die Erkennung von unbekannten Eingaben zu verbessern, ohne den Rechenaufwand signifikant zu erhöhen.
Die experimentellen Ergebnisse zeigen, dass die Verwendung von unsicherheitsgewahren ML-Modellen vorteilhaft ist, da sie in der Lage sind, (i) in einem geschlossenen Klassifikationsszenario aussagekräftige Unsicherheitsschätzungen zu liefern, (ii) Active Learning für eine effiziente Datenbeschriftung zu unterstützen und (iii) die Erkennung von Out-of-Distribution-Eingaben im Vergleich zu bestehenden Methoden zu verbessern.
Stats
Die Benign-Klasse umfasst 6.099.469 Samples.
Die Scanning-Klasse umfasst 3.781.419 Samples.
Die XSS-Klasse umfasst 2.455.020 Samples.
Die DDoS-Klasse umfasst 2.026.234 Samples.
Die Password-Klasse umfasst 1.153.323 Samples.
Die DoS-Klasse umfasst 712.609 Samples.
Die Injection-Klasse umfasst 684.465 Samples.
Die Backdoor-Klasse umfasst 16.809 Samples.
Die MITM-Klasse umfasst 7.723 Samples.
Die Ransomware-Klasse umfasst 3.425 Samples.
Quotes
"Für sicherheitskritische Anwendungen, wie die Netzwerkeindringungserkennung, sollten ML-Modelle nicht nur hinsichtlich ihrer Klassifikationsleistung, sondern auch hinsichtlich der Quantifizierung ihrer Vorhersageunsicherheit bewertet werden."
"Eine unsicherheitsgewahre Klassifikation wäre vorteilhaft, um die Leistung der geschlossenen Klassifikation zu verbessern, Active Learning zu ermöglichen und Eingaben unbekannter Klassen als tatsächlich unbekannt zu erkennen, was die Fähigkeiten der offenen Klassifikation und der Out-of-Distribution-Erkennung erschließt."