Die Studie präsentiert einen robusten Rahmen zur Erkennung von Phishing-Websites. Es wird eine 10-fache Kreuzvalidierungsstrategie verwendet, um Datenlecks beim Aufbau des Ensembles zu vermeiden. Die Merkmalsauswahl unter Verwendung der rekursiven Merkmalsauswahl dient dazu, den repräsentativsten Teilsatz von Merkmalen für jeden Klassifizierungsalgorithmus zu erhalten. 10 verschiedene Klassifikatoren werden mit dem erhaltenen Merkmalsatz trainiert. Die Ausgaben der Algorithmen werden als Wahrscheinlichkeitswerte anstelle von binären Werten verwendet, um dem Meta-Klassifikator mehr Flexibilität beim Training zu bieten. Ein auf einem gierigen Algorithmus basierender Auswahlmechanismus wird konstruiert, um die Kombination von Basisklassifikatoren zu bestimmen, die die Leistung des Ensembles optimieren. Eine Deep-Neural-Network-Architektur wurde als Meta-Klassifikator verwendet, und die endgültigen Vorhersagen des Stacking-Ensemble-Klassifikators wurden auf vier Phishing-Datensätzen validiert. So wird eine ausgeklügelte Stacking-Ensemble-Klassifikator-Architektur gebildet, die über alle Datensätze hinweg eine gut generalisierte Leistung erbringt.
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Asif Newaz,F... a las arxiv.org 03-18-2024
https://arxiv.org/pdf/2403.09735.pdfConsultas más profundas