Die Studie präsentiert einen robusten Rahmen zur Erkennung von Phishing-Websites. Es wird eine 10-fache Kreuzvalidierungsstrategie verwendet, um Datenlecks beim Aufbau des Ensembles zu vermeiden. Die Merkmalsauswahl unter Verwendung der rekursiven Merkmalsauswahl dient dazu, den repräsentativsten Teilsatz von Merkmalen für jeden Klassifizierungsalgorithmus zu erhalten. 10 verschiedene Klassifikatoren werden mit dem erhaltenen Merkmalsatz trainiert. Die Ausgaben der Algorithmen werden als Wahrscheinlichkeitswerte anstelle von binären Werten verwendet, um dem Meta-Klassifikator mehr Flexibilität beim Training zu bieten. Ein auf einem gierigen Algorithmus basierender Auswahlmechanismus wird konstruiert, um die Kombination von Basisklassifikatoren zu bestimmen, die die Leistung des Ensembles optimieren. Eine Deep-Neural-Network-Architektur wurde als Meta-Klassifikator verwendet, und die endgültigen Vorhersagen des Stacking-Ensemble-Klassifikators wurden auf vier Phishing-Datensätzen validiert. So wird eine ausgeklügelte Stacking-Ensemble-Klassifikator-Architektur gebildet, die über alle Datensätze hinweg eine gut generalisierte Leistung erbringt.
In eine andere Sprache
aus dem Quellinhalt
arxiv.org
Wichtige Erkenntnisse aus
by Asif Newaz,F... um arxiv.org 03-18-2024
https://arxiv.org/pdf/2403.09735.pdfTiefere Fragen