Die Studie präsentiert einen robusten Rahmen zur Erkennung von Phishing-Websites. Es wird eine 10-fache Kreuzvalidierungsstrategie verwendet, um Datenlecks beim Aufbau des Ensembles zu vermeiden. Die Merkmalsauswahl unter Verwendung der rekursiven Merkmalsauswahl dient dazu, den repräsentativsten Teilsatz von Merkmalen für jeden Klassifizierungsalgorithmus zu erhalten. 10 verschiedene Klassifikatoren werden mit dem erhaltenen Merkmalsatz trainiert. Die Ausgaben der Algorithmen werden als Wahrscheinlichkeitswerte anstelle von binären Werten verwendet, um dem Meta-Klassifikator mehr Flexibilität beim Training zu bieten. Ein auf einem gierigen Algorithmus basierender Auswahlmechanismus wird konstruiert, um die Kombination von Basisklassifikatoren zu bestimmen, die die Leistung des Ensembles optimieren. Eine Deep-Neural-Network-Architektur wurde als Meta-Klassifikator verwendet, und die endgültigen Vorhersagen des Stacking-Ensemble-Klassifikators wurden auf vier Phishing-Datensätzen validiert. So wird eine ausgeklügelte Stacking-Ensemble-Klassifikator-Architektur gebildet, die über alle Datensätze hinweg eine gut generalisierte Leistung erbringt.
Para outro idioma
do conteúdo fonte
arxiv.org
Principais Insights Extraídos De
by Asif Newaz,F... às arxiv.org 03-18-2024
https://arxiv.org/pdf/2403.09735.pdfPerguntas Mais Profundas