核心概念
本研究提出了PhishGuard,這是一個多層次的集成模型,旨在提高網路釣魚網站的檢測準確性。該模型結合了多個機器學習分類器,包括隨機森林、梯度提升、CatBoost和XGBoost,以增強檢測精度。通過先進的特徵選擇方法,如SelectKBest和RFECV,以及超參數調優和數據平衡等優化,該模型在四個公開數據集上進行了訓練和評估。PhishGuard在其中一個數據集上實現了99.05%的檢測準確率,在其他數據集上也取得了類似的高結果。這項研究表明,優化方法與集成學習相結合,可以大大提高網路釣魚檢測的性能。
摘要
本研究提出了PhishGuard,這是一個多層次的集成模型,用於檢測網路釣魚網站。
特徵選擇:
- 使用SelectKBest和RFECV方法選擇最重要的特徵
- 使用PCA進行降維,保留95%以上的數據方差
模型訓練:
- 訓練了6個機器學習模型,包括SVM、隨機森林、XGBoost、CatBoost、AdaBoost和梯度提升
- 對模型進行了超參數調優,以優化性能
集成模型:
- 將表現最佳的4個模型組合成一個集成模型PhishGuard
- 採用stacking方法,將前3名模型作為基模型,最佳模型作為元模型
結果:
- PhishGuard在4個公開數據集上均取得了最高的檢測準確率,最高達99.05%
- 與現有的先進模型相比,PhishGuard也表現出更優秀的性能
總的來說,本研究通過優化特徵選擇和模型訓練,開發出了一個高性能的網路釣魚網站檢測集成模型PhishGuard,在多個數據集上都取得了出色的結果。這為提高網絡安全防護能力提供了有效的解決方案。
统计
在Dataset 1上,PhishGuard的檢測準確率達到99.05%
在Dataset 2上,PhishGuard的檢測準確率達到97.29%
在Dataset 3上,PhishGuard的檢測準確率達到97.33%
在Dataset 4上,PhishGuard的檢測準確率達到95.17%