透過有效的特徵選擇和模型可解釋性,特別是利用 CatBoost 和 XGBoost 等機器學習演算法,可以顯著增強網路釣魚檢測系統的準確性和效率。
PhishLang是一個開源、輕量級的語言模型,專門設計用於通過網站的上下文分析來檢測網路釣魚網站。與依賴靜態特徵且難以適應新威脅的傳統啟發式或機器學習模型,以及計算密集的深度學習模型不同,我們的模型利用MobileBERT(一種快速且節省內存的BERT架構變體)來學習網路釣魚攻擊的細粒度特徵。PhishLang可以以最少的數據預處理運行,並提供與領先的深度學習反網路釣魚工具相當的性能,同時速度更快,資源消耗更低。