핵심 개념
大型語言模型 (LLM) 在網路釣魚攻擊和防禦方面具有雙重性,既可以生成難以偵測的複雜網路釣魚郵件,也可以透過增強資料訓練來改進網路釣魚偵測器。
文獻資訊: Afane, K., Wei, W., Mao, Y., Farooq, J., & Chen, J. (2024). Next-Generation Phishing: How LLM Agents Empower Cyber Attackers. arXiv preprint arXiv:2411.13874v1 [cs.CR].
研究目標: 本研究旨在評估傳統網路釣魚偵測器和大型語言模型 (LLM) 在識別傳統和 LLM 改寫的網路釣魚郵件方面的有效性,並探討 LLM 在增強網路威脅情報 (CTI) 方面的作用。
方法: 研究人員使用了 Nazario 和 Nigerian Fraud 網路釣魚郵件資料集,並利用 GPT-4o 和 Llama 3 改寫網路釣魚郵件。他們評估了 Google Gmail 垃圾郵件過濾器、Apache SpamAssassin 和 Proofpoint 等傳統偵測器的效能,以及 SVM、邏輯迴歸和樸素貝葉斯等機器學習模型的效能。此外,他們還探討了使用 LLM(如 Llama、Gemini、Claude 和 GPT)作為網路釣魚偵測工具的可能性。
主要發現: 結果顯示,所有偵測器在偵測改寫郵件方面的準確性均顯著下降,突顯出當前網路釣魚防禦的嚴重缺陷。LLM 生成的網路釣魚郵件由於其細微的語言和規避技術,對傳統偵測方法構成了重大挑戰。
主要結論: 研究結果強調,需要更強大的安全控制和對 LLM 生成內容的監管,以防止其被濫用於發動先進的網路釣魚攻擊。
意義: 本研究透過利用 LLM 生成不同的網路釣魚變體以用於資料增強,並利用 LLM 的力量來增強網路釣魚偵測,為開發更有效、適應性更強的威脅偵測系統做出了貢獻。
局限性和未來研究方向: 未來的研究應側重於開發更先進的偵測機制,這些機制能夠處理 LLM 改寫的網路釣魚郵件的複雜性。此外,還需要探索 LLM 在其他語言中的應用,以增強網路釣魚偵測的穩健性。
통계
2023 年,大型組織平均因網路釣魚損失 1,500 萬美元。
在 Nazario 資料集中,傳統網路釣魚郵件的準確率高達 96.83%,但在經過改寫的郵件中,準確率下降到 88% 甚至更低。
在 Nigerian Fraud 資料集中,Proofpoint 在原始網路釣魚郵件上實現了最高的召回率,但其在改寫郵件上的效能下降。
使用 LLM 增強的資料集訓練的模型在偵測改寫的網路釣魚郵件方面表現出顯著的改進,準確率平均提高了 10.90%。