核心概念
本文介紹了一個名為 LProtector 的自動化漏洞檢測系統,該系統利用大型語言模型 GPT-4o 和檢索增強生成技術 (RAG) 來分析 C/C++ 程式碼並識別潛在的安全漏洞。
統計資料
在 Big-Vul 數據集中,易受攻擊樣本與不易受攻擊樣本的比率僅為 5.88%。
LProtector 在 Big-Vul 數據集上達到了 89.68% 的準確率和 33.49% 的 F1 分數。
移除 RAG 後,LProtector 的準確率下降到 76.42%,F1 分數下降到 23.92%。
移除 CoT 後,LProtector 的準確率下降到 79.73%,F1 分數下降到 26.51%。
同時移除 RAG 和 CoT 後,LProtector 的準確率急劇下降至 68.19%,F1 分數降至 18.61%。
引述
"LLMs have powerful code generation and understanding capabilities [13], [14], [15], along with a rich knowledge base and strong generalization ability [16], [17], [18]."
"This paper presents LProtector, an automated vulnerability detection system for C/C++ codebases based on GPT-4o and Retrieval-Augmented Generation (RAG)."
"Results show that LProtector outperforms two state-of-the-art baselines in terms of F1 score, demonstrating the potential of integrating LLMs with vulnerability detection."