本文介紹了一種名為 PentestAgent 的新型自動滲透測試框架,該框架利用大型語言模型(LLM)和多代理協作來自動化滲透測試過程,並通過實驗證明了其在任務完成率和效率方面的優越性能。
AutoPenBench是一個開源基準測試平台,用於評估生成式代理在自動滲透測試中的性能,實驗結果顯示,雖然完全自主的代理表現仍有限制,但人類輔助的代理展現出顯著的改進,突出了人機協作在自動化滲透測試領域的潛力。