Die Studie stellt SecurityBot vor, einen LLM-Agenten, der von vortrainierten RL-Agenten als Mentoren unterstützt wird, um Cybersicherheitsoperationen zu verbessern. SecurityBot umfasst vier Kernmodule - Profil, Speicher, Reflexion und Aktion - um die Entscheidungsfindung des LLM-Agenten zu verbessern. Zusätzlich werden drei Kollaborationsmechanismen eingeführt - Cursor, Aggregator und Caller -, um die Zusammenarbeit zwischen dem LLM-Agenten und den RL-Agenten zu ermöglichen.
Die Experimente zeigen, dass der LLM-Agent mit RL-Mentoren in beiden Aufgaben - Angriff und Verteidigung - deutlich bessere Leistungen erzielt als unabhängig agierende RL- oder LLM-Agenten. Der LLM-Agent kann in späteren Phasen die Leistung der RL-Mentoren sogar übertreffen, da er ein umfassenderes Verständnis der Umgebung entwickelt. Allerdings kann die Einbeziehung mehrerer RL-Mentoren auch zu instabilen Ergebnissen führen, wenn die Vorschläge der schwächeren RL-Agenten den LLM-Agenten ablenken.
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Yikuan Yan,Y... kl. arxiv.org 03-27-2024
https://arxiv.org/pdf/2403.17674.pdfDybere Forespørgsler