In diesem Artikel wird ein Multi-Agenten-Rahmen vorgestellt, um Angriffs- und Verteidigungsszenarios zu simulieren. Dieser Rahmen besteht aus vier intelligenten Agenten: einem Angreifer, einem Verschleierungsagenten, einem Sicherheitsevaluator und einem Verschleierungsevaluator.
Der Angreifer generiert Angriffsfragen, die den Verschleierungsagenten dazu bringen, Antworten mit gefährlichen Informationen zu erzeugen, ohne dass der Angreifer die Absicht erkennt. Der Verschleierungsagent erkennt, ob die Eingabe schädliche Informationen enthält, und verschleiert dann seine Verteidigungsabsicht, indem er eine sichere Antwort generiert, um eine Erkennung des Angriffsversagens durch den Angreifer zu vermeiden.
Die Sicherheitsevaluatorin und die Verschleierungsevaluatorin bewerten die Sicherheit und Verschleierung der vom Verschleierungsagenten erzeugten Antworten in jeder Runde des Angriffs- und Verteidigungsspiels. Basierend auf den Bewertungen wählen der Angreifer und der Verschleierungsagent dann Strategien aus, die ihren Gewinn in der nächsten Runde maximieren.
Durch diesen Prozess des Spiels zwischen Angreifer und Verschleierungsagent bis zum Nash-Gleichgewicht kann das Modell seine Fähigkeit zur Verschleierung von Verteidigungsabsichten schrittweise verbessern.
To Another Language
from source content
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Qianqiao Xu,... lúc arxiv.org 04-04-2024
https://arxiv.org/pdf/2404.02532.pdfYêu cầu sâu hơn