In diesem Artikel wird ein Multi-Agenten-Rahmen vorgestellt, um Angriffs- und Verteidigungsszenarios zu simulieren. Dieser Rahmen besteht aus vier intelligenten Agenten: einem Angreifer, einem Verschleierungsagenten, einem Sicherheitsevaluator und einem Verschleierungsevaluator.
Der Angreifer generiert Angriffsfragen, die den Verschleierungsagenten dazu bringen, Antworten mit gefährlichen Informationen zu erzeugen, ohne dass der Angreifer die Absicht erkennt. Der Verschleierungsagent erkennt, ob die Eingabe schädliche Informationen enthält, und verschleiert dann seine Verteidigungsabsicht, indem er eine sichere Antwort generiert, um eine Erkennung des Angriffsversagens durch den Angreifer zu vermeiden.
Die Sicherheitsevaluatorin und die Verschleierungsevaluatorin bewerten die Sicherheit und Verschleierung der vom Verschleierungsagenten erzeugten Antworten in jeder Runde des Angriffs- und Verteidigungsspiels. Basierend auf den Bewertungen wählen der Angreifer und der Verschleierungsagent dann Strategien aus, die ihren Gewinn in der nächsten Runde maximieren.
Durch diesen Prozess des Spiels zwischen Angreifer und Verschleierungsagent bis zum Nash-Gleichgewicht kann das Modell seine Fähigkeit zur Verschleierung von Verteidigungsabsichten schrittweise verbessern.
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Qianqiao Xu,... alle arxiv.org 04-04-2024
https://arxiv.org/pdf/2404.02532.pdfDomande più approfondite