Verschleiern von Verteidigungsabsichten: Ein Multi-Agenten-Angreifer-Verschleierungs-Spiel zur Verbesserung der Verteidigung von Großsprachmodellen
Durch ein Multi-Agenten-Spiel zwischen Angreifer und Verschleierungsagent kann das Großsprachmodell seine Fähigkeit verbessern, Verteidigungsabsichten zu verschleiern und gleichzeitig sicher zu antworten.