Generative Modell zur Erzeugung vielfältiger und effektiver Angriffsvektoren für die Umgehung von Sicherheitsmaßnahmen in großen Sprachmodellen
Ein generatives Modell namens AmpleGCG, das die Verteilung von Angriffsvektor-Suffixen für beliebige schädliche Abfragen erfasst und die schnelle Generierung von Hunderten erfolgreicher Angriffsvektor-Suffixe ermöglicht.