Angriff auf Prompt-Steuerung: Ein kontrollierbarer Angriff auf Diffusions-Modelle
Unser Ansatz ermöglicht es Text-zu-Bild-Modellen mit Sicherheitsverteidigungsmechanismen, semantisch reiche Inhalte, die nicht jugendfrei sind, zu generieren und Schwachstellen in aktuellen Verteidigungsmechanismen aufzuzeigen.