Effizientes Umgehen mit Wasserzeichen in Large Language Models durch farbsensitive Ersetzungen
Wir stellen einen neuen Ansatz namens Self Color Testing-based Substitution (SCTS) vor, um Wasserzeichen in Large Language Models effektiv zu umgehen, ohne auf externe Modelle angewiesen zu sein. SCTS nutzt gezielte Aufforderungen an das Modell, um Farbinformationen zu extrahieren, und ersetzt dann grüne Tokens durch rote, um die Wasserzeichen zu entfernen.