Belangrijkste concepten
Ein auf Entropie basiertes Verfahren zur genaueren Erkennung von Textwasserzeichen, insbesondere in Texten mit niedriger Entropie.
Samenvatting
In dieser Arbeit wird ein Entropie-basiertes Wasserzeichen-Erkennungsverfahren (EWD) vorgestellt, das die Entropie der einzelnen Tokens berücksichtigt, um die Erkennungsgenauigkeit in Szenarien mit niedriger Entropie zu verbessern.
Kernpunkte:
- Bisherige Wasserzeichen-Erkennungsverfahren haben Schwierigkeiten bei Texten mit niedriger Entropie, da die Modifikation der Tokens dort schwieriger ist.
- EWD weist den Tokens basierend auf ihrer Entropie unterschiedliche Gewichte zu, um den Einfluss von Tokens mit niedriger Entropie zu reduzieren.
- Theoretische Analyse zeigt, dass EWD die Erkennungsgenauigkeit in Szenarien mit niedriger Entropie verbessert, ohne die Leistung in Szenarien mit hoher Entropie zu beeinträchtigen.
- Experimente auf Code-Generierungs-Datensätzen bestätigen die Überlegenheit von EWD gegenüber bisherigen Methoden.
Statistieken
Die Wahrscheinlichkeit, dass ein Token mit hoher Entropie wassergefärbt wird, ist deutlich höher als die eines Tokens mit niedriger Entropie.
Der durchschnittliche Spike-Entropiewert der vom Wasserzeichen-Generator erzeugten Texte beträgt 0,607.
Citaten
"Tokens mit höherer Entropie sollten ein höheres Gewicht bei der Wasserzeichen-Erkennung erhalten, um den Grad der Wasserfärbung besser widerzuspiegeln."
"Unser vorgeschlagenes Erkennungsverfahren ist trainings-frei und vollständig automatisiert."