Eine prompt-basierte Pseudo-Labeling-Strategie mit LLMs, die genauere Pseudo-Labels auswählt als die alleinige Verwendung der Klassifikatorwahrscheinlichkeiten.
Eine neue Methode zur Injektion von Mehrbit-Informationen als Wasserzeichen in Texte, die von Großen Sprachmodellen generiert werden, um die Herkunft des Textes nachverfolgen zu können.
Durch die Erweiterung der ParaDetox-Pipeline auf mehrere Sprachen können nun Parallelkorpora für die Textentgiftung in verschiedenen Sprachen automatisch erstellt werden, was zu deutlich besseren Ergebnissen bei der Textentgiftung führt.
Große Sprachmodelle und Menschen haben Schwierigkeiten, Sentiment aus Texten zu entfernen, ohne dabei andere relevante Informationen zu verlieren.
Ein auf Entropie basiertes Verfahren zur genaueren Erkennung von Textwasserzeichen, insbesondere in Texten mit niedriger Entropie.