Die Studie untersucht einen grundlegend anderen Ansatz zur Erkennung von maschinell generiertem Text, der nicht auf überwachten Methoden durch Training an Korpora von bestätigten menschlichen und maschinell geschriebenen Dokumenten basiert. Stattdessen wird vorgeschlagen, Darstellungen des Schreibstils zu nutzen, die aus großen Mengen menschlich verfasster Texte geschätzt werden.
Die Ergebnisse zeigen, dass solche Stildarstellungen eine bemerkenswerte Fähigkeit haben, Texte zu unterscheiden, die von Menschen oder Sprachmodellen erstellt wurden, auch wenn die Sprachmodelle explizit angewiesen wurden, verschiedene Schreibstile nachzuahmen. Darüber hinaus ermöglichen die Stildarstellungen die Vorhersage, welches spezifische Sprachmodell einen gegebenen Textabschnitt erstellt hat, wenn nur wenige Beispiele für jedes Modell vorliegen.
Die Studie untersucht auch Faktoren, die zu effektiven Stildarstellungen für diese Aufgabe führen, und stellt fest, dass kontrastives Training auf großen Mengen menschlich verfasster Texte ausreicht, um nützliche Darstellungen zu erhalten, dass in bestimmten Szenarien mit wenigen Beispielen das Training auf zusätzlichen, von Sprachmodellen generierten Dokumenten die Leistung jedoch deutlich verbessert.
To Another Language
from source content
arxiv.org
Principais Insights Extraídos De
by Rafael River... às arxiv.org 03-28-2024
https://arxiv.org/pdf/2401.06712.pdfPerguntas Mais Profundas