핵심 개념
Effiziente Erkennung von maschinengenerierten Texten durch Multi-Population Aware Optimization für maximale mittlere Diskrepanz.
초록
Das Paper konzentriert sich auf die Erkennung von maschinengenerierten Texten (MGTs) aufgrund der Risiken wie Plagiat, irreführende Informationen und Halluzinationen. Es stellt die MMD-MP-Methode vor, um die Verteilungsunterschiede zwischen MGTs und von Menschen geschriebenen Texten zu messen. Durch Training mit MMD-MP werden stabile Diskrepanzschätzungen erzielt und die Übertragbarkeit verbessert. Experimente zeigen überlegene Leistung gegenüber anderen Methoden.
Einleitung
- LLMs wie ChatGPT generieren menschenähnliche Texte.
- MGTs können Risiken wie Fake News und Spam darstellen.
- Schwierigkeiten bei der Unterscheidung von MGTs und HWTs aufgrund subtiler Verteilungsunterschiede.
Optimierungsmechanismus von Kernel-basiertem MMD
- MMD-D zeigt hohe Varianz bei der Behandlung von Daten aus verschiedenen Populationen.
- MMD-MP verringert die Varianz und verbessert die Stabilität der Diskrepanzschätzungen.
Vorgeschlagene Methoden
- MMD-MP für MGT-Erkennung in Absätzen und Sätzen.
- Überlegene Leistung gegenüber bestehenden Baselines auf verschiedenen LLMs.
통계
MMD-D zeigt eine hohe Varianz bei der Behandlung von Daten aus verschiedenen Populationen.
MMD-MP verringert die Varianz und verbessert die Stabilität der Diskrepanzschätzungen.
인용구
"Es ist sehr dringend und wichtig, MGTs in vielen Situationen zu erkennen."
"Unsere Beiträge umfassen die Optimierung des MMD-Mechanismus und die Entwicklung von zwei neuen MGT-Erkennungsmethoden."