Core Concepts
Erweiterung der Toxizitätsminderung auf multilinguale Einstellungen durch Übersetzung und Vergleich verschiedener Minderungstechniken.
Abstract
In dieser Studie wird die Multilinguale Toxizitätsminderung in Sprachmodellen untersucht, wobei verschiedene Aspekte wie Minderungsstrategien, Datencharakteristika, die Verwendung und Auswirkungen von Übersetzungsdaten sowie die Skalierbarkeit dieser Techniken betrachtet werden.
Inhaltsverzeichnis
Einleitung
Durchbrüche mit großen Sprachmodellen
Bekannte Schäden durch toxischen Text
Toxizitätsminderung in Sprachmodellen
Fokus auf Einzelsprachen
Notwendigkeit der Erweiterung auf multilinguale Einstellungen
Experimente mit multilingualer Toxizitätsminderung
Untersuchung von 9 Sprachen und verschiedenen Modellgrößen
Auswirkungen von Übersetzungsdaten
Effektivität von Übersetzungsdaten im Vergleich zu In-Sprachdaten
Ablationsstudien
Untersuchung von Sprachreihenfolgen und Datenübersetzung
Skalierung auf 13B Basismodellgröße
Untersuchung der Skalierbarkeit der Minderungstechniken
Zusammenfassung und Schlussfolgerungen
Stats
"Unsere Studie umfasst neun Sprachen, darunter Englisch, Italienisch, Französisch, Portugiesisch, Spanisch, Russisch, Arabisch, Hindi und Koreanisch."
"DExperts zeigt eine höhere Empfindlichkeit gegenüber der Reihenfolge der hinzugefügten Sprachen im Vergleich zu Goodtriever."
"Die Verwendung von übersetzten Daten führt zu einer effektiveren Toxizitätsminderung in Sprachmodellen."
Quotes
"Es ist entscheidend, Sicherheitsmaßnahmen zu entwickeln, um eine inklusive und kulturell sensible Sprachtechnologie zu gewährleisten."
"Unsere Forschung markiert den Anfang eines wichtigen und expandierenden Forschungsfeldes."