Die Studie untersucht geschlechtsspezifische Verzerrungen in mehrsprachigen maskierten Sprachmodellen (MLMs) und präsentiert einen robusten Ansatz zur Bewertung dieser Verzerrungen.
Zunächst wird ein mehrsprachiges Geschlechtslexikon (MGL) erstellt, das genaue Übersetzungen von Geschlechtswörtern in fünf Sprachen enthält. Dieses Lexikon wird dann verwendet, um zwei Methoden zur Erstellung von Satzpaaren zu entwickeln: eine lexikonbasierte Methode (LSG) und eine modellbasierte Methode (MSG).
Anschließend werden drei Bewertungsmetriken eingeführt: die Mehrzweck-Bias-Bewertung (MBE), die Strenge Bias-Metrik (SBM) und die Direkte Vergleichs-Bias-Metrik (DBM). Diese Metriken werden verwendet, um die Geschlechtsverzerrungen in den MLMs für Englisch, Chinesisch, Deutsch, Portugiesisch und Spanisch zu untersuchen.
Die Ergebnisse zeigen, dass die MSG-Methode im Vergleich zu den anderen Ansätzen stabilere und konsistentere Bewertungen liefert. Darüber hinaus deuten die Ergebnisse darauf hin, dass die Geschlechtsverzerrungen in den untersuchten MLMs unterschiedlich sind und von Sprache zu Sprache variieren können.
Die Studie betont die Notwendigkeit eines systematischen Ansatzes zur Bewertung und Verbesserung von Geschlechtsverzerrungen in mehrsprachigen Sprachmodellen, um deren Fairness und Inklusivität zu gewährleisten.
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Jeongrok Yu,... a las arxiv.org 04-11-2024
https://arxiv.org/pdf/2404.06621.pdfConsultas más profundas