Die Studie untersucht geschlechtsspezifische Verzerrungen in mehrsprachigen maskierten Sprachmodellen (MLMs) und präsentiert einen robusten Ansatz zur Bewertung dieser Verzerrungen.
Zunächst wird ein mehrsprachiges Geschlechtslexikon (MGL) erstellt, das genaue Übersetzungen von Geschlechtswörtern in fünf Sprachen enthält. Dieses Lexikon wird dann verwendet, um zwei Methoden zur Erstellung von Satzpaaren zu entwickeln: eine lexikonbasierte Methode (LSG) und eine modellbasierte Methode (MSG).
Anschließend werden drei Bewertungsmetriken eingeführt: die Mehrzweck-Bias-Bewertung (MBE), die Strenge Bias-Metrik (SBM) und die Direkte Vergleichs-Bias-Metrik (DBM). Diese Metriken werden verwendet, um die Geschlechtsverzerrungen in den MLMs für Englisch, Chinesisch, Deutsch, Portugiesisch und Spanisch zu untersuchen.
Die Ergebnisse zeigen, dass die MSG-Methode im Vergleich zu den anderen Ansätzen stabilere und konsistentere Bewertungen liefert. Darüber hinaus deuten die Ergebnisse darauf hin, dass die Geschlechtsverzerrungen in den untersuchten MLMs unterschiedlich sind und von Sprache zu Sprache variieren können.
Die Studie betont die Notwendigkeit eines systematischen Ansatzes zur Bewertung und Verbesserung von Geschlechtsverzerrungen in mehrsprachigen Sprachmodellen, um deren Fairness und Inklusivität zu gewährleisten.
Başka Bir Dile
kaynak içeriğinden
arxiv.org
Önemli Bilgiler Şuradan Elde Edildi
by Jeongrok Yu,... : arxiv.org 04-11-2024
https://arxiv.org/pdf/2404.06621.pdfDaha Derin Sorular