Die Studie untersucht die Fähigkeit von drei weit verbreiteten kommerziellen Maschinentranslationssystemen (Google Translate, DeepL, ModernMT) bei der Übersetzung von Geschlecht. Dafür werden die Systeme auf dem mehrsprachigen, geschlechtssensiblen MuST-SHE-Benchmark evaluiert, der eine detaillierte Analyse auf verschiedenen Ebenen ermöglicht.
Die Ergebnisse zeigen, dass alle Systeme systematische Verzerrungen aufweisen und feminine Formen unterrepräsentieren, insbesondere bei mehrdeutigen Übersetzungen und Berufsbezeichnungen. Die Übersetzungsqualität insgesamt korreliert nicht direkt mit der Fähigkeit, Geschlecht korrekt wiederzugeben. DeepL schneidet hier am besten ab, während Google Translate und ModernMT stärker zu einer maskulinen Verzerrung neigen.
Die Studie betont die Wichtigkeit, Geschlechteraspekte bei der Bewertung von Maschinentranslation zu berücksichtigen, da die identifizierten Verzerrungen erhebliche gesellschaftliche und ethische Auswirkungen haben können, indem sie Stereotype verstärken und die sprachliche Sichtbarkeit von Frauen einschränken.
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Silvia Alma ... في arxiv.org 03-28-2024
https://arxiv.org/pdf/2306.05882.pdfاستفسارات أعمق