本研究では、多言語マスクド言語モデルの性別バイアスを評価するための新しい手法を提案している。従来の手法では、英語以外の言語における性別バイアスの評価が十分ではなかった。
提案手法では以下の3つの特徴がある:
多言語ジェンダー語彙集の構築: 中国語、ドイツ語、ポルトガル語、スペイン語の5言語について、ジェンダー関連の語彙を収集し、言語間の比較が可能な語彙集を作成した。
2つの新しい評価手法の提案:
これらの手法を用いて、5言語のマスクド言語モデルの性別バイアスを評価した結果、従来手法では検出できなかった言語間の違いが明らかになった。また、評価指標や文生成手法の違いによっても結果が大きく変わることが示された。
本研究の成果は、多言語マスクド言語モデルの公平性を評価し、改善するための重要な知見を提供するものである。
Naar een andere taal
vanuit de broninhoud
arxiv.org
Belangrijkste Inzichten Gedestilleerd Uit
by Jeongrok Yu,... om arxiv.org 04-11-2024
https://arxiv.org/pdf/2404.06621.pdfDiepere vragen