核心概念
文学的な対話設定における機械翻訳システムは、話者と聞き手の性別に基づく性差の影響を強く受け、登場人物の描写や話し方に基づいて誤った性別の訳語を選択する傾向がある。
要約
WMT24テストスイート:話者-聞き手間の対話における性別の解決と性差による影響分析
本論文は、機械翻訳における性差、特に文学的な対話設定における話者-聞き手間の関係における性別の解決という課題を取り上げています。
本研究は、文学的な対話設定において、機械翻訳システムが話者と聞き手の性別をどのように解決するか、また性差が翻訳の正確性にどのような影響を与えるかを調査することを目的としています。
本研究では、スペイン語、チェコ語、アイスランド語を対象言語として、話者-聞き手間の対話文を含むテストスイートを開発しました。このテストスイートは、登場人物や話し方に関するメタ情報を含む文脈と対話文を組み合わせることで、性別の解決が困難な状況を作り出しています。このテストスイートを用いて、様々な機械翻訳システムの性別解決の傾向を分析しました。