Core Concepts
상업용 기계 번역 시스템(Google Translate, DeepL, ModernMT)의 성 번역 능력과 편향성을 다양한 관점에서 분석하였으며, 전반적인 번역 품질과 성 번역 능력 간에 직접적인 관련이 없음을 확인하였다.
Abstract
이 연구는 세 가지 상업용 기계 번역 시스템(Google Translate, DeepL, ModernMT)의 성 번역 능력과 편향성을 다각도로 분석하였다. 영어에서 스페인어, 이탈리아어, 프랑스어로의 번역을 대상으로 하였으며, 다음과 같은 주요 결과를 도출하였다:
전반적인 번역 품질(BLEU 점수)과 성 번역 능력은 직접적인 관련이 없음을 확인하였다. 즉, 번역 품질이 높다고 해서 성 번역 능력도 우수한 것은 아니었다.
세 시스템 모두 성 편향성을 보였는데, 특히 문맥적 단서가 없는 경우(CAT1) 남성형을 선호하는 경향이 강했다. 반면 문맥적 단서가 있는 경우(CAT2)에는 성 번역 정확도가 상대적으로 높았다.
직업 명사 번역에서 가장 심각한 성 편향성이 나타났다. 대부분의 시스템에서 여성형 직업 명사의 번역 정확도가 매우 낮았다.
품사 별로 살펴보면, 개방 품사(명사, 형용사, 동사)에서 성 편향성이 폐쇄 품사(한정사, 대명사, 전치사)에 비해 더 크게 나타났다. 특히 명사에서 가장 큰 성 격차가 관찰되었다.
종합적으로 이 연구는 상업용 기계 번역 시스템의 성 편향성 문제를 다각도로 분석하고, 이를 통해 사용자들의 인식 제고와 기술적 해결책 마련의 필요성을 시사한다.
Stats
영어에서 스페인어, 이탈리아어, 프랑스어로 번역할 때 여성형 단어의 번역 정확도는 평균 66% 수준에 그쳤다.
반면 남성형 단어의 번역 정확도는 평균 90% 이상으로 매우 높았다.
문맥적 단서가 없는 문장(CAT1)에서 여성형 번역 정확도는 9.2%에서 36.7% 사이로 매우 낮았다.
Quotes
"영어에서 스페인어, 이탈리아어, 프랑스어로 번역할 때 여성형 단어의 번역 정확도는 평균 66% 수준에 그쳤다."
"반면 남성형 단어의 번역 정확도는 평균 90% 이상으로 매우 높았다."
"문맥적 단서가 없는 문장(CAT1)에서 여성형 번역 정확도는 9.2%에서 36.7% 사이로 매우 낮았다."