Core Concepts
언어 모델이 학습한 사회적 편견을 효과적으로 탐지하기 위해서는 일반화 언어의 맥락을 고려해야 한다.
Abstract
이 연구에서는 언어 일반화를 탐지하는 새로운 과제를 소개하고, 9개 언어(영어, 아랍어, 벵골어, 스페인어, 프랑스어, 힌디어, 인도네시아어, 말레이어, 포르투갈어)로 구성된 50,000건 이상의 문장으로 이루어진 GeniL 데이터셋을 구축했습니다.
데이터 분석 결과:
단순한 공동 출현 기반 접근법으로는 일반화 언어를 정확하게 탐지할 수 없음을 확인했습니다. 일반화 언어의 출현 빈도는 언어, 정체성 그룹, 속성에 따라 크게 다릅니다.
일반화 언어는 단순히 언급하는 경우와 일반화를 강화하는 경우로 구분할 수 있으며, 이 두 가지 유형의 비율은 언어마다 다릅니다.
GeniL 데이터셋을 활용해 다국어 일반화 언어 탐지 모델을 구축했으며, 전반적인 PR-AUC 성능은 58.7로 나타났습니다. 언어별로 성능 편차가 큰 것으로 확인되었습니다.
Stats
일반화 언어의 출현 빈도는 언어, 정체성 그룹, 속성에 따라 크게 다릅니다. 예를 들어 영어의 경우 7.7%, 아랍어는 5.1%, 힌디어는 1.9%입니다.
일반화 언어 중 일반화를 강화하는 경우는 평균 62.87%, 일반화를 언급하는 경우는 37.13%입니다.
Quotes
"언어 모델이 학습한 사회적 편견을 효과적으로 탐지하기 위해서는 일반화 언어의 맥락을 고려해야 한다."
"단순한 공동 출현 기반 접근법으로는 일반화 언어를 정확하게 탐지할 수 없다."