이 연구는 화학 개체명 인식 모델의 성별 편향을 종합적으로 분석하였다. 합성 데이터와 실제 사용자 데이터를 활용하여 편향을 측정하였다.
합성 데이터 실험 결과, 화학물질 명명 관행에서 여성 관련 이름이 자주 등장하여 모델이 이를 화학물질로 잘못 분류하는 편향이 발견되었다. 실제 사용자 데이터 실험에서도 여성 관련 데이터에 대한 모델 성능이 남성 데이터에 비해 낮게 나타났다. 특히 피임약, 호르몬제 등 여성 관련 약물 언급을 잘 탐지하지 못하는 것으로 확인되었다.
이러한 결과는 화학 개체명 인식 모델에 성별 편향이 존재함을 보여준다. 향후 이러한 편향을 해결하기 위한 노력이 필요할 것으로 보인다.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Xingmeng Zha... at arxiv.org 03-14-2024
https://arxiv.org/pdf/2212.12799.pdfDeeper Inquiries