이 연구는 사회경제적 편향이 대형 언어 모델에 존재하는지 조사하기 위해 SILVERSPOON이라는 새로운 데이터셋을 소개한다. SILVERSPOON은 사회경제적 약자가 어려운 상황에서 취하는 윤리적으로 모호한 행동에 대한 3,000개의 샘플로 구성되어 있으며, 상위 및 하위 계층의 사람들이 직접 레이블링했다.
연구 결과, 대부분의 대형 언어 모델은 사회경제적 약자에 대한 공감 능력이 부족한 것으로 나타났다. 특히 Alpaca는 하위 계층 레이블과 강한 불일치를 보였고, GPT-4는 다른 모델에 비해 사회경제적 약자에 대한 공감이 매우 부족했다. 모델 크기가 작은 Yi-6B는 사회경제적 약자를 지지하는 경향이 높았지만, Llama-7B는 Llama-13B보다 약자를 지지하는 경향이 낮아 모델 크기 외에도 데이터와 학습 방법이 중요한 요인인 것으로 나타났다.
이 연구는 사회경제적 편향에 대한 이해를 높이고 향후 연구의 기반을 마련하는 데 기여할 것으로 기대된다.
Para Outro Idioma
do conteúdo original
arxiv.org
Principais Insights Extraídos De
by Smriti Singh... às arxiv.org 03-25-2024
https://arxiv.org/pdf/2403.14633.pdfPerguntas Mais Profundas