핵심 개념
다양한 언어 및 지역의 사회적 편견을 반영하는 SeeGULL Multilingual 다국어 스테레오타입 데이터셋을 구축하고 모델 평가에 활용한다.
초록
Abstract:
다양한 언어 및 지역의 사회적 편견을 반영하는 SeeGULL Multilingual 다국어 스테레오타입 데이터셋을 구축한다.
다양한 언어 및 지역의 사회적 편견을 반영하는 SeeGULL Multilingual은 25,000개 이상의 스테레오타입을 포함하며 모델 평가에서 유용하게 활용된다.
Introduction:
다양한 언어로 평가되는 다국어 생성 모델의 안전성 및 공정성 평가의 중요성을 강조한다.
다양한 언어 및 문화적 배경을 고려한 모델 평가가 필요하다.
Dataset Creation Methodology:
다양한 언어 및 지역의 스테레오타입을 수집하고 다양성을 반영하는 데이터셋을 구축하는 방법을 소개한다.
Offensive Stereotypes in SGM:
스테레오타입의 모욕적인 속성을 분석하고 국가별로 가장 모욕적인 스테레오타입을 확인한다.
Foundation Model Evaluations with SGM:
다양한 다국어 모델의 평가 결과를 제시하고 모델이 스테레오타입을 어떻게 인식하는지 확인한다.
Conclusion:
다양한 언어 및 문화적 배경을 고려한 모델 평가의 중요성을 강조하며, 미래 연구 방향에 대한 제언을 제시한다.
통계
다양한 언어 및 지역에서 수집된 25,000개 이상의 스테레오타입을 포함하는 SeeGULL Multilingual 데이터셋을 구축한다.
국가별로 가장 모욕적인 스테레오타입을 확인한다.
인용구
"다양한 언어 및 문화적 배경을 고려한 모델 평가의 중요성을 강조한다."
"다양한 언어 및 지역의 사회적 편견을 반영하는 SeeGULL Multilingual은 모델 평가에 유용하게 활용된다."