Core Concepts
대규모 언어 모델(LLM)의 전 세계 문화에 대한 지식과 공정한 표현을 평가하고 개선하는 것이 중요하다.
Abstract
이 연구는 110개국과 지역의 8가지 문화 관련 주제에 대한 3개의 최신 LLM(gpt-4, llama2-13b, mistral-7b)의 문화 인식을 분석한다.
먼저 자연어 프롬프팅을 통해 각 모델의 문화 관련 생성물을 수집하고, 이로부터 문화 상징을 추출한다. 이를 통해 LLM이 문화를 구분하는 언어적 "표지"를 발견했다. 즉, 비서구 문화에 대해 "전통적"이라는 단어를 사용하거나 괄호를 사용해 설명하는 등 문화적 "타자화"가 나타났다.
또한 문화 무관적 생성물에서 문화 상징의 중복도를 분석한 결과, 서유럽, 영어권, 북유럽 국가의 문화 상징이 가장 많이 나타났다. 이와 함께 각 문화의 문화 상징 다양성을 측정한 결과, 지역 간 큰 격차가 있음을 발견했다. 이는 훈련 데이터의 편향성과 관련이 있는 것으로 나타났다.
이 연구는 LLM의 문화 인식을 평가하고 개선하기 위한 중요한 통찰을 제공한다.
Stats
서유럽, 영어권, 북유럽 국가의 문화 상징이 문화 무관적 생성물에서 가장 많이 나타났다.
문화 상징의 다양성은 지역 간 큰 격차를 보였으며, 이는 훈련 데이터의 편향성과 관련이 있었다.
Quotes
"전통적"이라는 단어를 사용하거나 괄호를 사용해 설명하는 등 LLM이 비서구 문화를 "타자화"하는 경향이 있다.
문화 상징의 다양성 측면에서 지역 간 큰 격차가 있어, 일부 문화에 대한 LLM의 지식이 부족한 것으로 나타났다.