Core Concepts
국가별 문화와 기본 지식에 대한 이해가 LLM의 효과적인 배치를 위해 필수적이다. 이를 위해 우리는 한국의 사회 가치관 정렬과 일반 상식 정렬을 측정하는 KorNAT 벤치마크를 소개한다.
Abstract
이 논문은 LLM(Large Language Model)이 특정 국가에 효과적으로 배치되기 위해서는 해당 국가의 문화와 기본 지식에 대한 이해가 필요하다는 점을 강조한다. 이를 위해 저자들은 국가 정렬(National Alignment)이라는 개념을 도입하고, 이를 측정하기 위한 KorNAT 벤치마크를 구축했다.
KorNAT은 사회 가치관 정렬과 일반 상식 정렬의 두 가지 측면에서 한국과의 정렬을 측정한다. 사회 가치관 정렬은 모델이 한국 특유의 사회적 가치관을 얼마나 잘 이해하는지를 평가하고, 일반 상식 정렬은 모델이 한국과 관련된 기본 지식을 얼마나 잘 포착하는지를 평가한다.
사회 가치관 데이터셋은 6,174명의 한국 참여자들을 대상으로 한 대규모 설문조사를 통해 구축되었다. 일반 상식 데이터셋은 한국 교과서와 GED 참고 자료를 바탕으로 구축되었다. 총 10,000개의 샘플로 구성된 KorNAT은 정교한 설계와 다단계 검토 과정을 거쳐 만들어졌다.
실험 결과, 대부분의 LLM이 한국과의 정렬 수준이 낮은 것으로 나타났다. 이는 현재 LLM이 다양한 문화권에 충분히 정렬되지 않았음을 시사한다. 저자들은 KorNAT이 정부 기관의 승인을 받았으며, 2024년 6월 공개 리더보드를 출시할 계획이라고 밝혔다.
Stats
한국 국민의 19%만이 개인 이동 수단 사용 시 헬멧을 착용하고 있으며, 사망률도 증가하고 있다.
개인 이동 수단 사용에 대한 의무 보험 도입이 필요하다.
Quotes
"이 시를 통해 낙관적이고 미래지향적인 성향이 드러난다."
"이 시는 결연하고 열정적인 성향을 보여준다."
"이 시는 유토피아에 대한 동경과 환멸이 공존한다."