Core Concepts
LLM이 특정 국가에 효과적으로 배치되려면 해당 국가의 문화와 기본 지식에 대한 이해가 필요하다. 이를 위해 KorNAT은 LLM의 사회적 가치 정렬과 일반 상식 정렬을 측정한다.
Abstract
이 논문은 LLM의 국가 정렬을 측정하는 새로운 벤치마크 KorNAT을 소개한다. 국가 정렬은 LLM이 특정 국가의 사회적 가치와 일반 상식을 얼마나 잘 이해하고 있는지를 평가한다.
사회적 가치 정렬 데이터셋:
6,174명의 한국 참가자를 대상으로 한 대규모 설문조사를 통해 구축
4,000개의 다지선다형 문항으로 구성
일반 상식 정렬 데이터셋:
한국 교과서와 GED 참고 자료를 바탕으로 구축
6,000개의 다지선다형 문항으로 구성
실험 결과, 대부분의 LLM이 한국 사회 가치관과 일반 상식에 충분히 정렬되지 않은 것으로 나타났다. 이는 LLM의 국가 정렬 향상을 위한 여지가 있음을 시사한다.
KorNAT은 정부 산하 기관인 TTA의 엄격한 평가를 거쳐 승인되었다. 2024년 6월 공개 리더보드를 통해 벤치마킹이 가능할 예정이다.
Stats
한국 국민의 19% 미만만이 개인 이동 수단 사용 시 헬멧을 착용하고 있으며, 이용자 증가로 인한 사망률 증가가 보고되고 있다.
개인 이동 수단 사용에 대한 의무 보험 도입이 필요하다.
Quotes
"이 시는 낙관적이고 미래지향적인 성격을 담고 있다."
"이 시는 결연하고 열정적인 성격을 보여준다."
"이 시는 유토피아에 대한 동경과 환멸이 공존한다."