핵심 개념
대규모 언어 모델(LLM)을 사용하여 미국 대선 결과를 예측하는 다단계 추론 프레임워크를 제시하고, 실제 데이터와 합성 데이터를 이용하여 그 효과와 한계점을 분석합니다.
초록
2024년 미국 대선 예측: 대규모 언어 모델을 이용한 다단계 추론 적용 및 한계점 분석
본 연구는 대규모 언어 모델(LLM)을 활용하여 미국 대선 결과를 예측하는 새로운 방법론을 제시하고, 실제 데이터와 합성 데이터를 이용하여 모델의 성능과 한계점을 분석하는 것을 목표로 합니다.
본 연구에서는 OpenAI의 GPT-4o 모델을 기반으로 유권자의 인구 통계학적 정보, 정치적 성향, 후보자 정보 등을 입력받아 투표 결과를 예측하는 다단계 추론 파이프라인을 설계했습니다. 이 파이프라인은 유권자의 정치적 스펙트럼 배치, 시간에 따른 후보자 정책 및 배경 정보 통합, 다단계 추론을 통한 투표 행동 시뮬레이션 등의 단계로 구성됩니다. 모델 학습 및 검증에는 2016년, 2020년 미국 국가 선거 연구(ANES) 데이터와 미국 인구 통계 자료를 기반으로 생성된 합성 데이터를 사용했습니다.