Concepts de base
본 논문에서는 대규모 언어 모델(LLM)을 활용하여 155년간의 독일 의회 토론에서 나타난 여성과 이민자에 대한 연대의 변화를 분석하고, 특히 GPT-4가 인간의 주석 품질에 근접하는 성능을 보여주며 자동화된 사회과학 연구에 유용한 도구가 될 수 있음을 시사합니다.
Résumé
155년간의 독일 의회 토론에서 나타난 여성과 이민자에 대한 연대에 대한 세분화된 분석 및 대규모 언어 모델 평가
본 연구는 1867년부터 2022년까지 155년간의 독일 의회 토론 내용을 분석하여 여성과 이민자에 대한 연대의 변화 양상을 살펴보고, 이러한 복잡한 사회과학적 분석에 대규모 언어 모델(LLM)을 활용하는 방법을 제시한 연구 논문입니다.
본 연구는 두 가지 주요 목적을 가지고 있습니다. 첫째, 155년이라는 장기간에 걸쳐 독일 의회에서 나타난 여성과 이민자에 대한 연대의 변화를 다양한 관점에서 분석하고자 합니다. 둘째, 이러한 분석에 있어서 인간의 수작업 주석 대신 LLM을 활용하여 그 효율성과 정확성을 평가하고자 합니다.
연구진은 먼저 1867년부터 2022년까지의 독일 의회 토론 기록을 수집하고, 이를 '이민자'와 '여성'이라는 두 가지 주제로 분류했습니다. 그 후, 각 주제별로 2,864개의 문장을 추출하여 Thijssen (2012)의 사회적 연대 프레임워크에 따라 수동으로 주석을 달았습니다. 이 프레임워크는 연대와 반(反)연대를 각각 집단 기반, 교환 기반, 동정적, 공감적 등 네 가지 하위 유형으로 분류합니다.
수동 주석 데이터를 기반으로 BERT, Llama-3, GPT-3.5, GPT-4 등 다양한 LLM의 성능을 비교 분석했습니다. 각 모델의 성능은 인간 주석과의 일치도를 나타내는 Macro F1 점수를 사용하여 평가했습니다.