Core Concepts
선거 관련 주장을 분류하고 인간 생성 및 AI 생성 콘텐츠를 구분하는 것이 중요하다.
Abstract
이 논문은 선거 관련 주장을 분류하고 인간 생성 및 AI 생성 콘텐츠를 구분하는 방법을 제안한다.
먼저, 선거 관련 주장을 특성화하기 위한 새로운 분류 체계를 제안했다. 이 분류 체계는 관할권, 장비, 프로세스, 주장의 성격 등 다양한 차원을 포함한다.
다음으로, ElectAI라는 벤치마크 데이터셋을 소개했다. 이 데이터셋은 9,900개의 트윗으로 구성되며, 각 트윗이 인간 생성인지 AI 생성인지 표시되어 있다. 1,550개의 트윗은 제안된 분류 체계를 사용하여 주석이 달려 있다.
실험 결과, 최신 LLM(Large Language Model)들이 선거 주장 특성 추출에 중간 수준의 성능을 보였다. 특히 Mistral 모델이 0.667 F1 점수로 가장 좋은 성능을 보였다.
한편, 사람들은 인간 생성 및 AI 생성 트윗을 구분하는 데 매우 어려움을 겪었다. 튜링 테스트 결과, 사람들은 정확도 36.5%로 트윗의 저자를 구분했다. 반면 기계 학습 모델, 특히 RoBERTa 모델은 0.983 F1 점수로 우수한 성능을 보였다.
이 연구는 선거 관련 주장 이해와 저자 식별 문제에 대한 중요한 통찰을 제공한다. 향후 연구에서는 더 많은 데이터를 활용하고 다양한 접근법을 시도할 계획이다.
Stats
선거 관련 주장에 대한 데이터셋에는 총 9,900개의 트윗이 포함되어 있으며, 이 중 1,550개의 트윗이 제안된 분류 체계를 사용하여 주석이 달려 있다.