이 논문은 균일 정보 밀도(UID) 원리를 활용하여 기계 생성 텍스트와 인간 생성 텍스트를 구분하는 GPT-who라는 통계 기반 다중 클래스 탐지기를 제안한다. GPT-who는 언어 모델의 토큰 확률을 활용하여 UID 기반 특징을 추출하고, 이를 통해 다양한 언어 모델과 인간 저자의 고유한 통계적 서명을 모델링한다. 이를 통해 정확한 저자 귀속을 수행한다.
실험 결과, GPT-who는 4개의 대규모 벤치마크 데이터셋에서 기존 최신 탐지기들을 20% 이상 능가하는 성능을 보였다. 또한 GPT-who는 계산적으로 효율적이며 해석 가능한 특징 공간을 활용하여 탐지 과정을 설명할 수 있다는 장점이 있다.
추가로, 다양한 언어 모델과 인간 생성 텍스트의 UID 분포 분석을 통해 언어 모델이 정보를 더 균일하게 분포시키는 경향이 있음을 발견했다. 또한 동일 아키텍처의 언어 모델들은 유사한 UID 분포를 보이는 것으로 나타났다.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Saranya Venk... at arxiv.org 03-19-2024
https://arxiv.org/pdf/2310.06202.pdfDeeper Inquiries