이 논문은 균일 정보 밀도(UID) 원리를 활용하여 기계 생성 텍스트와 인간 생성 텍스트를 구분하는 GPT-who라는 통계 기반 다중 클래스 탐지기를 제안한다. GPT-who는 언어 모델의 토큰 확률을 활용하여 UID 기반 특징을 추출하고, 이를 통해 다양한 언어 모델과 인간 저자의 고유한 통계적 서명을 모델링한다. 이를 통해 정확한 저자 귀속을 수행한다.
실험 결과, GPT-who는 4개의 대규모 벤치마크 데이터셋에서 기존 최신 탐지기들을 20% 이상 능가하는 성능을 보였다. 또한 GPT-who는 계산적으로 효율적이며 해석 가능한 특징 공간을 활용하여 탐지 과정을 설명할 수 있다는 장점이 있다.
추가로, 다양한 언어 모델과 인간 생성 텍스트의 UID 분포 분석을 통해 언어 모델이 정보를 더 균일하게 분포시키는 경향이 있음을 발견했다. 또한 동일 아키텍처의 언어 모델들은 유사한 UID 분포를 보이는 것으로 나타났다.
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Saranya Venk... a las arxiv.org 03-19-2024
https://arxiv.org/pdf/2310.06202.pdfConsultas más profundas