核心概念
고급 언어 모델(LLM)이 생성한 텍스트를 사람이 작성한 텍스트와 구별하는 것은 점점 어려워지고 있으며, 특히 다국어 환경에서는 저자 신원 은닉(AO) 기법을 통해 탐지를 회피하는 것이 가능해짐에 따라, 탐지 모델의 정확도를 높이기 위한 연구가 필요하다.
要約
다국어 기계 생성 텍스트 탐지: 저자 신원 은닉의 영향과 대응 방안 분석
본 연구 논문에서는 고급 언어 모델(LLM)의 발전으로 인해 사람이 작성한 텍스트와 기계가 생성한 텍스트(MGT)를 구별하는 것이 점점 어려워지고 있는 문제를 다루고 있습니다. 특히 다국어 환경에서 저자 신원 은닉(AO) 기법을 사용하여 MGT 탐지를 회피하는 것이 가능해짐에 따라 탐지 모델의 정확도를 높이기 위한 연구의 필요성이 강조되고 있습니다.
본 연구는 다국어 환경에서 다양한 AO 기법의 효과를 평가하고, 기존 MGT 탐지 모델의 취약성을 분석하는 것을 목표로 합니다. 또한, AO 기법에 대한 탐지 모델의 강건성을 향상시키기 위해 데이터 증강 기법의 효과를 검증하고자 합니다.
연구진은 11개 언어로 구성된 MULTITuDE 벤치마크 데이터셋을 활용하여 8개의 LLM이 생성한 텍스트와 사람이 작성한 텍스트를 비교 분석했습니다. AO 기법으로는 역번역, 패러프레이징, 텍스트 편집 등 10가지 방법을 사용했으며, 각 방법의 효과를 측정하기 위해 공개된 MGT 탐지 모델 37개를 대상으로 탐지 성공률(ASR) 및 AUC ROC 감소를 분석했습니다. 또한, AO 기법을 활용한 데이터 증강을 통해 탐지 모델의 강건성을 향상시키는 실험을 진행했습니다.