核心概念
대조 학습을 통해 기계 생성 텍스트를 효과적으로 탐지할 수 있음을 보여줌
摘要
이 논문은 SemEval-2024 Task 8A에 참여한 시스템을 소개합니다. 기계 생성 텍스트 탐지는 최근 대두되고 있는 문제로, 대규모 언어 모델(LLM)의 발전으로 인해 인간이 생성한 텍스트와 구분하기 어려워졌습니다.
논문에서는 다음과 같은 기여를 제시합니다:
- 데이터 증강 기법을 통해 훈련 데이터를 크게 늘렸습니다.
- 단일 모델을 사용하여 비교 가능한 성능을 보였습니다.
- 대조 학습과 데이터 증강을 통해 단일 모델로도 좋은 성능을 달성할 수 있음을 보였습니다.
실험 결과, 제안한 모델은 기존 베이스라인 대비 약 5.7% 향상된 성능을 보였습니다. 이는 대조 학습이 기계 생성 텍스트 탐지에 효과적일 수 있음을 시사합니다.
統計資料
제안한 모델은 베이스라인 대비 약 60% 적은 매개변수를 사용하였음에도 비교 가능한 성능을 보였습니다.
최대 문장 길이를 256으로 설정했을 때 가장 좋은 성능을 보였습니다.
분류기 드롭아웃을 0으로 설정했을 때 가장 좋은 성능을 보였습니다.
효과적 배치 크기를 2로 설정했을 때 가장 좋은 성능을 보였습니다.