Основні поняття
LLM을 활용하여 인간 작성 텍스트와 기계 생성 텍스트의 경계를 정확하게 탐지하는 기술을 개발하고, 이를 SemEval-2024 Task 8에서 최고 성능으로 달성하였다.
Анотація
이 논문은 인간 작성 텍스트와 기계 생성 텍스트가 혼합된 텍스트에서 경계를 탐지하는 기술을 다룹니다.
- 텍스트 내 각 토큰을 인간 작성 또는 기계 생성으로 분류하는 토큰 분류 문제로 접근하였습니다.
- 장기 의존성 처리에 강점이 있는 Longformer, XLNet, BigBird 등의 LLM을 활용하여 경계 탐지 성능을 평가하였습니다.
- LLM에 추가 레이어(LSTM, BiLSTM, CRF) 결합, 세그먼트 손실 함수 도입, 사전 학습 기법 적용 등 다양한 요인이 경계 탐지 성능에 미치는 영향을 분석하였습니다.
- 이러한 기술적 접근을 통해 SemEval-2024 Task 8의 '인간-기계 혼합 텍스트 탐지' 부문에서 1위를 달성하였습니다.
Статистика
인간 작성 텍스트와 기계 생성 텍스트가 혼합된 데이터셋의 평균 길이는 263단어이며, 최대 길이는 1,397단어입니다.
경계 지점의 평균 위치는 71번째 단어입니다.
Цитати
"LLM, 특히 ChatGPT 등장 이후 다양한 응용 분야에서 유창하고 자연스러운 텍스트를 생성할 수 있게 되었지만, 이로 인해 이러한 LLM의 오남용에 대한 우려가 커지고 있습니다."
"기존 연구는 텍스트가 완전히 기계 생성되었는지 아니면 완전히 인간 작성되었는지를 구분하는 데 초점을 맞추었지만, 인간과 AI의 협업이 증가함에 따라 인간 작성 부분과 기계 생성 부분이 혼합된 텍스트가 새로운 시나리오로 등장했습니다."