이 논문은 SemEval-2024 Task 8 - 다중 생성기, 다영역, 다언어 블랙박스 기계 생성 텍스트 탐지에 참여한 MasonTigers 팀의 접근 방식과 결과를 설명한다.
Task 8은 3개의 서브태스크로 구성되어 있다:
MasonTigers 팀은 주로 판별자 트랜스포머 모델의 앙상블, 문장 트랜스포머, 통계적 기계 학습 기법을 활용하여 우수한 성능을 달성했다. 또한 FLAN-T5의 제로샷 프롬팅과 파인튜닝을 활용하여 Track A와 B에서 좋은 결과를 얻었다.
서브태스크 A 단일어 트랙에서 앙상블 모델은 74%의 정확도를, 다언어 트랙에서는 60%의 정확도를 달성했다. 서브태스크 B에서는 65%의 정확도를 달성했다. 서브태스크 C에서는 평균 절대 오차(MAE) 60.78을 기록했다.
이 연구는 기계 생성 텍스트 탐지를 위한 강력한 방법론을 제시하며, 향후 이 분야의 발전에 기여할 것으로 기대된다.
Till ett annat språk
från källinnehåll
arxiv.org
Djupare frågor