언어학적 특성(통계, 가독성, 문체, 어휘 다양성, 수사 구조, 개체 격자)과 사전 훈련된 언어 모델 임베딩을 결합하여 기계 생성 텍스트와 인간 작성 텍스트를 효과적으로 구분할 수 있다.
SemEval-2024 Task 8에 참여한 MasonTigers 팀은 주로 판별자 트랜스포머 모델의 앙상블, 문장 트랜스포머, 통계적 기계 학습 기법을 활용하여 우수한 성능을 달성했다. 또한 FLAN-T5의 제로샷 프롬팅과 파인튜닝을 활용하여 Track A와 B에서 좋은 결과를 얻었다.