Core Concepts
이 공동 과제는 다중 도메인, 다중 모델 및 다국어 기계 생성 텍스트를 탐지하는 것을 목표로 합니다.
Abstract
이 공동 과제는 3개의 하위 과제로 구성됩니다:
하위 과제 A: 인간 vs. 기계 분류
텍스트가 인간이 작성했는지 기계가 생성했는지 판별하는 이진 분류 과제
단일 언어 트랙(영어)과 다국어 트랙으로 구성
하위 과제 B: 다중 생성기 탐지
텍스트가 인간이 작성했는지, 특정 LLM(GPT-3, GPT-3.5, GPT-4, Cohere, DALL-E, BLOOMz)에 의해 생성되었는지 판별
하위 과제 C: 변화점 탐지
텍스트 내에서 인간 작성 부분과 기계 생성 부분의 경계점을 정확히 식별
이 공동 과제에는 많은 참가팀이 참여했습니다: 하위 과제 A 단일 언어 트랙 (126팀), 하위 과제 A 다국어 트랙 (59팀), 하위 과제 B (70팀), 하위 과제 C (30팀). 참가팀들은 주로 LLM 기반의 접근법을 사용했습니다.
Stats
기계 생성 텍스트와 인간 작성 텍스트의 비율은 대략 1:1입니다.
하위 과제 A 단일 언어 트랙에는 영어 텍스트가, 하위 과제 A 다국어 트랙에는 영어, 중국어, 우르두어, 불가리아어, 인도네시아어 텍스트가 포함되어 있습니다.
하위 과제 B와 C에는 다양한 도메인(Wikipedia, Wikihow, Reddit, arXiv, PeerRead, Outfox)의 텍스트가 포함되어 있습니다.