Ghostbuster는 일련의 약한 언어 모델을 통해 문서를 전달하고, 이러한 모델의 특징을 조합하여 AI 생성 텍스트를 탐지하는 최신 기술입니다.
프롬프트 정보 유무에 따라 제로샷 AI 생성 텍스트 탐지기의 성능이 크게 달라진다.
본 연구는 외부 언어 모델을 사용하지 않고도 AI 생성 텍스트의 워터마크를 효과적으로 제거할 수 있는 SCTS 알고리즘을 제안한다. 이 접근법은 특정 프롬프팅 기술을 통해 워터마크 정보를 발견하고 활용하여 탐지를 회피할 수 있음을 보여준다.