CLIP-ViT의 시각적 지식과 기술적 능력을 효과적으로 활용하여 다양한 생성 모델에 걸쳐 강력하고 일반화된 AI 생성 이미지 탐지기를 개발한다.
생성 모델이 급속도로 증가함에 따라 범용 가짜 이미지 탐지기의 필요성이 커지고 있다. 기존 방식의 한계를 분석하고, 생성 모델에 관계없이 효과적으로 가짜 이미지를 탐지할 수 있는 새로운 접근법을 제안한다.
잠재 확산 모델에서 사용되는 자동인코더의 재구성 오차를 이용하여 생성 이미지를 효과적으로 탐지할 수 있다.
확산 모델 기반 이미지 생성 기술의 발전으로 실제 이미지와 생성 이미지를 구분하기 어려워졌다. 이에 대응하여 저자들은 잠재 공간의 재구성 오류를 활용한 새로운 탐지 방법 LaRE2를 제안한다. LaRE2는 기존 방법보다 효율적이면서도 실제 이미지와 생성 이미지를 잘 구분할 수 있다.