Core Concepts
AI 생성 이미지 탐지 데이터셋에 존재하는 JPEG 압축 및 이미지 크기 편향이 탐지기의 성능과 일반화 능력에 부정적인 영향을 미친다.
Abstract
이 논문은 AI 생성 이미지 탐지 데이터셋에 존재하는 JPEG 압축 및 이미지 크기 편향이 탐지기의 성능과 일반화 능력에 미치는 영향을 분석한다.
JPEG 압축 편향:
자연 이미지는 JPEG 형식으로, AI 생성 이미지는 무손실 압축 PNG 형식으로 저장되는 경우가 많다.
이로 인해 탐지기가 JPEG 압축 아티팩트를 이용해 이미지를 구분하게 된다.
실험 결과, JPEG 압축 수준이 높아질수록 탐지기의 성능이 크게 저하되었다.
반면 무압축 자연 이미지를 JPEG 압축하면 탐지기의 성능이 크게 향상되었다.
이미지 크기 편향:
AI 생성 이미지는 고정된 크기로 생성되지만, 자연 이미지는 다양한 크기 분포를 가진다.
실험 결과, 탐지기가 이미지 크기 정보를 이용해 구분하는 경향이 있음을 확인했다.
편향 제거 실험:
JPEG 압축 수준을 일치시키고 이미지 크기를 제한하여 데이터셋을 구성하여 탐지기를 재학습했다.
그 결과 탐지기의 일반화 성능과 강건성이 크게 향상되었다.
ResNet50과 Swin-T 탐지기의 평균 정확도가 11%p 이상 증가했다.
이 연구는 AI 생성 이미지 탐지 데이터셋의 편향을 지적하고, 이를 해결하는 방법을 제시함으로써 보다 신뢰할 수 있는 탐지기 개발에 기여한다.
Stats
자연 이미지의 대부분은 JPEG 품질 96으로 압축되어 있다.
AI 생성 이미지는 무압축 PNG 형식으로 저장되어 있다.
AI 생성 이미지의 크기는 128x128, 256x256, 512x512, 1024x1024 등 고정된 크기로 생성된다.
자연 이미지의 크기는 다양한 분포를 가진다.
Quotes
"JPEG 압축 수준이 높아질수록 탐지기의 성능이 크게 저하되었다."
"무압축 자연 이미지를 JPEG 압축하면 탐지기의 성능이 크게 향상되었다."
"탐지기가 이미지 크기 정보를 이용해 구분하는 경향이 있음을 확인했다."