Keskeiset käsitteet
최신 텍스트-이미지 생성 모델을 통해 생성된 이미지의 출처를 정확하게 식별할 수 있으며, 이를 위해 모델의 세부 하이퍼파라미터와 후처리 기법의 영향을 분석할 필요가 있다.
Tiivistelmä
이 연구는 최신 텍스트-이미지 생성 모델을 통해 생성된 이미지의 출처를 식별하는 방법을 제시한다.
먼저 12개의 최신 텍스트-이미지 생성 모델을 활용하여 450,000개 이상의 이미지 데이터셋을 구축하였다. 이 데이터셋을 활용하여 이미지 출처 식별 모델을 학습한 결과, 90% 이상의 정확도를 달성하였다. 이는 무작위 추측 정확도 7.69%를 크게 상회하는 수준이다.
이어서 동일한 생성 모델 내에서 하이퍼파라미터 변화(체크포인트, 스케줄러, 샘플링 스텝, 초기화 시드)가 생성 이미지에 미치는 영향을 분석하였다. 그 결과, 초기화 시드의 경우 98% 이상의 정확도로 식별할 수 있었고, 다른 하이퍼파라미터들도 무작위 추측 정확도를 크게 상회하는 수준으로 식별 가능했다.
또한 사용자가 AI 생성 이미지에 추가로 적용하는 편집 기법(SDXL 인페인팅, Photoshop 제너레이티브 필, Magnific AI 업샘플링)이 출처 식별 성능에 미치는 영향을 분석하였다. 편집 영역이 증가할수록 출처 식별 정확도가 감소하였지만, 여전히 무작위 추측 정확도를 크게 상회하는 수준을 유지하였다.
마지막으로 고주파 영역 교란, 중간 수준 표현(깊이 맵, 엣지, 표면 법선 등) 활용, 스타일 표현 활용 등을 통해 이미지 출처 식별에 활용되는 시각적 단서를 심층적으로 분석하였다. 그 결과, 고주파 정보 외에도 중간 수준의 텍스처, 구조, 레이아웃 정보가 출처 식별에 활용되고 있음을 확인하였다.
Tilastot
이 연구에서는 450,000개 이상의 AI 생성 이미지 데이터셋을 구축하였다.
이미지 출처 식별 모델은 90% 이상의 정확도를 달성하였다.
초기화 시드의 경우 98% 이상의 정확도로 식별할 수 있었다.
편집 영역이 증가할수록 출처 식별 정확도가 감소하였지만, 여전히 무작위 추측 정확도를 크게 상회하는 수준을 유지하였다.
Lainaukset
"최신 텍스트-이미지 (T2I) 확산 모델은 놀라운 사실성과 창의성으로 이미지를 생성할 수 있게 되었다. 이러한 발전은 가짜 이미지 탐지 및 귀속에 대한 연구를 촉발했지만, 이 작업의 실용적이고 과학적인 차원을 완전히 탐구하지 않았다."
"우리의 실험 결과는 초기화 시드가 매우 감지 가능하며, 이미지 생성 프로세스의 다른 미묘한 변화도 어느 정도 감지 가능하다는 것을 보여준다."
"특히 고주파 정보를 변경하면 정확도가 약간만 감소하고, 스타일 표현으로 훈련된 귀속기가 RGB 이미지로 훈련된 것보다 성능이 우수하다는 점이 주목할 만하다."