핵심 개념
이 논문은 텍스트에서 이미지 생성 모델을 평가하기 위한 새로운 평가 프레임워크를 제시하고, 인간 이미지 합성에 대한 결함 탐지를 돕는 데이터셋을 소개합니다.
통계
모델의 결함 탐지 정확도는 0.86으로 결함이 있는 이미지에서 더 낮음
SDXL 모델의 얼굴 결함율은 29%로 가장 낮음
CAN 모델의 SRCC는 0.754로 TANet보다 높음
인용구
"이미지 품질 및 텍스트 조건에 대한 균형있는 평가를 위한 새로운 프레임워크 소개"
"결함 탐지 모델과 데이터셋을 통해 인간 이미지 합성의 한계 탐지를 돕는다."