Core Concepts
최근 AI 이미지 생성 기술이 급속도로 발전하면서 다양한 AI 생성 이미지(AIGI)가 생성되고 있지만, AIGI의 품질은 매우 일관성이 없어 사용자의 시각적 경험을 저해하고 있다. 이에 따라 AIGI의 품질을 사람의 지각 관점에서 평가하는 AI 생성 이미지 품질 평가(AIGIQA) 연구가 중요해지고 있다.
Abstract
이 논문에서는 텍스트-이미지 및 이미지-이미지 AIGI를 모두 포함하는 대규모 지각적 품질 평가 데이터베이스인 PKU-AIGIQA-4K를 구축했다. 이를 위해 Midjourney, Stable Diffusion V1.5, DALLE3 등 3개의 이미지 생성 모델을 사용하여 총 4,000장의 AIGI를 생성했다. 이후 체계적인 주관적 실험을 통해 AIGI의 품질, 진정성, 텍스트-이미지 대응도에 대한 평가 점수를 수집했다.
또한 이미지 프롬프트를 참조 이미지로 사용하는지 여부에 따라 NR-AIGCIQA, FR-AIGCIQA, PR-AIGCIQA라는 3가지 이미지 품질 평가 방법을 제안했다. 이를 통해 텍스트-이미지 및 이미지-이미지 AIGI를 모두 평가할 수 있다. 마지막으로 PKU-AIGIQA-4K 데이터베이스를 활용하여 제안 방법과 기존 IQA 방법들의 성능을 비교 평가했다.
Stats
텍스트 프롬프트를 사용하여 생성된 AIGI의 품질 점수 평균은 0.8356이다.
이미지 프롬프트를 사용하여 생성된 AIGI의 품질 점수 평균은 0.7467이다.
Midjourney로 생성된 AIGI의 진정성 점수 평균은 0.7913이다.
Stable Diffusion V1.5로 생성된 AIGI의 텍스트-이미지 대응도 점수 평균은 0.7839이다.
Quotes
"최근 AI 이미지 생성 기술이 급속도로 발전하면서 다양한 AI 생성 이미지(AIGI)가 생성되고 있지만, AIGI의 품질은 매우 일관성이 없어 사용자의 시각적 경험을 저해하고 있다."
"이에 따라 AIGI의 품질을 사람의 지각 관점에서 평가하는 AI 생성 이미지 품질 평가(AIGIQA) 연구가 중요해지고 있다."