AI 생성 이미지(AIGI)의 품질 편차가 크기 때문에 인간 주관적 평가와 일치하는 모델이 필요하다. 이를 위해 15개의 주요 생성 모델과 다양한 하이퍼파라미터를 고려하여 20,000개의 AIGI와 420,000개의 주관적 평가 점수로 구성된 AIGIQA-20K 데이터베이스를 구축하였다.
AI 생성 이미지의 품질을 시각적 품질, 진정성, 일관성의 세 가지 차원에서 종합적으로 평가하는 방법을 제안한다.
AI 생성 이미지의 품질 평가에는 기존 DNN 기반 모델의 한계가 있으며, 이를 해결하기 위해 대규모 멀티모달 모델을 활용한 접근이 필요하다.
최근 AI 이미지 생성 기술이 급속도로 발전하면서 다양한 AI 생성 이미지(AIGI)가 생성되고 있지만, AIGI의 품질은 매우 일관성이 없어 사용자의 시각적 경험을 저해하고 있다. 이에 따라 AIGI의 품질을 사람의 지각 관점에서 평가하는 AI 생성 이미지 품질 평가(AIGIQA) 연구가 중요해지고 있다.