Core Concepts
AI 생성 이미지의 품질을 시각적 품질, 진정성, 일관성의 세 가지 차원에서 종합적으로 평가하는 방법을 제안한다.
Abstract
이 논문은 AI 생성 이미지(AGI)의 품질을 평가하기 위한 새로운 방법을 제안한다. 기존의 이미지 품질 평가 방법은 주로 자연 장면 이미지의 시각적 품질만을 평가하지만, AGI의 경우 시각적 품질뿐만 아니라 진정성과 일관성도 중요한 평가 요소이다.
제안하는 AMFF-Net 모델은 이미지를 다양한 스케일로 입력받아 적응적으로 특징을 융합하여 세 가지 차원의 품질 점수를 예측한다. 구체적으로:
시각적 품질: 다중 스케일 이미지 특징을 적응적으로 융합하여 예측
진정성: 다중 스케일 이미지 특징을 적응적으로 융합하여 예측
일관성: 이미지 특징과 텍스트 특징의 유사도를 계산하여 예측
실험 결과, AMFF-Net은 기존 방법들에 비해 AGI 품질 평가 성능이 우수하며, 특히 일관성 평가에서 큰 성능 향상을 보였다. 또한 다중 스케일 입력 전략과 적응형 특징 융합 블록의 효과성을 입증하였다.
Stats
시각적 품질 예측 정확도(SRCC)는 기존 최고 방법 대비 약 2.367% 향상되었다.
일관성 예측 정확도(SRCC)는 기존 최고 방법 대비 약 18.018% 향상되었다.
진정성 예측 정확도(SRCC)는 기존 최고 방법 대비 약 3.639% 향상되었다.
Quotes
"AI 생성 이미지의 품질을 시각적 품질, 진정성, 일관성의 세 가지 차원에서 종합적으로 평가하는 것이 중요하다."
"다중 스케일 이미지 특징을 적응적으로 융합하는 것이 AGI 품질 평가에 효과적이다."
"이미지 특징과 텍스트 특징의 유사도 계산은 일관성 평가에 도움이 된다."