제한된 데이터셋 크기로 인한 문제를 해결하기 위해 이미지 품질 평가(IQA)를 위한 새로운 사전 훈련 프레임워크인 ATTIQA(ATTribute-aware IQA)를 제안하며, 이는 CLIP의 광범위한 이미지-텍스트 지식과 대규모 데이터셋의 확장성을 효과적으로 활용하여 뛰어난 일반화 능력을 보여줍니다.
Dog-IQA는 사전 훈련된 멀티모달 대규모 언어 모델(MLLM)을 활용하여 이미지 품질을 평가하는 새로운 제로샷 학습 기반 프레임워크로, 객관적인 표준 기반 채점 메커니즘과 이미지의 전역 및 지역 품질을 모두 고려하는 혼합 세분화 집계 메커니즘을 통해 기존 방법보다 우수한 성능을 달성했습니다.
생성 모델을 활용하여 이미지 품질을 효과적으로 예측할 수 있다.
이 연구는 이미지 품질 평가를 위해 이항 분포 모델링을 제안합니다. 이 방법은 두 대안 강제 선택(2AFC) 실험 데이터를 활용하여 다양한 후보 지각 거리 함수의 적합성을 평가합니다.