이 논문은 전체 참조(FR) 및 무참조(NR) 이미지 품질 평가(IQA) 작업을 단일 프레임워크로 수행하는 방법을 제안한다.
먼저 입력 이미지에서 다중 수준의 특징을 추출하기 위해 인코더(ResNet50 또는 Swin Transformer)를 사용한다. 그 다음 계층적 주의 모듈(HA)을 제안하여 인코더 각 단계의 공간적 왜곡을 모델링한다. 또한 의미적 왜곡 인지 모듈(SDA)을 제안하여 얕은 층과 깊은 층의 특징 상관관계를 분석함으로써 왜곡이 이미지 의미에 미치는 영향을 추정한다.
HA와 SDA 모듈을 통해 제안된 네트워크는 FR 및 NR IQA 작업을 효과적으로 수행할 수 있다. 단일 작업으로 학습할 경우 기존 최신 모델들을 능가하는 성능을 보이며, 두 작업을 함께 학습할 경우 NR IQA 성능이 더욱 향상되면서 FR IQA에서도 최신 수준의 성능을 달성한다.
Na inny język
z treści źródłowej
arxiv.org
Głębsze pytania