이 논문은 전체 참조(FR) 및 무참조(NR) 이미지 품질 평가(IQA) 작업을 단일 프레임워크로 수행하는 방법을 제안한다.
먼저 입력 이미지에서 다중 수준의 특징을 추출하기 위해 인코더(ResNet50 또는 Swin Transformer)를 사용한다. 그 다음 계층적 주의 모듈(HA)을 제안하여 인코더 각 단계의 공간적 왜곡을 모델링한다. 또한 의미적 왜곡 인지 모듈(SDA)을 제안하여 얕은 층과 깊은 층의 특징 상관관계를 분석함으로써 왜곡이 이미지 의미에 미치는 영향을 추정한다.
HA와 SDA 모듈을 통해 제안된 네트워크는 FR 및 NR IQA 작업을 효과적으로 수행할 수 있다. 단일 작업으로 학습할 경우 기존 최신 모델들을 능가하는 성능을 보이며, 두 작업을 함께 학습할 경우 NR IQA 성능이 더욱 향상되면서 FR IQA에서도 최신 수준의 성능을 달성한다.
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Yi Ke Yun,We... kl. arxiv.org 04-09-2024
https://arxiv.org/pdf/2310.09560.pdfDybere Forespørgsler