本文提出了一种名为ADTRS的改进型盲目图像质量评估(NR-IQA)模型。该模型采用了CNN和Transformer编码器的结合,以捕获图像的局部和非局部特征。
首先,CNN用于从输入图像中提取多尺度特征,并经过归一化、池化和dropout等预处理步骤。然后,这些特征被输入到Transformer编码器中,利用多头自注意机制建模特征之间的依赖关系。
为了增强主观和客观评估之间的联系,模型采用了相对排名损失函数,关注图像质量的相对排序。同时,通过利用图像的等变换(如水平翻转)进行自我一致性训练,进一步提高了模型的鲁棒性。
最终,模型输出既包括绝对质量评分,也包括相对排名,实现了全面的图像质量评估。
在五个流行的图像质量数据集上的实验结果表明,ADTRS模型在PLCC和SROCC指标上均优于现有的SOTA算法,特别是在较小或合成数据集上的表现更为出色。这突出了该模型在捕获图像特征和提高评估可靠性方面的优势。
Till ett annat språk
från källinnehåll
arxiv.org
Djupare frågor