提案するADTRSモデルは、CNNとトランスフォーマーの特徴を融合し、画像の局所的および非局所的特徴を包括的に表現することで、画像品質を効率的に評価する。また、相対ランキングロスと自己整合性メカニズムを導入することで、モデルの精度と頑健性を向上させている。
画像品質評価モデルは、シーンカテゴリーと歪みタイプの両方に関する意味情報を活用することで大幅に向上する。提案手法は、テキストブランチとビジュアルブランチの両方でプロンプト学習を行うことで、これらの意味情報を効果的に抽出し、画像品質評価の精度を高めている。