核心概念
提案するADTRSモデルは、CNNとトランスフォーマーの特徴を融合し、画像の局所的および非局所的特徴を包括的に表現することで、画像品質を効率的に評価する。また、相対ランキングロスと自己整合性メカニズムを導入することで、モデルの精度と頑健性を向上させている。
要約
本研究では、CNNとトランスフォーマーを組み合わせた新しい盲目的画像品質評価(NR-IQA)モデルADTRSを提案している。
まず、CNNを用いて画像特徴を抽出し、正規化、プーリング、ドロップアウトなどの前処理を行う。次に、これらの特徴をトランスフォーマーエンコーダに入力し、自己注意メカニズムを通じて局所的および非局所的な特徴を学習する。
さらに、相対ランキングロスを導入することで、画像間の順位関係を考慮した学習を行う。また、自己整合性メカニズムを用いて、水平反転変換に対する整合性を確保することで、モデルの頑健性を高めている。
最終的に、全結合層を用いて画質スコアを予測する。
提案手法は、LIVE、CSIQ、TID2013、LIVE-C、KonIQ10Kの5つの標準的な画質評価データセットで評価を行い、既存手法と比較して優れた性能を示している。特に、小規模データセットや合成歪みデータセットにおいて顕著な改善が見られた。
統計
画像品質スコアの予測誤差を最小化するための回帰損失関数を定義している。
画像間の相対的な順位関係を考慮するための相対ランキング損失関数を導入している。
水平反転変換に対する自己整合性を確保するための損失関数を定義している。
引用
"提案するADTRSモデルは、CNNとトランスフォーマーの特徴を融合し、画像の局所的および非局所的特徴を包括的に表現することで、画像品質を効率的に評価する。"
"相対ランキングロスと自己整合性メカニズムを導入することで、モデルの精度と頑健性を向上させている。"