本研究では、CNNとトランスフォーマーを組み合わせた新しい盲目的画像品質評価(NR-IQA)モデルADTRSを提案している。
まず、CNNを用いて画像特徴を抽出し、正規化、プーリング、ドロップアウトなどの前処理を行う。次に、これらの特徴をトランスフォーマーエンコーダに入力し、自己注意メカニズムを通じて局所的および非局所的な特徴を学習する。
さらに、相対ランキングロスを導入することで、画像間の順位関係を考慮した学習を行う。また、自己整合性メカニズムを用いて、水平反転変換に対する整合性を確保することで、モデルの頑健性を高めている。
最終的に、全結合層を用いて画質スコアを予測する。
提案手法は、LIVE、CSIQ、TID2013、LIVE-C、KonIQ10Kの5つの標準的な画質評価データセットで評価を行い、既存手法と比較して優れた性能を示している。特に、小規模データセットや合成歪みデータセットにおいて顕著な改善が見られた。
Vers une autre langue
à partir du contenu source
arxiv.org
Questions plus approfondies