本論文は、画像品質評価(IQA)のための新しい手法を提案している。従来の深層学習ベースのIQA手法は、識別タスクのための表現を用いるため、画像品質に関する重要な特徴を見逃す可能性がある。一方、生成的な潜在表現は、画像の細部を保持するため、画像品質評価に適していると考えられる。
提案手法VAE-QAは、事前学習済みの生成モデル(VAE)の潜在表現を用いて、画像品質を予測する。具体的には、VAEの複数の中間層の特徴マップを抽出し、それらを統合して画質予測に用いる。
VAE-QAは、標準的なIQAベンチマークデータセットで高い予測精度を示し、特に異なるデータセットへの一般化性能が優れている。また、パラメータ数が少なく、メモリフットプリントが小さく、推論時間が速いという利点もある。
これらの結果から、生成的な潜在表現を活用することで、効率的かつ高精度な画像品質評価が可能であることが示された。
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Simon Raviv,... في arxiv.org 04-30-2024
https://arxiv.org/pdf/2404.18178.pdfاستفسارات أعمق