Core Concepts
事前学習された拡散モデルは、複雑なテクスチャに関する事前知識を包含し、画像超解像度の文脈でこの事前知識を活用することが重要である。
Abstract
画像超解像度は、高解像度画像から低解像度画像への回帰プロセスであり、特定のぼかしカーネルによって特徴付けられる。しかし、実世界のイメージングでは、ぼかしカーネルだけでは不十分であり、空間的に変動するぼかしカーネルが必要とされる。これらの課題を解決するために、Adaptive Multi-modal Fusion of Spatially Variant Kernel Refinement with Diffusion Model for Blind Image Super-Resolution(SSR)フレームワークが導入されている。SSRフレームワークでは、Depth-Informed Kernel Estimate Network(DKENet)が使用されており、深度情報をガイドしてぼかしカーネルを推定し、拡散プロセスに影響を与えている。さらに、Spatially Variant Kernel Refinement(SVKR)モジュールも導入されており、低解像度画像から深度情報を取得している。
Stats
ILR = (IHR ⊗ k) ↓s +n
PSNR ↑ SSIM ↑ LPIPS ↓ MUSIQ ↑ CLIP-IQA ↑ NIQE ↓
Quotes
"Pre-trained diffusion models utilized for image generation encapsulate a substantial reservoir of a priori knowledge pertaining to intricate textures."
"To address these concerns, we introduce a framework known as Adaptive Multi-modal Fusion of Spatially Variant Kernel Refinement with Diffusion Model for Blind Image Super-Resolution (SSR)."
"Our main contributions are four-fold: 1) We propose an blind image super-resolution framework known as SSR. 2) We proposed a Spatially Variant Kernel Refinement (SVKR) module to estimate blur kernels. 3) We developed Adaptive Multi-Modal Fusion (AMF) module to merge information from multiple modalities. 4) Extensive quantitative and qualitative experiments on representative datasets have verified the superior performance and effectiveness of our method."