最近、画像超解像(ISR)において、拡散ベースの手法は強力な生成事前条件を持つため注目を集めています。しかし、低解像度(LR)画像はしばしば深刻な劣化を経験するため、ISRモデルが意味情報や劣化情報を正確に把握することが困難であり、不正確なコンテンツや非現実的なアーティファクトを復元することがあります。この問題に対処するために、著者らはSuper-Resolution(XPSR)フレームワークを提案しています。XPSRでは、最先端のマルチモーダル大規模言語モデル(MLLMs)を使用して拡散モデルのための正確で包括的な意味条件を取得し、交差モデル事前条件のより良い融合を促進します。また、Degradation-Free Constraint(DFC)も導入されており、LRとその高解像度(HR)対応物との間にセマンティック保存情報を抽出します。
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Yunpeng Qu,K... في arxiv.org 03-11-2024
https://arxiv.org/pdf/2403.05049.pdfاستفسارات أعمق