本論文では、ドメインシフト拡散モデル(DoSSR)を提案している。DoSSRは、低解像度(LR)画像から高解像度(HR)画像への段階的なドメインシフトを拡散プロセスに組み込むことで、効率的な推論を実現している。
具体的には以下の3つの特徴がある:
ドメインシフト方程式を導入し、LR画像を初期値として拡散プロセスを開始することで、効率的な推論を実現している。
拡散プロセスをSDEで定式化し、カスタマイズされた高速なサンプラーを設計することで、さらなる効率化を図っている。
大規模に事前学習された拡散モデルの生成能力を活用することで、高品質な画像を生成できる。
実験結果では、従来手法と比較して5-7倍の高速化を達成しつつ、合成・実世界データセットでトップレベルの性能を示している。DoSSRは、拡散モデルベースの画像スーパーレゾリューションにおける効率と性能のバランスを最適化した手法と言える。
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Qinpeng Cui,... lúc arxiv.org 09-27-2024
https://arxiv.org/pdf/2409.17778.pdfYêu cầu sâu hơn