Core Concepts
ウェーブレット損失を用いてトランスフォーマーモデルを学習することで、定量的および視覚的な性能が向上する。
Abstract
本論文では、単一画像スーパーレゾリューション(SR)タスクにおいて、ハイブリッドトランスフォーマーアーキテクチャと、ウェーブレット損失関数を組み合わせた手法を提案している。
具体的には以下の2つの貢献がある:
非局所的疎注意(NLSA)ブロックをハイブリッドトランスフォーマーアーキテクチャに組み込むことで、受容野をさらに拡大している。
ウェーブレット損失関数を導入することで、高周波成分の再構成を改善し、定量的および視覚的な性能を向上させている。
実験結果から、提案手法はベンチマークデータセットにおいて、従来のトランスフォーマーベースのSR手法と比較して、PSNRおよび視覚的品質の両面で優れた性能を示すことが確認された。特に、Urban100データセットにおいて従来手法に対して最大0.72 dBのPSNR向上が得られた。
また、提案手法はトランスフォーマーベースのSR手法に一般的に適用可能であり、SwinIRモデルの性能も同様にウェーブレット損失関数によって改善されることを示した。
Stats
提案手法はUrban100データセットにおいて、従来手法に対して最大0.72 dBのPSNR向上を達成した。
提案手法はSet14、BSD100、DIV2Kデータセットにおいても、従来手法に対して0.1 dB以上のPSNR向上を示した。
Quotes
"ウェーブレット損失を用いてトランスフォーマーモデルを学習することで、定量的および視覚的な性能が向上する。"
"提案手法はトランスフォーマーベースのSR手法に一般的に適用可能であり、SwinIRモデルの性能も同様にウェーブレット損失関数によって改善される。"