本論文では、WaveMixSRモデルの改良版であるWaveMixSR-V2を提案している。主な改良点は以下の2点である:
従来のWaveMixSRモデルでは、単一の補間層を用いて低解像度(LR)画像を直接高解像度(HR)にアップサンプリングしていたが、WaveMixSR-V2では、段階的に解像度を2倍ずつ上げていく多段階設計に変更した。これにより、高倍率の超解像度タスクでも優れた性能を発揮できるようになった。
WaveMixSRモデルで使用されていた転置畳み込み層を、ピクセルシャッフル操作に置き換えた。これにより、パラメータ数を大幅に削減でき、効率性が向上した。また、ピクセルシャッフルは、転置畳み込みで生じがちなチェッカーボード状のアーティファクトを回避できる。
実験の結果、WaveMixSR-V2は、BSD100データセットにおいて2倍および4倍の超解像度タスクで最先端の性能を達成した。さらに、WaveMixSRと比較して、パラメータ数、計算量、レイテンシが大幅に減少し、スループットが向上していることが確認された。
Til et annet språk
fra kildeinnhold
arxiv.org
Viktige innsikter hentet fra
by Pranav Jeeva... klokken arxiv.org 09-18-2024
https://arxiv.org/pdf/2409.10582.pdfDypere Spørsmål