本レポートは、NTIRE 2024チャレンジの包括的な概要を提供する。主な内容は以下の通り:
チャレンジの目的は、効率的な単一画像超解像(ESR)ソリューションを刺激し、探求することである。効率性の観点から、さまざまな手法を直接比較するプラットフォームを提供し、学術界と産業界のリーダーが一堂に会し、アイデアを交換し、潜在的な協力関係を築くことを目的としている。
チャレンジのデータセットは、DIV2K と LSDIR を使用する。参加者は、追加の外部データセットを使用して自身のモデルをトレーニングすることができる。ただし、DIV2K およびLSDIR の検証/テストデータセットの使用は禁止されている。
RLFNがベースラインモデルとして使用される。参加者は、ランタイム、パラメータ、FLOPsを最適化しつつ、DIV2K LSDIR の有効データセットで26.90 dB以上、テストデータセットで26.99 dB以上のPSNRを維持するよう求められる。
チャレンジには4つのトラックがある:メイントラック(総合パフォーマンス)、サブトラック1(ランタイム)、サブトラック2(FLOPs)、サブトラック3(パラメータ)。各トラックの評価指標に基づいて最終的な順位が決定される。
262人が登録し、34チームが有効な提出を行った。提案された手法の多くは、パラメータフリーの注意メカニズム、再パラメータ化、マルチスケール情報の活用、ネットワーク剪定などを活用している。最終的な結果では、XiaomiMMチームが総合的な効率性で首位を獲得した。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Bin Ren,Yawe... at arxiv.org 04-17-2024
https://arxiv.org/pdf/2404.10343.pdfDeeper Inquiries