本研究は、画像スーパーレゾリューション(SR)タスクにおけるデータセットプルーニングの可能性を探る。
まず、データセットプルーニングの手法について説明する。コアセットと呼ばれる、オリジナルデータセットの代表的な部分集合を選択することで、データセットサイズを削減する。コアセットの選択方法として、本研究では損失値に基づくサンプリングを提案する。簡単な事前学習済みSRモデル(SRCNN)を使ってサンプルの再構成損失を計算し、高い損失値のサンプルを優先的に選択する。
次に、提案手法の有効性を検証する実験結果を示す。まず、上昇サンプリング(ASC)と下降サンプリング(DES)を比較し、DESの方が優れていることを示す。DESは、オリジナルデータセットと同等以上の性能を維持できることがわかった。一方、ASCでは性能が大幅に低下する。
さらに、提案の損失値ベースサンプリングと、先行研究のSobel filterベースサンプリングを比較する。損失値ベースの方が優れた結果を示すことを確認した。
最後に、損失値分布の分析から、最も高い損失値を持つ上位5%のサンプルが学習に悪影響を及ぼすことを発見した。そこで、これらの最も難しいサンプルを除外した refined コアセットを提案し、その有効性を検証した。refined コアセットは、オリジナルデータセットの50%のサイズでありながら、最先端のSRモデルであるSwinIRの性能を向上させることができた。
以上の結果から、損失値に基づくデータセットプルーニングは、画像スーパーレゾリューションの学習効率を大幅に改善できる有望な手法であることが示された。
Naar een andere taal
vanuit de broninhoud
arxiv.org
Belangrijkste Inzichten Gedestilleerd Uit
by Brian B. Mos... om arxiv.org 03-27-2024
https://arxiv.org/pdf/2403.17083.pdfDiepere vragen