核心概念
SwinFuSRは、RGB画像を利用して赤外線画像の高解像度化を行う新しい手法である。Swin Transformerを用いた軽量なアーキテクチャを提案し、RGB画像が欠落した場合の頑健性も向上させている。
摘要
本論文では、SwinFuSRと呼ばれる新しい手法を提案している。SwinFuSRは、RGB画像を利用して赤外線画像の高解像度化を行うモデルである。
モデルの構造は以下の通り:
- 浅層特徴抽出モジュール: 畳み込み層とSwin Transformerブロックを使用して浅層特徴を抽出する。
- 深層特徴融合モジュール: RGB画像とIR画像の特徴を融合するためのAttention-guided Cross-domain Fusion (ACF)ブロックを使用する。
- 深層特徴再構築モジュール: Swin Transformerブロックと畳み込み層を使用して、融合された特徴から高解像度画像を再構築する。
また、RGB画像が欠落した場合の頑健性を向上させるため、訓練時にランダムにRGB画像を削除する手法を提案している。
実験の結果、提案手法は既存手法と比較して高いPSNRとSSIMを達成し、PBVS 2024 Thermal Image Super-Resolution Challengeのトラック2で3位を獲得した。さらに、RGB画像が欠落した場合でも良好な性能を維持できることが示された。
统计
低解像度IR画像から高解像度IR画像を再構築する際、RGB画像を利用することで、PSNR値が28.96、SSIM値が0.878と大幅に向上する。
一方、RGB画像が欠落した場合、PSNR値が-8.67%、SSIM値が-7.44%低下するが、提案手法の訓練手法により、PSNR値が-6.63%、SSIM値が-5.68%まで改善される。
引用
"SwinFuSRは、RGB画像を利用して赤外線画像の高解像度化を行う新しい手法である。"
"提案手法は、RGB画像が欠落した場合の頑健性も向上させている。"