提案するDAF-Netは、赤外線画像と可視画像の特徴を効果的に融合し、グローバル構造と詳細テクスチャのバランスを取ることができる。
提案するFuseFormerアーキテクチャは、CNNとTransformerを組み合わせた二つのブランチを使用して、局所的な特徴と大域的なコンテキストを効果的に融合する。また、提案する新しい損失関数は、両入力画像の特徴を考慮することで、定量的および定性的な結果の向上を実現する。