本論文では、赤外線画像と可視画像の融合のためのドメイン適応型の双方向特徴分解融合ネットワーク(DAF-Net)を提案している。
DAF-Netの主な特徴は以下の通りである:
基本エンコーダにMulti-Kernel Maximum Mean Discrepancy (MK-MMD)を導入し、赤外線画像と可視画像の潜在特徴空間の分布差を低減することで、両者の特徴を効果的に融合する。
基本エンコーダはRestormerネットワークに基づいてグローバル構造情報を捕捉し、詳細エンコーダはInvertible Neural Networks (INN)に基づいて詳細テクスチャ情報を抽出する。
MK-MMDは基本エンコーダにのみ適用され、詳細エンコーダではモダリティ固有の情報の損失を避けるため、グローバル構造とローカル詳細のバランスを取ることができる。
実験結果から、提案手法DAF-Netは既存手法と比較して、視覚品質と融合性能の両面で優れた結果を示すことが分かった。
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Jian Xu, Xin... lúc arxiv.org 09-19-2024
https://arxiv.org/pdf/2409.11642.pdfYêu cầu sâu hơn