核心概念
本文提出了一種基於條件的可控圖像融合框架 (CCF),該框架利用預先訓練的去噪擴散概率模型 (DDPM) 和條件庫,無需額外訓練即可實現多種圖像融合任務中的可控融合。
摘要
論文概述
本論文提出了一種名為條件可控圖像融合 (CCF) 的新型圖像融合框架,該框架利用預先訓練的去噪擴散概率模型 (DDPM) 和條件庫,無需額外訓練即可實現多種圖像融合任務中的可控融合。
研究背景
圖像融合旨在將來自多個輸入圖像的互補信息整合到一個新的融合圖像中。現有方法通常針對特定場景採用不同的約束設計,形成固定的融合範式。然而,這種數據驅動的融合方法難以部署在不同的場景中,尤其是在快速變化的環境中。
研究方法
CCF 框架包含一個條件庫,該庫包含三種類型的條件:基本條件、增強條件和特定任務條件。基本條件用於生成基礎融合圖像,增強條件則用於優化圖像生成過程,而特定任務條件則針對特定任務進行定制。CCF 框架採用一種採樣自適應條件選擇 (SCS) 機制,根據不同的去噪步驟動態選擇適當的條件,從而實現動態可控的圖像融合。
實驗結果
在多模態、多焦點和多曝光圖像融合等多個圖像融合任務上的實驗結果表明,CCF 框架在定量和定性評估方面均優於現有方法。
研究貢獻
本論文的主要貢獻包括:
- 提出了一種基於條件的可控圖像融合框架 (CCF),該框架利用條件庫實現了多種圖像融合場景中的可控性,並促進了動態可控圖像融合的能力。
- 提出了一種採樣自適應條件選擇機制,將條件庫巧妙地集成到去噪步驟中,允許在運行中進行自適應條件選擇,而無需額外訓練,並確保融合過程的動態適應性。
- 大量實驗證實了 CCF 框架在各種融合任務中相對於現有方法的優越融合性能。此外,該方法還可以用於融合結果的交互式操作,證明了其適用性和有效性。
研究結論
CCF 框架是一種有效的圖像融合方法,它利用預先訓練的 DDPM 和條件庫,無需額外訓練即可實現多種圖像融合任務中的可控融合。
統計資料
在 LLVIP 數據集上,CCF 在 SSIM、MSE 和 CC 指標上均取得了最佳結果,分別比次優結果提高了 0.02 和 0.035。
在 MFFW 數據集上,CCF 的 SD 值比次優值高 11.19,表明對比度更高,圖像更清晰。
在 MEFB 數據集上,CCF 的 SD、AG 和 SF 指標均排名第一,表明保留了更多紋理細節。
在使用 YOLOv5 進行目標檢測的實驗中,添加檢測條件後,mAP.5 提高了 0.049,達到 0.907,mAP.5:.95 提高了 0.054,達到 0.563,召回率顯著提高到 0.832。
引述
"At present, general image fusion with controllable diffusion models is still a challenging problem, warranting further exploration."
"To the best of our knowledge, we for the first time propose a conditional controllable framework for image fusion."
"Empirical findings demonstrate that CCF surpasses the competing methods in achieving superior performance for general image fusion tasks."