Temel Kavramlar
本研究探討了三種融合熱感、RGB 和 LiDAR 影像數據的方法,用於繪製三個生物物理景觀特徵:犀牛糞堆、白蟻丘和水體。研究發現,雖然三種方法的整體表現相似,但它們在不同類別上的表現差異很大,這表明針對特定任務選擇最佳融合策略的重要性。
為了應對廣泛的土地退化和生物多樣性喪失,聯合國在其第十五個可持續發展目標「陸地生命」中呼籲保護、恢復和促進陸地生態系統的可持續利用和管理。成功地保護棲息地和物種需要有效的生態系統和生物多樣性監測。為此,生態學家和保護區管理人員需要繪製生物物理景觀特徵圖,這通常需要結合遙感和地面調查。
在非洲稀樹草原生態系統中,三個此類感興趣的特徵是犀牛糞堆、白蟻丘和水。犀牛糞堆是犀牛用於領地標記和社會交流的公共排便地點。白蟻丘由土壤、白蟻唾液和糞便組成,是景觀中養分和水分含量增強的小島,促進了植被的生長,而植被又吸引了食草動物。水在這裡被定義為河流、溪流或水坑,是許多動物物種賴以生存的關鍵資源。這些景觀特徵通常分佈在廣闊、難以到達的地區,這使得對遙感影像進行人工標註變得繁瑣,而完整的地面調查又超出了可用的時間和資源。這一挑戰促使人們使用深度學習 (DL)來自動檢測無人機影像中的生物物理景觀特徵。
本研究開發了深度學習模型,利用 2020 年 1 月在南非克魯格國家公園一個 284 公頃的場地拍攝的航空影像來繪製這些特徵圖。無人機配備了熱感相機、RGB 相機和 LiDAR(光探測和測距)掃描儀,它們同時以 0.5 米、0.05 米和 0.1 米的分辨率分別收集熱感、RGB 和高程數據。利用這些多模態數據,我們研究了以下問題:如何最有效地將多分辨率熱感、RGB 和 LiDAR 數據融合到深度學習模型中,以便在訓練數據有限且不平衡的情況下進行多類別圖像分類?具體而言,是在特徵提取過程的早期還是晚期進行融合更好?在後期融合時,應如何對模態進行加權?
三種融合策略
早期融合: 將不同模態的圖塊拼接在一起,並將其通過一個 5 通道 ResNet。
後期融合: 將不同模態的圖塊分別通過獨立的 ResNet 特徵提取器,然後在一個全連接層中進行融合。
專家混合 (MoE): 使用一個門控網絡,根據輸入對每個模態的預測進行加權。