核心概念
利用自監督的遮蔽自編碼方法,在覆蓋地球8.7%陸地面積的大規模 SAR 數據上進行預訓練,可以顯著減少下游任務(如植被覆蓋預測和土地覆蓋分類)的標籤需求,並且在地理上更具有泛化能力。
摘要
本文提出利用自監督的遮蔽自編碼方法對大規模 SAR 數據進行預訓練,並在兩個下游任務(植被覆蓋預測和土地覆蓋分類)上進行微調。
在植被覆蓋預測任務中:
- 使用預訓練模型可以將所需標籤數量減少一個數量級,在歐洲和南美兩個區域都取得了顯著的效果提升。
- 在南美這個未見過的區域,預訓練模型使用1%的標籤就能超過完全監督模型的性能。
在土地覆蓋分類任務中:
- 使用預訓練模型也可以減少所需標籤數量,在歐洲和南美兩個區域都取得了性能提升。
- 在南美這個未見過的區域,預訓練模型使用10%的標籤就能超過完全監督模型的性能。
這些結果表明,利用自監督預訓練可以顯著提高 SAR 數據在下游任務中的性能,並且具有良好的地理泛化能力。這對於利用 SAR 數據進行氣候變化監測和自然災害管理等應用具有重要意義,因為 SAR 數據可以在任何天氣條件下進行全天候監測。
統計資料
"SAR 數據覆蓋了地球8.7%的陸地面積。"
"在歐洲區域,使用10%的標籤,預訓練模型的 RMSE 為3.282%,優於完全監督模型的3.749%。"
"在南美區域,使用1%的標籤,預訓練模型的 RMSE 為8.390%,優於完全監督模型的8.883%。"
引述
"利用自監督的遮蔽自編碼方法,在覆蓋地球8.7%陸地面積的大規模 SAR 數據上進行預訓練,可以顯著減少下游任務的標籤需求,並且在地理上更具有泛化能力。"
"在南美這個未見過的區域,預訓練模型使用1%的標籤就能超過完全監督模型的性能。"
"這些結果表明,利用自監督預訓練可以顯著提高 SAR 數據在下游任務中的性能,並且具有良好的地理泛化能力。"