核心概念
本文提出了一種名為 MV-CC 的新型遙感影像變化描述模型,該模型採用視訊模型來提取時空特徵,並利用變化檢測 (CD) 遮罩來引導模型關注真實的變化區域,從而生成更準確的描述。
標題:MV-CC: Mask Enhanced Video Model for Remote Sensing Change Caption
作者:Ruixun Liu*, Kaiyu Li*, Jiayi Song*, Dongwei Sun, Xiangyong Cao
本研究旨在解決遙感影像變化描述 (RSICC) 任務中存在的兩個關鍵挑戰:
如何有效地捕捉時空特徵。
如何引導模型關注正確的變化區域。