Centrala begrepp
Das vorgeschlagene ELGC-Net-Modell nutzt effizient lokale und globale Kontextinformationen, um präzise Veränderungsregionen zu schätzen und gleichzeitig die Modellgröße zu reduzieren.
Sammanfattning
Die Studie präsentiert ein effizientes Veränderungserkennungsframework namens ELGC-Net, das darauf abzielt, semantische Veränderungen zwischen zeitlich versetzten Satellitenbildpaaren genau zu identifizieren. Der Schwerpunkt des Designs liegt auf der Einführung eines effizienten lokalen und globalen Kontextaggregators (ELGCA), der sowohl globale Kontextinformationen als auch lokale räumliche Informationen erfasst, während die Rechenkosten reduziert werden.
Das ELGCA-Modul umfasst Folgendes:
- Erfassung des globalen Kontexts durch eine gepoolte transponierte (PT) Aufmerksamkeit, die robuste Merkmalsextraktionen und eine lineare Komplexität in Bezug auf die Anzahl der Token ermöglicht.
- Erfassung des lokalen räumlichen Kontexts durch eine Tiefenkanalkonvolution.
- Mehrkanalmerkmalsaggregation durch eine 1x1-Konvolution.
Die umfangreichen Experimente auf drei CD-Datensätzen zeigen, dass ELGC-Net die bestehenden Methoden übertrifft und einen neuen Stand der Technik in der Fernerkundungsveränderungserkennung setzt. Darüber hinaus führen wir eine leichtgewichtige Variante namens ELGC-Net-LW ein, die eine vergleichbare Leistung bei deutlich reduzierten Rechenressourcen erzielt.
Statistik
Die Verwendung von Pooling-Operationen für die Abfrage- und Schlüsselmerkmale in der ELGCA-Komponente führt zu einer Verbesserung der Leistung.
Die Kombination von Durchschnitts- und Maximal-Pooling erzielt den besten IoU-Wert von 83,83%.
Citat
"Das vorgeschlagene ELGCA-Modul strebt danach, sowohl lokale als auch globale Kontextinformationen zu erfassen, während es die Rechenkosten im Vergleich zur Selbstaufmerksamkeit reduziert."
"Unsere ELGC-Net-LW-Variante bietet eine vergleichbare Leistung bei deutlich reduzierten Rechenressourcen."