Core Concepts
Das Ziel des Artikels ist es, effiziente semi-überwachte Lernmethoden für die semantische Segmentierung von Fernerkundungsbildern zu entwickeln, indem die Präzision und Vielfalt der Pseudoetiketten während des Trainings erhöht werden.
Abstract
Der Artikel stellt zwei semi-überwachte Lernarchitekturen namens DiverseHead und DiverseModel vor, um die semantische Segmentierung von Fernerkundungsbildern zu verbessern.
DiverseHead:
- Verwendet ein Netzwerk mit mehreren Köpfen, um die Präzision und Vielfalt der Pseudoetiketten zu erhöhen.
- Führt zwei Perturbationsmethoden ein: Dynamisches Einfrieren und Dropout, um die Parameterdiversität zu erhöhen.
- Verwendet ein effizientes Abstimmungsmodul, um optimierte Pseudoetiketten zu generieren.
DiverseModel:
- Verwendet mehrere unterschiedliche Segmentierungsnetzwerke parallel, um die Vielfalt der Pseudoetiketten zu erhöhen.
- Die Netzwerke überwachen sich gegenseitig, um von den komplementären Merkmalen zu profitieren.
- Die Grad-CAM-Analyse zeigt, dass die verschiedenen Netzwerke unterschiedliche und ergänzende Aufmerksamkeit auf dieselben Eingaben richten.
Die Experimente auf vier Fernerkundungsdatensätzen zeigen, dass die vorgeschlagenen Methoden die Leistung im Vergleich zu anderen semi-überwachten Lernansätzen deutlich verbessern können.
Stats
Die Gesamtgenauigkeit (OA) der vorgeschlagenen Methoden liegt zwischen 88,51% und 88,97%.
Die Nutzergenauigkeit (UA) der vorgeschlagenen Methoden liegt zwischen 78,40% und 79,54%.
Die Erzeugergenauigkeit (PA) der vorgeschlagenen Methoden liegt zwischen 84,84% und 85,82%.
Die mittlere Schnittmenge über Vereinigung (mIoU) der vorgeschlagenen Methoden liegt zwischen 70,07% und 71,14%.
Der F1-Score der vorgeschlagenen Methoden liegt zwischen 81,29% und 82,08%.
Quotes
"Das Ziel des Artikels ist es, effiziente semi-überwachte Lernmethoden für die semantische Segmentierung von Fernerkundungsbildern zu entwickeln, indem die Präzision und Vielfalt der Pseudoetiketten während des Trainings erhöht werden."
"Die Grad-CAM-Analyse zeigt, dass die verschiedenen Netzwerke unterschiedliche und ergänzende Aufmerksamkeit auf dieselben Eingaben richten."