Core Concepts
SCAResNet ist ein verbessertes Rückgrat-Netzwerk, das die Kontextinformationen und Merkmale kleiner Objekte wie Verteilungstürme effektiv erfasst und die Leistung bei der Erkennung kleiner Objekte in Fernaufnahmen verbessert.
Abstract
Der Artikel stellt SCAResNet vor, ein verbessertes Rückgrat-Netzwerk für die Objekterkennung, das speziell für die Erkennung kleiner Objekte wie Übertragungs- und Verteilungstürme in Fernerkundungsbildern entwickelt wurde.
Die Autoren identifizieren zwei Hauptprobleme bei der Erkennung kleiner Objekte: Informationsverlust durch Bildvorverarbeitung (Resizing) und unzureichende Merkmalsextraktion. Um diese Probleme zu lösen, führen sie folgende Verbesserungen in das ResNet-Rückgrat ein:
Positional-Encoding Multi-Head Criss-Cross Attention: Erfasst Kontextinformationen und lernt aus mehreren Repräsentationsunterbereichen, um die Semantik von Verteilungstürmen anzureichern.
SPPRCSP-Modul: Ermöglicht die Verarbeitung von Merkmalen unterschiedlicher Größen und Skalen, ohne Genauigkeit zu verlieren oder den Rechenaufwand zu erhöhen.
Die Experimente auf dem ETDII-Datensatz zeigen, dass SCAResNet die Erkennungsleistung für kleine Objekte im Vergleich zu Basismodellen deutlich verbessert, insbesondere bei der Erkennung von Verteilungstürmen.
Stats
Die Größe der Objekte im ETDII-Datensatz verteilt sich wie folgt: 12.713 kleine Objekte (davon 6.342 kleiner oder gleich 20x20 Pixel), 4.723 mittlere Objekte und 367 große Objekte.
Quotes
Keine relevanten Zitate gefunden.