Grunnleggende konsepter
Eine neuartige Skalierungs- und Positionsempfindliche (SLS) Verlustfunktion wird entwickelt, um die Beschränkungen bestehender Verlustfunktionen wie IoU und Dice zu überwinden. Zusammen mit einem einfachen Multi-Skalen-Kopf für das U-Net-Modell (MSHNet) wird eine leistungsfähige Infrarot-Kleinziel-Erkennungsmethode vorgestellt, die den aktuellen Stand der Technik deutlich übertrifft.
Sammendrag
Die Studie befasst sich mit der Infrarot-Kleinziel-Erkennung (IRSTD), einer wichtigen Aufgabe in der Bildverarbeitung mit vielen Anwendungen. Bestehende Deep-Learning-basierte Methoden konzentrieren sich hauptsächlich auf die Entwicklung komplexer Modellstrukturen zur Merkmalsextraktion, vernachlässigen aber die Verlustfunktionen, die für die IRSTD-Aufgabe unzureichend sind.
Die Autoren schlagen eine neuartige Skalierungs- und Positionsempfindliche (SLS) Verlustfunktion vor, um die Beschränkungen bestehender Verlustfunktionen wie IoU und Dice zu überwinden. Die SLS-Verlustfunktion hat zwei Komponenten:
- Skalierungsempfindlichkeit: Ein Gewicht für den IoU-Verlust wird basierend auf den vorhergesagten und tatsächlichen Skalierungen der Ziele berechnet, um dem Detektor zu helfen, Ziele mit unterschiedlichen Skalierungen zu unterscheiden.
- Positionsempfindlichkeit: Ein Strafterm basierend auf den Mittelpunkten der Ziele wird eingeführt, um den Detektor dabei zu unterstützen, die Ziele präziser zu lokalisieren.
Darüber hinaus wird ein einfacher Multi-Skalen-Kopf in das U-Net-Modell (MSHNet) eingeführt, der mehrere Skalenvorhersagen für jede Eingabe erzeugt. Durch Anwendung der SLS-Verlustfunktion auf verschiedene Skalen übertrifft MSHNet den aktuellen Stand der Technik deutlich, ohne auf komplexe Strukturen zurückgreifen zu müssen.
Die Experimente zeigen, dass MSHNet eine bessere Balance zwischen Erkennungsleistung, Rechenaufwand und Inferenzzeit erreicht als andere Methoden. Darüber hinaus kann die Erkennungsleistung bestehender Detektoren durch Anwendung der SLS-Verlustfunktion weiter verbessert werden, was die Effektivität und Allgemeingültigkeit der vorgeschlagenen Verlustfunktion demonstriert.
Statistikk
Die Erkennungswahrscheinlichkeit (Pd) von MSHNet beträgt 93,88% auf dem IRSTD-1k-Datensatz.
Die falsche Alarmrate (Fa) von MSHNet beträgt 15,03 × 10^-6 auf dem IRSTD-1k-Datensatz.
Die Überlappung über Vereinigung (IoU) von MSHNet beträgt 67,16% auf dem IRSTD-1k-Datensatz.
Sitater
"Unsere SLS-Verlustfunktion produziert unterschiedliche Verlustwerteauch für Vorhersagen mit der gleichen räumlichen Anordnung, was darauf hindeutet, dass Ziele mit unterschiedlichen Skalen vom Detektor unterschiedliche Aufmerksamkeit erhalten können, was zu einer insgesamt besseren Erkennungsleistung führt."
"Durch Anwendung unserer SLS-Verlustfunktion auf verschiedene Skalen der Vorhersagen können Ziele unterschiedlicher Skalen vom Detektor unterschiedliche Aufmerksamkeit erhalten, was zu einer insgesamt besseren Erkennungsleistung führt."