Die Studie befasst sich mit der Infrarot-Kleinziel-Erkennung (IRSTD), einer wichtigen Aufgabe in der Bildverarbeitung mit vielen Anwendungen. Bestehende Deep-Learning-basierte Methoden konzentrieren sich hauptsächlich auf die Entwicklung komplexer Modellstrukturen zur Merkmalsextraktion, vernachlässigen aber die Verlustfunktionen, die für die IRSTD-Aufgabe unzureichend sind.
Die Autoren schlagen eine neuartige Skalierungs- und Positionsempfindliche (SLS) Verlustfunktion vor, um die Beschränkungen bestehender Verlustfunktionen wie IoU und Dice zu überwinden. Die SLS-Verlustfunktion hat zwei Komponenten:
Darüber hinaus wird ein einfacher Multi-Skalen-Kopf in das U-Net-Modell (MSHNet) eingeführt, der mehrere Skalenvorhersagen für jede Eingabe erzeugt. Durch Anwendung der SLS-Verlustfunktion auf verschiedene Skalen übertrifft MSHNet den aktuellen Stand der Technik deutlich, ohne auf komplexe Strukturen zurückgreifen zu müssen.
Die Experimente zeigen, dass MSHNet eine bessere Balance zwischen Erkennungsleistung, Rechenaufwand und Inferenzzeit erreicht als andere Methoden. Darüber hinaus kann die Erkennungsleistung bestehender Detektoren durch Anwendung der SLS-Verlustfunktion weiter verbessert werden, was die Effektivität und Allgemeingültigkeit der vorgeschlagenen Verlustfunktion demonstriert.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Qiankun Liu,... at arxiv.org 03-29-2024
https://arxiv.org/pdf/2403.19366.pdfDeeper Inquiries