Die Studie befasst sich mit der Infrarot-Kleinziel-Erkennung (IRSTD), einer wichtigen Aufgabe in der Bildverarbeitung mit vielen Anwendungen. Bestehende Deep-Learning-basierte Methoden konzentrieren sich hauptsächlich auf die Entwicklung komplexer Modellstrukturen zur Merkmalsextraktion, vernachlässigen aber die Verlustfunktionen, die für die IRSTD-Aufgabe unzureichend sind.
Die Autoren schlagen eine neuartige Skalierungs- und Positionsempfindliche (SLS) Verlustfunktion vor, um die Beschränkungen bestehender Verlustfunktionen wie IoU und Dice zu überwinden. Die SLS-Verlustfunktion hat zwei Komponenten:
Darüber hinaus wird ein einfacher Multi-Skalen-Kopf in das U-Net-Modell (MSHNet) eingeführt, der mehrere Skalenvorhersagen für jede Eingabe erzeugt. Durch Anwendung der SLS-Verlustfunktion auf verschiedene Skalen übertrifft MSHNet den aktuellen Stand der Technik deutlich, ohne auf komplexe Strukturen zurückgreifen zu müssen.
Die Experimente zeigen, dass MSHNet eine bessere Balance zwischen Erkennungsleistung, Rechenaufwand und Inferenzzeit erreicht als andere Methoden. Darüber hinaus kann die Erkennungsleistung bestehender Detektoren durch Anwendung der SLS-Verlustfunktion weiter verbessert werden, was die Effektivität und Allgemeingültigkeit der vorgeschlagenen Verlustfunktion demonstriert.
Ke Bahasa Lain
dari konten sumber
arxiv.org
Wawasan Utama Disaring Dari
by Qiankun Liu,... pada arxiv.org 03-29-2024
https://arxiv.org/pdf/2403.19366.pdfPertanyaan yang Lebih Dalam