Concepts de base
Das vorgeschlagene SDSTrack-Verfahren überträgt die Merkmalsextraktionsfähigkeit eines vortrainierten RGB-basierten Trackers effizient auf andere Modalitäten und fusioniert die multimodalen Merkmale auf symmetrische Weise. Darüber hinaus verbessert eine komplementäre maskierte Patch-Distillationsstrategie die Robustheit des Trackers in extremen Bedingungen.
Résumé
Die Studie präsentiert einen neuartigen Ansatz für die multimodale visuelle Objektverfolgung, genannt SDSTrack. Kernpunkte sind:
- Symmetrische multimodale Adaption (SMA):
- Adapter-basierte Feinabstimmung überträgt die Merkmalsextraktionsfähigkeit des vortrainierten RGB-Trackers effizient auf andere Modalitäten.
- Symmetrische Fusion der multimodalen Merkmale verhindert die Dominanz einer bestimmten Modalität.
- Komplementäre maskierte Patch-Distillation:
- Zufälliges komplementäres Maskieren der Patch-Einbettungen fördert die Exploration von Modalitätskomplementarität.
- Selbstdistillationslernen nutzt saubere Merkmale, um die Robustheit in extremen Bedingungen zu verbessern.
Die Experimente zeigen, dass SDSTrack den Stand der Technik in verschiedenen multimodalen Tracking-Szenarien übertrifft und beeindruckende Ergebnisse in extremen Bedingungen erzielt.
Stats
Die Verwendung von nur einer Modalität (ohne RGB oder ohne X-Modalität) führt zu einem deutlichen Leistungsrückgang bei asymmetrischen Trackern, während symmetrische Tracker wie SDSTrack relativ robuste Leistung zeigen.
SDSTrack übertrifft den vorherigen besten Tracker ViPT um 3,3% in F-Score für RGB-D-Tracking, 23,2% und 16,4% in Präzision und Erfolg für RGB-T-Tracking sowie 11,6% und 7,9% in Präzision und Erfolg für RGB-E-Tracking, wenn die RGB-Modalität fehlt.
Citations
"SDSTrack reduziert die Abhängigkeit von bestimmten Modalitäten bis zu einem gewissen Grad und ist daher in herausfordernderen Szenarien effektiv einsetzbar."
"Die Experimente zeigen, dass SDSTrack den Stand der Technik in verschiedenen multimodalen Tracking-Szenarien übertrifft und beeindruckende Ergebnisse in extremen Bedingungen erzielt."