Der Artikel beschreibt eine selbstüberwachte Lernmethode zur Anpassung eines eingefrorenen Grundmodells für die standortübergreifende visuelle Geolokalisierung. Die Kernpunkte sind:
Herausforderungen bei der standortübergreifenden visuellen Geolokalisierung ohne Referenzbilder: Beziehungen in unmarkierten Daten herstellen und Unterschiede zwischen unsicheren Abfragen und Referenzen überbrücken.
Vorschlag eines selbstüberwachten Anpassungsframeworks, das einen lernfähigen Adapter für ein eingefrorenes Grundmodell trainiert. Der Adapter soll die Merkmalsverteilungen aus verschiedenen Ansichten in einen einheitlichen Raum abbilden, ohne auf gekennzeichnete Daten angewiesen zu sein.
Einführung eines Erwartungs-Maximierungs-basierten Pseudo-Labeling-Moduls, um iterativ Zuordnungen zwischen standortübergreifenden Merkmalen zu schätzen und den Adapter zu optimieren.
Einbau eines Informationskonsistenzmoduls, um die Robustheit der Merkmalsdarstellung des Grundmodells zu erhalten.
Experimente zeigen, dass der Ansatz die Leistung des Grundmodells deutlich verbessert und mit überwachten Methoden vergleichbare Genauigkeit erreicht, bei geringeren Trainingsparametern und ohne gekennzeichnete Daten.
toiselle kielelle
lähdeaineistosta
arxiv.org
Tärkeimmät oivallukset
by Haoyuan Li,C... klo arxiv.org 03-20-2024
https://arxiv.org/pdf/2403.12702.pdfSyvällisempiä Kysymyksiä