Der Artikel präsentiert TTT-KD, ein neuartiges Test-Zeit-Trainingsverfahren für die Aufgabe der 3D-semantischen Segmentierung. Im Gegensatz zu herkömmlichen Methoden, die die Netzwerkgewichte einfrieren, passt TTT-KD die Gewichte individuell für jede Testprobe an, indem es Wissenstransfer von Grundlagenmodellen als selbstüberwachtes Hilfsziel nutzt.
Während des Trainings optimiert das Verfahren ein 3D-Rückgrat gleichzeitig für die Hauptaufgabe der semantischen Segmentierung und für den Wissenstransfer von einem 2D-Grundlagenmodell. Während der Testphase führt TTT-KD mehrere Gradientenabstiegsschritte auf der Wissenstransfer-Aufgabe durch, um die Netzwerkgewichte an die Testprobe anzupassen, bevor die endgültige Vorhersage erfolgt.
Die umfangreichen Evaluierungen auf mehreren Innen- und Außenraum-3D-Segmentierungsbenchmarks zeigen, dass TTT-KD die Leistung sowohl für in-Verteilung als auch für out-of-Verteilung Testdatensätze deutlich verbessert, mit Leistungssteigerungen von bis zu 13% mIoU (7% im Durchschnitt) für in-Verteilung und bis zu 45% (20% im Durchschnitt) für out-of-Verteilung. Darüber hinaus ist TTT-KD unabhängig vom verwendeten 3D-Rückgrat und kann mit verschiedenen Grundlagenmodellen eingesetzt werden.
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Lisa Weijler... alle arxiv.org 03-19-2024
https://arxiv.org/pdf/2403.11691.pdfDomande più approfondite