Der Artikel präsentiert TTT-KD, ein neuartiges Test-Zeit-Trainingsverfahren für die Aufgabe der 3D-semantischen Segmentierung. Im Gegensatz zu herkömmlichen Methoden, die die Netzwerkgewichte einfrieren, passt TTT-KD die Gewichte individuell für jede Testprobe an, indem es Wissenstransfer von Grundlagenmodellen als selbstüberwachtes Hilfsziel nutzt.
Während des Trainings optimiert das Verfahren ein 3D-Rückgrat gleichzeitig für die Hauptaufgabe der semantischen Segmentierung und für den Wissenstransfer von einem 2D-Grundlagenmodell. Während der Testphase führt TTT-KD mehrere Gradientenabstiegsschritte auf der Wissenstransfer-Aufgabe durch, um die Netzwerkgewichte an die Testprobe anzupassen, bevor die endgültige Vorhersage erfolgt.
Die umfangreichen Evaluierungen auf mehreren Innen- und Außenraum-3D-Segmentierungsbenchmarks zeigen, dass TTT-KD die Leistung sowohl für in-Verteilung als auch für out-of-Verteilung Testdatensätze deutlich verbessert, mit Leistungssteigerungen von bis zu 13% mIoU (7% im Durchschnitt) für in-Verteilung und bis zu 45% (20% im Durchschnitt) für out-of-Verteilung. Darüber hinaus ist TTT-KD unabhängig vom verwendeten 3D-Rückgrat und kann mit verschiedenen Grundlagenmodellen eingesetzt werden.
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Lisa Weijler... lúc arxiv.org 03-19-2024
https://arxiv.org/pdf/2403.11691.pdfYêu cầu sâu hơn