Alapfogalmak
TAMM verbessert die 3D-Formverständnis durch effektive Nutzung von Bild- und Textdaten.
Statisztikák
ULIP schafft Triplets aus 3D-Punktwolken, 2D-Bildern und Texten.
TAMM verbessert die Null-Schuss-Klassifizierungsgenauigkeit auf Objaverse-LVIS von 46,8% auf 50,7%.
TAMM verbessert die lineare Sondierungsklassifikationsgenauigkeit auf ModelNet40 von 96,1% auf 99,0%.
Idézetek
"Unser TriAdapter Multi-Modal Learning (TAMM) verbessert signifikant das 3D-Formverständnis."
"TAMM nutzt die Bildmodalität besser aus und bringt mehr Gewinne beim Lernen aus Bild- und Textdaten."