Concetti Chiave
SHAPELLM ist ein 3D-Multimodal-Large-Language-Model, das auf einem verbesserten 3D-Encoder basiert und eine universelle 3D-Objektverständnis mit 3D-Punktwolken und Sprachen erforscht.
Statistiche
RECON++ hat eine bemerkenswerte Genauigkeit von 95,25% auf dem anspruchsvollsten ScanObjectNN PB T50 RS Benchmark erreicht.
SHAPELLM-13B erreichte auf dem 3D MM-Vet-Benchmark eine Gesamtgenauigkeit von 53,1%.
Citazioni
"SHAPELLM demonstriert eine bemerkenswerte Fähigkeit zur 3D-Objekterkennung und zum Verständnis von Interaktionen."