ULIP-2는 대규모 멀티모달 모델을 활용하여 3D 객체에 대한 포괄적인 언어 설명을 자동으로 생성함으로써, 3D 데이터셋의 언어 설명 품질 및 확장성 문제를 해결합니다. 이를 통해 효율적인 멀티모달 사전 학습 프레임워크와 결합하여 3D 객체 분류 작업에서 기존 방법들을 크게 개선합니다.