Concepts de base
Gamba는 3D 가우시안 스플래팅과 Mamba 기반 순차적 네트워크를 결합하여 단일 이미지에서 효율적이고 고품질의 3D 자산을 생성합니다.
Résumé
이 기술 보고서는 단일 이미지에서 효율적으로 3D 자산을 생성하는 Gamba 모델을 소개합니다. Gamba는 다음과 같은 두 가지 핵심 통찰을 바탕으로 합니다:
- 3D 표현: 효율적인 3D 가우시안 스플래팅 프로세스를 위해 많은 수의 3D 가우시안을 활용합니다.
- 백본 설계: 문맥 의존적 추론과 토큰 길이에 따른 선형 확장성을 가능하게 하는 Mamba 기반 순차 네트워크를 도입합니다.
Gamba는 데이터 전처리, 정규화 설계, 훈련 방법론 등에서 상당한 발전을 이루었습니다. 실제 스캔된 OmniObject3D 데이터셋을 사용하여 Gamba를 평가한 결과, 기존 최적화 기반 및 피드포워드 3D 생성 접근법과 비교하여 품질과 속도 면에서 모두 경쟁력 있는 성능을 보여줍니다. 특히 Gamba는 단일 NVIDIA A100 GPU에서 약 0.6초 만에 3D 자산을 생성할 수 있습니다.
Stats
단일 NVIDIA A100 GPU에서 Gamba는 약 0.6초 만에 3D 자산을 생성할 수 있습니다.
Gamba는 기존 최적화 기반 및 피드포워드 3D 생성 접근법보다 5000배 빠른 속도를 보입니다.
Citations
"Gamba는 3D 가우시안 스플래팅과 Mamba 기반 순차적 네트워크를 결합하여 단일 이미지에서 효율적이고 고품질의 3D 자산을 생성합니다."
"Gamba는 단일 NVIDIA A100 GPU에서 약 0.6초 만에 3D 자산을 생성할 수 있습니다."