단일 RGB 입력 이미지로부터 다중 뷰 RGB-D 이미지를 생성하여 3D 정보를 추론하는 방법을 제안한다. 깊이 정보 기반의 다중 뷰 일관성 메커니즘을 통해 보다 정확하고 다양한 3D 출력을 생성할 수 있다.
Gamba는 3D 가우시안 스플래팅과 Mamba 기반 순차적 네트워크를 결합하여 단일 이미지에서 효율적이고 고품질의 3D 자산을 생성합니다.