Conceitos Básicos
본 연구는 자기회귀 모델을 3D 도메인으로 확장하여 용량과 확장성을 동시에 향상시킴으로써 강력한 3D 모양 생성 능력을 달성하였다.
Resumo
본 논문은 3D 모양 생성을 위한 자기회귀 모델의 용량과 확장성 향상에 대해 다루고 있다.
- 데이터 측면:
- 다양한 공개 3D 데이터셋을 결합하여 약 90만 개의 3D 모양으로 구성된 Objaverse-Mix 데이터셋을 구축하였다.
- 데이터 전처리를 통해 메시, 포인트 클라우드, 볼륨, 렌더링 이미지, 텍스트 캡션 등 다양한 속성을 포함하도록 하였다.
- 모델 측면:
- 기존 자기회귀 모델의 한계인 높은 계산 비용과 불명확한 자기회귀 순서를 해결하기 위해 이산 표현 학습 기반의 Argus3D 모델을 제안하였다.
- Argus3D는 볼륨 그리드 대신 잠재 벡터에서 이산 표현 학습을 수행하여 계산 비용을 줄이고 기하학적 세부 사항을 보존할 수 있다.
- 또한 모델 규모를 확장하여 3.6억 개의 매개변수를 가진 대규모 모델을 구축하였다.
- 실험 결과:
- 4가지 생성 작업에서 Argus3D가 다양하고 정확한 3D 모양을 생성할 수 있음을 입증하였다.
- 대규모 모델 구축을 통해 3D 모양 생성 성능을 더욱 향상시켰다.
Estatísticas
본 연구에서는 약 100TB의 저장 공간을 사용하여 4주 동안 4대의 기계(각각 64코어 CPU와 8개의 A100 GPU)를 활용하여 데이터를 처리하였다.
데이터셋에는 약 90만 개의 3D 모양이 포함되어 있다.
Citações
"본 연구는 자기회귀 모델을 3D 도메인으로 확장하여 용량과 확장성을 동시에 향상시킴으로써 강력한 3D 모양 생성 능력을 달성하였다."
"Argus3D는 볼륨 그리드 대신 잠재 벡터에서 이산 표현 학습을 수행하여 계산 비용을 줄이고 기하학적 세부 사항을 보존할 수 있다."
"또한 모델 규모를 확장하여 3.6억 개의 매개변수를 가진 대규모 모델을 구축하였다."