이 논문은 단일 RGB-D 이미지에서 다중 물체의 완전한 3D 형상을 빠르고 정확하게 복원하는 방법을 제안한다. 기존 연구들은 단일 물체 3D 형상 완성에 초점을 맞추었지만, 복잡한 실세계 다중 물체 장면에서의 고품질 복원은 여전히 과제로 남아있다.
이를 해결하기 위해 저자들은 Octree U-Net과 잠재 3D MAE를 결합한 OctMAE 아키텍처를 제안한다. Octree U-Net은 지역적 기하학적 추론을, 잠재 3D MAE는 전역적 기하학적 추론을 수행하여 고품질이면서도 실시간에 가까운 다중 물체 형상 완성을 달성한다.
또한 저자들은 12,000개의 다양한 3D 물체 모델을 활용하여 대규모 사실적 데이터셋을 구축하였다. 실험 결과, 제안 방법은 합성 및 실세계 데이터셋에서 현재 최고 성능을 보이며, 제로샷 일반화 능력도 우수한 것으로 나타났다.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Shun Iwase,K... at arxiv.org 03-22-2024
https://arxiv.org/pdf/2403.14628.pdfDeeper Inquiries