이 논문은 단일 RGB-D 이미지에서 다중 물체의 완전한 3D 형상을 빠르고 정확하게 복원하는 방법을 제안한다. 기존 연구들은 단일 물체 3D 형상 완성에 초점을 맞추었지만, 복잡한 실세계 다중 물체 장면에서의 고품질 복원은 여전히 과제로 남아있다.
이를 해결하기 위해 저자들은 Octree U-Net과 잠재 3D MAE를 결합한 OctMAE 아키텍처를 제안한다. Octree U-Net은 지역적 기하학적 추론을, 잠재 3D MAE는 전역적 기하학적 추론을 수행하여 고품질이면서도 실시간에 가까운 다중 물체 형상 완성을 달성한다.
또한 저자들은 12,000개의 다양한 3D 물체 모델을 활용하여 대규모 사실적 합성 데이터셋을 구축하였다. 실험 결과, 제안 방법은 기존 최신 기술 대비 합성 및 실제 데이터셋에서 모두 우수한 성능을 보였으며, 제로샷 일반화 능력도 강력한 것으로 나타났다.
toiselle kielelle
lähdeaineistosta
arxiv.org
Tärkeimmät oivallukset
by Shun Iwase,K... klo arxiv.org 03-22-2024
https://arxiv.org/pdf/2403.14628.pdfSyvällisempiä Kysymyksiä