이 논문은 단일 이미지에서 복잡한 3D 장면을 재구성하는 방법을 제안합니다. 먼저 장면을 전체적으로 처리하여 깊이 정보와 의미론적 정보를 추출합니다. 그런 다음 개별 구성 요소에 대한 단일 샷 객체 수준 방법을 활용하여 상세한 재구성을 수행합니다. 이러한 구성적 처리 접근 방식을 통해 전체 프레임워크는 단일 이미지에서 복잡한 3D 장면을 완전히 재구성할 수 있습니다. 이 방법은 개별 모듈을 신중하게 통합하여 엔드-투-엔드 학습을 요구하지 않도록 설계되었습니다. 이를 통해 향후 방법이 개선됨에 따라 파이프라인이 자연스럽게 발전할 수 있습니다. 합성 및 실제 장면에 대한 실험 결과를 통해 제안된 접근 방식의 재구성 성능을 입증합니다.
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Andr... lúc arxiv.org 04-05-2024
https://arxiv.org/pdf/2404.03421.pdfYêu cầu sâu hơn