이 논문은 다중 카메라 주행 장면 비디오 생성을 위한 WoVoGen 프레임워크를 소개합니다. WoVoGen은 두 단계로 작동합니다:
4D 세계 볼륨은 시간, 높이, 길이, 폭의 4차원으로 구성되며, 객체 점유, 고해상도 지도, 배경 정보, 도로 속성 등 장면에 대한 포괄적인 데이터를 포함합니다. 이를 통해 WoVoGen은 장면 내 일관성과 센서 간 일관성을 보장하며, 차량 제어 입력에 따른 고품질 주행 장면 비디오를 생성할 수 있습니다. 또한 장면 편집 작업도 가능합니다.
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Jiachen Lu,Z... في arxiv.org 03-20-2024
https://arxiv.org/pdf/2312.02934.pdfاستفسارات أعمق