核心概念
제안된 LiDAR 확산 모델(LiDM)은 곡선 구조와 3D 기하학을 보존하여 실제 LiDAR 데이터와 유사한 장면을 생성할 수 있으며, 다양한 입력 조건(레이아웃, 카메라 뷰, 텍스트 등)을 활용할 수 있다.
摘要
이 논문은 LiDAR 장면 생성을 위한 새로운 확산 모델인 LiDAR 확산 모델(LiDM)을 제안한다. LiDM은 실제 LiDAR 데이터와 유사한 패턴과 기하학을 보존하기 위해 곡선 압축, 포인트 좌표 감독, 패치 기반 인코딩 등의 기술을 도입한다. 또한 LiDM은 레이아웃, 카메라 뷰, 텍스트 등 다양한 입력 조건을 활용할 수 있다. 실험 결과, LiDM은 기존 방법 대비 향상된 성능을 보이며, 특히 조건부 LiDAR 장면 생성에서 최신 기술 수준을 달성했다. 또한 LiDM은 기존 포인트 기반 모델 대비 107배 빠른 속도를 보인다.
統計資料
LiDM은 기존 포인트 기반 모델 대비 107배 빠른 속도를 보인다.
LiDM은 조건부 LiDAR 장면 생성에서 최신 기술 수준을 달성했다.
引述
"LiDMs are capable of processing arbitrary conditions, such as bounding boxes, camera images, and semantic maps."
"To grasp the semantic and conceptual essence of LiDAR scenes during the diffusion process, our approach leverages encoded points of LiDAR scenes into a perceptually equivalent latent space before the diffusion process."
"Augmented by these proposed modules, the resulting perceptual space enables DMs to efficiently synthesize high-quality LiDAR scenes (cf. Fig. 1), while also exhibiting superior performance with a ×107 speedup compared to point-based DMs (assessed on one NVIDIA RTX 3090), and supporting arbitrary types of image-based and token-based conditions."