Core Concepts
라이다 레인지 이미지의 반복적인 토큰 샘플링과 VQ-VAE를 통한 레인지 이미지 및 레이드롭 마스크 생성을 통해 현실적인 라이다 포인트 클라우드를 생성한다.
Abstract
이 논문은 라이다 포인트 클라우드 생성을 위한 새로운 모델인 LidarGRIT를 소개한다. LidarGRIT는 다음과 같은 특징을 가진다:
레인지 이미지 표현을 사용하여 효율적인 처리와 이미지 생성 모델과의 호환성을 확보한다.
레인지 이미지를 토큰화하고 자기회귀 트랜스포머를 통해 토큰 간 상호작용을 모델링하여 점진적인 생성을 수행한다.
VQ-VAE를 사용하여 레인지 이미지와 레이드롭 마스크를 별도로 생성하고, 레이드롭 손실 함수를 도입하여 레이드롭 노이즈를 정확하게 모델링한다.
기하학적 보존 기법을 제안하여 VQ-VAE의 일반화 성능을 높인다.
실험 결과, LidarGRIT는 KITTI-360 및 KITTI 주행 데이터셋에서 SOTA 모델들을 능가하는 성능을 보였다. 특히 이미지 기반 메트릭에서 큰 향상을 보였는데, 이는 레이드롭 노이즈의 더 현실적인 생성 덕분이다.
Stats
레인지 이미지 크기는 KITTI-360의 경우 64 x 1024, KITTI 주행의 경우 64 x 256이다.