이 논문은 자율주행 차량의 지각 스택에서 중요한 역할을 하는 컴퓨터 비전 기술에 대해 다룬다. 3D LiDAR 센서는 3D 점군 데이터를 수집하는 데 널리 사용되지만, 이러한 시스템은 인간 지각에 비해 희소한 점군 데이터에서 보이지 않는 부분을 추론하는 데 어려움을 겪는다. 장면 완성 작업은 LiDAR 측정의 간극을 예측하여 더 완전한 장면 표현을 달성하는 것을 목표로 한다.
저자들은 이미지에 대한 최근 확산 모델의 우수한 성과에 착안하여 단일 3D LiDAR 스캔에서 장면 완성을 달성하기 위해 이를 확장하였다. 이전 연구에서는 LiDAR 데이터에서 추출한 범위 이미지에 대해 이미지 기반 확산 방법을 직접 적용했지만, 저자들은 점 단위로 직접 작동하는 확산 과정을 제안한다. 또한 확산 과정 중 예측된 노이즈를 안정화하기 위한 정규화 손실을 제안한다.
실험 평가 결과, 제안 방법은 단일 LiDAR 스캔을 입력으로 받아 더 많은 세부 정보를 포함하는 장면을 생성할 수 있음을 보여준다. 저자들은 제안한 확산 과정 공식화가 점군 데이터에 적용되는 확산 모델 연구를 지원할 수 있을 것으로 믿는다.
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Lucas Nunes,... a las arxiv.org 03-21-2024
https://arxiv.org/pdf/2403.13470.pdfConsultas más profundas