Core Concepts
본 논문은 부호화된 거리 함수(SDF)를 활용하여 연속적이고 정확한 3D 장면 인식을 달성하는 비전 중심의 프레임워크 SurroundSDF를 제안한다. 또한 SDF 표현의 어려움을 해결하기 위해 샌드위치 Eikonal 방식이라는 새로운 약한 감독 기법을 소개한다.
Abstract
이 논문은 자율주행 시스템을 위한 비전 중심의 3D 환경 이해에 대해 다룬다. 기존의 3D 재구성 및 3D 인식 방법은 불연속적이거나 조잡한 3D 장면 표현에 한계가 있다. 이를 해결하기 위해 본 논문은 SDF(부호화된 거리 함수)를 활용하여 연속적이고 정확한 3D 장면 인식을 달성하는 SurroundSDF 프레임워크를 제안한다.
구체적으로:
SDF를 활용하여 3D 장면의 연속적인 표현과 정확한 장애물 표면 복원을 달성한다.
SDF 모델링의 어려움을 해결하기 위해 샌드위치 Eikonal 방식이라는 새로운 약한 감독 기법을 제안한다. 이 방식은 표면 양측에 정확하고 밀집된 제약을 가하여 기하학적 정확도와 연속성을 향상시킨다.
기하학과 의미론의 통합을 개선하는 새로운 손실 함수를 설계하여 일관성 있는 3D 장면 인식을 달성한다.
다양한 3D 표현(메쉬, 점유 voxel, 의미론적 재구성 메쉬)을 생성할 수 있다.
nuScenes 데이터셋에서 3D 의미론적 점유 예측 및 3D 장면 재구성 작업에서 SOTA 성능을 달성한다.
Stats
각 voxel 격자의 최소 SDF 값은 0.005의 임계값을 기준으로 "점유"로 간주된다.
최적의 SDF 임계값과 의미론적 mIoU가 최대가 되는 임계값이 크게 다르다.