Core Concepts
제한된 라벨링 데이터를 활용하여 LiDAR 점군의 의미 분할 성능을 향상시키는 것이 핵심 아이디어이다.
Abstract
이 논문은 LiDAR 점군 의미 분할을 위한 약한 감독 학습 방법을 제안한다. 기존의 LiDAR 의미 분할 방법은 충분한 라벨링 데이터가 필요하지만, 이는 많은 시간과 비용이 소요된다. 이를 해결하기 위해 저자들은 다음과 같은 접근 방식을 제안한다:
이미지에 산발적인 라벨링을 수행하고, SAM (파운데이션 모델)을 활용하여 이미지의 의미 분할 결과를 생성한다. 이를 통해 LiDAR 점군에 대한 의사 라벨을 생성한다.
생성된 의사 라벨의 오류를 완화하기 위해 이미지 특징과 LiDAR 특징을 융합하는 멀티모달 네트워크 (MM-ScatterNet)를 제안한다. 이를 통해 점군 특징 표현을 향상시킨다.
테스트 시에는 LiDAR 데이터만을 입력으로 사용하여 단일 모달 예측을 수행한다.
실험 결과, 제안 방법은 SemanticKITTI 데이터셋에서 완전 감독 학습 대비 66%의 성능을, NuScenes 데이터셋에서 95%의 성능을 달성했다. 이는 기존 방법 대비 큰 성능 향상을 보여준다.
Stats
LiDAR 점군의 0.02%만을 사용해도 SemanticKITTI 데이터셋에서 완전 감독 학습 대비 66%의 성능을 달성할 수 있다.
LiDAR 점군의 0.1%만을 사용해도 NuScenes 데이터셋에서 완전 감독 학습 대비 95%의 성능을 달성할 수 있다.
Quotes
"LiDAR 점군 의미 분할은 충분한 라벨링 데이터가 필요하지만, 이는 많은 시간과 비용이 소요된다."
"제안 방법은 SemanticKITTI 데이터셋에서 완전 감독 학습 대비 66%의 성능을, NuScenes 데이터셋에서 95%의 성능을 달성했다."