핵심 개념
LiDAR 센맥 세그멘테이션 작업에서 클래스 불균형과 콜드 스타트 문제를 해결하기 위해 크기 기반 웜 스타트 액티브 러닝 방법을 제안한다.
초록
이 논문은 LiDAR 센맥 세그멘테이션 작업에서 발생하는 두 가지 문제를 다룬다. 첫째, 기존 액티브 러닝 방법들이 LiDAR 센맥 세그멘테이션 데이터셋의 심각한 클래스 불균형을 간과한다는 점이다. 둘째, 레이블된 데이터가 없는 상황에서 초기 모델을 학습하기 위해 무작위로 선택된 데이터 샘플을 사용하는데, 이로 인해 성능이 낮다는 점이다. 이를 해결하기 위해 저자들은 BaSAL이라는 크기 균형 웜 스타트 액티브 러닝 모델을 제안한다.
BaSAL은 다음과 같은 특징을 가진다:
- 각 객체 클래스의 크기 특성을 관찰하여, 크기 기반 샘플링을 통해 클래스 균형이 잡힌 데이터셋을 생성한다.
- 사전 학습된 모델이 필요 없는 크기 기반 샘플링을 통해 콜드 스타트 문제를 해결한다.
- 기존의 정보 측정 방법(엔트로피, CoreSet)과 결합하여 성능을 향상시킨다.
실험 결과, BaSAL은 SemanticKITTI 데이터셋에서 전체 데이터셋을 사용한 완전 지도 학습 성능과 유사한 수준을 달성하면서도 레이블된 데이터의 5%만을 사용했다. 또한 nuScenes 데이터셋에서도 기존 최신 방법과 유사한 성능을 보였다.
통계
전체 SemanticKITTI 데이터셋에서 자전거 클래스는 0.01%, 오토바이 클래스는 0.05%만을 차지한다.
자전거 클래스의 경우 제안 모델이 기존 방법 대비 20% 이상 높은 성능을 보였다.
자전거 타는 사람 클래스의 경우 제안 모델이 기존 방법 대비 약 10% 높은 성능을 보였다.
인용구
"LiDAR 센맥 세그멘테이션 작업의 성능은 일반적으로 mIoU 지표로 측정되는데, 이는 모든 클래스에 동일한 가중치를 부여한다. 그러나 클래스 불균형이 심각하기 때문에, 모델은 드문 클래스의 포인트 수가 적어 일반적으로 낮은 성능을 보인다."
"크기 기반 샘플링은 사전 학습된 모델이 필요 없기 때문에, 액티브 러닝의 첫 번째 반복에서도 쉽게 적용할 수 있다. 이를 통해 콜드 스타트 문제를 효과적으로 해결할 수 있다."