Core Concepts
LiDAR 센맥 세그멘테이션에서 발생하는 "many-to-one" 문제를 해결하기 위해 시간적 정보를 활용하는 TFNet 모델을 제안한다.
Abstract
이 논문은 LiDAR 센맥 세그멘테이션에서 발생하는 "many-to-one" 문제를 해결하기 위한 TFNet 모델을 제안한다.
"many-to-one" 문제는 LiDAR 데이터의 수평 및 수직 각도 해상도 제한으로 인해 발생하며, 이로 인해 약 20%의 3D 포인트가 가려지게 된다. 이 문제를 해결하기 위해 TFNet은 다음과 같은 방법을 사용한다:
시간적 융합 레이어를 통해 이전 스캔의 유용한 정보를 추출하고 현재 스캔과 통합한다.
최대 투표 기반의 후처리 기법을 통해 잘못된 예측, 특히 "many-to-one" 문제로 인한 예측을 보정한다.
실험 결과, TFNet은 SemanticKITTI와 SemanticPOSS 벤치마크에서 우수한 성능을 보였으며, 다양한 네트워크에 적용할 수 있는 범용성을 입증했다. 특히 작은 객체 클래스에서 강점을 보였다.
Stats
3D 포인트 중 약 20%가 "many-to-one" 문제로 인해 가려진다.
이 문제를 해결하지 않으면 성능이 약 6.1% 하락한다.
Quotes
"LiDAR 센맥 세그멘테이션은 로봇과 자율주행 차량이 주변 환경을 정확하고 강건하게 이해할 수 있게 해준다."
"range-image 기반 기술은 효율성 때문에 실용적 응용 분야에서 널리 채택되고 있다."
"우리는 시간적 정보를 활용하여 'many-to-one' 문제를 해결하고자 한다."