OccRWKV는 3D 의미론적 점유 예측을 위한 효율적인 네트워크 구조를 제안합니다. 기존 네트워크가 의미론과 점유 예측을 함께 학습하는 것과 달리, OccRWKV는 이를 별도의 브랜치로 분리하여 각 도메인에 특화된 학습을 가능하게 합니다. 이를 통해 의미론적 정확도와 기하학적 특징의 상호보완적 특성을 효과적으로 활용할 수 있습니다.
OccRWKV는 Sem-RWKV, Geo-RWKV, BEV-RWKV 블록을 통해 장거리 의존성을 포착하여 예측 정확도를 높입니다. Sem-RWKV와 Geo-RWKV 블록은 각각 의미론적 특징과 기하학적 특징을 학습하며, BEV-RWKV 블록은 BEV 공간으로 특징을 투영하여 효율적인 특징 융합을 수행합니다. 이를 통해 실시간 추론이 가능하면서도 성능 저하를 최소화할 수 있습니다.
실험 결과, OccRWKV는 SemanticKITTI 벤치마크에서 최신 기술 대비 20배 빠른 속도(22.2 FPS)로 최고 수준의 성능(mIoU 25.1%)을 달성했습니다. 또한 실제 로봇 환경에 적용하여 내비게이션 효율성을 크게 향상시킬 수 있음을 확인했습니다.
翻譯成其他語言
從原文內容
arxiv.org
深入探究