본 논문은 3D 의미 분할 작업에서 희소 CNN이 포인트 변환기를 능가할 수 있음을 보여줍니다. 이를 위해 다음과 같은 핵심 내용을 제안합니다:
공간적으로 적응형 수용 영역: 3D 장면의 다양한 기하학적 구조와 외관에 맞춰 수용 영역 크기를 동적으로 조절합니다. 이를 위해 다중 스케일 피라미드 그리드 분할과 적응형 집계기를 도입합니다.
적응형 관계 매핑: 효율적인 다중-일-다 패러다임을 통해 각 비어있지 않은 voxel과 중심 voxel 간의 관계를 동적으로 모델링합니다. 이를 통해 CNN 기반 모델에서도 복잡한 관계를 학습할 수 있습니다.
옴니-적응형 3D CNN (OA-CNN) 아키텍처: 위 두 가지 핵심 모듈을 통합한 OA-CNN 모델을 제안합니다. 실험 결과, OA-CNN은 포인트 변환기 모델을 정확도와 효율성 측면에서 모두 능가합니다.
본 연구는 희소 CNN이 포인트 변환기를 능가할 수 있음을 보여주며, 이를 위한 핵심 설계 요소를 제안합니다. 이는 3D 인식 분야에서 중요한 발견이 될 것으로 기대됩니다.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문