RoadFormer는 다음과 같은 주요 구성 요소로 이루어져 있습니다:
이종 특징 추출을 위한 듀플렉스 인코더: RGB 이미지와 표면 법선 정보에서 각각 특징을 추출합니다.
이종 특징 융합 및 재조정 블록(HFSB): 자기 주의 메커니즘을 활용하여 추출된 이종 특징을 효과적으로 융합하고 재조정합니다.
픽셀 디코더: 재조정된 다중 스케일 특징 맵에서 장거리 의존성을 학습합니다.
Transformer 디코더: 픽셀 디코더의 출력을 활용하여 최종 의미론적 예측을 수행합니다.
RoadFormer는 기존 단일 모달 및 데이터 융합 네트워크에 비해 우수한 성능을 보입니다. 특히 KITTI 도로 벤치마크에서 1위를 달성했습니다. 또한 RoadFormer는 도로 결함 탐지를 포함한 포괄적인 도로 장면 분석을 위해 새로 구축한 SYN-UDTIRI 데이터셋에서도 우수한 성능을 보였습니다.
In eine andere Sprache
aus dem Quellinhalt
arxiv.org
Wichtige Erkenntnisse aus
by Jiahang Li,Y... um arxiv.org 04-15-2024
https://arxiv.org/pdf/2309.10356.pdfTiefere Fragen