Основные понятия
ODTFormer는 스테레오 카메라 이미지를 활용하여 효율적으로 장애물을 탐지하고 추적하는 모델입니다. 3D 비용 볼륨 구축을 위한 변형 가능한 어텐션 메커니즘과 프레임 간 점유 격자 매칭을 통해 정확하고 빠른 장애물 인식 및 추적이 가능합니다.
Аннотация
이 논문은 로봇 자율 주행을 위한 장애물 탐지 및 추적 문제를 다룹니다. 기존 접근법의 한계를 극복하기 위해 ODTFormer라는 Transformer 기반 모델을 제안합니다.
장애물 탐지 모듈:
- 스테레오 이미지에서 다중 스케일 특징을 추출하고, 3D 비용 볼륨을 구축하기 위해 변형 가능한 어텐션을 사용합니다.
- 이렇게 구축된 비용 볼륨을 U-Net 디코더를 통해 점유 격자로 점진적으로 출력합니다.
장애물 추적 모듈:
- 연속 프레임 간 점유 격자를 매칭하여 장애물의 3D 움직임을 추정합니다.
- 물리적 제약을 고려하여 효율적이고 정확한 추적이 가능합니다.
실험 결과, ODTFormer는 기존 접근법 대비 장애물 탐지 및 추적 성능이 우수하며, 계산 효율성 또한 크게 향상되었습니다.
Статистика
장애물 탐지 시 15m 범위에서 IoU 84.64%, 30m 범위에서 IoU 74.72%를 달성했습니다.
장애물 추적 시 평균 오차(EPE)는 0.021m, 전경 오차는 1.11m였습니다.
전체 모델은 RTX A5000 GPU에서 20fps의 속도로 동작합니다.
Цитаты
"ODTFormer는 스테레오 카메라 이미지를 활용하여 효율적으로 장애물을 탐지하고 추적하는 모델입니다."
"3D 비용 볼륨 구축을 위한 변형 가능한 어텐션 메커니즘과 프레임 간 점유 격자 매칭을 통해 정확하고 빠른 장애물 인식 및 추적이 가능합니다."