이 논문은 효율적이고 안전한 자율 주행을 위해 필수적인 다른 교통 참여자의 움직임 예측 문제를 다룬다. 현재 고정밀 예측 모델은 학습 리소스 요구사항과 임베디드 하드웨어 배포에 어려움이 있다.
저자들은 새로운 효율적인 움직임 예측 모델(EMP)을 제안한다. EMP는 단일 GPU에서 몇 시간 만에 학습되며, 경량 아키텍처와 학습 리소스 감소에 초점을 맞추어 다양한 데이터셋에 쉽게 적용할 수 있다. 또한 낮은 추론 지연 시간으로 인해 제한된 컴퓨팅 리소스를 가진 자율 주행 애플리케이션에 적합하다.
EMP는 에이전트 기록, 도로 토폴로지, 장면 정보를 인코딩하기 위해 표준 트랜스포머 블록을 사용한다. 미래 궤적과 신뢰도 점수를 디코딩하기 위해 단순한 다층 퍼셉트론 기반 디코더와 정교한 트랜스포머 기반 디코더를 실험한다.
실험 결과, EMP는 Argoverse 2 벤치마크에서 경쟁력 있는 성과를 달성하며, 학습 시간과 추론 속도 면에서도 우수한 성능을 보인다. 특히 EMP-M 모델은 단일 NVIDIA V100 GPU에서 6시간 만에 학습되며, 다양한 GPU에서 빠른 추론 속도를 제공한다.
To Another Language
from source content
arxiv.org
Principais Insights Extraídos De
by Alexander Pr... às arxiv.org 09-25-2024
https://arxiv.org/pdf/2409.16154.pdfPerguntas Mais Profundas