자율주행을 위한 일반화된 예측 모델
본 연구는 자율주행 분야에서 최초로 대규모 비디오 예측 모델을 소개합니다. 데이터 수집의 제한을 극복하고 모델의 일반화 능력을 향상시키기 위해 웹에서 대량의 데이터를 수집하고 다양하고 고품질의 텍스트 설명과 함께 제공합니다. 제안된 GenAD 모델은 새로운 시간적 추론 블록을 활용하여 운전 장면의 복잡한 역학을 다룰 수 있으며, 다양한 미관찰 운전 데이터셋에 대해 제로샷 일반화를 달성할 수 있습니다. 또한 GenAD는 액션 조건부 예측 모델 또는 모션 플래너로 적용될 수 있어 실제 운전 애플리케이션에 큰 잠재력을 가지고 있습니다.