실제 세계 인식 입력을 사용한 모션 예측에서 엔드 투 엔드 방식과 전통적 방식의 비교
본 논문에서는 골격 데이터와 텍스트 설명을 결합하여 장기 모션 예측의 정확도를 향상시키고 불확실성을 정량화하는 새로운 다중 모달 확산 모델(MDMP)을 제안합니다.
DeMo는 미래 궤적의 방향 의도를 나타내는 모드 쿼리와 시간에 따른 동적 상태를 추적하는 상태 쿼리로 분리하여, 보다 정확하고 일관된 다중 모드 궤적 예측을 가능하게 합니다.
본 논문에서는 자율주행에서 중요한 과제인 모션 예측을 현실적인 연속 주행 상황에서 다루는 새로운 프레임워크인 RealMotion을 제안합니다. 이 프레임워크는 장면 컨텍스트 스트림과 에이전트 궤적 스트림이라는 두 가지 주요 구성 요소를 통해 시간에 따른 상황 정보와 예측된 에이전트 모션 상태를 순차적으로 활용하여 기존 방법보다 정확하고 효율적인 모션 예측을 가능하게 합니다.