核心概念
본 연구는 사전 학습된 그래프 주의 집중 네트워크 기반의 일반화된 교통 장면 이해 모델 PreGSU를 제안한다. PreGSU는 마스크된 도로 모델링(MRM)과 가상 상호작용 힘(VIF) 모델링이라는 두 가지 자기 지도 학습 작업을 통해 교통 요소 간 상호작용을 학습하여, 다양한 하위 작업에 적용될 수 있는 일반화된 장면 이해 능력을 갖추고 있다.
摘要
본 연구는 자율주행을 위한 일반화된 교통 장면 이해 모델 PreGSU를 제안한다. PreGSU는 그래프 주의 집중 네트워크 기반으로 설계되었으며, 두 가지 사전 학습 작업을 통해 교통 요소 간 상호작용을 학습한다.
특징 공학: 에이전트 궤적과 도로 지도 정보를 벡터화하여 그래프 구조로 표현한다.
그래프 인코더: 에이전트 간 상호작용과 에이전트-도로 상호작용을 모델링하는 계층적 그래프 주의 집중 네트워크를 구축한다.
사전 학습 작업:
마스크된 도로 모델링(MRM): 에이전트-도로 연결을 학습한다.
가상 상호작용 힘(VIF) 모델링: 에이전트 간 상호작용을 학습한다.
미세 조정: 사전 학습된 모델 파라미터를 활용하여 다양한 하위 작업(예: 도시 시나리오의 다중 모달 궤적 예측, 고속도로 시나리오의 의도 인식)에 적용한다.
실험 결과, PreGSU는 기존 모델 대비 우수한 성능을 보였으며, 사전 학습 작업 설계의 효과성을 입증하였다. 이를 통해 PreGSU가 다양한 교통 시나리오에 대한 일반화된 이해 능력을 갖추고 있음을 확인할 수 있다.
統計資料
대부분의 교통 시나리오에는 50m 이내에 20개 미만의 다른 에이전트가 존재한다.
마스크된 도로 모델링 작업에서 마스킹 비율은 50%로 설정하였다.
사전 학습 시 VIF 손실은 0.0175, MRM 손실은 0.0329로 나타났다.
引述
"본 연구는 사전 학습된 그래프 주의 집중 네트워크 기반의 일반화된 교통 장면 이해 모델 PreGSU를 제안한다."
"PreGSU는 마스크된 도로 모델링(MRM)과 가상 상호작용 힘(VIF) 모델링이라는 두 가지 자기 지도 학습 작업을 통해 교통 요소 간 상호작용을 학습하여, 다양한 하위 작업에 적용될 수 있는 일반화된 장면 이해 능력을 갖추고 있다."