핵심 개념
본 연구는 확산 모델을 활용하여 자율주행 차량의 의사결정 성능을 향상시키고, 라그랑지안 기반 안전성 제약을 통해 안전한 의사결정을 달성하는 DDM-Lag 모델을 제안한다.
초록
본 연구는 자율주행 차량의 의사결정 문제를 제약된 마르코프 의사결정 프로세스(CMDP)로 모델링하고, 확산 모델을 활용하여 이를 해결하는 DDM-Lag 모델을 제안한다.
- 확산 모델의 역전파 과정을 통해 최적의 차량 제어 결정을 생성하는 확산 기반 정책 모델을 개발하였다.
- 행동 모방과 Q-학습을 결합한 하이브리드 정책 업데이트 방법을 제안하고, 이를 Actor-Critic 구조에 적용하여 정책 업데이트를 수행하였다.
- 라그랑지안 최적화 기법을 활용하여 안전성 제약을 정책 학습 과정에 통합함으로써 안전한 의사결정을 달성하였다.
실험 결과, DDM-Lag 모델은 기존 방법들에 비해 안전성과 종합적인 성능이 크게 향상된 것을 확인할 수 있었다. 특히 복잡한 시나리오에서도 안정적이고 효과적인 의사결정을 수행하였다.
통계
자율주행 차량의 상태 정보(위치, 속도, 조향각, 도로 경계와의 거리)와 주변 환경 정보(LiDAR 데이터, 주변 차량 정보)를 입력으로 사용한다.
차량의 종방향 가속도와 횡방향 조향각을 출력으로 생성한다.