MARVEL은 대규모 가변 속도 제한 시스템을 위한 다중 에이전트 강화 학습 프레임워크이다. 이 연구에서는 다음과 같은 주요 내용을 다루고 있다:
대규모 고속도로 구간(17마일)에 34개의 가변 속도 제한 에이전트를 배치하고, 이들의 협력적인 의사결정을 통해 교통 안전성과 이동성을 향상시키는 방법을 제안한다.
에이전트의 상태 공간, 행동 공간, 보상 함수를 설계하여 적응성, 안전성, 이동성이라는 다중 목표를 달성할 수 있도록 한다. 특히 에이전트 간 순차적 의사결정 메커니즘을 도입하여 실제 운영 요구사항을 반영한다.
마이크로 시뮬레이션 환경에서 MARVEL 정책을 학습하고, 다양한 교통 상황과 운전자 준수율에 대해 평가한다. 그 결과 MARVEL은 기존 알고리즘 대비 63.4% 향상된 안전성과 58.6% 향상된 이동성을 달성한다.
실제 I-24 고속도로 데이터를 활용하여 MARVEL 정책의 실제 운영 능력을 검증한다.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Yuhang Zhang... at arxiv.org 03-19-2024
https://arxiv.org/pdf/2310.12359.pdfDeeper Inquiries