Concepts de base
MARL 기반 교통 신호 제어 모델의 의사결정 과정을 다각도로 분석하여 이해를 높이고 효율적인 교통 관리 전략을 수립하는 것이 핵심 목표이다.
Résumé
이 연구는 MARL 기반 교통 신호 제어 모델의 해석성을 높이기 위한 시각적 분석 도구 MARLens를 제안한다. MARLens는 MARL 모델의 학습 과정, 각 에이전트의 정책, 에이전트 간 상호작용, 의사결정 과정 등을 다양한 관점에서 분석할 수 있는 기능을 제공한다.
구체적으로 MARLens는 다음과 같은 기능을 제공한다:
- 에피소드 단위로 모델 학습 과정을 요약하여 보여줌
- 특정 시간대의 각 에이전트의 정책을 직관적으로 표현
- 각 에이전트의 상태, 행동, 메트릭 등을 시각화하고 에이전트 간 상호작용을 분석
- 각 에이전트의 의사결정 과정을 설명하는 규칙 트리를 제공
- 시뮬레이션 재생 기능을 통해 특정 시점의 상황을 확인
이를 통해 MARL 기반 교통 신호 제어 모델의 내부 작동 원리를 다각도로 이해할 수 있으며, 더 나은 교통 관리 전략을 수립하는데 기여할 수 있다.
Stats
각 에이전트의 큐 길이는 전체 도로망의 혼잡 상황을 나타내는 지표이다.
신호등 위상 변경 횟수를 줄이는 것이 안전성 측면에서 중요하다.
보상 함수는 큐 길이와 신호등 위상 변경 횟수를 고려하여 설계되었다.
Citations
"때때로 에이전트들이 통제할 수 없게 되어 정확히 무슨 일이 일어났는지 모르겠습니다."
"우리는 TensorBoard를 사용하여 학습 과정을 모니터링하고 행동과 상태 간의 관계를 포착하려 했지만, 이 접근법은 모델에 대한 종합적인 이해를 제공하지 못했습니다."