이 논문은 시간 변화에 따른 상관 신호를 고려한 새로운 평균장 상관 균형 개념인 "Adaptive Mean Field Correlated Equilibrium (AMFCE)"를 제안한다. 기존의 평균장 상관 균형 개념은 고정된 상관 신호를 가정하였지만, AMFCE는 시간에 따라 변화하는 상관 신호를 고려한다.
이를 바탕으로 "Correlated Mean Field Imitation Learning (CMFIL)"이라는 새로운 모방 학습 프레임워크를 제안한다. CMFIL은 AMFCE 정책을 복원할 수 있으며, 이를 통해 기존 평균장 모방 학습 알고리즘보다 더 넓은 범위의 시나리오에서 우수한 성능을 달성할 수 있다.
이론적으로, CMFIL의 성능 차이와 모방 격차가 시간 horizon에 대해 다항식 의존성을 가지는 것을 보였다. 이는 기존 실용적인 평균장 모방 학습 방법들의 지수적 의존성을 개선한 것이다.
실험적으로, CMFIL은 다양한 수치 실험 과제와 실세계 교통 흐름 예측 문제에서 기존 방법들을 뛰어넘는 성능을 보였다. 이는 CMFIL이 시간 변화에 따른 상관 신호를 효과적으로 다룰 수 있음을 보여준다.
翻譯成其他語言
從原文內容
arxiv.org
深入探究