이 논문은 단조 게임에서의 거울 플레이(mirror play, MP) 동학을 변분 해석하는 새로운 관점을 제시한다.
MP 동학을 유한 시간 거울 미분 게임(mirror differential game, MDG)의 폐루프 내쉬 균형 경로와 동등하게 해석한다. MDG의 단계 비용은 Brezis-Ekeland 변분 원리에 기반하여 정의된다.
이를 통해 MP 유한 시간 궤적을 MDG의 균형 경로로 해석할 수 있으며, Lyapunov 방법을 활용하여 MP 동학의 유한 시간 수렴 속도를 정량화할 수 있다.
이 변분 해석은 확률적 거울 플레이(stochastic mirror play, SMP)로 확장되며, SMP 동학이 확률적 거울 미분 게임(stochastic mirror differential game, SMDG)의 폐루프 내쉬 균형 경로와 동등함을 보인다.
이러한 변분 해석은 MP 동학의 안정성과 최적성을 이해하는 데 도움이 될 것으로 기대된다.
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Yunian Pan,T... a las arxiv.org 03-26-2024
https://arxiv.org/pdf/2403.15636.pdfConsultas más profundas