알려지지 않은 시스템 모델에서 부분적으로 중첩된 정보 패턴을 가지는 분산형 선형 2차 제어기를 온라인 학습하는 알고리즘을 제안하였다. 이 알고리즘은 시간 지평 T에 대해 $\sqrt{T}$ 회귀 오차를 달성한다.
An online learning algorithm that adaptively designs a decentralized linear quadratic regulator when the system model is unknown, achieving a regret that scales sublinearly with the time horizon.