선형 제약이 있는 온라인 LQG 문제에 대해 Riemannian 계량을 활용한 최적화 알고리즘을 제안하고, 비교 정책 대비 누적 비용의 하위 최적성을 나타내는 후회 한계를 제시한다.