Core Concepts
シンプレクティック積分子を用いて、交代ミラーディセント法のための保存量を導出し、その性質を利用して、アルゴリズムの性能保証を改善する。
Abstract
本論文は、交代ミラーディセント法(AMD)のアルゴリズムを理解するために、シンプレクティック積分子の理論的な枠組みを活用している。
まず、ハミルトン流れの離散化であるシンプレクティック・ユーラー法と、ゲーム理論における交代ミラーディセント法の関係を明らかにする。シンプレクティック・ユーラー法では、修正ハミルトニアンと呼ばれる保存量が存在し、その性質を利用することで、AMD アルゴリズムの性能保証を改善できることを示す。
具体的には、修正ハミルトニアンの級数展開の性質を詳しく分析し、その保存誤差を評価することで、AMD の総regret bound をO(K^{1/5})、平均の双対ギャップをO(K^{-4/5})まで改善できることを示す。さらに、修正ハミルトニアンの収束条件が満たされれば、これらの bound をさらに改善できる可能性があることを示唆する。
Stats
AMD アルゴリズムの総regret boundはO(K^{1/5})である。
AMD アルゴリズムの平均の双対ギャップはO(K^{-4/5})である。
修正ハミルトニアンが絶対収束すれば、総regret boundはO(1)、平均の双対ギャップはO(K^{-1})になる可能性がある。