本論文では、過去の決定全体が現在の損失に影響を及ぼす場合のオンラインの凸最適化問題を扱う新しい枠組み「オンラインの凸最適化における無制限のメモリ」を提案している。
まず、この問題設定を定式化し、p-有効メモリ容量という概念を導入する。p-有効メモリ容量は、過去の決定が現在の損失に及ぼす最大の影響を表す指標である。
次に、この問題に対するアルゴリズムとして、正則化追従リーダー(FTRL)アルゴリズムを提案し、p-有効メモリ容量に依存する上限レグレット界を示す。また、最悪ケースの下限レグレット界も示す。
さらに、この枠組みの特殊ケースとしてのオンラインの凸最適化における有限メモリ問題に対して、初めての非自明な下限レグレット界を示す。
最後に、この枠組みを用いて、オンラインの線形制御問題とオンラインの影響予測問題の解析を行い、既存の結果を改善することを示す。
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문