toplogo
サインイン

オンラインの凸最適化における無制限のメモリ


核心概念
過去の決定全体が現在の損失に影響を及ぼす場合のオンラインの凸最適化問題を扱う新しい枠組みを提案し、その上限と下限の正則化レグレットを示す。
要約

本論文では、過去の決定全体が現在の損失に影響を及ぼす場合のオンラインの凸最適化問題を扱う新しい枠組み「オンラインの凸最適化における無制限のメモリ」を提案している。

まず、この問題設定を定式化し、p-有効メモリ容量という概念を導入する。p-有効メモリ容量は、過去の決定が現在の損失に及ぼす最大の影響を表す指標である。

次に、この問題に対するアルゴリズムとして、正則化追従リーダー(FTRL)アルゴリズムを提案し、p-有効メモリ容量に依存する上限レグレット界を示す。また、最悪ケースの下限レグレット界も示す。

さらに、この枠組みの特殊ケースとしてのオンラインの凸最適化における有限メモリ問題に対して、初めての非自明な下限レグレット界を示す。

最後に、この枠組みを用いて、オンラインの線形制御問題とオンラインの影響予測問題の解析を行い、既存の結果を改善することを示す。

edit_icon

要約をカスタマイズ

edit_icon

AI でリライト

edit_icon

引用を生成

translate_icon

原文を翻訳

visual_icon

マインドマップを作成

visit_icon

原文を表示

統計
オンラインの凸最適化における無制限のメモリの問題設定では、損失関数ftはL-リプシッツ連続であり、p-有効メモリ容量Hpが有限である。 アルゴリズムのレグレットは、O(√(HpTL˜L))以下に抑えられる。
引用
なし

抽出されたキーインサイト

by Raunak Kumar... 場所 arxiv.org 04-02-2024

https://arxiv.org/pdf/2210.09903.pdf
Online Convex Optimization with Unbounded Memory

深掘り質問

過去の決定が現在の損失に及ぼす影響が非線形の場合、本手法をどのように拡張できるか。

過去の決定が現在の損失に及ぼす影響が非線形の場合、本手法を拡張するためにはいくつかのアプローチが考えられます。まず、非線形な影響を取り入れるために、過去の決定と現在の損失の関係をより複雑な関数形で表現する必要があります。これにより、過去の決定が現在の損失に及ぼす影響をより正確にモデル化できます。 さらに、非線形な影響を考慮するために、過去の決定と現在の損失の関係を線形でないオペレータや関数で表現することが重要です。このような拡張により、より複雑な問題設定に対応できるようになります。また、過去の決定が現在の損失に及ぼす非線形な影響を取り入れることで、より現実的なシナリオに対応できる可能性があります。
0
star