本論文では、適応的なオンライン勾配降下法(AdaOGD)を提案している。AdaOGDは、強凸性や強単調性のパラメータを事前に知る必要がなく、単一エージェントの設定では最適な後悔bound(log^2(T))を達成し、多エージェントの強単調ゲームでは最適な最終反復収束率(log^3(T)/T)を達成する。
単一エージェントの設定では、AdaOGDは強凸性パラメータを必要としない一方で、従来のOGDは強凸性パラメータを必要としていた。多エージェントの強単調ゲームでは、AdaOGDは強単調性パラメータを必要としないが、従来のOGDは強単調性パラメータを必要としていた。
さらに、指数凹ゲームに対して、適応的なオンラインニュートン法(AdaONS)を提案し、同様の性能保証を示している。これは、指数凹ゲームが強単調ゲームの一般化であることを示唆している。
本手法は、ニュースベンダー問題などの在庫管理問題にも適用でき、従来手法では必要だった問題パラメータを必要としない初の実用的かつ近最適なアルゴリズムを提供する。
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문