核心概念
既存のプライマル・デュアルアルゴリズムを弱適応性リグレット最小化器で拡張し、実用的なアプリケーションに適用可能な「デュアルバランス」フレームワークを提供します。
摘要
この論文では、予算と投資収益率(ROI)制約下でのオンライン学習問題に焦点を当てています。従来のアルゴリズムが前提とする条件を回避する方法を示し、実践的な入札戦略に最適なフレームワークを提案しています。新しい「デュアルバランス」フレームワークは、知識が不足してもデュアル変数が十分に小さく保たれることを保証します。これにより、確定的および敵対的入力下で最良の成果を実現します。
統計資料
α > 0 の条件が満たされることが重要です。
フレームワークは T OPTP − P t∈[T] ft(xt) ≤ C(T, α, δ) を保証します。
P t∈[T] ht(xt) ≤ 1 + 2/(ηRα) および P t∈[T] ct(xt) ≤ B の制約があります。
引述
"我々は既存のプライマル・デュアルテンプレートを弱適応性リグレット最小化器で拡張しました"
"この論文では、予算と投資収益率(ROI)制約下でのオンライン学習問題に焦点を当てています"