Core Concepts
提案されたアルゴリズムは、線形コンテキストバンディット問題において、Tの依存性を改善し、Tsallisエントロピーを使用してO(log(T))の後悔を得ることができます。
Abstract
この研究では、線形コンテキストバンディット問題における新しいアルゴリズムが提案されました。既存の研究と比較して、より一般的な場合に対応することができます。アルゴリズムはTsallisエントロピーを使用し、後悔を最小化します。さらに、マージン条件に関する新しい仮定が導入されました。これにより、問題の難易度が特徴付けられます。提案されたアルゴリズムはTの依存性を改善しました。
Stats
O(log(T))
O(log2(T))
O(log(T))
O(log(T))
O(log2(T))
O(log(T))
O(poly(T))
O(poly(T))
O(poly(K, d, T ))
O(poly(K, d, T ))