Core Concepts
最適なペアマッチング戦略の探求と、サンプリング後の最適な後悔率に焦点を当てる。
Abstract
多腕バンディット問題における非標準的なインスタンスであるペアマッチング問題について、グラフ構造の発見と最適な戦略の重要性が強調されています。この論文では、2つのコミュニティを持つ条件付き確率的ブロックモデルに基づくグラフ生成が取り上げられ、最適な後悔率が議論されます。各個人が一定回数未満しかサンプリングされない制約下での最適後悔率や、公平性制約下での最適後悔率に関する推測も行われます。さらに、将来の研究や拡張可能性に触れられています。
Stats
𝑇 ≤ |Egood| = 2𝑛/2^2
𝑝, 𝑞 ∈ [0, 1/2]
𝑠 ≤ 1/32(1 + 𝜌∗)
最大期待利得: 𝑝𝑇
最適後悔率: (𝑝 − 𝑞) E𝜇[𝑁𝑏𝑎𝑑(𝜓,𝑇)]