核心概念
本文探討了在具有雜訊和缺失值的特徵下,情境線性賭博機問題的貝葉斯預測器策略,並提出了一種演算法,在arm數量較多的情況下,可以達到 ˜O(d√T) 的遺憾界限。
Kim, J., Yun, S., Jeong, M., Nam, J., Shin, J., & Combes, R. (2024). Contextual Linear Bandits under Noisy Features: Towards Bayesian Oracles. arXiv preprint arXiv:1703.01347v4.
本研究旨在探討在具有雜訊和缺失值的特徵下,如何設計有效的情境線性賭博機演算法,並分析其遺憾界限。