核心概念
本文提出一個新的框架,稱為具有機率觸發臂的上下文組合老虎機 (C2MAB-T),並設計了新的演算法來解決此問題,在各種平滑條件下實現了比先前研究更嚴格的後悔界限。
Liu, X., Zuo, J., Wang, S., Lui, J. C., Hajiesmaili, M., Wierman, A., & Chen, W. (2024). Contextual Combinatorial Bandits with Probabilistically Triggered Arms. In Proceedings of the 40th International Conference on Machine Learning (pp. 1-23). PMLR.
本研究旨在探討具有機率觸發臂的上下文組合老虎機問題 (C2MAB-T),並設計高效的演算法,在各種平滑條件下實現更嚴格的後悔界限。