核心概念
本稿では、ツリーアンサンブルを用いた新しい文脈付き多腕バンディット問題のフレームワークを提案し、既存手法と比較して、ベンチマークデータセットと実世界の道路ネットワークナビゲーションにおいて、リグレット最小化と計算時間の両方で優れたパフォーマンスを示すことを実証しています。
要約
文脈付きバンディット問題におけるツリーアンサンブル:研究論文の概要
Nilsson, H., Johansson, R., Åkerblom, N., Chehreghani, M. H. (2024). Tree Ensembles for Contextual Bandits. arXiv preprint arXiv:2402.06963v3.
本研究は、文脈付き多腕バンディット問題において、ツリーアンサンブルモデルが効果的な学習と累積リグレットの最小化を実現できるかどうかを検証することを目的としています。