本論文では、文脈依存デューリングバンディットの問題に対して、感情的トンプソンサンプリングを適用したアルゴリズムFGTS.CDSを提案している。
文脈依存デューリングバンディットとは、学習エージェントが文脈情報を利用しながら、2つの選択肢を比較し、ユーザの好みを学習する問題設定である。これまでUCBベースのアルゴリズムが提案されてきたが、トンプソンサンプリングを用いたアルゴリズムは存在しなかった。
提案するFGTS.CDSアルゴリズムの特徴は以下の通り:
実験では、提案手法が既存手法と比べて大幅に優れた性能を示すことを確認している。
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Xuheng Li,He... lúc arxiv.org 04-10-2024
https://arxiv.org/pdf/2404.06013.pdfYêu cầu sâu hơn