本論文では、文脈依存デューリングバンディットの問題に対して、感情的トンプソンサンプリングを適用したアルゴリズムFGTS.CDSを提案している。
文脈依存デューリングバンディットとは、学習エージェントが文脈情報を利用しながら、2つの選択肢を比較し、ユーザの好みを学習する問題設定である。これまでUCBベースのアルゴリズムが提案されてきたが、トンプソンサンプリングを用いたアルゴリズムは存在しなかった。
提案するFGTS.CDSアルゴリズムの特徴は以下の通り:
実験では、提案手法が既存手法と比べて大幅に優れた性能を示すことを確認している。
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Xuheng Li,He... kl. arxiv.org 04-10-2024
https://arxiv.org/pdf/2404.06013.pdfDybere Forespørgsler