本論文では、文脈依存デューリングバンディットの問題に対して、感情的トンプソンサンプリングを適用したアルゴリズムFGTS.CDSを提案している。
文脈依存デューリングバンディットとは、学習エージェントが文脈情報を利用しながら、2つの選択肢を比較し、ユーザの好みを学習する問題設定である。これまでUCBベースのアルゴリズムが提案されてきたが、トンプソンサンプリングを用いたアルゴリズムは存在しなかった。
提案するFGTS.CDSアルゴリズムの特徴は以下の通り:
実験では、提案手法が既存手法と比べて大幅に優れた性能を示すことを確認している。
เป็นภาษาอื่น
จากเนื้อหาต้นฉบับ
arxiv.org
ข้อมูลเชิงลึกที่สำคัญจาก
by Xuheng Li,He... ที่ arxiv.org 04-10-2024
https://arxiv.org/pdf/2404.06013.pdfสอบถามเพิ่มเติม