Centrala begrepp
適応的マスキングを用いて、ユーザーの履歴の長短に応じて柔軟に対応し、効率的な長系列モデリングを実現することで、推薦システムの性能を向上させる。
Sammanfattning
本研究では、強化学習ベースの推薦システムの課題に取り組むため、新しいオフラインの手法「MaskRDT」を提案している。
- 推薦タスクを推論課題としてモデル化し、適応的なマスキング設定を導入することで、ユーザーの履歴の長短に応じて柔軟に対応できるようにした。
- 多段階の保持メカニズムを組み込むことで、長系列のモデリングを効率的に行えるようにした。
- 実験の結果、オンラインシミュレーションおよびオフラインデータセットにおいて、提案手法の優位性が示された。
Statistik
推薦システムにおいて、ユーザーの履歴は時系列的な変化を捉えるのに重要な情報である。
しかし、ユーザーの興味関心は動的に変化するため、履歴の長さによって最適な情報が異なる。
提案手法では、履歴の長さに応じて柔軟にマスキングを行うことで、短期的な嗜好と長期的な嗜好を適切に捉えることができる。
Citat
"適応的マスキング手法は、ユーザーの最近の行動に着目する短期的な視点と、長期的な嗜好を捉える広範な視点を、状況に応じて使い分けることができる。"
"多段階の保持メカニズムにより、長系列のモデリングを効率的に行うことができる。"