本研究では、推薦システムにおける短期的なユーザーの反応と長期的なユーザーの定着の両方を同時に最適化するための新しいフレームワークDT4IERを提案している。
主な特徴は以下の通り:
短期的な反応と長期的な定着のバランスを取るための新しい報酬設計を導入している。ユーザー属性に基づいて報酬の重要度を動的に調整することで、より適切な推薦を行うことができる。
複数の報酬信号を効果的に捉えるための高次元エンコーダを採用している。これにより、異なるタスク間の複雑な関係性を適切に捉えることができる。
行動埋め込みの予測に対するコントラスティブ学習を導入することで、モデルの全体的なパフォーマンスを大幅に向上させている。
実験の結果、DT4IERは既存の手法と比較して、推薦精度と長期的なユーザー定着の両方において優れた性能を示すことが確認された。特に、即時的なフィードバックと長期的な定着のバランスを取ることができる点が大きな特徴となっている。
Para Outro Idioma
do conteúdo original
arxiv.org
Principais Insights Extraídos De
by Ziru Liu,Shu... às arxiv.org 04-05-2024
https://arxiv.org/pdf/2404.03637.pdfPerguntas Mais Profundas