Core Concepts
Incorporating planning capabilities into recommendation systems is crucial for long-term engagement and mitigating filter bubbles.
Abstract
長期的なエンゲージメントを最大化し、フィルターバブルを緩和するために、推薦システムに計画能力を組み込むことが重要です。提案されたBiLLPフレームワークは、LLMの長期計画能力を刺激し適応させる効果的な手法であり、RLベースの方法や他のLLMベースラインよりも優れたパフォーマンスを示します。BiLLPは、長尾アイテムに対する計画能力が顕著であり、フィルターバブル問題を効果的に緩和し、長期的なエンゲージメントを最大化することができます。
Stats
BiLLPはRLベースの方法や他のLLMベースラインよりも優れたパフォーマンスを示す。
ActOnlyメソッドは明らかに低いパフォーマンスを示す。
ReActメソッドはReflexionメソッドよりも若干劣る。
Quotes
"An explicit thinking and planning process is crucial for enhancing the planning capabilities of LLMs."
"RL-based method A2C tends to overfit on popularity items and lack planning capabilities on long-tail items."
"The LLM-based method BiLLP exhibits significantly better planning capabilities on long-tail items."