Core Concepts
対話型推薦システムにおいて、ユーザの好みを効率的に引き出すために、属性の組み合わせを最適化し、質問の多様性と依存性を高めることが重要である。
Abstract
本研究では、より現実的な対話型推薦システムのシナリオである「多属性マルチラウンド対話型推薦」(MTAMCR)を提案する。MTAMCRでは、システムがラウンドごとに複数の属性タイプについて質問することができる。
提案手法のCoCHPLは、MTAMCRを階層的強化学習タスクとして定式化し、長期的なオプション選択ポリシーと短期的な属性/アイテム生成ポリシーを組み合わせることで、質問の効率性と推薦の有効性を高める。具体的には、長期ポリシーがオプション(質問か推薦)を決定し、短期ポリシーが多段階の推論と選択を通じて属性や商品の連鎖を生成する。また、ユーザのフィードバックを予測する関数を導入し、属性間の依存関係を考慮する。
4つのベンチマークデータセットでの実験結果から、CoCHPLが既存手法に比べて大幅な性能向上を示すことが確認された。特に、属性の多様性と依存性を高めることで、推薦の成功率と効率性が大きく改善された。
Stats
ユーザは平均7.61ラウンド以内で目的の商品を見つけることができる。
ユーザの好みを捉えるために、平均3.75の属性を尋ねれば十分である。
Quotes
"対話型推薦システムにおいて、ユーザの好みを効率的に引き出すために、属性の組み合わせを最適化し、質問の多様性と依存性を高めることが重要である。"
"提案手法のCoCHPLは、MTAMCRを階層的強化学習タスクとして定式化し、長期的なオプション選択ポリシーと短期的な属性/アイテム生成ポリシーを組み合わせることで、質問の効率性と推薦の有効性を高める。"