核心概念
本研究は、ユーザーの過去および未来の行動パターンを捉えた双方向時系列データ拡張手法を提案し、これを事前学習に活用することで、短い行動系列の予測精度を大幅に向上させている。
摘要
本研究は、順序推薦システムにおける課題である短い行動系列の予測精度向上に取り組んでいる。
- 従来の単方向の時系列データ拡張手法では、生成された疑似的な過去アイテムと実際のユーザー嗜好との整合性が取れない問題があった。
- そこで本研究では、ユーザーの過去および未来の行動パターンを捉えた双方向の時系列データ拡張手法を提案している。
- この手法により生成された疑似的な過去アイテムは、ユーザーの実際の嗜好と整合性が高く、かつアイテム間の意味的な関係性も強化される。
- さらに、拡張データと元のデータの確率分布の整合性を保つ知識強化ファインチューニング手法を導入することで、モデルの表現力を一貫して維持できるようにしている。
- 実験の結果、提案手法は既存手法と比べて、短い行動系列から長い行動系列まで、幅広い系列長に対して優れた予測精度を示している。
统计
短い行動系列(長さ≤3)が全体の32%を占めるが、長い行動系列(長さ≥20)は4.2%しかない。
提案手法BARec は、SASRecと比べて、Recall@5で28.28%、NDCG@5で30.67%、MRR@5で27.95%の平均的な相対的な性能向上を示した。
提案手法BARec は、ASRepと比べて、Recall@5で7.76%、NDCG@5で6.99%、MRR@5で6.45%の平均的な性能向上を示した。
引用
"短い行動系列を扱うことは非常に困難であり、多くのベンチマークデータセットでは短い行動系列が優勢である。"
"従来の単方向の時系列データ拡張手法は、生成された疑似的な過去アイテムとユーザーの実際の嗜好との整合性が取れない問題がある。"
"提案手法BARec は、ユーザーの過去および未来の行動パターンを捉えた双方向の時系列データ拡張手法を導入し、生成された疑似的な過去アイテムがユーザーの実際の嗜好と整合性が高く、かつアイテム間の意味的な関係性も強化されている。"