本論文では、マトリクス因子分解(MF)を用いた推奨システムの訓練プロセスを高速化する手法を提案する。
まず、MFの訓練プロセスにおいて、特徴行列(ユーザー特徴行列と商品特徴行列)に細かな構造的スパース性が存在することを観察した。この細かな構造的スパース性により、行列乗算と潜在因子の更新に多くの不要な演算が発生し、訓練プロセスの計算時間が増大する。
そこで以下の2つの手法を提案する:
特徴行列の再配置: 特徴行列の共同スパース性に基づいて特徴行列を再配置し、小さなインデックスの潜在ベクトルがより密になるようにする。これにより後のプルーニング処理による誤差を抑える。
動的プルーニング: 行列乗算と潜在因子の更新の際に、重要でない潜在因子を早期に停止してプルーニングする。プルーニングの程度は、ユーザーや商品ごとの潜在因子のスパース性に応じて動的に変化する。
実験の結果、提案手法により1.2-1.65倍の高速化を実現し、最大20.08%の誤差増加に抑えられることを示した。また、提案手法は最適化手法やハイパーパラメータの選択に依存せず適用可能であることを確認した。
翻译成其他语言
从原文生成
arxiv.org
更深入的查询