本論文は、推薦システムにおけるOOV(未知の値)ユーザーや商品の扱いを改善する手法について提案している。
まず、推薦システムの評価方法には、トランスダクティブ(既知の値のみ)とインダクティブ(既知・未知の値)の2つがあり、実際の産業応用ではインダクティブ設定が重要となる。しかし、従来の研究では主にトランスダクティブ設定での評価が行われてきた。
そこで本論文では、OOV値の扱いを改善するための9つの手法を提案・評価している。これらの手法には、単純なゼロベクトルや平均ベクトルの使用から、ユーザー/商品の特徴情報を活用したハッシュベースの手法まで含まれる。
実験の結果、特徴情報を活用したロケーションセンシティブハッシュ(LSH)ベースの手法が、多くのモデル・データセットの組み合わせで最も良好なインダクティブパフォーマンスを示すことが分かった。特に提案手法の中で最も優れていたm-lshは、従来の業界標準手法に比べて平均3.74%の改善を示した。
また、本論文ではインダクティブ評価に適したデータセットの作成も行っており、これらのデータセットとコード一式をオープンソース化することで、今後のOOV対策に関する研究の発展に寄与することが期待される。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by William Shia... at arxiv.org 03-28-2024
https://arxiv.org/pdf/2403.18280.pdfDeeper Inquiries