核心概念
単一の大規模言語モデルを用いて、セマンティックトークン化と生成型推薦のプロセスを統合的に実現する。
要約
本論文では、セマンティックトークン化と生成型推薦を統合的に実現するフレームワーク「STORE」を提案している。従来のアプローチでは、アイテムの意味表現を抽出するエンコーダ、離散トークンに量子化するクォンタイザ、そして推薦モデルの3つのサブモデルが必要であった。一方、STOREでは単一の大規模言語モデルを用いて、以下の3つのタスクを統合的に実現する:
テキストからトークンへの変換: アイテムの意味表現をトークン列に変換する。
トークンからトークンへの生成: ユーザ履歴からアイテムのトークン列を生成する推薦タスク。
トークンからテキストへの再構成: 生成したトークン列からアイテムの意味表現を再構成する。
これにより、情報の損失を最小限に抑え、モデル間の知識移転を促進できる。また、複雑なパイプラインを簡素化し、実用的なコストを削減できる。
実験の結果、STOREは既存手法と比べて、ニュース推薦とレストラン推薦の両方のタスクで優れた性能を示した。特に、大規模言語モデルを用いた生成型スコアリングタスクでは、大幅な性能向上が確認された。
統計
平均ユーザ長は、MIND データセットで11.78、Yelp データセットで6.47である。
平均アイテム出現回数は、MIND データセットで20.69、Yelp データセットで3.97である。