核心概念
本稿では、大規模言語モデルを用いてユーザーの行動履歴から長期的な興味を効率的に学習し、推薦システムの精度向上に活用する新しいフレームワーク「LIBER」を提案する。
摘要
LIBER: 大規模言語モデルに基づく生涯ユーザー行動モデリング
本稿は、推薦システムにおけるクリック率(CTR)予測の精度向上を目的とし、大規模言語モデル(LLM)を用いてユーザーの生涯にわたる行動履歴から長期的な興味を効率的に学習する新しいフレームワーク「LIBER」を提案する研究論文である。
従来の推薦システムでは、ユーザーの行動履歴を時系列データとして扱い、直近の行動に偏った短期的な興味に基づいて推薦を行うことが一般的であった。しかし、ユーザーの興味は時間とともに変化し、過去の行動履歴にも重要な情報が含まれている。そこで本研究では、LLMを用いてユーザーの生涯にわたる行動履歴から長期的な興味を抽出し、より効果的な推薦を実現することを目的とする。
LIBERは、以下の3つのモジュールから構成される。
ユーザー行動ストリーミング分割モジュール
ユーザーの生涯にわたる行動履歴を、短期的な行動キャッシュと長期的な行動メモリに分割する。短期的な行動キャッシュは従来の推薦モデルで処理され、長期的な行動メモリはLLMによって処理される。長期的な行動メモリはさらに固定長のパーティションに分割され、新しい行動が追加されるたびに、特定の条件を満たすと新しいパーティションが作成される。
ユーザー興味学習モジュール
LLMを用いて、長期的な行動メモリから推薦に関連する知識を抽出する。各パーティションに対して、パーティション内の行動を要約した「ブロック内ユーザー興味サマリー」と、パーティション間の興味の変化を捉えた「ブロック間ユーザー興味シフト」をカスケード方式で生成する。
ユーザー興味融合モジュール
LLMによって生成されたテキスト形式の知識を、推薦モデルで利用可能な密ベクトル表現に変換し、適切に融合する。具体的には、知識エンコーダを用いてテキストをベクトル表現に変換し、Attention機構を用いて異なるパーティションからの表現を統合する。最終的に得られた長期的なユーザー興味表現は、任意の推薦モデルに入力として組み込むことができる。