本論文は、大規模言語モデル(LLM)を活用した個人化マルチモーダル生成手法PMGを提案している。
まず、ユーザーの行動履歴(クリック履歴やチャット履歴など)をテキストに変換し、LLMを用いて個人の嗜好を抽出する。抽出した嗜好は、明示的なキーワードと暗黙的な埋め込みの組み合わせで表現する。
次に、抽出した嗜好と生成対象のアイテムの特徴をジェネレータ(マルチモーダルLLMやディフュージョンモデル)に入力し、個人化されたコンテンツを生成する。
生成時には、生成結果の正確性と個人化のバランスを取るため、それぞれのスコアを最適化する。
実験では、ファッション商品や映画ポスターの生成タスクで提案手法の有効性を示している。また、生成した画像をレコメンデーションに活用することで、推薦精度の向上にも寄与することを示している。
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問