核心概念
本論文は、サンプル内および異なるサンプル間の特徴量の相互作用を効果的にモデル化するための検索拡張トランスフォーマー(RAT)を提案する。RAT は、類似サンプルを検索し、それらを対象サンプルの入力に組み込むことで、より詳細な特徴量の相互作用を捉えることができる。また、階層的な注意機構を用いることで、効率的かつ堅牢なモデリングを実現している。
要約
本論文は、クリックスルー率(CTR)予測のための新しいアプローチとして、検索拡張(RA)学習を提案している。従来のCTRモデルは、個々のサンプル内の特徴量の相互作用にのみ着目していたが、サンプル間の関係性も重要な情報源となり得る。そこで本論文では、検索によって得られた類似サンプルを活用し、サンプル内外の特徴量の相互作用をトランスフォーマーベースのモデルで捉えるRAT を開発した。
具体的には以下の通り:
検索エンジンを用いて、対象サンプルに類似した過去のサンプルを検索し、参照コンテキストとして活用する。
検索結果と対象サンプルを組み合わせた拡張入力を構築する。
トランスフォーマーのブロックを用いて、サンプル内の特徴量相互作用(intra-sample)とサンプル間の特徴量相互作用(cross-sample)を階層的に捉える。
最終的な予測は、拡張入力の単一表現を用いて行う。
実験の結果、RAT は既存の検索拡張モデルを上回る性能を示し、特に長尾データに対する優位性が確認された。これは、RAT が特徴量の疎さや冷スタート問題に効果的に対処できることを示唆している。
統計
検索対象サンプルと検索結果サンプルの特徴量が一致する度合いを表す指標は、log(N - N(x_t^f) + 0.5) / (N(x_t^f) + 0.5)である。ここで、Nはサンプル数、N(x_t^f)は特徴量x_t^fを含むサンプル数を表す。
検索結果として、対象サンプルに最も類似した上位K個のサンプルを取得する。