Core Concepts
自己教師学習ベースの推薦システムは偽相関の影響を受けやすく、一般化性能が低下する。本研究では、複数の環境から不変特徴を自動的に抽出し、偽相関の影響を緩和する手法を提案する。
Abstract
本研究では、自己教師学習ベースの推薦システムが偽相関の影響を受けやすい問題に着目した。偽相関は、データ収集プロセスにおける選択バイアスにより不可避的に存在し、自己教師学習タスクを通じて推薦モデルに捕捉されてしまう。
提案手法の「不変特徴学習(IFL)」フレームワークでは、以下の2つの課題に取り組む:
教師なしで偽特徴を自動的にマスクすること
偽特徴から他の特徴への悪影響の伝播を遮断すること
具体的には、IFLは以下の手順で実現される:
ユーザー-アイテム相互作用を複数の環境に分割し、環境間の分布シフトを利用して不変特徴を特定する特徴マスク機構を学習する
特徴マスク機構に基づいて偽特徴をドロップした拡張サンプルを生成し、元のサンプルとの対比学習を行うことで、偽相関の影響を遮断する
実験の結果、IFLは既存手法に比べて偽相関の影響を効果的に緩和し、一般化性能を向上させることが示された。特に、分布シフトのある外部テストデータセットにおいて顕著な性能向上が確認された。
Stats
ユーザーの勤務経験年数が4年や6年の場合、フルタイムの仕事との相互作用が高くなる一方で、5年や7年の場合は相互作用が低くなる。
ユーザーの現在の職場での勤務経験年数によって、オーストリアの求人への相互作用が大きく変化する。
Quotes
「ユーザーの勤務経験年数が4年や6年の場合、フルタイムの仕事との相互作用が高くなる一方で、5年や7年の場合は相互作用が低くなる」
「ユーザーの現在の職場での勤務経験年数によって、オーストリアの求人への相互作用が大きく変化する」