核心概念
連邦型推薦システムは、プライバシーを保護しつつ、スパース性の高いクライアントデータを活用するための対比学習フレームワークを提案する。さらに、この対比学習がかえってシステムの脆弱性を高めることを発見し、ポピュラリティに基づく正則化手法を導入することで、推薦性能と堅牢性を両立させる。
要約
本論文は、連邦型推薦システム(FedRec)における2つの課題に取り組む。
- データスパース性: クライアントの個人データが極端に少ないため、推薦性能が低下する問題。
- 提案手法CL4FedRecは、クライアントの限られたデータを活用するための対比学習フレームワークを導入する。ユーザー表現の拡張と、ユーザー・アイテムの2つの対比学習タスクを設計する。
- モデル汚染攻撃の脆弱性: 連邦学習の分散・オープンな特性により、悪意あるクライアントによるモデル汚染攻撃に晒される問題。
- 実験の結果、CL4FedRecはかえってモデル汚染攻撃に対する脆弱性を高めることが分かった。これは、対比学習によってアイテム表現の一様性が高まり、攻撃者が標的アイテムを人気アイテムに擬装しやすくなるためと分析した。
- そこで、ポピュラリティに基づく正則化手法rCL4FedRecを提案し、推薦性能と堅牢性を両立させた。
統計
各クライアントのデータは極端に少ない(MovieLens-1Mの平均165.5件、Amazon-Phoneの平均7.8件など)。
人気アイテムのエンベディングは密集しているが、対比学習によってより一様に分散する。
引用
"連邦型推薦システム(FedRec)は、プライバシーを保護しつつ、注目を集めている。"
"対比学習はデータスパース性の問題に取り組む有力な研究分野だが、FedRecへの適用は非自明である。"
"実験の結果、対比学習はかえってFedRecのモデル汚染攻撃に対する脆弱性を高めることが分かった。"