本論文は、連邦学習(FL)における毒入りモデル攻撃に対する新しい防御メカニズムであるCeltiberoを提案している。
Celtiberoの特徴は以下の通り:
検知・フィルタリングと影響低減の2つのメカニズムを組み合わせることで、攻撃に対する堅牢性を高めている。検知・フィルタリングでは、局所モデルの更新ベクトルのクラスタリングを行い、異常なものを排除する。影響低減では、検知された正常なベクトルの中央値を取ることで、検知漏れの攻撃モデルの影響を最小限に抑える。
これらのメカニズムを各層で個別に適用する「階層的集約」を行うことで、特定の層に限定された攻撃パターンを正確に検知・除去できる。これにより、従来の手法よりも高い防御性能を発揮する。
実験では、MNIST、IMDBデータセットを用いて、様々な毒入りモデル攻撃に対するCeltiberoの有効性を検証した。その結果、Celtiberoは既存の防御手法を大きく上回る性能を示し、特にデータが非i.i.d.の場合に顕著な優位性を発揮することが分かった。
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문