核心概念
自己教師学習の特殊なメカニズム(データ拡張、均一性)を考慮した上で、裏口攻撃のためのレジリエントなトリガー設計を提案する。
摘要
本論文は、自己教師学習(CL)に対する裏口攻撃について研究している。
- 既存の裏口攻撃は、CLの特殊なメカニズム(データ拡張、均一性)を考慮していないため、攻撃成功率が低い。
- 提案手法は、バイレベル最適化を用いて、CLの動的を模擬しながら、トリガーを最適化する。これにより、トリガーがCLのメカニズムに適応し、高い攻撃成功率を達成できる。
- 実験結果から、提案手法は既存手法に比べて高い攻撃成功率を示し、さまざまな防御手法に対しても頑健性を持つことが確認された。
- 分析により、提案手法のトリガーが、データ拡張や均一性の影響を受けにくい特性を持つことが明らかになった。
统计
提案手法は、CIFAR-10/-100、ImageNet-100データセットにおいて、1%の汚染率で99%以上の高い攻撃成功率を達成した。
既存手法は、同じ条件下で35%前後の攻撃成功率しか得られなかった。
引用
"既存の裏口攻撃は、CLの特殊なメカニズム(データ拡張、均一性)を考慮していないため、攻撃成功率が低い。"
"提案手法は、バイレベル最適化を用いて、CLの動的を模擬しながら、トリガーを最適化する。これにより、トリガーがCLのメカニズムに適応し、高い攻撃成功率を達成できる。"