核心概念
データの次元間ギャップは、敵対的攻撃におけるモデルの脆弱性に重要な影響を与える。
要約
この研究では、低次元データ空間と高次元空間との次元間ギャップが、クリーンにトレーニングされたモデルがオフマニフォールド方向で敵対的摂動に脆弱であることを明らかにしています。さらに、異常な攻撃はこの次元ギャップから生じることが示唆されています。実験結果は、理論的な予測を裏付けており、モデルの脆弱性が増すことを示しています。また、異常な攻撃への耐性も同様に増加する傾向が見られます。
統計
Ambient: 320, 128, 64
LPCA: 307200, 49152, 12288
MLE(k=5): 12, 12, 12
TwoNN: 22.75, 21.87, 20.88
引用
"Neural networks are known to generalize well but are vulnerable to certain small-magnitude perturbations."
"Our main results provide an explicit relationship between the attack strength and the dimension gap."
"The vulnerability of neural networks to unnatural attacks is a pressing issue."