Core Concepts
画像モデルの敵対的な堅牢性を向上させるLAAT戦略が提案された。
Abstract
1. 背景情報:
DNNは敵対的攻撃に弱いことが知られている。
Zero-shot敵対的な堅牢性の難しさが残っている。
LAATはテキストエンコーダーの特徴を利用して、画像モデルのゼロショット敵対的な堅牢性を向上させる。
2. LAAT戦略:
テキストエンコーダーから固定されたテキストアンカーを取得し、画像分類モデルを監督する。
ゼロショット推論では、テキストアンカーと画像特徴量のCoSを最大化して新しいカテゴリを認識する。
3. 実験結果:
LAATはSOTA方法よりも優れたゼロショット敵対的な堅牢性を示した。
CIFAR-FSでConv4-512モデルと比較しても、LAATは強力なゼロショット堅牢性を示した。
4. 結論:
LAAT戦略は、ゼロショット設定で画像分類の敵対的な堅牢性を向上させる有望な手法であることが示された。
Stats
LAATは状態-of-the-art方法よりも優れたゼロショット敵対的な堅牢性を実現しました。
Quotes
"Deep Neural Networks (DNNs) are known to be susceptible to adversarial attacks."
"We propose LAAT, a Language-driven, Anchor-based Adversarial Training strategy."