この論文では、SATBAという新しいバックドア攻撃手法が提案されています。この手法は、空間的注意を使用して被害者モデルがクリーンデータに焦点を当てる領域を特定し、その特定のサンプルに対応するトリガーを生成します。その後、U-netベースのモデルがトリガーを生成した画像に埋め込みます。さまざまな標準データセットとDNNでの試験により、SATBAは他のバックドア攻撃と比較して高い効果を示しました。また、NCやAEVEなどのバックドア防御手法に対する耐性も確認されました。さらに、SATBAは他の攻撃方法と比較して優れたステルス性を持ち、異なるデータセットで高い類似性指標値を達成しました。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Huasong Zhou... at arxiv.org 03-06-2024
https://arxiv.org/pdf/2302.13056.pdfDeeper Inquiries