この研究では、敵対的な例を平均化することで攻撃の転移性を向上させる方法が提案されました。従来の攻撃方法と比較して、新しい手法はより高い攻撃成功率を達成しました。実験結果は、異なるモデルに対しても効果的であることを示しています。また、異なる種類の敵対的な例の「スープ」が他の攻撃手法と組み合わせても有効であることが示されました。
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Bo Yang,Heng... lúc arxiv.org 02-29-2024
https://arxiv.org/pdf/2402.18370.pdfYêu cầu sâu hơn