この研究では、敵対的な例を平均化することで攻撃の転移性を向上させる方法が提案されました。従来の攻撃方法と比較して、新しい手法はより高い攻撃成功率を達成しました。実験結果は、異なるモデルに対しても効果的であることを示しています。また、異なる種類の敵対的な例の「スープ」が他の攻撃手法と組み合わせても有効であることが示されました。
toiselle kielelle
lähdeaineistosta
arxiv.org
Tärkeimmät oivallukset
by Bo Yang,Heng... klo arxiv.org 02-29-2024
https://arxiv.org/pdf/2402.18370.pdfSyvällisempiä Kysymyksiä