Concepts de base
Individual natural examples exhibit varying vulnerabilities, prompting the need for adaptive perturbation radii in adversarial training.
Résumé
最近のDeep Neural Networks(DNNs)は、印象的な成功を収めていますが、DNNsの脆弱性に対する懸念が高まっています。この記事では、Adversarial Training(AT)において一定の摂動半径で生成された敵対的例を使用する代わりに、個々の自然例の脆弱性に基づいて摂動半径を割り当てる新しい方法が提案されました。提案された手法は、既存のAT手法のパフォーマンスを向上させることが示されました。
この研究では、MWPBとSDWPBという2つの新しい摂動予算割り当て関数が導入されました。これらの関数は、各自然例の脆弱性を評価し、その情報を利用して敵対的例を生成する際に摂動半径を決定します。実験結果は、提案手法がさまざまなデータセットや異なる攻撃下で人気のあるAT手法のパフォーマンスを一貫して向上させることを示しています。
Stats
arXiv:2403.04070v1 [cs.LG] 6 Mar 2024