Core Concepts
過去の状態を活用して、効果的な初期化と防御を提供するLAST(Learn from the Past)フレームワークが、モデルの堅牢性を著しく向上させることが示されました。
Abstract
Adversarial Training(AT)は深層学習モデルの堅牢性を強化するために広く採用されています。
LASTは、プロキシモデルの応答を活用し、動的に学習された高速重みを導出して、ターゲットモデルの更新方向を修正します。
自己蒸留正則化防御目的関数は、外部教師モデルに頼らずにプロキシモデルの更新軌道を誘導し、過度な適合問題の影響を和らげます。
LASTフレームワークは、CIFAR10およびCIFAR100データセットで堅牢性を向上させることが実証されています。
プロキシガイドアップデート規則は安定した収束動作を示し、最終的な堅牢性に貢献します。
Stats
拡張されたLASTフレームワークはCIFAR10およびCIFAR100データセットで9.2%および20.3%の堅牢精度向上を実現しました。
Quotes
"Adversarial Training (AT), pivotal in fortifying the robustness of deep learning models, is extensively adopted in practical applications."
"Extensive experiments and ablation studies showcase the framework’s efficacy in markedly improving model robustness."
"In this work, we emphasize that during the defense process, the historical parameter states of target model and their corresponding gradient directions remain concealed, thus serving as unknown elements to the adversarial examples and providing defense prior."