核心概念
連続的な敵対的攻撃に対して、忘却を防ぎながら頑健性を維持する方法を提案する。
摘要
本論文は、深層ニューラルネットワーク(DNN)の敵対的防御における課題を取り扱っている。従来の敵対的防御手法は一回限りの設定を前提としており、新しい攻撃に順応するためには過去の防御を忘れてしまう問題がある。
本論文では、連続的な敵対的攻撃に対する頑健性を維持する「連続的な敵対的防御」の概念を初めて提案する。具体的には以下の3つの利点を持つ手法「Anisotropic & Isotropic Replay (AIR)」を提案している:
- 等方性リプレイにより、新しいデータの近傍分布の一貫性を確保し、新旧タスクの出力の整合性を間接的に保つ。
- 非等方性リプレイにより、新旧タスクの特徴空間を融合し、潜在的な将来の攻撃に備えた汎化能力を高める。
- 単純な正則化項により、新旧タスクの出力の整合性を直接的に保つことで、可塑性と安定性のトレードオフを緩和する。
実験結果から、提案手法AIRは従来手法を上回る、あるいは最大値に近い性能を達成できることが示された。また、特徴空間の可視化から、AIRが新旧攻撃を同一クラスタに統合することで、忘却を抑制していることが分かった。
統計資料
新しい攻撃に順応するためには、過去の防御を忘れてしまう問題がある。
従来の敵対的防御手法は一回限りの設定を前提としている。
連続的な敵対的攻撃に対する頑健性を維持するには、防御モデルが新しい攻撃に絶えず適応する必要がある。
引述
「連続的な敵対的防御では、防御モデルが新しい攻撃に絶えず適応する必要がある。」
「新しい攻撃への適応は、過去の防御に対する忘却を引き起こす可能性がある。」