المفاهيم الأساسية
지속적 적대적 방어를 위해 비등방성 및 등방성 의사 재현 기반 방법을 제안한다. 이를 통해 이전 공격에 대한 강건성을 유지하면서 새로운 공격에 적응할 수 있다.
الملخص
이 논문은 지속적 적대적 방어의 문제를 다룬다. 기존 방어 기법은 한 번의 방어 훈련 단계에 국한되어 있지만, 실제 배포 환경에서는 새로운 공격이 지속적으로 발생한다. 이에 따라 방어 모델은 새로운 공격에 지속적으로 적응해야 하며, 이 과정에서 이전 공격에 대한 방어 능력이 상실되는 문제가 발생한다.
이 논문에서는 비등방성 및 등방성 의사 재현 기반의 지속적 적대적 방어 기법인 AIR를 제안한다. AIR는 다음과 같은 장점을 가진다:
- 등방성 재현은 새로운 데이터의 근접 분포 일관성을 보장하여 이전 과제와 새로운 과제 간 출력 선호도를 간접적으로 정렬한다.
- 비등방성 재현은 새로운 의미 조합을 학습하여 잠재적 미래 공격에 대한 대응 능력을 향상시킨다.
- 간단한 정규화기를 통해 새로운 과제와 이전 과제 간 출력을 정렬하여 '가소성-안정성' 트레이드오프를 완화한다.
실험 결과, AIR는 기존 방법 대비 우수한 성능을 보이며, 때로는 Joint Training의 경험적 상한선을 능가하는 것으로 나타났다.
الإحصائيات
적대적 공격에 대한 방어 모델은 새로운 공격에 적응하는 과정에서 이전 공격에 대한 방어 능력을 상실하는 문제가 발생한다.
'from easy to difficult' 공격 순서에서 더 심각한 망각이 관찰되었다.
공격 강도가 다른 경우에도 망각 문제가 발생한다.
اقتباسات
"Defense without Forgetting: Continual Adversarial Defense with Anisotropic & Isotropic Pseudo Replay"
"Adversarial training suffers from significant catastrophic forgetting under all attack sequences, and the forgetting becomes more severe under the 'difficult to easy' attack sequence."