Core Concepts
본 논문은 선형 및 비선형 분류 문제에 대해 SVM 마진 개념에 영감을 받은 새로운 적대적 학습 방법을 제안한다. 이를 통해 적대적 공격에 대한 강건성을 가진 분류기를 학습할 수 있으며, 이에 대한 유한 표본 복잡도 보장을 제공한다.
Abstract
본 논문은 적대적 공격에 대한 강건한 분류기 학습 방법을 제안한다.
선형 및 비선형 분류기에 대해 SVM 마진 개념에 영감을 받은 새로운 적대적 학습 방법을 제안한다.
제안된 방법을 통해 학습된 분류기는 적대적 공격에 대한 강건성을 가지며, 이에 대한 유한 표본 복잡도 보장을 제공한다.
이를 위해 분류기 마진을 통해 강건성을 정의하고, 이를 최적화하는 선형 프로그래밍 및 2차 원뿔 프로그래밍 기반의 알고리즘을 제안한다.
실험 결과, 제안된 방법은 MNIST 및 CIFAR10 데이터셋에서 기존 방법과 비교할만한 성능을 보이며, 적대적 예제 생성 없이도 강건성을 달성할 수 있음을 보인다.
Stats
입력 데이터 x의 최대 크기 ∥x∥≤u를 가정한다.
학습된 분류기 파라미터 w의 L1 노름 ∥w∥1 ≤v를 가정한다.