核心概念
본 논문은 선형 및 비선형 분류 문제에 대해 SVM 마진 개념에 영감을 받은 새로운 적대적 학습 방법을 제안한다. 이를 통해 적대적 공격에 대한 강건성을 가진 분류기를 학습할 수 있으며, 이에 대한 유한 표본 복잡도 보장을 제공한다.
摘要
본 논문은 적대적 공격에 대한 강건한 분류기 학습 방법을 제안한다.
- 선형 및 비선형 분류기에 대해 SVM 마진 개념에 영감을 받은 새로운 적대적 학습 방법을 제안한다.
- 제안된 방법을 통해 학습된 분류기는 적대적 공격에 대한 강건성을 가지며, 이에 대한 유한 표본 복잡도 보장을 제공한다.
- 이를 위해 분류기 마진을 통해 강건성을 정의하고, 이를 최적화하는 선형 프로그래밍 및 2차 원뿔 프로그래밍 기반의 알고리즘을 제안한다.
- 실험 결과, 제안된 방법은 MNIST 및 CIFAR10 데이터셋에서 기존 방법과 비교할만한 성능을 보이며, 적대적 예제 생성 없이도 강건성을 달성할 수 있음을 보인다.
统计
입력 데이터 x의 최대 크기 ∥x∥≤u를 가정한다.
학습된 분류기 파라미터 w의 L1 노름 ∥w∥1 ≤v를 가정한다.