이 연구는 적대적 공격에 대한 앙상블 모델의 방어 능력을 향상시키기 위해 노력했다. 기존의 방어 전략은 주로 첫 번째 순서 기울기 정보에 초점을 맞추었지만, 이 연구에서는 두 번째 순서 기울기 정보에 주목했다. 두 번째 순서 기울기는 손실 함수의 곡률을 나타내며, 곡률과 모델 강건성 간의 강한 상관관계가 있다는 것이 밝혀졌다.
이 연구에서는 저차원 곡률 모델을 통합하여 앙상블 모델의 다양성을 높이는 새로운 정규화 방법을 제안했다. 이를 통해 적대적 공격의 전이성을 줄일 수 있었다. 실험 결과, 제안된 방법은 다양한 데이터셋에서 기존 방법보다 우수한 강건성을 보였다.
Till ett annat språk
från källinnehåll
arxiv.org
Djupare frågor