이 연구는 적대적 공격에 대한 앙상블 모델의 방어 능력을 향상시키기 위해 노력했다. 기존의 방어 전략은 주로 첫 번째 순서 기울기 정보에 초점을 맞추었지만, 이 연구에서는 두 번째 순서 기울기 정보에 주목했다. 두 번째 순서 기울기는 손실 함수의 곡률을 나타내며, 곡률과 모델 강건성 간의 강한 상관관계가 있다는 것이 밝혀졌다.
이 연구에서는 저차원 곡률 모델을 통합하여 앙상블 모델의 다양성을 높이는 새로운 정규화 방법을 제안했다. 이를 통해 적대적 공격의 전이성을 줄일 수 있었다. 실험 결과, 제안된 방법은 다양한 데이터셋에서 기존 방법보다 우수한 강건성을 보였다.
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Kaikang Zhao... lúc arxiv.org 03-26-2024
https://arxiv.org/pdf/2403.16405.pdfYêu cầu sâu hơn