Temel Kavramlar
기존 입력 변환 기반 공격들은 모델 간 주목 열맵의 일관성이 부족하여 전이성이 제한적이다. 이를 해결하기 위해 블록 셔플링과 회전을 통해 다양한 주목 열맵을 생성하고 평균 기울기를 사용하여 전이성을 크게 향상시킨다.
Özet
이 연구는 적대적 예제의 전이성을 향상시키기 위한 새로운 입력 변환 기반 공격 기법인 블록 셔플링과 회전(BSR)을 제안한다.
- 기존 입력 변환 기반 공격들은 모델 간 주목 열맵의 일관성이 부족하여 전이성이 제한적이다.
- 이미지를 블록으로 나누고 랜덤하게 셔플링 및 회전하면 주목 열맵이 크게 달라지는 것을 발견했다.
- 이를 바탕으로 BSR을 제안했다. BSR은 여러 변환된 이미지에 대한 평균 기울기를 사용하여 주목 열맵의 일관성을 높이고 전이성을 향상시킨다.
- ImageNet 데이터셋에 대한 실험 결과, BSR은 기존 입력 변환 기반 공격 대비 월등한 전이성을 보였다.
- BSR은 다른 전이성 향상 기법과 호환되어 시너지 효과를 낼 수 있다.
İstatistikler
표준 모델에 대한 평균 공격 성공률이 93.8%로 기존 최고 성능 대비 6.5% 이상 향상되었다.
적대적 학습 모델에 대한 평균 공격 성공률이 56.2%로 기존 최고 성능 대비 11.0% 이상 향상되었다.
다양한 방어 기법에 대해서도 BSR이 우수한 성능을 보였다.
Alıntılar
"기존 입력 변환 기반 공격들은 모델 간 주목 열맵의 일관성이 부족하여 전이성이 제한적이다."
"이미지를 블록으로 나누고 랜덤하게 셔플링 및 회전하면 주목 열맵이 크게 달라진다."
"BSR은 여러 변환된 이미지에 대한 평균 기울기를 사용하여 주목 열맵의 일관성을 높이고 전이성을 향상시킨다."