核心概念
SSL 모델에 대한 주파수 기반 백도어 공격을 효과적으로 방어할 수 있는 두 가지 방법을 제안한다. 첫째, 모델 학습 시 가우시안 블러를 활용하여 공격 패턴의 분산을 높임으로써 모델이 공격 패턴을 학습하지 않도록 한다. 둘째, 추론 시 RGB 이미지 대신 Y' 채널만을 사용하여 색 정보가 변조된 공격을 효과적으로 차단한다.
要約
이 연구는 SSL 모델에 대한 주파수 기반 백도어 공격을 방어하는 두 가지 방법을 제안한다.
- 모델 학습 시 방어:
- 가우시안 블러를 데이터 증강 기법으로 사용하여 공격 패턴의 분산을 높임
- 이를 통해 모델이 공격 패턴을 학습하지 않도록 함
- 실험 결과 ACC는 향상되고 ASR은 60-85% 감소
- 추론 시 방어:
- RGB 이미지 대신 Y' 채널만을 사용하여 추론
- 공격자가 색 정보만 변조하는 공격을 효과적으로 차단
- Y' 채널은 의미 정보를 잘 보존하므로 분류 성능 저하 없음
이 방법들은 CTRL, FIBA, HTBA 등 다양한 주파수 기반 백도어 공격에 대해 효과적으로 작동한다. 또한 이론적 분석을 통해 방어 메커니즘을 설명하였다.
統計
가우시안 블러를 적용하면 CIFAR 10에서 ACC가 84.96%에서 89.38%로, CIFAR 100에서 49.76%에서 56.24%로 향상됨
CTRL 공격에 대한 ASR은 CIFAR 10에서 83.62%에서 35.54%로, CIFAR 100에서 95.5%에서 38.98%로 감소함
引用
"SSL 모델에 대한 주파수 기반 백도어 공격을 효과적으로 방어할 수 있는 두 가지 방법을 제안한다."
"가우시안 블러를 데이터 증강 기법으로 사용하여 공격 패턴의 분산을 높임으로써 모델이 공격 패턴을 학습하지 않도록 한다."
"RGB 이미지 대신 Y' 채널만을 사용하여 추론함으로써 공격자가 색 정보만 변조하는 공격을 효과적으로 차단한다."