מושגי ליבה
무라벨 데이터만을 이용하여 효과적인 백도어 공격을 수행할 수 있는 방법을 제안한다.
תקציר
이 논문은 자기지도학습(SSL)에서 발생할 수 있는 보안 위협인 백도어 공격에 대해 다룬다. 기존의 백도어 공격은 레이블이 있는 데이터를 필요로 하지만, 이 논문에서는 레이블 정보 없이도 효과적인 백도어를 만들 수 있는 방법을 제안한다.
제안하는 두 가지 방법은 다음과 같다:
클러스터링 기반 무라벨 백도어:
무라벨 데이터에 K-means 클러스터링을 적용하여 유사한 샘플들을 찾고, 이 중 가장 작은 클러스터를 선택하여 백도어 포이즌 집합으로 사용한다.
클러스터링의 불안정성으로 인해 때때로 성능이 좋지 않을 수 있다.
대조 선택 기반 무라벨 백도어:
상호정보량 최대화 원리에 기반하여 포이즌 집합을 선택한다.
포이즌 샘플들 간의 유사도는 높이고, 비포이즌 샘플들과의 유사도는 낮추는 방식으로 선택한다.
클러스터링 기반 방법보다 안정적이고 효과적인 성능을 보인다.
실험 결과, 두 가지 제안 방법 모두 다양한 SSL 모델에 대해 효과적인 백도어 공격을 수행할 수 있으며, 파인튜닝 기반 방어에도 어느 정도 강인한 것으로 나타났다.
סטטיסטיקה
데이터셋 크기: CIFAR-10 60,000개, ImageNet-100 100,000개
포이즌 비율: CIFAR-10 6%, ImageNet-100 0.6%
ציטוטים
"무라벨 데이터만을 이용하여 효과적인 백도어 공격을 수행할 수 있는 방법을 제안한다."
"클러스터링 기반 방법보다 대조 선택 기반 방법이 더 안정적이고 효과적인 성능을 보인다."