Core Concepts
기존의 수직 클래스 백도어와 달리, 수평 클래스 백도어는 클래스와 무관하게 특정 무해한 특징을 가진 샘플에서만 백도어 효과를 발휘한다.
Abstract
이 연구는 수평 클래스 백도어(HCB)라는 새로운 유형의 백도어 공격을 소개한다. HCB는 기존의 수직 클래스 백도어(VCB)와 달리 클래스 의존성을 제거한다. HCB는 특정 무해한 특징(예: 표정, 날씨 등)을 가진 샘플에서만 백도어 효과를 발휘하며, 그 외의 샘플에서는 정상적으로 작동한다.
실험 결과, HCB 공격은 다양한 작업(MNIST, 얼굴 인식, 교통 표지판 인식, 객체 탐지, 의료 진단 등)에서 높은 효율성과 효과성을 보였다. 또한 11개의 대표적인 방어 기법에 대한 평가에서 HCB가 이를 쉽게 회피할 수 있음을 확인했다. 이는 기존 방어 기법이 클래스 의존적인 통계적 측정에 의존하기 때문이다.
Stats
수평 클래스 백도어 공격은 MNIST 데이터셋에서 99.5%의 공격 성공률을 달성했다.
GTSRB 데이터셋에서 99.2%의 공격 성공률을 달성했다.
CelebA 데이터셋에서 99.2%의 공격 성공률을 달성했다.
Quotes
"기존의 모든 백도어 공격은 수직 클래스 특성에 의존한다."
"수평 클래스 백도어는 클래스와 무관하게 특정 무해한 특징을 가진 샘플에서만 백도어 효과를 발휘한다."
"수평 클래스 백도어는 기존 방어 기법을 쉽게 회피할 수 있다."