핵심 개념
본 연구는 얼굴 인식 시스템에 대한 모방 공격과 회피 공격의 성능을 동시에 향상시키는 새로운 공격 방법을 제안한다.
초록
본 연구는 얼굴 인식 시스템에 대한 두 가지 유형의 적대적 공격, 즉 모방 공격과 회피 공격에 대해 탐구한다. 연구진은 기존의 모방 공격만으로는 회피 공격의 성공을 보장하지 않는다는 것을 확인했다. 이를 해결하기 위해 새로운 공격 방법인 Pre-training Pruning Restoration Attack (PPR)을 제안했다.
PPR 방법은 다음과 같은 단계로 구성된다:
사전 학습 단계: 모방 공격과 회피 공격을 동시에 수행하는 Lagrangian 공격을 사용하여 적대적 얼굴 예제를 생성한다.
가지치기 단계: 적대적 예제의 중요도를 평가하고, 중요도가 낮은 부분의 적대적 perturbation을 제거한다.
복원 단계: 가지치기된 영역에 회피 공격에 유리한 적대적 perturbation을 추가하여 회피 공격 성능을 향상시킨다.
실험 결과, PPR 방법은 기존 공격 방법에 비해 회피 공격 성능을 크게 향상시키면서도 모방 공격 성능을 유지할 수 있음을 보여주었다. 이는 실제 응용 시나리오에서 중요한 의미를 가진다.
통계
적대적 예제의 중요도를 평가하기 위해 |xadv - xs|를 계산한다.
가지치기 단계에서 전체 적대적 perturbation의 20%를 제거한다.
인용구
"기존 모방 공격만으로는 회피 공격의 성공을 보장하지 않는다."
"PPR 방법은 모방 공격 성능을 유지하면서도 회피 공격 성능을 크게 향상시킬 수 있다."