핵심 개념
본 논문에서는 알려지지 않은 악의적인 백도어 공격을 방어하기 위해 능동적으로 방어 백도어를 주입하는 새로운 방어 메커니즘인 PDB(Proactive Defensive Backdoor)를 제안합니다.
초록
능동적 방어 백도어 주입을 통한 백도어 공격 완화: 연구 논문 요약
Wei, S., Zha, H., & Wu, B. (2024). Mitigating Backdoor Attack by Injecting Proactive Defensive Backdoor. Advances in Neural Information Processing Systems, 38. https://arxiv.org/abs/2405.16112v2
본 연구는 딥러닝 모델에 대한 데이터 포이즈닝 백도어 공격을 완화하는 새로운 방법을 제시하는 것을 목표로 합니다. 연구진은 공격자가 데이터 세트의 일부를 조작하여 훈련 중에 모델에 백도어를 삽입할 수 있는 상황에서 안전한 모델을 훈련하는 방법을 모색했습니다.