신경망 모델의 매개변수 학습 과정에서 발생하는 취약점을 분석하고, 설명 인식 백도어 공격에 대한 효과적인 방어 기법을 제안한다.
데이터 오염 공격으로부터 신경망을 효과적으로 방어하기 위해 특성 벡터 기반의 새로운 접근법을 제안한다. 이 방법은 다양한 데이터 오염 기법에 대해 강건하며, 최종 모델의 성능을 크게 저하시키지 않는다.