본 연구는 딥러닝 모델의 백도어 공격 탐지를 위한 One-class 그래프 임베딩 분류 기법(OCGEC)을 제안한다. OCGEC는 먼저 소량의 깨끗한 데이터로 다수의 작은 모델을 학습하고, 이를 그래프 구조로 변환한다. 이후 그래프 자동 인코더(GAE)를 이용하여 그래프 데이터의 특징을 추출하고, One-class 분류 기법을 통해 정상 모델과 백도어 모델을 구분한다. 실험 결과, OCGEC는 다양한 백도어 공격에 대해 98% 이상의 높은 탐지 성능을 보였으며, 기존 방법들에 비해 월등한 성능을 보였다. 또한 OCGEC는 백도어 공격 전략에 대한 사전 지식이 필요 없어 실제 환경에 적용하기 용이하다.
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問