본 연구는 딥러닝 모델의 백도어 공격 탐지를 위한 One-class 그래프 임베딩 분류 기법(OCGEC)을 제안한다. OCGEC는 먼저 소량의 깨끗한 데이터로 다수의 작은 모델을 학습하고, 이를 그래프 구조로 변환한다. 이후 그래프 자동 인코더(GAE)를 이용하여 그래프 데이터의 특징을 추출하고, One-class 분류 기법을 통해 정상 모델과 백도어 모델을 구분한다. 실험 결과, OCGEC는 다양한 백도어 공격에 대해 98% 이상의 높은 탐지 성능을 보였으며, 기존 방법들에 비해 월등한 성능을 보였다. 또한 OCGEC는 백도어 공격 전략에 대한 사전 지식이 필요 없어 실제 환경에 적용하기 용이하다.
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Haoyu Jiang,... lúc arxiv.org 04-09-2024
https://arxiv.org/pdf/2312.01585.pdfYêu cầu sâu hơn