Core Concepts
제안된 VGAE-MP 공격은 학습 데이터에 의존하지 않고 악성 로컬 모델을 생성하여 연방 학습 프로세스를 조작하고 전체 학습 정확도를 점진적으로 저하시킬 수 있다.
Abstract
이 논문은 연방 학습(FL)에 대한 새로운 데이터 비의존 모델 오염(MP) 공격인 VGAE-MP를 제안한다. VGAE-MP 공격은 악성 로컬 모델을 생성하기 위해 양호한 로컬 모델의 청취만을 활용한다. 이를 위해 적대적 변분 그래프 자동 인코더(VGAE)를 확장하여 데이터 접근 없이도 로컬 모델 간 상관관계를 추출하고 조작한다.
VGAE-MP 공격은 다음과 같이 작동한다:
공격자는 양호한 로컬 모델 업데이트를 청취한다.
공격자는 VGAE를 사용하여 로컬 모델 간 상관관계를 학습하고 조작한다.
공격자는 조작된 상관관계와 양호한 모델 특징을 활용하여 악성 로컬 모델을 생성한다.
악성 로컬 모델은 서버에 업로드되어 전역 모델을 점진적으로 왜곡시킨다.
실험 결과, VGAE-MP 공격은 연방 학습 정확도를 점진적으로 저하시키고 기존 방어 메커니즘을 우회할 수 있음을 보여준다.
Stats
연방 학습 정확도가 점진적으로 50%에서 80% 사이에서 변동하며 저하된다.