Core Concepts
노드 수준 수직 연합 GNN에 대한 새로운 제로 배경 지식 기반 레이블 추론 공격 기법을 제안한다. 이 기법은 공격자가 사전 지식 없이도 서버가 반환한 경사도를 활용하여 높은 정확도로 레이블을 추론할 수 있다.
Abstract
이 논문은 노드 수준 수직 연합 학습 (VFL) 환경에서 그래프 신경망 (GNN)을 대상으로 하는 새로운 레이블 추론 공격 기법을 제안한다.
제안하는 공격 기법 BlindSage는 공격자가 사전 지식 없이도 서버가 반환한 경사도 정보를 활용하여 높은 정확도로 레이블을 추론할 수 있다. 기존 연구와 달리 BlindSage는 레이블에 대한 사전 지식이 필요하지 않다.
실험 결과, BlindSage는 대부분의 경우 100%의 정확도를 달성했다. 심지어 공격자가 모델 아키텍처와 클래스 수에 대한 정보가 없는 경우에도 90% 이상의 정확도를 보였다.
또한 BlindSage는 경사도 추이를 모니터링하여 최적의 공격 시점을 결정하는 조기 중단 전략을 제안했다. 이를 통해 공격 성능을 더욱 향상시킬 수 있었다.
마지막으로 기존 방어 기법을 테스트했지만, 이들은 주 분류 작업의 성능을 크게 저하시키는 것으로 나타났다. 이에 따라 효과적인 방어 전략에 대한 초기 조사도 수행했다.
Stats
대부분의 경우 BlindSage가 100%의 정확도를 달성했다.
공격자가 모델 아키텍처와 클래스 수에 대한 정보가 없는 경우에도 90% 이상의 정확도를 보였다.
Reddit 데이터셋에 대해 Top-5 정확도가 약 70%를 기록했다.
Quotes
"BlindSage는 공격자가 사전 지식 없이도 서버가 반환한 경사도 정보를 활용하여 높은 정확도로 레이블을 추론할 수 있다."
"실험 결과, BlindSage는 대부분의 경우 100%의 정확도를 달성했다."
"심지어 공격자가 모델 아키텍처와 클래스 수에 대한 정보가 없는 경우에도 90% 이상의 정확도를 보였다."