Core Concepts
연합 학습 참여 기기의 고품질 데이터 선별과 인센티브 제공을 통해 프라이버시 보호와 모델 성능 향상을 달성하는 기술
Abstract
본 논문은 연합 학습(Federated Learning, FL) 환경에서 프라이버시 보호와 참여 유인 제공을 동시에 달성하는 QI-DPFL(Quality-Aware and Incentive-Boosted Federated Learning with Differential Privacy) 기술을 제안한다.
먼저, 클라이언트 선별 메커니즘을 설계하여 고품질 데이터를 가진 클라이언트를 선별한다. 이를 위해 Earth Mover's Distance(EMD) 지표를 활용하여 클라이언트의 데이터 분포를 평가한다.
다음으로, 선별된 클라이언트와 중앙 서버 간의 상호작용을 두 단계의 Stackelberg 게임으로 모델링한다. 1단계에서 중앙 서버는 정확도 손실과 총 보상 간의 trade-off를 고려하여 최적의 보상을 설계한다. 2단계에서 각 선별 클라이언트는 중앙 서버가 제공한 보상을 바탕으로 자신의 프라이버시 예산을 최적화한다.
제안 기술은 ρ-zero-concentrated differential privacy(ρ-zCDP) 기법을 활용하여 클라이언트가 전송하는 모델 파라미터에 인공 가우시안 노이즈를 추가함으로써 프라이버시 보호를 달성한다.
실험 결과, 제안 기술은 다양한 실세계 데이터셋에서 기존 기술 대비 우수한 모델 성능과 낮은 비용을 달성하였다. 특히 Non-IID 데이터 환경에서 그 우수성이 두드러졌다.
Stats
중앙 서버의 비용 함수 UT는 모델 정확도 손실과 총 보상의 합으로 구성된다.
각 클라이언트의 효용 함수 Ut
i는 중앙 서버로부터 받은 보상과 학습 비용의 차이로 정의된다.
모델 정확도 ϵt는 전체 프라이버시 예산 ρt의 concave 함수로 표현된다.
Quotes
"연합 학습은 개인 데이터를 업로드하지 않고도 다수의 엣지 클라이언트가 협력하여 공유 모델을 학습할 수 있는 혁신적이고 안전한 분산 모델 학습 패러다임으로 인정받고 있다."
"연합 학습 모델 학습 절차에 모바일 엣지 기기의 적극적인 참여를 유도하는 동시에 무선 전송 중 프라이버시 유출 위험을 완화하는 과제는 상대적으로 아직 충분히 탐구되지 않았다."