Core Concepts
연합학습과 차등 프라이버시의 통합은 대규모 데이터를 활용하면서도 개인정보를 보호할 수 있는 실용적인 AI 서비스를 가능하게 한다.
Abstract
이 논문은 연합학습(Federated Learning, FL)과 차등 프라이버시(Differential Privacy, DP)의 통합에 대해 체계적으로 소개한다.
먼저 FL과 DP의 개념 및 특징을 설명하고, 이들의 결합이 가져올 수 있는 이점을 논의한다. 이어서 현재 연구 동향을 바탕으로 다양한 FL-DP 패러다임을 분류하고 소개한다.
이후 실용적인 FL-DP 시스템을 위한 핵심 최적화 원칙을 제시한다. 구체적으로 DP 관점에서의 노이즈 감소, 프라이버시 손실 추적 등의 기술과 FL 관점에서의 업데이트 빈도 감소, 모델 압축 등의 기술을 다룬다.
마지막으로 LLM 파인튜닝, 데이터 스트림 처리, 강건성, 공정성, 잊힐 권리 등 FL-DP 통합에 있어 남은 과제와 연구 방향을 논의한다.
Stats
연합학습은 중앙 서버와 클라이언트 간 협력을 통해 지리적으로 분산된 데이터로 ML 모델을 학습할 수 있다.
차등 프라이버시는 개인정보 유출을 엄격하게 제한하는 프라이버시 보장 기법이다.
연합학습과 차등 프라이버시의 결합은 대규모 데이터 활용과 개인정보 보호를 동시에 달성할 수 있다.
Quotes
"연합학습은 원격 클라이언트들이 협력하여 ML 모델을 학습할 수 있게 하며, 이를 통해 데이터 분산 문제를 해결할 수 있다."
"차등 프라이버시는 개인정보 유출을 엄격하게 제한하는 프라이버시 보장 기법으로, 연합학습과 결합하면 실용적인 AI 서비스를 구현할 수 있다."