Core Concepts
연합 학습(FL)은 개인 학습 데이터를 공유하지 않고 협력적으로 모델을 학습하는 기술이다. 그러나 FL은 대규모 모델의 높은 통신 비용과 모든 클라이언트와 서버가 동일한 모델 구조를 가져야 한다는 필요성과 같은 문제에 직면한다. 이러한 문제를 해결하기 위해 지식 증류(KD)를 FL에 통합한 연합 증류(FD)가 제안되었다. FD는 모델 매개변수 공유 대신 지식 전달을 가능하게 하여 클라이언트와 서버 간의 더 유연한 지식 전달을 가능하게 한다. 또한 클라이언트와 서버 간 동일한 모델 구조를 요구하지 않음으로써 대규모 모델의 통신 비용을 완화한다.
Abstract
이 논문은 FD에 대한 종합적인 개요를 제공한다. 먼저 FL과 KD의 기본 개념을 소개한다. 이어서 FD의 주요 공식화를 자세히 설명한다. 다음으로 FD가 다양한 FL 과제를 해결하는 방식을 요약한다. 마지막으로 FD의 다양한 응용 분야를 탐색하고 향후 연구 방향을 제시한다.
FD는 클라이언트와 서버 간 모델 매개변수 공유 대신 소프트 레이블 정보를 교환함으로써 통신 비용을 줄이고 클라이언트 모델 구조의 다양성을 허용한다. 또한 KD를 통해 모델 성능을 향상시킬 수 있다.
FD는 데이터 이질성, 시스템 이질성, 모델 이질성 등 다양한 FL 과제를 해결하기 위한 방안을 제시한다. 데이터 이질성 문제에 대해서는 공개 데이터, 합성 데이터, 전역 정렬, 지역 정렬 등의 전략을 활용한다. 시스템 이질성 문제에 대해서는 약한 클라이언트 제거, 자원 균형 조정 등의 방법을 사용한다. 모델 이질성 문제에 대해서는 개인화된 FD, 이기종 앙상블 기반 FD 등의 접근법을 제안한다.
FD는 통신 비용 감소, 프라이버시 보호, 모델 성능 향상 등의 장점을 가지며, 의료, 자연어 처리, 컴퓨터 비전, 산업 공학 등 다양한 분야에 적용되고 있다. 향후 연구에서는 데이터 이질성, 시스템 이질성, 모델 이질성 등 다양한 과제에 대한 더 강력한 해결책 개발이 필요할 것으로 보인다.
Stats
연합 학습은 개인 학습 데이터를 공유하지 않고 협력적으로 모델을 학습하는 기술이다.
연합 학습은 대규모 모델의 높은 통신 비용과 모든 클라이언트와 서버가 동일한 모델 구조를 가져야 한다는 필요성과 같은 문제에 직면한다.
연합 증류는 모델 매개변수 공유 대신 지식 전달을 가능하게 하여 클라이언트와 서버 간의 더 유연한 지식 전달을 가능하게 한다.
연합 증류는 클라이언트와 서버 간 동일한 모델 구조를 요구하지 않음으로써 대규모 모델의 통신 비용을 완화한다.
Quotes
"연합 학습은 개인 학습 데이터를 공유하지 않고 협력적으로 모델을 학습하는 기술이다."
"연합 증류는 모델 매개변수 공유 대신 지식 전달을 가능하게 하여 클라이언트와 서버 간의 더 유연한 지식 전달을 가능하게 한다."
"연합 증류는 클라이언트와 서버 간 동일한 모델 구조를 요구하지 않음으로써 대규모 모델의 통신 비용을 완화한다."