Core Concepts
연합 학습 환경에서 GAN을 활용하여 데이터 불완전성 문제를 해결하고 모델 성능을 향상시킬 수 있다.
Abstract
연합 학습(Federated Learning, FL)은 데이터를 공유하지 않고 분산된 장치들이 협력하여 모델을 학습하는 기술이다.
데이터 불완전성은 FL에서 주요한 문제로, 일부 클래스의 데이터가 부족하거나 노드 간 데이터 양이 불균형한 경우가 발생할 수 있다.
이 연구에서는 FLIGAN이라는 새로운 방법을 제안한다. FLIGAN은 생성적 적대 신경망(GAN)을 활용하여 노드별로 합성 데이터를 생성하고, 이를 단계적으로 FL 모델 학습에 활용한다.
FLIGAN은 클래스별 샘플링과 노드 그룹화 기법을 사용하여 합성 데이터의 품질을 높이고, 과적합을 방지한다.
실험 결과, FLIGAN은 기존 FL 기법 대비 최대 20%의 정확도 향상을 보였다.
Stats
데이터 불완전성이 심한 경우 FLIGAN은 기존 FL 기법 대비 최대 20%의 정확도 향상을 달성할 수 있다.
FLIGAN은 합성 데이터를 단계적으로 추가하면서 모델을 학습하는데, 이때 최대 23%의 합성 데이터를 추가하였다.
Quotes
"데이터 불완전성은 FL에서 주요한 문제로, 일부 클래스의 데이터가 부족하거나 노드 간 데이터 양이 불균형한 경우가 발생할 수 있다."
"FLIGAN은 클래스별 샘플링과 노드 그룹화 기법을 사용하여 합성 데이터의 품질을 높이고, 과적합을 방지한다."