Conceitos essenciais
데이터 이질성이 높은 환경에서 유사성 기반 클러스터링을 통해 연합 학습의 효율성을 높일 수 있다.
Resumo
이 연구는 연합 학습에서 클라이언트 선택 전략을 개선하기 위해 다양한 통계적 유사성 지표를 활용하는 방법을 제안한다.
연합 학습에서는 매 라운드마다 일부 클라이언트만 선택되어 모델 업데이트에 참여하는데, 이때 무작위 선택 방식은 중복되는 정보를 전송하게 되어 비효율적일 수 있다.
이에 저자들은 클라이언트의 데이터 분포 유사성을 측정하여 클러스터링하고, 각 클러스터에서 하나의 클라이언트를 선택하는 방식을 제안한다.
실험 결과, 데이터 이질성이 높은 환경에서 유사성 기반 클러스터링을 적용하면 필요한 라운드 수를 크게 줄일 수 있으며, 에너지 소비도 23.93%에서 41.61% 감소할 수 있다.
특히 1-Wasserstein 거리 지표를 사용한 경우 라운드 수가 무작위 선택 대비 4.5배 이상 감소하는 등 우수한 성능을 보였다.
반면 데이터 분포가 균일한 환경에서는 유사성 기반 방식의 이점이 크지 않았다.
Estatísticas
데이터 이질성이 높은 환경(β=0.05)에서 1-Wasserstein 거리 지표를 사용하면 무작위 선택 대비 라운드 수가 4.5배 이상 감소한다.
데이터 이질성이 높은 환경(β=0.05)에서 유사성 기반 클러스터링을 사용하면 에너지 소비가 23.93%에서 41.61% 감소할 수 있다.
Citações
"데이터 이질성이 높은 환경에서 유사성 기반 클러스터링을 적용하면 필요한 라운드 수를 크게 줄일 수 있으며, 에너지 소비도 23.93%에서 41.61% 감소할 수 있다."
"1-Wasserstein 거리 지표를 사용한 경우 라운드 수가 무작위 선택 대비 4.5배 이상 감소하는 등 우수한 성능을 보였다."