이 연구는 데이터 메시 패러다임에 연합 학습 기법을 통합하는 방안을 제안한다. 데이터 메시는 도메인 단위의 데이터 소유권 분산, 데이터 제품 개념, 자체 서비스 데이터 플랫폼, 연방 거버넌스 등의 핵심 원칙을 가지고 있다. 이러한 분산 데이터 아키텍처에서 전통적인 중앙집중식 기계 학습은 여러 도메인에 걸친 효과적인 분석을 수행하기 어려운 문제가 있다.
이에 본 연구에서는 연합 학습을 데이터 메시에 통합하는 선구적인 접근법을 소개한다. 이를 통해 데이터 소유권 분산, 프라이버시 보호, 분산 데이터 분석 전략을 실현할 수 있다. 구체적으로 두 가지 시나리오를 구현하였는데, 하나는 라벨 공유 환경, 다른 하나는 라벨 비공개 환경이다. 이를 바탕으로 소매 산업의 개인화 추천 시스템과 금융 기관의 사기 탐지 시스템 등 두 가지 실제 사례를 제시하였다. 실험 결과, 제안한 연합 학습 기반 솔루션은 데이터 규모 확장에 따른 안정적인 성능을 보였으며, 데이터 도메인 간 다양성 활용을 통해 예측 성능을 향상시킬 수 있음을 확인하였다.
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Haoyuan Li,S... kl. arxiv.org 03-27-2024
https://arxiv.org/pdf/2403.17878.pdfDybere Forespørgsler