Core Concepts
본 연구는 최적 전송과 연합 학습을 결합하여 다중 소스 도메인 적응 문제를 해결하는 새로운 프레임워크를 제안한다. 이 프레임워크는 개별 소스 도메인에 대한 최적 전송 기반 적응과 연합 학습을 통한 협업적 모델 학습을 포함한다. 또한 프라이버시 보호를 위해 소스 도메인의 데이터에 직접 접근하지 않고도 효과적인 적응이 가능하다.
Abstract
본 연구는 다중 소스 도메인 적응 문제를 해결하기 위해 최적 전송과 연합 학습을 결합한 새로운 프레임워크를 제안한다. 이 프레임워크는 두 단계로 구성된다.
최적 전송 기반 적응 단계:
각 소스 도메인은 최적 전송을 사용하여 타겟 도메인과의 도메인 시프트를 줄이는 새로운 데이터 표현을 생성한다.
타겟 도메인의 소량의 의사 레이블 데이터를 활용하여 새로운 표현의 품질을 평가하고, 개선이 있는 경우 해당 표현을 사용한다.
연합 학습 기반 적응 단계:
각 소스 도메인은 자신의 모델 가중치를 서버에 전송한다.
서버는 타겟 도메인의 의사 레이블 데이터를 사용하여 각 소스 모델의 성능을 평가하고, 이를 가중치로 사용하여 최종 모델을 업데이트한다.
이를 통해 데이터 프라이버시를 보장하면서도 다중 소스 정보를 효과적으로 활용할 수 있다.
실험 결과, 제안 방법인 FMDA-OT가 기존 방법들에 비해 우수한 성능을 보였다. 특히 연합 학습 단계에서 각 소스 모델의 성능 변화를 고려하여 동적으로 적응함으로써 안정적인 성능 향상을 달성했다.
Stats
각 소스 도메인의 데이터 크기는 ni개이다.
타겟 도메인의 데이터 크기는 m개이다.
각 소스 도메인의 데이터 분포는 Si이고, 타겟 도메인의 데이터 분포는 T이다.
소스 도메인들 간의 분포 차이와 소스-타겟 도메인 간의 분포 차이가 존재한다.
Quotes
"다중 소스 도메인 적응은 레이블이 있는 다수의 소스 도메인과 레이블이 없는 타겟 도메인 간의 도메인 시프트 문제를 해결하는 것을 목표로 한다."
"연합 학습은 데이터를 공유하지 않고도 다수의 클라이언트가 협력하여 모델을 학습할 수 있게 해준다."
"최적 전송은 소스 도메인과 타겟 도메인 간의 도메인 시프트를 효과적으로 줄일 수 있다."