核心概念
다중 소스 도메인 적응은 레이블이 있는 여러 소스 도메인에서 학습한 지식을 레이블이 없거나 부족한 타겟 도메인으로 전이하는 강력하고 실용적인 접근법이다.
要約
이 논문은 다중 소스 도메인 적응(MDA)에 대한 체계적인 조사를 제공한다. 먼저 다양한 MDA 전략을 정의하고 설명한다. 그런 다음 깊은 학습 시대의 현대 MDA 방법을 다양한 관점에서 체계적으로 요약하고 비교한다. 일반적으로 사용되는 데이터셋과 간단한 벤치마크도 제공한다. 마지막으로 향후 MDA 연구 방향에 대해 논의한다.
MDA 방법은 크게 3가지 범주로 분류할 수 있다:
- 잠재 공간 변환: 도메인 불변 특징 표현을 학습하는 방법으로, 거리 기반 방법, 적대적 정렬 방법, 자기 지도 기반 방법 등이 있다.
- 중간 도메인 생성: 픽셀 수준의 정렬을 위해 GAN 등을 이용해 중간 도메인을 생성하는 방법이다.
- 작업 분류기 정제: 소스 분류기를 타겟 도메인에 맞게 정제하는 방법으로, 의사 레이블 기반 분류기 학습, 결정 경계 정제, 범주 수준 정렬 등이 있다.
이 외에도 도메인 페어링 전략, 특징 추출기 가중치 공유 전략, 도메인/샘플 가중치 전략 등 다양한 매칭 전략이 고려된다.
실험 결과, MDA 방법은 단일 소스 적응에 비해 성능이 크게 향상되지만, 여전히 오라클 성능과 큰 격차가 있어 추가적인 연구가 필요하다.
統計
단일 소스 적응 방법의 MNIST-M 데이터셋 정확도는 52.3%에 불과하지만, 타겟 데이터로 학습하면 96.0%까지 향상된다.
단일 소스 적응 방법의 Cityscapes 데이터셋 mIoU는 38.7%에 불과하지만, 다중 소스 적응 방법인 MSCAN은 53.2%까지 향상시킬 수 있다.
引用
"직접 전이하면 도메인 간 차이로 인해 성능이 크게 저하될 수 있다."
"다중 소스 도메인 적응은 레이블이 있는 여러 소스 도메인에서 학습한 지식을 레이블이 없거나 부족한 타겟 도메인으로 전이하는 강력하고 실용적인 접근법이다."