核心概念
합성 데이터로 사전 학습된 스테레오 매칭 네트워크를 실제 데이터로 미세 조정할 때 도메인 일반화 능력이 심각하게 저하될 수 있다. 이 문제를 해결하기 위해 Ground Truth와 Pseudo Label의 차이를 활용하여 네트워크를 미세 조정하는 새로운 프레임워크를 제안한다.
要約
이 논문은 합성 데이터로 사전 학습된 스테레오 매칭 네트워크를 실제 데이터로 미세 조정할 때 도메인 일반화 능력이 심각하게 저하되는 문제를 다룬다.
먼저 저자들은 Ground Truth(GT)와 Pseudo Label(PL)의 차이를 분석하여 두 가지 주요 원인을 발견했다:
- 불충분한 정규화로 인해 새로운 지식을 학습하는 경우 도메인 일반화 능력이 저하된다.
- GT의 세부 사항에 과적합되는 경우 도메인 일반화 능력이 저하된다.
이를 바탕으로 저자들은 DKT(Dark Knowledge Transfer) 프레임워크를 제안한다. DKT는 고정된 Teacher, 지수 이동 평균(EMA) Teacher, 그리고 Student 네트워크로 구성된다. EMA Teacher는 Student가 학습한 내용을 동적으로 측정하여 GT와 PL을 개선한다. 필터링과 앙상블(F&E) 모듈은 불일치 영역을 제거하고 일관된 영역에서 미세한 변형을 추가하여 도메인 일반화 능력을 보존하면서 타겟 도메인 성능을 향상시킨다.
실험 결과, DKT 프레임워크는 타겟 도메인 성능을 유지하면서 다양한 실제 데이터 시나리오에 대한 강건성을 크게 향상시킨다.
統計
합성 데이터로 사전 학습된 네트워크를 실제 데이터로 미세 조정하면 도메인 일반화 능력이 심각하게 저하될 수 있다.
Ground Truth를 사용하여 미세 조정하면 타겟 도메인 성능은 향상되지만 도메인 일반화 능력이 크게 저하된다.
Pseudo Label을 사용하여 미세 조정하면 도메인 일반화 능력은 유지되지만 타겟 도메인 성능이 저하된다.
引用
"GT 감독에서 불일치 영역을 제거하면 일반화 능력 저하를 효과적으로 완화할 수 있다."
"불일치 영역의 GT만을 사용하여 미세 조정하면 일반화 능력이 심각하게 저하된다."
"일관된 영역의 GT를 사용하여 미세 조정하면 도메인 일반화 능력이 저하된다."