이 논문은 합성 데이터로 사전 학습된 스테레오 매칭 네트워크를 실제 데이터로 미세 조정할 때 도메인 일반화 능력이 심각하게 저하되는 문제를 다룬다.
먼저 저자들은 Ground Truth(GT)와 Pseudo Label(PL)의 차이를 분석하여 두 가지 주요 원인을 발견했다:
이를 바탕으로 저자들은 DKT(Dark Knowledge Transfer) 프레임워크를 제안한다. DKT는 고정된 Teacher, 지수 이동 평균(EMA) Teacher, 그리고 Student 네트워크로 구성된다. EMA Teacher는 Student가 학습한 내용을 동적으로 측정하여 GT와 PL을 개선한다. 필터링과 앙상블(F&E) 모듈은 불일치 영역을 제거하고 일관된 영역에서 미세한 변형을 추가하여 도메인 일반화 능력을 보존하면서 타겟 도메인 성능을 향상시킨다.
실험 결과, DKT 프레임워크는 타겟 도메인 성능을 유지하면서 다양한 실제 데이터 시나리오에 대한 강건성을 크게 향상시킨다.
Till ett annat språk
från källinnehåll
arxiv.org
Djupare frågor