본 연구는 전통적인 지식 증류(KD) 방법이 교사와 학생 모델의 과제가 다른 경우 효과적이지 않다는 점에 주목한다. 이를 해결하기 위해 역투영 기법을 제안한다. 역투영은 교사 모델의 과제 특정 특징을 효과적으로 제거할 수 있어, 다양한 과제 간 지식 증류에서 성능 향상을 달성할 수 있다.
실험 결과, 역투영을 사용하면 깊이 추정, 의미 분할, 이미지 변환 등 다양한 과제에서 최대 7.47%의 성능 향상을 얻을 수 있다. 특히 교사 모델이 무작위로 초기화된 경우에도 성능 향상이 가능하다.
이를 통해 저자들은 지식 증류 손실 함수를 지식 전달 및 스펙트럼 정규화 항으로 분해할 수 있음을 보였다. 이를 바탕으로 교사 모델 없이도 성능 향상을 달성할 수 있는 새로운 정규화 손실 함수를 제안하였다.
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Dylan Auty,R... lúc arxiv.org 03-22-2024
https://arxiv.org/pdf/2403.14494.pdfYêu cầu sâu hơn