본 연구는 기존의 단일 과제 지식 증류 방식의 한계를 극복하고자 다중 과제 지식 증류를 위한 새로운 투영 기법을 제안한다.
기존의 단일 과제 지식 증류 방식은 교사 모델과 학생 모델이 동일한 과제를 학습하는 경우에 효과적이지만, 서로 다른 과제를 학습하는 경우에는 성능 향상이 제한적이다.
이를 해결하기 위해 본 연구에서는 "역 투영" 기법을 제안한다. 이 기법은 교사 모델의 과제 특정적 특징을 효과적으로 제거하여 학생 모델의 성능을 향상시킬 수 있다.
실험 결과, 역 투영 기법을 사용하면 다양한 과제 쌍에서 최대 7.47%의 성능 향상을 달성할 수 있다. 특히 교사 모델과 학생 모델의 과제가 크게 다른 경우에 효과적이다.
또한 투영 행렬의 특이값 분해 분석을 통해 지식 전달과 스펙트럼 정규화 성분으로 증류 손실 함수를 분해할 수 있음을 보였다. 이를 바탕으로 교사 모델 없이도 성능 향상을 달성할 수 있는 새로운 정규화 손실 함수를 제안하였다.
Til et annet språk
fra kildeinnhold
arxiv.org
Viktige innsikter hentet fra
by Dylan Auty,R... klokken arxiv.org 03-22-2024
https://arxiv.org/pdf/2403.14494.pdfDypere Spørsmål