이 논문은 검은 상자 지식 증류(B2KD) 문제를 다룬다. B2KD는 클라우드 서버에 배포된 교사 모델의 내부 구조와 매개변수를 알 수 없는 상황에서 학생 모델을 압축하는 문제이다.
저자들은 먼저 탈개인화(deprivatization) 및 증류(distillation)의 2단계 워크플로를 제안한다. 탈개인화 단계에서는 생성 모델을 사용하여 교사 모델의 역 매핑을 에뮬레이션한다. 이를 통해 개인정보가 제거된 합성 이미지를 생성할 수 있다.
증류 단계에서는 합성 이미지를 교사 모델에 입력하여 고차원 이미지 공간에서의 거리를 최소화함으로써 학생 모델의 로짓을 교사 모델의 로짓에 정렬한다. 이는 기존 방식과 다른 최적화 방향을 제공한다.
실험 결과, 제안된 방법인 MEKD는 다양한 벤치마크에서 기존 방법들을 능가하는 성능을 보였다. 또한 제한된 쿼리 샘플 및 도메인 시프트 상황에서도 강건한 결과를 보였다.
Na inny język
z treści źródłowej
arxiv.org
Głębsze pytania