이 논문은 의료 기반 모델의 성능 향상과 배포 비용 절감을 위해 "지식 분해"라는 새로운 관점을 제안한다.
기반 모델의 일반적인 특징 추출 능력에도 불구하고, 특정 과제에서의 성능은 여전히 과제 특화 방법에 미치지 못한다. 이는 현재 기반 모델이 일반성과 특화를 동시에 보장하지 못하기 때문이다.
지식 분해는 기반 모델을 다수의 경량 전문가 모델로 분해하여, 각 전문가 모델이 특정 도메인에 전문화되도록 한다. 이를 통해 특정 도메인에서의 전문화 성능을 높이고 배포 비용을 낮출 수 있다.
저차원 전문가 모듈과 효율적인 지식 분리 합성곱을 도입하여 기반 모델을 분해한다. 저차원 전문가 모듈은 매개변수 효율성과 충분한 특징 표현 능력을 제공하고, 효율적인 지식 분리 합성곱은 단일 순전파에서 과제별 지식을 분리할 수 있다.
실험 결과, 제안 방법인 LoRKD는 성능과 전이성 측면에서 우수한 결과를 보였다. 또한 매개변수 수와 계산 효율성 측면에서도 장점을 보였다.
Till ett annat språk
från källinnehåll
arxiv.org
Djupare frågor