Core Concepts
프롬프트 전이 기법에 지식 증류 기술을 도입하여 프롬프트 기반 미세 조정의 성능을 향상시킴
Abstract
이 논문은 프롬프트 전이(Prompt Transfer, PoT) 기법의 한계를 해결하기 위해 지식 증류 기술을 도입한 새로운 접근법인 PANDA를 제안한다.
첫째, 기존 PoT 기법은 소스 과제와 타겟 과제 간 유사성에 민감하고 소스 프롬프트를 직접 미세 조정하면 유용한 일반 지식이 망각되는 문제가 있다.
둘째, PANDA는 새로운 프롬프트 전이 가능성 측정 지표를 제안하여 유사한 소스 과제를 선별하고, 지식 증류 기술을 활용하여 소스 과제의 지식을 타겟 프롬프트로 효과적으로 전이시킨다.
셋째, 189개의 소스-타겟 과제 조합과 5가지 규모의 언어 모델에 대한 실험 결과, PANDA가 기존 PoT 대비 평균 2.3% 성능 향상(최대 24.1%)을 달성했으며, 프롬프트 기반 미세 조정이 모델 기반 미세 조정보다 경쟁력 있거나 더 나은 성능을 보였다.
Stats
프롬프트 전이 기법은 소스 과제에서 학습한 프롬프트를 타겟 과제에 초기화하여 성능을 향상시킬 수 있다.
그러나 소스-타겟 과제 간 유사성에 민감하고 직접 미세 조정하면 유용한 일반 지식이 망각되는 문제가 있다.
Quotes
"프롬프트 전이(PoT)는 최근 제안된 접근법으로, 유사한 소스 과제에서 학습한 프롬프트를 타겟 과제의 초기화에 사용하여 프롬프트 미세 조정을 개선한다."
"그러나 이러한 기존 PoT 접근법은 종종 최적의 성능을 달성하지 못하는데, 이는 (i) PoT가 소스-타겟 쌍의 유사성에 민감하고 (ii) 소스 프롬프트로 초기화된 프롬프트를 타겟 과제에 직접 미세 조정하면 소스 과제에서 학습한 유용한 일반 지식이 망각될 수 있기 때문이다."