대규모 언어 모델에서 지속적인 지시 미세 조정 과정에서 일반적인 지식의 망각 현상이 관찰되며, 모델 규모가 증가할수록 망각의 심각성이 증가한다. 또한 디코더 전용 모델인 BLOOMZ가 인코더-디코더 모델인 mT0보다 지식 유지 능력이 더 우수하며, 일반적인 지시 미세 조정이 후속 미세 조정 과정에서 재앙적 망각 현상을 완화할 수 있다.


coremsg

대규모-언어-모델의-지속적-미세-조정-과정에서-발생하는-재앙적-망각-현상에-대한-실증적-연구


대규모 언어 모델의 지속적 미세 조정 과정에서 발생하는 재앙적 망각 현상에 대한 실증적 연구