이 논문은 언어 모델의 성능 악화 현상인 "모델 붕괴"를 이해하기 위한 통계적 모델을 제시한다.
논문은 이론적 분석과 실험을 통해 이러한 결과를 뒷받침한다. 특히 완전 합성 데이터 학습 시 모델 분포가 디락 분포로 수렴하는 "완전 붕괴"를 보여주고, 부분 합성 데이터 학습 시 실제 데이터와의 분포 차이를 정량화한다.
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Mohamed El A... alle arxiv.org 04-09-2024
https://arxiv.org/pdf/2404.05090.pdfDomande più approfondite