이 논문은 생성 모델이 자신이 생성한 데이터로 학습하는 폐쇄 루프 학습 과정을 분석한다.
먼저 생성 모델의 온도 매개변수에 따른 세 가지 경우로 나누어 분석한다:
이러한 퇴화 현상은 모델의 학습 정확도와 초기 데이터 분포 유지 사이의 근본적인 트레이드오프를 보여준다. 정확한 모델일수록 데이터 분포가 더 빨리 퇴화된다. 따라서 초기 데이터를 보존하고 주기적으로 재주입하는 것이 중요하다.
이 결과는 대규모 생성 모델이 인터넷 데이터로 학습할 때 발생할 수 있는 문제를 예측한다. 모델이 생성한 데이터가 다시 모델의 학습에 포함되면 결국 모든 지식이 소실될 수 있다.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Matteo March... at arxiv.org 04-04-2024
https://arxiv.org/pdf/2404.02325.pdfDeeper Inquiries