핵심 개념
비지도 사전 훈련의 일반화 능력을 향상시키기 위한 중요한 요인과 새로운 이론적 프레임워크를 소개하고, 이를 통해 효과적인 사전 훈련 알고리즘을 설계하는 방법을 밝힘.
초록
최근 비지도 학습의 발전으로 사전 훈련 및 세밀 조정이 모델의 일반화를 향상시킬 수 있다는 것이 밝혀짐.
이 논문은 사전 훈련 데이터의 통계적 이질성과 작업 다양성을 고려한 새로운 이론적 프레임워크를 제시함.
사전 훈련된 표현 모델의 복잡성과 분포 불일치가 세밀 조정된 모델의 일반화에 영향을 미침.
실험 결과는 Rademacher 표현 정규화가 세밀 조정 모델의 성능을 향상시킬 수 있음을 입증함.
통계
사전 훈련 데이터의 크기: 50,000 이미지
세밀 조정 데이터의 크기: 4,096 샘플
RadReg 정규화 계수: 10^-5
인용구
"우리의 이론은 사전 훈련된 표현 모델의 복잡성과 세밀 조정 모델의 일반화에 영향을 미치는 네 가지 요인에 의존한다."
"Rademacher 표현 정규화는 사전 훈련 단계에서 표현 복잡성을 제한하여 최종적으로 세밀 조정된 모델의 성능을 향상시킬 수 있다."