المفاهيم الأساسية
비지도 사전 훈련의 일반화 능력을 향상시키기 위한 중요한 요인과 새로운 이론적 프레임워크를 소개하고, 이를 통해 효과적인 사전 훈련 알고리즘을 설계하는 방법을 밝힘.
الإحصائيات
사전 훈련 데이터의 크기: 50,000 이미지
세밀 조정 데이터의 크기: 4,096 샘플
RadReg 정규화 계수: 10^-5
اقتباسات
"우리의 이론은 사전 훈련된 표현 모델의 복잡성과 세밀 조정 모델의 일반화에 영향을 미치는 네 가지 요인에 의존한다."
"Rademacher 표현 정규화는 사전 훈련 단계에서 표현 복잡성을 제한하여 최종적으로 세밀 조정된 모델의 성능을 향상시킬 수 있다."