Core Concepts
공변량 이동 하에서 최소 노름 보간기의 일반화 성능을 이론적으로 분석하고, 과대 매개변수화 정도에 따른 유익한 이동과 해로운 이동을 분류하였다.
Abstract
이 논문은 공변량 이동 하에서 최소 노름 보간기의 일반화 성능을 이론적으로 분석하였다.
먼저, 분산 및 편향 항에 대한 상한과 하한을 도출하였다. 이를 통해 공변량 이동의 유익성 및 해로움을 판단할 수 있는 기준을 제시하였다.
과대 매개변수화 정도에 따라 공변량 이동을 유익한 이동과 해로운 이동으로 구분하였다. 과대 매개변수화가 심한 경우, 상위 k개 성분의 이동만이 중요하며 하위 p-k개 성분의 이동은 무시할 수 있다. 반면 과대 매개변수화가 약한 경우, 상위 k개 성분과 하위 p-k개 성분의 이동이 상호작용하여 비표준적인 이동 행태를 보인다.
실험 결과, 선형 모델과 신경망 모델 모두에서 이론적 분석 결과와 부합하는 경향을 확인하였다. 특히 입력 차원이 훈련 샘플 수보다 큰 경우, 신경망 모델이 최소 노름 보간기와 유사한 행태를 보였다.
Stats
과대 매개변수화 정도를 나타내는 지표 Rk/n이 클수록 공변량 이동에 더 강인하다.
상위 k개 성분의 이동 강도 α가 1보다 작으면 유익한 이동, 1보다 크면 해로운 이동이 나타난다.
하위 p-k개 성분의 이동 강도 β가 1보다 작으면 유익한 이동, 1보다 크면 해로운 이동이 나타난다.
Quotes
"우리는 공변량 이동 하에서 최소 노름 보간기의 일반화 성능을 이론적으로 분석하였다."
"과대 매개변수화 정도에 따라 공변량 이동을 유익한 이동과 해로운 이동으로 구분할 수 있다."
"입력 차원이 훈련 샘플 수보다 큰 경우, 신경망 모델이 최소 노름 보간기와 유사한 행태를 보였다."