Core Concepts
신경망은 입력 공간의 반공간 교차로 표현되는 단순한 특징을 학습하고 이를 선형적으로 결합하여 학습한다.
Abstract
이 논문은 신경망 특징 학습에 대한 새로운 관점을 제시한다. 기존에는 신경망이 단순히 커널 방법을 구현하거나 복잡한 계층적 특징을 학습한다는 두 가지 극단적인 견해가 있었다.
저자들은 신경망을 전문가의 혼합체로 해석하여 중간적인 관점을 제시한다. 신경망의 각 경로는 입력 공간의 반공간 교차로 표현되는 단순한 특징을 학습하고, 이를 선형적으로 결합하여 최종 모델을 학습한다.
이를 바탕으로 저자들은 Deep Linearly Gated Network(DLGN)이라는 새로운 모델을 제안한다. DLGN은 선형 신경망과 ReLU 신경망의 중간 지점에 위치하며, 비선형 특징을 학습할 수 있지만 각 특징은 단순한 반공간 교차로 표현된다.
저자들은 DLGN을 통해 신경망 특징 학습 메커니즘을 분석하였다. 초기 학습 단계에서 신경망은 입력 공간의 저주파 영역에 집중하여 특징을 학습하고, 이후 단계에서 고주파 영역으로 확장한다. 이는 경사하강법의 단순성 편향을 보여주는 것으로, 향후 이를 극복할 수 있는 최적화 알고리즘 개발이 필요할 것으로 보인다.
Stats
신경망은 입력 공간의 저주파 영역에 더 많은 경로를 할당한다.
신경망의 경험적 NTK는 학습 과정에서 크게 변화한다.
Quotes
"신경망은 입력 공간의 반공간 교차로 표현되는 단순한 특징을 학습하고 이를 선형적으로 결합하여 학습한다."
"초기 학습 단계에서 신경망은 입력 공간의 저주파 영역에 집중하여 특징을 학습하고, 이후 단계에서 고주파 영역으로 확장한다."