Core Concepts
두 층 신경망은 커널 방법보다 데이터 의존적 커널을 학습할 수 있으며, 이를 통해 다중 RKHS 유니온에 대해 더 나은 샘플 복잡도를 달성할 수 있다.
Abstract
이 논문은 두 층 신경망의 특징 학습 능력을 커널 방법의 관점에서 연구한다. 두 시간 규모 극한을 사용하여 첫 번째 층의 커널 동역학을 분석하고, 이를 통해 다음을 보여준다:
평균장 랑주뱅 동역학의 전역 수렴을 보이고, 시간 및 입자 이산화 오차를 도출한다.
두 층 신경망이 다중 RKHS 유니온에 대해 커널 방법보다 더 효율적으로 학습할 수 있음을 보인다.
첫 번째 층에 의해 유도된 커널이 타깃 함수와 정렬되도록 움직이며, 내재 잡음으로 인해 자유도가 증가하는 편향이 발생함을 보인다.
라벨 노이즈 절차를 제안하여 자유도를 줄이고 전역 최적점에 선형 수렴함을 보인다.
Stats
입력 차원 d가 클수록 평균장 신경망이 커널 방법보다 더 적은 샘플로 Barron 공간을 학습할 수 있다.
초기 커널 정렬은 O(1/√d)이지만, 학습 후 커널 정렬은 Ω(1)으로 향상된다.
내재 잡음이 증가할수록 자유도가 증가한다.
Quotes
"두 층 신경망은 데이터 의존적 커널을 학습할 수 있으며, 이를 통해 커널 방법보다 더 나은 샘플 복잡도를 달성할 수 있다."
"내재 잡음은 자유도에 편향을 유발하며, 라벨 노이즈 절차를 통해 이를 완화할 수 있다."