Core Concepts
가우시안 혼합 분포를 따르는 입력 데이터에 대해서도 표준화를 적용하면 기존 이론의 예측과 일치하는 신경망 동역학이 관찰된다.
Abstract
이 연구는 가우시안 혼합 분포를 따르는 입력 데이터에 대한 신경망 동역학을 분석하였다. 기존 연구에서는 단순 가우시안 분포를 따르는 입력 데이터에 대한 신경망 동역학을 분석하였지만, 실제 데이터는 가우시안 혼합 분포를 따르는 경우가 많다.
연구 결과, 가우시안 혼합 분포를 따르는 입력 데이터에 대해서도 표준화를 적용하면 기존 이론의 예측과 일치하는 신경망 동역학이 관찰되었다. 이는 비선형 활성화 함수의 특성 때문인 것으로 분석되었다. 즉, 비선형 활성화 함수에서 고차 모멘트의 영향이 작아 분포의 1, 2차 모멘트에 의해 동역학이 주도된다.
이를 통해 기존 이론의 적용 범위를 가우시안 혼합 분포까지 확장할 수 있게 되었다. 이는 실제 데이터에 더 부합하는 신경망 동역학 이해를 가능하게 한다.
Stats
가우시안 혼합 분포의 KL 발산이 증가할수록 표준화하지 않은 경우 신경망 동역학이 기존 이론과 크게 벗어나지만, 표준화한 경우 기존 이론과 거의 일치한다.
Quotes
"가우시안 혼합 분포를 따르는 입력 데이터에 대해서도 표준화를 적용하면 기존 이론의 예측과 일치하는 신경망 동역학이 관찰된다."
"비선형 활성화 함수의 특성 때문에 분포의 1, 2차 모멘트에 의해 동역학이 주도된다."