Core Concepts
스파이킹 신경망에서 대리 경사 학습은 이론적 기반이 명확하지 않았지만, 스토캐스틱 자동 미분 프레임워크를 통해 이론적 근거를 제공할 수 있다.
Abstract
이 논문은 스파이킹 신경망에서 대리 경사 학습의 이론적 기반을 규명하고자 한다.
먼저 기존의 두 가지 이론적 접근법인 평활화된 확률 모델(SPM)과 스토캐스틱 자동 미분(stochAD) 프레임워크를 소개한다. SPM은 스파이크의 이산성을 기대값으로 평활화하여 경사를 계산하지만, 다층 네트워크로 확장하기 어렵다. 반면 stochAD는 이산 랜덤 변수에 대한 미분을 정의하여 이를 해결할 수 있다.
이후 단일 퍼셉트론과 다층 퍼셉트론 모델을 통해 대리 경사와 stochAD의 관계를 분석한다. 단일 퍼셉트론의 경우 대리 경사가 SPM의 기대값 미분과 stochAD의 평활화된 스토캐스틱 미분과 동일함을 보인다. 다층 퍼셉트론의 경우에도 stochAD가 대리 경사에 대한 이론적 근거를 제공함을 확인한다.
또한 대리 경사가 결정론적 네트워크에서 편향된 근사치를 제공할 수 있으며, 대리 손실 함수의 경사가 아님을 보인다.
마지막으로 스토캐스틱 스파이킹 신경망 모델에 대리 경사 학습을 적용하여 우수한 성능을 보임을 실험적으로 확인한다. 이를 통해 대리 경사 학습이 스토캐스틱 스파이킹 신경망 학습에 적합함을 입증한다.
Stats
대리 경사는 결정론적 네트워크에서 실제 경사와 부호가 다를 수 있다.
대리 경사는 대리 손실 함수의 경사가 아니다.
Quotes
"SGs cannot be understood as gradients of a surrogate loss."
"SG-descent is theoretically justified by stochAD albeit only for stochastic spiking."