Core Concepts
순방향 기울기 기반 Frank-Wolfe 최적화 알고리즘을 통해 메모리 효율적인 딥 신경망 학습을 달성할 수 있다.
Abstract
이 논문은 메모리 효율적인 딥 신경망 학습을 위한 순방향 기울기 기반 Frank-Wolfe 최적화 알고리즘을 제안한다.
기존의 역전파 기반 기울기 계산 방식은 메모리 집약적이다. 이를 해결하기 위해 순방향 기울기 추정 방식을 Frank-Wolfe 알고리즘에 적용한다.
순방향 기울기 기반 Frank-Wolfe 알고리즘(FGFW)을 분석한 결과, 최적해에 수렴하지만 일정 오차 범위 내에 수렴하는 한계가 있다.
이를 개선하기 위해 과거 순방향 기울기들의 평균을 사용하는 평균 순방향 기울기 Frank-Wolfe 알고리즘(AFGFW)을 제안한다.
AFGFW 알고리즘은 최적해에 정확하게 수렴하며, 하위 선형 수렴 속도를 보인다.
다항 로지스틱 회귀 문제에 적용한 실험 결과, AFGFW 알고리즘이 FGFW 알고리즘보다 우수한 성능을 보인다.
Stats
최적해와의 오차 E[f(xk) - f(x*)]는 O(MD2√n + 4)의 상한을 가진다.
평균 순방향 기울기 Frank-Wolfe 알고리즘(AFGFW)의 수렴 속도는 O(αk/γk)이다.
Quotes
"순방향 기울기 추정은 메모리 집약적인 역전파 기법에 비해 메모리 효율적이다."
"순방향 기울기 기반 Frank-Wolfe 알고리즘은 최적해에 수렴하지만 일정 오차 범위 내에 수렴한다."
"평균 순방향 기울기 Frank-Wolfe 알고리즘은 최적해에 정확하게 수렴하며 하위 선형 수렴 속도를 보인다."