核心概念
분산 모멘텀 방법은 편향된 기울기 추정에서 수렴 경계를 설정하고 전통적인 편향된 기울기 하강보다 빠른 수렴 성능을 확인합니다.
統計資料
"우리의 수치 실험은 MNIST 및 FashionMNIST 데이터셋에서 SGD 및 SGDM의 성능을 비교하였습니다."
"FCNN 모델은 669706개의 학습 가능한 매개변수를 가지고 있습니다."
"ResNet-18 모델은 11181642개의 학습 가능한 매개변수를 가지고 있습니다."
引述
"모멘텀 방법은 SGD보다 빠른 수렴을 보여줍니다."
"SGDM은 편향된 기울기 추정에서 더 나은 성능을 보입니다."