この論文では、AdamとSGDMの収束率を非一様な滑らかさ条件下で比較しました。Adamがより速い収束を示すことが明らかになりました。具体的には、決定論的環境ではAdamが既知の最適化アルゴリズムの収束率の下限に到達し、確率的設定でもSGDMよりも優れた結果を示すことが示されました。新しい停止時間ベースの技術を導入して、問題のハイパーパラメータ全体で下限値に合致することが証明されました。
לשפה אחרת
מתוכן המקור
arxiv.org
תובנות מפתח מזוקקות מ:
by Bohan Wang,H... ב- arxiv.org 03-25-2024
https://arxiv.org/pdf/2403.15146.pdfשאלות מעמיקות