この論文では、AdamとSGDMの収束率を非一様な滑らかさ条件下で比較しました。Adamがより速い収束を示すことが明らかになりました。具体的には、決定論的環境ではAdamが既知の最適化アルゴリズムの収束率の下限に到達し、確率的設定でもSGDMよりも優れた結果を示すことが示されました。新しい停止時間ベースの技術を導入して、問題のハイパーパラメータ全体で下限値に合致することが証明されました。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Bohan Wang,H... at arxiv.org 03-25-2024
https://arxiv.org/pdf/2403.15146.pdfDeeper Inquiries