核心概念
選擇性地對模型參數進行正則化,允許某些層自由變化,同時限制其他層的變化,可以提高微調基礎模型的穩健性和泛化能力。
標題: 重新思考權重衰減以實現基礎模型的穩健微調
作者: Junjiao Tian, Chengyue Huang, Zsolt Kira
機構: 佐治亞理工學院
發表: NeurIPS 2024 (預印本 arXiv:2411.01713v1 [cs.LG] 3 Nov 2024)
本研究旨在探討如何改善現有權重衰減技術在微調大型基礎模型時的不足,以提升模型的穩健性和泛化能力。