本稿では、深層学習、特に大規模言語モデル(LLM)における活性化関数の表現力に着目し、従来の活性化関数の限界を克服する新しい活性化関数「PolyCom」を提案しています。
Başka Bir Dile
kaynak içeriğinden
arxiv.org
Önemli Bilgiler Şuradan Elde Edildi
by Zhijian Zhuo... : arxiv.org 11-07-2024
https://arxiv.org/pdf/2411.03884.pdfDaha Derin Sorular