核心概念
本文提出了一種名為激活變異稀疏性分數 (AVSS) 的新指標,用於評估大型語言模型 (LLM) 中各層的重要性,並通過移除低 AVSS 分數的層級來簡化模型,同時保持 90% 以上的效能。
標題:透過激活變異稀疏性分析評估大型語言模型中的層級重要性 (AVSS: Layer Importance Evaluation in Large Language Models via Activation Variance-Sparsity Analysis)
作者:Zichen Song, Yuxin Wu, Sitan Huang, Zhongfeng Kang
機構:蘭州大學
本研究旨在開發一種新的指標,用於評估大型語言模型 (LLM) 中各層級的重要性,並探討移除不重要層級對模型效能的影響。