這篇研究論文介紹了 FuseGPT,一種用於結構化剪枝的新方法,旨在提高生成式預訓練 Transformer (GPT) 模型在資源受限環境中的部署效率。FuseGPT 專注於有效地回收和融合冗餘的 Transformer 模塊,解決了剪枝後維持高效能的關鍵挑戰。
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Zehua Pei, H... lúc arxiv.org 11-25-2024
https://arxiv.org/pdf/2411.14507.pdfYêu cầu sâu hơn