Descarga Linnk AI
•
Asistente de Investigación
>
Iniciar sesión
Información
-
大規模言語モデルのための効率的なMoEプルーニング
大規模言語モデルの効率的な推論のための構造化-非構造化プルーニング
MoEモデルの推論コストを大幅に削減するために、構造化プルーニングと非構造化プルーニングを組み合わせた新しいプルーニング手法を提案する。
1