Last ned Linnk AI
•
Forskningsassistent
>
Logg Inn
innsikt
-
大規模言語モデルのための効率的なMoEプルーニング
大規模言語モデルの効率的な推論のための構造化-非構造化プルーニング
MoEモデルの推論コストを大幅に削減するために、構造化プルーニングと非構造化プルーニングを組み合わせた新しいプルーニング手法を提案する。
1