Lataa Linnk AI
•
Tutkimusavustaja
>
Kirjaudu sisään
näkemys
-
大規模言語モデルのための効率的なMoEプルーニング
大規模言語モデルの効率的な推論のための構造化-非構造化プルーニング
MoEモデルの推論コストを大幅に削減するために、構造化プルーニングと非構造化プルーニングを組み合わせた新しいプルーニング手法を提案する。
1