本研究は、ビジョントランスフォーマー(ViT)の実用的な展開を阻害している高い計算コストと大きなメモリ需要の課題に取り組んでいる。主要な4つの圧縮手法、すなわち量子化、低ランク近似、知識蒸留、プルーニングの効果を体系的に分析・比較している。
量子化手法は、特にダイナミック量子化が優れた性能を示し、モデルサイズを4分の1に削減しつつ、精度の大幅な低下を抑えることができた。一方、単純なプルーニングでは精度の大幅な低下が見られた。
知識蒸留手法では、DeiTモデルが推論速度を2倍以上に高速化しつつ、精度も良好に維持できることが分かった。さらに、量子化と知識蒸留を組み合わせた手法では、モデルサイズを4分の1に削減しつつ、推論速度を2倍以上に高速化できることが示された。
これらの結果は、ViTの実用的な展開に向けて、圧縮手法の組み合わせが有効であることを示唆している。精度、モデルサイズ、推論速度のバランスを取るための最適な圧縮手法の選択と組み合わせが重要であると結論付けられる。
Para outro idioma
do conteúdo fonte
arxiv.org
Principais Insights Extraídos De
by Feiyang Chen... às arxiv.org 04-17-2024
https://arxiv.org/pdf/2404.10407.pdfPerguntas Mais Profundas