Основные понятия
MicroScopiQ 是一種新的模型量化技術,它結合了剪枝和異常感知量化,以在保持硬體效率的同時實現高精度。
Ramachandran, A., Kundu, S., & Krishna, T. (2024). MicroScopiQ: Accelerating Foundational Models through Outlier-Aware Microscaling Quantization. arXiv preprint arXiv:2411.05282.
本研究旨在解決基礎模型(FMs)量化過程中,因出現大值特徵(異常值)而導致的精度下降和硬體效率低落問題。