Kernekoncepter
大規模言語モデル(LLM)の量子化における重要な技術であるGPTQを、よりシンプルでスケーラブル、かつ高性能なCDQuantというGreedy Coordinate Descentを用いた手法によって改善する。
Resumé
CDQuant: 大規模言語モデルの高精度量子化のための Greedy Coordinate Descent
Pranav Ajit Nair, Arun Sai Suggala. (2024). CDQuant: Greedy Coordinate Descent for Accurate LLM Quantization. arXiv:2406.17542v3 [cs.LG].
本研究は、大規模言語モデル(LLM)の量子化において、既存手法であるGPTQの性能を上回る、よりシンプルでスケーラブルな手法を開発することを目的とする。