Ein backpropagationsfreier Algorithmus für Post-Training-Quantisierung
COMQ ist ein innovativer Post-Training-Quantisierungsalgorithmus, der sequenziell die schichtweisen Rekonstruktionsfehler koordinatenweise minimiert. Er behandelt die Skalierungsfaktoren und Bitcodes als Variablen und aktualisiert diese in einer sorgfältig entworfenen gierigen Reihenfolge, um die Genauigkeit deutlich zu verbessern.