Effiziente Verringerung des Quantisierungsausgabefehlers durch Bias-Kompensation
Durch Hinzufügen eines optimierten Bias-Vektors zu den Ausgaben quantisierter Schichten kann der Quantisierungsausgabefehler effizient minimiert werden, ohne dass eine Feinabstimmung des Modells erforderlich ist.