Effiziente Verarbeitung und Analyse großer Sprachmodelle durch Neuausrichtung der Kanalabmessungen zur Isolierung von Ausreißern für Quantisierung mit geringer Bittiefe
Durch die Neuausrichtung der Kanalabmessungen können Aktivierungsausreißer in großen Sprachmodellen isoliert und die Quantisierung mit geringer Bittiefe verbessert werden.