FlattenQuant ermöglicht effiziente Quantisierung von großen Sprachmodellen, um Rechenengpässe zu überwinden.