TFMQ-DM: Temporäre Merkmalserhaltungs-Quantisierung für Diffusionsmodelle
Die TFMQ-DM-Quantisierungsmethode verbessert die Leistung von Diffusionsmodellen unter 4-Bit-Quantisierung mit minimaler Leistungsverschlechterung im Vergleich zum Vollpräzisionsmodell.