QAQ ermöglicht eine bis zu 10-fache Komprimierung des KV-Caches bei vernachlässigbarem Einfluss auf die Modellleistung.