Effiziente gemischte Präzisions-Quantisierung von Gated Recurrent Units unter Verwendung von Genetischen Algorithmen
Wir präsentieren ein modulares Integer-Quantisierungsschema für GRUs, bei dem die Bitbreite jedes Operators unabhängig ausgewählt werden kann. Wir verwenden Genetische Algorithmen, um Pareto-optimale gemischte Präzisions-Quantisierungsschemata zu finden, die Modellgenauigkeit und -größe gleichzeitig optimieren.