Effiziente Kompression von Transformer-Architekturen durch One-Shot-Pruning
Das OPTIN-Framework ermöglicht eine effiziente Kompression von vortrainierten Transformer-Architekturen über verschiedene Domänen hinweg, ohne Neutraining erforderlich zu machen.