Eine dichte neuronale Netzwerkstruktur enthält ein stark spärliches Subnetzwerk (Gewinnertickets), das eine bessere Leistung als das Originalmodell erzielen kann.
Es gibt spezielle Minima in der Verlustlandschaft neuronaler Netze, die eine gute Generalisierungsleistung aufweisen, aber ein sehr kleines Volumen im Originalraum haben. Das iterative Magnitude-Pruning-Verfahren legt solche Minima frei, die ansonsten verborgen bleiben würden.