Schichtweise lineare Modellkonnektivität: Einblicke in die Struktur der Verlustfunktion tiefer neuronaler Netzwerke
Tiefe neuronale Netzwerke zeigen keine schichtweisen Barrieren zwischen Modellen, was auf eine konvexe Verlustfunktion in Bezug auf lineare Schnitte einzelner Schichten hinweist. Die Robustheit verschiedener Teilräume des Optimierungslandschafts kann Aufschluss über das Auftreten von Interpolationsbarrieren geben.