Alapfogalmak
Hochdimensionale Funktionen können oft durch eine geringe Anzahl gleichzeitiger Interaktionen mit niedriger Komplexität gut charakterisiert werden. Wir untersuchen, wie man durch geeignete Basisumwandlungen eine sparse additive Zerlegung solcher Funktionen finden kann.
Kivonat
Der Artikel befasst sich mit der effizienten Verarbeitung und Analyse hochdimensionaler Funktionen, die sich durch eine sparse additive Zerlegung in Summanden mit nur wenigen Variablen darstellen lassen.
Zunächst werden verschiedene Konzepte für solche sparse additive Zerlegungen, wie die ANOVA- und die verankerte Zerlegung, diskutiert. Es wird gezeigt, wie diese Zerlegungen mit den Eigenschaften des Funktionengraphen zusammenhängen.
Der Hauptteil des Artikels beschreibt ein dreistufiges Verfahren, um eine orthogonale Basisumwandlung zu finden, unter der die Funktion eine sparse additive Zerlegung zulässt:
- Minimierung der Anzahl der Knoten im Funktionengraphen durch Singulärwertzerlegung des Gradienten.
- Feinste Blockdiagonalisierung der Hessematrizen durch gemeinsame Blockdiagonalisierung.
- Sparsifizierung der einzelnen Blöcke durch nichtkonvexe Optimierung über der Gruppe der speziellen orthogonalen Matrizen.
Für den letzten Schritt werden Riemannsche Gradientenverfahren und der Landing-Algorithmus analysiert. Es werden Konvergenzresultate für diese Verfahren hergeleitet.
Abschließend werden numerische Beispiele präsentiert, die die Leistungsfähigkeit des Gesamtverfahrens illustrieren.
Statisztikák
Die Anzahl der Knoten |V(fU)| im Funktionengraphen von fU ist minimal, wenn U eine linke Singulärmatrix der Matrix mit den Gradienten ∇f(x(n)) als Spalten ist.
Die Anzahl der Kanten |E(fU)| im Funktionengraphen von fU ist minimal, wenn U eine feinste gemeinsame Blockdiagonalisierung der Hessematrizen ∇2f(x(n)) liefert.
Idézetek
"Hochdimensionale reale Systeme können oft durch eine geringe Anzahl gleichzeitiger Interaktionen mit niedriger Komplexität gut charakterisiert werden."
"Die Sparsität dieser additiven Funktionszerlegungen ist äquivalent zur Tatsache, dass die meisten ihrer gemischten partiellen Ableitungen verschwinden."