Core Concepts
Approximatives UMAP (aUMAP) ist eine effiziente Variante des UMAP-Algorithmus, die eine schnelle Projektion hochdimensionaler Datenstroeme in Echtzeit ermöglicht, ohne dabei die Genauigkeit der Standardprojektion signifikant zu beeinträchtigen.
Abstract
Die Studie präsentiert eine neue Variante des UMAP-Algorithmus, genannt approximatives UMAP (aUMAP), die darauf abzielt, Projektionen für die Echtzeitvisualisierung hochdimensionaler Datenstroeme zu beschleunigen.
Zunächst wird die Genauigkeit von aUMAP evaluiert, indem die Projektionen mit denen des Standardverfahrens UMAP verglichen werden. Die Ergebnisse zeigen, dass aUMAP die Clusterstruktur der UMAP-Projektionen gut approximiert, mit nur geringen Abweichungen.
Anschließend werden die Trainings- und Projektionszeiten der verschiedenen UMAP-Methoden (Standard-UMAP, parametrisches UMAP (pUMAP) und aUMAP) untersucht. Dabei zeigt sich, dass aUMAP eine Größenordnung schneller bei der Projektion ist als Standard-UMAP und pUMAP, während die Trainingszeiten ähnlich sind. Standard-UMAP ist deutlich langsamer bei der Projektion als die anderen Methoden.
Insgesamt erfüllt aUMAP die Kriterien für eine geeignete Methode zur Echtzeitvisualisierung hochdimensionaler Daten am besten: Es liefert genaue Projektionen, hat kurze Trainings- und Projektionszeiten und ist leichtgewichtig. Parametrisches UMAP ist ebenfalls eine mögliche Option, erfordert jedoch spezielle Hardware-Unterstützung für eine optimale Leistung.
Stats
Die Projektion neuer Datenpunkte durch aUMAP hat eine durchschnittliche euklidische Distanz von 0,083 bis 0,256 Standardabweichungen zu den Projektionen durch Standard-UMAP.
Quotes
"aUMAP delivers projections that replicate the projection space of standard UMAP while decreasing projection speed by an order of magnitude and maintaining the same training time."
"aUMAP performs an additional order of magnitude faster, where all 500 projections are generated in less than 100 milliseconds."