核心概念
Ein neuartiger Algorithmus zur effizienten Berechnung von 0-dimensionaler persistenter Homologie auf 2D-Bildern, der den Speicherverbrauch minimiert und die Verarbeitungszeit optimiert. Zusätzlich wird eine verteilte Version des Algorithmus präsentiert, die große Bilderdatensätze parallel verarbeiten kann.
摘要
Der Artikel präsentiert PixHomology, einen neuartigen Algorithmus zur effizienten Berechnung von 0-dimensionaler persistenter Homologie auf 2D-Bildern. Der Algorithmus zeichnet sich durch einen deutlich reduzierten Speicherverbrauch im Vergleich zu bestehenden Methoden wie Ripser aus.
Darüber hinaus wird eine verteilte Version des Algorithmus vorgestellt, die auf dem Apache Spark Framework basiert. Dieses verteilte System ermöglicht die parallele Verarbeitung großer Bilderdatensätze. Im Rahmen der Entwicklung wurden verschiedene Optimierungsvarianten des verteilten Ansatzes untersucht, um die Lastverteilung und Skalierbarkeit weiter zu verbessern.
Die experimentelle Analyse zeigt, dass PixHomology sowohl in seiner sequentiellen als auch in der verteilten Version deutlich effizienter ist als der derzeitige Goldstandard Ripser, insbesondere bei der Verarbeitung sehr großer Bilder. Dabei liefert PixHomology qualitativ gleichwertige Ergebnisse wie Ripser.
統計資料
Die Verarbeitungszeit von PixHomology ist bis zu 10% kürzer als die von Ripser, wenn eine Filterung der Hintergrundpixel angewendet wird.
PixHomology benötigt für die Verarbeitung von 10.000 x 10.000 Pixel großen Bildern nur etwa 8 GB Arbeitsspeicher, während Ripser ca. 112 GB benötigt.
Die verteilte Version von PixHomology ist deutlich effizienter als die verteilte Lösung DIPHA, sowohl in Bezug auf die Ausführungszeit als auch auf den Speicherverbrauch.
引述
"PixHomology bietet eine deutliche Reduzierung des Speicherverbrauchs im Vergleich zu bestehenden Methoden wie dem Ripser-Paket, wenn es auf die Berechnung von 0-dimensionaler persistenter Homologie angewendet wird."
"Die verteilte Version von PixHomology ist konsistent schneller als DIPHA bei der Analyse großer Bilderdatensätze."