核心概念
Die vorgeschlagenen Methoden entfernen redundante CAS- und Flush-Anweisungen aus PMwCAS-Operationen und schließen Dirty-Flags aus, um die Leistung auf Mehrkern-CPUs zu verbessern.
要約
Der Artikel stellt neue PMwCAS-Algorithmen für Mehrkern-CPUs vor. Die Autoren identifizieren, dass der ursprüngliche Algorithmus von Wang et al. redundante CAS- und Flush-Anweisungen enthält, was zu einer schlechten Leistung auf Mehrkern-CPUs führt.
Die Autoren schlagen zwei Verbesserungen vor:
- Entfernen redundanter CAS- und Flush-Anweisungen aus PMwCAS-Operationen
- Ausschließen von Dirty-Flags, die die Datenhaltbarkeit verwalten, aus dem Algorithmus
Die Autoren implementieren die vorgeschlagenen Methoden als C++-Bibliothek und führen Experimente durch, um deren Effektivität zu zeigen. Die Ergebnisse zeigen, dass die vorgeschlagenen Methoden bis zu zehnmal schneller sind als der ursprüngliche Algorithmus. Die Autoren diskutieren auch Leistungstrends basierend auf verschiedenen Parametern und geben Empfehlungen für den Umgang mit PMwCAS-Operationen.
統計
Die Durchsatzrate der vorgeschlagenen Methoden ist bis zu zehnmal höher als die des ursprünglichen Algorithmus.
Die 99. Perzentil-Latenz der vorgeschlagenen Methoden ist bis zu einem Zehntel der Latenz des ursprünglichen Algorithmus.
引用
"Die vorgeschlagenen Methoden entfernen redundante CAS- und Flush-Anweisungen aus PMwCAS-Operationen und schließen Dirty-Flags aus, um die Leistung auf Mehrkern-CPUs zu verbessern."
"Experimentelle Ergebnisse zeigen, dass die vorgeschlagenen Methoden bis zu zehnmal schneller sind als der ursprüngliche Algorithmus."