Die Studie untersucht den COnfLUX-Algorithmus, eine Variante des 2.5D LU-Faktorisierungsalgorithmus mit Turnierpivotisierung, und identifiziert potenzielle Probleme in Bezug auf die Schätzung der oberen Schranke, die empirischen Untersuchungsmethoden und die entsprechende untere Schranke.
Diese Arbeit präsentiert neuartige, lokationsbasierte Algorithmen für den dynamischen Datenaustausch mit geringer Dichte, die eine Leistungssteigerung von bis zu 20x gegenüber bestehenden Methoden erreichen.
Das Ozaki-Schema ermöglicht die Berechnung von hochpräziser Matrixmultiplikation auf Recheneinheiten mit niedriger Genauigkeit, indem die Eingabematrizen in mehrere Teilmatrizen aufgeteilt und separat multipliziert werden. Die Autoren zeigen, dass die Verwendung von ganzzahligen Recheneinheiten wie den NVIDIA Tensor Cores theoretische Vorteile in Bezug auf Genauigkeit, Speicherverbrauch und Rechenaufwand bietet.
Der vorgeschlagene sokolskew-Löser nutzt parallele selbstvermeidende Spaziergänge auf dem skew-symmetrischen Suchraum, um neue beste bekannte binäre Sequenzen mit hohem Gütemaß zu finden.