Core Concepts
Eine kosteneffiziente Methodik, die Interdependenzen zwischen Parametern und Routinen analysiert, um die Suche nach optimalen Konfigurationen in Hochleistungsrechnungsanwendungen zu verbessern.
Abstract
Die Studie präsentiert eine Methodik zur Bewältigung komplexer Abstimmungssuchen in Hochleistungsrechnungsanwendungen (HPC) mithilfe von Bayesscher Optimierung. Die Komplexität entsteht nicht nur durch die genaue Abstimmung von Parametern innerhalb von Routinen, sondern auch durch mögliche Interdependenzen zwischen ihnen, die herkömmliche Optimierungsmethoden ineffizient machen.
Anstatt Interdependenzen zwischen Parametern und Routinen zu untersuchen, stehen Praktiker oft vor dem Dilemma, unabhängige Abstimmungssuchen für jede Routine durchzuführen, wodurch Interdependenzen übersehen werden, oder eine ressourcenintensivere gemeinsame Suche für alle Routinen zu verfolgen.
Die vorgestellte Methodik passt und verfeinert bestehende Methoden zur Interdependenzanalyse und hochdimensionalen Zerlegung, um die Recheneffizienz zu gewährleisten und gleichzeitig Leistungsgewinne in Praxisszenarien zu maximieren. Sie nutzt eine kosteneffiziente Interdependenzanalyse, um zu entscheiden, ob mehrere Abstimmungssuchen zu einer gemeinsamen Suche zusammengeführt oder orthogonale Suchen durchgeführt werden sollen.
Die Methodik wurde auf synthetische Funktionen mit unterschiedlichen Graden an Parameterinterabhängigkeit getestet und konnte den Suchraum effizient erkunden. Im Vergleich zu auf Bayesscher Optimierung basierenden vollständig unabhängigen oder vollständig gemeinsamen Suchen schlug die Methodik eine optimierte Aufteilung in unabhängige und zusammengeführte Suchen vor, die zu bis zu 8% genaueren Endkonfigurationen führte und die Suchzeit um bis zu 95% reduzierte.
Bei der Anwendung auf GPU-offgeladene Echtzeit-Zeitabhängige Dichtefunktionaltheorie (RT-TDDFT), einer Anwendung in der Materialwissenschaft, die moderne HPC-Autotuner herausfordert, erzielte die Methodik eine effektive Abstimmungssuche. Ihre Anpassungsfähigkeit und Effizienz gehen über RT-TDDFT hinaus und machen sie für verwandte Anwendungen in HPC wertvoll.
Stats
Die Variabilität der Ausgabe von Gruppe 3 beträgt für Fallstudie 1 bis zu 357,33% für den Parameter nbatches und für Fallstudie 2 bis zu 356% für den Parameter nbatches.
Quotes
"Anstatt Interdependenzen zwischen Parametern und Routinen zu untersuchen, stehen Praktiker oft vor dem Dilemma, unabhängige Abstimmungssuchen für jede Routine durchzuführen, wodurch Interdependenzen übersehen werden, oder eine ressourcenintensivere gemeinsame Suche für alle Routinen zu verfolgen."
"Die vorgestellte Methodik passt und verfeinert bestehende Methoden zur Interdependenzanalyse und hochdimensionalen Zerlegung, um die Recheneffizienz zu gewährleisten und gleichzeitig Leistungsgewinne in Praxisszenarien zu maximieren."