Optimierung der OpenACC-Leistung der Navier-Stokes-Finite-Elemente-Assemblierung auf GPUs für den Weg zur Exascale-Leistung
Die Kombination von Umstrukturierung, Spezialisierung und Privatisierung der Zwischenwerte enthüllt das volle Leistungspotenzial auf GPU und CPU, was zu einer Leistungssteigerung von mehr als 50x auf einer NVIDIA A100 GPU und einem weiteren Faktor von 5x für einen Intel Icelake-basierten CPU-Knoten führt.