Hochoptimierte 3D-Stencil-Berechnungen auf aktuellen GPU-Architekturen: Leistungsbewertung und Optimierungsempfehlungen für verschiedene Programmiermodelle
Durch die Evaluierung und Optimierung von Stencil-Kerneln auf verschiedenen GPU-Programmiermodellen (CUDA, OpenACC, OpenMP) für die neuesten NVIDIA-GPU-Architekturen (Ampere, Hopper) konnten Leistungssteigerungen von bis zu 58% gegenüber der Vorgängergeneration erzielt werden. Darüber hinaus wurden spezifische Optimierungsempfehlungen für jedes Programmiermodell abgeleitet.