Core Concepts
Die Untersuchung von Matrix-Beschleunigern von NVIDIA und AMD zeigt wichtige Unterschiede in numerischen Eigenschaften auf.
Abstract
Die Studie untersucht die numerischen Eigenschaften von NVIDIA Tensor Cores und AMD Matrix Cores.
Es wird gezeigt, wie fehlende Informationen über diese Beschleuniger die Portierung von Codes beeinflussen können.
Tests enthüllen Unterschiede in Subnormalzahlen, Rundungsmodi und FMA-Eigenschaften.
Die Ergebnisse verdeutlichen die Bedeutung der Kenntnis von Hardware-spezifischen Unterschieden.
Ein einfaches Matrix-Multiplikationsbeispiel verdeutlicht die variierenden Ergebnisse auf verschiedenen GPUs.
Stats
NVIDIA Tensor Cores und AMD Matrix Cores sind von Interesse für HPC und ML.
Die GPUs zeigen Unterschiede in der Unterstützung von Subnormalzahlen und Rundungsmodi.
AMD GPUs verwenden konsequent drei zusätzliche Bits für präzises Runden.
Quotes
"Die Untersuchung von Matrix-Beschleunigern von NVIDIA und AMD zeigt wichtige Unterschiede in numerischen Eigenschaften auf."