Die Studie untersucht die Herausforderungen bei der effizienten Ausführung von Heterogenen Graphen Neuronalen Netzen (HGNNs) auf aktueller Hardware. Sie identifiziert eine Möglichkeit zur Verbesserung der Datenlokalität durch eine Analyse der Topologie heterogener Graphen.
Um diese Möglichkeit zu nutzen, schlagen die Autoren eine Methode zur Graphenrestrukturierung vor und implementieren sie in einer Hardware-Vorstufe namens GDR-HGNN. GDR-HGNN strukturiert Graphen dynamisch um, um die Datenlokalität für HGNN-Beschleuniger zu verbessern.
Die Ergebnisse zeigen, dass GDR-HGNN in Kombination mit einem führenden HGNN-Beschleuniger eine durchschnittliche Beschleunigung von 14,6x und 1,78x im Vergleich zu einem state-of-the-art Software-Framework auf einer A100 GPU bzw. dem Beschleuniger selbst erreicht. Außerdem reduziert es den DRAM-Zugriff um 91,3% bzw. 42,9%.
לשפה אחרת
מתוכן המקור
arxiv.org
תובנות מפתח מזוקקות מ:
by Runzhen Xue,... ב- arxiv.org 04-09-2024
https://arxiv.org/pdf/2404.04792.pdfשאלות מעמיקות