Diese Studie gibt einen systematischen Überblick über die Optimierung von dünnbesetzter Matrix-Vektor-Multiplikation (SpMV). Es werden zwei typische Anwendungen von SpMV vorgestellt - numerische iterative Lösungsverfahren und der PageRank-Algorithmus. Anschließend werden verschiedene Speicherformate für dünnbesetzte Matrizen diskutiert, die darauf abzielen, die Speichereffizienz und Rechenleistung zu verbessern. Klassische Optimierungsstrategien für SpMV, automatische Abstimmungsverfahren und maschinelles Lernen werden ebenfalls behandelt. Darüber hinaus werden hardwarenahe Optimierungen für CPUs, GPUs, FPGAs, PIM-Architekturen, heterogene und verteilte Plattformen erläutert. Eine umfassende Leistungsbewertung vergleicht den Stand der Technik bei SpMV-Implementierungen. Abschließend werden Herausforderungen und zukünftige Forschungsrichtungen diskutiert.
เป็นภาษาอื่น
จากเนื้อหาต้นฉบับ
arxiv.org
ข้อมูลเชิงลึกที่สำคัญจาก
by Jianhua Gao,... ที่ arxiv.org 04-10-2024
https://arxiv.org/pdf/2404.06047.pdfสอบถามเพิ่มเติม