Diese Studie gibt einen systematischen Überblick über die Optimierung von dünnbesetzter Matrix-Vektor-Multiplikation (SpMV). Es werden zwei typische Anwendungen von SpMV vorgestellt - numerische iterative Lösungsverfahren und der PageRank-Algorithmus. Anschließend werden verschiedene Speicherformate für dünnbesetzte Matrizen diskutiert, die darauf abzielen, die Speichereffizienz und Rechenleistung zu verbessern. Klassische Optimierungsstrategien für SpMV, automatische Abstimmungsverfahren und maschinelles Lernen werden ebenfalls behandelt. Darüber hinaus werden hardwarenahe Optimierungen für CPUs, GPUs, FPGAs, PIM-Architekturen, heterogene und verteilte Plattformen erläutert. Eine umfassende Leistungsbewertung vergleicht den Stand der Technik bei SpMV-Implementierungen. Abschließend werden Herausforderungen und zukünftige Forschungsrichtungen diskutiert.
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Jianhua Gao,... lúc arxiv.org 04-10-2024
https://arxiv.org/pdf/2404.06047.pdfYêu cầu sâu hơn