本文介绍了四种串行稀疏Cholesky分解算法:多前端法(MF)、左看型法(LL)、右看型法(RL)和右看型阻塞法(RLB)。
MF是目前最常用的Cholesky分解方法,它利用消元树管理更新矩阵栈。LL则是通过从左到右的方式直接将更新应用到目标列。
RL是本文提出的一种新方法,它比MF更简单,同时也略微更快且需要更少的存储空间。
RLB是本文的主要贡献,它不需要进行任何装配操作,且能够充分利用Intel MKL多线程BLAS的并行性,从而显著提高了计算速度。RLB通过在超节点内重排列列,减少了密集的非对角块,从而进一步提高了性能。
总的来说,RLB是一种高效的串行稀疏Cholesky分解算法,尤其是在使用Intel MKL多线程BLAS时,其性能明显优于其他方法。
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by M. Ozan Kars... lúc arxiv.org 09-23-2024
https://arxiv.org/pdf/2409.13090.pdfYêu cầu sâu hơn