本文提出了一種新的局部性理論——對稱局部性,它基於排列的對稱性來分析和優化重複數據遍歷的記憶體效能。
CodeRosetta 是一種新型的編碼器-解碼器轉換器模型,專為在程式語言及其高效能運算 (HPC) 擴展之間進行翻譯而設計,透過創新的訓練目標和無監督學習方法,展現出優於現有方法的效能,並為 Fortran 到 C++ 等複雜翻譯任務開闢了新的可能性。
排程語言已經從自動調整程式庫和迭代編譯的發展中演變而來,使開發人員能夠更好地控制程式碼優化,並有望在未來實現更易於使用和可移植的自動化高效能程式碼生成。
DiFuseR 是一種適用於 GPU 的新型分散式影響力最大化演算法,它利用草圖技術和創新的負載平衡機制,在處理大型圖形時,顯著提升了速度和效率。