核心概念
透過將記憶體管理任務卸載到智慧網卡,SODA 能夠有效利用網路附加記憶體,提升記憶體密集型應用程式的效能。
書目資訊
Wahlgren, J., Schieffer, G., Gokhale, M., Pearce, R., & Peng, I. (2024). Disaggregated Memory with SmartNIC Offloading: a Case Study on Graph Processing. arXiv preprint arXiv:2410.02599.
研究目標
本研究旨在探討如何利用具備卸載功能的智慧網卡,實現高效能的網路附加記憶體系統,並以圖形處理應用程式為例進行評估。
方法
設計並實現了一個名為 SODA 的執行時函式庫,用於管理計算節點與記憶體節點之間的資料移動,並將其卸載到智慧網卡上。
SODA 採用多種優化策略,包括 NUMA 感知、資料快取、任務聚合和非同步請求轉發,以提升效能。
在搭載 Nvidia BlueField DPU 的測試平台上,使用 Ligra 圖形處理框架和多個真實世界的圖形資料集,對 SODA 進行了評估。
主要發現
SODA 能夠有效地將記憶體管理任務卸載到智慧網卡上,從而釋放主機上的計算資源。
與節點本地 NVMe SSD 相比,SODA 在大多數情況下都能夠實現顯著的效能提升,最高可達 7.9 倍。
與未卸載到智慧網卡的網路附加記憶體系統相比,SODA 能夠在保持相似或更佳效能的同時,減少高達 42% 的網路流量。
主要結論
利用智慧網卡卸載記憶體管理任務,是提升網路附加記憶體系統效能的有效方法。
SODA 為記憶體密集型應用程式提供了一種可行且高效的解決方案,尤其適用於圖形處理等領域。
意義
本研究為高性能計算領域的記憶體系統設計提供了新的思路,有助於提升資源利用率和降低系統成本。
局限與未來研究方向
SODA 目前僅支援單一用戶端對可寫入 FAM 物件的訪問,未來可以探討多用戶端一致性維護機制。
未來可以進一步研究 SODA 在其他應用程式和不同類型智慧網卡上的效能表現。
統計資料
與節點本地 NVMe SSD 相比,SODA 在大多數情況下都能夠實現顯著的效能提升,最高可達 7.9 倍。
與未卸載到智慧網卡的網路附加記憶體系統相比,SODA 能夠在保持相似或更佳效能的同時,減少高達 42% 的網路流量。
在 com-friendster 圖形資料集中,靜態頂點快取可以減少 PageRank 應用程式 42% 的網路流量,其他應用程式則減少 10-11%。
在 Moliere 圖形資料集中,靜態頂點快取可以減少 PageRank 應用程式 10% 的網路流量,其他應用程式則減少 2-3%。