核心概念
DynaSplit 是一個雙階段框架,透過動態配置軟硬體參數,在邊緣設備上實現節能的機器學習推理,同時滿足延遲需求。
摘要
這篇研究論文介紹了 DynaSplit,一個針對邊緣人工智慧應用程式設計的節能推理框架。
文獻資訊:
May, D., Tundo, A., Ilager, S., & Brandic, I. (2024). DynaSplit: A Hardware-Software Co-Design Framework for Energy-Aware Inference on Edge. arXiv preprint arXiv:2410.23881v1.
研究目標:
本研究旨在解決在資源受限的邊緣設備上部署機器學習模型時,如何降低能耗並滿足應用程式服務品質需求的挑戰。
方法:
DynaSplit 採用軟硬體協同設計方法,透過動態分割神經網路模型並調整硬體參數(如 CPU 頻率、加速器使用),在邊緣和雲端資源之間分配運算負載。該框架分為兩個階段:
- 離線階段: 使用多目標優化演算法(NSGA-III)探索軟硬體參數空間,找到一組非支配配置方案,這些方案在延遲、能耗和準確性方面取得了良好的平衡。
- 線上階段: 根據使用者請求的服務品質等級(以最大可接受推理延遲表示),從離線階段獲得的非支配配置方案中選擇最節能的方案,並據此配置系統執行推理任務。
主要發現:
- 與僅在雲端運算相比,DynaSplit 可將能耗降低多達 72%,同時滿足約 90% 的請求延遲閾值。
- 小型模型(如 ResNet50 和 MobileNetV2)在邊緣設備上執行效率更高,而大型模型(如 VGG16 和 ViT)則受益於分割運算。
- 硬體配置對推理效能有顯著影響,而識別最佳神經網路分割點具有挑戰性。
結論:
DynaSplit 透過動態配置軟硬體參數,為邊緣人工智慧應用程式提供了一種節能的推理解決方案,同時滿足服務品質需求。
意義:
本研究為邊緣運算中節能機器學習推理提供了一種實用的解決方案,有助於推動邊緣人工智慧應用程式的發展。
限制和未來研究:
- 本研究僅評估了兩種神經網路模型,未來將探索更多模型和應用程式。
- 未來工作將考慮網路頻寬和動態環境因素對系統效能的影響。
統計資料
DynaSplit 可將能耗降低多達 72%,與僅在雲端運算相比。
DynaSplit 滿足約 90% 的請求延遲閾值。
VGG16 網路包含 22 個層級。
ViT 網路包含 19 個層級。
探索 20% 的搜尋空間足以識別合適的配置。
每個配置的評估結果取樣自 1,000 次推理的平均值。
邊緣節點的功耗測量取樣率為 200 毫秒。
雲端節點的功耗測量取樣率為 20 毫秒。