المفاهيم الأساسية
提出一种新的权重打包算法,可以最大限度地减少内存计算加速器中权重加载的开销,同时也能最大化计算资源的利用率。
الملخص
本文提出了一种新的权重打包算法,用于内存计算(IMC)加速器中,以最小化权重加载的开销,同时最大化计算资源的利用率。
首先,作者定义了一个4维的设计空间(Di x Do x Dh x Dm),用于描述IMC加速器的计算和存储结构。在这个空间中,作者提出了一种权重打包算法,包括以下步骤:
生成权重瓦片池:根据IMC维度,确定一组标准的权重瓦片,并生成它们的组合(超级瓦片)。
生成列池:通过2D打包超级瓦片,找到密集分配的列组合。
将列分配到IMC宏中:采用1D装箱算法,将列分配到不同的IMC宏中,同时满足计算利用率的要求。
作者还提出了一种瓦片折叠技术,可以进一步减小瓦片的占用空间。
通过一系列案例研究,作者展示了该权重打包算法相比于文献中的基线方法,在能耗-延迟(EDP)指标上可以带来10-100倍的改善,特别是对于权重占主导的工作负载。
الإحصائيات
本文提出的权重打包算法可以实现10-100倍的EDP改善。
اقتباسات
"本文提出了一种新的权重打包算法,用于内存计算(IMC)加速器中,以最小化权重加载的开销,同时最大化计算资源的利用率。"
"通过一系列案例研究,作者展示了该权重打包算法相比于文献中的基线方法,在能耗-延迟(EDP)指标上可以带来10-100倍的改善,特别是对于权重占主导的工作负载。"