本文提出了一種名為 LUTMUL 的演算法硬體協同設計方法,該方法利用 FPGA 中大量的查找表 (LUT) 資源來執行高效的乘法運算,從而突破傳統基於 DSP 的 FPGA 加速器性能瓶頸,實現更高效的神經網路推理。