本論文では、多精度DNNの効率的な実行を可能にするRISC-Vベクトルプロセッサ「SPEED」を提案している。
まず、SPEEDは、RVV命令セットの予約領域を活用したカスタマイズ命令を導入している。これにより、命令の複雑さを低減し、4ビットから16ビットまでの多様な精度をサポートできる。
次に、SPEEDのハードウェアアーキテクチャでは、パラメータ化された多精度テンソルユニットを開発し、スケーラブルモジュールに統合している。これにより、多様なDNNオペレーターの計算パターンに合わせて、柔軟な並列処理能力を提供できる。
さらに、SPEEDは、様々な演算オペレーターの計算・メモリアクセスパターンに合わせた最適なデータフロー設計を採用している。これにより、データの再利用を最大化し、演算効率と消費電力を大幅に改善できる。
実験結果から、SPEEDは4ビット演算で737.9 GOPSの演算スループットと1383.4 GOPS/Wのエネルギー効率を達成し、従来のRVVプロセッサと比較して5.9倍から26.9倍の面積効率向上を示した。これにより、SPEEDは多精度DNNインファレンスに大きな可能性を示している。
לשפה אחרת
מתוכן המקור
arxiv.org
תובנות מפתח מזוקקות מ:
by Chuanning Wa... ב- arxiv.org 09-24-2024
https://arxiv.org/pdf/2409.14017.pdfשאלות מעמיקות