本論文は、新しい汎用テンソルアクセラレータ GTA を提案している。
まず、論文では、行列乗算と精度乗算の類似性を発見し、テンソル演算子を p-GEMM と ベクトル演算に分類する方法を提案した。これにより、システリック・アーキテクチャを一般目的アクセラレータに導入することができる。
次に、GTA アーキテクチャを設計した。GTA は、マルチプレシジョン・リコンフィギャラブル・アレイ (MPRA) を採用し、ベクトル・アーキテクチャの既存の制御・通信ハードウェアリソースを再利用することで、任意の計算負荷とプレシジョンのテンソル演算子を効率的に処理できる。
さらに、データフロー、プレシジョン、アレイサイズの最適化を組み合わせた一般的なテンソルスケジューリング手法を提案した。
評価の結果、GTA は、VPU、GPGPU、CGRAと比較して、メモリアクセスが7.76倍、3.39倍、8.76倍効率的で、演算速度が6.45倍、3.39倍、25.83倍高速であることが示された。
To Another Language
from source content
arxiv.org
Önemli Bilgiler Şuradan Elde Edildi
by Chenyang Ai,... : arxiv.org 05-06-2024
https://arxiv.org/pdf/2405.02196.pdfDaha Derin Sorular