toplogo
サインイン

16 nmの異種 RISC-V SoC「Siracusa」: 拡張現実向けのAt-MRAM ニューラルエンジン搭載


核心概念
Siracusa は、RISC-V コアクラスタと高性能なニューラルネットワークアクセラレータ N-EUREKA を統合した、拡張現実アプリケーション向けの高性能・高効率な異種 SoC である。N-EUREKA は、高密度の MRAM メモリと密結合されており、ウェイトデータの高速アクセスを実現している。
要約

本論文では、拡張現実(XR)アプリケーション向けの高性能・高効率な異種 SoC「Siracusa」を紹介している。Siracusa は、以下の特徴を持つ:

  1. RISC-V ベースの8コアクラスタと、ニューラルネットワークアクセラレータ N-EUREKA を統合した異種アーキテクチャ
  2. N-EUREKA は、4 MiB の高密度 MRAM メモリと密結合されており、ウェイトデータの高速アクセスを実現
  3. RISC-V コアクラスタと N-EUREKA が共有の L1 メモリを介して協調動作し、ニューラルネットワークと従来の信号処理・制御を効率的に実行
  4. 製造プロセスは16 nm CMOS、面積効率は65.2 GOp/s/mm2、ピークエネルギー効率は8.84 TOp/J

N-EUREKA の特徴は以下の通り:

  • 3x3 dense、3x3 depthwise、1x1 dense convolutionをサポート
  • 8ビット入力活性化、2-8ビットウェイト精度、8ビット出力量子化に対応
  • 36個のPEで構成され、1950 GOp/sのピーク性能を発揮
  • MRAM メモリと密結合されており、ウェイトデータを高速にアクセス可能

Siracusa は、拡張現実アプリケーションの厳しい性能・電力制約を満たすことができる高性能・高効率な SoC である。

edit_icon

要約をカスタマイズ

edit_icon

AI でリライト

edit_icon

引用を生成

translate_icon

原文を翻訳

visual_icon

マインドマップを作成

visit_icon

原文を表示

統計
Siracusa の最大動作周波数は0.8 Vで360 MHz、0.65 Vで210 MHz Siracusa の消費電力は0.8 Vで332 mW、0.65 Vで151 mW RISC-Vクラスタの最大性能は0.8 Vで120.6 GOp/s@1.13 TOp/J、0.65 Vで57.5 GOp/s@485 GOp/J (2ビット演算)
引用
なし

深掘り質問

Question1

SiracusaのMRAMメモリの書き換え耐久性と書き込み速度の課題をどのように解決しているか、詳しく説明してください。 Siracusaは、MRAMを静的なDNNウェイトメモリとして統合することで、MRAMの遅い書き込み性能と限られた書き込み耐久性に対処しています。通常のメモリ技術であるSRAMは、高い速度で動作し、360 MHz以上の動作周波数を達成できますが、MRAMのピークは180 MHzです。さらに、SRAMは0.6 Vまでの低電圧で動作でき、MRAMの0.65 Vよりも優れた性能を提供します。一方、MRAMは高い密度と非揮発性を特徴とし、重量の保存が必要な場合やスペースが限られている場合に適しています。MRAMの高い密度は、スペースの効率的な利用を可能にし、システム全体のコンパクトさと効率性に貢献しています。このような設計変更により、Siracusaは65.2 GOP/s/mm2のピークエリア効率を提供しています。SRAMタイルメモリは、アクティベーション値に関連する動的で一時的なデータフローを処理するために使用され、SRAMの高速なデータアクセス能力を活用しています。これにより、アクティベーション値に関連するデータの動的な処理が迅速かつ効率的に行われます。

Question2

SiracusaのRISC-VクラスタとN-EUREKAの協調動作を実現するための具体的な手法は何か、詳しく説明してください。 Siracusaでは、RISC-VクラスタとN-EUREKAの協調動作を実現するために、L1メモリを共有し、低遅延のL1インターコネクトを介してアクセスできるようにしています。RISC-Vクラスタは、最適化された行列乗算カーネルを使用して、異なるオペランド精度(2ビット、4ビット、8ビット)のSIMD処理をサポートし、動作電圧を0.65 Vから0.8 Vまで変化させながら、スループットとエネルギー効率を評価しています。この設計により、Siracusaは異なるオペランド精度で高いスループットとエネルギー効率を実現しています。RISC-Vクラスタの最大動作周波数は、0.65 Vで310 MHzにまで低下し、エネルギー効率は1.3倍に向上します。このように、RISC-VクラスタとN-EUREKAの協調動作は、共有メモリを介して効率的に行われ、高い性能とエネルギー効率を実現しています。

Question3

Siracusaの設計アプローチは、他の異種SoCアーキテクチャにどのように応用・発展できるか考えてください。 Siracusaの設計アプローチは、近接センサーコンピューティングシステムにおける高性能で効率的なDNN推論を実現するための革新的な手法を提供しています。この設計アプローチは、他の異種SoCアーキテクチャにも応用・発展できます。例えば、異種SoCにおいても、NVMとアクセラレータを緊密に統合することで、高速で効率的なデータアクセスを実現し、エネルギー効率を向上させることが可能です。さらに、RISC-VクラスタとN-EUREKAの協調動作を通じて、異種アプリケーションワークロードを効率的に処理する手法は、他の異種SoCにも適用できます。Siracusaの設計アプローチは、異種SoCの性能と効率を向上させるための有益な手法として応用される可能性があります。
0
star