toplogo
登入

Arm社のEthos-U55組み込みマシーンラーニングアクセラレータにおけるソフトエラー耐性の特徴付け


核心概念
Arm社のEthos-U55組み込みマシーンラーニングアクセラレータは、ソフトエラーに対して十分な耐性を持っていないことが明らかになった。ただし、選択的な保護によって、面積オーバーヘッドを最小限に抑えつつASIL-D安全基準を満たすことが可能である。
摘要

本論文は、Arm社のEthos-U55組み込みマシーンラーニングアクセラレータのソフトエラー耐性を徹底的に特徴付けている。

まず、大規模なRTLレベルのフォールト注入実験を行い、Ethos-U55の4つの構成すべてが、自動運転車などの安全重要アプリケーションに求められるASIL-D耐性基準を満たせないことを示した。

次に、Ethos-U55の各機能ブロックの耐性を詳細に分析した。その結果、機能ブロックによってソフトエラーに対する感度が大きく異なることが分かった。例えば、データフローを管理するTraversal Unitやメモリからの重みデコーダは特に脆弱であることが明らかになった。

さらに、従来の耐ソフトエラー手法(二重化、フリップフロップ強化など)を適用した場合の効果を分析した。その結果、面積オーバーヘッドを最小限に抑えつつASIL-D基準を満たすには、一部の機能ブロックのみを選択的に保護すればよいことが分かった。

最後に、大規模なフォールト注入実験を行わずに、Ethos-U55の耐性を高速に推定する統計的分析ツールを提案した。これにより、膨大な探索空間を効率的に探索できるようになった。

edit_icon

客製化摘要

edit_icon

使用 AI 重寫

edit_icon

產生引用格式

translate_icon

翻譯原文

visual_icon

產生心智圖

visit_icon

前往原文

統計資料
Ethos-U55のSilent Data Corruption (SDC)率は、ASIL-B/C基準は満たすものの、ASIL-D基準を満たさない。 Ethos-U55の機能ブロックの中でも、Traversal Unit (TSU)とWeight Decoder (WD)が最も脆弱である。 16nmプロセスノードでは、TSUとWDを二重化し、DMAとMAC Unitのフリップフロップを強化することで、ASIL-D基準を満たすことができる。 7nmプロセスノードでは、TSUとWDのフリップフロップを強化し、DMAとMAC Unitを二重化することで、ASIL-D基準を満たすことができる。
引述
"Ethos-U55, across a range of hardware configurations and DNNs, shows a Silent Data Corruption (SDC) rate lower than 0.1 × 10−15 per inference. While exceedingly low and indeed lower than (i.e., satisfies) the Automotive Safety Integrity Level (ASIL) B and C standards, the SDC rate still violates the ASIL-D standard, the most strict form of ASIL." "Critically, this sensitivity pattern holds under different process nodes but changes significantly depending on whether faults in logic elements are considered." "We show that in order to meet the most stringent ASIL-D standard, some form of modular redundancy must be introduced. However, one does not have to duplicate all the function blocks."

深入探究

質問1

Ethos-U55以外のマシーンラーニングアクセラレータについても同様の耐ソフトエラー性の分析が必要か? エシックス-U55のソフトエラー耐性の分析は、安全性に関する重要な要素であり、自動車や医療機器などの安全性の高いアプリケーションにおいて特に重要です。他のマシンラーニングアクセラレータについても同様の耐ソフトエラー性の分析が必要です。これは、ソフトエラーが機械学習アクセラレータに影響を与える可能性があるためです。他のアクセラレータにおいても、同様にソフトエラーの影響を評価し、適切な対策を講じることが重要です。これにより、安全性や信頼性を確保し、システムの正常な動作を維持することができます。

質問2

ソフトエラー耐性を向上させるための新しい手法はないか? ソフトエラー耐性を向上させるためには、新しい手法やアプローチが必要です。例えば、より効果的なハードウェア設計やソフトウェアアルゴリズムの導入、信頼性の高いエラー検出および修復メカニズムの実装などが考えられます。また、ソフトエラーの原因となる要因をより詳細に分析し、それに対応するための新しい対策を開発することも重要です。さらに、他の産業や研究分野での最新の技術や手法を取り入れることで、ソフトエラー耐性を向上させる新しいアプローチを見つけることができるかもしれません。

質問3

Ethos-U55のソフトエラー耐性の向上がもたらす電力/性能への影響はどのようなものか? Ethos-U55のソフトエラー耐性の向上は、電力と性能に影響を与える可能性があります。例えば、新しいソフトエラー対策を導入することで、追加のハードウェアや検出メカニズムが必要となり、それに伴う電力消費が増加する可能性があります。また、ソフトエラー対策が性能に影響を与えることも考えられます。例えば、エラー検出や修復のための追加の処理が必要となり、それが処理速度や効率に影響を与える可能性があります。したがって、ソフトエラー耐性の向上は、電力消費や性能に対してトレードオフの関係が生じる可能性があります。このため、ソフトエラー対策を慎重に検討し、電力と性能のバランスを保ちながらシステムの信頼性を確保することが重要です。
0
star