Concetti Chiave
Arm社のEthos-U55組み込みマシーンラーニングアクセラレータは、ソフトエラーに対して十分な耐性を持っていないことが明らかになった。ただし、選択的な保護によって、面積オーバーヘッドを最小限に抑えつつASIL-D安全基準を満たすことが可能である。
Sintesi
本論文は、Arm社のEthos-U55組み込みマシーンラーニングアクセラレータのソフトエラー耐性を徹底的に特徴付けている。
まず、大規模なRTLレベルのフォールト注入実験を行い、Ethos-U55の4つの構成すべてが、自動運転車などの安全重要アプリケーションに求められるASIL-D耐性基準を満たせないことを示した。
次に、Ethos-U55の各機能ブロックの耐性を詳細に分析した。その結果、機能ブロックによってソフトエラーに対する感度が大きく異なることが分かった。例えば、データフローを管理するTraversal Unitやメモリからの重みデコーダは特に脆弱であることが明らかになった。
さらに、従来の耐ソフトエラー手法(二重化、フリップフロップ強化など)を適用した場合の効果を分析した。その結果、面積オーバーヘッドを最小限に抑えつつASIL-D基準を満たすには、一部の機能ブロックのみを選択的に保護すればよいことが分かった。
最後に、大規模なフォールト注入実験を行わずに、Ethos-U55の耐性を高速に推定する統計的分析ツールを提案した。これにより、膨大な探索空間を効率的に探索できるようになった。
Statistiche
Ethos-U55のSilent Data Corruption (SDC)率は、ASIL-B/C基準は満たすものの、ASIL-D基準を満たさない。
Ethos-U55の機能ブロックの中でも、Traversal Unit (TSU)とWeight Decoder (WD)が最も脆弱である。
16nmプロセスノードでは、TSUとWDを二重化し、DMAとMAC Unitのフリップフロップを強化することで、ASIL-D基準を満たすことができる。
7nmプロセスノードでは、TSUとWDのフリップフロップを強化し、DMAとMAC Unitを二重化することで、ASIL-D基準を満たすことができる。
Citazioni
"Ethos-U55, across a range of hardware configurations and DNNs, shows a Silent Data Corruption (SDC) rate lower than 0.1 × 10−15 per inference. While exceedingly low and indeed lower than (i.e., satisfies) the Automotive Safety Integrity Level (ASIL) B and C standards, the SDC rate still violates the ASIL-D standard, the most strict form of ASIL."
"Critically, this sensitivity pattern holds under different process nodes but changes significantly depending on whether faults in logic elements are considered."
"We show that in order to meet the most stringent ASIL-D standard, some form of modular redundancy must be introduced. However, one does not have to duplicate all the function blocks."