核心概念
非同期ニューロモーフィックハードウェアの設計における課題を解決するため、SNNアルゴリズムとハードウェアアーキテクチャの協調探査フレームワークANCoEFと、完全非同期シミュレータTrueAsyncを提案する。
要約
ANCoEF:非同期ニューロモーフィックアルゴリズム/ハードウェア協調探査フレームワークと完全非同期シミュレータ
書誌情報: Jian Zhang, Xiang Zhang, Jingchen Huang, Jilin Zhang, and Hong Chen. (2023). ANCoEF: Asynchronous Neuromorphic Algorithm/Hardware Co-Exploration Framework with a Fully Asynchronous Simulator. DAC '23: Proceedings of the 60th ACM/IEEE Design Automation Conference.
研究目的: 本研究は、多様な現実世界のエッジシナリオの要求を満たす非同期ニューロモーフィックハードウェアの開発における課題に対処することを目的とする。具体的には、リアルタイム応答性、信頼性の高い推論精度などの要件を満たしながら、ハードウェアリソースと電力バジェットの制約に対処することを目指す。
手法: 本研究では、以下の2つの主要な要素を含む非同期ニューロモーフィックアルゴリズム/ハードウェア協調探査フレームワーク(ANCoEF)を提案する。
多目的強化学習(RL)ベースのハードウェアアーキテクチャ最適化手法
最新のシミュレータよりも2倍以上のランタイム速度向上を実現する完全非同期シミュレータ(TrueAsync)
主な結果:
ANCoEFのRLベースのハードウェアアーキテクチャ最適化手法は、N-MNISTデータセットにおいて、最新の手法よりもハードウェアのエネルギー遅延積(EDP)を1.81倍削減し、探索時間を2.73倍短縮した。
ANCoEFの協調探査フレームワークは、DVS128Gestureデータセットにおいて、SNNの精度を9.72%向上させ、ハードウェアのEDPを最新の手法と比較して28.85倍削減した。
ANCoEFフレームワークは、外部ニューロモーフィックデータセットCIFAR10-DVS、およびCIFAR10、CIFAR100、SVHN、Tiny-ImageNetなどの静的データセットでも評価され、優れた結果を示した。
結論: ANCoEFは、SNNアルゴリズムと非同期ニューロモーフィックハードウェアアーキテクチャを同時に最適化するための効果的なフレームワークである。提案されたフレームワークとシミュレータは、エッジAIアプリケーション向けのエネルギー効率の高い高性能なニューロモーフィックハードウェアの開発に貢献する可能性がある。
制限と今後の研究:
本研究では、特定の種類のSNNと非同期ニューロモーフィックハードウェアアーキテクチャに焦点を当てている。他の種類のSNNやハードウェアアーキテクチャへの適用可能性を探る必要がある。
ANCoEFの探索プロセスは、計算コストがかかる可能性がある。探索効率をさらに向上させるために、より高度な探索アルゴリズムや最適化手法を検討する必要がある。
統計
TrueAsyncは、最新シミュレータCanMoreと比較して、MLP-MNISTアプリケーションで2.01倍、CSNN-CIFAR10アプリケーションで15.8倍のランタイム削減を達成しました。
ANCoEFのRLベースハードウェアアーキテクチャ検索手法は、S-256アプリケーションで1.81倍、S-1024アプリケーションで1.41倍のハードウェアEDP削減を達成しました。
ANCoEFは、MNISTデータセットでハードウェアEDPを3.7倍、DVS128Gestureデータセットで163倍削減しました。
CIFAR10データセットでは、ANCoEFはANASの検索時間のわずか0.3%を使用して最適なアーキテクチャを見つけ、フレームあたり8.48 s⋅nJのハードウェアEDPを達成し、SNNの精度を9.37%向上させました。