本論文では、ボクセルベースの点群ニューラルネットワークの処理を高速化するためのVoxel-CIMアクセラレータを提案している。
主な特徴は以下の通り:
マップ検索の高速化: 深度エンコーディングに基づく出力主導型の検索手法(DOMS)を提案し、様々な状況下でメモリアクセス量を安定的にO(N)レベルに抑えることができる。さらに、ブロック化したDOMSを導入することで、より高い効率を実現している。
データ集中型の畳み込み演算の効率的な処理: 計算メモリ(CIM)アーキテクチャを採用し、Spconv3Dと2D畳み込みに適した重み割り当て手法を提案している。これにより、メモリアクセスを大幅に削減できる。
不均一な計算負荷の解消: 重み負荷の均等化(W2B)手法を導入し、中心部と周辺部の計算負荷のアンバランスを解消している。
実装と評価の結果、Voxel-CIMは従来の点群アクセラレータやGPUと比べて、検出タスクで2.4~5.4倍、セグメンテーションタスクで1.2~8.1倍の高速化と4.5~7.0倍の高エネルギー効率を達成している。
翻译成其他语言
从原文生成
arxiv.org
更深入的查询