ハードウェアアクセラレーション

Sign In

insight - ハードウェアアクセラレーション

高スループットLempel-Ziv 4圧縮アルゴリズムのハードウェアアクセラレータ

LZ4圧縮アルゴリズムの並列実装における2つの主要な課題を解決し、スループットを大幅に向上させる新しい手法を提案する。

TensorCore性能向上のためのエンコーダベースの手法

TensorCore性能を大幅に向上させるためのEN-TensorCoreアーキテクチャを提案する。既存のTensorCoreアーキテクチャに容易に統合でき、チップ面積とエネルギー効率を大幅に改善できる。

AIエンジンとプログラマブルロジックを活用したAI最適化FPGAでのGEMMアクセラレーション手法の提案

AIエンジンとTensorブロックを活用して、Versal ACAFとStratix 10 NXのAI最適化FPGAでGEMMの高スループットと高エネルギー効率を実現する手法を提案する。

固有のデータを隠さずに、情報提供的で正直なタイトルに書き換えた「インテリジェンス処理ユニットへのマシンラーニングモデルの移行から得られた洞察」

インテリジェンス処理ユニット(IPU)は、材料科学や電池研究の分野におけるマシンラーニング(ML)アプリケーションの有力なアクセラレータ代替として機能することが示された。GPUからIPUへのモデル移行プロセスを調査し、パイプラインやグラジエント累積などの最適化手法を探索することで、IPUベースのモデルのパフォーマンスを向上させることができた。

1