LZ4圧縮アルゴリズムの並列実装における2つの主要な課題を解決し、スループットを大幅に向上させる新しい手法を提案する。
TensorCore性能を大幅に向上させるためのEN-TensorCoreアーキテクチャを提案する。既存のTensorCoreアーキテクチャに容易に統合でき、チップ面積とエネルギー効率を大幅に改善できる。
AIエンジンとTensorブロックを活用して、Versal ACAFとStratix 10 NXのAI最適化FPGAでGEMMの高スループットと高エネルギー効率を実現する手法を提案する。
インテリジェンス処理ユニット(IPU)は、材料科学や電池研究の分野におけるマシンラーニング(ML)アプリケーションの有力なアクセラレータ代替として機能することが示された。GPUからIPUへのモデル移行プロセスを調査し、パイプラインやグラジエント累積などの最適化手法を探索することで、IPUベースのモデルのパフォーマンスを向上させることができた。