Core Concepts
提案手法TCOVFEM(INT8テンソルコア活用直交ボクセル有限要素法)は、従来手法に比べて17.0倍高速で、同等の精度を実現する。
Abstract
本研究では、GPUの性能を最大限に活用するための陽解法弾性波動伝播解析手法を提案している。
従来の陽解法ボクセル有限要素法(VFEM)では、質量行列の簡略化により数値分散が生じ、精度を上げるためには要素サイズを小さくする必要があった。一方、直交ボクセル有限要素法(OVFEM)では質量行列が対角行列となり数値分散を抑えられるが、計算コストが高かった。
そこで本研究では、INT8テンソルコアを活用したTCOVFEMを提案した。TCOVFEMでは、要素剛性行列計算をINT8演算に変換することで、FP64精度を維持しつつ高速化を実現している。具体的には、
要素剛性行列の一部をINT8演算に変換
INT8演算とFP64演算の階層的な組み合わせによりデータ変換コストを削減
マトリクスベクトル積をマトリクスマトリクス積に変換し、テンソルコアの性能を最大限に活用
これらの工夫により、従来のVFEMに比べて17.0倍の高速化を実現した。また、同等の要素サイズでTCOVFEMはVFEMよりも高精度な結果を得られることを示した。
本手法は、物理シミュレーションにおけるテンソルコアの活用事例として重要な知見を提供するものである。
Stats
要素剛性行列の1成分計算結果の比較:
FP128: 507813.690592559616827867910192902549
FP64: 507813.6905925632
FP32: 507814.750
INT8 (M=4): 507813.7802133318
INT8 (M=8): 507813.6905925595
Quotes
"提案手法TCOVFEM(INT8テンソルコア活用直交ボクセル有限要素法)は、従来手法に比べて17.0倍高速で、同等の精度を実現する。"