Core Concepts
GPU 성능을 효과적으로 활용하여 저차 직교 보텍셀 유한요소 기반의 명시적 탄성파 전파 분석을 가속화하는 방법을 제안한다.
Abstract
본 연구에서는 GPU 성능을 효과적으로 활용하여 명시적 탄성파 전파 분석을 가속화하는 방법을 제안한다. 기존의 저차 구조화 유한요소 방법(VFEM)은 질량행렬의 근사로 인한 수치 분산 문제가 있었다. 이를 해결하기 위해 직교 기저 함수를 사용하는 직교 보텍셀 유한요소 방법(OVFEM)이 제안되었다.
본 연구에서는 OVFEM에 INT8 텐서 코어를 활용하여 계산 성능을 향상시키는 TCOVFEM 방법을 제안한다. TCOVFEM은 대부분의 계산을 8비트 정수 연산으로 수행하여 텐서 코어의 고속 연산 성능을 활용한다. 또한 데이터 전송 비용을 최소화하는 알고리즘을 사용하여 전체 계산 성능을 향상시켰다.
실제 문제에 대한 수치 실험 결과, TCOVFEM은 기존 VFEM 대비 17.0배 빠른 계산 속도를 달성하였으며, OVFEM 대비 3.39배 빠른 성능을 보였다. 이는 텐서 코어의 고속 연산 성능을 효과적으로 활용한 결과이다. 제안된 TCOVFEM 방법은 GPU 기반 물리 시뮬레이션의 가속화에 기여할 것으로 기대된다.
Stats
탄성파 전파 시뮬레이션 시 TCOVFEM은 OVFEM 대비 4.5배 빠른 행렬-벡터 곱 연산 속도를 보였다.
TCOVFEM은 VFEM 대비 17.0배 빠른 전체 시뮬레이션 속도를 달성하였다.
Quotes
"Tensor Cores, which are an acceleration mechanism in modern GPUs, are used in deep learning and other applications due to their high computing performance. However, the application of Tensor Cores in physics-based simulations remains limited because it must be brought into a specific format and data transfer must be performed without losing computing performance."
"In this context, the formulation and implementation presented in this paper, which exploits the performance advantages of Tensor Cores in explicit physics-based simulations, are general and expected to provide insights into accelerating other applications."