AMD Versal ACAP의 다중 인공지능 엔진(AIE)을 활용하여 GotoBLAS2의 병렬 일반 행렬 곱셈(GEMM) 알고리즘을 최적화하고, 딥러닝 추론을 위한 혼합 정밀도 연산을 지원하는 아키텍처 특화 마이크로 커널을 제안한다.