Centrala begrepp
Effiziente Kronecker Matrix-Matrix Multiplikation auf GPUs ermöglicht signifikante Leistungssteigerungen durch neue Optimierungen.
Statistik
FastKron ermöglicht bis zu 13,7 TFLOPS bei der Kron-Matmul von M=1024 und verschiedenen PN-Werten.