Główne pojęcia
Effiziente Kronecker Matrix-Matrix Multiplikation auf GPUs ermöglicht signifikante Leistungssteigerungen durch neue Optimierungen.
Statystyki
FastKron ermöglicht bis zu 13,7 TFLOPS bei der Kron-Matmul von M=1024 und verschiedenen PN-Werten.