Основные понятия
Effiziente Kronecker Matrix-Matrix Multiplikation auf GPUs ermöglicht signifikante Leistungssteigerungen durch neue Optimierungen.
Статистика
FastKron ermöglicht bis zu 13,7 TFLOPS bei der Kron-Matmul von M=1024 und verschiedenen PN-Werten.