Direkte Faltung mit Gewichtsparallelität erreicht die beste Latenz und Energieeffizienz auf OpenEdgeCGRA.