Core Concepts
Direkte Faltung mit Gewichtsparallelität erreicht die beste Latenz und Energieeffizienz auf OpenEdgeCGRA.
Stats
Direkte Faltung mit Gewichtsparallelität erreicht bis zu 3,4× und 9,9× Verbesserung in Energie und Latenz im Vergleich zur CPU-Implementierung.
WP-Ansatz erreicht eine Spitzenleistung von 0,665 MAC/Zyklus.
Im2col-OP-Ansatz zeigt die geringste Robustheit bei Hyperparameter-Änderungen.
Quotes
"WP-Ansatz erreicht Energie- und Latenzverbesserungen von 3,4× bzw. 9,9×."
"WP ist die robusteste Methode bei Hyperparameter-Änderungen."