Effiziente Beschleunigung von ViT-Inferenz auf FPGA durch statisches und dynamisches Pruning
Durch die Kombination von statischem Gewichtspruning und dynamischem Token-Pruning kann die Rechenleistung von Vision Transformers (ViT) auf FPGA-Hardware deutlich gesteigert werden, bei nur geringem Genauigkeitsverlust.