Effiziente Beschleunigung der deformierbaren Aufmerksamkeit durch pruning-unterstützte Raster-Abtastung und Multi-Skalen-Parallelverarbeitung
DEFA ist ein dedizierter Beschleuniger für die effiziente Verarbeitung von Multi-Skalen-deformierbarer Aufmerksamkeit (MSDeformAttn), der durch Algorithmus-Architektur-Co-Optimierung Rechenleistung und Energieeffizienz deutlich steigert.