核心概念
DEFA ist ein dedizierter Beschleuniger für die effiziente Verarbeitung von Multi-Skalen-deformierbarer Aufmerksamkeit (MSDeformAttn), der durch Algorithmus-Architektur-Co-Optimierung Rechenleistung und Energieeffizienz deutlich steigert.
要約
DEFA ist ein neuartiger Beschleuniger für die Verarbeitung von Multi-Skalen-deformierbarer Aufmerksamkeit (MSDeformAttn), einem Schlüsselmechanismus in verschiedenen Bildverarbeitungsaufgaben. MSDeformAttn leidet jedoch unter erheblicher Rechenleistungsineffizienz auf Standardplattformen wie CPUs und GPUs, da es zu unregelmäßigem Datenzugriff und hohem Speicherbedarf führt.
DEFA adressiert diese Probleme durch einen zweistufigen Ansatz:
Algorithmus-Ebene:
- Frequenz-gewichtetes Pruning (FWP) zur Reduzierung unnötiger Femap-Pixel
- Wahrscheinlichkeits-bewusstes Pruning (PAP) zur Entfernung überflüssiger Abtastpunkte
- Diese Techniken reduzieren den Speicherbedarf um über 80%
Architektur-Ebene:
- Erkundung von Multi-Skalen-Parallelität zur deutlichen Steigerung des Durchsatzes
- Feinkörnige Operator-Fusion und Femap-Wiederverwendung zur Reduzierung des Speicherzugriffs
Die Evaluierung auf repräsentativen Benchmarks zeigt, dass DEFA eine 10,1-31,9-fache Beschleunigung und eine 20,3-37,7-fache Steigerung der Energieeffizienz gegenüber leistungsstarken GPUs erreicht. Verglichen mit verwandten Beschleunigern bietet DEFA eine 2,2-3,7-fache Verbesserung der Energieeffizienz bei gleichzeitiger Unterstützung von MSDeformAttn.
統計
DEFA reduziert die Anzahl der Abtastpunkte um durchschnittlich 84%.
DEFA reduziert die Anzahl der Femap-Pixel um durchschnittlich 43%.
DEFA reduziert den Rechenaufwand um durchschnittlich über 50%.
引用
"DEFA ist der erste dedizierte Beschleuniger für die effiziente Verarbeitung von MSDeformAttn."
"DEFA erreicht eine 10,1-31,9-fache Beschleunigung und eine 20,3-37,7-fache Steigerung der Energieeffizienz gegenüber leistungsstarken GPUs."
"DEFA bietet eine 2,2-3,7-fache Verbesserung der Energieeffizienz im Vergleich zu verwandten Beschleunigern."