Effiziente Verarbeitung von Inhalten durch Entropie-basierte Vereinfachung von Vision-Transformern
Durch Entropie-basierte Identifizierung und Integration nicht-essentieller Aufmerksamkeitsschichten in nachfolgende MLP-Schichten können Vision-Transformer effizient vereinfacht und deren Rechenaufwand reduziert werden, ohne die Leistung zu beeinträchtigen.