Effiziente Beschleunigung von dünnen DNN-Modellen durch strukturierte dünnbesetzte Tensorzerlegung
Die Arbeit stellt eine Methode namens Tensor Approximation via Structured Decomposition (TASD) vor, um beliebige dünne Tensoren durch eine Reihe von strukturiert dünnbesetzten Tensoren zu approximieren. Dadurch können dichte und dünne DNN-Modelle ohne Feinabstimmung auf strukturiert dünn unterstützter Hardware beschleunigt werden.