Simba: Mamba-Augmented U-ShiftGCN für die Erkennung von Skelettaktionen in Videos
Unser Simba-Modell integriert Mamba, ein selektives strukturiertes Zustandsraumsequenzmodell, in eine neuartige Encoder-Decoder-Architektur mit einem Shift-GCN-Rückgrat, um die Herausforderung der effizienten Modellierung von Langzeitsequenzen in Skelett-Aktionserkennungsaufgaben anzugehen.