Große Sprachmodelle, die über große Modellarchitekturen und reiches implizites Wissen verfügen, können effektiv als Aktionserkenner eingesetzt werden, indem die Eingabesignale der Aktionen in ein "Satzformat" projiziert werden, das für die Sprachmodelle verständlich ist.
Graph Convolutional Networks (GCNs) haben Schwächen in der Erhaltung der Skeletttopologie und der Modellierung multi-relationaler Gelenkvorkommen, die durch Topological Invariance Encoding und BlockGC erfolgreich angegangen werden.