TCNet, ein hybrides Netzwerk, extrahiert effektiv räumlich-zeitliche Informationen aus Trajektorien und korrelierten Regionen, um die Leistung der kontinuierlichen Gebärdenspracherkennung zu verbessern.
Eine effiziente Strategie zum Übertragen hochqualitativer visueller Merkmale großer Bildsprach-Modelle auf die kontinuierliche Gebärdenspracherkennung, die trotz hoher Effizienz die Leistung bestehender Methoden deutlich übertrifft.