Erkennung von Gesten in ultraweiter Entfernung mit einer Webcam in der Mensch-Roboter-Interaktion
Ein neuartiges tiefes Lernmodell, das Graph-Vision-Transformer (GViT), ermöglicht die Erkennung von Gesten in ultraweiter Entfernung von bis zu 25 Metern unter Verwendung einer einfachen RGB-Kamera.