Das Paper beschreibt die Entwicklung eines niedrigparametrigen, modularen Systems zur schnellen Erkennung von Schreib- und Tippaktivitäten in Videos für Bildungszwecke. Es konzentriert sich auf die Herausforderungen der Langzeitvideoaktivitätserkennung in realen Klassenzimmervideos und präsentiert eine interaktive Webanwendung zur Visualisierung von menschlichen Aktivitätskarten über lange Videos. Die Struktur des Systems umfasst schnelle Aktivitätsinitialisierungen, Objekterkennungsmethoden und einen optimalen niedrigparametrigen dyadischen 3D-CNN-Klassifikator zur Identifizierung von Aktivitäten. Das System verwendet verschiedene Methoden zur Optimierung des Inferenzprozesses und erreicht eine hohe Genauigkeit bei der Klassifizierung von Schreib- und Tippaktivitäten. Es präsentiert auch eine modulare und schnelle Inferenzaktivitätserkennung. Die Ergebnisse zeigen eine verbesserte Geschwindigkeit und Genauigkeit im Vergleich zu aktuellen Methoden.
Egy másik nyelvre
a forrásanyagból
arxiv.org
Mélyebb kérdések