Das Paper beschreibt die Entwicklung eines niedrigparametrigen, modularen Systems zur schnellen Erkennung von Schreib- und Tippaktivitäten in Videos für Bildungszwecke. Es konzentriert sich auf die Herausforderungen der Langzeitvideoaktivitätserkennung in realen Klassenzimmervideos und präsentiert eine interaktive Webanwendung zur Visualisierung von menschlichen Aktivitätskarten über lange Videos. Die Struktur des Systems umfasst schnelle Aktivitätsinitialisierungen, Objekterkennungsmethoden und einen optimalen niedrigparametrigen dyadischen 3D-CNN-Klassifikator zur Identifizierung von Aktivitäten. Das System verwendet verschiedene Methoden zur Optimierung des Inferenzprozesses und erreicht eine hohe Genauigkeit bei der Klassifizierung von Schreib- und Tippaktivitäten. Es präsentiert auch eine modulare und schnelle Inferenzaktivitätserkennung. Die Ergebnisse zeigen eine verbesserte Geschwindigkeit und Genauigkeit im Vergleich zu aktuellen Methoden.
Іншою мовою
із вихідного контенту
arxiv.org
Ключові висновки, отримані з
by Venkatesh Ja... о arxiv.org 03-05-2024
https://arxiv.org/pdf/2403.01281.pdfГлибші Запити